czw.. cze 18th, 2026

Sztuczna inteligencja w rozpoznawaniu niedoskonałości skóry – kilka powszechnych problemów, które algorytmy identyfikują bezbłędnie

Zakres działania AI

AI analizuje cechy wizualne skóry — tekstury, koloru i kształtu — aby wykrywać i klasyfikować typowe niedoskonałości na zdjęciach. Systemy uczone na obrazach klinicznych i zdjęciach smartphone potrafią identyfikować zarówno powierzchowne problemy kosmetyczne, jak i niektóre zmiany wymagające dalszej oceny medycznej. W praktyce te rozwiązania działają jako narzędzie wstępnej selekcji i monitoringu, a nie jako ostateczna diagnoza lekarska.

Wynik działania algorytmu jest zwykle ilościowy: liczba obszarów zmian, procent powierzchni objętej problemem, kategoria nasilenia. Takie dane ułatwiają porównywanie zdjęć w czasie i ocenę skuteczności terapii lub produktów kosmetycznych.

Co AI rozpoznaje szybko i powtarzalnie?

Model uczy się wykrywać lokalne wzorce pikseli — krawędzie, cienie, skupiska zmiany koloru — które korelują z klinicznymi postaciami zmian skórnych. Dzięki temu algorytmy potrafią wykryć subtelne różnice trudne do zmierzenia gołym okiem, a także powtarzalnie oceniać te same parametry na kolejnych zdjęciach.

Warto podkreślić, że skuteczność zależy od jakości zdjęcia (ostrość, oświetlenie, kąt) oraz reprezentatywności danych treningowych — w kontrolowanych warunkach algorytmy osiągają zauważalnie lepsze wyniki niż przy zdjęciach z telefonu użytkownika.

Najczęściej rozpoznawane niedoskonałości

  • trądzik: algorytmy rozróżniają zaskórniki otwarte i zamknięte, grudki, krosty oraz zmiany torbielowate; segmentacja umożliwia liczenie ognisk,
  • przebarwienia i melasma: wykrywanie asymetrii, granic i natężenia pigmentu poprzez analizę kanałów kolorów,
  • zmarszczki i utrata elastyczności: analiza topografii i cieniowania skóry służy ocenie głębokości zmarszczek oraz utraty objętości tkanek,
  • odwodnienie skóry: ocena mikrotekstury i odbicia światła pozwala wykryć suchość i zmniejszoną gładkość,
  • zmiany pigmentacyjne klinicznie istotne: nieregularne plamy o asymetrycznych brzegach wymagające oceny dermatologa,
  • zaburzenia naczyniowe: zaczerwienienia, pajączki naczyniowe i teleangiektazje wykrywane dzięki analizie koloru i wzorca rozgałęzienia naczyń,
  • infekcje i stany zapalne: cechy zapalenia takie jak erythema i obrzęk oraz wyraźne zmiany grzybicze lub bakteryjne na zdjęciach klinicznych,
  • brodawki i zmiany rogowaceniowe: detekcja konturu, tekstury i rogowacenia powierzchni.

Modele i techniki stosowane w analizie obrazów

Typy modeli

W zadaniach klasyfikacji i wykrywania najczęściej wykorzystuje się sieci konwolucyjne (CNN), takie jak ResNet czy EfficientNet, które dobrze radzą sobie z ekstrakcją reprezentacji z obrazów. Do lokalizacji i segmentacji obszarów zmian stosuje się architektury segmentacyjne, np. U-Net lub Mask R-CNN. Transfer learning z dużych, ogólnych zbiorów obrazów przyspiesza naukę modeli na mniejszych, specjalistycznych zbiorach dermatoskopowych.

Przetwarzanie obrazu i augmentacja

Preprocessing obejmuje korekcję barwy, ujednolicenie oświetlenia, normalizację rozdzielczości oraz usuwanie tła. Augmentacja danych — rotacje, zmiany jasności, balans bieli, losowe przycięcia — zmniejsza ryzyko nadmiernego dopasowania i poprawia uogólnianie na różne warunki zdjęciowe. Dodatkowo algorytmy korekcji oświetlenia pomagają ograniczyć wpływ cieni i różnic w ekspozycji.

Dane i zbiory używane w badaniach

Do badań akademickich i komercyjnych używa się kilku uznanych zbiorów:

ISIC (International Skin Imaging Collaboration) — obszerne zbiory dermatoskopowe do klasyfikacji zmian barwnikowych oraz badań porównawczych. HAM10000 to zestaw obejmujący obrazy 10 typów zmian pigmentowych, szeroko wykorzystywany do trenowania i walidacji. Badania nad trądzikiem i przebarwieniami korzystają także ze zdjęć klinicznych oraz zdjęć z telefonów komórkowych; jednak modele trenowane na dermatoskopowych obrazach osiągają zwykle wyższą skuteczność.

Uwaga: wiele komercyjnych systemów korzysta również z danych użytkowników, co obliguje do przestrzegania przepisów o ochronie danych osobowych — w UE jest to RODO; procesy anonimizacji i polityki retencji są kluczowe.

Jak AI „widzi” cechy skóry — krótka wyjaśnienie

Model przetwarza obraz przez kolejne warstwy filtrów: od wykrywania krawędzi i drobnych tekstur po bardziej złożone reprezentacje odpowiadające klinicznym wzorcom. Na niskich poziomach CNN rozpoznaje gradienty i punkty świetlne; na wyższych poziomach agreguje te informacje w cechy typu „nieregularna ciemna plama” lub „okrągła pustula”. Tak powstaje macierz cech, na podstawie której model klasyfikuje zmianę lub segmentuje jej obszar.

Metryki i wyniki — jak ocenić jakość

  • dokładność (accuracy): odsetek poprawnych klasyfikacji na danym zbiorze testowym,
  • czułość (sensitivity): procent prawidłowo wykrytych przypadków chorobowych (istotne dla wykrywania zmian alarmowych),
  • swoistość (specificity): procent prawidłowo rozpoznanych przypadków zdrowych (ważne, aby ograniczyć fałszywe alarmy),
  • AUC-ROC: pole pod krzywą charakterystyki odbiornik–operator; wartość bliska 1,0 wskazuje na dobrą separację klas.

W literaturze AUC dla zadań klasyfikacji zmian barwnikowych często mieści się w przedziale 0,85–0,98 w warunkach kontrolowanych, a porównawcze badania dermatoskopowe raportują wartości około 0,90–0,98, zbliżone do wyników ekspertów.

Praktyczne zastosowania

AI w analizie zdjęć skóry znajduje zastosowanie zarówno w produktach konsumenckich, jak i w praktyce klinicznej wspomagającej:

jako narzędzie kosmetyczne systemy mogą dobierać rekomendacje pielęgnacyjne i monitorować efekty stosowania produktów; w teledermatologii służą do wstępnej selekcji zmian wymagających pilnej konsultacji oraz do przesyłania ustrukturyzowanych raportów przed wizytą;

w monitoringu leczenia algorytmy porównują zdjęcia „przed” i „po”, wyliczając procentowy spadek powierzchni zmian, co pozwala mierzyć skuteczność terapii w sposób obiektywny.

Ograniczenia i ryzyka

Bias danych pozostaje jednym z największych wyzwań: niedostateczna reprezentacja ciemniejszych fototypów często prowadzi do niższej skuteczności u osób o ciemniejszej skórze. Modele trenowane głównie na obrazach jasnej skóry mogą nie wykryć subtelnych zmian u innych grup etnicznych.

Inne ograniczenia to zależność od warunków zdjęciowych (różne oświetlenie, ostrość, kąty), brak dostępu AI do kontekstu klinicznego (wywiadu, objawów ogólnych, badań dodatkowych) oraz ryzyko fałszywych alarmów lub przeoczeń. W badaniach praktycznych modele działające na zdjęciach smartphone wykazują spadek dokładności o około 10–30% w porównaniu z obrazami dermatoskopowymi.

W zakresie regulacji prawnych należy rozróżnić aplikacje informacyjne od urządzeń medycznych: dopuszczenie CE lub FDA ma istotne znaczenie, gdy aplikacja rekomenduje leczenie lub podejmuje decyzje diagnostyczne.

Jak weryfikować narzędzie AI — 7 kryteriów

  • podstawowe metryki: publikacja accuracy, sensitivity, specificity i AUC na zewnętrznym zbiorze testowym,
  • różnorodność danych treningowych: liczba zdjęć, rozkład fototypów, wiek i płeć uwzględnione w zbiorze,
  • walidacja zewnętrzna: testy przeprowadzone na niezależnych, nieużywanych wcześniej zbiorach,
  • przejrzystość modelu: opis architektury, procedur augmentacji i preprocessingowych,
  • ocena kliniczna: porównanie wyników z diagnozą dermatologa w badaniach prospektywnych,
  • ochrona danych: zgodność z RODO, anonimizacja zdjęć oraz jasne zasady przechowywania,
  • certyfikacja: informacja o dopuszczeniu jako urządzenie medyczne, jeśli aplikacja rekomenduje interwencje.

Przykładowy workflow systemu AI dla zdjęć skóry

Typowy przebieg analizy obejmuje kilka etapów realizowanych automatycznie lub w części z udziałem osoby obsługującej system: 1) zebranie obrazu — zdjęcie smartphone lub dermatoskop; 2) preprocessing — korekcja barwy, przycięcie, normalizacja rozdzielczości i ujednolicenie ekspozycji; 3) segmentacja i ekstrakcja cech — tekstura, histogram kolorów, kształt; 4) klasyfikacja — model nadaje etykietę (np. „trądzik III stopnia”, „hiperpigmentacja umiarkowana”); 5) generacja raportu — procent powierzchni zmiany, sugestie pielęgnacyjne i rekomendacja konsultacji dermatologicznej w przypadku cech alarmowych.

Dowody i badania potwierdzające użyteczność

W literaturze porównawczej algorytmy osiągają w zadaniach klasyfikacji dermatoskopowej AUC porównywalne z ekspertami — często wartości 0,90–0,98. W zadaniach związanych z trądzikiem systemy potrafią automatycznie zliczać ogniska z błędem rzędu kilku procent w kontrolowanych warunkach zdjęciowych, a zgodność klasyfikacji nasilenia sięga 75–92% w zależności od jakości zdjęć i definicji skali nasilenia.

Badania pokazują też, że modele trenowane wyłącznie na dermatoskopowych obrazach tracą na skuteczności przy zdjęciach smartphone — spadek trafności wynosi najczęściej 10–30%, co podkreśla konieczność walidacji w rzeczywistych warunkach użytkowania.

Interpretacja wyników aplikacji konsumenckiej

Wynik z aplikacji to zazwyczaj etykieta plus prawdopodobieństwo klasyfikacji. Wysokie prawdopodobieństwo zmiany alarmowej powinno kierować użytkownika na konsultację dermatologiczną. Wyniki o niskim prawdopodobieństwie problemu kosmetycznego mogą służyć jako wskazówka do doboru pielęgnacji, o ile aplikacja podaje protokoły oparte na dowodach i źródłach naukowych.

Rekomendacje dla twórców i użytkowników

Dla twórców kluczowe są testy na zewnętrznych, zróżnicowanych zbiorach, raportowanie metryk i ograniczeń oraz transparentność co do pochodzenia danych. Dla użytkowników ważne jest wybieranie narzędzi z jawnie podanymi metrykami, polityką prywatności i możliwością eskalacji do specjalisty. Dla klinicystów AI powinno pełnić funkcję wspomagającą, nigdy nie zastępując pełnego wywiadu i badania fizykalnego.

Prywatność i etyka

Zdjęcia twarzy to dane wrażliwe: wymagane jest świadome wyrażenie zgody na ich przetwarzanie. Anonimizacja, ograniczony czas przechowywania oraz jasne informacje dla użytkownika o zakresie analizy i przeznaczeniu danych zmniejszają ryzyko nadużyć. Transparentność co do tego, czy aplikacja pełni funkcję medyczną, jest wymogiem prawnym i etycznym.

Konkretny przykład — jak AI rozpoznaje trądzik

Wejście to zdjęcie twarzy wykonane w możliwie jednorodnych warunkach oświetleniowych. System przeprowadza preprocessing (korekcja barwy, segmentacja obszarów tłustych), a następnie wykrywa typowe morfologie: okrągłe jasne ogniska (pustule), twarde guzki (nodules) czy czarne zaskórniki. Wyniki obejmują liczbę zmian, kategorię nasilenia (np. 0–4) i procentową powierzchnię zajętą przez zmiany. W badaniach zgodność z oceną eksperta wynosi zwykle od 75% do 92%, zależnie od jakości obrazów i definicji skali.

Najczęstsze błędy AI i jak je ograniczyć

Do typowych problemów należą fałszywe pozytywy wywołane cieniami lub refleksami — ogranicza je poprawa oświetlenia i preprocessing; fałszywe negatywy przy jasnych zmianach na ciemnej skórze — niweluje to zwiększenie reprezentacji fototypów w zbiorze treningowym; oraz trudności z porównaniem zdjęć w czasie — rozwiązuje się je poprzez standaryzację warunków fotografowania i użycie metryk porównawczych.

Checklist dla wdrożenia w klinice lub aplikacji

  • zgromadzenie reprezentatywnego zbioru zdjęć (zalecane >10 000 obrazów),
  • walidacja zewnętrzna na co najmniej dwóch niezależnych zbiorach,
  • raportowanie sensytywności i specyficzności dla każdej klasy zmian,
  • mechanizm eskalacji do dermatologa przy wynikach przekraczających próg ryzyka,
  • wdrożenie zabezpieczeń RODO, polityki retencji i procedury anonimizacji.

Przeczytaj również: