Namierzenie potencjalnych terrorystów na stadionie, gdzie w krótkim czasie wchodzi wiele tysięcy osób lub na lotnisku, gdzie dziennie przewija się ich jeszcze więcej, nie jest łatwe.
Bardziej wiarygodne metody rozpoznawania ludzi na podstawie ich cech biometrycznych, bazujące na odciskach palców, skanach siatkówki czy analizie głosu wymagają relatywnie dużo czasu oraz świadomego udziału badanych. Tylko rozpoznawanie twarzy pozwala identyfikować ludzi szybko, masowo i w sposób absolutnie pasywny.
A przynajmniej chcielibyśmy, żeby tak było, bo dotychczasowe sukcesy w tej dziedzinie są dość skromne. Krytycy technologii wytykają, że ona po prostu nie działa. System rozpoznawania twarzy zainstalowany na lotnisku w Bostonie został usunięty po dwuletnim okresie próbnym ze względu na niską skuteczność. Analogiczny system zainstalowany w Newham, jednej z gmin Londynu w ciągu kilku lat działania nie rozpoznał żadnego kryminalisty, mimo że takowi mieszkają na tym obszarze.
Tradycyjne systemy rozpoznawania twarzy porównują zdjęcie zarejestrowane przez kamerę ze zdjęciami które są w bazie danych, zasilonej przykładowo zdjęciami z dowodów osobistych, praw jazdy czy innych tego typu dokumentów. Nie jest to porównanie obrazku z obrazkiem, tylko porównanie map twarzy, charakterystycznych punktów, odległości między oczami, oczu do ust, ust do nosa. Zwracane są wyniki najbliższe szukanemu i tu zaczynają się schody. Dlaczego komputery tak biedzą się nad zadaniem które każde dziecko potrafi rozwiązać?
Zdjęcia paszportowe robione są en face. Zdjęcia z kamer na obiektach łapane są pod różnymi kątami, najczęściej nie na wprost. Komputer radzi sobie stosunkowo dobrze jeśli odchyłka jest nie większa niż 20 stopni, ale im dalej w kierunku profilu tym gorzej. Dopiero nowsze systemy bazujące na trójwymiarowej mapie twarzy dają sobie lepiej radę. Inną przeszkodą są złe warunki oświetleniowe, tutaj kompensujemy lampami na podczerwień, które iluminują filmowany obszar światłem niewidocznym dla oka, ale dobrze widocznym dla sensorów kamer. Nie radzimy sobie zupełnie z mimiką twarzy, uśmiech od ucha do ucha potrafi zaburzyć mapę twarzy na tyle, że nie zostanie skojarzona ze wzorcem, najczęściej zdjęciem z neutralnym wyrazem twarzy. Póki co nic nie potrafimy wskórać jak ktoś założy ciemne okulary lub przykryje oczy gęstą grzywą. Od biedy ludzi permanentnie wyszczerzonych i nadmiernie kudłatych mogłaby wyłapywać i sprawdzać ochrona.
Do niedawna kluczowym problemem wszystkich systemów była niska rozdzielczość zdjęć. Obiekty użyteczności publicznej są nafaszerowane kamerami, natomiast każda kamera pokrywa jakiś obszar, a pojedynczy człowiek, szczególnie jego twarz, stanowi malutki wycinek kadru. Ten mały wycinek porównujemy ze zdjęciem zrobionym z reguły w warunkach studyjnych, gdzie twarz wypełnia cały kadr. Tutaj pomocna jest halucynacja twarzy. Tak nazwano proces, w którym rozdzielczość jest podbijana przez komputer w sposób automatyczny. Wynikowe zdjęcie wyższej rozdzielczości jest sztuczne i niekoniecznie stuprocentowo odzwierciedla oryginalną twarz, natomiast mimo to daje dużo lepszą skuteczność porównań w systemach rozpoznawania twarzy.
Publikacja naukowa na temat halucynacji twarzy
Źródło grafiki: (C) Piotr Mańkowski