Bbabo NET

Nauka & Technologia Wiadomości

Sieć neuronowa PIGEON nauczyła się określać lokalizację obiektów na zdjęciach

Absolwenci Uniwersytetu Stanforda opracowali sieć neuronową o nazwie Predicting Image Geolocations (w skrócie PIGEON), która potrafi określić lokalizację na podstawie zdjęcia. PIGEON ma dokładność do 40 km i w 95% przypadków poprawnie nazywa kraj.

Lukasa Haasa, Michała Skretu i Silasa Alberti połączyła pasja do gry internetowej GeoGuessr, w której uczestnicy proszeni są o określenie geolokalizacji obiektów przedstawionych na zdjęciach. GeoGuessr ma ponad 50 milionów graczy, którzy biorą udział w mistrzostwach świata, transmitują na Twitchu i popularnych kanałach na Youtube. Absolwenci Uniwersytetu Stanforda uważali, że sami są całkiem dobrzy w GeoGuessr. Co więcej, zastanawiali się, czy mogliby stworzyć sztucznie inteligentnego gracza, który działałby lepiej niż ludzie. Sięgnęli do istniejącego systemu analizy obrazu CLIP i zdjęć Google Street View, tworząc własny zbiór danych z 500 tys. zdjęć dostępnych w serwisie.

Jak opisuje NPR, „zespół dodał do programu dodatkowe elementy, w tym taki, który pomógł sztucznej inteligencji klasyfikować obrazy według ich położenia na globie”.

Aby przetestować PIGEON, jego twórcy zorganizowali „sparing” pomiędzy swoją siecią neuronową a legendą GeoGuessr, Trevorem Rainboltem: „Nie byliśmy pierwszą sztuczną inteligencją, która grała przeciwko Rainbolt. Jesteśmy pierwszą sztuczną inteligencją, która pokonała Rainbolta”.

PIGEON ma wiele zastosowań, od identyfikowania lokalizacji na starych obrazach po przeprowadzanie szybkich ankiet (na przykład pod kątem obecności inwazyjnych gatunków roślin). Minusem jest to, że PIGEON może ujawnić informacje o osobach, którymi nigdy nie miał zamiaru się dzielić. Według Jaya Stanleya, starszego analityka ds. polityki w Amerykańskiej Unii Wolności Obywatelskich, który bada technologię, firmy i rządy będą mogły wykorzystywać sztuczną inteligencję, aby dowiedzieć się, które kraje i regiony odwiedzili ludzie; takie zmiany pomogą atakującym w ściganiu ofiar. Usunięcie geotagów ze zdjęć nie będzie już chronić prywatności.

Absolwenci Stanforda są świadomi zagrożeń, jakie stwarza ich rozwój. Byli współautorami artykułu wraz ze swoją profesor Chelsea Finn, ale powstrzymali się od upublicznienia pełnego modelu właśnie ze względu na te obawy.

Google ma już funkcję zwaną „szacowaniem lokalizacji”, która wykorzystuje sztuczną inteligencję do określenia geolokalizacji na podstawie zdjęcia. Obecnie korzysta jedynie z katalogu zawierającego około miliona punktów orientacyjnych, a nie z 220 miliardów zdjęć ulic zgromadzonych przez Google. Firma powiedziała NPR, że użytkownicy mogą wyłączyć tę funkcję.

Sieć neuronowa PIGEON nauczyła się określać lokalizację obiektów na zdjęciach