Като доказателство за това, че компютрите ще могат да правят анализи на изображения толкова добре, колкото и текстов анализ, група учени от Станфорд успяха да направят точни прогнози за това как гласуват хората в отделните квартали. Анализите са извършени на милиони снимки, събрани от Google Street View, съобщава New York Times. Докато други академични проекти са използвали изкуствен интелект, за да използват Google Street View за социално-икономически прозрения (като Streetchange), този проект е забележителен поради огромното количество изображения, обработвани от неговия AI софтуер.
Екипът от изследователи, начело с компютърния учен Timnit Gebru, използва софтуер, за да анализира 50 милиона изображения на улиците и данните за местоположението. Тяхната цел е да намерят данни, които биха могли да се използват, за да прогнозират демографските статистики в отделните квартали (наброяващи обикновено около 1,000 души).
От изображенията те успяват да съберат информация, включително марка и модел, за около 22 милиона автомобила, или 8 % от всички автомобили в САЩ, в 3,000 населени места и 39,000 района за гласуване. След като обединяват тези данни с информация от други източници, включително Изследването на американските общности на Бюрото за преброяване на населението на САЩ и резултатите от гласуването на президентските избори, изследователите установяват, че могат да направят точни прогнози за приходите, расата, образованието и за кого гласуват хората в квартала.
За да накарат AI алгоритмите да класифицират автомобилите точно, изследователите ги „обучават“, като набират стотици хора от места като Mechanical Turk, както и автомобилни експерти, за да идентифицират превозните средства в извадка от милиони снимки. В края на краищата техният софтуер успява да класифицира автомобилите в 50 милиона снимки само за две седмици. Според Times автомобилен експерт би изпълнил тази задача за 15 години.
В статия, публикувана в Сборника на Националната академия на науките, екипът пише, че тяхната технология може да допълни Изследването на американските общности, което струва повече от 250 милиона долара годишно. Тъй като проучването е трудоемко, понеже работниците преминават от врата до врата, това означава, че по-малки райони с население под 65,000 души често се пренебрегват. След като технологията се подобрява, демографската статистика може евентуално да бъде актуализирана в реално време. Изследователите отбелязаха, че политиците ще трябва да бъдат внимателни, за да се гарантира, че данните се събират само на общностно равнище, за да се защити неприкосновеността на личния живот.
За Никхил Найк, компютърен учен и изследовател от Харвард, който също е използвал снимки от Google Street View в проучване на градската среда, проектът на Станфорд сочи към бъдещето на изследванията, базирани на изображения.
„За първи път в историята разполагаме с технологията за извличане на прогнози от много големи количества визуални данни“, каза г-н Найк. „Но докато технологията е вълнуваща, компютърните учени трябва да работят в тясно сътрудничество със социалните учени и други, за да се уверят, че ще бъде полезна“.