Две группы специалистов, работающих вне зависимости друг от друга, заявили о разработке продвинутых алгоритмов, которые способны распознавать и описывать объекты на фото и видео с гораздо большей точностью, чем когда-либо. Приблизительно одинакового успеха достигли Гугл и Стэнфордский университет.
До сих пор компьютерное зрение могло «видеть» на изображениях только отдельные объекты, осознание картинки в целом для техники было недоступным. Новейшие методы, которые включают искусственные сети нейронов, способные к обучению, пошли далеко вперед. Сейчас они могут обрисовывать происходящее обыкновенным человеческим языком.
«Я полагаю, что пиксельные данные в картинках и видео – это своеобразная темная материя Глобальной сети, – сказал руководитель лаборатории по разработке искусственного интеллекта в Стэнфордском университете Ф.Ф. Ли, – «Сейчас мы сможем начать ее освещать». Специалисты из Стэнфорда поведали о достижениях в техотчете, а команда Гугл выложила статью на веб-сайте arXiv.org, также они отметили, что сейчас у них осуществляется лечение сайта от вирусов и в скором времени он будет доступен всем.
Наработки этих групп специалистов, весьма похожи. Они позволят описывать миллиарды картинок и видео в Сети, которые в основном плохо либо совсем не документированы. Сейчас поисковые алгоритмы Гугл отталкиваются лишь от описания, каковое предоставил сам человек, загрузивший картинку.