Зачем Фейсбук собирает наши хештеги?

Когда кто-то загружает фотографию в Инстраграм (платформу, с 2012 года принадлежащую Фейсбуку), он может добавить хештег. Это может быть что-то вроде #love #life #friends (одни из самых популярных хештегов), представляющее собой абстрактные характеристики, которыми пользователи наделяют изображения. Также в Инстраграме есть и конкретные теги, например #brownbear, кликнув на который, понятное дело, мы увидим большое количество медведей.

Но если хештеги являются для кого-то отличным способом увидеть миллион картинок #путешествий других людей, то Фейсбук использует хештегированный контент несколько для других целей: работники тренируют свои программы для распознавания лиц и изображений — искусственный интеллект, который называется машинным зрением.

Фактически, они уже использовали 3,5 миллиона Инстраграм фотографий (с открытых аккаунтов) и 17000 хештегов для тренировки системы машинного зрения, которая, по заверению работников Фейсбука, являются лучшей из всего ранее созданного.

Обучение

Компьютерные зрительные системы можно учить распознавать объекты разными способами. Мы можем показывать им изображения, помеченные тегом «медведь», например, и они будут идентифицировать объекты на фото как медведей. Изображения вполне точно передают суть хештега и программы хорошо учатся таким образом.

«Это работает реально хорошо», — сказал Манохар Палури — руководитель группы Фейсбука по машинному зрению. В мире искусственного интеллекта, чем большее количество данных система сможет обработать, тем лучше будет результат. Также очень важны разнообразные данные — если Вы хотите научить ИИ-систему распознавать свадебные платья, то вы вряд ли будете показывать только свадебные фотографии из Северной Америки — необходимы будут фотографии со всего мира.

На некоторых изображениях хештеги указаны не осторожно. Именно поэтому ИИ-системам и нужно обрабатывать огромное количество данных. Искусственный интеллект учится объединять и комбинировать различные хештеги для получения одного и того же образа. Например, хештег #коричневыймедведь вместе с хештегом #гризли становится обозначением изображений медведей.

Но такие процессы обучения очень сложные, несовершенные и порождают шум. Например, Палури рассказывает, кто-то решает выложить фотографию, сделанную рядом с Эйфелевой Башней и присваивает изображению соответствующий тег, но сама башня будет не видна. Данный тег будет иметь значение в человеческом контексте, но машинному интеллекту будет очень сложно сопоставить содержимое фотографии с хештегом. Или, например, фотография, на которой изображена вечеринка в честь дня рождения, с именинником, держащим пирог, может быть не помечена тегом #пирог, что также не сможет помочь ИИ-программам в изучении того, как выглядят пироги.

Пример классификации изображений, которую системы распознавания в Фейсбуке могли делать раньше.
Новая система более точная: она может распознать животное не только как «птицу», но и как «лугового трупиала».

Тем не менее, это работает

«Не смотря на все сложности, это работает, — сказал Палури, — и работает хорошо». Система, которую тренируют на миллионе Инстраграм фотографий, научилась распознавать картинки с точностью 85%. Палури сказал, что у них получилась самая умная программа визуального распознавания, которая когда-либо была у Фейсбука.

Если Вы пользуетесь Фейсбуком, то знаете, что он может распознавать лица на фотографиях, которые Вы загружаете, и предлагает отметить их подходящим(по мнению ИИ) тегом. Это пример машинного зрения — в данном случае, распознавание лиц. Но также Фейсбук использует машинное зрение и для распознавания того, что находится на фотографии помимо лиц, в том числе визуального контента, который является запрещенным на данной платформе(например, порнография).

Палури сказал, что новая технология, по которой тренируют ИИ в Инстаграме, уже используется для того, чтобы помечать запрещенный контент на фотографиях. Также Палури похвастался значительным улучшением работы искусственного интеллекта, когда речь заходит о распознавании запрещенного контента.

Фото: images1.popmeh.ru, www.popsci.com

Banner

Добавить комментарий

Ваш e-mail не будет опубликован. Обязательные поля помечены *

Лимит времени истёк. Пожалуйста, перезагрузите CAPTCHA.

Смотрите также