Искусственный интеллект обогнал человека при распознавании образов

07.09.2021 0:16

Соревнования Visual Question Answering (VQA) Challenge 2021 в которых участвовали модели искусственного интеллекта, в частности, от Microsoft и Alibaba, соревновавшиеся с людьми, привели к уже давно ожидаемому результату. Алгоритм Alibaba продемонстрировал точность распознавания 81,26%, в то время как точность распознавания людьми составила 80,83%.

На VQA Challenge 2021 модели компьютерного зрения изучают изображения и отвечают на вопросы об изображениях. AliceMind смогла обойти модель Microsoft и людей, которые отвечали на вопросы параллельно с моделями.

Задание в соревновании VQA Challenge 2021 состояло из 250 000 изображений и абстрактных сцен. К каждому из них задавалось не менее трех волросов. Ответы на них принадлежат одному из трех типов:

1. Да/нет. Например: «Дождливо ли на фотографии?», «Ожидает ли человек на фотографии друзей?», «Расстроен ли человек на фотографии?»

2. Число. Например: «На сколько частей разрезана пицца?», «Сколько человек на фотографии?», «Сколько программ открыто на экране ноутбука?»

3. Другие. Например: «Кто на фотографии надел очки?», «На чем сидит ребенок?», «Что делает человек на фотографии?»

Alibaba использует AliceMind в чат-боте Alime Shop Assistant, которым ежедневно пользуются несколько десятков тысяч продавцов Alibaba.

Источник: Neurohive

Источник