Даже некоторые из лучших искусственного интеллекта не могут превзойти этот новый стандарт

Южные Новости

Sunday, April 20 2025

Некоммерческий Центр безопасности искусственного интеллекта (CAIS) и компания Scale AI, предоставляющая ряд услуг по разметке данных и разработке искусственного интеллекта, выпустили сложный новый стандарт для передовых систем искусственного интеллекта.

Созданный для проверки Humanity’s Last Exam включает тысячи вопросов, собранных через массового опроса, касающихся таких предметов, как математика, гуманитарные науки и естественные науки. Чтобы сделать оценку более сложной, вопросы представлены в нескольких форматах, включая форматы с диаграммами и изображениями.

По предварительному исследованию ни одна из общедоступных флагманских систем искусственного интеллекта не смогла набрать более 10% на Humanity’s Last Exam.

CAIS и Scale AI планируют открыть стандарт для исследовательского сообщества, чтобы исследователи могли “погрузиться в разнообразие” и оценить новые модели искусственного интеллекта.

Южные Новости

Даже некоторые из лучших искусственного интеллекта не могут превзойти этот новый стандарт

Recent Posts

Тоглия достигает жертвенный удар в 14-м иннинге, и Rockies обыгрывают White Sox 5-4

OpenAI излагает свои планы по переходу к коммерческому бизнесу

Плей-офф Восточной Конференции - это противостояние фаворитов сезона Кельтов и гордых аутсайдеров Пейсерс

Отчет Google об окружающей среде уклончиво избегает фактической стоимости энергии искусственного интеллекта

Победа 'Аноры' на Оскаре приносит премию Американской киноакадемии в новую эру