Альянс в сфере ИИ выпустил новую версию бенчмарка больших языковых моделей MERA

Альянс в сфере искусственного интеллекта представил новую версию бенчмарка MERA: в нее вошли динамический лидерборд, обновленная кодовая база замеров, более совершенная система промптов и улучшенные датасеты, поддержка API, а также замеры десятков новых моделей, включая созданные OpenAI. Об этом CNews сообщили представители Альянса в сфере ИИ.

MERA (Multimodal Evaluation for Russian-language Architectures) – это крупнейший независимый открытый бенчмарк для оценки фундаментальных моделей русского языка, совместно разработанный на площадке Альянса в сфере искусственного интеллекта исследователями от индустрии – командами Сбербанка и MTS AI, а также академическими партнерами Skoltech AI и НИУ ВШЭ.

Обновленная версия бенчмарка включает в себя 15 основных задач, из которых строится рейтинг, и восемь открытых публичных датасетов.

С момента релиза первой версии бенчмарка им воспользовались десятки разработчиков моделей, отправивших свыше 1000 сабмитов. Совершенствование MERA стало возможно благодаря комментариям пользователей и обратной связи от участников NLP-сообщества. Дальнейшее развитие MERA предусматривает появление в нем задач для оценки распознавания изображений, аудио- и видеоматериалов.

Подобрать тариф на виртуальные рабочие места VDI на ИТ-маркетплейсе Market.CNews

Короткая ссылка

Альянс в сфере ИИ выпустил новую версию бенчмарка больших языковых моделей MERA

Другие материалы рубрики

MARKET.CNEWS

IP-телефония

DRaaS

Colocation

DBaaS

Техника

Обзор беспроводных наушников Baseus Bowie H1i: Hi-Res Audio, 100 часов работы и ANC

Лучшие флагманские TWS-наушники 2025 года: выбор ZOOM

Самые умные зубные щетки в 2025 году: хиты продаж

Наука

Найдены следы динозавра возрастом 166 миллионов лет, он был размером с пони

Сталагмиты из древней пещеры показали, что Сахара была оазисом еще 8000 лет назад

Разгадана космическая загадка, почему скопления галактик остаются горячими

Совместимость решений — один из главных вызовов при внедрении заказного ПО

Global ERP:
как отечественная система
заменяет SAP

Цифровизация закупок: простая автоматизация
или способ сохранить бизнес в 2025 году

Совместимость решений — один из главных вызовов при внедрении заказного ПО

Global ERP:
как отечественная система
заменяет SAP

Если сотрудники начинают терять важные сообщения, стоит задуматься о внедрении бизнес-платформ

Альянс в сфере ИИ выпустил новую версию бенчмарка больших языковых моделей MERA

Другие материалы рубрики

MARKET.CNEWS

IP-телефония

DRaaS

Colocation

DBaaS

Техника

Обзор беспроводных наушников Baseus Bowie H1i: Hi-Res Audio, 100 часов работы и ANC

Лучшие флагманские TWS-наушники 2025 года: выбор ZOOM

Самые умные зубные щетки в 2025 году: хиты продаж

Наука

Найдены следы динозавра возрастом 166 миллионов лет, он был размером с пони

Сталагмиты из древней пещеры показали, что Сахара была оазисом еще 8000 лет назад

Разгадана космическая загадка, почему скопления галактик остаются горячими

Совместимость решений — один из главных вызовов при внедрении заказного ПО

Global ERP:как отечественная системазаменяет SAP

Цифровизация закупок: простая автоматизация или способ сохранить бизнес в 2025 году

Совместимость решений — один из главных вызовов при внедрении заказного ПО

Global ERP:как отечественная системазаменяет SAP

Если сотрудники начинают терять важные сообщения, стоит задуматься о внедрении бизнес-платформ

Global ERP:
как отечественная система
заменяет SAP

Цифровизация закупок: простая автоматизация
или способ сохранить бизнес в 2025 году

Global ERP:
как отечественная система
заменяет SAP