Спецпроекты

Искусственный интеллект

В России усовершенствовали ИИ-модель Vintix, теперь ей не нужно переобучение под каждую новую задачу

Ученые из института AIRI представили Vintix II – новую версию ИИ-модели, которая умеет подстраиваться под новые задачи без дополнительного обучения. Такой подход особенно важен для сфер, где условия постоянно меняются: в робототехнике, управлении энергосистемами и зданиями, автономном транспорте, в промышленном моделировании. Об этом CNews сообщил представитель института AIRI.

По сравнению с предыдущей версией – Vintix – проект стал значительно масштабнее. В обучающий набор включили еще шесть новых областей применения, а саму архитектуру дополнили специальным модулем, который помогает работать с разными типами данных. Благодаря этому Vintix II может использовать опыт, полученный в одной среде, для решения задач в другой. Именно это сочетание – большого объема разнородных данных и новой архитектурной доработки – позволило создать более универсального ИИ-агента.

Модель проверяли на внушительном наборе задач: 209 использовались для обучения и еще 46 для тестирования. Всего исследование охватило 10 различных доменов и более 700 млн шагов взаимодействия со средой. В набор данных вошло большое количество сценариев: от климат-контроля в зданиях до управления роботами-манипуляторами и компьютерного моделирования.

Тестирование проходило в двух режимах. В первом случае модель начинала работу без каких-либо подсказок и постепенно улучшала свои действия уже по ходу взаимодействия со средой. Во втором случае ей сначала показывали несколько примеров, чтобы она быстрее поняла новый контекст и адаптировалась. Таким образом, исследователи проверили сразу два важных качества: насколько хорошо модель умеет разбираться в новой задаче с нуля и насколько эффективно использует даже небольшое число примеров.

Результаты показали, что качество работы Vintix II стабильно растет, если давать ей больше демонстраций. Особенно заметно это проявилось в таких средах как Meta*-World, Industrial-Benchmark и SinerGym. В остальных случаях показатели как минимум не ухудшались. Это значит, что дополнительные примеры помогают модели точнее понять структуру задачи и выбрать более подходящую стратегию действий.

На тестовой выборке Vintix II достигла 67% уровня эксперта и показала прирост на 28% по сравнению с предыдущей версией Vintix в тех областях, где их можно было напрямую сравнить. В некоторых задачах модель также превзошла решение REGENT, что подтверждает ее высокий уровень среди подобных систем. Кроме того, результаты показали, что Vintix II умеет обобщать опыт и справляться даже с теми вариантами поведения среды, которых не было в обучающих данных.

«Такой подход можно рассматривать не только как исследовательскую идею, но и как практическую основу для создания универсальных ИИ-агентов. Модель умеет переносить полезные закономерности между разными средами и уточнять свою стратегию по мере накопления нового опыта. Это особенно ценно для задач со сложными, меняющимися условиями», – отметил Андрей Полубаров, научный сотрудник группы «Адаптивные агенты» института AIRI.

* Американская транснациональная холдинговая компания Meta Platforms Inc. по реализации продуктов социальных сетей Facebook и Instagram входит в перечень организаций, признанных в соответствии с законодательством Российской Федерации экстремистскими

Короткая ссылка