Ученые Smart Engines научились распознавать рукописную «шиншиллу» из мемов про русский курсив
Ученые компании Smart Engines обучили ИИ распознавать трудночитаемые рукописные слова, такие как «шиншилла», без языкового контекста. Новая нейросеть не использует знаний о словах русского языка и учитывает только особенности сопряжения букв на изображении. Такой подход снижает вероятность галлюцинаций ИИ на редко встречающихся словах, включая имена собственные. Об этом CNews сообщили представители Smart Engines.
Слово «Шиншилла» – своеобразный тест Тьюринга для систем распознавания рукописного текста на кириллице. Сложность задачи обусловлена тем, что при быстром и не очень аккуратном письме строчные формы букв «ш», «л», «и» становятся практически неразличимы. По этой причине слово «шиншилла» неоднократно упоминалось в мемах про сложность русского языка.
Нейросетевая архитектура «Да Винчи» не использует лингвистические механизмы — рекуррентные схемы, триграммы и словари. За счет этого она работает быстрее аналогов и занимает меньше места в памяти устройства. Но даже это не гарантирует переобучения языковому контексту. Для сокращения риска галлюцинаций «Да Винчи» обучена на 1,2 млн строк рукописного текста, синтезированного с равномерным распределением сочетаний букв.
«Основной целью было создать метод ИИ, который умел бы читать такие сложные для прочтения рукописные слова, как «шиншила», но без использования языкового контекста. Это необходимо для распознавания документов - паспортов, штампов о регистрации и других. В них надо читать ровно то, что написано, а не то, что правильно с точки зрения языка», – сказал генеральный директор Smart Engines, доктор технических наук Владимир Арлазаров.
Выход новой технологии приурочен к десятилетию выпуска первой системы распознавания паспорта России в видеопотоке на смартфоне. 17 марта 2015 г. ученые Smart Engines первыми в мире реализовали возможность распознавания страниц основного разворота паспорта на мобильном телефоне в видеопотоке в режиме реального времени. Целевыми моделями в то время были iPhone 4S и Samsung Galaxy S3.