Smart Engines запатентовала в США технологию ИИ для отсеивания «мусорных» изображений при удаленном обслуживании
Smart Engines запатентовала в США технологию искусственного интеллекта, которая вычленяет «мусор» среди изображений документов еще на входе – до того, как кадр отправится на распознавание. Алгоритм мгновенно сверяет изображение с эталонными шаблонами и отбраковывает нерелевантные, некачественные или искаженные снимки. Разработка позволяет исключить подачу в систему случайных изображений, снизить нагрузку на ИТ-инфраструктуру и повысить защиту удаленных каналов обслуживания. Это уже четырнадцатый патент Smart Engines в США. Об этом CNews сообщили представители Smart Engines.
«В дистанционных каналах обслуживания – от онбординга до кредитного скоринга и МФО-сервисов – злоумышленники часто создают на системы искусственную нагрузку. Они массово загружают неподходящие или намеренно искаженные кадры, чтобы «пробить» систему. Наш метод позволяет «вылавливать» эти изображения и таким образом защитить канал от такого рода атак. Технология особенно эффективна в банках и финтехе (KYC/AML, кредитование, работа с клиентами), телекоме (eSIM, оформление договоров), страховании, логистике, HR и других секторах, где требуется надежная работа с документами в режиме онлайн», – сказал Владимир Арлазаров, автор патента, генеральный директор Smart Engines, доктор технических наук.
Ученые Smart Engines поставили задачу: отсеивать неподходящие кадры еще до того, как устройство будет тратить ресурсы на их распознавание. Система сначала сопоставляет каждый кадр с «идеальными» шаблонами документа, затем оценивает, сколько совпадающих признаков – и как они распределены по предполагаемой области документа. Алгоритм также проверяет, нет ли чрезмерного сжатия или сильных искажений, а еще контролирует, чтобы документ занимал в кадре не меньше 70% от эталонного размера. Если кадр «не проходит» эту первичную фильтрацию, он сразу исключается из дальнейшего анализа.
По результатам проверок на публичном датасете процент ложных срабатываний снизился до нуля. Кадры, которые не прошли фильтрацию, действительно либо вовсе не содержали документ, либо были недостаточно высокого качества, чтобы извлечение из них информации могло принести ощутимую пользу. Для тестирования использовались датасеты MIDV-500 (50 типов удостоверений, по 300 кадров каждого типа) и eBDtheque (100 изображений комиксов) – последний выбран, поскольку геометрическая структура комикса напоминает документ и может «сбить с толку» ИИ.
Smart Engines патентует технологии по всему миру, что подчеркивает инновационность ее разработок в области компьютерного зрения и распознавания документов. В 2024 г. исследователи компании получили 18 патентов в России и 5 – в США. На сегодняшний день у компании 14 американских патентов в области ИИ.