Российский разработчик создал ИИ, которому не нужны графические процессоры и дата-центры
Разработчики из Smart Engines улучшили скорость и качество распознавания текста новой версией нейросети, которая при этом может работать на устройствах без GPU и не нуждается в дата-центре.
Новое поколение ИИ
Новое поколение нейросети GreenOCR 2.0 российского разработчика Smart Engines на 20% быстрее считывает данные и при этом использует значительно меньше электроэнергии, сообщили CNews Smart Engines.
Количество ошибок по сравнению с предыдущей версией снизилось в 10 раз. Система работает с печатным и рукописным текстом на 103 языках.
Smart Engines создана в 2015 г., как указано на ее сайте, Владимиром Арлазаровым, внуком одного из «отцов советского ИИ» Владимира Львовича Арлазарова. Основные программные решения Smart Engines включают продукты для распознавания и проверки подлинности документов; для считывания QR-кодов, банковских карт и номеров телефонов. Их используют крупные российские аэропорты, банки, сотовые операторы, госсектор.
Усовершенствованная архитектура
Для улучшения показателей нейросеть обучили понимать не только сами символы, но и их структурные взаимосвязи: соседство фрагментов букв, точки соединения элементов и другие графические особенности.
В GreenOCR 2.0 применяются сверхлегкие вычислительные архитектуры — 4,6-битные и усредняющие 8-битные сети. В основе GreenOCR лежит технология замены вещественных чисел на целые. Это позволяет развернуть всю функциональность ИИ даже на устройствах без GPU, пояснили разработчики.
Фильтры 4,6-битных нейронных сетей квантуются таким образом, чтобы промежуточные данные обладали ограниченной разрядностью, давая возможность более эффективно использовать векторные операции процессора. Вычислительное ядро применяет скалярное произведение на основе древовидного усреднения и использует регистры вдвое интенсивнее.
«За счет полностью локальной работы технологии не нужны дата-центры и мегаватты энергии: все распознавания клиентов компании за год выделяют меньшее количество CO2, чем nhb уличных газовых обогревателя за аналогичный период», — отметил Владимир Арлазаров, генеральный директор Smart Engines.
Проблема дата-центров
Проблема дата-центров (центр обработки данных, ЦОД) в том, что они расходуют много энергии. По данным Международного энергетического агентства, в 2025 г. США являются абсолютным мировым лидером по установленной мощности центров обработки данных (53,7 ГВт), которые потребляют уже 8,9% всей электроэнергии страны.
Спрос на вычислительные ресурсы из-за развития технологий ИИ растет. Строятся новые центры и уровень энергопотребления увеличивается. Новый ИИ-объект в Вайоминге (штат на западе США), например, будет потреблять больше электричества, чем все жилые дома штата вместе взятые.
По прогнозам аналитиков Dell'Oro Group, к 2029 г. ежегодные мировые капиталовложения в дата-центры превысят $1 трлн, а их средний темп прироста (CAGR) составит 21%. Компания Microsoft, к примеру, как писал CNews в январе 2025 г., планирует в 2025 г. потратить $80 млрд на строительство ЦОДов, что почти на 60% больше всех капитальных затрат корпорации, сделанных в 2024 г.