«Яндекс» обновил технологию фотоперевода: новая версия поможет легко читать тексты с картинок на десятках языков

«Яндекс» представил новую версию технологии перевода текста на фото и изображениях на базе нейросетей. Компания одной из первых в мире применила большую языковую модель, чтобы переводить картинки с учетом контекста. Технология поможет, например, в поездке, если нужно быстро перевести меню в ресторане, или в работе, чтобы разобраться в нюансах технической документации на иностранном языке. Кроме того, «Яндекс» улучшил визуализацию перевода — текст теперь легче читается и больше похож на оригинальную верстку. Обновление уже доступно в «Переводчике» и «Браузере», а позже появится и в «Умной камере».

Модель семейства YandexGPT понимает стиль оригинального текста и может сохранить игру слов, например, на фотографиях рекламных слоганов или газетных заголовков. Новая технология на базе нейросетей позволила подбирать более точные формулировки во фразах с несколькими значениями и не переводить выражения дословно. За счет этого выросло как качество перевода простых текстов, таких как состав косметической продукции, так и сложных — публицистических статей, энциклопедий и инструкций. Перевод на основе большой языковой модели работает для изображений с текстом на английском.

Яндекс

«Яндекс» обновил технологию фотоперевода

Чтобы пользователю было удобно читать перевод текста на картинках, «Яндекс» улучшил его визуализацию для нескольких десятков языков. Технология стирает оригинальный текст с изображения и располагает переведенный поверх него: алгоритмы подбирают шрифт, размер и цвет букв, а также убирают различные артефакты таким образом, чтобы переведенные изображения выглядели наиболее естественно. Кроме того, текст получается контрастным, за счет чего его читать даже легче, чем оригинал. Технология распознает переносы слов и может понять их значение, даже если в кадр попала только часть.

Для перевода текста на изображениях разработчики «Яндекса» создали отдельную модель семейства YandexGPT, адаптированную под задачи перевода с английского на русский. Ее обучали на множестве пар оригинальных и переведенных текстов. Модели показывали примеры качественных и плохих переводов, чтобы она училась подражать эталонным, избегала ошибок и не добавляла в свои тексты несуществующие детали.

Для того чтобы нейросеть могла быстро обрабатывать большое количество запросов пользователей, разработчики применили метод дистилляции, при котором от большой «учительской» модели семейства YandexGPT знания передаются к меньшей «ученической». Меньшая модель старается подражать поведению большой модели, и качество ее ответов остается на уровне «учительской» при меньших вычислительных затратах.

Присоединяйтесь к AgroCode Conf Genetics — будущее отечественной селекции и генетики уже здесь!

Короткая ссылка

«Яндекс» обновил технологию фотоперевода: новая версия поможет легко читать тексты с картинок на десятках языков

Другие материалы рубрики

MARKET.CNEWS

Colocation

Онлайн-бухгалтерия

Dedicated

VPS

Техника

Обзор Dreame Z20 AquaCycle Station: настоящий комплекс для влажной и сухой уборки

Умные кондиционеры с русскоязычным голосовым помощником: выбор ZOOM

Лучшие приложения для отслеживания полезных привычек: выбор ZOOM

Наука

Вселенная закончится гораздо раньше, чем мы думали: исчезнет всё, от черных дыр до людей

Еще одна Великая стена? Раскрыты секреты загадочной конструкции в Гоби

Как пережить массовое вымирание: ученые выяснили, как восстанавливается жизнь после катастрофы

Карта рынка: отечественные поставщики СХД

Исследование CNews: какие компании контролируют поставки ноутбуков в школы?

Карта рынка: отечественные поставщики СХД

Исследование CNews: какие компании контролируют поставки ноутбуков в школы?

Топ-10 вендоров BPMS

CNews. МиллиардерыПервыйопубликован первый рейтинг самых богатых владельцев публичных интернет-компаний в России