Поймай бота: в Высшей школе экономики разрабатывают технологию идентификации текстов, сгенерированных ИИ любого типа

Ученые НИУ ВШЭ работают над созданием приложения, которое позволяет установить, написан текст человеком или сгенерирован искусственным интеллектом. Подход, на который опирается приложение, носит универсальный характер и позволяет «ловить» самых разных ботов, построенных на разной архитектуре. В ближайшее время запланировано тестирование прототипа в широком диапазоне текстов. Предполагается, что платформа будет доступна пользователям в 2025 г. Об этом CNews сообщили представители НИУ ВШЭ.

Развитие технологий искусственного интеллекта привело к тому, что объем текстов, сгенерированных ИИ, увеличивается лавинообразно. При этом тексты, которые генерируют боты, сегодня уже сложно отличить от тех, которые пишут люди. Как понять, что ты читаешь текст, созданный ИИ? Эту задачу решают исследователи Высшей школы экономики.

Существующие на сегодня подходы к идентификации текстов, сгенерированных ботами, зачастую базируются на работе с несколькими конкретными архитектурами бота, что существенно снижает диапазон их применения и делает уязвимыми перед будущими поколениями ботов. Цель проекта Вышки — создание эффективной системы обнаружения текстов, написанных разными программами, в широком классе ботов для различных языков.

«Наша разработка отличается от разработок конкурентов. Подавляющее большинство аналогичных проектов посвящено задаче идентификации конкретных архитектур генеративных языковых моделей (к примеру, ChatGPT). Это приводит к неизбежному устареванию таких наработок по мере развития инструментов генерации текстов и (или) возникновения новых типов ботов, а также вынуждает потенциальных потребителей использовать на практике сразу несколько моделей, ответственных за обнаружение ботов с различными архитектурами. Мы “ловим” всех ботов, а не только одного или нескольких, находящихся в нашем распоряжении», — Василий Громов, руководитель проекта, профессор департамента анализа данных и искусственного интеллекта факультета компьютерных наук НИУ ВШЭ.

Разрабатываемая система опирается на несколько различных областей математического знания: теория хаотических динамических систем, топологический анализ данных, теория размерности, теория кластеризации (четкой и нечеткой), нейронные сети и др. Это обеспечивает робастность системы: бот может «подделать» одну или даже несколько характеристик, но «подделать» их все крайне трудно.

«Нами проведены широкомасштабные вычислительные эксперименты с использованием различных методов анализа данных и искусственного интеллекта, что позволило определить наборы характеристик, наиболее подходящих для различения пространств и траекторий ботов и людей, и разработать прототип программного обеспечения», — Василий Громов, руководитель проекта, профессор департамента анализа данных и искусственного интеллекта факультета компьютерных наук НИУ ВШЭ

В ближайшее время запланировано тестирование прототипа в широком диапазоне текстов — от художественных произведений, сгенерированных ботами, до выпускных конкурсных работ студентов НИУ ВШЭ. Планируется, что широкому кругу пользователей платформа будет доступна в 2025 г. Сначала она сможет «ловить» ботов на русском и английском языках, но ученые уже работают над увеличением числа языков, с которыми может взаимодействовать система. Это прежде всего языки стран БРИКС и языки народов России.

Лучший софт для обеспечения ИТ-безопасности компании ― на ИТ-маркетплейсе Market.CNews. С ценами.

Короткая ссылка

Поймай бота: в Высшей школе экономики разрабатывают технологию идентификации текстов, сгенерированных ИИ любого типа

Другие материалы рубрики

MARKET.CNEWS

ИТ-безопасность

DBaaS

VDI

BaaS

Техника

Dreame X40 Ultra Complete — очень умный помощник с флагманскими характеристиками

Как умирали знаменитые мессенджеры: история провалов

Как выбрать смартфон и ноутбук для учебы в 2024 году: лучшие устройства от TECNO

Наука

Российские ученые первыми создали модель ИИ, которая сама обучается новым действиям без участия людей

В черных дырах есть сердце и легкие, благодаря им галактики избегают ранней смерти

Галактический переворот: обнаружены скрытые спутники Млечного Пути

Крупнейшие
ИТ-компании
России

Крупнейшие ИКТ-бюджеты регионов России 2024

Как с помощью SD-WAN обеспечить безопасную
и бесперебойную передачу трафика

Как сделать DevOps безопасным

Крупнейшие ИКТ-бюджеты регионов России 2024

Крупнейшие
ИТ-компании
России

Поймай бота: в Высшей школе экономики разрабатывают технологию идентификации текстов, сгенерированных ИИ любого типа

Другие материалы рубрики

MARKET.CNEWS

ИТ-безопасность

DBaaS

VDI

BaaS

Техника

Dreame X40 Ultra Complete — очень умный помощник с флагманскими характеристиками

Как умирали знаменитые мессенджеры: история провалов

Как выбрать смартфон и ноутбук для учебы в 2024 году: лучшие устройства от TECNO

Наука

Российские ученые первыми создали модель ИИ, которая сама обучается новым действиям без участия людей

В черных дырах есть сердце и легкие, благодаря им галактики избегают ранней смерти

Галактический переворот: обнаружены скрытые спутники Млечного Пути

Крупнейшие ИТ-компании России

Крупнейшие ИКТ-бюджеты регионов России 2024

Как с помощью SD-WAN обеспечить безопасную и бесперебойную передачу трафика

Как сделать DevOps безопасным

Крупнейшие ИКТ-бюджеты регионов России 2024

Крупнейшие ИТ-компании России

Крупнейшие
ИТ-компании
России

Как с помощью SD-WAN обеспечить безопасную
и бесперебойную передачу трафика

Крупнейшие
ИТ-компании
России