В ТУСУР разрабатывают программное обеспечение, которое распознаёт сообщения, созданные роботами

13 сентября – День программиста. Праздник тусуровцев, которые ежегодно создают в университете уникальные системы. Среди них - аспирантка кафедры КИБЭВС, которая разрабатывает программу для распознавания искусственного текста.

Распознать текст

Массово порождённые с помощью специальных алгоритмов тексты распространяются в сети Интернет как паразитный контент (спам), рассылки или посты в соцсетях. Такие автоматически сгенерированные сообщения способны нарушить нормальную работу электронных систем. Аспирантка кафедры КИБЭВС Анастасия Шумская работает над методикой, которая поможет мгновенно распознать текст, искусственно созданный ботами.

- Разработана альфа-версия продукта, который определит вероятность написания текста человеком или программным генератором, - говорит Анастасия Шумская, - исследован ряд текстовых характеристик, которые позволяют распознать искусственные тексты: это и символьные, и лексические, и синтаксические характеристики текста. Исследование показывает, что сгенерировать текст можно, используя исходник любого автора, а разработанная автоматизированная система поможет его определить и тем самым решить широкий спектр задач. Разрабатываемый алгоритм идентификации возможно внедрить в поисковые системы для более эффективного обнаружения поискового спама, а также в любые электронные системы, обрабатывающие тексты. Уже сейчас многие организации интересуются моей разработкой в целях собственной безопасности.

Получить достоверный результат

На данный момент аналоговые разработки есть и в России, и за рубежом, но нет законченного продукта, который давал бы достоверный результат. Аспирантка ТУСУР работает над качественным программным обеспечением, которое ускорит процесс нахождения и автоматически распознает искусственный текст.

-Человеку самостоятельно несложно выявить автоматически созданный текст, - поясняет Анастасия. Обычно текст содержит большое количество грамматических ошибок, либо использованы слова и словосочетания, не характерные для предметной области или редко используемые в данной тематике, что искажает смысл текста. Однако важной задачей является формализация и автоматизация процесса идентификации искусственных текстов. Создание программы, которая смогла бы быстро распознавать такие ошибки, особенно смысловые, требует времени и долгой технической отработки. Сейчас я заканчиваю научно-исследовательские работы: тестирую тексты, которые самостоятельно создаю для оттачивания алгоритмов системы.

Когда исследование завершится, программа сможет идентифицировать происхождение входного текста.

Междисциплинарный проект

Проект получил большой интерес со стороны российского научного сообщества. Анастасия принимала участие в городских, областных и всероссийских конференциях, где учёные в области лингвистики, психологии, искусственного интеллекта, нейроинформатики, когнитивной эргономики и компьютерных наук положительно оценили перспективы исследования. По словам Анастасии, работа носит междисциплинарный характер, поэтому мнение и советы компетентных специалистов были необходимы для полноценной работы.

- Изначально я не думала, что возможно создать такой продукт, - признаётся Анастасия Шумская, - но мой научный руководитель - проректор по научной работе и инновациям Роман Валерьевич Мещеряков - дал верное направление моим исследованиям, помог оптимизировать процесс работы и найти подход к решению возникающих задач и созданию алгоритмов.

Грантовый проект

Работа стала победителем грантового конкурса «У.М.Н.И.К.», где молодые учёные демонстрируют выдающиеся успехи в учёбе, научной работе и настроены на позитивные изменения в современной науке. Для развития своих исследований Анастасия получила 400 тысяч рублей на два года.

Сейчас исследования выполняются со значительным опережением, а значит, результаты будут выше изначально заявленных. Недавно Анастасия Шумская вошла в четвёрку победителей из ТУСУР в номинации «Премии молодым научным и научно-педагогическим работникам, специалистам, докторантам и аспирантам в возрасте до 35 лет включительно», ежегодного конкурса на звание «Лауреат премии Томской области в сфере образования, науки, здравоохранения и культуры». Победители данной номинации получили премии в размере 25 тысяч рублей от администрации Томской области.