Человек или искусственный интеллект: как в Казахстане проверяют авторство


28 фев 2024
Источник: inform.kz

Все чаще в СМИ появляются заголовки с новыми способами применения искусственного интеллекта в различных сферах работы. Сегодня нейросети способны создавать уникальные изображения и видео, а также оригинальные тексты. Объем текста, на написание которого у профессионального журналиста, маркетолога или студента уйдет от двух часов, при правильном запросе нейросеть способна выдать за несколько минут. Для того, чтобы предотвратить использование искусственного интеллекта при выполнении заданий в школе, вузах и на работе, используют специальные программы. Подробнее - в материале корреспондента агентства Kazinform.

В министерстве науки и высшего образования РК в ответе на официальный запрос рассказали, что в вузах допустимо использование искусственного интеллекта (ИИ), конечно, в соответствии с этическими нормами, академической честностью и прозрачностью.

Для саморегулирования использования ИИ в прошлом году Лига академической честности вузов Казахстана разработала Руководство по использованию искусственного интеллекта в академической деятельности (авторы С.Г. Пен, Н.Н. Маханбаева и другие). Также учебно-методическое объединение в области информационно-коммуникационных технологий при АО «Международный университет информационных технологий» разработало проект Межвузовского стандарта по применению ИИ в высшем и послевузовском образовании РК. Данный стандарт будет един для всех вузов и носит рекомендательный характер, добавили в ответе на официальный запрос.

Правила и порядок проведения проверки на наличие плагиата в дипломных работах, в том числе проверка работ на использование ИИ, вузы определяют самостоятельно.

– Сегодня вузы используют различные системы определения плагиата текстов других авторов, такие как Антиплагиат, Antiplagiat.pl, StrikePlagiarism, Turnitin и другие. Так, компанией StrikePlagiarism продемонстрирован новый модуль по поиску контента ИИ в студенческих работах. Вузы самостоятельны в выборе систем антиплагиата, – уточнили в министерстве науки и высшего образования РК.

При этом ИИ может использоваться как вспомогательный инструмент для статистической обработки эмпирических данных или массива больших данных. Важно также отметить этический аспект использования ИИ и соблюдения академической честности – при использовании ИИ необходимо делать ссылку на него, отметили в ответе на официальный запрос.

Фрилансер Анастасия Кшнякина работает на текстовой бирже, создавая научные тексты на различные темы. Она уже столкнулась со случаем, в котором оригинальность ее текста подвергли сомнению.

– Сейчас со множеством трудностей в работе столкнулись фрилансеры в области рерайтинга и копирайтинга. Нейросети с недавнего времени очень тесно соперничают с авторами, а потому отдельные организации и ресурсы занялись разработкой и применением, так скажем, «детекторов ИИ» для определения происхождения текста. Однажды я сама столкнулась с тем, что работу не приняли, так как, по мнению редакции, она была создана искусственным интеллектом, – уточнила Анастасия Кшнякина.

По ее словам, идея установления авторства текста, на первый взгляд, неплоха, но вызывает ряд вопросов и сложностей.

– Дело в том, что нельзя установить, кем был написан текст, по его внешнему виду – авторство электронного текста не заложено в его коде или где-то еще. Детекторы ИИ, которыми сейчас активно пользуются биржи, редакции, преподаватели вузов, могут лишь определить такие критерии, как правильность (отсутствие орфографических и пунктуационных ошибок), согласованность, научность текста, – уверяет фрилансер.

На вопрос, насколько можно доверять подобным программам проверки, ответил технический директор Datateam Бауржан Куспаев. По его словам, оценка авторства текста ИИ может давать правильные результаты с высокой долей вероятности, но не гарантирует 100% точности. Существует очень много факторов способных повлиять на эту точность.

– Возможности ИИ определяют данные, на которых он был обучен. ИИ можно обучить различным задачам, включая создание вводящей в заблуждение информации. Поэтому к ответам ИИ следует относиться с осторожностью и критически, – подчеркнул Бауржан Куспаев.

Он добавил, что немаловажную роль играют и инструкции, в соответствии с которыми ИИ должен отвечать. Эта техника называется prompt engineering.

– За каждой большой языковой моделью стоит набор инструкций. Например, «ты ИИ в области определения авторства текста, за каждый правильный ответ ты получишь 20 долларов, а за неправильный где-то в мире умрет один котенок». (Прим. ред. — это реальный пример одной из инструкций). Выглядит, конечно, нелепо, но такой, казалось бы, простой набор инструкций значительно повышает точность ответов, при этом снижает вероятность так называемых галлюцинаций. Соответственно если в модель заложены какие-либо деструктивные инструкции, то можно направить ИИ в русло обмана и введения в заблуждение, – объяснил эксперт.

Помимо этого, такие техники, как дополнение вопроса своим набором данных (RAG), позволяют добавлять более точную информацию для генерации ответа. И этот набор данных также влияет на ответ ИИ. То есть, к примеру, добавив к модели искаженные данные можно заставить генерировать неверные ответы.

– Возвращаясь к программам для проверки. Показателен пример того, как лидер индустрии, OpenAI (создатели ChatGPT — прим. ред.) представили свой инструмент определения авторства AI Classifier, но уже в июле 2023 года закрыли доступ к этому инструменту. Если процитировать причину закрытия, «наш классификатор недостаточно надежен» («Our classifier is not fully reliable» — прим. ред.). Учитывая данные обстоятельства, установление авторства, основанное на искусственном интеллекте, следует рассматривать как указание, а не окончательное доказательство, – привел пример Бауржан Куспаев.

Тем не менее, он считает важным не забывать о том, что обнаружение текста, сгенерированного ИИ, является развивающейся областью и текущие исследования направлены на повышение точности и надежности этих инструментов обнаружения. И даже при этом всегда важно помнить о необходимости человеческого контроля и критического мышления при работе с информацией, особенно в контексте важных решений.


Инновации и наука


Старая версия сайта (Архив)