Чем и как определить, что текст написан ИИ: обзор инструментов

Считается, что т.н. искусственный интеллект Dall-E хорошо рисует, Vall-E прикольно говорит, а теперь есть еще и ChatGPT, который помимо прочего пишет тексты.

Притом эти самые тексты ИИ пишет (составляет) до такой степени складно (есть и такое мнение), что выявить их «искусственное» происхождение иногда можно только с применением специальных программных инструментов. Благо, такие тоже существуют.

Правда, и мы намеренно акцентируем Ваше внимание на данном факте, такие инструменты пока очень далеки от совершенства (проще говоря, работают они так себе).

Но за неимением других пользоваться приходится тем, что есть. И сейчас вкратце о нескольких наиболее удачных (на наш взгляд) решениях.

Не пропустите: OPENAI S SERVICES ARE NOT AVAILABLE — КАК ОБОЙТИ И ЗАРЕГИСТРИРОВАТЬСЯ В CHATGPT

Итак,..

GPT-2 Output Detector

Самый что ни есть непосредственный родственник ChatGPT. В том смысле, что «детектор» этот тоже разработан специалистами OpenAI и в настоящее время является одним из самых инновационных инструментов такого типа в мире.

А OpenAI, напомним, технологиями «имитации и дублирования» художественных способностей человека официально занимается аж с 2015 года. То есть, начали ребята задолго до нынешнего хайпа вокруг ChatGPT.

Вокруг сервиса GPT-2 Output Detector хайпа вообще никакого не наблюдается. Тем не менее он уже тоже функционирует, притом сравнительно давно. Но пока только в демо-режиме. Но работает. Вот [ССЫЛКА] на страницу проверки текстов.

Организовано все просто и понятно: открываем страницу по ссылке, вставляем текст в поле — и прога тут же определяет (а точнее, «предсказывает»), написан ли он человеком (Real) или сгенерирован ИИ (Fake).

Не пропустите: КРИПТОГРАФИЧЕСКИЙ ВОДЯНОЙ ЗНАК В CHATGPT: ЧТО ЭТО И КАК «УДАЛЯТЬ»

GLTR

Это сокращенно от Giant Language Model Test Room. Система создана в 2019 году совместно специалистами компании MIT-IBM Watson AI Lab и Гарвардского университета.

Что характерно, создана она была именно как инструмент выявления сгенерированных ИИ текстов и в ответ на выпуск OpenAI как раз программы GPT-2.

Работает GLTR по принципу «takes one to know one», то бишь «…сам такой». В том смысле, что тест GLTR анализирует тоже с помощью ИИ путем «предсказывания» слов — [ССЫЛКА].

И если прога сама правильно угадывает слова по тексту, то делает вывод, что текст сгенерирован. В противном же случае, т.е. угадывать каждое следующее слово у неё не получается, она скажет, что текст, вероятнее всего, написан человком.

Не пропустите: КАК ВЫЯВИТЬ НЕВИДИМЫЕ СИМВОЛЫ В ТЕКСТЕ НА САЙТАХ?

GPTZero

А это программное изделие создал не кто иной, как лично Эдвард Тиан (студент Принстонского университета). Который с некоторых пор обрел широкую известность (в узких кругах) публичными заявлениями относительно того, что студенты уже во всю делают учебные задания с помощью ChatGPT и прочих аналогичных программ.

И одними лишь заявлениями Тиан, как видим, не ограничился. Его GPTZero умеет рассчитывать «случайность» в предложениях и на основе эти данных определяет авторство.

Вот [ССЫЛКА] — переходим на сайт, вставляем текст в поле, затем прокручиваем экран в самый низ и жмем кнопку «Get GPTZero Result». Работает сервис довольно медленно (и непонятно), но тоже может быть где-то полезен.

Общая проблема детекторов текста ИИ

Если взять два теста — написанный собственноручно и сгенерированный в ChatGPT — и прогнать из через детекторы, то все проги (и перечисленные в этом посте и другие), вероятнее всего покажут, что оба теста «искусственные».

И это таки проблема! НО что еще «интереснее», не понятно, как с нею быть дальше.

Дело в том, что авторы, которые сегодня профессионально или полупрофессионально пишут онлайн, уже очень давно пишут не толко для читателей-людей, но и для алгоритмов тоже. Поисковых систем. И ходу работы уже на автомате руководствуются определенными алгоритмами (упрощают и сокращают предложения, расставляют ключевые фразы, выделяют заголовки, цитаты и т.д.).

Другими словами, сами авторы пишут как ИИ, это во-первых. А во-вторых, все ИИ учились и учатся на тех тестах, которые по алгоритмам и для алгоритмов пишут люди. Такая вот загогулина…

[irp]

Что будем искать? Например,VPN

Мы в социальных сетях