Как использовать GPTZero — инструмент для поиска текста, созданного ChatGPT
Что такое GPTZero и зачем он нужен
GPTZero — это сервис, который анализирует загруженный текст и пытается определить, была ли использована одна из больших языковых моделей (LLM) при его написании. К таким моделям относится, например, нейросеть в основе ChatGPT. Систему разработал выпускник Принстонского университета Эдвард Тянь, чтобы помочь преподавателям в проверке студенческих работ на плагиат.
Формально система принимает русский язык для проверки, но не может его полноценно сканировать. Поэтому сервис пока стоит использовать только с английским. Возможно, в дальнейшем появится поддержка и других языков.
Для определения оригинальности текста GPTZero ориентируется на два основных критерия — уровень случайности в составленных предложениях (Perplexity) и разрывность, или вариативность, этих предложений (Burstiness).
Perplexity показывает, выглядят ли отдельные предложения или выражения из входного текста как нечто, собранное языковой моделью. Чем выше этот показатель, тем больше вероятность, что содержимое написано человеком.
Burstiness относится скорее к распределению случайности между всеми предложениями. Нейросети обычно генерируют чётко выстроенный текст с фразами примерно одной длины. В работах людей может быть больше вариантов длины и нетипичных выражений. Как и в случае с первым показателем, чем выше уровень Burstiness, тем вероятнее авторство реального человека.
Стоит отметить, что на данный момент GPTZero нельзя назвать идеальным инструментом для проверки текстов. Система не всегда выдаёт правильный результат. Алгоритм неплохо справляется с выявлением сгенерированных предложений, но и полностью написанные человеком работы часто относит к плагиату. Иногда возникает и обратная ситуация: несуразные истории от нейросети GPTZero принимает за оригинальные тексты.
Скорее всего, «проницательность» сервиса улучшат в будущем, но пока его стоит использовать только как дополнение к другим инструментам и вашим собственным знаниям.
Как использовать GPTZero
Если вам нужно быстро проанализировать небольшой текст, то регистрация не понадобится. Достаточно перейти на сайт GPTZero и активировать функцию. Для регулярного использования и проверки нескольких файлов одновременно придётся создать аккаунт. Это бесплатно и занимает не больше пары минут.
Материал можно вставить в текстовое поле или загрузить в виде документа. Принимаются форматы PDF, DOCX и TXT. В тексте должно быть не меньше 250 символов, чтобы алгоритм смог его полноценно проанализировать.
Перед началом проверки необходимо подтвердить галочкой, что вы согласны с условиями использования сервиса. Помните, что при добавлении текстов или загрузке документов в GPTZero разработчик или владельцы сервера могут получить доступ и сохранить вашу информацию себе. Поэтому данный инструмент не стоит применять для работы с конфиденциальной информацией. Когда будете готовы, нажмите кнопку Get Results.
После активации проверки GPTZero быстро проанализирует текст и представит результаты ниже на странице под полем ввода. По заголовку сразу будет понятно, какой вердикт вынесла система.
Сервис выдаёт один из нескольких вариантов: текст полностью написан человеком, целиком создан ботом или может содержать части, которые составлены нейросетью.
Если GPTZero найдёт отдельные подозрительные куски, за которыми могла стоять нейросеть, то он покрасит их жёлтым цветом. Иногда система ошибается и выделяет авторские абзацы как сгенерированные.
Прокрутите страницу ниже, чтобы изучить показатели Perplexity и Burstiness в разделе со статистикой. Два этих свойства определяются баллами. Чёткой градации для оценок пока нет. Можно ориентироваться на степень «закрашенности» шкалы.
В конце блока GPTZero также выводит предложение с наивысшей степенью оригинальности и его индивидуальную оценку. С этими результатами система также может ошибаться. Часто алгоритм выдаёт именно сгенерированный текст, а не написанное человеком. Поэтому опираться на итоги стоит с осторожностью.
Базовая версия GPTZero доступна бесплатно, но с ограничениями. Можно проверять тексты объёмом не более 5 000 знаков и загружать не более трёх документов одновременно. Платные подписки за 10 и 20 долларов в месяц расширяют ограничение до 50 000 знаков и дают возможность регулярно работать с большим объёмом записей преподавателям или организациям.
Станьте первым, кто оставит комментарий