21 августа 2023

Как определить, что текст написала нейросеть

Искусственный интеллект — неплохой помощник во многих вопросах. Но безоговорочно доверять ему не стоит.

Основатель школы для копирайтеров

Как определить, что текст написала нейросеть

По данным Bloomberg, около 30% специалистов используют для генерации текста нейросети. В России 67% опрошенных хотят применять в работе искусственный интеллект, чтобы меньше трудиться самому и не терять в доходе. Вот только такая статистика радует далеко не всех заказчиков. Некоторые не доверяют нейросетям, поэтому предпочитают, чтобы тексты писали не роботы, а люди.

Разбираемся, почему заказчики с осторожностью относятся к технологиям и какие средства разоблачения нейротекстов существуют сегодня.

Почему к текстам от нейросетей стоит относиться с осторожностью

Вот основные причины, почему заказчики остерегаются подобных статей.

Риск нарушения авторских прав

Сегодня нет официальной позиции по вопросу, кому принадлежат авторские права на тексты, созданные с помощью ИИ. По закону автор — это человек, который творческим или интеллектуальным трудом создаёт произведение. Однако в случае с нейросетью люди только дают указания, но не пишут сами.

Так как сейчас закон не признаёт нейротексты объектами авторского права, правила использования сгенерированного технологиями контента определяются в пользовательском соглашении нейросети.

И если Open AI передаёт права на текст даже в бесплатной версии, то Gerwin ограничивает его применение в политических, дискриминационных целях или в недоброжелательной рекламе. А в Midjourney использовать контент в коммерческих целях можно только при условии генерации произведения на платном тарифе.

Риск получения неуникальной или недостоверной информации

Нейросеть получает запрос, проводит его через алгоритмы, анализирует доступную по теме информацию и выдаёт ответ. Не отрицая, что по такому же запросу от другого пользователя может выдать аналогичный или похожий текст.

И тут появляется новая опасность. Исследователи из Корнелльского университета пришли к выводу: если ответы нейросети на одинаковый вопрос сильно разнятся, то с большой вероятностью она придумывает факты.

Риск, что нейротексты понизят ресурс компании в поисковой выдаче

В конце прошлого года специалист группы качества Google Дуй Нгуен заявил, что у компании есть алгоритмы для обнаружения и понижения рейтинга материалов, созданных искусственным интеллектом. Поэтому многие опасаются, что поисковики будут искать такой контент и пессимизировать его. То есть понижать позицию в поисковой выдаче.

Прецеденты уже существуют. К примеру, маркетолог Нил Патель провёл эксперимент, создав 50 тестовых веб‑сайтов, которые разделил на две группы. Сайты первой части эксперт заполнил статьями, созданными исключительно искусственным интеллектом. На сайтах второй были размещены ИИ‑статьи, доработанные людьми, а также материалы, написанные копирайтерами без использования нейросетей.

Результаты эксперимента показали, что ресурсы первой группы потеряли несколько позиций в поисковой выдаче. И это привело к снижению трафика до 70%.

При этом представители Google добавили, что положительно относятся к развитию нейросетей и уже создали свой чат‑бот Bard. Но для компании в приоритете качественные тексты. Система, которая ранжирует результаты, в первую очередь предлагает пользователям материалы, отвечающие стандартам E‑E‑A‑T (опыт, компетентность, авторитетность, достоверность).

Тексты, соответствующие им, вызывают доверие и считаются полезными, поскольку содержат примеры, опыт, аналитическую часть, исследования. А контент, который создают нейросети, без дополнительной глубокой доработки человеком зачастую таковым не является.

Между тем, в Госдуме предложили вводить маркировку для материалов, созданных с помощью ИИ. А пока этого не произошло, определять, что текст сгенерирован нейросетью, придётся самостоятельно. Или с помощью специальных сервисов.

Как самостоятельно определить, что текст написала нейросеть

В технологическом университете МИРЭА недавно провели эксперимент, в котором приняли участие 20 преподавателей и свыше 200 студентов. Половина из них писали научную работу самостоятельно. А другие 50% воспользовались помощью нейросетей. Преподавателям же предстояло вычислить такие ИИ‑материалы.

Чтобы это сделать, педагоги обращали внимание на стилистические и орфографические особенности текста. Например, на большое количество повторяющихся слов и смыслов, фактические и логические ошибки, отсутствие оригинальных суждений. Таким способом преподаватели смогли выявить 96% работ, написанных с помощью нейросети. 4% студентов же, которых не разоблачили, признались, что потратили на редактуру ИИ‑текста много часов.

Универсальной инструкции, которая поможет вычислить текст, сгенерированный нейросетью, не существует. Однако проведённый эксперимент показывает: таким материалам присущи схожие паттерны. Рассмотрим их подробнее.

Повторы смыслов и слов

Одна из причин понижения сайта в выдаче — переоптимизация ключевыми словами. Нейросеть в ответ на запрос зачастую «отвечает по кругу». Иногда она использует разные вхождения, но смысл всё равно повторяется.

Так, на скриншоте, представленном ниже, искусственному интеллекту была поставлена задача написать продающий пост о новом щадящем способе окрашивания волос. И в небольшом тексте нейросеть неоднократно повторила одни и те же тезисы.

Почти в каждом предложении сгенерированного текста повторяется словосочетание «новый способ окрашивания». А также присутствует неоднократное дублирование смыслов о безопасности метода и индивидуальном подходе, который позволит подчеркнуть уникальность каждого клиента.

Вот несколько цитат из текста, иллюстрирующих это: «преобразить свой образ и выразить свою индивидуальность», «учитываем вашу индивидуальность», «подходящий именно вам», «создать для вас уникальный и стильный образ», «сделать вашу причёску неповторимой», «сохранить здоровье и блеск ваших волос», «безопасным для ваших волос», «бережно ухаживают за волосами, сохраняя их здоровье».

Между тем, достаточно было один раз упомянуть, что в салоне представлена новая процедура — щадящий метод окрашивания, который позволит сохранить волос живым. А также пояснить, как работает метод, в чём его новизна и почему он безопасен. И добавить, что палитра цветов разнообразна, а мастера, прошедшие обучение, не только качественно проведут окрашивание, но и помогут с выбором цвета.

Наличие в тексте большого количества штампов и клише, отсутствие чувственного опыта

Пример с окрашиванием также показывает: имитировать то, как человек говорит в жизни, нейросеть не может. Люди опечатываются, используют сленг и сокращения, намеренно искажают слова. Такая подача помогает привлечь внимание, вызвать эмоции, передать позицию автора, его чувственный опыт.

Исследования показывают: нейросеть не делится чувствами, не принимает чью‑либо позицию. Поэтому предпочитает нейтральность, штампы и клише. В указанном выше примере это «профессиональные навыки», «высококачественные материалы», «уникальная возможность».

При этом нейросеть генерирует тексты в разных стилях. Например, можно дать ей задачу подготовить материал на тему «Что влияет на стоимость нефти». Но уточнить, что писать текст следует не сухим языком, а с добавлением метафор и сравнений. Однако результат всё равно получается искусственным. Ведь у ИИ нет меры, он не «чувствует» текст так, как человек.

Наличие в тексте большого количества штампов и клише, отсутствие чувственного опыта

1 / 0

2 / 0

Увидеть, что полученный результат не сравнится с интонацией, присущей человеку, поможет один из абзацев: «Спрос и предложение — это как танец двух влюблённых на рынке нефти. Если спрос на нефть растёт, как бушующий океан, а предложение не успевает за ним, то цены поднимаются, как шампанское на новогодней вечеринке. Но если спрос снижается, а предложение растёт, то цены могут упасть, как шарик на детском празднике».

Текст кажется искусственным, а большинство оборотов в нём — неуместными. И хотя пост действительно получился «не сухим», сложно представить, что так написал бы эксперт. Кроме того, буквально каждое предложение — это метафоры и сравнения. Однако такие приёмы должны быть точечными и аккуратно встроенными в текст. Иначе за избытком образов потеряется смысл.

Наличие бессмысленных фраз и отсутствие логики

Лингвист Ноам Хомский в книге «Синтаксические структуры» отмечает: грамматически верное построение фраз в предложении не гарантирует наличия в нём логики и смысла. В пример эксперт привёл фразу colorless green ideas sleep furiously — «бесцветные зелёные идеи спят яростно».

Алгоритмы помогают нейросети строить правильные предложения с точки зрения грамматики. Однако для ИИ не существует понятия «смысл». И логика для каждого абзаца у него может быть своя, поскольку материал получен из разных источников.

К примеру, нейросеть попросили сгенерировать отзывы на гель для душа и спортивный костюм. Текст про одежду получился таким: «С помощью костюма можно расслабиться, погрузиться в мир спорта, а также выйти на прогулку. Он имеет регулировку температуры, благодаря которой чувствуешь себя комфортно в любой ситуации».

А вот отзыв на гель для душа: «Замечательный гель, не протекает, не утяжеляет кожу. Упакован в пакетик, в коробку, с крышкой. Не надо ждать ничего лишнего, чтобы он слегка рассыпался. Можно использовать, как ночной гель для душа».

Некоторые фразы в них правильно построены, но при этом кажутся абсурдными и напоминают иллюстрацию Хомского.

Отсутствие фактуры и поверхностные примеры

Искусственный интеллект даёт в текстах очевидную информацию, общие факты, использует обтекаемые фразы и примеры, которые мало раскрывают вопрос. При этом сложность темы не имеет значения. Вопрос может быть глубоким, как, например, перспективы развития инклюзии в России. Или более простым и индивидуальным, касающимся выбора техники.

В тексте про инклюзию нейросеть рассказала, как важна и актуальна эта тема. А также добавила, что инклюзия — это долгий процесс, сопровождающийся сложностями, но работы по созданию условий для людей с особенностями проводятся. И подвела итог: если не останавливаться, то развитие непременно будет.

Однако написанное не раскрывает вопрос. Важно, чтобы в тексте была конкретика. К примеру, можно проанализировать, какие из принятых законов работают, а какие — нет и почему. Раскрыть зарубежный опыт. И пояснить, какие конкретные шаги для развития инклюзии может ещё сделать государство, бизнес и каждый человек.

В тексте про покупку смартфона, сгенерированном нейросетью, также указаны очевидные факторы выбора. Например: следует определиться с операционной системой (iOS или Android), брендом, ознакомиться с отзывами и техническими характеристиками, а также учитывать собственные возможности.

Отсутствие фактуры и поверхностные примеры

1 / 0

2 / 0

Однако люди и так это понимают. Другое дело — рассказать про фишки операционных систем, указать ограничения, существующие на данный момент. Или упомянуть об инновационных решениях — например, о технологии eSIM, позволяющей иметь до пяти номеров в одном смартфоне. Или поделиться моделями устройств с завышенной ценой и их аналогами по оптимальной стоимости.

Искажение фактов, добавление придуманной информации

Нейросеть правдоподобно отвечает на практически любой вопрос, предоставляя хронику, даты, фамилии, историю происхождения. При этом информация бывает искажённой или полностью выдуманной. Такой баг в работе ИИ называют галлюцинацией.

Так, нейросети была поставлена задача: рассказать о знаменитых глухих людях, которые внесли большой вклад в развитие общества. В результате ИИ большую часть из них выдумал.

Искажение фактов, добавление придуманной информации

1 / 0

2 / 0

Например, астронавта Раймонда Лу или боксёра Марио Галлегоса. А 42‑м президентом США всё же был не Мэттью Клинтон, а Билл Клинтон. И слуха он не терял.

Кроме того, ИИ уверенно ответил на запрос «напиши пост о креативной амнезии». Несмотря на то, что такого термина не существует.

На вопрос, зачем бот придумывает людей и рассуждает о несуществующих терминах, он лишь приносит извинения за возможную путаницу.

1 / 0

2 / 0

Когда фальшивые факты переплетены с правдивыми данными, обнаружить галлюцинации нейросети сложнее. Особенно при беглом чтении. Но если сконцентрироваться на приведённых в тексте примерах, можно заметить те, что выглядят подозрительно, и проверить их, забив в строку поиска.

Отсутствие актуальной информации о текущих изменениях, событиях

Нейросети самообучаются при общении с пользователями, запоминая уточнения человека, его реакцию на сгенерированный контент, примеры, которыми человек делится с ботом. Эксперты отметили, что способность ИИ самообучаться стала для них неожиданностью. И что это умение помогает нейросетям совершенствоваться.

При этом машинное обучение, проводимое разработчиками на гигабайтах данных — статьях, книгах, текстах из Сети, — имеет чёткое начало и конец. И в основном нейросети не имеют доступа к поисковым системам. Поэтому информация, которая появилась после проведённого разработчиками обучения, недоступна ИИ до следующего этапа.

При этом перерыв между машинным обучением составляет месяцы, а иногда — годы. Конечно, прогресс не стоит на месте: к примеру, в мае текущего года пользователям с платной подпиской GPT Plus стал доступен ChatGPT с выходом в интернет. Однако большинство нейросетей, особенно их бесплатные версии, такой возможности пока не имеют.

Так, база бесплатной версии ChatGPT4 ограничена 2021 годом, поэтому бот не знает, кто выиграл последний Чемпионат мира по футболу в 2022 году. А нейросеть Google — Bard AI — призналась, что не может составить текст о значимых событиях, которые произошли в мире текущим летом.

Отсутствие актуальной информации о текущих изменениях, событиях

1 / 0

2 / 0

Поскольку её последнее обучение было проведено разработчиками в мае 2023 года, лето для Bard AI ещё не наступило.

В таких случаях нейросети обычно не придумывают факты, а признаются, что не могут «предсказывать будущее».

Если в тексте нет актуальных сведений по теме или он выглядит оторванным от реальности, поскольку за последнее время многое изменилось, то существует вероятность, что материал писала нейросеть.

Какие сервисы могут помочь

Распознать сгенерированный искусственным интеллектом текст можно и с помощью самой нейросети. Например, это умеет бот GPT-4. Также помочь могут и специальные сервисы, которые способны выявлять алгоритмы ИИ. Ниже рассмотрим некоторые из них.

Text.ru. Сайт позиционируется как биржа копирайтинга и антиплагиата. Но недавно на портале появился и платный нейропомощник. Одна из его функций — ИИ‑детектор. В окошко следует загрузить текст, который необходимо проверить. Через несколько секунд система выдаст результат.
PR·CY. В сервис можно загружать тексты объёмом от 1 000 знаков. При этом на портале есть уточнения: некачественные, переспамленные варианты, которые писал человек, система расценит как результат работы ИИ. Так же как и тексты с яркой стилистической окраской — например, похожие на произведения Маяковского.
GPTZero. Инструмент считывает сложность, сочетание слов, структуру и длину предложений. Однако если с текстами на английском сервис неплохо справляется, то при загрузке русскоязычного материала нередко выдаёт ошибку. Из плюсов — наличие бесплатной версии.

Нейросеть может быть отличным помощником. Например, при поиске идей. Однако полностью доверять ей контент опасно. Относиться к ИИ‑материалам стоит ответственно: редактировать переспам, проверять на достоверность, логику, актуальность фактов. И корректировать стиль под «человеческий» язык, чтобы не отпугнуть аудиторию, сохранить репутацию и позиции компании в поисковой выдаче.

6 нейросетей для создания логотипов

Как добавить бота в Discord

6 причин, почему не стоит слепо доверять искусственному интеллекту

Лучшие предложения

Nahodki AliExpress: samye interesnye i poleznye tovary

Находки AliExpress: самые интересные и полезные товары

10 полезных товаров дешевле 500 рублей

Находки AliExpress: 20 полезных товаров дешевле 1 000 рублей

Новый год как в детстве: 6 праздничных традиций, которые поможет соблюсти техника Gorenje

Отборные скидки до 64% от AliExpress, Redmond и других магазинов

15 стильных пуховиков стоимостью от 3 000 до 15 000 рублей

10 наборов для вышивания, с которыми захочется заняться рукоделием

12 комфортных дутиков для зимних прогулок

Это интересно

Обзор TECNO Spark 30 Pro — доступного смартфона, который не выбеливает селфи

Дети нашего времени. Какие они на самом деле

Брать или не брать: хитрый тест для самых бережливых

12 идей подарков на «Мегамаркете» для тех, кто участвует в «Тайном Санте»

Комментарии

Наталья Мурахтанова

21.08.23 14:27

Очень актуально, спасибо!

Вадим Емельяненко

21.08.23 19:17

Ничего актуального, статья написана человеком непонимающим в этом ничего.

Вадим Емельяненко

21.08.23 19:16

Статья написана человеком который сразу видно никогда не работал и не использовал сети для работы, ничего в них не понимает, все взято с разных источников, не из головы, вот это уж точно. Любой текст нейросети обрабатывается, допиливается и узнать кем и когда он написан вы никогда не сможете, как нейросеть, то что вы пишите ерунда чистой воды, я могу с вами поспорить на любые деньги и показать на примерах. Всё факты проверяются обязательно. Выводы? Автор пишет о чем не понимает.

Стефания Вишняк

18.10.23 15:31 | изменено

Любой человек, работающий с текстами, может отличить написанное живым копи от шлака, сгенерированного "Искусственным Идиотом". Потому что нейросети, на которые вы, айтишники и прочие технофилы, так дрочите, льют воду, искажают факты, громоздят нечитаемые фразы и даже в небольшом тексте на 1,5-2 K допускают повторы. Слабый копирайтер-новичок, работающий за 50/1000, и то пишет лучше. Одним словом, даже в более-менее читаемых текстах от нейросети встречаются речевые обороты, несвойственные людям, живущим на территории СНГ - это пусть качественный, но все равно гуглоперевод. Так что это вы пишете о том, о чем не имеете ни малейшего представления.

Danila Dunkel

25.01.24 11:47

Бред сивой кобылы, Емельяненко! Во-первых, научитесь грамотно говорить: "с (из) разных источников... из головы". Во-вторых, объясните свои термины ("допиливается" - кем, когда, за какой процент). В-третьих, с дураками, то есть с вами не спорят, тем более сомнительно, чтобы у вас были деньги. В-четвертых, эта статья про вас: не говорите ерунды "и узнать кем и когда он написан вы никогда не сможете, как нейросеть, " - здесь нет смысла. В-пятых, поскромнее надо быть и не хвастаться собственными завоеваниями: "Автор пишет о чем не понимает." (это про вас, не так ли?).

Viktor Semenov

21.11.24 21:48

по креативной амнезии. Смотря что Вы сами имеете в виду под этим понятием. Не самая последняя версия ИИ ответила. что такого медицинского термина не существует. Но вместе с тем под креативной амнезией она понимает "... Это скорее метафорическое или концептуальное выражение, используемое в обсуждениях творчества и креативных процессов. В отличие от термина "амнезия," который в медицинском контексте означает потерю памяти, "креативная амнезия" обозначает сознательное или полусознательное освобождение от предыдущих шаблонов мышления и привычек, чтобы открыть путь новым идеям и подходам... " Как то так.

Что вы могли пропустить

Выбираем электронную книгу с цветными чернилами: 5 крутых моделей

09:00

Ликбез

Устройства

WhatsApp и Skype будут вынуждены делиться данными российских пользователей

Вчера

Веб-сервисы

Новости

Как выбрать пароочиститель для дома и не разочароваться

Вчера

Ликбез

Устройства

OhSnap выпустит вирусный выдвижной геймпад для смартфонов, придуманный 19-летним подростком

Вчера

Новости

Устройства

Представлен ONEXPLAYER G1 — игровой мини-ноутбук с геймпадом под отсоединяемой клавиатурой

20 декабря

Новости

Устройства

Представлена PETBRICK 65 — меховая клавиатура для любителей кошек

20 декабря

Новости

Устройства

15 надёжных посудомоечных машин, которые не подведут

20 декабря

Ликбез

Устройства

Lenovo готовится выпустить ноутбук с «вырастающим» экраном

20 декабря

Новости

Советы

YaOS от «Яндекса» может появиться на всех импортируемых в РФ телевизорах

19 декабря

Новости

Технологии

Пользователи в России жалуются на проблемы с YouTube даже на смартфонах

19 декабря

Веб-сервисы

Новости

20 отличных фитнес-трекеров и смарт-часов в 2025 году

19 декабря

Ликбез

Спорт и фитнес

Insta360 представила Connect — саундбар для видеоконференций с двумя веб-камерами и ИИ

19 декабря

Новости

Устройства

Сравнение пылесосов: какой выбрать и на что обратить внимание при покупке

19 декабря

Устройства

ChatGPT теперь доступен через WhatsApp — без регистрации и обходных путей

19 декабря

Новости

Технологии

Китай запустил отечественную альтернативу Bluetooth под названием Star Flash

18 декабря

Новости

Технологии

Новые комментарии

Дмитрий Дендеберов2 минуты назад

0 / 0

"Но ещё независимость холодных земель удобна тем, что попасть туда можно без визы. Необходим лишь паспорт и некоторые документы о разрешении на посещение.» Кто-то кроме меня вкурсе, что "некоторые документы о разрешении на посещение» это и есть виза либо что-то более сложное (виза - регламентирована: дал документы/взнос и она есть, а "некоторые документы о разрешении на посещение» - это отсутствии гарантии в посещении антарктиды.

9 удивительных фактов об Антарктиде, о которых вы вряд ли знали

Mikhail Grenkov1 час назад

0 / 0

Выбирал давече читалку. До этого не пользовался никогда. Тоже хотел цветную, читал отзывы, по большей части сугубо положительные, но всеж решил предварительно посмотреть на устройства. К счастью в местном DNS оказались Onyx Galileo и Onyx Raphael. Крутил их туда-сюда минут 40, сравнивал. В итоге выбор пал на ч/б. С ним гораздо комфортнее оказалось работать. Цветной сильно уж серый без подсветки ну и приемлемого режима обновления я не нашел - или как-то очень криво все перерисовывается, дерганно, или перерисовывается норм, но качество итоговой картинки такое себе. В итоге взял на авито новый Onyx Edison 7.8 дюйма.

Выбираем электронную книгу с цветными чернилами: 5 крутых моделей