Как обнаружить ИИ-текст: реальные методы и их пределы
Я проверяю тексты для контентной редакции уже четвёртый год. Сначала это была ручная вычитка, потом подключились детекторы, потом мы научили внутренний классификатор. Скажу сразу: серебряной пули нет. Любой детектор даёт ложноположительные и ложноотрицательные срабатывания, и понимать пределы важнее, чем верить процентам.
Зачем вообще обнаруживать
Причины разные. Кому-то нужно понимать, что у автора в портфолио свой стиль, а не «отдала промпт и забрала ответ». Преподавателям — отличить честную работу от подсунутой. SEO-командам — поймать партнёров, которые сдают сгенерированные описания товаров пачками. Везде задача похожа, но допустимая ошибка разная.
Что замеряют детекторы
Под капотом большинства публичных детекторов лежит одна или несколько метрик:
- Perplexity — насколько «предсказуемо» каждое следующее слово для языковой модели. У человека текст более рваный, у генерации — более ровный.
- Burstiness — разброс длин и сложности предложений. Люди пишут «всплесками», модели стремятся к среднему.
- Лексическое разнообразие — отношение уникальных слов к общему числу.
- Стилевые маркеры — частота вводных слов, предлогов, сложных конструкций.
Эти метрики прогоняются через классификатор, на выходе вероятность «текст сгенерирован».
Где они врут
Главный провал — короткие тексты. На 200 словах метрики статистически шумные, и классификатор кидает кубик. Я видела детекторы, которые на одном и том же абзаце выдавали 12% и 87% в зависимости от лишнего пробела.
Второй провал — переведённый текст. Когда автор пишет на русском, а потом прогоняет через переводчик и отдаёт английский — это тоже «гладко» и тоже похоже на сгенерированное.
Третий — пост-редактирование. Если человек взял сгенерированный текст и переписал каждый второй абзац, детектор путается. Гибридный текст — самая частая реальность 2026 года.
Что реально работает в моей практике
Не один сигнал, а пакет. У меня в работе три уровня:
- Автоматический скрининг через два детектора (один публичный, один свой). Если оба согласны — флаг.
- Сравнение с предыдущими работами автора. Резкая смена стиля, словаря, ритма — флаг.
- Содержательная проверка. Сгенерированный текст часто «правильный, но пустой»: нет конкретики, нет цифр, нет личных деталей.
Третий уровень — самый надёжный. Текст про «как я переехала в Тбилиси и сняла квартиру» отличается от сгенерированного не структурой, а тем, упомянуты ли реальные районы, реальные цены, фамилия конкретного риелтора. Не упомянуты — это либо очень общий обзор, либо подделка.
Стилевой фингерпринт
У моих авторов есть свой fingerprint. Я считаю на каждой их статье простые штуки: средняя длина предложения, доля слов в страдательном залоге, частота тире, частота двоеточий. Сохраняю в Postgres, и при новой статье сравниваю с историческим распределением. Если sigma больше двух — смотрю руками.
import re
from statistics import mean, stdev
def sentence_lengths(text):
sentences = re.split(r'[.!?]+', text)
return [len(s.split()) for s in sentences if s.strip()]
def fingerprint(text):
sl = sentence_lengths(text)
return {
'avg_sentence': mean(sl) if sl else 0,
'std_sentence': stdev(sl) if len(sl) > 1 else 0,
'dash_ratio': text.count('—') / max(len(text), 1),
'colon_ratio': text.count(':') / max(len(text), 1),
}Метод простой и не идеальный, но за два года ловил несколько случаев, когда автор «передал перо» подрядчику.
Что нельзя делать с детектором
Принимать решение «уволить/завалить экзамен/удалить пост» только по одному числу из публичного детектора. Я видела статью моего хорошего автора, которая на трёх детекторах подряд показывала 90%+ генерации, а это была абсолютно его рукопись. Просто стиль у него такой — ровный, академический, с длинными предложениями.
Граница
Сейчас, в 2026-м, грань между «человек написал» и «человек попросил написать и подредактировал» размылась окончательно. Детекторы научились ловить «сырую» генерацию, но любые цепочки «черновик от модели — переписала автор — вычитала редактор» уже не определяются. И это не катастрофа, это новая норма.
В моей работе я перестала бороться с самим фактом использования ИИ. Я смотрю на результат: есть в тексте конкретный опыт, конкретные числа, узнаваемый голос автора, или это вода. Если есть — публикую. Если нет — отправляю на доработку. Текст не становится плохим от того, что в его создании участвовал инструмент. Он становится плохим, когда там нечего читать.
Что делать прямо сейчас
Если ты редактор или преподаватель — собери у каждого автора 5–10 старых работ и зафиксируй их fingerprint. Это лучшая страховка против ложных тревог. Если ты автор — пиши руками, перечитывай, добавляй конкретику. Никакая генерация не заменит тебе фразу «зимой 2024-го я приехала в Кутаиси и сняла квартиру за 850 лари у Левана».