Как обнаружить ИИ-текст: реальные методы и их пределы

14 февраля 2026 г. 18K

Я проверяю тексты для контентной редакции уже четвёртый год. Сначала это была ручная вычитка, потом подключились детекторы, потом мы научили внутренний классификатор. Скажу сразу: серебряной пули нет. Любой детектор даёт ложноположительные и ложноотрицательные срабатывания, и понимать пределы важнее, чем верить процентам.

Зачем вообще обнаруживать

Причины разные. Кому-то нужно понимать, что у автора в портфолио свой стиль, а не «отдала промпт и забрала ответ». Преподавателям — отличить честную работу от подсунутой. SEO-командам — поймать партнёров, которые сдают сгенерированные описания товаров пачками. Везде задача похожа, но допустимая ошибка разная.

Что замеряют детекторы

Под капотом большинства публичных детекторов лежит одна или несколько метрик:

Perplexity — насколько «предсказуемо» каждое следующее слово для языковой модели. У человека текст более рваный, у генерации — более ровный.
Burstiness — разброс длин и сложности предложений. Люди пишут «всплесками», модели стремятся к среднему.
Лексическое разнообразие — отношение уникальных слов к общему числу.
Стилевые маркеры — частота вводных слов, предлогов, сложных конструкций.

Эти метрики прогоняются через классификатор, на выходе вероятность «текст сгенерирован».

Где они врут

Главный провал — короткие тексты. На 200 словах метрики статистически шумные, и классификатор кидает кубик. Я видела детекторы, которые на одном и том же абзаце выдавали 12% и 87% в зависимости от лишнего пробела.

Второй провал — переведённый текст. Когда автор пишет на русском, а потом прогоняет через переводчик и отдаёт английский — это тоже «гладко» и тоже похоже на сгенерированное.

Третий — пост-редактирование. Если человек взял сгенерированный текст и переписал каждый второй абзац, детектор путается. Гибридный текст — самая частая реальность 2026 года.

Что реально работает в моей практике

Не один сигнал, а пакет. У меня в работе три уровня:

Автоматический скрининг через два детектора (один публичный, один свой). Если оба согласны — флаг.
Сравнение с предыдущими работами автора. Резкая смена стиля, словаря, ритма — флаг.
Содержательная проверка. Сгенерированный текст часто «правильный, но пустой»: нет конкретики, нет цифр, нет личных деталей.

Третий уровень — самый надёжный. Текст про «как я переехала в Тбилиси и сняла квартиру» отличается от сгенерированного не структурой, а тем, упомянуты ли реальные районы, реальные цены, фамилия конкретного риелтора. Не упомянуты — это либо очень общий обзор, либо подделка.

Стилевой фингерпринт

У моих авторов есть свой fingerprint. Я считаю на каждой их статье простые штуки: средняя длина предложения, доля слов в страдательном залоге, частота тире, частота двоеточий. Сохраняю в Postgres, и при новой статье сравниваю с историческим распределением. Если sigma больше двух — смотрю руками.

import re
from statistics import mean, stdev

def sentence_lengths(text):
    sentences = re.split(r'[.!?]+', text)
    return [len(s.split()) for s in sentences if s.strip()]

def fingerprint(text):
    sl = sentence_lengths(text)
    return {
        'avg_sentence': mean(sl) if sl else 0,
        'std_sentence': stdev(sl) if len(sl) > 1 else 0,
        'dash_ratio': text.count('—') / max(len(text), 1),
        'colon_ratio': text.count(':') / max(len(text), 1),
    }

Метод простой и не идеальный, но за два года ловил несколько случаев, когда автор «передал перо» подрядчику.

Что нельзя делать с детектором

Принимать решение «уволить/завалить экзамен/удалить пост» только по одному числу из публичного детектора. Я видела статью моего хорошего автора, которая на трёх детекторах подряд показывала 90%+ генерации, а это была абсолютно его рукопись. Просто стиль у него такой — ровный, академический, с длинными предложениями.

Граница

Сейчас, в 2026-м, грань между «человек написал» и «человек попросил написать и подредактировал» размылась окончательно. Детекторы научились ловить «сырую» генерацию, но любые цепочки «черновик от модели — переписала автор — вычитала редактор» уже не определяются. И это не катастрофа, это новая норма.

В моей работе я перестала бороться с самим фактом использования ИИ. Я смотрю на результат: есть в тексте конкретный опыт, конкретные числа, узнаваемый голос автора, или это вода. Если есть — публикую. Если нет — отправляю на доработку. Текст не становится плохим от того, что в его создании участвовал инструмент. Он становится плохим, когда там нечего читать.

Что делать прямо сейчас

Если ты редактор или преподаватель — собери у каждого автора 5–10 старых работ и зафиксируй их fingerprint. Это лучшая страховка против ложных тревог. Если ты автор — пиши руками, перечитывай, добавляй конкретику. Никакая генерация не заменит тебе фразу «зимой 2024-го я приехала в Кутаиси и сняла квартиру за 850 лари у Левана».