Stable Diffusion vs Flux vs Midjourney в 2026: что выбрать под задачу
Я три года генерирую картинки для рекламы, обложек и карточек товаров. За это время прошёл от SD 1.5 на 3060 до SDXL, потом Flux, потом Flux 2 и обратно к SDXL для отдельных задач. Если ты заходишь в эту тему сейчас, выбор между Stable Diffusion, Flux и Midjourney выглядит запутанно. Объясню, как они различаются на практике.
Что я считаю «хорошей картинкой»
Не «красивую», не «художественную», а пригодную для конкретной задачи. Карточка товара — резкий объект на чистом фоне, без артефактов рук и перьев. Обложка статьи — стилизованная сцена с предсказуемой композицией. Реклама — модель в нужной позе, в нужном свете, без лишних пальцев на руках. Под каждую задачу — свой инструмент.
Midjourney
Самый красивый «по умолчанию». Версия 7 в 2026 году по эстетике обходит почти всех конкурентов из коробки. Минимум промпт-инжиниринга, выдаёт сразу четыре варианта, удобный --sref для копирования стиля.
Минусы знаешь и так: Discord-интерфейс (хотя есть веб), нет контроля композиции, нет inpainting в привычном смысле, не запустишь локально. Если у тебя задача «сделать одну красивую картинку» — Midjourney чемпион. Если «вставить лицо клиента в готовый шаблон» — мимо.
Flux
За последний год Flux стал моей основной рабочей моделью для коммерческой графики. Особенно Flux 2 Pro: текст рисует так, что не стыдно за вывески и подписи, руки пальцами не путает, фотореализм отличный.
Запускаю локально через ComfyUI на 4090. На 1024x1024 одна картинка — 8 секунд при 30 шагах. Через API на fal.ai/replicate — ~25 центов за картинку, что по моим объёмам выгоднее, чем электричество и шум.
Где Flux лучше всех:
- Тексты на картинке. Раньше любая модель путала буквы, Flux 2 в 95% случаев пишет правильно.
- Реалистичные фотопортреты с нормальными руками.
- Контроль через ControlNet, IP-Adapter, LoRA.
Stable Diffusion (SDXL и SD3.5)
Не надо хоронить SDXL. Я её до сих пор держу под две задачи: художественные стили (аниме, иллюстрация, концепт-арт) и быстрые превью. На 4090 SDXL даёт 2 секунды на картинку, в три раза быстрее Flux. Когда нужно перебрать 20 вариантов композиции — это удобно.
Главное преимущество: огромная экосистема. На civitai.com тысячи LoRA под любой стиль, под конкретного художника, под конкретного персонажа. Flux догоняет, но пока экосистема SDXL шире.
SD3.5 — улучшение по фотореализму, но в моих тестах Flux 2 её обходит, поэтому в работе я её не держу.
Сравнительная таблица в голове
- «Просто красиво» — Midjourney 7.
- «С текстом или подписями» — Flux 2.
- «Реалистичные люди» — Flux 2.
- «Аниме и иллюстрации» — SDXL с подходящим LoRA.
- «Быстро перебрать варианты» — SDXL.
- «Контроль композиции через позу/маску» — Flux + ControlNet или SDXL + ControlNet.
- «Нет своего GPU и хочется локально» — Midjourney или Flux через API.
Цена
На моём объёме (около 800 картинок в месяц) расклад такой. Локально на 4090: ~600 рублей электричества, ноль за картинку, но плюс время на настройку. API Flux 2 через fal.ai: ~16 тысяч рублей в месяц, нулевая морока. Midjourney Pro: ~3 тысячи рублей в месяц, удобно, но без автоматизации.
Мой выбор — гибрид. Локальный Flux + SDXL для основного потока, Midjourney для «нужно срочно красивую обложку без раздумий», API в отдельных проектах, где не хочу гонять GPU.
Промпты
Главное, что я понял: длинные художественные промпты в стиле «trending on artstation, masterpiece, intricate details» — это уже не нужно. Современные модели хорошо понимают обычный язык. «Photo of a young woman walking in Tbilisi old town at golden hour, shallow depth of field, 35mm lens» — этого достаточно. Дальше Flux сделает за тебя.
Где гриценится
Flux и SDXL не запустишь без минимум 16 ГБ видеопамяти на нормальной скорости. На картах 8 ГБ — только маленькие разрешения и долго. Если ты только заходишь в тему — попробуй сначала Midjourney, чтобы понять, нравится ли. Потом, если хочется контроля и автоматизации, переходи на Flux через API. На локальный сетап садись только если у тебя 4090/5090 и любишь возиться. Альтернатива на M3/M4 Max через Draw Things — рабочий вариант, но Flux там идёт в 4–5 раз медленнее, чем на 4090.
Итог
В 2026-м нет «лучшей» модели. Есть удобный набор под задачи. Если выбираешь одну — бери Flux 2 через API: универсальная, фотореалистичная, с текстом, не требует возиться с железом. Midjourney оставь для красоты «в один клик», SDXL — для художественных стилей и быстрого перебора. Главное, не зацикливайся на инструменте: 80% результата делает идея и хороший промпт, а не модель.