Midjourney v7 вышел в марте и переписал половину того, что мы привыкли делать в v6.1. Это не просто «модель стала умнее» — это другая логика работы с промптами, новые флаги, новый режим draft и обязательная персонализация. Если вы продолжаете писать промпты как в v6 — половину возможностей вы оставляете на столе.

Ниже — 12 практических техник, которые я гонял на v7 последние шесть недель. Каждая опирается либо на новый функционал (omnireference, --sref random, draft mode), либо на сдвиг поведения относительно v6.1. С конкретными формулами, ценами и сравнением с альтернативой через генератор картинок Quantium на FLUX 2 Pro.

Что вообще нового в v7 vs v6.1

Если коротко — v7 это не «следующая версия с улучшениями», а перенастройка самой философии модели. v6.1 был оптимизирован под идеальный one-shot: вы пишете промпт, модель выдаёт максимально красивую картинку под «среднестатистический хороший вкус». v7 ушёл от этой логики: теперь модель явно подстраивается под вас, агрессивно использует референсы и поощряет итеративный workflow вместо разовых попыток.

Пять ключевых изменений, которые меняют workflow целиком:

  • Persona / персонализация — модель запоминает ваш визуальный вкус. Нужно рейтнуть стартовый пак из 200 пар изображений, после этого v7 склоняется к выбранной эстетике автоматически. Это работает как мягкий стиль-фильтр на каждой генерации.
  • Draft Mode — генерация в 10 раз быстрее и вдвое дешевле по GPU-минутам. Качество ниже стандарта, но композиция, свет и общий вайб читаются. Идеально для итераций промпта.
  • Omnireference (--oref) — перенос конкретного объекта или персонажа между кадрами с сохранением узнаваемости лучше, чем у --cref в v6.
  • --sref random — случайный стилевой референс по сидам. Способ открывать неожиданные эстетики без поиска картинок в Pinterest.
  • Длинные промпты — до 1500 токенов против ~350 в v6. Лучшее распознавание текста на изображении (хотя всё ещё хуже, чем GPT-Image).

Техники 1-2: персонализация и draft

1. Включите personalization сразу. Без неё v7 даёт «средний» рендер — менее интересный, чем v6.1 без флагов. Зайдите в /personalize, рейтните 200 пар (10 минут работы), и весь дальнейший вывод будет смещён к вашему вкусу. Многие проклинают v7 именно потому, что генерируют без персонализации. Я после первой настройки сделал второй пакет ещё на 200 рейтингов через пару недель — модель стала «попадать» в стиль ещё точнее. Если работаете в нескольких эстетиках одновременно (например, фуд-фото и портреты), создайте несколько персон через /personalize and switch между ними.

2. Любой новый промпт — сначала draft. Это новая дисциплина. В v6 итерации в Standard были болезненны по кредитам. В v7 draft в 10 раз быстрее и стоит в 2 раза меньше GPU-минут — нет причин шлифовать промпт в Standard. Алгоритм: 8-12 итераций в draft → нашли формулу → один заход в Standard для финала. На практике это меняет ощущение работы: вместо «вдумчиво пишу один промпт и жду» становится «быстро пробую варианты как при работе с Photoshop-инструментом».

Техники 3-5: референсы --sref, --cref, --oref

3. --sref с конкретным сидом. Если нашли стиль, который нравится — забейте его сид и используйте повторно. --sref 1234567890 повторяемо. Это особенно мощно для серии: одна эстетика на 20 кадров без артистических колебаний.

4. --sref random для разведки. Когда не знаете, чего хочется — --sref random кидает случайный стиль. Запустите 4 раза с одним и тем же промптом и разными random-стилями — найдёте направление, в котором никогда бы не пошли руками.

5. --oref для серии с одним героем. Omnireference в v7 — это то, чего не было раньше. Загружаете картинку гитары — получаете ту же гитару в руках разных персонажей. Загружаете лицо — получаете того же человека в разных ситуациях, сохранение узнаваемости лучше, чем у --cref в v6. Используйте --ow 100 для максимального веса референса, --ow 50 для мягкого смешения. На практике для серии из 8-12 кадров с одним героем (например, серия портретов для книги или маркетингового кампейна) --oref экономит десятки часов работы — где раньше нужно было руками выбирать «похожие лица» из тысячи вариантов, теперь модель держит лицо стабильным сама.

Тонкость работы с --oref: модель иногда переинтерпретирует объект под контекст сцены. Загрузили винтажный микрофон 1950-х — а в кадре получили современный USB-микрофон, потому что вы написали «modern recording studio». Решение: усиливайте описание референса текстом в промпте («vintage 1950s ribbon microphone, brass body»), даже если объект на референсе очевиден. Модель сильнее опирается на текст, чем кажется.

Техники 6-7: weight параметры и --raw

6. Веса в промпте через ::. «red dress::2 city street::1» — платье получит вдвое больший вес внимания, чем фон. Полезно когда модель смещается не в ту сторону, что вам нужно. Отрицательные веса — boring::-1 — работают как мягкое --no.

7. --raw для документального стиля. Этот флаг убирает «художественную приправу» v7 — фирменный мидджорневский глянец. Кадр становится более репортажным, менее «инстаграмным». Особенно полезно для product-фото и архитектуры, где нужна реалистичность, а не красота. Сравните «coffee cup on table» и «coffee cup on table --raw»: первый даст вам дорогой fashion-снимок с боке, второй — реалистичный кадр, как с обычной зеркалки. Для каталогов и интерьеров --raw обязателен.

Дополнительная техника: --stylize (--s) параметр. --s 50 уменьшает художественную интерпретацию, --s 750 (default) — стандарт, --s 1000 — максимально «художественно». Комбинация --raw --s 100 даёт самый документальный, нейтральный рендер v7. Это полезно для коммерческой работы, где «фотореалистично» означает «не выглядит сгенерированно».

Техники 8-9: режимы и длина промпта

8. Standard vs Draft vs Relax — осознанный выбор. Standard — финал, оплата GPU-минут как раньше. Draft — итерация, в 10 раз быстрее, в 2 раза дешевле, качество ~70% от standard. Relax — бесконечно бесплатно по GPU-минутам, но в очереди (2-5 минут на кадр), качество = Standard. Если не торопитесь — Relax. Если шлифуете — Draft. Если финал клиенту — Standard.

9. Длина промпта — 60-120 слов, в правильном порядке. v7 поддерживает 1500 токенов, но реальный sweet spot — 60-120 слов. После ~150 слов модель начинает игнорировать концевые инструкции. Структура важнее длины: subject → environment → camera → lighting → mood → style → flags.

Техники 10-12: негативы, аспекты, варианты

10. --no для конкретных артефактов. v7 всё ещё иногда даёт «лишние пальцы», текст-абракадабру на фоне, бессмысленные знаки. --no extra fingers, watermark, text artifacts, blur — рутинно добавляйте в каждый промпт где есть руки или текст.

11. Aspect ratios под задачу. 16:9 — киноплан, 4:5 — Instagram-портрет, 9:16 — Reels/Stories, 1:1 — пост в ленту, 21:9 — широкий банер. v7 рендерит каждое соотношение со своей логикой композиции — не растягивайте 1:1 в Photoshop, делайте сразу в нужном AR. Особенно заметно на 9:16: модель умеет строить вертикальную композицию с правильным позиционированием subject в верхней трети кадра (где видно в сторис до полосы интерфейса).

12. V vs U workflow. V — генерирует вариации, U — апскейлит. После основного грида не нажимайте U сразу: сначала V на лучший кадр, получите 4 варианта той же композиции, выберите идеальный, потом U. Это даёт ~30% прирост попаданий на финал. Многие новички упускают этот шаг и получают «хорошую, но не идеальную» картинку — а одна дополнительная итерация V почти бесплатна по кредитам и резко повышает качество финала. Применяйте V особенно когда композиция уже почти-почти, но не хватает одной детали.

Готовая формула промпта для v7

Если лень собирать с нуля — вот шаблон, который работает на 90% задач:

[Subject + action] — «A woman drinking espresso at a small marble table»
[Environment] — «in a sunlit Milan cafe, terracotta walls»
[Camera + lens] — «shot on Leica M11 with 50mm Summilux f/1.4»
[Lighting] — «soft window light from left, warm 3200K»
[Mood] — «calm, intimate, unhurried»
[Style ref] — «--sref 1234567890 --raw»
[Flags] — «--ar 4:5 --no text artifacts»

Такой промпт занимает 70-80 слов, ложится в sweet spot v7 и даёт повторяемый результат при одинаковом --sref. Заметьте порядок: subject идёт первым (модель присваивает ему максимальный вес), environment вторым, технические параметры (камера, свет, стиль) — следом. Mood и финальные флаги — в конце. Если поменять порядок, например начать с «cinematic style» — модель будет смещать всё к стилю, а subject получит меньше внимания. Это маленькая, но реальная разница в качестве.

Типичные ошибки новичков в v7

За шесть недель работы я наблюдал у разных людей одни и те же провалы. Если избежать этих пяти — кривая обучения сократится вдвое:

  • Игнорирование персонализации. «Я хочу нейтральный вывод, без вкуса» — это иллюзия. Без персонализации v7 даёт «средневзвешенный вкус интернета», который часто хуже вашего собственного. Лучше настроить.
  • Промпты в стиле v5/v6. Длинные комма-сепарированные списки тегов («cinematic, dramatic, 4k, octane render, hyperrealistic») работают плохо в v7. Модель ожидает связный текст, а не теги.
  • Боязнь --sref random. Многие зацикливаются на одном стиле и не пробуют random. Это закрывает доступ к 80% выразительных возможностей v7.
  • Финал в Standard без draft-шлифовки. Тратят дорогие GPU-минуты на итерации, когда могут сделать то же в draft за десятую часть цены.
  • Несовместимость --oref и --cref в одном промпте. Эти параметры конфликтуют. Используйте либо один, либо другой за раз.

Сколько это стоит и есть ли альтернатива

Midjourney Basic — $10/мес за ~200 standard-кадров плюс безлимит draft и relax. Standard plan — $30 за ~900 кадров плюс fast hours. Plan Pro — $60 за расширенные лимиты и stealth-режим.

ПараметрMidjourney v7FLUX 2 Pro в Quantium
СтильХудожественный, узнаваемыйФотореалистичный, нейтральный
ФотореализмХорош, но «приправлен»Лидер класса
Цена за кадр~$0.05 (Basic, standard)~$0.04 (Basic тариф)
ИнтерфейсDiscord / Web (отдельно)Telegram-бот рядом с GPT-5
Стилевые референсы--sref, --cref, --orefimg2img, prompt-based

Если нужен именно стиль Midjourney — берите MJ напрямую, никакая альтернатива не повторит фирменный визуальный почерк. Если нужен фотореализм без подписок на каждый сервис — FLUX 2 Pro в Quantium на тарифе Basic даёт 375 кадров в месяц за схожую цену плюс GPT-Image, Gemini Nano Banana, видео Sora 2 и чат с GPT-5 / Claude в том же боте.

Реалистичный сценарий — параллельное использование: Midjourney для художественных кадров и креатива, FLUX через Quantium для коммерческой фотографии, продуктовых фото и кадров, которые требуют максимально нейтрального реализма без «авторского» налёта. Для большинства команд это $10/мес MJ Basic + Quantium на тарифе Basic — суммарно ~6000 рублей за полностью покрытый visual-стек на месяц.

И последнее наблюдение по v7: модель явно поощряет творчество вместо точности. Если у вас задача «сделать ровно вот эту картинку» — v7 будет сопротивляться, потому что персонализация и стилевые tendencies встроены глубоко. Если задача «исследовать визуальное направление» — v7 лучше всех. Это смещение, которое нужно учитывать при выборе инструмента.

Связанные материалы: альтернатива Midjourney на FLUX, промпт-гайд FLUX 2 Pro, галерея работ.

Q
Quantium Editorial 30+ нейросетей в одном Telegram-боте

Попробуйте Quantium бесплатно

20 кредитов в месяц на бесплатном тарифе. 30+ нейросетей в одном Telegram-боте.

Открыть бот →

Читайте также