Midjourney v7 вышел в марте и переписал половину того, что мы привыкли делать в v6.1. Это не просто «модель стала умнее» — это другая логика работы с промптами, новые флаги, новый режим draft и обязательная персонализация. Если вы продолжаете писать промпты как в v6 — половину возможностей вы оставляете на столе.
Ниже — 12 практических техник, которые я гонял на v7 последние шесть недель. Каждая опирается либо на новый функционал (omnireference, --sref random, draft mode), либо на сдвиг поведения относительно v6.1. С конкретными формулами, ценами и сравнением с альтернативой через генератор картинок Quantium на FLUX 2 Pro.
Что вообще нового в v7 vs v6.1
Если коротко — v7 это не «следующая версия с улучшениями», а перенастройка самой философии модели. v6.1 был оптимизирован под идеальный one-shot: вы пишете промпт, модель выдаёт максимально красивую картинку под «среднестатистический хороший вкус». v7 ушёл от этой логики: теперь модель явно подстраивается под вас, агрессивно использует референсы и поощряет итеративный workflow вместо разовых попыток.
Пять ключевых изменений, которые меняют workflow целиком:
- Persona / персонализация — модель запоминает ваш визуальный вкус. Нужно рейтнуть стартовый пак из 200 пар изображений, после этого v7 склоняется к выбранной эстетике автоматически. Это работает как мягкий стиль-фильтр на каждой генерации.
- Draft Mode — генерация в 10 раз быстрее и вдвое дешевле по GPU-минутам. Качество ниже стандарта, но композиция, свет и общий вайб читаются. Идеально для итераций промпта.
- Omnireference (--oref) — перенос конкретного объекта или персонажа между кадрами с сохранением узнаваемости лучше, чем у --cref в v6.
- --sref random — случайный стилевой референс по сидам. Способ открывать неожиданные эстетики без поиска картинок в Pinterest.
- Длинные промпты — до 1500 токенов против ~350 в v6. Лучшее распознавание текста на изображении (хотя всё ещё хуже, чем GPT-Image).
Техники 1-2: персонализация и draft
1. Включите personalization сразу. Без неё v7 даёт «средний» рендер — менее интересный, чем v6.1 без флагов. Зайдите в /personalize, рейтните 200 пар (10 минут работы), и весь дальнейший вывод будет смещён к вашему вкусу. Многие проклинают v7 именно потому, что генерируют без персонализации. Я после первой настройки сделал второй пакет ещё на 200 рейтингов через пару недель — модель стала «попадать» в стиль ещё точнее. Если работаете в нескольких эстетиках одновременно (например, фуд-фото и портреты), создайте несколько персон через /personalize and switch между ними.
2. Любой новый промпт — сначала draft. Это новая дисциплина. В v6 итерации в Standard были болезненны по кредитам. В v7 draft в 10 раз быстрее и стоит в 2 раза меньше GPU-минут — нет причин шлифовать промпт в Standard. Алгоритм: 8-12 итераций в draft → нашли формулу → один заход в Standard для финала. На практике это меняет ощущение работы: вместо «вдумчиво пишу один промпт и жду» становится «быстро пробую варианты как при работе с Photoshop-инструментом».
Техники 3-5: референсы --sref, --cref, --oref
3. --sref с конкретным сидом. Если нашли стиль, который нравится — забейте его сид и используйте повторно. --sref 1234567890 повторяемо. Это особенно мощно для серии: одна эстетика на 20 кадров без артистических колебаний.
4. --sref random для разведки. Когда не знаете, чего хочется — --sref random кидает случайный стиль. Запустите 4 раза с одним и тем же промптом и разными random-стилями — найдёте направление, в котором никогда бы не пошли руками.
5. --oref для серии с одним героем. Omnireference в v7 — это то, чего не было раньше. Загружаете картинку гитары — получаете ту же гитару в руках разных персонажей. Загружаете лицо — получаете того же человека в разных ситуациях, сохранение узнаваемости лучше, чем у --cref в v6. Используйте --ow 100 для максимального веса референса, --ow 50 для мягкого смешения. На практике для серии из 8-12 кадров с одним героем (например, серия портретов для книги или маркетингового кампейна) --oref экономит десятки часов работы — где раньше нужно было руками выбирать «похожие лица» из тысячи вариантов, теперь модель держит лицо стабильным сама.
Тонкость работы с --oref: модель иногда переинтерпретирует объект под контекст сцены. Загрузили винтажный микрофон 1950-х — а в кадре получили современный USB-микрофон, потому что вы написали «modern recording studio». Решение: усиливайте описание референса текстом в промпте («vintage 1950s ribbon microphone, brass body»), даже если объект на референсе очевиден. Модель сильнее опирается на текст, чем кажется.
Техники 6-7: weight параметры и --raw
6. Веса в промпте через ::. «red dress::2 city street::1» — платье получит вдвое больший вес внимания, чем фон. Полезно когда модель смещается не в ту сторону, что вам нужно. Отрицательные веса — boring::-1 — работают как мягкое --no.
7. --raw для документального стиля. Этот флаг убирает «художественную приправу» v7 — фирменный мидджорневский глянец. Кадр становится более репортажным, менее «инстаграмным». Особенно полезно для product-фото и архитектуры, где нужна реалистичность, а не красота. Сравните «coffee cup on table» и «coffee cup on table --raw»: первый даст вам дорогой fashion-снимок с боке, второй — реалистичный кадр, как с обычной зеркалки. Для каталогов и интерьеров --raw обязателен.
Дополнительная техника: --stylize (--s) параметр. --s 50 уменьшает художественную интерпретацию, --s 750 (default) — стандарт, --s 1000 — максимально «художественно». Комбинация --raw --s 100 даёт самый документальный, нейтральный рендер v7. Это полезно для коммерческой работы, где «фотореалистично» означает «не выглядит сгенерированно».
Техники 8-9: режимы и длина промпта
8. Standard vs Draft vs Relax — осознанный выбор. Standard — финал, оплата GPU-минут как раньше. Draft — итерация, в 10 раз быстрее, в 2 раза дешевле, качество ~70% от standard. Relax — бесконечно бесплатно по GPU-минутам, но в очереди (2-5 минут на кадр), качество = Standard. Если не торопитесь — Relax. Если шлифуете — Draft. Если финал клиенту — Standard.
9. Длина промпта — 60-120 слов, в правильном порядке. v7 поддерживает 1500 токенов, но реальный sweet spot — 60-120 слов. После ~150 слов модель начинает игнорировать концевые инструкции. Структура важнее длины: subject → environment → camera → lighting → mood → style → flags.
Техники 10-12: негативы, аспекты, варианты
10. --no для конкретных артефактов. v7 всё ещё иногда даёт «лишние пальцы», текст-абракадабру на фоне, бессмысленные знаки. --no extra fingers, watermark, text artifacts, blur — рутинно добавляйте в каждый промпт где есть руки или текст.
11. Aspect ratios под задачу. 16:9 — киноплан, 4:5 — Instagram-портрет, 9:16 — Reels/Stories, 1:1 — пост в ленту, 21:9 — широкий банер. v7 рендерит каждое соотношение со своей логикой композиции — не растягивайте 1:1 в Photoshop, делайте сразу в нужном AR. Особенно заметно на 9:16: модель умеет строить вертикальную композицию с правильным позиционированием subject в верхней трети кадра (где видно в сторис до полосы интерфейса).
12. V vs U workflow. V — генерирует вариации, U — апскейлит. После основного грида не нажимайте U сразу: сначала V на лучший кадр, получите 4 варианта той же композиции, выберите идеальный, потом U. Это даёт ~30% прирост попаданий на финал. Многие новички упускают этот шаг и получают «хорошую, но не идеальную» картинку — а одна дополнительная итерация V почти бесплатна по кредитам и резко повышает качество финала. Применяйте V особенно когда композиция уже почти-почти, но не хватает одной детали.
Готовая формула промпта для v7
Если лень собирать с нуля — вот шаблон, который работает на 90% задач:
Такой промпт занимает 70-80 слов, ложится в sweet spot v7 и даёт повторяемый результат при одинаковом --sref. Заметьте порядок: subject идёт первым (модель присваивает ему максимальный вес), environment вторым, технические параметры (камера, свет, стиль) — следом. Mood и финальные флаги — в конце. Если поменять порядок, например начать с «cinematic style» — модель будет смещать всё к стилю, а subject получит меньше внимания. Это маленькая, но реальная разница в качестве.
Типичные ошибки новичков в v7
За шесть недель работы я наблюдал у разных людей одни и те же провалы. Если избежать этих пяти — кривая обучения сократится вдвое:
- Игнорирование персонализации. «Я хочу нейтральный вывод, без вкуса» — это иллюзия. Без персонализации v7 даёт «средневзвешенный вкус интернета», который часто хуже вашего собственного. Лучше настроить.
- Промпты в стиле v5/v6. Длинные комма-сепарированные списки тегов («cinematic, dramatic, 4k, octane render, hyperrealistic») работают плохо в v7. Модель ожидает связный текст, а не теги.
- Боязнь --sref random. Многие зацикливаются на одном стиле и не пробуют random. Это закрывает доступ к 80% выразительных возможностей v7.
- Финал в Standard без draft-шлифовки. Тратят дорогие GPU-минуты на итерации, когда могут сделать то же в draft за десятую часть цены.
- Несовместимость --oref и --cref в одном промпте. Эти параметры конфликтуют. Используйте либо один, либо другой за раз.
Сколько это стоит и есть ли альтернатива
Midjourney Basic — $10/мес за ~200 standard-кадров плюс безлимит draft и relax. Standard plan — $30 за ~900 кадров плюс fast hours. Plan Pro — $60 за расширенные лимиты и stealth-режим.
| Параметр | Midjourney v7 | FLUX 2 Pro в Quantium |
|---|---|---|
| Стиль | Художественный, узнаваемый | Фотореалистичный, нейтральный |
| Фотореализм | Хорош, но «приправлен» | Лидер класса |
| Цена за кадр | ~$0.05 (Basic, standard) | ~$0.04 (Basic тариф) |
| Интерфейс | Discord / Web (отдельно) | Telegram-бот рядом с GPT-5 |
| Стилевые референсы | --sref, --cref, --oref | img2img, prompt-based |
Если нужен именно стиль Midjourney — берите MJ напрямую, никакая альтернатива не повторит фирменный визуальный почерк. Если нужен фотореализм без подписок на каждый сервис — FLUX 2 Pro в Quantium на тарифе Basic даёт 375 кадров в месяц за схожую цену плюс GPT-Image, Gemini Nano Banana, видео Sora 2 и чат с GPT-5 / Claude в том же боте.
Реалистичный сценарий — параллельное использование: Midjourney для художественных кадров и креатива, FLUX через Quantium для коммерческой фотографии, продуктовых фото и кадров, которые требуют максимально нейтрального реализма без «авторского» налёта. Для большинства команд это $10/мес MJ Basic + Quantium на тарифе Basic — суммарно ~6000 рублей за полностью покрытый visual-стек на месяц.
И последнее наблюдение по v7: модель явно поощряет творчество вместо точности. Если у вас задача «сделать ровно вот эту картинку» — v7 будет сопротивляться, потому что персонализация и стилевые tendencies встроены глубоко. Если задача «исследовать визуальное направление» — v7 лучше всех. Это смещение, которое нужно учитывать при выборе инструмента.
Связанные материалы: альтернатива Midjourney на FLUX, промпт-гайд FLUX 2 Pro, галерея работ.
Попробуйте Quantium бесплатно
20 кредитов в месяц на бесплатном тарифе. 30+ нейросетей в одном Telegram-боте.
Открыть бот →

