Sora 2 умеет cinematic-кадры с физикой и синхронным аудио, но если кинуть в неё «a man walking in the city, cinematic» — получишь сюрреализм и плавающую перспективу. Модель ловит подробности: чем точнее вы описываете кадр, тем меньше ей приходится домысливать. Между фразами «portrait, photorealistic» и описанием из 80 слов с указанием объектива, света и атмосферы — пропасть. Первое даёт стоковую картинку, второе — кадр уровня референса.

Ниже — 10 техник, которые я гонял на Sora 2 последние два месяца в видео-движке Quantium. Каждая — это один параметр, который ощутимо меняет результат. От света и движения камеры до negative prompts. С шаблонами промптов и тем, что получится на выходе. Все техники тестировались на реальных задачах: трейлеры для инди-игр, фоновое видео для лендингов, концепт-сцены для арт-проектов и music videos.

Перед тем как переходить к техникам — один принцип. Sora 2 работает по схеме «чем подробнее описание, тем меньше домыслов». Модель видела миллионы кадров с EXIF-данными, описаниями режиссёров и инструкциями оператора. Она различает «35mm anamorphic» и «50mm spherical», понимает разницу между «golden hour» и «blue hour», узнаёт референсы конкретных DOP — Роджер Дикинс, Эммануэль Любецки, Грэйг Фрейзер. Используйте этот словарь и пишите промпт на английском: модель тренирована на англоязычных описаниях, и русскоязычные термины она конвертирует с потерями.

Композиция и физика: техники 1-2

1. Композиция кадра

Sora 2 понимает классическую киноязыковую терминологию. Указывайте план явно: extreme close-up, medium shot, wide establishing shot, over-the-shoulder. Без этого модель усредняет до среднего плана и режет руки персонажа на границе кадра.

Wide establishing shot of a rain-soaked Tokyo street at dusk,
neon signs reflecting on wet asphalt, low camera angle
Результат: широкая урбан-сцена с глубиной, отражения работают, нет рваных кадрировок

2. Физика и материалы

Главная сила Sora 2 — симуляция физических процессов. Чем явнее вы её просите рендерить физику, тем чище результат. Прописывайте: liquid splash, cloth folds, smoke dissipation, glass shatter, particle dispersion. Модель честно считает поведение материала.

A coffee cup spills across a wooden table in slow motion,
liquid forms thin sheets, droplets bounce, cloth napkin absorbs
the edge of the spill, realistic surface tension
Результат: реалистичный сплэш с правильным распределением жидкости, без мультяшности

Освещение: техника 3

3. Трёхточечная схема света

Кинокадр держится на свете, и Sora 2 умеет ставить классическую трёхточку. Указывайте все три источника: key light (основной), fill light (заполняющий) и rim light (контровый). Это не магия — модель видела миллионы кадров с правильной светопостановкой.

Portrait of a violinist on stage, key light from upper-left at 45 degrees,
soft fill light from camera-right, rim light behind the head separating
subject from dark background, slight haze in beam paths
Результат: объёмный портрет с отделением от фона, кадр выглядит снятым на большой студии

Движение камеры: техника 4

4. Конкретный тип движения

Sora 2 понимает разницу между типами движения. Не пишите «camera moves» — это плацебо. Используйте: slow dolly in (наезд по рельсам), tracking shot following subject, orbit 180 degrees around subject, handheld with subtle shake, crane up revealing landscape. Модель различает все эти движения и держит их в кадре.

Slow dolly in on a chess board, pieces in dramatic side lighting,
camera moves from wide to extreme close-up over 5 seconds,
shallow depth of field shifting focus to the king piece
Результат: плавный наезд с правильным шифтом фокуса, без рывков и без потери композиции

Атмосфера: техника 5

5. Воздух между планами

Атмосферные эффекты добавляют кинематографичности больше, чем любой LUT. Прописывайте: volumetric fog, morning haze, dust particles in light beams, steam rising from streets, light rain. Один такой элемент превращает плоский AI-рендер в кадр с глубиной.

A lone figure walks through a forest at dawn, volumetric god rays
between trees, morning haze filling the middle ground, dust particles
visible in light beams, soft atmospheric depth
Результат: классический «лес в лучах», объёмный воздух, реалистичная глубина перспективы

Цветовая палитра: техника 6

6. Цвет через референсы кинокартин

Sora 2 знает референсы фильмов и режиссёров — это самый быстрый способ задать палитру одной строкой. «In the color palette of Blade Runner 2049» даёт оранж-сине-зелёную тональность. «Wes Anderson symmetrical pastels» — пастельные центрированные кадры. «Roger Deakins lighting» — мягкий золотистый натуральный свет.

An old man reads a letter by the window, in the color palette of
"The Revenant" — desaturated cold tones with warm interior accents,
natural light only, Roger Deakins-style lighting
Результат: чёткий референсный лук без необходимости описывать каждый цвет вручную

Аудио-синхронизация: техника 7

7. Описывайте звук вместе с действием

Sora 2 синтезирует аудио в той же генерации, что и видео — но только если вы попросите. Указывайте: diegetic sound (звук в кадре), ambient noise, character speaking «реплика», background music: cinematic strings, slow tempo. Реплики персонажей можно писать на любом языке — модель озвучит синхронно с губами.

A barista pours steamed milk into a cup, ambient cafe noise,
soft jazz playing quietly in background, the barista says
"Your latte is ready" with a gentle smile, sound of milk frothing
synchronized with the pour
Результат: видео с реалистичным sound design, синхрон губ и звуков предметов

Длительность и темп: техника 8

8. Указывайте темп кадра

Sora 2 в Quantium генерирует 5-секундные ролики, и без указания темпа модель усредняет до «обычного» — все движения происходят за 2 секунды, остаётся пустая третья. Прописывайте: slow motion 0.25x для эффектных кадров, real-time для разговоров, time lapse для природы и облаков, two-act beat: setup then reveal для драматургии.

5-second shot with two-act beat: first 2 seconds show closed gift box
on a table in soft light, then in the last 3 seconds hands enter
the frame and slowly open the box, anticipation building
Результат: ролик с внутренней драматургией, а не статичная сцена с одной механикой

Прайминг стиля: техника 9

9. Указывайте формат и носитель

Один префикс меняет всё. «Cinematic» — стандартный кинолук. «Shot on 35mm film» — зернистость и тёплые тона. «16mm documentary» — репортажный кадр. «Anamorphic lens with horizontal flares» — широкоэкранная кинематика с характерными бликами. «VHS-style 1990s home video» — стилизация под ретро.

Shot on 35mm film, anamorphic lens, slight horizontal lens flares,
a vintage car driving down a coastal highway at golden hour,
desaturated blue sky, warm shadows, cinematic widescreen 2.39:1
Результат: устойчивый плёночный стиль, который держится на всех 5 секундах

Negative prompts: техника 10

10. То, чего быть не должно

Sora 2 принимает negative prompts через блок «avoid:» или «no:» в конце промпта. Это убирает типичные артефакты: лишние пальцы, искажённые лица, водяные знаки, плавающие объекты. Используйте короткий список из 4-6 пунктов, не больше — длинные negative-блоки модель начинает игнорировать. Подробный разбор синтаксиса и 20 готовых блоков — в отдельной статье про negative prompts.

... основной промпт ...
Avoid: distorted faces, extra limbs, warped hands, floating objects,
text artifacts, oversaturated colors, jittery camera
Результат: чистые кадры без классических AI-багов, особенно на близких планах

Готовый шаблон промпта

Когда лень собирать с нуля — вот формула, которая работает на любой сцене Sora 2:

[Shot type] — wide / medium / close-up / extreme close-up
[Subject and action] — кто и что делает
[Camera movement] — slow dolly in / orbit / handheld / static
[Lighting] — key + fill + rim, цветовая температура
[Atmosphere] — fog / haze / dust / rain
[Color palette] — референс фильма или конкретный лук
[Audio] — ambient / dialogue / music
[Style prefix] — cinematic / 35mm / anamorphic
[Negative] — avoid: ...

Workflow: как я собираю промпт за 3 минуты

На реальных клиентских роликах я не пишу промпт «с нуля». У меня есть фиксированный пайплайн, который занимает 3 минуты и даёт стабильный результат.

Шаг 1. Референс. Открываю Pinterest или Vimeo, нахожу кадр, который похож на то, что я хочу. Скачиваю — это будет визуальный якорь.

Шаг 2. Дешифровка. Описываю этот кадр текстом по 9 параметрам шаблона выше: композиция, физика, свет, камера, атмосфера, цвет, аудио, темп, стиль. Это 80% работы.

Шаг 3. Negative. Добавляю 4-6 пунктов под потенциальные артефакты конкретно для этой сцены. Если в кадре лицо — добавляю «no distorted faces». Если руки — «no extra fingers». Если текст — «no garbled text».

Шаг 4. Image-to-video. Загружаю референсный кадр как стартовый — Sora 2 принимает image-to-video, и это резко повышает стабильность стиля. Текстовый промпт описывает только движение и аудио.

Шаг 5. Итерация. Первая генерация — почти всегда близко, но не идеально. Я меняю один параметр за раз: сначала движение камеры, потом свет, потом длительность. На третьей попытке обычно ловлю кадр.

Сколько это стоит

Sora 2 в Quantium — 60 кредитов за 5-секундный ролик в Standard и 120 кредитов в Pro-режиме с приоритетной очередью. На тарифе Basic с 3000 кредитов в месяц это 50 видео — больше, чем по одному в день. Если работаете с клиентскими роликами, имеет смысл начинать со Standard для шлифовки промпта и переключаться в Pro только для финального кадра.

Аудио и видео генерируются в одном вызове — отдельной озвучки покупать не нужно, и это серьёзно меняет экономику против схемы «Veo + ElevenLabs». Для рекламных коротких роликов с синхроном губ и текстом продукта лучше переключаться на Veo 3.1 — у него специфика заточена под маркетинг. Подробнее про сравнение — в материале Sora 2 vs Veo 3.1.

Связанные материалы: image-to-video из готовой картинки, Kling vs Veo, галерея работ.

Частые вопросы

Сколько стоит одна генерация Sora 2 в Quantium?

Sora 2 — 60 кредитов за 5-секундный ролик в Standard, 120 в Pro-режиме. На тарифе Basic с 3000 кредитов это 50 видео в месяц. Аудио идёт в одном вызове с видео.

Поддерживает ли Sora 2 русский язык в озвучке?

Да, Sora 2 синтезирует речь на 30+ языках, включая русский. Сам промпт сцены пишите по-английски, реплики персонажей — на нужном языке внутри кавычек.

Чем Sora 2 отличается от Veo 3.1?

Sora 2 сильнее в cinematic-сценах с физикой и длительностью 8+ секунд. Veo 3.1 точнее в рекламных коротких роликах с синхроном губ и текстом продукта.

Можно ли загрузить референсное изображение в Sora 2?

Да, image-to-video в Sora 2 принимает один кадр и оживляет его по текстовому промпту — это самый стабильный способ зафиксировать стиль и персонажа.

Что делать, если Sora генерирует артефакты на лицах?

Используйте negative prompts «no distorted faces, no warped features». Снизьте длительность до 4 секунд, поменяйте close-up на medium shot — это убирает 90% артефактов.

Q
Quantium Editorial 30+ нейросетей в одном Telegram-боте

Попробуйте Sora 2 в Quantium

20 кредитов в месяц на бесплатном тарифе. 30+ нейросетей в одном Telegram-боте.

Открыть бот →

Читайте также