Sora 2 умеет cinematic-кадры с физикой и синхронным аудио, но если кинуть в неё «a man walking in the city, cinematic» — получишь сюрреализм и плавающую перспективу. Модель ловит подробности: чем точнее вы описываете кадр, тем меньше ей приходится домысливать. Между фразами «portrait, photorealistic» и описанием из 80 слов с указанием объектива, света и атмосферы — пропасть. Первое даёт стоковую картинку, второе — кадр уровня референса.
Ниже — 10 техник, которые я гонял на Sora 2 последние два месяца в видео-движке Quantium. Каждая — это один параметр, который ощутимо меняет результат. От света и движения камеры до negative prompts. С шаблонами промптов и тем, что получится на выходе. Все техники тестировались на реальных задачах: трейлеры для инди-игр, фоновое видео для лендингов, концепт-сцены для арт-проектов и music videos.
Перед тем как переходить к техникам — один принцип. Sora 2 работает по схеме «чем подробнее описание, тем меньше домыслов». Модель видела миллионы кадров с EXIF-данными, описаниями режиссёров и инструкциями оператора. Она различает «35mm anamorphic» и «50mm spherical», понимает разницу между «golden hour» и «blue hour», узнаёт референсы конкретных DOP — Роджер Дикинс, Эммануэль Любецки, Грэйг Фрейзер. Используйте этот словарь и пишите промпт на английском: модель тренирована на англоязычных описаниях, и русскоязычные термины она конвертирует с потерями.
Композиция и физика: техники 1-2
1. Композиция кадра
Sora 2 понимает классическую киноязыковую терминологию. Указывайте план явно: extreme close-up, medium shot, wide establishing shot, over-the-shoulder. Без этого модель усредняет до среднего плана и режет руки персонажа на границе кадра.
Wide establishing shot of a rain-soaked Tokyo street at dusk, neon signs reflecting on wet asphalt, low camera angle
2. Физика и материалы
Главная сила Sora 2 — симуляция физических процессов. Чем явнее вы её просите рендерить физику, тем чище результат. Прописывайте: liquid splash, cloth folds, smoke dissipation, glass shatter, particle dispersion. Модель честно считает поведение материала.
A coffee cup spills across a wooden table in slow motion, liquid forms thin sheets, droplets bounce, cloth napkin absorbs the edge of the spill, realistic surface tension
Освещение: техника 3
3. Трёхточечная схема света
Кинокадр держится на свете, и Sora 2 умеет ставить классическую трёхточку. Указывайте все три источника: key light (основной), fill light (заполняющий) и rim light (контровый). Это не магия — модель видела миллионы кадров с правильной светопостановкой.
Portrait of a violinist on stage, key light from upper-left at 45 degrees, soft fill light from camera-right, rim light behind the head separating subject from dark background, slight haze in beam paths
Движение камеры: техника 4
4. Конкретный тип движения
Sora 2 понимает разницу между типами движения. Не пишите «camera moves» — это плацебо. Используйте: slow dolly in (наезд по рельсам), tracking shot following subject, orbit 180 degrees around subject, handheld with subtle shake, crane up revealing landscape. Модель различает все эти движения и держит их в кадре.
Slow dolly in on a chess board, pieces in dramatic side lighting, camera moves from wide to extreme close-up over 5 seconds, shallow depth of field shifting focus to the king piece
Атмосфера: техника 5
5. Воздух между планами
Атмосферные эффекты добавляют кинематографичности больше, чем любой LUT. Прописывайте: volumetric fog, morning haze, dust particles in light beams, steam rising from streets, light rain. Один такой элемент превращает плоский AI-рендер в кадр с глубиной.
A lone figure walks through a forest at dawn, volumetric god rays between trees, morning haze filling the middle ground, dust particles visible in light beams, soft atmospheric depth
Цветовая палитра: техника 6
6. Цвет через референсы кинокартин
Sora 2 знает референсы фильмов и режиссёров — это самый быстрый способ задать палитру одной строкой. «In the color palette of Blade Runner 2049» даёт оранж-сине-зелёную тональность. «Wes Anderson symmetrical pastels» — пастельные центрированные кадры. «Roger Deakins lighting» — мягкий золотистый натуральный свет.
An old man reads a letter by the window, in the color palette of "The Revenant" — desaturated cold tones with warm interior accents, natural light only, Roger Deakins-style lighting
Аудио-синхронизация: техника 7
7. Описывайте звук вместе с действием
Sora 2 синтезирует аудио в той же генерации, что и видео — но только если вы попросите. Указывайте: diegetic sound (звук в кадре), ambient noise, character speaking «реплика», background music: cinematic strings, slow tempo. Реплики персонажей можно писать на любом языке — модель озвучит синхронно с губами.
A barista pours steamed milk into a cup, ambient cafe noise, soft jazz playing quietly in background, the barista says "Your latte is ready" with a gentle smile, sound of milk frothing synchronized with the pour
Длительность и темп: техника 8
8. Указывайте темп кадра
Sora 2 в Quantium генерирует 5-секундные ролики, и без указания темпа модель усредняет до «обычного» — все движения происходят за 2 секунды, остаётся пустая третья. Прописывайте: slow motion 0.25x для эффектных кадров, real-time для разговоров, time lapse для природы и облаков, two-act beat: setup then reveal для драматургии.
5-second shot with two-act beat: first 2 seconds show closed gift box on a table in soft light, then in the last 3 seconds hands enter the frame and slowly open the box, anticipation building
Прайминг стиля: техника 9
9. Указывайте формат и носитель
Один префикс меняет всё. «Cinematic» — стандартный кинолук. «Shot on 35mm film» — зернистость и тёплые тона. «16mm documentary» — репортажный кадр. «Anamorphic lens with horizontal flares» — широкоэкранная кинематика с характерными бликами. «VHS-style 1990s home video» — стилизация под ретро.
Shot on 35mm film, anamorphic lens, slight horizontal lens flares, a vintage car driving down a coastal highway at golden hour, desaturated blue sky, warm shadows, cinematic widescreen 2.39:1
Negative prompts: техника 10
10. То, чего быть не должно
Sora 2 принимает negative prompts через блок «avoid:» или «no:» в конце промпта. Это убирает типичные артефакты: лишние пальцы, искажённые лица, водяные знаки, плавающие объекты. Используйте короткий список из 4-6 пунктов, не больше — длинные negative-блоки модель начинает игнорировать. Подробный разбор синтаксиса и 20 готовых блоков — в отдельной статье про negative prompts.
... основной промпт ... Avoid: distorted faces, extra limbs, warped hands, floating objects, text artifacts, oversaturated colors, jittery camera
Готовый шаблон промпта
Когда лень собирать с нуля — вот формула, которая работает на любой сцене Sora 2:
Workflow: как я собираю промпт за 3 минуты
На реальных клиентских роликах я не пишу промпт «с нуля». У меня есть фиксированный пайплайн, который занимает 3 минуты и даёт стабильный результат.
Шаг 1. Референс. Открываю Pinterest или Vimeo, нахожу кадр, который похож на то, что я хочу. Скачиваю — это будет визуальный якорь.
Шаг 2. Дешифровка. Описываю этот кадр текстом по 9 параметрам шаблона выше: композиция, физика, свет, камера, атмосфера, цвет, аудио, темп, стиль. Это 80% работы.
Шаг 3. Negative. Добавляю 4-6 пунктов под потенциальные артефакты конкретно для этой сцены. Если в кадре лицо — добавляю «no distorted faces». Если руки — «no extra fingers». Если текст — «no garbled text».
Шаг 4. Image-to-video. Загружаю референсный кадр как стартовый — Sora 2 принимает image-to-video, и это резко повышает стабильность стиля. Текстовый промпт описывает только движение и аудио.
Шаг 5. Итерация. Первая генерация — почти всегда близко, но не идеально. Я меняю один параметр за раз: сначала движение камеры, потом свет, потом длительность. На третьей попытке обычно ловлю кадр.
Сколько это стоит
Sora 2 в Quantium — 60 кредитов за 5-секундный ролик в Standard и 120 кредитов в Pro-режиме с приоритетной очередью. На тарифе Basic с 3000 кредитов в месяц это 50 видео — больше, чем по одному в день. Если работаете с клиентскими роликами, имеет смысл начинать со Standard для шлифовки промпта и переключаться в Pro только для финального кадра.
Аудио и видео генерируются в одном вызове — отдельной озвучки покупать не нужно, и это серьёзно меняет экономику против схемы «Veo + ElevenLabs». Для рекламных коротких роликов с синхроном губ и текстом продукта лучше переключаться на Veo 3.1 — у него специфика заточена под маркетинг. Подробнее про сравнение — в материале Sora 2 vs Veo 3.1.
Связанные материалы: image-to-video из готовой картинки, Kling vs Veo, галерея работ.
Частые вопросы
Сколько стоит одна генерация Sora 2 в Quantium?
Sora 2 — 60 кредитов за 5-секундный ролик в Standard, 120 в Pro-режиме. На тарифе Basic с 3000 кредитов это 50 видео в месяц. Аудио идёт в одном вызове с видео.
Поддерживает ли Sora 2 русский язык в озвучке?
Да, Sora 2 синтезирует речь на 30+ языках, включая русский. Сам промпт сцены пишите по-английски, реплики персонажей — на нужном языке внутри кавычек.
Чем Sora 2 отличается от Veo 3.1?
Sora 2 сильнее в cinematic-сценах с физикой и длительностью 8+ секунд. Veo 3.1 точнее в рекламных коротких роликах с синхроном губ и текстом продукта.
Можно ли загрузить референсное изображение в Sora 2?
Да, image-to-video в Sora 2 принимает один кадр и оживляет его по текстовому промпту — это самый стабильный способ зафиксировать стиль и персонажа.
Что делать, если Sora генерирует артефакты на лицах?
Используйте negative prompts «no distorted faces, no warped features». Снизьте длительность до 4 секунд, поменяйте close-up на medium shot — это убирает 90% артефактов.
Попробуйте Sora 2 в Quantium
20 кредитов в месяц на бесплатном тарифе. 30+ нейросетей в одном Telegram-боте.
Открыть бот →

