Image-to-video — функция, на которую год назад смотрели с недоверием, а сегодня она генерирует целые контент-стратегии. Берёшь одну фотографию, добавляешь короткое описание движения — получаешь готовое видео на 5-12 секунд. В видеогенераторе Quantium это занимает 30-90 секунд от загрузки до результата.

Как это работает

Технически: модель берёт твою фотографию как «первый кадр» и достраивает следующие 120-300 кадров (5-12 секунд при 24 fps). При этом она держит композицию, цвет, объекты и пытается двигать их естественно — согласно физике мира и твоему промпту.

Раньше было заметно «плывущее лицо» и «дёрганые руки». В 2026 на хороших моделях (Veo 3.1 и Kling v3) такие артефакты встречаются на одном кадре из десяти.

Какую модель брать под image-to-video

Из доступных в Quantium:

  • Veo 3.1 — самый надёжный. Стабильно держит композицию исходника, лица не дрейфуют, есть встроенное аудио. 28 кредитов за 10 секунд.
  • Kling v3 — сильнее на движениях тела и танце. Иногда чуть художественнее интерпретирует исходник. 22 кредита за 10 секунд.
  • Sora 2 — даёт самую кинематографичную картинку, но иногда «уходит» от исходника. Лучше для художественных задач, не для документального оживления. 38 кредитов за 10 секунд.

По умолчанию — Veo 3.1. На задачах с танцами/спортом — Kling. На рекламных и художественных — Sora. Подробнее — в сравнении Kling vs Veo.

Что писать в промпте

Главное правило: не описывай, что на фото — описывай, что должно произойти. Модель уже видит фото. Ей нужно знать движение.

Плохо: «woman in red dress standing in cafe» (это описание исходника).

Хорошо: «she takes a sip of coffee, then smiles slightly and looks out the window» (это указание движения).

Что хорошо ложится в промпт:

  • Конкретное действие («turns head», «raises hand», «walks forward»)
  • Эмоция в движении («smiles slowly», «frowns then relaxes»)
  • Камера («slow zoom in», «pan left», «push toward face»)
  • Окружение («wind blows hair», «steam rises from cup»)
  • Темп («slow motion», «natural pace», «slightly slower than real time»)

Какая фотография подходит

Не любая фотография даёт хороший результат. Что работает:

  • Чёткое лицо, не размытое, хороший фокус
  • Однозначный субъект (один человек, не толпа)
  • Естественное освещение, без жёстких контровых теней
  • Композиция с воздухом вокруг субъекта (не обрезано впритык)
  • Разрешение от 1024 пикселей по большей стороне

Что обычно ломается:

  • Фото в очень тёмном помещении (модель не видит детали)
  • Множественные мелкие лица (детский сад, концерт) — модель путается
  • Стилизованные иллюстрации (мультяшный рисунок) — результат странный
  • Сильно отретушированные фото — иногда «оживают» в неестественную пластмассу

5 типичных ошибок и как их избежать

1. «Лицо плывёт через 3 секунды». Решение: возьми Veo 3.1 вместо других, сократи ролик до 5-7 секунд. Чем короче, тем стабильнее.

2. «Движение слишком резкое». Решение: добавь в промпт «slow, gentle motion» или «natural pace». Без указания модели иногда переусердствуют.

3. «Получилось другое лицо». Решение: используй промпт «keep face identity, only animate body and expression». На Veo это работает.

4. «Руки превращаются в кашу». Решение: попросить модель не двигать руки явно — «hands stay relaxed, no gesture». Или брать кадр, где рук в кадре нет.

5. «Размер исходника слишком разный». Решение: ресайз до квадрата или 16:9 перед загрузкой. Модель не любит экстремальные пропорции.

Подробнее по практике — туториал по image-to-video.

Цена и применение

В тарифе Basic (3000 кредитов) — это 107 роликов Veo 3.1 по 10 секунд или 136 роликов Kling. VIP (15 000 кредитов) — 535 роликов Veo. Для маркетолога с 4 креативами в неделю это запас на полгода.

Практические применения:

  • Reels/Shorts из старых статичных фото из архива
  • «Оживление» портретов клиентов для тизеров кейсов
  • Анимированные обложки постов в Telegram-канал
  • Превью продуктов из карточек товаров
  • Тизеры YouTube из футажей-стопкадров

Связанное: глубокое сравнение Sora vs Veo, Kling vs Veo на людях, первое видео в Sora, все видео-возможности Quantium.

Q
Quantium Editorial 30+ нейросетей в одном Telegram-боте

Попробуйте Quantium бесплатно

20 кредитов в месяц на бесплатном тарифе. 30+ нейросетей в одном Telegram-боте.

Открыть бот →

Читайте также