Image-to-video — функция, на которую год назад смотрели с недоверием, а сегодня она генерирует целые контент-стратегии. Берёшь одну фотографию, добавляешь короткое описание движения — получаешь готовое видео на 5-12 секунд. В видеогенераторе Quantium это занимает 30-90 секунд от загрузки до результата.
Как это работает
Технически: модель берёт твою фотографию как «первый кадр» и достраивает следующие 120-300 кадров (5-12 секунд при 24 fps). При этом она держит композицию, цвет, объекты и пытается двигать их естественно — согласно физике мира и твоему промпту.
Раньше было заметно «плывущее лицо» и «дёрганые руки». В 2026 на хороших моделях (Veo 3.1 и Kling v3) такие артефакты встречаются на одном кадре из десяти.
Какую модель брать под image-to-video
Из доступных в Quantium:
- Veo 3.1 — самый надёжный. Стабильно держит композицию исходника, лица не дрейфуют, есть встроенное аудио. 28 кредитов за 10 секунд.
- Kling v3 — сильнее на движениях тела и танце. Иногда чуть художественнее интерпретирует исходник. 22 кредита за 10 секунд.
- Sora 2 — даёт самую кинематографичную картинку, но иногда «уходит» от исходника. Лучше для художественных задач, не для документального оживления. 38 кредитов за 10 секунд.
По умолчанию — Veo 3.1. На задачах с танцами/спортом — Kling. На рекламных и художественных — Sora. Подробнее — в сравнении Kling vs Veo.
Что писать в промпте
Главное правило: не описывай, что на фото — описывай, что должно произойти. Модель уже видит фото. Ей нужно знать движение.
Плохо: «woman in red dress standing in cafe» (это описание исходника).
Хорошо: «she takes a sip of coffee, then smiles slightly and looks out the window» (это указание движения).
Что хорошо ложится в промпт:
- Конкретное действие («turns head», «raises hand», «walks forward»)
- Эмоция в движении («smiles slowly», «frowns then relaxes»)
- Камера («slow zoom in», «pan left», «push toward face»)
- Окружение («wind blows hair», «steam rises from cup»)
- Темп («slow motion», «natural pace», «slightly slower than real time»)
Какая фотография подходит
Не любая фотография даёт хороший результат. Что работает:
- Чёткое лицо, не размытое, хороший фокус
- Однозначный субъект (один человек, не толпа)
- Естественное освещение, без жёстких контровых теней
- Композиция с воздухом вокруг субъекта (не обрезано впритык)
- Разрешение от 1024 пикселей по большей стороне
Что обычно ломается:
- Фото в очень тёмном помещении (модель не видит детали)
- Множественные мелкие лица (детский сад, концерт) — модель путается
- Стилизованные иллюстрации (мультяшный рисунок) — результат странный
- Сильно отретушированные фото — иногда «оживают» в неестественную пластмассу
5 типичных ошибок и как их избежать
1. «Лицо плывёт через 3 секунды». Решение: возьми Veo 3.1 вместо других, сократи ролик до 5-7 секунд. Чем короче, тем стабильнее.
2. «Движение слишком резкое». Решение: добавь в промпт «slow, gentle motion» или «natural pace». Без указания модели иногда переусердствуют.
3. «Получилось другое лицо». Решение: используй промпт «keep face identity, only animate body and expression». На Veo это работает.
4. «Руки превращаются в кашу». Решение: попросить модель не двигать руки явно — «hands stay relaxed, no gesture». Или брать кадр, где рук в кадре нет.
5. «Размер исходника слишком разный». Решение: ресайз до квадрата или 16:9 перед загрузкой. Модель не любит экстремальные пропорции.
Подробнее по практике — туториал по image-to-video.
Цена и применение
В тарифе Basic (3000 кредитов) — это 107 роликов Veo 3.1 по 10 секунд или 136 роликов Kling. VIP (15 000 кредитов) — 535 роликов Veo. Для маркетолога с 4 креативами в неделю это запас на полгода.
Практические применения:
- Reels/Shorts из старых статичных фото из архива
- «Оживление» портретов клиентов для тизеров кейсов
- Анимированные обложки постов в Telegram-канал
- Превью продуктов из карточек товаров
- Тизеры YouTube из футажей-стопкадров
Связанное: глубокое сравнение Sora vs Veo, Kling vs Veo на людях, первое видео в Sora, все видео-возможности Quantium.
Попробуйте Quantium бесплатно
20 кредитов в месяц на бесплатном тарифе. 30+ нейросетей в одном Telegram-боте.
Открыть бот →

