Image-to-video — режим, где модель берёт ваше готовое фото как первый кадр и достраивает следующие 5 секунд движения. Это в разы предсказуемее, чем text-to-video: вы заранее знаете, что будет в кадре.
Gemini Veo 3.1 — одна из лучших моделей под эту задачу: сохраняет лица, не «плывут» детали, понимает физику движения объектов. Разберём, как с ней работать.
1Подберите исходное фото
Хорошо работают: пейзажи (вода, облака, листва), портреты с явной эмоцией, продуктовые шоты, города. Плохо: мелкие толпы людей, текстовые скриншоты, очень тёмные кадры. Идеальный размер — 1024×1024 и больше, формат 16:9 или 9:16.
2Загрузите и опишите движение
В боте: «🎬 Видео» → «Veo 3.1» → «Image-to-video». Прикрепите фото и в подписи опишите, что должно ожить в кадре. Чем конкретнее — тем лучше.
3Управляйте камерой
Veo понимает три типа движения камеры: static camera (статика), slow zoom in/out (приближение/отдаление), pan left/right (горизонтальный сдвиг). Для лиц обычно лучше статика — иначе модель искажает черты.
4Подскажите физику
Veo иногда не уверен, что движется, а что — нет. Подсказывайте: only the leaves move, branches and trunk stay still, the woman is the only moving subject, background remains static. Это спасает от «плывущего» фона.
5Если не получилось — варианты
Veo 3.1 поддерживает seed — число, фиксирующее «вариант» движения. Если первая версия почти ок, но что-то одно не так — сохраните seed и перегенерируйте с уточнением промпта. Это сэкономит кредиты.
Что дальше
Image-to-video — самый предсказуемый и дешёвый способ получить рабочий ролик. Особенно хорошо подходит для соцсетей: одно красивое фото + Veo = живой Reels.
Готовы попробовать? 20 бесплатных кредитов хватит на серию из 3–5 генераций.
Открыть @quantium_aibot →


