Quantium даёт доступ к 15+ голосам от трёх ведущих TTS-провайдеров: OpenAI, Google Gemini и xAI. Каждый со своим характером — от мягкого нарратора аудиокниги до бодрого ведущего рекламы.

За 6 минут разберём, какой голос под какую задачу, как послушать примеры до полной генерации и что делать с длинными текстами (>3000 знаков).

1Откройте раздел Озвучка

В боте: «🔊 Озвучка» → выбор провайдера. Цены: 1 кр. за 1000 знаков на Standard, 2 кр. — на Pro. Один Standard-вариант 5-минутного ролика обойдётся в 8–12 кредитов.

2Прослушайте примеры голосов

Перед тем как выбирать голос для полного текста, нажмите «🎧 Примеры». Бот покажет список (Onyx, Alloy, Nova, Echo, Shimmer для OpenAI; Aoede, Charon, Kore для Gemini; и т.д.) — на каждый можно тапнуть и услышать 10-секундный сэмпл.

3Подберите голос под задачу

Грубое правило: OpenAI Onyx — для серьёзных аудиокниг и подкастов, Nova — для рекламы и vlog-стиля, Echo — нейтральный диктор. Gemini Aoede — выразительный для презентаций, Charon — глубокий для драмы. xAI Sage — мужской ведущий ток-шоу.

4Длинные тексты

OpenAI TTS лимитирует одну озвучку 4096 знаками, Gemini — 5000, xAI — 8000. Quantium автоматически режет более длинный текст на куски и склеивает результат. Если в склейке слышно шов — попросите разбить вручную по абзацам и сгенерировать каждый отдельным запросом.

5Настройте темп и эмоцию

На Pro-моделях работают теги: [slow], [fast], [cheerful], [serious], [whisper]. Вставляйте прямо в текст — модель меняет интонацию по ходу.

[cheerful] Привет, друзья! Сегодня у нас особенный выпуск. [serious] Но прежде чем мы начнём, важное предупреждение для зрителей младше 16 лет. [normal] А теперь — поехали.

Что дальше

TTS в Quantium закрывает 90% задач: видео-озвучка, подкасты, аудиостатьи для соцсетей, рекламные ролики. Для блогеров — отличный способ озвучить готовый сценарий без записи микрофоном.

Готовы попробовать? 20 бесплатных кредитов хватит на серию из 3–5 генераций.

Открыть @quantium_aibot →

Похожие туториалы