Что умеет нейросеть для озвучки текста
TTS-нейросеть (Text-to-Speech) превращает обычный текст в естественный человеческий голос. Вы передаёте текст — получаете готовый MP3-файл с озвучкой.
На практике TTS-нейросеть подходит для:
- Подкастов и аудиокниг — озвучивайте свои статьи и сценарии без диктора в студии.
- Видеороликов на YouTube и TikTok — экономия на закадровом голосе и студийной записи.
- Голосовых ассистентов и чат-ботов — естественный голос вместо роботизированного.
- Уведомлений в мобильных приложениях — «ваш заказ доставлен» и подобные.
- Доступности (a11y) — озвучка статей на сайте для людей с нарушением зрения.
- Обучающих курсов — голосовая дорожка к слайдам и видеоурокам.
В России 2026 года прямой доступ к OpenAI закрыт. RubikBot даёт доступ к TTS-моделям OpenAI через российский биллинг: оплата картой РФ или по СБП, тариф Pro за 990 ₽ в месяц.
Какими моделями озвучивает RubikBot
На /pricing в разделе «Дополнительные сервисы поставщиков» доступны три модели TTS:
- tts-1 — стандартное качество, оптимально для большинства задач (видео, чат-боты, уведомления).
- tts-1-hd — повышенное качество, подходит для подкастов, аудиокниг, дорогих коммерческих проектов.
- tts-1-mini — самая дешёвая модель, годится для массовой озвучки коротких сообщений (уведомления, навигация).
ElevenLabs (клонирование голоса) и Suno (генерация музыки) — в дорожной карте на Q3 2026.
Как озвучить текст через RubikBot
API-эндпоинт /v1/audio/speech полностью совместим с OpenAI SDK. Минимальный пример на Python:
from openai import OpenAI
client = OpenAI(
api_key="<RUBIKBOT_API_KEY>",
base_url="https://api.rubikbot.com/v1",
)
response = client.audio.speech.create(
model="tts-1",
voice="alloy",
input="Привет, мир! Это пример озвучки текста нейросетью.",
)
response.stream_to_file("output.mp3")
Через curl:
curl https://api.rubikbot.com/v1/audio/speech \
-H "Authorization: Bearer $RUBIKBOT_API_KEY" \
-H "Content-Type: application/json" \
-d '{
"model": "tts-1",
"voice": "alloy",
"input": "Привет, мир!"
}' \
--output output.mp3
Получите API-ключ в кабинете /app/api-keys. Полная документация — на /docs.
Голоса OpenAI: что выбрать
| Голос | Характер | Подходит для |
|---|
| alloy | Нейтральный, средний регистр | Корпоративные ролики, инструкции |
| echo | Мужской, уверенный | Реклама, подкасты, обзоры |
| fable | Мягкий, с лёгким акцентом | Аудиокниги, рассказы |
| onyx | Глубокий мужской | Документальные, исторические |
| nova | Женский, естественный | Подкасты, видеоролики |
| shimmer | Мягкий женский | Aудиокниги, медитации |
Все голоса хорошо звучат на русском. Различие — в тембре и интонациях. Попробуйте все в песочнице, выберите подходящий.
Стоимость TTS на RubikBot
Цена считается за миллион символов входного текста. Конкретные ставки в рублях — на странице /pricing в разделе «Дополнительные сервисы поставщиков». Стоимость автоматически пересчитывается из тарифов OpenAI по курсу с учётом наценки платформы.
Примерный расчёт: озвучка одного видеоролика на 5 минут (≈ 750 слов ≈ 5000 символов) стоит порядка 2-3 ₽ для tts-1.
Подробнее про вычисление стоимости — в калькуляторе на /pricing.
Что дальше
- ElevenLabs (клонирование голоса) — Q3 2026.
- Suno (генерация музыки) — Q3 2026.
- Realtime TTS (стриминг аудио по WebSocket для голосовых ассистентов) — Q4 2026.
Подписывайтесь на /blog — там анонсируем все обновления.