OpenAI · GPT-4 семейство (omni-вариант)

GPT-4o в России

Нативная мультимодальная модель OpenAI — обрабатывает текст, изображения, аудио и голос. Быстрая, дешевле флагмана, оптимальна для real-time приложений и assistant-задач.

Цена в рублях

Курс валюты обновляется ежедневно. Цены за токены автоматически пересчитываются с учётом наценки платформы за инфраструктуру.

Входящие токены

309 ₽

за 1 млн токенов

Исходящие токены

1 235 ₽

за 1 млн токенов

Контекст

128 тыс.

токенов

Разработчик

OpenAI

США

Все цены в рублях. Доступ из России без VPN, оплата картой РФ или через СБП.

Дополнительные тарифы

Особые режимы биллинга, которые применяются для специфических сценариев. Все цены в рублях с учётом курса и наценки платформы.

Пакетный API

−50%

154 ₽ / 618 ₽

за 1 млн токенов (вход / выход)

Для асинхронных запросов готовых ждать до 24 часов.

Кэшированный ввод

−90%

154 ₽

за 1 млн токенов

Скидка на повторяющиеся префиксы промптов (system message и т.д.).

Что такое GPT-4o?

Разработчик
OpenAI
Релиз
Май 2024 (обновляется регулярно)
Поколение
GPT-4 семейство (omni-вариант)

GPT-4o (от «omni» — все модальности) — первая нативно-мультимодальная модель OpenAI. В отличие от предшественников, где модальности обрабатывались отдельными моделями, GPT-4o учится сразу на тексте, изображениях, аудио и видео — одной нейросетью, в общем смысловом пространстве.

Уникальные возможности

  • Голосовой помощник с временем отклика около 320 мс — быстрее средней реакции человека.
  • Понимание эмоций в голосе — модель определяет настроение собеседника.
  • Живая обработка видео с камеры — описание того, что видит, чтение жестов.
  • Смешанная генерация — текст с распознаванием изображения за один запрос.
GPT-4o была моделью по умолчанию в ChatGPT весь 2024–2025 год. Сейчас на смену приходит GPT-5, но GPT-4o остаётся незаменимой для голосовых интерфейсов и приложений с низкой задержкой.

Когда выбирать GPT-4o

  • Голосовые интерфейсы — только GPT-4o и GPT-4o mini поддерживают голосовой режим.
  • Приложения реального времени с низкой задержкой ответа.
  • Помощники в обучении, где мультимодальность встроена в основной сценарий.

Окно контекста и ограничения

Контекст 128 тысяч токенов — меньше, чем у GPT-5 (400 тысяч), но достаточно для большинства диалоговых задач. Для работы с очень длинными документами лучше подойдёт GPT-4.1 (1 миллион контекста) или GPT-5.

Доступ из России

В RubikBot GPT-4o доступна через нашу инфраструктуру в России — без VPN, оплата картой РФ, через СБП или по счёту. Точная цена в рублях с учётом наценки платформы — в блоке «Цена в рублях» выше на этой странице.

Возможности

  • Нативная мультимодальность (текст, изображения, аудио, голос)
  • Голосовой режим с задержкой около 320 мс
  • Понимание эмоций в голосе
  • Контекст 128 тысяч токенов
  • Вызов внешних функций и работа с инструментами
  • Структурированный вывод
  • Поддержка 50+ языков

Бенчмарки

MMLU

88%

Академические знания

HumanEval

90%

Программирование

VQAv2

78%

Понимание изображений

Сценарии использования

Реальные примеры задач, которые лучше всего решает GPT-4o — с готовыми запросами для копирования.

Голосовой ассистент

Voice mode GPT-4o — единственный нативный способ создать голосового ассистента с человеческой реакцией.

Реализуй голосового ассистента для российского e-commerce: 1) приветствует клиента; 2) выясняет цель звонка через 2-3 уточняющих вопроса; 3) направляет к нужному отделу или решает простой вопрос. Учитывай эмоциональный тон собеседника. Скрипт для каждой ветки разговора.

Анализ изображений и UI

Подайте скриншот UI или фото — GPT-4o опишет, найдёт проблемы, предложит улучшения.

Вот скриншот мобильного приложения банка (вложение). Сделай UX-аудит: 1) accessibility проблемы (контраст, размеры тапа); 2) визуальная иерархия (что выделяется правильно/неправильно); 3) ошибки UX (типичные dark patterns или конфьюз); 4) 3 конкретных улучшения с указанием места.

Live-помощник для обучения

Объяснение материала с возможностью показать страницу учебника, задать вопросы голосом, получить ответ.

Объясни школьнику 9 класса теорему Пифагора. Стиль: дружеский, без жаргона. Структура: 1) что это (1 предложение); 2) зачем нужна (пример из жизни); 3) сама формула с пояснением каждой буквы; 4) пример задачи с пошаговым решением; 5) 3 проверочных вопроса.

✓ Сильные стороны

  • Лидер по скорости отклика среди топ-моделей
  • Уникальная voice mode (нативная, не TTS)
  • Дешевле GPT-5 при сопоставимом качестве
  • Хорошее понимание эмоций и контекста в голосе
  • Идеальна для real-time приложений
  • Стабильное мультимодальное качество

✗ Слабые стороны

  • Контекст 128K — меньше GPT-4.1 (1M) и GPT-5 (400K)
  • Reasoning хуже GPT-5
  • На программировании уступает Claude Opus

Тарифная выгода

Сколько ответов GPT-4o включает каждый тариф

Подписки RubikBot включают ежемесячный бонусный баланс — это деньги на кошельке, которые автоматически расходуются на токены при работе с моделями. Ниже — сколько исходящих токенов GPT-4o вы получите бесплатно каждый месяц на каждом тарифе.

Pro · 990 ₽/мес

~243K

исходящих токенов GPT-4o

Бонус: 300 ₽/мес + +3% при пополнении

Plus · 1 499 ₽/мес

~567K

исходящих токенов GPT-4o

Бонус: 700 ₽/мес + +5% при пополнении

Business · 4 990 ₽/мес

~1.1M

исходящих токенов GPT-4o

Бонус: 1 400 ₽/мес + +7% при пополнении

Сравнить тарифы →

Часто задаваемые вопросы

GPT-4o дешевле и быстрее, имеет голосовой режим. GPT-5 умнее на сложных задачах и имеет больший контекст (400 тысяч против 128 тысяч токенов). Для голосового ассистента или работы в реальном времени — GPT-4o. Для сложных рассуждений — GPT-5. Подробнее про GPT-5.

Похожие модели

Готовы попробовать GPT-4o?

Регистрация бесплатно. 50 ₽ приветственного бонуса для теста — этого хватит на ~50-200 запросов в зависимости от модели. Без VPN, картой РФ.