Каталог · 26 моделей · 7 провайдеров

Все нейросети.
Один API.
Цены в рублях.

GPT-5, Claude 4.6, Gemini 2.5, YandexGPT, GigaChat, Llama, Mistral и автономный ИИ-агент Hermes — через единый OpenAI-совместимый эндпоинт. Работает в России без VPN, оплата картой РФ или СБП.

  • Без VPN
  • Картой РФ или СБП
  • 50 ₽ при регистрации
  • OpenAI SDK совместимо
OpenAI
Anthropic
Google
Яндекс
Сбер
DeepSeek
MetaСкоро
MistralСкоро
Hermes
OpenAI

Флагманская линейка GPT — мультимодальная, быстрая, лучшая для вызова инструментов и пошагового планирования агентов.

RubikBot · Hermes

Автономный ИИ-агент с памятью и 87 навыками. Стоимость считается по выбранной внутри модели — каждая модель имеет свою цену за входящие и исходящие токены.

hermes-общийНовое

Контекст

Любая

Вход / 1M ₽

по модели

Выход / 1M ₽

по модели

ТекстИнструменты
hermes-выделенный

Контекст

Любая

Вход / 1M ₽

по модели

Выход / 1M ₽

по модели

ТекстИнструментыГолос

Подобрать модель

Какую модель брать под задачу

Не уверены что выбрать? Краткий справочник: 6 типичных сценариев → рекомендованная модель с обоснованием.

Учёба, рефераты, объяснения

gpt-5-mini

Дёшево, быстро, качество достаточное для учебных задач

≈ 250 ₽ / 1M

Длинные документы, договоры, книги

claude-opus-4.6

Контекст 1M токенов, лучшая внимательность к деталям

1M контекст

Анализ видео, аудио, картинок

gemini-2.5-pro

Сильнейшая мультимодальность на входе и выходе

2M контекст

Парное программирование, ревью кода

claude-sonnet-4.6

Лучшее качество на коде в категории своей цены

300 ₽ / 1M вход

AI-агент с инструментами (Telegram, MAX, почта, БД)

gpt-5

Лучший выбор для многошаговых сценариев Hermes

Топ

Массовая классификация, чат-бот, ответы на FAQ

gemini-2.5-flash-lite

Самая дешёвая модель — 10 ₽ за миллион входных токенов

Дешёвое

Для разработчиков

Поменяйте одну строку — переключайтесь между моделями

Совместимый с OpenAI SDK — замените только base_url. Параметр model принимает любое имя из каталога выше.

python · openai SDK
from openai import OpenAI

client = OpenAI(
    api_key="rk_live_...",
    base_url="https://api.rubikbot.com/v1",
)

# Меняйте любую модель строкой:
for model in ["gpt-5", "claude-opus-4.6", "gemini-2.5-pro"]:
    r = client.chat.completions.create(
        model=model,
        messages=[{"role": "user", "content": "Привет!"}],
    )

Подбор по задаче

Нейросеть для каждой задачи

8 типичных задач — какую модель брать и почему. Каждая ссылка ведёт в песочницу с предзаполненной моделью.

Подробное сравнение моделей в реальных задачах — GPT-5 vs Claude 4.6 vs Gemini 2.5 →

Глубже

Детальные гайды и исследования

Частые вопросы

Главные вопросы про нейросети

От «почему ChatGPT не работает в России» до «что такое токен» и «как выбрать модель для своей задачи».

Почему ChatGPT не работает в России и как пользоваться нейросетями без VPN?

+

С российского IP-адреса OpenAI, Anthropic и Google закрывают доступ к ChatGPT, Claude и Gemini — возвращают «Country not supported» или 403. RubikBot решает это так: вы пишете нашему API, мы проксируем запросы к провайдерам через нашу зарубежную инфраструктуру. Для вас — обычный HTTP-запрос к api.rubikbot.com, никакого VPN. Все 12+ моделей доступны напрямую из РФ.

Как оплатить нейросети картой российского банка?

+

Принимаем оплату картами Visa, MasterCard, МИР российских банков, СБП по QR-коду и реквизитам, для юрлиц — расчётный счёт с актом и счёт-фактурой. Все платежи через лицензированного российского оператора PayStо. Зарубежные карты не нужны.

Какую нейросеть выбрать, если не знаю с чего начать?

+

Общая работа (тексты, переписка, помощь по учёбе) — gpt-5 или claude-sonnet-4.6. Дёшево и массово (классификация, простые ответы, чат-боты) — gpt-4o-mini или gemini-2.5-flash-lite. Длинные документы (книги, договоры, исследования) — claude-opus-4.6 или gemini-2.5-pro с контекстом 1-2 миллиона токенов. Полный гид по выбору — см. блок «Какую модель брать под задачу» выше.

Что лучше для написания кода — GPT-5 или Claude 4.6?

+

Для парного программирования и ревью кода — claude-sonnet-4.6 чаще выигрывает по качеству (особенно на сложных рефакторингах). По метрике SWE-Bench Verified Claude Sonnet даёт 64% vs 58% у GPT-5. Зато GPT-5 лучше для агентных сценариев — когда модель сама вызывает компилятор, читает ошибку, исправляет. Для open-source проектов есть Codestral от Mistral — дешевле и заточена именно под код.

Какая нейросеть умеет работать с большими документами?

+

По размеру контекста: gemini-2.5-pro (до 2 миллионов токенов — около 5 000 страниц текста), claude-opus-4.6 (1 миллион — 2 500 страниц), claude-sonnet-4.6 (200K — 500 страниц), gpt-5 (400K — 1 000 страниц). Для одноразового анализа толстого PDF (отчёт, договор, книга) лучший выбор — gemini-2.5-pro. Для регулярной работы с длинными документами в чате — claude-opus или claude-sonnet (быстрее и аккуратнее с деталями).

Какая нейросеть умеет распознавать изображения и видео?

+

Большинство моделей в каталоге умеют vision (см. тег «Зрение» на карточке): gpt-4o и gpt-5, claude-opus/sonnet/haiku 4.6, gemini-2.5-pro/flash. Для распознавания текста на фото лучший — gpt-4o. Для распознавания структуры документа (таблицы, диаграммы) — claude-opus. Для анализа видео и аудио — gemini-2.5-pro (единственный с native video/audio input на входе).

Чем отличаются версии mini, flash, haiku от флагманских моделей?

+

Это уменьшенные варианты флагманов: в 5-30 раз дешевле, в 2-3 раза быстрее, качество достаточное для большинства задач. gpt-4o-mini в 80 раз дешевле gpt-5 на выходе. claude-haiku-4.5 — в 19 раз дешевле claude-opus. gemini-2.5-flash-lite — в 250 раз дешевле gemini-pro. Используйте флагман (gpt-5, claude-opus, gemini-pro) только когда нужно максимальное качество — финальное ревью, сложные рассуждения, критичные задачи.

Что значит «вход / 1M ₽» и «выход / 1M ₽» в каталоге?

+

Стоимость в рублях за один миллион токенов на вход (то что вы отправляете модели — запрос, контекст, история) и выход (что модель отвечает). 1 токен ≈ 0,75 слова русского текста, то есть 1M токенов ≈ 750 000 слов или 1 500 страниц. Обычно выход стоит в 3-5 раз дороже входа, поэтому для генерации длинных текстов считайте именно выход.

Можно ли мигрировать существующий код с OpenAI SDK на ваш API?

+

Да, за минуту. Эндпоинт api.rubikbot.com/v1 полностью совместим с протоколом OpenAI Chat Completions. Замените только base_url в инициализации клиента OpenAI Python или Node.js SDK — остальной код работает как есть. Поддерживаются стриминг, вызов инструментов (tools), структурированный JSON-вывод, кеширование промптов. Пример кода — в блоке «Поменяйте одну строку» выше.

Можно ли переключаться между моделями в одном диалоге?

+

Да. В песочнице /playground переключатель в шапке — любая модель на любом сообщении истории. Через API передавайте параметр model в каждом запросе. История диалога переносится, контекст сохраняется. Это один из главных плюсов единого API: можно начать ответ на gpt-5-mini (дёшево), а финальную проверку сделать на claude-opus (качественно).

Зачем нужен ИИ-агент Hermes — чем отличается от прямого вызова GPT?

+

Hermes — это не чат-бот, а автономный агент: планирует шаги, исполняет инструменты (поиск в интернете, чтение почты, работа с БД), проверяет результаты и решает что делать дальше — без вашего вмешательства. 87 встроенных навыков покрывают разработку (github, sql), маркетинг (telegram_post, instagram), исследования (web_search, arxiv), MLOps. Подходит когда задача — «сделай работу до результата», а не «ответь на вопрос». Подробнее на /hermes.

Чем отличается «общий» Hermes от «выделенного» Hermes?

+

Общий (на тарифах Pro и Plus) — Hermes на общей инфраструктуре RubikBot с приоритетом по тарифу. Выделенный (только Business 4 990 ₽) — отдельный контейнер Hermes на отдельном сервере под вашу команду: больше CPU и памяти, журнал действий с хранением 3 года, до 20 ваших навыков, полная изоляция данных от других клиентов. См. /pricing и /hermes.

Когда подключите YandexGPT и GigaChat?

+

В каталоге уже видны с пометкой «Скоро» — подключение завершаем в течение нескольких недель после публичного запуска платформы. Главное преимущество — соответствие 152-ФЗ о персональных данных (данные не покидают РФ). Для большинства задач можно сразу использовать доступные GPT-5/Claude/Gemini — они также соответствуют РФ-законодательству, так как оплата идёт через российское юр.лицо RubikBot.

Можно ли использовать свой ключ OpenAI или Anthropic (BYOK)?

+

Да, в настройках Hermes на /app/hermes можно подключить свой ключ к OpenAI или Anthropic. Расходы пойдут с вашего ключа напрямую к провайдеру, RubikBot предоставит только инфраструктуру (Telegram-бот, MAX, проксирование, среда выполнения агента). Полезно если у вас уже есть неиспользованный кредит у провайдера или особый прайс для крупных клиентов.

Можно ли попробовать модели бесплатно перед оплатой?

+

Да. После регистрации на счёт зачисляется приветственный бонус 50 ₽ — этого хватит на ~100 запросов к gpt-5-mini, claude-haiku или gemini-flash для сравнения качества на ваших задачах. Без банковской карты, без обязательств. Открыть песочницу с переключателем моделей — /playground.

Что такое токен в нейросети?

+

Токен — единица текста, на которую модель разбивает запрос для обработки. В среднем 1 токен ≈ 0,75 слова на русском или ≈ 4 символа на английском. То есть 1 миллион токенов ≈ 750 000 русских слов или 1 500 страниц текста. Цена «1 250 ₽ за 1M входа» означает что отправка 1 500 страниц текста модели обойдётся в 1 250 рублей.

Что такое контекст модели (context window)?

+

Контекст — это «оперативная память» модели в одном диалоге: сколько токенов она помнит одновременно. Включает ваши предыдущие сообщения, ответы модели и системный промпт. У GPT-5 контекст 400K, у Claude Opus — 1M, у Gemini 2.5 Pro — 2M (это рекорд каталога, около 5 000 страниц текста). Чем больше контекст, тем длиннее документы можно анализировать целиком.

Что такое tool calling (вызов инструментов) у нейросети?

+

Tool calling — способность модели не просто отвечать текстом, а вызывать ваши функции: «поиск в Google», «отправь email», «прочитай файл», «выполни SQL-запрос». Модель сама решает, какую функцию нужно вызвать, передаёт аргументы, получает результат и использует его в ответе. Эта возможность делает возможными агентные сценарии (см. Hermes). Поддерживается всеми моделями с тегом «Инструменты» в каталоге.

Какая нейросеть самая дешёвая по цене за токены?

+

Самая дешёвая в каталоге — gemini-2.5-flash-lite (10 ₽ за миллион входных, 40 ₽ за миллион выходных токенов). Далее по возрастанию: gpt-4o-mini (15/60 ₽), codestral (20/60 ₽), gemini-2.5-flash (30/250 ₽), llama-4-70b (60/60 ₽), claude-haiku-4.5 (80/400 ₽). Для массовых задач (классификация, простые ответы) выбирайте flash-lite или 4o-mini — экономия в десятки раз vs флагманов.

Один API, все модели

Меняйте модель строкой — без новых ключей и переписывания кода. 50 ₽ при регистрации для теста, чтобы протестировать любые модели на своих задачах.