Учёба, рефераты, объяснения
gpt-5-miniДёшево, быстро, качество достаточное для учебных задач
≈ 250 ₽ / 1MКаталог · 26 моделей · 7 провайдеров
GPT-5, Claude 4.6, Gemini 2.5, YandexGPT, GigaChat, Llama, Mistral и автономный ИИ-агент Hermes — через единый OpenAI-совместимый эндпоинт. Работает в России без VPN, оплата картой РФ или СБП.
Флагманская линейка GPT — мультимодальная, быстрая, лучшая для вызова инструментов и пошагового планирования агентов.
Claude — премиум-качество логических рассуждений, лучший выбор для длинных документов, ревью кода и аккуратных правок.
Gemini — огромный контекст до 2 миллионов токенов, сильная мультимодальность с видео и аудио на входе.
YandexGPT — российская модель с прямой поддержкой русского языка и соответствием 152-ФЗ. Данные обрабатываются в РФ.
GigaChat — российская модель от Сбера. Max для общих задач, Pro для деловой переписки и юридических текстов. 152-ФЗ.
Дешёвая китайская модель с открытыми весами. V3 для чата, R1 — reasoning для математики и науки.
Автономный ИИ-агент с памятью и 87 навыками. Стоимость считается по выбранной внутри модели — каждая модель имеет свою цену за входящие и исходящие токены.
hermes-общийНовоеКонтекст
Любая
Вход / 1M ₽
по модели
Выход / 1M ₽
по модели
hermes-выделенныйКонтекст
Любая
Вход / 1M ₽
по модели
Выход / 1M ₽
по модели
Подобрать модель
Не уверены что выбрать? Краткий справочник: 6 типичных сценариев → рекомендованная модель с обоснованием.
Учёба, рефераты, объяснения
gpt-5-miniДёшево, быстро, качество достаточное для учебных задач
≈ 250 ₽ / 1MДлинные документы, договоры, книги
claude-opus-4.6Контекст 1M токенов, лучшая внимательность к деталям
1M контекстАнализ видео, аудио, картинок
gemini-2.5-proСильнейшая мультимодальность на входе и выходе
2M контекстПарное программирование, ревью кода
claude-sonnet-4.6Лучшее качество на коде в категории своей цены
300 ₽ / 1M входAI-агент с инструментами (Telegram, MAX, почта, БД)
gpt-5Лучший выбор для многошаговых сценариев Hermes
ТопМассовая классификация, чат-бот, ответы на FAQ
gemini-2.5-flash-liteСамая дешёвая модель — 10 ₽ за миллион входных токенов
ДешёвоеДля разработчиков
Совместимый с OpenAI SDK — замените только base_url. Параметр model принимает любое имя из каталога выше.
from openai import OpenAI
client = OpenAI(
api_key="rk_live_...",
base_url="https://api.rubikbot.com/v1",
)
# Меняйте любую модель строкой:
for model in ["gpt-5", "claude-opus-4.6", "gemini-2.5-pro"]:
r = client.chat.completions.create(
model=model,
messages=[{"role": "user", "content": "Привет!"}],
)Подбор по задаче
8 типичных задач — какую модель брать и почему. Каждая ссылка ведёт в песочницу с предзаполненной моделью.
Длинные тексты, статьи, посты, рассылки, переводы. Лучший «писательский» голос и самый богатый контекст русского языка.
gpt-5Попробовать →Парное программирование, ревью кода, генерация тестов, рефакторинг. Claude Sonnet — премиум-качество, Codestral — дёшево и быстро.
claude-sonnet-4.6 · codestralПопробовать →Литературные и технические переводы с сохранением стиля. Claude Opus — лучший для длинных документов, GPT-5 — быстрый для коротких текстов.
gpt-5 · claude-opus-4.6Попробовать →Контекст до 2 миллионов токенов = 5 000 страниц за раз. Загружаете PDF целиком — модель отвечает на любой вопрос по документу.
gemini-2.5-pro · claude-opus-4.6Попробовать →OCR текста с фото, распознавание объектов и сцен, анализ диаграмм и таблиц. Gemini уникален поддержкой видео и аудио на входе.
gpt-4o · gemini-2.5-proПопробовать →Telegram-боты, автоматизация бизнес-процессов, чтение почты, работа с CRM, ведение календаря. 87 встроенных навыков из коробки.
Hermes на базе gpt-5Попробовать →Самые дешёвые модели — от 10-15 ₽ за миллион токенов. Достаточное качество для типовых задач: классификация, ответы на частые вопросы, простые ответы.
gemini-2.5-flash-lite · gpt-4o-miniПопробовать →Быстро, дёшево, качество достаточное для учебных задач. Объясняют сложные темы простыми словами, помогают с домашкой и рефератами.
gpt-5-mini · claude-haiku-4.5Попробовать →Подробное сравнение моделей в реальных задачах — GPT-5 vs Claude 4.6 vs Gemini 2.5 →
Глубже
По типу задачи
9 детальных лендингов: генерация текста, кода, картинок, видео, презентаций, перевод, фото-обработка. С выбором модели и примерами промптов.
Технические разборы
Независимые бенчмарки GPT-5, Claude 4.6, Gemini, DeepSeek. Архитектура Hermes-агента. RAG, tool calling, embeddings в продакшене.
Частые вопросы
От «почему ChatGPT не работает в России» до «что такое токен» и «как выбрать модель для своей задачи».
С российского IP-адреса OpenAI, Anthropic и Google закрывают доступ к ChatGPT, Claude и Gemini — возвращают «Country not supported» или 403. RubikBot решает это так: вы пишете нашему API, мы проксируем запросы к провайдерам через нашу зарубежную инфраструктуру. Для вас — обычный HTTP-запрос к api.rubikbot.com, никакого VPN. Все 12+ моделей доступны напрямую из РФ.
Принимаем оплату картами Visa, MasterCard, МИР российских банков, СБП по QR-коду и реквизитам, для юрлиц — расчётный счёт с актом и счёт-фактурой. Все платежи через лицензированного российского оператора PayStо. Зарубежные карты не нужны.
Общая работа (тексты, переписка, помощь по учёбе) — gpt-5 или claude-sonnet-4.6. Дёшево и массово (классификация, простые ответы, чат-боты) — gpt-4o-mini или gemini-2.5-flash-lite. Длинные документы (книги, договоры, исследования) — claude-opus-4.6 или gemini-2.5-pro с контекстом 1-2 миллиона токенов. Полный гид по выбору — см. блок «Какую модель брать под задачу» выше.
Для парного программирования и ревью кода — claude-sonnet-4.6 чаще выигрывает по качеству (особенно на сложных рефакторингах). По метрике SWE-Bench Verified Claude Sonnet даёт 64% vs 58% у GPT-5. Зато GPT-5 лучше для агентных сценариев — когда модель сама вызывает компилятор, читает ошибку, исправляет. Для open-source проектов есть Codestral от Mistral — дешевле и заточена именно под код.
По размеру контекста: gemini-2.5-pro (до 2 миллионов токенов — около 5 000 страниц текста), claude-opus-4.6 (1 миллион — 2 500 страниц), claude-sonnet-4.6 (200K — 500 страниц), gpt-5 (400K — 1 000 страниц). Для одноразового анализа толстого PDF (отчёт, договор, книга) лучший выбор — gemini-2.5-pro. Для регулярной работы с длинными документами в чате — claude-opus или claude-sonnet (быстрее и аккуратнее с деталями).
Большинство моделей в каталоге умеют vision (см. тег «Зрение» на карточке): gpt-4o и gpt-5, claude-opus/sonnet/haiku 4.6, gemini-2.5-pro/flash. Для распознавания текста на фото лучший — gpt-4o. Для распознавания структуры документа (таблицы, диаграммы) — claude-opus. Для анализа видео и аудио — gemini-2.5-pro (единственный с native video/audio input на входе).
Это уменьшенные варианты флагманов: в 5-30 раз дешевле, в 2-3 раза быстрее, качество достаточное для большинства задач. gpt-4o-mini в 80 раз дешевле gpt-5 на выходе. claude-haiku-4.5 — в 19 раз дешевле claude-opus. gemini-2.5-flash-lite — в 250 раз дешевле gemini-pro. Используйте флагман (gpt-5, claude-opus, gemini-pro) только когда нужно максимальное качество — финальное ревью, сложные рассуждения, критичные задачи.
Стоимость в рублях за один миллион токенов на вход (то что вы отправляете модели — запрос, контекст, история) и выход (что модель отвечает). 1 токен ≈ 0,75 слова русского текста, то есть 1M токенов ≈ 750 000 слов или 1 500 страниц. Обычно выход стоит в 3-5 раз дороже входа, поэтому для генерации длинных текстов считайте именно выход.
Да, за минуту. Эндпоинт api.rubikbot.com/v1 полностью совместим с протоколом OpenAI Chat Completions. Замените только base_url в инициализации клиента OpenAI Python или Node.js SDK — остальной код работает как есть. Поддерживаются стриминг, вызов инструментов (tools), структурированный JSON-вывод, кеширование промптов. Пример кода — в блоке «Поменяйте одну строку» выше.
Да. В песочнице /playground переключатель в шапке — любая модель на любом сообщении истории. Через API передавайте параметр model в каждом запросе. История диалога переносится, контекст сохраняется. Это один из главных плюсов единого API: можно начать ответ на gpt-5-mini (дёшево), а финальную проверку сделать на claude-opus (качественно).
Hermes — это не чат-бот, а автономный агент: планирует шаги, исполняет инструменты (поиск в интернете, чтение почты, работа с БД), проверяет результаты и решает что делать дальше — без вашего вмешательства. 87 встроенных навыков покрывают разработку (github, sql), маркетинг (telegram_post, instagram), исследования (web_search, arxiv), MLOps. Подходит когда задача — «сделай работу до результата», а не «ответь на вопрос». Подробнее на /hermes.
Общий (на тарифах Pro и Plus) — Hermes на общей инфраструктуре RubikBot с приоритетом по тарифу. Выделенный (только Business 4 990 ₽) — отдельный контейнер Hermes на отдельном сервере под вашу команду: больше CPU и памяти, журнал действий с хранением 3 года, до 20 ваших навыков, полная изоляция данных от других клиентов. См. /pricing и /hermes.
В каталоге уже видны с пометкой «Скоро» — подключение завершаем в течение нескольких недель после публичного запуска платформы. Главное преимущество — соответствие 152-ФЗ о персональных данных (данные не покидают РФ). Для большинства задач можно сразу использовать доступные GPT-5/Claude/Gemini — они также соответствуют РФ-законодательству, так как оплата идёт через российское юр.лицо RubikBot.
Да, в настройках Hermes на /app/hermes можно подключить свой ключ к OpenAI или Anthropic. Расходы пойдут с вашего ключа напрямую к провайдеру, RubikBot предоставит только инфраструктуру (Telegram-бот, MAX, проксирование, среда выполнения агента). Полезно если у вас уже есть неиспользованный кредит у провайдера или особый прайс для крупных клиентов.
Да. После регистрации на счёт зачисляется приветственный бонус 50 ₽ — этого хватит на ~100 запросов к gpt-5-mini, claude-haiku или gemini-flash для сравнения качества на ваших задачах. Без банковской карты, без обязательств. Открыть песочницу с переключателем моделей — /playground.
Токен — единица текста, на которую модель разбивает запрос для обработки. В среднем 1 токен ≈ 0,75 слова на русском или ≈ 4 символа на английском. То есть 1 миллион токенов ≈ 750 000 русских слов или 1 500 страниц текста. Цена «1 250 ₽ за 1M входа» означает что отправка 1 500 страниц текста модели обойдётся в 1 250 рублей.
Контекст — это «оперативная память» модели в одном диалоге: сколько токенов она помнит одновременно. Включает ваши предыдущие сообщения, ответы модели и системный промпт. У GPT-5 контекст 400K, у Claude Opus — 1M, у Gemini 2.5 Pro — 2M (это рекорд каталога, около 5 000 страниц текста). Чем больше контекст, тем длиннее документы можно анализировать целиком.
Tool calling — способность модели не просто отвечать текстом, а вызывать ваши функции: «поиск в Google», «отправь email», «прочитай файл», «выполни SQL-запрос». Модель сама решает, какую функцию нужно вызвать, передаёт аргументы, получает результат и использует его в ответе. Эта возможность делает возможными агентные сценарии (см. Hermes). Поддерживается всеми моделями с тегом «Инструменты» в каталоге.
Самая дешёвая в каталоге — gemini-2.5-flash-lite (10 ₽ за миллион входных, 40 ₽ за миллион выходных токенов). Далее по возрастанию: gpt-4o-mini (15/60 ₽), codestral (20/60 ₽), gemini-2.5-flash (30/250 ₽), llama-4-70b (60/60 ₽), claude-haiku-4.5 (80/400 ₽). Для массовых задач (классификация, простые ответы) выбирайте flash-lite или 4o-mini — экономия в десятки раз vs флагманов.
Меняйте модель строкой — без новых ключей и переписывания кода. 50 ₽ при регистрации для теста, чтобы протестировать любые модели на своих задачах.