Каталог моделей: один API-ключ ко всем основным LLM
Модели OpenAI, Claude, Gemini, DeepSeek и Qwen через один OpenAI-совместимый endpoint. Один ключ и один base_url; счёт в рублях, цены — за 1 млн токенов раздельно input и output.
Цены обновлены
Мы не даём гарантий от лица зарубежных провайдеров: по каждой модели указывается статус доступа с датой последней проверки. Со своей стороны фиксируем то, что получаете вы: собственный ключ VseLLM, endpoint из российских сетей, оплату в рублях и работу по договору.
Семейства моделей
Модели OpenAI
GPT-4o — универсальная модель для текста и vision; GPT-4o mini — рабочая лошадка чат-ботов и массовых пайплайнов, где важна цена за токен.
- GPT-4o — от 387 ₽/1M input
- GPT-4o mini — от 24 ₽/1M input
Claude (Anthropic)
Opus 4.7 — для сложных рассуждений и длинных документов, Sonnet 4.6 — основная рабочая модель для кода и агентных сценариев, Haiku 4.5 — дешёвый тир для классификации и batch-задач.
- Claude Opus 4.7 — от 773 ₽/1M input
- Claude Sonnet 4.6 — от 464 ₽/1M input
- Claude Haiku 4.5 — от 155 ₽/1M input
Gemini (Google)
Gemini 3 Pro — длинный контекст и мультимодальность (текст, изображения, аудио); Flash — быстрый и дешёвый продакшен: суммаризация, извлечение данных, высоконагруженные боты.
- Gemini 3 Pro — от 309 ₽/1M input
- Gemini 3 Flash — от 78 ₽/1M input
DeepSeek
Главный аргумент семейства — цена: сопоставимое качество на типовых задачах при стоимости заметно ниже флагманов, плюс скидка за cache-hit при повторяющихся префиксах промптов.
- DeepSeek V4 Flash — от 22 ₽/1M input
- DeepSeek V4 Pro — от 68 ₽/1M input
Qwen (Alibaba)
Бюджетные модели с сильным мультиязычием, включая русский и китайский. Подходит для дешёвых пайплайнов обработки текста, где флагманские модели избыточны.
- Qwen — от 62 ₽/1M input
Сводная таблица
Все цены — в рублях за 1M токенов, обновлены 4 июля 2026.
| Модель | Контекст | Сильна в | ₽/1M input | ₽/1M output |
|---|---|---|---|---|
| GPT-4o | 128K | универсальные задачи, vision | 387 ₽ | 1 545 ₽ |
| GPT-4o mini | 128K | чат-боты, массовые пайплайны | 24 ₽ | 93 ₽ |
| Claude Opus 4.7 | 200K | сложные рассуждения, длинные документы | 773 ₽ | 3 862 ₽ |
| Claude Sonnet 4.6 | 200K | код, агентные сценарии | 464 ₽ | 2 317 ₽ |
| Claude Haiku 4.5 | 200K | классификация, batch | 155 ₽ | 773 ₽ |
| Gemini 3 Pro | 1M | длинный контекст, мультимодальность | 309 ₽ | 1 854 ₽ |
| Gemini 3 Flash | 1M | дешёвый прод, суммаризация | 78 ₽ | 464 ₽ |
| DeepSeek V4 Flash | 128K | дешёвый прод, большие объёмы | 22 ₽ | 44 ₽ |
| DeepSeek V4 Pro | 128K | цена/качество | 68 ₽ | 135 ₽ |
| Qwen | 131K | мультиязычие, бюджетные пайплайны | 62 ₽ | 186 ₽ |
Как это работает
Один base_url, один ключ, один баланс в рублях. Endpoint OpenAI-совместимый: если ваш код уже использует SDK OpenAI, достаточно заменить base_url и подставить ключ VseLLM — остальное продолжает работать, включая streaming и tool calling. Переключение между моделями — сменой значения model.
from openai import OpenAI
client = OpenAI(
api_key="VSELLM_API_KEY", # ключ из кабинета VseLLM
base_url="https://api.payclarus.com/v1", # OpenAI-совместимый endpoint
)
resp = client.chat.completions.create(
model="claude-sonnet-4.6", # или "gpt-4o", "gemini-3-pro", "deepseek-v4-flash"
messages=[{"role": "user", "content": "Проверка подключения"}],
)
print(resp.choices[0].message.content)Частые вопросы
Нужен ли VPN для работы с моделями из каталога?
Нет. Запросы идут на endpoint VseLLM, который доступен из российских сетей, — это свойство шлюза, а не способ обхода блокировок. Ваш сервер или локальная машина обращается к endpoint напрямую; настройка сетевого окружения не требуется.
Вы продаёте API-ключи OpenAI, Anthropic или Google?
Нет, чужие ключи мы не продаём и не перепродаём. Вы получаете собственный ключ VseLLM, который открывает доступ к моделям перечисленных провайдеров через наш шлюз. Баланс и ключ остаются у вас в кабинете, а статус доступа к каждой модели публикуется с датой проверки.
Как указаны цены?
Все цены — в рублях за 1 млн токенов, раздельно input и output; курсовых пересчётов на вашей стороне нет. Цены пересчитываются из провайдерских прайсов по курсу ЦБ РФ; на странице видна дата последнего обновления.
Как подключиться юридическому лицу?
Работаем по договору: счёт на расчётный счёт, закрывающие документы (УПД), обмен через ЭДО. Ключи можно разделить по командам и проектам, расходы видны по каждому ключу.
Храните ли вы содержимое запросов к моделям?
Для работы сервиса мы храним только биллинговые метаданные: какая модель вызвана, количество токенов input/output, стоимость и время запроса. Они нужны для расчётов и закрывающих документов.
Что будет, если провайдер изменит условия доступа к модели?
Мы не даём гарантий от лица провайдеров. При изменениях статус доступа обновляется, а затронутым пользователям доступны альтернативные модели через тот же endpoint — миграция сводится к смене значения model в коде.
Ранний доступ к API-шлюзу
Оставьте заявку — расскажем о подключении, ценах в рублях и договоре для юрлица, и первыми пригласим, когда откроется выпуск ключей.