Каталог моделей: один API-ключ ко всем основным LLM

Модели OpenAI, Claude, Gemini, DeepSeek и Qwen через один OpenAI-совместимый endpoint. Один ключ и один base_url; счёт в рублях, цены — за 1 млн токенов раздельно input и output.

Цены обновлены

Мы не даём гарантий от лица зарубежных провайдеров: по каждой модели указывается статус доступа с датой последней проверки. Со своей стороны фиксируем то, что получаете вы: собственный ключ VseLLM, endpoint из российских сетей, оплату в рублях и работу по договору.

Семейства моделей

Модели OpenAI

GPT-4o — универсальная модель для текста и vision; GPT-4o mini — рабочая лошадка чат-ботов и массовых пайплайнов, где важна цена за токен.

  • GPT-4o — от 387 ₽/1M input
  • GPT-4o mini — от 24 ₽/1M input

Claude (Anthropic)

Opus 4.7 — для сложных рассуждений и длинных документов, Sonnet 4.6 — основная рабочая модель для кода и агентных сценариев, Haiku 4.5 — дешёвый тир для классификации и batch-задач.

  • Claude Opus 4.7 — от 773 ₽/1M input
  • Claude Sonnet 4.6 — от 464 ₽/1M input
  • Claude Haiku 4.5 — от 155 ₽/1M input

Gemini (Google)

Gemini 3 Pro — длинный контекст и мультимодальность (текст, изображения, аудио); Flash — быстрый и дешёвый продакшен: суммаризация, извлечение данных, высоконагруженные боты.

  • Gemini 3 Pro — от 309 ₽/1M input
  • Gemini 3 Flash — от 78 ₽/1M input

DeepSeek

Главный аргумент семейства — цена: сопоставимое качество на типовых задачах при стоимости заметно ниже флагманов, плюс скидка за cache-hit при повторяющихся префиксах промптов.

  • DeepSeek V4 Flash — от 22 ₽/1M input
  • DeepSeek V4 Pro — от 68 ₽/1M input

Qwen (Alibaba)

Бюджетные модели с сильным мультиязычием, включая русский и китайский. Подходит для дешёвых пайплайнов обработки текста, где флагманские модели избыточны.

  • Qwen — от 62 ₽/1M input

Сводная таблица

Все цены — в рублях за 1M токенов, обновлены 4 июля 2026.

МодельКонтекстСильна в₽/1M input₽/1M output
GPT-4o128Kуниверсальные задачи, vision387 ₽1 545 ₽
GPT-4o mini128Kчат-боты, массовые пайплайны24 ₽93 ₽
Claude Opus 4.7200Kсложные рассуждения, длинные документы773 ₽3 862 ₽
Claude Sonnet 4.6200Kкод, агентные сценарии464 ₽2 317 ₽
Claude Haiku 4.5200Kклассификация, batch155 ₽773 ₽
Gemini 3 Pro1Mдлинный контекст, мультимодальность309 ₽1 854 ₽
Gemini 3 Flash1Mдешёвый прод, суммаризация78 ₽464 ₽
DeepSeek V4 Flash128Kдешёвый прод, большие объёмы22 ₽44 ₽
DeepSeek V4 Pro128Kцена/качество68 ₽135 ₽
Qwen131Kмультиязычие, бюджетные пайплайны62 ₽186 ₽

Как это работает

Один base_url, один ключ, один баланс в рублях. Endpoint OpenAI-совместимый: если ваш код уже использует SDK OpenAI, достаточно заменить base_url и подставить ключ VseLLM — остальное продолжает работать, включая streaming и tool calling. Переключение между моделями — сменой значения model.

from openai import OpenAI

client = OpenAI(
    api_key="VSELLM_API_KEY",     # ключ из кабинета VseLLM
    base_url="https://api.payclarus.com/v1",  # OpenAI-совместимый endpoint
)

resp = client.chat.completions.create(
    model="claude-sonnet-4.6",    # или "gpt-4o", "gemini-3-pro", "deepseek-v4-flash"
    messages=[{"role": "user", "content": "Проверка подключения"}],
)
print(resp.choices[0].message.content)

Частые вопросы

Нужен ли VPN для работы с моделями из каталога?

Нет. Запросы идут на endpoint VseLLM, который доступен из российских сетей, — это свойство шлюза, а не способ обхода блокировок. Ваш сервер или локальная машина обращается к endpoint напрямую; настройка сетевого окружения не требуется.

Вы продаёте API-ключи OpenAI, Anthropic или Google?

Нет, чужие ключи мы не продаём и не перепродаём. Вы получаете собственный ключ VseLLM, который открывает доступ к моделям перечисленных провайдеров через наш шлюз. Баланс и ключ остаются у вас в кабинете, а статус доступа к каждой модели публикуется с датой проверки.

Как указаны цены?

Все цены — в рублях за 1 млн токенов, раздельно input и output; курсовых пересчётов на вашей стороне нет. Цены пересчитываются из провайдерских прайсов по курсу ЦБ РФ; на странице видна дата последнего обновления.

Как подключиться юридическому лицу?

Работаем по договору: счёт на расчётный счёт, закрывающие документы (УПД), обмен через ЭДО. Ключи можно разделить по командам и проектам, расходы видны по каждому ключу.

Храните ли вы содержимое запросов к моделям?

Для работы сервиса мы храним только биллинговые метаданные: какая модель вызвана, количество токенов input/output, стоимость и время запроса. Они нужны для расчётов и закрывающих документов.

Что будет, если провайдер изменит условия доступа к модели?

Мы не даём гарантий от лица провайдеров. При изменениях статус доступа обновляется, а затронутым пользователям доступны альтернативные модели через тот же endpoint — миграция сводится к смене значения model в коде.

Ранний доступ к API-шлюзу

Оставьте заявку — расскажем о подключении, ценах в рублях и договоре для юрлица, и первыми пригласим, когда откроется выпуск ключей.