Часто задаваемые вопросы

Всё что нужно знать для начала работы с API

← Главная  ·  Цены
01 Что такое токены и как считается стоимость?
Токен — это единица текста, которую обрабатывает AI-модель. Один токен примерно равен 4 символам латиницы или 1–2 символам кириллицы. Грубо говоря, 1 слово ≈ 1–2 токена.

Стоимость запроса складывается из двух частей: input (ваш промпт — то, что вы отправили) и output (ответ модели). У каждой модели свои расценки.

Тип контентаПримерно токеновПример
Короткое сообщение в чате30–100«Переведи это на английский»
Обычный диалог (вопрос + ответ)200–500Вопрос по теме + развёрнутый ответ
Страница текста (A4)400–600Статья, отчёт, документ
Генерация кода300–1500Функция или компонент
Анализ документа1000–4000Резюме длинного документа
Длинный диалог (20+ сообщений)3000–8000Сессия с контекстом

Для ориентира: на $1 при использовании бюджетных моделей (DeepSeek, Llama, Gemini Flash) можно получить тысячи ответов. На премиум-моделях (GPT-4o, Claude Sonnet) — сотни.
02 Как подключиться к API?
Наш API полностью совместим со стандартным форматом OpenAI. Если ваше приложение уже работает с OpenAI, ChatGPT или любым совместимым сервисом — вам нужно поменять только два параметра: Base URL и API Key.

Пример подключения на Python:
from openai import OpenAI client = OpenAI( base_url="https://ваш-домен/api/v1", api_key="ваш-ключ" ) response = client.chat.completions.create( model="openai/gpt-4o-mini", messages=[{"role": "user", "content": "Привет!"}] ) print(response.choices[0].message.content)
Работает с библиотеками openai (Python, Node.js), curl, LangChain, LlamaIndex и любыми сервисами, поддерживающими OpenAI-формат.
03 Как подключить API к стороннему сервису или приложению?
Большинство современных AI-инструментов позволяют указать custom API endpoint. Найдите в настройках поля:

ПараметрЧто вписать
API Base URL (или Endpoint, Server URL)https://ваш-домен/api/v1
API Key (или Token, Secret)ваш-ключ-от-нас
Model (или Model Name)Название модели, например openai/gpt-4o-mini

Это работает в: IDE-плагинах (Cursor, Continue, Cody), чат-ботах, автоматизациях (n8n, Make), телеграм-ботах, веб-приложениях и любых инструментах с поддержкой OpenAI API формата.
04 Какие модели доступны и чем они отличаются?
Мы предоставляем доступ к моделям от ведущих разработчиков AI — полный список с ценами на странице цен. Вкратце:

Для повседневных задач (чаты, переводы, простые вопросы) — бюджетные модели: DeepSeek, Llama, Gemini Flash, GPT-4o Mini. Быстрые и дешёвые.

Для сложных задач (анализ, длинные тексты, рассуждения) — премиум-модели: GPT-4o, Claude Sonnet. Умнее, но дороже.

Для генерации кода — DeepSeek V3, Claude Sonnet, GPT-4o. Хорошо справляются с программированием на любых языках.

Вы можете переключать модели в любой момент — один ключ даёт доступ ко всем разрешённым моделям.
05 Как работает баланс и оплата?
Система работает по предоплате. Вы получаете API-ключ с определённым балансом. Каждый запрос списывает стоимость использованных токенов с вашего баланса. Когда баланс заканчивается — ключ перестаёт работать до пополнения.

В личном кабинете вы видите: текущий баланс, историю запросов, стоимость каждого запроса и оставшийся лимит.

Для пополнения свяжитесь с администратором.
06 Есть ли лимиты на количество запросов?
Да, для стабильной работы сервиса установлены два лимита:

RPM (Requests Per Minute) — максимум запросов в минуту. Обычно 30–60.
RPD (Requests Per Day) — максимум запросов в день. Обычно 500–1000.

Также ограничена максимальная длина ответа в токенах на один запрос.

Эти лимиты настраиваются индивидуально. Если вам нужен больший объём — обратитесь к администратору.
07 Поддерживается ли стриминг (потоковая передача)?
Да. API поддерживает streaming (Server-Sent Events) — ответ модели начинает приходить посимвольно, не дожидаясь полной генерации. Это стандартное поведение для чат-интерфейсов.

Чтобы включить стриминг, добавьте "stream": true в тело запроса — точно так же, как в стандартном OpenAI API.
08 Мои данные и запросы — они где-то хранятся?
Мы храним только метаданные запросов для расчёта стоимости: время, модель, количество токенов, стоимость. Содержимое ваших сообщений (промпты и ответы) не сохраняется на нашей стороне — они передаются напрямую к модели и обратно.
09 Что делать если API возвращает ошибку?
Частые ошибки и решения:

КодЗначениеРешение
401Неверный ключПроверьте API key, он должен начинаться с llm-
402Баланс исчерпанПополните баланс
403Модель не доступнаЭта модель не включена для вашего ключа
429Лимит запросовПодождите минуту или обратитесь за увеличением лимита
502/504Ошибка провайдераВременная проблема, повторите запрос