FAQ — You.RU LLM Proxy

01 Что такое токены и как считается стоимость?

▼

Токен — это единица текста, которую обрабатывает AI-модель. Один токен примерно равен 4 символам латиницы или 1–2 символам кириллицы. Грубо говоря, 1 слово ≈ 1–2 токена.

Стоимость запроса складывается из двух частей: input (ваш промпт — то, что вы отправили) и output (ответ модели). У каждой модели свои расценки.

Тип контента	Примерно токенов	Пример
Короткое сообщение в чате	30–100	«Переведи это на английский»
Обычный диалог (вопрос + ответ)	200–500	Вопрос по теме + развёрнутый ответ
Страница текста (A4)	400–600	Статья, отчёт, документ
Генерация кода	300–1500	Функция или компонент
Анализ документа	1000–4000	Резюме длинного документа
Длинный диалог (20+ сообщений)	3000–8000	Сессия с контекстом

Для ориентира: на $1 при использовании бюджетных моделей (DeepSeek, Llama, Gemini Flash) можно получить тысячи ответов. На премиум-моделях (GPT-4o, Claude Sonnet) — сотни.

02 Как подключиться к API?

▼

Наш API полностью совместим со стандартным форматом OpenAI. Если ваше приложение уже работает с OpenAI, ChatGPT или любым совместимым сервисом — вам нужно поменять только два параметра: Base URL и API Key.

Пример подключения на Python:

from openai import OpenAI

client = OpenAI(
    base_url="https://ваш-домен/api/v1",
    api_key="ваш-ключ"
)

response = client.chat.completions.create(
    model="openai/gpt-4o-mini",
    messages=[{"role": "user", "content": "Привет!"}]
)
print(response.choices[0].message.content)
        

Работает с библиотеками openai (Python, Node.js), curl, LangChain, LlamaIndex и любыми сервисами, поддерживающими OpenAI-формат.

03 Как подключить API к стороннему сервису или приложению?

▼

Большинство современных AI-инструментов позволяют указать custom API endpoint. Найдите в настройках поля:

Параметр	Что вписать
API Base URL (или Endpoint, Server URL)	`https://ваш-домен/api/v1`
API Key (или Token, Secret)	`ваш-ключ-от-нас`
Model (или Model Name)	Название модели, например `openai/gpt-4o-mini`

Это работает в: IDE-плагинах (Cursor, Continue, Cody), чат-ботах, автоматизациях (n8n, Make), телеграм-ботах, веб-приложениях и любых инструментах с поддержкой OpenAI API формата.

04 Какие модели доступны и чем они отличаются?

▼

Мы предоставляем доступ к моделям от ведущих разработчиков AI — полный список с ценами на странице цен. Вкратце:

Для повседневных задач (чаты, переводы, простые вопросы) — бюджетные модели: DeepSeek, Llama, Gemini Flash, GPT-4o Mini. Быстрые и дешёвые.

Для сложных задач (анализ, длинные тексты, рассуждения) — премиум-модели: GPT-4o, Claude Sonnet. Умнее, но дороже.

Для генерации кода — DeepSeek V3, Claude Sonnet, GPT-4o. Хорошо справляются с программированием на любых языках.

Вы можете переключать модели в любой момент — один ключ даёт доступ ко всем разрешённым моделям.

05 Как работает баланс и оплата?

▼

Система работает по предоплате. Вы получаете API-ключ с определённым балансом. Каждый запрос списывает стоимость использованных токенов с вашего баланса. Когда баланс заканчивается — ключ перестаёт работать до пополнения.

В личном кабинете вы видите: текущий баланс, историю запросов, стоимость каждого запроса и оставшийся лимит.

Для пополнения свяжитесь с администратором.

06 Есть ли лимиты на количество запросов?

▼

Да, для стабильной работы сервиса установлены два лимита:

RPM (Requests Per Minute) — максимум запросов в минуту. Обычно 30–60.
RPD (Requests Per Day) — максимум запросов в день. Обычно 500–1000.

Также ограничена максимальная длина ответа в токенах на один запрос.

Эти лимиты настраиваются индивидуально. Если вам нужен больший объём — обратитесь к администратору.

07 Поддерживается ли стриминг (потоковая передача)?

▼

Да. API поддерживает streaming (Server-Sent Events) — ответ модели начинает приходить посимвольно, не дожидаясь полной генерации. Это стандартное поведение для чат-интерфейсов.

Чтобы включить стриминг, добавьте "stream": true в тело запроса — точно так же, как в стандартном OpenAI API.

08 Мои данные и запросы — они где-то хранятся?

▼

Мы храним только метаданные запросов для расчёта стоимости: время, модель, количество токенов, стоимость. Содержимое ваших сообщений (промпты и ответы) не сохраняется на нашей стороне — они передаются напрямую к модели и обратно.

09 Что делать если API возвращает ошибку?

▼

Частые ошибки и решения:

Код	Значение	Решение
`401`	Неверный ключ	Проверьте API key, он должен начинаться с `llm-`
`402`	Баланс исчерпан	Пополните баланс
`403`	Модель не доступна	Эта модель не включена для вашего ключа
`429`	Лимит запросов	Подождите минуту или обратитесь за увеличением лимита
`502/504`	Ошибка провайдера	Временная проблема, повторите запрос

❓ Часто задаваемые вопросы