Russian 🇷🇺
January 23

Какой лимит запросов?

Мы часто получаем вопросы про лимиты,
почему они есть, почему меняются и почему нельзя просто написать «10 сообщений в день».
Попробуем объяснить это по-человечески — сначала очень просто, потом чуть подробнее.


Короткое объяснение

Представьте, что у нас есть одна большая пицца на месяц.

Мы не знаем заранее:

  • сколько гостей придёт,
  • сколько из них будут активно есть,
  • кто съест один кусочек,
  • а кто попробует съесть половину пиццы в одиночку.

Наша задача — чтобы:

  • пиццы хватило всем,
  • никто не остался без еды,
  • и один человек не съел всё сразу.

Поэтому пицца делится между всеми, кто сейчас за столом.
Если гостей становится больше — каждому достаётся меньше.
Если гостей меньше — можно взять чуть больше.

Если пицца закончилась — новых кусочков уже нет.
Но:

  • через время приедет новая пицца, и всё начнётся заново;
  • а если кому-то нужно больше прямо сейчас — он может купить себе отдельную пиццу.

Главный вопрос тут всегда один:

что делать, если один гость решит съесть слишком много, а если придут тысячи гостей?

Если разрешить — остальные останутся ни с чем.
Если запретить всем есть больше одного кусочка — пицца может остаться, а люди будут голодны.

Поэтому лимит:

  • есть у каждого,
  • он зависит от количества гостей,
  • и он постоянно меняется.

А что такое «пицца» в реальности

В реальности пицца — это деньги, которые мы платим за работу нейросетей.

Каждое сообщение в боте: текст, голос, фото, файл, обрабатывается нейросетями и стоит денег.

В среднем:

  • простое текстовое сообщение может стоить около 20–50 копеек руб.,
  • сложные запросы (фото, файлы, распознавание речи, авиабилеты, работа с часовыми поясами) —
    несколько рублей,
  • в редких случаях — до 10–15 рублей за один запрос.

И это нормально: разные задачи требуют разного объёма вычислений.


Почему стоимость так сильно отличается

Потому что внутри бот — это не «одна нейросеть».

Мы используем несколько классов моделей:

  • Быстрые и дешёвые — для классификации и простых запросов
  • Основные рабочие — для большинства повседневных задач
  • Более мощные — для сложных случаев (авиабилеты, часовые пояса, сложная логика)
  • Отдельную модель для распознавания голоса

Кроме того:

  • если одна модель временно недоступна,
  • или отвечает с ошибкой,
  • запрос автоматически уходит в следующую по списку.

То есть один и тот же запрос:

  • сегодня может обработаться дешёвой моделью,
  • завтра — более дорогой,
  • а послезавтра — пройти через несколько этапов.

Поэтому заранее сказать:

«это сообщение стоит ровно столько-то»

мы просто не можем.


Почему нельзя написать «у вас осталось N сообщений»

Потому что:

  • сообщения бывают очень разными,
  • токены считаются по-разному,
  • модели стоят по-разному,
  • а нагрузка на сервис постоянно меняется.

Один человек может:

  • отправить 50 коротких сообщений и почти ничего не потратить.

Другой:

  • отправить одно длинное аудио или фото с текстом,
  • и потратить столько же, сколько десятки обычных сообщений.

Фиксированные лимиты вроде «10 сообщений в день» в такой системе просто не работают.


Поэтому лимит динамический

Мы делаем так:

  1. Есть общий бюджет на ИИ.
  2. Есть текущее количество активных пользователей.
  3. Остаток бюджета делится между всеми, кто сейчас пользуется ботом.

Сегодня пользователей меньше — лимит больше.
Завтра пользователей больше — лимит меньше.

Это не ошибка и не «скрытые ограничения», а единственный способ:

  • сохранить сервис работающим,
  • и не выключать его для всех сразу.

Что происходит, когда лимит заканчивается

Когда лимит исчерпан:

  • бот временно перестаёт отправлять запросы к ИИ,
  • иначе пострадают все остальные пользователи.

Это жёстко, но без этого сервис просто не сможет существовать.


Зачем тогда платное увеличение лимита

Это вариант для ситуаций, когда:

  • вам нужно больше прямо сейчас,
  • и вы не хотите зависеть от общей нагрузки.

Платное увеличение:

  • умножает ваш текущий лимит,
  • гарантирует работу ИИ,
  • даже если в этот момент ботом пользуется очень много людей.

Это не обязательная подписка,
а возможность получить свою «отдельную пиццу», когда это действительно нужно.


Что будет дальше

Через время:

  • бюджет обновляется,
  • приезжает «новая пицца»,
  • пользователи пересчитываются,
  • и лимиты распределяются заново.

Никто не блокируется навсегда.


Главное, что важно понять

Лимиты — это не жадность и не попытка что-то скрыть.
Это способ:

  • честно разделить ресурсы,
  • защититься от злоупотреблений,
  • и сделать так, чтобы бот продолжал работать для всех.

Если совсем коротко:

Пицца одна, гостей много, и мы стараемся, чтобы поел каждый.

Спасибо, что пользуетесь ботом и задаёте вопросы — именно они помогают делать систему понятнее.