Слой маршрутизации, который берёт на себя самое сложное
Самое сложное в мультимодельной инфраструктуре — это всё, что происходит между запросом и ответом. Именно это WayJet выстраивает в каждом вызове, чтобы ваш код оставался одной чистой интеграцией, а слой отрабатывал своё.
В каждом вызове
Работа между запросом и ответом
Оценка маршрутов
Маршрут A
Маршрут B
Маршрут C
Работоспособность, задержка и цена оцениваются при каждом вызове — побеждает лучший маршрут.
Маршрутизация по оценке, а не фиксированный маршрут
Каждый вызов оценивается по актуальному состоянию провайдера, задержке и цене, а затем направляется по лучшему маршруту — с балансировкой нагрузки, с учётом задержки, с учётом стоимости или по правилам. Закрепите провайдера, отдайте предпочтение самому дешёвому участнику или маршрутизируйте по header; политика — это конфигурация, а не повторное развёртывание.
Неработоспособные upstream-маршруты выявляются и отключаются автоматическим предохранителем (circuit breaker); вызовы повторяются с экспоненциальной задержкой (backoff) и переключаются на исправного провайдера для той же модели. Ветка BYOK может откатиться к пулу. Ваше приложение продолжает отвечать во время сбоя, а не наследует его.
claude-opus-4.7— ok
gpt-5.1— ok
gemini-3-pro— ok
Одна панель для каждой модели и каждого вызова.
Каждый вызов полностью наблюдаем
Задержка, статус и расходы по каждой модели в одном месте — с разбивкой по каждому запросу на сегменты маршрутизации, upstream и cache, чтобы ничто в вызове не оставалось чёрным ящиком, о котором приходится гадать.
Контроль без обслуживания
Остальная часть слоя
Группы моделей
Определите виртуальную модель, которая разрешается в лучшего участника по стоимости, приоритету или весу. Меняйте политику выбора, не трогая ни строки вашего кода.
Используйте свои ключи
Маршрутизируйте через собственные аккаунты провайдеров, когда захотите, — сохраняйте скидки за обязательства по расходам, доверьте оркестрацию WayJet, который берёт лишь плату за услугу.
Контроль расходов и лимитов
Лимиты на ключ по RPM, TPM, параллелизму и дневным расходам, а также бюджеты организации — управление встроено в слой и применяется до вызова upstream, а не пристроено постфактум.
Кеширование ответов
Точное и семантическое кеширование с переключателями на ключ и наблюдаемостью попаданий — повторная работа выдаётся из cache, поэтому стоимость upstream вы оплачиваете один раз, а не каждый раз.
Точный учёт
Стоимость token рассчитывается из собственного потребления upstream по ценам каталога, в decimal, с fail-closed, когда вызов невозможно оценить точно. Точность уровня OpenRouter — по замыслу.
Единый учёт использования
Единый источник истины о расходах и объёме по всем моделям и ключам — запрашивайте по периоду, модели или ключу, с предоплаченным балансом, который никогда не сгорает.
Стройте на слое, а не на одном поставщике
Один API-ключ ко всем моделям — маршрутизация, отказоустойчивость, наблюдаемость и контроль включены.