feat(assistant): авто-получение лимитов моделей для любого провайдера

Новый GET /admin/assistant/models: тянет список моделей провайдера с лимитами
(OpenAI-совместимый /models: context_length+max_completion_tokens+pricing;
нативный Google generativelanguage: inputTokenLimit/outputTokenLimit) и кэширует
лимиты текущей модели на провайдере. Карточка показывает лимиты у ВСЕХ провайдеров
(не только Kilo), для отсутствующих — фоновая авто-подгрузка. В форме — кнопка
«Загрузить модели провайдера» с выбором модели и её лимитами. Так Gemini и любые
новые модели получают лимиты автоматически.

Co-Authored-By: Claude Opus 4.8 (1M context) <noreply@anthropic.com>
This commit is contained in:
Maxim Dolgolyov
2026-06-04 21:28:34 +03:00
parent f1f79335ec
commit 6e0a00fd8b
4 changed files with 125 additions and 11 deletions
+1
View File
@@ -17,6 +17,7 @@ router.get('/assistant', ctrl.getAssistant);
router.put('/assistant', ctrl.saveAssistant);
router.post('/assistant/test', ctrl.testAssistant);
router.post('/assistant/reindex', ctrl.reindexTextbooks);
router.get('/assistant/models', ctrl.getProviderModels);
router.post('/assistant/provider', ctrl.saveProvider);
router.delete('/assistant/provider/:id', requireRole('admin'), ctrl.deleteProvider);
router.post('/assistant/active', ctrl.setActiveProvider);