feat(assistant): авто-получение лимитов моделей для любого провайдера

Новый GET /admin/assistant/models: тянет список моделей провайдера с лимитами (OpenAI-совместимый /models: context_length+max_completion_tokens+pricing; нативный Google generativelanguage: inputTokenLimit/outputTokenLimit) и кэширует лимиты текущей модели на провайдере. Карточка показывает лимиты у ВСЕХ провайдеров (не только Kilo), для отсутствующих — фоновая авто-подгрузка. В форме — кнопка «Загрузить модели провайдера» с выбором модели и её лимитами. Так Gemini и любые новые модели получают лимиты автоматически. Co-Authored-By: Claude Opus 4.8 (1M context) <noreply@anthropic.com>
2026-06-04 21:28:34 +03:00
parent f1f79335ec
commit 6e0a00fd8b
4 changed files with 125 additions and 11 deletions
@@ -17,6 +17,7 @@ router.get('/assistant',              ctrl.getAssistant);
 router.put('/assistant',              ctrl.saveAssistant);
 router.post('/assistant/test',        ctrl.testAssistant);
 router.post('/assistant/reindex',     ctrl.reindexTextbooks);
+router.get('/assistant/models',           ctrl.getProviderModels);
 router.post('/assistant/provider',        ctrl.saveProvider);
 router.delete('/assistant/provider/:id',  requireRole('admin'), ctrl.deleteProvider);
 router.post('/assistant/active',          ctrl.setActiveProvider);