Commit Graph

8 Commits

Author SHA1 Message Date
Maxim Dolgolyov 6e0a00fd8b feat(assistant): авто-получение лимитов моделей для любого провайдера
Новый GET /admin/assistant/models: тянет список моделей провайдера с лимитами
(OpenAI-совместимый /models: context_length+max_completion_tokens+pricing;
нативный Google generativelanguage: inputTokenLimit/outputTokenLimit) и кэширует
лимиты текущей модели на провайдере. Карточка показывает лимиты у ВСЕХ провайдеров
(не только Kilo), для отсутствующих — фоновая авто-подгрузка. В форме — кнопка
«Загрузить модели провайдера» с выбором модели и её лимитами. Так Gemini и любые
новые модели получают лимиты автоматически.

Co-Authored-By: Claude Opus 4.8 (1M context) <noreply@anthropic.com>
2026-06-04 21:28:34 +03:00
Maxim Dolgolyov f1f79335ec fix(assistant): длинные формулы не обрезаются + лимиты моделей в админке
Рендер ответа: display-формулы KaTeX прокручиваются по горизонтали
(overflow-x:auto), пузырь ассистента во всю ширину, панель шире (380px) —
длинные выражения больше не режутся по правому краю.

Админка: к моделям Kilo добавлены ctx/out (из /models); на карточке Kilo
показывается «контекст N · ответ до M токенов · бесплатно».

Co-Authored-By: Claude Opus 4.8 (1M context) <noreply@anthropic.com>
2026-06-04 21:18:50 +03:00
Maxim Dolgolyov 78a9eca9c0 fix(assistant): снятие устаревшего флага failover + чистый sample в тесте
Баннер «провайдеры недоступны» висел из старой записи assistant_failover.
Теперь успешный тест активного провайдера и смена активного снимают флаг,
плюс кнопка «Снять» на баннере (PUT /assistant {dismissFailover}).
Тест провайдера: system-инструкция + 64 токена + fallback на reasoning →
sample не показывает «мысли вслух» reasoning-моделей.

Co-Authored-By: Claude Opus 4.8 (1M context) <noreply@anthropic.com>
2026-06-04 21:06:31 +03:00
Maxim Dolgolyov f748e074fd feat(assistant): форма добавления провайдера свёрнута по умолчанию
Раскрывается кнопкой «+ Добавить провайдера» (и автоматически при «Изм.»),
сворачивается после сохранения/отмены. Окно компактнее в обычном режиме.

Co-Authored-By: Claude Opus 4.8 (1M context) <noreply@anthropic.com>
2026-06-04 20:58:14 +03:00
Maxim Dolgolyov 0e08e5775d feat(assistant): красивый интерактивный модуль провайдеров + модели Kilo
Админ-раздел переделан: провайдеры — карточки (активный подсвечен, бейджи
ключ/активен, кнопки Сделать активным/Тест/Изменить/Удалить, hover-подъём).
Форма с лейблами и пресетами. Для Kilo — выпадающий список проверенных бесплатных
моделей (Nemotron 550B / Owl Alpha / Nemotron Nano 30B / Laguna XS) и инлайн-
переключатель модели прямо на карточке. Бэкенд: пресет Kilo + kiloModels в /admin/assistant.

Co-Authored-By: Claude Opus 4.8 (1M context) <noreply@anthropic.com>
2026-06-04 20:47:28 +03:00
Maxim Dolgolyov aac1240658 feat(assistant): уведомление о failover в админке
callLLMFailover пишет состояние в app_settings.assistant_failover: какой провайдер
исчерпан и каким подхвачено (или «все недоступны»); при успехе активного флаг
снимается. Админ-раздел показывает баннер «Провайдер X недоступен — работаю на Y».

Co-Authored-By: Claude Opus 4.8 (1M context) <noreply@anthropic.com>
2026-06-04 20:27:29 +03:00
Maxim Dolgolyov e2bff24b5b feat(assistant): несколько провайдеров ИИ + выбор активного + авто-перехват при лимите
Конфиг стал списком провайдеров (assistant_providers) + активный (assistant_active).
llmConfig берёт активного; providersOrdered — активный первым, затем остальные с
ключом; callLLMFailover перебирает их при 429/сетевой ошибке (второй ключ подхватывает
при исчерпании квоты). Legacy мигрируется в список. Админ-раздел: список провайдеров
(радио-активный, Тест/Изменить/Удалить) + форма с пресетами. Эндпоинты
POST/DELETE /admin/assistant/provider(/:id), POST /admin/assistant/active.

Co-Authored-By: Claude Opus 4.8 (1M context) <noreply@anthropic.com>
2026-06-04 20:21:06 +03:00
Maxim Dolgolyov 78300845ed feat(assistant): чёткий ответ при лимите ИИ (память не теряется), напоминание о памяти, отдельный раздел в админке
- Баг «не помнит»: на самом деле free-лимит Gemini (429). callLLM теперь
  возвращает ошибку; при 429 показываем «много запросов, подожди минутку —
  память не потеряется» и НЕ ломаем историю (убираем неудачный вопрос); при
  сбое — «не получилось, попробуй позже». Раньше показывалось «не нашёл ответ».
- В окне «Спроси» — пояснение, сколько помнит Квантик (≈6 реплик, рабочая память).
- Окна красивее: шире, аватар Квантика в шапке, мягкая анимация.
- Управление помощником вынесено в отдельный раздел админки «Помощник Квантик»
  (системный вкл/выкл + модель/ключ/тест/RAG/кнопки экзамена/статистика/качество);
  из раздела «Игры» конфиг убран.

Co-Authored-By: Claude Opus 4.8 (1M context) <noreply@anthropic.com>
2026-06-04 20:03:02 +03:00