feat(assistant): уведомление о failover в админке

callLLMFailover пишет состояние в app_settings.assistant_failover: какой провайдер
исчерпан и каким подхвачено (или «все недоступны»); при успехе активного флаг
снимается. Админ-раздел показывает баннер «Провайдер X недоступен — работаю на Y».

Co-Authored-By: Claude Opus 4.8 (1M context) <noreply@anthropic.com>
This commit is contained in:
Maxim Dolgolyov
2026-06-04 20:27:29 +03:00
parent e2bff24b5b
commit aac1240658
3 changed files with 36 additions and 6 deletions
+3 -1
View File
@@ -921,10 +921,12 @@ function getAssistant(_req, res) {
if (f) { feedback.up = f.up; feedback.down = f.down; }
feedback.recent = db.prepare("SELECT q, created_at FROM assistant_feedback WHERE rating=-1 AND q IS NOT NULL AND q <> '' ORDER BY id DESC LIMIT 5").all();
} catch (e) {}
let failover = null;
try { var fv = _aset('assistant_failover'); if (fv) failover = JSON.parse(fv); } catch (e) {}
res.json({
providers, activeId, active,
rag: _aset('assistant_rag') !== '0', examButtons: _aset('assistant_exam_buttons') === '1',
chunks, usage, usage30, feedback, presets: ASSISTANT_PRESETS,
chunks, usage, usage30, feedback, failover, presets: ASSISTANT_PRESETS,
});
}
+19 -5
View File
@@ -317,15 +317,29 @@ async function callLLM(messages, maxTokens, override) {
/* Перебор провайдеров: активный, затем остальные — при лимите/сетевой ошибке.
* Останавливаемся на успехе или на «контентной» неудаче (пустой ответ). */
const _RETRYABLE = { rate_limit: 1, http: 1, timeout: 1, network: 1 };
function _recordFailover(failed, served, reason) {
try {
db.prepare("INSERT OR REPLACE INTO app_settings (key, value) VALUES ('assistant_failover', ?)")
.run(JSON.stringify({ at: new Date().toISOString(), failedId: failed && failed.id, failedName: failed && failed.name, servedId: served && served.id, servedName: served && served.name, reason: reason || 'error' }));
} catch (e) {}
}
function _clearFailover() { try { db.prepare("DELETE FROM app_settings WHERE key = 'assistant_failover'").run(); } catch (e) {} }
async function callLLMFailover(messages, maxTokens) {
const cfgs = providersOrdered();
if (!cfgs.length) return { text: null, error: 'off' };
let last = { text: null, error: 'off' };
for (const c of cfgs) {
last = await callLLM(messages, maxTokens, c);
if (last.text) return last;
if (!_RETRYABLE[last.error]) break; // не лимит/сеть — нет смысла пробовать другие
let last = { text: null, error: 'off' }, firstErr = null;
for (let i = 0; i < cfgs.length; i++) {
last = await callLLM(messages, maxTokens, cfgs[i]);
if (i === 0) firstErr = last.error;
if (last.text) {
if (i === 0) _clearFailover(); // активный работает — снимаем флаг
else _recordFailover(cfgs[0], cfgs[i], firstErr); // активный упал → выручил запасной
return last;
}
if (!_RETRYABLE[last.error]) break; // не лимит/сеть — нет смысла пробовать других
}
if (cfgs.length && _RETRYABLE[firstErr]) _recordFailover(cfgs[0], null, firstErr); // все недоступны
return last;
}