feat(assistant): «Спроси» через бесплатную LLM (Groq по умолчанию), грунтовка по FAQ

ask() умеет вызывать OpenAI-совместимую модель: топ-FAQ как контекст, краткий
ответ на русском (source:'model'), таймаут 12с, при ошибке/без ключа — мягкий
откат на FAQ. Конфиг через ENV (ASSISTANT_LLM_URL/KEY/MODEL): дефолт — Groq
(бесплатный ключ), поддержан и локальный Ollama без ключа. Фронт показывает
ответ модели сверху, FAQ и поиск по платформе — ниже. .env.example дополнен.

Co-Authored-By: Claude Opus 4.8 (1M context) <noreply@anthropic.com>
This commit is contained in:
Maxim Dolgolyov
2026-06-04 17:22:32 +03:00
parent e1cde834d0
commit 9dbc0443af
3 changed files with 73 additions and 17 deletions
+11
View File
@@ -13,3 +13,14 @@ CLIENT_ORIGIN=http://localhost:5500
# TURN_URL=turn:turn.example.com:3478
# TURN_USER=username
# TURN_PASS=password
# Помощник «Квантик» — LLM для «Спроси» (необязательно).
# Бесплатно и подходит: Groq — заведи ключ на console.groq.com → API Keys,
# вставь в ASSISTANT_LLM_KEY и перезапусти сервер. Без ключа «Спроси» работает
# на FAQ + поиске по платформе (как сейчас).
# ASSISTANT_LLM_URL=https://api.groq.com/openai/v1/chat/completions
ASSISTANT_LLM_KEY=
# ASSISTANT_LLM_MODEL=llama-3.3-70b-versatile
# Локально без ключа (Ollama): `ollama serve` + `ollama pull qwen2.5:3b`, затем
# ASSISTANT_LLM_URL=http://localhost:11434/v1/chat/completions
# ASSISTANT_LLM_MODEL=qwen2.5:3b