feat(assistant): «Спроси» через бесплатную LLM (Groq по умолчанию), грунтовка по FAQ

ask() умеет вызывать OpenAI-совместимую модель: топ-FAQ как контекст, краткий ответ на русском (source:'model'), таймаут 12с, при ошибке/без ключа — мягкий откат на FAQ. Конфиг через ENV (ASSISTANT_LLM_URL/KEY/MODEL): дефолт — Groq (бесплатный ключ), поддержан и локальный Ollama без ключа. Фронт показывает ответ модели сверху, FAQ и поиск по платформе — ниже. .env.example дополнен. Co-Authored-By: Claude Opus 4.8 (1M context) <noreply@anthropic.com>
2026-06-04 17:22:32 +03:00
parent e1cde834d0
commit 9dbc0443af
3 changed files with 73 additions and 17 deletions
@@ -13,3 +13,14 @@ CLIENT_ORIGIN=http://localhost:5500
 # TURN_URL=turn:turn.example.com:3478
 # TURN_USER=username
 # TURN_PASS=password
+
+# Помощник «Квантик» — LLM для «Спроси» (необязательно).
+# Бесплатно и подходит: Groq — заведи ключ на console.groq.com → API Keys,
+# вставь в ASSISTANT_LLM_KEY и перезапусти сервер. Без ключа «Спроси» работает
+# на FAQ + поиске по платформе (как сейчас).
+# ASSISTANT_LLM_URL=https://api.groq.com/openai/v1/chat/completions
+ASSISTANT_LLM_KEY=
+# ASSISTANT_LLM_MODEL=llama-3.3-70b-versatile
+# Локально без ключа (Ollama): `ollama serve` + `ollama pull qwen2.5:3b`, затем
+#   ASSISTANT_LLM_URL=http://localhost:11434/v1/chat/completions
+#   ASSISTANT_LLM_MODEL=qwen2.5:3b