feat(assistant): «Спроси» через бесплатную LLM (Groq по умолчанию), грунтовка по FAQ
ask() умеет вызывать OpenAI-совместимую модель: топ-FAQ как контекст, краткий ответ на русском (source:'model'), таймаут 12с, при ошибке/без ключа — мягкий откат на FAQ. Конфиг через ENV (ASSISTANT_LLM_URL/KEY/MODEL): дефолт — Groq (бесплатный ключ), поддержан и локальный Ollama без ключа. Фронт показывает ответ модели сверху, FAQ и поиск по платформе — ниже. .env.example дополнен. Co-Authored-By: Claude Opus 4.8 (1M context) <noreply@anthropic.com>
This commit is contained in:
@@ -13,3 +13,14 @@ CLIENT_ORIGIN=http://localhost:5500
|
||||
# TURN_URL=turn:turn.example.com:3478
|
||||
# TURN_USER=username
|
||||
# TURN_PASS=password
|
||||
|
||||
# Помощник «Квантик» — LLM для «Спроси» (необязательно).
|
||||
# Бесплатно и подходит: Groq — заведи ключ на console.groq.com → API Keys,
|
||||
# вставь в ASSISTANT_LLM_KEY и перезапусти сервер. Без ключа «Спроси» работает
|
||||
# на FAQ + поиске по платформе (как сейчас).
|
||||
# ASSISTANT_LLM_URL=https://api.groq.com/openai/v1/chat/completions
|
||||
ASSISTANT_LLM_KEY=
|
||||
# ASSISTANT_LLM_MODEL=llama-3.3-70b-versatile
|
||||
# Локально без ключа (Ollama): `ollama serve` + `ollama pull qwen2.5:3b`, затем
|
||||
# ASSISTANT_LLM_URL=http://localhost:11434/v1/chat/completions
|
||||
# ASSISTANT_LLM_MODEL=qwen2.5:3b
|
||||
|
||||
Reference in New Issue
Block a user