sadium/content/posts/nextcloud_x_litellm_x_ollama.md at 4bd2efc12b70e74c9761f10ca3c4d001181cfc58

SadmL/sadium

Fork 0

Артём 4bd2efc12b

/ site (push) Successful in 1s

Details

статья "Nextcloud Assistant ← LiteLLM ← Ollama"

2024-07-20 14:10:21 +03:00

4.5 KiB

Raw Blame History

title

date

author

tags

description

showFullContent

readingTime

hideComments

Nextcloud Assistant ← LiteLLM ← Ollama

2024-07-19

Сисадмин Линк

nextcloud

litellm

ollama

Настройка локального ИИ для Nextcloud Assistant через прослойку LiteLLM

false

Опять же, как было в случае с принтером, у меня Arch-based дистрибутив, поэтому буду расписывать по нему.

Начнём с установки Ollama. У меня карточка от красных, поэтому я ставлю версию rocm.

yay -S ollama-rocm

или

sudo pacman -S ollama-rocm

Как в моём случае, почему-то оно не подхватывало мою RX 6700 XT (но тут нашлось решение), поэтому мне пришлось редактировать сервис systemd следующим образом:

sudo systemctl edit --full ollama

[Unit]
Description=Ollama Service
Wants=network-online.target
After=network.target network-online.target

[Service]
ExecStart=/usr/bin/ollama serve
WorkingDirectory=/var/lib/ollama
Environment="HOME=/var/lib/ollama"
Environment="HSA_OVERRIDE_GFX_VERSION=10.3.0" # Добавлено, чтобы увидело карточку
Environment="OLLAMA_HOST=0.0.0.0" # Возможность локально подключатся извне
User=ollama
Group=ollama
Restart=on-failure
RestartSec=3
Type=simple
PrivateTmp=yes
ProtectSystem=full
ProtectHome=yes

[Install]
WantedBy=multi-user.target

Далее устанавливаем желаемую модель, в моём случае это llama3 и qwen2

ollama pull llama3

ollama pull qwen2

Далее идём ставить LiteLLM. Это прослойка между Ollama и Nextcloud LocalAI, которая использует запросы в формате OpenAI API.

pipx install 'litellm[proxy]'

Нам нужна именно litellm[proxy], а не просто litellm!

Теперь нужно собственно, запустить модель, с которой впоследствии мы будем общаться через Nextcloud Assistant, я буду использовать qwen2.
Для этого я сделал systemd сервис, чтобы не запускать это дело ручками, он должен располагаться в

/home/ваш_пользователь/.config/systemd/user/litellm.service

[Unit]
Description=LiteLLM for Ollama

[Service]
ExecStart=/home/ваш_пользователь/.local/bin/litellm --model ollama/qwen2
Restart=on-failure
RestartSec=5s

[Install]
WantedBy=default.target

systemctl --user daemon-reload
systemctl --user enable --now litellm

Теперь идём в настройки сервера Искусственный интеллект [/settings/admin/ai], предварительно установив Nextcloud Assistant и OpenAI and LocalAI integration, листаем ниже до OpenAI и локальная интеграция.

Service URL - ip_пк:4000
Service Name (optional) - LiteLLM (или другое, какое хотите)

API key - не нужен
Default completion model to use - выбираем ollama/ваша_модель (openai) 
Max new tokens per request - я поставил 17500, но это уже индивидуально

Select enabled features 
отключил:
Image generation provider 
Speech-to-text
потому что модель такое не умеет

Я не знаю, как запустить несколько моделей параллельно, поэтому мне приходится редактировать и перезапускать мой systemd сервис, чтобы менять модель. Если вы знаете как это сделать - напишите мне.

Статья написана без использования ИИ. Хотя, наверное, это и так видно 🙃

4.5 KiB Raw Blame History Unescape Escape

4.5 KiB

Raw Blame History