Развертывание Tabby на VPS: создание собственного AI-ассистента …

Розгортання Tabby на VPS: створення власного AI-асистента для кодингу (Self-hosted GitHub Copilot alternative)

TL;DR

У цьому посібнику ми розгорнемо Tabby — сучасну self-hosted альтернативу GitHub Copilot — на виділеному віртуальному сервері. Це дозволить вам отримати потужний інструмент автодоповнення коду на базі великих мовних моделей (LLM), зберігаючи при цьому повний контроль над вашими вихідними кодами та приватністю. Ми налаштуємо Docker-контейнери, забезпечимо безпеку через SSL-шифрування та підключимо асистента до популярних IDE.

Конфіденційність: Ваш код ніколи не покидає ваш сервер.
Економія: Відсутність щомісячних підписок за кожного користувача.
Гнучкість: Можливість вибору моделей (StarCoder, DeepSeek, CodeLlama) під конкретні задачі.
Продуктивність: Оптимізація під CPU та GPU архітектури актуальні в 2026 році.
Інтеграція: Підтримка VS Code, JetBrains, Vim/Neovim через офіційні розширення.

rocket_launch Quick pick

Looking for a server that just works?

Valebyte VPS — NVMe, 24/7 support, deploy in 60 seconds.

View VPS plans arrow_forward

1. Що ми налаштовуємо та навіщо

Програмування в 2026 році немислиме без AI-асистентів. Однак використання хмарних рішень на кшталт GitHub Copilot або ChatGPT пов'язане з ризиками: витік пропрієтарного коду, залежність від стабільності зовнішніх сервісів та постійно зростаюча вартість підписки. Tabby вирішує ці проблеми, пропонуючи open-source движок для запуску LLM (Large Language Models), оптимізованих спеціально для написання коду.

Tabby — це не просто обгортка над моделлю, це повноцінний бекенд, який індексує ваші локальні репозиторії для забезпечення контекстного автодоповнення. Він підтримує сучасні техніки квантування, що дозволяє запускати важкі моделі навіть на споживчому залізі або недорогих VPS без виділених відеокарт (використовуючи тільки CPU та швидкі інструкції AVX-512).

Що ви отримаєте в результаті:

Власний API-сервер, сумісний з протоколами сучасних AI-розширень.
Веб-інтерфейс для управління моделями та моніторингу навантаження.
Повну незалежність від західних хмарних провайдерів.
Можливість донавчання (fine-tuning) моделі на кодовій базі вашої компанії.

2. Який VPS-конфіг потрібен під цю задачу

Вибір заліза для Tabby критично важливий, оскільки робота LLM безпосередньо залежить від швидкості доступу до пам'яті та обчислювальної потужності процесора. У 2026 році стандартом для комфортної роботи є моделі об'ємом від 3B до 7B параметрів у квантованому вигляді (4-bit або 8-bit).

Характеристика	Мінімальні (1 користувач)	Рекомендовані (команда 3-5 осіб)	Максимальні (GPU-прискорення)
CPU	2-4 vCPU (з підтримкою AVX2)	8+ vCPU (Modern AMD/Intel)	4+ vCPU + NVIDIA GPU (8GB+ VRAM)
RAM	8 GB DDR4/DDR5	16-32 GB DDR5	16 GB + VRAM відеокарти
Диск	40 GB NVMe SSD	100 GB NVMe SSD	200 GB NVMe SSD
ОС	Ubuntu 24.04 / 26.04 LTS	Ubuntu 24.04 / 26.04 LTS	Ubuntu + NVIDIA Drivers

Для стабільної роботи без затримок (latency) під час генерації коду вкрай важливо використовувати NVMe накопичувачі, оскільки ваги моделей підвантажуються в пам'ять швидко, але індексація репозиторіїв створює високе навантаження на I/O. Якщо ви плануєте використовувати моделі рівня DeepSeek-Coder-7B, орієнтуйтеся на об'єм оперативної пам'яті не менше 16 ГБ.

Для більшості індивідуальних розробників і невеликих команд оптимальним вибором буде відповідний VPS з 4-8 ядрами і швидким NVMe диском. Якщо ж ваша кодова база обчислюється мільйонами рядків, варто розглянути відповідний dedicated сервер, щоб уникнути "галасливих сусідів" і використовувати всю потужність CPU для інференсу.

Локація сервера: Вибирайте дата-центр з мінімальним пінгом до вашого робочого місця. Затримка в 100-150 мс при кожному натисканні клавіші може зробити використання AI-асистента некомфортним.

3. Підготовка сервера

Після отримання доступу до сервера необхідно виконати базове налаштування безпеки. Ми створимо окремого користувача, налаштуємо брандмауер і оновимо пакети системи.

Підключаємось по SSH:


ssh root@your_server_ip

Оновлюємо систему до актуального стану:


apt update && apt upgrade -y

Створюємо користувача для роботи з Tabby (запуск AI-сервісів від root — погана практика):


adduser tabbyuser
usermod -aG sudo tabbyuser

Налаштовуємо базовий брандмауер (UFW). Нам знадобляться порти 22 (SSH), 80 (HTTP) та 443 (HTTPS):


ufw allow 22/tcp
ufw allow 80/tcp
ufw allow 443/tcp
ufw enable

Встановлюємо часовий пояс та корисні утиліти:


timedatectl set-timezone Europe/Moscow
apt install -y curl git vim htop fail2ban

rocket_launch Quick pick

Looking for a server that just works?

Valebyte VPS — NVMe, 24/7 support, deploy in 60 seconds.

View VPS plans arrow_forward

4. Встановлення Docker та необхідних утиліт

Tabby офіційно розповсюджується у вигляді Docker-образів. Це найбільш стабільний спосіб розгортання, оскільки він ізолює залежності моделей та бібліотеки інференсу.

Встановлюємо Docker через офіційний скрипт:


curl -fsSL https://get.docker.com -o get-docker.sh
sudo sh get-docker.sh

Додаємо нашого користувача до групи docker, щоб не використовувати sudo постійно:


sudo usermod -aG docker tabbyuser

Важливо: Перезайдіть в термінал (logout/login), щоб права застосувалися.

Перевіряємо працездатність:


docker --version && docker compose version

5. Розгортання Tabby: покрокова установка

Ми будемо використовувати Docker Compose для управління контейнером Tabby. Це дозволить легко оновлювати модель та зберігати конфігурацію.

Створюємо директорію для проекту:


mkdir ~/tabby-server && cd ~/tabby-server

Створюємо файл docker-compose.yml. У даному прикладі ми використовуємо конфігурацію для CPU-інференсу, яка підходить для більшості VPS. Ми виберемо модель StarCoder2-3B, яка відмінно збалансована за швидкістю та якістю.


cat < docker-compose.yml
version: '3.8'

services:
  tabby:
    image: tabbyml/tabby:latest
    container_name: tabby
    restart: always
    ports:
      - "8080:8080"
    volumes:
      - ./data:/data
    command: serve --model StarCoder2-3B --device cpu
EOF

Розберемо параметри команди запуску:

--model StarCoder2-3B: Вказує Tabby автоматично завантажити та використовувати цю модель.
--device cpu: Явна вказівка використовувати центральний процесор. Якщо у вас є GPU, замініть на cuda.
--port 8080: Внутрішній порт сервера.

Запускаємо сервер (перший запуск займе час, оскільки скачується образ та ваги моделі — близько 2-5 ГБ):


docker compose up -d

Перевірити статус завантаження моделі можна через логи:


docker compose logs -f

Коли ви побачите повідомлення Listening at 0.0.0.0:8080, сервер готовий до роботи.

6. Конфігурація: домен, SSL та безпека

Відкривати порт 8080 безпосередньо в інтернет небезпечно. Ми налаштуємо реверс-проксі за допомогою Caddy. Caddy автоматично отримає SSL-сертифікати від Let's Encrypt та налаштує HTTPS.

Створюємо Caddyfile у тій самій директорії:


cat < Caddyfile
ai.yourdomain.com {
    reverse_proxy tabby:8080
    
    header {
        Strict-Transport-Security max-age=31536000
    }
}
EOF

Замініть ai.yourdomain.com на ваш реальний домен або піддомен.

Оновимо docker-compose.yml, додавши сервіс Caddy:


cat < docker-compose.yml
version: '3.8'

services:
  tabby:
    image: tabbyml/tabby:latest
    container_name: tabby
    restart: always
    volumes:
      - ./data:/data
    command: serve --model StarCoder2-3B --device cpu

  caddy:
    image: caddy:latest
    container_name: caddy
    restart: always
    ports:
      - "80:80"
      - "443:443"
    volumes:
      - ./Caddyfile:/etc/caddy/Caddyfile
      - caddy_data:/data
      - caddy_config:/config
    depends_on:
      - tabby

volumes:
  caddy_data:
  caddy_config:
EOF

Перезапускаємо стек:


docker compose up -d

Тепер ваш AI-асистент доступний за захищеним протоколом HTTPS. Перейдіть у браузері на https://ai.yourdomain.com. При першому вході Tabby запропонує створити аккаунт адміністратора. Це критично важливо для захисту вашого API від несанкціонованого доступу.

rocket_launch Quick pick

Looking for a server that just works?

Valebyte VPS — NVMe, 24/7 support, deploy in 60 seconds.

View VPS plans arrow_forward

7. Налаштування IDE (VS Code та JetBrains)

Після того, як сервер запущено, його потрібно підключити до вашого редактора коду. Tabby має офіційні розширення для більшості популярних інструментів.

Visual Studio Code

Відкрийте Extensions (Ctrl+Shift+X).
Знайдіть та встановіть розширення Tabby.
Натисніть на іконку Tabby в статус-барі (внизу справа).
В полі Server Endpoint введіть https://ai.yourdomain.com.
Якщо ви налаштували авторизацію, введіть ваш API Token (його можна знайти у веб-інтерфейсі Tabby в розділі Settings -> Auth).

JetBrains (IntelliJ IDEA, PyCharm, WebStorm)

Settings -> Plugins -> Marketplace.
Встановіть плагін Tabby.
Settings -> Tools -> Tabby.
Вкажіть адресу вашого сервера та API ключ.

Перевірка: Почніть писати функцію, наприклад def get_weather(city):. За секунду Tabby повинен запропонувати сірим текстом продовження коду. Натисніть Tab для прийняття пропозиції.

8. Бекапи та обслуговування

AI-сервер потребує регулярного догляду. Основні дані Tabby зберігаються в папці ./data, яку ми примонтували в контейнер. Там знаходяться індекси ваших репозиторіїв, налаштування користувачів та завантажені моделі.

Що потрібно бекапити:

Файл docker-compose.yml та Caddyfile.
Директорію ./data/config (там лежать токени та налаштування).
Базу даних SQLite (зазвичай ./data/tabby.db).

Простий скрипт для щоденного бекапу в локальну папку:


#!/bin/bash
BACKUP_DIR="/home/tabbyuser/backups"
TIMESTAMP=$(date +"%Y%m%d_%H%M%S")
mkdir -p $BACKUP_DIR

# Останавливаем контейнер для консистентности БД
cd /home/tabbyuser/tabby-server
docker compose stop

# Создаем архив
tar -czf $BACKUP_DIR/tabby_backup_$TIMESTAMP.tar.gz ./data Caddyfile docker-compose.yml

# Запускаем обратно
docker compose start

# Удаляем бэкапы старше 7 дней
find $BACKUP_DIR -type f -mtime +7 -name ".gz" -delete

Додайте цей скрипт в crontab -e для автоматизації:

0 3 /home/tabbyuser/tabby-server/backup.sh

Оновлення Tabby: Розробники часто випускають оновлення з оптимізаціями. Щоб оновитися, виконайте:

docker compose pull docker compose up -d

9. Troubleshooting + FAQ

Чому генерація коду відбувається занадто повільно?

Основна причина — нестача потужностей CPU або відсутність підтримки інструкцій AVX-512. Переконайтеся, що ваш VPS не перевантажений іншими процесами. Також спробуйте змінити модель на більш легку, наприклад, з 7B на 1.1B або 3B. Якщо ви використовуєте Docker, переконайтеся, що ви не обмежили ресурси контейнера в конфігу.

Помилка "Out of Memory" (OOM) під час запуску

Моделі LLM завантажуються цілком в RAM. Модель 7B в квантуванні 4-bit вимагає близько 5-6 ГБ вільної пам'яті + запас для роботи самої системи. Якщо у вас 8 ГБ RAM, закрийте зайві сервіси або додайте Swap-файл (хоча це сильно сповільнить роботу).

Як підключити свої приватні репозиторії для контексту?

У веб-інтерфейсі Tabby перейдіть в розділ "Repositories". Ви можете додати посилання на Git-репозиторії. Tabby склонує їх локально та проіндексує. Після цього асистент буде знати про ваші внутрішні бібліотеки та стилістику коду.

Який VPS-конфіг мінімально підійде?

Для мінімально комфортної роботи (модель 1.1B або 3B) достатньо 4 ГБ ОЗУ та 2 ядра CPU. Однак для професійної розробки ми наполегливо рекомендуємо починати з 8-16 ГБ ОЗУ, оскільки це дозволить використовувати більш "розумні" моделі рівня DeepSeek-Coder.

Що вибрати — VPS або dedicated для цієї задачі?

Якщо ви працюєте один — якісного VPS буде достатньо. Якщо ви розгортаєте Tabby на команду з 10+ людей, краще взяти dedicated сервер. LLM-інференс — це CPU-інтенсивна задача, і на VPS ви можете зіткнутися з деградацією продуктивності через сусідів по гіпервізору.

Чи безпечно зберігати код в Tabby?

Так, це одна з головних причин переходу на self-hosted. Весь код зберігається в Docker-волюмі на вашому сервері. Якщо ви налаштували HTTPS та складний пароль адміністратора, доступ до даних буде тільки у вас. Tabby не відправляє телеметрію з вашим кодом на зовнішні сервери.

Tabby не пропонує варіанти коду в IDE, що робити?

Перевірте: 1. Статус сервера (повинен бути Online). 2. Правильність API ключа. 3. Логи контейнера (docker logs tabby) — чи немає там помилок аутентифікації або проблем з завантаженням моделі. 4. Брандмауер — чи дозволено доступ до порту 443.

rocket_launch Quick pick

Looking for a server that just works?

Valebyte VPS — NVMe, 24/7 support, deploy in 60 seconds.

View VPS plans arrow_forward
10. Висновки та наступні кроки

Схема: 10. Висновки та наступні кроки

Ми успішно розгорнули власний AI-асистент Tabby на VPS, забезпечивши приватність та високу швидкість роботи. Тепер у вас є потужний інструмент, який не залежить від підписок та зовнішніх API. Це фундамент для створення по-справжньому ефективного середовища розробки.

Що робити далі:

Експериментуйте з моделями: Спробуйте DeepSeek-Coder-6.7B-Instruct, якщо ресурси сервера дозволяють — вона вважається однією з найкращих у 2026 році для Python та JS.

Налаштуйте індексацію: Додайте всі основні проекти вашої компанії в Tabby, щоб він пропонував код, що враховує вашу специфіку.

Моніторинг: Встановіть Prometheus та Grafana для відстеження навантаження на CPU та часу відгуку (latency) вашого AI-сервера.

Self-hosting AI — це не тільки про економію, але й про цифрову гігієну. У світі, де код є головним активом компанії, контроль над інструментами його написання стає стратегічною перевагою.