Nagios XI i Proxmox VE – idealne połączenie do monitorowania homelabu i środowisk produkcyjnych
Monitorowanie infrastruktury IT jest obecnie jednym z najważniejszych elementów utrzymania serwerów, usług i maszyn wirtualnych. Nawet najlepiej skonfigurowany serwer Proxmox VE może ulec awarii, zabraknąć mu miejsca na dysku lub pamięci RAM, a administrator dowie się o problemie dopiero wtedy, gdy użytkownicy zaczną zgłaszać niedostępność usług.
Właśnie dlatego warto wdrożyć system monitoringu. Jednym z najbardziej rozbudowanych rozwiązań dostępnych na rynku jest Nagios XI.
W tym poradniku pokażę:
- czym jest Nagios XI,
- jakie ograniczenia ma wersja Free,
- jak zainstalować Nagios XI,
- jak skonfigurować monitorowanie Proxmox VE,
- jak utworzyć token API,
- jakie metryki warto monitorować
Czym jest Nagios XI?
Nagios XI to komercyjna nakładka na popularny Nagios Core oferująca:
- nowoczesny interfejs WWW,
- kreatory konfiguracji,
- automatyczne wykrywanie hostów,
- raporty SLA,
- dashboardy,
- alerty e-mail i SMS,
- monitorowanie serwerów Linux i Windows,
- monitorowanie maszyn wirtualnych,
- monitorowanie urządzeń sieciowych.
W przeciwieństwie do Nagios Core większość konfiguracji odbywa się przez interfejs WWW.
Czy istnieje darmowa wersja Nagios XI?
Tak.
Nagios XI posiada wersję Free Edition umożliwiającą monitorowanie maksymalnie:
- 7 hostów
lub
- 7 urządzeń sieciowych
Jest to wystarczające dla:
- homelabów,
- małych firm,
- środowisk testowych,
- laboratoriów szkoleniowych.
Po przekroczeniu limitu konieczny jest zakup licencji.
Dlaczego monitorować Proxmox VE?
Proxmox VE jest obecnie jedną z najpopularniejszych platform do wirtualizacji typu open source.
Umożliwia uruchamianie:
- maszyn KVM,
- kontenerów LXC,
- klastrów HA,
- replikacji,
- backupów.
Brak monitoringu może doprowadzić do:
- przepełnienia storage,
- przeciążenia CPU,
- wykorzystania całej pamięci RAM,
- awarii backupów,
- problemów klastra.
Nagios XI pozwala wykrywać te problemy zanim wpłyną na działanie usług.
Wymagania dla Nagios XI
Minimalne:
| Komponent | Wartość |
|---|---|
| CPU | 2 vCPU |
| RAM | 4 GB |
| Dysk | 40 GB |
| System | Debian, Ubuntu, RHEL |
Rekomendowane:
| Komponent | Wartość |
|---|---|
| CPU | 4 vCPU |
| RAM | 8 GB |
| Dysk | 120 GB SSD |
Instalacja Nagios XI
Najprostszą metodą jest instalacja na świeżym Ubuntu Server.
Aktualizacja systemu:
apt update && apt upgrade -y
Pobranie instalatora:
cd /root
wget https://assets.nagios.com/downloads/nagiosxi/xi-latest.tar.gz

Rozpakowanie:
tar xzf xi-latest.tar.gz

Przejście do katalogu:
cd nagiosxi
Uruchomienie instalacji:
./fullinstall

Proces trwa zwykle od 10 do 30 minut.
Po zakończeniu zobaczysz adres panelu WWW.

Przykład:
http://192.168.1.72/nagiosxi
Pierwsze logowanie
Po wejściu do panelu:
- Ustaw strefę czasową.
- Wybierz język.
- Skonfiguruj HTTPS.
- Utwórz konto administratora.
- Zaloguj się do panelu.


Instalacja biblioteki Proxmoxer
Kliknij na koło zębate i kliknij Configuration Wizard

Wyszukaj Promox VE

Kreator monitorowania Proxmox wykorzystuje bibliotekę Python Proxmoxer.
Instalacja na serwerze Nagios:
pip3 install proxmoxer --break-system-packages


Tworzenie tokenu API w Proxmox VE
Logujemy się do panelu Proxmox.
Przechodzimy:
Datacenter
→ Permissions
→ API Tokens
Klikamy:
Add
Przykład:
User:
monitoring@pve
Token ID:
nagios
Generujemy token.
Otrzymamy:
monitoring@pve!nagios
oraz Secret.
Zapisz Secret ponieważ później nie będzie widoczny.
Nadawanie uprawnień tokenowi
Przechodzimy:
Datacenter
→ Permissions
→ Add
Dodajemy rolę:
PVEAuditor
Uprawnienia:
Path: /
Dzięki temu Nagios będzie miał dostęp wyłącznie do odczytu.
Konfiguracja połączenia
Wprowadzamy:
Hostname/IP:
192.168.1.100
Port:
8006
Authentication:
API Token
Format:
monitoring@pve!nagios=SECRET
Lub Username/Password
root@pam
Twoje_hasło
Klikamy:
Test Connection
Jeżeli wszystko działa:
Connection Successful
Klikamy Next
Przykład Authentication: Username/Password

Jakie metryki monitorować?
CPU
Pozwala wykrywać przeciążenie hosta.
Progi:
Warning:
80%
Critical:
95%
Memory – RAM
Pozwala wykryć wyczerpywanie pamięci.
Progi:
Warning:
80%
Critical:
95%
Storage Threshold Configuration
Najczęstsza przyczyna problemów w Proxmox.
Progi:
Warning:
80%
Critical:
95%

Status klastra
Monitorowanie:
- quorum,
- węzłów,
- synchronizacji.
Szczególnie ważne przy klastrach HA.
Backupy
Nagios może monitorować:
- nieudane backupy,
- błędy harmonogramów,
- brak wykonania backupu.
Logi
Możliwe jest monitorowanie:
- błędów storage,
- błędów sieci,
- problemów klastra.
Nie należy ustawiać zbyt dużego czasu przeszukiwania logów, ponieważ zwiększa to obciążenie serwera.
Monitorowanie maszyn wirtualnych
Każda maszyna zostanie dodana jako osobny host.
Można monitorować:
- stan VM,
- CPU,
- RAM,
- dyski,
- dostępność sieciową.
Przykład:
Ubuntu-Server
Windows-Server
HomeAssistant
Vaultwarden
Każda VM otrzyma własny dashboard i historię zdarzeń.
Najlepsze praktyki
Utwórz osobnego użytkownika monitoringu
Nigdy nie używaj konta root.
Przykład:
monitoring@pve
Używaj API Tokenów
Tokeny są bezpieczniejsze niż hasła.
Monitoruj backupy
Wielu administratorów monitoruje tylko dostępność hosta.
Największe straty zwykle wynikają jednak z nieudanych kopii zapasowych.
Ustaw alerty dla storage
Przepełniony storage jest jedną z najczęstszych przyczyn awarii środowisk Proxmox.
Nagios XI kontra Zabbix
| Funkcja | Nagios XI | Zabbix |
|---|---|---|
| Łatwość konfiguracji | Bardzo wysoka | Średnia |
| Kreatory | Tak | Nie |
| Monitoring Proxmox | Tak | Tak |
| Dashboardy | Tak | Tak |
| Alerty | Tak | Tak |
| Koszt | Płatny powyżej 7 hostów | Darmowy |
Dla początkujących administratorów Nagios XI jest zwykle prostszy w konfiguracji.
Podsumowanie
Połączenie Nagios XI i Proxmox VE pozwala stworzyć profesjonalny system monitoringu infrastruktury wirtualnej. Dzięki wykorzystaniu API Proxmox administrator może monitorować nie tylko sam host, ale również klastry, backupy, storage oraz każdą maszynę wirtualną i kontener LXC.
Dla homelabów oraz małych środowisk testowych darmowa wersja Nagios XI jest często całkowicie wystarczająca. Wdrożenie monitoringu zajmuje zwykle mniej niż godzinę, a korzyści w postaci szybszego wykrywania awarii i lepszej kontroli nad infrastrukturą są ogromne.

