Перейти к содержанию

Мониторинг

Автоматически сгенерировано: 2026-03-03 09:38

Компоненты мониторинга

Компонент URL Назначение
Prometheus http://mon.b2g.kz:9090 Сбор и хранение метрик
Grafana https://mon.b2g.kz Визуализация метрик
Telegram @callbox_docs_bot Уведомления об ошибках

Схема мониторинга

┌─────────────────────────────────────────────┐
│  Node Exporter (на всех серверах :9100)    │
│  - lb-1, lb-2, web-1, web-2, db-1, db-2    │
│  - redis-1, voip-1, voip-2, mon-1          │
└──────────────────┬──────────────────────────┘
                   │ scrape every 15s
                   ▼
         ┌─────────────────┐
         │   Prometheus    │
         │   mon-1:9090    │
         └────────┬────────┘
                  │ query
                  ▼
         ┌─────────────────┐
         │    Grafana      │
         │   mon-1:3000    │
         │ mon.b2g.kz      │
         └─────────────────┘

Метрики

System Metrics (Node Exporter)

  • CPU usage
  • Memory usage
  • Disk I/O
  • Network traffic
  • Disk space
  • System load

Application Metrics

  • HTTP request rate
  • Response time
  • Error rate
  • Active connections

Алерты

Настроенные алерты (если есть):

  • High CPU usage (>80% за 5 минут)
  • High memory usage (>90%)
  • Disk space low (<10%)
  • Service down
  • PostgreSQL replica lag

Быстрый доступ

# Prometheus
ssh -L 9090:localhost:9090 mon-1
# Открыть http://localhost:9090

# Grafana
ssh -L 3000:localhost:3000 mon-1
# Открыть http://localhost:3000

# Отправить тестовое уведомление в Telegram
ssh mon-1 '/opt/scripts/telegram-notify.sh "Test notification"'