Monitoring & Health
Мониторинг агентов и метрики здоровья
Обзор
FlowLink tracks agent health metrics: CPU, RAM, Disk usage, and overall status (healthy/degraded/critical). Timeseries data enables dashboard building and anomaly detection.
Пороги статуса здоровья
| Status | CPU | Память | Disk |
|---|---|---|---|
| Healthy | 0-50% | 0-70% | 0-70% |
| Degraded | 50-75% | 70-85% | 70-85% |
| Critical | >75% | >85% | >85% |
API эндпоинты
bash
# Get agent health metrics
GET /api/v1/agents/{id}/health
# Get timeseries data
GET /api/v1/agents/{id}/health/timeseries?from=2026-04-21T00:00:00Z&to=2026-04-22T00:00:00Z
# Get health overview for all agents
GET /api/v1/agents/health/overviewСтруктура метрик здоровья
bash
{
"agent_id": "prod-db-01",
"status": "healthy",
"cpu": { "usage_percent": 42.5, "load_avg": 1.2 },
"memory": { "usage_percent": 65.3, "total_mb": 16384, "used_mb": 10701 },
"disk": { "usage_percent": 58.2, "total_gb": 100, "used_gb": 58.2 },
"network": {
"in_mb_per_s": 12.4,
"out_mb_per_s": 8.7,
"connections": 15
},
"last_updated": "2026-04-21T20:00:00Z",
"uptime_seconds": 86400
}Данные временных рядов
Timeseries возвращает бакеты с разрешением 1 минуту по умолчанию:
bash
{
"agent_id": "prod-db-01",
"metrics": {
"cpu": [
{ "timestamp": "2026-04-21T19:00:00Z", "value": 38.2 },
{ "timestamp": "2026-04-21T19:01:00Z", "value": 41.5 },
...
],
"memory": [...],
"disk": [...]
}
}Обзор дашборда
Обзор здоровья агрегирует данные по всем агентам:
bash
{
"total_agents": 25,
"healthy": 22,
"degraded": 2,
"critical": 1,
"avg_cpu": 35.7,
"avg_memory": 62.3,
"avg_disk": 54.8
}Примеры запросов
bash
# Получить здоровье конкретного агента curl https://flowlink.flow-masters.ru/api/v1/agents/prod-db-01/health # Получить timeseries за последние 24 часа curl "https://flowlink.flow-masters.ru/api/v1/agents/prod-db-01/health/timeseries?from=2026-04-21T00:00:00Z&to=2026-04-22T00:00:00Z" # Получить обзор здоровья curl https://flowlink.flow-masters.ru/api/v1/agents/health/overview # Проверить только критические агенты curl https://flowlink.flow-masters.ru/api/v1/agents/health/overview?status=critical
Варианты использования
- •Alerting: Обнаружение всплесков CPU, утечек памяти
- •Capacity Planning: Идентификация серверов, приближающихся к лимитам
- •Performance Analysis: Сравнение до/после изменений конфигурации
- •Dashboarding: Создание кастомных дашбордов здоровья