👁 Упали сервисы, а ты узнал об этом от пользователей? Классика. Даже самый стабильный backend может внезапно пойти по одному месту — out of memory, зависший процесс, закончился диск... Поэтому важно: никогда не разворачивай продакшен без хотя бы базового мониторинга и алертов.
📌 Вот с чего можно начать (и это почти бесплатно):
- Установи node_exporter и Prometheus:
Эти два товарища дадут тебе подробные метрики о загрузке CPU, памяти, I/O, сети и даже температуре. Устанавливаются за 5 минут, в конфиге достаточно указать endpoint.
- Подключи Alertmanager и настрой алерты:
Начни хотя бы с instance_down, high_load > 90%, disk_usage > 80%, memory_usage > 90%, tls_cert_expiry < 10d. Уведомления можно слать в Slack, Telegram, Email — настраивается гибко.
- Добавь Grafana:
Красивые дашборды с метриками — не только для DevOps. На одном экране ты увидишь здоровье всей системы. У Grafana уже есть готовые дашборды для node_exporter и nginx, достаточно просто подключить.
- Логи тоже важны:
Если нет ресурсов ставить полноценный ELK или Loki — начни с logrotate и journalctl. Убедись, что логи не копятся бесконечно и не забивают диск.
-
Безопасность:
- Поставь fail2ban - это спасение от брутфорса и сканеров
- Настрой ufw или iptables, открой только нужные порты
- Обновляй систему через unattended-upgrades (но проверяй, что не ломается прод)
- Добавь проверку на окончание TLS-сертификатов и домены в DNS
🔎 Набор минималиста — если ты хочешь совсем простой стек для 1-2 серверов:
sudo apt install prometheus node-exporter grafana fail2ban ufw logrotate
Плюс базовая настройка — и у тебя уже есть мониторинг, графики, защита и управление логами.
❗️ Помни: мониторинг — не про «графики ради графиков». Это про своевременную реакцию и спокойный сон. Даже если ты не DevOps — знай, как это устроено, и не разворачивай продакшен «вслепую».
tags: #мониторинг #безопасность
❤️ @recura_tech


