lenec ru

← все теги

#observability

12 постов

Prometheus metrics: правильные метрики для веб-сервиса

# Grafana Loki: централизованные логи без Elasticsearch Если вы устали от тяжеловесного ELK stack, который съедает гигабайты RAM и требует постоянного внимания к шардам — пора познакомиться с Grafana…

0 1
Dmitry Volkov

Что такое Logsa: локальный индекс логов для разработки и отладки

Когда сервисов становится больше трёх, логи перестают быть файлом, который можно спокойно открыть глазами. Один процесс пишет JSON, второй плюёт plain text, третий живёт в Docker, четвёртый…

421 15K
Тиринтил

Correlation ID на практике: как сшить логи в одну историю запроса

Distributed tracing решает задачу красиво, но не везде применим: легаси-сервисы без OTel-агента, кроссплатформенные интеграции, where the trace context не пробрасывается. Часто проще иметь хотя бы…

446 15K
Алексей Морозов

Distributed tracing с OpenTelemetry: что включить и как читать спаны

Запрос пришёл от пользователя в API gateway, оттуда — в orders, оттуда — в payments и inventory параллельно, payments позвал внешний эквайер, ответ собрался обратно. Где-то в этой цепочке произошёл…

178 12K
Алексей Морозов

OpenTelemetry в Node-приложении: настройка трейсинга и метрик

OpenTelemetry — это про «сделай свои сервисы наблюдаемыми, не привязываясь к одному vendor-у». Я внедряла OTel на трёх Node-сервисах в этом году: один в Selectel, один в Yandex Cloud, один в свой…

117 10K
Влада Барсукова

Структурированное логирование: что, как и куда складывать

Текстовый лог в файле — это удобно, пока сервисов не больше двух. Дальше начинается мучение: ssh на ноду, grep, ssh на другую ноду, grep, скачать всё в один файл, сшить по таймстемпам.…

475 15K
Алексей Морозов

Grafana Loki: централизованные логи без Elasticsearch

# Grafana Loki: централизованные логи без Elasticsearch Если вы устали от тяжеловесного ELK stack, который съедает гигабайты RAM и требует постоянного внимания к шардам — пора познакомиться с Grafana…

0
Михаил Логинов

SLO, SLI и error budget: как договариваться о надёжности с цифрами

«Сервис должен быть надёжным» — фраза, под которой все согласно кивают, но никто не понимает одинаково. Для разработчика «надёжный» = «не падает при моём релизе». Для product owner — «работает, когда…

290 19K
Алексей Морозов

OpenTelemetry в Node.js: трейсинг от разработки до прода

# Grafana Loki: централизованные логи без Elasticsearch Если вы устали от тяжеловесного ELK stack, который съедает гигабайты RAM и требует постоянного внимания к шардам — пора познакомиться с Grafana…

0
Дмитрий Соколов

slog в Go 1.21+: переход со старого логгера на структурированный

В Go 1.21 появился log/slog — структурированный логгер в стандартной библиотеке. До этого все писали на zap, zerolog или logrus, и каждый проект тащил свой выбор. Сейчас можно жить на stdlib без…

74 19K
Игорь Лебедев

Минимальный observability-стек на open-source за день: logs, metrics, traces

В каждый новый кластер k8s через две недели после старта приходит вопрос: «а почему этот сервис тормозит ночью?». И ты понимаешь, что ничего не видишь — ни логов, ни метрик, ни трейсов. Можно…

231 19K
Дмитрий Орлов

Observability в FastAPI: structured logs, метрики, tracing

Логирование и observability в Python-сервисе — это история, к которой большинство приходит постфактум. Сначала пишешь print, потом logging.info, потом ставишь Sentry, потом упирается во что-то в…

480 11K
Андрей Крылов