lenec ru

← все теги

#resilience

3 поста

Retry, backoff и jitter: как делать повторы, которые не убьют сервис

Любой код, который ходит в сеть, рано или поздно встречается с сетевой ошибкой. Сервис прислал 503, БД таймаутнула, gRPC отвалился по дедлайну. Логичный рефлекс — повторить запрос. Логичный, но…

123 17K
Алексей Морозов

Circuit breaker: как защитить сервис от лавины запросов к умирающему соседу

Сценарий, который я разбирал не раз: сервис заказов зовёт сервис каталога. Каталог тормозит, ответы идут по 5 секунд вместо 50 миллисекунд. Пул потоков сервиса заказов забивается ожиданием каталога,…

363 12K
Алексей Морозов

Bulkhead pattern: как не дать одному соседу утопить весь сервис

Сценарий, который я разбирал в трёх компаниях: сервис A зовёт сервис B и сервис C. B начинает тормозить, отвечает по 5 секунд. Запросы к B забивают весь пул потоков сервиса A. Запросы к C, которые…

184 14K
Алексей Морозов