Блог h3llo — длинные разборы, кейсы, постмортемы
Инженерные статьи от команды h3llo и наших клиентов: от «kubernetes без бубна» до «inference на 1000 RPS». Без marketing-fluff.
Свежие материалы
9 материаловNetwork policies для тех, кто всё откладывал на потом
Берём пустой кластер и за час превращаем его в zero-trust. На реальных примерах с egress, dns и инцидент-постмортемом.
Inference-кластер на 200 RPS: что нам пришлось переделать
Batching, KV-cache, autoscaling по latency, а не по CPU. Что сломалось в первый день, что — во второй, и что наконец заработало.
Right-sizing без боли: как мы режем счёт за k8s в два раза
VPA в режиме рекомендаций, реалистичные requests, ночные spot-ноды. Готовая методика и Grafana-дашборды (можно копировать).
Lazyboard: как мы переехали с трёх облаков на одно за 11 дней
Стартап, 22 микросервиса, 4 БД и одна паника по дороге. Подробный таймлайн и где именно мы остановились бы, если б не дедлайн.
Почему у нас нет «Premium-поддержки» и почему так и останется
Спойлер: потому что это нечестная сделка. Объясняем, как устроен support-tier у h3llo и сколько стоит каждая минута SRE-инженера.
Pod Security Admission: три профиля и одна засада
Restricted-профиль ломает половину helm-чартов. Рассказываем, как мы накатывали PSA постепенно, без даунтайма и грязных слов.
etcd, который не падает: бэкапы, watch-задачи и фрагментация
Постмортем по двум инцидентам и список из 9 настроек, которые мы теперь применяем по умолчанию. С метриками, которые надо мониторить.
RAG в проде: вектора, latency и что не пишут в туториалах
Hybrid retrieval, переранжирование, query rewriting. Как мы держим p95 ≤ 800 мс на корпусе из 4 млн документов.
Госсектор и облака: как мы провели проверку ФСТЭК (и не сошли с ума)
Что от нас потребовали, чем закончилось, какие документы пригодились. Полезно тем, кто только думает о сертификации УЗ-3/4.
Раз в две недели — лучшее в почту
Анонсы новых постов, эпизодов подкастов, серий и материалов в библиотеке. Без новостей и анонсов фич. Отписаться — одна кнопка.