О надежности

Почему надежность информационных систем приобрела особую роль в современном мире в последние десять лет?

Какие профессии должны думать о надежности информационных продуктов?

Про Google

Почему именно Google стал главным авторитетом в построении надежных информационных систем?

Все большие ИТ компании умеют в SRE? Как быть более мелким компаниям? А зачем?

Про SRE

Что такое SRE? Почему спустя 6 лет после появления термина все еще продолжают идти споры и нет единого понимания термина и подхода?

Положение SRE среди других похожих практик и подходов. Что случилось с DevOps? DevOps больше не нужен?

Полезные практики

Комплексная работа над «культурой надежности». Доверить заниматься надежностью людям с опытом разработки. Дежурства 24х7 силами инженеров и связанные с этим процессы. Грамотная работа с алертированием. Обучение: экзамены, отработка кейсов. Безопасные релизы: переключатели функционала, канарейки. Автоматизированный мониторинг надежности. Грамотное написание постмортемов. Процессы организации работ по устранению сбоев. Необвинительная культура. Автоматизация рутиных операций. Постоянная борьба с устаревающим кодом. Обеспечение постепенной деградации.

и многое другое...

Вопросы?