Почему надежность информационных систем приобрела особую роль в современном мире в последние десять лет?
Какие профессии должны думать о надежности информационных продуктов?
Почему именно Google стал главным авторитетом в построении надежных информационных систем?
Все большие ИТ компании умеют в SRE? Как быть более мелким компаниям? А зачем?
Что такое SRE? Почему спустя 6 лет после появления термина все еще продолжают идти споры и нет единого понимания термина и подхода?
Положение SRE среди других похожих практик и подходов. Что случилось с DevOps? DevOps больше не нужен?
Комплексная работа над «культурой надежности». Доверить заниматься надежностью людям с опытом разработки. Дежурства 24х7 силами инженеров и связанные с этим процессы. Грамотная работа с алертированием. Обучение: экзамены, отработка кейсов. Безопасные релизы: переключатели функционала, канарейки. Автоматизированный мониторинг надежности. Грамотное написание постмортемов. Процессы организации работ по устранению сбоев. Необвинительная культура. Автоматизация рутиных операций. Постоянная борьба с устаревающим кодом. Обеспечение постепенной деградации.
и многое другое...