課程簡介
歡迎踏上《SLO兵法》的探索之旅,一場引領(lǐng)你進入Site Reliability Engineering(SRE)精髓的深度學習之旅。這門課程將為你揭示系統(tǒng)穩(wěn)定性的奧秘,為構(gòu)建可靠、穩(wěn)定、安全的服務打開全新的思維之門。
為何選擇《SLO兵法》?
這不僅僅是一門課程,更是通往業(yè)務系統(tǒng)可靠性和可觀測性的鑰匙。對于所有希望在生產(chǎn)環(huán)境領(lǐng)域取得卓越業(yè)務戰(zhàn)績的你,《SLO兵法》將成為你事業(yè)道路上的重要里程碑。
目標收益
1.在組織中對SRE相關(guān)的核心理念基礎(chǔ)、SLO實踐流程達成高度一致和認同
2.詳細了解在組織中為業(yè)務系統(tǒng)制定 SLO的詳細實施的方式
3.徹底梳理SRE知識體系結(jié)構(gòu)和最相關(guān)的重要技術(shù)實踐
4.對SLO的實施過程和相關(guān)案例做針對性的研討
培訓對象
1、DevOps工程師、SRE工程師
2、開發(fā)人員、應用架構(gòu)師、服務交付經(jīng)理
3、產(chǎn)品經(jīng)理、項目經(jīng)理、一線運維經(jīng)理
4、敏捷教練,DevOps教練
課程大綱
第一模塊: 對齊 SRE 中與 SLO 相關(guān)的術(shù)語概念 |
1.SLI、SLO 概念解析:深入剖析 SLI(Service Level Indicator)和 SLO(Service Level Objective)的核心概念,確保學員對這兩個關(guān)鍵術(shù)語有清晰準確的理解。 2.SLO 與客戶體驗之間的關(guān)系:探討 SLO 與客戶體驗之間的緊密聯(lián)系,幫助學員建立起對服務質(zhì)量目標與最終用戶體驗之間的敏感性 |
第二模塊: 業(yè)務系統(tǒng)為何需要 SLO ? |
1.可靠性是應用系統(tǒng)的最重要特性:強調(diào)應用系統(tǒng)可靠性的至關(guān)重要地位,為學員樹立系統(tǒng)穩(wěn)定性管理的核心價值觀。 2.深入理解 SLO 目標數(shù)值的設定原則:深入研究 SLO 目標數(shù)值的設定流程,引導學員理解背后的原則與方法,以確保系統(tǒng)的運行水平符合組織的期望。 |
第三模塊: 使用錯誤預算 |
1.理解錯誤預算的概念和應用:解讀錯誤預算的概念,著重探究其與 SLO 密切的邏輯關(guān)系,幫助學員理解如何通過錯誤預算合理管理業(yè)務系統(tǒng)風險。 2.錯誤預算與運維操作和監(jiān)控告警的關(guān)系:深入研究如何運用錯誤預算進行運維操作的優(yōu)化,以及如何構(gòu)建有效的 SLO 監(jiān)控告警規(guī)則,確保在業(yè)務系統(tǒng)發(fā)生關(guān)鍵異常時能夠準確、迅速的響應。 |
第四模塊: 實戰(zhàn)演練 - 實施SLO案例實戰(zhàn) |
1.閱讀學員手冊:引導學員仔細閱讀學員手冊,以建立對實操案例的基本理解。 2.講解小組工作流程:解釋小組工作流程,確保學員能夠理解并分組準確執(zhí)行實際操作。 3.小組工作成果展示:學員展示他們在演練案例中所完成的成果,促進知識分享與團隊協(xié)作。 |
第五模塊:綜合答疑&總結(jié) | 回答學員提出的問題,深化對課程內(nèi)容的理解,并進行全面總結(jié),確保學員能夠充分領(lǐng)會并應用所學的關(guān)鍵概念。 |
第一模塊: 對齊 SRE 中與 SLO 相關(guān)的術(shù)語概念 1.SLI、SLO 概念解析:深入剖析 SLI(Service Level Indicator)和 SLO(Service Level Objective)的核心概念,確保學員對這兩個關(guān)鍵術(shù)語有清晰準確的理解。 2.SLO 與客戶體驗之間的關(guān)系:探討 SLO 與客戶體驗之間的緊密聯(lián)系,幫助學員建立起對服務質(zhì)量目標與最終用戶體驗之間的敏感性 |
第二模塊: 業(yè)務系統(tǒng)為何需要 SLO ? 1.可靠性是應用系統(tǒng)的最重要特性:強調(diào)應用系統(tǒng)可靠性的至關(guān)重要地位,為學員樹立系統(tǒng)穩(wěn)定性管理的核心價值觀。 2.深入理解 SLO 目標數(shù)值的設定原則:深入研究 SLO 目標數(shù)值的設定流程,引導學員理解背后的原則與方法,以確保系統(tǒng)的運行水平符合組織的期望。 |
第三模塊: 使用錯誤預算 1.理解錯誤預算的概念和應用:解讀錯誤預算的概念,著重探究其與 SLO 密切的邏輯關(guān)系,幫助學員理解如何通過錯誤預算合理管理業(yè)務系統(tǒng)風險。 2.錯誤預算與運維操作和監(jiān)控告警的關(guān)系:深入研究如何運用錯誤預算進行運維操作的優(yōu)化,以及如何構(gòu)建有效的 SLO 監(jiān)控告警規(guī)則,確保在業(yè)務系統(tǒng)發(fā)生關(guān)鍵異常時能夠準確、迅速的響應。 |
第四模塊: 實戰(zhàn)演練 - 實施SLO案例實戰(zhàn) 1.閱讀學員手冊:引導學員仔細閱讀學員手冊,以建立對實操案例的基本理解。 2.講解小組工作流程:解釋小組工作流程,確保學員能夠理解并分組準確執(zhí)行實際操作。 3.小組工作成果展示:學員展示他們在演練案例中所完成的成果,促進知識分享與團隊協(xié)作。 |
第五模塊:綜合答疑&總結(jié) 回答學員提出的問題,深化對課程內(nèi)容的理解,并進行全面總結(jié),確保學員能夠充分領(lǐng)會并應用所學的關(guān)鍵概念。 |