課程簡(jiǎn)介
歡迎踏上《SLO兵法》的探索之旅,一場(chǎng)引領(lǐng)你進(jìn)入Site Reliability Engineering(SRE)精髓的深度學(xué)習(xí)之旅。這門(mén)課程將為你揭示系統(tǒng)穩(wěn)定性的奧秘,為構(gòu)建可靠、穩(wěn)定、安全的服務(wù)打開(kāi)全新的思維之門(mén)。
為何選擇《SLO兵法》?
這不僅僅是一門(mén)課程,更是通往業(yè)務(wù)系統(tǒng)可靠性和可觀測(cè)性的鑰匙。對(duì)于所有希望在生產(chǎn)環(huán)境領(lǐng)域取得卓越業(yè)務(wù)戰(zhàn)績(jī)的你,《SLO兵法》將成為你事業(yè)道路上的重要里程碑。
目標(biāo)收益
1.在組織中對(duì)SRE相關(guān)的核心理念基礎(chǔ)、SLO實(shí)踐流程達(dá)成高度一致和認(rèn)同
2.詳細(xì)了解在組織中為業(yè)務(wù)系統(tǒng)制定 SLO的詳細(xì)實(shí)施的方式
3.徹底梳理SRE知識(shí)體系結(jié)構(gòu)和最相關(guān)的重要技術(shù)實(shí)踐
4.對(duì)SLO的實(shí)施過(guò)程和相關(guān)案例做針對(duì)性的研討
培訓(xùn)對(duì)象
1、DevOps工程師、SRE工程師
2、開(kāi)發(fā)人員、應(yīng)用架構(gòu)師、服務(wù)交付經(jīng)理
3、產(chǎn)品經(jīng)理、項(xiàng)目經(jīng)理、一線運(yùn)維經(jīng)理
4、敏捷教練,DevOps教練
課程大綱
第一模塊: 對(duì)齊 SRE 中與 SLO 相關(guān)的術(shù)語(yǔ)概念 |
1.SLI、SLO 概念解析:深入剖析 SLI(Service Level Indicator)和 SLO(Service Level Objective)的核心概念,確保學(xué)員對(duì)這兩個(gè)關(guān)鍵術(shù)語(yǔ)有清晰準(zhǔn)確的理解。 2.SLO 與客戶體驗(yàn)之間的關(guān)系:探討 SLO 與客戶體驗(yàn)之間的緊密聯(lián)系,幫助學(xué)員建立起對(duì)服務(wù)質(zhì)量目標(biāo)與最終用戶體驗(yàn)之間的敏感性 |
第二模塊: 業(yè)務(wù)系統(tǒng)為何需要 SLO ? |
1.可靠性是應(yīng)用系統(tǒng)的最重要特性:強(qiáng)調(diào)應(yīng)用系統(tǒng)可靠性的至關(guān)重要地位,為學(xué)員樹(shù)立系統(tǒng)穩(wěn)定性管理的核心價(jià)值觀。 2.深入理解 SLO 目標(biāo)數(shù)值的設(shè)定原則:深入研究 SLO 目標(biāo)數(shù)值的設(shè)定流程,引導(dǎo)學(xué)員理解背后的原則與方法,以確保系統(tǒng)的運(yùn)行水平符合組織的期望。 |
第三模塊: 使用錯(cuò)誤預(yù)算 |
1.理解錯(cuò)誤預(yù)算的概念和應(yīng)用:解讀錯(cuò)誤預(yù)算的概念,著重探究其與 SLO 密切的邏輯關(guān)系,幫助學(xué)員理解如何通過(guò)錯(cuò)誤預(yù)算合理管理業(yè)務(wù)系統(tǒng)風(fēng)險(xiǎn)。 2.錯(cuò)誤預(yù)算與運(yùn)維操作和監(jiān)控告警的關(guān)系:深入研究如何運(yùn)用錯(cuò)誤預(yù)算進(jìn)行運(yùn)維操作的優(yōu)化,以及如何構(gòu)建有效的 SLO 監(jiān)控告警規(guī)則,確保在業(yè)務(wù)系統(tǒng)發(fā)生關(guān)鍵異常時(shí)能夠準(zhǔn)確、迅速的響應(yīng)。 |
第四模塊: 實(shí)戰(zhàn)演練 - 實(shí)施SLO案例實(shí)戰(zhàn) |
1.閱讀學(xué)員手冊(cè):引導(dǎo)學(xué)員仔細(xì)閱讀學(xué)員手冊(cè),以建立對(duì)實(shí)操案例的基本理解。 2.講解小組工作流程:解釋小組工作流程,確保學(xué)員能夠理解并分組準(zhǔn)確執(zhí)行實(shí)際操作。 3.小組工作成果展示:學(xué)員展示他們?cè)谘菥毎咐兴瓿傻某晒?,促進(jìn)知識(shí)分享與團(tuán)隊(duì)協(xié)作。 |
第五模塊:綜合答疑&總結(jié) | 回答學(xué)員提出的問(wèn)題,深化對(duì)課程內(nèi)容的理解,并進(jìn)行全面總結(jié),確保學(xué)員能夠充分領(lǐng)會(huì)并應(yīng)用所學(xué)的關(guān)鍵概念。 |
第一模塊: 對(duì)齊 SRE 中與 SLO 相關(guān)的術(shù)語(yǔ)概念 1.SLI、SLO 概念解析:深入剖析 SLI(Service Level Indicator)和 SLO(Service Level Objective)的核心概念,確保學(xué)員對(duì)這兩個(gè)關(guān)鍵術(shù)語(yǔ)有清晰準(zhǔn)確的理解。 2.SLO 與客戶體驗(yàn)之間的關(guān)系:探討 SLO 與客戶體驗(yàn)之間的緊密聯(lián)系,幫助學(xué)員建立起對(duì)服務(wù)質(zhì)量目標(biāo)與最終用戶體驗(yàn)之間的敏感性 |
第二模塊: 業(yè)務(wù)系統(tǒng)為何需要 SLO ? 1.可靠性是應(yīng)用系統(tǒng)的最重要特性:強(qiáng)調(diào)應(yīng)用系統(tǒng)可靠性的至關(guān)重要地位,為學(xué)員樹(shù)立系統(tǒng)穩(wěn)定性管理的核心價(jià)值觀。 2.深入理解 SLO 目標(biāo)數(shù)值的設(shè)定原則:深入研究 SLO 目標(biāo)數(shù)值的設(shè)定流程,引導(dǎo)學(xué)員理解背后的原則與方法,以確保系統(tǒng)的運(yùn)行水平符合組織的期望。 |
第三模塊: 使用錯(cuò)誤預(yù)算 1.理解錯(cuò)誤預(yù)算的概念和應(yīng)用:解讀錯(cuò)誤預(yù)算的概念,著重探究其與 SLO 密切的邏輯關(guān)系,幫助學(xué)員理解如何通過(guò)錯(cuò)誤預(yù)算合理管理業(yè)務(wù)系統(tǒng)風(fēng)險(xiǎn)。 2.錯(cuò)誤預(yù)算與運(yùn)維操作和監(jiān)控告警的關(guān)系:深入研究如何運(yùn)用錯(cuò)誤預(yù)算進(jìn)行運(yùn)維操作的優(yōu)化,以及如何構(gòu)建有效的 SLO 監(jiān)控告警規(guī)則,確保在業(yè)務(wù)系統(tǒng)發(fā)生關(guān)鍵異常時(shí)能夠準(zhǔn)確、迅速的響應(yīng)。 |
第四模塊: 實(shí)戰(zhàn)演練 - 實(shí)施SLO案例實(shí)戰(zhàn) 1.閱讀學(xué)員手冊(cè):引導(dǎo)學(xué)員仔細(xì)閱讀學(xué)員手冊(cè),以建立對(duì)實(shí)操案例的基本理解。 2.講解小組工作流程:解釋小組工作流程,確保學(xué)員能夠理解并分組準(zhǔn)確執(zhí)行實(shí)際操作。 3.小組工作成果展示:學(xué)員展示他們?cè)谘菥毎咐兴瓿傻某晒?,促進(jìn)知識(shí)分享與團(tuán)隊(duì)協(xié)作。 |
第五模塊:綜合答疑&總結(jié) 回答學(xué)員提出的問(wèn)題,深化對(duì)課程內(nèi)容的理解,并進(jìn)行全面總結(jié),確保學(xué)員能夠充分領(lǐng)會(huì)并應(yīng)用所學(xué)的關(guān)鍵概念。 |