課程簡介
大數(shù)據(jù)存儲已經(jīng)走到了一個新的階段,肯定會有新的革命性技術(shù)來替換它,而數(shù)據(jù)湖就是大數(shù)據(jù)的下一個變革。業(yè)界趨勢是從傳統(tǒng)的數(shù)據(jù)倉庫向數(shù)據(jù)湖的方向演進(jìn).
數(shù)據(jù)湖構(gòu)建實(shí)戰(zhàn),基于目前大數(shù)據(jù)領(lǐng)域流行的數(shù)據(jù)湖技術(shù)及方案,結(jié)合數(shù)據(jù)湖在知名互聯(lián)網(wǎng)及云計算公司的構(gòu)建案例,從理論和實(shí)戰(zhàn)的角度介紹數(shù)據(jù)湖的構(gòu)建及應(yīng)用。
目標(biāo)收益
從實(shí)戰(zhàn)角度解密流行的數(shù)據(jù)湖技術(shù)及構(gòu)建方案,使企業(yè)快速構(gòu)建數(shù)據(jù)湖能力,降低試錯的成本。幫助企業(yè)厘清數(shù)據(jù)湖概念,解決大數(shù)據(jù)應(yīng)用實(shí)戰(zhàn)中的問題。
培訓(xùn)對象
課程內(nèi)容
1.數(shù)據(jù)湖是什么湖?
a)什么是數(shù)據(jù)湖
b)原始數(shù)據(jù)保存的問題
c)與數(shù)據(jù)倉庫的區(qū)別
d)數(shù)據(jù)湖的關(guān)鍵技術(shù)
e)數(shù)據(jù)沼澤與數(shù)據(jù)治理
f)數(shù)據(jù)河與數(shù)據(jù)源
2.數(shù)據(jù)湖的架構(gòu)及戰(zhàn)略分析
a)數(shù)據(jù)湖的常見架構(gòu)
b)與數(shù)據(jù)倉庫的關(guān)系和并存
c)數(shù)據(jù)湖與Hadoop的關(guān)系
d)數(shù)據(jù)湖與原始數(shù)據(jù)的關(guān)系
e)數(shù)據(jù)湖與大數(shù)據(jù)
f)數(shù)據(jù)湖的安全保障
g)數(shù)據(jù)湖與元數(shù)據(jù)
3.數(shù)據(jù)湖技術(shù)分析與實(shí)戰(zhàn)
a)Apache Hadoop數(shù)據(jù)湖的基礎(chǔ)
b)Apache Kafka數(shù)據(jù)河流的基礎(chǔ)
c)Apache Hudi數(shù)據(jù)湖存儲
d)Apache Ranger數(shù)據(jù)湖安全
e)Apache Atlas數(shù)據(jù)湖治理與元數(shù)據(jù)
4.數(shù)據(jù)湖的案例分析
a)開源Hadoop數(shù)據(jù)湖案例分析
b)Amazon數(shù)據(jù)湖案例分析
c)阿里云EMR數(shù)據(jù)湖案例分析
d)阿里飛天數(shù)據(jù)湖案例分析
e)微軟Data lake as service案例分析
5.未來的發(fā)展
a)下一代數(shù)據(jù)倉庫
b)AI驅(qū)動
c)決策自動化