開發(fā)經(jīng)理
電商
大數(shù)據(jù)
云計算
變革
推薦課程
average > 0 ? $model->average . '分' : '10.0分' ?>

數(shù)據(jù)湖構(gòu)建實(shí)戰(zhàn)

李虎翼

前阿里巴巴 計算平臺Staff Engineer

硅谷海歸軟件工程師、架構(gòu)師,主要研究方向是分布式系統(tǒng)、大數(shù)據(jù)系統(tǒng)及數(shù)據(jù)挖掘;
10年以上從事大數(shù)據(jù)基礎(chǔ)設(shè)施研發(fā);
曾供職阿里巴巴云梯、飛天及計算平臺任高級技術(shù)專家;
參與阿里云梯、飛天、5K、計算平臺等系統(tǒng)研發(fā)并任核心成員;
曾在硅谷TangoMe從事數(shù)據(jù)基礎(chǔ)設(shè)施研發(fā),是國內(nèi)最早參與大數(shù)據(jù)研究的軟件工程師之一;
擁有《Hadoop硬實(shí)戰(zhàn)》《Hadoop MapReduce實(shí)戰(zhàn)手冊》等多本著作,及MPICH2-Yarn、大數(shù)據(jù)恢復(fù)系統(tǒng)等多項(xiàng)專利。

硅谷海歸軟件工程師、架構(gòu)師,主要研究方向是分布式系統(tǒng)、大數(shù)據(jù)系統(tǒng)及數(shù)據(jù)挖掘; 10年以上從事大數(shù)據(jù)基礎(chǔ)設(shè)施研發(fā); 曾供職阿里巴巴云梯、飛天及計算平臺任高級技術(shù)專家; 參與阿里云梯、飛天、5K、計算平臺等系統(tǒng)研發(fā)并任核心成員; 曾在硅谷TangoMe從事數(shù)據(jù)基礎(chǔ)設(shè)施研發(fā),是國內(nèi)最早參與大數(shù)據(jù)研究的軟件工程師之一; 擁有《Hadoop硬實(shí)戰(zhàn)》《Hadoop MapReduce實(shí)戰(zhàn)手冊》等多本著作,及MPICH2-Yarn、大數(shù)據(jù)恢復(fù)系統(tǒng)等多項(xiàng)專利。

課程費(fèi)用

5800.00 /人

課程時長

3小時

成為教練

課程簡介

大數(shù)據(jù)存儲已經(jīng)走到了一個新的階段,肯定會有新的革命性技術(shù)來替換它,而數(shù)據(jù)湖就是大數(shù)據(jù)的下一個變革。業(yè)界趨勢是從傳統(tǒng)的數(shù)據(jù)倉庫向數(shù)據(jù)湖的方向演進(jìn).

數(shù)據(jù)湖構(gòu)建實(shí)戰(zhàn),基于目前大數(shù)據(jù)領(lǐng)域流行的數(shù)據(jù)湖技術(shù)及方案,結(jié)合數(shù)據(jù)湖在知名互聯(lián)網(wǎng)及云計算公司的構(gòu)建案例,從理論和實(shí)戰(zhàn)的角度介紹數(shù)據(jù)湖的構(gòu)建及應(yīng)用。

目標(biāo)收益

從實(shí)戰(zhàn)角度解密流行的數(shù)據(jù)湖技術(shù)及構(gòu)建方案,使企業(yè)快速構(gòu)建數(shù)據(jù)湖能力,降低試錯的成本。幫助企業(yè)厘清數(shù)據(jù)湖概念,解決大數(shù)據(jù)應(yīng)用實(shí)戰(zhàn)中的問題。

培訓(xùn)對象

課程內(nèi)容

1.數(shù)據(jù)湖是什么湖?
a)什么是數(shù)據(jù)湖
b)原始數(shù)據(jù)保存的問題
c)與數(shù)據(jù)倉庫的區(qū)別
d)數(shù)據(jù)湖的關(guān)鍵技術(shù)
e)數(shù)據(jù)沼澤與數(shù)據(jù)治理
f)數(shù)據(jù)河與數(shù)據(jù)源

2.數(shù)據(jù)湖的架構(gòu)及戰(zhàn)略分析
a)數(shù)據(jù)湖的常見架構(gòu)
b)與數(shù)據(jù)倉庫的關(guān)系和并存
c)數(shù)據(jù)湖與Hadoop的關(guān)系
d)數(shù)據(jù)湖與原始數(shù)據(jù)的關(guān)系
e)數(shù)據(jù)湖與大數(shù)據(jù)
f)數(shù)據(jù)湖的安全保障
g)數(shù)據(jù)湖與元數(shù)據(jù)

3.數(shù)據(jù)湖技術(shù)分析與實(shí)戰(zhàn)
a)Apache Hadoop數(shù)據(jù)湖的基礎(chǔ)
b)Apache Kafka數(shù)據(jù)河流的基礎(chǔ)
c)Apache Hudi數(shù)據(jù)湖存儲
d)Apache Ranger數(shù)據(jù)湖安全
e)Apache Atlas數(shù)據(jù)湖治理與元數(shù)據(jù)

4.數(shù)據(jù)湖的案例分析
a)開源Hadoop數(shù)據(jù)湖案例分析
b)Amazon數(shù)據(jù)湖案例分析
c)阿里云EMR數(shù)據(jù)湖案例分析
d)阿里飛天數(shù)據(jù)湖案例分析
e)微軟Data lake as service案例分析

5.未來的發(fā)展
a)下一代數(shù)據(jù)倉庫
b)AI驅(qū)動
c)決策自動化

活動詳情

提交需求