互聯(lián)網(wǎng)
大數(shù)據(jù)
SQL
Spark
HBase
大數(shù)據(jù)平臺
推薦課程
average > 0 ? $model->average . '分' : '10.0分' ?>

大數(shù)據(jù)實戰(zhàn)培訓

中科院 大數(shù)據(jù)技術專家

北京獵豹移動科技有限公司-大數(shù)據(jù)技術專家;
(鄭州)中科院計算所大數(shù)據(jù)研究院-大數(shù)據(jù)技術專家;
鄭州工業(yè)應用技術學院特聘大數(shù)據(jù)講師;
慕課網(wǎng)大數(shù)據(jù)體系課獨家簽約講師;
電子工業(yè)出版社2022年度優(yōu)秀作者;
華為開發(fā)者學堂認證講師;
51CTO企業(yè)IT學院優(yōu)秀講師;
華為HCIP大數(shù)據(jù)高級工程師認證;
新工科-大數(shù)據(jù)高級工程師認證;
發(fā)明專利:一種基于SparkSQL和RestAPI的流數(shù)據(jù)處理方法;
出版書籍:《大數(shù)據(jù)技術及架構圖解實戰(zhàn)派》、《Flink入門與實戰(zhàn)》

北京獵豹移動科技有限公司-大數(shù)據(jù)技術專家; (鄭州)中科院計算所大數(shù)據(jù)研究院-大數(shù)據(jù)技術專家; 鄭州工業(yè)應用技術學院特聘大數(shù)據(jù)講師; 慕課網(wǎng)大數(shù)據(jù)體系課獨家簽約講師; 電子工業(yè)出版社2022年度優(yōu)秀作者; 華為開發(fā)者學堂認證講師; 51CTO企業(yè)IT學院優(yōu)秀講師; 華為HCIP大數(shù)據(jù)高級工程師認證; 新工科-大數(shù)據(jù)高級工程師認證; 發(fā)明專利:一種基于SparkSQL和RestAPI的流數(shù)據(jù)處理方法; 出版書籍:《大數(shù)據(jù)技術及架構圖解實戰(zhàn)派》、《Flink入門與實戰(zhàn)》

課程費用

5800.00 /人

課程時長

2

成為教練

課程簡介

本次課程主要針對大數(shù)據(jù)平臺中MapReduce,Spark中的Spark core、Spark SQL 、SparkStreaming、Spark性能優(yōu)化,以及HBase的高級特性這些內(nèi)容進行講解,通過這些內(nèi)容的學習,可以掌握MapReduce的編程思想,掌握Spark中的離線計算和實時計算,以及HBase的高級特性。

目標收益

?了解大數(shù)據(jù)中MapReduce的核心原理
?掌握MapReduce核心編程
?了解Spark性能優(yōu)化
?掌握Spark中的離線計算和實時計算
?掌握Spark SQL的使用
?掌握HBase的高級特性

培訓對象

課程內(nèi)容

第一天(上午)
Hadoop原理及HDFS實操
1 快速了解Hadoop
2 Hadoop3.x的核心細節(jié)優(yōu)化
3 Hadoop大數(shù)據(jù)平臺的選型
4 HDFS核心原理詳解
5 HDFS的常用及高級shell命令
6 HDFS體系結構原理詳細剖析
HDFS高級內(nèi)容
7 HDFS的回收站和安全模式
8 HDFS的高可用和高擴展架構剖析
9 HDFS機架感知策略原理剖析
10 HDFS寫數(shù)據(jù)原理及源碼剖析
11 HDFS的糾刪碼機制(Erasure Coding)原理剖析
第一天(下午)
MapReduce核心編程
1 MapReduce原理深度剖析
2 MapReduce實戰(zhàn)案例開發(fā)
3 Shuffle過程詳解
4 Hadoop中的序列化機制分析
5 MapTask源碼分析
6 RecuceTask源碼分析
7 YARN資源管理模型分析
8 YARN中的多資源隊列配置和使用
MapReduce源碼剖析及性能優(yōu)化解決方案
9 Inputformat切片源碼分析
10 Outputformat源碼分析
11 小文件問題剖析及實戰(zhàn)
12 數(shù)據(jù)傾斜問題原理剖析及實戰(zhàn)
13 MapReduce Job提交流程分析
14 Map job和Reduce join案例分析及實戰(zhàn)
15 MapReduce中的數(shù)據(jù)壓縮案例分析及實戰(zhàn)
第二天(上午)
Spark原理及案例開發(fā)
1 Spark核心原理及架構剖析
2 Spark任務的三種提交模式

活動詳情

提交需求