課程簡(jiǎn)介
時(shí)下引領(lǐng)著技術(shù)變革的非“大數(shù)據(jù)”莫屬,本課程帶你全面掌握Hadoo和Spark開發(fā)的核心技能:HDFS 、MapReduce的搭建及框架的應(yīng)用,了解最火爆最前沿的大數(shù)據(jù)技術(shù)發(fā)展趨勢(shì)。
目標(biāo)收益
構(gòu)建大數(shù)據(jù)生態(tài)立體化的知識(shí)體系
掌握大數(shù)據(jù)核心應(yīng)用技術(shù)
從大數(shù)據(jù)開發(fā)者成為具備大數(shù)據(jù)思維的技術(shù)專家
培訓(xùn)對(duì)象
課程大綱
Hadoop生態(tài)系統(tǒng)概述(1H) |
1. 分布式文件系統(tǒng)HDFS 2. 分布式計(jì)算MapReduce 3. 分布式資源管理Yarn 4. 大數(shù)據(jù)SQL分析引擎Hive 5. 分布式機(jī)器學(xué)習(xí)與數(shù)據(jù)挖掘Mahout 6. NoSQL引擎HBase 7. 分布式一致性框架ZooKeeper 8. 高性能大數(shù)據(jù)引擎Spark |
HDFS原理與應(yīng)用實(shí)踐(2H) |
1. HDFS高可用可伸縮架構(gòu)原理分析 2. HDFS配置與部署實(shí)踐 3. HDFS API編程實(shí)踐 |
MapReduce原理與應(yīng)用實(shí)踐(2H) |
1. MapReduce編程模型與案例分析 2. MapReduce核心組件分析 3. MapReduce計(jì)算過(guò)程分析 4. MapReduce用戶擴(kuò)展接口編程實(shí)踐 5. MapReduce部署管理實(shí)踐 6. MapReduce配置優(yōu)化與案例分析 |
Hive原理與應(yīng)用實(shí)踐(1H) |
1. SQL轉(zhuǎn)換MapReduce原理分析 2. Hive核心組件與處理流程分析 3. Hive部署管理實(shí)踐 4. 大數(shù)據(jù)在線分析Hive應(yīng)用實(shí)踐 5. Hive SQL優(yōu)化與配置優(yōu)化 |
Spark原理與實(shí)踐(2H) |
1. Spark編程模型及部署模型 2. Spark運(yùn)行原理及調(diào)度機(jī)制 3. Spark性能優(yōu)化及最佳實(shí)踐 |
Hadoop周邊產(chǎn)品討論(0.5H) |
1. Hadoop基準(zhǔn)測(cè)試工具Hibench 2. Hadoop性能測(cè)試工具HiTune 3. Hadoop性能分析工具Dew |
Hadoop大數(shù)據(jù)平臺(tái)架構(gòu)(1H) |
1. 阿里巴巴大數(shù)據(jù)平臺(tái)架構(gòu)分析 2. 騰訊大數(shù)據(jù)平臺(tái)架構(gòu)分析 3. 百度大數(shù)據(jù)平臺(tái)架構(gòu)分析 |
大數(shù)據(jù)分析實(shí)踐(1.5H) |
1. 用戶行為數(shù)據(jù)打點(diǎn)與采集系統(tǒng)架構(gòu) 2. 互聯(lián)網(wǎng)大數(shù)據(jù)分析常用方法 3. 數(shù)據(jù)分析案例 |
大數(shù)據(jù)與機(jī)器學(xué)習(xí)(1.5H) |
1. 大數(shù)據(jù)分類與聚類算法 2. 推薦引擎算法實(shí)踐 3. 神經(jīng)網(wǎng)絡(luò)原理與應(yīng)用 |
Hadoop生態(tài)系統(tǒng)概述(1H) 1. 分布式文件系統(tǒng)HDFS 2. 分布式計(jì)算MapReduce 3. 分布式資源管理Yarn 4. 大數(shù)據(jù)SQL分析引擎Hive 5. 分布式機(jī)器學(xué)習(xí)與數(shù)據(jù)挖掘Mahout 6. NoSQL引擎HBase 7. 分布式一致性框架ZooKeeper 8. 高性能大數(shù)據(jù)引擎Spark |
HDFS原理與應(yīng)用實(shí)踐(2H) 1. HDFS高可用可伸縮架構(gòu)原理分析 2. HDFS配置與部署實(shí)踐 3. HDFS API編程實(shí)踐 |
MapReduce原理與應(yīng)用實(shí)踐(2H) 1. MapReduce編程模型與案例分析 2. MapReduce核心組件分析 3. MapReduce計(jì)算過(guò)程分析 4. MapReduce用戶擴(kuò)展接口編程實(shí)踐 5. MapReduce部署管理實(shí)踐 6. MapReduce配置優(yōu)化與案例分析 |
Hive原理與應(yīng)用實(shí)踐(1H) 1. SQL轉(zhuǎn)換MapReduce原理分析 2. Hive核心組件與處理流程分析 3. Hive部署管理實(shí)踐 4. 大數(shù)據(jù)在線分析Hive應(yīng)用實(shí)踐 5. Hive SQL優(yōu)化與配置優(yōu)化 |
Spark原理與實(shí)踐(2H) 1. Spark編程模型及部署模型 2. Spark運(yùn)行原理及調(diào)度機(jī)制 3. Spark性能優(yōu)化及最佳實(shí)踐 |
Hadoop周邊產(chǎn)品討論(0.5H) 1. Hadoop基準(zhǔn)測(cè)試工具Hibench 2. Hadoop性能測(cè)試工具HiTune 3. Hadoop性能分析工具Dew |
Hadoop大數(shù)據(jù)平臺(tái)架構(gòu)(1H) 1. 阿里巴巴大數(shù)據(jù)平臺(tái)架構(gòu)分析 2. 騰訊大數(shù)據(jù)平臺(tái)架構(gòu)分析 3. 百度大數(shù)據(jù)平臺(tái)架構(gòu)分析 |
大數(shù)據(jù)分析實(shí)踐(1.5H) 1. 用戶行為數(shù)據(jù)打點(diǎn)與采集系統(tǒng)架構(gòu) 2. 互聯(lián)網(wǎng)大數(shù)據(jù)分析常用方法 3. 數(shù)據(jù)分析案例 |
大數(shù)據(jù)與機(jī)器學(xué)習(xí)(1.5H) 1. 大數(shù)據(jù)分類與聚類算法 2. 推薦引擎算法實(shí)踐 3. 神經(jīng)網(wǎng)絡(luò)原理與應(yīng)用 |