課程簡介
數(shù)據(jù)挖掘和機(jī)器學(xué)習(xí)是屬于大數(shù)據(jù)的核心技術(shù)之一,以科學(xué)嚴(yán)謹(jǐn)?shù)臄?shù)據(jù)依據(jù)幫助企業(yè)做分析決策,同時(shí)其高深的理論門檻也阻擋了廣大工程師的學(xué)習(xí)上手,在大數(shù)據(jù)時(shí)代,如何進(jìn)行基于海量數(shù)據(jù)在成百上千的機(jī)器進(jìn)行分布式數(shù)據(jù)挖掘更是需要解決的難題,本課程從實(shí)戰(zhàn)角度出發(fā),基于企業(yè)實(shí)際需求,深入淺出的講解數(shù)據(jù)挖掘最常用的算法和企業(yè)場景,讓工程師通俗易懂的掌握,并且進(jìn)行編程落地實(shí)踐培訓(xùn),讓抽象的算法公式完全落地為工程化的程序?yàn)槠髽I(yè)所用。
目標(biāo)收益
培訓(xùn)對象
初中級基礎(chǔ)的工程師,數(shù)據(jù)分析/挖掘/大數(shù)據(jù)技術(shù)人員,企業(yè)數(shù)據(jù)建模/決策人員等等
課程大綱
一、大數(shù)據(jù)分析挖掘技術(shù)介紹 |
1、map/reduce 2、mahout數(shù)據(jù)挖掘 3、sql on hadoop 4、spark生態(tài)體系 5、R語言 6、MPI并行計(jì)算 7、GPU并行計(jì)算(深度學(xué)習(xí)) 8、java并行計(jì)算框架 |
二、常用機(jī)器學(xué)習(xí)算法原理 |
1、決策樹 2、隨機(jī)森林 3、協(xié)同過濾推薦算法(余弦相似、修正余弦) 4、Jaccard算法 5、樸素貝葉斯算法 6、k-means聚類算法 7、pagerank算法 8、邏輯回歸 9、圖計(jì)算 |
三、大數(shù)據(jù)挖掘業(yè)務(wù)場景和生產(chǎn)平臺 |
1、互聯(lián)網(wǎng)金融業(yè)務(wù)—如何構(gòu)建阿里金融系統(tǒng) 2、銀行客戶需求業(yè)務(wù) 3、大數(shù)據(jù)分析生產(chǎn)平臺 4、推薦/廣告系統(tǒng)的原理、架構(gòu)、模型、驗(yàn)證等。 5、基于GBDT的組合模型架構(gòu) |
四、編程實(shí)踐(動手) |
1、迭代類機(jī)器學(xué)習(xí)編程入門-求圓周率 2、pagerank的并行化實(shí)現(xiàn)(*) 3、邏輯回歸算法的java實(shí)現(xiàn) 4、決策樹c45,id3的java實(shí)現(xiàn) 5、隨機(jī)森林和全樹并行化實(shí)現(xiàn) 6、訓(xùn)練數(shù)據(jù)和結(jié)果模擬器 7、模型結(jié)果規(guī)則化處理 8、協(xié)同過濾java實(shí)現(xiàn) 9、基于圖計(jì)算的推薦java實(shí)現(xiàn) |
五、神經(jīng)網(wǎng)絡(luò)及深度學(xué)習(xí) |
1、什么是神經(jīng)網(wǎng)絡(luò)算法 2、多層神經(jīng)網(wǎng)絡(luò)程序如何實(shí)現(xiàn)(java程序) 3、神經(jīng)網(wǎng)絡(luò)數(shù)學(xué)原理(誤差函數(shù)、梯度下降求最小值、更新權(quán)重和截距) 4、推導(dǎo)需要的最小化數(shù)學(xué)知識(導(dǎo)數(shù)和偏導(dǎo)數(shù)、導(dǎo)數(shù)運(yùn)算、梯度下降原理) 5、數(shù)學(xué)推導(dǎo)過程 6、什么是深度學(xué)習(xí) 7、深度學(xué)習(xí)的計(jì)算過程 8、深度學(xué)習(xí)如何訓(xùn)練 9、深度學(xué)習(xí)和神經(jīng)網(wǎng)絡(luò)的關(guān)系是什么 10、圖像識別原理 |
一、大數(shù)據(jù)分析挖掘技術(shù)介紹 1、map/reduce 2、mahout數(shù)據(jù)挖掘 3、sql on hadoop 4、spark生態(tài)體系 5、R語言 6、MPI并行計(jì)算 7、GPU并行計(jì)算(深度學(xué)習(xí)) 8、java并行計(jì)算框架 |
二、常用機(jī)器學(xué)習(xí)算法原理 1、決策樹 2、隨機(jī)森林 3、協(xié)同過濾推薦算法(余弦相似、修正余弦) 4、Jaccard算法 5、樸素貝葉斯算法 6、k-means聚類算法 7、pagerank算法 8、邏輯回歸 9、圖計(jì)算 |
三、大數(shù)據(jù)挖掘業(yè)務(wù)場景和生產(chǎn)平臺 1、互聯(lián)網(wǎng)金融業(yè)務(wù)—如何構(gòu)建阿里金融系統(tǒng) 2、銀行客戶需求業(yè)務(wù) 3、大數(shù)據(jù)分析生產(chǎn)平臺 4、推薦/廣告系統(tǒng)的原理、架構(gòu)、模型、驗(yàn)證等。 5、基于GBDT的組合模型架構(gòu) |
四、編程實(shí)踐(動手) 1、迭代類機(jī)器學(xué)習(xí)編程入門-求圓周率 2、pagerank的并行化實(shí)現(xiàn)(*) 3、邏輯回歸算法的java實(shí)現(xiàn) 4、決策樹c45,id3的java實(shí)現(xiàn) 5、隨機(jī)森林和全樹并行化實(shí)現(xiàn) 6、訓(xùn)練數(shù)據(jù)和結(jié)果模擬器 7、模型結(jié)果規(guī)則化處理 8、協(xié)同過濾java實(shí)現(xiàn) 9、基于圖計(jì)算的推薦java實(shí)現(xiàn) |
五、神經(jīng)網(wǎng)絡(luò)及深度學(xué)習(xí) 1、什么是神經(jīng)網(wǎng)絡(luò)算法 2、多層神經(jīng)網(wǎng)絡(luò)程序如何實(shí)現(xiàn)(java程序) 3、神經(jīng)網(wǎng)絡(luò)數(shù)學(xué)原理(誤差函數(shù)、梯度下降求最小值、更新權(quán)重和截距) 4、推導(dǎo)需要的最小化數(shù)學(xué)知識(導(dǎo)數(shù)和偏導(dǎo)數(shù)、導(dǎo)數(shù)運(yùn)算、梯度下降原理) 5、數(shù)學(xué)推導(dǎo)過程 6、什么是深度學(xué)習(xí) 7、深度學(xué)習(xí)的計(jì)算過程 8、深度學(xué)習(xí)如何訓(xùn)練 9、深度學(xué)習(xí)和神經(jīng)網(wǎng)絡(luò)的關(guān)系是什么 10、圖像識別原理 |