架構(gòu)師
互聯(lián)網(wǎng)
電商
支付平臺
傳統(tǒng)金融
互聯(lián)網(wǎng)金融
可穿戴設備
醫(yī)療
智能家居
物聯(lián)網(wǎng)
車聯(lián)網(wǎng)
安全
制造
電信
政府機構(gòu)
稅務
快消品
其他
大數(shù)據(jù)
推薦課程
average > 0 ? $model->average . '分' : '10.0分' ?>

大數(shù)據(jù)建模與分析挖掘應用實戰(zhàn)

劉老師

某知名咨詢公司 云平臺系統(tǒng)架構(gòu)師

畢業(yè)于?連理??學
簡介:
精通開源的?數(shù)據(jù)?態(tài)技術(shù)和架構(gòu),Hadoop、Hive、Hbase、 Spark、Flink等開源技術(shù)棧。
有10年左右基于?數(shù)據(jù)解決?案平臺、數(shù)據(jù)架構(gòu)、數(shù)據(jù)中臺、數(shù)據(jù)治理、數(shù)據(jù)分析和挖掘的?型數(shù)據(jù)湖和數(shù)
據(jù)中臺項?架構(gòu)實施經(jīng)驗,
?前任職國內(nèi)知名咨詢公司,先后服務于北京?學軟件研究所、阿?巴巴、Teradata,實施過基于開源?數(shù)據(jù)技術(shù)
棧的數(shù)據(jù)湖解決?案和實施、湖倉?體架構(gòu)咨詢和實施、數(shù)據(jù)中臺的咨詢和設施
最近主要項?介紹:
某移動?數(shù)據(jù)平臺架構(gòu)設計和設施 (Hadoop、Spark)
四??之?的數(shù)據(jù)湖咨詢和實施
某?型商業(yè)銀?數(shù)據(jù)中臺咨詢
某銀?基于開源?數(shù)據(jù)技術(shù)棧數(shù)據(jù)中臺的咨詢和實施
某航空公司數(shù)據(jù)平臺流批?體解決?案和實施
特長:
在?數(shù)據(jù)架構(gòu)、開發(fā)、運維和優(yōu)化、數(shù)據(jù)集成、 數(shù)據(jù)湖(Data Lake)、數(shù)據(jù)建模、數(shù)據(jù)挖掘/機器學習、數(shù)據(jù)
中臺等??有豐富經(jīng) 驗。

畢業(yè)于?連理??學 簡介: 精通開源的?數(shù)據(jù)?態(tài)技術(shù)和架構(gòu),Hadoop、Hive、Hbase、 Spark、Flink等開源技術(shù)棧。 有10年左右基于?數(shù)據(jù)解決?案平臺、數(shù)據(jù)架構(gòu)、數(shù)據(jù)中臺、數(shù)據(jù)治理、數(shù)據(jù)分析和挖掘的?型數(shù)據(jù)湖和數(shù) 據(jù)中臺項?架構(gòu)實施經(jīng)驗, ?前任職國內(nèi)知名咨詢公司,先后服務于北京?學軟件研究所、阿?巴巴、Teradata,實施過基于開源?數(shù)據(jù)技術(shù) 棧的數(shù)據(jù)湖解決?案和實施、湖倉?體架構(gòu)咨詢和實施、數(shù)據(jù)中臺的咨詢和設施 最近主要項?介紹: 某移動?數(shù)據(jù)平臺架構(gòu)設計和設施 (Hadoop、Spark) 四??之?的數(shù)據(jù)湖咨詢和實施 某?型商業(yè)銀?數(shù)據(jù)中臺咨詢 某銀?基于開源?數(shù)據(jù)技術(shù)棧數(shù)據(jù)中臺的咨詢和實施 某航空公司數(shù)據(jù)平臺流批?體解決?案和實施 特長: 在?數(shù)據(jù)架構(gòu)、開發(fā)、運維和優(yōu)化、數(shù)據(jù)集成、 數(shù)據(jù)湖(Data Lake)、數(shù)據(jù)建模、數(shù)據(jù)挖掘/機器學習、數(shù)據(jù) 中臺等??有豐富經(jīng) 驗。

課程費用

5800.00 /人

課程時長

2

成為教練

課程簡介

大數(shù)據(jù)建模與分析挖掘技術(shù)已經(jīng)逐步地應用到新興互聯(lián)網(wǎng)企業(yè)(如電子商務網(wǎng)站、搜索引擎、社交網(wǎng)站、互聯(lián)網(wǎng)廣告服務提供商等)、銀行金融證券企業(yè)、電信運營等行業(yè),給這些行業(yè)帶來了一定的數(shù)據(jù)價值增值作用。

目標收益

1.本課程讓學員充分掌握大數(shù)據(jù)平臺技術(shù)架構(gòu)、大數(shù)據(jù)分析的基本理論、大數(shù)據(jù)分析挖掘應用實戰(zhàn)技能、國內(nèi)外主流的大數(shù)據(jù)分析與BI商業(yè)智能分析解決方案、以及大數(shù)據(jù)分析在搜索引擎、廣告服務推薦、電商數(shù)據(jù)分析、金融客戶分析方面的應用案例。
2.本課程強調(diào)主流的大數(shù)據(jù)分析挖掘算法技術(shù)的應用和分析平臺的實施,讓學員掌握主流的基于大數(shù)據(jù)Hadoop和Spark、R的大數(shù)據(jù)分析平臺架構(gòu)和實際應用,并用結(jié)合實際的生產(chǎn)系統(tǒng)案例進行教學,掌握基于Hadoop大數(shù)據(jù)平臺的數(shù)據(jù)挖掘和數(shù)據(jù)倉庫分布式系統(tǒng)平臺應用,以及商業(yè)和開源的數(shù)據(jù)分析產(chǎn)品加上Hadoop平臺形成大數(shù)據(jù)分析平臺的應用剖析。

培訓對象

課程大綱

數(shù)據(jù)建模概念 ?為什么要數(shù)據(jù)建模
?數(shù)據(jù)建模解決哪些問題
?什么是邏輯數(shù)據(jù)模型
?模型設計的流程
?邏輯模型設計
?物理模型設計
?數(shù)據(jù)建模的工具介紹
基于大數(shù)據(jù)平臺分析和挖掘工具 ?業(yè)界主流的基于Hadoop和Spark的大數(shù)據(jù)分析挖掘項目解決方案
?業(yè)界數(shù)據(jù)倉庫與數(shù)據(jù)分析挖掘平臺軟件工具
?Hadoop數(shù)據(jù)倉庫工具Hive、Tez、Kylin和Presto
?Spark實時數(shù)據(jù)倉庫工具SparkSQL
?Spark機器學習與數(shù)據(jù)分析挖掘工具MLlib和SparkR
?大數(shù)據(jù)分析挖掘項目的實施步驟
數(shù)據(jù)集成 ?日志數(shù)據(jù)解析和導入導出到數(shù)據(jù)倉庫的操作訓練
?從原始搜索數(shù)據(jù)集中抽取、集成數(shù)據(jù),整理后形成規(guī)范的數(shù)據(jù)倉庫
?數(shù)據(jù)分析挖掘模塊從大型的集中式數(shù)據(jù)倉庫中訪問數(shù)據(jù),一個數(shù)據(jù)倉庫面向一個主題,構(gòu)建兩個數(shù)據(jù)倉庫
?同一個數(shù)據(jù)倉庫中的事實表數(shù)據(jù),可以給多個不同類型的分析挖掘任務調(diào)用
?去除噪聲
HIVE數(shù)據(jù)倉庫集群的多維分析建模應用實踐 ?基于Hadoop的大型分布式數(shù)據(jù)倉庫在行業(yè)中的數(shù)據(jù)倉庫應用案例
?Hive數(shù)據(jù)倉庫集群的平臺體系結(jié)構(gòu)、核心技術(shù)剖析
?Hive Server的工作原理、機制與應用
?Hive數(shù)據(jù)倉庫集群的安裝部署與配置優(yōu)化
?Hive應用開發(fā)技巧
?Hive SQL剖析與應用實踐
?Hive數(shù)據(jù)倉庫表與表分區(qū)、表操作、數(shù)據(jù)導入導出、客戶端操作技巧
?Hive數(shù)據(jù)倉庫報表設計
?將原始的日志數(shù)據(jù)集,經(jīng)過整理后,加載至Hadoop + Hive數(shù)據(jù)倉庫集群中,用于共享訪問
R語言介紹 ?R語言介紹
?R語言常用的分析庫介紹
?R語言開發(fā)環(huán)境介紹
?R分析分析和挖掘案例實戰(zhàn)
?Spark和R的整合
聚類分析建模與挖掘算法的實現(xiàn)原理和技術(shù)應用 ?聚類分析建模與算法原理及其在Spark MLlib中的實現(xiàn)與應用,包括:
a)Canopy聚類(canopy clustering)
b)K均值算法(K-means clustering)
c)模糊K均值(Fuzzy K-means clustering)
d)EM聚類,即期望最大化聚類(Expectation Maximization)
e)以上算法在Spark MLib中的實現(xiàn)原理和實際場景中的應用案例。
?Spark聚類分析算法程序示例
分類分析建模與挖掘算法的實現(xiàn)原理和技術(shù)應用 ?分類分析建模與算法原理及其在Spark MLlib中的實現(xiàn)與應用, 包括:
a.Spark決策樹算法實現(xiàn)
b.邏輯回歸算法(logistics regression)
c.貝葉斯算法(Bayesian與Cbeyes)
d.支持向量機(Support vector machine)
e.以上算法在Spark MLlib中的實現(xiàn)原理和實際場景中的應用案例。
?Spark客戶資料分析與給用戶貼標簽的程序示例
?Spark實現(xiàn)給商品貼標簽的程序示例
?Spark實現(xiàn)用戶行為的自動標簽和深度技術(shù)
推薦分析挖掘模型與算法技術(shù)應用 ?推薦算法原理及其在Spark MLlib中的實現(xiàn)與應用,包括:
a)Spark協(xié)同過濾算法程序示例
b)Item-based協(xié)同過濾與推薦
c)User-based協(xié)同過濾與推薦
?交叉銷售推薦模型及其實現(xiàn)
回歸分析模型與預測算法 ?利用線性回歸(多元回歸)實現(xiàn)訪問量預測
?利用非線性回歸預測成交量和訪問量的關(guān)系
?基于SparkR實現(xiàn)回歸分析模型及其應用操作
?Spark回歸程序?qū)崿F(xiàn)異常點檢測的程序示例
Spark Graphx數(shù)據(jù)挖掘 ?Spark Graphx介紹
?GraphxFrame介紹
?復雜社交網(wǎng)落分析實戰(zhàn)
?圖分析實戰(zhàn)
數(shù)據(jù)建模概念
?為什么要數(shù)據(jù)建模
?數(shù)據(jù)建模解決哪些問題
?什么是邏輯數(shù)據(jù)模型
?模型設計的流程
?邏輯模型設計
?物理模型設計
?數(shù)據(jù)建模的工具介紹
基于大數(shù)據(jù)平臺分析和挖掘工具
?業(yè)界主流的基于Hadoop和Spark的大數(shù)據(jù)分析挖掘項目解決方案
?業(yè)界數(shù)據(jù)倉庫與數(shù)據(jù)分析挖掘平臺軟件工具
?Hadoop數(shù)據(jù)倉庫工具Hive、Tez、Kylin和Presto
?Spark實時數(shù)據(jù)倉庫工具SparkSQL
?Spark機器學習與數(shù)據(jù)分析挖掘工具MLlib和SparkR
?大數(shù)據(jù)分析挖掘項目的實施步驟
數(shù)據(jù)集成
?日志數(shù)據(jù)解析和導入導出到數(shù)據(jù)倉庫的操作訓練
?從原始搜索數(shù)據(jù)集中抽取、集成數(shù)據(jù),整理后形成規(guī)范的數(shù)據(jù)倉庫
?數(shù)據(jù)分析挖掘模塊從大型的集中式數(shù)據(jù)倉庫中訪問數(shù)據(jù),一個數(shù)據(jù)倉庫面向一個主題,構(gòu)建兩個數(shù)據(jù)倉庫
?同一個數(shù)據(jù)倉庫中的事實表數(shù)據(jù),可以給多個不同類型的分析挖掘任務調(diào)用
?去除噪聲
HIVE數(shù)據(jù)倉庫集群的多維分析建模應用實踐
?基于Hadoop的大型分布式數(shù)據(jù)倉庫在行業(yè)中的數(shù)據(jù)倉庫應用案例
?Hive數(shù)據(jù)倉庫集群的平臺體系結(jié)構(gòu)、核心技術(shù)剖析
?Hive Server的工作原理、機制與應用
?Hive數(shù)據(jù)倉庫集群的安裝部署與配置優(yōu)化
?Hive應用開發(fā)技巧
?Hive SQL剖析與應用實踐
?Hive數(shù)據(jù)倉庫表與表分區(qū)、表操作、數(shù)據(jù)導入導出、客戶端操作技巧
?Hive數(shù)據(jù)倉庫報表設計
?將原始的日志數(shù)據(jù)集,經(jīng)過整理后,加載至Hadoop + Hive數(shù)據(jù)倉庫集群中,用于共享訪問
R語言介紹
?R語言介紹
?R語言常用的分析庫介紹
?R語言開發(fā)環(huán)境介紹
?R分析分析和挖掘案例實戰(zhàn)
?Spark和R的整合
聚類分析建模與挖掘算法的實現(xiàn)原理和技術(shù)應用
?聚類分析建模與算法原理及其在Spark MLlib中的實現(xiàn)與應用,包括:
a)Canopy聚類(canopy clustering)
b)K均值算法(K-means clustering)
c)模糊K均值(Fuzzy K-means clustering)
d)EM聚類,即期望最大化聚類(Expectation Maximization)
e)以上算法在Spark MLib中的實現(xiàn)原理和實際場景中的應用案例。
?Spark聚類分析算法程序示例
分類分析建模與挖掘算法的實現(xiàn)原理和技術(shù)應用
?分類分析建模與算法原理及其在Spark MLlib中的實現(xiàn)與應用, 包括:
a.Spark決策樹算法實現(xiàn)
b.邏輯回歸算法(logistics regression)
c.貝葉斯算法(Bayesian與Cbeyes)
d.支持向量機(Support vector machine)
e.以上算法在Spark MLlib中的實現(xiàn)原理和實際場景中的應用案例。
?Spark客戶資料分析與給用戶貼標簽的程序示例
?Spark實現(xiàn)給商品貼標簽的程序示例
?Spark實現(xiàn)用戶行為的自動標簽和深度技術(shù)
推薦分析挖掘模型與算法技術(shù)應用
?推薦算法原理及其在Spark MLlib中的實現(xiàn)與應用,包括:
a)Spark協(xié)同過濾算法程序示例
b)Item-based協(xié)同過濾與推薦
c)User-based協(xié)同過濾與推薦
?交叉銷售推薦模型及其實現(xiàn)
回歸分析模型與預測算法
?利用線性回歸(多元回歸)實現(xiàn)訪問量預測
?利用非線性回歸預測成交量和訪問量的關(guān)系
?基于SparkR實現(xiàn)回歸分析模型及其應用操作
?Spark回歸程序?qū)崿F(xiàn)異常點檢測的程序示例
Spark Graphx數(shù)據(jù)挖掘
?Spark Graphx介紹
?GraphxFrame介紹
?復雜社交網(wǎng)落分析實戰(zhàn)
?圖分析實戰(zhàn)

課程費用

5800.00 /人

課程時長

2

預約體驗票 我要分享

近期公開課推薦

近期公開課推薦

活動詳情

提交需求