工程師
互聯(lián)網(wǎng)
產(chǎn)品設計
商業(yè)模式
大數(shù)據(jù)
數(shù)據(jù)挖掘
互聯(lián)網(wǎng)金融
數(shù)據(jù)分析
推薦課程
average > 0 ? $model->average . '分' : '10.0分' ?>

大數(shù)據(jù)治理落地實戰(zhàn):數(shù)據(jù)收集、清洗、融合、挖掘

風清揚

Dataware 數(shù)據(jù)挖掘博士

原58同城數(shù)據(jù)智能部總監(jiān)負責人,英國帝國理工數(shù)據(jù)挖掘博士。他長期從事推薦引擎、社交圖譜及興趣圖譜挖掘、計算廣告等方面深入研發(fā)工作,是大數(shù)據(jù)挖掘和智能系統(tǒng)的資深專家。他目前全面負責58同城大數(shù)據(jù)智能分析和挖掘的建設。曾擔任人人網(wǎng)應用研究中心負責人,兼任人人網(wǎng)清華聯(lián)合實驗室負責人,總體負責人人網(wǎng)社交網(wǎng)絡中社交關系鏈挖掘、好友推薦、興趣偏好及熱點趨勢挖掘、圖像處理和識別的研發(fā)工作。曾從事百度商務搜索部鳳巢廣告系統(tǒng)研發(fā)。他擅長產(chǎn)品技術創(chuàng)新,目前擁有10多個相關專利。他是中科院大學工程與信息技術學院大數(shù)據(jù)方向專家委員會特聘委員。

原58同城數(shù)據(jù)智能部總監(jiān)負責人,英國帝國理工數(shù)據(jù)挖掘博士。他長期從事推薦引擎、社交圖譜及興趣圖譜挖掘、計算廣告等方面深入研發(fā)工作,是大數(shù)據(jù)挖掘和智能系統(tǒng)的資深專家。他目前全面負責58同城大數(shù)據(jù)智能分析和挖掘的建設。曾擔任人人網(wǎng)應用研究中心負責人,兼任人人網(wǎng)清華聯(lián)合實驗室負責人,總體負責人人網(wǎng)社交網(wǎng)絡中社交關系鏈挖掘、好友推薦、興趣偏好及熱點趨勢挖掘、圖像處理和識別的研發(fā)工作。曾從事百度商務搜索部鳳巢廣告系統(tǒng)研發(fā)。他擅長產(chǎn)品技術創(chuàng)新,目前擁有10多個相關專利。他是中科院大學工程與信息技術學院大數(shù)據(jù)方向專家委員會特聘委員。

課程費用

68000.00 /人

課程時長

2

成為教練

課程簡介

課程大數(shù)據(jù)分析處理技術的難度值:高;
課程大數(shù)據(jù)挖掘的難度值:中;
產(chǎn)品和案例面的豐富度:中;
商業(yè)模式創(chuàng)新和組織架構面詳盡度:低。

本課程將圍繞大數(shù)據(jù)治理的全流程展開講解。從大數(shù)據(jù)的思維培養(yǎng)、大數(shù) 據(jù)產(chǎn)品思維、大數(shù)據(jù)分析和治理方法、大數(shù)據(jù)工具和挖掘技術等層 面,從互聯(lián)網(wǎng)應用和傳統(tǒng)企業(yè)的業(yè)務場景諸多角度多領域做實站案例講 解。該課程使學員: n 理解大數(shù)據(jù)基本概念,理解大數(shù)據(jù)幫助企業(yè)進行商業(yè)模式創(chuàng)新的方法 和思維 n 理解大數(shù)據(jù)團隊構成和組織架構建設的重要性和方法 n 理解大數(shù)據(jù)產(chǎn)品設計思維和業(yè)務創(chuàng)新的方法 n 理解大數(shù)據(jù)收集、清洗、融合、挖掘及應用技術架構從零開始建設的 方法 n 理解大數(shù)據(jù)行業(yè)發(fā)展的現(xiàn)狀:大數(shù)據(jù)在傳統(tǒng)行業(yè)和 TMT 企業(yè)中的應用 情況、對業(yè)務提升的影響結果。 n 介紹大量大數(shù)據(jù)在互聯(lián)網(wǎng)應用中的智能化產(chǎn)品和技術解決方案作為借 鑒。這些應用包括 O2O、本地生活服務、社交型應用、互聯(lián)網(wǎng)金融、支 付、保險類型應用等 n 介紹大量大數(shù)據(jù)在傳統(tǒng)企業(yè)管理中的智能化產(chǎn)品和技術解決方案作為 借鑒。這些應用包括物流、企業(yè)外部環(huán)境認知、戰(zhàn)略分析、企業(yè)客戶關 系管理等。相關的傳統(tǒng)行業(yè)包括電信、銀行、印刷、文化藝術、零售、 制造等

目標收益

培訓對象

企業(yè)高管、產(chǎn)品及運營負責人、項目負責人、技術負責人、數(shù) 據(jù)分析師、數(shù)據(jù)挖掘工程師

課程內容

大量大數(shù)據(jù)真實實踐案例,重點傳統(tǒng)企業(yè)如何借鑒互聯(lián)網(wǎng)大數(shù)據(jù)商業(yè)模式發(fā)展方法來取得自身企業(yè)發(fā)展進行探討。最后強調:大數(shù)據(jù)不僅是一種技術和工具,更是企業(yè)治理和企業(yè)發(fā)現(xiàn)藍海商業(yè)模式的重要發(fā)方法輪。

課程大綱

一、大數(shù)據(jù)思維模式建立及組織架構建設 1.大數(shù)據(jù)概述
1.1 奧斯卡 3 項大獎電影“點球成金”揭示了什么?
1.2 全球著名的咨詢服務公司 Gartner 怎么看大數(shù)據(jù)?
1.3 大數(shù)據(jù)本質特征概述
1.4 大數(shù)據(jù)能解決什么問題?

2 大數(shù)據(jù)驅動商業(yè)模式創(chuàng)新
2.1 “互聯(lián)網(wǎng)+”驅動新的商業(yè)模式創(chuàng)新
2.2 “大數(shù)據(jù)+”驅動新的商業(yè)模式創(chuàng)新
2.3 成功“大數(shù)據(jù)+”企業(yè)戰(zhàn)略實施案例
2.4 大數(shù)據(jù)企業(yè)戰(zhàn)略和項目實施方法總結和禁忌點

3 大數(shù)據(jù)團隊建設
3.1 大數(shù)據(jù)公司(部門)的都在做什么?
3.2 大數(shù)據(jù)團隊組成

4 “大數(shù)據(jù)+”行業(yè)應用案例簡述
4.1 Target 孕婦案例及沃爾瑪啤酒尿布案例
4.2 TMobile 用戶流失案例
4.3 LV 旗艦試衣間案例

5 概維智能智能化服務介紹
二 大數(shù)據(jù)分析入門與進階 1 數(shù)據(jù)分析技術
1.1 數(shù)據(jù)分析的數(shù)據(jù)類型
1.2 數(shù)據(jù)分析的流程設計
1.3 數(shù)據(jù)分析驅動運營常用方法
1.3.1 數(shù)據(jù)分析表設計
1.3.2 多維分解
1.3.3 用戶分群
1.3.4 用戶細查
1.3.5 漏斗分析
1.3.6 留存分析
1.4 數(shù)據(jù)運營案例分析
1.4.1 EDM 營銷數(shù)據(jù)分析

2 前端數(shù)據(jù)埋點采集技術
2.1 數(shù)據(jù)埋點是什么?
2.2 數(shù)據(jù)埋點數(shù)據(jù)采集內容設計
2.3 數(shù)據(jù)埋點分類:代碼埋點、可視化埋點、無痕埋點
2.4 代碼埋點案例
2.5 無痕埋點的技術架構
2.6 可視化埋點常用數(shù)據(jù)采集工具

3 大數(shù)據(jù)治理框架
3.1 大數(shù)據(jù)處理及架構
3.2 流式計算架構
3.3 分布式計算架構
3.4 規(guī)則引擎

4 業(yè)務數(shù)據(jù)分析進階:用戶畫像分析
4.1 數(shù)據(jù)分析通用體系
4.2 用戶畫像數(shù)據(jù)的構成
4.3 用戶畫像體系
4.4 用戶畫像的分析使用

5 數(shù)據(jù)挖掘技術
5.1 數(shù)據(jù)治理及智能化應用通用過程
5.2 大數(shù)據(jù)技術落地介紹
5.2.1 數(shù)據(jù)格式
5.2.2數(shù)據(jù)準備
5.2.3 選擇算法
5.2.4 模型訓練
5.2.5 模型評估
5.2.6 模型應用
5.2.7 使用命令行
5.3 挖掘案例:金融服務中用戶購買意愿建模分析
三 機器學習及人工智能技術 1 機器學習本質原理
1.1 分類學習的根源問題及解決
1.2 Bias、Variance 困境
1.3 均衡 Overfitting 和 Underfitting
2 機器學習常用算法
2.1 DecisionTree
2.2 NavieBayes
2.3 Logistic Regression
3 機器學習模型進階:多模型算法
3.1 Ensemble Selection
3.2 Bagging
3.3 Random Forest
3.4 Random Decision Tree (RDT)
3.5 Boosting
3.6 Meta-learning
3.7 Error-Correcting Output Codes (ECOC)
4 機器學習評估指標
4.1 Confusion Matrix
4.2 Accuracy 和 Error Rate
4.3 Precision 和 Recall
4.4 F-measure
4.5 Specificity, Sensitivity 和 G-mean
4.6 ROC 和 AUC
4.7 MSE 和 RMSE
4.8 如何選擇合適的數(shù)據(jù)挖掘評估指標:案例講解
5 企業(yè)算法應用架構設計
5.1 通用算法架構
5.2 統(tǒng)一應用接口
5.3 實驗分流平臺
5.4 業(yè)務算法內核
5.5 大數(shù)據(jù)模型內核
5.6 實時數(shù)據(jù)統(tǒng)計分析平臺
5.7 系統(tǒng)監(jiān)控平臺
四 企業(yè)大數(shù)據(jù)實戰(zhàn)應用案例 1 推薦引擎實戰(zhàn)
1.1 推薦引擎使用場景舉例
1.2 推薦引擎基本原理及主要挑戰(zhàn)
1.3 好友推薦引擎
1.4 二度好友模型:案例講解
(1).二度好友模型解決的問題
(2).二度好友模型的建模過程
(3).二度好友模型的效果評估
1.5 好友簇算法:案例講解
(1).好友簇算法解決的問題
(2).聚類方法原理
(3).好友簇算法的建模過程
(4).好友簇算法的效果評估
1.6 加好友申請接受率預估模型:案例講解
(1).加好友申請接受率預估解決的問題
(2).加好友申請接受率預估的建模過程
(3).加好友申請接受率預估的效果評估

2 社交網(wǎng)絡大數(shù)據(jù)實戰(zhàn)
2.1 社交圖譜挖掘介紹
2.1.1 社交網(wǎng)絡數(shù)據(jù)挑戰(zhàn)
2.1.2 社交網(wǎng)絡中的數(shù)據(jù)挖掘意義
2.1.3 社交圖譜挖掘主要任務
2.1.4 社交圖譜挖掘通用路標
2.2 社交圖譜挖掘案例講解:好友親密度模型
2.2.1 好友親密度模型的意義
2.2.2 經(jīng)典用戶行為分析建模方法簡介
2.2.3 好友親密度建模過程
2.2.4 好友親密度模型效果分析
2.3 社交圖譜挖掘案例講解:好友自動分組
2.3.1 好友智能分組的意義
2.3.2 社區(qū)發(fā)現(xiàn)簡介
2.3.3 好友自動分組建模過程
2.3.4 好友自動分組效果評估

3 瀏覽型及金融應用的數(shù)據(jù)挖掘實戰(zhàn)
3.1 互聯(lián)網(wǎng)應用的分類
3.2 瀏覽型應用中的大數(shù)據(jù)應用實例
3.2.1 全局唯一用戶識別 GUID
3.2.2 用戶及業(yè)務畫像
3.2.3 CTR 預估
3.3 金融支付保險應用中的大數(shù)據(jù)應用實例
3.3.1 用戶流失分析與預測
3.3.2 大數(shù)據(jù)用戶實時授信
3.3.3 大數(shù)據(jù)投資賬戶相似性檢測
3.3.4 大數(shù)據(jù)賬戶投資意愿預估
一、大數(shù)據(jù)思維模式建立及組織架構建設
1.大數(shù)據(jù)概述
1.1 奧斯卡 3 項大獎電影“點球成金”揭示了什么?
1.2 全球著名的咨詢服務公司 Gartner 怎么看大數(shù)據(jù)?
1.3 大數(shù)據(jù)本質特征概述
1.4 大數(shù)據(jù)能解決什么問題?

2 大數(shù)據(jù)驅動商業(yè)模式創(chuàng)新
2.1 “互聯(lián)網(wǎng)+”驅動新的商業(yè)模式創(chuàng)新
2.2 “大數(shù)據(jù)+”驅動新的商業(yè)模式創(chuàng)新
2.3 成功“大數(shù)據(jù)+”企業(yè)戰(zhàn)略實施案例
2.4 大數(shù)據(jù)企業(yè)戰(zhàn)略和項目實施方法總結和禁忌點

3 大數(shù)據(jù)團隊建設
3.1 大數(shù)據(jù)公司(部門)的都在做什么?
3.2 大數(shù)據(jù)團隊組成

4 “大數(shù)據(jù)+”行業(yè)應用案例簡述
4.1 Target 孕婦案例及沃爾瑪啤酒尿布案例
4.2 TMobile 用戶流失案例
4.3 LV 旗艦試衣間案例

5 概維智能智能化服務介紹
二 大數(shù)據(jù)分析入門與進階
1 數(shù)據(jù)分析技術
1.1 數(shù)據(jù)分析的數(shù)據(jù)類型
1.2 數(shù)據(jù)分析的流程設計
1.3 數(shù)據(jù)分析驅動運營常用方法
1.3.1 數(shù)據(jù)分析表設計
1.3.2 多維分解
1.3.3 用戶分群
1.3.4 用戶細查
1.3.5 漏斗分析
1.3.6 留存分析
1.4 數(shù)據(jù)運營案例分析
1.4.1 EDM 營銷數(shù)據(jù)分析

2 前端數(shù)據(jù)埋點采集技術
2.1 數(shù)據(jù)埋點是什么?
2.2 數(shù)據(jù)埋點數(shù)據(jù)采集內容設計
2.3 數(shù)據(jù)埋點分類:代碼埋點、可視化埋點、無痕埋點
2.4 代碼埋點案例
2.5 無痕埋點的技術架構
2.6 可視化埋點常用數(shù)據(jù)采集工具

3 大數(shù)據(jù)治理框架
3.1 大數(shù)據(jù)處理及架構
3.2 流式計算架構
3.3 分布式計算架構
3.4 規(guī)則引擎

4 業(yè)務數(shù)據(jù)分析進階:用戶畫像分析
4.1 數(shù)據(jù)分析通用體系
4.2 用戶畫像數(shù)據(jù)的構成
4.3 用戶畫像體系
4.4 用戶畫像的分析使用

5 數(shù)據(jù)挖掘技術
5.1 數(shù)據(jù)治理及智能化應用通用過程
5.2 大數(shù)據(jù)技術落地介紹
5.2.1 數(shù)據(jù)格式
5.2.2數(shù)據(jù)準備
5.2.3 選擇算法
5.2.4 模型訓練
5.2.5 模型評估
5.2.6 模型應用
5.2.7 使用命令行
5.3 挖掘案例:金融服務中用戶購買意愿建模分析
三 機器學習及人工智能技術
1 機器學習本質原理
1.1 分類學習的根源問題及解決
1.2 Bias、Variance 困境
1.3 均衡 Overfitting 和 Underfitting
2 機器學習常用算法
2.1 DecisionTree
2.2 NavieBayes
2.3 Logistic Regression
3 機器學習模型進階:多模型算法
3.1 Ensemble Selection
3.2 Bagging
3.3 Random Forest
3.4 Random Decision Tree (RDT)
3.5 Boosting
3.6 Meta-learning
3.7 Error-Correcting Output Codes (ECOC)
4 機器學習評估指標
4.1 Confusion Matrix
4.2 Accuracy 和 Error Rate
4.3 Precision 和 Recall
4.4 F-measure
4.5 Specificity, Sensitivity 和 G-mean
4.6 ROC 和 AUC
4.7 MSE 和 RMSE
4.8 如何選擇合適的數(shù)據(jù)挖掘評估指標:案例講解
5 企業(yè)算法應用架構設計
5.1 通用算法架構
5.2 統(tǒng)一應用接口
5.3 實驗分流平臺
5.4 業(yè)務算法內核
5.5 大數(shù)據(jù)模型內核
5.6 實時數(shù)據(jù)統(tǒng)計分析平臺
5.7 系統(tǒng)監(jiān)控平臺
四 企業(yè)大數(shù)據(jù)實戰(zhàn)應用案例
1 推薦引擎實戰(zhàn)
1.1 推薦引擎使用場景舉例
1.2 推薦引擎基本原理及主要挑戰(zhàn)
1.3 好友推薦引擎
1.4 二度好友模型:案例講解
(1).二度好友模型解決的問題
(2).二度好友模型的建模過程
(3).二度好友模型的效果評估
1.5 好友簇算法:案例講解
(1).好友簇算法解決的問題
(2).聚類方法原理
(3).好友簇算法的建模過程
(4).好友簇算法的效果評估
1.6 加好友申請接受率預估模型:案例講解
(1).加好友申請接受率預估解決的問題
(2).加好友申請接受率預估的建模過程
(3).加好友申請接受率預估的效果評估

2 社交網(wǎng)絡大數(shù)據(jù)實戰(zhàn)
2.1 社交圖譜挖掘介紹
2.1.1 社交網(wǎng)絡數(shù)據(jù)挑戰(zhàn)
2.1.2 社交網(wǎng)絡中的數(shù)據(jù)挖掘意義
2.1.3 社交圖譜挖掘主要任務
2.1.4 社交圖譜挖掘通用路標
2.2 社交圖譜挖掘案例講解:好友親密度模型
2.2.1 好友親密度模型的意義
2.2.2 經(jīng)典用戶行為分析建模方法簡介
2.2.3 好友親密度建模過程
2.2.4 好友親密度模型效果分析
2.3 社交圖譜挖掘案例講解:好友自動分組
2.3.1 好友智能分組的意義
2.3.2 社區(qū)發(fā)現(xiàn)簡介
2.3.3 好友自動分組建模過程
2.3.4 好友自動分組效果評估

3 瀏覽型及金融應用的數(shù)據(jù)挖掘實戰(zhàn)
3.1 互聯(lián)網(wǎng)應用的分類
3.2 瀏覽型應用中的大數(shù)據(jù)應用實例
3.2.1 全局唯一用戶識別 GUID
3.2.2 用戶及業(yè)務畫像
3.2.3 CTR 預估
3.3 金融支付保險應用中的大數(shù)據(jù)應用實例
3.3.1 用戶流失分析與預測
3.3.2 大數(shù)據(jù)用戶實時授信
3.3.3 大數(shù)據(jù)投資賬戶相似性檢測
3.3.4 大數(shù)據(jù)賬戶投資意愿預估

活動詳情

提交需求