工程師
其他
Python
數(shù)據(jù)分析
推薦課程
average > 0 ? $model->average . '分' : '10.0分' ?>

Python數(shù)據(jù)分析案例實戰(zhàn)培訓

劉老師

某知名咨詢公司 云平臺系統(tǒng)架構師

畢業(yè)于?連理??學
簡介:
精通開源的?數(shù)據(jù)?態(tài)技術和架構,Hadoop、Hive、Hbase、 Spark、Flink等開源技術棧。
有10年左右基于?數(shù)據(jù)解決?案平臺、數(shù)據(jù)架構、數(shù)據(jù)中臺、數(shù)據(jù)治理、數(shù)據(jù)分析和挖掘的?型數(shù)據(jù)湖和數(shù)
據(jù)中臺項?架構實施經(jīng)驗,
?前任職國內知名咨詢公司,先后服務于北京?學軟件研究所、阿?巴巴、Teradata,實施過基于開源?數(shù)據(jù)技術
棧的數(shù)據(jù)湖解決?案和實施、湖倉?體架構咨詢和實施、數(shù)據(jù)中臺的咨詢和設施
最近主要項?介紹:
某移動?數(shù)據(jù)平臺架構設計和設施 (Hadoop、Spark)
四??之?的數(shù)據(jù)湖咨詢和實施
某?型商業(yè)銀?數(shù)據(jù)中臺咨詢
某銀?基于開源?數(shù)據(jù)技術棧數(shù)據(jù)中臺的咨詢和實施
某航空公司數(shù)據(jù)平臺流批?體解決?案和實施
特長:
在?數(shù)據(jù)架構、開發(fā)、運維和優(yōu)化、數(shù)據(jù)集成、 數(shù)據(jù)湖(Data Lake)、數(shù)據(jù)建模、數(shù)據(jù)挖掘/機器學習、數(shù)據(jù)
中臺等??有豐富經(jīng) 驗。

畢業(yè)于?連理??學 簡介: 精通開源的?數(shù)據(jù)?態(tài)技術和架構,Hadoop、Hive、Hbase、 Spark、Flink等開源技術棧。 有10年左右基于?數(shù)據(jù)解決?案平臺、數(shù)據(jù)架構、數(shù)據(jù)中臺、數(shù)據(jù)治理、數(shù)據(jù)分析和挖掘的?型數(shù)據(jù)湖和數(shù) 據(jù)中臺項?架構實施經(jīng)驗, ?前任職國內知名咨詢公司,先后服務于北京?學軟件研究所、阿?巴巴、Teradata,實施過基于開源?數(shù)據(jù)技術 棧的數(shù)據(jù)湖解決?案和實施、湖倉?體架構咨詢和實施、數(shù)據(jù)中臺的咨詢和設施 最近主要項?介紹: 某移動?數(shù)據(jù)平臺架構設計和設施 (Hadoop、Spark) 四??之?的數(shù)據(jù)湖咨詢和實施 某?型商業(yè)銀?數(shù)據(jù)中臺咨詢 某銀?基于開源?數(shù)據(jù)技術棧數(shù)據(jù)中臺的咨詢和實施 某航空公司數(shù)據(jù)平臺流批?體解決?案和實施 特長: 在?數(shù)據(jù)架構、開發(fā)、運維和優(yōu)化、數(shù)據(jù)集成、 數(shù)據(jù)湖(Data Lake)、數(shù)據(jù)建模、數(shù)據(jù)挖掘/機器學習、數(shù)據(jù) 中臺等??有豐富經(jīng) 驗。

課程費用

6800.00 /人

課程時長

2

成為教練

課程簡介

課程涵蓋數(shù)據(jù)分析和挖掘流程、常用工具介紹及五個項目實戰(zhàn),包括用戶消費行為分析、數(shù)據(jù)分析營銷案例、餐廳訂單數(shù)據(jù)分析、物流數(shù)據(jù)分析和用戶流失模型構建。通過實操演練,學員將掌握數(shù)據(jù)預處理、特征工程、建模與評估等技能,并能運用所學知識解決實際業(yè)務問題。本課程適合數(shù)據(jù)分析師、數(shù)據(jù)科學家等角色,旨在提升學員的Python數(shù)據(jù)分析和挖掘能力。

目標收益

培訓對象

課程大綱

第一天
數(shù)據(jù)分析和挖掘流程介紹
數(shù)據(jù)挖掘的基本任務
定義分析和挖掘目標
數(shù)據(jù)取樣
數(shù)據(jù)探索
單變量數(shù)據(jù)探索
數(shù)據(jù)關聯(lián)性分析
數(shù)據(jù)預處理
數(shù)據(jù)特征工程構建和選擇
挖掘建模
模型評價
數(shù)據(jù)分析和挖掘常用的工具 Jupyter工具介紹和使用
Numpy基本使用
Pandas基本使用
數(shù)據(jù)加載與處理
Pandas分組與合并
Pandas時間序列
Matplotlib基本使用
Scikit-Learn基本使用
PySpark工具介紹
項目實戰(zhàn)一:
用戶消費行為數(shù)據(jù)分析實戰(zhàn)
項目介紹和需求分析
數(shù)據(jù)介紹和數(shù)據(jù)導入
數(shù)據(jù)預處理
用戶個體消費數(shù)據(jù)分析
用戶消費行為數(shù)據(jù)分析
用戶分層RFM模型
新用戶、活躍用戶、回流用戶和用戶流失分析
用戶購買周期分析
用戶生命周期分析
用戶復購率分析
用戶回購分析
用戶營銷和推薦分析
項目總結和報告撰寫
項目實戰(zhàn)二:
數(shù)據(jù)分析營銷案例實戰(zhàn)
一、數(shù)據(jù)概況分析
? 數(shù)據(jù)概況
? 數(shù)據(jù)清洗
二、單變量分析
? 觀察樣本0、1的平衡性
? 觀察均值大小
? 可視化
三、相關性分析和可視化
四、邏輯回歸模型的建立和評估
? 模型建立
? 模型評估
? 模型優(yōu)化
五、業(yè)務價值
六、模型管理、發(fā)布和調用
第二天
項目實戰(zhàn)三:
餐廳訂單數(shù)據(jù)分析實戰(zhàn)
一、數(shù)據(jù)概況分析
? 數(shù)據(jù)概況
? 數(shù)據(jù)清洗
最受歡迎的菜單分析及可視化展示
訂單消費維度分析及可視化展示
日期與時間維度分析及可視化展示
菜單組合營銷分析
項目總結
項目實戰(zhàn)四:
物流數(shù)據(jù)粉實戰(zhàn)
需求分析
數(shù)據(jù)預處理-重復值、缺失值、數(shù)據(jù)格式調整
異常值和偏態(tài)分布處理
月份列的數(shù)據(jù)格式處理
貨品配送服務分析
銷售區(qū)域潛力分析
商品質量分析
項目總結
項目實戰(zhàn)五:
用戶流失模型實戰(zhàn)
技術架構介紹
流失模型構建
-數(shù)據(jù)清洗和轉換
-空值和異常值處理
-數(shù)據(jù)歸一化
-特征提取
-特征的降維和升維
-文本的數(shù)據(jù)化
決策樹和隨機森林介紹
基于Python的用戶流失模型開發(fā)
模型測試
第一天
數(shù)據(jù)分析和挖掘流程介紹
數(shù)據(jù)挖掘的基本任務
定義分析和挖掘目標
數(shù)據(jù)取樣
數(shù)據(jù)探索
單變量數(shù)據(jù)探索
數(shù)據(jù)關聯(lián)性分析
數(shù)據(jù)預處理
數(shù)據(jù)特征工程構建和選擇
挖掘建模
模型評價
數(shù)據(jù)分析和挖掘常用的工具
Jupyter工具介紹和使用
Numpy基本使用
Pandas基本使用
數(shù)據(jù)加載與處理
Pandas分組與合并
Pandas時間序列
Matplotlib基本使用
Scikit-Learn基本使用
PySpark工具介紹
項目實戰(zhàn)一:
用戶消費行為數(shù)據(jù)分析實戰(zhàn)
項目介紹和需求分析
數(shù)據(jù)介紹和數(shù)據(jù)導入
數(shù)據(jù)預處理
用戶個體消費數(shù)據(jù)分析
用戶消費行為數(shù)據(jù)分析
用戶分層RFM模型
新用戶、活躍用戶、回流用戶和用戶流失分析
用戶購買周期分析
用戶生命周期分析
用戶復購率分析
用戶回購分析
用戶營銷和推薦分析
項目總結和報告撰寫
項目實戰(zhàn)二:
數(shù)據(jù)分析營銷案例實戰(zhàn)
一、數(shù)據(jù)概況分析
? 數(shù)據(jù)概況
? 數(shù)據(jù)清洗
二、單變量分析
? 觀察樣本0、1的平衡性
? 觀察均值大小
? 可視化
三、相關性分析和可視化
四、邏輯回歸模型的建立和評估
? 模型建立
? 模型評估
? 模型優(yōu)化
五、業(yè)務價值
六、模型管理、發(fā)布和調用
第二天
項目實戰(zhàn)三:
餐廳訂單數(shù)據(jù)分析實戰(zhàn)
一、數(shù)據(jù)概況分析
? 數(shù)據(jù)概況
? 數(shù)據(jù)清洗
最受歡迎的菜單分析及可視化展示
訂單消費維度分析及可視化展示
日期與時間維度分析及可視化展示
菜單組合營銷分析
項目總結
項目實戰(zhàn)四:
物流數(shù)據(jù)粉實戰(zhàn)
需求分析
數(shù)據(jù)預處理-重復值、缺失值、數(shù)據(jù)格式調整
異常值和偏態(tài)分布處理
月份列的數(shù)據(jù)格式處理
貨品配送服務分析
銷售區(qū)域潛力分析
商品質量分析
項目總結
項目實戰(zhàn)五:
用戶流失模型實戰(zhàn)
技術架構介紹
流失模型構建
-數(shù)據(jù)清洗和轉換
-空值和異常值處理
-數(shù)據(jù)歸一化
-特征提取
-特征的降維和升維
-文本的數(shù)據(jù)化
決策樹和隨機森林介紹
基于Python的用戶流失模型開發(fā)
模型測試

活動詳情

提交需求