課程簡介
課程涵蓋數(shù)據(jù)分析和挖掘流程、常用工具介紹及五個項目實戰(zhàn),包括用戶消費行為分析、數(shù)據(jù)分析營銷案例、餐廳訂單數(shù)據(jù)分析、物流數(shù)據(jù)分析和用戶流失模型構建。通過實操演練,學員將掌握數(shù)據(jù)預處理、特征工程、建模與評估等技能,并能運用所學知識解決實際業(yè)務問題。本課程適合數(shù)據(jù)分析師、數(shù)據(jù)科學家等角色,旨在提升學員的Python數(shù)據(jù)分析和挖掘能力。
目標收益
培訓對象
課程大綱
第一天 數(shù)據(jù)分析和挖掘流程介紹 |
數(shù)據(jù)挖掘的基本任務 定義分析和挖掘目標 數(shù)據(jù)取樣 數(shù)據(jù)探索 單變量數(shù)據(jù)探索 數(shù)據(jù)關聯(lián)性分析 數(shù)據(jù)預處理 數(shù)據(jù)特征工程構建和選擇 挖掘建模 模型評價 |
數(shù)據(jù)分析和挖掘常用的工具 |
Jupyter工具介紹和使用 Numpy基本使用 Pandas基本使用 數(shù)據(jù)加載與處理 Pandas分組與合并 Pandas時間序列 Matplotlib基本使用 Scikit-Learn基本使用 PySpark工具介紹 |
項目實戰(zhàn)一: 用戶消費行為數(shù)據(jù)分析實戰(zhàn) |
項目介紹和需求分析 數(shù)據(jù)介紹和數(shù)據(jù)導入 數(shù)據(jù)預處理 用戶個體消費數(shù)據(jù)分析 用戶消費行為數(shù)據(jù)分析 用戶分層RFM模型 新用戶、活躍用戶、回流用戶和用戶流失分析 用戶購買周期分析 用戶生命周期分析 用戶復購率分析 用戶回購分析 用戶營銷和推薦分析 項目總結和報告撰寫 |
項目實戰(zhàn)二: 數(shù)據(jù)分析營銷案例實戰(zhàn) |
一、數(shù)據(jù)概況分析 ? 數(shù)據(jù)概況 ? 數(shù)據(jù)清洗 二、單變量分析 ? 觀察樣本0、1的平衡性 ? 觀察均值大小 ? 可視化 三、相關性分析和可視化 四、邏輯回歸模型的建立和評估 ? 模型建立 ? 模型評估 ? 模型優(yōu)化 五、業(yè)務價值 六、模型管理、發(fā)布和調用 |
第二天 項目實戰(zhàn)三: 餐廳訂單數(shù)據(jù)分析實戰(zhàn) |
一、數(shù)據(jù)概況分析 ? 數(shù)據(jù)概況 ? 數(shù)據(jù)清洗 最受歡迎的菜單分析及可視化展示 訂單消費維度分析及可視化展示 日期與時間維度分析及可視化展示 菜單組合營銷分析 項目總結 |
項目實戰(zhàn)四: 物流數(shù)據(jù)粉實戰(zhàn) |
需求分析 數(shù)據(jù)預處理-重復值、缺失值、數(shù)據(jù)格式調整 異常值和偏態(tài)分布處理 月份列的數(shù)據(jù)格式處理 貨品配送服務分析 銷售區(qū)域潛力分析 商品質量分析 項目總結 |
項目實戰(zhàn)五: 用戶流失模型實戰(zhàn) |
技術架構介紹 流失模型構建 -數(shù)據(jù)清洗和轉換 -空值和異常值處理 -數(shù)據(jù)歸一化 -特征提取 -特征的降維和升維 -文本的數(shù)據(jù)化 決策樹和隨機森林介紹 基于Python的用戶流失模型開發(fā) 模型測試 |
第一天 數(shù)據(jù)分析和挖掘流程介紹 數(shù)據(jù)挖掘的基本任務 定義分析和挖掘目標 數(shù)據(jù)取樣 數(shù)據(jù)探索 單變量數(shù)據(jù)探索 數(shù)據(jù)關聯(lián)性分析 數(shù)據(jù)預處理 數(shù)據(jù)特征工程構建和選擇 挖掘建模 模型評價 |
數(shù)據(jù)分析和挖掘常用的工具 Jupyter工具介紹和使用 Numpy基本使用 Pandas基本使用 數(shù)據(jù)加載與處理 Pandas分組與合并 Pandas時間序列 Matplotlib基本使用 Scikit-Learn基本使用 PySpark工具介紹 |
項目實戰(zhàn)一: 用戶消費行為數(shù)據(jù)分析實戰(zhàn) 項目介紹和需求分析 數(shù)據(jù)介紹和數(shù)據(jù)導入 數(shù)據(jù)預處理 用戶個體消費數(shù)據(jù)分析 用戶消費行為數(shù)據(jù)分析 用戶分層RFM模型 新用戶、活躍用戶、回流用戶和用戶流失分析 用戶購買周期分析 用戶生命周期分析 用戶復購率分析 用戶回購分析 用戶營銷和推薦分析 項目總結和報告撰寫 |
項目實戰(zhàn)二: 數(shù)據(jù)分析營銷案例實戰(zhàn) 一、數(shù)據(jù)概況分析 ? 數(shù)據(jù)概況 ? 數(shù)據(jù)清洗 二、單變量分析 ? 觀察樣本0、1的平衡性 ? 觀察均值大小 ? 可視化 三、相關性分析和可視化 四、邏輯回歸模型的建立和評估 ? 模型建立 ? 模型評估 ? 模型優(yōu)化 五、業(yè)務價值 六、模型管理、發(fā)布和調用 |
第二天 項目實戰(zhàn)三: 餐廳訂單數(shù)據(jù)分析實戰(zhàn) 一、數(shù)據(jù)概況分析 ? 數(shù)據(jù)概況 ? 數(shù)據(jù)清洗 最受歡迎的菜單分析及可視化展示 訂單消費維度分析及可視化展示 日期與時間維度分析及可視化展示 菜單組合營銷分析 項目總結 |
項目實戰(zhàn)四: 物流數(shù)據(jù)粉實戰(zhàn) 需求分析 數(shù)據(jù)預處理-重復值、缺失值、數(shù)據(jù)格式調整 異常值和偏態(tài)分布處理 月份列的數(shù)據(jù)格式處理 貨品配送服務分析 銷售區(qū)域潛力分析 商品質量分析 項目總結 |
項目實戰(zhàn)五: 用戶流失模型實戰(zhàn) 技術架構介紹 流失模型構建 -數(shù)據(jù)清洗和轉換 -空值和異常值處理 -數(shù)據(jù)歸一化 -特征提取 -特征的降維和升維 -文本的數(shù)據(jù)化 決策樹和隨機森林介紹 基于Python的用戶流失模型開發(fā) 模型測試 |