課程簡介
本次課程將介紹數據分析、數據倉庫、商業(yè)智能和數據挖掘等技術的基本理論和體系架構,通過大型數據倉庫和數據挖掘項目案例闡述數據倉庫和數據挖掘項目的實施過程和方法。通過實際應用案例介紹多維數據模型、粒度、立方體及元數據等重要概念。詳細講解構建數據倉庫和數據挖掘體系的核心方法和技術,并結合實際項目搭建數據倉庫和數據挖掘環(huán)境。掌握主流數據倉庫和數據挖掘廠商及相關軟件產品的操作和使用。
目標收益
培訓對象
課程大綱
專題一: BI基礎知識 |
簡述: 介紹數據倉庫與數據挖掘基本概念,BI體系架構, BI工具介紹及其應用,針對行業(yè)提供行業(yè)解決方案和案例分析。 內容一:數據倉庫基本概念 1、數據倉庫的來源及定義 2、數據倉庫的應用領域 3、數據挖掘的來源及定義 4、數據挖掘的應用領域 內容二:BI的架構 1、BI體系介紹 2、數據倉庫介紹 3、ETL介紹 4、多維數據庫介紹 5、前端展現介紹 6、數據挖掘模型介紹 內容三:BI工具介紹 1、ETL工具---SSIS介紹 2、OLAP工具---SSAS介紹 3、報表工具---SSRS介紹 4、數據挖掘工具---SSAS中的挖掘模型 內容四、BI在行業(yè)中的應用 1、現代企業(yè)BI需求概述 2、電力行業(yè)案例分析 3、生產制造行業(yè)案例研究 4、醫(yī)藥行業(yè)案例分析 5、BI系統(tǒng)數據更新與維護 |
專題二: 數據倉庫架構設計與完整流程詳解 |
簡述:介紹數據倉庫設計的基本原則和數據倉庫的架構設計方式,以及構建數據倉庫的核心步驟,提供ETL,OLAP,報表等整體解決方案和設計方法。 內容一、數據倉庫設計 1、數據倉庫設計原則與模型搭建 2、星型架構與雪花型架構 3、事實表與維度表的設計 4、邏輯設計與物理設計 5、數據倉庫設計的常用方法 6、數據倉庫設計技巧總結 7、數據倉庫案例分析 內容二、ETL 1、數據集成方法 2、數據抽取 3、數據轉換 4、數據加載 5、ETL調度策略 6、緩慢變化維度和時間戳的處理 7、ETL高級技巧 8、ETL案例分析 內容三:OLAP模型設計 1、OLAP的應用場合 2、OLAP模型搭建 3、統(tǒng)一維度模型UDM 4、確定維度、量度與事實的關系 5、使用計算成員 6、使用KPI 7、OLAP中的高級應用 內容四:前端展現分析 1、多維分析報表 2、報表設計 3、報表開發(fā) 4、報表分發(fā)和定制 5、報表權限管理 6、報表集成 |
專題三: 數據挖掘架構設計與完整流程詳解 |
簡述: 九種數據挖掘算法與模型詳解,數據挖掘的設計與實施流程,數據挖掘查詢語言的使用等,重點對決策樹算法、關聯規(guī)則算法、聚類算法等給出詳細設計和處理流程。 內容一:九種數據挖掘算法 1、 九種挖掘算法應用的背景 2、 決策樹算法與模型設計 3、 聚類算法與模型設計 4、 關聯規(guī)則算法與模型設計 5、 貝葉斯算法與模型設計 6、 時間序列算法與模型設計 7、 其他挖掘算法與模型設計 內容二:常用挖掘模型詳解 1、決策樹算法詳解及工具實現 2、聚類算法詳解及工具實現 3、關聯規(guī)則算法詳解及工具實現 4、貝葉斯算法詳解及工具實現 5、時間序列算法詳解及工具實現 6、數據挖掘模型評估 內容三:數據挖掘的流程 1、數據清洗準備 2、數據預處理 3、選擇數據挖掘模型 4、數據挖掘模型訓練 5、更新算法模型 6、模型評估 7、部署與應用 內容四:DMX語言 1、DMX語法結構 2、使用DMX創(chuàng)建挖掘模型 3、使用DMX將挖掘結果導出 4、使用DMX進行挖掘模型參數設置 |
專題四: 數據倉庫與數據挖掘項目案例分析 |
簡述: 大型數據倉庫與數據挖掘項目設計和實施,重點對項目架構設計和數據完整處理流程做重點分析和詳細介紹,針對大型數據倉庫項目,提供了完備的異構數據源集成方案,以及ODS和緩慢變化維度等的應用技巧,針對數據挖掘項目給出完整設計思路和數據處理技術應用。 內容一:Novartis大型數據倉庫項目 1、項目介紹 2、復雜多系統(tǒng)多數據源的特點 3、ODS的使用 4、整體項目架構設計 5、ETL流程設計 6、緩慢變化維度的使用 7、抽取策略的制定 8、OLAP與報表的設計和使用 9、數據倉庫更新技巧 內容二:MSN數據挖掘項目 1、項目介紹 2、項目中的海量數據 3、數據挖掘算法 4、數據挖掘模型構建 5、數據的預處理技術 6、對挖掘模型進行訓練 7、展示數據挖掘模型結果 8、數據挖掘模型評估 內容三:AdventureWorks整體項目案例 1、案例介紹 2、ETL流程詳解 3、OLAP流程詳解 4、前端報表流程詳解 5、數據挖掘流程詳解 |
專題一: BI基礎知識 簡述: 介紹數據倉庫與數據挖掘基本概念,BI體系架構, BI工具介紹及其應用,針對行業(yè)提供行業(yè)解決方案和案例分析。 內容一:數據倉庫基本概念 1、數據倉庫的來源及定義 2、數據倉庫的應用領域 3、數據挖掘的來源及定義 4、數據挖掘的應用領域 內容二:BI的架構 1、BI體系介紹 2、數據倉庫介紹 3、ETL介紹 4、多維數據庫介紹 5、前端展現介紹 6、數據挖掘模型介紹 內容三:BI工具介紹 1、ETL工具---SSIS介紹 2、OLAP工具---SSAS介紹 3、報表工具---SSRS介紹 4、數據挖掘工具---SSAS中的挖掘模型 內容四、BI在行業(yè)中的應用 1、現代企業(yè)BI需求概述 2、電力行業(yè)案例分析 3、生產制造行業(yè)案例研究 4、醫(yī)藥行業(yè)案例分析 5、BI系統(tǒng)數據更新與維護 |
專題二: 數據倉庫架構設計與完整流程詳解 簡述:介紹數據倉庫設計的基本原則和數據倉庫的架構設計方式,以及構建數據倉庫的核心步驟,提供ETL,OLAP,報表等整體解決方案和設計方法。 內容一、數據倉庫設計 1、數據倉庫設計原則與模型搭建 2、星型架構與雪花型架構 3、事實表與維度表的設計 4、邏輯設計與物理設計 5、數據倉庫設計的常用方法 6、數據倉庫設計技巧總結 7、數據倉庫案例分析 內容二、ETL 1、數據集成方法 2、數據抽取 3、數據轉換 4、數據加載 5、ETL調度策略 6、緩慢變化維度和時間戳的處理 7、ETL高級技巧 8、ETL案例分析 內容三:OLAP模型設計 1、OLAP的應用場合 2、OLAP模型搭建 3、統(tǒng)一維度模型UDM 4、確定維度、量度與事實的關系 5、使用計算成員 6、使用KPI 7、OLAP中的高級應用 內容四:前端展現分析 1、多維分析報表 2、報表設計 3、報表開發(fā) 4、報表分發(fā)和定制 5、報表權限管理 6、報表集成 |
專題三: 數據挖掘架構設計與完整流程詳解 簡述: 九種數據挖掘算法與模型詳解,數據挖掘的設計與實施流程,數據挖掘查詢語言的使用等,重點對決策樹算法、關聯規(guī)則算法、聚類算法等給出詳細設計和處理流程。 內容一:九種數據挖掘算法 1、 九種挖掘算法應用的背景 2、 決策樹算法與模型設計 3、 聚類算法與模型設計 4、 關聯規(guī)則算法與模型設計 5、 貝葉斯算法與模型設計 6、 時間序列算法與模型設計 7、 其他挖掘算法與模型設計 內容二:常用挖掘模型詳解 1、決策樹算法詳解及工具實現 2、聚類算法詳解及工具實現 3、關聯規(guī)則算法詳解及工具實現 4、貝葉斯算法詳解及工具實現 5、時間序列算法詳解及工具實現 6、數據挖掘模型評估 內容三:數據挖掘的流程 1、數據清洗準備 2、數據預處理 3、選擇數據挖掘模型 4、數據挖掘模型訓練 5、更新算法模型 6、模型評估 7、部署與應用 內容四:DMX語言 1、DMX語法結構 2、使用DMX創(chuàng)建挖掘模型 3、使用DMX將挖掘結果導出 4、使用DMX進行挖掘模型參數設置 |
專題四: 數據倉庫與數據挖掘項目案例分析 簡述: 大型數據倉庫與數據挖掘項目設計和實施,重點對項目架構設計和數據完整處理流程做重點分析和詳細介紹,針對大型數據倉庫項目,提供了完備的異構數據源集成方案,以及ODS和緩慢變化維度等的應用技巧,針對數據挖掘項目給出完整設計思路和數據處理技術應用。 內容一:Novartis大型數據倉庫項目 1、項目介紹 2、復雜多系統(tǒng)多數據源的特點 3、ODS的使用 4、整體項目架構設計 5、ETL流程設計 6、緩慢變化維度的使用 7、抽取策略的制定 8、OLAP與報表的設計和使用 9、數據倉庫更新技巧 內容二:MSN數據挖掘項目 1、項目介紹 2、項目中的海量數據 3、數據挖掘算法 4、數據挖掘模型構建 5、數據的預處理技術 6、對挖掘模型進行訓練 7、展示數據挖掘模型結果 8、數據挖掘模型評估 內容三:AdventureWorks整體項目案例 1、案例介紹 2、ETL流程詳解 3、OLAP流程詳解 4、前端報表流程詳解 5、數據挖掘流程詳解 |