課程簡介
大數據平臺數據湖和數據治理
目標收益
通過此次課程培訓,可使學習者獲得如下收益:
1. 了解數據治理的體系架構
2. 理解數據架構設計與數據治理的基本知識;
2. 掌握數據建模方法,范式建模和維度建模
3. 理解數據標準化、數據質量和元數據等如何建設,和建設中注意的問題
4. 數據治理落地的難點和經驗分享
5. XXX銀行數據治理真實案例深度分享
培訓對象
1、數據開發(fā)工程師
2、業(yè)務人員
3、架構師
4、項目經理
5、對數據治理趕興趣的同學
課程大綱
數據治理范圍 |
?大數據平臺數據建設中存在的問題 ?數據治理面臨的挑戰(zhàn) ?數據的多元化 ?數據的復雜性 ?數據的完整性 ?數據生命周期管理 ?統(tǒng)一元數據管理 ?數據集成方法 ?數據安全 ?數據湖架構 ?基于大數據平臺的數據建模 ?RMDBS數據的增量實時同步采集 |
數據質量管理 |
?數據質量管理的范圍 ?數據質量評估的維度 ?數據質量的維護管理 ?數據質量的改進管理 ?數據質量管理模型 ?數據質量管理的監(jiān)控 ?案例演示 |
元數據管理 |
?元數據概念 ?Hadoop平臺元數據處理面臨的問題 ?元數據注冊機制 ?元數據的統(tǒng)一管理 ?元數據一致性管理 ?數據字典的概念 ?元數據的添加和需改管理 ?基于Hadoop平臺元數據處理方案 |
數據生命周期管理 |
?數據質量 ?數據標準 ?數據生命周期管理的重要性 ?數據生命周期的概念 ?開源Falcon解決那些問題 ?Falcon架構和原理 ?Falcon實戰(zhàn) ?Falcon+HDFS、Hive實戰(zhàn) ?Falcon+Oozie實戰(zhàn) |
數據湖 |
?數據湖定義 ?數據湖里面數據存儲格式 ?數據湖實現的步驟 ?HDFS、Hive等實現數據湖 ?數據湖分區(qū)(LCRD) ?LCRD詳解 ?某大型銀行基于Hadoop的數據湖實戰(zhàn)解析 |
測試數據環(huán)境的搭建 |
?測試數據的準備 ?測試數據的脫敏機制 ?數據脫敏的方法 ?數據關聯的脫敏機制 ?測試環(huán)境搭建的要求 ?測試環(huán)境性能的評估原則 |
數據倉庫的敏捷開發(fā) |
?敏捷開發(fā)的含義 ?敏捷數據倉庫的定義 ?為什么需要敏捷數據倉庫 ?敏捷數據倉庫和傳統(tǒng)數據倉庫的區(qū)別 ?敏捷數據倉庫實現的模型 ?在Hadoop上面實現敏捷數據倉庫的思路 |
案例分析 |
?Hadoop之上數據倉庫案例解析 ?數據湖案例解析和演示 |
數據治理范圍 ?大數據平臺數據建設中存在的問題 ?數據治理面臨的挑戰(zhàn) ?數據的多元化 ?數據的復雜性 ?數據的完整性 ?數據生命周期管理 ?統(tǒng)一元數據管理 ?數據集成方法 ?數據安全 ?數據湖架構 ?基于大數據平臺的數據建模 ?RMDBS數據的增量實時同步采集 |
數據質量管理 ?數據質量管理的范圍 ?數據質量評估的維度 ?數據質量的維護管理 ?數據質量的改進管理 ?數據質量管理模型 ?數據質量管理的監(jiān)控 ?案例演示 |
元數據管理 ?元數據概念 ?Hadoop平臺元數據處理面臨的問題 ?元數據注冊機制 ?元數據的統(tǒng)一管理 ?元數據一致性管理 ?數據字典的概念 ?元數據的添加和需改管理 ?基于Hadoop平臺元數據處理方案 |
數據生命周期管理 ?數據質量 ?數據標準 ?數據生命周期管理的重要性 ?數據生命周期的概念 ?開源Falcon解決那些問題 ?Falcon架構和原理 ?Falcon實戰(zhàn) ?Falcon+HDFS、Hive實戰(zhàn) ?Falcon+Oozie實戰(zhàn) |
數據湖 ?數據湖定義 ?數據湖里面數據存儲格式 ?數據湖實現的步驟 ?HDFS、Hive等實現數據湖 ?數據湖分區(qū)(LCRD) ?LCRD詳解 ?某大型銀行基于Hadoop的數據湖實戰(zhàn)解析 |
測試數據環(huán)境的搭建 ?測試數據的準備 ?測試數據的脫敏機制 ?數據脫敏的方法 ?數據關聯的脫敏機制 ?測試環(huán)境搭建的要求 ?測試環(huán)境性能的評估原則 |
數據倉庫的敏捷開發(fā) ?敏捷開發(fā)的含義 ?敏捷數據倉庫的定義 ?為什么需要敏捷數據倉庫 ?敏捷數據倉庫和傳統(tǒng)數據倉庫的區(qū)別 ?敏捷數據倉庫實現的模型 ?在Hadoop上面實現敏捷數據倉庫的思路 |
案例分析 ?Hadoop之上數據倉庫案例解析 ?數據湖案例解析和演示 |