課程簡介
本課程講解利用Python控制、整理、分析結構化數(shù)據(jù)的基本知識,并通過實踐案例讓學員們學會如何利用各種Python庫(包括NumPy、Pandas、Matplotlib,Jupyter?Pyhton等)高效地解決各式各樣的數(shù)據(jù)分析和可視化問題。
目標收益
通過本課程的學習,學員們能夠在短時間內掌握利用python進行數(shù)據(jù)分析的技巧和方法,能夠在企業(yè)數(shù)據(jù)整理分析等項目上迅速入手。
培訓對象
本課程適合從事數(shù)據(jù)分析、數(shù)據(jù)挖掘、數(shù)據(jù)展示等數(shù)據(jù)相關方面工作的學員。
課程大綱
搭建和使用科學計算環(huán)境 |
1.1準備開發(fā)環(huán)境 1.1.1為什么用python進行數(shù)據(jù)分析 1.1.2數(shù)據(jù)分析的主要python庫 1.1.3安裝Anaconda數(shù)據(jù)分析包 1.2 Anaconda和Ipython用法 1.2.1 Ipython交互式計算環(huán)境基礎 1.2.2 JupyterNotebook的用法 |
Numpy 基礎 |
2.1 Numpy數(shù)組 2.1.1 數(shù)組的構造、重塑和數(shù)據(jù)類型 2.1.2 數(shù)組的切片與索引 2.1.3 數(shù)組操作 2.2 Numpy通用函數(shù) 2.2.1 字符串函數(shù) 2.2.2 數(shù)學運算函數(shù) 2.2.3 統(tǒng)計函數(shù) 2.2.4 NumPy排序、搜索和計數(shù)函數(shù) 2.3 Numpy高級用法 2.3.1 Numpy生成隨機數(shù)和線性代數(shù) 2.3.2 Numpy文件讀寫 2.3.3 性能提示 |
Pandas 基礎 |
3.1 Pandas入門 3.1.1 Pandas數(shù)據(jù)結構 3.1.2 數(shù)據(jù)觀察、排序及缺失值的處理 3.1.3 數(shù)據(jù)匯總統(tǒng)計方法 3.1.4 層次化索引 3.2 數(shù)據(jù)加載、存儲與文件格式 3.2.1 讀取文本格式的數(shù)據(jù) 3.2.2 將數(shù)據(jù)寫出到文本格式 3.2.3 使用HDF5格式和數(shù)據(jù)庫 3.3 數(shù)據(jù)規(guī)整化 3.3.1 合并數(shù)據(jù)集 3.3.2 數(shù)據(jù)重塑和軸向旋轉 3.3.3 數(shù)據(jù)轉換和重復處理 3.3.4 字符串操作 3.3.5 數(shù)據(jù)的離散化 3.4 pandas繪圖和可視化 |
Pandas 練習 |
1908年以來空難數(shù)據(jù)的分析 |
Pandas高級用法 |
4.1 數(shù)據(jù)的聚合與分組 4.1.1 數(shù)據(jù)聚合 4.1.2 分組運算和轉換 4.1.3 透視表 4.2 時間序列 4.2.1 時間序列基礎 4.2.2 時間序列的重采樣 |
數(shù)據(jù)分析 練習 |
1.共享單車騎行數(shù)據(jù)分析 谷歌股票趨勢分析 |
Matplotlib繪圖基礎 |
5.1 線圖、柱形圖、直方圖、散點圖、餅圖 5.2 面向對象繪圖 5.3 多圖的繪制 5.4 使用中文與3D繪圖 |
數(shù)據(jù)分析 實例與練習 |
6.1 紐約市出租車行車記錄(2013年) 6.2 2015年美國社區(qū)統(tǒng)計數(shù)據(jù) 6.3 波士頓 Airbnb 公開數(shù)據(jù) |
搭建和使用科學計算環(huán)境 1.1準備開發(fā)環(huán)境 1.1.1為什么用python進行數(shù)據(jù)分析 1.1.2數(shù)據(jù)分析的主要python庫 1.1.3安裝Anaconda數(shù)據(jù)分析包 1.2 Anaconda和Ipython用法 1.2.1 Ipython交互式計算環(huán)境基礎 1.2.2 JupyterNotebook的用法 |
Numpy 基礎 2.1 Numpy數(shù)組 2.1.1 數(shù)組的構造、重塑和數(shù)據(jù)類型 2.1.2 數(shù)組的切片與索引 2.1.3 數(shù)組操作 2.2 Numpy通用函數(shù) 2.2.1 字符串函數(shù) 2.2.2 數(shù)學運算函數(shù) 2.2.3 統(tǒng)計函數(shù) 2.2.4 NumPy排序、搜索和計數(shù)函數(shù) 2.3 Numpy高級用法 2.3.1 Numpy生成隨機數(shù)和線性代數(shù) 2.3.2 Numpy文件讀寫 2.3.3 性能提示 |
Pandas 基礎 3.1 Pandas入門 3.1.1 Pandas數(shù)據(jù)結構 3.1.2 數(shù)據(jù)觀察、排序及缺失值的處理 3.1.3 數(shù)據(jù)匯總統(tǒng)計方法 3.1.4 層次化索引 3.2 數(shù)據(jù)加載、存儲與文件格式 3.2.1 讀取文本格式的數(shù)據(jù) 3.2.2 將數(shù)據(jù)寫出到文本格式 3.2.3 使用HDF5格式和數(shù)據(jù)庫 3.3 數(shù)據(jù)規(guī)整化 3.3.1 合并數(shù)據(jù)集 3.3.2 數(shù)據(jù)重塑和軸向旋轉 3.3.3 數(shù)據(jù)轉換和重復處理 3.3.4 字符串操作 3.3.5 數(shù)據(jù)的離散化 3.4 pandas繪圖和可視化 |
Pandas 練習 1908年以來空難數(shù)據(jù)的分析 |
Pandas高級用法 4.1 數(shù)據(jù)的聚合與分組 4.1.1 數(shù)據(jù)聚合 4.1.2 分組運算和轉換 4.1.3 透視表 4.2 時間序列 4.2.1 時間序列基礎 4.2.2 時間序列的重采樣 |
數(shù)據(jù)分析 練習 1.共享單車騎行數(shù)據(jù)分析 谷歌股票趨勢分析 |
Matplotlib繪圖基礎 5.1 線圖、柱形圖、直方圖、散點圖、餅圖 5.2 面向對象繪圖 5.3 多圖的繪制 5.4 使用中文與3D繪圖 |
數(shù)據(jù)分析 實例與練習 6.1 紐約市出租車行車記錄(2013年) 6.2 2015年美國社區(qū)統(tǒng)計數(shù)據(jù) 6.3 波士頓 Airbnb 公開數(shù)據(jù) |