課程簡(jiǎn)介
1. 使用“用戶-電影”數(shù)據(jù)集、Large Movie Review Dataset、MovieLens Dataset、Netflix、TMDB、真實(shí)的用戶離網(wǎng)流失分析數(shù)據(jù)集、真實(shí)用戶的換機(jī)數(shù)據(jù)模型進(jìn)行項(xiàng)目制內(nèi)容講解,闡述從經(jīng)典協(xié)同過濾、略復(fù)雜的隱特征推薦算法、深度學(xué)習(xí)方案的推薦算法、大廠使用的“非經(jīng)典”推薦算法(如word2vec模型在數(shù)據(jù)中的使用等)。
2.實(shí)踐和理論相結(jié)合。學(xué)習(xí)期間將按照真實(shí)的“項(xiàng)目開發(fā)”模式進(jìn)行。
目標(biāo)收益
1.推薦系統(tǒng)算法基礎(chǔ)和機(jī)器學(xué)習(xí)模型
2.數(shù)據(jù)集分析和推薦系統(tǒng)的整體結(jié)構(gòu)
3.特征工程
4.基于協(xié)同過濾的商品推薦
5.基于協(xié)同過濾和隱特征的商品推薦
6.完成推薦系統(tǒng)的整體設(shè)計(jì)和算法驗(yàn)證
培訓(xùn)對(duì)象
有Python編程經(jīng)驗(yàn) 至少1年軟件工程研發(fā)經(jīng)驗(yàn) 初步掌握機(jī)器學(xué)習(xí)算法的理論基礎(chǔ)
課程大綱
第1節(jié):推薦系統(tǒng)算法基礎(chǔ)和機(jī)器學(xué)習(xí)模型 |
1. python解釋器與概況 2. 數(shù)據(jù)挖掘和機(jī)器學(xué)習(xí)包的應(yīng)用 3. 爬蟲的編寫 4. json與數(shù)據(jù)交換 5. 線性回歸 6. Logistic回歸 7. 隨機(jī)森林 8. 層次聚類、空間密度聚類 9. 協(xié)同過濾 10. 卷積神經(jīng)網(wǎng)絡(luò) |
第2節(jié):數(shù)據(jù)集分析和推薦系統(tǒng)的整體結(jié)構(gòu) |
1. “用戶-電影”數(shù)據(jù)集、Large Movie Review Dataset、MovieLens Dataset、Netflix、TMDB、用戶離網(wǎng)流失分析數(shù)據(jù)集、用戶的換機(jī)模型等數(shù)據(jù)集的各自分析。 2. 完成數(shù)據(jù)表讀寫和檢索 3. 完成數(shù)據(jù)表關(guān)聯(lián)分析 4. 完成兩個(gè)進(jìn)階矩陣“用戶列表”和“商品列表”,為協(xié)同過濾做準(zhǔn)備 |
第3節(jié):特征工程 |
1. 數(shù)據(jù)清洗:異常值、空值的處理 2. 完成數(shù)據(jù)分析和特征選擇 3. 完成用戶相似度、商品相似度的計(jì)算 思考:使用不同相似度會(huì)產(chǎn)生何種影響(非常重要) |
第4節(jié):基于協(xié)同過濾的商品推薦 |
1. 搜索是推薦的系統(tǒng)基礎(chǔ) 2. 鄰接表的使用 3. 基于搜索系統(tǒng),完成快速檢索 4. user-based/item-based 協(xié)同過濾算法的使用 5. 分類標(biāo)簽和作用和如何定義標(biāo)簽 6. 商品評(píng)論中的分值計(jì)算 7. 鄰接表的逆向使用:使用商品對(duì)用戶打分 8. 建立用戶興趣模型 9. 構(gòu)建少量用戶訪問記錄 10. 構(gòu)建用戶“關(guān)鍵詞”模型,思考和TopN模型的區(qū)別 |
第5節(jié):基于協(xié)同過濾和隱特征的商品推薦 |
1.基于標(biāo)準(zhǔn)測(cè)試集,構(gòu)建用戶訪問記錄 2.基于標(biāo)準(zhǔn)測(cè)試集,構(gòu)建商品被訪問記錄 3. 完成實(shí)時(shí)和離線的user-based 推薦 4. 完成實(shí)時(shí)和離線的item-based 推薦 5. 隱特征推薦的含義 6. LFM模型的算法原理 7. SVD模型和LFM的比較 8. LFM、SVD模型用于隱特征的推薦 |
第6節(jié):完成推薦系統(tǒng)的整體設(shè)計(jì)和算法驗(yàn)證 |
1. 完成特征選擇文檔 2. 完成特征的構(gòu)建 3. 完成基于LR的點(diǎn)擊預(yù)估模型訓(xùn)練 4. 完成基于LR的線上推薦服務(wù) 5. 完成多種推薦算法的整合 6. 完成項(xiàng)目總結(jié) |
思考: |
1. 如何獲得更多的特征,如冷啟動(dòng)階段。 2.是否能使用深度學(xué)習(xí)模型,如果可以,如何使用。 |
第1節(jié):推薦系統(tǒng)算法基礎(chǔ)和機(jī)器學(xué)習(xí)模型 1. python解釋器與概況 2. 數(shù)據(jù)挖掘和機(jī)器學(xué)習(xí)包的應(yīng)用 3. 爬蟲的編寫 4. json與數(shù)據(jù)交換 5. 線性回歸 6. Logistic回歸 7. 隨機(jī)森林 8. 層次聚類、空間密度聚類 9. 協(xié)同過濾 10. 卷積神經(jīng)網(wǎng)絡(luò) |
第2節(jié):數(shù)據(jù)集分析和推薦系統(tǒng)的整體結(jié)構(gòu) 1. “用戶-電影”數(shù)據(jù)集、Large Movie Review Dataset、MovieLens Dataset、Netflix、TMDB、用戶離網(wǎng)流失分析數(shù)據(jù)集、用戶的換機(jī)模型等數(shù)據(jù)集的各自分析。 2. 完成數(shù)據(jù)表讀寫和檢索 3. 完成數(shù)據(jù)表關(guān)聯(lián)分析 4. 完成兩個(gè)進(jìn)階矩陣“用戶列表”和“商品列表”,為協(xié)同過濾做準(zhǔn)備 |
第3節(jié):特征工程 1. 數(shù)據(jù)清洗:異常值、空值的處理 2. 完成數(shù)據(jù)分析和特征選擇 3. 完成用戶相似度、商品相似度的計(jì)算 思考:使用不同相似度會(huì)產(chǎn)生何種影響(非常重要) |
第4節(jié):基于協(xié)同過濾的商品推薦 1. 搜索是推薦的系統(tǒng)基礎(chǔ) 2. 鄰接表的使用 3. 基于搜索系統(tǒng),完成快速檢索 4. user-based/item-based 協(xié)同過濾算法的使用 5. 分類標(biāo)簽和作用和如何定義標(biāo)簽 6. 商品評(píng)論中的分值計(jì)算 7. 鄰接表的逆向使用:使用商品對(duì)用戶打分 8. 建立用戶興趣模型 9. 構(gòu)建少量用戶訪問記錄 10. 構(gòu)建用戶“關(guān)鍵詞”模型,思考和TopN模型的區(qū)別 |
第5節(jié):基于協(xié)同過濾和隱特征的商品推薦 1.基于標(biāo)準(zhǔn)測(cè)試集,構(gòu)建用戶訪問記錄 2.基于標(biāo)準(zhǔn)測(cè)試集,構(gòu)建商品被訪問記錄 3. 完成實(shí)時(shí)和離線的user-based 推薦 4. 完成實(shí)時(shí)和離線的item-based 推薦 5. 隱特征推薦的含義 6. LFM模型的算法原理 7. SVD模型和LFM的比較 8. LFM、SVD模型用于隱特征的推薦 |
第6節(jié):完成推薦系統(tǒng)的整體設(shè)計(jì)和算法驗(yàn)證 1. 完成特征選擇文檔 2. 完成特征的構(gòu)建 3. 完成基于LR的點(diǎn)擊預(yù)估模型訓(xùn)練 4. 完成基于LR的線上推薦服務(wù) 5. 完成多種推薦算法的整合 6. 完成項(xiàng)目總結(jié) |
思考: 1. 如何獲得更多的特征,如冷啟動(dòng)階段。 2.是否能使用深度學(xué)習(xí)模型,如果可以,如何使用。 |