工程師
互聯(lián)網(wǎng)
其他
機(jī)器學(xué)習(xí)
數(shù)據(jù)挖掘
項目管理
深度學(xué)習(xí)
推薦課程
average > 0 ? $model->average . '分' : '10.0分' ?>

人工智能訓(xùn)練師算法開發(fā)實戰(zhàn)技能

鄒老師

長春工業(yè)大學(xué) 人工智能學(xué)院院長

鄒偉,長春工業(yè)大學(xué)人工智能學(xué)院院長、華東建筑設(shè)計研究總院研究員、山東交通學(xué)院客座教授、南昌航空大學(xué)碩士生導(dǎo)師、中國軟件行業(yè)協(xié)會專家委員、天津大學(xué)創(chuàng)業(yè)導(dǎo)師、中華中醫(yī)藥學(xué)會會員、中國醫(yī)藥教育協(xié)會老年運(yùn)動與健康分會學(xué)術(shù)委員;領(lǐng)導(dǎo)團(tuán)隊與全國兄弟高校、企業(yè)建立了廣泛的項目合作,完成50多個深度學(xué)習(xí)實踐項目,應(yīng)用于醫(yī)療、交通、農(nóng)業(yè)、氣象、銀行、電信等多個領(lǐng)域。

鄒偉,長春工業(yè)大學(xué)人工智能學(xué)院院長、華東建筑設(shè)計研究總院研究員、山東交通學(xué)院客座教授、南昌航空大學(xué)碩士生導(dǎo)師、中國軟件行業(yè)協(xié)會專家委員、天津大學(xué)創(chuàng)業(yè)導(dǎo)師、中華中醫(yī)藥學(xué)會會員、中國醫(yī)藥教育協(xié)會老年運(yùn)動與健康分會學(xué)術(shù)委員;領(lǐng)導(dǎo)團(tuán)隊與全國兄弟高校、企業(yè)建立了廣泛的項目合作,完成50多個深度學(xué)習(xí)實踐項目,應(yīng)用于醫(yī)療、交通、農(nóng)業(yè)、氣象、銀行、電信等多個領(lǐng)域。

課程費(fèi)用

5800.00 /人

課程時長

2

成為教練

課程簡介

課程講授人是從事深度學(xué)習(xí)項目管理的人員,帶隊完成了數(shù)十個AI項目,內(nèi)容不僅包括深度學(xué)習(xí)、機(jī)器學(xué)習(xí)、數(shù)據(jù)挖掘等具體技術(shù)要點,也包括AI的整體發(fā)展、現(xiàn)狀、應(yīng)用、商業(yè)價值、未來方向等,涵蓋內(nèi)容非常豐富。

目標(biāo)收益

1,整體把握機(jī)器學(xué)習(xí)、深度學(xué)習(xí)、數(shù)據(jù)挖掘的發(fā)展方向
2,了解機(jī)器學(xué)習(xí)、深度學(xué)習(xí)的技術(shù)框架
3,理解機(jī)器學(xué)習(xí)和深度學(xué)習(xí)的思維方式和關(guān)鍵技術(shù)
4,獨立完成深度學(xué)習(xí)和機(jī)器學(xué)習(xí)在簡單實際場景的落地應(yīng)用

培訓(xùn)對象

課程內(nèi)容

第一篇:機(jī)器學(xué)習(xí)與深度學(xué)習(xí)
第一節(jié):Python數(shù)據(jù)分析
Numpy/Scipy/Pandas/Matplotlib/Seaborn庫
Numpy基礎(chǔ)屬性與數(shù)組創(chuàng)建
Numpy索引
Numpy數(shù)學(xué)運(yùn)算與常用分布
Pandas數(shù)據(jù)處理與分析
Pandas文件讀寫和個性化控制
Pandas的concat與merge
Matplotlib 基本圖結(jié)構(gòu)介紹
基于Matplotlib繪制散點圖、柱狀圖、等高線圖、3D圖等
多圖合并與圖片文件存取
Seaborn/PyEcharts等包的使用
scikit-learn的介紹和典型使用
邏輯回歸、決策樹、隨機(jī)森林、SVM
XGBoost、LightGBM
多元高斯分布
典型圖像處理
多種數(shù)學(xué)曲線
多項式擬合
代碼和案例實踐:
快速傅里葉變換FFT與信號處理
Soble/Prewitt/Laplacian算子與卷積網(wǎng)絡(luò)
卷積與(指數(shù))移動平均線
股票數(shù)據(jù)分析
缺失數(shù)據(jù)的處理和預(yù)測
環(huán)境數(shù)據(jù)異常檢測和分析
快速傅里葉變換FFT
圖像處理與奇異值分解SVD
第二節(jié):機(jī)器學(xué)習(xí)核心原理和損失函數(shù):回歸分析
線性回歸
Logistic/Softmax回歸
廣義線性回歸
L1/L2正則化
Ridge與LASSO
Elastic Net
梯度下降算法:BGD與SGD
特征選擇與過擬合
Softmax回歸的概念源頭
最大熵模型
K-L散度
代碼和案例實踐:
股票數(shù)據(jù)的特征提取和應(yīng)用
泰坦尼克號乘客缺失數(shù)據(jù)處理和存活率預(yù)測
環(huán)境檢測數(shù)據(jù)異常分析和預(yù)測
模糊數(shù)據(jù)查詢和數(shù)據(jù)校正方法
PCA與鳶尾花數(shù)據(jù)分類
二手車數(shù)據(jù)特征選擇與算法模型比較
廣告投入與銷售額回歸分析
鳶尾花數(shù)據(jù)集的分類
TensorFlow實現(xiàn)線性回歸
TensorFlow實現(xiàn)Logistic回歸
第三節(jié):決策樹和隨機(jī)森林
熵、聯(lián)合熵、條件熵、KL散度、互信息
最大似然估計與最大熵模型
ID3、C4.5、CART詳解
決策樹的正則化
預(yù)剪枝和后剪枝
Bagging
隨機(jī)森林
不平衡數(shù)據(jù)集的處理
利用隨機(jī)森林做特征選擇
使用隨機(jī)森林計算樣本相似度
異常值檢測
代碼和案例實踐:
隨機(jī)森林與特征選擇
決策樹應(yīng)用于回歸
多標(biāo)記的決策樹回歸
決策樹和隨機(jī)森林的可視化
葡萄酒數(shù)據(jù)集的決策樹/隨機(jī)森林分類
泰坦尼克乘客存活率估計
第四節(jié):聚類分析
各種相似度度量及其相互關(guān)系
Jaccard相似度和準(zhǔn)確率、召回率
Pearson相關(guān)系數(shù)與余弦相似度
K-means與K-Medoids及變種
層次聚類:自頂向下,自底向上
AP算法(Sci07)/LPA算法及其應(yīng)用
密度聚類DBSCAN/DensityPeak(Sci14)
譜聚類SC
聚類評價和結(jié)果指標(biāo)
代碼和案例實踐:
1.K-Means++算法原理和實現(xiàn)
2.向量量化VQ及圖像近似
3.并查集的實踐應(yīng)用
4.密度聚類的異常值檢測
5.譜聚類用于圖片分割
第五節(jié):XGBoost與LightGBM模型詳解
定義樹的復(fù)雜度
boosting tree的提升思路
殘差的選擇
XGBoost損失函數(shù)的提成
Loss的精確一階導(dǎo)數(shù)和二階導(dǎo)數(shù)
近似加權(quán)分位法
稀疏自適應(yīng)分割策略
XGBoost的過擬合與正則化目標(biāo)函數(shù)
算法成功之處和存在的問題
boosting框架總覽
重新認(rèn)識樣本的梯度
GOSS思想在LightGBM中的應(yīng)用
貪心和啟發(fā)式特征搜索
EFB候選特征的選擇
Histogram算法與Pre-sorted算法對數(shù)據(jù)結(jié)構(gòu)的影響
樣本采樣與權(quán)重
再談引入稀疏數(shù)據(jù)的原因
單邊采樣帶來的訓(xùn)練樣本減少
代碼和案例實踐:
1.收入分類模型的提升應(yīng)用
2.XGBoost庫與sklearn庫的使用
3.提升模型在用戶感知評分預(yù)測的應(yīng)用
4.XGBoost用于真實信號數(shù)據(jù)中的分類建模和調(diào)參
5.鉆井工況數(shù)據(jù)在LightGBM中的實踐
6. LightGBM與XGBoost的性能比較
7.基站小區(qū)節(jié)能預(yù)測建模
8.哪些場景不適合LightGBM
第六節(jié):深度學(xué)習(xí)環(huán)境配置與卷積神經(jīng)網(wǎng)絡(luò)
GPU下的TensorFlow、PyTorch環(huán)境安裝
Pytorch框架介紹和環(huán)境搭建
Pytorch張量、卷積等基礎(chǔ)知識
神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu),濾波器,卷積
池化,激活函數(shù),反向傳播
目標(biāo)分類與識別、目標(biāo)檢測與追蹤
AlexNet、VGGNet、GoogleLeNet
Inception-V3/V4
MLP多層感知機(jī)模型搭建與代碼實現(xiàn)
Pytorch分類模型ResNet、DenseNet的實現(xiàn)
Pytorch對回歸建模損失函數(shù)的修正
代碼和案例實踐:
數(shù)字圖片分類
卷積核與特征提取
以圖搜圖
人證合一
卷積神經(jīng)網(wǎng)絡(luò)調(diào)參經(jīng)驗分享
第七節(jié):Pytorch時間序列分析
隱馬爾科夫模型
HMM與CRF
ARIMA、時間序列分析
一維卷積、指數(shù)平均和滑動平均、
Prophet模型對時間序列分析的影像
MaxPooling做光滑的trick
Bi-LSTM雙向循環(huán)網(wǎng)絡(luò)
Pytorch函數(shù)式API與回調(diào)函數(shù)
代碼和案例實踐:
時間序列算法:自回歸、移動平均和整合模型
股票走勢可視化
突變點分析
股票預(yù)測模型建立
模型訓(xùn)練
預(yù)測與評估
第八節(jié):深度學(xué)習(xí)文本建模
語言模型Bi-Gram/Tri-Gram/N-Gram
分詞算法的原理及類似應(yīng)用
詞性標(biāo)注
語義關(guān)系抽取
詞向量
文本分類:基于CNN和基于LSTM的方法比較
機(jī)器翻譯:Seq2Seq的典型應(yīng)用
Transformer、BERT等模型原理
文本摘要與信息抽取
閱讀理解
問答系統(tǒng)
情感分析
代碼和案例實踐:
知識圖譜:命名實體識別的實踐
知識圖譜:實體關(guān)系的判定與分類
HMM分詞及CRF的異同
文本摘要的生成
智能對話系統(tǒng)和SeqSeq模型
閱讀理解的實現(xiàn)與Attention
機(jī)器翻譯
使用LSTM生成文本
第九節(jié):生成對抗網(wǎng)絡(luò)GAN和擴(kuò)散模型DM
GAN-VAE-流模型-擴(kuò)散模型的技術(shù)發(fā)展和變化
CLIP和擴(kuò)散模型的結(jié)合:基于CLIP模型的多模態(tài)引導(dǎo)圖像生成:圖文引導(dǎo)
GLIDE:文本引導(dǎo)
Diffusion-CLIP模型
擴(kuò)散和去噪(Diffusion&Denoise)
訓(xùn)練和采樣(Training&Sampling)
離散步驟的馬爾可夫鏈
分子熱動力學(xué)的擴(kuò)散過程
離散加噪
DDPM-最經(jīng)典的擴(kuò)散模型
DDIM:加速采樣、可控擴(kuò)散
IVLR:迭代去燥的圖像編輯,低通濾波上采樣
RePaint: 被掩碼的區(qū)域進(jìn)行擴(kuò)散生成
CLIP和擴(kuò)散模型的結(jié)合:基于CLIP模型的多模態(tài)引導(dǎo)圖像生成:圖文引導(dǎo)
GLIDE:文本引導(dǎo)
DALL·E 2:diffusion model和CLIP結(jié)合在一起
隱式分類器引導(dǎo)的圖像生成
Blended Diffusioni模型
Diffusion-CLIP模型
DiffEdit模型
分別實現(xiàn)圖像引導(dǎo)、文字引導(dǎo)、圖文引導(dǎo)下的圖片生成
Diffusion LM
AIGC的可能應(yīng)用領(lǐng)域和行業(yè)影響
代碼和案例實踐:
低質(zhì)量噪聲圖像修復(fù)
精確復(fù)原原圖
圖像去除遮擋、圖像補(bǔ)全
圖像生成(人物恢復(fù)青春、人物變瘦)
圖像引導(dǎo)、文本引導(dǎo)、圖像+文本引導(dǎo)

第二篇 實際項目實戰(zhàn)(可增補(bǔ)其他感興趣的項目)
第一節(jié):用戶滿意度多分類預(yù)測
使用運(yùn)營商用戶網(wǎng)絡(luò)感知評分真實數(shù)據(jù),結(jié)合O域信令數(shù)據(jù)及B域用戶數(shù)據(jù),采樣時間為近半年網(wǎng)絡(luò)評分用戶數(shù)據(jù)。 參賽選手需要根據(jù)訓(xùn)練數(shù)據(jù)集(train.csv)訓(xùn)練模型,并預(yù)測測試集中用戶的網(wǎng)絡(luò)感知打分(test.csv)。
涉及知識點和代碼框架中注意問題:
1、字符串?dāng)?shù)值化
2、空值處理
3、異常值處理
4、特征分箱
5、One-hot編碼
4、選擇回歸與分類模型
5、提高模型MAE/F1-score的通用方法
第二節(jié):基站節(jié)能策略合理性預(yù)測
基于無線基站節(jié)能場景,提供5天不同場景下若干小區(qū)節(jié)能策略數(shù)據(jù)共1萬余行,并給出了相應(yīng)的評判標(biāo)簽:節(jié)能策略合理或不合理,從而訓(xùn)練出合適的數(shù)據(jù)推理模型來預(yù)測小區(qū)節(jié)能策略的合理性。
涉及知識點和代碼框架中注意問題:
1、多列關(guān)鍵字的數(shù)據(jù)分組
2、寬表的生成、多表合并
3、機(jī)器學(xué)習(xí)數(shù)據(jù)標(biāo)準(zhǔn)表的整理:A+C/A+C模式
4、機(jī)器學(xué)習(xí)模型選擇
5、機(jī)器學(xué)習(xí)模型調(diào)參
第三節(jié):多元網(wǎng)絡(luò)業(yè)務(wù)趨勢預(yù)測
基于某網(wǎng)絡(luò)業(yè)務(wù)場景,針對若干個業(yè)務(wù)ID,提供多個指標(biāo)小時粒度的歷史數(shù)據(jù),對其中某一指標(biāo)進(jìn)行趨勢預(yù)測,得到未來24小時的小時粒度數(shù)據(jù)。
涉及知識點和代碼框架中注意問題:
1、單列關(guān)鍵字的數(shù)據(jù)分組與表格化輸出
2、特征篩選
3、同比-環(huán)比問題
4、經(jīng)典時間序列模型的建模和調(diào)參
5、深度學(xué)習(xí)模型的TSA嘗試
6、時間序列建模自回歸方案
第四節(jié):通用文本情感二分類預(yù)測
本賽題進(jìn)行通用文本的情感分類,選取了外賣、酒店、旅游、美食評論、電影評論等多個生活中常用的領(lǐng)域第三方APP下的評論數(shù)據(jù)作為本次賽題的數(shù)據(jù)集。本次賽題的輸入是一段文字,輸出是“積極”和“消極”兩種情感類型的標(biāo)簽,其中“積極”用1表示,“消極”用0表示。
1、不同文本格式的讀寫
2、文本合并
3、數(shù)據(jù)增強(qiáng)
4、詞向量、字向量
5、機(jī)器學(xué)習(xí)模型下的文本分類
6、深度學(xué)習(xí)模型搭建
7、GPU的TensorFlow、pyTorch部署與使用
8、深度模型的訓(xùn)練和調(diào)參

活動詳情

提交需求