課程簡介
本課程旨在深入剖析大模型技術(shù)的發(fā)展脈絡(luò),從機(jī)器學(xué)習(xí)源起、小模型到大模型的演進(jìn),到GPT與閉源大模型的崛起,以及開源社區(qū)的進(jìn)展,全面展現(xiàn)大模型技術(shù)的全貌。同時,課程將結(jié)合實踐案例,詳細(xì)講解大模型的基礎(chǔ)技術(shù)理解、訓(xùn)練與推理、推理優(yōu)化以及應(yīng)用開發(fā)等方面的知識,幫助學(xué)員掌握大模型應(yīng)用與開發(fā)的核心技能。此外,課程還將關(guān)注大模型在研發(fā)生產(chǎn)實踐中的應(yīng)用,探討大模型時代下的研發(fā)工序新范式,以及超級開發(fā)者的崛起與成長路徑,為學(xué)員提供前瞻性的行業(yè)洞察。
目標(biāo)收益
培訓(xùn)對象
課程內(nèi)容
1.?大模型發(fā)展脈絡(luò)
1.1?機(jī)器學(xué)習(xí)源起
1.1.1?機(jī)器學(xué)習(xí)數(shù)學(xué)基礎(chǔ)
1.1.2?ML之分類算法
1.1.3?ML之聚類算法
1.1.4?深度學(xué)習(xí)時代下的ML算法
1.1.5?注意力機(jī)制與Transformer的崛起
1.2?從小模型到大模型
1.2.1?CV圖像處理算法
1.2.2?NLP自然語言處理算法
1.2.3?從Bert時代到GPT時代
1.3?GPT與閉源大模型
1.3.1?OpenAI歷史回顧
1.3.2?指令學(xué)習(xí)與強(qiáng)化對齊
1.3.3?從chatGPT到GPT4
1.3.4?從文本到多模態(tài)
1.3.5?Claude、Gemini與其余閉源大模型
1.4?開源社區(qū)的進(jìn)展
1.4.1?國外開源大模型概覽(llama、Grok、Mistral、Gemma等)
1.4.2?國內(nèi)開源大模型概覽(通義千問、百川、智譜、kimi等)
1.4.3?MoE技術(shù)、多模態(tài)的崛起
1.5?發(fā)展總結(jié)與展望
2.?大模型落地實踐
2.1大模型基礎(chǔ)技術(shù)理解
2.1.1?常見大模型介紹與網(wǎng)絡(luò)結(jié)構(gòu)的統(tǒng)一性
2.1.2?大模型的縮放法則與涌現(xiàn)能力
2.1.3?大模型的基礎(chǔ)訓(xùn)練過程(預(yù)訓(xùn)練、指令微調(diào)、強(qiáng)化學(xué)習(xí)對齊)
2.1.4?大模型主流預(yù)訓(xùn)練框架介紹(Megatron,Deepspeed。。。)
2.1.5?大模型評價體系(數(shù)據(jù)集與榜單介紹)
2.2?大模型訓(xùn)練與推理(?以GLM3-6B為例)
2.2.1基礎(chǔ)權(quán)重準(zhǔn)備與推理部署
2.2.2?微調(diào)數(shù)據(jù)集準(zhǔn)備
2.2.3?全參數(shù)微調(diào)與Lora微調(diào)(數(shù)據(jù)構(gòu)造與超參數(shù)設(shè)定)
2.2.4?垂類模型微調(diào)實踐(格式服從案例)
2.3?大模型推理優(yōu)化
2.3.1?大規(guī)模推理成本優(yōu)化(量化、vLLM并行推理)
2.3.2?檢索強(qiáng)化型大模型應(yīng)用(RAG)
2.3.3?如何針對線上Case修復(fù)模型問題
2.3.4?如何利用CoT與Agent機(jī)制提升模型效果
2.3.5?大模型安全與風(fēng)險控制
3.?大模型應(yīng)用開發(fā)
3.1?開發(fā)框架介紹
3.1.1?Langchain
3.1.2?Dify?與?Coze
3.1.3?其余典型項目介紹
3.2?框架核心模塊入門
3.2.1?基于LLM?Chain的工作流實踐
3.2.2?模板化輸入
3.2.3?框架記憶力機(jī)制
3.3?提示詞工程的最佳實踐
3.3.1?基于結(jié)構(gòu)化prompt
3.3.2?基于CoT的prompt優(yōu)化
3.3.3?基于RAG的領(lǐng)域能力提升
3.3.4?基于functionCall的專業(yè)能力提升
3.3.5?基于ReAct框架協(xié)同推理與行動
3.3.6?基于Agent機(jī)制強(qiáng)化能力
3.4?RAG模式數(shù)據(jù)處理流
3.4.1?文檔加載器
3.4.2?文檔轉(zhuǎn)換器
3.4.3?文檔向量化轉(zhuǎn)換模型
3.4.4?向量數(shù)據(jù)庫
3.4.5?檢索器Retrievers
3.5?Agent模式構(gòu)建復(fù)雜應(yīng)用
3.5.1?函數(shù)調(diào)用能力functionCall
3.5.2?LLM的推理、規(guī)劃與反思能力
3.5.3?模塊設(shè)計與原理實現(xiàn)
3.5.4?當(dāng)前Agent落地的實踐
4.?大模型Agent應(yīng)用構(gòu)建示例
4.1?基于知識庫與圖像生成的營銷顧問
4.2?基于GPT4v/GLM-4V實現(xiàn)多模態(tài)交互
4.3?AgentGPT、AutoGPT?實踐與原理拆解
5.?大模型賦能研發(fā)生產(chǎn)實踐
5.1?大模型時代下的研發(fā)工序新范式
5.1.1?需求分析和設(shè)計階段
5.1.2?軟件編碼與測試階段
5.1.3?應(yīng)用發(fā)布與維護(hù)階段
5.1.4?軟件開發(fā)場景大模型應(yīng)用行業(yè)回顧
5.2?當(dāng)前大模型落地對研發(fā)人員的要求與挑戰(zhàn)
5.2.1?研發(fā)人員的AI應(yīng)用水平
5.2.2?研發(fā)人員的業(yè)務(wù)理解能力
5.2.3?新技術(shù)的敏感度與實踐
5.2.4?研發(fā)管理者的要求
5.3?超級開發(fā)者的崛起與成長路徑
5.3.1?大模型時代下的全棧工程師
5.3.2?業(yè)務(wù)理解與需求分析的全?;?br />
5.3.3?領(lǐng)域特點與模塊化認(rèn)知
5.3.4?演進(jìn)式架構(gòu)設(shè)計
5.3.5?端到端研發(fā)交付全流程
5.3.6?開發(fā)者的成長路徑(人人都是開發(fā)者)
5.4?軟件提示工程場景應(yīng)用與實戰(zhàn)
5.4.1?提示詞工程回顧(Prompt?Engineering)
5.4.1?代碼生成部分:text2SQL、Text2Python
5.4.2?Bug檢測與修復(fù)部分:Bugfix、Explain
5.4.3?流程提效部分:產(chǎn)品實踐與技術(shù)知識問答
5.5?構(gòu)建大模型時代下的軟件研發(fā)組織
5.5.1?模型適配&開放框架選型&?場景應(yīng)用適配
5.5.2?基于人與AI系統(tǒng)的流程實踐
5.5.3?研發(fā)數(shù)據(jù)資產(chǎn)和知識管理
5.5.4?數(shù)據(jù)隱私保護(hù)與安全合規(guī)
5.5.5?專業(yè)能力與組織分工演進(jìn)