課程簡介
理解 DeepSeek 大模型 (假設(shè)) 的特點(diǎn)、優(yōu)勢和局限性。
掌握基于 DeepSeek 構(gòu)建各種 AI 應(yīng)用的Prompt Engineering 技巧。
學(xué)習(xí)如何對 DeepSeek 大模型進(jìn)行微調(diào) (Fine-tuning),以適應(yīng)特定業(yè)務(wù)場景。
掌握將 DeepSeek 大模型集成到現(xiàn)有系統(tǒng)中的方法。
了解如何評估和優(yōu)化基于 DeepSeek 構(gòu)建的應(yīng)用的性能和效果。
能夠構(gòu)建基于 DeepSeek 的企業(yè)級 AI 應(yīng)用原型系統(tǒng)。
了解基于LLM的企業(yè)應(yīng)用合規(guī)性和安全實(shí)踐。
目標(biāo)收益
培訓(xùn)對象
機(jī)器學(xué)習(xí)工程師、AI 開發(fā)者、數(shù)據(jù)科學(xué)家、業(yè)務(wù)分析師、產(chǎn)品經(jīng)理,以及希望利用大模型構(gòu)建創(chuàng)新應(yīng)用的企業(yè)技術(shù)人員。
課程大綱
第一天:DeepSeek 大模型概覽與Prompt Engineering 模塊 1:DeepSeek 大模型概覽 (上午) |
DeepSeek 大模型的架構(gòu)特點(diǎn) (Transformer-based, etc.) DeepSeek 大模型的能力范圍 (文本生成, 語言理解, 代碼生成, etc.) DeepSeek 大模型的優(yōu)勢與局限性 (推理速度, 上下文長度, 領(lǐng)域知識, etc.) DeepSeek 大模型的部署方式 (API, 模型下載, etc.) 和成本考量 與其它主流大模型的對比分析 (GPT-3/4, PaLM, LLaMA, etc.) |
模塊 2:Prompt Engineering 基礎(chǔ) (上午) |
什么是 Prompt Engineering? 核心原則和目標(biāo) Prompt 的構(gòu)成要素: 指令, 上下文, 輸入, 輸出指示器 Prompt Engineering 的常用技巧: 零樣本 (Zero-shot) / 小樣本 (Few-shot) 學(xué)習(xí) 思維鏈 (Chain-of-Thought) Prompting 角色扮演 (Role-Playing) Prompting 提示模版設(shè)計(jì)與管理 |
模塊 3:Prompt Engineering 實(shí)戰(zhàn) (下午) |
針對不同任務(wù)設(shè)計(jì) Prompt: 文本摘要 (Summarization) 內(nèi)容生成 (Content Generation) 問題回答 (Question Answering) 文本翻譯 (Translation) 代碼生成 (Code Generation) Prompt 優(yōu)化與評估: 使用評估指標(biāo) (BLEU, ROUGE, etc.) 評估 Prompt 效果 A/B 測試不同 Prompt 變體 Prompt 注入攻擊防范 |
模塊 4:DeepSeek 大模型 API 使用 (假設(shè)) (下午) |
DeepSeek API 認(rèn)證與授權(quán) API 請求參數(shù)詳解 (溫度, Top-P, 長度限制, etc.) API 調(diào)用錯(cuò)誤處理與重試機(jī)制 API 使用最佳實(shí)踐 (批量處理, 異步調(diào)用, etc.) 動手實(shí)踐:通過 DeepSeek API 實(shí)現(xiàn)文本摘要、翻譯等功能 |
第二天:DeepSeek 大模型微調(diào) (Fine-tuning) 模塊 5:微調(diào) (Fine-tuning) 基礎(chǔ) (上午) |
什么是微調(diào)? 為什么要微調(diào)? 微調(diào)的優(yōu)勢與局限性 微調(diào)的數(shù)據(jù)準(zhǔn)備: 數(shù)據(jù)收集, 清洗, 標(biāo)注 微調(diào)的策略: 完全微調(diào) (Full Fine-tuning) 參數(shù)高效微調(diào) (Parameter-Efficient Fine-tuning) LoRA (Low-Rank Adaptation) Prefix-Tuning 選擇合適的微調(diào)策略 |
模塊 6:DeepSeek 大模型微調(diào)實(shí)戰(zhàn) (假設(shè)) (上午) |
選擇微調(diào)框架: Hugging Face Transformers, etc. 準(zhǔn)備微調(diào)數(shù)據(jù)集 配置微調(diào)參數(shù): 學(xué)習(xí)率, Batch Size, Epochs 啟動微調(diào)過程 監(jiān)控微調(diào)過程: Loss 曲線, 評估指標(biāo) 動手實(shí)踐:使用 Hugging Face Transformers 對 DeepSeek 大模型進(jìn)行微調(diào) |
模塊 7:微調(diào)模型評估與部署 (下午) |
微調(diào)模型評估指標(biāo): 根據(jù)任務(wù)類型選擇合適的評估指標(biāo) 微調(diào)模型評估方法: 交叉驗(yàn)證, Holdout驗(yàn)證 微調(diào)模型部署: API 部署: 使用 Flask, FastAPI 等框架 模型 Serving: 使用 TensorFlow Serving, TorchServe 等工具 模型監(jiān)控與維護(hù) |
模塊 8:使用 Vector Database 增強(qiáng) DeepSeek 應(yīng)用 (下午) |
向量數(shù)據(jù)庫原理與 DeepSeek 模型嵌入 將非結(jié)構(gòu)化數(shù)據(jù)向量化并儲存在數(shù)據(jù)庫中 使用向量數(shù)據(jù)庫做語義檢索 將檢索到的上下文信息與 Prompt 結(jié)合,提升 LLM 效果 |
第三天:企業(yè)應(yīng)用案例與最佳實(shí)踐 模塊 9:基于 DeepSeek 的企業(yè)應(yīng)用案例 (上午) |
智能客服: 構(gòu)建自動回復(fù)客戶咨詢的聊天機(jī)器人 知識圖譜構(gòu)建: 從海量文本中提取知識并構(gòu)建知識圖譜 內(nèi)容生成: 自動生成營銷文案, 新聞稿, 技術(shù)文檔 代碼生成: 輔助程序員編寫代碼, 自動生成測試用例 行業(yè)應(yīng)用: 金融風(fēng)控: 欺詐檢測, 信用評估 醫(yī)療診斷: 輔助醫(yī)生進(jìn)行疾病診斷 智能制造: 預(yù)測性維護(hù), 質(zhì)量檢測 案例分析:分析優(yōu)秀案例的技術(shù)架構(gòu)、實(shí)現(xiàn)步驟和關(guān)鍵挑戰(zhàn) |
模塊 10:將 DeepSeek 集成到現(xiàn)有系統(tǒng) (上午) |
API 集成: 使用 API 網(wǎng)關(guān)統(tǒng)一管理 API 消息隊(duì)列集成: 使用 Kafka, RabbitMQ 等消息隊(duì)列進(jìn)行異步處理 數(shù)據(jù)庫集成: 將 DeepSeek 生成的數(shù)據(jù)存儲到數(shù)據(jù)庫中 用戶界面集成: 在 Web 頁面, 移動 App 中展示 DeepSeek 的結(jié)果 動手實(shí)踐:設(shè)計(jì)將 DeepSeek 集成到現(xiàn)有系統(tǒng)的方案 |
模塊 11:DeepSeek 應(yīng)用性能與成本優(yōu)化 (下午) |
性能優(yōu)化: Prompt 優(yōu)化 模型量化, 剪枝 使用 GPU 加速推理 成本優(yōu)化: 選擇合適的 API 計(jì)費(fèi)方案 緩存 API 結(jié)果 控制 API 調(diào)用頻率 動手實(shí)踐:使用性能分析工具評估 DeepSeek 應(yīng)用的性能瓶頸,并提出優(yōu)化方案 |
模塊 12:LLM 應(yīng)用合規(guī)性和安全 (下午) |
LLM應(yīng)用中的偏見問題與緩解方法 數(shù)據(jù)隱私保護(hù)措施:匿名化,差分隱私等 LLM應(yīng)用的安全風(fēng)險(xiǎn):提示注入、對抗性攻擊等 Responsible AI 原則與實(shí)踐 可信賴AI框架:歐盟AI法案等 動手實(shí)踐:分析LLM 生成內(nèi)容的偏見并設(shè)計(jì)緩解方案 |
工具與技術(shù): |
DeepSeek 大模型 API (假設(shè)) Hugging Face Transformers Python 云平臺 (AWS, Azure, Google Cloud) 向量數(shù)據(jù)庫 Flask, FastAPI Kafka, RabbitMQ TensorBoard |
第一天:DeepSeek 大模型概覽與Prompt Engineering 模塊 1:DeepSeek 大模型概覽 (上午) DeepSeek 大模型的架構(gòu)特點(diǎn) (Transformer-based, etc.) DeepSeek 大模型的能力范圍 (文本生成, 語言理解, 代碼生成, etc.) DeepSeek 大模型的優(yōu)勢與局限性 (推理速度, 上下文長度, 領(lǐng)域知識, etc.) DeepSeek 大模型的部署方式 (API, 模型下載, etc.) 和成本考量 與其它主流大模型的對比分析 (GPT-3/4, PaLM, LLaMA, etc.) |
模塊 2:Prompt Engineering 基礎(chǔ) (上午) 什么是 Prompt Engineering? 核心原則和目標(biāo) Prompt 的構(gòu)成要素: 指令, 上下文, 輸入, 輸出指示器 Prompt Engineering 的常用技巧: 零樣本 (Zero-shot) / 小樣本 (Few-shot) 學(xué)習(xí) 思維鏈 (Chain-of-Thought) Prompting 角色扮演 (Role-Playing) Prompting 提示模版設(shè)計(jì)與管理 |
模塊 3:Prompt Engineering 實(shí)戰(zhàn) (下午) 針對不同任務(wù)設(shè)計(jì) Prompt: 文本摘要 (Summarization) 內(nèi)容生成 (Content Generation) 問題回答 (Question Answering) 文本翻譯 (Translation) 代碼生成 (Code Generation) Prompt 優(yōu)化與評估: 使用評估指標(biāo) (BLEU, ROUGE, etc.) 評估 Prompt 效果 A/B 測試不同 Prompt 變體 Prompt 注入攻擊防范 |
模塊 4:DeepSeek 大模型 API 使用 (假設(shè)) (下午) DeepSeek API 認(rèn)證與授權(quán) API 請求參數(shù)詳解 (溫度, Top-P, 長度限制, etc.) API 調(diào)用錯(cuò)誤處理與重試機(jī)制 API 使用最佳實(shí)踐 (批量處理, 異步調(diào)用, etc.) 動手實(shí)踐:通過 DeepSeek API 實(shí)現(xiàn)文本摘要、翻譯等功能 |
第二天:DeepSeek 大模型微調(diào) (Fine-tuning) 模塊 5:微調(diào) (Fine-tuning) 基礎(chǔ) (上午) 什么是微調(diào)? 為什么要微調(diào)? 微調(diào)的優(yōu)勢與局限性 微調(diào)的數(shù)據(jù)準(zhǔn)備: 數(shù)據(jù)收集, 清洗, 標(biāo)注 微調(diào)的策略: 完全微調(diào) (Full Fine-tuning) 參數(shù)高效微調(diào) (Parameter-Efficient Fine-tuning) LoRA (Low-Rank Adaptation) Prefix-Tuning 選擇合適的微調(diào)策略 |
模塊 6:DeepSeek 大模型微調(diào)實(shí)戰(zhàn) (假設(shè)) (上午) 選擇微調(diào)框架: Hugging Face Transformers, etc. 準(zhǔn)備微調(diào)數(shù)據(jù)集 配置微調(diào)參數(shù): 學(xué)習(xí)率, Batch Size, Epochs 啟動微調(diào)過程 監(jiān)控微調(diào)過程: Loss 曲線, 評估指標(biāo) 動手實(shí)踐:使用 Hugging Face Transformers 對 DeepSeek 大模型進(jìn)行微調(diào) |
模塊 7:微調(diào)模型評估與部署 (下午) 微調(diào)模型評估指標(biāo): 根據(jù)任務(wù)類型選擇合適的評估指標(biāo) 微調(diào)模型評估方法: 交叉驗(yàn)證, Holdout驗(yàn)證 微調(diào)模型部署: API 部署: 使用 Flask, FastAPI 等框架 模型 Serving: 使用 TensorFlow Serving, TorchServe 等工具 模型監(jiān)控與維護(hù) |
模塊 8:使用 Vector Database 增強(qiáng) DeepSeek 應(yīng)用 (下午) 向量數(shù)據(jù)庫原理與 DeepSeek 模型嵌入 將非結(jié)構(gòu)化數(shù)據(jù)向量化并儲存在數(shù)據(jù)庫中 使用向量數(shù)據(jù)庫做語義檢索 將檢索到的上下文信息與 Prompt 結(jié)合,提升 LLM 效果 |
第三天:企業(yè)應(yīng)用案例與最佳實(shí)踐 模塊 9:基于 DeepSeek 的企業(yè)應(yīng)用案例 (上午) 智能客服: 構(gòu)建自動回復(fù)客戶咨詢的聊天機(jī)器人 知識圖譜構(gòu)建: 從海量文本中提取知識并構(gòu)建知識圖譜 內(nèi)容生成: 自動生成營銷文案, 新聞稿, 技術(shù)文檔 代碼生成: 輔助程序員編寫代碼, 自動生成測試用例 行業(yè)應(yīng)用: 金融風(fēng)控: 欺詐檢測, 信用評估 醫(yī)療診斷: 輔助醫(yī)生進(jìn)行疾病診斷 智能制造: 預(yù)測性維護(hù), 質(zhì)量檢測 案例分析:分析優(yōu)秀案例的技術(shù)架構(gòu)、實(shí)現(xiàn)步驟和關(guān)鍵挑戰(zhàn) |
模塊 10:將 DeepSeek 集成到現(xiàn)有系統(tǒng) (上午) API 集成: 使用 API 網(wǎng)關(guān)統(tǒng)一管理 API 消息隊(duì)列集成: 使用 Kafka, RabbitMQ 等消息隊(duì)列進(jìn)行異步處理 數(shù)據(jù)庫集成: 將 DeepSeek 生成的數(shù)據(jù)存儲到數(shù)據(jù)庫中 用戶界面集成: 在 Web 頁面, 移動 App 中展示 DeepSeek 的結(jié)果 動手實(shí)踐:設(shè)計(jì)將 DeepSeek 集成到現(xiàn)有系統(tǒng)的方案 |
模塊 11:DeepSeek 應(yīng)用性能與成本優(yōu)化 (下午) 性能優(yōu)化: Prompt 優(yōu)化 模型量化, 剪枝 使用 GPU 加速推理 成本優(yōu)化: 選擇合適的 API 計(jì)費(fèi)方案 緩存 API 結(jié)果 控制 API 調(diào)用頻率 動手實(shí)踐:使用性能分析工具評估 DeepSeek 應(yīng)用的性能瓶頸,并提出優(yōu)化方案 |
模塊 12:LLM 應(yīng)用合規(guī)性和安全 (下午) LLM應(yīng)用中的偏見問題與緩解方法 數(shù)據(jù)隱私保護(hù)措施:匿名化,差分隱私等 LLM應(yīng)用的安全風(fēng)險(xiǎn):提示注入、對抗性攻擊等 Responsible AI 原則與實(shí)踐 可信賴AI框架:歐盟AI法案等 動手實(shí)踐:分析LLM 生成內(nèi)容的偏見并設(shè)計(jì)緩解方案 |
工具與技術(shù): DeepSeek 大模型 API (假設(shè)) Hugging Face Transformers Python 云平臺 (AWS, Azure, Google Cloud) 向量數(shù)據(jù)庫 Flask, FastAPI Kafka, RabbitMQ TensorBoard |