課程簡介
本課程將帶領(lǐng)您深入探索Sora類技術(shù)的崛起,理解其在業(yè)務(wù)場景中的創(chuàng)新引擎作用。我們將從Sora類技術(shù)的核心特點(diǎn)出發(fā),詳細(xì)剖析其靈活的視頻時(shí)間長度、分辨率、寬高比,以及強(qiáng)大的文本理解能力和視頻編輯能力。同時(shí),我們還將探討鏡頭3D一致性、物體角色持久一致性等關(guān)鍵技術(shù),以及游戲數(shù)字世界模擬和圖生視頻等前沿應(yīng)用。
目標(biāo)收益
培訓(xùn)對象
課程內(nèi)容
1. 引子~Sora介紹?
1.1?內(nèi)容特點(diǎn):靈活的視頻時(shí)間長度、分辨率、寬高比
1.2?文本理解能力
1.3?視頻編輯能力
1.4?鏡頭3D一致性
1.5?物體角色持久一致性
1.6?游戲數(shù)字世界模擬
1.7?圖生視頻
1.8?局限
2. AI視頻生成技術(shù)迭代?
2.1?VDM:Video?Diffusion?Models(google)
2.2?Make-A-Video
2.3?Imagen?Video
2.4?Video?LDM
2.5?AnimateDiff
2.6?Show-1
2.7?SVD:Stable?Video?Diffusion
2.8?NaViT/Vivit/DiT
2.8?Sora技術(shù)分析?與?opensora
3.1?行業(yè)發(fā)展概覽
3.2?生產(chǎn)端典型公司介紹:runway&pika&pixelverse
3.3?業(yè)務(wù)應(yīng)用端典型公司介紹:Tavus&奧創(chuàng)光年&各類工作室(AI我中華)
4. 真實(shí)工業(yè)環(huán)境下的多模態(tài)落地實(shí)踐
4.1??圖片模態(tài):
4.1.1?可控生圖?的技術(shù)落地介紹
4.1.2?IP形象復(fù)刻與可控生成衍生品
4.1.3?多格漫畫的生成與翻譯
4.1.4?頭像規(guī)模化生成
4.1.5?社區(qū)可控配圖
4.1.6?規(guī)?;鷪D推理成本控制
4.2?虛擬人模態(tài):
4.2.1?聲音克隆
4.2.2?虛擬IP互動(dòng)唱歌
4.2.3?數(shù)字分身制作
4.3?視頻模態(tài):
4.3.1?動(dòng)態(tài)漫畫視頻
4.3.2?短劇剪輯:視頻剪輯與自動(dòng)解說
4.3.3?短劇出海:視頻換臉、翻譯與對嘴型
5. 行業(yè)垂類落地核心環(huán)節(jié)建設(shè)
5.1?文案:商品理解與營銷短語
5.2?創(chuàng)意:劇本與創(chuàng)意模板
5.3?視覺化:生圖與視頻
5.4?GPU集群:選型、部署與推理加速
6. 展望
6.1?落地合規(guī)與安全展望
6.2?從多模態(tài)輸入到多模態(tài)輸出