|
點(diǎn)擊 1490回復(fù) 0
原帖
2022-06-04 14:07
“一句話生成視頻”AI 爆火“一句話生成視頻”AI 爆火
由清華和智源研究院出品的模型 CogVideo,“一脈相承”于文本-圖像生成模型 CogView2,這個系列的 AI 模型只支持中文輸入,輸出的4秒視頻幀數(shù)在32張左右。該模型一共有90億參數(shù),基于預(yù)訓(xùn)練文本-圖像模型 CogView2 打造,一共分為兩個模塊。第一部分先基于CogView2,通過文本生成幾幀圖像,這時候合成視頻的幀率還很低;第二部分則會基于雙向注意力模型對生成的幾幀圖像進(jìn)行插幀,來生成幀率更高的完整視頻。 |
粵公網(wǎng)安備 44030402000745號
客服微信