虎扑评分区,老熟妇大胆性开放图,中文字幕精品av一区二区五区,波多野42部无码喷潮在线

谷歌 DeepMind 新研究:利用 AI 模型為無聲視頻配音

每日快訊
2024
06/19
22:02
IT之家
分享
評論

來源:IT之家 

據(jù)谷歌 DeepMind 新聞稿,DeepMind 近日公布了一項利用 AI 為無聲視頻生成背景音樂的 "video-to-audio" 技術(shù)。

IT 之家獲悉,當(dāng)前 DeepMind 這款 AI 模型依然存在局限性,需要開發(fā)者使用提示詞為模型預(yù)先 " 介紹 " 視頻可能的聲音,暫時不能直接根據(jù)視頻畫面添加具體音效

據(jù)悉,該模型首先會將用戶輸入的視頻進(jìn)行拆解,此后結(jié)合用戶的用戶文字提示,利用擴散模型反復(fù)運算,最終以生成與視頻畫面協(xié)調(diào)的背景聲音,例如輸入一條 " 在黑暗中行走 " 的無聲視頻,再添加 " 電影、恐怖片、音樂、緊張、混凝土上的腳步聲 " 等文字提示,相關(guān)模型就能生成恐怖風(fēng)格的背景音效。

DeepMind 同時表示,該 "video-to-audio" 模型可以為任何視頻生成無限數(shù)量的音軌,還能夠通過提示詞內(nèi)容判斷生成的音頻 " 正向性 " 或 " 反向性 ",從而令生成的聲音更貼近某些特定場景。

展望未來,DeepMind 表示研究人員正進(jìn)一步優(yōu)化這款 "video-to-audio" 模型,計劃未來能夠讓模型直接根據(jù)視頻內(nèi)容,無須通過提示詞即可生成視頻背景音,同時還將改善視頻中人物對白的口型同步能力。

THE END
廣告、內(nèi)容合作請點擊這里 尋求合作
數(shù)碼
免責(zé)聲明:本文系轉(zhuǎn)載,版權(quán)歸原作者所有;旨在傳遞信息,不代表砍柴網(wǎng)的觀點和立場。

相關(guān)熱點

海通證券分析師杰夫普(Jeff Pu)近日發(fā)布投資簡報,認(rèn)為蘋果公司已經(jīng)開始構(gòu)建基于 M2 Ultra 芯片的 AI 服務(wù)器。
每日快訊
一家 AI 初創(chuàng)公司 Suno 近日發(fā)布了首款能夠生成 " 廣播級 " 歌曲的工具,能夠在數(shù)秒之內(nèi)創(chuàng)作出兩分鐘的完整歌曲,所有用戶均可免費訪問。
評測
小米官宣將于 2 月 22 日晚發(fā)布 Redmi Book Pro 2024 筆記本,號稱是 " 小米筆記本業(yè)務(wù)的全新篇章 ",用手機的產(chǎn)業(yè)能力深度賦能筆記本業(yè)務(wù),并且全面接入小米澎湃 OS。
每日快訊
據(jù)國外媒體報道稱,iPhone 16 的所謂設(shè)計圖流出,而據(jù)此渲染出的效果是,回歸豎排雙攝。
評測
如果 Vision Pro 頭顯出現(xiàn)系統(tǒng)故障,用戶應(yīng)該如何恢復(fù)呢?根據(jù)蘋果解鎖的最新細(xì)節(jié),整個恢復(fù)過程類似于 Apple Watch 和 Apple TV,需要 iPhone 借助完成。
每日快訊

相關(guān)推薦

1
3