請(qǐng) 登錄后使用快捷導(dǎo)航
沒(méi)有賬號(hào)？立即注冊(cè)

[切換城市]
蘭州 北京 上海 天津 重慶 長(zhǎng)春 沈陽(yáng) 西寧 西安 銀川 鄭州 濟(jì)南 太原 合肥 武漢 南京 成都 貴陽(yáng) 昆明 南寧 杭州 南昌 廣州 福州

新資訊_傳遞價(jià)值資訊,優(yōu)質(zhì)的新資訊平臺(tái)_最新_熱點(diǎn)_產(chǎn)業(yè)_行業(yè)觀察_城市發(fā)展_政策解讀 › 首頁(yè) ›最新資訊› 國(guó)際資訊 › 查看內(nèi)容

返回首頁(yè)

文字轉(zhuǎn)視頻來(lái)了！美國(guó)OpenAI發(fā)布首個(gè)視頻生成模型

新資訊 2024-2-17 13:39 央視財(cái)經(jīng) 21 0

（央視財(cái)經(jīng)《第一時(shí)間》）美國(guó)開(kāi)放人工智能研究中心OpenAI，15日發(fā)布了首個(gè)視頻生成模型，該模型可通過(guò)接收文本指令，生成相應(yīng)的視頻。

據(jù)美國(guó)開(kāi)放人工智能研究中心官網(wǎng)介紹，該公司正在努力讓人工智能“理解和模擬處在運(yùn)動(dòng)當(dāng)中的物理世界”。此次發(fā)布的文字轉(zhuǎn)視頻模型可以依據(jù)用戶輸入的指令，生成一段時(shí)長(zhǎng)可達(dá)1分鐘的視頻。也能獲取現(xiàn)有的靜態(tài)圖像并從中生成視頻，還能獲取現(xiàn)有視頻，進(jìn)行擴(kuò)展或填充缺失內(nèi)容。

據(jù)介紹，該模型能夠生成包含多個(gè)角色以及特定類型運(yùn)動(dòng)的復(fù)雜場(chǎng)景，并能精確生成物體和背景的細(xì)節(jié)。目前的模型仍然存在缺陷，例如，它可能難以精確模擬復(fù)雜場(chǎng)景的物理狀況，也可能無(wú)法理解一些特定的因果和時(shí)間聯(lián)系等。此外，模型還可能混淆一些文本指令中的空間細(xì)節(jié)，例如左右方向等。