国产91免费_国产精品电影一区_日本s色大片在线观看_中文在线免费看视频

CNTXJ.NET | 通信界-中國通信門戶 | 通信圈 | 通信家 | 下載吧 | 說吧 | 人物 | 前瞻 | 智慧(區塊鏈 | AI
 國際新聞 | 國內新聞 | 運營動態 | 市場動態 | 信息安全 | 通信電源 | 網絡融合 | 通信測試 | 通信終端 | 通信政策
 專網通信 | 交換技術 | 視頻通信 | 接入技術 | 無線通信 | 通信線纜 | 互聯網絡 | 數據通信 | 通信視界 | 通信前沿
 智能電網 | 虛擬現實 | 人工智能 | 自動化 | 光通信 | IT | 6G | 烽火 | FTTH | IPTV | NGN | 知本院 | 通信會展
您現在的位置: 通信界 >> 智慧 >> 新聞正文
 
Sora如何降維打擊其他文生視頻大模型?記者實測對比
[ 通信界 | 羅亦丹 | www.6611o.com | 2024/2/19 9:14:15 ]
 

  OpenAI的文生視頻大模型Sora已經發布兩天,其沖擊力依然不減。

  2月18日,新京報貝殼財經記者進行了Sora與其他文生視頻大模型的對比測試,發現Sora在時間和視頻生成質量上均對“同行”產生了“降維打擊”:其他文生視頻大模型僅能生成3至4秒的視頻,而Sora生成的視頻時間最多可達1分鐘,且景物也更加清晰穩定、符合描述。

  不過,隨著越來越多使用Sora制作的視頻出現以及部分技術細節的公開,業界開始對其進行全方位審視,其中,贊揚和驚嘆聲不少,但Sora生成的視頻也被發現存在諸多不合理之處。

  文生視頻對比實測:Sora從“動圖”升級到“短片”

  “一個時髦的女人走在東京的街道上,街道上充滿了溫暖發光的霓虹燈和生動的城市標志。她穿著一件黑色的皮夾克,一件紅色的長裙,一雙黑色的靴子,還帶著一個黑色的錢包。她戴著太陽鏡,涂著紅色的口紅。她自信而隨意地走著。街道是潮濕和反光的,創造了一個五顏六色的燈的鏡面效果。許多行人走來走去。”這是OpenAI官網介紹Sora時,出現的第一組提示詞。

  在OpenAI推出Sora之前,文生視頻領域的創業公司主要包括Pika、Runway等,為了驗證Sora的能力,新京報貝殼財經記者將上述同樣的提示詞輸入Pika文生視頻模型,以及Runway旗下的Gen-2video文生視頻模型進行了實測。

在相同提示詞下,新京報貝殼財經記者使用Pika生成的視頻截圖。

在相同提示詞下,新京報貝殼財經記者使用runway旗下Gen-2video生成的視頻截圖。

  OpenAI官網上Sora生成的視頻。

  貝殼財經記者發現,在相同的提示詞下,Pika僅能生成3秒的視頻,Gen-2video則可以生成4秒的視頻。其中,Pika的視頻為“時髦女人”的背影,無法體現她“戴著太陽鏡,涂著紅色的口紅”的描述,不過對于提示詞中“潮濕反光的街道和五顏六色燈的鏡面效果”體現得較好,但整體上視頻較為模糊。

  Gen-2video則跳出了“無法輸入這么多提示詞”的彈窗,并根據能夠輸入的部分生成了一個4秒的視頻,該視頻相比Pika顯然精細很多,也符合提示詞描述的人物形象,包括“街道、人群、黑錢包”等。

  但可以發現,無論是Pika還是Gen-2video,都忽略了“一件紅色的長裙”這個細節,且貝殼財經記者通過觀看視頻發現,這兩段視頻仍能看出AI生成的影子,特別是Gen-2video的人物臉部,有細微的形變,這正是AI生成視頻的特點之一:難以始終保持同一人物的連貫性。

  而Sora不僅體現了提示詞中的全部細節,而且還很好地保持了人物的連貫性,使得該視頻幾乎可以“以假亂真”。當然,如果仔細觀察,可以發現該視頻中人物的腳步在某幾個幀會出現不自然的扭曲,以及該視頻中的背景廣告牌雖然酷似日文,但由于目前AI還無法直接在視頻中“認識”文字,其只能生成似是而非的“日文”,這都是AI生成視頻的特點之一。

  但即便如此,Sora還是用事實顯現出了同其他文生視頻大模型的代差。

  在谷歌和推特都有從業經歷的AI創業者Gabor Cselle也發布了使用相同提示詞,在其他四個文生視頻模型中“復現”Sora“穿過下雪、櫻花飛舞的東京街道……”的場景,并表示“其他模型達不到能和Sora比較的效果”。

  Gabor Cselle社交賬號截圖。

  在國內,也有不少AI從業者直觀地感受到了Sora帶來的沖擊。

  清華大學沈陽教授團隊一直聚焦AI在各個領域的應用,并也一直在使用AI模型進行文生視頻的操作。2月17日,他在朋友圈發布了一條團隊成員花兩天制作的“半失敗”AI視頻,并表示“從這里可以看出和Sora的差距,我讓她暫時放棄這個作品,等算法升級再重做一下。”

  對于Sora出現后,使用AI制作視頻的工作能否繼續,沈陽回復貝殼財經記者“慢慢弄,往前挪唄”。

  理解物理世界顛覆影視、游戲行業 Sora是“通用世界模型”嗎?

  為何Sora能夠在視頻生成的質量上明顯領先同業產品?OpenAI在官方網站上表示,Sora是能夠理解和模擬現實世界的模型的基礎,相信這一能力將是實現通用人工智能的重要里程碑。不過,Sora還存在很多不完善之處,仍然處于世界模型研究應用的初期階段。

  什么是世界模型?貝殼財經了解到,實際上runway公司在去年12月就提出過要開發通用世界模型(General World Model),用其旗下的Gen-2模型來模擬整個世界,“我們相信,人工智能的下一個重大進步將來自理解視覺世界及其動態的系統,這就是為什么我們要圍繞通用世界模型開始一項新的長期研究工作。”

  從效果上看,目前OpenAI已經通過Sora部分做到了這一點,因為只有理解物理世界的運行法則,文生視頻模型才能創造出更加逼真的視頻。英偉達高級科學家Jim Fan就對此表示,Sora是一個數據驅動的物理引擎,“它是對許多世界的模擬,無論是真實的,還是虛構的。該模擬器通過去噪和梯度學習方式,學習了復雜的渲染、直觀的物理、長期推理和語義理解。”

  而理解現實世界的物理法則,也正是通往通用人工智能這一“終極目標”的必經之路。

  對此,不少科技圈名人都發出了驚嘆,馬斯克直接在社交平臺上發布短評“GG世界”(GG是網絡游戲的用語之一,原指游戲結束時玩家互相致意,后引申為“游戲結束”)。

  360公司董事長周鴻祎則直接在朋友圈發文稱,一旦AI能夠接上攝像頭,觀看并理解世界上所有的電影,它對世界的理解能力將遠遠超過僅僅通過文字學習所能達到的水平。在這種情況下,實現通用人工智能不再是遙不可及的夢想。周鴻祎甚至預測,這一天可能在一兩年內就會到來,而不是十年或二十年。

  在現實層面,有更多人擔心文生視頻大模型可能直接沖擊影視和游戲行業。美國舊金山早期投資人Zak Kukoff預測,在5年內,一個不到5人的團隊將可能用文生視頻模型制作出一部票房收入超過5000萬美元的電影。

  值得注意的是,日前大火的游戲《幻獸帕魯》的開發團隊就僅有4人,有許多人質疑該團隊使用了AI生成技術制作游戲角色,以節省成本。而根據OpenAI 發布的最新Sora技術報告,Sora能夠模擬視頻游戲的數字化過程,Sora能在控制 Minecraft 游戲角色進行基本操作的同時,高質量動態渲染游戲世界。這意味著,個人開發制作游戲的門檻可能會被進一步降低。

  前阿里巴巴副總裁,Lepton AI公司創始人賈揚清則直接評價Sora“真的非常牛”,他表示Sora的問世可能會給對作OpenAI的公司帶來一波被大廠FOMO(害怕錯過機會而導致的收購)收購的機會。賈揚清預測,大模型市場長期仍將呈現閉源寡頭的格局,開源大模型仍然需要一段時間才能追趕上,而從算法小廠的角度來看,要么在算法上與OpenAI媲美,要么深耕垂直領域的應用,要么選擇開源道路;最后,基礎設施的需求將繼續猛增。

 

1作者:羅亦丹 來源:新京報 編輯:顧北

 

聲明:①凡本網注明“來源:通信界”的內容,版權均屬于通信界,未經允許禁止轉載、摘編,違者必究。經授權可轉載,須保持轉載文章、圖像、音視頻的完整性,并完整標注作者信息并注明“來源:通信界”。②凡本網注明“來源:XXX(非通信界)”的內容,均轉載自其它媒體,轉載目的在于傳遞更多行業信息,僅代表作者本人觀點,與本網無關。本網對文中陳述、觀點判斷保持中立,不對所包含內容的準確性、可靠性或完整性提供任何明示或暗示的保證。請讀者僅作參考,并請自行承擔全部責任。③如因內容涉及版權和其它問題,請自發布之日起30日內與本網聯系,我們將在第一時間刪除內容。 
熱點動態
普通新聞 OpenAI甩出AI模型Sora,拍大片就一句話的事兒,誰最害怕?
普通新聞 Sora為何出道即碾壓主流AI視頻模型:文生視頻最長紀錄 對世界有全面
普通新聞 世人驚呼Sora誕生:現實不存在了!多家A股公司積極布局視頻生成模型
普通新聞 Sora如何降維打擊其他文生視頻大模型?記者實測對比
普通新聞 30年全球半導體建廠洞察:美國需736天,比全球平均值多8%
普通新聞 全球首款透明屏PC?聯想將在MWC展示新款AI PC
普通新聞 AMD將發銳龍8000GE系列APU 頻率功耗均降低
普通新聞 iPhoneSE4或2025年推出 造型類似iPhone14
普通新聞 曝魅族21PRO已經正式完成測試將于下個月開啟預熱
普通新聞 外媒:美國政府考慮為英特爾提供超過100億美元補貼
普通新聞 國家綠色發展基金領投,美克生能源完成D輪融資
普通新聞 周鴻祎:Sora意味著AGI實現將從10年縮短到1年
普通新聞 “手寫再見,智能你好” 一文讀懂AI商務速記
普通新聞 國貨之光!FFALCON雷鳥電視及顯示器新品,顏值與實力并存
普通新聞 FFALCON雷鳥2024新品發布會揭秘:MiniLED與千級背光分區如何重塑電
普通新聞 AI商務速記,引領高效溝通新時代
普通新聞 中國移動聯合華為,全球首條 5G-A 車聯網全要素驗證示范線路開通
普通新聞 華為全年研發投入1621億元!中國第一 世界第五
普通新聞 臺積電耗時36年 成全球最大半導體制造商
普通新聞 分析師:忘記FAANG和Magnificent Seven 美股將由AI 5來主導
通信視界
高通CEO安蒙:生成式AI走向終端,將帶來最大智
普通對話 高通CEO安蒙:生成式AI走向終端,將帶來最大
普通對話 李彥宏:不斷地重復開發基礎大模型是對社會
普通對話 中興通訊徐子陽:強基慧智,共建數智熱帶雨
普通對話 鄔賀銓:移動通信開啟5G-A新周期,云網融合
普通對話 華為輪值董事長胡厚崑:我們正努力將5G-A帶
普通對話 高通中國區董事長孟樸:5G與AI結合,助力提
普通對話 雷軍發布小米年度演講:堅持做高端,擁抱大
普通對話 聞庫:算網融合正值挑戰與機遇并存的關鍵階
普通對話 工信部副部長張云明:我國算力總規模已居世
普通對話 鄔賀銓:我國互聯網平臺企業發展的新一輪機
通信前瞻
亨通光電實踐數字化工廠,“5G+光纖”助力新一
普通對話 亨通光電實踐數字化工廠,“5G+光纖”助力新
普通對話 中科院錢德沛:計算與網絡基礎設施的全面部
普通對話 工信部趙志國:我國算力總規模居全球第二 保
普通對話 鄔賀銓院士解讀ChatGPT等數字技術熱點
普通對話 我國北方海區運用北斗三號短報文通信服務開
普通對話 華為云Stack智能進化,三大舉措賦能政企深度
普通對話 孟晚舟:“三大聚力”迎接數字化、智能化、
普通對話 物聯網設備在智能工作場所技術中的作用
普通對話 軟銀研發出以無人機探測災害被埋者手機信號
普通對話 AI材料可自我學習并形成“肌肉記憶”
普通對話 北斗三號衛星低能離子能譜儀載荷研制成功
普通對話 為什么Wi-Fi6將成為未來物聯網的關鍵?
普通對話 馬斯克出現在推特總部 收購應該沒有懸念了
普通對話 臺積電澄清:未強迫員工休假或有任何無薪假
普通對話 新一代載人運載火箭發動機研制獲重大突破
推薦閱讀
Copyright @ Cntxj.Net All Right Reserved 通信界 版權所有
未經書面許可,禁止轉載、摘編、復制、鏡像