日本a√视频在线,久久青青亚洲国产,亚洲一区欧美二区,免费g片在线观看网站

        <style id="k3y6c"><u id="k3y6c"></u></style>
        <s id="k3y6c"></s>
        <mark id="k3y6c"></mark>
          
          

          <mark id="k3y6c"></mark>

          "); //-->

          博客專欄

          EEPW首頁 > 博客 > Sora將顛覆誰?

          Sora將顛覆誰?

          發(fā)布人:芯股嬸 時間:2024-02-23 來源:工程師 發(fā)布文章

          春節(jié)后的第一周,美國人工智能公司OpenAI依舊是全球矚目的焦點。

          此前在北京時間2月16日凌晨,OpenAI在官網(wǎng)宣布推出一個名為Sora的文本生成視頻模型,極大地拓展了AI在視頻內(nèi)容生成方面能力。相比此前已有的視頻生成模型,Sora在時長和分辨率上大幅超越,強大的文本理解和細節(jié)生成能力更是引發(fā)全球關注,被視為AI界的新里程碑。

          “完了,我可能要失業(yè)了?!彪S著不斷地翻看由Sora生成且未經(jīng)修改的視頻,在廣告設計公司做視頻剪輯的李俊心中涌起一股不安,在看到一段段視頻精準還原了提示文字的每一個細節(jié),他的職業(yè)危機感如潮水般涌來。

          Sora的橫空出世讓不少傳統(tǒng)行業(yè)的從業(yè)者感到顛覆與重塑正在上演,首當其沖的便是影視相關行業(yè)?!盁o人機視圖,海浪撞擊著大蘇爾的加雷點海灘崎嶇的懸崖.....這個景色捕捉了海岸的原始美景和太平洋海岸公路的崎嶇景觀?!迸c這段文字匹配的是一段Sora生成的高清視頻,盡管只有8秒,但已經(jīng)足夠讓李俊震撼不已。

          Sora的“問世”適逢中國春節(jié),順勢抓住了公眾閑暇時光與社交場景,并通過互聯(lián)網(wǎng)社交平臺擴散、裂變,最終引發(fā)熱烈談論,360創(chuàng)始人周鴻祎更是下場判斷,Sora意味著AGI的實現(xiàn)將從10年縮短到1年。與此同時,圍繞Sora相關功能的知識付費課程層出不窮,相關概念股成為龍年“開門紅”行情的領頭羊,“掘金熱潮”不減。

          OpenAI上一次這樣“出風頭”是在2022年11月底,其開發(fā)的ChatGPT點燃AI熱潮,掀起了整個2023年的人工智能淘金熱。那么,此次Sora的橫空出世,又將預示著什么?

          跨越式突破

          “Sora給人的震撼主要體現(xiàn)在其生成視頻的精細畫面已經(jīng)很接近現(xiàn)實世界,有些甚至到了難以區(qū)分真假的程度?!?月下旬,短視頻創(chuàng)作者夏廷對記者表示,Sora不僅提供了清晰、豐富的的視頻內(nèi)容,且其細節(jié)、光影和色彩等方面表現(xiàn)出色。

          雖然在此之前視頻生成已經(jīng)是大模型領域最熱門的研究方向之一,谷歌、Meta、Runway、百度、字節(jié)跳動等國內(nèi)外公司都在積極布局,但截至目前,市場上尚未出現(xiàn)能夠與Sora相抗衡的競爭對手。Sora走紅后,視頻生成賽道的領先者Runway公司CEO克里斯托瓦爾·巴倫蘇埃拉在X平臺上發(fā)布了一個簡短的宣言:“Game On(比賽開始了)。”

          圖片

          根據(jù)OpenAI官方介紹,因使用Transformer架構,Sora具有極強的擴展性,同時在基于過去對DALL·E和GPT的研究基礎構建上,還利用了DALL·E 3的重述提示詞技術,為視覺模型訓練數(shù)據(jù)生成高描述性的標注,該模型不僅能理解用戶提示詞中的物品,更能理解這些物品在真實世界的存在形式。

          2021年1月份,OpenAI發(fā)布了DALL·E模型,它能從文字說明中創(chuàng)建圖像,用于表達各種可由自然語言表達的概念。一年后,OpenAI發(fā)布DALL·E 2,相比第一代以4倍的分辨率生成更真實和準確的圖像。2023年9月,OpenAI再度刷新,DALL·E 3與整合了ChatGPT,語言理解能力大幅提升,可以將用戶的想法轉換為非常精確的圖像。從文生圖模型的快速迭代來看,Sora的突然爆發(fā)并未偶然。

          不過,OpenAI也說明了Sora的局限性:它可能難以準確模擬復雜場景的物理特性,并且可能無法理解因果關系的具體實例。例如,一個人可能會咬一口餅干,但餅干可能沒有咬痕。同時,該模型還可能混淆提示的空間細節(jié),例如,左右混淆,并且可能難以精確描述隨時間推移發(fā)生的事件,例如遵循特定的相機軌跡。

          目前,Sora尚未開放公測,僅相關程序人員、安全測試人員以及OpenAI挑選的少量創(chuàng)作者和藝術家有體驗權限。OpenAI稱,在Sora產(chǎn)品上線前將會進行一系列的安全測試,包括進行誤導性信息、仇恨內(nèi)容等對抗測試,構建幫助識別誤導性內(nèi)容的工具,并制定安全規(guī)則等。

          招商策略在研報中分析,“雖然OpenAI表示當前Sora仍有弱點,例如難以準確模擬復雜場景中的物理現(xiàn)象,可能無法理解具體的因果關系,但從當前展示的效果來看,Sora顯著領先于其他文生視頻模型,推動AI視頻生成進入了一個全新的時代?!?/p>

          顛覆與重構

          和此前ChatGPT一樣,Sora一夜爆火后,隨之而來的便是其應用領域會顛覆哪些行業(yè)的討論。

          “Sora的出現(xiàn)將極大地改變視頻制作的方式和效率,為導演們帶來更多的創(chuàng)作可能性?!毙っ魇且患矣耙暪镜木帉?,此前主要拍攝傳記片,他對《國際金融報》記者表示,Sora能夠將文本直接轉換成高質量的視頻,在某些場景下,拍攝條件可能受限或無法實現(xiàn),就能通過Sora生成相應的視頻片段來彌補這些不足。

          不過肖明也強調,Sora暫時不會顛覆影視行業(yè),因為視頻是由模型生成的,而不是真實的演員和場景,可能缺乏真實性和情感共鳴,“畢竟影視行業(yè)的核心是劇本,劇本和創(chuàng)意還是得靠人?!?/p>

          圖片

          受訪者提供

          根據(jù)浙商證券分析,短期內(nèi),Sora及同類產(chǎn)品可大幅提升圖像和短視頻的制作效率,改變創(chuàng)意生產(chǎn)及營銷工作流,提升短視頻產(chǎn)品生產(chǎn)力。對于業(yè)態(tài)更加復雜的長視頻和游戲,受限于模型目前還無法很好理解因果關系和其他技術難點,現(xiàn)階段或以提供美術靈感支持為主。

          “從中長期來看,Sora及同類產(chǎn)品將參與改變信息生產(chǎn)和分發(fā)兩大環(huán)節(jié)的進程中,PGC(專業(yè)生產(chǎn)內(nèi)容)將廣泛采用AI工具輔助生產(chǎn),UGC(用戶生產(chǎn)內(nèi)容)將借助AI工具逐步替代PGC(專業(yè)生產(chǎn)內(nèi)容)?!闭闵套C券進一步稱,“AI生成視頻工具的商業(yè)化將提速,目前Sora還未公布收費標準,參照之前部分文生視頻工具收費情況,定價相對較高。鑒于Sora采用的世界模擬器技術路徑,邊際成本或有降低的可能?!?/p>

          不過就實際情況而言,當下AI視頻的落地還面臨多重不確定性和挑戰(zhàn)。尤其是版權歸屬問題,AI生成的視頻內(nèi)容究竟歸屬于誰?這既涉及到原創(chuàng)性的界定,也牽涉到多方利益的平衡。

          “在實踐中,有關AIGC是否受著作權相關法律保護存在爭議?!鄙虾J泻HA永泰律師事務所合伙人陳元熹向記者指出,基于Sora與基于Stable Diffusion、DALL·E等其他軟件生成內(nèi)容的保護是類似的。在我國,《著作權法》第三條要求,作品應當是具有獨創(chuàng)性的智力成果。在使用過程中,使用者通過輸入提示詞,由Sora基于Diffusion與Transformer架構,直接生成不帶聲音的視頻內(nèi)容。在這個過程中,除了提示詞以外,使用者無法對Sora進行干預,這種視頻生成方式與傳統(tǒng)的視頻拍攝、剪輯等制作方法完全不同。

          “我們保守認為,這樣的視頻生成比較難以成為法律規(guī)定的作品。然而,北京互聯(lián)網(wǎng)法院在2023年11月的判決認可了基于Stable Diffusion生成圖片的著作權?!标愒溥M一步分析稱,“所以,Sora生成視頻涉及的著作權問題,還需要未來更多案件的具體分析與法律討論?!?/p>

          新一輪跟風?

          Sora橫空出世所激起的風浪仿佛“昨日重現(xiàn)”。

          在過去的2023年,ChatGPT引領了全球大模型的浪潮,掀起了全球范圍內(nèi)的AI軍備競賽。國內(nèi)科技行業(yè)則形成了“百模大戰(zhàn)”,百度、阿里、騰訊、科大訊飛等科技大廠和眾多創(chuàng)業(yè)公司跑步入場,通用大模型、垂直大模型等各類產(chǎn)品百花齊放;持續(xù)疲軟的手機行業(yè)也在全面擁抱AI大模型,華為、小米、OPPO、vivo等廠商都在致力于將大模型裝進手機里面。

          伴隨著Sora成為開年以來最亮眼的“王炸”,“降維打擊”“新的GPT時刻”“人類愿賭服輸”等贊譽紛至沓來,可以預見的是,國內(nèi)企業(yè)的跟進風潮將再度開啟。

          從春節(jié)后的首個交易日開始,A股市場相關概念股就迎來漲停潮。記者注意到,與AI、算力、游戲、影視、廣告營銷等行業(yè)相關的多家上市公司在投資者互動平臺上對Sora所引發(fā)的熱潮進行了回應。例如,巨人網(wǎng)絡表示,公司關注到Sora在視頻生成領域取得的突破性進展,公司同樣在積極布局多模態(tài)大模型領域,聚焦游戲垂直類創(chuàng)作場景;芒果超媒也表示,對以Sora為代表的新興AI文生視頻技術平臺保持密切關注。

          文生視頻模型并不是剛出現(xiàn)的新鮮事物,在Sora問世之前,Meta和谷歌也曾推出過文生視頻工具,創(chuàng)業(yè)公司中,Runway旗下視頻生成模型Gen-2和去年爆火的Pika旗下Pika 1.0在這一賽道都有亮眼的表現(xiàn)。

          但這些產(chǎn)品在Sora面前顯得有些黯然失色,OpenAI自帶的光環(huán)是原因之一,更重要的原因在于視頻長度、連貫性、畫質、多角度鏡頭等多個方面的突破,以及對人類語言和真實世界的理解。

          在對外發(fā)聲方面,相比上市公司,國內(nèi)的互聯(lián)網(wǎng)大廠們則顯得有些低調。有人說,Sora問世之后,壓力給到國內(nèi)的科技巨頭,尤其是字節(jié)跳動,原因在于Sora未來會對短視頻行業(yè)帶來巨大沖擊,而作為全球短視頻巨頭,字節(jié)跳動旗下視頻編輯工具剪映將面臨威脅。

          盡管在AI方面起步較晚,但從去年以來的一系列調整動作可以看出,字節(jié)跳動正在“火力全開”。就在Sora發(fā)布前一周,帶領團隊從0到1推出抖音的張楠宣布辭去抖音集團CEO一職,未來將把精力聚焦在剪映的發(fā)展上,張楠在朋友圈表示“跟著這個AI時代一起成長”,所透露的信號不言而喻。

          值得關注的是,2月20日,有消息稱,字節(jié)跳動推出了一款“中文版Sora”——Boximator,它可以通過文本精準控制生成視頻中人物或物體的動作。對此,字節(jié)跳動相關人士表示,Boximator目前還無法作為完善的產(chǎn)品落地,距離國外領先的視頻生成模型在畫面質量、保真率、視頻時長等方面還有很大差距。

          這也意味著,字節(jié)跳動能否突圍,依舊任重道遠,而這或許也是國內(nèi)眾多科技公司都需要摸索和解答的問題。


          *博客內(nèi)容為網(wǎng)友個人發(fā)布,僅代表博主個人觀點,如有侵權請聯(lián)系工作人員刪除。



          關鍵詞: Sora

          技術專區(qū)

          關閉