界面新聞記者 | 李彪
界面新聞編輯 | 宋佳楠
年初發布第一代世界模型Genie后,DeepMind又在年末帶著升級版新模型登場了。
美國當地時間12月4日,谷歌旗下人工智能研究機構DeepMind推出新模型Genie 2。作為Genie模型的升級版,Genie2同樣是一款世界模型(AI行業對理解和模擬現實世界生成式AI模型的統稱),升級后其在模擬復雜環境方面展現出更加強大的實力。
據DeepMind論文介紹,新模型最大的特色是支持通過單張圖片和文字描述生成3D世界,生成時長可持續一分鐘左右,但多數情況下維持在10到20秒之間。
DeepMind在論文中附帶了許多段演示視頻,展示用戶與Genie 2的互動過程。模型會根據文字描述生成初始圖片,再基于這張圖片創造出一個完整的3D互動世界。用戶可以通過操縱鍵盤鼠標與其互動,而Genie 2會實時模擬生成你看到的每一幀畫面。
生成的3D世界支持用戶從不同的視角互動,如第一人稱視角和等距視角,以還原真實世界互動的既視感。
從演示視頻中可以看出,模型生成的3D世界中的許多細節都在模擬真實世界,例如模擬物體交互、復雜角色動畫、物理現象、照明效果、反射效果及NPC設計等等。
最為重要的是,這款世界模型還可以“繼續成長”變得更強大。論文介紹,推出Genie 2的主要目的之一是為通用AI智能體提供無限多樣的動態場景,用于訓練和評估。經過循環往復的大規模訓練,AI也從模擬真實世界無限接近成為一個可以理解真實世界的“智能體”。
具備以上一系列強大功能后,Genie 2模型有望在游戲領域先找到一番“用武之地”。
DeepMind團隊在論文中特別指出,Genie 2能按照用戶需求生成豐富多樣的3D游戲環境,如果未來用于游戲開發中任務場景設計,或可徹底改變游戲行業,特別會給《我的世界》這類開放世界游戲的創作帶來“一場技術革命”。