界面新聞記者 | 李彪
AI大模型可以從無到有地生產各種數據后,創造出的海量數據該怎么用成了新問題。
10月26日,在由界面新聞主辦的2023 REAL科技大會上,騰訊數字孿生產品部/自動駕駛業務總經理蘇奎峰發表了《數字孿生與生成式AI的閉環迭代進化》主題演講。
蘇奎峰認為外界對于數字孿生價值的理解存在諸多誤區,數字孿生的真正價值在于可視、可算與可用。可視在于提供一個交互方式,如果一個孿生系統沒有做到可視化,那么它將是失敗的;可算即將物理世界模型化和參數化,以實時數據驅動和推演,再將虛實場景疊加在一起,最后獲得更強和更大規模的計算模型,且這個計算模型可以按照設計者的需求隨時編輯。可用體現在提供沉浸式、游戲化的交互體驗,使得其在現實世界中可以無障礙使用,
他通過實際應用場景解釋了數字孿生的價值。一輛貨車送貨,技術團隊可以將裝載、卸載、運輸這些現實場景通過數字孿生建成數字世界。這個三維虛擬“世界”不僅要在視覺上做到了對物流世界的仿真還原,還必須可編輯的,例如改變車流方向、環境路況。
以他所負責的自動駕駛業務為例,自動駕駛行業當前最大的一個痛點就是缺數據。如果將數字孿生應用在自動駕駛的仿真系統中,一旦這套系統掌握了編輯能力,就可以按照開發者的需求進行二次開發設計。同時,還能通過這些可編輯數據再加上原來的傳感器采集數據,便可以按照高質量的數據來訓練AI大模型。大模型又可以生成完善自動駕駛功能需要的更多測試場景。
演講結束后,蘇奎峰接受了界面新聞記者的專訪,談了他思考數字孿生應用于自動駕駛的改變,及騰訊對于自動駕駛的投入戰略,以下為專訪內容(有刪改):
界面新聞:大模型可以生成提供大量高質量、結構化的數據,這些AI生成數據能夠解決自動駕駛缺數據的現狀嗎,通過這種方式與傳感器捕捉數據相比有哪些不同?
蘇奎峰:首先需要強調的是,現實數據一定是需要的,完全靠虛擬的數據肯定不可能。
自動駕駛目前在數據上主要克服三個問題。第一個是數據效率;第二個就是極端狀況數據(現實中無法復現測試);第三個是樣本均衡問題,如果某一類樣本數據多,某一類樣本數據少,也會影響最后的表現。
我們的解決方案就是通過數字孿生和 AIGC 結合。這種方案并不是完全脫離了傳感器,而是通過傳感器采集到了真實數據,采集完成數據,再通過數字孿生技術建模,相當于將一輛車行駛的現實場景重建成數字場景,并且我們還可以按照需求編輯這個三維的虛擬場景,做到了可視、可算和可用。
這套方案執行下來,第一,傳感器的數據保障了真實性;第二,數字孿生建立的場景又是可以編輯的,可按照自動駕駛測試的需求進行二次開發設計;第三,如果編輯效率低,還能通過這些可編輯數據再加上原來的傳感器采集數據, 訓練出一個大模型。
我們目前在這上面所做的工作,于基本算法上已有了雛形,現在開始驗證一致性。
界面新聞:對于技術驗證一致性后的落地使用,你有怎樣的預期?
蘇奎峰:很快,或許一年之后我們再見就可以討論落地效果。
界面新聞:騰訊的自動駕駛業務現在隸屬于數字孿生產品部,從公司戰略角度,這代表了怎樣的發展路線?
蘇奎峰:我們思考自動駕駛是一項復合技術,它包含了人工智能的許多底層技術,例如感知、建模、決策規劃。
自動駕駛的核心競爭力在于數據要素和計算資源的低成本獲取和高效利用。對數據進行高效收集和利用,是整個自動駕駛技術迭代的關鍵點。數字孿生的虛擬仿真技術有助于加速自動駕駛的落地應用,且在服務于自動駕駛的同時,又拓展了自身的應用邊界,例如智慧城市、工業數字化等等。
其實無論自動駕駛還是數字孿生,甚至于現在的 AIGC,我們現在的這個團隊都有儲備,隨時做遷移,以覆蓋自動駕駛的技術需要。
界面新聞:在自動駕駛業務領域,騰訊目前的計劃仍然是給車打造工具嗎?
蘇奎峰:是的,騰訊做自動駕駛的定位就是數字化助手,這也和騰訊在產業互聯網中的角色定位一致。
我們內部一開始也思考過造車與做Robotaxi類的自動駕駛算法提供商兩條路線,但很快就被否決掉了。不造車,是因為它涉及生產制造領域的專業問題,與騰訊的互聯網公司基因不符。不做算法提供商是因為商業模式,自動駕駛最終落地后的商業模型能不能成立,我們對此表示懷疑。
界面新聞:就BAT三家公司對自動駕駛的投入來說,騰訊怎么看各家近一兩年來在這上面的調整?
蘇奎峰:自動駕駛像所有行業一樣,當它的現實發展符合大家的理想預期時,各家就會加大投入,市場也會相應放大。目前在這種狀態下,大家都收縮的時候,說明行業現階段對這件事情的認知與判斷都很模糊。
如果把自動駕駛看成多項技術的集大成者,那行業就可以找到更多的商業出口和落地場景。現在的難處在于如何把技術和現有產業結合起來。
騰訊目前的調整是方向性的調整,但大戰略沒變。