在10月10日舉辦的vivo開發者大會上,AI成為了絕對的主角。
大會期間,vivo發布了全新AI戰略——「藍心智能」,以及全面升級的自研藍心大模型矩陣、OriginOS 5、藍河操作系統2,以及vivo在安全、人文、生態合作等方面的最新成果。
自ChatGPT引發的生成式AI風潮興起之后,AI成為智能手機領域當下最炙手可熱的概念。但在過去一年的時間里,由于行業技術尚未完全成熟、基礎設施不健全等原因,市面上的AI手機大多還只停留在單一功能點創新的階段,并沒有出現令用戶期待的顛覆式革新,AI手機的概念也在爆火后迎來沉寂。
行業沉寂之時,恰恰是參與者深度思考的好時機。手機廠商試圖解答圍繞端側AI的核心問題:它到底能夠做什么,以及應該實現怎樣的目標?
蟄伏11個月之后,vivo帶來了一張新答卷——將大模型技術與手機操作系統深度融合的藍心智能。它以藍心大模型為技術底座,能夠理解用戶的個人情景和偏好,通過更自然、更符合直覺的交互,來為用戶提供個人化的專屬服務。為此,vivo做了一系列系統重構的工作,也重新定義了人與設備、人與數字世界、人與物理世界的交互與連接。
從單點創新,到系統重構
提起AI手機,大部分用戶可能會第一時間聯想到文生圖、路人消除、會議紀要等生成式AI相關功能。在ChatGPT 3.5時代,這些功能為用戶提供了眼前一亮的體驗,但絕不是對AI手機的全部定義。手機廠商意識到,大模型要真正在端側發揮功效,最難且最核心的挑戰,一定在于對系統的重構。
藍心智能就是一次突破性的嘗試。在OriginOS 5中,vivo對于AI手機的構想有了更全面的落地。vivo副總裁、OS產品副總裁、vivo AI全球研究院院長周圍將vivo在過去11個月的努力總結成三件事:升級已有功能、構建公共能力并向第三方開放,以及構建具有執行能力、真正服務于人的智能體。
第一件事是用AI來升級現有的手機功能。以搜索為例,這是用戶在手機上最常使用的功能之一。過去的搜索限定在特定APP的搜索框內,用戶需要復制關鍵文字,再切入特定APP內進行操作,這種做法顯然低效。
OriginOS 5內置的小V圈搜功能,采用了一種更符合直覺的人機溝通方式:通過長按導航條的形式將它呼出,直接用手指圈選手機上的圖片、文件、文字等任意內容并向下拖拽,即可完成一次搜索。這還不僅僅是一次簡單的搜索,也能夠融合用戶的個人數據來做下一步操作的意圖識別,用更本地化的思維做主動的理解和思考。
于是,人與設備的交互開始變得更自然。Origin OS 5搭載的「原子島」功能,將原有的通知功能結合了藍心小V的意圖識別能力,能夠不斷分析和判斷用戶當前需求,主動提供后續服務。用戶可以通過一按一復制,或一按一拖拽的交互形式來布置任務;新升級的「小V建議」以桌面常駐組件的形式,根據用戶所處的時間地點,不間斷地為用戶提供打車建議、登機口提醒、旅行城市攻略等。
改變了交互形式之后,vivo做的第二件事是重構數字服務體驗,這不能只依靠vivo一家的力量。
過去用戶需要下載不同的APP來滿足不同的需求,但同時也帶來了內存負擔,且體驗不夠智能。vivo一邊搭建好基礎設施,一邊將自有的AI能力向第三方合作伙伴開放,讓用戶在需要作業指導時,可以用教育智能體來進行在線輔導,有就醫需求時,用醫療的智能體來幫助掛號。
第三件事也是最具挑戰性的一件事,即真正讓AI代替用戶來執行部分操作。
OriginOS 5搭載了vivo自研的手機智能體「PhoneGPT」,這是一個可基于用戶意圖和習慣,實時自主拆解需求并主動規劃路徑的多模態助理。例如其中的「小V訂座助手」功能,通過語音對話說出想要預訂的餐廳類型、時間,和人數后,它可以自主跳轉相關APP,找到符合需求的餐廳,識別餐廳電話并自動進行電話預約。
從理解訂餐意圖到完成電話預約,這是一個極其復雜的鏈路,它需要讓PhoneGPT盡可能接近于人,像人一樣會識別界面、會與餐廳交流。這是完全由vivo訓練的大模型,在數十萬應用投喂訓練的之后,vivo把一個操作步驟的執行時間速度縮短到了2秒,而這僅僅是一個起點。隨著PhoneGPT逐漸強大,相應的功能也會變得更加豐富。
做符合直覺、遵循常識的事
OriginOS 5是vivo對 AI 手機階段性解答。事實上,AI手機到底應該怎么做,所有手機廠商都在摸著石頭過河。
周圍在接受采訪時說道,做傳統智能手機時,vivo總是要進行小半年的用戶和市場調研,收集有效反饋來成為下一代產品的參考。但在真正考慮做AI之前,vivo花五個月時間做了用戶和市場調研,卻無法從用戶身上得到任何有效的反饋。在全新的技術爆發面前,用戶對自己的需求也沒有任何感知。
這是拋給手機廠商的難題。在經歷長達十年的智能手機高速增長時期之后,vivo們再度走回了「不舒適區」。
但vivo已經考慮好了要走的路。作為最早投入人工智能研發的手機廠商之一,早在2017年,vivo就啟動了人工智能的研發,此后陸續組建了AI全球研究院、人工智能圖譜研究院等機構。迄今,已經有數百人專注研發AI大模型,并且維持著千人以上的專業AI團隊。
這為vivo帶來了更豐富的認知和技術儲備。在ChatGPT問世之前,vivo就已在2019年的開發者大會上系統闡述過對手機AI的思考。當時的vivo將下一代智能手機定義為“智慧手機”,自主人工智能品牌Jovi作為智慧手機的中樞系統,將消費者希想要的服務精準、按時、按需地送達,這種思路也恰好是如今藍心智能的雛形。
在OriginOS 5中,“Jovi語音”與“藍心小V”進行了深度的融合,升級后的藍心小V智慧能力全面升級,為用戶帶來便捷的溝通方式、默契的服務推薦、溫暖的共同記憶、貼身的時刻陪伴。
vivo一直以來都在強調的是,AI帶來的體驗應該是更自然的。從OriginOS 5的升級也不難看出這一點。例如小V圈搜功能的升級,是把指甲蓋觸碰屏幕的方式,換成了用手指來圈選屏幕,這兩者看似區別不大,但本質上是為了讓操作和交互更符合人的自然習慣和直覺。
vivo還是少有的在聲音大模型領域保持重投入的手機廠商。在其最新發布的聲音大模型中,手機已經能夠實現各種口音的自然交互,包括粵語、四川話、東北話、河南話,甚至還有苗語。并且,手機和用戶不再是干澀和機械的對話,而是帶有人的氣息的真實互動。
這是對手機語音交互的一次重塑,它讓語音互動真正成為了人人易于使用的功能,把使用AI的門檻進一步放低,讓AI服務于人,而不是人來適應AI。
就像iPhone打破諾基亞統治的市場那樣,每當更符合自然和直覺的交互產生的時候,產品體驗一定會帶來巨大的變革。在周圍看來,這才是手機廠商做大模型真正的意義所在——如果只做大模型,而想不出怎么用大模型,也就沒有做大模型的必要。
“我很認同一句話,如果沒有正確的認知,黃金就不是黃金,而是土。”周圍說,對AI的重投入,為vivo帶來的不僅僅是技術創新能力的躍遷,更重要的是認知的豐富與轉變。某種程度上,這也是當下競逐AI手機戰場的廠商最稀缺的一種能力。
熱度當前,回歸本原
許多人將2024視為AI手機元年。主流手機廠商紛紛開始將AI作為最大的新品賣點之一,甚至有廠商宣布放棄傳統智能手機研發,把所有資源投入到AI領域。業界期待AI成為手機行業下一個突破式創新,迎來自己的ChatGPT時刻。
AI的確已經必不可少,但無論技術如何前進,但消費者的本質需求并沒有改變。多數用戶對復雜的大模型參數并不了解,也不關心AI技術的發展,他們的需求非常簡單直接:流暢、舒適、自然、高效。
這也正是vivo的目標。周圍的觀點是,vivo的目的從來不是顛覆手機行業。事實上,現有的行業技術成熟度,也還很難談真正的顛覆。這的確是行業現狀:自生成式AI火爆以來,它最被用戶高頻使用的功能,并不是新創造的場景,而是通過AI來賦能已有場景,讓工作、學習和生活變得更加高效、簡便。
AI手機同樣如此。對手機廠商來說,目前更現實且有效的做法是,結合自身在AI領域的技術積累,利用手機廠商的端側優勢,對現有的能力進行不斷優化、升級,做好連接,做更符合用戶直覺和常識的事情,就是一種巨大的進步。例如,過去手機只能傻瓜式地遵循用戶指令,現在已經可以主動感知場景、幫助用戶做決策甚至執行操作。
避開鋒芒與噱頭,冷靜、積極地面對技術浪潮的到來,這是vivo在AI時代的選擇。這種選擇離不開vivo的「本分」文化。本分文化強調保持平常心,即在面對困難、壓力和誘惑時,能夠拋開事物表面的干擾,回歸事物的本原進行思考,堅持做正確的事,并力求把事情做正確。
什么是正確的事?vivo始終堅持的一條原則是堅持用戶導向式創新。無論是重金投入的影像、自研芯片的創造性嘗試,還是AI重構系統的決心,vivo的一切工作都圍繞用戶需求來開展,通過極致場景價值檢驗、耦合式創新點投入和底層技術創新支撐,逐步實現用戶體驗的躍級。
市場選擇是最直觀的。據Counterpoint、Canalys以及BCI三大行業分析機構發布的2023年度智能手機市場數據,vivo均位居全品牌第二、國產品牌第一。2024前三季度,vivo仍然位列國內市場首位,在vivo X100系列、vivo X Fold3等的帶動下,vivo在高端市場的占比也有了明顯提升。
在此起彼伏的科技公司AI大戰中,vivo仍然是那個悶聲做實事的角色。vivo的目標并不遠大,但足夠實際:“我們從來無意定義AI手機,但是我們希望用戶用完能說,這個手機很AI。”