文 | 新莓daybreak 李歡
編輯|翟文婷
2024年被業內稱為「AI應用元年」,字節跳動布局AI的節奏明顯加快了。
過去一年,字節推出十余款AI應用,覆蓋Agent 定制、聊天、社交、圖像/視頻、辦公、教育等多個領域,甚至還涉足了硬件產品。
移動互聯網時代,字節就有「APP工廠」之稱,所以相繼打造今日頭條和抖音兩個爆款產品,借此成為最賺錢的中國互聯網公司之一。
大模型時代,他們還要創造新的增長奇跡,尋找第三個超級應用的可能性。
這不是字節的專利。置身于AIGC浪潮之年,發力大模型的公司都是這樣設想、計劃且實施的。
在今年5月的一場行業大會上,小冰公司CEO李笛提到,「當前 AI 的商業價值已從單純的技術輸出轉變為通過高附加值產品實現收益。」
更早些時候,朱嘯虎在接受騰訊新聞的采訪時也很現實地談到,對于AGI(通用人工智能),他信仰能馬上商業化的應用。但對于大模型到底在什么點讓to C應用爆發,他也不知道。他只是說,「to C應用必須剛需、高頻,長遠才有機會守得住。」
如同爭奪移動互聯網的船票一樣,現在大家瞄準的是AI時代的船票。字節當然也知道,現在是押寶的階段,所以探索型布局顯得尤為重要。
一、字節需要AI時代的抖音
過去一年,Chatbot、AI虛擬社交、AI Agent是AI圈熱點討論的三大產品領域。字節無一遺漏。
除了對標ChatGPT、Kimi的智能對話產品豆包;定位為「AI虛擬角色聊天互動社交」星野的「貓箱」(原「話爐」);還有AI Bot開發平臺扣子(Coze),對標OpenAI推出的?GPT Store。
這是由多支AI團隊內部賽馬的結果。短時間快速推出產品,再經由市場檢驗,優勝劣汰,這是字節一貫的作風。移動互聯網時代,字節就有「App 工廠」之稱。《晚點 LatePost》曾統計,2018-2020 年,字節跳動自研/收購了大量項目,在App Store上線的應用約140 個。
其中不論在字節體系內,還是AI行業,豆包都以用戶規模第一的姿態處于探索前鋒。
而且豆包承載著字節在AI時代的雄心——即打造類似今日頭條、抖音這樣的爆款、國民級應用。
簡而言之,豆包是一款通用型產品,既是生產力變革工具,也有情感陪護功能。甚至應用與大模型同名,都是豆包。
所以,基于豆包大模型(原云雀大模型)開發的 AI bot,豆包可以實現AI智能聊天、對話、問答工具,預制了多個智能體,支持學習、生活、情感等多個場景,同時也允許用戶定制自己的AI智能體。
QuestMobile數據顯示,截止到今年7月份,AI原生應用(也即APP)月活用戶規模已經突破了6630萬,其中,豆包以3042萬的月活用戶規模位居榜一,比百度的文小言多出2000多萬的月活用戶規模。
這是字節信奉大力出奇跡的結果。在抖音,看不到什么AI應用的投放廣告,除了豆包。據說,字節幾乎屏蔽了同類型產品在抖音的所有投放,將海量用戶轉化的機會都留給了自家豆包。
除豆包、星野等AI原生應用外,字節根據自身業務特性,甚至戰略需要,基于現有產品孵化中一些新的應用,最典型的就是即夢。
作為全球短視頻最大平臺,字節CEO梁汝波曾在內部發起警覺,「AI技術對于內容創作會有很大的顛覆,甚至會產生新的創作平臺」。尤其Sora橫空出世之后,文生視頻的風浪可能會進一步沖擊抖音現有的行業地位。
假如,中國版Sora不是出自字節系,而是其他創作平臺呢?并且這樣的事情一而再再而三的發生呢?后果是,抖音就會失去視頻創作入口。久而久之,更是可能失去發布入口。
這是張楠被調任剪映的一個重要背景,即夢正是她掌管的剪映業務團隊推出的一個AI視頻生成應用。
但是從反饋來看,這個新產品距離被用戶廣泛接受,還有很長距離要走。截至今年10月15日,七麥數據顯示,即夢AI的累計下載量為79.14萬。此外,這款產品近30天日均下載量為22978次。
從時間表來看,即夢的雛形Dreamina比快手可靈推出時間要更早,卻被后者賺足風頭。一個未經證實的消息是,可靈的營收已經過千萬,內部還切蛋糕小小慶祝了一下。大模型時代,視頻行業格局發生變數的可能性增加了。
左手豆包,右手剪映,這是字節在大模型時代迅速打出的兩張王牌。一個是純粹的AI原生應用,一個是基于現有核心業務的進化迭代,本質都是在爭取AI時代的一張船票。
二、APP工廠依然在繼續
豆包和即夢只是字節押注AI應用的兩個明星產品。這個移動時代的APP工廠,依然在廣泛布局。
而且他們是全產業鏈推進。從底層最基礎的模型層,到中間做性能優化匹配的連接層,再到最后落地C端的應用層,字節跳動都全面涉及覆蓋。
據新莓daybreak不完全統計,去年 8 月至今,字節跳動在 AI 領域一共推出包括豆包大模型家族在內的 9款大模型、2 個智能體開發平臺,和十余個 AI 應用。9月份,字節甚至推出首款AI硬件產品——AI智能體耳機Ola Friend,試圖在硬件市場找到AI落地的新入口。
根據非凡資本旗下商業數字化及創新研究中心「非凡產研」的數據榜單顯示,除了百度,字節是國內目前AI產品數量最多的企業。
對比兩家大廠,百度AI產品的布局策略是從覆蓋熱門品類,到賦能日常衣食住行場景。比如AI對話產品文心一言,以及接入百度人臉識別技術的中關村在線科技生活館、整合百度AI技術,為景區搭建智能票務系統等。
字節則更多集中聚焦市場熱門領域中的高頻使用場景品類。比如圖片/視頻生成、聊天、社交、辦公、教育、音樂等領域。
據新莓daybreak不完全統計,今年年初以來,字節更新或上線了扣子、貓箱、星繪、河馬愛學等8款AI應用產品,且大多都在今年上半年推出。
值得注意的是,這些孵化更新的產品并不僅產生于一個團隊,除了聚焦于應用層的AI創新業務部門Flow,剪映、今日頭條、大力教育、巨量引擎等業務部門也在發力AI,這些團隊目前推出的產品分別聚焦于圖像/視頻、辦公、教育、電商內容創作等領域。
此外,字節AI產品策略還有一個典型特征,就如移動互聯網時代那樣,更注重海內外同步布局。國內有豆包,海外有cici;國內是扣子,海外是Coze;國內推出貓箱,海外就有BagelBelI……
其中,字節跳動旗下海外產品Gauth、Cici AI、Hypic三款應用均進入2024年9月的全球APP下載榜Top30。
而且字節試圖C端和B端通吃。典型如既面向C端又面向B端開發者的Agent定制產品「扣子」。
除了大模型,Agent(智能體)是另一個被廣泛討論的概念,業內共同的認知是,「Al agent是AI與具體應用場景結合落地的一種方式,大模型需要Agent來實現功能的擴展。」
「扣子」是目前Agent應用開發平臺領域用戶規模最高,品牌熱度最大的產品。根據第三方平臺Similarweb的數據,截至2024年6月,「扣子」的月訪問用戶數達到約200萬左右。
上線初期,一位知乎用戶分享自己使用扣子的實際體驗,「基于文本的對話體驗挺好,速度反應比原生GPT4速度快,流暢。也支持部署到discord上當Agent使用。但是多模態挺bug的,上傳的文本和圖像基本存在問題,完全不能用。」
盡管問題重重,依然沒有阻擋大廠推出Agent開發平臺的熱情。
百度智能云千帆APPBuilder于2023年10月17日推出,是上線時間最早的產品,百度今年二季度財報數據顯示,App Builder構建應用量達數十萬。騰訊元器于今年5月上線,但目前并未公布用戶規模,不過用戶創建的智能體可以一鍵分發至QQ、微信客服、微信公眾號等騰訊全域。
核心領域都要覆蓋,國內海外同步,C端B端通吃,字節產品布局策略有效的前提是,大模型底座足夠過硬。
三、大模型底座夠不夠支撐字節的野心?
字節在忙著布局應用的同時,豆包大模型也在快速更新。
2023年8月,字節自研推出了一款大規模預訓練語言模型——云雀大模型,定位于自然語言內容生成和內容理解的AI大模型。豆包就是基于該模型開發出來的。7個月之后,云雀大模型升級為豆包大模型家族,并一口氣發布了9個豆包模型。
字節大模型差不多是每兩個月更新一次。今年5月,字節火山引擎先是一口氣推出9款豆包大模型家族,兩個月之后又發布了豆包·圖生圖模型;再到今年9月,推出了PixelDance和 Seaweed兩款豆包·視頻生成模型。
截至目前,豆包模型家族已經集齊了文本、語音、圖片、音樂、視頻等,共計13款模型。
今年5月,火山引擎總裁譚待接受虎嗅采訪時提到,字節的模型在不斷進化,一旦進化到某一個層次,就有可能去上面做應用。字節的兩款TOP級AI原生應用——扣子和豆包,都是基于豆包大模型。
并且譚待還提到字節對外發布豆包大模型相對較晚的原因,「因為豆包到了大家可以廣泛用它去做應用的程度,只有越來越多的人去做更多應用,反過來又可以驅動技術進步,形成一個正循環。」
最近,硅星人引用字節內部人士的話解釋豆包大模型,「現在的豆包更像是一個統一的出口,連接用戶。豆包產品后端連接了多個模型測試,是一個訓練場,通過API的結果反饋來評測模型效果,但一時間很難有取舍。」
此外,定位為字節跳動的 ToB 云平臺「火山引擎」,肩負著字節在B端市場數字化落地的大任。隨著AI大模型的出現,「云服務+大模型」就成了云服務市場轉型的重點。
目前,火山引擎已經形成云基礎設施、豆包大模型和火山方舟2.0的一套產品體系。一方面可以幫助企業實現AI轉型,一方面為內部輸血。
比如上月底發布的豆包視頻生成模型,在訓練過程中就采用了火山引擎的大模型訓練視頻預處理方案。而火山引擎視頻云團隊提供的點播解決方案,也保障模型完成商業化應用。
在字節內部,火山引擎給自己的定位是「為他人做嫁衣」。去年,譚待對外表示,「火山引擎自己不做大模型,首先服務好國內做大模型創業的公司。」
當時,他對媒體強調,火山的任務一方面是算力供給,另一方面是搭建云原生機器學習平臺,幫助企業應用好算力,進一步提升效率,把大模型訓練得又快又穩定。
置身于AI大模型應用的浪潮年。在完成商業落地的同時,業內奮起爭當「中國OpenAI」,底層能力的搭建至關重要。
上個月,譚待在解釋為何此時才發布視頻模型時提到,模型是影響未來十年、二十年的長遠的東西。
AI計算正在加速滲入各行各業,一場看不見的革命也許就在不久的未來。但同時,字節在AI時代的野心也需要得到物理世界的驗證。
而種一棵樹,最好的時機首先是在十年前,其次是當下。