文|互聯網怪盜團
有一種流傳很廣的看法:互聯網公司做的是“流量生意”,沒有什么技術含量;互聯網公司的研發,其實就是產品迭代而已,算不上真正的基礎研發;如果互聯網公司有技術含量,那也只可能存在于云計算這樣的To B業務當中,而不可能存在于消費業務當中。
在這些人心目中,“消費互聯網公司”與“硬科技公司”是天然對立的——如果你運營一個龐大的互聯網平臺,擁有數以億計的個人用戶,那你就不可能通過基礎研發取得任何“硬科技”成果。
我必須嚴肅指出,上述觀點是片面的。面向消費者的互聯網平臺業務,當然是需要技術含量的,而且技術含量不能低,否則會迅速在激烈競爭中被用戶拋棄。(參考閱讀:一個嚴肅的問題:究竟什么是“硬科技”公司?)畢竟一個幾億人使用的應用,可能出現的問題之多,非從業者難以想象,需要依靠“硬科技”去提升用戶體驗、保證用戶安全及合規等。可以說,復雜、多變的To C業務,是培育“硬科技”的試煉場。
另一方面,在粗放式增長階段結束之后,互聯網公司都意識到了技術的重要性和可拓展性,投入大量資源做自研技術,已經是領先互聯網企業的新常態。
舉一個例子:根據谷歌2021年財報,谷歌搜索引擎每天要處理數萬億個搜索請求,其中15%是全新的、前所未見的。谷歌需要在幾十到幾百毫秒之內,從浩如煙海的互聯網公開信息(包括文本、圖片、視頻等多種不同格式)當中,找到用戶想要的信息。因此,谷歌一直在大力發展人工智能和機器學習技術,從而不斷提升其核心搜索功能的效率。其中一個最重要的成果,就是2021年5月發布的“多任務統一模型”(Multitask Unified Model)——能夠讓用戶以自然語言提出開放式問題,以對話的方式獲得類似人工專家的解答。可以想象,這個模型很快成為了國際人工智能研究領域的熱門話題,很可能也會成為人工智能歷史上最重要的應用之一。
事實上,在消費互聯網領域,搜索引擎已經算是一個比較“簡單”的業務了。更復雜、更敏感、對研發要求更高的業務還有很多,例如第三方支付。當你走進一家便利店,打開支付寶掃碼,整個支付過程大概還花不了一秒鐘。可是就在這一瞬間,支付寶的APP端和云端進行了涉及海量數據的計算和判定:
用戶有沒有被盜號?移動設備有沒有失竊?換句話說,這個支付請求真的是出自用戶本人嗎?
收款的商戶是合法的嗎?它是否具備基本的資質,有沒有釣魚詐騙的嫌疑?
這會不會是刷單,或者其他類型的虛假交易?
這一切都發生在你掃碼和聽到“支付完成!”之間,在這短短的間隙,支付寶使用了全圖風控、交互式主動風控、多方安全計算、端邊云協同……等一批人工智能、隱私計算等“硬科技”,從而在你甚至感知不到的消費體驗下,確保你的財產安全。要知道,國內互聯網黑產的從業人員很可能超過了200萬人(數據來源:《2019年中國數字反欺詐全景報告》),而支付寶的風控資損率僅為億分之0.98。
公允地說,國內主流第三方支付平臺的風控普遍做的都還不錯。除了支付寶,微信支付、京東支付、美團支付的風控資損率都很低。它們能做到這一點,當然不是靠堆砌人力,更不是出于黑產集團手下留情;而是靠在消費場景對前沿技術的應用,以及多年來持續更新技術。
另一些因素也在倒逼互聯網公司加快技術創新。近幾年數據安全和隱私日益受到重視,無論是合規還是社會層面都對互聯網公司的服務提出了更高要求——既保護用戶隱私,又要保證安全和流暢。這基本相當于“既要馬兒跑,又要馬兒不吃草”,可是互聯網公司居然真的能做到,這應當歸功于對機器學習技術的深度應用。
還是拿谷歌做例子。今年早些時候,谷歌推出了“隱私沙盒”(Privacy Sandbox)技術框架,意在實現不跟蹤用戶設備ID、不使用第三方Cookies的情況下,仍能精準地推送廣告。“隱私沙盒”的基礎是一種名為“群組聯邦學習”(Federal Learning of Cohorts)的算法,也就是聚焦于具備相似行為的一組用戶,而不需要去獲取每個用戶的私人信息。
螞蟻集團也推出了國內首個“可信隱私沙盒”(AntDTX),目前已經在vivo、榮耀等廠商的手機等設備中得到應用。“可信隱私沙盒”基于端邊云協同風控技術,可以在減少手機端內數據向云端流動的情況下,升級手機的風險感知能力,提升支付安全性。
這些技術都是基于消費端的真實需求而開發出來的,其適用范圍又遠遠超過了廣告、支付等消費業務本身。當代科學技術的發展,早已超越了少數天才坐在實驗室里所能達到的水平,進入了“產學研”高度一體化的時代。很多人的認知還沒有更新,以為只有航空航天領域里的高精尖技術可以“降維”用在消費領域,沒想過反過來的情況也存在。美國的“機器學習四強”——亞馬遜、谷歌、微軟、Meta,都是從海量用戶的平臺場景當中鍛煉出了強大的機器學習技術,然后將其用于醫療、現代制造、航空航天等尖端場景,乃至以“機器學習即服務”(Machine Learning as a Servicce)的方式輸出給海量的企業用戶,潛移默化地實現對傳統行業的賦能。
在國內何嘗不是如此?阿里、騰訊、螞蟻、字節跳動、百度、美團……均在人工智能、機器學習、計算機圖形技術、VR/AR等領域進行著持續的研發。阿里早在2019年就將首款自研人工智能芯片運用于阿里云的數據中心。騰訊于2018年成立了量子實驗室,迄今已經發表了十余篇關于量子預算的學術論文。百度是全球最先進的智能駕駛解決方案供應商之一,而且具備平臺、整車、服務三位一體的開發能力。相信凡是熟悉中國互聯網行業的人,都對此有所耳聞。
或許有人會認為,上述技術還是太偏“應用層”了,不夠“基礎”。那我們看看螞蟻集團投入大量資源在研發的“圖計算”(Graph Processing)技術。圖計算基于數學中的“圖論”(Graph Theory),將各種類型的復雜數據融合到一個“圖”里進行分析,從而更好地描述和理解事物之間的聯系。例如用圖計算對海量的金融交易行為進行分析,可以大幅增進對可疑交易、可疑團伙的辨識度,從根本上提升風控效率——也就是螞蟻的“全圖風控”。這就是螞蟻多年一直不懈提升圖計算技術水平的直接原因。
但是,圖計算的技術能力一旦培養出來,應用范圍將大大超過金融支付風控的范圍。Gartner預測,到了2025年,圖計算將應用于80%的數據和分析創新工作。從電網等復雜基礎設施的故障診斷,到重大公共衛生事件的防范,都可以深入應用圖計算技術。按照中國工程院院士鄭緯民的說法:“現在布局高性能圖計算恰逢其時,就相當于抓住了未來大數據、人工智能和高性能計算產業發展的牛鼻子。”
騰訊的微信事業部也研發了Plato開源圖計算平臺,并且成為了GitHub的高星開源項目。一些讓我們日常買個菜更便利的技術,最終能夠應用于廣闊的星辰大海,這大概是絕大部分用戶難以想象的。
即便與發達國家的互聯網巨頭相比,國內互聯網公司的技術實力往往也不落下風。就拿前面提到過第三方支付而言,支付寶、微信等國內主流支付平臺,在用戶數量巨大、黑產層出不窮的情況下,仍能實現全球領先的風控資損率,而作為全球最大跨境支付巨頭的PayPal,直到2021年才在激增的釣魚詐騙壓力之下,推出了“增強欺詐防護系統”,達到了支付寶和微信早已提供的防護水平。這個案例充分說明,所謂“國內互聯網公司研發水平遠遜于國內同行”,僅僅是以偏概全罷了。
根據官方數據,“2021年中國的全社會科研投入約為2.79萬億元,比上年增長17.9%”,而領先的消費互聯網公司的增幅更大,比如美團2021年科研投入上漲53.1%,達到167億元;螞蟻連續三年平均增長39%,去年投入了188億。比起商湯、蔚來等更接近大眾認知中的“硬科技公司”,這些消費互聯網公司在科研上的投入完全不落下風,體量上反而領先不少。這么多錢在做什么?拿螞蟻來說,除了前面提到的“圖計算”,還有隱私計算、云原生技術、分布式數據庫等等等等。其中有許多研發項目,并不單純是為了眼前的業務發展;還有很多技術,經歷了消費端的歷練之后,必將成為下一代尖端技術的基礎或催化劑。
其他領先的互聯網公司也是如此,從人工智能到區塊鏈,從芯片設計到無人機,在外界能想象的一切“硬科技”門類,我們都能看到不同規模、不同類型的互聯網公司,在進行著規模巨大、曠日持久的投入。
誰說互聯網公司沒有硬科技?我恰恰看到,中國硬科技研發之光,很可能在于那些消費互聯網公司。