讓星火大模型趕超ChatGPT，科大訊飛做到了嗎？|界面新聞

文|連線Insight 王慧瑩

編輯|子夜

國產大模型追上ChatGPT要多久？

“百模大戰”伊始，這個問題的答案就成為國產大模型廠商的一種執念。

五個月前，國內市場正掀起一場大模型的熱潮，科大訊飛帶著星火大模型跑步入場，立下了全面對標ChatGPT的“軍令狀”。

“10月24日科大訊飛全球開發者大會期間，星火有望能夠全面對標ChatGPT：在中文上要超越ChatGPT，在英文上要達到跟它相當的水平”。彼時，科大訊飛董事長劉慶峰提出這個目標。

盡管市場將信將疑，但科大訊飛給出了一張時間表，并在前天給出了答案。

10月24日，科大訊飛召開全球1024開發者節開幕，并發布了“訊飛星火”認知大模型V3.0。據劉慶峰介紹，該大模型已全面對標ChatGPT（GPT3.5），英文能力相當，中文能力已實現超越。

圖源科大訊飛微信公眾號

與此同時，科大訊飛還發布了一系列應用場景。醫療、教育、編程、汽車等多個垂類賽道都有星火大模型的身影。劉慶峰提到，“大模型首先要能夠在工業和科研領域造福人類，這才是我們真正解決社會剛需的地方。”

事實上，過去五個月，科大訊飛已經完成了對星火大模型的多次升級。6月9日，星火大模型V1.5發布，開放式問答、多輪對話及數學能力升級；8月15日，星火大模型升級至V2.0，突破代碼能力、多模態交互再升級。

依靠算力、技術的支撐，星火大模型升級迭代速度的確夠快。不過，當同行業都在用力奔跑時，科大訊飛也必須要面臨技術上和落地場景的考驗。

更重要的是，過去幾年，業績增速放緩、凈利潤下跌，科大訊飛需要一個新的故事來證明自己，并挽回資本市場信心。作為“A股第一家以人工智能為主業上市的公司 ”，抓住大模型的意義對于科大訊飛來說不亞于尋找一條新的增長曲線。

當然，大模型行業的投入并非一朝一夕，科大訊飛還在繼續投入，劉慶峰又提出了一個新目標——2024年上半年，星火大模型要實現對標GPT-4，新的時間表的提出，也意味著科大訊飛接下來依然要全情投入，這對科大訊飛來說，有動力也有壓力。

01 星火大模型，跑到了哪一步？

“我們如期兌現了自己給大家的時刻表。”

10月24日，科大訊飛全球開發者大會上，科大訊飛董事長劉慶峰激動地說出這句話，同時發布了“訊飛星火”認知大模型V3.0。

這對于科大訊飛來說確實不容易。從發布時間上看，隨著百度文心一言、阿里通義千問的推出，今年5月份科大訊飛的星火大模型姍姍來遲，并不具備先發優勢。

不過，和別家不同的是，從一開始科大訊飛就給出了明確的升級版本時間表。

彼時，科大訊飛方面表示，在2023年內預計還會進行三次升級，分批次增強數學能力、補足代碼能力，希望最終將在10月24日全球開發者大會期間，能夠全面對標ChatGPT，在中文上要超越ChatGPT，英文上要達到和它相當的水平。

科大訊飛研究院院長劉聰在接受媒體群訪時談及原因，“定這個東西肯定不是拍腦袋，之所以能立這個 flag，是因為既有技術邏輯，也有我們產品和場景落地的邏輯。”

從科大訊飛宣布的進展來看，經歷兩次迭代，訊飛星火大模型先后突破開放式問答、代碼能力，并升級了多輪對話能力、多模態交互能力。此次，星火V3.0在文本生成、語言理解、知識問答、邏輯推理、數學能力、代碼能力和多模態能力7大方面都有了顯著的提升。

其中，星火V3.0最受關注的新功能莫過于虛擬人格功能。在應用過程中，用戶可以通過“友伴”從性格、情緒、表達風格等方面設定AI助手的基本人設，且可以導入特定的知識、相關對話記錄形成個性化的記憶。

據劉慶峰介紹，科大訊飛根據《通用認知智能大模型評測體系》構建測試集，采用盲測進行測試，結果顯示：訊飛星火V3.0的中文能力客觀評測已超越ChatGPT。

可以看到，自從入科大訊飛入局以來，ChatGPT就被科大訊飛反復提及，并對標超越。如今，要討論星火大模型是否超過了ChatGPT，一組報告或許可以參考。

根據國務院發展中心國研經濟研究院的橫評報告，星火大模型綜合能力已超越ChatGPT，實現國內領先，國際一流，且在教育、醫療和法律行業表現尤為突出。

此外，根據OpenAI在官網發布的英文任務測試集，在10月16日至20日的測試中，星火V3.0的英文能力對標ChatGPT48項任務結果相當，二者得分分別為85.1%（星火V3.0）和84.3%。

事實上，星火V3.0是在星火V2.0基礎上的升級，尤其是在數學能力和代碼能力等上有了明顯的“進化”，也讓星火V3.0趕超ChatGPT3.5成為可能。

在發布會上，劉慶峰喊出了新一步的目標，預計在2024年上半年將會發布星火認知大模型V4.0，屆時將會對標GPT4。

不過，盡管科大訊飛提到，星火V3.0綜合能力已經超過ChatGPT3.5，但國產大模型仍在一些方面與ChatGPT存在差距，這也增加了星火大模型4.0對標ChatGPT4的難度。

“中國現有的大模型根基實力，與GPT-4仍有差距。”劉慶峰坦言，在復雜知識推理、小樣本快速學習、超長文本處理以及跨模態的統一理解上，國產模型還有不小的差距。

“雖然 flag 立在那，但是客觀來說完成得并沒有那么輕松。每次快開發布會時，都處于緊急上線的狀態，實際上這個目標還是有挑戰性的。然而，有這樣一個團隊存在，再加上我們之前對 AI 的積累和理解，我們對達到 GPT4 這個水平非常有信心。唯一令人擔心的是我們需要花費多少時間來實現這個目標。”科大訊飛研究院院長劉聰如是說道。

02 為大模型投入巨大，也需要大模型拉升信心

“遙遙領先，如期而至”，這是發布會上科大訊飛董事長劉慶峰多次提到的字眼。

看似篤定的話語中，其實透露著劉慶峰和科大訊飛的焦慮。盡管科大訊飛在AI領域有著多年積累，這場國產大模型軍備競賽依舊打得火熱，科大訊飛想要一直對標并超越ChatGPT，難度不小。

眾所周知，大模型是“大數據+大算力+強算法”結合的產物，科技企業的技術底座決定了其AI大模型的應用價值。

對于星火大模型而言，科大訊飛很早就確認了“1+N+X”的生態布局。“1”是核心的底座，“N”是訊飛自有賽道的自有產品，“X”是生態。它們之間的關聯是，底座本身的提升會帶來“N”的提升，也帶來“X”的提升。

這樣的思路之下，今年8月中旬，科大訊飛聯合華為推出了大模型算力硬件 “星火一體機”。一體機的特點是可以私有化部署大模型，讓所有企業都可以在國產自主創新平臺上私有化部署大模型。

1個月后的華為全聯接大會上，劉慶峰在演講中透露了與華為的進一步合作。而在10月24日，科大訊飛聯合華為正式推出基于昇騰生態的自主創新大模型算力底座“飛星一號”平臺，支持訊飛星火大模型在對標GPT-4之路上，實現更大規模的訓練。

自5月6日星火發布以來，訊飛開放平臺新增143.4萬開發者團隊，同比增幅331%，其中新增大模型開發者17.8萬。大模型也顯著降低了開發者門檻，在訊飛星火上，已有1.5萬助手開發者，開發超2.9萬個助手應用。

技術的升級，離不開真金白銀的投入，更何況是燒錢的大模型行業。據新智元報道，大模型的訓練及運行成本極高，GPT-4一次訓練成本估計要6300萬美元，且由于每次提問都需要進行大量新的計算，難以形成標準軟件的規律效益，企業投入成本是個不小挑戰。

9月，知名投資機構紅杉資本的David Cahn發布文章稱，如今的AI產業還需1250億美元的營收，才能掙回為了大模型在GPU、數據中心、能源等成本上的投入。但目前AI在應用層面上的創新與商業化前景，與1250億美元的閾值還有巨大的分歧。

巨大的投入成本，在科大訊飛身上也有體現。

科大訊飛2023年三季度財報顯示，2023年第三季度公司實現營業收入47.72億元，同比增長2.89%；歸母凈利潤為2579.01萬元，同比下滑81.86%；扣非后歸母凈利潤由盈轉虧，為-2018.87萬元，同比降113.65%。

從前三季度情況看，科大訊飛實現營業收入126.14億元，同比略微下滑0.37%；歸屬于上市公司股東的凈利潤9936.21萬元，同比下滑76%。

對于財報的表現，科大訊飛給出的理由為，“在通用人工智能認知大模型等方面堅定投入”。今年前三季度，科大訊飛在研發方面支出費用達到24.98億，同比增長7.19%。

成本居高不下，繼續投入卻有必要，這種情況下，更需要盡快實現商業化。因此，當廠商們在比拼技術時，拼場景、拼應用也在同步進行。

民生證券在研報中指出，“單純發布一個大模型的門檻沒有市場想象中的那么高”，難的是“有一個能持續迭代，性能不斷提升的優質大模型”，優質的、獨特的數據價值更大。

事實上，大模型的浪潮，科大訊飛必須要抓住。這不僅能給科大訊飛帶來新的增長，更重要的是通過大模型挽回資本市場的信心。

在發布星火V3.0的當天，資本市場給科大訊飛澆了一盆冷水。10月24日，科大訊飛午后跳水持續走低，截至收盤，科大訊飛以跌停價46.70元報收。截至發稿，科大訊飛市值為1054.33億元。

總的來看，技術層面科大訊飛已然拿到了AI大模型的門票，最終能否在行業中搶占新的先機，還要看具體的商業落地表現。

03 深耕垂類，更有希望？

科大訊飛是一家典型的技術公司。1999年，科大訊飛以智能語音技術起家，經過二十多年的發展，科大訊飛在語音合成、語音識別、自然語言處理等核心技術領域處于國際領先水平。

但在AI大模型領域，技術是一回事，商業落地又是另一回事。基于這樣的思考，“技術頂天，應用落地”是科大訊飛在發展大模型過程中始終遵循的兩項準則，在研發技術的同時，思考場景落地與商業化。

一個業內的共識是，“百模大戰”至今，國產大模型已從“卷參數”進入了“卷應用”。紅衫資本在近期的一份研究報告中也指出，當下的大模型競逐已進入第二階段，比起技術，更強調產品體驗與應用形態。

簡而言之，大模型跑得快的標準正變成好用和實用。

放眼整個行業，B端仍是大模型商業化落地的重點，各行各業對大模型的需求很強烈，大家都想借助大模型的AI能力，助力企業的數智化轉型。

具體而言，發布會上，科大訊飛發布了星火V3.0的能力集成與部署進一系列賦能行業與場景的商業化產品中，如全新升級的iFlyCode2.0（智能編程助手），與中科院文獻情報中心聯合打造的星火科研助手、教育領域的AI心理伙伴、醫療領域的曉醫助手等。

此外，最新發布的訊飛星火V3.0將賦能智能座艙全面升級，面向多樣化的汽車使用場景，科大訊飛推出星火座艙OS、星火汽車APP和星火座艙域控，支持實時檢索，可以實現插件化調度，并集成多模態生成的能力，為合作伙伴提供自主可控、組件化、更開放的座艙解決方案。

同時，科大訊飛還面向金融、汽車、運營商、工業、住建、物業、法律、科研文獻、傳媒、政務、文旅、水利等12個領域發布了垂直行業大模型。

一個明顯的趨勢是，大模型C端市場需求增量明顯，這給了B端和C端兩條腿走路的科大訊飛更多大模型落地的機會。

發布會上，星火V3.0推出了多項應用大模型的C端產品，如具備英語AI答疑輔學的訊飛AI學習機、面向未來的人形機器人等。

值得關注的是，教育一直是科大訊飛的核心產品線。此次發布的AI心理咨詢師“小星”與以往發布的教育產品不同，更加關注學生心理健康。“小星”在星火大模型的加持下，能夠通過視頻、語音、文字等多模態方式與青少年展開類人自由對話，理解青少年的情緒情感，表達接納與共情，促進青少年自我覺察，并提供個性化行動建議。

圖源科大訊飛微信公眾號

不過，無論是企業和開發者，對于大模型的和使用方式有不同的差異。比起主打普惠使用的“全面型”能力，大模型要在千行百業應用起來，考驗的是更快速精準的算力，和更具特色化的功能。想讓大模型真正用起來，需要國產大模型廠商找到高頻剛需的應用場景，打造殺手級應用。

劉慶峰在會上透露，自訊飛星火9月5日對公眾開放以來，當前已有1200萬用戶。升級到V3.0后，訊飛星火在七大能力——文本生成、語言理解、知識問答、邏輯推理、數學能力、代碼能力以及多模態上有了持續的提升。

談及大模型的商業回報周期，劉慶峰表示，“至于商業收益方面，我認為明年將會顯現出明顯的效果。然而，我們還有很多工作要做，不能說已經達到了一個穩定狀態，還需要時間來完善細節并逐步訓練。”

大模型掀起的熱潮過去了大半年，經歷了一輪輪軍備競賽之后，大模型已經告別了最初的技術比拼，玩家們開始冷靜思考下半場的決勝點。或許，誰能率先將大模型技術與更多產業場景結合，訓練更垂直化的能力，誰就能搶到更多蛋糕。

文|連線Insight 王慧瑩

編輯|子夜

國產大模型追上ChatGPT要多久？

“百模大戰”伊始，這個問題的答案就成為國產大模型廠商的一種執念。

五個月前，國內市場正掀起一場大模型的熱潮，科大訊飛帶著星火大模型跑步入場，立下了全面對標ChatGPT的“軍令狀”。

盡管市場將信將疑，但科大訊飛給出了一張時間表，并在前天給出了答案。

圖源科大訊飛微信公眾號

依靠算力、技術的支撐，星火大模型升級迭代速度的確夠快。不過，當同行業都在用力奔跑時，科大訊飛也必須要面臨技術上和落地場景的考驗。

01 星火大模型，跑到了哪一步？

“我們如期兌現了自己給大家的時刻表。”

10月24日，科大訊飛全球開發者大會上，科大訊飛董事長劉慶峰激動地說出這句話，同時發布了“訊飛星火”認知大模型V3.0。

不過，和別家不同的是，從一開始科大訊飛就給出了明確的升級版本時間表。

可以看到，自從入科大訊飛入局以來，ChatGPT就被科大訊飛反復提及，并對標超越。如今，要討論星火大模型是否超過了ChatGPT，一組報告或許可以參考。

事實上，星火V3.0是在星火V2.0基礎上的升級，尤其是在數學能力和代碼能力等上有了明顯的“進化”，也讓星火V3.0趕超ChatGPT3.5成為可能。

在發布會上，劉慶峰喊出了新一步的目標，預計在2024年上半年將會發布星火認知大模型V4.0，屆時將會對標GPT4。

02 為大模型投入巨大，也需要大模型拉升信心

“遙遙領先，如期而至”，這是發布會上科大訊飛董事長劉慶峰多次提到的字眼。

眾所周知，大模型是“大數據+大算力+強算法”結合的產物，科技企業的技術底座決定了其AI大模型的應用價值。

巨大的投入成本，在科大訊飛身上也有體現。

從前三季度情況看，科大訊飛實現營業收入126.14億元，同比略微下滑0.37%；歸屬于上市公司股東的凈利潤9936.21萬元，同比下滑76%。

成本居高不下，繼續投入卻有必要，這種情況下，更需要盡快實現商業化。因此，當廠商們在比拼技術時，拼場景、拼應用也在同步進行。

事實上，大模型的浪潮，科大訊飛必須要抓住。這不僅能給科大訊飛帶來新的增長，更重要的是通過大模型挽回資本市場的信心。

總的來看，技術層面科大訊飛已然拿到了AI大模型的門票，最終能否在行業中搶占新的先機，還要看具體的商業落地表現。

03 深耕垂類，更有希望？

簡而言之，大模型跑得快的標準正變成好用和實用。

放眼整個行業，B端仍是大模型商業化落地的重點，各行各業對大模型的需求很強烈，大家都想借助大模型的AI能力，助力企業的數智化轉型。

同時，科大訊飛還面向金融、汽車、運營商、工業、住建、物業、法律、科研文獻、傳媒、政務、文旅、水利等12個領域發布了垂直行業大模型。

一個明顯的趨勢是，大模型C端市場需求增量明顯，這給了B端和C端兩條腿走路的科大訊飛更多大模型落地的機會。

發布會上，星火V3.0推出了多項應用大模型的C端產品，如具備英語AI答疑輔學的訊飛AI學習機、面向未來的人形機器人等。

圖源科大訊飛微信公眾號

歷史搜索全部刪除

熱門搜索

讓星火大模型趕超ChatGPT，科大訊飛做到了嗎？

01 星火大模型，跑到了哪一步？

02 為大模型投入巨大，也需要大模型拉升信心

03 深耕垂類，更有希望？

科大訊飛

評論

讓星火大模型趕超ChatGPT，科大訊飛做到了嗎？

01 星火大模型，跑到了哪一步？

02 為大模型投入巨大，也需要大模型拉升信心

03 深耕垂類，更有希望？