界面新聞記者 | 肖芳
界面新聞編輯 | 文姝琪
在2024 re:Invent全球大會上,亞馬遜一口氣發布了6款大模型。
這些大模型都依托于其發布的推出新一代基礎模型Amazon Nova,并集成在Amazon Bedrock中提供服務。
其中,Amazon Nova系列基礎模型包括Micro、Lite、Pro、Premier四款:Amazon Nova Micro為純文本生成模型,每秒可輸出210個token;Amazon Nova Lite和Amazon Nova Pro為多模態模型,分別對標OpenAI的GPT-4o mini和GPT-4o,且多項能力在基準測試中表現更優;Amazon Nova Premier同樣是多模態大模型,專為復雜推理任務而生。
目前,Amazon Nova系列Micro、Lite、Pro模型已全部正式可用,Amazon Nova Premier預計將在2025年第一季度可用。
同時,亞馬遜還推出了兩個全新模型。Amazon Nova Canvas是圖像生成模型,性能上優于OpenAI的DALL-E 3和Stable Diffusion,還內置的安全控制措施確保能夠追溯每張圖像的來源;Amazon Nova Reel是視頻生成模型,支持生成六秒的視頻,未來幾個月將支持最長為兩分鐘的視頻生成。
亞馬遜云科技新任CEO馬特?加曼(Matt Garman)在演講中表示,大模型是一個創新速度極快的領域,幾乎每周都會有新版本、新功能、新模型、新更新以及新的成本變化。盡管有這么多創新和眾多模型,可實際上要找到一個完全契合自身用例的完美模型依舊十分困難。
正是基于這樣的市場洞察,亞馬遜云科技試圖打造一個專業知識與延遲、成本等因素進行合理組合的大模型服務。其最近兩年在大模型上的動作也均以此為出發點。
Amazon Bedrock去年的使用量已增長5倍
面對市場對大模型的需求痛點,亞馬遜在2023年4月推出一項完全托管的服務Amazon Bedrock,來滿足市場需要考量模型專業能力、成本等因素的需求。
通過API集合,Amazon Bedrock提供來自AI21 Labs、Anthropic、Cohere、Meta、Mistral AI、Stability AI 以及亞馬遜自身等多家公司的基礎模型。這些基礎模型涵蓋了文本生成、圖像生成等多種類型,為開發者提供了豐富的選擇,以滿足不同的應用場景和需求。
馬特?加曼(Matt Garman)透露,每天都有數以萬計的客戶在生產應用中使用Amazon Bedrock,其使用量在去年就增長了近5倍。
快速增長的使用量證明了市場對于Amazon Bedrock這種服務模式的認可。背后的原因也不難理解,大模型在快速迭代升級,很多企業并非是想使用一款基礎模型,而是針對不用需求選擇更合適的模型。Amazon Bedrock集成了越來越多模型,其帶來的便捷性不僅吸引了很多企業客戶使用,還吸引了Salesforce、SAP和Workday等獨立軟件供應商(ISV)集成到他們自己的系統上,為下游客戶提供生成式AI服務。
Amazon Nova系列模型也是在平衡專業能力、成本和延遲等多方面基礎之上推出的。同時,亞馬遜還在Amazon Bedrock中推出模型蒸餾功能,幫助企業進一步降低大模型的使用成本。根據馬特?加曼(Matt Garman)在演講中透露的信息,經過蒸餾的模型相比被蒸餾的模型,運行速度能夠快500%,成本還能降低75%,而且Amazon Bedrock可一站式完成所有相關工作。
亞馬遜自研的Nova系列模型還能夠與蒸餾功能整合在一起,把大模型的智能“轉移”到更小的模型中,這些小模型成本效益更高,延遲更低。
亞馬遜在2024 re:Invent全球大會上發布的6款模型并不是全部。根據馬特?加曼(Matt Garman)的介紹,亞馬遜還將在2025年推出語音到語音模型以及多模態到多模態模型。
其中,語音到語音模型計劃在2025年第一季度推出,該模型旨在通過理解自然語言的流式語音輸入,解釋語言和非語言信號(如語調和節奏),提供流暢的類人交互,徹底改變對話式AI應用,確保低延遲的雙向交流。
多模態到多模態模型是亞馬遜在大模型上的一個全新嘗試,能夠接受文本、圖像、音頻和視頻作為輸入,并以任意模態生成輸出。該模型預計在2025年中旬推出,將簡化應用開發,使同一模型能夠執行多種任務,如內容模態轉換、內容編輯,以及驅動能夠理解和生成所有模態的AI代理。
數十萬枚自研芯片落地Anthropic,亞馬遜要向微軟+OpenAI發起新挑戰
在2024 re:Invent全球大會上,AI初創公司Anthropic的聯合創始人兼首席計算官Tom Brown宣布了“雷尼爾計劃”(Project Rainier),該計劃也是一個有戰略意義的布局。
“雷尼爾計劃”的核心內容是,Anthropic未來將使用一個擁有數十萬枚亞馬遜自研芯片的算力集群。其芯片數量將是Anthropic現有算力集群的五倍以上。
Anthropic是亞馬遜投資的AI初創公司。2023年9月,亞馬遜向Anthropic投資40億美元。今年11月,亞馬遜再次向Anthropic追加40億美元投資。這是亞馬遜近30年最大的一筆對外投資。投資之后,Anthropic必須使用亞馬遜AWS的云計算服務,其推出的Claude系列模型也已集成在Amazon Bedrock上。
從模型能力上看,Claude系列模型是目前市面上幾乎少數可以和OpenAI旗下GPT-4對標的模型。如果“雷尼爾計劃”能夠順利落地,Anthropic將用上全球規模最大的AI算力集群之一,這對后續模型能力的進一步提升也有積極的幫助。
此舉背后,我們可以看到亞馬遜云在大模型上更大的野心。一方面,亞馬遜云科技聯合Anthropic對標微軟+OpenAI的模式,和其爭奪更多有大模型和云計算使用需求的客戶。
此前,微軟CEO薩提亞·納德拉在電話財報會中曾表示,超過1.8萬家公司正在使用微軟的Azure OpenAI服務,這里面有很多是Azure的新客戶。并且,其云計算產品Azure的收入增長,也有不少是來自微軟提供的GPT-4入口。
這意味著OpenAI走紅后,其為微軟的云服務Azure帶來了更多新增客戶,亞馬遜也可以復制這種已經被驗證過的打法。
另一方面,亞馬遜通過投資的方式將自研芯片和Anthropic深度綁定,既能夠降低自己的算力成本,也能減少其對英偉達、英特爾等芯片供應商的依賴。節省下來的算力成本可以讓亞馬遜的云計算服務以及生成式AI服務在價格上更有競爭力。
據Synergy Research Group最新公布的數據估算,2024 年第三季度,亞馬遜在全球云基礎設施市場的市場份額達到31%,領先于微軟 Azure平臺的 20%和谷歌云的11%。
顯然,亞馬遜云科技并未滿足于此,還在試圖通過AI大模型帶來的增量尋求更多的市場份額。