DeepSeek陰影下的大廠互聯網+

一面加入,一面追趕。
來源 | 伯虎財經(bohuFN)
作者 | 路費
最后一個反擊DeepSeek的主要玩家終于姍姍來遲。
2月18日晚間,馬斯克的 xAI帶著Grok3亮相直播。發布會上,馬斯克強調,為了訓練Grok3,用了 超過20萬張 H100,總訓練小時數達到兩億小時。而收獲的成果是,在分數上,Grok3 超過了目前公開測試的所有模型,包括DeepSeek R1.。
馬總的成果讓不少推上觀眾開始覺得,大力出奇跡仍然是有效的。但很快,就有人發現,Grok3雖然刷分成績優秀,實際表現卻并不如想象中驚艷。比如它仍然無法識別9.11和9.90誰更大,給出的許多答案和建議也存在明顯錯誤。
即便馬斯克后續發文挽尊,表示Grok3每天都會改進,現在還只是個測試版,但昨晚的展示又進一步證明了DeepSeek帶來的陰影——大力出奇跡并不是AI的唯一解,大模型的競爭關鍵正在從算力轉向優質訓練數據。
和試圖反駁DeepSeek的美國同行不同,國內的大廠們紛紛擁抱了DeepSeek。
字節旗下的火山引擎官宣接入DeepSeek;百度不僅從閉源轉向開源,還把核心的搜索業務也接入DeepSeek。
阿里巴巴在云服務、1688、天貓精靈、國際業務等多個板塊都部署DeepSeek;讓市場反應最大的,還是微信接入DeepSeek,在搜索欄新增了AI搜索的服務。消息一出,騰訊股價一度上漲至512港元,創下了2021年10月以來的最佳表現。
當下的情況在某種程度上印證的李彥宏的那句名言:在所有大廠都看好的情況下,創業公司成功的概率幾乎為零。當行業發生重大轉向時,去年還風頭正勁的AI六小龍有些泯然眾人,但大廠依然可以憑借自身業務去做落地場景開發,同時憑借自身的賺錢能力繼續投入,留在牌桌上。
01 舊世界的分崩離析
2月10日,在法國巴黎大皇宮,AI學者、斯坦福大學教授李飛飛在“人工智能行動峰會上”發表演講,并表示,“毫無疑問,歷史學家今后一定會把這段時間稱作‘真正的第一個AI時代'”。
新技術浪潮來臨的特點之一,大概是正因為探索的是一片無人區,所以你永遠不知道哪里是正確的方向。當所有人都以為通往AGI的道路只有“大力出奇跡”這華山一條路時,DeepSeek告訴你,往哪個方向都是路。
DeepSeek對過去路線的改變主要有三點:成本、開源和路徑。
自AI浪潮誕生以來,所有的關鍵技術突破都在美國,因此硅谷的風向可以當作行業的風向。OpenAI認為算力能夠解決一切,所以競爭的關鍵是足夠的卡。
你能看到的是,即便是現在,馬斯克仍然試圖用20萬張 H100、2億訓練小時去證明過去的路線。但事實是,雖然 Grok3 在大模型競技場榜單上的得分排名第一,但是領先的分數并不多。
DeepSeek的例子證明了,算力雖然也重要,更重要的是數據質量,成本也存在大幅優化的空間。
國內大模型行業的風向也因此改變。
大廠對于AI這波機會的“FOMO”情緒是顯而易見的。阿里、騰訊等大廠都投資了半數甚至半數以上的“AI六小龍”。不僅自己投,大廠也在自己造。
阿里分別推出了開源大模型Qwen系列和閉源大模型通義千問2.5;騰訊則推出了混元大模型;最早投入AI、也是最早跟上OpenAI節奏的百度則推出了文心一言。
相對于以上三家,字節的反應更慢,但是投入也更猛烈。根據《財經》報道,字節對大模型的投入“不設限”。豆包團隊不僅規模達數千人,甚至不少人員都是字節加了50%甚至1倍的薪資,從其他大廠里挖來的。
根據浙商證券的分析,2024年字節跳動的資本開支約為800億元,接近百度、阿里、騰訊三家的總和(約1000億元)。
一個字節后來居上的例子是,在DeepSeek-R1橫空出世之前,字節旗下的豆包日活已經來到了國內第一。
但是僅僅一個月,甚至沒有任何成本,DeepSeek就超越它來到了行業第一。成為史上最快突破3000萬日活的App。
只是一轉眼,DeepSeek活成了豆包夢想的樣子
根據《晚點LatePost》報道,在日前字節的全員會上,CEO梁汝波反思說去年 9 月 OpenAI 發布長鏈思考模型、成為行業熱點后,字節意識到技術重大變化,但 “沒有覺得要馬上復現出來 ...... 現在回頭看,如果一開始重大問題就爭先,我們有機會更早實現?!?/p>
此前一直堅持閉源路線的百度也宣布免費和開源。
02 大廠的特權:一邊加入一邊追趕
幾乎是沒有任何猶豫的,互聯網大廠們都選擇了加入DeepSeek。
據了解,在年前和過年期間,多家大廠都開了線上電話會,要求完成DeepSeek的適配和接入工作。一方面,DeepSeek開源的比較徹底,下載、部署、使用非常方便;另一方面,作為目前討論度最高的大模型,DeepSeek意味著巨大的流量,并且其創始人梁文鋒致力于實現AGI,并沒有想拿日活做文章的意思。
可以說,誰能吃到DeepSeek這波機會,至少取得了AI to c的先機。這也是這輪大廠to c業務調整的契機。
意料之外而又情理之中的是,動的最快的是騰訊。從產品來看,騰訊把DeepSeek接入了自家最核心的微信,灰度測試了AI搜索功能。并且騰訊地圖、QQ音樂、騰訊文檔都已經接入DeepSeek。
從組織層面來看,根據《智能涌現》報道,繼今年1月騰訊元寶(全能AI產品)從TEG(技術工程事業群)轉入CSIG之后,包括QQ瀏覽器、搜狗輸入法、ima等更多產品和應用,將正式轉入CSIG(云與智慧產業事業群)。
雖然第一個把DeepSeek接入核心產品的行為,并不符合騰訊“敢為人后”的風格,但理由也不難猜測。
此前行業普遍認為大模型的推理能力一定會出現,不過這個過程可能會很長。DeepSeek的出現一下把節點提前了,應用場景逐漸清晰起來。
以搜索為例。過去騰訊坐擁流量入口,但是在搜索這塊始終折戟。行業的共識是,AI一旦出現,最先顛覆的一定是搜索,因為AI本身的能力能夠讓你在最短的時間內得到最想要的答案。騰訊旗下的游戲等業務也是AI落地的核心場景。
既然目前DeepSeek沒有做to c的想法,也沒有外部融資的計劃,借助它的流量和能力,去培育自己的產品,何樂而不為呢?
其他幾家大廠也都選擇把DeepSeek接入自家業務,只不過步子邁的沒有那么大。比如阿里旗下to B的釘釘率先接入了DeepSeek,在to c層面,阿里把夸克當作核心,同時和蘋果的合作有望讓阿里承接更多用戶和流量。
大廠們也沒放棄基礎模型的研究。
從《晚點LatePost》的報道來看,字節重提務實的浪漫主義。針對AI,梁汝波提出了三個重點目標:意識追求智能上線,不忽略關鍵技術節點。二是探索新的交互。但是加強規模效應。同時成立探索通用人工智能(AGI)前沿研究的Seed Edge項目,項目員工的考核周期和目標也比其他員工放的更寬。
騰訊在微信搜一搜接入DeepSeek不久,就在騰訊元寶上線了自研的混元T1深度思考模型,圍繞AI搜索場景打造自主的模型能力。
DeepSeek的驚喜本就不是顛覆式的創新,反而加重了行業“FOMO”情緒。有子彈的大廠一定不會放棄拿到AGI船票的機會。
03 寫在最后
據了解,前任當紅AI炸子雞月之暗面也主動調整了策略。界面新聞報道,月之暗面近期決定大幅收縮產品投放預算,包括暫停多個安卓渠道的投放,以及第三方廣告平臺的合作,把主要精力放在模型能力的提升上。
而此前的AI六小龍里,階躍星辰和MiniMax已經接入DeepSeek-R1模型,零一萬物明確表示不做基礎大模型,轉向應用層開發。百川智能推出了以Baichuan-M1為底座打造的“AI兒科醫生”,智譜AI則選擇加碼Agent智能體。
我們常常說大廠沒有創業的土壤,但事實是創業公司在拿到風投的錢以后,也需要考慮到股東回報的問題,從而不得不把中心放到商業化上。
至于DeepSeek?它不缺錢。
文章封面首圖及配圖,版權歸版權所有人所有。若版權者認為其作品不宜供大家瀏覽或不應無償使用,請及時聯系我們,本平臺將立即更正。
1.TMT觀察網遵循行業規范,任何轉載的稿件都會明確標注作者和來源;
2.TMT觀察網的原創文章,請轉載時務必注明文章作者和"來源:TMT觀察網",不尊重原創的行為TMT觀察網或將追究責任;
3.作者投稿可能會經TMT觀察網編輯修改或補充。