IBM CEO:DeepSeek證明我們是正確的,小型且高效的模型同樣能有實際成果快訊
AI 必須是專有技術,以大約 600 萬美元的成本訓練了最新的模型,都有能力推動成本下降。
2 月 7 日消息,當地時間 2 月 4 日,IBM 首席執行官 Arvind Krishna 在《財富》雜志發表了一篇長文,談到自己對 DeepSeek 及人工智能行業的看法及未來展望。
附 Arvind Krishina 的觀點大意如下:
上周,DeepSeek 打破了 AI 領域的傳統認知。一直以來,人們普遍認為,訓練最先進的 AI 模型需要投入超過 10 億美元,并依賴數千枚最新的芯片。AI 必須是專有技術,只有少數幾家公司具備開發它的能力,因此保密至關重要。
但 DeepSeek 的做法顛覆了這一認知。新聞報道指出,他們僅用約 2000 枚英偉達芯片,以大約 600 萬美元的成本訓練了最新的模型,遠低于行業預期。這再次證明,小型、高效的模型也能帶來實際成果,無需依賴龐大而昂貴的專有系統。
然而,這一突破引出了一個更深層次的問題:AI 的未來究竟掌握在誰手中?AI 的發展不能由少數幾家公司壟斷,尤其是其中一些公司可能在數據保護、隱私和透明度等基本價值觀上存在分歧。答案不是限制技術進步,而是要推動更廣泛的合作,確保大學、企業、研究機構和社會組織共同參與 AI 的構建。
替代方案是,AI 的主導權可能會落入價值觀和優先事項不同的參與者手中,這意味著未來社會和產業變革的關鍵技術將不再受掌控。真正的創新和進步,只有在 AI 的開發權得到廣泛共享的前提下才能實現。
AI 行業已經走過了炒作期。2025 年,AI 必須從少數巨頭的封閉體系中解放出來。到了 2026 年,社會各界不僅要使用 AI,更應投身于它的研發。
開源的小模型將成為實現這一目標的關鍵。DeepSeek 的成功說明,真正出色的工程技術應當在性能和成本之間找到最佳平衡。過去,行業普遍認為更大規模的模型才能帶來更好表現,但真正的突破并不在于規模,而在于效率。我們在 IBM 的研究表明,針對特定應用優化的模型已經將 AI 推理成本降低了最多 30 倍,使訓練更高效、更易獲取。
我并不認為 AGI 即將實現,也不認同未來的 AI 需要依賴龐大的核能數據中心。這種論調人為制造了錯誤的選擇題。AI 的高昂成本并非必然,它只是一個尚待解決的工程挑戰。無論是成熟企業還是初創公司,都有能力推動成本下降,讓 AI 更實用、更普及。
歷史早有先例。計算機發展早期,存儲和計算能力的成本高得驚人。然而,隨著技術進步和規模效應,這些成本迅速下降,推動了計算機的普及和創新。
AI 的發展軌跡也將如此。這對全球企業而言是一個積極信號。只有當技術變得經濟實惠、觸手可及,它才能真正改變世界。通過擁抱開放、高效的 AI 模型,企業能夠找到更具成本效益、符合自身需求的解決方案,釋放 AI 在各行業的巨大潛力。(清源)
1.TMT觀察網遵循行業規范,任何轉載的稿件都會明確標注作者和來源;
2.TMT觀察網的原創文章,請轉載時務必注明文章作者和"來源:TMT觀察網",不尊重原創的行為TMT觀察網或將追究責任;
3.作者投稿可能會經TMT觀察網編輯修改或補充。