大模型創業,李彥宏公布標準答案互聯網+

                  伯虎財經 2023-11-17 11:33
                  分享到:
                  導讀

                  大模型不是越多越好。

                  來源 | 伯虎財經(bohuFN)

                  作者 | 陳平安

                  日前,原阿里首席AI科學家賈揚清的一條朋友圈截圖在社交媒體傳得沸沸揚揚。截圖指出某國產大模型其實是LLaMA架構,只是更換了幾個變量名而已。

                  這也不是業內人士第一次發聲質疑,在幾個月前的Waves大會上,中國人民大學高瓴人工智能學院盧志武教授也曾表示,所謂“國產大模型的春天”,不過是很多公司在“微調國外底座模型”的假象。

                  雖然后續也有其他學者表達了不同的看法,但爭論之下,一條有關大模型的暗線已然浮出水面——大模型,越多越好嗎?

                  關于這個問題,百度創始人、董事長兼首席執行官李彥宏在11月15日舉行的深圳2023西麗湖論壇上給出了自己的答案:

                  “目前中國的大模型太多,而模型之上開發的AI原生應用太少。”

                  “人類進入AI時代的標志,是出現大量的AI原生應用,而不是出現大量的大模型。”

                  01 大模型狂飆

                  要想回答開頭的問題,首先需要搞清楚,我們需要怎樣的大模型。

                  以去年11月底 ChatGPT的橫空出世為分界線,國內大模型發展經歷了從寒冬到盛夏的兩級反轉。不只是阿里、百度等巨頭公司,越來越多的創業公司開始涌入這個賽道:截止今年10月,國內已經發布了238個大模型,而6月份的時候這個數字是79個,相當于4個月就翻了3倍。

                  但正如開頭專家們所質疑的,大模型的風口并不好追。大模型的顛覆性來自其“智能涌現”的能力:簡單解釋就是觸類旁通,通過訓練,即便是沒有教過的東西,大模型也會。以百度的文心一言為例,在此前的演示中,當李彥宏要求其現場根據一些關鍵詞為一輛新能源汽車生成廣告時,文心一言僅僅花了三分鐘就生成了豎版廣告、5條文案和一段30秒的數字人廣告。

                  獲得這樣能力的前提是模型的參數規模足夠大,訓練數據量足夠多并且能夠不斷投入,進行迭代。

                  一方面,這決定了大模型是典型的資金密集型賽道,要開發好用、可用的大模型,存在很高的技術和成本門檻。據OpenAI聯合創始人布羅克曼等測算,訓練大模型消耗的計算量,每 3、4 個月會翻一倍。據多位業內人士估算,OpenAI 訓練 GPT-3 一年,僅算力成本就有 2000 萬美元。

                  另一方面,這也使得缺乏“智能涌現”能力的專用大模型難言價值。在會上,李彥宏曾提到一個現象,很多行業、企業,甚至很多城市都在買卡、囤芯片,建立智算中心,想要從頭訓練自己的專用大模型,但大模型的產業化模式,應該是把基礎模型的通用能力和行業領域的專有知識相結合。大模型更通用,但是成本高,小模型雖然只能應對特定場景的任務,但勝在成本低,實時性較強。在訓練的過程中,大模型能夠幫助小模型提升快速生成、標記樣本的能力,而小模型則幫助大模型快速收斂,從而提升算法性能。

                  一個例證在于,文心大模型的API調用量。李彥宏表示:“自從8月31號開放以來,文心大模型的API調用量,呈現了指數級的增長。國內有200多個大模型,文心大模型一家的調用量比這200多家大模型的調用量加起來還要多?!?/p>

                  讀到這里其實不難發現,大模型本質是一個基礎底座,有些類似pc時代的Windows操作系統或者移動互聯網時代的安卓或者ios系統。它的門檻和特性決定了,未來的競爭格局一定是一到兩個技術底座占據行業的統治地位。這也是為什么李彥宏會強調:“不斷地重復開發基礎大模型是對社會資源的極大浪費”。

                  02 大模型的價值錨點

                  業界之所以把大模型視為第四次工業革命真正進入快車道的標志,是期待其所帶來的效果和效率的躍遷。

                  還是以百度的文心大模型為例,自今年三月正式發布后基于文心大模型3.0的文心一言產品后,上個月,百度又發布了文心4.0版本。和前代相比,4.0是迄今為止最強大的文心大模型,在理解、生成、邏輯和記憶四大能力上,都有明顯提升。比如,在生成能力上,文心一言除了生成文字內容,更包括了圖片、視頻、數字人等多模態內容,可實現的創作體裁超過200種,涵蓋了幾乎所有寫作需求。在邏輯和記憶能力上,相比之前的版本也有了成倍提升。

                  但和過去誕生的許多新技術一樣,大模型也需要解決應用場景的桎梏,尋找兌現商業價值的路徑。就如同pc時代改變我們辦公、游戲方式的軟件,以及在根植于移動終端的抖音、微信這樣的應用一樣,同樣具備技術底座屬性的大模型如果不能形成繁榮的生態,那么也就難言價值。這也是大模型真正的價值錨點所在。

                  李彥宏在會上表示,“AI原生時代,我們需要的是100萬量級的AI原生應用,而不是100個所謂的大模型?!?/strong>

                  這需要從業者們共同努力。比如李彥宏提到一個情況,和國內百模大戰的情況相比,國外雖然涌現了幾十個基礎大模型,但對于AI原生應用的探索也很火熱,目前已經有上千個AI原生應用。例如微軟、Adobe都根據自身業務推出了相對應的AI原生應用。

                  發力生態建設也是百度一直在做的事情, 目前百度智能云千帆大模型平臺2.0月活企業數近萬家,覆蓋了金融、教育、制造、能源、政務、交通等多個行業的400多個場景,擁有了800萬AI開發者。

                  無論是PC時代還是移動互聯網時代,技術變革往往也意味著那些大機會,比如通訊、娛樂、購物、工作等。這些人們最本質的需求往往會因為技術而煥發新的形式和生機,就好比當人們滿足于互聯網時代的圖文閱讀模式時,一定不會想到未來有一個叫抖音的APP改變了數以億計人群的娛樂方式。

                  正如李彥宏所言,直到今天,無論是中國也好,美國也好,最好的AI原生應用還有沒出現。就像移動時代誕生了像微信、抖音、Uber這樣的“mobile-native”的應用一樣,AI原生時代一定會有優秀的AI原生應用是基于這些大模型開發出來的。

                  也因此,對于大模型從業者們而言,和花大力氣用于開發大模型相比,如何做出更好的AI原生應用顯然是更大的機會。

                  03 如何迎接AI時代

                  在此前的百度世界大會上,李彥宏曾表示“企業競爭,不是大魚吃小魚,而是快魚吃慢魚,比競爭對手更快決策,很可能你就贏了?!?/p>

                  和這段發言相印證的,是過去 7 個月里,百度在大模型方面的推進速度——文心大模型大大小小的更新有數十次,提出了多個大模型生態計劃,率先向全社會開放了大模型應用。

                  這里的邏輯有兩個。

                  首先是CEO對于業務驅動的關鍵作用?,F在AI和大模型會成為新的變革技術幾乎已經成為共識,咨詢機構麥肯錫預測:大模型和它掀起的生成式人工智能有望為全球經濟貢獻約 7 萬億美元價值。

                  但是作為企業應該如何擁抱AI時代呢?李彥宏表示,雖然許多企業上上下下都很重視這次機會,但對于問題的本質了解不深,“以為自己搞個基礎模型,或者按照網上傳播的評測方法來挑選一款評分高的大模型,就是擁抱AI時代了”。

                  實際上,大模型有沒有對互聯網公司的DAU、時長、用戶留存這些指標產生正向影響,有沒有對企業的收入、利潤、成本產生影響,才是問題的本質,而這些是只有CEO才會關心的問題,做最適合自己公司業務的選擇。

                  其次,強大的基礎大模型,是AI原生應用的底層驅動力,而AI原生應用則會帶動市場,倒逼市場變化。

                  基于自家的文心大模型,百度不僅把旗下各產品線進行了AI原生化重構,也孵化了全新的AI原生應用。比如智能代碼助手Comate。百度現在每新增100行代碼,就有20行是AI生成的。同時,得益于智能化的提升,AI原生化重構后的產品也取得了新的進展,比如百度文庫的付費率提升明顯。

                  這里李彥宏舉出新能源汽車去做類比:“中國新能源車在全球的市場份額達到65%。因為國家政策扶持的就是應用端,通過減免車輛購置稅,上路不限號不限行等手段,有效拉動了新能源汽車產業的快速增長。AI產業也是需求驅動,所以應該是在需求側、應用層發力,就像補貼新能源汽車用戶一樣,鼓勵企業調用大模型來開發人工智能原生應用,用市場推動產業發展?!?/p>

                  如果說此前幾次工業革命,中國的主題是錯過和追趕,那在大模型風起的當下,我們起碼已經和國外站在了同一起跑線。在這場競爭中,我們有足夠的技術和資源去做比拼,而更值得思考的,則是選擇一條怎樣的路。和百模大戰相比,通過類比過去的技術浪潮,強調AI 原生應用或許是一個更好的路徑。

                  畢竟就在當下,如何平衡收入和支出,已經成為大模型企業們頭疼的問題。

                  *文章封面首圖及配圖,版權歸版權所有人所有。若版權者認為其作品不宜供大家瀏覽或不應無償使用,請及時聯系我們,本平臺將立即更正。


                  模型 AI 應用
                  分享到:

                  1.TMT觀察網遵循行業規范,任何轉載的稿件都會明確標注作者和來源;
                  2.TMT觀察網的原創文章,請轉載時務必注明文章作者和"來源:TMT觀察網",不尊重原創的行為TMT觀察網或將追究責任;
                  3.作者投稿可能會經TMT觀察網編輯修改或補充。