模型即產(chǎn)品(The Model is the Product)
chenxiaoyun
發(fā)布于 云南 2025-02-19 · 2545瀏覽
過去幾年,人們一直在討論下一個AI發(fā)展周期可能是什么:智能體(Agents)?推理系統(tǒng)(Reasoners)?還是徹底的多模態(tài)?

現(xiàn)在是時候下結(jié)論了:下一個周期,就是“模型本身即產(chǎn)品”。

目前,無論是科研界還是產(chǎn)業(yè)界的變化,都在推動這種轉(zhuǎn)型:
? 通用模型擴展遇到了瓶頸。OpenAI發(fā)布GPT-4.5時透露了一個重要信息:模型能力呈現(xiàn)線性增長,但算力成本卻指數(shù)級飆升。盡管過去兩年訓練效率不斷提高,但成本太高,以至于OpenAI無法以合理的價格廣泛部署最新的大模型。
? 特定任務(wù)的強化訓練效果遠超預期。結(jié)合強化學習與推理能力訓練,模型開始真正地“學習任務(wù)”,出現(xiàn)了一種新東西:既非傳統(tǒng)機器學習,也不是基礎(chǔ)模型,而是一種神秘的第三種類型。小模型突然展現(xiàn)出極強的數(shù)學能力;代碼模型不僅會寫代碼,甚至能自己管理整個代碼庫;Claude甚至能在信息極少的情況下玩寶可夢游戲,并且做得很好。
? 推理成本大幅下降。以DeepSeek為例,新的優(yōu)化技術(shù)已經(jīng)讓全球所有現(xiàn)有GPU的總算力,足以每天給地球上的每個人提供1萬個頂級模型生成的token。這意味著,單純賣token(模型調(diào)用次數(shù))的經(jīng)濟模式已經(jīng)難以持續(xù),模型提供商不得不去做更高附加值的事情。

這種趨勢讓許多人感到不舒服。投資者們原本押注在應用層,但下一個階段,最可能被AI取代的恰恰就是應用層。

下一代模型的形態(tài)

過去幾周,我們看到了新一代“模型即產(chǎn)品”的典型案例,比如OpenAI的DeepResearch和Anthropic的Claude Sonnet 3.7。

許多人誤解了DeepResearch,尤其市面上出現(xiàn)了大量山寨版本,讓情況更加混亂。事實上,OpenAI并不是簡單地在GPT基礎(chǔ)上增加了外部搜索功能。他們訓練了一個全新的模型,能夠完全在內(nèi)部完成搜索任務(wù):

模型學習了基礎(chǔ)的瀏覽能力(搜索、點擊、滾動、文件解析),以及如何通過強化學習來整合大量網(wǎng)頁信息,生成結(jié)構(gòu)清晰、來源可靠的研究報告。

因此,DeepResearch并不是普通的聊天模型,而是一種專門設(shè)計用于搜索和研究的新型語言模型。相比之下,谷歌的Gemini和Perplexity的類似功能,只是在普通模型基礎(chǔ)上的表面優(yōu)化:

Gemini和Perplexity也提供了所謂“深度研究”功能,但他們并未公開任何優(yōu)化模型方法或?qū)嵸|(zhì)性評估,這表明他們并未進行深入訓練。

Anthropic也在明確他們的發(fā)展方向。他們在去年底給出了智能體(Agent)明確的定義:真正的智能體必須能夠自主決定任務(wù)的具體實現(xiàn)過程和工具使用,而非被人為設(shè)計好的工作流程所限制。

目前市面上許多號稱“智能體”的公司,實際上只是在設(shè)計自動化工作流程(workflows),即人為定義好的代碼路徑串聯(lián)模型和工具。雖然這種工作流程也有一定價值,但未來真正有效的智能體一定會通過重新訓練模型本身來實現(xiàn)。

舉個具體例子:最近發(fā)布的Claude 3.7模型,專門針對復雜的代碼開發(fā)任務(wù)進行強化訓練,這讓所有與代碼相關(guān)的應用都出現(xiàn)了性能顯著提升。

我所在的Pleias團隊也做了類似嘗試:我們設(shè)計了兩個專門的模型,一個用于數(shù)據(jù)準備,一個專門用于搜索和報告生成,通過設(shè)計全新的合成數(shù)據(jù)和獎勵機制進行訓練,讓部署階段更簡單,最終使得復雜性在訓練階段就被解決。

具體表現(xiàn)為將這種復雜結(jié)構(gòu):圖1

轉(zhuǎn)變?yōu)槿缦赂啙嵉哪J剑簣D2

要么自己訓練,要么被別人訓練。

可以明確的是,各大實驗室都在向這個方向前進:他們會逐步停止開放API,轉(zhuǎn)向自己訓練并直接提供完整模型服務(wù)。著名AI公司Databricks的投資人Naveen Rao很清晰地指出:
在未來2-3年內(nèi),所有閉源AI提供商將停止提供API服務(wù),只有開源模型才會繼續(xù)提供API。閉源公司會建立更加獨特、非商品化的能力。

近期的跡象也佐證了這個趨勢:

? OpenAI發(fā)布的DeepSearch只用于高級訂閱用戶,根本沒有提供API服務(wù)。
? Claude Code的模型訓練針對代碼應用場景優(yōu)化后,反而導致Cursor這樣的第三方工具使用效果不佳。
? 一些曾經(jīng)的“套殼公司”(wrapper公司,比如Cursor、WindSurf、Perplexity)也開始秘密訓練自己的小型模型,以增強自己的競爭力。

小公司可能不會馬上感受到這種沖擊,但他們會越來越依賴獨立的推理服務(wù)提供商?,F(xiàn)在的競爭格局就像免費為大公司做市場調(diào)研和數(shù)據(jù)生成,最終結(jié)果可能是被訓練公司吞并。

強化學習的價值被嚴重低估。

目前所有AI投資都存在同質(zhì)化現(xiàn)象,投資機構(gòu)普遍認為:
? 真正的價值只存在于與模型無關(guān)的應用層;
? 所有形式的訓練,包括強化學習,都沒有投資價值。

但現(xiàn)實情況是,強化學習(RL)的進步已經(jīng)徹底改變了這種情況。現(xiàn)在的市場情況更像是風險投資出現(xiàn)了集體錯誤定價,忽視了強化學習最新的技術(shù)突破帶來的巨大價值。
實際上,真正的新機會反而是那些專注于模型訓練的公司,但他們卻很難拿到融資。Prime Intellect公司雖然訓練出了第一個去中心化的大模型,但融資規(guī)模甚至不如一般的應用層公司。

OpenAI最近也開始表達對這一現(xiàn)象的不滿,希望硅谷創(chuàng)業(yè)公司多關(guān)注“垂直領(lǐng)域強化學習”,未來YC孵化器可能會做出調(diào)整:模型實驗室不再只是向客戶開放API,而是會和參與模型早期訓練階段的公司形成深度合作。

技術(shù)的爆炸,而非應用的爆炸。

相較之下,中國 DeepSeek 創(chuàng)始人梁文峰則更加直接地指出了這一點:
當前的AI發(fā)展,是一場技術(shù)創(chuàng)新的爆炸,而非應用創(chuàng)新的爆炸……如果上下游生態(tài)體系還不完整,直接去押注應用并沒有意義。

很多西方公司甚至還沒有意識到這場技術(shù)戰(zhàn)爭已經(jīng)結(jié)束了,他們還在用上一次戰(zhàn)爭的思維去打下一次戰(zhàn)爭,已經(jīng)遠遠落后。

以上,就是目前AI發(fā)展的大勢所趨:
模型本身已經(jīng)成為產(chǎn)品本身,誰掌握模型訓練,誰就掌握未來。
chenxiaoyun
半自動人工智障點贊機
瀏覽 2545
相關(guān)推薦
最新評論
贊過的人
評論加載中...

暫無評論,快來評論吧!