模型即產(chǎn)品(The Model is the Product)
chenxiaoyun
發(fā)布于 云南 2025-02-19 · 3372瀏覽
過去幾年,人們一直在討論下一個(gè)AI發(fā)展周期可能是什么:智能體(Agents)?推理系統(tǒng)(Reasoners)?還是徹底的多模態(tài)?

現(xiàn)在是時(shí)候下結(jié)論了:下一個(gè)周期,就是“模型本身即產(chǎn)品”。

目前,無論是科研界還是產(chǎn)業(yè)界的變化,都在推動(dòng)這種轉(zhuǎn)型:
? 通用模型擴(kuò)展遇到了瓶頸。OpenAI發(fā)布GPT-4.5時(shí)透露了一個(gè)重要信息:模型能力呈現(xiàn)線性增長,但算力成本卻指數(shù)級(jí)飆升。盡管過去兩年訓(xùn)練效率不斷提高,但成本太高,以至于OpenAI無法以合理的價(jià)格廣泛部署最新的大模型。
? 特定任務(wù)的強(qiáng)化訓(xùn)練效果遠(yuǎn)超預(yù)期。結(jié)合強(qiáng)化學(xué)習(xí)與推理能力訓(xùn)練,模型開始真正地“學(xué)習(xí)任務(wù)”,出現(xiàn)了一種新東西:既非傳統(tǒng)機(jī)器學(xué)習(xí),也不是基礎(chǔ)模型,而是一種神秘的第三種類型。小模型突然展現(xiàn)出極強(qiáng)的數(shù)學(xué)能力;代碼模型不僅會(huì)寫代碼,甚至能自己管理整個(gè)代碼庫;Claude甚至能在信息極少的情況下玩寶可夢(mèng)游戲,并且做得很好。
? 推理成本大幅下降。以DeepSeek為例,新的優(yōu)化技術(shù)已經(jīng)讓全球所有現(xiàn)有GPU的總算力,足以每天給地球上的每個(gè)人提供1萬個(gè)頂級(jí)模型生成的token。這意味著,單純賣token(模型調(diào)用次數(shù))的經(jīng)濟(jì)模式已經(jīng)難以持續(xù),模型提供商不得不去做更高附加值的事情。

這種趨勢(shì)讓許多人感到不舒服。投資者們?cè)狙鹤⒃趹?yīng)用層,但下一個(gè)階段,最可能被AI取代的恰恰就是應(yīng)用層。

下一代模型的形態(tài)

過去幾周,我們看到了新一代“模型即產(chǎn)品”的典型案例,比如OpenAI的DeepResearch和Anthropic的Claude Sonnet 3.7。

許多人誤解了DeepResearch,尤其市面上出現(xiàn)了大量山寨版本,讓情況更加混亂。事實(shí)上,OpenAI并不是簡單地在GPT基礎(chǔ)上增加了外部搜索功能。他們訓(xùn)練了一個(gè)全新的模型,能夠完全在內(nèi)部完成搜索任務(wù):

模型學(xué)習(xí)了基礎(chǔ)的瀏覽能力(搜索、點(diǎn)擊、滾動(dòng)、文件解析),以及如何通過強(qiáng)化學(xué)習(xí)來整合大量網(wǎng)頁信息,生成結(jié)構(gòu)清晰、來源可靠的研究報(bào)告。

因此,DeepResearch并不是普通的聊天模型,而是一種專門設(shè)計(jì)用于搜索和研究的新型語言模型。相比之下,谷歌的Gemini和Perplexity的類似功能,只是在普通模型基礎(chǔ)上的表面優(yōu)化:

Gemini和Perplexity也提供了所謂“深度研究”功能,但他們并未公開任何優(yōu)化模型方法或?qū)嵸|(zhì)性評(píng)估,這表明他們并未進(jìn)行深入訓(xùn)練。

Anthropic也在明確他們的發(fā)展方向。他們?cè)谌ツ甑捉o出了智能體(Agent)明確的定義:真正的智能體必須能夠自主決定任務(wù)的具體實(shí)現(xiàn)過程和工具使用,而非被人為設(shè)計(jì)好的工作流程所限制。

目前市面上許多號(hào)稱“智能體”的公司,實(shí)際上只是在設(shè)計(jì)自動(dòng)化工作流程(workflows),即人為定義好的代碼路徑串聯(lián)模型和工具。雖然這種工作流程也有一定價(jià)值,但未來真正有效的智能體一定會(huì)通過重新訓(xùn)練模型本身來實(shí)現(xiàn)。

舉個(gè)具體例子:最近發(fā)布的Claude 3.7模型,專門針對(duì)復(fù)雜的代碼開發(fā)任務(wù)進(jìn)行強(qiáng)化訓(xùn)練,這讓所有與代碼相關(guān)的應(yīng)用都出現(xiàn)了性能顯著提升。

我所在的Pleias團(tuán)隊(duì)也做了類似嘗試:我們?cè)O(shè)計(jì)了兩個(gè)專門的模型,一個(gè)用于數(shù)據(jù)準(zhǔn)備,一個(gè)專門用于搜索和報(bào)告生成,通過設(shè)計(jì)全新的合成數(shù)據(jù)和獎(jiǎng)勵(lì)機(jī)制進(jìn)行訓(xùn)練,讓部署階段更簡單,最終使得復(fù)雜性在訓(xùn)練階段就被解決。

具體表現(xiàn)為將這種復(fù)雜結(jié)構(gòu):圖1

轉(zhuǎn)變?yōu)槿缦赂啙嵉哪J剑簣D2

要么自己訓(xùn)練,要么被別人訓(xùn)練。

可以明確的是,各大實(shí)驗(yàn)室都在向這個(gè)方向前進(jìn):他們會(huì)逐步停止開放API,轉(zhuǎn)向自己訓(xùn)練并直接提供完整模型服務(wù)。著名AI公司Databricks的投資人Naveen Rao很清晰地指出:
在未來2-3年內(nèi),所有閉源AI提供商將停止提供API服務(wù),只有開源模型才會(huì)繼續(xù)提供API。閉源公司會(huì)建立更加獨(dú)特、非商品化的能力。

近期的跡象也佐證了這個(gè)趨勢(shì):

? OpenAI發(fā)布的DeepSearch只用于高級(jí)訂閱用戶,根本沒有提供API服務(wù)。
? Claude Code的模型訓(xùn)練針對(duì)代碼應(yīng)用場(chǎng)景優(yōu)化后,反而導(dǎo)致Cursor這樣的第三方工具使用效果不佳。
? 一些曾經(jīng)的“套殼公司”(wrapper公司,比如Cursor、WindSurf、Perplexity)也開始秘密訓(xùn)練自己的小型模型,以增強(qiáng)自己的競(jìng)爭力。

小公司可能不會(huì)馬上感受到這種沖擊,但他們會(huì)越來越依賴獨(dú)立的推理服務(wù)提供商。現(xiàn)在的競(jìng)爭格局就像免費(fèi)為大公司做市場(chǎng)調(diào)研和數(shù)據(jù)生成,最終結(jié)果可能是被訓(xùn)練公司吞并。

強(qiáng)化學(xué)習(xí)的價(jià)值被嚴(yán)重低估。

目前所有AI投資都存在同質(zhì)化現(xiàn)象,投資機(jī)構(gòu)普遍認(rèn)為:
? 真正的價(jià)值只存在于與模型無關(guān)的應(yīng)用層;
? 所有形式的訓(xùn)練,包括強(qiáng)化學(xué)習(xí),都沒有投資價(jià)值。

但現(xiàn)實(shí)情況是,強(qiáng)化學(xué)習(xí)(RL)的進(jìn)步已經(jīng)徹底改變了這種情況?,F(xiàn)在的市場(chǎng)情況更像是風(fēng)險(xiǎn)投資出現(xiàn)了集體錯(cuò)誤定價(jià),忽視了強(qiáng)化學(xué)習(xí)最新的技術(shù)突破帶來的巨大價(jià)值。
實(shí)際上,真正的新機(jī)會(huì)反而是那些專注于模型訓(xùn)練的公司,但他們卻很難拿到融資。Prime Intellect公司雖然訓(xùn)練出了第一個(gè)去中心化的大模型,但融資規(guī)模甚至不如一般的應(yīng)用層公司。

OpenAI最近也開始表達(dá)對(duì)這一現(xiàn)象的不滿,希望硅谷創(chuàng)業(yè)公司多關(guān)注“垂直領(lǐng)域強(qiáng)化學(xué)習(xí)”,未來YC孵化器可能會(huì)做出調(diào)整:模型實(shí)驗(yàn)室不再只是向客戶開放API,而是會(huì)和參與模型早期訓(xùn)練階段的公司形成深度合作。

技術(shù)的爆炸,而非應(yīng)用的爆炸。

相較之下,中國 DeepSeek 創(chuàng)始人梁文峰則更加直接地指出了這一點(diǎn):
當(dāng)前的AI發(fā)展,是一場(chǎng)技術(shù)創(chuàng)新的爆炸,而非應(yīng)用創(chuàng)新的爆炸……如果上下游生態(tài)體系還不完整,直接去押注應(yīng)用并沒有意義。

很多西方公司甚至還沒有意識(shí)到這場(chǎng)技術(shù)戰(zhàn)爭已經(jīng)結(jié)束了,他們還在用上一次戰(zhàn)爭的思維去打下一次戰(zhàn)爭,已經(jīng)遠(yuǎn)遠(yuǎn)落后。

以上,就是目前AI發(fā)展的大勢(shì)所趨:
模型本身已經(jīng)成為產(chǎn)品本身,誰掌握模型訓(xùn)練,誰就掌握未來。
chenxiaoyun
半自動(dòng)人工智障點(diǎn)贊機(jī)
瀏覽 3372
相關(guān)推薦
最新評(píng)論
贊過的人
評(píng)論加載中...

暫無評(píng)論,快來評(píng)論吧!