AI發(fā)展趨勢(shì):模型即產(chǎn)品
chenxiaoyun
發(fā)布于 香港 2025-03-31 · 1805瀏覽 1贊

最近,AI 圈子里有兩個(gè)事值得關(guān)注:

一個(gè)是 GPT-4o 推出了新的畫圖模型,另一個(gè)是豆包升級(jí)了“邊搜邊想”功能。

這兩個(gè)例子都指向了一個(gè)正在越來(lái)越被人接受和認(rèn)同的 AI 新范式——“模型即產(chǎn)品”。它聽起來(lái)有點(diǎn)抽象,但其實(shí)可能會(huì)影響未來(lái) AI 產(chǎn)品的發(fā)展形態(tài)。那么“模型即產(chǎn)品”到底是什么意思,它跟傳統(tǒng)的AI方式有什么不同,為什么它這么厲害但為什么又不夠普及? 什么是“模型即產(chǎn)品”? 簡(jiǎn)單來(lái)說(shuō),“模型即產(chǎn)品”就是把AI模型本身當(dāng)作產(chǎn)品,它的核心價(jià)值來(lái)自于模型的智能和能力,而不是靠一大堆復(fù)雜的軟件或界面來(lái)包裝。
 

比如說(shuō),GPT-4o的新畫圖模型,你只需要上纏圖片寫六個(gè)字:“吉卜力風(fēng)格化”,它就能直接生成一張高度還原又可愛(ài)的吉卜力動(dòng)畫風(fēng)格圖片;或者你可以基于剛生成的吉卜力漫畫形象再去生成個(gè)表情包,甚至還能生成一幅四格漫畫。不需要你會(huì)用Photoshop,也不用切換好幾個(gè)App,一個(gè)模型就搞定了一切。 想想以前畫圖的流程:你得先找素材、調(diào)顏色、畫線條,還得用別的工具加文字,步驟多得讓人頭暈。而現(xiàn)在,GPT-4o的畫圖模型把這些都“學(xué)會(huì)”了,直接給你成品。 這就是“模型即產(chǎn)品”的魅力——模型可以直接滿足各種場(chǎng)景下的不同情況,而不需要你去設(shè)計(jì)復(fù)雜的工作流或者在不同的 App 之間切換。

它和傳統(tǒng)的工作流智能體有什么區(qū)別?各自有什么優(yōu)缺點(diǎn)? 傳統(tǒng)的AI應(yīng)用大多是“工作流智能體”模式。啥意思呢?就是通過(guò)預(yù)先設(shè)計(jì)好固定的流程,把AI模型和其他工具串起來(lái),按部就班地完成任務(wù)。比如前一段時(shí)間很火的 Manus,如果你讓它“幫我規(guī)劃一下北京到山西自駕游的詳細(xì)行程”,那么它會(huì)設(shè)計(jì)一個(gè)類似于 TODO List 的工作流:

- 搜索北京到山西之間的景點(diǎn)信息

- 搜索北京到山西自駕游的攻略

- 生成詳細(xì)行程 這樣的工作流優(yōu)點(diǎn)就是容易執(zhí)行,按部就班就能出來(lái)結(jié)果,缺點(diǎn)就是不夠靈活,因?yàn)?TODO List / 工作流一旦定了,就不好根據(jù)返回的結(jié)果做調(diào)整。

如果搜索結(jié)果中出現(xiàn)了最近北京到山西之間某一段高速施工的新聞資訊,或者未來(lái)會(huì)出現(xiàn)極端天氣的新聞資訊,那么就需要增加對(duì)繞開高速路段的搜索和天氣預(yù)報(bào)的搜索,最終綜合調(diào)整行程。

豆包最近測(cè)試上線的「邊搜邊想」功能是另一個(gè)很好的例子。不同于傳統(tǒng)AI的“先搜后想”——模型根據(jù)你的問(wèn)題,一股腦搜索一遍網(wǎng)絡(luò)資料,然后拿著這一份固定的信息來(lái)作答,豆包會(huì)在思考過(guò)程中進(jìn)行多輪搜索。也就是說(shuō),模型邊回答邊判斷:“我是不是還缺某方面的信息?” 如果是,它會(huì)主動(dòng)再搜索。如此循環(huán),直到把問(wèn)題各個(gè)方面都弄清楚為止。

就像前面行程規(guī)劃的例子,“邊搜邊想”先搜出基本景點(diǎn)和交通方案,再根據(jù)這些結(jié)果想到“還需要看看最新的天氣預(yù)報(bào)和當(dāng)?shù)亟煌ㄇ闆r”,于是進(jìn)行第二輪搜索獲取這些動(dòng)態(tài)信息,最后綜合各方面數(shù)據(jù),甚至連景點(diǎn)之間的小交通都考慮進(jìn)去,給出一個(gè)周全的行程表。 這就像一個(gè)聰明的助手,會(huì)根據(jù)手頭的信息動(dòng)態(tài)調(diào)整策略,而不是死板地走完預(yù)定路線。

為什么“模型即產(chǎn)品”很難? 既然“模型即產(chǎn)品”的模式這么強(qiáng)大,為什么不都采用這種模式呢?因?yàn)閷⒛P陀?xùn)練成一個(gè)適應(yīng)不同場(chǎng)景的通用產(chǎn)品,簡(jiǎn)單易用太難了:

- 研發(fā)門檻高:需要有很強(qiáng)大的基座模型;需要有優(yōu)質(zhì)數(shù)據(jù);需要專門的強(qiáng)化訓(xùn)練。

- 資源燒錢:訓(xùn)練模型得用超級(jí)多的計(jì)算資源,像GPU集群,小公司根本玩不起。

- 市場(chǎng)風(fēng)險(xiǎn)大:投入大、周期長(zhǎng),投資者往往更愛(ài)快見效的應(yīng)用,而不是這種“慢工出細(xì)活”的項(xiàng)目。

- 用戶體驗(yàn)挑戰(zhàn):模型再牛,也得有個(gè)好用的界面。像 GPT-4o 在聊天框就可以畫圖,像豆包只要選中“深度思考”就可以自動(dòng)“邊搜邊想”。

簡(jiǎn)單科普:強(qiáng)化學(xué)習(xí) 說(shuō)到這,有必要提一提“模型即產(chǎn)品”背后的核心技術(shù)——強(qiáng)化學(xué)習(xí)(Reinforcement Learning, RL)。簡(jiǎn)單說(shuō),就是讓AI自己試錯(cuò),像訓(xùn)練馬戲團(tuán)的動(dòng)物一樣,給它獎(jiǎng)勵(lì)和反饋,讓它慢慢學(xué)會(huì)做事。 舉個(gè)經(jīng)典例子:AlphaZero,那個(gè)打敗人類圍棋冠軍的AI。它沒(méi)靠人類教招式,而是通過(guò)強(qiáng)化學(xué)習(xí),自己跟自己下棋。贏了有獎(jiǎng)勵(lì),輸了調(diào)整策略,玩了幾百萬(wàn)局后,它不僅學(xué)會(huì)了圍棋,還發(fā)現(xiàn)了人類幾千年沒(méi)想到的招數(shù)。這就是強(qiáng)化學(xué)習(xí)的厲害之處——讓AI自己摸索出最佳方案。

比如豆包的“邊搜邊想”也是通過(guò)強(qiáng)化訓(xùn)練,通過(guò)模擬的搜索數(shù)據(jù)庫(kù),以及搜索訓(xùn)練集,讓模型一遍遍的去對(duì)給定的問(wèn)題去嘗試不同的關(guān)鍵詞和思考后再搜索,一次又一次地嘗試后終于偶然找到了答案,得到獎(jiǎng)勵(lì)。

然后,模型再嘗試?yán)斫獠⒖偨Y(jié)出那些能提高下次找到相似答案可能性的規(guī)律。 這種自主學(xué)習(xí)能力,是“模型即產(chǎn)品”能取代復(fù)雜工作流的關(guān)鍵。 未來(lái)展望 盡管挑戰(zhàn)不小,但可以看到“模型即產(chǎn)品”已經(jīng)成為AI發(fā)展的重大趨勢(shì)。

 

展望未來(lái),我們可以期待“模型即產(chǎn)品”帶來(lái)更多驚喜。也許再過(guò)不久,你與AI的互動(dòng)將不僅局限于問(wèn)答,而更像是與一個(gè)能夠替你執(zhí)行復(fù)雜操作的數(shù)字伙伴合作。屆時(shí),我們的許多應(yīng)用場(chǎng)景可能被重新定義:很多以前要在人和工具之間反復(fù)切換的事情,現(xiàn)在一個(gè)AI模型就能包辦。從創(chuàng)作靈感的火花,到繁瑣資料的整理,再到?jīng)Q策方案的拿出,AI模型將直接為你提供端到端的支持。 真正聰明的AI,不是你告訴它怎么做,而是它自己知道該怎么做。

chenxiaoyun
半自動(dòng)人工智障點(diǎn)贊?rùn)C(jī)
瀏覽 1805
1
相關(guān)推薦
最新評(píng)論
贊過(guò)的人 1
評(píng)論加載中...

暫無(wú)評(píng)論,快來(lái)評(píng)論吧!