DeepSeek新出的模型V3 0324可能是跑MCP性價(jià)比最高的模型。它在性能上接近Claude-3.7 Sonnet,調(diào)用MCP很絲滑,但是成本卻低了非常非常多,真的是白菜價(jià)了。我給你們看一下就明白了。
這個(gè)是我目前用得最多的MCP客戶端Cline。DeepSeek最新模型,它已經(jīng)支持了。我這邊選的是付費(fèi)版。平臺(tái)雖然也提供免費(fèi)版,但是不建議用。我前邊試過了,速度太慢,而且步驟一多就容易中斷,就挺鬧心的。所以咱還是老老實(shí)實(shí)花錢吧。
我的需求很簡單:谷歌發(fā)布Gemini 2.5模型。這是他們的官方博客。我讓DeepSeek幫我把內(nèi)容扒下來,翻譯成中文,并且在開頭加上總結(jié),最后存進(jìn)文檔里。
你看,DeepSeek先做了四步規(guī)劃:
第一,把用戶需求拆成明確的任務(wù);
第二,判斷需要用哪些工具,包括Tavily MCP里的提取工具,以及寫入文件的工具;
第三,當(dāng)前的環(huán)境是,文件已經(jīng)存在,用戶也允許直接進(jìn)行操作;
第四,給自己設(shè)定執(zhí)行步驟。
這個(gè)就是AI比人類強(qiáng)的地方。你想嘛,有幾個(gè)人能做到這么清晰思考和規(guī)劃的?
整個(gè)過程花了兩三分鐘,我就不具體展示了。當(dāng)文檔寫入完成后,整個(gè)任務(wù)結(jié)束,一共花了0.0358美金。
接下來,咱們加點(diǎn)難度。我讓它調(diào)用兩個(gè)MCP:一個(gè)是Sequential-thinking,步驟盡可能多。另一個(gè)是Tavily,負(fù)責(zé)聯(lián)網(wǎng)搜索資料。每一步思考之前,都要搜一次資料,再結(jié)合搜到的內(nèi)容思考。
像這種需求就特別考驗(yàn)?zāi)P?。因?yàn)樗纫貌鸾鈫栴},還得根據(jù)實(shí)際搜到的信息隨時(shí)調(diào)整思考方向,以及下一步需要搜什么,而且還要頻繁調(diào)用MCP、不能出錯(cuò)。
我建議大家看完視頻也這么去測試,不管是測試模型還是測試客戶端都可以。然后你就知道該怎么選了。
咱們回到DeepSeek這邊。整個(gè)推理過程花了三分多種。DeepSeek一共做了六步思考,最終給出了答案。但是我覺得下邊的要點(diǎn)還不夠詳細(xì),于是讓它進(jìn)一步完善。最終,花了0.039美金,DeepSeek完成了這個(gè)回答。
通過這兩個(gè)例子可以看出,DeepSeek新版本模型在使用MCP方面已經(jīng)沒問題了,而且價(jià)格很低。說實(shí)話,我這段時(shí)間用Claude跑MCP,已經(jīng)在API上花了十幾美金了。日常高頻使用的話,真的會(huì)肉痛。
高性價(jià)比,就是我推薦DeepSeek的原因。官方在公眾號(hào)文章里介紹了這次小版本升級。模型能力提升包括這幾個(gè)方面,比如推理任務(wù)表現(xiàn)提高、前端開發(fā)能力增強(qiáng)、中文寫作升級,等等。
其實(shí)我最看中的,以及我認(rèn)為最重要的,是工具調(diào)用能力的提升。還是之前說過的邏輯:
AI發(fā)展的兩條路徑,一是獲取更多信息,二是調(diào)用更多工具。
如果只能處理文本,搞不了多模態(tài),那么AI的世界就是黑白的。這是我看好Gemini的原因。
如果只局限于推理,用不了更多工具,那么AI就只有大腦、沒有手腳。這是我看好Claude的原因。
現(xiàn)在DeepSeek終于把工具調(diào)用能力提升上來了,疊加它本來就很強(qiáng)的成本優(yōu)勢,肯定能推動(dòng)MCP進(jìn)一步普及。
最后,說一下我對今年Agent發(fā)展的判斷:
以Dify、Coze為代表的任務(wù)編排模式會(huì)逐漸被取代。這種做法雖然精確度高,但是太費(fèi)人力,門檻也很高,而且非常限制模型的發(fā)揮,所以只適合企業(yè)生產(chǎn)環(huán)境。
我認(rèn)為,最優(yōu)解一定是:人類只需要設(shè)定起點(diǎn),也就是Context、上下文,以及終點(diǎn),也就是目標(biāo)。在起點(diǎn)和終點(diǎn)之間一切,都交給模型自由發(fā)揮。
一個(gè)超強(qiáng)的模型作為單核,搭配海量、原子化的工具,就是AI行業(yè)今年發(fā)展的重點(diǎn)。
現(xiàn)在,我們已經(jīng)有Claude和DeepSeek這樣的模型了,也有MCP這樣的中間層協(xié)議了。萬事俱備,一切都將飛速展開。





暫無評論,快來評論吧!