亚洲久久短篇小说,人人噜人人噜啊啊啊久久

Intel Core Ultra 如何使用GPU推理

發(fā)布于云南 2025-03-31 · 2036瀏覽 1贊

最近兩年的新筆記本CPU都使用Intel Core Ultra系列，這個(gè)本子大多是輕薄本，好像是英特爾搞的什么AIPC的戰(zhàn)略，但是實(shí)際用下來，在很多場(chǎng)景下可能還不如上一代的CPU，最難評(píng)的就是這個(gè)NPU的使用場(chǎng)景不明確，完全沒用。但是這個(gè)CPU的集成顯卡貌似比上一代提升很大，就嘗試一下這個(gè)GPU的速度。

ipex-llm 是英特爾團(tuán)隊(duì)開發(fā)的一個(gè)本地大語言模型推理加速框架，主要用于 Intel GPU（集成顯卡）和 I 卡運(yùn)行大語言模型，目前已經(jīng)支持大多數(shù)主流 AI 大模型。ipex-llm 專門針對(duì) Ollama 優(yōu)化出了一個(gè)免安裝版本，直接下載就能用，而且上線了魔搭社區(qū)，下載也超快，魔搭社區(qū)模型庫搜索關(guān)鍵詞：Ollama 英特爾優(yōu)化版。

Ollama 英特爾優(yōu)化版在如下設(shè)備上進(jìn)行了驗(yàn)證:

Intel Core Ultra 處理器
Intel Core 第 11 至第 14 代處理器
Intel Arc A 系列 GPU
Intel Arc B 系列 GPU

一通安裝，接下來就實(shí)測(cè)

直接ollama run --verbose deepseek-r1:14b，因?yàn)槭羌@，所以顯存和內(nèi)存是公用的，windows的策略應(yīng)該是內(nèi)存和共享顯存是1：1的，我這個(gè)本子32G內(nèi)存，所以理論上有16G顯存，實(shí)際有15.8G，下圖是開始推理后的GPU占用情況，14b大概占用了12G的顯存

下圖是token情況，每秒7.x的token，體驗(yàn)還可以，而且由上圖可見GPU跑滿了，CPU不高，比純CPU跑確實(shí)是快很多

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者

番茄雞蛋少點(diǎn)蛋

這人不懶，什么都沒留下~

贊 1

相關(guān)推薦

最新評(píng)論

贊過的人 1

評(píng)論加載中...

暫無評(píng)論，快來評(píng)論吧!

国內一级黄色视频|少妇91导航日韩第一页久久|黄色三A视频色爽网站|亚洲精品 无码一区二区在直播间|成人高清国产无码|aaa成人免费视频|国产一级一片免费播放放a|我要看免费的毛片|动漫a片免费观看|日韩欧美国产视频

国內一级黄色视频|少妇91导航日韩第一页久久|黄色三A视频色爽网站|亚洲精品无码一区二区在直播间|成人高清国产无码|aaa成人免费视频|国产一级一片免费播放放a|我要看免费的毛片|动漫a片免费观看|日韩欧美国产视频