大模型回答隨機(jī)性的影響因素
ll飛行日記
發(fā)布于 云南 2025-12-25 · 1925瀏覽 1贊

 對(duì)于大模型問(wèn)答,為什么會(huì)同樣的內(nèi)容,多次問(wèn)答出現(xiàn)不同的結(jié)論呢? 

在基于大模型的應(yīng)用中,這是非常常見(jiàn)且核心的挑戰(zhàn),主要源于大模型的隨機(jī)性或稱(chēng)創(chuàng)造性。

主要原因是因?yàn)榇竽P蜕晌谋镜倪^(guò)程本質(zhì)上是基于概率的。

 

通常會(huì)有以下幾個(gè)因素會(huì)對(duì)隨機(jī)性產(chǎn)生影響:

1.關(guān)鍵參數(shù):溫度(Temperature):

Temperature 是一個(gè)決定模型在選擇下一個(gè)詞時(shí),對(duì)詞語(yǔ)概率分布進(jìn)行平滑的參數(shù)。

也就是說(shuō)每次回答時(shí)模型內(nèi)部會(huì)計(jì)算出每個(gè)候選詞的概率,而溫度參數(shù)會(huì)放大或縮小高概率詞和低概率詞之間的權(quán)重,從而改變最終被采樣的概率分布。

溫度高: 模型在選擇下一個(gè)詞時(shí),會(huì)考慮更多可能性較低的詞語(yǔ),回答會(huì)更創(chuàng)造性、更發(fā)散,但隨機(jī)性也更高,更容易出現(xiàn)不一致的結(jié)論。

溫度低: 模型會(huì)傾向于選擇概率最高的詞語(yǔ),回答會(huì)確定、更機(jī)械,隨機(jī)性大大降低,但可能缺乏靈活性。

 

舉例來(lái)說(shuō),假設(shè)現(xiàn)在需要生成“結(jié)論是...”后面的詞,模型計(jì)算出所有可能詞的原始概率分布如下(從高到低):

高度  0.60  、明確  0.20  、令人  0.10  、這份  0.05  、香蕉  0.01  

如果將溫度設(shè)為0.1,那么經(jīng)調(diào)整后的 采樣概率 從高到低變?yōu)椋?/span>

高度 0.98(被極大增強(qiáng))、明確 0.01(被極大抑制)、令人 0.005、其他詞趨近于0

那么導(dǎo)致結(jié)果就是模型幾乎每次回答,結(jié)果后面都會(huì)選擇概率最高的詞“高度”。

 

如果將溫度設(shè)為1,那么經(jīng)調(diào)整后的 采樣概率 變?yōu)椋?/span>

高度  0.35(被稀釋)、明確 0.25、令人 0.15、這份 0.10、香蕉0.05 (被放大)

概率差異被大大抹平。 即使在原始語(yǔ)境下不合邏輯的詞,被選中的概率也被提高。這就會(huì)導(dǎo)致輸出的結(jié)果會(huì)非常多樣,甚至可能出現(xiàn)邏輯錯(cuò)誤。


 

2.其他影響參數(shù) Top K (Top-k Sampling)和Top P

它們通常配合溫度進(jìn)行控制。

Top K 限制模型只從概率最高的 K 個(gè)詞中進(jìn)行采樣。

Top P 限制模型只從累積概率達(dá)到 P 的最小詞集中進(jìn)行采樣。

 

還是上面的例子,如果設(shè)置K=1,那么模型生成時(shí)只會(huì)考慮概率最高的 1 個(gè)詞“高度”。效果與只設(shè)置 溫度=0 相似。

如果K=3,那么模型生成時(shí)會(huì)考慮概率最高的3個(gè)詞(高度、明確、令人)。即使此時(shí)溫度=0.1,模型生成時(shí)也會(huì)從這 3 個(gè)詞中根據(jù) 的溫度權(quán)重進(jìn)行選擇。

如果P=0.8僅考慮累積概率達(dá)到 0.8的詞集,即高度、明確。(注:累計(jì)概率是指可能性排序由高到低的詞語(yǔ),將其概率依次累加后≤0.8的詞語(yǔ)集合)

如果P=1則會(huì)考慮所有詞,效果等同于不做限制。


 

3.指令Prompt優(yōu)化

屬于軟性限制,是指通過(guò)系統(tǒng)指令來(lái)給模型設(shè)立清晰的行為邊界和輸出規(guī)則。

可以從風(fēng)格、格式、禁止推測(cè)等方式來(lái)降低回答的隨機(jī)性(反之為增加隨機(jī)性)。

風(fēng)格可約束模型避免創(chuàng)造性或主觀(guān)推測(cè),格式限制確保每次輸出的結(jié)構(gòu)一致性,禁止推測(cè)則能消除因信息缺失而導(dǎo)致的隨機(jī)發(fā)揮。


 

4.知識(shí)庫(kù)RAG優(yōu)化

這屬于數(shù)據(jù)基礎(chǔ),如果使用了 RAG,知識(shí)庫(kù)內(nèi)容的質(zhì)量直接影響模型的穩(wěn)定性。

可以從內(nèi)容和結(jié)構(gòu)兩個(gè)方面去優(yōu)化。

通過(guò)內(nèi)容去重檢查并刪除知識(shí)庫(kù)中矛盾或重復(fù)的表述,避免模型檢索到相互沖突的信息而產(chǎn)生隨機(jī)結(jié)論。

通過(guò)結(jié)構(gòu)化對(duì)于關(guān)鍵數(shù)據(jù)、標(biāo)準(zhǔn)、流程,使用列表、表格或簡(jiǎn)短點(diǎn)句替代長(zhǎng)篇大論。使模型能更容易、更穩(wěn)定地提取關(guān)鍵信息。


 

 應(yīng)用舉例 

1.極端確定性場(chǎng)景

目標(biāo): 結(jié)論不能有任何變化,例如:分類(lèi)判斷、數(shù)據(jù)提取、代碼生成

建議參數(shù)設(shè)置:Temperature = 0;Top P、Top K 保持默認(rèn)或不設(shè)

指令要點(diǎn):強(qiáng)制輸出格式

 

2.高確定性,低隨機(jī)性場(chǎng)景(要求結(jié)果有一定的嚴(yán)謹(jǐn)性)

目標(biāo): 結(jié)果必須基于事實(shí),但可以接受語(yǔ)言表達(dá)上細(xì)微的潤(rùn)色

建議參數(shù)設(shè)置:Temperature = 0.1 ~ 0.3;Top P=0.8

指令要點(diǎn):做風(fēng)格約束和輸出格式限制

 

3.適度隨機(jī)性場(chǎng)景

目標(biāo): 需要保持一定的創(chuàng)造性和流暢性,但不能跑題

建議參數(shù)設(shè)置:Temperature = 0.5 ~ 0.7;Top P=0.9

指令要點(diǎn):只做重點(diǎn)限制

ll飛行日記
低空飛行~
瀏覽 1925
1
相關(guān)推薦
最新評(píng)論
贊過(guò)的人 1
評(píng)論加載中...

暫無(wú)評(píng)論,快來(lái)評(píng)論吧!