大模型回答隨機(jī)性的影響因素
ll飛行日記
發(fā)布于 云南 2025-12-25 · 1207瀏覽 1贊

 對于大模型問答,為什么會同樣的內(nèi)容,多次問答出現(xiàn)不同的結(jié)論呢? 

在基于大模型的應(yīng)用中,這是非常常見且核心的挑戰(zhàn),主要源于大模型的隨機(jī)性或稱創(chuàng)造性。

主要原因是因為大模型生成文本的過程本質(zhì)上是基于概率的。

 

通常會有以下幾個因素會對隨機(jī)性產(chǎn)生影響:

1.關(guān)鍵參數(shù):溫度(Temperature):

Temperature 是一個決定模型在選擇下一個詞時,對詞語概率分布進(jìn)行平滑的參數(shù)。

也就是說每次回答時模型內(nèi)部會計算出每個候選詞的概率,而溫度參數(shù)會放大或縮小高概率詞和低概率詞之間的權(quán)重,從而改變最終被采樣的概率分布。

溫度高: 模型在選擇下一個詞時,會考慮更多可能性較低的詞語,回答會更創(chuàng)造性、更發(fā)散,但隨機(jī)性也更高,更容易出現(xiàn)不一致的結(jié)論。

溫度低: 模型會傾向于選擇概率最高的詞語,回答會確定、更機(jī)械,隨機(jī)性大大降低,但可能缺乏靈活性。

 

舉例來說,假設(shè)現(xiàn)在需要生成“結(jié)論是...”后面的詞,模型計算出所有可能詞的原始概率分布如下(從高到低):

高度  0.60  、明確  0.20  、令人  0.10  、這份  0.05  、香蕉  0.01  

如果將溫度設(shè)為0.1,那么經(jīng)調(diào)整后的 采樣概率 從高到低變?yōu)椋?/span>

高度 0.98(被極大增強(qiáng))、明確 0.01(被極大抑制)、令人 0.005、其他詞趨近于0

那么導(dǎo)致結(jié)果就是模型幾乎每次回答,結(jié)果后面都會選擇概率最高的詞“高度”。

 

如果將溫度設(shè)為1,那么經(jīng)調(diào)整后的 采樣概率 變?yōu)椋?/span>

高度  0.35(被稀釋)、明確 0.25、令人 0.15、這份 0.10、香蕉0.05 (被放大)

概率差異被大大抹平。 即使在原始語境下不合邏輯的詞,被選中的概率也被提高。這就會導(dǎo)致輸出的結(jié)果會非常多樣,甚至可能出現(xiàn)邏輯錯誤。


 

2.其他影響參數(shù) Top K (Top-k Sampling)和Top P

它們通常配合溫度進(jìn)行控制。

Top K 限制模型只從概率最高的 K 個詞中進(jìn)行采樣。

Top P 限制模型只從累積概率達(dá)到 P 的最小詞集中進(jìn)行采樣。

 

還是上面的例子,如果設(shè)置K=1,那么模型生成時只會考慮概率最高的 1 個詞“高度”。效果與只設(shè)置 溫度=0 相似。

如果K=3,那么模型生成時會考慮概率最高的3個詞(高度、明確、令人)。即使此時溫度=0.1,模型生成時也會從這 3 個詞中根據(jù) 的溫度權(quán)重進(jìn)行選擇。

如果P=0.8僅考慮累積概率達(dá)到 0.8的詞集,即高度、明確。(注:累計概率是指可能性排序由高到低的詞語,將其概率依次累加后≤0.8的詞語集合)

如果P=1則會考慮所有詞,效果等同于不做限制。


 

3.指令Prompt優(yōu)化

屬于軟性限制,是指通過系統(tǒng)指令來給模型設(shè)立清晰的行為邊界和輸出規(guī)則。

可以從風(fēng)格、格式、禁止推測等方式來降低回答的隨機(jī)性(反之為增加隨機(jī)性)。

風(fēng)格可約束模型避免創(chuàng)造性或主觀推測,格式限制確保每次輸出的結(jié)構(gòu)一致性,禁止推測則能消除因信息缺失而導(dǎo)致的隨機(jī)發(fā)揮。


 

4.知識庫RAG優(yōu)化

這屬于數(shù)據(jù)基礎(chǔ),如果使用了 RAG,知識庫內(nèi)容的質(zhì)量直接影響模型的穩(wěn)定性。

可以從內(nèi)容和結(jié)構(gòu)兩個方面去優(yōu)化。

通過內(nèi)容去重檢查并刪除知識庫中矛盾或重復(fù)的表述,避免模型檢索到相互沖突的信息而產(chǎn)生隨機(jī)結(jié)論。

通過結(jié)構(gòu)化對于關(guān)鍵數(shù)據(jù)、標(biāo)準(zhǔn)、流程,使用列表、表格或簡短點句替代長篇大論。使模型能更容易、更穩(wěn)定地提取關(guān)鍵信息。


 

 應(yīng)用舉例 

1.極端確定性場景

目標(biāo): 結(jié)論不能有任何變化,例如:分類判斷、數(shù)據(jù)提取、代碼生成

建議參數(shù)設(shè)置:Temperature = 0;Top P、Top K 保持默認(rèn)或不設(shè)

指令要點:強(qiáng)制輸出格式

 

2.高確定性,低隨機(jī)性場景(要求結(jié)果有一定的嚴(yán)謹(jǐn)性)

目標(biāo): 結(jié)果必須基于事實,但可以接受語言表達(dá)上細(xì)微的潤色

建議參數(shù)設(shè)置:Temperature = 0.1 ~ 0.3;Top P=0.8

指令要點:做風(fēng)格約束和輸出格式限制

 

3.適度隨機(jī)性場景

目標(biāo): 需要保持一定的創(chuàng)造性和流暢性,但不能跑題

建議參數(shù)設(shè)置:Temperature = 0.5 ~ 0.7;Top P=0.9

指令要點:只做重點限制

ll飛行日記
低空飛行~
瀏覽 1207
1
相關(guān)推薦
最新評論
贊過的人 1
評論加載中...

暫無評論,快來評論吧!