對于大模型問答,為什么會同樣的內(nèi)容,多次問答出現(xiàn)不同的結(jié)論呢?
在基于大模型的應(yīng)用中,這是非常常見且核心的挑戰(zhàn),主要源于大模型的隨機(jī)性或稱創(chuàng)造性。
主要原因是因為大模型生成文本的過程本質(zhì)上是基于概率的。
通常會有以下幾個因素會對隨機(jī)性產(chǎn)生影響:
1.關(guān)鍵參數(shù):溫度(Temperature):
Temperature 是一個決定模型在選擇下一個詞時,對詞語概率分布進(jìn)行平滑的參數(shù)。
也就是說每次回答時模型內(nèi)部會計算出每個候選詞的概率,而溫度參數(shù)會放大或縮小高概率詞和低概率詞之間的權(quán)重,從而改變最終被采樣的概率分布。
溫度高: 模型在選擇下一個詞時,會考慮更多可能性較低的詞語,回答會更創(chuàng)造性、更發(fā)散,但隨機(jī)性也更高,更容易出現(xiàn)不一致的結(jié)論。
溫度低: 模型會傾向于選擇概率最高的詞語,回答會確定、更機(jī)械,隨機(jī)性大大降低,但可能缺乏靈活性。
舉例來說,假設(shè)現(xiàn)在需要生成“結(jié)論是...”后面的詞,模型計算出所有可能詞的原始概率分布如下(從高到低):
高度 0.60 、明確 0.20 、令人 0.10 、這份 0.05 、香蕉 0.01
如果將溫度設(shè)為0.1,那么經(jīng)調(diào)整后的 采樣概率 從高到低變?yōu)椋?/span>
高度 0.98(被極大增強(qiáng))、明確 0.01(被極大抑制)、令人 0.005、其他詞趨近于0
那么導(dǎo)致結(jié)果就是模型幾乎每次回答,結(jié)果后面都會選擇概率最高的詞“高度”。
如果將溫度設(shè)為1,那么經(jīng)調(diào)整后的 采樣概率 變?yōu)椋?/span>
高度 0.35(被稀釋)、明確 0.25、令人 0.15、這份 0.10、香蕉0.05 (被放大)
概率差異被大大抹平。 即使在原始語境下不合邏輯的詞,被選中的概率也被提高。這就會導(dǎo)致輸出的結(jié)果會非常多樣,甚至可能出現(xiàn)邏輯錯誤。
2.其他影響參數(shù) Top K (Top-k Sampling)和Top P
它們通常配合溫度進(jìn)行控制。
Top K 限制模型只從概率最高的 K 個詞中進(jìn)行采樣。
Top P 限制模型只從累積概率達(dá)到 P 的最小詞集中進(jìn)行采樣。
還是上面的例子,如果設(shè)置K=1,那么模型生成時只會考慮概率最高的 1 個詞“高度”。效果與只設(shè)置 溫度=0 相似。
如果K=3,那么模型生成時會考慮概率最高的3個詞(高度、明確、令人)。即使此時溫度=0.1,模型生成時也會從這 3 個詞中根據(jù) 的溫度權(quán)重進(jìn)行選擇。
如果P=0.8僅考慮累積概率達(dá)到 0.8的詞集,即高度、明確。(注:累計概率是指可能性排序由高到低的詞語,將其概率依次累加后≤0.8的詞語集合)
如果P=1則會考慮所有詞,效果等同于不做限制。
3.指令Prompt優(yōu)化
屬于軟性限制,是指通過系統(tǒng)指令來給模型設(shè)立清晰的行為邊界和輸出規(guī)則。
可以從風(fēng)格、格式、禁止推測等方式來降低回答的隨機(jī)性(反之為增加隨機(jī)性)。
風(fēng)格可約束模型避免創(chuàng)造性或主觀推測,格式限制確保每次輸出的結(jié)構(gòu)一致性,禁止推測則能消除因信息缺失而導(dǎo)致的隨機(jī)發(fā)揮。
4.知識庫RAG優(yōu)化
這屬于數(shù)據(jù)基礎(chǔ),如果使用了 RAG,知識庫內(nèi)容的質(zhì)量直接影響模型的穩(wěn)定性。
可以從內(nèi)容和結(jié)構(gòu)兩個方面去優(yōu)化。
通過內(nèi)容去重檢查并刪除知識庫中矛盾或重復(fù)的表述,避免模型檢索到相互沖突的信息而產(chǎn)生隨機(jī)結(jié)論。
通過結(jié)構(gòu)化對于關(guān)鍵數(shù)據(jù)、標(biāo)準(zhǔn)、流程,使用列表、表格或簡短點句替代長篇大論。使模型能更容易、更穩(wěn)定地提取關(guān)鍵信息。
應(yīng)用舉例
1.極端確定性場景
目標(biāo): 結(jié)論不能有任何變化,例如:分類判斷、數(shù)據(jù)提取、代碼生成
建議參數(shù)設(shè)置:Temperature = 0;Top P、Top K 保持默認(rèn)或不設(shè)
指令要點:強(qiáng)制輸出格式
2.高確定性,低隨機(jī)性場景(要求結(jié)果有一定的嚴(yán)謹(jǐn)性)
目標(biāo): 結(jié)果必須基于事實,但可以接受語言表達(dá)上細(xì)微的潤色
建議參數(shù)設(shè)置:Temperature = 0.1 ~ 0.3;Top P=0.8
指令要點:做風(fēng)格約束和輸出格式限制
3.適度隨機(jī)性場景
目標(biāo): 需要保持一定的創(chuàng)造性和流暢性,但不能跑題
建議參數(shù)設(shè)置:Temperature = 0.5 ~ 0.7;Top P=0.9
指令要點:只做重點限制





暫無評論,快來評論吧!