14張圖訓(xùn)練lora保持人物一致性,對已有ip形象作延展
瓜兮羊
發(fā)布于 云南 2025-05-30 · 5702瀏覽 1贊

        AI繪畫有一個一直困擾大家的難題——人物一致性難以保持,即在生成例如一本繪本的時候,主角形象僅能靠提示詞描述來固定住形象。但這種方式是弱固定,無法保證人物形象在每一張圖中完全不變。這是幾乎所有閉源AI繪畫軟件的時候都會遇到的一個難題。

       并且,由于閉源軟件的局限性,無法用諸如midjourney,即夢一類軟件,復(fù)刻或是延展出我們已有的,由人工設(shè)計出的ip形象。例如某公司由人工設(shè)計的ip形象,或是某本漫畫由人工繪制的ip形象。

       但深度學(xué)習(xí)領(lǐng)域的lora模型訓(xùn)練可以解決此類問題。通過收集素材圖片、調(diào)整圖片長寬比、AI提示詞反推器給每張圖片打標(biāo)、人工修改每張圖片標(biāo)簽、調(diào)整合適的參數(shù)進(jìn)行l(wèi)ora訓(xùn)練,這五大步驟。我們會得到一個lora模型,用于生成圖片。

      值得一提的是:lora訓(xùn)練全流程及用訓(xùn)練出來的lora模型生成圖片是完全免費并完全基于本地計算機(jī)的。

      以某本漫畫中的形象為例,由于素材量問題,本次訓(xùn)練僅用了14張圖片,即獲得了一個良好的lora模型,此模型具有較好的泛化性,可用性很高。

     原始素材如下:

     這里可以看到,原始素材所包含的圖片中,沒有此動漫人物的背面圖片。但通過這14張圖片訓(xùn)練出來的模型,能夠很好的推理出此動漫人物的后視圖,并延展出來了該角色吃冰淇淋、騎老虎等的圖片。同時值得注意的是,該人物的服裝,五官,發(fā)飾等細(xì)節(jié)并未發(fā)生變化。保持住了該動漫人物的個人特征。

     甚至,結(jié)合我的另外一個工作流,我生成了一個有趣的連環(huán)畫小故事“項羽馴虎記”

瓜兮羊
凌晨四點半,海棠花未眠
瀏覽 5702
1
相關(guān)推薦
最新評論
贊過的人 1
評論加載中...

暫無評論,快來評論吧!