目前,很多AI圖片生成的軟件已經(jīng)非常發(fā)達好用,但僅僅是“好看”并不足以覆蓋所有的業(yè)務場景。諸如豆包、即夢、midjourney等的軟件在AI圖片生成方面有個比較大的缺點就是,生成圖片畫面的控制,僅能夠通過提示詞及墊圖來控制。缺乏更加強有力的控制手段。
這造成的問題就是,雖然生成的圖片很精美,但是畫面的細節(jié),畫面各個部分的構圖,往往不能得到精準的控制,但使用flux模型配合CN控制,就能完美的解決這些問題。例如在做圖生圖的時候,利用CN控制的canny功能,可以提取到圖片的硬邊緣,從而使得重繪出來的圖片輪廓框架不會脫離原圖,更好的保持原圖的結構。通過depth,可以提取圖片的深度圖,用于控制圖片等等。
例如用canny模型提取了該水電站的硬邊緣:
然后再在硬邊緣圖片及原圖的雙重控制之下,可以生成風格化的圖片,這里可以看到,風格化后的圖片細節(jié)保持的很好的。
再例如,對于無需保留太多細節(jié),可以讓圖片變動比較大的情況,可以做到如下:
重繪前:
重繪后:
以上的所有工作,都是基于comfyui的,這個工作流是完全免費,并且基于本地計算機的,能夠快速的放到服務器中,通過api調用,能讓許多人使用此功能。
?著作權歸作者所有,轉載或內容合作請聯(lián)系作者





暫無評論,快來評論吧!