SD原班人馬出品 超強文字生成圖片模型FLUX.1:沒畸形手指問題
在開源的文生圖模型領域,Stable Diffusion模型一直處於領先地位,哪怕公司經歷過一段動盪,也還是開源了Stable Diffusion 3模型,雖然效果一般,但還是未來可期的,不過隨着FLUX.1模型的發布,這個最強開源文生圖模型的頭銜,可能要易主了。
FLUX.1模型,是由Stable Diffusion原班人馬成立的新工作室——黑森林工作室推出,也就是從Stable Diffusion公司Stability離職的成員組成,可以說FLUX模型就是對Stable Diffusion模型發起的挑戰,給前東家狠狠的來上兩巴掌。
那麼FLUX.1模型有什麼特點呢,首先第一個,圖像質量增強,拉近了和最強文生圖軟件Midjourney的距離,但這款是閉源軟件,和開源模型還是有點不公平的。第二個特點呢,是手部細節的優化與增強,比起Stable Diffusion模型的畸形手指,FLUX.1模型要正常得多。
然後還有關鍵詞語義理解準確性的增強,也就是能理解一段話的內容,更能準確的生成出文字描述的圖片,不需要單個單個的提示詞。其次就是生圖速度變得更快了,但是由於配置需求最低的模型都需要16GB的顯存起步,只是消費級顯卡的話,很難體驗到生圖速度變快。
目前FLUX.1放出的模型版本有專業版、開發者版、快速版三種模型,開發者版本已經超過了SD3-Ultra,整體表現可以說是目前最強開源,當然數據不能完整說明這個模型的特點,下面會列舉一些圖片進行舉例。
FLUX官網有放出一些示例圖,可以看出人物動作很擬真,同樣的也支持和SD3模型一樣的,目前可以識別英文,並完整顯現在圖片中,而且圖片形式也有不同風格,可以是現實風格,也能是卡通風格。
生成的風景畫基本能做到和現實沒什麼差別,不認真辨別的話很難猜出來是由AI生成的圖片。
二次元畫風也不在話下,可以說FLUX.1模型從推出就有着比SD3要好不少的表現。
想要體驗的同學,FLUX.1模型已在官網推出了3款開源鏈接,第一個FLUX.1PRO,是最好的版本,但無法下載到本地,僅支持調用API,第二個是FLUX.1Dev,是支持下載的開源模型,但不可以商用化,如果你的顯卡擁有16GB顯存,那麼就可以下載這一版原模型,第三個是FLUX.1Schnell,支持下載,在Apache2.0許可下可商用,個人體驗下載Dev版即可,目前該模型只支持ComfyUI,並且需要將內核更新至最新版,不要忘記哦。
那麼如果你的顯卡不夠,可以去下載經過網友精簡的FP8模型,大小僅有原模型的一半,且顯卡的顯存需求會降低至8GB起步。
延伸閱讀:智能手機正式走進OLED時代 出貨量飆升50% 今年三星將有大增長(點擊連結看全文)
【本文獲「中關村在線」授權轉載。】