太快了!文生圖片只需1秒,開源SDXL Turbo來啦!
SDXL Turbo展示
11月29日,著名開源生成式AI平臺Stability.ai在官網發佈了,開源文生圖模型SDXL Turbo。
根據使用體驗,SDXL Turbo的生成圖像效率非常快,可以做到實時響應(可能小於1秒)。
在你輸入完最後一個文本後,圖像就能馬上顯示,推理效率超過了Midjourney、DALL·E 3以及Stability.ai自己開發的Stable Difusion系列模型。
天下武功,無堅不破,唯快不破,SDXL Turbo就是大模型界的“博爾特”。用風馳電掣、電光石火、疾風驟雨來形容SDXL Turbo都不過分。
「AIGC開放社區」介紹了那麼多的文生圖模型,截至目前這個是響應最快,並且生成的圖像質量非常高,精準還原提示文本的描述。
開源地址:https://github.com/Stability-AI/generative-models
在線體驗地址:https://clipdrop.co/stable-diffusion-turbo
論文地址:https://stability.ai/s/adversarial_diffusion_distillation.pdf
SDXL Turbo簡單介紹
SDXL Turbo是基於SDXL 1.0開發而成,並且使用了一種全新的對抗擴散蒸餾技術(ADD),將圖像所需的生成步驟從50減少至1—4步,並且絲毫不影響圖像質量。稍後「AIGC開放社區」會詳細介紹這篇論文。
該技術可以在高質量圖像下以1—4個步驟對大規模基礎圖像擴散模型進行採樣。使用分數蒸餾來利用大規模現成的圖像擴散模型作爲指導。
並將其與對抗網絡相結合,以確保即使在一個或兩個採樣步驟的低步驟狀態下也能確保高圖像保真度,同時避免了其他蒸餾方法中常見的失真或模糊問題。
SDXL Turbo實驗數據
爲了測試SDXL Turbo的性能,Stability.ai使用相同的文本提示,與StyleGAN-T++,OpenMUSE,IF-XL,SDXL和LCM-XL等不同版本的文生圖模型進行了比較。
測試結果顯示,SDXL Turbo只用一個生成步驟,就擊敗了LCM-XL的4步驟生成的圖像,以及擊敗了SDXL通過50個步驟生成的圖像。
雖然SDXL Turbo功能很強,也有一些侷限性。Stability.ai表示,目前SDXL Turbo只能用於學術研究,稍後會開放商業權限。
此外,SDXL Turbo只能生成512x512固定像素的圖片,對一些細節可能表現的不夠好,例如,人的手指、面部表情等,無法完美的展現照片級真實感。
但SDXL Turbo對擴散模型的生成效率、質量實現了重大技術突破,可以幫助中小型企業以更低的成本來進行部署使用。
本文素材來源Stability.ai官網,如有侵權請聯繫刪除