これは公式の安定版ディフュージョンリポジトリ compVis/安定版 Diffusion に基づいています。オープンソースのウェイトを直接読み込めるように、モデル構造は同じままにしました。この実装にはトレーニングコードは含まれていません。
promptart.labml.aiに安定した拡散ベースの画像生成サービスを展開しました
コアは潜在拡散モデルです。以下で構成されています。
また、(オプションで)フラッシュアテンションをU-Netアテンションに統合しました。これにより、RTX A6000 GPUのパフォーマンスを50%近くスピードアップできます。
画像生成スクリプトは次のとおりです。
util.py
ユーティリティ関数を定義します。