2024年8月に登場した新しい画像生成AI「Flux.1」は、そのリアルな人間の描写能力で注目を集めています。Stable Diffusionの開発者たちによって設立されたBlack Forest Labsが開発したこのAIは、特に高品質な画像生成能力と多様な出力が特徴です。本記事では、Fluxの使い方やその特性を詳しく解説し、人気の画像生成AI「Midjourney」との比較も行います。
Midjourneyの全貌については以下の記事をご覧ください。
【画像生成最強卍】Midjourneyとは?使い方まとめ!無料版は復活するのか?
この記事はこんな人におすすめ
・AIっぽくならない画像生成AIツールを探している
・Midjourneyに課金しようか悩んでいる
・Flux.1の使い方を知りたい
Flux.1とは
Fluxより引用
Flux.1は、Black Forest Labsが開発した最新の画像生成AIで、テキストから画像を生成する能力を持っています。FLUX.1の開発元、Black Forest Labsは3,100万ドルのシリーズシード資金調達を完了しました。米国を代表するトップクラスのVC、Andreessen Horowitz氏が主導し、著名なAI専門家やエンジェル投資家が参加。General CatalystとMätchVCから追加投資も獲得しました。
Fluxは、120億パラメータを持つモデルであり、3つのバリエーションモデルが提供されています。それぞれのモデルは、利用者のニーズに応じて異なる特性を持っています。
各特徴は以下の通りです。
FLUX.1 [pro]
FLUX.1 [pro]で作成された画像
- 商用利用が可能な最高性能モデルで、APIを通じて提供されています。プロンプトの追従性やビジュアルクオリティ、画像のディテールにおいて最先端のパフォーマンスを発揮します。FLUX.1 Proは、FLUX.1シリーズの最高峰モデルです。
入力プロンプトを忠実に再現し、美しく繊細な画像を生成します。API、Replicate、fal.ai経由で利用可能で、高速かつ高品質な画像生成が特徴です。GitHubアカウントが必要となりますが、プロフェッショナルな用途に最適な選択肢です。
FLUX.1 [dev]
FLUX.1 [dev]で作成された画像
- 非商用向けのオープンウェイトモデルで、Proと同等の品質を持ちつつ、効率的な画像生成が可能です。FLUX.1 Proからガイダンス蒸留バリアントされており、Proと同等の品質と忠実なプロンプト再現能力を持ちつつ、より効率的に画像を生成します。Hugging Face、Replicate、fal.ai経由で使用でき、高速で高品質な画像生成が可能です。
FLUX.1 [schnell]
- 最速で個人利用に適したモデルで、latent adversarial diffusion distillationにより高品質なイメージを迅速に生成することができます。
ローカル環境での使用および個人開発向けに最適化されています。ステップ蒸留とガイダンス蒸留技術を採用し、画像生成プロセスを少ないステップ数で行えるよう最適化されています。Hugging Faceで利用可能で、高速性を重視する開発者に適しています。
Flux.1のすごさは?
Fluxより引用
FLUX.1は、テキストから画像を生成するAIモデルの新しいスイートで、画像の詳細さ、プロンプトへの忠実性、スタイルの多様性、複雑なシーン構築において、新たな基準を打ち立てています。
この画像は、FLUX.1の性能を示すグラフです。緑から紫へのグラデーションで表された複数の棒グラフは、異なる評価基準または比較対象を表していると推測されます。最も高い緑の棒がFLUX.1を、その他の棒が競合するAIモデルを表しています。
DALLE3やMidjourneyを抜いて一位に君臨しています。
Fluxより引用
上記画像は以下の5つの性能差を比較したものです。
多彩な能力: FLUX.1は5つの重要な点で優れています:
- きれいな画像を作る
- 指示通りの画像を作る
- 様々な大きさや形の画像を作れる
- 文字をうまく扱える
- 多様な画像を作り出せる
図の緑色の線がFLUX.1を表しています。この線が他の色(他のAI)よりも外側に広がっているので、FLUX.1が全体的に優れていることが分かります。
Flux.1の使い方
ウェブ上で試す方法とパソコン上で試す方法の2種類があります。ウェブ上で試す方が圧倒的に簡単なので、今回はウェブ上での使い方を実際に行いながら説明いたします。
一番簡単なのが「Hugging Face Space」です。FLUX.1 [dev]のモデルを使って画像作成していきます。
Hugging Face Spaceにアクセスします。
以下の画面が出てきます。実際にプロンプトを入れてみましょう。
プロンプトを入れたら「Run」を押下すると画像生成が始まります。
「Chihuahua is traveling in space(チワワが宇宙旅行をしている)」と入れてみました。
できました!リアルだし、シチュエーションも完璧!
下の「Advanced Settings」を押下すると細かいサイズ設定などができます。
Fluxの「Advanced Settings」でできることは以下の通りです。
設定項目 | 設定値/範囲 | 説明 |
---|---|---|
Seed | 0 – [最大値不明] | 画像生成の初期値。同じSeedを使用すると同じ結果が得られる。 |
Randomize seed | チェックボックス | オンにするとSeedがランダムに設定される。 |
Width | 1024 (スライダーで調整可能) | 生成される画像の幅。 |
Height | 1024 (スライダーで調整可能) | 生成される画像の高さ。 |
Guidance Scale | 3.5 (スライダーで調整可能) | プロンプトに対する画像の忠実度。値が高いほどプロンプトに忠実な画像が生成される。 |
Number of inference steps | 28 (スライダーで調整可能) | 画像生成の反復回数。多いほど詳細な画像が生成されるが、処理時間も長くなる。 |
MidjourneyとFlux.1を比較してみた。
実際に同じ条件でどんな画像ができるのかを以下のプロンプトで比較してみました。
A subculture Japanese woman wearing headphones and listening to music
(ヘッドフォンをして音楽を聴いているサブカルな日本人女性)
まずはFlux.1(FLUX.1 [dev]のモデルを使用)
MidjourneyのV6.1モデルを使用
正直同じ条件で出てきた画像を比較すると「Midjourney」に軍配が上がると思います。
どうしてもFLUX.1ではアジア人の作成が不得意なんでしょう。肌のつやがAI感をぬぐえません。それでも無料で使う分には十分でしょう。
※Midjourneyv6.1は最新モデルであり、FLUX.1との検証比較はv6.0でした。
実際にアジア人以外での比較もしてみました。左がFLUX、右がMidjourneyです。
こうなるとどっちもクオリティ高すぎますねwwもうAIなのかわからない。すごい。
Flux.1は商用利用可能?
Fluxは各モデルごとに使用範囲が異なります。以下の通りです。
バージョン | 特徴 | アクセス方法 | 商用利用 | 私的使用 | 備考 |
---|---|---|---|---|---|
FLUX.1 pro | 最高性能モデル | API(レート制限あり) | ⭕ | ⭕ | 課金制、モデル非公開 |
FLUX.1 dev | 標準モデル | ほぼ無制限で使用可能 | ❌ | ⭕ | 非商用ライセンス、モデル公開 |
FLUX.1 schnell | 高速生成(devの約5倍速) | ほとんど制限なし | ⭕ | ⭕ | Apache License 2.0、モデル公開 |
Flux.1は無料?
Flux.1は、Hugging FaceやReplicate、fal.aiを通じてオンラインで利用可能です。Hugging Faceではログイン不要で試すことができ、Replicateやfal.aiではGithubアカウントでのログインが必要です。特にfal.aiは無料で利用できる枠が多く、コストを抑えたいユーザーにとって魅力的です。
ただし、API経由で画像を生成する場合、1枚あたり約8円のコストが発生します。
API経由で画像を生成する場合、1枚あたり約8円のコストが発生
Flux.1 まとめ
Flux.1は、画像生成AIとして多様なニーズに応えることができるツールです。特にリアルな人物画像の生成においては、Midjourneyに匹敵するクオリティを持ち、APIの利用が可能である点が大きな利点です。ユーザーの目的に応じて、どちらのツールを選ぶかを慎重に検討することが重要です。Flux.1の登場により、画像生成AIの選択肢がさらに広がり、クリエイティブな表現の可能性が拡大しています。
趣味:業務効率化、RPA、AI、サウナ、音楽
職務経験:ECマーチャンダイザー、WEBマーケティング、リードナーチャリング支援
所有資格:Google AI Essentials,HubSpot Inbound Certification,HubSpot Marketing Software Certification,HubSpot Inbound Sales Certification
▼書籍掲載実績
Chrome拡張×ChatGPTで作業効率化/工学社出版
保護者と教育者のための生成AI入門/工学社出版(【全国学校図書館協議会選定図書】)
突如、社内にて資料100件を毎月作ることとなり、何とかサボれないかとテクノロジー初心者が業務効率化にハマる。AIのスキルがない初心者レベルでもできる業務効率化やAIツールを紹介。中の人はSEO歴5年、HubSpot歴1年