【Midjourney比較】画像生成AI「Flux.1」がマジでリアル人間!使い方を解説 | AI-ワークスタイルlAIツールで仕事を効率化させるAIメディア
CONTACT US
内容に広告・プロモーションを含みます

【Midjourney比較】画像生成AI「Flux.1」がマジでリアル人間!使い方を解説

画像生成

2024年8月に登場した新しい画像生成AI「Flux.1」は、そのリアルな人間の描写能力で注目を集めています。Stable Diffusionの開発者たちによって設立されたBlack Forest Labsが開発したこのAIは、特に高品質な画像生成能力と多様な出力が特徴です。本記事では、Fluxの使い方やその特性を詳しく解説し、人気の画像生成AI「Midjourney」との比較も行います。

Midjourneyの全貌については以下の記事をご覧ください。

【画像生成最強卍】Midjourneyとは?使い方まとめ!無料版は復活するのか?

この記事はこんな人におすすめ

・AIっぽくならない画像生成AIツールを探している
・Midjourneyに課金しようか悩んでいる
・Flux.1の使い方を知りたい

Flux.1とは

Fluxより引用

Flux.1は、Black Forest Labsが開発した最新の画像生成AIで、テキストから画像を生成する能力を持っています。FLUX.1の開発元、Black Forest Labsは3,100万ドルのシリーズシード資金調達を完了しました。米国を代表するトップクラスのVC、Andreessen Horowitz氏が主導し、著名なAI専門家やエンジェル投資家が参加。General CatalystとMätchVCから追加投資も獲得しました。

Fluxは、120億パラメータを持つモデルであり、3つのバリエーションモデルが提供されています。それぞれのモデルは、利用者のニーズに応じて異なる特性を持っています。

各特徴は以下の通りです。

FLUX.1 Pro
🏆
最高モデル。美しさと繊細さが特徴。
🚀高速で高品質な画像生成
🔗API、Replicate、fal.ai経由で利用可能
FLUX.1 dev
💻
非商用モデル。Proと同等の品質を効率的に実現。
Proより効率的な画像生成
🌐Hugging Face、Replicate、fal.aiで利用可能
FLUX.1 schnell
🏎️
最速モデル。ローカル環境・個人開発向け。
⏱️ステップ蒸留で高速化
🧠ガイダンス蒸留でモデルサイズ縮小

FLUX.1 [pro]

FLUX.1 [pro]で作成された画像
  • 商用利用が可能な最高性能モデルで、APIを通じて提供されています。プロンプトの追従性やビジュアルクオリティ、画像のディテールにおいて最先端のパフォーマンスを発揮します。FLUX.1 Proは、FLUX.1シリーズの最高峰モデルです。

    入力プロンプトを忠実に再現し、美しく繊細な画像を生成します。API、Replicate、fal.ai経由で利用可能で、高速かつ高品質な画像生成が特徴です。GitHubアカウントが必要となりますが、プロフェッショナルな用途に最適な選択肢です。

FLUX.1 [dev]

FLUX.1 [dev]で作成された画像
  • 非商用向けのオープンウェイトモデルで、Proと同等の品質を持ちつつ、効率的な画像生成が可能です。FLUX.1 Proからガイダンス蒸留バリアントされており、Proと同等の品質と忠実なプロンプト再現能力を持ちつつ、より効率的に画像を生成します。Hugging Face、Replicate、fal.ai経由で使用でき、高速で高品質な画像生成が可能です。

FLUX.1 [schnell]

  • 最速で個人利用に適したモデルで、latent adversarial diffusion distillationにより高品質なイメージを迅速に生成することができます。

    ローカル環境での使用および個人開発向けに最適化されています。ステップ蒸留とガイダンス蒸留技術を採用し、画像生成プロセスを少ないステップ数で行えるよう最適化されています。Hugging Faceで利用可能で、高速性を重視する開発者に適しています。

Flux.1のすごさは?

Fluxより引用

FLUX.1は、テキストから画像を生成するAIモデルの新しいスイートで、画像の詳細さ、プロンプトへの忠実性、スタイルの多様性、複雑なシーン構築において、新たな基準を打ち立てています。

この画像は、FLUX.1の性能を示すグラフです。緑から紫へのグラデーションで表された複数の棒グラフは、異なる評価基準または比較対象を表していると推測されます。最も高い緑の棒がFLUX.1を、その他の棒が競合するAIモデルを表しています。

きょろ
きょろ

DALLE3やMidjourneyを抜いて一位に君臨しています。

Fluxより引用

上記画像は以下の5つの性能差を比較したものです。

多彩な能力: FLUX.1は5つの重要な点で優れています:

  • きれいな画像を作る
  • 指示通りの画像を作る
  • 様々な大きさや形の画像を作れる
  • 文字をうまく扱える
  • 多様な画像を作り出せる

図の緑色の線がFLUX.1を表しています。この線が他の色(他のAI)よりも外側に広がっているので、FLUX.1が全体的に優れていることが分かります。

Flux.1の使い方

ウェブ上で試す方法とパソコン上で試す方法の2種類があります。ウェブ上で試す方が圧倒的に簡単なので、今回はウェブ上での使い方を実際に行いながら説明いたします。

一番簡単なのが「Hugging Face Space」です。FLUX.1 [dev]のモデルを使って画像作成していきます。

 Hugging Face Spaceにアクセスします。

以下の画面が出てきます。実際にプロンプトを入れてみましょう。

プロンプトを入れたら「Run」を押下すると画像生成が始まります。

「Chihuahua is traveling in space(チワワが宇宙旅行をしている)」と入れてみました。

できました!リアルだし、シチュエーションも完璧!

下の「Advanced Settings」を押下すると細かいサイズ設定などができます。

Fluxの「Advanced Settings」でできることは以下の通りです。

設定項目設定値/範囲説明
Seed0 – [最大値不明]画像生成の初期値。同じSeedを使用すると同じ結果が得られる。
Randomize seedチェックボックスオンにするとSeedがランダムに設定される。
Width1024 (スライダーで調整可能)生成される画像の幅。
Height1024 (スライダーで調整可能)生成される画像の高さ。
Guidance Scale3.5 (スライダーで調整可能)プロンプトに対する画像の忠実度。値が高いほどプロンプトに忠実な画像が生成される。
Number of inference steps28 (スライダーで調整可能)画像生成の反復回数。多いほど詳細な画像が生成されるが、処理時間も長くなる。

MidjourneyとFlux.1を比較してみた。

実際に同じ条件でどんな画像ができるのかを以下のプロンプトで比較してみました。

A subculture Japanese woman wearing headphones and listening to music

(ヘッドフォンをして音楽を聴いているサブカルな日本人女性)

まずはFlux.1(FLUX.1 [dev]のモデルを使用)

MidjourneyのV6.1モデルを使用

きょろ
きょろ

正直同じ条件で出てきた画像を比較すると「Midjourney」に軍配が上がると思います。

どうしてもFLUX.1ではアジア人の作成が不得意なんでしょう。肌のつやがAI感をぬぐえません。それでも無料で使う分には十分でしょう。

※Midjourneyv6.1は最新モデルであり、FLUX.1との検証比較はv6.0でした。

実際にアジア人以外での比較もしてみました。左がFLUX、右がMidjourneyです。

こうなるとどっちもクオリティ高すぎますねwwもうAIなのかわからない。すごい。

Flux.1は商用利用可能?

Fluxは各モデルごとに使用範囲が異なります。以下の通りです。

バージョン 特徴 アクセス方法 商用利用 私的使用 備考
FLUX.1 pro 最高性能モデル API(レート制限あり) 課金制、モデル非公開
FLUX.1 dev 標準モデル ほぼ無制限で使用可能 非商用ライセンス、モデル公開
FLUX.1 schnell 高速生成(devの約5倍速) ほとんど制限なし Apache License 2.0、モデル公開

Flux.1は無料?

Flux.1は、Hugging FaceやReplicate、fal.aiを通じてオンラインで利用可能です。Hugging Faceではログイン不要で試すことができ、Replicateやfal.aiではGithubアカウントでのログインが必要です。特にfal.aiは無料で利用できる枠が多く、コストを抑えたいユーザーにとって魅力的です。

ただし、API経由で画像を生成する場合、1枚あたり約8円のコストが発生します。

API経由で画像を生成する場合、1枚あたり約8円のコストが発生

Flux.1 まとめ

Flux.1は、画像生成AIとして多様なニーズに応えることができるツールです。特にリアルな人物画像の生成においては、Midjourneyに匹敵するクオリティを持ち、APIの利用が可能である点が大きな利点です。ユーザーの目的に応じて、どちらのツールを選ぶかを慎重に検討することが重要です。Flux.1の登場により、画像生成AIの選択肢がさらに広がり、クリエイティブな表現の可能性が拡大しています。

タイトルとURLをコピーしました