近年、AI技術の進化により、画像生成ツールが私たちの日常やクリエイティブ活動に欠かせない存在となっています。特に、AIを活用した画像生成は、デザインや広告、SNS投稿など、さまざまな分野で注目されています。その中でも、Googleが開発した新しい画像生成ツール「Whisk(ウィスク)」は、初心者からプロフェッショナルまで幅広いユーザーに向けて提供される画期的なサービスです。
Whiskは、単なるテキストプロンプトによる画像生成だけでなく、「テーマ」「シーン」「スタイル」という3つの要素を組み合わせて直感的に画像を作成できるという特徴を持っています。この記事では、「Whiskとは何か?」という基本的な情報から、その使い方や料金体系、さらに人気の画像生成AI「Midjourney」との比較まで詳しく解説します。


この記事はこんな人におすすめ
・無料で品質の高いAI画像を生成したい
GoogleのWhiskとは
Whiskより引用
Whiskは、Googleが開発した画像生成AIツールで、複数の画像を組み合わせて新しいビジュアルを生み出す革新的な技術です。このツールは、従来のテキストプロンプトベースの画像生成AIとは異なり、ユーザーが指定した画像を「テーマ」「シーン」「スタイル」という3つの要素に分け、それらを組み合わせることで直感的に新しい画像を生成します。


Whiskは、Googleの最先端AI技術「Imagen 3」と「Geminiモデル」を活用しており、これにより高度な画像理解と生成が可能となっています。名前の由来でもある「泡立て器(Whisk)」のように、複数の要素を混ぜ合わせて独創的な作品を生み出すことが特徴です。
現在はWhiskの試験運用版として、 labs.google/whisk からお試しいただけます。
ImageFXと何が違う?
ImageFXはAdobeや他社が提供する画像編集ツールの一つであり、主に既存画像の加工や編集に特化しています。一方でWhiskは、以下のような点で大きく異なります。
項目 | ImageFX | Whisk |
---|---|---|
目的 | 既存画像の編集・加工 | 新しい画像の生成 |
操作方法 | 手動操作中心 | AIによる自動生成 |
特徴的な機能 | フィルターやレイヤー調整 | 画像リミックス、テーマ・シーン・スタイル指定 |
対象ユーザー | プロフェッショナルデザイナー向け | 初心者からプロまで幅広く対応 |
Whiskは特に「テーマ」「シーン」「スタイル」の要素を指定することで、新しいビジュアルを簡単に作成できる点がユニークです。これにより、クリエイターだけでなく初心者でも直感的に利用可能です。
GoogleのWhiskの料金は?
現在、WhiskはGoogle Labsから無料で利用できます。将来的には有料プランや追加機能が提供される可能性もありますが、現時点では完全無料で試せる点が魅力です。
Whiskの使い方
以下では、Whiskを使った画像生成プロセスについて詳しく解説します。
①初心者向け
Whiskページへのアクセス
Whisk公式サイトまたはGoogle Labs内からアクセスします。
Googleでログインを押下

ログイン出来たら準備は完了です。

プロジェクト開始
下にスクロールすると「ゼロから作ってみる」ボタンをクリックします。画面左側には「テーマ」「シーン」「スタイル」の枠が表示されます。

まずはおまかせを押してみます。

セッティングしてくれるので、「→」マークを押下します。

わーできました!なんか子供が好きそうな画像です(笑)

完成した画像を押下すると、

プロンプトを入れて修正できます。

ロボットが笑顔で、シーンは夕日と入れてみました。めちゃくちゃ怖い画像ができて笑いました。

プロンプトは英語でないと反応してくれません。
日本語には対応していないことに注意です。

②応用編
ここからはオリジナルの画像を作成していきます。
基本的に以下の機能がWhiskにあります。
- 素材画像の生成
Whisk内で素材となる画像そのものも生成できます。例えば、「青空」をテーマとして入力すると、それに合った背景素材が作成されます。 - 部分的な要素指定
必ずしも3つすべての要素(テーマ・シーン・スタイル)を指定する必要はありません。例えば、「テーマ」と「シーン」だけで生成することも可能です。 - 編集機能
一度生成した画像でもプロンプトや素材を変更し再編集できます。この柔軟性がクリエイティブ作業をより効率的にします。
画像アップロード
各枠に適切な画像をアップロードします。

上から、
- テーマ:生成される画像の主役(例:人物や動物)
- シーン:背景となる情景(例:海辺や都市)
- スタイル:全体的な画風(例:油絵風やモノクロ)
となる画像をアップロードします。
今回は以下の3つからアップロードしてみます。左から「テーマ」「シーン」「スタイル」です。



プロンプトは無しで作成してみます。

スタイルが反映されませんでした。シュールな画像です。

サイコロを振るというボタンを押下すると素材をランダムで出してくれます。

いろんな画像が出てきました。まったく関係ないものです。

画像をタップしてチェックマークを押さないと、素材が混ざらないので、注意です。

背景やスタイルはどちらかしか選べません。

大分テイストが溶け込んできました。(笑)

プロンプトを入力してみます。プロンプトは個別の画像と全体に対して指示が可能です。

個別の方では、個別の画像を作成する機能しかないので注意です。

Change the girl into a boy(女の子は男の子に変えて)入力したのですが、あまり精度がよくないです・・・

Change the girl into a boy(女の子は男の子に変えて)と全体に入力してみました。
若干弱いですね。

スタイルを筋肉にしたのですが、どんどんわけわからなくなりました。(笑)
でも画像の質はすごいいいです。

画像のダウンロードは以下のやり方でできます。

DLで出力されるのはpngのみです。

Midjourneyと比較してみた
Midjourneyはテキストプロンプトによる画像生成AIとして広く知られています。一方でWhiskとの違いは次の通りです。
項目 | Midjourney | Whisk |
---|---|---|
操作方法 | テキストプロンプト中心 | 画像とテキスト両方で指示可能 |
対応プラットフォーム | Discord経由(Webブラウザも可能) | Webブラウザ |
料金体系 | 有料(月額制で約1,200円ほど) | 無料 |
強み | 高品質なアート作品 | ユーザー指定による直感的なリミックス |
Midjourneyはアート性や高品質な出力で評価されていますが、Whiskはユーザー自身が持つ素材やイメージを活用し、新たなビジュアル表現を作り出す点で異なる価値があります。また、無料で使える点も魅力です。
実際に美女を作成してみました。左がMidjourney、右がWhiskです。
Midjourneyの方がリアルではありますが、どちらも人間といえば正直わからないです。
Whiskはこれが無料なのだからすごい。


Midjourneyについての記事は以下にてご覧いただけます。
Googleの「Whisk」は商用利用可能?
Googleの新しいAI画像生成ツール「Whisk」の商用利用については可とも不可とも書いていません。あくまで試用目的で活用しましょう。
Imagen 3で生成された画像については、公式サイト(https://imagx.ai/ja)で商用利用可能であることが明記されています。

一方、Whiskに関しては、現在試験運用段階の画像生成ツールであるため、商用利用の可否が明確に定義されていません。開発途上のツールであることを考慮すると、商用利用については慎重な判断が求められます。
利用を検討する際は、Googleの最新の利用規約を確認し、必要に応じて直接問い合わせることをお勧めします。クリエイターや企業が安心して利用できるよう、今後のWhiskの利用指針に注目が集まっています。
まとめ
Googleが開発した「Whisk」は、新しいビジュアル表現を追求するための革新的なツールです。そのユニークな機能と簡単な操作性により、初心者からプロまで幅広いユーザー層に対応しています。特に、「テーマ」「シーン」「スタイル」を直感的に指定できる仕組みは他にはない特徴と言えるでしょう。
現在は実験段階ながらも無料で提供されており、日本からでもVPN経由で利用可能です。Midjourneyなど他のAIツールとの違いも明確であり、自分自身のクリエイティブ活動に最適なツールとして活用できます。
今後さらに機能拡張が進むことが期待されるため、この機会にぜひ試してみてはいかがでしょうか。
趣味:業務効率化、RPA、AI、サウナ、音楽
職務経験:ECマーチャンダイザー、WEBマーケティング、リードナーチャリング支援
所有資格:Google AI Essentials,HubSpot Inbound Certification,HubSpot Marketing Software Certification,HubSpot Inbound Sales Certification
▼書籍掲載実績
Chrome拡張×ChatGPTで作業効率化/工学社出版
保護者と教育者のための生成AI入門/工学社出版(【全国学校図書館協議会選定図書】)
突如、社内にて資料100件を毎月作ることとなり、何とかサボれないかとテクノロジー初心者が業務効率化にハマる。AIのスキルがない初心者レベルでもできる業務効率化やAIツールを紹介。中の人はSEO歴5年、HubSpot歴1年