PR

「DALL-E 3(DALLE3)」使い方~応用裏技紹介!ChatGPTで画像生成する方法2選!

画像生成

マイクロソフトの無料画像生成AIサービス「Bing Image Creator」で、新しい画像生成AI「DALL-E 3」の先行利用ができることが明らかになりました。「DALL-E 3(DALLE3)」はOpenAIによって9月21日に公表されましたが、まだ広く公開されていません。

※10月5日より日本でもChatGPTの有償版で画像生成機能が順次使えるようになりました。

DALL-E 3(DALLE3)は、従来のシステムよりもニュアンスやディテールを理解し、ユーザーのアイデアを忠実に再現する画像を生成することが可能です。これはまるで、人間の頭の中にあるイメージを直接描き出すかのような感覚です。

画像生成機能の中でも本当におすすめします!実際に使い方と導入方法を紹介します。

OpenAIから新サービスの発表がなされた動画生成AIサービス「Sora」の記事はこちらから

この記事では、以下の内容について解説します。

・DALL-E 3(DALLE3)の導入~使い方

この記事はこんな人におすすめ

・質の高い画像生成機能を無料で使いたい
・DALL-E 3(DALLE3)を無料で使いたい
・ChatGPTで画像生成する方法を知りたい

DALL-E 3(DALLE3)とは?

DALL-E 3(DALLE3)は、2023年9月21日にOpenAI社から発表された最新の画像生成AIで、テキストプロンプトに基づいて反映された画像を生成するDALLシリーズの新しいバージョンです。

Microsoft BingのImage Creatorではすでに利用が開始されており、2023年10月からは、ChatGPTPlusとEnterpriseという2つの有料プラン向けに提供が開始されます。

ChatGPT、画像も作れるようになります【DALL·E 3発表】

きょろ
きょろ

そんな機能が、「Bing Image Creator」だと無料で使えちゃうものですからエグイですよね。
DALL-E 3(DALLE3)の主な特徴は以下の5つです。

・ChatGPTへの統合
DALL-E 3(DALLE3)はChatGPTを基盤としています。これにより、ChatGPTを使用してアイデアをブレインストーミングしたり、プロンプトを洗練させることができます。たとえば、特定の画像が気に入ったが完璧ではない場合、ChatGPTに数語で調整を依頼することができます。

・利用の可能性が無限大
DALL-E 3(DALLE3)は、ChatGPT PlusとEnterpriseの顧客に対して、10月にAPIおよびLabsを通じて利用可能になる予定です。生成された画像は、ユーザーが自由に使用、販売、商品化することができます。

・コンテンツ制限
DALL·E 3(DALLE3)は、暴力的、成人向け、または憎悪的なコンテンツを生成する能力が制限されています。また、公共の人物に関するリクエストや、生きているアーティストのスタイルでの画像生成も拒否されます。

・細微までこだわった画像生成が可能
DALL-E 3(DALLE3)は、テキスト内の詳細な要素を生成する能力が以前のモデルと比べて大幅に向上しています。例えば、「ハトが湖の周りを飛んでいるイラスト。湖には ワニがいる」というテキストを与えると、DALL-E 3(DALLE3)はその要求に完全に応えるアートワークを生成します。

きょろ
きょろ

実際に「ハトが湖の周りを飛んでいるイラスト。湖には ワニがいる」を
作ってもらいました。すごくない?(笑)

DALL-E 3(DALLE3)の能力はどれほど?

DALL-E 3(DALLE3)は、その前身であるDALL-E 2と比較して大幅な改善が見られます。同じプロンプトでも、DALL-E 3(DALLE3)はDALL-E 2よりも優れた結果を提供する事が可能でう。また、DALL-E 3(DALLE3)はChatGPTと統合されており、ユーザーはChatGPTを使用してプロンプトを作成したり、プロンプトを微調整したりすることができます。下記はChatGPTの公式の見解です。

当社の新しいテキストから画像へのモデルである DALL·E 3(DALLE3) は、微妙なリクエストを非常に詳細で正確な画像に変換できます。アイデアを実現するための素晴らしいプロンプトを作成するのに役立つ ChatGPT Plus & Enterprise が間もなく登場します

OpenAIより引用
きょろ
きょろ

実際に進撃の巨人の超大型巨人が学校で勉強している様子。と
プロンプトを打ちました。すると・・・

これはエグイです・・・。

DALL-E 3(DALLE3)の使い方(無料で使う方法)

DALL-E 3(DALLE3)は、2023年10月にChatGPT PlusおよびEnterpriseの顧客に提供される予定です。その後、OpenAI Labsを通じて一般公開される予定です。しかしながら先行して無料で使う方法があります。

それが「Bing Image Creator」を活用する事です。

使い方は下記の通り

①「Image Creator」へアクセス
②指示文を入力して作成を押下

Image Creatorの全体感はこちらです。

①「Image Creator」へアクセス

例えば下記のようなプロンプトを入力してみました。
「大谷翔平がダンクシュートをするシーン」

※英語で入れた方が精度は高いです。
「Scene where Shohei Otani takes a dunk shot」

すると・・・

横顔は大谷翔平に似ていませんか?(笑) 少年漫画なら絶対主人公のライバル役ですね。

DALL-E 3(DALLE3)の使い方(ChatGPT内で使う方法)

ChatGPTでは有償版の方だけ使えるようになります。
尚、順次機能実装されているようなので待ちましょう。

やり方はかなり簡単です。

①「GPT-4」のタブを押下
②「DALL-E 3」にチェックを入れる

これだけで使えちゃいます!

DALL-E 3(DALLE3)の「指示文を正確に理解できる」は本当なのか?検証してみた

大谷翔平は固有名詞なので、一般的な指示文で画像を作ってもらいました。

太陽の周りを自転車で走る人間 と入力してみました。

man riding a bicycle around the sun

きょろ
きょろ

自転車で走る・・・という点がミソですね・・・どうでしょうか・・・。

man riding a bicycle around the sun

いやこれはすごいww本当に太陽の周りを自転車で走っています!!w

DALL-E 3(DALLE3)の応用した活用方法①

DALL-E 3(DALLE3)で作った画像をさらに、品質を上げるため動画にしてみました。
太陽の周りを自転車で走る人間・・・こが動画になったらすごくないですか?(笑)

それがこちら

きょろ
きょろ

これを素人が作れてしまう世の中がすごい。(笑)
これは「runway gen-2」というAIツールを掛け合わせて作成しています。

使い方は下記の記事をご覧ください。

DALL-E 3(DALLE3)の応用した活用方法②

ChatGPTのDALL-E 3(DALLE3)にただ指示文を入力するだけでは、思い通りの画像は作れません。
そこで下記2つのポイントを守る事でよりクオリティの高い画像が作れるようになります。使い方をうまく汁事が大事です。

①指示文を明確にすること
②英語で入力すること

順番に見ていきましょう。

指示文を明確にし使いこなす

例えば「鳥が地球を回る。」と入力してみます。

ん~抽象的すぎていろんなクオリティに差がありますね
後回っていないし。

ではここでこんな指示文を打ってみました。

「かっこいい多くの鳥が悠々と地球を回る。」

これはすごくないですか?(笑) もう少しクオリティをあげてみましょう。

英語で入力するとさらに良い

では「かっこいい多くの鳥が悠々と地球を回る。」を英語で入れてみましょう。

「Many cool birds roam the earth leisurely.」と入力してみました。

きょろ
きょろ

映画のワンシーンにもなりそうですごい(笑)。

英語が苦手な人でも下記のフローを経れば誰でも英語で指示文が打てます。

・Googleで「訳」と検索

・原文を日本語に設定します。

・下に日本語を入れると英語に変換されます。

覚えておくと便利な「DALL-E 3(DALLE3)」の裏技

DALL-E 3(DALLE3)は気に入った画像の再生成が可能

画像をどれかクリックしてみましょう。

すると右側にプロンプトが現れます。これをコピーし再度コピーした指示文を出すことで同じものができます。

 DALL-E 3(DALLE3)はアスペクト比を入れる事でサイズ調整が可能

先ほどの画像を16:9にしてもらいました。指示文の中に画像サイズ指定をするとその通りに作成してくれます。尚、現在は3種サイズ対応のみです。

※画像サイズは「16:9」「1:1」「9:16」の3種

DALL-E 3(DALLE3)は文字入れが可能

現在英語のみ対応可能です。英語で指示文を出した方が良いと伝えたのはこの理由もあります。

Englishを付けたしてもらうよう指示を出しました。

DALL-E 3(DALLE3)は数字も入れられます。

記念日なんかにいいですね。

「DALL-E 3(DALLE3)に画像編集機能が登場!

DALL・Eで作成した画像をさらに編集できるようになりました。新たに追加されたエディタインターフェイスなどを使えば、画像の特定の領域を選択し、テキストチャットで具体的な変更内容を指示するだけで、簡単に画像を編集することが可能です。

例えば、「選択した人物の髪の色を金髪に変更して」といった指示を出せば、指定した通りに画像が編集されます。背景の変更や、オブジェクトの追加・削除・変形など、様々な編集が可能となっています。

ポイントをまとめると以下の通りです。

  • DALL・Eで作成した画像を編集する機能が追加された
  • 画像の一部を選択し、テキストで指示を出すことで編集できる
  • 髪色の変更、背景の変更、オブジェクトの追加・削除・変形など様々な編集が可能
  • 画像生成と編集が一貫して行えるようになり、創造性を発揮しやすくなった

詳しい使い方については下記記事をご参照ください。

「DALL-E 3(DALLE3)の最新機能「gen_id」の使い方

2023年11月5日、ChatGPTはDALL-E 3に新しい機能を追加しました。その新しい機能とは、「gen_id」というものです。「gen_id」とは、DALL-E 3で生成された画像に、固有のIDを付与する機能です。この機能により、DALL-E 3で生成された画像を簡単に管理や共有ができるようになりました。

「gen_id」の使い方は非常に簡単です。DALL-E 3で画像を生成すると、画像の右下に「gen_id:xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx」という文字列が表示されます。この文字列は、画像の固有のIDを表しています。このIDは、画像の内容やテキストに関係なく、ランダムに生成されます。このIDは、画像と一緒に保存されます。

「gen_id」の利用方法は、以下のようにまとめることができます。

・画像の識別:「gen_id」は、画像の固有のIDとして機能します。これにより、画像の重複や紛失を防ぐことができます。また、画像の検索や整理にも役立ちます。
・画像の共有:「gen_id」は、画像の共有にも便利です。画像を送るときに、「gen_id」を一緒に送ることで、相手に画像の内容や出所を伝えることができます。また、画像を受け取るときに、「gen_id」を確認することで、画像の正当性や信頼性を確認することができます。
・画像の再生成:「gen_id」は、画像の再生成にも使えます。画像を失くしたり、画質が悪くなったりしたときに、「gen_id」を入力することで、元の画像を再生成することができます。また、画像の一部を変更したり、画像にテキストを追加したりすることもできます。

「gen_id」の使い方事例を見てみましょう。以下の画像は、DALL-E 3で「リンゴとスイカが戦っている画像を生成して」というテキストから生成された画像です。

続けて「gen-idをください」と指示を出してみました。すると・・・。

gen-idが出てきました!これが、この画像の固有のIDです。

この画像を保存すると、このIDも一緒に保存されます。この画像を送るときには、このIDも一緒に送りましょう。この画像を受け取るときには、このIDを確認します。この画像を再生成するときには、このIDを入力して同じ画像を作ることができます。

きょろ
きょろ

注意が必要なのが「gen-id」を使う際には「All Tools」機能でしか使えない点です。生成画像の固有ID「gen_id」を取得したい場合には、必ず「All Tools」(Defaultモード)を使用してください。尚、「「All Tools」(Defaultモード)」がわからない方はまずは下記の記事をご参照ください。

【ChatGPT All Tools】使い方 GPT-4の全機能の重ね技を徹底解説

gen_idの応用技

gen-idにさらに加工をする事が出来ます。例えば「hDuYIxAmL21n344yのスイカを二人にしてください。」と入力してみました。すると・・・

before
after

確かにスイカを増やしてくれましたw

「DALL-E 3(DALLE3)」を使う上での著作権や商用問題は?真偽を徹底解説

これだけ便利になった分気になる人も多いと思います。
「なんかDALL-E3は商用利用可能らしいけど・・・」
「著作権OKってこと?」

色々な疑問があると思います。
DALL-E 3の利用に際する注意事項と安全性確保に向けた取り組みについて紹介します。

著作権について結論からいうと「グレー」


「DALL-E 3」によって作成されたコンテンツの権利は基本的に生成したユーザーに帰属しますとOpenAI公式が利用規約内に下記の声明を出しています。

お客様は、サービスに入力し、その入力に基づいてサービスによって生成され返される出力 (コンテンツ) を受け取ることができます。入力と出力は総称して「コンテンツ」です。当事者間において、適用法で認められる範囲で、お客様はすべての入力を所有します。お客様が本規約を遵守することを条件として、OpenAI は、アウトプットに関するすべての権利、所有権、利益をお客様に譲渡します。これは、本規約に従う場合、販売や出版などの商業目的を含むあらゆる目的でコンテンツを使用できることを意味します。OpenAI は、コンテンツを使用してサービスを提供および維持し、適用される法律を遵守し、当社のポリシーを施行することがあります。あなたは、コンテンツが適用法または本規約に違反していないことを保証することを含め、コンテンツに対して責任を負います。

OpenAIより引用

この規定により、そのイメージを再配布、販売、または各種商業活動での使用が可能となっています。

きょろ
きょろ

だけど実際にアニメの文言を入れるとそのキャラクターぽい画像が生成されるわけで
本当に大丈夫なのでしょうか。もう少し細かくOpenAIの規約を見てみましょう。

AI の関与について視聴者を誤解させないでください。

  • あなたの作品を共有するときは、あなたの作品への AI の関与を積極的に開示することをお勧めします。
  • 必要に応じて DALL・E の署名を削除することもできますが、作品の性質について他の人に誤解を与えてはなりません。たとえば、その作品が完全に人間によって生み出されたものであることや、その作品が実際の出来事をそのまま撮影したものであることを人々に伝えることはできません。
きょろ
きょろ

要するにDALL-E 3で生成された画像は、人工知能が生成したものであることを明示する必要があります。
また、DALL-E 3で生成された画像は、OpenAIのライセンスに従って利用する必要があります。
そのままAI画像であることを明言せずに使うことは避けた方がいいでしょう。

OpenAIのライセンスでは、以下のことが定められています。

有害な内容の制御

DALL-E 3は、人工知能がテキストや音声のプロンプトに応じて画像を生成するサービスですが、そのプロンプトには制限があります。DALL-E 3は、以下のような有害な内容を含むプロンプトに対しては、画像を生成しません。

暴力的な内容
性的な内容
差別的な内容
違法な内容
その他、社会的に不適切な内容

DALL-E 3は、有害な内容を含むプロンプトを検出するために、フィルタリングシステムを導入しています。しかし、このシステムは完璧ではありません。DALL-E 3は、意図しない画像を生成することがあります。その場合は、ユーザーは画像を削除するか、フィードバックを送ることができます。
以下はOpenAIからの引用です。

憎しみ:憎しみの象徴、否定的な固定概念、特定のグループを動物/物体に喩えること、またはアイデンティティに基づいて憎しみを表現または促進すること。
ハラスメント:個人を嘲笑したり、脅迫したり、いじめたりすること。
暴力:暴力的な行為と他者の苦しみや屈辱。
自傷行為:自殺、切断、摂食障害、その他自分自身を傷つけようとする試み。
性的:ヌード、性的行為、性的サービス、または性的興奮を引き起こすことを意図したコンテンツ。
衝撃的:体液、わいせつな身振り、または衝撃や嫌悪感を与える可能性のあるその他の冒涜的な主題。
違法行為:薬物使用、盗難、破壊行為、その他の違法行為。
欺瞞:現在進行中の主要な地政学的出来事に関連した重大な陰謀または出来事。
政治的:政治家、投票箱、抗議活動、または政治プロセスに影響を与えたりキャンペーンを行うために使用される可能性のあるその他のコンテンツ。
公衆および個人の健康:病気の治療、予防、診断、伝染、あるいは健康障害を患っている人々。
スパム:未承諾の大量コンテンツ。

DALL-E 3(DALLE3)についてFAQ

DALL-E 3(DALLE3)で作成できる画像サイズは?

DALL-E 3(DALLE3)では、以下の三種類の画像サイズから選べます。

正方形(1024×1024)
横長(1792×1024)
縦長(1024×1792)
サイズの指定はプロンプトで行えます。

DALL-E 3(DALLE3)は危険なコンテンツを作成する可能性は?

OpenAIはDALL-E 3(DALLE3)において、暴力的な内容や成人向け、憎悪的な内容の生成を制限していますが、100%の安全性は保証されていません。

DALL-E 3(DALLE3)で有名人や公的人物の画像は作成できる?

特定の公人や著名人の画像生成は、不適切な利用を防ぐために制限されています。

DALL-E 3(DALLE3)が生成する画像の種類は?

DALL-E 3(DALLE3)はテキストプロンプトを元に多彩な画像を作成できます。風景、物体、生き物、抽象的なイメージなど、ユーザーの要望に応じて様々な画像が生成されます。

なぜDALL-E 3(DALLE3)が使用できないのですか?

DALL-E 3(DALLE3)は、2023年10月の初めから、ChatGPT Plusと企業向けのChatGPT Enterpriseの登録ユーザーに段階的に公開されています。もしChatGPT PlusまたはChatGPT Enterpriseの登録者でない場合、利用はできません。さらに、全てのユーザーが即座にアクセスできるわけではなく、段階的な展開が行われています。

もし無料で使いたい場合はBing Image Creator」を活用する事です。

DALL-E 3(DALLE3)で生成した画像は商用で使えるのか?

基本的には、DALL-E 3(DALLE3)によって生成された画像の権利はユーザーに帰属します。
そのため、商業的な目的での使用も可能ですが、コンテンツポリシーへの記載があるようにAIによる生成がされたものである明言がどこかにあると良いでしょう。

DALL-E 3(DALLE3)による画像の著作権はどうなっている?

OpenAIはAPIを通じて生成されたコンテンツに対して著作権を主張していません。ただし、AIによる作品の著作権に関する法的基準はまだ不明確です。そのため、生成された画像がパブリックドメインとされる可能性もあります。

DALL-E 3(DALLE3)はプラグインを入れて使うの?

DALL-E 3(DALLE3)はもともと機能実装されているものなのでプラグインを使うことはないです。

DALL-E 3(DALLE3)は画像を認識することもできるの?

画像を認識する機能はGPT-4Vです。詳細は下記リンクをご覧ください。

ChatGPTの音声・画像認識機能、GPT-4V(ビジョン)がエグイ!導入方法~使い方を徹底解説

DALL-E 3(DALLE3)のまとめ

DALL-E 3(DALLE3)は、テキストから画像を生成する能力を持つAIとして、その可能性と応用範囲が広がっています。その統合性と高度な機能により、ユーザーは自分のアイデアを具体的なビジュアルに変換することが可能になります。これからの進化に期待しましょう!

おすすめ講座

\ ホリエモンプロデュース!ChatGPTのオンラインスクール開講 /

ChatGPTや生成AIを学び放題【タノメルキャリアスクール】

ChatGPTを仕事で活かしたい、学校で活かしたい方必見!
月額制で約100講義の生成AI講座が見放題 !!
専用のサポートコミュニティで24時間質問し放題!!!

堀江貴文氏監修のChatGPTオンラインスクール

タイトルとURLをコピーしました