Googleの大規模言語モデルであるBardが、2023年9月、さらにアップデートし日本でも画像認識機能を搭載したことで話題になっています。Bardは、テキストだけでなく画像もアップロードすることで、想像力や創造性を高めることができるようになりました。この記事では、Bardの画像認識機能の使い方や魅力について紹介します。
GoogleBardの画像生成機能の使い方については下記記事をご覧ください。
Gemini(GoogleBard)画像生成機能の使い方を徹底解説
今は英語でしか対応していないけど、日本語に翻訳すれば充分に使えるよ。 2023年9月より日本語対応となりました。
Google Bardとは何か知りたい方はこちらの記事もおすすめです。
Google Bard日本語版の使い方を徹底解説!実際に使った活用事例も紹介
改めて、Gemini(旧Google Bard)とは何か?
Gemini(旧Google Bard)とは、Googleが開発した大規模言語モデルです。
Gemini(旧Google Bard)は、インターネット上の膨大なテキストデータを学習して、自然言語処理のさまざまなタスクに対応できるようになりました。Gemini(旧Google Bard)は、テキスト生成や要約、翻訳、質問応答などの能力を持ちます。
また、Gemini(旧Google Bard)は、ユーザーと自然な会話をすることもできます。Gemini(旧Google Bard)は、Googleアカウントを持っていれば無料で利用できます。
Gemini(旧Google Bard)の画像認識機能とは何か?
Bardの画像認識機能とは、Bardが最近導入した新しい機能です。
GoogleのAIチャット「Bard」が2023年7月13日アップデートされ、
Googleレンズ機能の追加や回答の読み上げなどさまざまな機能強化が行なわれました。
※2023年9月に日本語でも対応が可能となりました。
Gemini(旧Google Bard)の画像認識機能の使い方
Bardの画像認識機能は簡単に使える!
①GoogleBardへログイン後、左下の写真アイコンをクリック
②好きな画像をアップロード
③指示文を入力し送信ボタンを押下
④Googleが画像に沿って回答してくれました!
英語版でしか対応していないので質問文を英語で伝える必要があります。
「質問文 英語」と検索をかければ英語がわからなくても
すぐにGoogleが英語文を用意してくれます。
使用方法:料理のレシピを調べるのにも
Bardは画像に含まれる材料を認識し、それらで作れる料理を提案し、レシピのリンクも貼ってくれます。また、画像に対して「この画像の作り方を教えて?」というような質問を入力すると、Bardは以下のように答えます。
めっちゃ丁寧!!
Gemini(旧Google Bard)の画像認識機能のメリット
・画像をアップロードするだけで、画像に関する情報や分析を得ることができる。
・画像に対する質問や指示にも応答することができる。
・画像に含まれる文字も読み取ることができる。
・画像の面白さやユニークさなどを評価することができる。
・想像力や創造性を高めることができる。
GoogleBardの画像認識機能の今後の展望
Bardの画像認識機能は、まだ開発途中の機能です。今後は、以下のような改善や拡張が期待されます。
・chrome拡張機能との連携
・画像生成や編集などのマルチモーダルな機能の追加
・画像認識の精度や速度の向上
・画像に関するフィードバックや評価の収集
Bardの画像認識機能は、Googleの最新技術を体験できる素晴らしい機能です。ぜひ一度試してみてください。Bardと一緒に、画像から学びや楽しみを見つけましょう。
趣味:業務効率化、RPA、AI、サウナ、音楽
職務経験:ECマーチャンダイザー、WEBマーケティング、リードナーチャリング支援
所有資格:Google AI Essentials,HubSpot Inbound Certification,HubSpot Marketing Software Certification,HubSpot Inbound Sales Certification
書籍掲載実績:Chrome拡張×ChatGPTで作業効率化/工学社出版
突如、社内にて資料100件を毎月作ることとなり、何とかサボれないかとテクノロジー初心者が業務効率化にハマる。AIのスキルがない初心者レベルでもできる業務効率化やAIツールを紹介。中の人はSEO歴5年、HubSpot歴1年