OpenAIが2024年9月25日に発表した「Advanced Voice Mode」は、ChatGPTの音声機能を大幅に向上させた革新的な機能です。この新機能により、ユーザーはより自然で流暢な会話体験を得ることができるようになりました。本記事では、Advanced Voice Modeの詳細や使い方、その影響について詳しく解説していきます。

AI監修者兼ライター

きょろ

AIツール専門家

所有資格：Google AI Essentials

書籍：Chrome拡張×ChatGPTで作業効率化/工学社出版

AIツールレビュー数100以上。AIワークスタイルのオウンドメディア立ち上げ～AI関連の記事執筆を通じて、「実際に使ってみて、本当に良いAIツールを届ける」という信念のもと、AIで日本が盛り上がることを夢見るアラサー

この記事はこんな人におすすめ

・ChatGPTの新ボイス機能で英語を勉強したい
・ChatGPTの新ボイス機能でどこまで声を表現できるのか知りたい

Advanced Voice Modeとは？
1. Advanced Voice Modeの主な特徴
Advanced Voice Modeの使い方
Advanced Voice Modeの料金
Advanced Voice Modeの仕組み
Advanced Voice Modeのセキュリティ面について
Advanced Voice Modeの活用事例
まとめ

Advanced Voice Modeとは？

Advanced Voice Modeは、ChatGPTの音声応答能力を人間に近いレベルまで引き上げた機能です。従来のシステムでは、回答に3〜5行程度の時間を要していましたが、この新機能では人間とほぼ同じ0.3秒で応答が可能になりました。

恐山氏より引用

きょろ

この動画、めっちゃ怖いですｗｗアムウェイっぽい。底をつかれたときの笑う瞬間とか。
最後の「また会おうねー」の語尾が下がるのがリアルすぎる。

Advanced Voice Modeの主な特徴

特徴	詳細
対象ユーザー	ChatGPT PlusとTeamプランのユーザー
技術的特徴	GPT-4oのネイティブオーディオ機能を使用リアルタイムで自然な会話が可能
高度な機能	話す速度などの非言語的な手がかりを理解感情を込めた応答が可能
使用制限	1日あたりの使用回数に制限あり
標準音声モードとの違い	より自然でスムーズな会話体験ネイティブにマルチモーダル（音声とAIが直接やりとり）
注意点	音声認識の誤りの可能性があるため、重要な情報は確認が必要機能へのアクセスや使用制限は変更される可能性あり

この機能により、ユーザーはより自然で滑らかな対話を楽しむことができます。また、感情表現が可能になったことで、より豊かなコミュニケーションが実現しました。

Advanced Voice Modeの使い方

Advanced Voice Modeの使用方法は非常にシンプルです。ただし、この機能は有料会員向けのサービスであるため、まずはChatGPTの有料プランに加入する必要があります。

使用手順

ChatGPTの有料プランに加入する
アプリまたはウェブサイトにログインする
設定画面からAdvanced Voice Modeを有効にする（通知が来ます。）
好みの音声タイプを9種類の中から選択する（今回新しく5種類追加）
必要に応じてカスタムインストラクションを設定する
音声入力を開始し、自然な会話を楽しむ

なお、この機能は順次提供されるため、すぐに利用できない場合もあります。利用可能になると、以下のようなアプリ内で通知が表示されます。

見ていただくとわかる通り右上を押すと、9種類のボイスに変更できますね。「sol」の声が好きです。

Meet the five new voices. pic.twitter.com/F9BOUaJqG1
— OpenAI (@OpenAI) September 24, 2024

Advanced Voice Modeは、2024年7月に一部の有料ユーザー向けにアルファ版として提供が開始されましたが、この度の発表により、全ての有料ユーザーが利用可能になりました。これは多くのユーザーにとって待望のアップデートとなるでしょう。

地域制限に関する注意事項： ただし、現時点では地域による制限があります。EU加盟国、イギリス、スイス、アイルランド、ノルウェー、リヒテンシュタインではまだ利用できません。一方で、日本を含むその他の多くの国では順次利用可能となります。

この新機能の拡大展開により、より多くのユーザーが高度な音声対話機能を体験できるようになり、ChatGPTとのコミュニケーションがさらに豊かになることが期待されます。

Advanced Voice Modeの料金

Advanced Voice Modeは、ChatGPTの有料プランに含まれる機能です。具体的な料金体系は以下の通りです。

プラン名	月額料金	Advanced Voice Mode
無料プラン	$0	利用不可
Plus	$20	利用可能
Team	$30/ユーザー	利用可能
Enterprise	要問い合わせ	利用可能

Advanced Voice Modeを利用するためには、少なくともPlusプランへの加入が必要です。

Advanced Voice Modeの仕組み

Advanced Voice Modeの背後にある技術は、OpenAIの最新の機械学習モデルと音声合成技術の組み合わせです。

主要な技術要素

高度な自然言語処理（NLP）モデル
リアルタイム音声認識
高速な文章生成アルゴリズム
最新の音声合成技術

これらの技術が統合されることで、人間のような自然な会話が可能になりました。特に、0.3秒という超高速の応答時間は、複雑な計算を瞬時に行う並列処理技術の成果と言えるでしょう。

また、感情表現の向上は、テキスト解析と音声合成の両面での進歩によるものです。テキストの意味や文脈を深く理解し、それに適した抑揚や強調を音声に反映させることで、より豊かな表現が可能になりました。

Advanced Voice Modeのセキュリティ面について

高度な音声技術を使用するAdvanced Voice Modeでは、セキュリティとプライバシーの問題が重要な懸念事項となります。

主なセキュリティ対策

エンドツーエンドの暗号化
音声データの匿名化処理
ユーザーの同意に基づくデータ使用
定期的なセキュリティ監査

OpenAIは、ユーザーの音声データを保護するために厳格な措置を講じています。ただし、音声認識技術の性質上、完全なプライバシー保護は難しい面もあります。ユーザーは、個人情報や機密情報を音声で入力する際には注意が必要です。

Advanced Voice Modeの活用事例

地面師っぽい風

もうええでしょう！！！を彷彿とさせますｗｗ

新しいボイスモードとAI画像で地面師っぽくする。ChatGPTはAI声優もできる。

画像:Midjourney
音声:ChatGPT advanced voice
リップシンク:hedra pic.twitter.com/CaO2b5NJzV
— いっしゅ / AIクリエイター (@ish_creative) September 25, 2024

漫才師もできる

地面師がいけるなら漫才師もいけて当然です。

【ガチでAIと漫才してみた。】

これ多分、極めたらM-1の2回戦くらいは突破するかもしれないっすねw（ツッコミとプロンプト次第だが）

反応と抑揚と関西弁はほぼ完璧。

しかも最後の大喜利も中々おもろい。

是非、皆さんもこの漫才の評価をくださいw

挑戦者も待ってますw pic.twitter.com/FED1kF8s7f
— チャエン | 重要AIニュースを毎日発信⚡️ (@masahirochaen) September 25, 2024

アムウェイっぽい人に変身

少なくとも悪用は現金です。エンタメとしてはめちゃくちゃ面白いです。

恐山氏より引用

英語教師もいける

もう本格的に留学しなくても英語が身につく時代が来そうです。

やば、ChatGPT高度なボイスモードついに来た！！英語学習に革命…！

さっそくAIを英語教師にしてみた。英語日本語ともにネイティブレベルの講師からの個別指導が24時間使い放題はバグ。

動画は、TOEICの単語教えてもらうのと、実際のビジネスシーンをロールプレイ練習する様子 pic.twitter.com/OhE0uBiC6R
— 石川陽太 Yota Ishikawa (@ytiskw) September 24, 2024

Advanced Voice Modeは、様々な分野で革新的な活用が期待されています。

ビジネス分野での活用

カスタマーサポート：24時間体制の自然な音声対応
会議の議事録作成：リアルタイムでの音声認識と要約
プレゼンテーション補助：質疑応答のサポート

教育分野での活用

語学学習：ネイティブスピーカーのような発音練習
個別指導：学生の質問にリアルタイムで回答
教材作成：音声ナレーションの自動生成

医療分野での活用

問診補助：患者の症状を音声で聞き取り、分析
医療記録の作成：診察内容を自動で文書化
遠隔医療サポート：患者とのコミュニケーション支援

エンターテインメント分野での活用

インタラクティブストーリーテリング：ユーザーの選択に応じて物語が変化
ゲーム内NPCの会話：よりリアルなキャラクター対話
バーチャルアシスタント：個人用の音声アシスタントの高度化

これらの活用例は、Advanced Voice Modeの可能性のほんの一部に過ぎません。今後、さらに多くの革新的な使用方法が開発されていくことでしょう。

まとめ

OpenAIのAdvanced Voice Modeは、人工知能と音声技術の融合による画期的な機能です。0.3秒という超高速の応答時間、自然な発音とアクセント、感情表現の向上など、多くの革新的な特徴を備えています。

この技術は、ビジネス、教育、医療、エンターテインメントなど、幅広い分野での活用が期待されています。ただし、セキュリティとプライバシーの観点から、使用には一定の注意が必要です。

Advanced Voice Modeは、人間とAIのコミュニケーションの在り方を大きく変える可能性を秘めています。今後の発展と、社会への影響に注目が集まることは間違いないでしょう。

技術の進歩は日々加速しており、Advanced Voice Modeもその一例です。ユーザーは、この新しい技術を賢く活用することで、生活やビジネスの質を向上させることができるでしょう。同時に、技術の倫理的な使用や、人間の役割の再定義など、社会全体で考えるべき課題も浮上してきています。

Advanced Voice Modeは、AIと人間の協調の新たな章を開く可能性を秘めています。この技術が私たちの日常生活にどのような変革をもたらすのか、今後の展開が非常に楽しみです。

きょろ

趣味：業務効率化、RPA、AI、サウナ、音楽
職務経験：ECマーチャンダイザー、WEBマーケティング、リードナーチャリング支援
所有資格：Google AI Essentials,HubSpot Inbound Certification,HubSpot Marketing Software Certification,HubSpot Inbound Sales Certification
▼書籍掲載実績
Chrome拡張×ChatGPTで作業効率化/工学社出版
 保護者と教育者のための生成AI入門/工学社出版（【全国学校図書館協議会選定図書】）

突如、社内にて資料100件を毎月作ることとなり、何とかサボれないかとテクノロジー初心者が業務効率化にハマる。AIのスキルがない初心者レベルでもできる業務効率化やAIツールを紹介。中の人はSEO歴５年、HubSpot歴１年