人工知能技術の急速な進歩により、私たちの日常生活や仕事のあり方が大きく変わりつつあります。その中でも、OpenAIが開発する言語モデルは常に注目を集めています。2025年2月1日、OpenAIは最新の小型推論モデル「o3-mini」をChatGPTおよびAPIで正式に提供開始しました。この記事では、o3-miniの特徴や使い方、そしてその高性能版である「o3-mini-high」について詳しく解説していきます。
o3を使うと、以下のようなゲームも1分で作成してくれます。
これはo3に「イライラ棒」のようなゲームを作成してといったところ作成してくれました。(笑)
カーソルでボールを動かしていき、壁にぶつかったらアウトになります。こんなゲームが簡単に作成できるo3の正体を徹底解説します。
この記事はこんな人におすすめ
・「o3-mini」「o3-mini-high」の違いがわからない
・「o3-mini」「o3-mini-high」でなにができるのか知りたい
OpenAI o3-miniとは
OpenAIより引用
OpenAI o3-miniは、OpenAIが開発した最新の小型推論モデルで、2024年12月に発表されました。このモデルは、特にSTEM(Science, Technology, Engineering, and Mathematics)領域における推論能力を大幅に強化しており、以下の特徴を備えています。
後述しますが、o3-miniのすごいところは「検索しながら思考ができる」推論モデルなんです。
STEM領域での高い推論能力
STEM分野における卓越した推論能力は、このモデルの最も顕著な特徴の一つです。AIME 2024の競技数学問題では「o3-mini-high」は87.3%という驚異的な正解率を記録し、高度な数学的推論能力を実証しました。
また、PhDレベルの科学的問題(GPQA Diamond)においても79.7%という高い正確性を示し、最先端の科学的知識と理解力を備えていることが証明されています。さらに、プログラミングの実力を競うCodeforcesでは2073というEloレーティングを達成し、高度なコーディング能力も実証されています。
研究レベルの数学(FrontierMath)では、Pythonツールを使用した場合、最初の試行で32%以上の問題を解決し、特に難易度の高いT3問題においても28%以上の解決率を達成しています。
競技プログラミング分野では、推論レベルを上げるにつれてパフォーマンスが向上し、中程度の推論レベルでもo1と同等の性能を発揮します。
高いコーディング能力
開発者向けには、関数呼び出し、構造化出力、開発者メッセージ機能、ストリーミングサポートなど、実用的な新機能が追加されました。これにより、より柔軟な開発環境が整えられています。
LiveBenchコーディングテストでは、: OpenAI o3-mini は、中程度の推論レベルでもo1-highを上回る性能を示し、高推論レベルではさらに優位性を広げています。
人間の嗜好に合わせた高い推論能力
外部の専門家テスターによる評価でも、OpenAI o3-mini は、特に STEM に関して、OpenAI o1-mini よりも正確で明確な回答を生成し、推論能力が優れていることが示されています。テスターは、o1-mini よりも o3-mini の回答を 56% の割合で好み、難しい現実世界の質問で重大なエラーが 39% 減少したことを観察しました。 全体的により正確で明確な回答を提供できるようになっています。
「o3-mini」と「o3-mini-high」の違いは?
o3-miniには、標準版の「o3-mini」と高精度版の「o3-mini-high」の2つのバージョンが存在します。これらの主な違いは、推論の深さと精度にあります。
モデル | 特徴と用途 |
---|---|
o3-mini |
• 標準的な推論深度で効率的な処理 • 応答速度と正確性のバランスを重視 • 日常的な質問や一般的なタスクに最適 |
o3-mini-high |
• より深い推論処理による高度な分析 • 優れた精度と詳細な分析能力 • 複雑なSTEM問題や高度な推論タスクに特化 |
「o3-mini-high」は、特に難解な数学問題や高度な科学的推論、複雑なプログラミングタスクにおいて真価を発揮します。例えば、外部テスターによる評価では、「o3-mini-high」は以下のような impressive な結果を示しています
- 数学(AIME 2024):87.3%の正答率
- 科学的推論(GPQA Diamond):PhDレベルの難問に対し79.7%の正答率
- プログラミング(Codeforces):Eloスコア2130を達成
これらの結果は、「o3-mini-high」が高度な学術的問題や専門的なプログラミングタスクにも十分に対応できることを示しています。
実際に「o3-mini-high」を使って48秒でゲームを作成した人もいます。
一方で、「o3-mini」は日常的な質問や一般的なタスクに対して、迅速かつ効率的に応答することができます。多くのユースケースでは、「o3-mini」の性能で十分であり、必要に応じて「o3-mini-high」を使用するという柔軟な運用が可能です。
「o3-mini」と「o3-mini-high」の使い方
o3-miniとo3-mini-highの使い方は、ユーザーのニーズや利用環境によって異なります。ここでは、主な利用方法について詳しく説明します。
ChatGPT Plusまたは Teamユーザーの場合、以下の手順でo3-miniとo3-mini-highを利用できます。
- ChatGPTのウェブインターフェースにログインする
- 画面上部のモデル選択メニューを開く
- 「o3-mini」または「o3-mini-high」を選択する
- 通常通りプロンプトを入力し、会話を開始する
ChatGPT Freeユーザーの場合も、o3-miniを試用することができます
- ChatGPTのウェブインターフェースにログインする
- プロンプト入力欄の下部にある「Reason」ボタンをクリック
- o3-miniを使用したレスポンスが生成される
「大谷翔平が何故ホームラン王になれたのか教えて」と入れてみました。
ちゃんと思考しながら答えてくれました。
検索機能の利用
o3-miniでは、最新情報の検索機能も強化されています。以下の手順で利用できます
- プロンプト入力欄の近くにある「検索する」ボタンをクリック
- 検索したいキーワードや質問を入力
- o3-miniが最新の情報を検索し、結果を反映した回答を生成
この機能により、常に最新の情報に基づいた正確な回答を得ることができます。
検索機能は有料プランのみしか使えないことに注意です。
APIでの利用
開発者向けには、o3-miniのAPIも提供されています。APIを使用することで、自社のアプリケーションやサービスにo3-miniの機能を組み込むことができます。
APIの利用例
from openai import OpenAI
client = OpenAI()
response = client.chat.completions.create(
model="o3-mini",
messages=[{"role": "user", "content": "33922の素因数は?"}],
reasoning_effort="high" # o3-mini-high を利用
)
print(response.choices[0].message.content)
このコードでは、reasoning_effort
パラメータを “high” に設定することで、o3-mini-highモードを利用しています。これにより、より深い推論と高精度な回答を得ることができます。
Reasoning Effortの選択(開発者向け)
o3-miniの特徴的な機能の一つが、Reasoning Effortの選択です。これにより、ユーザーは推論の深さを調整することができます。
- 低:迅速な応答が必要な場合や、簡単な質問に適しています。
- 中:バランスの取れた応答速度と正確性を提供します。多くの一般的なタスクに適しています。
- 高:複雑な問題や高度な推論が必要な場合に適しています。o3-mini-highとして機能します。
Reasoning Effortを適切に選択することで、タスクの性質に応じた最適な性能を引き出すことができます。
o3-miniのAPIでできること
o3-miniのAPIは、開発者に多くの可能性を提供します。主な機能と活用方法を見ていきましょう。
関数呼び出し
o3-miniのAPIでは、外部ツールとの連携が可能になりました。これにより、複雑な処理の自動化が実現できます。例えば、天気情報APIと連携して、現在の気象条件に基づいた推奨行動を生成するなど、多様なアプリケーションが考えられます。
Structured OutputsとDeveloper Messages
構造化された出力と開発者向けの詳細なメッセージ機能により、API利用時の解析やデバッグが容易になりました。これらの機能を活用することで、開発効率が大幅に向上し、より洗練されたAIアプリケーションの開発が可能になります。
ストリーミング、Batch API、Assistants API
o3-miniは、さまざまなAPIアクセス方法に対応しています:
- ストリーミング:リアルタイムでの応答生成が可能です。チャットボットなどのインタラクティブなアプリケーションに適しています。
- Batch API:大量のデータを一括で処理する際に有用です。データ分析や文書処理などの大規模タスクに適しています。
- Assistants API:より複雑なタスクや長期的な対話を管理するのに適しています。カスタマーサポートや教育支援などの分野で活用できます。
これらの多様なAPIオプションにより、開発者は柔軟にo3-miniの機能を自社のサービスに統合することができます。
コンテキストウィンドウと出力トークン数
o3-miniは、以下のような仕様を持っています:
- コンテキストウィンドウ:200,000トークン
- 最大出力トークン数:100,000トークン
この大きなコンテキストウィンドウにより、長文の入力や複雑な文脈を理解することが可能です。また、最大出力トークン数も十分に大きいため、詳細な説明や長文の生成にも対応できます。
STEM領域での高性能
o3-miniは、STEM領域での性能が特に優れています。例えば:
- 数学:高度な数学問題(AIME 2024など)での高い正答率
- 科学的推論:PhDレベルの難問(GPQA Diamond)に対する高い理解力
- プログラミング:Codeforcesでの高いEloスコア
これらの能力を活かし、教育支援ツール、研究補助、コーディング支援など、幅広い分野でのアプリケーション開発が可能です。
「o3-mini」と「o3-mini-high」は無料?
o3-miniとo3-mini-highの利用可能性と料金体系について、ユーザータイプ別に詳しく見ていきましょう。
ChatGPT Plus&Teamユーザー
ChatGPT Plus&Teamユーザーは、追加料金なしでo3-miniとo3-mini-highを無制限に利用できます。さらに、1日あたりのメッセージ上限が従来の50から150に拡大されました。これにより、より多くの対話や複雑なタスクを行うことが可能になりました。
ChatGPT Freeユーザー
ChatGPT Freeユーザーも、o3-miniを試用することができます。プロンプト入力欄下部にある「Reason」ボタンを使用することで、o3-miniの機能を体験できます。ただし、利用回数や機能に制限がある可能性があります。
※検索機能は使えません。
Enterpriseユーザー
Enterpriseユーザーは、o3-miniとo3-mini-highを利用可能です。提供開始から約1週間以内に利用可能となる予定です。具体的な料金体系や利用条件については、OpenAIとの契約内容に基づきます。
API利用者
API利用は、まずtiers 3–5の開発者向けに提供され、順次対象が拡大される予定です。API料金は従来のo1モデルと比べて大幅に削減されており、1トークンあたりの価格は約10分の1未満になっています。
具体的なAPI料金は以下の通りです:
- 入力トークン:$0.0001 / 1K tokens
- 出力トークン:$0.0002 / 1K tokens
この料金設定により、開発者は低コストでo3-miniの高性能な機能を利用することができます。
「o3-mini-high」と「o1」を比較してみた
o3-miniは、従来のo1モデルと比較して多くの面で進化を遂げています。ここでは、「問題解決能力」と「コーディング能力」の両面から両モデルを比較してみましょう。
問題解決能力
まず、「垂れたろうそくを掃除してくれる動物は何?」と聞いてみたいと思います。
答え:フクロウ(拭くロウ)です。
「o3-mini」の場合
アライ(洗い)クマと答えてくれました。残念・・・惜しい・・・
でもすごいのは照合しまくっている点です。以下の動画をご覧ください。こんなにいろんな動物を照合して推論している動きはo1ではありませんでした。
「o3-mini-high」ではどうでしょうか。
象と答えてきました。残念・・・ただあっ(粗品)
ちゃんと拭くロウを推論できているんです。何故導けなかったあああ。
こんな難題の答えを推測できているという点ではすごいですよね。
では、o1ではどうでしょうか。
なんと、、正解してしまいました。。。数字を除いた問題解決能力としてはo1の方が優れているのかもしれません。
コーディング能力
ここではオセロのゲームを作ってもらうようにしました。
プロンプト例
オセロのゲームを作成してください。カスタムhtmlとCSSでワードプレス用にお願いします。他のソースに影響を与えないでください。また、レスポンシブ対応必須です。作り方を調べてもいいです。
「o3-mini-high」の場合
すごいできました!試してみてください。ひっくり返らないと置けないというありがた迷惑なルールになっていますが、上記のプロンプトで1分で作ったレベルとしては上出来です。
o1の場合はどうでしょうか。
o1もしっかり作成してくれましたが、デザイン面ではやはりo3に軍配が上がります。
o3すごい。
「o3-mini」と「o3-mini-high」の活用事例
ここでは「o3」を活用して作成したユーザーのクリエイティブを紹介していきます。
クイックソートの動作を説明するアニメ
これ、何かの変遷動画を作成するのにめちゃくちゃ便利ですよね。
シューティングゲームの作成
これもう飽きないですよ、本当にゲームが作れる時代に。
振り子のシミュレーションプログラム
これ、何かの発表でも使えますよね。
ポートフォリオの作成
いよいよLPもすぐにできる時代が近付いてきたのでは。
まとめ
OpenAIの新しい小型推論モデル「o3-mini」と「o3-mini-high」は、AI技術の新たな地平を切り開く革新的な製品です。これらのモデルは、特にSTEM分野での高い性能、コスト効率の向上、そして柔軟な利用オプションにより、幅広い用途での活用が期待されています。
主な特徴をまとめると:
- STEM領域での卓越した推論能力
- 大幅に向上したコスト効率
- 柔軟なReasoning Effortオプション
- 拡張されたAPI機能
- 大きなコンテキストウィンドウによる複雑な文脈理解
o3-miniとo3-mini-highは、ChatGPT Plusユーザーには無料で提供され、API利用者にも非常に競争力のある価格で提供されています。これにより、個人開発者から大企業まで、幅広いユーザーがこの最新技術を活用できるようになりました。
従来のo1モデルと比較して、o3-miniは多くの面で優れた性能を示しています。特に、STEM分野での問題解決能力、高速な応答性、そしてコスト効率の面で大きな進歩が見られます。
今後、o3-miniとo3-mini-highは、教育、研究、ビジネス、そして日常生活のさまざまな場面で活用されることが予想されます。これらのモデルの登場により、AI技術の応用範囲がさらに拡大し、私たちの生活や仕事のあり方に大きな変革をもたらす可能性があります。
趣味:業務効率化、RPA、AI、サウナ、音楽
職務経験:ECマーチャンダイザー、WEBマーケティング、リードナーチャリング支援
所有資格:Google AI Essentials,HubSpot Inbound Certification,HubSpot Marketing Software Certification,HubSpot Inbound Sales Certification
▼書籍掲載実績
Chrome拡張×ChatGPTで作業効率化/工学社出版
保護者と教育者のための生成AI入門/工学社出版(【全国学校図書館協議会選定図書】)
突如、社内にて資料100件を毎月作ることとなり、何とかサボれないかとテクノロジー初心者が業務効率化にハマる。AIのスキルがない初心者レベルでもできる業務効率化やAIツールを紹介。中の人はSEO歴5年、HubSpot歴1年