2025年1月20日、中国のAI開発スタートアップ「DeepSeek」が、画期的な推論モデル「DeepSeek R1」をリリースしました[1]。このモデルは、OpenAIの最高精度推論モデル「o1」と同等の性能を持ちながら、驚くべき低価格で提供されています。本記事では、DeepSeek R1の概要、機能、使用方法、料金体系、そしてChatGPT o1との比較について詳しく解説していきます。
この記事はこんな人におすすめ
・「DeepSeek」がSNSで話題で気になる
・「DeepSeek」はo1より頭いいって本当?
DeepSeek R1とは?
DeepSeekより引用
DeepSeek R1は、中国のAI企業DeepSeekが開発した最新の推論モデルです。DeepSeekは、2024年のクリスマスに685Bパラメータを持つ「DeepSeek V3」をHugging Faceに公開し、一躍注目を集めた企業です。R1の登場は、V3に続く衝撃的な発表となりました。このモデルは、o1と同等の高度な推論能力と低コストを両立させた革新的なAIとして注目を集めています。
DeepSeek R1は2つのモデルで構成
DeepSeek社は、強化学習を中心とした独自のアプローチで新しい推論モデルシリーズを開発しました。このシリーズは2つの主要なモデルから構成されています。
DeepSeek R1-Zero・・・強化学習のみで訓練されたモデル
DeepSeek R1・・・DeepSeek R1-Zeroを改良したもの
特徴は以下のとおり。
モデル | 特徴 | 開発アプローチ | 推論性能 |
---|---|---|---|
DeepSeek R1-Zero | 実験的モデル | 強化学習のみ | 独自の推論パターン獲得 |
DeepSeek R1 | 完成形モデル | 強化学習+コールドスタート | OpenAI-o1と同等 |
DeepSeek R1-Zeroは、従来のモデル開発で一般的だった教師あり学習による事前調整を完全に省略し、強化学習のみで訓練を行うという大胆な実験から生まれました。このアプローチにより、モデルは予想以上の推論能力を示し、自然な形で強力な問題解決パターンを獲得しました。しかし、同時にいくつかの課題も明らかになりました
- 同じ内容の繰り返し出力
- 複数言語の混在
- 文章の可読性の低下
これらの課題を克服するため、研究チームは強化学習の前段階でコールドスタートデータを導入するという改良を加え、DeepSeek R1を開発しました。この改良により、R1-Zeroの問題を解消しながら、数学、コーディング、そして一般的な推論タスクにおいてOpenAI-o1と同等の性能を実現することに成功しています。
さらに注目すべき成果として、より実用的なサイズへの蒸留モデルの開発があります。特にDeepSeek-R1-Distill-Qwen-32Bは、OpenAI-o1-miniを上回る性能を示し、密モデルとしては最高性能を記録しました。これは、高度な推論能力を持つAIモデルの実用化への大きな一歩と言えるでしょう。
DeepSeek R1の4つの特徴
DeepSeek R1が注目されるのには以下の4つの特徴があります。
特徴 | 詳細 |
---|---|
OpenAI-o1に匹敵する推論性能 |
OpenAIのo1モデルと同等以上の性能を実現
・教師なし強化学習による独自の推論能力獲得
・数学、コーディング、一般的な推論タスクで高性能 ・コールドスタートデータ活用による安定性向上 |
従来の25分の1以下の価格設定 |
API価格がOpenAI o1の25分の1以下
・効率的なMoEアーキテクチャ採用
・37Bの活性化パラメータで671Bの総パラメータ相当の性能 ・リソース使用の最適化による運用コスト削減 |
MITライセンスによる完全オープン化 |
MITライセンスによる完全なる自由度
・商用利用、改変、再配布が完全に自由
・1.5Bから70Bまでの6種類の蒸留モデルを提供 ・QwenとLlamaベースのモデルで幅広いニーズに対応 |
数学・コーディングでの卓越した成績 |
幅広い分野での優れた成績
・AIME 2024で79.8%の正答率
・Codeforces Rating 2029を達成 ・MATH-500で97.3%、MMLUで90.8%のスコア |
OpenAI-o1に匹敵する推論性能
DeepSeek R1の高性能は、革新的な開発アプローチによって実現されています。特に注目すべきは、大規模な強化学習(RL)を直接適用する手法を採用したことです。従来の教師あり学習(SFT)による事前調整を経ずに、モデルが自然に推論能力を獲得できることを実証しました。
この開発プロセスは2段階に分かれています:
- DeepSeek R1-Zero:強化学習のみで訓練され、独自の推論パターンを獲得
- DeepSeek R1:コールドスタートデータを導入し、より安定した性能を実現
結果として、数学、コーディング、一般的な推論タスクにおいてOpenAI-o1と同等以上の性能を達成。特にアメリカ数学オリンピック予選やプログラミングコンテストなどで優れた成績を収めています。
従来の25分の1以下の価格設定
API価格設定において、OpenAI-o1の25分の1以下という画期的な価格を実現しました。この低コスト化は、効率的なモデルアーキテクチャと独自の最適化技術によって可能となりました。特に:
- MoEアーキテクチャの採用による効率的な計算リソースの活用
- 37Bの活性化パラメータで671Bの総パラメータに匹敵する性能を実現
- 効率的な推論パターンの発見によるリソース使用の最適化
MITライセンスによる完全オープン化
MITライセンスでの公開は、AI研究とビジネス応用の両面で重要な意味を持ちます
- 商用利用が完全に自由
- モデルの改変や再配布が可能
- 研究コミュニティへの貢献
- 6つの異なるサイズの蒸留モデルを提供(1.5Bから70Bまで)
- QwenとLlamaベースのモデルを提供し、様々なニーズに対応
数学・コーディングでの卓越した成績
様々なベンチマークで優れた性能を示しています
- AIME 2024:79.8%の正答率(OpenAI-o1-miniの63.6%を上回る)
- MATH-500:97.3%の正答率を達成
- Codeforces:2029のレーティングを記録
- MMLU:90.8%のスコアを達成
- DROP:92.2%のF1スコアを記録
特に蒸留モデルのDeepSeek-R1-Distill-Qwen-32Bは、より小さなモデルサイズながら優れた性能を示し、実用的な展開の可能性を広げています。
なぜDeepSeek R1は低コストで高性能なのか?
DeepSeekが注目を集めている最大の理由は、モデルのトレーニングコストを劇的に圧縮することに成功している点です。例えば、DeepSeek V3は685Bパラメータの超巨大モデルですが、次点で大きいLlama 3.1 405Bと比べても、わずか11分の1ほどの学習時間しかかかっていないとされています。
この効率化がどのように実現されているかは詳細が明かされていませんが、学習効率を劇的に高める独自の技術を有していると考えられます。この技術により、フロンティアモデルの学習コストを大幅に削減し、結果として低価格でのサービス提供が可能になっているのです。
DeepSeek R1でできること
DeepSeek R1は、高度な推論能力を持つAIモデルとして、様々なタスクをこなすことができます。以下に、主な機能と応用例を紹介します。
1. 複雑な問題解決
DeepSeek R1は、数学や科学の複雑な問題を解決する能力に優れています。アメリカ数学オリンピック予選の正答率で79.8%を記録し、OpenAI o1の79.2%を上回る成績を示しました。これは、R1が高度な数学的推論を行えることを示しています。
2. プログラミングとコーディング支援
プログラマーのレーティングサイトCodeforcesのランクで、96.3%の人間を上回る高ランクを達成しています。これは、R1が複雑なアルゴリズムの理解や効率的なコード生成に優れていることを示唆しています。
3. 自然言語処理タスク
テキスト生成、要約、翻訳、質問応答など、幅広い自然言語処理タスクをこなすことができます。高度な言語理解能力により、ニュアンスの捉えやコンテキストの理解も優れています。
4. データ分析と洞察
大量のデータから重要な洞察を導き出す能力があります。ビジネス分析やマーケットリサーチなどの分野で活用できる可能性があります。
5. クリエイティブな文章生成
物語、詩、スクリプトなど、創造的な文章を生成することができます。人間の作家やクリエイターの補助ツールとして活用できます。
DeepSeek R1は無料で使える?
DeepSeek R1は、無料で試用できる方法と、有料のAPI利用の両方が用意されています。以下に、それぞれの利用方法と料金体系について詳しく説明します。
無料で使用する方法は2つ
- Webインターフェース
DeepSeekの公式サイトでは、ChatGPTのようなWebインターフェースを提供しています。アカウントを作成するだけで、無料でDeepSeek R1を試すことができます。ただし、利用回数に一定の制限があります。 - スマートフォンアプリ
iPhoneとAndroid向けのアプリが公開されており、App StoreやGoogle Play Storeから無料でダウンロードできます。アプリ版も現在は無料で利用可能で、課金オプションは存在しません。
これらの無料版では、「DeepThink」モードをオンにすることで、DeepSeek R1モデルを使用できます。R1は回答を生成する前に「考える」ステップを踏み、その思考過程を見ることができるのが特徴です。
有料APIの料金体系
DeepSeek R1をより本格的に、または大量に利用したい場合は、APIを通じて従量課金で利用することができます。
DeepSeek APIの料金体系は以下の通りです:
項目 | 料金 (1M tokens あたり) |
---|---|
入力トークン (キャッシュ有) | $0.14 |
入力トークン (キャッシュ無) | $0.55 |
出力トークン | $2.19 |
この料金設定は、OpenAI o1と比較して大幅に安価です:
- 入力トークン (キャッシュ有): 98%引き
- 入力トークン (キャッシュ無): 96%引き
- 出力トークン: 96%引き
API利用のためには、DeepSeek APIのプラットフォームでアカウントを作成し、PayPalやクレジットカードで料金をチャージする必要があります。最小チャージ額は2ドルからで、使用量に応じてチャージ残高が消費されていきます[1]。
無料版と有料版の違い
- 利用制限
無料版(WebインターフェースとアプリVersion)には利用回数の制限がありますが、具体的な制限回数は明確に公表されていません。一方、有料APIには利用回数の制限はなく、チャージした金額の範囲内で自由に使用できます。 - 機能の違い
無料版でも基本的な機能は使えますが、APIを使用することで、より柔軟にDeepSeek R1を自社のサービスやアプリケーションに組み込むことができます。 - 応答速度と安定性
有料APIを使用した方が、より安定した高速な応答が期待できる可能性があります。 - カスタマイズ性
APIを使用することで、より細かい設定やパラメータの調整が可能になり、特定の用途に最適化したAI機能を実装できます。 - スケーラビリティ
大規模なサービスや頻繁な利用を想定している場合、APIを使用する方が適しています。
無料版は、DeepSeek R1の性能を試してみたい個人ユーザーや小規模な利用に適しています。一方、ビジネスでの利用や大規模なプロジェクトでは、有料APIを使用することで、より安定した高品質なサービスを提供できるでしょう。
料金面では、他のAIサービスと比較して非常に競争力のある価格設定となっているため、コスト効率の高いAIソリューションを求めている企業にとっては魅力的な選択肢となるでしょう。
DeepSeek R1の使い方
DeepSeek R1を使用する方法はいくつかありますが、ここでは主にWebインターフェースでの使い方について詳しく説明します。
Webインターフェースを使用する方法
DeepSeekの公式サイトでは、ChatGPTのようなWebインターフェースを提供しています。これは、最も簡単にDeepSeek R1を試すことができる方法です。
手順:
DeepSeekの公式サイトにアクセスします。
「Start Now」ボタンをクリックします。
メールアドレスとパスワードを登録してアカウントを作成します。Googleでの簡単ログインがおすすめです。
ログイン後、チャットインターフェースが表示されます。
「DeepThink」モードをオンにして、DeepSeek R1モデルを使用します。
テキストボックスに質問や指示を入力し、送信します。
例えば「牛がいて塔があって鹿がいて、それぞれが混ざり合っている職業ってなんだ?」ってきいてみました。
基本的に中国語か英語が主になりますが、プロンプトを「think in English, output in Japanese:」とつけると最初に中国語で英語圏で思考して日本語で最後回答を返してくれます。
think in English, output in Japanese:
答え:投資家
それぞれの単語「うし」「とう」「しか」を混ぜ合わせると「とうしか」に
んんwはずれました。問題が悪かったかww
think in English, output in Japanese:大谷翔平はホームラン何本去年打った?
と入れてみました。
2023年の内容でしたが回答は合っています。2024年は?と聞いてみると・・・
2024年7月13日までの回答しかできないようです。
※無料で利用できますが、使用回数に制限があります。
DeepSeek R1は非常に強力なツールですが、その能力を最大限に引き出すには、適切な使用方法と継続的な学習が必要です。ユーザーのフィードバックや実際の使用経験を基に、より効果的な利用方法を見出していくことが重要です。
DeepSeek R1とChatGPT o1を比較してみた
DeepSeek R1とChatGPT o1(OpenAI GPT-4)は、両者とも最先端の大規模言語モデルですが、いくつかの重要な違いがあります。ここでは、性能、コスト、アクセシビリティ、特徴的な機能、制限事項などの観点から両者を比較します。
1. 性能比較
数学的推論能力
- DeepSeek R1:アメリカ数学オリンピック予選の正答率で79.8%を記録
- ChatGPT o1:同テストで79.2%の正答率
この結果から、DeepSeek R1は数学的推論能力においてChatGPT o1とほぼ同等、あるいはわずかに上回る性能を示しています。
以下の推論の問題で比較してみました。
【問題】
X、Y、Zが同じ絵を見てて、次のように発言した。
X この絵には虎が描かれている。
Y この絵には少なくとも虎か龍が描かれている。
Z この絵には龍が描かれている。
全員が本当のことを言っているとは限らない。そこで、以下の推論がなされた。次のうち正しいものを一つ選びなさい。
<選択肢>
Yが正しければXは必ず正しい
SPIより引用
Zが正しければYは必ず正しい
Xが正しければZは必ず正しい
B:Zが正しければYは必ず正しい
数学的推論能力:DeepSeek R1の場合
しっかり正解してくれました。すげええええ
数学的推論能力:o1の場合
o1も強いですやりおった。でも、o1(月額3,000円前後と同様のものが無料で使えるのはすごい・・・)
プログラミング能力
- DeepSeek R1:Codeforcesのランクで96.3%の人間を上回る
- ChatGPT o1:具体的な数値は公表されていないが、高いプログラミング能力を持つことで知られている
両モデルとも高度なプログラミング能力を持っていますが、DeepSeek R1の具体的な数値が公表されているため、直接的な比較が可能です。
「ビールジョッキのローディングアニメーションを作成するコードを作成して」と入れてみました。
プログラミング能力:DeepSeek R1の場合
できました。すごい4コマ漫画にありそうですごくないですか?
プログラミング能力:o1の場合
んん?正直再現できていないです。。。これはDeepSeek R1に軍配あり
2. コスト比較
DeepSeek R1は、ChatGPT o1(GPT-4)と比較して大幅に低コストです。
モデル | 入力トークン(キャッシュ有) | 入力トークン(キャッシュ無) | 出力トークン |
---|---|---|---|
DeepSeek R1 | $0.14 / 1M tokens | $0.55 / 1M tokens | $2.19 / 1M tokens |
ChatGPT o1 | $10 / 1M tokens | $10 / 1M tokens | $30 / 1M tokens |
DeepSeek R1は、ChatGPT o1と比較して:
- 入力トークン(キャッシュ有):98%引き
- 入力トークン(キャッシュ無):96%引き
- 出力トークン:96%引き
この大幅なコスト差は、DeepSeek R1の大きな競争優位性となっています。
3. アクセシビリティ
DeepSeek R1:
- 無料のWebインターフェースとモバイルアプリを提供
- APIは比較的低コストで利用可能
- オープンソースでモデルをダウンロード可能(MITライセンス)
ChatGPT o1:
- ChatGPT Plusの有料サブスクリプション(月額20ドル)で利用可能
- APIは比較的高コスト
- クローズドソース
DeepSeek R1は、無料版の提供やオープンソース化により、より幅広いユーザーがアクセスしやすい環境を提供しています。
4. 特徴的な機能
DeepSeek R1:
- 「DeepThink」モードによる思考プロセスの可視化
- 効率的な学習アルゴリズムによる低コスト化
ChatGPT o1:
- 高度なマルチモーダル機能(画像理解・生成など)
- 豊富な学習データによる幅広い知識
ChatGPT o1は、より多様な機能と幅広い知識ベースを持っていますが、DeepSeek R1は思考プロセスの可視化という独自の特徴を持っています。
5. 制限事項
DeepSeek R1:
- 比較的新しいモデルのため、長期的な安定性や一貫性が未確認
- 中国企業製のため、一部の国や組織で使用に制限がかかる可能性
ChatGPT o1:
- 高コストによる利用制限
- 一部の機能やデータへのアクセス制限
DeepSeek R1は新しいモデルであるため、長期的な評価はまだ確立されていません。一方、ChatGPT o1はコストや一部の制限が課題となっています。
まとめ
DeepSeek R1とChatGPT o1(GPT-4)は、それぞれに強みと特徴を持つ高性能な言語モデルです。DeepSeek R1は、その低コストと高い数学的推論能力で注目を集めており、特にコスト効率を重視するユーザーや、オープンソースの柔軟性を求める開発者にとって魅力的な選択肢となっています。
一方、ChatGPT o1は、より幅広い機能と豊富な知識ベースを持ち、高度なマルチモーダルタスクに強みを発揮します。また、OpenAIの継続的な改善と安定性も大きな利点です。
選択にあたっては、プロジェクトの具体的な要件、予算、セキュリティ要件、必要な機能などを総合的に考慮する必要があります。また、両モデルとも急速に進化しているため、最新の情報を常に確認することが重要です。
AI技術の進歩は日々加速しており、DeepSeek R1とChatGPT o1の競争は、より優れたAIサービスの開発と、ユーザーにとってのより良い選択肢の創出につながることが期待されます。
趣味:業務効率化、RPA、AI、サウナ、音楽
職務経験:ECマーチャンダイザー、WEBマーケティング、リードナーチャリング支援
所有資格:Google AI Essentials,HubSpot Inbound Certification,HubSpot Marketing Software Certification,HubSpot Inbound Sales Certification
▼書籍掲載実績
Chrome拡張×ChatGPTで作業効率化/工学社出版
保護者と教育者のための生成AI入門/工学社出版(【全国学校図書館協議会選定図書】)
突如、社内にて資料100件を毎月作ることとなり、何とかサボれないかとテクノロジー初心者が業務効率化にハマる。AIのスキルがない初心者レベルでもできる業務効率化やAIツールを紹介。中の人はSEO歴5年、HubSpot歴1年