2024年10月、Anthropic社から衝撃的な発表がありました。強力なAIアシスタント「Claude 3.5 Sonnet」の大規模アップグレードと、革新的な新機能「コンピューター使用」機能の導入です。さらに、新モデル「Claude 3.5 Haiku」の登場も予告され、AI業界に大きな波紋を広げています。
前回のモデルは以下の記事をご覧ください。
このアップデートで、Claude 3.5 Sonnetはコーディング能力を大幅に向上させ、業界最高峰の性能を実現。特に注目すべきは、人間のようにコンピューターを操作できる画期的な新機能です。本記事では、このアップグレードされたClaude 3.5 Sonnet (New)の特徴や使い方、さらには新モデルClaude 3.5 Haikuについても詳しく解説していきます。
これまでのClaudeモデル変遷は以下
【GPTsのライバル】Claudeの新機能「Projects」とは?設定~使い方を徹底解説
速wClaude 3.5 Sonnetの使い方!料金は?無料で使える「Artifacts」についても徹底解説!
【iOSアプリ Claude爆誕】課金者がClaudeアプリの登録方法~使い方を徹底解説
【Claude 2.1(Claude2.1)登場!】Claude 2との違いや使い方は?ChatGPTとも比較してみた
Claude 3.5 Sonnet (New) とは?
Anthropic社が2024年10月に発表した最新のAIモデル「Claude 3.5 Sonnet (New)」は、前バージョンから大幅な性能向上を実現した革新的なAIアシスタントです。特筆すべきは、コーディング能力が大幅に向上し、業界トップとなったことが発表されています。
Claudeより引用
このアップグレードされたバージョンでは、従来のコストと処理速度を維持しながら、全体的な性能が向上。特に、ソフトウェアエンジニアリングのベンチマークであるSWE-bench Verifiedでは、スコアを33.4%から49.0%に改善し、OpenAI のGPT-4を含む他の公開モデルを上回る結果を示しています。
Claude 3.5 Sonnet (New) の特徴
Claude 3.5 Sonnet (New)の最大の特徴は、実務での即戦力となる高度な処理能力です。GitLabでの実証実験では、DevSecOps関連タスクにおいて平均10%の性能向上が確認されました。特筆すべきは、この性能向上がレイテンシーの増加を伴わないことです。つまり、より複雑な処理を同じ速度で実行できるようになったということです。
さらに、ツール使用能力も大幅に向上しています。小売業界の業務を想定したTAU-benchでは69.2%という高スコアを記録。より複雑な航空業界のタスクでも46.0%のスコアを達成し、実務での応用可能性を大きく広げました。
Cognitionによる実地テストでは、コードレビューから機能テスト、デバッグまでの一連の開発プロセスを自律的にこなす能力が実証されました。The Browser Companyでは、Webブラウザの自動操作やテスト自動化において、従来のツールでは実現できなかった複雑なワークフローの自動化に成功しています。
生成AI+RPA?!新機能「Computer Use(コンピューター使用)」がエグイ
Youtubeより引用
2024年10月、Anthropic社が発表したClaude 3.5 Sonnet (New)の新機能「Computer Use」が、ビジネス自動化の世界に革命を起こしています。この機能は、従来のRPA(Robotic Process Automation)と最新の生成AI技術を組み合わせた画期的な機能です。
この機能により、Claude 3.5 Sonnetは人間のようにコンピューターを操作できるようになりました。具体的には、画面を認識し、マウスを動かし、キーボードで入力するといった、人間の操作をエミュレートすることが可能になったのです。
Computer Use機能により、Claude 3.5 Sonnetは人間のように実際のコンピューターを操作できるようになりました。具体的には:
- 画面を見て状況を理解し、適切な操作を判断
- マウスカーソルを正確に移動させ、クリック操作を実行
- キーボードを使って文字入力を行う
つまり、人間がコンピューターを操作する方法をそのままエミュレートできるのです。
これ、もうRPA要るんでしょうか・・・詳細はは以下の動画からも確認いただけます。
コンピューター画面のスクリーンショットを解釈
カーソル移動に必要なピクセル数を正確に計算
クリック、タイピングなどの基本操作を実行
(業界最高)
他のAIモデル
なぜこれが画期的なのか?
従来のAIアシスタントは特別に設計されたツールを介してしか作業できませんでしたが、Computer Use機能により、既存の一般的なソフトウェアを直接操作できるようになりました。例えば:
- Excelの表からWebフォームへのデータ転記
- CRMシステムへの顧客情報入力
- 複数のアプリケーション間でのデータ連携
これらの作業を、人間の指示だけで自律的に実行できます。
開発プロセスと特徴
このComputer Use機能の開発には、いくつかの重要な技術的ブレイクスルーがありました:
- ピクセル精度の画面認識
- スクリーンショットを解析して画面の状態を理解
- 正確なピクセル数のカウントによる精密なカーソル移動
- 論理的な作業手順の生成
- ユーザーの指示を具体的な操作手順に変換
- 障害発生時の自己修正能力
- 汎用性の高い操作能力
- 計算機やテキストエディタなどの基本ソフトから学習
- 様々なソフトウェアへの応用が可能
技術的な性能を示すOSWorldベンチマークでは、14.9%というスコアを達成。これは次点の7.8%を大きく引き離す結果です。さらに、複数のステップを必要とする複雑なタスクでは22.0%まで性能が向上し、実用レベルでの活用が現実的となっています。
ただし、現時点ではいくつかの制限もあります。例えば、ドラッグ&ドロップやピンチズームといった複雑な操作はまだ完璧とはいえません。また、長時間の連続操作時の安定性にも改善の余地があります。しかし、Anthropic社はこれらの課題に積極的に取り組んでおり、今後のアップデートでの改善が期待されています。
Claude 3.5 Sonnet (New) の使い方
アップグレードされたClaude 3.5 Sonnetは、すべてのユーザーがすでに利用可能となっています。開発者の方々は、コンピューター使用のベータ版機能を使って開発を始めることができます。この革新的な機能により、画面の認識やカーソルの移動、ボタンのクリック、テキスト入力など、人間のようなコンピューター操作が可能になりました。
また、パブリックベータ版として提供されている「コンピューター使用」機能は、現段階ではまだ実験的な段階にあり、操作が難しかったりエラーが発生しやすい場合があります。しかし、開発者からのフィードバックを得ながら、今後急速な機能改善が期待されています。
実際に、Asana、Canva、Cognition、DoorDash、Replit、The Browser Companyなどの企業がすでにこの新機能を活用し始めており、数十から数百のステップを必要とする複雑なタスクの実行に成功しています。例えば、Replitは、このコンピューター使用機能とUIナビゲーション機能を活用して、Replit Agent製品用のアプリケーション評価機能の開発を進めています。
実際にClaude 3.5 Sonnet (New)を活用してみます。
①Claudeにログインします。
②この時点で既に使うことが可能となっています。
※New Introducing the upgraded Claude 3.5 Sonnet を押下すると機能モデルの説明が見られます。
Computer Use(コンピューター使用)機能の使い方
Anthropic社が公開したクイックスタートガイドを使えば、新しいComputer Use機能をすぐに体験することができます。提供されているクイックスタートリポジトリには、以下の3つのプラットフォームでの実装方法が詳しく解説されています:
- Anthropic APIを直接使用する方法
- Amazon Bedrockを利用する方法
- Google Cloud Vertex AIを使用する方法
執筆時点(2024年10月)では、最新のClaude 3.5 SonnetはAnthropicの本家APIでの利用が最も確実です。Amazon Bedrockでの対応はまだ完全には整っていない状況ですので、まずは本家APIでの検証をお勧めします。
開発者の方々は、このクイックスタートリポジトリを参考に、それぞれの環境に合わせた実装を進めることができます。実際の業務プロセスの自動化に向けて、まずはこのクイックスタートで基本的な機能を確認することをお勧めします。
ClaudeのComputer Use(コンピューター使用)機能を使う前に環境を構築する必要があります。Dockerをインストールしよう。詳しい使い方を説明します。
1. Dockerのインストール
インストールすると、以下のようなボタンが出てきて押すと、強制的に再起動になるので必要なデータは保存しておこう。
2. APIキーの取得
Anthropicのサービスを利用するためには、APIキーが必要となります。以下の手順で取得できます:
- Anthropicコンソールにアクセス
- アカウントを作成またはログイン
- コンソール画面から「API Keys」セクションを選択
- 「Create API Key」をクリックして新しいキーを生成
注意: APIキーは外部に漏れないよう、安全に管理してください。
APIキーの詳しい利用方法については、Anthropicの公式ドキュメントをご確認ください。
3.リポジトリのクローン
git clone https://github.com/anthropics/anthropic-quickstarts.git
4.Dockerコンテナを起動
以下の%your_api_key% にAnthropicAPIのキーを指定してください。
export ANTHROPIC_API_KEY=%your_api_key% docker run \ -e ANTHROPIC_API_KEY=$ANTHROPIC_API_KEY \ -v $HOME/.anthropic:/home/computeruse/.anthropic \ -p 5900:5900 \ -p 8501:8501 \ -p 6080:6080 \ -p 8080:8080 \ -it ghcr.io/anthropics/anthropic-quickstarts:computer-use-demo-latest
5.デモの開始: ブラウザで下記URLにアクセス
Docker起動完了後、お使いのウェブブラウザを開く
アドレスバーに以下のURLを入力:
http://localhost:8080」
これで仮想デスクトップの操作環境が整います
Computer Use機能の実力を体験するには、この公式のクイックスタートガイドが最適な入口となるでしょう。
パブリックベータ版として提供されており、開発者からのフィードバックを受けながら継続的に改善が行われています。
Claude 3.5 Sonnet (New) とClaude 3.5 Sonnet を比較してみた
左がClaude 3.5 Sonnet でClaude 3.5 Sonnet (New) です。
コーディングスピードとしては元の方が早いですがコードの質は右の方がしっかり作成してくれました。
このように、Claude 3.5 Sonnet (New)は、より実践的で柔軟な利用が可能となり、開発現場での活用の幅が大きく広がっています。
実際の活用シーンとしては、ECサイトでの商品情報の収集や、顧客データの一括入力、ソフトウェアのテスト自動化などが挙げられます。例えば、ある企業では毎日数百件の顧客データを異なるシステムに手動で転記する作業を行っていましたが、Claude 3.5 Sonnet (New)の導入により、この作業を完全に自動化することに成功しました。
新モデル「Claude 3.5 Haiku」はいつ出る?
2024年10月後半に登場予定のClaude 3.5 Haikuは、高速処理と低コストを両立した画期的な新モデルです。注目すべきは、前世代の最上位モデルであるClaude 3 Opusと同等以上の性能を持ちながら、処理速度と運用コストを大幅に改善している点です。
具体的な性能指標として、ソフトウェア開発能力を測るSWE-bench Verifiedでは40.6%という高スコアを記録。これは初期版のClaude 3.5 SonnetやGPT-4を上回る成績であり、Haikuの実力の高さを示しています。
リリーススケジュールとしては、まずテキスト処理機能のみを搭載した第一世代が提供され、その後のアップデートで画像入力機能が追加される予定です。提供プラットフォームは、Anthropicの独自API、Amazon Bedrock、Google Cloud Vertex AIの3つのプラットフォームで同時展開されます。これにより、開発者は既存の開発環境を変更することなく、新モデルの導入が可能となります。
Claude 3.5 Sonnet (New) の安全性は?
AIの安全性が重要視される中、Claude 3.5 Sonnet (New)は徹底的な安全性検証を経て提供されています。米国のUS AI Safety Institute (US AISI)と英国のUK Safety Institute (UK AISI)による厳格な事前検証を通過し、両機関から高い評価を受けています。
特に注目すべきは、新機能「コンピューター使用」に関する安全性対策です。AIによるコンピューター操作という新しい可能性は、同時に新たなセキュリティリスクも伴います。これに対しAnthropicは、プロンプトインジェクション攻撃への対策や、不正利用を検知する高度な監視システムを実装。さらに、ユーザーデータの保護に関しても、厳格なガイドラインに基づいた管理体制を確立しています。
継続的な安全性向上への取り組みも特筆すべき点です。新たな脅威が発見された場合の迅速な対応体制を整備し、セキュリティクラシファイアの継続的な改善を行っています。また、「責任あるAI開発」という観点から、モデルの判断プロセスの透明性確保にも注力しています。
Claude 3.5 Sonnet (New) まとめ
Claude 3.5 Sonnet (New)は、AIアシスタントの新時代を切り開く革新的なモデルとして注目を集めています。コーディング能力の大幅な向上や、人間のようなコンピューター操作能力の実現により、ビジネスプロセスの自動化に新たな可能性をもたらしました。
特に「コンピューター使用」機能は、これまでのAIにはない画期的な機能として高く評価されています。実際の業務現場での活用事例も増えており、その実用性は既に実証されつつあります。
さらに、新モデルのClaude 3.5 Haikuの登場により、AnthropicのAI技術はより幅広い用途での活用が期待されています。高速処理と低コストを両立させた新モデルは、中小規模の企業にとっても導入しやすい選択肢となるでしょう。
今後の展望として、より高度な操作性の実現や、開発者の実装負担軽減、さらなる安全性の向上などが期待されています。AI技術の進化が続く中、Claude 3.5 Sonnet (New)は、その先端を走る存在として注目を集め続けることでしょう。
趣味:業務効率化、RPA、AI、サウナ、音楽
職務経験:ECマーチャンダイザー、WEBマーケティング、リードナーチャリング支援
所有資格:Google AI Essentials,HubSpot Inbound Certification,HubSpot Marketing Software Certification,HubSpot Inbound Sales Certification
書籍掲載実績:Chrome拡張×ChatGPTで作業効率化/工学社出版
突如、社内にて資料100件を毎月作ることとなり、何とかサボれないかとテクノロジー初心者が業務効率化にハマる。AIのスキルがない初心者レベルでもできる業務効率化やAIツールを紹介。中の人はSEO歴5年、HubSpot歴1年