Googleが推論能力を高めた「Gemini 2.5」を発表
Googleは3月25日、最新のAIモデル「Gemini 2.5」を発表した。推論能力の強化を特徴とし、最初のリリースとして「Gemini 2.5 Pro Experimental」が提供される。このモデルは、従来のAIと異なり、出力を決定する前に自らの思考プロセスを分析する機能を持つ。数学、科学、コーディングの各分野で評価が高く、「LMArena」のリーダーボードでも首位に立っている。
開発者は「Google AI Studio」でGemini 2.5を利用でき、一般ユーザー向けには「Gemini Advanced」からのアクセスが可能となる。将来的には「Vertex AI」にも展開される予定だ。モデルの基本的な特徴として、長いコンテキストウィンドウとマルチモーダル対応が挙げられる。テキストや画像に加え、音声や動画、コードリポジトリまで幅広い情報を処理できる。
競争が激化するAI市場において、Googleは推論機能をAIモデルに組み込むことを強調している。他社との比較では、OpenAIの「o3-mini」やAnthropicの「Claude 3.7 Sonnet」との競争が注目される。特にコーディング性能に関する評価では、Anthropicのモデルが一部のベンチマークで上回る結果を示しているが、総合的な推論能力ではGemini 2.5が優位に立つ部分もある。
Gemini 2.5の実用性
GoogleはGemini 2.5の実用性を示すため、具体的な事例を公開している。例えば、簡単なプロンプトからゲームを自動生成するデモや、手書きスケッチを3Dプリント用データに変換する実験が行われた。特にエンドレスランナー型ゲームを短時間で構築するデモは、開発者の注目を集めた。
数学・科学分野においても、Gemini 2.5は「GPQA」や「AIME 2025」などのベンチマークで高い成績を記録した。また、「Humanity’s Last Exam」と呼ばれるデータセットでは、ツールなしのモデルとして18.8%のスコアを達成している。コーディング能力に関しては、「Aider Polyglot」や「SWE-Bench Verified」などの評価で高スコアを獲得し、コード変換や編集機能の向上が確認された。
一方で、完璧ではない部分も指摘されている。例えば、コーディング能力を測る「LiveCodeBench v5」では、OpenAIの「o3-mini」の方が高スコアを記録した。また、一部のユーザーからはGeminiアプリの再インストールが必要だったとの報告がある。
Googleの発表を受け、他のAI企業も推論能力を強化したモデルの開発を加速させるとみられる。OpenAIやAnthropic、xAI、DeepSeekなどが競争を繰り広げる中で、AIの推論能力が技術革新の中心的なテーマとなりつつある。
【関連リンク】
・Google、思考するAI「Gemini 2.5」発表──推論能力とコーディング能力が大幅向上(ITmedia AI+)
https://www.itmedia.co.jp/aiplus/articles/2503/26/news121.html
関連記事
TEXT:PreBell編集部
PHOTO:iStock
この記事を気にいったらいいね!しよう
PreBellの最新の話題をお届けします。
