Googleが推論能力を高めた「Gemini 2.5」を発表

2025/03/30

Googleは3月25日、最新のAIモデル「Gemini 2.5」を発表した。推論能力の強化を特徴とし、最初のリリースとして「Gemini 2.5 Pro Experimental」が提供される。このモデルは、従来のAIと異なり、出力を決定する前に自らの思考プロセスを分析する機能を持つ。数学、科学、コーディングの各分野で評価が高く、「LMArena」のリーダーボードでも首位に立っている。

開発者は「Google AI Studio」でGemini 2.5を利用でき、一般ユーザー向けには「Gemini Advanced」からのアクセスが可能となる。将来的には「Vertex AI」にも展開される予定だ。モデルの基本的な特徴として、長いコンテキストウィンドウとマルチモーダル対応が挙げられる。テキストや画像に加え、音声や動画、コードリポジトリまで幅広い情報を処理できる。

競争が激化するAI市場において、Googleは推論機能をAIモデルに組み込むことを強調している。他社との比較では、OpenAIの「o3-mini」やAnthropicの「Claude 3.7 Sonnet」との競争が注目される。特にコーディング性能に関する評価では、Anthropicのモデルが一部のベンチマークで上回る結果を示しているが、総合的な推論能力ではGemini 2.5が優位に立つ部分もある。

Gemini 2.5の実用性

GoogleはGemini 2.5の実用性を示すため、具体的な事例を公開している。例えば、簡単なプロンプトからゲームを自動生成するデモや、手書きスケッチを3Dプリント用データに変換する実験が行われた。特にエンドレスランナー型ゲームを短時間で構築するデモは、開発者の注目を集めた。

数学・科学分野においても、Gemini 2.5は「GPQA」や「AIME 2025」などのベンチマークで高い成績を記録した。また、「Humanity’s Last Exam」と呼ばれるデータセットでは、ツールなしのモデルとして18.8%のスコアを達成している。コーディング能力に関しては、「Aider Polyglot」や「SWE-Bench Verified」などの評価で高スコアを獲得し、コード変換や編集機能の向上が確認された。

一方で、完璧ではない部分も指摘されている。例えば、コーディング能力を測る「LiveCodeBench v5」では、OpenAIの「o3-mini」の方が高スコアを記録した。また、一部のユーザーからはGeminiアプリの再インストールが必要だったとの報告がある。

Googleの発表を受け、他のAI企業も推論能力を強化したモデルの開発を加速させるとみられる。OpenAIやAnthropic、xAI、DeepSeekなどが競争を繰り広げる中で、AIの推論能力が技術革新の中心的なテーマとなりつつある。

【関連リンク】
・Google、思考するAI「Gemini 2.5」発表──推論能力とコーディング能力が大幅向上(ITmedia AI＋)
https://www.itmedia.co.jp/aiplus/articles/2503/26/news121.html

TEXT：PreBell編集部
PHOTO：iStock

tag: #AI

#Google

この記事を気にいったらいいね！しよう

PreBellの最新の話題をお届けします。

Follow @prebell_jp