中国の新AIモデル「DeepSeek R1」、OpenAIの「o1」と同等レベルとして話題に
中国のAI企業DeepSeekが公開した言語モデル“DeepSeek-R1”が、業界で広く話題を呼んでいる。このモデルは、米OpenAIの最新モデル“o1”に匹敵する性能を持ちながら、無料で提供されている。DeepSeekは、このモデルをオープンソースライセンスで公開し、利用者が自由に改変や商用利用を行える環境を整えた。特に個人開発者や中小企業にとって活用しやすいものとなっている。
DeepSeek-R1の主な特徴は、強化学習を駆使した高度なトレーニング手法にある。このアプローチにより、数学やプログラミング、推論タスクにおいて優れた性能を発揮することが可能だ。また、“DeepSeek-R1-Zero”という初期バージョンでは、教師あり学習を排除し、完全な強化学習を採用した点が注目される。AlphaZeroの自己対戦による進化を彷彿とさせるこの手法は、試行錯誤を繰り返す中で自律的に学習を進める仕組みとなっている。
今回の発表により、AI業界では商用利用可能なオープンソースモデルとしての価値が強調されている。一方で、このモデルの開発元が中国企業であることから、一部の利用者はその信頼性やデータ保護に関する懸念を抱いている。実際に、台湾や中国政府に関連する質問では特定の制約が確認されており、この点には注意が必要だ。
DeepSeek-R1の性能と課題
DeepSeek-R1は、数学的推論やプログラミング能力において特に高い評価を得ている。例えば、アメリカ数学招待試験(AIME 2024)では79.8%という優れたスコアを記録し、同様の分野でOpenAI“o1”を僅かに上回った。また、総合的な知識理解力を評価するMMLUテストでは90.8%のスコアを達成し、幅広い分野における有用性を示している。さらに、プログラミングコンテストプラットフォームCodeforcesでは2029という高レーティングを獲得し、競技プログラミング分野でもその性能が証明された。
一方で、このモデルには課題も残る。出力の一部で中国政府の主張を反映した回答が見られるほか、使用言語に関しても特定の偏りが指摘されている。中国語を中心とした推論プロセスにより、他言語との整合性に課題が生じる場合があることから、利用者はプロンプト設計や出力結果のチェックに細心の注意を払う必要がある。
総じて、DeepSeek-R1は性能面での評価が高いが、その背後に潜む課題を踏まえた適切な利用が求められる。AI技術の進展を背景に、こうしたオープンソースモデルがどのように発展していくか、注目が集まっている。
【関連リンク】
・OpenAIの「o1」と同レベルうたうLLM「R1」登場、中国DeepSeekから 商用利用可(ITmedia AI+)
https://www.itmedia.co.jp/aiplus/articles/2501/21/news104.html
関連記事
TEXT:PreBell編集部
PHOTO:Freepik
この記事を気にいったらいいね!しよう
PreBellの最新の話題をお届けします。