2023.12.10 OpenAIがAIモデルトレーニングのための新データパートナーシップを立ち上げ
OpenAIは「OpenAI Data Partnerships」というAIモデルのトレーニングに必要なパブリックおよびプライベートのデータセットを構築する新たな取り組みを立ち上げた。
OpenAIは、このパートナーシップを通じて、より多くの組織がAIの舵取りを支援し、より有益なモデルから恩恵を受けることを可能にすることを目指している。
AIモデルが全人類にとって安全で有益なAGIを実現するためには、すべてのテーマ、業界、文化、言語を深く理解することが必要だ。そのためには、広範なトレーニングデータセットが不可欠である。
データセットの構築には、画像、音声、動画などの多様なメディアを含むとされている。また、「人間の意図を表現する」データ、例えば長文のテキストや会話なども含まれるだろう。
データは、パートナーシップ参加組織との協力のもと、光学式文字認識ツールや自動音声認識ツールを用いてデジタル化され、必要に応じて機密情報や個人情報が削除される。
OpenAIは、2種類のデータセット、すなわち誰でも利用可能なオープンソースのデータセットと独自のAIモデルのトレーニングに利用するプライベートデータセットを構築する予定だ。
新しいAGIの定義
新たなAGIの定義に関しては、グーグル・ディープマインドの研究チームが提案している。どのようなタスクを何個こなせば人間並みとされるのか、といった具体的な基準がしっかりと設けられているのだ。
研究チームは、この新定義を作成するためにまず、既存のよく知られているAGIの定義から出発点を設け、それらが共有する本質的特徴を抜き出した。AGIは単にAIであるというだけではなく、AIよりも優れているという観念が重要であるとされている。
さらに、研究チームはAGIの5つの段階レベルを提唱している。これは新興、有能、専門家、名人、そして超人間の5段階で、現在最先端のチャットボットである「チャットGPT(ChatGPT)」や「バード(Bard)」などが新興の段階に位置づけられている。
超人間のレベルでは、他人の思考の解読や未来の出来事の予測、動物との会話など、人間がまったくできないタスクをどの人間よりもうまく実行する能力が求められる。しかし、新興AGIを超えるレベルに到達するのはまだこれからの課題とされている。
【関連リンク】
・AI トレーニング用のオープンソース データセットとプライベート データセットを共同で作成します。(OpenAI)
https://openai.com/blog/data-partnerships
【関連記事】
- Humaneが革新的ウェアラブルプロジェクター「Ai Pin」を発表!
- OpenAIがAIチャット「ChatGPT」の公式アカウントを開始
- 高解像度でディテールまで再現!OpenAIのDALL-E 3が画像生成に進化
- 「ChatGPT」にAIとユーザーのやり取りを保存しない新機能が追加。
- OpenAI社のCEOであるサム・アルトマン氏が来日、岸田総理大臣と面会を果たす。
- 米オープンAIのCEO、AI規制求める
- 「ChatGPT」、インターネットへのアクセスが可能に。最新の情報を提供。
- 最新「GPT-4」が発表。数ヶ月後にはMicrosoft 365とかけ合わせた新機能が利用可能に。
- 話題の「ChatGPT」で、他のユーザーの履歴が見れてしまう不具合が発生。
TEXT:PreBell編集部
PHOTO:iStock