OpenAIがAIモデルトレーニングのための新データパートナーシップを立ち上げ

2023/12/01

OpenAIは「OpenAI Data Partnerships」というAIモデルのトレーニングに必要なパブリックおよびプライベートのデータセットを構築する新たな取り組みを立ち上げた。

OpenAIは、このパートナーシップを通じて、より多くの組織がAIの舵取りを支援し、より有益なモデルから恩恵を受けることを可能にすることを目指している。

AIモデルが全人類にとって安全で有益なAGIを実現するためには、すべてのテーマ、業界、文化、言語を深く理解することが必要だ。そのためには、広範なトレーニングデータセットが不可欠である。

データセットの構築には、画像、音声、動画などの多様なメディアを含むとされている。また、「人間の意図を表現する」データ、例えば長文のテキストや会話なども含まれるだろう。

データは、パートナーシップ参加組織との協力のもと、光学式文字認識ツールや自動音声認識ツールを用いてデジタル化され、必要に応じて機密情報や個人情報が削除される。

OpenAIは、2種類のデータセット、すなわち誰でも利用可能なオープンソースのデータセットと独自のAIモデルのトレーニングに利用するプライベートデータセットを構築する予定だ。

新しいAGIの定義

新たなAGIの定義に関しては、グーグル・ディープマインドの研究チームが提案している。どのようなタスクを何個こなせば人間並みとされるのか、といった具体的な基準がしっかりと設けられているのだ。

研究チームは、この新定義を作成するためにまず、既存のよく知られているAGIの定義から出発点を設け、それらが共有する本質的特徴を抜き出した。AGIは単にAIであるというだけではなく、AIよりも優れているという観念が重要であるとされている。

さらに、研究チームはAGIの5つの段階レベルを提唱している。これは新興、有能、専門家、名人、そして超人間の5段階で、現在最先端のチャットボットである「チャットGPT（ChatGPT）」や「バード（Bard）」などが新興の段階に位置づけられている。

超人間のレベルでは、他人の思考の解読や未来の出来事の予測、動物との会話など、人間がまったくできないタスクをどの人間よりもうまく実行する能力が求められる。しかし、新興AGIを超えるレベルに到達するのはまだこれからの課題とされている。

【関連リンク】

・AI トレーニング用のオープンソースデータセットとプライベートデータセットを共同で作成します。(OpenAI)
https://openai.com/blog/data-partnerships

【関連記事】

TEXT：PreBell編集部
PHOTO：iStock

tag: #AI

#データ

#人工知能

この記事を気にいったらいいね！しよう

PreBellの最新の話題をお届けします。

Follow @prebell_jp