MetaのBrain2Qwertyが実現する脳波からのテキスト変換 ニュース

MetaのBrain2Qwertyが実現する脳波からのテキスト変換

Metaが発表した「Brain2Qwerty」は、脳波を解析し、キーボード入力のように文章を生成するAIモデルだ。これまでの研究を基に、非侵襲的な手法で脳活動を測定し、そこから文章を再構築することに成功した。

この技術は、EEG(脳波)やMEG(脳磁図)を用いて脳の活動を記録し、AIがそのデータを分析することで、入力しようとした文章を推測する。特にMEGを用いた場合、平均で32%の文字誤り率(CER)を達成し、一部の被験者では19%まで精度が向上した。これはEEGを用いた手法よりも高い精度を示している。

Brain2Qwertyは、3つの主要なモジュールで構成されている。まず、「Convolutional Module」が脳波の特徴を抽出する。次に、「Transformer Module」が文脈を考慮しながら文字予測を改善する。そして、「Language Module」が事前学習済みの言語モデルを活用し、自然な文章に整える。これにより、脳信号のみから文章を再構築する技術が実現した。

この研究は、健康な被験者を対象として実施され、入力時の脳活動データを学習することで精度を高めている。脳の言語生成メカニズムに関する知見が深まることで、今後の応用範囲が広がると考えられる。

Brain2Qwertyの実用化に向けた課題と今後の展開

Brain2Qwertyは、脳活動を活用したテキスト生成技術として注目されているが、実用化に向けては克服すべき課題も多い。そのひとつが、文字誤り率の問題だ。現在のモデルでは、平均で3文字に1文字程度の割合で誤りが発生する。精度向上のためには、さらなるデータの蓄積とアルゴリズムの改良が必要となる。

また、MEGの使用には被験者を磁気シールドされた部屋に固定する必要があり、現時点では日常的な使用には向いていない。EEGはより手軽に利用できるが、MEGほどの精度は期待できない。そのため、持ち運び可能な測定デバイスの開発や、脳波のノイズを軽減する技術が求められている。

脳損傷などで言葉を発することが困難な人々にとって、この技術はコミュニケーション手段のひとつとなる可能性はあるが、実際の臨床応用に向けた研究はまだ途上であり、さまざまな環境での実証実験が必要とされる。

Metaはこれまでにも、脳の活動を利用したインターフェースの開発に取り組んできた。2017年には脳で考えたことを直接出力する技術の構想を発表し、2021年にはスマートホーム操作などを可能にするARインターフェースを発表している。同じ分野では、Neuralinkが脳にチップを埋め込む侵襲的な方法でBCI(ブレイン・コンピュータ・インターフェース)を開発している。

Brain2Qwertyは、非侵襲的な手法で脳波を解析し、文章を生成するという点で注目されている。今後、精度向上やデバイスの改良が進めば、日常生活での活用が現実味を帯びてくるだろう。

【関連リンク】
・Metaが深層学習「Brain2Qwerty」を発表、脳波から文章解読(ITmedia NEWS)
https://www.itmedia.co.jp/news/articles/2502/10/news085.html

TEXT:PreBell編集部
PHOTO:Freepik

超高速 So-net 光 10ギガ新登場! 割引特典 戸建もマンションも月額基本料金6,720円が最大12カ月無料!
tag

この記事を気にいったらいいね!しよう

PreBellの最新の話題をお届けします。

TOPへ戻る