日立製作所、生成AI文章を識別する最新技術を開発
日立製作所は、生成AIが作成した文章を識別する新たな手法を世界に示した。同社の開発チームは、生成AIによるフェイクニュースの問題に焦点を当て、その不正利用防止を目的とした技術開発に成功した。
この技術の核となるのは「電子透かし」である。生成AI特有の単語グループを電子透かしとして文章に埋め込むことで、AIが作成した文章であることを識別できるようにしている。複数の電子透かしを採用することで識別精度を高め、さらにセキュリティを強化している点が画期的である。
日立の技術では、大規模言語モデル(LLM)の出力テキストにおいて、トークンと呼ばれる単語や文字の数値表現を調整し、「AIによく見られるパターン」を巧妙に織り込む。
これにより、テキストの品質を保ちつつ、生成AI特有の痕跡を残すことができる。複数の電子透かしを採用することで、セキュリティを強化し、一つのパスワードが漏洩した場合でも、すべての透かしが偽造されるリスクを低減させている。
電子透かし技術の現状と課題
電子透かし技術自体は、日立に先駆けていくつかの団体によっても開発されている。米メリーランド大学では、短いトークンから合成テキストを検出できる効率的な電子透かしを提案している。
この手法では、トークンをハッシュ値に基づいて分類し、テキストの生成時に特定の色のトークン(例: グリーントークン)の割合を高くすることで、電子透かしの有無を判定する。
また、Google傘下のDeepMindが開発した「SynthID」は、テキストと動画の両方に電子透かしを埋め込むことができる。テキスト生成時のトークン調整を通じて、AIの特徴をテキストに埋め込むことで、AI生成コンテンツの識別を可能にしている。
しかし、これらの技術はAI生成テキストが大幅に変更や翻訳された場合、電子透かしの信頼性が低下する可能性があるという課題も抱えている。短いテキストや事実に基づくプロンプトでは、バリエーションが限られるため、電子透かしの精度が落ちる傾向にあることも考慮する必要がある。
生成AIの急速な進化に伴い、AI生成コンテンツを見分ける技術開発は今や不可欠となっている。日立の新技術は、複数の電子透かしを採用した画期的な手法ではあるものの、今後のさらなる進化が期待される。
【関連リンク】
・文章に“多重電子透かし”を入れる技術、日立が開発 書き手が「人間」or「AI」か区別可能に その仕組みとは?(ITmedia AI+)
https://www.itmedia.co.jp/aiplus/articles/2407/29/news128.html
TEXT:PreBell編集部
PHOTO:iStock
この記事を気にいったらいいね!しよう
PreBellの最新の話題をお届けします。