アップル、新たなAI画像編集モデル「MGIE」を発表
ニュース

2024.02.26 アップル、新たなAI画像編集モデル「MGIE」を発表

米アップル社は、テキストベースの指示で画像を編集する革新的なオープンソースの人工知能モデル「MGIE」を発表した。

MGIE、あるいは「MLLM-Guided Image Editing」は、カリフォルニア大学サンタバーバラ校との共同研究の成果として誕生したもので、画像編集に関する新たな地平を切り開いた。

このモデルは、切り抜き、サイズ変更、回転といった基本的な機能から、明るさやカラーバランス、コントラストの調整まで、幅広い編集タスクを自然言語の指示によって実行可能である。

GitHubやHugging Faceで実際にデモを試すことができるため、技術愛好家や開発者にとっては格好の検証機会となるだろう。

MGIEの機能と社会への影響

MGIEは、マルチモーダル大規模言語モデルを活用しており、ユーザーは自然言語での指示を通じて直感的な画像編集を行うことができる。例えば「空をもっと青く」と指示すれば、AIは「空の彩度を20%増加」といった具体的な操作命令を生成し、実際の編集を行う。

MGIE自身がMLLMを使用して視覚的な創造力を引き出し、望む編集結果を生成する能力も持った。これにより、単にPhotoshopで行うような編集作業だけでなく、髪型や目の色、服装の修正といった複雑なローカル編集も可能になった。

現時点では、この技術がアップル製品にどのように組み込まれるかは不明だが、SNSやアート、エンターテインメントなど多岐にわたる分野での応用が期待されている。

アップルのオープンソースへの進出は、戦略的な意図を持って行われたもので、世界中の開発者がアップルの技術に貢献し、その進化を加速させることが可能だ。

オープンソースコミュニティへの関与は、アップルのブランド価値を高め、AIおよびAIベースの画像編集の業界標準を築く上で有利な立場を得ることにも繋がる。

【関連リンク】

・Apple、UCSBと共同でマルチモーダルLLM採用のテキストベースの画像編集「MGIE」発表(ITmedia NEWS)
https://www.itmedia.co.jp/news/articles/2402/08/news090.html

TEXT:PreBell編集部
PHOTO:iStock

この記事を気にいったらいいね!しよう

PreBellの最新の話題をお届けします。

ページトップ