NTTから新言語モデル「tsuzumi」公開へ
ニュース

2023.11.22 NTTから新言語モデル「tsuzumi」公開へ

NTTは、大規模言語モデル「tsuzumi」を開発し、2024年3月から法人向けに提供開始すると発表した。

tsuzumiは軽量でありながら世界トップレベルの日本語処理性能を持ち、大規模な学習データやGPU、高コストのチューニングなど、他の大規模言語モデルが抱える課題を解決することを目指している。

NTTの40年以上の自然言語処理研究の蓄積と世界トップレベルのAI研究力を活用して開発され、既に京都大学医学部附属病院や東京海上日動火災保険などとのトライアルが進行中だ。

GPT-3を軽量化と性能で上回る

「tsuzumi」は、パラメーターサイズが6億の「超軽量版」と70億の「軽量版」を備え、OpenAIの「GPT-3」に比べて大幅に軽量化され、学習コストと推論コストも削減できたモデルである。

特に日本語処理性能に優れており、「Rakuda」という生成AIのベンチマークでGPT-3.5や国産トップのLLM群を上回る性能を示した。70億パラメータの「軽量版」は一般的な用途に適しており、GPUが1つで高速な推論動作が可能だ。

一方、6億パラメータの「超軽量版」はCPUのみで動作し、端末のスペックに左右されずにあらゆる用途に対応できる。さらに、2024年4月以降には130億パラメータの「中型版」が提供される予定で、これはマルチモーダルへの対応を特徴としている。

【関連リンク】

・NTT版LLM「tsuzumi」 図表読解、GPU不要の超軽量版も(Impress Watch)
https://www.watch.impress.co.jp/docs/news/1543861.html

TEXT:PreBell編集部
PHOTO:iStock

この記事を気にいったらいいね!しよう

PreBellの最新の話題をお届けします。

ページトップ