チャットGPTだけが言語AIじゃない。米大学が有力34モデルの性能を比較ランキング

2023年02月24日（金）08時00分

こうした動きに対抗しようとしているのが、世界中の研究者が開発に協力しているBigScienceと呼ばれるオープンプロジェクト。BigScienceは、BLOOMなど3個の基盤モデルを開発している。BLOOMは、フランス政府がスーパーコンピューターを提供するなどして開発に協力しており、AIが問題発言しないようにする技術の正確さで３位にランクインするなど、高い性能を誇っている。

同様に中国の清華大学を中心とするオープンプロジェクトは、中国語と英語のバイリンガル基盤モデルGLMを開発。GLMは、要約の正確さで５位にランクインしている。

この記事では、質疑応答、情報検索、要約、問題発言検知といった用途でのランキングのトップ5だけを紹介するが、スタンフォード大学基盤モデル研究所は詳細に渡って評価している。ただ同研究所は、純粋な言語モデルだけを比較している。Facebook（Meta）のCICEROは、対話エンジンと計画エンジンを合体させたモデルだし、GoogleのLaMDAは言語モデルを対話型に改良したモデル。なのでこのプロジェクトでは比較対象になっていない。今後こうした特定の用途に特化させた基盤モデルも次々と登場してくることだろう。今後開発したいサービスには、どの基盤モデルが合っているのか。しっかりと検討していただきたい。

ChatGPTはハイプサイクルを一気に駆け上がった。ここまで急速に期待値が高まったのだから、これから一気に幻滅期に向かう可能性が高い。AIは万能ではない。用途を狭く限定すれば人間以上の能力を発揮するが、用途を広く構えてしまえば問題を引き起こす可能性がある。虚偽の情報を拡散したり、差別発言をしたりして、社会問題や訴訟にまで発展するかもしれない。AIの基盤モデルを少数のテック大手が独占することに対する批判も、これから浮上してくることだろう。

言語AIはまだ黎明期。これかも技術革新が必要とされている。ブームに踊らされることなく、しっかりと腰を据えて社会に価値を提供し続けられるようなサービスを開発していただきたいと思う。

【順位】言語AIの用途別ベスト５

前のページ 1 2 3 次のページ

関連キーワード

#グーグル #マイクロソフト #AI #メタ #チャットGPT

この筆者のコラム

AppleとOpenAIの提携は何を意味するのか

AIは今後も急速に進化する？進化が減速し始めた？

AI自体を製品にするな＝サム・アルトマン氏からスタートアップへのアドバイス

汎用AIが特化型モデルを不要に＝サム・アルトマン氏最新インタビュー

マーク・ザッカーバーグ氏インタビュー「なぜAIを無料公開するのか」

記事一覧へ

プロフィール

湯川鶴章

AI新聞編集長。米カリフォルニア州立大学サンフランシスコ校経済学部卒業。サンフランシスコの地元紙記者を経て、時事通信社米国法人に入社。シリコンバレーの黎明期から米国のハイテク産業を中心に取材を続ける。通算２０年間の米国生活を終え２０００年５月に帰国。時事通信編集委員を経て２０１０年独立。2017年12月から現職。主な著書に『人工知能、ロボット、人の心。』（2015年）、『次世代マーケティングプラットフォーム』（2007年）、『ネットは新聞を殺すのか』（2003年）などがある。趣味はヨガと瞑想。妻が美人なのが自慢。