今回のレポートで指摘されたのは、不正操作に対するAIの弱さだった。場合によっては1本のブログ記事だけでAIをだまし、特定の人物をその分野のエキスパートと思わせることが可能だったとされる。

一方、グーグルは同社のDeepMind研究者が実施した調査を引き合いに、SimpleQAには問題があると反論した。

同社の研究者はSimpleQAについて、誤った「グラウンド・トゥルース(人間が検証した事実、あるいは証拠に基づく事実)」が複数あることを発見したという。

グーグルはまた、OumiがAIモデルを使ってGeminiの評価を行っていた――つまり、不完全なAIモデルの正確さを、別の不完全なAIモデルで評価していたとも指摘する。

具体的には、ニューヨーク・タイムズ紙が挙げた2件の実例に言及した。

まず、ボブ・マーリーの自宅が博物館に改修された年について、Geminiが生成した答えは1987年だったが、正解は1986年だった。

しかしグーグルによれば、Geminiが参照したウィキペディアの記事には1986年と1987年の両方の記載があった(グーグルはスクリーンショットも提示している)。ただ、現在のウィキペディアの記事は「1986年」で統一されている。

次に、ノースカロライナ州を流れるニュース川の位置をGeminiが間違えたというニューヨーク・タイムズの主張にも反論した。

Geminiの回答では、ニュース川はゴールズボロ市の「西」を流れているとした。これについてグーグルは、ニュース川は主にゴールズボロ市の南を流れているものの、確かに同市の南西も流れており、Geminiの答えは「もっともらしい」と主張している。

【関連記事】
ニューズウィーク日本版 世界宗教入門
2026年5月5日/12日号(4月28日発売)は「世界宗教入門」特集。

イラン戦争の背景にある三大一神教を基礎から読み解く[PLUS]宗教学者・加藤喜之教授の「福音派」超解説

※バックナンバーが読み放題となる定期購読はこちら
※画像をクリックするとアマゾンに飛びます