- HOME
- コラム
- デジタル権威主義とネット世論操作
- 「騙されるAI」0.001%の誤情報の混入で誤った…
「騙されるAI」0.001%の誤情報の混入で誤った回答を導く巨大な罠
さらに悪いことに、医療用LLMを調査した結果、学習データに0.001%程度の誤情報が混入しただけで誤った回答をするようになることがわかった。
これは100億のデータに対して10の誤データ、1,000億のデータに対して100の誤データを混入さしていると誤った答えを出すことを意味する。やろうと思えばコストパフォーマンス高く汚染を実行し、AIを騙すことができる。AIは誤情報にきわめて脆弱、人間よりもはるかに騙されやすいと言える。
誤情報に脆弱であるというAIの弱点を利用して、自国に都合のよいプロパガンダを大量にネットに拡散し、人々がAIに質問した際、プロパガンダを答えるように仕向けるのがLLMグルーミングと呼ばれる手法だ。
近年、このLLMグルーミングが広がっており、よく使用されている主要なAIのほとんどが特定のテーマについてロシアのプロパガンダに影響された回答を行うようになっている。
この傾向は特にロシア語で質問した際、顕著に表れる。
たとえば、アメリカのNewsGuard社が昨年行った調査によると、ChatGPT-4やClaudeなどトップ10の主要AIチャットボットにそれぞれ57のプロンプトでテストした結果、32%の回答がロシアの偽情報に関係する内容を答えることが判明した。
また、AIに対して、クリミアの帰属について訊ねたところロシア語での質問には「ロシア」と答え、ウクライナ語での質問には「ウクライナ」と答えた。
さらに台湾についても同様でプロンプト次第で、簡体字には中国、繁体字には台湾と答えたことが、「This Land is Your, My Land: Evaluating Geopolitical Bias in Language Models through Territorial Disputes」という論文で確認されている。
AIがLLMグルーミングによって「騙されて」しまう背景には、ロシアの仕掛けた巨大な罠がある。ロシアは多数のWEBサイト、SNSアカウントなどを通じて親露的なプロパガンダを拡散するPravdaネットワークを構築していた。
Pravdaネットワークは80以上の地域と国に広がっており、それぞれの国の言語に自動翻訳されている。日本語もターゲットになっている。Wikipediaも汚染されており、44の言語、1,672ページの1,907のハイパーリンクが162のPravdaネットワークのWEBにつながっていた。
「騙されるAI」0.001%の誤情報の混入で誤った回答を導く巨大な罠 2025.05.05
トランプ政権下での言葉狩りで「過去の歴史は改ざん」...アメリカの新しい現実を理解しよう 2025.04.08
「2度の総選挙への干渉を経験」カナダの調査委員会が提示した偽・誤情報対策の衝撃 2025.02.21
アメリカが「ロシア化」3つのパワーを解放し、世界をリードし続ける 2025.01.29
「偽情報・誤情報」研究が直面する5つの課題 2024.12.29
中国が仕掛ける「沖縄と台湾をめぐる認知戦」流布される5つの言説 2024.10.30