- HOME
- コラム
- デジタル権威主義とネット世論操作
- 「騙されるAI」0.001%の誤情報の混入で誤った…
「騙されるAI」0.001%の誤情報の混入で誤った回答を導く巨大な罠
さらに悪いことに、医療用LLMを調査した結果、学習データに0.001%程度の誤情報が混入しただけで誤った回答をするようになることがわかった。
これは100億のデータに対して10の誤データ、1,000億のデータに対して100の誤データを混入さしていると誤った答えを出すことを意味する。やろうと思えばコストパフォーマンス高く汚染を実行し、AIを騙すことができる。AIは誤情報にきわめて脆弱、人間よりもはるかに騙されやすいと言える。
誤情報に脆弱であるというAIの弱点を利用して、自国に都合のよいプロパガンダを大量にネットに拡散し、人々がAIに質問した際、プロパガンダを答えるように仕向けるのがLLMグルーミングと呼ばれる手法だ。
近年、このLLMグルーミングが広がっており、よく使用されている主要なAIのほとんどが特定のテーマについてロシアのプロパガンダに影響された回答を行うようになっている。
この傾向は特にロシア語で質問した際、顕著に表れる。
たとえば、アメリカのNewsGuard社が昨年行った調査によると、ChatGPT-4やClaudeなどトップ10の主要AIチャットボットにそれぞれ57のプロンプトでテストした結果、32%の回答がロシアの偽情報に関係する内容を答えることが判明した。
また、AIに対して、クリミアの帰属について訊ねたところロシア語での質問には「ロシア」と答え、ウクライナ語での質問には「ウクライナ」と答えた。
さらに台湾についても同様でプロンプト次第で、簡体字には中国、繁体字には台湾と答えたことが、「This Land is Your, My Land: Evaluating Geopolitical Bias in Language Models through Territorial Disputes」という論文で確認されている。
AIがLLMグルーミングによって「騙されて」しまう背景には、ロシアの仕掛けた巨大な罠がある。ロシアは多数のWEBサイト、SNSアカウントなどを通じて親露的なプロパガンダを拡散するPravdaネットワークを構築していた。
Pravdaネットワークは80以上の地域と国に広がっており、それぞれの国の言語に自動翻訳されている。日本語もターゲットになっている。Wikipediaも汚染されており、44の言語、1,672ページの1,907のハイパーリンクが162のPravdaネットワークのWEBにつながっていた。
静かに進む「デジタル植民地化」──なぜ日本はデジタル主権を語らないのか 2025.11.28
アメリカのサイバー戦略はなぜ失敗したのか──中国が築く「閉鎖ネット」と地政学的優位 2025.10.23
認知戦で狙われているのは誰なのか?──影響工作の本当の標的 2025.09.03
民主主義をむしばむ「ハイブリッド脅威」──今そこにある見えない戦争 2025.07.25
「AIファクトチェック」はもはや幻想? 非常時に裏切るチャットボットの正体 2025.07.08
アメリカ発「陰謀論が主流に」──民主主義と情報の未来、日本は対岸の火事か? 2025.06.02
「騙されるAI」0.001%の誤情報の混入で誤った回答を導く巨大な罠 2025.05.05
-
プロダクトエンジニア「ポテンシャル採用/大手や外資系など3000社に導入/HR SaaS「ミキワメ」/web系SE・PG/東京都/東京メトロ日比谷線虎ノ門ヒルズ駅から徒歩2分
株式会社リーディングマーク
- 東京都
- 年収400万円~550万円
- 正社員
-
基本在宅! 外資系企業向け:システム運用保守 立川駅
株式会社スタッフサービス ITソリューション
- 東京都
- 月給23万5,000円~
- 正社員
-
未経験OK 外資系有名ブランド企業社内ヘルプデスク業務 京橋駅
株式会社スタッフサービス ITソリューション
- 東京都
- 月給23万5,000円~
- 正社員
-
生成AI商材/大手外資系「インサイドセールス「SV候補」」/その他コンサルティング系
ブリッジインターナショナル株式会社
- 東京都
- 年収340万円~450万円
- 正社員






