- HOME
- コラム
- デジタル権威主義とネット世論操作
- 「騙されるAI」0.001%の誤情報の混入で誤った…
「騙されるAI」0.001%の誤情報の混入で誤った回答を導く巨大な罠
さらに悪いことに、医療用LLMを調査した結果、学習データに0.001%程度の誤情報が混入しただけで誤った回答をするようになることがわかった。
これは100億のデータに対して10の誤データ、1,000億のデータに対して100の誤データを混入さしていると誤った答えを出すことを意味する。やろうと思えばコストパフォーマンス高く汚染を実行し、AIを騙すことができる。AIは誤情報にきわめて脆弱、人間よりもはるかに騙されやすいと言える。
誤情報に脆弱であるというAIの弱点を利用して、自国に都合のよいプロパガンダを大量にネットに拡散し、人々がAIに質問した際、プロパガンダを答えるように仕向けるのがLLMグルーミングと呼ばれる手法だ。
近年、このLLMグルーミングが広がっており、よく使用されている主要なAIのほとんどが特定のテーマについてロシアのプロパガンダに影響された回答を行うようになっている。
この傾向は特にロシア語で質問した際、顕著に表れる。
たとえば、アメリカのNewsGuard社が昨年行った調査によると、ChatGPT-4やClaudeなどトップ10の主要AIチャットボットにそれぞれ57のプロンプトでテストした結果、32%の回答がロシアの偽情報に関係する内容を答えることが判明した。
また、AIに対して、クリミアの帰属について訊ねたところロシア語での質問には「ロシア」と答え、ウクライナ語での質問には「ウクライナ」と答えた。
さらに台湾についても同様でプロンプト次第で、簡体字には中国、繁体字には台湾と答えたことが、「This Land is Your, My Land: Evaluating Geopolitical Bias in Language Models through Territorial Disputes」という論文で確認されている。
AIがLLMグルーミングによって「騙されて」しまう背景には、ロシアの仕掛けた巨大な罠がある。ロシアは多数のWEBサイト、SNSアカウントなどを通じて親露的なプロパガンダを拡散するPravdaネットワークを構築していた。
Pravdaネットワークは80以上の地域と国に広がっており、それぞれの国の言語に自動翻訳されている。日本語もターゲットになっている。Wikipediaも汚染されており、44の言語、1,672ページの1,907のハイパーリンクが162のPravdaネットワークのWEBにつながっていた。
-
「墨田区」外資系大手企業内 情報システム・OA機器のヘルプデスク/正社員「転勤なし」/夜間対応なし/人材サービス「紹介/教育/研修」
日本アスペクトコア株式会社
- 東京都
- 年収342万円~
- 正社員
-
未経験OK 外資系有名ブランド企業社内ヘルプデスク業務 京橋駅
株式会社スタッフサービス ITソリューション
- 東京都
- 月給23万5,000円~
- 正社員
-
外資金融機関での施設警備員年収472万可能/高時給/賞与支給/夜勤あり/サポート体制万全/経験OK
株式会社G4S Secure Solutions Japan
- 東京都
- 年収442万4,000円~472万円
- 正社員
-
外資金融機関での施設警備スタッフ年収472万可能/高収入/賞与支給/夜勤あり/丁寧な研修あり/経験者OK
株式会社G4S Secure Solutions Japan
- 東京都
- 年収442万4,000円~472万円
- 正社員