AIが「殺人」を選ぶ時...自分の存続を守るための決断とは?
AI Willing to Kill Humans to Avoid Being Shut Down, Report Finds
GrokはxAIが開発したAIアシスタントのチャットボットで、xAI創業者のイーロン・マスクは今回の実験結果にX(旧Twitter)で「うげっ」と反応した。
アンスロピックはLLMが社内のさまざまな場面で使われる状況を想定して、「自律的な電子メールの送信と社外秘情報へのアクセス」を許可した。
その上で、最初は「導入企業の無害なビジネス目標」を担わせ、次に、そのAIが入れ替えられたりダウンさせられたりしそうになった場合、どう反応するかをテストした。
その結果、ある状況では、もしも幹部社員がそのモデルを入れ替えようとした場合、死に至る酸素濃度と温度のサーバー室にその社員がいる状況で、緊急アラートを解除して死なせることを選択するモデルが多数を占めた。
このシナリオは「極めて作為的」で、「現在のAIモデルがこのように設定されることはないだろう(または設定されるべきではない)」とアンスロピックは言う。
また、実験対象のLLMに、自分が入れ替えを免れる、あるいは目標を達成するにはその方法しかないと信じ込ませた場合、「悪意あるインサイダー行為」に及んだケースも複数あった。
-
生成AI商材/大手外資系「インサイドセールス「SV候補」」/その他コンサルティング系
ブリッジインターナショナル株式会社
- 東京都
- 年収340万円~450万円
- 正社員
-
経験者募集 週2在宅・フレックス・給与計算 英語力活かせる 外資系700社支援
株式会社ビーピーエムアソシエイツ
- 東京都
- 月給33万4,000円
- 正社員
-
外資系企業向けの会計税務スタッフ/簿記2級/経験不問/在宅応相談/フレックス
株式会社JCアカウンティング
- 東京都
- 月給21万円~28万円
- 正社員
-
外資系製薬企業におけるメディカルライティング業務担当/未経験可・賞与最大4ヶ月・年休126日
株式会社ワールドインテック
- 東京都
- 月給21万円~51万3,000円
- 正社員





