最新記事

#テクノロジー #AI #ChatGPT

前のページ 1 2 3 4 次のページ

AIが「殺人」を選ぶ時...自分の存続を守るための決断とは？

AI Willing to Kill Humans to Avoid Being Shut Down, Report Finds

2025年06月30日（月）16時20分

ジャスミン・ロウズ

アンスロピックが「エージェントの不整合」と呼ぶ動作には、役員を脅迫したり、競合他社に社外秘情報を漏らしたりといった行為が含まれる。

アンスロピックのXの投稿によれば、そうした脅迫行為は「混乱やエラーが原因ではなく、その行動の非倫理性を十分認識した上での意図的な戦略的推論だった」

「我々が実験した全モデルがこの認識を示した」と同社は付け加えている。

The blackmailing behavior emerged despite only harmless business instructions. And it wasn't due to confusion or error, but deliberate strategic reasoning, done while fully aware of the unethical nature of the acts. All the models we tested demonstrated this awareness. pic.twitter.com/FPAJrD4BwK
— Anthropic (@AnthropicAI) June 20, 2025

LLMのうちClaudeモデルでは、その状況が「テスト」か「本番環境」かを判断するチャンスが与えられた場合にどう反応するかを調べた。

その結果、Claudeの行動は、テストと判断した場合よりも本番と判断した場合の方が、不整合が多かったという。

そうした筋書きの中で、たとえ各LLMに対して「脅迫やスパイ行為を避ける」よう指示したとしても、その指示が多少の助けにはなったものの、「不整合な行為を食い止めるにはほど遠かった」とアンスロピックはXで伝えている。

次のページ

AIはますます「自律的」に...最小限の監視では「管理不十分」

前のページ 1 2 3 4 次のページ

関連キーワード

#テクノロジー #AI #ChatGPT

あわせて読みたい

キャリア情報

Sponsored by 求人ボックス

新着記事

台湾当局、TSMC元社員を起訴　営業秘密を無断複製し、中国で利用画策か

台湾当局、TSMC元社員を起訴　営業秘密を無断複製し、中国で利用画策か

歌舞伎町は、20代の女の子がヤクザに「うるせえジジイ！」と怒鳴る街になった

歌舞伎町は、20代の女の子がヤクザに「うるせえジジイ！」と怒鳴る街になった

「日本語って大変」　『ダーリンは外国人　リマスター版』第４話

「日本語って大変」　『ダーリンは外国人　リマスター版』第４話

小栗左多里

サッカーW杯で再確認、やっぱり世界は「イングランドが嫌い」…最も嫌っているのは？

サッカーW杯で再確認、やっぱり世界は「イングランドが嫌い」…最も嫌っているのは？

ジョージ・チェスタートン

動画

【「終われない」米イラン戦争の終わり方】事態打開のキーパーソンは2人／伸縮自在「60日間交渉」の現在地／停戦再交渉の時期をヒト・モノ・金で予測／ホルムズ通航料が突破口？／イスラエルの本音「ほら見ろ」

【Amazonを公有化せよ】斎藤幸平が語る暗黒社会の生き延び方／資本主義でイノベーションは生まれない／中国もAmazonも…人類の未来は”計画経済”か？／使用価値ベースの経済へ／不可逆的な気候変動

【Amazonを公有化せよ】斎藤幸平が語る暗黒社会の生き延び方／資本主義でイノベーションは生まれない／中国もAmazonも…人類の未来は”計画経済”か？／使用価値ベースの経済へ／不可逆的な気候変動

【日銀”弱腰利上げ”で続く副作用】市場の攻撃が為替に向かう可能性／植田総裁“病欠”に見る危険な兆候／暮らしへの影響「マイナス面大きい」／有事の円買いは消滅／日本人の資産防衛、最適解は？／加谷珪一の解説

【日銀”弱腰利上げ”で続く副作用】市場の攻撃が為替に向かう可能性／植田総裁“病欠”に見る危険な兆候／暮らしへの影響「マイナス面大きい」／有事の円買いは消滅／日本人の資産防衛、最適解は？／加谷珪一の解説

【宗教で日米を読み解く】“無思想”トランプが穏健な福音派を狂わせた

【宗教で日米を読み解く】“無思想”トランプが穏健な福音派を狂わせた／推し文化と宗教／バンスはトランプを継げない／創価学会との共通点／“中核が空虚”なMAGA運動の吸引力／SNS時代のカリスマの条件

週刊ニューズウィーク日本版

特集：ウクライナ逆転大作戦

特集：ウクライナ逆転大作戦

2026年7月28日号（7/22発売）

ドローンを駆使した石油施設攻撃でロシアに大打撃。クリミア半島を奪還すればプーチンは窮地に？

お得で便利な定期購読はこちらデジタル版最新号の目次

書籍

特集：ウクライナ逆転大作戦

ムック

特集：ウクライナ逆転大作戦

あわせて読みたい

注目のキーワード

トランプ

北朝鮮

ウクライナ

中国

イラン

NW動画

クイズ

over 50s

投資

インフォメーション

利用規約改定のお知らせ

　

ペンオンライン編集部員、フィガロ編集部スタッフ（業務委託）、書籍編集部員、広告部メディアアカウントプランナーを募集