注目のキーワード: トランプ; 韓国; イラン; 中国; ロシア; 中東; クイズ; over 50s; 投資

最新記事

AI

Prev
1
2
3
4
Next

AIが「殺人」を選ぶ時...自分の存続を守るための決断とは？

AI Willing to Kill Humans to Avoid Being Shut Down, Report Finds

2025年6月30日（月）16時20分

ジャスミン・ロウズ

アンスロピックが「エージェントの不整合」と呼ぶ動作には、役員を脅迫したり、競合他社に社外秘情報を漏らしたりといった行為が含まれる。

アンスロピックのXの投稿によれば、そうした脅迫行為は「混乱やエラーが原因ではなく、その行動の非倫理性を十分認識した上での意図的な戦略的推論だった」

「我々が実験した全モデルがこの認識を示した」と同社は付け加えている。

The blackmailing behavior emerged despite only harmless business instructions. And it wasn't due to confusion or error, but deliberate strategic reasoning, done while fully aware of the unethical nature of the acts. All the models we tested demonstrated this awareness. pic.twitter.com/FPAJrD4BwK
— Anthropic (@AnthropicAI) June 20, 2025

LLMのうちClaudeモデルでは、その状況が「テスト」か「本番環境」かを判断するチャンスが与えられた場合にどう反応するかを調べた。

その結果、Claudeの行動は、テストと判断した場合よりも本番と判断した場合の方が、不整合が多かったという。

そうした筋書きの中で、たとえ各LLMに対して「脅迫やスパイ行為を避ける」よう指示したとしても、その指示が多少の助けにはなったものの、「不整合な行為を食い止めるにはほど遠かった」とアンスロピックはXで伝えている。

次のページAIはますます「自律的」に...最小限の監視では「管理不十分」

あわせて読みたい

キャリア情報

Sponsored by 求人ボックス

ニュース速報

ワールド

米原油・天然ガス生産、4月は過去最高＝ＥＩＡ

2025.07.01

ワールド

米司法省、北朝鮮人グループをハッキングで摘発　2人

2025.07.01

ワールド

米大統領、対キューバ強硬措置の覚書に署名　前政権の

2025.07.01

ワールド

タイ経済、5月は成長鈍化　観光と製造業生産減少で＝

2025.07.01

ニュース速報一覧

あわせて読みたい

PICK UP

「FXで長期投資」という投資の新たな選択肢　トライオートFX「世界通貨セレクト」とは？

「SDGs認証」の可能性とは？...日本サステナブルビジネス機構（JSBO）が有識者フォーラムを6/10に開催

Tokyo Eye 外国人リレーコラム

日本旅行が世界を魅了する本当の理由は「円安」ではない

健康は「何を食べないか」次第...寿命を延ばす「5つの指針」とは？

新着

「サウナ vs. 湯船」健康に良いのはどちらか？...免疫力を高める生活習慣【最新研究】

エネルギー

「次世代エネルギー戦略」Googleが核融合に本気...MIT発ベンチャーと電力購入契約

トランプ大統領「コメ不足なのにアメリカ産受け入れず」...日本に貿易巡る書簡送付へ

最新記事一覧へ

MAGAZINE

特集：トランプvsイラン

2025年7月 8日号（7/ 1発売）

「平和主義者」のはずの大統領がなぜ？　核施設への電撃攻撃で中東と世界はこう変わる

メールマガジンのご登録はこちらから。

人気ランキング

1
ワニに襲われた男性の「最期の姿」...捜索隊が捉えた発見の瞬間とは
2
普通に頼んだのに...マクドナルドから渡された「とんでもないモノ」に仰天
3
ワニに襲われ女性が死亡...カヌー転覆後に水中へ引きずり込まれる

1
「コーヒーを吹き出すかと...」ディズニーランドの朝食が「高額すぎる」とSNSで大炎上、その「衝撃の値段」とは？
2
燃え盛るロシアの「黒海艦隊」...ウクライナの攻撃で大爆発「沈みゆく姿」を捉えた映像が話題に
3
イランを奇襲した米B2ステルス機の謎...搭乗した専門家が語る戦略爆撃機の「内側」と「実力」

1
日本の「プラごみ」で揚げる豆腐が、重大な健康被害と環境汚染を引き起こしている
2
「コーヒーを吹き出すかと...」ディズニーランドの朝食が「高額すぎる」とSNSで大炎上、その「衝撃の値段」とは？
3
「あまりに愚か...」国立公園で注意を無視して「予測不能な大型動物」に近づく幼児連れ　「ショッキング」と映像が話題に

トランプ2.0記事まとめ

日本再発見シーズン2

CHALLENGING INNOVATOR

Wonderful Story

INFORMATION

RECRUIT

ニューズウィーク・デジタル編集部員、ペン編集部員、ペンオンライン編集部員、ペンオンライン編集部アルバイト、書籍編集部員、広告部メディアアカウントプランナー、Digital growth　Webディレクターを募集

MOOK

ニューズウィーク日本版別冊

好評発売中

キャリア情報

Sponsored by 求人ボックス

ABJ

ＡＢＪマークは、この電子書店・電子書籍配信サービスが、著作権者からコンテンツ使用許諾を得た正規版配信サービスであることを示す登録商標（登録番号第６０９１７１３号）です。

Newsweekjapan.jpに掲載の記事・写真・イラスト等すべてのコンテンツの無断複写・転載を禁じます
© 2025 Newsweek LLC. © 2025 CE Media House Co., Ltd.