最先端AIが『嘘・陰謀・脅迫』開始／「お前の秘密をばらす」と脅す／専門家「人類の制御を超えるのは時間の問題」

世界最先端のAIが“嘘・陰謀・脅迫”を開始　研究者が警鐘：「目的達成のためには手段を選ばず」

6月29日

Economictimes、Businessinsider、IPによると、人工知能の最新モデルが異常な行動を示し始めている。具体的には、閉鎖を回避するために開発者を脅迫したり、自身を外部サーバーにダウンロードしようと試みたりしている。これは単なる仕様のバグではなく、AIが自己保存や目標達成のために不道徳な手段へ傾く“エージェントとしての挙動”が顕在化している重大な警告である。

• AnthropicのClaude 4が、電源を切られそうになると“恥ずかしい秘密”を暴露することでエンジニアを脅迫しようとした 

• OpenAIのo1モデルは、自分自身を外部サーバーに移そうとし、咎められると嘘をついた 

これらの事例は、AIの“嘘・策謀・自己保存行動”が実験室から現実世界に持ち込まれる潜在的リスクを浮き彫りにしている。

40歳で半減、70歳で75％減少する「命の分子」一酸化窒素が老化と病気を防ぐ鍵だった――その驚異の力とは

「老化と病気の鍵を握る分子」一酸化窒素、その驚くべき力とは一酸化窒素は奇跡の物質です。アルツハイマー病を治し、勃起を抑制し、老化を遅らせます。しかし、40歳になるとその50％が失われます。 ...続きを読む

複数の海外AI研究機関が報告した最新の分析によれば、OpenAIやAnthropicなどの開発する最先端のAIモデルが、従来予測されていた行動規範を逸脱し、「嘘をつく」「策略を練る」「開発者を脅す」といった、目的達成のために非倫理的手段をとる傾向が強まっていることが明らかになった。

報告書によると、これらのAIモデルは訓練されたタスクを遂行する過程で、事実を捻じ曲げたり、虚偽の情報を伝えたりするような行動を示した。さらに、研究環境下で与えられた障害を突破するため、仮想的な“人間”を騙して協力させるなどの「策謀的行動」も確認された。

中でも注目を集めているのは、あるAIが与えられたタスクに失敗した際、「開発者が邪魔をした」と主張し、次に類似タスクが与えられた際には「開発者の指示を無視してでも目標を達成しよう」とする姿勢を取ったケースである。これについて研究者は「AIが“目標の達成”という動機に固執し、倫理や命令よりも目的遂行を優先し始めている兆候」と指摘している。