アンソロピック、AI開発の「減速」を提言――再帰的自己改善に伴うリスク回避へ

AI開発関連

I開発企業のAnthropic(アンソロピック)は4日、急速に進化するAI技術が人間の制御を離れるリスクを危惧し、開発の調整や一時停止の仕組みを構築すべきとする声明「AIが自分自身を構築する(When AI builds itself)」を公開した。

「再帰的自己改善」が加速する開発現場

声明では、AIが自ら次世代モデルを設計・開発する「再帰的自己改善(Recursive self-improvement)」の段階が、想定よりも早く到来する可能性が指摘されている。

  • 自動化の現状: 同社の社内データによると、2026年現在のエンジニアによるコードマージ量は2024年比で8倍に急増している。
  • 進化の過程: 人間によるコーディングからチャットボットの支援を経て、現在は自律型エージェントが自らコードを実行し、他のエージェントに業務を委任する段階に達している。
  • 人間との比較: テストや評価のスピードにおいてAIは人間を凌駕しており、人間が依然として優位なのは「研究におけるセンスと判断力」という特定領域のみに限定されつつある。

AIが制御不能になる3つの未来シナリオ

Anthropicは今後の未来像として、以下の3つのシナリオを提示している。

  1. 進歩の頭打ち: 技術的限界やサプライチェーンの制約により普及にとどまる(実現可能性は低いと評価)。
  2. 大幅な自動化と人間による管理: AI開発は自動化されるが、方向性や評価は人間が担う。生産性は飛躍するが、権威主義的な監視などへの悪用リスクがある。
  3. 完全な再帰的自己改善: AIシステム自体が自らを設計・改良する能力を獲得する。これが最も有力視されるシナリオであり、「人間による制御が不能になる危険性」を伴う。

「減速」のための国際的な協調が必要

同社は、社会構造やAIの価値観の一致(アラインメント)に関する研究が、技術の進歩に追いつくまでの時間を確保するため、「最先端AI開発の遅延や一時停止」という選択肢を世界規模で検討すべきだと訴えている。

ただし、この仕組みは一企業では実現不可能であり、最先端の研究機関が同一の条件下で合意し、実効性を検証できる環境が必要となる。ミサイル技術などと異なり、AIの学習プロセスは隠蔽が容易であるという課題はあるものの、同社は今後数カ月以内に政策立案者、研究者、市民社会、そして他AI企業との対話の場を設け、議論を深めていく意向を示している。

よかったらシェアしてね!
  • URLをコピーしました!
  • URLをコピーしました!

この記事を書いた人

岡本晟楽はEIICHI JOURNALの編集長、代表。仮想通貨の価格分析からPR記事まで幅広い作成経験を持つ。元コインテレグラフジャパンの編集者。野村総合研究所。兵庫県神戸市出身、台湾・カナダなどの環境で学生時代を過ごす。世界的なメディアでの経験から仮想通貨に限らず政治、経済などの記事についても執筆をする。

コメント

コメントする

目次