開発/設計

Claude Code Auto Modeで「承認ボタン」が消えた日。エンジニアの仕事の単位が変わり始めている

「承認しますか? (y/n)」

Claude Code Auto Modeで「承認ボタン」が消えた日。エンジニアの仕事の単位が変わり始めている
目次

「承認しますか? (y/n)」

Claude(クロード) Code(クロードコード)を使っている人なら、この表示に見覚えがあるはず。ファイルを書き換えるたび、bashを叩くたび、yを押す。正直に言うと、私は途中からほぼ無意識にyを連打していました。

2026年3月24日、Anthropic(アンソロピック)が「Auto Mode(オートモード)」を発表。AIが安全と判断したアクションを自動実行する仕組みです。 (TechCrunch(テッククランチ))

「ついに来たか」と思った人も、「怖くない?」と感じた人もいるでしょう。両方の気持ち、わかります。

この記事では、Auto Modeの機能紹介にとどまらず、エンジニアの「仕事の単位」がどう変わるかを掘り下げます。元・挫折エンジニアの私が試したBefore/Afterも全部書きますね。


「93%は自動で通せた」をAnthropicが数字で証明した

Auto Modeの話をする前に、データを1つ紹介させてください。

承認プロンプトに対してyを押す割合は93%。 (Anthropic公式ブログ)

100回聞かれて93回はOKしているという計算になります。 残りの7回だけが「止めるべきアクション」だったわけです。

この数字を見て、自分の使い方を振り返って苦笑しました。 私の場合、たぶん98%くらいyを押していた気がする。 ほぼ反射的に。

Anthropicはこのパターンを認識していたそうです。 93%のルーティン承認を自動化し、残りの危険なアクションだけをブロックする。 理にかなった設計思想だと感じました。

従来の3つの権限モードとの違い

Claude Codeにはもともと3つの権限モードがありました。

  • default: すべてのアクションで承認を求める
  • acceptEdits: ファイル編集は自動、bashは承認が必要
  • plan: 読み取り専用。変更は一切しない

Auto Modeは4つ目の選択肢として追加されたもの。 Shift+Tabで切り替えられます。 (Claude Code公式ドキュメント)

Claude Codeの4つの権限モード比較表。default/acceptEdits/plan/autoの承認フローの違い

ここで大事なのは「全部スキップ」ではない点です。 --dangerously-skip-permissionsは以前から存在していました。 あれは文字通り全承認を飛ばす危険なモード。 Auto Modeはそれとは根本的に違います。


裏で動く「分類器」があなたの代わりに危険を判断する

Auto Modeの核心は、裏で動くAI分類器(classifier)です。

アクションが実行される前に、別のAIモデルが評価をかけます。 会話のコンテキストと実行予定の操作を照らし合わせる仕組み。 チェックするのは3つのカテゴリです。 (The AI Insider)

  1. スコープの逸脱: 依頼した作業範囲を超えていないか
  2. 信頼できないインフラ: 未知の外部サービスへの接続がないか
  3. プロンプトインジェクション: 悪意ある指示に影響されていないか

たとえば「src/のテストを修正して」と頼んだとします。 それなのに突然rm -rf /を実行しようとしたら止まる。 当たり前のように聞こえるかもしれません。

でも「当たり前を当たり前に止める」仕組みの実装。 AIコーディングツールに組み込まれたのは大きな一歩です。

分類器が繰り返しブロックした場合

知っておきたいポイントがもうひとつ。 分類器が同じアクションを繰り返しブロックした場合、 Auto Modeは人間にプロンプトを出します。

「完全無人」ではなく「ほぼ無人」という設計。 必要なときだけ呼ばれる。ここがよくできていると感じました。

CS(カスタマーサクセス)時代の経験を思い出します。 エスカレーションフローを設計したことがありました。 一次対応は自動化し、判断が必要なものだけ人間に回す。 Auto Modeはまさにその発想と同じ構造なんですよね。


私が試した開発フロー Before/After。体感が全く違う

ここからは実際に使ってみた話です。

Before/After比較。Auto Mode OFF時の承認連打フローとON時の連続実行フローを並べた図

Before: 承認連打の日々

副業でSlack Botのリファクタリングをやっていた時の話です。 Claude Codeに以下の指示を出しました。 「エラーハンドリングを統一して、テストも追加して」と。

実行されるアクションはこんな感じでした。

# こういうのが延々と出てくる(イメージ)
Edit file src/handlers/message.ts? (y/n)  # y
Edit file src/handlers/reaction.ts? (y/n)  # y
Run: npm test? (y/n)  # y
Edit file src/handlers/message.ts? (y/n)  # テスト失敗で再修正 → y
Run: npm test? (y/n)  # y
# ...以下20回くらい繰り返し

修正→テスト→修正のループで30分間ずっとy連打。 途中でコーヒーを入れに行きたかったのに行けない。 地味にストレスでした。

しかも厄介なのは、yを押すたびに一瞬考えてしまうこと。 「今のアクション、本当に大丈夫か?」と。 考えた結果、99%はそのまま承認するんですけどね。 この「考える0.5秒」が20回積み重なると集中が途切れます。

After: Auto Modeで「流れ」が変わる

同じ作業をAuto Modeで試しました。 CLIから有効にするのはシンプルです。

# Auto Modeを有効化して起動
claude --enable-auto-mode

# または起動中にShift+Tabで切り替え
# default → acceptEdits → plan → auto

指示を出した後、ターミナルを眺めていると変化がわかります。 ファイルの編集とテスト実行が承認なしで次々進む。 テストが失敗したら自動で修正して再実行。 このループが無人で回るのは、体感が全く違いました。

ハマったポイントを先に言っておきます。

Auto Modeが止まるパターンとして経験したのは、 外部APIのcurlコマンドでした。 Slack APIを叩くスクリプトを生成しようとした際に、 分類器が「信頼できないインフラ」と判断してブロック。 ここだけ手動で承認が必要でした。

これは正しい挙動だと思います。 外部サービスへの通信はデータ送信リスクがある。 止めてくれてありがたいくらいです。

ちなみにnpm installnpm testは問題なく通りました。 リポジトリ内で完結するコマンドは信頼される傾向にある。 このあたりの基準は使っていくうちに掴めてきます。

体感での生産性変化

数字で出すのは難しいですが、体感を正直に書きます。

  • リファクタリング: 30分の承認連打が放置15分で完了。手が空いた時間でSlackの返信を片付けられた
  • テスト修正ループ: 3〜5回の修正ループが完全自動化。途中でコーヒーを入れに行ける
  • 集中の質: 「y押す→確認→y押す」から「指示→結果確認」の2ステップに変わった

「些細な改善じゃないか」と思うかもしれません。 でもバイブコーディングの真髄は別のところにあります。 人間がコードの細部に介入しないことなんですよ。 Auto Modeはその思想を権限モデルのレベルで実現した機能です。

ひとつ注意点も書いておきます。 Auto Modeは万能ではありません。 Anthropicも「隔離された環境での使用を引き続き推奨」と明記。 本番環境に直接適用するのではなく、 feature branchやサンドボックスで使うのが安全です。 (BuildFastWithAI)


Enterpriseセルフサーブ解放で「個人の遊び」から「チームの標準」へ

Auto Modeと同時期に、もうひとつ動きがありました。 Enterpriseプランのセルフサーブ解放です。 (Anthropic公式)

これまでEnterpriseは営業チーム経由での契約が必要でした。 SSO、役割ベースのアクセス制御、コンプライアンスAPI。 機能は揃っていたけれど、導入ハードルが高かった。

セルフサーブ化で管理者が直接シートを購入できるように。 組織全体のClaude Code設定をポリシー配布する機能も追加。

Enterprise管理画面のイメージ。組織全体のAuto Mode設定、使用パターンの可視化ダッシュボード

これが意味すること

個人で使っていた人には「便利になったね」で終わる話。 でも組織レベルで見ると景色が変わります。

管理者がAuto Modeのポリシーを組織全体に適用できる。

たとえば本番ブランチではAuto Mode禁止。 feature branchでは許可。そんなルールを一括設定できます。 PRに含まれるAI支援コード量の可視化ダッシュボードもある。 導入効果の測定がそのまま可能です。

CS時代にツール導入の支援をしていた経験から言えること。 経営層への「このツールの価値は何か」の説明は大変です。 使用量と成果が見える管理画面は、推進者にとって最高の武器。

料金体系: シート+従量課金

Self-Serve版はシート課金+APIレート従量課金のモデルです。 (Anthropic料金ページ)

使った分だけ払う構造。 「全員に配布したけど使われていない」が起きにくい。 CS出身としては「よくわかってるな」と思うポイントでした。

前職でSaaS導入を支援していた頃を思い出します。 年額契約で使われないライセンスを大量に抱えるクライアント。 何社も見てきました。 月1回も開いていないユーザーに毎月課金が発生する状況。 その打開策として従量課金モデルを提案した経験がある。 AnthropicのSelf-Serveはその理想形にかなり近いと感じます。


Auto Mode時代に人間がやるべき仕事の「最小単位」

ここからが本題です。 Auto Modeで、エンジニアの仕事はどう変わるのか。

業界全体で見ても、この方向性は加速しています。NVIDIA GTC 2026でJensen Huang(ジェンスン・ファン)が「agent inflection point(エージェントの転換点)」と語りました。CLIエージェントが開発現場の本流に入り、バイブコーディングが検定になる時代。Auto Modeはその流れをもう一歩押し進める存在です。

「導入フェーズ」から「実務標準フェーズ」への移行ツール。そう位置づけるのが最もしっくりきます。

「コードを書く」から「指示を設計する」へ

従来のバイブコーディングでも仕事の性質は変わっていました。 「コードを書く」から「AIに指示を出す」へのシフト。 Auto Modeで起きるのは、その先の変化です。

「指示を出す→確認」が「指示を設計する→検証」に変わる。

「指示を出す」と「指示を設計する」は似て非なるもの。

「指示を出す」は1回のプロンプトです。 「指示を設計する」はAuto Modeが自律的に完遂できる 作業の塊を定義すること。10ステップを任せるイメージ。

具体的に何が変わるか

Before(Auto Mode以前):

  1. 「message.tsのエラーハンドリング修正して」→ 承認 → 確認
  2. 「テストを追加して」→ 承認 → 確認
  3. 「テスト失敗してるから直して」→ 承認 → 確認

After(Auto Mode以降):

  1. 「2ファイルのエラーハンドリング統一、テスト追加、テストが通るまで修正」→ 放置 → 最終検証

1つ目は3ステップの「指示出し」。 2つ目は1つの「指示設計」。この違いは作業規模に比例します。

マルチファイルリファクタ、依存パッケージ更新、テスト修正。 Auto Modeが力を発揮するのはリポジトリ内完結の定型作業。 (BuildFastWithAI)

人間に残る仕事は何か

Auto Modeに任せられない領域を整理しました。

  • 設計判断: どんなアーキテクチャで実装するか。AIには丸投げできない
  • 外部接続の判断: どのAPIに接続し何を送るか。分類器がブロックする領域
  • ビジネス要件の翻訳: ユーザー体験をコード仕様に落とし込む作業。CS出身の私の強み
  • 最終検証: 生成結果が意図通りか確認する「最後のチェック」

逆に「書く」「直す」「テストを通す」はAuto Modeに任せていい。

「設計判断」をもう少し掘り下げさせてください。 私が副業で作っているSlack Botを例に取ります。 「リアクションをトリガーに特定チャンネルへ転送」という仕様。 これはビジネス文脈を理解して初めて出てくる要件です。 Auto Modeでは決められません。

でも「その仕様をTypeScriptで実装して」は得意領域。 「エラーハンドリングを付けてテストも書いて」もお手のもの。 仕様を考える人間と、仕様を実装するAI。 この役割分担がAuto Modeで初めて線引きされた気がします。


まとめ: 承認ボタンが消えた先に見える景色

Auto Modeは単なる便利機能ではありません。 エンジニアの仕事の粒度を変える転換点です。

エンジニアの仕事の粒度変化を示すタイムライン。手書きコード→AI補完→AIエージェント→Auto Mode自律実行

振り返ると、私が「プロには敵わない」と感じた壁は、 コードの品質やスピードでした。 Cursor(カーソル)が来て補完が速くなった。 Claude Codeが来て「凄腕エンジニアが宿った」感覚を得た。

Auto Modeはその凄腕エンジニアが 自分の判断で手を動かしてくれるフェーズの始まりです。

「怖くないか」と聞かれたら、正直ゼロではありません。 理解していないコードが自動で生成される感覚は慣れが必要。

でも分類器というセーフティネットがある。 危険なアクションは止まる。最終検証は自分がやる。 この構造なら、私は使います。

CLIエージェントが本流に入り、検定が生まれ、Auto Modeが来た。AIコーディングは「趣味の段階」を完全に抜けたと言い切れます。検定で知識を証明し、Auto Modeで実務の生産性を上げる。そういう時代が、もう始まっている。

まだ試していない人へ。 claude --enable-auto-modeで有効化できます。 feature branchで小さなリファクタから始めてみてください。

93%のyを押す時間が消えたとき、 自分が本当にやるべき仕事が何か見えてきますよ。


出典:

ゲン
Written byゲンCS × Vibe Coder

正直、一度エンジニアは諦めました。新卒で入った開発会社でバケモノみたいに優秀な人たちに囲まれて、「あ、私はこっち側じゃないな」って悟ったんです。その後はカスタマーサクセスに転向して10年。でもCursorとClaude Codeに出会って、全部変わりました。完璧なコードじゃなくていい。自分の仕事を自分で楽にするコードが書ければ、それでいいんですよ。週末はサウナで整いながら次に作るツールのこと考えてます。