開発/設計

「プロダクトの80%はAIで書いた」が日本のスタートアップで現実になった。PeopleX宣言とCursor Composer 2を並べて、本番運用の地図を書く

PeopleXが新規実装の80%をAI生成と公表した。Cursor Composer 2正式版と並べると、バイブコーディングは「試す段階」を抜けて「本番運用フェーズ」に入った。月20ドルで使う側の私が今週やる本番化チェックまで翻訳する。

「プロダクトの80%はAIで書いた」が日本のスタートアップで現実になった。PeopleX宣言とCursor Composer 2を並べて、本番運用の地図を書く
目次

昨日の朝、私はSpaceXがCursorに$60B買収オプションを設定した話を書いた。$60B、$10B、$1.3Bの3つの数字を分解しながら、月20ドルで使ってる側の地図を書き直す内容だ。読み終わったあと、自分でこう思った。「マクロの話だけだと、明日もう一度Cursorを開いた時に、何を変えればいいのか掴めない読者がいる」。

その答えは、2025年6月に出ていた。

日本のHRスタートアップ、株式会社PeopleXが「全プロダクトの新規実装ソースコードの約80%をAIで開発」と発表した。発表は2025年6月4日。一次ソースはPR TIMESCreatorZine日本経済新聞が同時報道している。導入したのはCursorとv0。バイブコーディングという呼び名で広まった「AIに自然言語で指示してコードを生成させる開発方式」を、実プロダクトの中核に据えた、と公式に宣言したわけだ。

その約9ヶ月後、CursorはComposer 2の正式版を出した(2026年3月19日)。プログラミング特化のAIモデルで、SWE-bench Multilingualで73.7点。コーディング領域でfrontier級の有力候補として名乗りを上げた。

バイブコーディング本番化の時系列タイムライン。横書きシーケンス図で、左から「2025-06-04 PeopleXが新規実装80%をAIで開発と宣言」「2026-

元・挫折エンジニアとして言わせてほしい。これは「自分には関係ない」記事ではない。月20ドルでCursorを開いてる時点で、あなたはPeopleXと同じインフラの上に立っている。違うのは「何%まで任せるか」の意思決定だけだ。

この記事では、$60Bの祝祭ではなく、80%という運用数字を分解する。3時間溶かした人間が、3分でフレームを渡したい記事を書く。

【事実編】PeopleX「80%をAIで開発」宣言の中身を分解する

ここからの2つのH2は、報じられた一次情報の整理に絞る。私見と行動提案は後半【私見編】【行動編】にまとめた。

最初に、PR TIMES原文と複数報道で確認できる事実だけを並べる。私の解釈は次のセクションに置く。

何を発表したか

PeopleXは、人事領域のSaaSと「AgenticHR Platform」を開発する日本のスタートアップだ。今回の発表で確認できる主な事実は4つある。

項目内容ソース
導入ツールCursor(AIエディタ)と v0(UI自動生成ツール)PR TIMES
配布範囲全エンジニア・デザイナー同上
数値全プロダクトの新規実装ソースコードの約80%をAIで生成同上
開発手法バイブコーディング(自然言語指示でAIがコード生成)同上

「全プロダクト」が指すのはPeopleX社が公開している複数のSaaSだ。新規実装に限定しての80%という条件付きであって、「既存コード全部の80%がAI生成」という話ではない。ここを読み飛ばすと数字を誤読する。

「新規実装の80%」と「コードベース全体の80%」は違う

ここは大事なので一段ぶら下げる。報道で「80%をAIで開発」と一言で書かれると、「ソフトウェア全体の8割がAI製」と誤読されがちだ。原文の主旨は「新規に追加・修正される実装行のうち約80%がAI生成」という意味で、過去のコードベース全体ではない。

例えるとこうなる。あなたの手帳の今年分、8割をAIが下書きした、という話だ。過去10年分の手帳全部の8割がAIで埋め直された、という話ではない。新規分の話、と覚えておきたい。

CTOの発言「異常な速度で実装する」

PR TIMES内で、PeopleXのCTOコメントが引用されている。同社のコアバリューの1つに「異常な速度で社会に実装する」が掲げられていて、その実現手段としてAIツールを開発フローの中核に据えた、という説明だ。

挫折組として読むと、これは「ツール選定の話」ではなく「経営判断としてバイブコーディングを業務OSに組み込んだ」という話に聞こえる。Cursorの月額は1ライセンス20ドル前後(個人プランの場合)。エンジニア・デザイナー全員に配ったところで、年間の人件費に対しては誤差みたいな金額だ。それで「新規実装の80%」が回るなら、ROIは桁が違う。

他社の事例と並べる

PeopleX 80%という数字を読む時は、他社の本番運用事例と並べると地図が立体になる。

  • Money Forward: 2026年Q1時点で全エンジニア約1,000人にCursor配布(既出記事参照・私が3月に書いた記事の再掲ベース)
  • PlanetScale: AIコードレビュー導入で2 FTE相当を削減(同上記事)

なお、Anthropicが自社コードの90%超をAIで生成していると複数の二次報道が伝えているが、一次ソースは現時点で未確認のため参考情報として扱う。

PeopleXの80%は、確認できた事例の中でも高水準のレンジに入っている。「日本のスタートアップが世界水準の生産性に追いついた」、というより「世界水準の生産性に乗らないと事業が回らない時代に入った」という方が正確だ。

バイブコーディング本番運用事例カード3枚。左から「PeopleX: 新規実装の約80%をAI生成・Cursor+v0・2025年6月発表(出典: PR TIME

【事実編】Cursor Composer 2正式版が変えた現場の動かし方

PeopleX 80%を支える側のインフラも、その後に動いた。Cursorが2026-03-19に発表したComposer 2の正式版だ(SiliconANGLE 2026-03-19Cursor公式blog)。

Composer 2の核心スペック

公開済みの数字を、雑音抜きで並べる。

指標Composer 2比較対象出典
コンテキスト200,000トークンClaude Opus 4.6: 200KSiliconANGLE
アーキテクチャMixture-of-Experts (MoE)同上
価格(API換算)入力$0.50/M、出力$2.50/MOpus 4.6: 出力$15/M(参考)同上
SWE-bench Multilingual73.7Opus 4.6: 近似帯DataCamp Composer 2 review
Terminal-Bench 2.061.7同帯上位同上
CursorBench61.3GPT-5.4 medium・low と同帯同上

Mixture-of-Experts(MoE)というのは、入力ごとに「必要な専門家モデルだけが動く」設計の総称だ。全パラメータを毎回動かすより速く、安く動く。Cursorはこの仕組みを採ることで、出力1Mトークンあたり$2.50という価格帯でコーディング特化を成立させた。

ベンチマークの読み方を3行で

ベンチマーク数字は、慣れていないと「で、何ができるの?」になりがちだ。私の現場感で翻訳する。

  • SWE-bench Multilingual 73.7: GitHubの実バグ修正で、73.7%のチャレンジに合格レベル
  • Terminal-Bench 2.0 61.7: ターミナル経由でファイル操作・実行・確認まで通せる比率が61.7%
  • CursorBench 61.3: Cursor自身のリアルタスクで61.3%通過

3指標でfrontier級モデルと肩を並べるレンジに入っている。「コーディング特化モデルとして、実戦投入できる有力候補が、Cursorのサブスクの中に入った」と読み解ける。

Composer 2が「価格×速度」で開けた本番運用の窓

ここが、PeopleX 80%とつながる肝だ。Composer 2の価格は、出力1Mトークンあたり$2.50。これは Opus 4.6 の出力単価(参考: $15/M)の6分の1に近い。コーディング作業では、入力(既存コード読み込み)も出力(生成コード)も大きい。価格が6分の1ということは、同じ予算で6倍動かせる、ということだ。

エンタープライズで「全エンジニアにAIエディタを配って、新規実装の8割を任せる」運用は、Opus 4.6相当の単価では予算が破綻する。Composer 2が出てきて初めて、PeopleXのような会社が「全員配布×新規80%」を業務として成立させられる経済性が出た。

# 例: 1人のエンジニアが1日にAI生成依存で書くコード量を概算する
# 平均的な手書きコード量: 200行/日
# AI支援で生成行数が3倍になると仮定: 600行/日
# 出力トークン換算(1行≒40トークン): 24,000トークン/日

# Composer 2 出力単価: $2.50/M
# 1人あたり1日のAPI使用料目安: 24,000 × $2.50 / 1,000,000 = $0.06
# 月20営業日換算: $1.20/人/月

# Cursorのサブスク料金(個人プラン): $20/月
# Composer 2の単価設計だと、サブスク内に十分収まる

このコスト構造があるから、PeopleXは「全エンジニアに配布」を判断できた。Composer 2は単に「新しいモデル」ではなく「本番運用の窓を開いたコスト構造」として読みたい。

Composer 2 vs Claude Code vs GitHub Copilot の現状ポジション

docs/research/toomi_claude_2026-04-29.md で追跡されているCursor Composer 2の文脈を踏まえつつ、私が今週使い分けに使っているフレームを書き出す。これはあくまでスナップショットで、来月には変わる前提だ。

ツール強み弱み「本番」での適性
Cursor + Composer 2価格$2.50/M出力・コーディング特化・MoE高速UIで完結する分、CLI統制は弱い全員配布で日常実装に強い
Claude Code(Opus 4.6 / Sonnet 4.6)長文設計指示・思考の透明性・CLI統制単価が相対的に高い設計レビューと長文タスクに強い
GitHub Copilot(GPT-5系)既存IDE統合の摩擦が低い思考プロセスの可視性は薄い個人OSSや小規模チームで導入が早い

PeopleX 80%は、Cursor + v0 という構成だ。3つ全部使う必要はない。だが「日常実装はCursor、長文設計はClaude Code、軽量補完はCopilot」のような棲み分けは、私の手元で機能している。

Composer 2・Claude Code・GitHub Copilot の3ツール比較表に、各ツールの強み・弱み・本番適性を3列で配置した選択マトリクス。各

【接続編】昨日の$60Bと今日の80%は、同じ事件の別の角度

ここは事実と私見が混じる接続セクションだ。明示的に書いておく。

私が昨日書いたSpaceX×Cursor $60B記事は、資本側のマクロイベントだった。9兆円規模で動く話。一方、PeopleX 80%は運用側のミクロイベントだ。日本のスタートアップが2025年6月に「本番でこう動かしています」と数字で示した話。

並べると、こう見える。

角度4/29記事(マクロ・資本)本記事(ミクロ・運用)
主語SpaceX × CursorPeopleX
数字$60B買収オプション・$10B協業フィー全プロダクト新規実装の80%
領域投資・所有権の地図開発フローと業務OS
読者へのメッセージ「月20ドルは投票」「自分は何%までAIに任せるか」
共通の方向バイブコーディングが業界の本流に来たバイブコーディングが現場の本番に来た

2記事をセットで読むと、「2025〜2026年にかけてバイブコーディングが資本面と運用面の両方で本流に入った」という構図が見える。SpaceX×Cursorの$60Bと、PeopleXの80%は、別の事件ではなく、同じ事件の2つの角度だ。

個人開発者にとっての翻訳

挫折組の私から、月20ドルで使ってる側の翻訳を書いておく。

$60Bは「あなたが乗ってる船の大きさ」を示す数字だった。80%は「同じ船の中で、隣の客がどれくらい荷物をAIに預けているか」を示す数字だ。船の大きさは個人の判断には直結しないが、隣の客の荷預け率は直結する。あなたが「30%しか任せていない」状態で、隣の客がもう80%預けているなら、その差は1〜2年で生産性の桁差になる。

これは脅しではない。私自身、つい3ヶ月前まで「補完候補を採用するか手動で考える」モードでCursorを使っていた。今は違う。「まずAIに書かせて、レビューする側に回る」モードに変えてから、業務の余力が3〜4倍になった。30%→70%へ移行する瞬間、生産性の感覚が変わる。

PeopleX 80%は、この移行を「一人の体験」ではなく「組織の業務OS」として行えるかを問う数字だ。挫折組として、ここに引き込まれない理由がない。

マクロとミクロが短期間に揃うと何が起きるか

マクロイベント(資本)とミクロイベント(運用)が短期間で揃うと、業界の方向性は1段階ロックされる。資金が入って、本番採用が出て、メディアが取り上げる。3点が重なった局面は、後から振り返ると「フェーズ転換点」と呼ばれることが多い。

例えば2022年11月、ChatGPT公開週がそうだ。当時、私は「面白いツールが出たな」程度に流していたが、半年後には開発フローが書き換わった。昨日の$60Bと、PeopleX 80%の積み重ねは、同じ匂いがする。流すか乗るか、判断は読者に委ねるが、流した側のリスクは小さくない。

【私見編】「実験」と「本番」を分ける4つの軸

ここから先は、私の現場感ベースの判断軸だ。出典に支えられた事実ではなく、CS出身の運用視点と挫折組のフィルター越しの観察。

PeopleX 80%は「本番運用フェーズに入った」と表現された。だが、本番と実験の境界は曖昧になりがちだ。私が手元で使ってる4軸の判断フレームを書き出す。これに3つ以上当てはまるなら「本番」、2つ以下なら「実験」だ。

「実験」「本番」を分ける4軸の判断フレーム。中央に4象限のマトリクス、各軸に「コードレビュー体制」「ロールバック手段」「モデル依存の二重化」「運用ログの取得」を

軸1: AI生成コードの全件レビュー体制があるか

「AIに書かせたコードを、人間が必ず読む」体制が組織に組み込まれているかどうか。これが最重要だ。

PeopleXの80%が「本番」と呼べるのは、おそらく社内に「AI生成コードでも通常のPRレビューを通過させる」標準フローがあるからだ。Cursorの差分がGitHub PRに乗り、レビュアーが目を通し、テストが通って初めてマージされる。この経路があれば、AIが書いた行も人間の目を1回は通っている。

逆に「AIが書いたから動くだろう」でマージしている個人プロジェクトは、ここで脱落する。挫折組としての本音、3ヶ月前まで私はこっち側だった。動いたコードはそのままマージ、動かなかったコードだけ手直し。本番運用の視点では失格だ。

軸2: ロールバック手段が常に1コマンドで動くか

AIが書いたコードに本番障害が起きた時、何分で前のバージョンに戻せるか。これは個人開発者でも本番運用の手前で必ず備える指標だ。

私がPeopleX発表を読んで真っ先に思ったのは、「80%をAIに任せて、もし本番で事故ったらどう戻すんだろう」という運用的な疑問だった。組織として80%まで任せられるのは、おそらくCI/CDとロールバックの自動化が固まっているからだ。デプロイした瞬間に1コマンドで前バージョンに戻せる経路がないと、AI生成率の数字を上げる経営判断はできない。

具体的には、以下のような備えだ。

# Vercelの場合
vercel rollback <deployment-id>
# 直近20デプロイ分が常にリスト化されている

# Renderの場合
# ダッシュボードから「Rollback」ボタン1つで直前バージョンに戻る

# AWS ECSの場合
aws ecs update-service \
  --cluster <cluster> \
  --service <service> \
  --task-definition <previous-task-def-arn>
# 1コマンドで前タスク定義に戻せる

ロールバックを自動化していないチームは、AI生成率を高めるべきではない。ハマりポイントを先に書いておく、私はかつてロールバック手段なしで本番にデプロイして、深夜2時にDB復旧で泣いた経験がある。先に備える方が安い。

軸3: モデル依存の二重化があるか

「Composer 2が動かなくなったら明日の業務が止まる」状態は、本番運用ではない。これも$60B記事と地続きの話だ。Cursorの所有権がSpaceXに動く可能性が出た以上、モデルやツールが1つのベンダーに集中するリスクは現実的になった。

PeopleXがCursor + v0 で80%を回しているとして、もしCursorに大規模障害が起きた場合のフォールバックがあるか。これは外からは確認できないが、本番運用と呼ぶ条件としては必須だ。

私の手元では、Cursor + Composer 2 を主にしている。Claude Code(Opus/Sonnet)を副、GitHub Copilot(GPT-5)を予備、の3層構成だ。1層目が落ちても2層目で回せる。3層目まで含めれば、ベンダー1社の事故で業務が完全停止する事態は避けられる。

これは個人開発者でも今日から組める。サブスク3つで月$50〜$70。$60Bが動く世界の中での保険料としては安い方だ。

軸4: 運用ログを「あとで読む」状態に置けているか

最後の軸が、地味だが効く。AIが生成したコード差分を、後からまとめて読み返せる状態にしているか。

CursorにはAI生成行を判別するメタデータが内部に持たれているが、出力先のリポジトリには直接残らない。何も対策しないと、6ヶ月後に「このバグのある行はAIが書いたのか、人間が書いたのか」が判別できなくなる。

私は最近、コミットメッセージに [ai-assisted][ai-generated] のタグを足す運用を始めた。GitフックでCursor使用時に自動付与する。これだけで「障害発生時の原因切り分け」と「AI生成率の自社測定」が両立する。

# .git/hooks/prepare-commit-msg の例
#!/bin/bash
# Cursor経由のコミットなら [ai-assisted] タグを自動付与
if [ -n "$CURSOR_SESSION_ID" ]; then
  # コミットメッセージの先頭にタグを挿入
  sed -i.bak '1s/^/[ai-assisted] /' "$1"
fi

PeopleXが80%という数字を出せたのは、おそらく類似の計測体制があるからだ。逆に「AIで書いた行と書いてない行の比率を出せない」状態は、本番ではなく実験の段階だ。

【行動編】月20ドルの個人開発者が今週やる「本番化チェック」3つ

ここまで読んで「本番運用、自分には早い」と思った読者がいたら、それは違う、と挫折組の私から伝えておきたい。本番化は組織の話じゃない。「自分の作業を、AIにどこまで預けて回せるか」の話だ。月20ドルで使ってる時点で、入り口に立っている。

PeopleX 80%を「他社の話」で終わらせないために、私が今週から始めた3つの行動を共有する。3時間溶かしたので、あなたは3分で通過してほしい。

行動1: 自分のリポジトリの「AI生成率」を可視化する

まず、自分が今どのくらいAIに任せているかを数字で出す。「だいたい半分くらい」では弱い。週単位で実数を測る。

私の方法を書いておく。コミットメッセージにタグを足すだけだ。

# 直近1週間のコミットでAI生成タグの比率を出す
git log --since="1 week ago" --oneline | wc -l > total.txt
git log --since="1 week ago" --oneline | grep -c "\[ai-" > ai.txt
echo "AI生成率: $(cat ai.txt) / $(cat total.txt)"

最初に測ると、思ったより低い数字が出ることが多い。私は最初、自分で「70%くらい任せてる」と思っていたら、実数は42%だった。可視化すると、伸びしろが見える。

PeopleXの80%は、自社で測定しているからこそ出せた数字だ。あなたも自分の数字を持っていい。

行動2: ロールバック手段を1コマンド以内に圧縮する

本番化の手前で、ロールバック経路を必ず確認する。Vercel・Render・Cloudflare Pages・Netlify・AWS Amplify、どのサービスを使っていても、ダッシュボード or 1コマンドで直前デプロイに戻せるはずだ。

知らない人が一定数いる。今すぐ自分の使っているサービスのドキュメントで「rollback」を検索して、1回試しに戻してみてほしい。本番が動いていない深夜の試運用で、5分で済む。

「やればわかる」は本番でやってはいけない。「実験中に1回試した」が本番運用の前提条件だ。挫折組として、私はここを怠って3ヶ月で2回障害を起こした。

行動3: モデル選定の「二重化サブスク」を月$50で組む

最後に、月の支出を少しだけ組み替える。AIエディタを1社に集中させない。

私の現在の構成を晒す。

種別サブスク月額役割
Cursor + Composer 2$20日常実装・全タスクの一次対応
Claude Code Pro$20設計レビュー・長文タスク
予備GitHub Copilot$10個人OSS・軽量補完
合計$50

月$50。$60Bが動く世界では、これは保険料としては安い。1社の障害で業務全停止を避けられるなら、月コーヒー10杯分の出費は、むしろ意思決定としては合理的だ。

PeopleX 80%の話を読んで「自分も明日から80%」とは思わなくていい。だが「自分も本番運用フェーズに入る覚悟は決めよう」とは思ってほしい。月$50の二重化サブスクは、その覚悟を3分で形にできる仕組みだ。

本番化チェック3つの行動マップ。中央に「AI生成率の可視化」「ロールバック1コマンド」「モデル選定の二重化サブスク」を3つの円で配置、各円に「実施目安:今週中」

まとめ — 80%は「実験から本番へ」の合図

長くなったので、まとめを箇条書きで残す。

  • PeopleXは「全プロダクト新規実装の約80%をAIで生成」と2025年6月に公式発表(PR TIMES・日経・CreatorZine報道)。CursorとV0の本格導入が背景
  • 同年約9ヶ月後、Cursor Composer 2が正式版に。SWE-bench Multilingual 73.7、出力単価$2.50/M、MoEで高速化。コーディング特化の実戦投入できる有力候補
  • 昨日書いた$60B買収オプションが「資本のマクロ」、80%が「運用のミクロ」。同じ事件の別の角度
  • 本番と実験を分ける4軸: 全件レビュー、ロールバック、モデル二重化、運用ログ
  • 個人開発者の今週アクション: AI生成率の可視化、ロールバック1コマンド化、月$50の二重化サブスク

挫折組の同志に向けて最後に一言。「PeopleXは本気で本番に入った会社」と「自分は実験中の個人」を分けて見るな、と言いたい。月20ドルで使ってる時点で、同じ船に乗っている。違うのは「何%まで任せるか」の判断だけだ。

挫折経験があるからこそ、「本番運用」という言葉の重みがわかる。AIが書いた行で本番が動く瞬間、そこには動かしている責任がある。だからこそ、4軸のチェックを今週通しておきたい。挫折組の地図読み力で、PeopleX 80%の話を、自分の現場の話に翻訳していく。

私はこれから、今日もCursorを開いて「とりあえず動くもん作りましょう」と話しかける。Composer 2が背中で動いて、PeopleXが隣の船で80%を回している、その地図の上で、私の月20ドルの作業は変わらない。けど、その20ドルの意味は、確実に書き換わった。


出典一覧

関連記事

ゲン
Written byゲンCS × Vibe Coder

正直、一度エンジニアは諦めました。新卒で入った開発会社でバケモノみたいに優秀な人たちに囲まれて、「あ、私はこっち側じゃないな」って悟ったんです。その後はカスタマーサクセスに転向して10年。でもCursorとClaude Codeに出会って、全部変わりました。完璧なコードじゃなくていい。自分の仕事を自分で楽にするコードが書ければ、それでいいんですよ。週末はサウナで整いながら次に作るツールのこと考えてます。