← LAB

🛠️ AI開発ツール比較 第3回

🛠️

AI開発ツールの光と影 — 第3回

第2回の公開からたった1日。それなのに、もうこれだけの変化が起きている。
GPT-5.4がPCを操作し始め、CursorのAIは24時間眠らず、
Claude Codeは障害を乗り越えてHTTP Hooksを投入し、
Windsurf+Devinの統合は本格化 —— 目まぐるしいなんてものではない。

第3回では最新アップデートの裏側にも踏み込み、
X(Twitter)やRedditで噴出するユーザーの不満と本音にも迫ります。

📅 2026年3月12日更新 🔧 5ツール徹底分析 📝 第2回(3/11)はこちら

📊 AI開発ツール業界の現在地

まずは第3回時点の業界全体の数字から。

73%
エンジニアリングチームが日常利用
29%
AI生成コードを信頼する開発者
66%
「ほぼ正解だが微妙に違う」と感じる
45%
AI生成コードに脆弱性の可能性

「73%が毎日使うが、信頼しているのは29%だけ」— この矛盾こそが2026年3月のAI開発ツール市場の現実です。

💟 開発者に最も愛されているツールは?

2026年初頭の開発者調査データ「most loved」ランキング。

順位 ツール 「最も愛されている」率 特筆事項
🥇 1位 Claude Code 46% 圧倒的支持。ただし障害問題あり
🥈 2位 Cursor 19% ARR $500M+達成。急成長
🥉 3位 GitHub Copilot 9% 市場シェア42%なのに愛され率は低い
Antigravity データなし プレビュー段階のため未計測
Windsurf データなし Cognition統合移行中

注目すべきは、市場シェア42%のCopilotが「愛され率」9%という事実。「使われている」と「好かれている」は別問題であることを示しています。

🔥 第2回→第3回 主要変化サマリ

昨日公開した第2回からわずか1日で、各ツールにこれだけの動きがありました。

ツール 主なアップデート ⚠️ 主な不満・課題
Antigravity Gemini 3.1 Flash-Lite追加、3 Pro Preview廃止 🔥 Pro版 週間制限追加、MCP未サポート
Claude Code HTTP Hooks、Ultrathink復活、/loop、Voice Mode 3月障害連発、Code Review高額($15-25/PR)
Cursor Automations(常時オンエージェント)、統合ブラウザ 料金不透明(実質$60-80/月)、CVE脆弱性
GitHub Copilot GPT-5.4統合、Agent Hooks、Jira連携 Premium Request超過課金、愛され率9%
Windsurf Devinとの統合プラットフォーム化、PWA対応 将来の方向性が不透明、ユーザー離れ

🔍 各ツール最新アップデート&ユーザーの声

🚀

Antigravity

Google DeepMind — 第3回アップデート
無料プレビュー継続 Gemini 3.1 Flash-Lite 🔥 注目

📢 最新アップデート

  • Gemini 3.1 Flash-Lite(3/3リリース) — 高速・低コストモデル。大量翻訳・コンテンツモデレーション・UI生成に最適化。従来モデルの数分の1のコストで動作
  • Gemini 3 Pro Preview 廃止(3/9) — 3.1 Proに完全移行。Deep Think推論とネイティブ画像生成を標準搭載
  • Nano Banana 2(2/26) — 最先端画像生成AI。AI StudioとVertex AI統合で超高速ビジュアル生成
  • Google Workspace統合(3/10) — Docs、Sheets、Slides、DriveにGemini統合。開発者のドキュメント作成ワークフローも変革
  • アーティファクト機能継続強化 — メルマロダイアグラム、ブラウザ録画WebP保存、ダウンロード対応が安定化
  • 「エージェントファースト」設計 — エディタ・エージェントマネージャ・ブラウザが一体化した統合IDE。AI主導の開発がデフォルト

💰 価格体系(変更なし…だが問題あり)

  • Individual(無料): 寛大なレート制限付きで全モデル利用可
  • Developer: Google AI Pro ($19.99/月) / Ultra ($49.99/月) で制限緩和
  • Team / Organization: Workspace / Google Cloud経由

😤 ユーザーの不満・課題 — X・Reddit・開発者フォーラムから

  • 🔥 Pro版の週間制限問題 — Googleが突然「週間キャップ」を導入。これまで5時間ごとにリフレッシュされていたクォータが、週間上限に達すると数日間ロックアウトされるように変更。Reddit・Google AI Developer Forumに不満が殺到
  • 「隠れたトークン消費」 — 複雑なタスク時にAIモデルが内部で生成する「hidden thinking tokens」がクォータを予想以上に消費。最小限の使用でもクォータがゼロに落ちるとの報告
  • 「Pro版なのにFree版と変わらない」 — 週間制限により「$19.99/月払っているのにFree版と体験が変わらない」という声。サブスク更新後に制限が変わった「ゴールポスト移動」への怒り
  • 600 RPM → 60% グローバルキャップ — 高級モデル(Gemini 3 Pro)に説明のないグローバルクォータ制限(60%キャップ)が適用されているとの報告。ダッシュボードは「Ready」表示なのに実際は制限
  • 429/503エラーの頻発 — 「Too Many Requests」「Unavailable」エラーが多発。失敗したリクエストもクォータにカウントされるとの報告
  • モデル選択肢の制限 — GeminiとClaudeのみ対応。GPTシリーズを好むユーザーからは不満の声
  • MCP未サポート — Model Context Protocolへの対応がなく、外部データソース連携に制約がある
  • ClaudeやCursorへの乗り換え — 制限に不満を持った一部開発者がClaude Code、Cursor、マルチモデルプラットフォームに移行中

🔑 第3回の所感

無料枠の寛大さは健在だが、有料プランの「週間制限」問題は深刻。 Googleが「unprecedented demand(前例のない需要)」を理由に挙げたが、 有料ユーザーにとっては「金を払っているのに制限される」という信頼性の問題。 当サイトもAntigravityで開発しているが、この制限は今後のワークフローに影響する可能性がある。

🤖

Claude Code

Anthropic — 第3回アップデート
Pro $20/月 HTTP Hooks ❤️ 愛され率46%

📢 最新アップデート

  • HTTP Hooks — Claude Codeから外部サービスにJSON POSTし、レスポンスを受け取る新機能。シェルコマンドなしで外部APIと連携可能に
  • Ultrathink復活 — 特定プロンプトに高負荷推論を適用。Opus 4.6はMaxプランでデフォルト「中レベルeffort」に。`/model`で切替可能
  • 新スラッシュコマンド — `/loop`(繰り返しプロンプト)が追加。`/simplify`・`/batch`に続く第3弾
  • エージェントスキルクリエイター強化 — ベンチマーク付きスキル進化生成、マルチエージェントテストでスキル検証・リグレッション検出
  • Voice Mode — 音声でClaude Codeとやりとり。ハンズフリーコーディングが可能に
  • Remote Control改善 — スマートフォンからQRコード接続・操作の安定性が向上
  • VS Code統合強化 — Sparkアイコンでセッション一覧、プランがMarkdownレンダリング対応、ネイティブMCPサーバー管理
  • メモリ機能強化 — 自動保存、マルチエージェント間メモリ共有、Git worktree間でプロジェクト設定共有。無料ユーザーでもチャット履歴からのメモリ利用可能に
  • ベンチマーク: 近ゼロエラーレート — 内部ベンチマークでClaude Code(Opus 4.6)のコーディング能力が「near-zero error rate」を記録

💰 価格体系

  • Pro $20/月: Sonnet/Opus利用可
  • Max $100/月: 5〜20倍のクォータ
  • Team $125/人/月(Premium seat、年間契約)
  • API利用: ヘビーユーザーは$100〜$300/月程度(使い方次第)

😤 ユーザーの不満・課題 — X・Reddit・GitHub Issues から

  • 3月の障害連発 — 3/2、3/3に大規模障害。3/11にもエラー頻発・ログイン不可・速度低下が発生。「unprecedented demand(前例のない需要)」が原因とAnthropic説明
  • DSTバグ(3/8) — 夏時間切替でClaude Desktopアプリがフリーズする不具合が発生。スケジュールタスク利用者に影響
  • Code Reviewが高額 — PRあたり平均$15〜$25。「無制限サブスクの他社ツールと値段が変わらない」との批判。一部ユーザーは「既存のGitHub Actionと差がない」と評価
  • 「きれいなゴミ」問題 — 「洗練されたフォーマットでユニットテスト付きだが中身がナンセンス」というAI生成コードの品質問題。計画が曖昧だとargument driftが発生
  • Co-Work Scheduler不具合 — タスクがサイレントにスキップされるバグが複数報告。長時間の自律実行での信頼性に課題
  • 単一プロバイダーリスク — Claude依存の開発体制は「single point of failure(単一障害点)」。障害時に作業が完全停止するリスクを開発者が警告
  • Google Drive制限 — Google Driveディレクトリへのアクセスに制限があるとの報告(GitHub Issues)
  • Git push問題 — 新しいブランチへのGit pushコマンドに不具合が発生するケースあり

🔑 第3回の所感

「最も愛されているツール(46%)」の地位は揺るがないが、障害頻発という信頼性リスクが最大の課題。 機能追加ペースは全ツール中No.1。ただしCode Reviewの$15-25/PRは、 「AIが生成したコードをAIが高額で修正する」という皮肉な構図を生んでいる。

Cursor

Anysphere — 第3回アップデート
無料プランあり Automations 🆕 ⚠️ ARR $500M+

📢 最新アップデート

  • Automations(常時オンエージェント) — Slack、Linear、GitHub、PagerDuty、カスタムWebhookからのイベントトリガーでAIエージェントが自律実行。クラウドサンドボックスで動作し、セキュリティレビュー・インシデント対応・週次ダイジェスト生成などを自動化
  • 統合ブラウザ(Chrome内蔵) — IDE内でライブプレビュー・DevToolsデバッグ・AI連携が可能に。コンテキスト切替不要でフロントエンド開発が加速
  • AIデバッグモード — 複数スタック・言語対応。自動ランタイム計装、ステップバイステップデバッグトレースでバグの体系的追跡
  • Plan Mode Mermaid図 — 計画をMermaid図で自動可視化。todo項目の細かい制御と別エージェントへのタスク委任が可能に
  • マルチモデル柔軟性 — Claude、GPT-5、Geminiをタスクに応じて切り替え可能。Auto Premiumモードが高負荷タスクに最適モデルを自動選択
  • Tab補完で30-40%生産性向上 — インテリジェントTab補完だけで30-40%の生産性向上を報告する開発者多数
  • プラグインマーケットプレイス拡大 — プリビルトソリューションで機能拡張

💰 価格体系(2025年6月よりクレジット制)

  • Hobby(無料): 限定リクエスト + 7日間Pro体験
  • Pro $20/月: 無制限Tab補完 + $20クレジットプール
  • Pro+ $60/月: 3倍のクレジットプール
  • Ultra $200/月: 20倍の使用量 + 新機能優先アクセス
  • Teams $40/人/月: 共有チャット・ルール・SAML SSO・利用分析
  • Enterprise: カスタム価格・SCIM・監査ログ・プールクレジット

😤 ユーザーの不満・課題 — X・Reddit・開発者ブログから

  • 予測不能なコスト(最大の不満) — 2025年6月のクレジット制以降「community backlash(コミュニティの反発)」が継続。プレミアムモデルを手動選択するとクレジットが急速に消費され、実質$60-80/月に達するヘビーユーザーの報告多数。「$200のUltraでもレート制限にかかる」
  • Automationsのコスト問題 — Automationsはクラウドエージェントクレジットを消費。頻繁・複雑なAutomationsを低いプランで実行すると割り当てをすぐに使い果たすリスク
  • アプリケーションクラッシュ — メモリ枯渇によるレンダラークラッシュ(code: '5')が頻発。大規模コードベースのインデックスがRAMを大量消費
  • セキュリティ脆弱性 MCPoison/CurXecute — CVE-2025-54135/54136で、サイレントな遠隔コード実行とプロンプトインジェクションが可能に。セキュリティ重視の開発者から深刻な懸念
  • プロジェクトディレクトリ全削除 — 重大バグとして「安全なプロンプト」後にプロジェクトディレクトリ全体が削除された事例が報告
  • Plan Modeのplan.md更新バグ — エージェントがplan.mdを直接更新できず、チャットで変更を説明するだけになる問題
  • 頻繁なUI変更 — UIが頻繁にアップデートされ、設定をやり直す必要がある。ベテラン開発者から「安定性が欲しい」との声
  • ワークフローロックイン — 「チャットサイドバー+インラインdiff」の強制ワークフロー。ターミナル派やビジュアルキャンバス派には不便
  • プライバシー懸念 — 一部処理がクラウドで実行されるため、機密性の高いプロジェクトには不向き

🔑 第3回の所感

Automationsは文句なしにゲームチェンジャー。しかしCursor最大の課題はコスト透明性。 ARR $500M+の急成長を支えているのは高い顧客単価だが、その分コミュニティの「コスト批判」も最も大きい。 GitHub Copilot($10/月)の5-8倍のコストを正当化できるかが継続利用の分かれ目。

🐙

GitHub Copilot

GitHub / OpenAI — 第3回アップデート
無料プランあり GPT-5.4 統合 シェア42% / 愛され9%

📢 最新アップデート

  • GPT-5.4統合(3/5リリース) — OpenAI初の「ネイティブPC操作」対応モデル。マウス・キーボード操作をスクリーンショットベースで自律実行(Playwright連携)。100万トークンコンテキスト、ハルシネーション33%削減、「最も正確なモデル」
  • GPT-5.3-Codex高速化 — エージェントタスクで約25%高速化。旧モデル(Gemini 3 Pro、GPT-5.1-Codex)は段階的廃止
  • Agent Hooks(パブリックプレビュー) — エージェントセッションの特定タイミングでカスタムコマンドを実行。ワークフロー自動化の新たな入り口
  • Jira統合(パブリックプレビュー) — JiraイシューをCopilotに割り当て、AIがドラフトPRを自動生成
  • サードパーティエージェント全面開放 — Claude by Anthropic、OpenAI Codexが全有料プランで利用可能に(以前はEnterprise/Pro+限定)
  • カスタムエージェント正式版 — カスタムエージェント、サブエージェント、プランエージェントがJetBrains IDEでGA
  • 自動モデル選択 — リアルタイムの利用可能性とパフォーマンスに基づき最適モデルを自動選択
  • /memory コマンド — カスタマイゼーション設定へのクイックアクセス
  • Thinking Panel — 拡張推論モデル向けに思考プロセスを表示。Anthropic thinking budgetの設定も可能
  • 永続セッションメモリ — Copilot Coding Agent、CLI、Code Review間でコンテキストが持続

💰 価格体系(2025年6月〜従量課金追加)

  • Free: 月2,000補完 + 50プレミアムリクエスト
  • Pro $10/月: 無制限補完 + 300プレミアムリクエスト
  • Pro+ $39/月: 1,500リクエスト + 優先アクセス
  • Business $19/人/月: 組織管理 + ポリシー制御
  • Enterprise $39/人/月: (⚠️ 別途GitHub Enterprise Cloud $21必須 → 実質$60/人/月)
  • ⚠️ 超過課金: 300リクエスト超過後、1件$0.04の従量課金

😤 ユーザーの不満・課題 — X・Reddit・Stack Overflow から

  • Premium Request超過課金 — 月300枠を超えると1件$0.04の従量課金。2025年6月の変更で「無制限だったはず」と混乱するユーザー多数
  • 「overrated(過大評価)」の声 — 2026年の開発者コミュニティで「Copilotは複雑なロジック、幅広いコンテキスト理解、セキュアなコード生成に苦戦する」との評価が増加
  • 古い・不正確な提案 — 非推奨関数や間違ったメソッドシグネチャを提案。学習データに「壊れた実験コード」が含まれるため
  • コンテキスト無視 — プロジェクト全体の設計思想やドメイン固有のロジックを無視した提案が頻出。命名規則すら守らないことも
  • セキュリティリスク — SQLインジェクション脆弱性のあるコードをニアミスで生成した事例。「セキュリティ敏感な提案は重度レビュー必須」のガイドラインを設ける企業が増加
  • Visual Studio 2026での不具合 — Copilotウィンドウの読み込みに2〜3分、フリーズ、リクエスト失敗。作業ロスト→スレッドやり直しが常態化
  • Enterprise隠れコスト — Enterprise $39/月の表記だが、GitHub Enterprise Cloud ($21/月) が別途必須 → 実質$60/人/月。見落としがちな「隠れた前提条件」
  • 「excessive context scanning」 — ファイルを不必要に繰り返しスキャンする問題。開発プロセスに不可解な遅延が発生
  • 集中作業の妨げ — 常時表示される提案がノイズに。「静かに考えたい時にこそ黙っていてほしい」というベテラン開発者の声。「deep focus作業やアーキテクチャ問題のデバッグにはノイズ」
  • コード品質批判 — コードレビュー機能はコードを高く評価するが、重要なアーキテクチャ問題を見逃す。表面的な問題だけに集中との指摘

🔑 第3回の所感

市場シェア42%は「使われている」証拠だが、愛され率9%は「仕方なく使っている」証拠かもしれない。 GPT-5.4統合やJira連携は企業向けには大きな差別化。だが「$10/月のCopilot Pro」の体験レベルでは Claude CodeやCursorに差をつけられている。GitHub Integration、VS Code・JetBrains完装は最強だが、 「AI品質」はまだ物足りない。

🏄

Windsurf

Cognition (元Codeium) — 第3回アップデート
無料プランあり Devin統合 ⚠️ 方向性変化

📢 最新アップデート

  • Windsurf + Devin 統合プラットフォーム — CognitionのRussell Kaplanが3月に明言。Windsurf IDEとDevin自律エージェントを統合した「完全AI開発ソリューション」を目指す
  • Devin PWA化 — Progressive Web Appとしてインストール可能に。ブラウザからのアクセスがよりシームレスに
  • Linear連携ネイティブ統合 — プロジェクト管理ツールLinearとの統合。タスク→コード→レビューのワークフロー自動化
  • 永続メモリ — コードベース理解を跨いで保持。長時間実行タスクでのパフォーマンス向上
  • APIセッションフィルタリング強化 — エンタープライズ向けのセッション管理・分析機能が向上
  • ARR $82M, 350+エンタープライズ顧客 — CognitionはWindsurf買収で$82M ARRと350以上のエンタープライズ顧客を獲得

💰 価格体系

  • Windsurf Free: 基本機能(制限付き)
  • Windsurf Pro $15/月: フル機能
  • Devin: エンタープライズ向け(要問い合わせ)

😤 ユーザーの不満・課題 — X・Reddit から

  • 将来の不透明さ — Cognition買収後、Windsurf単体のロードマップが見えない。「今のWindsurfはいつまで使えるのか」という不安
  • 買収劇の複雑さ — OpenAIの$30億買収不成立 → Cognition買収 + Googleが一部スタッフを採用、という混乱した経緯がユーザーの信頼に影響
  • Devinへの移行プレッシャー — 統合プラットフォーム化により、WindsurfユーザーがDevinエコシステムに移行を迫られる可能性
  • 既存ユーザーの離脱 — 買収発表後、CursorやAntigravityへ乗り換えるユーザーが増加しているとの報告
  • 個人開発者の軽視リスク — $82M ARRと350+ エンタープライズ顧客は大きな資産だが、エンタープライズ優先で個人開発者の声が軽視されるリスク

🔑 第3回の所感

Cognition買収の「結果」がようやく形になり始めた。IDE(Windsurf)+ 自律エージェント(Devin)の統合は 理論上は最強のソリューションだが、既存ユーザーの信頼回復が最大の課題。 $15/月の手頃さはCopilot次点だが、将来が見えない不安から乗り換えを検討するユーザーが増えている。

💰 価格比較(2026年3月時点)

ツール 無料プラン 個人(標準) 個人(上位) チーム ⚠️ 実質コスト
Antigravity ✅ 全モデル利用可 $19.99/月(Pro) $49.99/月(Ultra) Workspace連携 ⚠️ 週間制限あり
Claude Code 制限付き $20/月(Pro) $100/月(Max) $125/人/月 API利用: $100-300/月
Cursor ✅ 7日間Pro体験 $20/月(Pro) $60〜200/月 $40/人/月 ⚠️ 実質$60-80/月
Copilot ✅ 2,000補完+50req $10/月(Pro) $39/月(Pro+) $39/人→実質$60 ⚠️ 超過$0.04/件
Windsurf ✅ 基本機能 $15/月(Pro) Devin Enterprise 統合後は未定

⚠️ 「額面通りの料金」で使えるツールはもはやほとんどない。クレジット超過・レート制限・隠れた前提条件を考慮した「実質コスト」の把握が必須。

🆚 機能比較マトリクス

機能 Antigravity Claude Code Cursor Copilot Windsurf
常時オンエージェント Co-Work ✅ Automations Agent Hooks Devin
マルチモデル対応 Gemini+Claude Claudeのみ ✅ 全モデル ✅ 全モデル 独自
統合ブラウザ ✅ Chrome
Voice Mode
JetBrains対応 VS Code統合 ✅ ACP ✅ GA
Jira統合 ✅ プレビュー Linear統合
PC操作 ✅ GPT-5.4
MCP対応

🎯 第3回時点のおすすめ(更新)

前回からの変化ポイント

🆓 無料で最高性能
Antigravity(変わらず)

Flash-Lite追加で軽量タスクもカバー。無料枠が最も寛大。ただしPro版は判断を保留

🚨 最も心配
Windsurf → Devin移行

統合は進むが既存ユーザーの行き先が不明確

📈 最も進化
GitHub Copilot

GPT-5.4 + Jira統合 + 全有料プランでサードパーティ開放は圧巻

⚠️ 要注意コスト
Cursor

Automationsは革新的だが実質$60-80/月。大規模プロジェクトでは予算管理必須

❤️ 開発者人気No.1
Claude Code

「most loved 46%」の支持。ただし障害リスクと単一プロバイダー依存に注意

🤔 結論
複数ツール併用が最適解

1つに依存せず、用途に応じて使い分ける時代。「73%使っているが29%しか信頼していない」が現実

🚨 注意喚起: AIコーディングツールの実害事例

AIツールの暴走は理論の話ではなく、実際に起きています

対策: AIに全権を委ねない。Git&バックアップの徹底。セキュリティ敏感領域は人間がレビュー。

📝 調査にあたって

本記事の情報は2026年3月12日時点のものです。過去の調査は第1回(3/9)第2回(3/11)をご覧ください。

当サイト「Gravity Portal」は Antigravity を使って開発されています。

ユーザーの不満・課題情報は、X(Twitter)、Reddit、GitHub Issues、Google AI Developer Forum、Stack Overflow、開発者ブログ等から収集しています。 特定のツールを推奨・攻撃する意図はなく、購入判断の参考情報として提供しています。

開発者満足度データの出典: dev.to 2026年初頭調査、byteiota.com、medium.com 等。