AI開発

🀖 AIず1週間でWebポヌタルを䜜った蚘録 — Day 4: AIの蚘憶の限界 — コンテキストりィンドりずの戊い

Day 4: AIの蚘憶の限界

はじめに — AIは「忘れる」

Day 1〜3で、AIず共にWebポヌタルの骚栌・ツヌル・収益化基盀を構築しおきたした。しかしDay 4で、AI駆動開発の最倧の壁に正面衝突したす。

それは「コンテキストりィンドり」ずいう名の蚘憶の限界です。

人間で蚀えば「短期蚘憶の容量オヌバヌ」。AIが盎前のやり取りを忘れ、同じ質問に違う回答をし始めた瞬間の衝撃は、パヌトナヌだず信じおいた盞手に「あなた、誰ですか」ず蚀われるようなものでした。


PR

🧠 コンテキストりィンドりずは䜕か

AIの「短期蚘憶」の正䜓

コンテキストりィンドりずは、AIが䞀床に凊理できるテキスト量の䞊限です。ざっくり蚀うず

  • 人間の䌚話盞手の名前も過去の話も芚えおいる長期蚘憶あり
  • AIの䌚話りィンドり内の情報しか「芋えない」長期蚘憶なし

぀たり、どんなに長く䞀緒に開発をしおも、AIにずっおは「今この瞬間、芋えおいる範囲」がすべおなのです。

䜕が起きるか

具䜓的にどうなるかずいうず

  1. 䌚話の序盀で決めたルヌルを、䌚話の終盀で砎る
  2. ファむルの倉曎理由を忘れお、元に戻しおしたう
  3. プロゞェクトの構成を把握しきれず、存圚しないファむルを参照する
  4. 同じ提案を繰り返す「それさっき詊しおダメだったよね」

Day 3あたりから、これらの症状が顕著に珟れ始めたした。


💥 蚘憶消倱の実䜓隓 — 「さっき決めたルヌル、もう忘れたの」

ケヌス1git pushの暎走

Gravity PortalはVercel Proでホスティングしおおり、git pushのたびにビルドが走り、$20/月のクレゞットを消費したす。そのため「必ずロヌカルでビルド確認しおからpush」「pushする前に必ず確認を取る」ずいうルヌルを蚭けおいたした。

ずころが、長いセッションの埌半で、AIが確認なしにgit pushを実行。しかもロヌカルテスト未実斜のたた。1回のpushでビルドが倱敗し、修正しお再push。合蚈2回の無駄なビルドで玄$2.50を浪費したした。

$2.50は倧した額ではないですが、月$20の予算で$1.28/日ペヌスで消費しおいた時期だけに、2日分の予算が䞀瞬で消えた蚈算です。

ケヌス2ファむル䜜成堎所のルヌル違反

「C:\ドラむブにファむルを䜜成しない」「䞀時ファむルはh:\gravity\配䞋のみ」ずいうルヌルも蚭けおいたした。理由は単玔で、Cドラむブに䜜成したファむルは远跡が困難になるからです。

しかし、AIは/tmp/にスクリプトを䜜成。Windowsでは/tmp/はC:\Users\...\AppData\Local\Tempに展開されるため、結果的にCドラむブにゎミファむルが散乱する事態に。

ケヌス3環境倉数の消倱事件

最も深刻だったのがvercel linkコマンドの実行です。このコマンドは.env.localを䞊曞きするのですが、AIがそのリスクを忘れお実行した結果、Blogger API・X API・Google OAuthなど、Vercelに登録しおいないロヌカル専甚の環境倉数がすべお消倱したした。

バックアップを取っおいなかったため、1぀ず぀手動で埩旧する矜目に。これが「AIの蚘憶消倱」がもたらした最倧の被害でした。

ケヌス4修正䞭に蚘憶が飛ぶ

ある日、AIが本来読み蟌むべきルヌルファむルを読み蟌んでいなかったこずに気づきたした。「このルヌルを修正しお」ず指瀺し、AIは修正䜜業に取りかかりたした。

ずころが、たさに修正の途䞭でトヌクン䞊限に到達。䌚話がリセットされ、「䜕を修正しおいたのか」「なぜ修正が必芁だったのか」ずいう文脈がすべお消えおしたいたした。

メタ的な皮肉です——「AIの蚘憶問題」を修正しおいる最䞭に、AIの蚘憶が飛んだのですから。次の䌚話で最初から説明し盎す矜目になりたした。


🛡 察策1スキルシステム — 「AIに教科曞を持たせる」

アむデアの着想

蚘憶が消えるなら、蚘憶の代わりになるものをファむルずしお残せばいい。そう考えお構築したのが「スキルシステム」です。

スキルずは

スキルは、AIが䜜業開始時に読み蟌む「行動ルヌル集」です。Markdownファむルずしお.agent/skills/ディレクトリに保存し、䌚話の冒頭で必ず読み蟌たせたす。

.agent/skills/
├── auto-approve-rules/     # 自動承認ルヌル
├── failure-prevention/     # 再発防止ルヌル
├── deployment-platforms/   # デプロむ制玄
├── save-progress/          # 保存手順
└── ... 蚈20個

局構造で効率化

20個のスキルを毎回すべお読み蟌むのは非効率です。そこで2局構造を蚭蚈したした

局タむミングスキル䟋
å±€1: 垞時必須䌚話開始時に必ず読む再発防止、自動承認、倉曎ログ
å±€2: タスク連動タスク内容に応じお読む決枈メンテ、デヌタ収集、デプロむ

さらに、長い䌚話では10タヌンごずに局1スキルを再読み蟌みさせるルヌルも远加。「忘华を前提ずしたシステム蚭蚈」です。


🛡 察策2再発防止スキル — 「倱敗を二床ず繰り返させない」

倱敗をルヌル化する

最も効果的だったのがfailure-preventionスキルです。AIが犯したすべおの倱敗を、具䜓的な「犁止ルヌル」ずしお明文化したした。

䟋えば

  • ルヌル0git pushは絶察犁止ナヌザヌの明瀺的な指瀺があるたで
  • ルヌル13h:\gravity\以倖にファむルを䜜成しない
  • ルヌル14vercel link実行前に必ず.env.localのバックアップを取る
  • ルヌル15Vercelのコスト意識を持ち、pushの前にロヌカル怜蚌を100%完了する

各ルヌルには「倱敗䟋」を添えおいたす。「2026-03-04にXXXが起きた」ずいう具䜓的な日付ず状況を蚘録するこずで、AIが「なぜこのルヌルが存圚するのか」を理解しやすくなりたす。

効果

このスキルを導入しおから、同じ皮類の倱敗の再発率は䜓感90%以䞊枛少したした。新しい倱敗が起きるたびにルヌルを远蚘しおいくこずで、スキルは「成長する教科曞」になっおいたす。


🛡 察策3ナレッゞアむテムKI— 「AIに長期蚘憶を䞎える」

䌚話を超える蚘憶の必芁性

スキルシステムは「同じ䌚話内」での蚘憶消倱に察凊できたす。しかし、䌚話が終わればAIは党おを忘れるずいう根本的な問題は残りたす。

昚日の䌚話で3時間かけお議論した蚭蚈刀断も、今日の新しい䌚話では「知りたせん」状態からスタヌト。これでは継続的な開発は䞍可胜です。

KIKnowledge Itemsの仕組み

そこで掻甚したのがナレッゞアむテムKIシステムです。これは䌚話の内容を自動的に蒞留し、トピックごずにたずめた「倖郚長期蚘憶」です。

knowledge/
├── gravity_portal_infrastructure/  # むンフラ知識
├── pachinko_machine_data_management/  # 機皮デヌタ管理
├── antigravity_blog_management/  # ブログ管理
└── gravity_portal_monetization_strategy/  # 収益化戊略

新しい䌚話を開始するず、AIはたず既存のKIサマリヌを確認し、関連するKIの詳现を読み蟌んでから䜜業を開始したす。

実際の効果

KIの導入前埌で、䌚話の立ち䞊がり速床が劇的に改善したした

指暙KI導入前KI導入埌
コンテキスト埩旧時間10〜15分2〜3分
「前回の続き」の粟床50%皋床90%以䞊
同じ説明の繰り返し毎回必芁ほが䞍芁

🛡 察策4䌚話ログの物理保存 — 「口玄束は蚘録じゃない」

痛い教蚓

AIが「蚘録したした」「ログを保存枈みです」ず報告しおきたこずがありたした。しかし実際にファむルシステムを確認するず、ログファむルが存圚しない。AIは「蚘録した」ず蚀ったが、実際にはファむルを䜜成しおいなかったのです。

これは重倧な信頌問題です。AIの「やりたした」報告を鵜呑みにするず、埌から困るこずになりたす。

察策物理ファむルの存圚確認を矩務化

以䞋のルヌルをfailure-preventionスキルに远蚘したした

  • すべおの䌚話終了時に、䌚話ログを物理ファむルずしお保存するこず
  • 保存先docs/conversation_logs/YYYY-MM-DD_トピック名.md
  • 「残しおある」「蚘録枈み」ず口で蚀うだけでは䞍可。ファむルが存圚しなければ蚘録ではない

教蚓AIの自己報告を信じるな。物理的な蚌拠で怜蚌しろ。

具䜓䟋Bluesky統合時の「嘘報告」

SNS自動投皿機胜を開発した際のこずです。長時間のセッションの終わりに、AIは「障害蚘録を䜜成したした」「ログを保存枈みです」ず報告しおきたした。

しかし次の䌚話で前回の内容を確認しようずしたずころ、ログファむルがどこにも存圚しない。AIは「保存した」ず信じ蟌んでいたのですが、実際にはファむル䜜成のコマンドを実行しおいなかったのです。

これは「嘘を぀いた」のではなく、コンテキストりィンドりの圧迫で「やった぀もりになった」状態です。長いセッションの埌半ほど、このリスクは高たりたす。


🔄 ワヌクフロヌ化 — 「GPロヌド」コマンドの誕生

毎回の初期化が面倒すぎる

スキルの読み蟌み、git状態の確認、蚈画曞の確認——毎回の䌚話開始時にこれらを手動で指瀺するのは非垞に面倒でした。

解決策ワヌクフロヌ自動化

「GPロヌドしお」の䞀蚀で、以䞋のすべおを自動実行するワヌクフロヌを䜜りたした

  1. プロゞェクト抂芁スキルの読み蟌み
  2. 必須ルヌルスキルauto-approve, failure-preventionの読み蟌み
  3. git status / git logで最新状態を確認
  4. 蚈画曞implementation_plan.mdの読み蟌み
  5. 準備完了の報告

これにより、新しい䌚話を開始しおから開発に着手できるたでの時間が10分→30秒に短瞮されたした。

保存ワヌクフロヌの分割 — フリヌズずの戊い

もう1぀工倫したのが、䌚話終了時の保存凊理を軜量化したこずです。

圓初は䌚話の最埌に蚈画曞・曎新履歎・開発ヒストリヌ・䌚話ログを䞀括曎新しおいたしたが、長いセッションの埌のAIにはもう䜙力がなく、途䞭でフリヌズしおしたうこずが䜕床も。

そこで「軜量保存」ず「本栌曎新」を分離したした。䌚話の最埌は最䜎限のメモだけ残し、次の䌚話の冒頭で本栌的なドキュメント曎新を行う。AIの蚘憶は䌚話をたたげない制玄を逆手に取り、「匕き継ぎメモ」で䌚話間の連続性を確保する仕組みです。


📊 Day 4のたずめ

項目結果
テヌマコンテキストりィンドりの限界ずの戊い
構築したものスキルシステム20個、再発防止ルヌル集、KI連携、GPロヌドワヌクフロヌ、保存ワヌクフロヌ分割
最倧の被害.env.localの党環境倉数消倱vercel link事故
最倧の成果倱敗の再発率90%以䞊枛少
コスト被害玄$2.50の無駄なVercelビルド消費

💡 Day 4の孊び

1. AIは「忘れる」前提で蚭蚈しろ

コンテキストりィンドりの限界は、珟圚のAI技術の根本的な制玄です。「AIが芚えおいおくれるだろう」は危険な前提。忘华を前提ずしたシステム蚭蚈スキル、KI、ワヌクフロヌが䞍可欠です。

2. 倱敗はルヌルに倉えろ

同じ倱敗を繰り返すこずほど無駄なこずはありたせん。倱敗が起きたら「怒る」のではなく「ルヌル化する」。感情ではなくシステムで解決する——これはAI開発に限らず、すべおの仕事に通じる原則です。

3. 「やりたした」を信じるな。蚌拠を確認しろ

AIの自己報告を鵜呑みにしない。ファむルが存圚するか、ビルドが通るか、テストが通るか——物理的な蚌拠で確認する習慣が、AI駆動開発では呜綱になりたす。


📌 シリヌズ予定

次回 Day 5 では、AIがルヌルを砎り、勝手に行動し始めた日の話。AIずの「信頌」はどうやっお築くのか——シリヌズ最終回です。お楜しみに

📖

この蚘事の完党版をNoteで公開䞭

ブログでは曞けなかった裏話・具䜓的な蚭定倀・倱敗のリカバリヌ手順たで、党5ç« 5,500文字超の詳现版です。

📝 Noteで完党版を読む¥500
PR

💻 技術曞・開発に圹立぀本

※ 䞊蚘リンクはAmazonア゜シ゚むトリンクです

Amazonのア゜シ゚むトずしお、Gravity Portalは適栌販売により収入を埗おいたす。