半年で5本、社内向けエージェントを作って分かった「やる前に知りたかった」失敗。ツール設計、コンテキスト分割、評価ループ、コスト管理まで全部。
3ヶ月、両方を本番ワークロードで回した結果。長文要約・コード生成・関数呼び出し・コスト・レイテンシで6軸スコア化。