product
站盤(たんばん)
AI エージェント運用の計器盤。AI に開発を委ねる会社が、その運転を見て、次の一手を決めるための道具です。
ひとつひとつの委譲が想定どおりに動いたか。所要時間、失敗、往復回数、コンテキストの肥大をアクション単位で検査します。
実額のコストと予算、停止スイッチの状態まで、運転席に必要な計器を揃えています。
数字を並べて終わりにせず、モデル選定・委譲先・計測の調整候補を「次の一手」として提示します。計測の欠けも隠さず所見にします。
既存の記録を読むだけの薄い収集器で動くため、いまの開発フローに手を入れずに導入できます。
AI エージェントに実装を任せはじめて、「何が起きているか見えない」と感じている開発組織。
任せる範囲を広げたいけれど、コストや暴走への不安が先に立つ経営者・技術責任者。
以下は自社の実データから切り出した典型的な一週間です。金額・単価・参照先の実名は載せていません。
站盤 tanban
AI エージェント運用の計器盤 | 対象期間: 2026-06-26 〜 07-02
- AI への委譲
- 165件
- PR マージ
- 80本
- 課題の出荷
- 97件
- 人の裁定
- 7件
次の一手
-
Fable 比率が 29%(閾値 5%)です。
Fable への昇格条件を確認し、不要な経路は Sonnet/Opus へ降格する。 -
gemini の失敗率が 35%(7/20件)です。
gemini のプロンプト/ハーネス見直しと失敗ケースの再現確認を行う。 -
採用判定の記録率が 0%です。
採用/不採用の記録を徹底し、判断できない実行は null として残す。 -
課題への紐付け記録率が 46%です。
委譲ログと課題チケットの紐付けを徹底し、成果物まで追跡できる状態を保つ。 -
裁定待ちが 16件あります。
人の裁定を待つ課題を確認し、先に裁定を片付ける。 -
100k 超コンテキストの比率が 34%です。
コンテキストを分割し、入力資料の記録と圧縮を見直す。
アクション検査
| day | tool | model | latency秒 | turns | context |
|---|---|---|---|---|---|
| 2026-07-02 | codex | - | 222秒 | - | - |
| 2026-07-02 | gemini | gemini-2.5-flash-image | 5秒 | - | - |
| 2026-07-02 | gemini | gemini-2.5-flash-image | 6秒 | - | - |
| 2026-07-02 | grok | grok-build | 93秒 | 1 | 154,545 |
| 2026-07-02 | gemini | gemini | 11秒 | - | - |
| 2026-07-02 | gemini | gemini | 36秒 | - | - |
| 2026-07-02 | gemini | gemini | 28秒 | - | - |
| 2026-07-02 | gemini | gemini | 12秒 | - | - |
| 2026-07-02 | gemini | gemini | 12秒 | - | - |
| 2026-07-02 | gemini | gemini | 9秒 | - | - |
| 2026-07-02 | gemini | gemini | 10秒 | - | - |
| 2026-07-02 | gemini | gemini | 9秒 | - | - |
委譲先の質
| tool | 件数 | 失敗率 | p50 | p95 |
|---|---|---|---|---|
| grok | 77 | 5% | 28秒 | 466秒 |
| codex | 68 | 3% | 323秒 | 641秒 |
| gemini | 20 | 35% | 12秒 | 28秒 |
トークン効率
- context p50
- 48,823
- context p95
- 166,613
- 100k超比率
- 34%
記録率 採用 0% / 課題 46% / tokens 28%
中継網
cascade
Fable 比率 29%(閾値 5%)
裁定
- 済み
- 7件
- 裁定待ち
- 16件
出荷の例
- 2026-06-29 Hero を初見3秒の署名フレームへ攻める(縦書き+朱の一点+巨大明朝)
- 2026-07-01 AI Intake を中継網の relay ターミナルへ作り込む(思考中に朱の信号が走る)
- 2026-06-30 intake 未接続時に常設で機能する代替連絡導線を実装する
- 2026-06-27 workflow改訂: 既定を main直 → 軽量PRフロー(branch→PR→Cloudflare preview→squash merge)
ジャムチ自身が、この站盤で自社の運転を見はじめたところです。このページの計器はその公開断面です。
提供は「少人数 × AI 自律駆動オペ」導入支援の一部として。運用の型と一緒に、御社のデータで動く站盤を設置します。
プロンプトの中身まで踏み込む示唆は、トレース連携(Langfuse)とあわせて次の版で拡張する予定です。

