本文へスキップ

product

站盤(たんばん)

AI エージェント運用の計器盤。AI に開発を委ねる会社が、その運転を見て、次の一手を決めるための道具です。

ひとつひとつの委譲が想定どおりに動いたか。所要時間、失敗、往復回数、コンテキストの肥大をアクション単位で検査します。

実額のコストと予算、停止スイッチの状態まで、運転席に必要な計器を揃えています。

数字を並べて終わりにせず、モデル選定・委譲先・計測の調整候補を「次の一手」として提示します。計測の欠けも隠さず所見にします。

既存の記録を読むだけの薄い収集器で動くため、いまの開発フローに手を入れずに導入できます。

AI エージェントに実装を任せはじめて、「何が起きているか見えない」と感じている開発組織。

任せる範囲を広げたいけれど、コストや暴走への不安が先に立つ経営者・技術責任者。

以下は自社の実データから切り出した典型的な一週間です。金額・単価・参照先の実名は載せていません。

站盤 tanban

AI エージェント運用の計器盤 | 対象期間: 2026-06-26 〜 07-02

AI への委譲
165
PR マージ
80
課題の出荷
97
人の裁定
7

次の一手

  • Fable 比率が 29%(閾値 5%)です。

    Fable への昇格条件を確認し、不要な経路は Sonnet/Opus へ降格する。
  • gemini の失敗率が 35%(7/20件)です。

    gemini のプロンプト/ハーネス見直しと失敗ケースの再現確認を行う。
  • 採用判定の記録率が 0%です。

    採用/不採用の記録を徹底し、判断できない実行は null として残す。
  • 課題への紐付け記録率が 46%です。

    委譲ログと課題チケットの紐付けを徹底し、成果物まで追跡できる状態を保つ。
  • 裁定待ちが 16件あります。

    人の裁定を待つ課題を確認し、先に裁定を片付ける。
  • 100k 超コンテキストの比率が 34%です。

    コンテキストを分割し、入力資料の記録と圧縮を見直す。

アクション検査

daytoolmodellatency秒turnscontext
2026-07-02 codex - 222秒 - -
2026-07-02 gemini gemini-2.5-flash-image 5秒 - -
2026-07-02 gemini gemini-2.5-flash-image 6秒 - -
2026-07-02 grok grok-build 93秒 1 154,545
2026-07-02 gemini gemini 11秒 - -
2026-07-02 gemini gemini 36秒 - -
2026-07-02 gemini gemini 28秒 - -
2026-07-02 gemini gemini 12秒 - -
2026-07-02 gemini gemini 12秒 - -
2026-07-02 gemini gemini 9秒 - -
2026-07-02 gemini gemini 10秒 - -
2026-07-02 gemini gemini 9秒 - -

委譲先の質

tool件数失敗率p50p95
grok 77 5% 28秒 466秒
codex 68 3% 323秒 641秒
gemini 20 35% 12秒 28秒

トークン効率

context p50
48,823
context p95
166,613
100k超比率
34%

記録率 採用 0% / 課題 46% / tokens 28%

中継網

裁定 7件 Claude grok 77件 codex 68件 gemini 20件

cascade

opus359
fable167
sonnet40
haiku1

Fable 比率 29%(閾値 5%)

裁定

済み
7件
裁定待ち
16件

出荷の例

  • 2026-06-29 Hero を初見3秒の署名フレームへ攻める(縦書き+朱の一点+巨大明朝)
  • 2026-07-01 AI Intake を中継網の relay ターミナルへ作り込む(思考中に朱の信号が走る)
  • 2026-06-30 intake 未接続時に常設で機能する代替連絡導線を実装する
  • 2026-06-27 workflow改訂: 既定を main直 → 軽量PRフロー(branch→PR→Cloudflare preview→squash merge)

ジャムチ自身が、この站盤で自社の運転を見はじめたところです。このページの計器はその公開断面です。

提供は「少人数 × AI 自律駆動オペ」導入支援の一部として。運用の型と一緒に、御社のデータで動く站盤を設置します。

プロンプトの中身まで踏み込む示唆は、トレース連携(Langfuse)とあわせて次の版で拡張する予定です。

導入の相談をする →