koba · 稼働ログ

ループ・ゴール型 秘書システム適用パターン設計

📚 ナレッジ · 2026-06-28_ループゴール型_秘書システム適用パターン設計
← 戻る

ループ・ゴール型 秘書システム適用パターン設計

結論サマリ


1. ループ・ゴール型の最小定義

AIが「判断に迷ったもの」を捨てず保管し、人間の最終判断を蓄積として再利用することで、次回の同種判断を自動化していく仕組み。

3要素: 1. 曖昧度の自己申告(AIが「これは自信ない」と明示する) 2. 保管 → 人判断 → 記録(needs_review に積み、後で人が解決を書き戻す) 3. 次回プロンプトへの注入(過去解決事例を few-shot として食わせる)

daily-triage から抽出した本質は「判断を捨てない」こと。曖昧なものを「とりあえず分類した」「とりあえず除外した」で流すと改善燃料がゼロになる。


2. 共通アーキテクチャ

2.1 データフロー

[入力] → [AI処理] → [自信スコア/曖昧度]
                          │
              ┌───────────┴───────────┐
        高(>0.8)                   低(<=0.8)
              │                       │
        [自動完結]              [needs_review.json に保管]
                                      │
                              [Telegram通知 / 朝の一覧]
                                      │
                              [人がresolve.sh実行]
                                      │
                              [resolved に記録]
                                      │
                          [次回プロンプトに past_decisions として注入]

2.2 needs_review.json 標準形式

{
  "_updated_at": "2026-06-28",
  "_system": "<system_name>",
  "items": [
    {
      "id": "短いhash",
      "created_at": "2026-06-28 09:00:00",
      "context": "判断対象の生データ(短く)",
      "ai_guess": "AIの暫定判断",
      "confidence": 0.62,
      "reason": "なぜ自信がないか(1行)",
      "status": "pending|resolved|deferred",
      "resolution": null,
      "resolved_at": null,
      "resolver": "human|ai_auto"
    }
  ]
}

2.3 resolve.sh 標準形式

共通CLIを ~/.claude/scripts/loop_resolve.sh に置く想定。

loop_resolve.sh <system> <item_id> <resolution>
# 例:
loop_resolve.sh fx_weekly abc12345 "duplicate_of: 手法007"
loop_resolve.sh orchestrator def67890 "missing_field: 締切"
loop_resolve.sh ai_digest gh112233 "category: tool/image-gen"

resolution のプレフィックス(duplicate_of: / category: / alias_for: 等)で書き戻し先(aliases / categories / blacklist 等)を自動分岐させる。

2.4 past_decisions プロンプト注入

各システムのプロンプト先頭に以下を挟む:

## 過去の人間判断(最新N件)
- "<context>" → "<resolution>"
- "<context>" → "<resolution>"
(同種を見たら同じ判断をしてください)

resolved の上位N件(システムごとに5〜20件)を自動抽出するヘルパー loop_past_decisions.sh <system> <N> を共通モジュール側で提供。


3. 各システムへの適用案

3.1 orchestrator

3.2 FX週次情報収集

3.3 NewsPicks-design

3.4 fx-ea-builder

3.5 AI情報digest

3.6 mail-writer

3.7 allbloom-sales-deck


4. 優先順位マトリクス

優先 システム コスト 効果 理由
即着手 orchestrator S 既存スクリプトに最小フック、毎日使うので学習燃料が即日溜まる
即着手 AI情報digest S 朝の選別時間が即削減、past_decisions の効きが早い
即着手 FX週次 M 週次で目視工数が大きいので投資対効果が最大
次フェーズ NewsPicks-design S 効果が累積型なので急ぎではないが入れやすい
次フェーズ mail-writer M 案件別ストレージ設計が必要、共通モジュール完成後に着手
長期 allbloom-sales-deck M 業種別蓄積が貯まるまで効きにくい
長期 fx-ea-builder M 固有性が高くfew-shot効果が読みにくい、要PoC

5. 共通モジュール化

~/.claude/scripts/loop/ 配下に集約する想定。

モジュール 役割 形態
loop_save.py needs_review.json への保管 Python関数 + CLI
loop_resolve.sh 解決書き戻し(プレフィックス分岐込み) bash
loop_past_decisions.sh 過去解決上位N件をプロンプト用テキストで返す bash
loop_metrics.py needs_review率 / 解決時間 / 再発率を集計 Python
loop_notify.sh 朝の一覧をTelegramに通知 bash
schema.json needs_review.json のJSON Schema 検証用

共通化することで、各システム側は 「保管時に loop_save、プロンプト先頭に loop_past_decisions の出力を差し込む」 の2行追加だけで済むようになる。


6. メトリクス

各システムについて週次で計測:

指標 定義 良い方向
needs_review率 needs_review送り件数 / 全処理件数 適度に高い(保守的なのは良いこと)
解決時間(平均) created_at → resolved_at の中央値 短い(人判断負荷の指標)
再発率 同種 context が再び needs_review に上がる率 低い(past_decisions が効いてる証拠)
自動化率 confidence>0.8 で自動完結した割合 高い(ループが回ってる証拠)
pending滞留 status=pending が7日以上残っている数 少ない(運用が破綻していない証拠)

集計は週次 launchd で loop_metrics.py → Obsidian の週次レビューに自動追記する想定。


7. 次アクション3つ

  1. 共通モジュール v0.1 雛形作成~/.claude/scripts/loop/loop_save.py / loop_resolve.sh / loop_past_decisions.sh の3本を実装。schema.json も同時定義。所要1日。
  2. orchestrator に最小組込:要件確認フェーズの曖昧検出箇所に loop_save を1行差し込む。past_decisions 注入も同時。1週間運用して needs_review率と解決時間を計測。所要0.5日 + 観測1週間。
  3. FX週次への組込設計レビュー:仕上げエージェントのプロンプト+出力JSONを書き換える設計レビューを秘書側でドラフト化し、しずやさん承認を取ってから来週の金曜走行に間に合わせる。所要0.5日 + 承認待ち。

(設計者: 秘書 / 2026-06-28 / 次回見直し: Phase1完了時)