industrialization-roadmap.md 1.86 KB

工业化路线图

更新:2026-06-02

一页结论

当前项目已完成:

  • 原型可运行
  • retrieval-first 初步改造
  • 服务骨架
  • 外部数据 adapter 雏形

下一阶段必须聚焦三件事:

  1. 真实数据接入
  2. hard-case 精度
  3. 商业化合规与服务稳定性

1. 路线图图示

flowchart LR
    P0[P0 原型跑通] --> P1[P1 真实数据验证]
    P1 --> P2[P2 工程化与服务化]
    P2 --> P3[P3 大规模索引]
    P3 --> P4[P4 商用上线]

2. 阶段表

阶段 目标 当前状态 核心产物
P0 端到端原型 已完成 demo/train/index/eval
P1 白名单真实数据接入 进行中 adapters/manifests/benchmark
P2 API / benchmark / ops 进行中 FastAPI + spec
P3 ANN / 增量索引 未完成 Faiss/HNSW
P4 可商用平台 未完成 license gate / SLA / release flow

3. 近期优先级

Priority A

  • FMA / Jamendo 小规模白名单子集接入
  • humming_like / confused 精度提升
  • service 配置化与真实部署 smoke

Priority B

  • ANN 向量索引
  • 拒识/误接收指标
  • 模型版本化

Priority C

  • foundation model baseline
  • 在线评估与监控
  • 商业部署流程

4. 分层职责

重点
数据层 只接入可审计白名单数据
模型层 以 retrieval 指标为主,不迷信分类头
检索层 强化 hard-case 与 rejection
服务层 稳定 API、可配置、可观测
合规层 任何上线模型必须可追溯数据来源

5. 细节附录

关联文档:

Sources