industrialization-roadmap.md
1.79 KB
工业化路线图
更新:2026-06-02
一页结论
当前项目已完成:
- 原型可运行
- retrieval-first 初步改造
- 服务骨架
- 外部数据 adapter 雏形
下一阶段必须聚焦三件事:
- 真实数据接入
- hard-case 精度
- 商业化合规与服务稳定性
1. 路线图图示
flowchart LR
P0[P0 原型跑通] --> P1[P1 真实数据验证]
P1 --> P2[P2 工程化与服务化]
P2 --> P3[P3 大规模索引]
P3 --> P4[P4 商用上线]
2. 阶段表
| 阶段 | 目标 | 当前状态 | 核心产物 |
|---|---|---|---|
| P0 | 端到端原型 | 已完成 | demo/train/index/eval |
| P1 | 白名单真实数据接入 | 进行中 | adapters/manifests/benchmark |
| P2 | API / benchmark / ops | 进行中 | FastAPI + spec |
| P3 | ANN / 增量索引 | 未完成 | Faiss/HNSW |
| P4 | 可商用平台 | 未完成 | license gate / SLA / release flow |
3. 近期优先级
Priority A
- FMA / Jamendo 小规模白名单子集接入
- humming_like / confused 精度提升
- service 配置化与真实部署 smoke
Priority B
- ANN 向量索引
- 拒识/误接收指标
- 模型版本化
Priority C
- foundation model baseline
- 在线评估与监控
- 商业部署流程
4. 分层职责
| 层 | 重点 |
|---|---|
| 数据层 | 只接入可审计白名单数据 |
| 模型层 | 以 retrieval 指标为主,不迷信分类头 |
| 检索层 | 强化 hard-case 与 rejection |
| 服务层 | 稳定 API、可配置、可观测 |
| 合规层 | 任何上线模型必须可追溯数据来源 |
5. 细节附录
关联文档:
docs/dataset-sources-and-licensing.mddocs/industrial-benchmark-spec.mddocs/service-api.md
Sources
- See
docs/references-and-sources.mdfor the current source map.