references-and-sources.md 2.54 KB

References and Sources Map

更新:2026-06-02

一页结论

当前项目的引用分成四类:

  1. 开源数据集来源
  2. 研究/SOTA 来源
  3. 服务与工程规范来源
  4. 项目内部文档来源

1. 引用分层图

flowchart TD
    A[References] --> B[Datasets]
    A --> C[Research]
    A --> D[Engineering]
    A --> E[Internal Docs]

    B --> B1[FMA]
    B --> B2[MTG-Jamendo]
    B --> B3[CCMusic]
    B --> B4[ModelScope]

    C --> C1[Neural AFP]
    C --> C2[Music Foundation Models]
    C --> C3[Band-split]
    C --> C4[Data Balancing]

2. 外部来源表

类别 名称 URL 当前用途
Dataset FMA https://github.com/mdeff/fma 真实 retrieval baseline 候选
Dataset MTG-Jamendo https://github.com/MTG/mtg-jamendo-dataset 真实音乐检索候选
Dataset CCMusic https://ccmusic-database.github.io/en/database/ccm.html 中文 MIR 数据源候选
Dataset ModelScope music search https://modelscope.cn/search?page=1&search=music&type=dataset 数据发现入口
Research MERT https://arxiv.org/abs/2306.00107 foundation-model 方向参考
Research MuQ https://arxiv.org/abs/2501.01108 music representation 方向参考
Research Band-split RNN https://arxiv.org/abs/2209.15174 频带建模参考
Research BAGAN https://arxiv.org/abs/1803.09655 数据平衡增强参考

3. 内部文档依赖图

flowchart LR
    A[references-and-sources.md] --> B[dataset-sources-and-licensing.md]
    A --> C[sota-research-2026.md]
    A --> D[industrialization-roadmap.md]

4. 文字说明

4.1 为什么单独做 References Map

因为后续文档会越来越多,如果不把“哪些结论来自哪里”系统整理出来,很快会失去可追溯性。

4.2 目前引用质量说明

  • dataset 来源:优先官方 repo / 官方主页
  • research 来源:优先 arXiv / 论文主页
  • service/工程来源:当前主要以内生工程规范为主

4.3 未来要加强的地方

  • 在每篇核心文档底部补“Sources”小节
  • benchmark 报告与 model card 显式引用训练数据与论文版本

5. 细节附录

建议补充:

  • 每份文档增加 Sources
  • 每次模型 release 输出引用快照

Sources