(B) CHORUS: Foundation Models for Unified Data Discovery and Exploration
[!QUESTION]
- 传统数据发现 (Data Discovery) 和探索 (Data Exploration) 存在哪些主要挑战?
- 分析师需花费大量时间 (约 40%) 在数据加载和清洗上.
- 企业内 60-70% 的数据未被利用, 成为 “暗数据”.
- 现有工具依赖任务专用模型, 需大量标注数据 (如 10 万至百万级样本).
- 异构数据集成困难, 自动化程度不足, 导致数据发现效率低下.
3/7/25About 3 min