【行业洞察】WSJ 深度观察:AI “数据荒”引发合成数据公司估值暴增
内容要点:资源枯竭: 华尔街日报指出,到 2026 年,人类文明高质量公网文本已基本被大模型抓取殆尽,数据已成为比算力更紧缺的“石油”。合成数据崛起: 以“Gretel”和“Synthesis AI”为代表的高质量合成数据供应商,在 2026 年 Q1 的估值平均翻了三倍。
隐私红利: 由于合成数据不涉及真实个人信息,它正成为金融和医疗行业绕过合规限制、进行模型训练的“唯一合法合规途径”。
久湛洞察:
当“真数据”不够用时,“假数据”的真实度就成了壁垒。久湛认为,合成数据不仅是补充,更是对模型能力的“提纯”。企业在构建自有模型时,应考虑引入合成数据生成链路,这不仅是为了解决量的问题,更是为了在合规红线内训练更精准的行业专家模型。
关键词: 合成数据、数据原油、隐私合规、数据训练
信息来源: 《华尔街日报 (The Wall Street Journal)》2026 年 4 月 24日商业版 https://www.wsj.com/tech/ai/synthetic-data-is-the-new-oil-20260424...