打造一个高度还原自我的数字分身需要收集的信息量相当庞大,且涉及多个维度的个人数据。具体范围取决于数字分身的应用场景(如虚拟助手、社交互动、工作场景替代等),但核心信息通常包括以下类别:
若追求高度还原(90%以上相似度),至少需收集:
构建高度还原的数字分身至少需要数十类个人信息和数万条行为记录,但用户需在真实性需求与隐私风险间谨慎权衡。建议优先通过场景限定(如仅限工作场景)和数据最小化原则降低风险,技术上可采用联邦学习(本地训练模型)进一步保障安全。