合成数据有利于避免过度处理个人数据

发布时间 - 2023-11-09 14:32:12    点击率:989次

2023年11月6日,西班牙数据保护机构AEPD探讨了合成数据如何在人工智能模型训练中取代个人数据的问题,认为当所需要的大量个人数据不可用或不容易收集时,合成数据可以作为替代品。

数据需求量日益增大。当前,人工智能模型需要大量数据进行开发、测试和验证,执行此类过程所需的数据量是不可预估,且在某些情况下,需要通过专门测试数据来验证和描述异常情况、极端情况、低概率或未记录情况的系统,甚至通过操纵数据测试攻击类型。

合成数据是非真实数据。合成数据是人工生成的数据,与从现实中收集的真实数据形成鲜明对比,但同样可以保留特定场景下真实数据的特征和属性。合成数据可用于机器学习服务的开发、测试和验证,在这些服务中,无法获得所需数量的真实数据,甚至可能不存在此类真实数据。合成数据可以允许公司以一种在数据空间框架内共享数据而不泄露商业机密的方式一样进行使用,可以用于创建具有与个人数据集相同效用的非个人数据集,在这种情况下可以被当作一种隐私技术。

合成数据越来越受到关注。合成数据可以通过允许方问来自公共和私人实体的信息(即数据空间)支撑数据经济。但是,如果对此类数据的处理目的、实际限制、相关风险没有得到足够保证时,相关实体将不愿意披露可能泄露商业秘密、自身情况、知识产权的数据。而生成合成数据将成为可以解决此类问题的主要技术之一。合成数据有助于开发、测试和验证自然语言理解系统、视觉算法系统、自动驾驶汽车系统和面向金融机构的欺诈检测模型,因此,近年来越来越受到关注。

合成数据不是随机数据。从真实数据合成数据集,或创建新数据集时,应当再现真实数据的结构和特征,从而在特定场景中得出相关结论。由于合成数据属于人工生成的数据,至少可以对一个特定目的具有意义,在此背景下,合成数据的最基本形式可能类似真实数据格式的虚拟文件。

合成数据可以取代真实数据。每个特定场景对数据具有不同的质量水平要求,对于流程和最终使用目的也具有差别细微的不同要求,在某些特定场景下,合成数据可以取代真实数据。例如,为了验证人脸识别系统,可以生成一个合成人脸数据集,以检查这一系统的局限性。但是,需要注意的是,这样的数据集可能缺乏检查其他类型系统或开发新的人脸系统所需的数据质量。

合成数据可以作为PET使用。由于合成数据可以最大限度的减少对个人数据的处理,同时实现相关目标,且结论与使用原始个人数据所获得的结论一样,因此,与其他许多技术一样,合成数据也可以作为一种隐私增强技术(PET)使用。在GDPR框架下,即使是从真实的个人数据中生成,合成数据也不应包含可识别个人的信息。合成数据出于特定目的保留了真实个人数据的统计属性,因此可以防止个人数据被处理。但根据GDPR,从真实的个人数据创建合成数据本身就是一种处理活动,所以应当考虑GDPR的相关规定。

来源:CAICT互联网法律研究中心

最新文章 第十二版《网络安全企业100强》发布 开源推荐算法为什么并不“可靠”? 虹膜写真风靡年轻人:小心泄露敏感个人信息 国内最大IT社区CSDN被挂马,CDN可能是罪魁祸首? Apache Struts文件上传漏洞 (CVE-2024-53677) 安全风险通告 工信部:关于防范新型勒索病毒Ymir的风险提示 美国报告揭示俄罗斯战略信息攻击:从攻击方法到战略效果 最危险的网络攻击:云勒索软件 个人信息保护合规审计:个人信息删除落地与审计 Forrester:Akamai创新微分段技术引领企业安全升级,实现 152%高ROI Fortinet发布《2025年网络威胁趋势预测报告》 揭秘四大威胁挑战 榜上有名!360入选2024年天津市网络安全应用场景优秀案例 只需一个暗号,即可戳穿语音克隆骗局 写在IDCC2024数字基础设施国际合作大会之前 IETF的运行方式及RFC的形成 《AI时代深度伪造和合成媒体的安全威胁与对策(2024版)》报告发布 UnitedHealth勒索软件攻击事件应吸取的六个备份教训 网络安全产品奥斯卡 2024年度赛可达优秀产品奖(SKD AWARDS) “危“”机“并存,五位网络安全大咖预警2025年安全态势 赋能智算未来,CDCE2024国际数据中心展12月5日上海璀璨开幕 俄罗斯黑客组织渗透和利用巴基斯坦黑客组织服务器案揭秘 国家安全部:警惕开源信息成为泄密源头 “清朗·网络平台算法典型问题治理”专项行动中的排名算法 游戏玩家请注意!Winos4.0木马已“潜伏” 2024 DAMS中国数据智能管理峰会即将在上海举办 WAF气数已尽? 网安巨头Palo Alto全球数千防火墙被攻陷:因开发低级错误造成零日漏洞 数字城市AI安全运营中心签约揭牌,360赋能长三角城市安全新篇章 勒索软件忙招人,2024年网络威胁五大新趋势 360发布全球首份《大模型安全漏洞报告》,曝光近40个大模型相关安全漏洞 值得关注的十二大网络安全风险评估工具及选型指南 俄黑客通过“近邻攻击”远程入侵美国企业WiFi网络 四校签约、六家授牌!360与河南高校再摘网络安全人才培育新果实 Apple多个在野高危漏洞在野利用通告 苹果官方警告:零日漏洞攻击瞄准Mac电脑用户 《密码法》颁布五周年:法治成效、实施难点与未来走向 27天!揭秘身份管理中凭证修复为何如此艰难? 微软“清理门户”,禁止杀毒软件访问Windows内核 云原生环境下的七大网络安全威胁及应对建议 ​透析恶意软件“四大家族”
在线客服
联系方式

热线电话

18556842815

上班时间

周一到周五

公司电话

027-85365976

二维码
线