用AI检测AI合规?谷歌公开AI合规检查工具

发布时间 - 2024-10-15 15:08:20    点击率:305次

10月10日消息,谷歌公开发布其内部工具“Checks”,该工具可以帮助评估应用程序、代码和AI是否符合各种标准和法规,以应对监管要求。

该工具最初在谷歌内部使用,现在可以公开使用,并专注于合规性的三个关键领域——应用程序合规(App Compliance)、代码合规(Code Compliance)和AI安全(AI Safety)。

0主要功能

1.应用程序合规

应用程序合规性评估通过检查应用程序或网站,确保其遵守用户数据收集法规,这些法规例如欧盟GDPR(《通用数据保护条例》)、美国加州CCPA(《加州消费者隐私法案》)或巴西LGPD(《《通用数据保护法》》)。此外,它还可用于已经上线应用商店的应用程序。

整个“Checks”的系统基于AI大型语言模型运行,该模型经过微调,可理解不同的政策法规。因此,该系统通过检查这些政策并将其与应用程序或网站进行比对,并利用AI爬虫来检查应用程序的功能。

谷歌表示,虽然用户可以利用“Checks”获得法律见解,但其设计目并不是提供法律建议或支持,而是主要用于标准政策检查。

2.代码合规性

目前,代码合规性还处于封闭测试阶段。不过,它可以帮助编码人员在应用程序发布前检查监管问题。用户可以轻松地将其集成到开发环境中,并在构建系统时使用它来获知潜在的风险。此外,它还能检测如过时的SDK之类的关键问题。

3.AI安全

目前,AI行业的安全标准、道德和合规性仍在审查和评估中。例如,OpenAI正在为人工智能合规性和标准创建一个安全委员会。不过,要制定全行业的标准尚需时日。

由于人工智能系统是一个复杂的模型,因此通过谷歌的“Checks”工具对其进行全面评估具有一定的挑战性。谷歌正在进行密集的封闭测试,试图制定某些标准和政策以尽可能提供最好的合规性检查。

人工智能安全检查不仅可以进行合规性检查,它还可以协助检查来自大语言模型的表达、幻觉和有争议的声明或制作,比如那些带有偏见或种族色彩的输出结果。

02 “Checks”与AI安全

谷歌称,“Checks”建立了一个整体性运行框架可以覆盖开发人员使用AI产品时需要解决三个主要阶段的问题,分别是:

第一阶段对齐阶段”:确定哪些政策法规与AI产品相关。

第二阶段“评估阶段”:确保初始模型版本可以完成开发所设定的预期任务。

“Checks”对AI模型进行“红队测试 ”和“提示词测试”,检测AI产品的是否存在安全隐患,并根据所选定的相关国家或地区法律法规检测AI产品在暴力、仇恨言论和敏感数据(如个人身份信息)方面的输出结果符合预期。

第三阶段“监控阶段”:在AI产品推出后,开发人员需要检查它在实际环境中可以正常、正确运行,确保不会被盗用或被黑客入侵。

例如,曾经有这样一个案例:一家公司推出了一个通用人工智能代理,为特定场景提供服务,但人们发现他们可以“黑”它,从而免费盗用这个模型,但这个模型的开发成本实际上非常高。

“Checks”可以监控输入提示和输出提示并检测问题,比如当有人试图对模型进行骇入时,输入提示就会被阻止到达模型;任何个人隐私数据的输出行为也都会被检测。

03 初始版本

“Checks by Google”早在2023年5月就在谷歌官方的一篇博客中被提及。

谷歌称在这篇博客中称,“Checks”最初于2022年作为Google内部孵化器的一部分推出,用于快速发现和解决Google Play和iOS商店中的应用程序的隐私合规性问题,该初始版本具有3个关键产品领域:

  • 1.合规性监控(Compliance Monitoring)通过使用自动化测试来扫描应用程序及其隐私披露情况,帮助公司识别潜在的法规和移动应用商店合规性问题,并提供可操作的建议来帮助解决任何已发现的问题。
  • 2.数据监控(Data Monitoring)提供应用程序数据收集和共享行为的端到端可见性,使开发运营团队能够更高效地、集成地管理其数据治理
  • 3.商店披露支持(Store Disclosure Support)可帮助公司确保其开发的程序符合Google Play数据安全要求。

来源Checks官网

编译|尚健

审核|唐巧盈

声明:本文来自上海市人工智能与社会发展研究会,稿件和图片版权均归原作者所有。所涉观点不代表本站立场,转载目的在于传递更多信息。如有侵权,请联系本站,我们将及时按原作者或权利人的意愿予以更正。
最新文章 第十二版《网络安全企业100强》发布 开源推荐算法为什么并不“可靠”? 虹膜写真风靡年轻人:小心泄露敏感个人信息 国内最大IT社区CSDN被挂马,CDN可能是罪魁祸首? Apache Struts文件上传漏洞 (CVE-2024-53677) 安全风险通告 工信部:关于防范新型勒索病毒Ymir的风险提示 美国报告揭示俄罗斯战略信息攻击:从攻击方法到战略效果 最危险的网络攻击:云勒索软件 个人信息保护合规审计:个人信息删除落地与审计 Forrester:Akamai创新微分段技术引领企业安全升级,实现 152%高ROI Fortinet发布《2025年网络威胁趋势预测报告》 揭秘四大威胁挑战 榜上有名!360入选2024年天津市网络安全应用场景优秀案例 只需一个暗号,即可戳穿语音克隆骗局 写在IDCC2024数字基础设施国际合作大会之前 IETF的运行方式及RFC的形成 《AI时代深度伪造和合成媒体的安全威胁与对策(2024版)》报告发布 UnitedHealth勒索软件攻击事件应吸取的六个备份教训 网络安全产品奥斯卡 2024年度赛可达优秀产品奖(SKD AWARDS) “危“”机“并存,五位网络安全大咖预警2025年安全态势 赋能智算未来,CDCE2024国际数据中心展12月5日上海璀璨开幕 俄罗斯黑客组织渗透和利用巴基斯坦黑客组织服务器案揭秘 国家安全部:警惕开源信息成为泄密源头 “清朗·网络平台算法典型问题治理”专项行动中的排名算法 游戏玩家请注意!Winos4.0木马已“潜伏” 2024 DAMS中国数据智能管理峰会即将在上海举办 WAF气数已尽? 网安巨头Palo Alto全球数千防火墙被攻陷:因开发低级错误造成零日漏洞 数字城市AI安全运营中心签约揭牌,360赋能长三角城市安全新篇章 勒索软件忙招人,2024年网络威胁五大新趋势 360发布全球首份《大模型安全漏洞报告》,曝光近40个大模型相关安全漏洞 值得关注的十二大网络安全风险评估工具及选型指南 俄黑客通过“近邻攻击”远程入侵美国企业WiFi网络 四校签约、六家授牌!360与河南高校再摘网络安全人才培育新果实 Apple多个在野高危漏洞在野利用通告 苹果官方警告:零日漏洞攻击瞄准Mac电脑用户 《密码法》颁布五周年:法治成效、实施难点与未来走向 27天!揭秘身份管理中凭证修复为何如此艰难? 微软“清理门户”,禁止杀毒软件访问Windows内核 云原生环境下的七大网络安全威胁及应对建议 ​透析恶意软件“四大家族”
在线客服
联系方式

热线电话

18556842815

上班时间

周一到周五

公司电话

027-85365976

二维码
线