在数据科学领域工作过的人都知道,开发一个人工智能模型通常可以概括为 3 个阶段:训练、验证和测试。在测试模型的准确性时,选择验证集来调整超参数(hyperparameters)时,通常有很多考虑。
为了进行准确的模型评估,企业倾向于使用一部分真实数据进行验证,但自然会有很多安全和隐私方面的考虑,特别是在处理个人身份信息(PII)方面。
如果你的模型是由一个外部公司开发的,你基本上有两个选择。要么该公司与你分享其模型,这将对其知识产权保护构成风险;要么你与他们分享你的真实数据,这对你来说是一种隐私风险,也可能导致模型对真实数据过度拟合。在做出这两种困难的选择时,也有很多法律障碍需要跳过。因此,虽然企业希望尽快采用人工智能,但在处理数据时,模型开发过程无论是内部还是外部,他们都面临着挑战。
为了解决这个问题, 微软正在研究一个名为 EzPC 的新框架 ,它代表着“轻松安全的多方计算”。 从本质上讲,EzPC 是基于安全的多方计算(MPC)的。MPC 使多方能够使用加密技术联合计算一个函数,而不向对方透露他们的数据。
虽然 MPC 已经存在多年,但事实证明它很难实现,因为在计算多个函数时,使其具有可扩展性和高效性的挑战。EzPC 通过使用 MPC 作为构建块来解决这些问题,并使开发者--不仅仅是密码学专家--能够在此基础上进行扩展。
微软表示
EzPC 的核心是两项创新。
● CrypTFlow 模块化编译器
将用于 ML 推理的 TensorFlow 或 Open Neural Network Exchange(ONNX)代码作为输入,并自动生成类似 C 的代码,然后可以将其编译为各种 MPC 协议。这个编译器既是“MPC感知”的,也是优化的,确保了 MPC 协议的高效和可扩展。
● 高性能的加密协议
第二个创新是一套高性能的加密协议,用于安全地计算复杂的ML函数。
微软吹嘘说,EzPC 在与斯坦福大学研究人员的测试中实现了“有史以来第一次对生产级人工智能模型的安全验证”,从而证明你不需要分享数据来进行验证。尽管微软的EzPC模型在“两个标准的云端虚拟机”上用了15分钟做带有验证元素的安全推理--这比普通推理要长 3000 倍,但该公司表示,这并不重要,因为计算并行可以解决这个问题。
根据目前的方法,验证集中的 500 多个图像在五天的时间内完成了推理,总成本不到 100 美元。微软声称,如果所有的数据都是并行运行的,它可以在 15 分钟内完成对整个集合的推理。你可以在这里发表的论文中探讨这些发现。
【来源:cnBeta.COM】
责任编辑:kj005
文章投诉热线:156 0057 2229 投诉邮箱:29132 36@qq.com如果你有原装的SurfacePro、SurfacePro2或SurfacePro3设备,那么我们有一个重要的安全信息给你。微软已...
对GalaxyS22用户来说现在有一个好消息,基于OneUI5 0的Android13测试版固件可能很快就会开放下载。这个...
Google正在为Maps服务添加一个标签,让人们识别他们的商户是LGBTQ+人士开设的,这与之前Yelp提供的功能...