差异隐私如何保护您的数据? Marco Verch / Flickr, CC BY 

技术公司可以使用差别隐私收集和共享有关用户习惯的汇总数据,同时保持个人隐私。

Facebook,谷歌,苹果和亚马逊等大型科技公司越来越多地渗透到我们的个人和社交互动中,每天都收集大量数据,这并不是什么秘密。 与此同时,网络空间中的隐私侵犯通常会制作头版新闻。

那么如何在一个数据被收集和分享的世界中以更快的速度和独创性来保护隐私?

差异隐私是一种网络安全的新模式,支持者声称可以保护个人数据的传播方式远远优于传统方法。

它的基础数学是几年前开发的10,并且该方法已被Apple和Apple采用 谷歌 最近几年。


内在自我订阅图形


什么是差别隐私?

差异隐私使得科技公司可以收集和分享有关用户习惯的汇总信息,同时保持个人用户的隐私。

例如,假设您想展示人们在公园散步的最受欢迎的路线。 您可以追踪经常穿过公园的100人的路线,以及他们是走在路上还是穿过草地。

但不是分享每条路线的具体人员,而是分享随着时间的推移收集的汇总数据。 查看结果的人可能会知道,60人中的100更喜欢在草地上进行快捷方式,而不是哪些60人。

我们为什么需要它?

世界上许多政府对科技公司如何收集和分享用户数据都有严格的政策。 不遵守规定的公司可能面临巨额罚款。 一个 比利时法院最近下令Facebook 停止收集用户在外部网站上浏览习惯的数据,或面对每天€250,000的罚款。

对于许多公司,特别是在不同司法管辖区运营的跨国公司而言,这使得他们在收集和使用客户数据时处于微妙的位置。

一方面,这些公司需要用户的数据,以便他们能够提供有益于用户的高质量服务,例如个性化推荐。 另一方面,如果他们收集太多的用户数据,或者他们试图将数据从一个管辖区移到另一个管辖区,他们可能会面临费用。

传统的隐私保护工具(如密码学)无法解决这个难题,因为它阻止了科技公司访问数据。 匿名会降低数据的价值 - 如果算法不知道您的习惯是什么,算法无法为您提供个性化推荐。

我们如何运作?

让我们继续通过公园步行路线的例子。 如果您知道研究中包含的身份,但您不知道谁走了哪条路线,那么您可能会认为隐私受到保护。 但情况可能并非如此。

说看看你的数据的人想要确定鲍勃是否喜欢穿过草地或路径。 他们已经获得了关于研究中其他99人的背景信息,这些信息告诉他们40人更喜欢走在路上,而59更喜欢穿过草地。 因此,他们可以推断出,数据库中的100th人是谁,他是喜欢穿越草地的60th人。

这种类型的攻击称为差异攻击,由于无法控制某人可以获得多少背景知识,因此很难防御。 差分隐私旨在抵御这种类型的攻击。

有人推断你的步行路线可能听起来不太严重,但如果你用艾滋病检测结果代替步行路线,那么你可以看到有可能严重侵犯隐私。

差异隐私模型保证即使某人在数据集中有关于99人员的100的完整信息,仍然无法推断出有关最终人员的信息。

实现这一目标的主要机制是将随机噪声添加到聚合数据。 在路径示例中,您可以说喜欢穿越草地的人数是59或61,而不是60的确切数量。 不准确的数字可以保护Bob的隐私,但对模式的影响很小:在60周围,人们更喜欢采取捷径。

噪音经过精心设计。 当苹果公司在iOS 10中使用不同的隐私时,它会给个人用户输入增加噪音。 这意味着它可以跟踪,例如,最常用的表情符号,但任何个人用户的表情符号使用都被屏蔽。

辛西娅Dwork, 差别隐私的发明者,已经提出了很好的数学证明,说明有多少噪声足以实现差分隐私的要求。

它的实际应用是什么?

差异隐私可应用于从推荐系统到基于位置的服务和社交网络等各种应用。 苹果 使用不同的隐私 从iPhone,iPad和Mac等设备收集匿名使用情况见解。 该方法是用户友好的,并且 在法律上明确.

差异隐私还可以让像亚马逊这样的公司访问您的个性化购物偏好,同时隐藏有关您的历史购买清单的敏感信息。 Facebook可以用它来收集针对性广告的行为数据,而不会违反国家的隐私政策。

它怎么能在未来使用?

不同的国家有不同的隐私政策,敏感文件目前必须在从一个国家迁移到另一个国家之前进行人工检查。 这是耗时且昂贵的。

最近,一队来自 迪肯大学 开发差分隐私技术,实现各国云共享社区内的隐私过程自动化。

谈话他们建议使用数学公式来模拟每个国家的隐私法律,这些法律可以转化为“中间件”(软件)以确保数据的一致性。 以这种方式采用差别隐私可以保护用户的隐私并解决技术公司的数据共享问题。

关于作者

朱天庆,科学,工程与建筑环境学院网络安全讲师, 迪肯大学

这篇文章最初发表于 谈话。 阅读 原创文章.

相关书籍

at InnerSelf 市场和亚马逊