这是时代的光芒一盏灯的算法,电力大哥

通过算法排序使我们在盒子里。 我们怎么知道他们是正确的吗? 生成,CC BY通过算法排序使我们在盒子里。 我们怎么知道他们是正确的吗? 生成,CC BY

社会似乎在课程设置到一个地步,我们的生活都受到计算机算法的详细审查。 我们生成的数据看了又看和分析,无论是政府对国家安全或公司以盈利为目的,这是不太可能改变 - 电源和数据分析,一旦发现,上诉不会轻易放弃。

但说实话我不知道我是否很担心更多,我们的数据被收集或事实,我们什么都不知道了宣判后,我们的算法。

我们的生活和习惯,可以从我们留下的数据松绑的详细程度之前已经讨论过,并且正在获取新的播出为英国各地的草案进行辩论的一部分 调查权力法案。 我们知道至少一些关于其中的一些是由英国和欧洲法律的约束数据被收集什么以及多久它被存储为,。

该法案草案文本例如,我们知道,英国政府将“唯一”的需求(莫须有)获得通信的元数据,标题和邮件主题,而手机的通话记录。 但是,我们也知道如何单独暴露元数据可以是:看看的 麻省理工学院媒体实验室的沉浸项目 对于到底有多少细节的有力例证可以从它来确定。 这当然 不是在所有可比的逐项手机话费如权利。

所以,是好还是坏,我们的公众,有一些线索,正在录制的内容。 但是,我们绝对不知道的分析工具和技术被应用到这些数据 - 并在此意义不应该被低估。

仰卧起坐什么的数字?

我们可以推测。 国家安全机构可能使用我们的元数据来生成人物和地点,除其他事物之间的社交网络,连接我们联系在一起。 然后,这些关系网络将进行分析,以确定如果我们感兴趣的人,看你如何比较其他利害关系人确定,以及如何连接到的现有利益的人或那些与他们无关。

谁使用这些技术的研究人员了解其局限性,那是他们的动力可能含有对它们的输出产生了深远影响的错误或基本假设的算法。 在这种情况下,这可能意味着无论你贴上了恐怖分子与否,或者是否有资格获得贷款或抵押贷款。

它也并不完全清楚其中的模糊边界地区关系的存在定义。 难道只是参观为恐怖暗示共同的价值观相同的网站,或者每天都骑同样的巴士路线建议你与恐怖分子经常交谈? 这是很可能访问由已知的恐怖分子许多正当的理由经常访问的网站。 如果从同一个网站让你的消息,因为恐怖分子有你更可能是恐怖分子? 歧视和偏见 可以在数据收集点被引入,然后再次当决定如何分析这些数据制成。 算法可以区分了。

边界模糊

该算法引入不良偏差的可能性是非常真实的。 例如,由保安服务中使用那些被训练已知的恐怖分子和已知的非恐怖分子的数据集。 这是否意味着, 作为最知名的恐怖分子20岁,男性30,你就更有可能被归类为仅仅是男性和老年大致20-30恐怖分子,不管你其他的属性? 如果是这样,这对数据如何使用显著的影响?

问题发生在我和其他学术研究人员利用复杂网络分析,机器学习,模式匹配,或人工智能技术这样的事实,有我们利用这些技术公开同行评审,以确定的方法和结论的有效性的实力; 政府安全部门和私营部门组织没有。 我们没有自己的方法的质量以及如何部署它们的想法。 有没有解决办法?

那些来自安全,密码学的另一个领域,很早就学会,最好的办法,以提高质量,因此安全性,它的算法是向公众发布。 加密的实现和密码发表,研究人员鼓励他们尝试发现错误或瑕疵,这样做提高了安全性所有谁使用它们。 此外,封闭源(非公开)cryptogaphic算法的任何实现一般 持怀疑态度。 如果他们在我们身上发音改变生活的判断 - 我们是否被标记为恐怖分子或经济不配 - 同样的模式应该被应用到安全算法。

针对这样的举动的说法是,公开,透明的算法可能导致恐怖分子修改,以避免被发现他们的真实世界的行为。 这将意味着改变之类的东西它们之间的相互作用,协会,浏览习惯,并有可能变动。 但对此,如果算法正常工作,就意味着他们基本上不再像恐怖分子。 如果我们未来的安全,自由和安全将是依赖于这些算法,我们必须完全放心怎样 - 而且 - 他们的工作。

关于作者谈话

菲利普·加内特,讲师,约克大学。

本文最初发表于 谈话。 阅读 原创文章.

相关图书:

数据与歌利亚:隐藏的战斗收集您的数据和控制您的世界

作者: 布鲁斯
绑定: 精装
出版商: 诺顿公司
价格表: $27.95
优惠 - 购买新的来源: $10.56 使用从: $7.98
现在购买