YouTube的算法可能激怒人们-但真正的问题是我们不知道他们如何工作 Tempter先生/ Shutterstock

YouTube是否会创建极端分子? 一种 最近的一项研究 在科学家之间引起争议,他们认为支持该网站的算法并不能通过推荐更多极端视频来帮助激怒人们,例如 已经提出 最近几年。

该论文已提交给开放存取期刊《第一星期一》,但尚未经过正式同行评审,分析了不同类型渠道收到的视频推荐。 它声称YouTube的算法优先于主流媒体渠道,而不是独立的内容,并认为激进化与创作有害内容的人更多的是网站的算法。

该领域的专家很快 回应研究,有些批评 论文的方法 和其他人争论算法是其中之一 几个重要因素 还有那个数据科学 不会给我们答案.

这次讨论的问题在于,我们无法真正回答YouTube算法在激化人们方面所扮演的角色,因为我们不了解它的工作原理。 这只是更广泛问题的征兆。 这些算法在我们的日常生活中起着越来越重要的作用,但缺乏任何透明度。

很难说YouTube在激进化中没有发挥作用。 技术社会学家Zeynep Tufekci首先指出了这一点,他说明了推荐视频如何逐步吸引用户 追求更极端的内容。 用Tufekci的话说,有关慢跑的视频会导致有关进行超级马拉松的视频,有关疫苗的视频会导致阴谋论,而有关政治的视频则导致“大屠杀否认和其他令人不安的内容”。


内在自我订阅图形


这也被写成 详细 前YouTube员工Guillaume Chaslot负责该网站的推荐算法。 自离开公司以来,Chaslot一直在努力提出这些建议 更透明。 他说YouTube建议偏向 阴谋论和实际上不正确的视频,但仍使人们在网站上花费更多的时间。

事实上, 最大化观看时间 是YouTube算法的重点,这鼓励视频创作者以任何可能的方式争取关注。 公司的纯粹 缺乏透明度 确切地讲这是如何工作的,因此几乎不可能在网站上进行激进化。 毕竟,如果没有透明度,很难知道可以为改善情况而做出哪些改变。

YouTube的算法可能激怒人们-但真正的问题是我们不知道他们如何工作 YouTube算法的工作原理仍然是个谜。 谁是Danny / Shutterstock

但是YouTube在这方面并不罕见。 每当算法在大型系统中使用时(无论是由私人公司还是公共机构使用),其算法如何工作都缺乏透明度。 除了决定接下来要播放的视频之外,机器学习算法现在还可以用来 让孩子上学, 决定 监禁,确定 信用评分保险费率以及命运 移民, 求职者大学申请者。 通常我们不了解这些系统如何做出决定。

研究人员找到了创新的方法来展示这些算法对社会的影响,无论是通过研究 反动权利的上升 或者 阴谋论的传播 或在YouTube上展示如何 搜索引擎反映了种族偏见 创造它们的人。

机器学习系统通常是大型,复杂且不透明的。 适合地,它们通常被描述为 黑匣子,信息进入其中,信息或动作出现,但没人能看到两者之间发生了什么。 这意味着,由于我们不确切了解YouTube推荐系统之类的算法是如何工作的,因此尝试弄清楚网站的工作原理就像在不打开引擎盖的情况下理解汽车。

反过来,这意味着试图编写法律来规范应该执行或不应该执行的算法将成为盲目的过程或反复试验。 YouTube和许多其他机器学习算法就是这种情况。 我们试图在他们的结果中有发言权,而不真正了解他们的实际工作方式。 我们需要开放这些专利技术,或者至少使它们足够透明以至于我们可以对其进行监管。

解释和测试

一种方法是让算法提供 反事实的解释 以及他们的决定。 这意味着要计算出算法做出不同决策所需的最低条件,而无需描述其完整逻辑。 例如,决策银行贷款的算法可能会产生这样的输出:“如果您年满18岁且没有以前的债务,则您将接受银行贷款”。 但这对于使用推荐算法的YouTube和其他网站可能很难做到,因为从理论上讲,可以随时推荐平台上的任何视频。

另一个功能强大的工具是算法测试和审核,在诊断偏差算法中特别有用。 在最近的案例中,一家专业的简历筛选公司发现其算法是 优先考虑两个因素 作为工作绩效的最佳预测指标:候选人的名字是否是Jared,以及他们是否在高中打过曲棍球。 这是在机器不受监督的情况下发生的情况。

在这种情况下,简历筛选算法已经注意到白人被录用的可能性更高,并且发现在所录用候选人中存在相关的代理人特征(例如被任命为Jared或打长曲棍球)。 借助YouTube,算法审核可以帮助您了解哪些视频应优先考虑进行推荐-也许可以帮助解决有关YouTube建议是否有助于激进化的争论。

引入反事实的解释或使用算法审核是一个困难而昂贵的过程。 但这很重要,因为替代方案更糟。 如果算法不受控制,不受管制,我们就会看到阴谋理论家和极端主义者逐渐渗透到我们的媒体中,而我们的注意力将由能够产生最有利可图的内容的人控制。谈话

关于作者

Chico Q. Camargo,数据科学博士后, 牛津大学

本文重新发表 谈话 根据知识共享许可。 阅读 原创文章.