搜索引擎如何传播错误信息和控制信息

: By 希拉格·沙（Chirag Shah）

感谢造访 InnerSelf.com，哪里有 20,000+ 宣传“新态度和新可能性”的改变生活的文章。所有文章均翻译为 30多种语言. 订阅每周出版的《内在自我》杂志和玛丽·T·拉塞尔的《每日灵感》。 InnerSelf杂志 自 1985 年起出版。

这不只是一个社交媒体问题-搜索引擎如何传播错误信息 搜索引擎通常会混淆信息和错误信息。克里斯平·瓦莱恩特（Crispin la valiente）/ Moment通过Getty Images, CC BY-ND

搜索引擎是社会通往信息和人的主要途径之一，但它们也是错误信息的渠道。如同有问题的社交媒体算法，搜索引擎将学会为您提供您和他人之前点击过的内容。由于人们被轰动的感觉所吸引，因此算法与人性之间的这种舞蹈会助长错误信息的传播。

像大多数在线服务一样，搜索引擎公司不仅通过出售广告，还通过跟踪用户并出售其数据来获利。通过实时出价在上面。人们对轰动性和娱乐性新闻以及渴望引起争议或证实其观点的信息的渴望常常导致误导信息。一项研究发现，关于糖尿病的YouTube视频越来越流行不太可能具有医学上有效的信息比不那么受欢迎的影片。

广告驱动的搜索引擎（如社交媒体平台）旨在奖励诱人链接的点击，因为它可以帮助搜索公司提高其业务指标。作为研究者研究搜索和推荐系统，我和我的同事表明，公司获利动机与个人敏感性之间的这种危险组合使问题难以解决.

搜索结果如何出问题

当您单击搜索结果时，搜索算法将得知您单击的链接与您的搜索查询相关。这就是所谓的相关性反馈。该反馈有助于搜索引擎将来为该查询赋予该链接更高的权重。如果足够多的人单击该链接足够多次，从而提供了强大的相关性反馈，则该网站的搜索结果和相关查询的排名会更高。

人们是更有可能点击显示在较高位置的链接在搜索结果列表中。这会形成一个积极的反馈循环–网站展示的频率越高，点击次数就越多，从而使该网站的排名更高或保持更高。搜索引擎优化技术使用此知识来增加网站的可见性。

这个错误信息问题有两个方面：如何评估搜索算法以及人类对标题，标题和摘要的反应。像大多数在线服务一样，搜索引擎是使用一系列指标来判断的，其中之一就是用户参与度。为您提供想要阅读，观看或单击的内容，这是搜索引擎公司的最大利益。因此，当搜索引擎或任何推荐系统创建要显示的项目列表时，它将计算您单击这些项目的可能性。

传统上，这是为了带出最相关的信息。但是，相关性的概念变得模糊，因为人们一直在使用搜索来查找有趣的搜索结果以及真正相关的信息.

想象您正在寻找钢琴调音器。如果有人向您展示了一只猫在弹钢琴的视频，您会点击它吗？即使与钢琴调音无关，许多人也会这样做。这项搜索服务受到了积极的相关反馈的认可，并且知道当人们搜索钢琴调音器时，可以显示一只猫在弹钢琴。

实际上，它比在许多情况下显示相关结果更好。人们喜欢看有趣的猫咪视频，而搜索系统获得了更多的点击次数和用户参与度。

这似乎无害。那么，如果人们不时分心并点击与搜索查询无关的结果怎么办？问题在于，人们被令人兴奋的图像和耸人听闻的标题所吸引。他们倾向于点击阴谋论和耸人听闻的新闻，而不仅仅是猫在弹钢琴不仅仅是点击真实新闻或相关信息。

著名但假的蜘蛛

2018年，搜索“新的致命蜘蛛” 钉在Google上在Facebook帖子上声称有一只新的致命蜘蛛在多个州杀死了几人之后。在此趋势查询的第一周，我和我的同事分析了Google搜索“新致命蜘蛛”的前100个结果。

这不只是一个社交媒体问题-搜索引擎如何传播错误信息 2018年XNUMX月，谷歌针对``新致命蜘蛛''的搜索结果的前两页（阴影区域）与该主题的原始虚假新闻帖子有关，而不涉及揭穿或其他事实信息。希拉格·沙（Chirag Shah）, CC BY-ND

原来这个故事是假的，但搜寻该邮件的人在很大程度上暴露了与原始虚假帖子有关的错误信息。当人们继续单击并共享该错误信息时，Google会继续在搜索结果的顶部提供这些页面。

这种令人兴奋且未经验证的故事不断涌现，人们点击它们的模式仍在继续，人们显然要么不关心事实，要么相信如果像Google搜索这样的受信任服务向他们展示了这些故事，那么这些故事一定是真实的。最近，一个拒登报告据称，由于这种恶性循环，中国让冠状病毒从实验室泄漏而在搜索引擎上引起了人们的关注。

发现错误信息

为了测试人们对准确信息和错误信息的区分程度，我们设计了一个简单的游戏，称为“谷歌与否。” 此在线游戏显示同一查询的两组结果。目标很简单–选择可靠，可信赖或最相关的集合。

这不只是一个社交媒体问题-搜索引擎如何传播错误信息 在测试中，大约有一半的时间人们无法分辨包含错误信息的Google搜索结果与仅包含可信赖结果的搜索结果之间的区别。希拉格·沙（Chirag Shah）, CC BY-ND

这两组中的一组具有一个或两个结果，这些结果已被验证并标记为错误信息或被揭穿的故事。我们公开发布了该游戏，并通过各种社交媒体渠道进行了广告宣传。总体而言，我们从2,100多个国家/地区收集了30份回复。

当我们分析结果时，我们发现大约有一半的时间，人们错误地选择了带有一两个错误信息结果的集合，作为值得信赖的集合。我们在许多次迭代中与数百个其他用户进行的实验也得出了类似的发现。换句话说，大约有一半的时间人们在选择包含阴谋论和虚假新闻的结果。随着越来越多的人选择这些不准确和误导性的结果，搜索引擎发现这就是人们想要的。

除了关于大技术监管和自我监管的问题外，对于人们来说，重要的是要了解这些系统如何工作以及如何赚钱。否则，市场经济和人们天生的倾向会被吸引眼球的链接所吸引，这将使恶性循环继续下去。