图灵测试和人工智能 10 17

Pexels/谷歌 Deepmind, 创用CC BY-SA

1950年,英国计算机科学家阿兰·图灵提出了一种实验方法来回答这个问题:机器能思考吗? 他建议,如果一个人在五分钟的询问后无法分辨自己是在与人工智能(AI)机器还是另一个人交谈,这将证明人工智能具有类似人类的智能。

尽管人工智能系统在图灵生前还远远没有通过他的测试,但他推测:

“[…] 大约 70 年后,将有可能对计算机进行编程 […] 使它们能够很好地玩模仿游戏,以至于询问者在 XNUMX 分钟后做出正确识别的机会不会超过 XNUMX%质疑。

如今,在图灵提出这一提议 70 多年后,还没有任何人工智能能够成功通过满足他概述的具体条件的测试。 尽管如此,作为 一些头条新闻 反映,一些系统已经非常接近了。

最近的一项实验 测试了三种大型语言模型,包括 GPT-4(ChatGPT 背后的人工智能技术)。 参与者花了两分钟与另一个人或人工智能系统聊天。 人工智能会被提示犯一些小的拼写错误,如果测试者变得过于激进,人工智能就会退出。


内在自我订阅图形


在这个提示下,人工智能很好地欺骗了测试人员。 当与 AI 机器人配对时,测试人员只能在 60% 的时间内正确猜测他们是否正在与 AI 系统交谈。

鉴于自然语言处理系统设计取得的快速进展,我们可能会在未来几年内看到人工智能通过图灵的原始测试。

但模仿人类真的是对智力的有效测试吗? 如果没有,我们可以使用哪些替代基准来衡量人工智能的能力?

图灵测试的局限性

虽然通过图灵测试的系统给了我们 一些 证明它是聪明的,这个测试不是对智力的决定性测试。 一个问题是它可能会产生“假阴性”。

当今的大型语言模型通常被设计为立即声明它们不是人类。 例如,当你问 ChatGPT 一个问题时,它通常会在答案前加上“作为人工智能语言模型”这一短语。 即使人工智能系统具有通过图灵测试的潜在能力,这种编程也会覆盖这种能力。

该测试还存在某些“误报”的风险。 正如哲学家内德·布洛克 指出: 在 1981 年的一篇文章中,可以想象,一个系统只需进行硬编码,对任何可能的输入做出类似人类的响应,就可以通过图灵测试。

除此之外,图灵测试特别关注人类认知。 如果人工智能认知与人类认知不同,专家询问者将能够找到人工智能和人类表现不同的任务。

对于这个问题,图灵写道:

这个反对意见是非常强烈的,但至少我们可以说,如果可以构造一台机器来令人满意地玩模仿游戏,我们就不必为这个反对意见所困扰。

换句话说,虽然通过图灵测试是系统智能的好证据,但失败并不是系统智能的好证据。 不能 智能。

此外,该测试并不能很好地衡量人工智能是否有意识,是否能感受到痛苦和快乐,或者是否具有道德意义。 许多认知科学家认为,意识涉及一组特定的心理能力,包括工作记忆、高阶思维、感知环境和模拟身体围绕环境移动的能力。

图灵测试并没有回答人工智能系统是否有效的问题 有这些能力.

人工智能不断增长的能力

图灵测试是基于一定的逻辑的。 即:人类是有智能的,所以任何能够有效模仿人类的东西都可能是智能的。

但这个想法并没有告诉我们任何有关智力本质的信息。 衡量人工智能智能的另一种方法是更批判性地思考智能是什么。

目前还没有任何单一测试可以权威地衡量人工智能或人类智能。

在最广泛的层面上,我们可以将智力视为 对,能力-- 在不同的环境中实现一系列的目标。 更智能的系统是那些能够在更广泛的环境中实现更广泛的目标的系统。

因此,跟踪通用人工智能系统设计进展的最佳方法是评估其在各种任务中的性能。 机器学习研究人员开发了一系列基准来实现这一点。

例如,GPT-4 是 能够正确回答 86% 的问题涉及大规模多任务语言理解——衡量一系列大学水平学术科目多项选择测试表现的基准。

也取得了不错的成绩 代理工作台,一种工具,可以衡量大型语言模型作为代理的能力,例如浏览网页、在线购买产品和参加游戏竞争。

图灵测试还有用吗?

图灵测试是模仿的衡量标准,即人工智能模拟人类行为的能力。 大型语言模型是模仿专家,这一点现在体现在它们通过图灵测试的潜力上。 但智力并不等同于模仿。

有多少种需要实现的目标,就有多少种智力。 了解人工智能智能的最佳方法是监控其在开发一系列重要功能方面的进展。

与此同时,在谈到人工智能是否智能的问题时,重要的是我们不要不断地“改变目标”。 由于人工智能的能力正在迅速提高,人工智能概念的批评者不断发现人工智能系统可能难以完成的新任务——结果却发现它们已经跳过了 还有另一个障碍.

在这种情况下,相关的问题不是人工智能系统是否智能,而是更准确地说,什么是智能? 他们可能拥有的智力。谈话

西蒙·戈德斯坦,澳大利亚天主教大学迪亚诺亚哲学研究所副教授, 澳大利亚天主教大学卡梅伦·多梅尼科·柯克-贾尼尼,哲学助理教授, 罗格斯大学(Rutgers University)

本文重新发表 谈话 根据知识共享许可。 阅读 原创文章.