Daboost / Shutterstock

随着 最近被解雇并迅速重新雇用 随着 OpenAI 的 Sam Altman 的研究,围绕人工智能 (AI) 的开发和使用的争论再次成为人们关注的焦点。 更不寻常的是,媒体报道的一个突出主题是 人工智能系统做数学.

显然,OpenAI 上的一些戏剧性事件与该公司开发一种新的 称为 Q* 的 AI 算法。 该系统被认为是一项重大进步,其显着特征之一是数学推理能力。

但数学不正是人工智能的基础吗? 鉴于计算机和计算器可以执行数学任务,人工智能系统怎么可能在数学推理方面遇到困难呢?

人工智能不是一个单一的实体。 它是在没有人类直接指令的情况下执行计算的策略的拼凑而成。 正如我们将看到的,一些人工智能系统具有数学能力。

然而,当前最重要的技术之一,即 ChatGPT 等人工智能聊天机器人背后的大型语言模型 (LLM),迄今为止一直难以模拟数学推理。 这是因为它们被设计为专注于语言。


内在自我订阅图形


如果该公司的新 Q* 算法能够解决看不见的数学问题,那么这很可能 成为重大突破。 数学是人类推理的一种古老形式 大型语言模型 (LLM) 迄今为止一直在努力模仿。 法学硕士是以下系统的基础技术 OpenAI 的 ChatGPT.

在撰写本文时,Q* 算法及其功能的细节有限,但非常有趣。 因此,在认为 Q* 成功之前,需要考虑各种微妙之处。

例如,数学是一门每个人都不同程度参与的学科,而 Q* 能够胜任的数学水平仍不清楚。 然而,已经发表的学术著作使用人工智能的替代形式来推进研究水平的数学(包括一些我自己写的,以及由一组数学家与 Google DeepMind 的研究人员合作编写的一篇文章)。

这些人工智能系统可以被描述为擅长数学。 然而,Q* 很可能不是用来帮助学者开展工作,而是用于其他目的。

尽管如此,即使 Q* 无法突破尖端研究的界限,它的构建方式也很可能具有一定的意义,可以为未来的发展带来诱人的机会。

越来越舒服

作为一个社会,我们越来越习惯使用专业人工智能来解决预定类型的问题。 例如, 数字助理, 面部识别在线推荐系统 大多数人都会熟悉。 仍然难以捉摸的是所谓的 “通用人工智能”(AGI) 具有与人类相当的广泛推理能力。

数学是我们渴望向每个学童传授的一项基本技能,并且肯定会成为探索通用人工智能的一个基本里程碑。 那么,具有数学能力的人工智能系统还能如何为社会提供帮助呢?

数学思维与多种应用相关,例如编码和工程,因此数学推理对于人类和人工智能来说都是一项重要的可转移技能。 具有讽刺意味的是,人工智能从根本上来说是基于数学的。

例如,人工智能算法实现的许多技术最终都归结为一个称为 矩阵代数。 矩阵只是一个数字网格,数字图像就是一个常见的例子。 每个像素是 无非是数字数据.

大型语言模型本质上也是数学的。 基于大量文本样本,机器可以学习单词的概率 最有可能遵循用户的提示(或问题) 到聊天机器人。 如果您希望预训练的法学硕士专注于某个特定主题,那么可以在数学文献或任何其他学习领域对其进行微调。 法学硕士可以生成读起来就像理解数学一样的文本。

不幸的是,这样做会产生一个擅长虚张声势但不擅长细节的法学硕士。 问题在于,根据定义,数学陈述可以被分配一个 明确的布尔值 (即真或假)。 数学推理相当于从先前建立的数学陈述中逻辑演绎出新的数学陈述。

魔鬼代言人

当然,任何依赖于语言概率的数学推理方法都会偏离其轨道。 解决这个问题的一种方法可能是将某种形式验证系统纳入架构中(LLM 正是如何构建的),该架构不断检查大型语言模型所实现的飞跃背后的逻辑。

已经完成此操作的线索可能是名称 Q*,它可能指的是 早在 1970 世纪 XNUMX 年代就已经开发出来的算法 帮助演绎推理。 或者,Q* 可以指 Q-learning,其中模型可以通过测试和奖励正确的结论来随着时间的推移而改进。

但构建具有数学能力的人工智能存在一些挑战。 例如,一些最有趣的数学由极不可能发生的事件组成。 在很多情况下,人们可能会认为某种模式是基于少量数据而存在的,但当人们检查足够多的案例时,它会意外地崩溃。 这种能力很难融入到机器中。

另一个挑战可能会令人惊讶:数学研究可以具有高度的创造性。 必须如此,因为从业者需要发明新概念,但又要坚持在现有的范围内 古代学科的正式规则.

任何经过训练只能在现有数学中寻找模式的人工智能方法大概永远无法创造出真正的新数学。 考虑到数学和技术之间的联系,这似乎排除了新技术革命的概念。

但让我们暂时唱反调,想象一下人工智能是否真的可以创造新的数学。 先前反对这一点的论点有一个缺陷,因为也可以说,最好的人类数学家也专门接受了预先存在的数学训练。 大型语言模型曾经让我们感到惊讶,并且还会再次让我们感到惊讶。谈话

汤姆·奥利弗,讲师,计算机科学与工程, 威斯敏斯特大学

本文重新发表 谈话 根据知识共享许可。 阅读 原创文章.