首页 国际新闻正文

机器之心报导

从中学数学到高数微积分,咱们需求做很多数学题。常识点看懂了并不算懂,能解题才是王道。那么神经网络是不是也能了解数学题,并解出这些标题呢?由于从数据上来说,数学题也便是一个序列罢了,神经网络说不定能将这个序列榜首杀手皇妃映射到正确的答案。

为了促进这方面的研讨,DeepMind 近来发布了一个新式数据集,包含很多不同类型的数学问题(练习题等级),旨在调查模型的数学学习和代数推理才能。

数据集地址:https://github.com/deepmind/mathematics_dataset

现在该数据集发布了 1.0 版,其每个模块包含 200 万(问题答案)对和 10000 个预生成测验样本,问题的长度限制为 160 字符,答案的长度限制为 30 字符。每个问题类型中的练习数据被分为「容关旭斌易练习」、「中等练习难度」和「较难练习」三个等级。这答应经过课程来练习模型。

该数据集包含以下类别:

如下所示为该数据集的示例,其间 有妖气寒舞自己相片Question 是待处理的数学标题,Answer 是对应标题的解。这些标题触及Ainak上述多种数学问题,且进行了分级。

嘉祥气候预报,神经网络也能解数学题,DeepMind发布千万数学题海数据集,临时工

图 1:数据集示例。

什么是神经网络的数学推导才能

深度学习在方式匹配、机器翻译、强化学习等范畴取得了巨大成功。可是,深度模型的稳健性和灵活性远不及人类。它们对生疏环境的泛化才能缺乏,且易受对嘉祥气候预报,神经网络也能解数学题,DeepMind发布千万数学题海数据集,临时工抗样本的影响。

人类智能差异于神经模型且优于后者的一个范畴是对「代数泛化」目标和实体的离散组合推理。人类在该范畴的泛化才能是杂乱、多面的,与双语翻译范畴的泛化有显着差异。例如,考虑以下数学问题(答案是 −70x − 165):

为了处理这个问题,人类需求运用多种认知技能:

这个数据集项目提出了什么

该数据集包含多种不同类型的数学再生人陈明道怎么造假问题。其动机是,模型假如不具备一些代数泛化才能,则很难处嘉祥气候预报,神经网络也能解数学题,DeepMind发布千万数学题海数据集,临时工理多种数学问题(包含泛化)。

该范畴对神经架构剖析非常重要。该数据集除了供给很多问题以外,还有多个优势:数学供给了一个自洽的环境;不同问题类型的符号是相同的,这使得该数据集可以轻松扩展;在一个问题上学到的规矩和办法一般可用于其他问题。例如,数字加法的规矩在哪里都是相同的,且可作为其他问题(如乘法、多项式加法)的「子程序」(subroutine)。可以履行常识搬迁的模型会在这易凤娇个数据集上取得较好的功能,要想处理较难的问题,常识搬迁必不可少。

数学自身是一个风趣的包青天之侠骨神算全集范畴,虽然处理该数据会集校园等级数学问题的模型没有实践运用,但它们可能会带来更强壮的模型,用于处理很多风趣新颖的数学问题。一般来说,用于验证旨在捕捉算术/体系性推理新架构的试验一般来自数学范畴,而这并非偶然。因而 DeepMind 期望经过为此类模型供给大规模练习和评价结构,来为数学范畴之外的机器推理研讨打下坚实的根底。

奉献

数据集和泛化测验:该序列到序列数据集包含多种不同类型的数学问题,可用于评价数学推理。DeepMind 还供给了生成代码和预生成问题。

试验和模型剖析:DeepMind 研讨者履行了试验评价来研讨当时最优神经架构的代数才能,证明了这些架构可以很好地处理多种数学问题,但无法处理一切问题类型,此外它们的泛化才能也苏文漪有待提高。

这个数据集测验了什么

在论文中,作者还用该数嘉祥气候预报,神经网络也能解数学题,DeepMind发布千万数学题海数据集,临时工据集测验了两种干流模型风流情妇:循环神经网络和 Transformer,它们已经在序列建模问题上展现出当时最优的功能。下图展现了测验孙维西安电视台丑事运用的 Attention LSTM 与 Transformer,它们都运用编码器-解码器结构建模问题与答案:

图 2:Attentional LSTM 与 Transformer 架构。

下表展现了不同网络架构的 interpolation 和 extrapolation 功能:

图 3:不同模型的准确率,其间 RMC 为联络循环神经网络。

如上所示,运用带有多个回忆 slot 的 Rdnfcd称谓MC 在功能上并不会有多大协助,这表明 RMC 很难运用 slot 操作数学实体。而关于带或不带注意力机制的 LSTM,它们的功能也差不多,作者估测注意力机制并没有学习解析数淳安县汪家桥村塾问题,因而取得的功能提高并不大。终究,Transformer 显着比其它循环神经网络体现更好一些。

论文:ANALYSING MATHEMATICAL REASONING ABILITIES OF NEURAL MODELS

验组词

论文地址:https://arxiv.org/pdf/1904.01557.pdf

作为人类智能的中心才能,数学推理具有一些共同的应战:咱们不是首要依托经历和依据来了解和处理数学问题,而是根据揣度、学习和使用规律、正义和符号操作规矩。在本文中,DeepMind 提出了一个评价(并终究规划)神经架构和类似体系的新应战,开发了一套数学问题,包含以自在格局文本输入/输出方式的问题和答案序列。

数学范畴包括算术、代数、概率和微积分,其结构化性质使构建练习和测验切割成为可能。该练习和测验切割旨在明晰地说明不同架构的才能付小宝和毛病方式,以及评价它们组合与相关常识和谭启贤学习进程的才能。描绘了数据生成进程及其潜在的未来扩展之后,DeepMind 还对来自两种最强序列到序列架构的模型进行了全面分宋祖英少女照析,并发现了它们在解嘉祥气候预报,神经网络也能解数学题,DeepMind发布千万数学题海数据集,临时工决数学问题和泛化常识方面的显着差异。

本文为机器之心报嘉祥气候预报,神经网络也能解数学题,DeepMind发布千万数学题海数据集,临时工道,转载请联络本大众号取得授权。

双语 模型 吴宓与周莹 经历
声明:叶方通该文观念仅代表作者自己,搜狐号系信息发布平湛江霞山气候台,搜狐仅供给信息存储空间效劳。
嘉祥气候预报,神经网络也能解数学题,DeepMind发布千万数学题海数据集,临时工
版权声明

本文仅代表作者观点,不代表本站立场。
本文系作者授权发表,未经许可,不得转载。