一种基于语义对齐的树结构数学应用题求解方法及系统与流程

专利2022-06-29  183


本发明涉及数学应用题的自动化求解技术领域,具体涉及一种基于语义对齐的树结构数学应用题求解方法及系统。



背景技术:

数学应用题自动求解的任务目标是通过理解问题的文本描述,推理出表达式并计算出正确答案,这要求求解器具有强大的自然语言理解和推理能力。一个典型的数学应用题是一个简短的故事,用文字叙述有关事实,反映某种数量关系,并提出含有一个或多个未知数的问题。为了解决这个问题,需要从文本中识别出相关的运算数和运算符,并且需要确定这些数量的计算顺序。

传统的应用题求解器依赖于手工特征提取和模板标注,这需要大量的人力和专业知识。深度学习为应用题自动化求解提供了新的方法。有的方法直接训练一个序列到序列的模型来学习问题到方程的映射关系;有的方法基于循环神经网络利用模板来构建数学表达式树。现有的基于编码器和解码器的端到端深度学习模型,简单地将数学应用题求解问题当成了序列理解和标注问题来求解,没有挖掘和利用题目中的语义关系来帮助运算表达式的构建。除此之外,现有的技术只能求解含有一个未知数的应用题,不能解决含有多个未知数的非线性问题,距离能在实际应用中求解多种复杂题型的通用应用题求解器还有很大差距。



技术实现要素:

因此,本发明提供的一种基于语义对齐的树结构数学应用题求解方法及系统,克服现有的技术只能求解含有一个未知数的应用题,不能解决含有多个未知数的非线性问题的缺陷。

第一方面,本发明实施例提供基于语义对齐的树结构数学应用题求解方法,包括:获取待求解的应用题题目文本;将所述待求解的应用题题目文本通过第一神经网络转化为语义编码后的上下文特征表示;将所述上下文特征表示利用第二神经网络构建根节点向量;利用第三神经网络对根节点向量进行节点类别,根据节点类别采用先序遍历的方式构建表达式树结构;利用第四神经网络分别对表达式树结构的子树特征和应用题题目文本的特征表示进行非线性变换,将两者转换到相同的语义空间;利用预设约束项对表达式树结构的子树特征与应用题题目文本的特征表示进行语义对齐处理;采用中序遍历的方式,将语义对齐处理后的表达式树结构解析成完整的数学表达式作为待求解的方程。

在一实施例中,所述第二神经网络、第三神经网络以及第四神经网络均为可实现非线性变换的神经网络。

在一实施例中,将所述待求解的应用题题目文本通过第一神经网络转化为语义编码后的上下文特征表示的步骤,包括:将待求解的应用题题目文本输入中的每个词标记通过查找单词表的方式被转换为词嵌入;将词嵌入向量被从头到尾和从末到头两种方式输入到循环神经网络中,对应产生两个隐状态向量;将两个隐状态向量相加,得到应用题题目文本的语义编码后的上下文特征表示。

在一实施例中,将词嵌入向量被从头到尾和从末到头两种方式输入到循环神经网络中,对应产生两个隐状态向量的步骤,包括:

将词嵌入向量被从头到尾和从末到头两种方式输入到双向门控循环单元中,对应产生两个隐状态向量隐状态向量的生成过程通过以下公式表示:

其中,gru(.,.)表示两层双向门控循环单元的函数。

在一实施例中,将所述上下文特征表示利用第二神经网络构建根节点向量的步骤,包括:

将所述上下文特征表示通过两层带门控机制的前馈神经网络构建根节点向量,根节点向量通过以下公式表示:

n0=σ(wqg0)⊙tanh(wtg0)

其中,n0表示根节点向量,σ表示sigmoid激活函数,tanh表示双曲正弦激活函数,wq和wt分别表示两层神经网络的网络参数,g0表示编码后的上下文特征表示。

在一实施例中,所述节点类别包括:应用题题目文本中已经给出的变量的数值、数学操作数的集合、未在题目文本中出现,但已经成为常识的常量的数值以及应用题题目文本中需要计算的未知数。

在一实施例中,根据节点类别采用先序遍历的方式构建表达式树结构的步骤,包括:当节点被识别为数学操作数时,当前节点向量需要被用来推导左右两个子节点的节点向量,以进一步构建表达式树,当被识别为其他类别,则下一个节点是叶子节点,停止构建子树;表达式树的构建采用先序遍历的方式,先产生父节点,再产生左子树,再产生右子树,在构造右子树时利用父节点的特征向量结合左子树的节点信息来产生右子树的节点向量。

在一实施例中,利用第四神经网络分别对表达式树结构的子树特征和应用题题目文本的特征表示进行非线性变换,将两者转换到相同的语义空间的步骤,包括:利用两层带有激活函数的前馈神经网络分别对表达式树结构的子树特征和应用题题目文本的特征表示进行非线性变换,将两者转换到相同的语义空间,计算方式如下:

ep=wp2·tanh(wp1·p)

et=wt2·tanh(wt1·t)

其中,其中,p和t分别表达式树结构的子树特征和应用题题目文本的特征表示,ep和et分别是变换后的应用题题目文本和表达式子树向量,tanh表示双曲正弦激活函数,wp1、wp2、wt1和wt2为可学习的参数。

在一实施例中,利用预设约束项对表达式树结构的子树特征与应用题题目文本的特征表示进行语义对齐处理的步骤,包括:采用l2范数来计算表达式树与问题文本在语义上对齐的约束项lpt,通过以下公式表示:

其中,m表示整个表达式树中子树的数量,ep和et分别表示问题文本和表达式子树的特征。

第二方面,本发明实施例提供一种基于语义对齐的树结构数学应用题求解系统,包括:应用题题目获取模块,用于获取待求解的应用题题目文本;上下文特征表示表示模块,用于将所述待求解的应用题题目文本通过第一神经网络转化为语义编码后的上下文特征表示;根节点向量构建模块,用于将所述上下文特征表示利用第二神经网络构建根节点向量;表达式树结构构建模块,用于利用第三神经网络对根节点向量进行节点类别,根据节点类别采用先序遍历的方式构建表达式树结构;语义空间转化模块,用于利用第四神经网络分别对表达式树结构的子树特征和应用题题目文本的特征表示进行非线性变换,将两者转换到相同的语义空间;语义对齐处理模块,用于利用预设约束项对表达式树结构的子树特征与应用题题目文本的特征表示进行语义对齐处理;待求解的方程获取模块,用于采用中序遍历的方式,将语义对齐处理后的表达式树结构解析成完整的数学表达式作为待求解的方程。

第三方面,本发明实施例提供一种计算机设备,包括:至少一个处理器,以及与所述至少一个处理器通信连接的存储器,其中,所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器执行本发明实施例第一方面所述的训练多任务目标检测模型的方法,以及本发明实施例第一方面所述的基于语义对齐的树结构数学应用题求解方法。

第四方面,本发明实施例提供一种计算机可读存储介质,所述计算机可读存储介质存储有计算机指令,以使所述至少一个处理器执行本发明实施例第一方面所述的基于语义对齐的树结构数学应用题求解方法。

本发明技术方案,具有如下优点:

本发明实施例提供基于语义对齐的树结构数学应用题求解方法及系统,通过树状结构的解码器,用结构化的表达和更具可解释性的构建过程来生成表达式;基于语义对齐的语义对齐的约束项,充分利用文本信息与表达式树结构信息,从全局角度规范表达式的生成;通过树结构来强化表达和显式约束题目文本中的语义信息,从而能够求解含有多个未知数的复杂题型应用题,具有较高的解题准确率,具有很高的实用价值。

附图说明

为了更清楚地说明本发明具体实施方式或现有技术中的技术方案,下面将对具体实施方式或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施方式,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。

图1为本发明实施例提供的基于语义对齐的树结构数学应用题求解方法的一个框架图;

图2为本发明实施例提供的基于语义对齐的树结构数学应用题求解方法的一个具体示例的流程图;

图3为本发明实施例提供的实施例编码器的结构的框架图;

图4为本发明实施例提供的树结构解码器框架图;

图5基于语义对齐的树结构数学应用题求解系统的一个具体示例的模块组成图;

图6为本发明实施例提供的计算机设备一个具体示例的组成图。

具体实施方式

下面将结合附图对本发明的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。

此外,下面所描述的本发明不同实施方式中所涉及的技术特征只要彼此之间未构成冲突就可以相互结合。

实施例1

本发明实施例提供的一种基于语义对齐的树结构数学应用题求解方法,可应用于自然语言理解、语义特征提取与表达,以及数学表达式树的构建与解析。该数学应用题求解方法的框架示意图如图1所示,如图2所示该方法包括如下步骤:

步骤s1:获取待求解的应用题题目文本。

在实际应用中,该应用题题目文本可以为包含一个未知数的应用题,也可以为含有多个未知数的非线性问题的应用题题目文本。

步骤s2:将待求解的应用题题目文本通过第一神经网络转化为语义编码后的上下文特征表示。

本发明实施例将待求解的应用题题目文本输入p={x1,x2,…xn}中的每个词标记xi通过查找单词表的方式被转换为词嵌入xi;将词嵌入向量{x1,x2,…xn}被从头到尾和从末到头两种方式输入到循环神经网络中,对应产生两个隐状态向量其中,是根据前一个隐状态计算得到;隐状态是根据后一个隐状态计算得到。它们的输入都是当前的词嵌入xt。因此,将该过程表示为:

其中gru(.,.)表示两层双向门控循环单元的函数。将两个隐状态相加,得到输入应用题题目文本单词xt的语义编码后的上下文特征表示

基于如图3所示的框架,在一具体实施例中,首先将文本中的字词转变为词嵌入向量,长度为128。为了更好地编码文本中前后单词的依赖关系,将字向量序列按两个方向输入到编码器。在编码器中,构建了两个双向门控循环单元,每个隐状态的向量长度设置为512。编码器输出的特征向量长度也为512。

步骤s3:将上下文特征表示利用第二神经网络构建根节点向量。

本实施例中,将上下文特征表示利用第二神经网络来构建根节点向量n0,第二神经网络为可以进行非线性变换的神经网络模型。

在一具体实施例中,根节点向量可以通过两层带门控机制的前馈神经网络得到,根节点向量通过以下公式表示:

n0=σ(wqg0)⊙tanh(wtg0)

其中,n0表示根节点向量,σ表示sigmoid激活函数,tanh表示双曲正弦激活函数,wq和wt分别表示两层神经网络的网络参数,g0表示编码后的上下文特征表示。

步骤s4:利用第三神经网络对根节点向量进行节点类别,根据节点类别采用先序遍历的方式构建表达式树结构。

本发明实施例中,节点类别包括四种,分别为:vk表示问题文本中已经给出的变量的数值;vop表示数学操作数的集合,包含{ ,-,*,/,^,=,;}。其中“;”用来表示方程式的组合;vcon表示未在题目中出现,但已经成为常识的常量的数值,比如一只鸡有2条腿,一年有12个月;vu表示题目中需要计算的未知数。

基于如图4所示的树结构解码器框架,当节点被识别为数学操作vop时,当前节点向量n需要被用来推导左右两个子节点的节点向量,以进一步构建表达式树。如果识别为其他类别,则下一个节点是叶子节点,可以停止构建子树。

表达式树的构建采用先序遍历的方式,先产生父节点,再产生左子树,再产生右子树。在构造右子树的时候,除了利用父节点的特征向量,还会结合左子树的节点信息来产生右子树的节点向量,利用左右子树的语义关系来更好地产生表达式树。

实际应用中,将数学应用题表示为(p,t),由问题文本p和表达式树的集合t组成。应用题文本p是词语标记和数值的序列,通常以关于真实场景的简短故事开头,其中包含一些数量和一些简单数量的更新,最后以一个或多个未知数量的问题结尾。该识别节点类别神经网络的目标函数为:

其中d为训练集中应用题文本和表达式树的集合,p为识别为某种类别的概率。只有当目标函数值大于一预设阈值时,才输出最终的节点类别。

步骤s5:利用第四神经网络分别对表达式树结构的子树特征和应用题题目文本的特征表示进行非线性变换,将两者转换到相同的语义空间。

本发明实施例第四神经网络也为可实现非线性变换的神经网络,在一具体实施例中利用两层带有激活函数的前馈神经网络分别对表达式树结构的子树特征和应用题题目文本的特征表示进行非线性变换,将两者转换到相同的语义空间,计算方式如下:

ep=wp2·tanh(wp1·p)

et=wt2·tanh(wt1·t)

其中,p和t分别表达式树结构的子树特征和应用题题目文本的特征表示,ep和et分别是变换后的应用题题目文本和表达式子树向量,tanh表示双曲正弦激活函数,wp1、wp2、wt1和wt2为可学习的参数。

步骤s6:利用预设约束项对表达式树结构的子树特征与应用题题目文本的特征表示进行语义对齐处理。

本发明实施例采用l2范数来计算表达式树与问题文本在语义上对齐的约束项lpt,通过以下公式表示:

其中,m表示整个表达式树中子树的数量,ep和et分别表示问题文本和表达式子树的特征。

步骤s7:采用中序遍历的方式,将语义对齐处理后的表达式树结构解析成完整的数学表达式作为待求解的方程。

本发明实施例提供基于语义对齐的树结构数学应用题求解方法,通过树状结构的解码器,用结构化的表达和更具可解释性的构建过程来生成表达式;基于语义对齐的语义对齐的约束项,充分利用文本信息与表达式树结构信息,从全局角度规范表达式的生成;通过树结构来强化表达和显式约束题目文本中的语义信息,从而能够求解含有多个未知数的复杂题型应用题,具有较高的解题准确率,具有很高的实用价值。

为了验证本发明实施例提供方法的有效性,选取了现有公开数据集中四个具有挑战性的数据集进行评测,分别是alg514,dolphin18k,math23k和hmwp。这四个数据集包含中文和英文题目,涵盖代数、一元一次方程和二元一次方程等题型。使用答案准确率作为评估指标,如果预测表达式树的计算值等于真实答案,则认为正确。本发明实施例分别在这四个数据集上与四种现有最好的应用题求解器进行对比,结果如下表所示。

从表中可以看出,本发明实施例提供的方法在四个数据集上的准确率都远远超过了现有的方法,证明了本发明提出的基于语义对齐的树结构应用求解器比其他方法更加准确和通用,可以用来解决不同类型的复杂数学应用题。

实施例2

本发明实施例提供一种基于语义对齐的树结构数学应用题求解系统,如图5所示,包括:

应用题题目获取模块1,用于获取待求解的应用题题目文本;此模块执行实施例1中的步骤s1所描述的方法,在此不再赘述。

上下文特征表示表示模块2,用于将所述待求解的应用题题目文本通过第一神经网络转化为语义编码后的上下文特征表示;此模块执行实施例1中的步骤s2所描述的方法,在此不再赘述。

根节点向量构建模块3,用于将所述上下文特征表示利用第二神经网络构建根节点向量;此模块执行实施例1中的步骤s3所描述的方法,在此不再赘述。

表达式树结构构建模块4,用于利用第三神经网络对根节点向量进行节点类别,根据节点类别采用先序遍历的方式构建表达式树结构。此模块执行实施例1中的步骤s4所描述的方法,在此不再赘述。

语义空间转化模块5,用于利用第四神经网络分别对表达式树结构的子树特征和应用题题目文本的特征表示进行非线性变换,将两者转换到相同的语义空间。此模块执行实施例1中的步骤s5所描述的方法,在此不再赘述。

语义对齐处理模块6,用于利用预设约束项对表达式树结构的子树特征与应用题题目文本的特征表示进行语义对齐处理;此模块执行实施例1中的步骤s6所描述的方法,在此不再赘述。

待求解的方程获取模块7,用于采用中序遍历的方式,将语义对齐处理后的表达式树结构解析成完整的数学表达式作为待求解的方程。此模块执行实施例1中的步骤s7所描述的方法,在此不再赘述。

本发明实施例提供的基于语义对齐的树结构数学应用题求解系统,通过树状结构的解码器,用结构化的表达和更具可解释性的构建过程来生成表达式;基于语义对齐的语义对齐的约束项,充分利用文本信息与表达式树结构信息,从全局角度规范表达式的生成;通过树结构来强化表达和显式约束题目文本中的语义信息,从而能够求解含有多个未知数的复杂题型应用题,具有较高的解题准确率,具有很高的实用价值。

实施例3

本发明实施例提供一种计算机设备,如图6所示,包括:至少一个处理器401,例如cpu(centralprocessingunit,中央处理器),至少一个通信接口403,存储器404,至少一个通信总线402。其中,通信总线402用于实现这些组件之间的连接通信。其中,通信接口403可以包括显示屏(display)、键盘(keyboard),可选通信接口403还可以包括标准的有线接口、无线接口。存储器404可以是高速ram存储器(ramdomaccessmemory,易挥发性随机存取存储器),也可以是非不稳定的存储器(non-volatilememory),例如至少一个磁盘存储器。存储器404可选的还可以是至少一个位于远离前述处理器401的存储装置。其中处理器401可以执行实施例1中的基于语义对齐的树结构数学应用题求解方法。存储器404中存储一组程序代码,且处理器401调用存储器404中存储的程序代码,以用于执行实施例1中的基于语义对齐的树结构数学应用题求解方法。其中,通信总线402可以是外设部件互连标准(peripheralcomponentinterconnect,简称pci)总线或扩展工业标准结构(extendedindustrystandardarchitecture,简称eisa)总线等。通信总线402可以分为地址总线、数据总线、控制总线等。为便于表示,图6中仅用一条线表示,但并不表示仅有一根总线或一种类型的总线。

其中,存储器404可以包括易失性存储器(英文:volatilememory),例如随机存取存储器(英文:random-accessmemory,缩写:ram);存储器也可以包括非易失性存储器(英文:non-volatilememory),例如快闪存储器(英文:flashmemory),硬盘(英文:harddiskdrive,缩写:hdd)或固态硬盘(英文:solid-statedrive,缩写:ssd);存储器404还可以包括上述种类的存储器的组合。

其中,处理器401可以是中央处理器(英文:centralprocessingunit,缩写:cpu),网络处理器(英文:networkprocessor,缩写:np)或者cpu和np的组合。

其中,处理器401还可以进一步包括硬件芯片。上述硬件芯片可以是专用集成电路(英文:application-specificintegratedcircuit,缩写:asic),可编程逻辑器件(英文:programmablelogicdevice,缩写:pld)或其组合。上述pld可以是复杂可编程逻辑器件(英文:complexprogrammablelogicdevice,缩写:cpld),现场可编程逻辑门阵列(英文:field-programmablegatearray,缩写:fpga),通用阵列逻辑(英文:genericarraylogic,缩写:gal)或其任意组合。

可选地,存储器404还用于存储程序指令。处理器401可以调用程序指令,实现如本申请执行实施例1中的基于语义对齐的树结构数学应用题求解方法。

本发明实施例还提供一种计算机可读存储介质,计算机可读存储介质上存储有计算机可执行指令,该计算机可执行指令可执行实施例1中的基于语义对齐的树结构数学应用题求解方法。其中,所述存储介质可为磁碟、光盘、只读存储记忆体(read-onlymemory,rom)、随机存储记忆体(randomaccessmemory,ram)、快闪存储器(flashmemory)、硬盘(harddiskdrive,缩写:hdd)或固态硬盘(solid-statedrive,ssd)等;所述存储介质还可以包括上述种类的存储器的组合。

显然,上述实施例仅仅是为清楚地说明所作的举例,而并非对实施方式的限定。对于所属领域的普通技术人员来说,在上述说明的基础上还可以做出其它不同形式的变化或变动。这里无需也无法对所有的实施方式予以穷举。而由此所引申出的显而易见的变化或变动仍处于本发明创造的保护范围之中。


技术特征:

1.一种基于语义对齐的树结构数学应用题求解方法,其特征在于,包括:

获取待求解的应用题题目文本;

将所述待求解的应用题题目文本通过第一神经网络转化为语义编码后的上下文特征表示;

将所述上下文特征表示利用第二神经网络构建根节点向量;

利用第三神经网络对根节点向量进行节点类别,根据节点类别采用先序遍历的方式构建表达式树结构;

利用第四神经网络分别对表达式树结构的子树特征和应用题题目文本的特征表示进行非线性变换,将两者转换到相同的语义空间;

利用预设约束项对表达式树结构的子树特征与应用题题目文本的特征表示进行语义对齐处理;

采用中序遍历的方式,将语义对齐处理后的表达式树结构解析成完整的数学表达式作为待求解的方程。

2.根据权利要求1所述的基于语义对齐的树结构数学应用题求解方法,其特征在于,所述第二神经网络、第三神经网络以及第四神经网络均为可实现非线性变换的神经网络。

3.根据权利要求2所述的基于语义对齐的树结构数学应用题求解方法,其特征在于,将所述待求解的应用题题目文本通过第一神经网络转化为语义编码后的上下文特征表示的步骤,包括:

将待求解的应用题题目文本输入中的每个词标记通过查找单词表的方式被转换为词嵌入;

将词嵌入向量被从头到尾和从末到头两种方式输入到循环神经网络中,对应产生两个隐状态向量;

将两个隐状态向量相加,得到应用题题目文本的语义编码后的上下文特征表示。

4.根据权利要求3所述的基于语义对齐的树结构数学应用题求解方法,其特征在于,将词嵌入向量被从头到尾和从末到头两种方式输入到循环神经网络中,对应产生两个隐状态向量的步骤,包括:

将词嵌入向量被从头到尾和从末到头两种方式输入到双向门控循环单元中,对应产生两个隐状态向量隐状态向量的生成过程通过以下公式表示:

其中,gru(.,.)表示两层双向门控循环单元的函数。

5.根据权利要求2所述的基于语义对齐的树结构数学应用题求解方法,其特征在于,将所述上下文特征表示利用第二神经网络构建根节点向量的步骤,包括:

将所述上下文特征表示通过两层带门控机制的前馈神经网络构建根节点向量,根节点向量通过以下公式表示:

n0=σ(wqg0)⊙tanh(wtg0)

其中,n0表示根节点向量,σ表示sigmoid激活函数,tanh表示双曲正弦激活函数,wq和wt分别表示两层神经网络的网络参数,g0表示编码后的上下文特征表示。

6.根据权利要求1所述的基于语义对齐的树结构数学应用题求解方法,其特征在于,所述节点类别包括:应用题题目文本中已经给出的变量的数值、数学操作数的集合、未在题目文本中出现,但已经成为常识的常量的数值以及应用题题目文本中需要计算的未知数。

7.根据权利要求6所述的基于语义对齐的树结构数学应用题求解方法,其特征在于,根据节点类别采用先序遍历的方式构建表达式树结构的步骤,包括:

当节点被识别为数学操作数时,当前节点向量需要被用来推导左右两个子节点的节点向量,以进一步构建表达式树,当被识别为其他类别,则下一个节点是叶子节点,停止构建子树;

表达式树的构建采用先序遍历的方式,先产生父节点,再产生左子树,再产生右子树,在构造右子树时利用父节点的特征向量结合左子树的节点信息来产生右子树的节点向量。

8.根据权利要求2所述的基于语义对齐的树结构数学应用题求解方法,其特征在于,利用第四神经网络分别对表达式树结构的子树特征和应用题题目文本的特征表示进行非线性变换,将两者转换到相同的语义空间的步骤,包括:

利用两层带有激活函数的前馈神经网络分别对表达式树结构的子树特征和应用题题目文本的特征表示进行非线性变换,将两者转换到相同的语义空间,计算方式如下:

ep=wp2·tanh(wp1·p)

et=wt2·tanh(wt1·t)

其中,p和t分别表达式树结构的子树特征和应用题题目文本的特征表示,ep和et分别是变换后的应用题题目文本和表达式子树向量,tanh表示双曲正弦激活函数,wp1、wp2、wt1和wt2为可学习的参数。

9.根据权利要求8所述的基于语义对齐的树结构数学应用题求解方法,其特征在于,利用预设约束项对表达式树结构的子树特征与应用题题目文本的特征表示进行语义对齐处理的步骤,包括:

采用l2范数来计算表达式树与问题文本在语义上对齐的约束项lpt,通过以下公式表示:

其中,m表示整个表达式树中子树的数量,ep和et分别表示问题文本和表达式子树的特征。

10.一种基于语义对齐的树结构数学应用题求解系统,其特征在于,包括:

应用题题目获取模块,用于获取待求解的应用题题目文本;

上下文特征表示表示模块,用于将所述待求解的应用题题目文本通过第一神经网络转化为语义编码后的上下文特征表示;

根节点向量构建模块,用于将所述上下文特征表示利用第二神经网络构建根节点向量;

表达式树结构构建模块,用于利用第三神经网络对根节点向量进行节点类别,根据节点类别采用先序遍历的方式构建表达式树结构;

语义空间转化模块,用于利用第四神经网络分别对表达式树结构的子树特征和应用题题目文本的特征表示进行非线性变换,将两者转换到相同的语义空间;

语义对齐处理模块,用于利用预设约束项对表达式树结构的子树特征与应用题题目文本的特征表示进行语义对齐处理;

待求解的方程获取模块,用于采用中序遍历的方式,将语义对齐处理后的表达式树结构解析成完整的数学表达式作为待求解的方程。

11.一种计算机设备,其特征在于,包括:至少一个处理器,以及与所述至少一个处理器通信连接的存储器,其中,所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器执行权利要求1-9任一所述的基于语义对齐的树结构数学应用题求解方法。

12.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有计算机指令,所述计算机指令用于使所述计算机执行权利要求1-9任一所述的基于语义对齐的树结构数学应用题求解方法。

技术总结
本发明公开了一种基于语义对齐的树结构数学应用题求解方法及系统,将获取的待求解的应用题题目文本转化为语义编码后的上下文特征表示;将上下文特征表示利构建根节点向量;对根节点向量进行节点类别,根据节点类别采用先序遍历的方式构建表达式树结构;对表达式树结构的子树特征和应用题题目文本的特征表示进行非线性变换,将两者转换到相同的语义空间;利用预设约束项对表达式树结构的子树特征与应用题题目文本的特征表示进行语义对齐处理;采用中序遍历的方式将语义对齐处理后的表达式树结构解析成完整的数学表达式作为待求解的方程。本发明通过树结构来强化表达和显式约束题目文本中的语义信息,从而能够求解含有多个未知数的复杂题型应用题。

技术研发人员:龚科;周启贤
受保护的技术使用者:暗物智能科技(广州)有限公司
技术研发日:2020.02.10
技术公布日:2020.06.09

转载请注明原文地址: https://bbs.8miu.com/read-19845.html

最新回复(0)