WO2020192237A1

WO2020192237A1 - 基于人工智能的语义识别的方法、装置系统及存储介质

Info

Publication number: WO2020192237A1
Application number: PCT/CN2020/070175
Authority: WO
Inventors: 高丽丽; 李超
Original assignee: 北京京东尚科信息技术有限公司; 北京京东世纪贸易有限公司
Priority date: 2019-03-22
Filing date: 2020-01-03
Publication date: 2020-10-01
Also published as: CN111737971A

Abstract

一种基于人工智能的语义识别的方法、系统、装置及存储介质，本方法首先将长文本中的每个句子通过设置的第一卷积神经网络得到每个句子的文本信息，其中，所述文本信息代表所述句子的语义特征（101）；其次根据每个句子的文本信息得到所述长文本的文本信息向量，其中每个向量元素为每个句子的文本信息；将得到的文本信息向量输入到设置的第二神经网络中，输出得到代表每个句子文本信息之间的逻辑关系的向量（102）；最后，对所述向量进行分类以识别所述长文本的语义（103）。

Description

基于人工智能的语义识别的方法、装置系统及存储介质

本申请要求于2019年3月22日提交中国专利局、申请号为201910222540.7，发明名称为“一种语义识别的方法及系统”的中国专利申请的优先权，其全部内容通过引用结合在本申请中。

技术领域

本申请涉及计算机技术领域，特别涉及一种基于人工智能的语义识别的方法、装置、系统及存储介质。

背景技术

随着人工智能技术的发展，对句子的语义识别逐渐发展起来，对句子的语义识别可以应用到各种场景中，其中，运用最广泛的就是电子商务中处理投诉信息且确定对应的定责信息，以下以电子商务中处理投诉信息且确定对应的定责信息，对如何具体进行句子的语义识别进行说明。

随着计算机及互联网技术的发展，电子商务逐渐发展起来。电子商务(Electronic Commerce)是以信息网络技术为手段，以商品交换为中心的商务活动。随着电子商务的发展，由电子商务服务商基于互联网提供售卖商品的服务，使得人们可以在家直接方便地进行网上购物。在电子商务提供各种服务时，常常通过互联网在电子商务服务商与客户之间进行通信，以沟通各种服务相关事宜。其中，客户在进行电子商务过程中，常常会对电子商务的各个环节作出评价，在此过程中，也可能产生投诉信息，且将投诉发送给电子商务服务商，电子商务服务商在接收到后，对投诉信息进行分析，确定对应的确定定责信息，从而完成整个电子商务过程。

技术内容

本申请实施例提供一种基于人工智能的语义识别的方法、装置、系统及存储介质，从而提高长文本的语义识别的准确率。

本申请实施例是这样实现的：

一种基于人工智能的语义识别方法，包括：

将长文本中的每个句子通过设置的第一卷积神经网络得到每个句子的文本信息，其中，所述文本信息代表所述句子的语义特征；

根据每个句子的文本信息得到所述长文本的文本信息向量，其中每个向量元素为每个句子的文本信息；

将得到的文本信息向量输入到设置的第二神经网络中，输出得到代表每个句子文本信息之间的逻辑关系的向量；

对所述向量进行分类以识别所述长文本的语义。

一种基于人工智能的语义识别系统，包括：第一卷积神经网络单元、第二神经网络单元及分类单元，其中，

所述第一卷积神经网络单元，用于接收长文本中的每个句子，将每个句子输入第一卷积神经网络，得到每个句子的文本信息，其中，所述文本信息代表所述句子的语义特征；

所述第二神经网络单元，用于接收每个句子文本信息，根据每个句子的文本信息得到所述长文本的文本信息向量，其中每个向量元素为每个句子的文本信息，将得到的文本信息向量输入到第二神经网络，输出得到代表每个句子文本信息之间的逻辑关系的向量；

所述分类单元，用于对所述向量进行分类以识别所述长文本的语义。

一种语义识别的装置，包括：

存储器；以及耦接至所述存储器的处理器，所述处理器被配置为基于存储在所述存储器中的指令，执行上述任一项所述的语义识别的方法。

一种非易失性计算机可读存储介质，其上存储有计算机程序，该程序被处理器执行时实现上述任一项所述的语义识别的方法。

如上可见，本申请实施例首先将长文本中的每个句子通过设置的第一卷积神经网络得到每个句子的文本信息；其次根据每个句子的文本信息得到所述长文本的文本信息向量，其中每个向量元素为每个句子的文本信息，将得到的文本信息向量输入到设置的第二神经网络中，输出得到代表每个句子文本信息之间的逻辑关系的向量；最后，对所述向量进行分类以识别长文本的语义。更进一步地，本申请实施例可以应用于电子商务中的处理投诉信息且确定对应的定责信息场景中。由于本申请实施例在确定语义信息时，考虑到了长文本中每个句子文本信息之间的逻辑关系，而并不是基于孤立的根据每个句子文本信息确定的，所以提高了长文本语义识别的准确率。

附图简要说明

图1为本申请实施例提供的基于人工智能的语义识别的方法流程图；

图2为本申请实施例提供的基于人工智能的语义识别方法的另一流程图；

图3为本申请实施例提供的基于人工智能的语义识别方法的又一流程图；

图4为本申请实施例提供的在电子商务系统中确定投诉信息的方法整体框架图；

图5为本申请实施例识别每个句子的文本信息的过程示意图；

图6为本申请实施例中LSTM计算逻辑示意图；

图7为本申请实施例提供的BiLSTM处理数据的过程框图；

图8A-8C为本申请实施例提供的基于人工智能的语义识别的系统结构示意图；

图9为本申请实施例提供的基于人工智能的语义识别装置的结构示意图。

具体实施方式

为使本申请的目的、技术方案及优点更加清楚明白，以下参照附图并举实施例，对本申请进一步详细说明。

目前电子商务服务商在处理投诉信息且确定对应的定责信息时，主要采用人工与机器学习算法的结合方式来完成。具体地说，将接收到的投诉信息拼接在一起，构成长文本，再基于所构成的长文本采用设置的机器学习算法，对长文本进行文本分类，得到对应的定责信息，从而实现定责问题。

采用上述分析虽然可以一定程度地实现投诉信息对应的定责信息，但是其中一个很大问题是没有考虑到在投诉信息中，句子与句子之间的逻辑关系，而仅仅考虑了所构成的长文本的分类问题，使得最终得到的定责信息并不准确。也就是说，对于句子的语义识别，仅仅考虑了所构成的长文本的分类问题，而没有考虑句子与句子之间的逻辑关系，从而最终导致语义识别不准确。

可以看出，对语义识别不准确的原因，特别是在电子商务中的处理投诉信息且确定对应的定责信息场景中时定责信息不准确的原因，是没有考虑到句子与句子之间的逻辑关系，而仅仅考虑了所构成的长文本的分类问题。为了克服这个缺陷，本申请实施例首先将长文本中的每个句子通过设置的第一卷积神经网络得到每个句子的文本信息；其次根据每个句子的文本信息得到所述长文本的文本信息向量，其中每个向量元素为每个句子的文本信息，将得到的文本信息向量输入到设置的第二神经网络中，输出得到代表每个句子文本信息之间的逻辑关系的向量；最后，对所述向量进行分类以识别所述长文本的语义。由于本申请实施例在确定语义信息时，考虑到了每个句子文本信息之间的逻辑关系，而并不是基于孤立的根据每个句子文本信息确定的，所以提高了语义识别的准确率。

人工智能(Artificial Intelligence，AI)是利用数字计算机或者数字计算机控制的机器模拟、延伸和扩展人的智能，感知环境、获取知识并使用知识获得最佳结果的理论、方法、技术及应用系统。

神经网络(Neural Network)是一种数学模型或计算模型，主要包括：输入层、隐藏层和输出层。卷积神经网络(Convolutional Neural Network，CNN)是一类包含卷积计算且具有深度结构的神经网络。

更进一步地，本申请实施例可以应用于电子商务中的处理投诉信息且确定对应的定责信息场景中。

在这里，所述第二神经网络可以为双向长短记忆网络(BiLSTM)或门控循环单元(GRU)。

在电子商务中的处理投诉信息且确定对应的定责信息场景中，由于本申请实施例在确定定责信息时，不仅仅采用设置的第一卷积神经网络确定投诉信息中的各个句子的文本信息，且采用设置的BiLSTM或GRU对各个句子的文本信息之间的逻辑关系进行了识别，这样，最后得到对应的定责信息充分考虑到了投诉信息中的每个句子文本信息之间的逻辑关系，而并不是基于孤立的投诉信息中的每个句子文本信息确定的，所以提高了根据投诉信息确定定责信息的准确率。

图1为本申请实施例提供的基于人工智能的语义识别的方法流程图，可以由任何具有数据处理能力的计算设备执行，例如，终端设备或者服务器，所述终端设备可以是个人计算机(PC)、笔记本电脑等智能终端设备，也可以是智能手机、平板电脑等智能移动终端设备。其具体步骤为：

步骤101、将长文本中的每个句子输入设置的第一卷积神经网络得到每个句子的文本信息，所述文本信息代表所述句子的语义特征；

步骤102、根据每个句子的文本信息得到所述长文本的文本信息向量，其中每个向量元素为每个句子的文本信息；将得到的文本信息向量输入到设置的第二神经网络中，输出得到代表每个句子文本信息之间的逻辑关系的向量；

步骤103、对所述向量进行分类以识别所述长文本的语义。

在一些实施例中，所述将长文本中的每个句子通过设置的第一卷积神经网络得到每个句子的文本信息包括：

将长文本中的每个句子按照最小语义单元进行切分，将所述切分得到的最小语义单元按照顺序输入设置的第一卷积神经网络，得到每个句子的文本信息。

在这里，每个句子中的最小语义单元可以为一个汉字或一个单词，是具有语义的字或词的最小单元。

在一些实施例中，所述第一卷积神经网络包括多个卷积单元，每个卷积单元具有不同大小的卷积核，如图2所示，步骤101中所述得到每个句子的文本信息为：

S11，将按照顺序输入的最小语义单元，分别采用设置的不同单元长度值进行组合，得到具有不同单元长度值的最小语义单元组合；

S12，将得到的不同单元长度值的最小语义单元组合分别输入到不同的卷积单元中处理，将从不同卷积单元输出的文本信息向量进行拼接，得到每个句子的文本信息。

在一些实施例中，所述多个卷积单元的数量为三个，分别为第一卷积单元、第二卷积单元及第三卷积单元；

如图2所示，步骤S11中所述得到不同单元长度值的最小语义单元组合为：

S110，按照所述最小语义单元的输入顺序进行每两个相邻最小语义单元组合，得到单元长度值为2的最小语义单元组合；

S112，按照所述最小语义单元的输入顺序进行每三个相邻最小语义单元组合，得到单元长度值为3的最小语义单元组合；

S114，按照所述最小语义单元的输入顺序进行每四个相邻最小语义单元组合，得到单元长度值为4的最小语义单元组合；

在一些实施例中，如图2所示，步骤S12中将得到的不同单元长度值的最小语义单元组合分别输入到不同的卷积单元中处理为：

S120，将单元长度值为2的最小语义单元组合输入到第一卷积单元处理；

S122，将单元长度值为3的最小语义单元组合输入到第二卷积单元处理；

S124，将单元长度为4的最小语义单元组合输入到第三卷积单元处理。

在一些实施例中，所述设置的第二神经网络包括两个子神经网络，如图3所示，步骤102中所述输出得到代表每个句子文本信息之间的逻辑关系的向量的过程为：

S21，第一子神经网络将所述长文本的文本信息向量中的向量元素从左至右读取并进行处理，得到代表每个句子文本信息之间的从左至右的逻辑关系的向量；

S22，第二子神经网络将所述长文本的文本信息向量中的向量元素从右至左读取并进行处理，得到代表每个句子文本信息之间的从右至左的逻辑关系的向量；

S23，将得到代表每个句子文本信息之间的从左至右的逻辑关系的向量，及得到代表每个句子文本信息之间的从右至左的逻辑关系的向量进行拼接，得到代表每个句子文本信息之间的逻辑关系的向量。

在一些实施例中，所述第二神经网络为双向长短记忆网络BiLSTM或门控循环单元GRU；

所述第一子神经网络为BiLSTM或GRU；

所述第二子神经网络为BiLSTM或GRU。

在一些实施例中，步骤103中所述分类为：

采用设置的分类方式，将所述向量映射至符合的意图标签中，识别得到所述长文本的语义。

在一些实施例中，所述分类方式为多分类与评估指标(softmax)方式进行，将所述相邻映射至符合的意图标签中，从而识别得到语义。Softmax方式用于多分类过程中，它是将多个输出信息，映射到(0，1)区间内，可以开成为概率来理解，从而进行了多个分类，得到对应的语义。

以下以本申请实施例应用于电子商务中的处理投诉信息且确定对应的定责信息场景中，对本申请实施例进行完整说明，这时，句子为投诉信息，要识别得到的语义为定制信息。

假设投诉信息对应的定责信息(表中表示为标签)，如表一所示。

表一

表一中的投诉信息是在电子商务过程中产生的数据形式，以定责信息为“破损”和“丢失”举例分析，其中“破损”的数据刚开始站点发现问题的时候是“可能丢失”，在仓储调查之后实际为“破损”。其中“丢失”的数据刚开始站点发现问题的时候是“可能丢失”，在仓储调查之后发现该商品的确由运输至站点的记录，就可以确定为丢失。可见，句子与句子之间的逻辑推理关系，是需要构造第二神经网络的核心。

如图4所示，图4为本申请实施例提供的在电子商务系统中确定投诉信息的方法整体框架图，以第二神经网络是BiLSTM为例进行说明。

首先，采用设置的第一卷积神经网络(例如，图4所示的文本卷积神经网络textCNN)读取投诉信息中每个句子，并输出得到的结果为每个句子的文本信息Out_1，Out_2，…Out_n；然后将每个句子的文本信息作为输入，输入到设置的第二神经网络BiLSTM中进行处理；最后将BiLSTM的输出结果拼接起来，并通过softmax方式进行分类，得到对应的定责信息，也就是对应的定责标签。

在本申请实施例中，投诉信息一般是聊天数据，通常是通过聊天数据识别得到的，因此，在将投诉信息输入到第一卷积神经网络中时，可以输入的是聊天数据，即将聊天数据按照原本对话进行的顺序，依次输入到第一卷积神经网络中。确保句子之间的顺序符合原本聊天数据产生的顺序。

本申请实施例的整个过程为：

第一步骤：准备数据

将聊天数据按照原本对话进行的顺序，依次输入到第一卷积神经网络中。确保句子之间的顺序符合原本聊天产生的顺序。

第二步骤：采用第一卷积神经网络处理输入的聊天数据，识别每个句子的文本信息。图5为本申请实施例识别每个句子的文本信息的过程示意图。如图5所示，其中w1w2w3…….wn为具体输入的句子，w1，w2，…wn分别代表切分得到的最小语义单元。然后使用三个卷积核分别读取句子中的每个最小语义单元(例如，汉字或单词)。左边的卷积核每两个汉字或单词逐步读取数据进行卷积计算，中间的卷积核每三个汉字或单词逐步读取数据进行卷积计算，右边的卷积核每四个汉字或单词逐步读取数据进行卷积计算。最后将每一个卷积核输出的数据，即文本向量拼接在一起，构造得到该句子的文本信息，实际上就是表示该句子的文本信息的向量，输出结果为[Out_1，Out_2……Out_n]。

第三个步骤：使用BiLSTM学习每个句子的文本信息中间的逻辑关系

在这里，使用了BiLSTM对每个句子的文本信息进行逻辑关系的计算。具体地说，循环神经网络(RNN)的兴起因其梯度弥散的原因被人们诟病，在此基础上提出了门限RNN，而LSTM就是门限RNN中最著名的一种。在RNN中的有漏单元通过设计连接间的权重系数，从而允许RNN累计距离较远节点间的长期联系；而门限RNN则反馈了这样的思想，允许在不同时刻改变该系数，且允许网络忘记已经累积的信息。LSTM就是这样的门限RNN，LSTM巧妙之处在于通过增加输入门限，遗忘门限和输出门限，使得自循环的权重是变化的，这样一来在模型参数固定的情况下，不同时刻的积分尺度可以动态改变，从而避免了梯度消失或梯度膨胀的问题。

图6为本申请实施例中LSTM计算逻辑示意图。在本申请实施例中，使用LSTM对每句话做模型计算，LSTM的具体计算逻辑如图6所示。在本申请实施例中，图7为本申请实施例提供的BiLSTM处理数据的过程框图，如图7所示，采用了BiLSTM对第二步骤得到的每个句子的文本信息使用两个LSTM，即第一子神经网络(LSTM1)及第二子神经网络(LSTM2)，从两个方向分别读取句子的文本信息之间的逻辑关系，其中，LSTM1是从左至右读取句子的文本信息，LSTM2是从右至左读取句子的文本信息，最终将每一个LSTM读取之间的信息拼接至一个向量，输出为[can_1,can_2…….can_n]。

第四个步骤：实现定责信息的生成

将第三个步骤输出的矩阵全连接后，通过softmax方式映射至意图标签中，也就是得到了对应的定责分类标签，即定责信息。

进过实验证明，采用本申请实施例提供的方案，经过了两个神经网络对投诉信息的处理，使得最终得到的定责信息的准确率提升至94％。

图8A为本申请实施例提供的基于人工智能的语义识别的系统结构示意图，该系统包括：第一卷积神经网络单元801、第二神经网络单元802及分类单元803，其中，

第一卷积神经网络单元801，用于接收长文本中的每个句子，将每个句子输入第一卷积神经网络，得到每个句子的文本信息，其中，所述文本信息代表所述句子的语义特征；

第二神经网络单元802，用于接收每个句子文本信息，根据每个句子的文本信息得到所述长文本的文本信息向量，其中每个向量元素为每个句子的文本信息，将得到的文本信息向量输入到第二神经网络中，输出得到代表每个句子文本信息之间的逻辑关系的向量；

分类单元803，用于对所述向量进行分类以识别所述长文本的语义。

在一些实施例中，所述第一卷积神经网络单元801进一步用于：将每个句子按照最小语义单元进行切分，将所述切分得到的最小语义单元按照顺序输入设置的第一卷积神经网络，得到每个句子的文本信息。

其中，每个句子中的最小语义单元可以为一个汉字或一个单词，是具有语义的字或词的最小单元。

在一些实施例中，如图8B所示，所述第一卷积神经网络单元801进一步包括：组合单元8011和文本信息获取单元8012，其中：

组合单元8011，用于将按照顺序输入的最小语义单元，分别采用设置的不同单元长度值进行组合，得到具有不同单元长度值的最小语义单元组合；

文本信息获取单元8012，用于将得到的不同单元长度值的最小语义单元组合分别输入到不同的卷积核中处理，将从不同卷积核输出的文本信息向量进行拼接，得到每个句子的文本信息。

在一些实施例中，所述组合单元8011进一步用于：

按照所述最小语义单元的输入顺序进行每两个相邻最小语义单元组合，得到单元长度值为2的最小语义单元组合；

按照所述最小语义单元的输入顺序进行每三个相邻最小语义单元组合，得到单元长度值为3的最小语义单元组合；

按照所述最小语义单元的输入顺序进行每四个相邻最小语义单元组合，得到单元长度值为4的最小语义单元组合；

所述文本信息获取单元8012进一步用于：

将单元长度值为2的最小语义单元组合输入到第一卷积核处理；

将单元长度值为3的最小语义单元组合输入到第二卷积核处理；

将单元长度为4的最小语义单元组合输入到第三卷积核处理。

在一些实施例中，如图8C所示，所述第二神经网络单元802进一步包括第一子神经网络单元8021、第二子神经网络单元8022和向量获取单元8023，其中：

第一子神经网络单元8021，用于将所述长文本的文本信息向量中的向量元素从左至右读取并进行处理，得到代表每个句子文本信息之间的从左至右的逻辑关系的向量；

第二子神经网络单元8022，用于将所述长文本的文本信息向量中的向量元素从右至左读取并进行处理，得到代表每个句子文本信息之间的从右至左的逻辑关系的向量；

向量获取单元8023，将得到代表每个句子文本信息之间的从左至右的逻辑关系的向量，及得到代表每个句子文本信息之间的从右至左的逻辑关系的向量进行拼接，得到代表每个句子文本信息之间的逻辑关系的向量。

在一些实施例中，所述分类单元803进一步用于，采用设置的分类方式，将所述向量映射至符合的意图标签中，识别得到所述长文本的语义。

本申请实施例还提供一种基于人工智能的语义识别的装置，如图9所示，所述电子设备900包括：存储器906、处理器902，通信模块904，用户接口910，以及用于互联这些组件的通信总线908。

存储器906可以是高速随机存取存储器，诸如DRAM、SRAM、DDR RAM、或其他随机存取固态存储设备；或者非易失性存储器，诸如一个或多个磁盘存储设备、光盘存储设备、闪存设备，或其他非易失性固态存储设备。

用户接口910可以包括一个或多个输出设备912，以及一个或多个输入设备914。

存储器906存储处理器902可执行的指令集，包括用于实现上述各实施例中的处理流程的程序，所述处理器902执行所述程序时实现所述语义识别方法的步骤。

本申请实施例还提供一种计算机可读存储介质，其上存储有计算机程序，该程序被处理器执行时实现上述任一项所述的语义识别的方法。

本申请实施例采用第一卷积神经网络，具体是文本卷积神经网络(TextCNN)识别投诉信息中的每个句子内的文本信息，使用BiLSTM识别句子之间的逻辑算法，可以有效地捕捉句子之间的推理逻辑关系，从而得到更加准确地进行语义识别。

以上所述仅为本申请的较佳实施例而已，并不用以限制本申请，凡在本申请的精神和原则之内，所做的任何修改、等同替换、改进等，均应包含在本申请保护的范围之内。

Claims

一种基于人工智能的语义识别方法，包括：

将长文本中的每个句子通过设置的第一卷积神经网络得到每个句子的文本信息，其中，所述文本信息代表所述句子的语义特征；

根据每个句子的文本信息得到所述长文本的文本信息向量，其中每个向量元素为每个句子的文本信息；

将得到的文本信息向量输入到设置的第二神经网络中，输出得到代表每个句子文本信息之间的逻辑关系的向量；

对所述向量进行分类以识别所述长文本的语义。
如权利要求1所述的方法，所述将长文本中的每个句子通过设置的第一卷积神经网络得到每个句子的文本信息包括：

将长文本中的每个句子按照最小语义单元进行切分，将切分得到的最小语义单元按照顺序通过设置的第一卷积神经网络，得到每个句子的文本信息。
如权利要求2所述的方法，所述第一卷积神经网络包括多个卷积单元，每个卷积单元具有不同大小的卷积核，所述得到每个句子的文本信息为：

将按照顺序输入的最小语义单元，分别采用设置的不同单元长度值进行组合，得到具有不同单元长度值的最小语义单元组合；

将得到的不同单元长度值的最小语义单元组合分别输入到不同的卷积单元中处理，将从不同卷积单元输出的文本信息向量进行拼接，得到每个句子的文本信息。
如权利要求3所述的方法，所述多个卷积单元的数量为三个，分别为第一卷积单元、第二卷积单元及第三卷积单元；

所述得到不同单元长度值的最小语义单元组合为：

按照所述最小语义单元的输入顺序进行每两个相邻最小语义单元组合，得到单元长度值为2的最小语义单元组合；

按照所述最小语义单元的输入顺序进行每三个相邻最小语义单元组合，得到单元长度值为3的最小语义单元组合；

按照所述最小语义单元的输入顺序进行每四个相邻最小语义单元组合，得到单元长度值为4的最小语义单元组合；

将得到的不同单元长度值的最小语义单元组合分别输入到不同的卷积单元中处理为：

将单元长度值为2的最小语义单元组合输入到第一卷积单元处理；

将单元长度值为3的最小语义单元组合输入到第二卷积单元处理；

将单元长度为4的最小语义单元组合输入到第三卷积单元处理。
如权利要求1所述的方法，所述设置的第二神经网络包括两个子神经网络，所述输出得到代表每个句子文本信息之间的逻辑关系的向量的过程为：

第一子神经网络将所述长文本的文本信息向量中的向量元素从左至右读取并进行处理，得到代表每个句子文本信息之间的从左至右的逻辑关系的向量；

第二子神经网络将所述长文本的文本信息向量中的向量元素从右至左读取并进行处理，得到代表每个句子文本信息之间的从右至左的逻辑关系的向量；

将得到代表每个句子文本信息之间的从左至右的逻辑关系的向量，及得到代表每个句子文本信息之间的从右至左的逻辑关系的向量进行拼接，得到代表每个句子文本信息之间的逻辑关系的向量。
如权利要求5所述的方法，所述第二神经网络为双向长短记忆网络BiLSTM或门控循环单元GRU；

所述第一子神经网络为BiLSTM或GRU；

所述第二子神经网络为BiLSTM或GRU。
如权利要求1所述的方法，所述分类为：

采用设置的分类方式，将所述向量映射至符合的意图标签中，识别得到所述长文本的语义。
一种基于人工智能的语义识别系统，包括：第一卷积神经网络单元、第二神经网络单元及分类单元，其中，

第一卷积神经网络单元，用于接收长文本中的每个句子，将每个句子输入第一卷积神经网络，得到每个句子的文本信息，其中，所述文本信息代表所述句子的语义特征；

第二神经网络单元，用于接收每个句子文本信息，根据每个句子的文本信息得到所述长文本的文本信息向量，其中每个向量元素为每个句子的文本信息，将得到的文本信息向量输入到第二神经网络，输出得到代表每个句子文本信息之间的逻辑关系的向量；

分类单元，用于对所述向量进行分类以识别所述长文本的语义。
根据权利要求8所述语义识别系统，其中，所述第一卷积神经网络单元进一步用于：

将每个句子按照最小语义单元进行切分，将所述切分得到的最小语义单元按照顺序输入设置的第一卷积神经网络，得到每个句子的文本信息。
根据权利要求9所述的语义识别系统，其中，所述第一卷积神经网络单元进一步包括：组合单元和文本信息获取单元，所述文本信息获取单元包含不同大小的卷积核；

所述组合单元，用于将按照顺序输入的最小语义单元，分别采用设置的不同单元长度值进行组合，得到具有不同单元长度值的最小语义单元组合；

所述文本信息获取单元，用于将得到的不同单元长度值的最小语义单元组合分别输入到不同的卷积核中处理，将从不同卷积核输出的文本信息向量进行拼接，得到每个句子的文本信息。
根据权利要求10所述的语义识别系统，其中，所述组合单元进一步用于：

按照所述最小语义单元的输入顺序进行每两个相邻最小语义单元组合，得到单元长度值为2的最小语义单元组合；

按照所述最小语义单元的输入顺序进行每三个相邻最小语义单元组合，得到单元长度值为3的最小语义单元组合；

按照所述最小语义单元的输入顺序进行每四个相邻最小语义单元组合，得到单元长度值为4的最小语义单元组合；

所述文本信息获取单元进一步用于：

将单元长度值为2的最小语义单元组合输入到第一卷积核处理；

将单元长度值为3的最小语义单元组合输入到第二卷积核处理；

将单元长度为4的最小语义单元组合输入到第三卷积核处理。
根据权利要求8所述的语义识别系统，其中，所述第二神经网络单元进一步包括：

第一子神经网络单元，用于将所述长文本的文本信息向量中的向量元素从左至右读取并进行处理，得到代表每个句子文本信息之间的从左至右的逻辑关系的向量；

第二子神经网络单元，用于将所述长文本的文本信息向量中的向量元素从右至左读取并进行处理，得到代表每个句子文本信息之间的从右至左的逻辑关系的向量；

向量获取单元，将得到代表每个句子文本信息之间的从左至右的逻辑关系的向量，及得到代表每个句子文本信息之间的从右至左的逻辑关系的向量进行拼接，得到代表每个句子文本信息之间的逻辑关系的向量。
根据权利要求12所述的语义识别系统，其中，所述第二神经网络为双向长短记忆网络BiLSTM或门控循环单元GRU；

所述第一子神经网络单元为BiLSTM或GRU；

所述第二子神经网络单元为BiLSTM或GRU。
根据权利要求8所述的语义识别系统，其中，所述分类单元进一步用于，采用设置的分类方式，将所述向量映射至符合的意图标签中，识别得到所述长文本的语义。
一种语义识别的装置，包括：

存储器；以及耦接至所述存储器的处理器，所述处理器被配置为基于存储在所述存储器中的指令，执行如权利要求1-7中任一项所述的语义识别的方法。
一种计算机可读存储介质，其上存储有计算机程序，该程序被处理器执行时实现权利要求1-7中任一项所述的语义识别的方法。