CN109189882A - 序列内容的回答类型识别方法、装置、服务器和存储介质 - Google Patents
序列内容的回答类型识别方法、装置、服务器和存储介质 Download PDFInfo
- Publication number
- CN109189882A CN109189882A CN201810897819.0A CN201810897819A CN109189882A CN 109189882 A CN109189882 A CN 109189882A CN 201810897819 A CN201810897819 A CN 201810897819A CN 109189882 A CN109189882 A CN 109189882A
- Authority
- CN
- China
- Prior art keywords
- answer type
- speech
- vector
- question
- sequence content
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明实施例公开了一种序列内容的回答类型识别方法、装置、服务器和存储介质。该方法包括:依据序列内容中包括的各实体确定序列内容的实体向量表示和/或依据序列内容中包括的各词语的词性确定序列内容的词性向量表示;采用预设的问答类型识别模型依据所述实体向量表示和/或词性向量表示,确定序列内容的回答类型。本发明实施例实现了对用户提供的序列内容的回答类型进行有效的确定,提高了回答类型确定的准确度和通用性,从而进一步提高了后期答案的检索效率和准确度。
Description
技术领域
本发明实施例涉及信息技术领域,尤其涉及一种序列内容的回答类型识别方法、装置、服务器和存储介质。
背景技术
随着信息技术的快速发展,问答系统作为信息检索系统的一种高级形式,已逐步应用于人工智能领域中的各个方面。其涉及问题解析、段落检索和答案定位等多个环节。在问题解析中,关键在于问题对应答案的准召回率。
现有技术当接收到用户提出的问题时,针对问题语句中的关键词,依据词袋模型或现有资源库,从海量的信息中进行相关的检索。或者在特定的领域中,从相关的数据量较小的资源库中,同样依据词袋模型以及传统的分类模型,来确定问题语句的回答类型,以进行后续的检索。
然而,随着信息储备或资源库中信息量的快速增大,现有技术对于完整信息量的检索工作,增加了问题对应答案的获取时间,使得答案检索的效率和准确度大大降低。且即使是能够确定问题语句的回答类型并缩减检索范围,但由于现有技术仅能够使用在特定领域中,对于特定领域内数据的针对性较强,一般数据经过处理较为规整,结构较为单一,通用性较差,且难以正确识别较为复杂的问题。
发明内容
本发明实施例提供了一种序列内容的回答类型识别方法、装置、服务器和存储介质,能够确定用户提供的序列内容的回答类型,提高答案的检索效率和准确度。
第一方面,本发明实施例提供了一种序列内容的回答类型识别方法,包括:
依据序列内容中包括的各实体确定序列内容的实体向量表示和/或依据序列内容中包括的各词语的词性确定序列内容的词性向量表示;
采用预设的问答类型识别模型依据所述实体向量表示和/或词性向量表示,确定序列内容的回答类型。
第二方面,本发明实施例提供了一种序列内容的回答类型识别装置,包括:
向量表示确定模块,用于依据序列内容中包括的各实体确定序列内容的实体向量表示和/或依据序列内容中包括的各词语的词性确定序列内容的词性向量表示;
回答类型确定模块,用于采用预设的问答类型识别模型依据所述实体向量表示和/或词性向量表示,确定序列内容的回答类型。
第三方面,本发明实施例提供了一种服务器,包括:
一个或多个处理器;
存储器,用于存储一个或多个程序;
当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现本发明任意实施例所述的序列内容的回答类型识别方法。
第四方面,本发明实施例提供了一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现本发明任意实施例所述的序列内容的回答类型识别方法。
本发明实施例通过对用户提供的序列内容进行实体向量表示和/或词性向量表示的确定,利用预设的问答类型识别模型,通过对实体向量表示和/或词性向量表示的识别来确定序列内容的回答类型。本发明实施例实现了对用户提供的序列内容的回答类型进行有效的确定,提高了回答类型确定的准确度和通用性,从而进一步提高了后期答案的检索效率和准确度。
附图说明
图1为本发明实施例一提供的一种序列内容的回答类型识别方法的流程图;
图2为本发明实施例二提供的一种序列内容的回答类型识别方法的流程图;
图3为本发明实施例二提供的回答类型识别模型架构的示例图;
图4为本发明实施例三提供的一种序列内容的回答类型识别装置的结构示意图;
图5为本发明实施例四提供的一种服务器的结构示意图。
具体实施方式
下面结合附图和实施例对本发明实施例作进一步的详细说明。可以理解的是,此处所描述的具体实施例仅仅用于解释本发明实施例,而非对本发明的限定。另外还需要说明的是,为了便于描述,附图中仅示出了与本发明实施例相关的部分而非全部结构。
实施例一
图1为本发明实施例一提供的一种序列内容的回答类型识别方法的流程图,本实施例可适用于对用户提供的序列内容进行检索的情况,该方法可由一种序列内容的回答类型识别装置来执行。该方法具体包括如下步骤:
S110、依据序列内容中包括的各实体确定序列内容的实体向量表示和/或依据序列内容中包括的各词语的词性确定序列内容的词性向量表示。
在本发明具体实施例中,序列内容是指用户采用问答系统或搜索引擎进行知识的获取时,输入的包含多个词语的语句内容。序列内容可以为问答类型的问答语句,也可以为非问答类型的语句内容。此外序列内容可以为完成的句子结构,也可以为多个独立的词汇组成的序列结构。具体的,用户点击交互界面中的输入框,即可完成序列内容的任意输入。
本实施例在获取到用户输入的序列内容时,首先对序列内容进行分词处理。分词是指将连续的句子或文本按照一定的规则分成一个一个独立的词语,以重新组合成词序列的过程。本实施例可以依据分词词典对序列内容进行分词和实体词识别,以获取序列内容的实体向量表示;或者依据序列内容中包括的各词语的词性获取序列内容的词性向量表示。
具体的,实体是指能够独立存在的并能够作为一切属性的基础和万物本原的真实存在的物质或概念,通常可以指代具体的事物、主体和现象的支持者等,例如人名、物名、地名、机构名以及概念等。因此为了表达用户输入语句的主体,序列内容中通常包含至少一个实体。随着信息化时代的快速发展,各种各样的词汇逐渐踊跃而出,因此现实环境中大量实体和及其之间的关系存在多源异构特点,其在不同知识库中的可能存在含义相同但名称不同的现象,进而现有技术中对于不同领域的序列内容需要采用对应的分词算法和分词词典进行分词处理。本实施例可以采用基于知识图谱的分词工具对序列内容进行分词处理。其中,知识图谱是一种几乎涵盖所有领域知识的基于图的数据结构,对多种知识信息进行有机融合,其结点代表实体或者概念,边代表实体/概念之间的各种语义关系,在搜索引擎中通过使用知识图谱,能够更好地查询复杂的关联信息,从语义层面理解用户意图,改进问答系统或搜索引擎的搜索质量。
此外,词性是以语法特征(包括句法功能和形态变化)为主要依据,兼顾词汇意义对词进行划分的结果。现代汉语将词汇分类为14种词性,一类是实词,包括名词、动词、形容词、区别词、代词、数词和量词;另一类是虚词,包括副词、介词、连词、助词、语气词、拟声词和叹词;且英文中也有对应的词性划分,本实施例不再赘述。因此,为了表达输入语句中各词语之间的关系,序列内容中通常结合多种词性的词语对实体关系进行描述。因此,本实施例还可以通过对分词结果中各分词词汇进行词性识别,以获得序列内容的词性向量表示。
需要说明的是,上述两种分词方式可以独立进行,也可也结合使用。本实施例为了提高针对序列内容的回答类型确认的准确度,优选结合采用上述两种方式,以同步获取序列内容的实体向量表示和词性向量表示。
示例性的,假设用户输入的序列内容为“清朝的统治时间是多久”。相应的,通过基于知识图谱的分词工具,首先可以划分得到分词包括:{“清朝”,“的”,“统治”,“时间”,“是”,“多久”},进而可以识别该序列内容中的实体包括“清朝”、“统治”和“时间”,其中假设根据知识图谱中各词语之间的关系,可以确定“清朝”一词与“清代”一词是同义词的关系,因此可以扩展得到该序列内容的实体向量表示为{“清朝”,“清代”,“统治”,“时间”}。同时,判断词语“清朝”和“时间”为名词,词语“统治”为动词,词语“的”为代词,词语“是”为副词,词语“多久”为疑问副词,进而依据该序列内容中各分词的词性,可以确定该序列内容的词性向量表示为{“清朝”:名词,“的”:代词,“统治”:动词,“时间”:名词,“是”:副词,“多久”:疑问副词}。
值得注意的是,上述示例仅是对本实施例举例性的说明,而不限定向量表示的具体表现形式。
S120、采用预设的问答类型识别模型依据实体向量表示和/或词性向量表示,确定序列内容的回答类型。
在本发明具体实施例中,问答类型识别模型是指以确定的实体向量表示和/或词性向量表示为输入,通过对实体向量表示和/或词性向量表示的识别和分类,以序列内容的回答类型为输出的模型。其可以是通过机器学习或神经网络等多种方式训练得到。其中,回答类型是指对序列内容的搜索结果经模型识别所提前确定的所属类型,对于非问答型的序列内容可以通过模型确定其为非问答型,对于问答型的序列内容可以通过模型确定其回答的具体所属类型,从而缩小针对序列内容的搜索范围,提高搜索效率或准确度。进而,在识别序列内容的回答类型之前,可以先对可识别的问答类型进行确定。
具体的,获取不同领域的词语;依据获取的词语语义和浏览量,对各词语所属的类型进行归纳得到候选的各问答类型。为了提高本实施例的通用性,本实施例首先获取不同领域的词语,尽可能的覆盖所有情况。其次依据获取的词语语义对获取到的词语进行初步的分类,并通过人类主观定义对相似的类别进行合并,以缩减可识别的问答类型数量,获得初步回答类型确定结果。最终依据词语的页面浏览量(page view,pv)以及初步回答类型本身的类别相似度,对pv较低和/或类别相似度较高的初步回答类型进行合并且归纳为更大的类别分类,从而进一步缩减初步回答类型的类型数量,获得便于分类且冗余信息较少的最终的获选问答类型。同时将非问答型添加进候选回答类型,这样既能够覆盖几乎所有的常见回答类型,也能够利于模型的训练和分类。本实施例在候选回答类型的基础上,对分类模型进行训练,从而获取可以对实体向量表示进行识别的实体问答类型模型以及词性问答类型模型。
示例性的,依据人类主观定义,将类别“河流”、“母亲河”、“上游”以及“支流”等都可以归纳为“河流”,通过上述步骤可以获得类别数量大幅度缩减后的初步回答类型,假设包括500种,但仍然存在冗余类别。进而获取上述归纳的500种中各类别词语对应的pv,假设“河流”类别的pv较低,意味着单独将其作为一个类型导致分类过于详细,存在尾大不掉不利于搜索的现象。因此可以将“河流”、“山峰”、“湖泊”、“海洋”、“岛屿”以及“景点”等较为详细的类别都定义为一个大类别,如命名为“景点景观”,从而将最终的候选类别确定为适合搜索的数量如50种。并将非问答型添加进候选回答类型,得到51种候选回答类型。
本实施例在通过模型进行分类时,实体问答类型模型是预先基于双向循环神经网络构建的,将实体向量表示作为预设的实体问答类型模型的输入,得到序列内容的实体回答类型。具体的,使用基于知识图谱分词而来的实体向量表示作为实体问答类型模型的输入,经过神经网络的嵌入层embedding得到向量表示的转换,然后通过三层长短期记忆模型(Long Short-Term Memory,LSTM),接入最大池化层maxpooling,最终接入全连通层fc得到序列内容的实体回答类型。其中,LSTM是一种特殊的循环神经网络(Recurrent NeuralNetwork,RNN),是为了解决RNN模型梯度弥散的问题而提出的;能够压缩输入向量表示并预测输出。其第一层和第三层LSTM是正向的,第二层LSTM是逆向的。通过双向RNN模型中的前向循环神经网络预测下一个词,反向循环神经网络预测前一个词,并依据预测结果调整该双向RNN模型中的前向循环神经网络的隐藏层参数和反向循环神经网络的隐藏层参数。
本实施例在通过模型进行分类时,词性问答类型模型是基于循环神经网络和卷积神经网络构建的,将词性向量表示作为预设的词性问答类型模型的输入,得到序列内容的词性回答类型。具体的,经过神经网络的嵌入层embedding得到向量表示的转换,其中词性向量表示可以采用独热码(one-hot encoding)表示法将一个词表示为一个很长的向量,其维数是词汇表大小,其中绝大多数元素为0,只有一个维度的值为1,这个维度就代表当前的词。然后依次通过词性问答类型模型中的正向循环神经网络层和第一全连通层对该词性向量表示进行处理得到第一全连通向量;依次通过词性问答类型模型中的负向循环神经网络层和第二全连通层对该词性向量表示进行处理得到第二全连通向量;通过词性问答类型模型中的第三全连通层对该词性向量表示进行处理得到第三全连通向量;最终将第一全连通向量、第二全连通向量和第三全连通向量作为词性问答类型模型中的卷积神经网络层的输入,得到序列内容的词性回答类型。
本实施例若同时采用上述两种模型进行回答类型的分类,最终可以将上述两个输出的结果进行拼接,并接入softmax多类分类器,获得最终回答类型的输出。此外,本实施例还可以对问答识别模型输出的分类结果进行轻微纠正,对于序列内容中只包含一个词语,或者只包含专有名词,或者标点符号数量占比大于预设的符号比例阈值,诸如这种简单的句式结构,则可以直接将序列内容确定为非问答类型,通过进一步纠正提高识别准确率。其中,可以通过对正常文本的识别和学习,从而确定符合正常文本布局的标点符号数量占比来预先确定符号比例阈值。
示例性的,在上述示例中,通过对序列内容“清朝的通统治时间是多久”的实体向量表示输入实体问答类型模型,将词性向量表示输入词性问答类型模型,经过模型的识别和分类,最终可以获得的回答类型为“时长”。进而便于系统根据回答类型进行时间长度类的搜索,并排除非问答类型以及长文本答案的搜索结果,以缩减搜索范围提供搜索效率。假设用户输入序列内容为“明星A好漂亮”,同样依据模型可以确定该序列内容为非问答类型。
在确定序列内容的回答类型之后,本实施例还可以依据回答类型来判断某个实体是否具有某些属性。具体的,若序列内容中包括目标实体和目标实体的至少一个候选属性词,且序列内容的回答类型是非问答型,则确定目标实体不具备至少一个候选属性。
本实施例的技术方案,通过对用户提供的序列内容进行实体向量表示和/或词性向量表示的确定,利用预设的问答类型识别模型,通过对实体向量表示和/或词性向量表示的识别来确定序列内容的回答类型。本发明实施例实现了对用户提供的序列内容的回答类型进行有效的确定,提高了回答类型确定的准确度和通用性,从而进一步提高了后期答案的检索效率和准确度。
实施例二
本实施例在上述实施例一的基础上,提供了序列内容的回答类型识别方法的一个优选实施方式,能够利用神经网络模型依据序列内容的实体和词性向量表示对回答类型进行识别。图2为本发明实施例二提供的一种序列内容的回答类型识别方法的流程图,如图2所示,该方法包括以下具体步骤:
S210、依据序列内容中包括的各实体确定序列内容的实体向量表示和依据序列内容中包括的各词语的词性确定序列内容的词性向量表示。
在本发明具体实施例中,可以采用基于知识图谱的分词工具对序列内容进行分词处理,获得序列内容的实体向量表示。还可以通过对分词结果中各分词词汇进行词性识别,以获得序列内容的词性向量表示。上述两种分词方式可以独立进行,也可也结合使用。本实施例为了提高针对序列内容的回答类型确认的准确度,优选结合采用上述两种方式,以同步获取序列内容的实体向量表示和词性向量表示。
S220、将实体向量表示作为预设的实体问答类型模型的输入,得到序列内容的实体回答类型。
在本发明具体实施例中,实体问答类型模型是预先基于双向循环神经网络构建的。具体的,使用基于知识图谱分词而来的实体向量表示作为实体问答类型模型的输入,经过神经网络的嵌入层embedding得到向量表示的转换,然后通过三层长短期记忆模型(LongShort-Term Memory,LSTM),接入最大池化层maxpooling,最终接入全连通层fc得到序列内容的实体回答类型。其中,LSTM的第一层和第三层LSTM是正向的,第二层LSTM是逆向的。通过双向RNN模型中的前向循环神经网络预测下一个词,反向循环神经网络预测前一个词,并依据预测结果调整该双向RNN模型中的前向循环神经网络的隐藏层参数和反向循环神经网络的隐藏层参数。
S230、将词性向量表示作为预设的词性问答类型模型的输入,得到序列内容的词性回答类型。
在本发明具体实施例中,词性问答类型模型是基于循环神经网络和卷积神经网络构建的。其中,词性问答类型模型在嵌入层embedding之后分为三条并列的处理路径,使得经嵌入层embedding转换后的词性向量表示分别经过正向LSTM及全连通层、逆向LSTM及全连通层以及单独的全连通层,最终将三个结果依次输入卷积神经网络、最大池化层和全连通层,获得序列内容的词性回答类型。具体的,依次通过词性问答类型模型中的正向循环神经网络层和第一全连通层述词性向量表示进行处理得到第一全连通向量;依次通过词性问答类型模型中的负向循环神经网络层和第二全连通层对词性向量表示进行处理得到第二全连通向量;通过词性问答类型模型中的第三全连通层对词性向量表示进行处理得到第三全连通向量;将第一全连通向量、第二全连通向量和第三全连通向量作为词性问答类型模型中的卷积神经网络层的输入,得到序列内容的词性回答类型。
需要说明的是,为了提高回答类型的识别效率和准确度,上述两个识别过程可以是同时并行进行,本实施例不对实体回答类型的识别过程以及词性回答类型的识别过程的执行顺序进行限定。
S240、将拼接后的实体回答类型和词性回答类型输入至分类器中,以获取最终回答类型的输出,并进行轻微纠正。
在本发明具体实施例中,为了提高回答类型的识别准确度,最终可以将上述两个输出的结果进行拼接,输入softmax多类分类器,获得最终回答类型的输出,并进行轻微纠正。本实施例中整体的回答类型识别模型架构的示例图如图3所示。
S250、若序列内容中包括目标实体和目标实体的至少一个候选属性词,且序列内容的回答类型是非问答型,则确定目标实体不具备该至少一个候选属性。
在本发明具体实施例中,在确定序列内容的回答类型之后,本实施例还可以依据回答类型来判断某个实体是否具有某些属性。可以理解的是,若待判断的目标实体不具备某一候选属性词,则该目标实体与该候选属性词的结合不能构成一个能够提出问题的问题语句。因此,若序列内容中包括目标实体和目标实体的至少一个候选属性词,且经过问答类型识别模型确定该序列内容的回答类型是非问答型,则可以确定目标实体不具备该候选属性。
示例性的,假设实体A存在属性a、b和c,实体B存在属性d、e和f。若希望判断实体A是否存在属性d、e和f,则可以直接将实体A以及属性d、e和f进行拼接,作为序列内容进行回答类型识别。若识别结果为非问答类,则可以基本确定A不存在属性d、e和f。
本实施例的技术方案,通过对用户提供的序列内容进行基于知识图谱的实体向量表示的确定以及基于词语词性的词性向量表示的确定,利用预设的基于双向循环神经网络的实体问答类型模型对实体向量表示进行实体回答类型的识别,利用预设的基于循环神经网络和卷积神经网络的词性问答类型模型对词性向量表示进行词性回答类型的识别,最终通过分类器对实体回答类型和词性回答类型进行分类,从而确定最终的回答类型;同时还可以依据回答类型确定实体的具体属性。本发明实施例通过基于知识图谱的实体向量表示的确定以及候选问答类型的确定,提高了问答类型识别模型的通用性;同时基于整体的回答类型识别模型架构,综合实体回答类型和词性回答类型,实现了对用户提供的序列内容的回答类型进行有效的确定,提高了回答类型确定的准确度和通用性,从而进一步提高了后期答案的检索效率和准确度。
实施例三
图4为本发明实施例三提供的一种序列内容的回答类型识别装置的结构示意图,本实施例可适用于对用户提供的序列内容进行检索的情况,该装置可实现本发明任意实施例所述的序列内容的回答类型识别方法。该装置具体包括:
向量表示确定模块410,用于依据序列内容中包括的各实体确定序列内容的实体向量表示和/或依据序列内容中包括的各词语的词性确定序列内容的词性向量表示;
回答类型确定模块420,用于采用预设的问答类型识别模型依据所述实体向量表示和/或词性向量表示,确定序列内容的回答类型。
可选的,所述回答类型确定模块420,包括:
实体回答类型确定单元4201,用于将所述实体向量表示作为预设的实体问答类型模型的输入,得到序列内容的实体回答类型;其中,所述实体问答类型模型是预先基于双向循环神经网络和知识图谱构建的。
可选的,所述回答类型确定模块420,包括:
词性回答类型确定单元4202,用于将所述词性向量表示作为预设的词性问答类型模型的输入,得到序列内容的词性回答类型;其中,所述词性问答类型模型是基于循环神经网络和卷积神经网络构建的。
可选的,所述词性回答类型确定单元4202具体用于:
依次通过词性问答类型模型中的正向循环神经网络层和第一全连通层对所述词性向量表示进行处理得到第一全连通向量;
依次通过词性问答类型模型中的负向循环神经网络层和第二全连通层对所述词性向量表示进行处理得到第二全连通向量;
通过词性问答类型模型中的第三全连通层对所述词性向量表示进行处理得到第三全连通向量;
将所述第一全连通向量、所述第二全连通向量和所述第三全连通向量作为词性问答类型模型中的卷积神经网络层的输入,得到序列内容的词性回答类型。
进一步的,所述装置还包括问答类型归纳模块430;所述问答类型归纳模块430包括:
词语获取单元4301,用于在所述采用预设的问答类型识别模型依据所述实体向量表示和/或词性向量表示,确定序列内容的回答类型之前,获取不同领域的词语;
问答类型归纳单元4302,用于依据获取的词语语义和浏览量,对各词语所属的类型进行归纳得到候选的各问答类型。
进一步的,述装置还包括:
属性确认模块440,用于在所述采用预设的问答类型识别模型依据所述实体向量表示和/或词性向量表示,确定序列内容的回答类型之后,若所述序列内容中包括目标实体和目标实体的至少一个候选属性词,且所述序列内容的回答类型是非问答型,则确定所述目标实体不具备所述至少一个候选属性。
本实施例的技术方案,通过各个功能模块之间的相互配合,实现了各领域词语的获取、候选回答类型的确定、基于神经网络的问答识别模型的训练、序列内容的分词、实体向量表示的确定、词性向量表示的确定、回答类型的识别以及输出结果的纠正等功能。本发明实施例实现了对用户提供的序列内容的回答类型进行有效的确定,提高了回答类型确定的准确度和通用性,从而进一步提高了后期答案的检索效率和准确度。
实施例四
图5为本发明实施例四提供的一种服务器的结构示意图,图5示出了适于用来实现本发明实施例实施方式的示例性服务器的框图。图5显示的服务器仅仅是一个示例,不应对本发明实施例的功能和使用范围带来任何限制。
图5显示的服务器12仅仅是一个示例,不应对本发明实施例的功能和使用范围带来任何限制。
如图5所示,服务器12以通用计算设备的形式表现。服务器12的组件可以包括但不限于:一个或者多个处理器16,系统存储器28,连接不同系统组件(包括系统存储器28和处理器16)的总线18。
总线18表示几类总线结构中的一种或多种,包括存储器总线或者存储器控制器,外围总线,图形加速端口,处理器或者使用多种总线结构中的任意总线结构的局域总线。举例来说,这些体系结构包括但不限于工业标准体系结构(ISA)总线,微通道体系结构(MAC)总线,增强型ISA总线、视频电子标准协会(VESA)局域总线以及外围组件互连(PCI)总线。
服务器12典型地包括多种计算机系统可读介质。这些介质可以是任何能够被服务器12访问的可用介质,包括易失性和非易失性介质,可移动的和不可移动的介质。
系统存储器28可以包括易失性存储器形式的计算机系统可读介质,例如随机存取存储器(RAM)30和/或高速缓存存储器32。服务器12可以进一步包括其它可移动/不可移动的、易失性/非易失性计算机系统存储介质。仅作为举例,存储系统34可以用于读写不可移动的、非易失性磁介质(图5未显示,通常称为“硬盘驱动器”)。尽管图5中未示出,可以提供用于对可移动非易失性磁盘(例如“软盘”)读写的磁盘驱动器,以及对可移动非易失性光盘(例如CD-ROM,DVD-ROM或者其它光介质)读写的光盘驱动器。在这些情况下,每个驱动器可以通过一个或者多个数据介质接口与总线18相连。系统存储器28可以包括至少一个程序产品,该程序产品具有一组(例如至少一个)程序模块,这些程序模块被配置以执行本发明实施例各实施例的功能。
具有一组(至少一个)程序模块42的程序/实用工具40,可以存储在例如系统存储器28中,这样的程序模块42包括但不限于操作系统、一个或者多个应用程序、其它程序模块以及程序数据,这些示例中的每一个或某种组合中可能包括网络环境的实现。程序模块42通常执行本发明实施例所描述的实施例中的功能和/或方法。
服务器12也可以与一个或多个外部设备14(例如键盘、指向设备、显示器24等)通信,还可与一个或者多个使得用户能与该服务器12交互的设备通信,和/或与使得该服务器12能与一个或多个其它计算设备进行通信的任何设备(例如网卡,调制解调器等等)通信。这种通信可以通过输入/输出(I/O)接口22进行。并且,服务器12还可以通过网络适配器20与一个或者多个网络(例如局域网(LAN),广域网(WAN)和/或公共网络,例如因特网)通信。如图所示,网络适配器20通过总线18与服务器12的其它模块通信。应当明白,尽管图中未示出,可以结合服务器12使用其它硬件和/或软件模块,包括但不限于:微代码、设备驱动器、冗余处理器、外部磁盘驱动阵列、RAID系统、磁带驱动器以及数据备份存储系统等。
处理器16通过运行存储在系统存储器28中的程序,从而执行各种功能应用以及数据处理,例如实现本发明实施例所提供的序列内容的回答类型识别方法。
实施例五
本发明实施例五还提供一种计算机可读存储介质,其上存储有计算机程序(或称为计算机可执行指令),该程序被处理器执行时用于执行一种序列内容的回答类型识别方法,该方法包括:
依据序列内容中包括的各实体确定序列内容的实体向量表示和/或依据序列内容中包括的各词语的词性确定序列内容的词性向量表示;
采用预设的问答类型识别模型依据所述实体向量表示和/或词性向量表示,确定序列内容的回答类型。
本发明实施例的计算机存储介质,可以采用一个或多个计算机可读的介质的任意组合。计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质。计算机可读存储介质例如可以是——但不限于——电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。计算机可读存储介质的更具体的例子(非穷举的列表)包括:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑磁盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本文件中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。
计算机可读的信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读的信号介质还可以是计算机可读存储介质以外的任何计算机可读介质,该计算机可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。
计算机可读介质上包含的程序代码可以用任何适当的介质传输,包括——但不限于无线、电线、光缆、RF等等,或者上述的任意合适的组合。
可以以一种或多种程序设计语言或其组合来编写用于执行本发明实施例操作的计算机程序代码,所述程序设计语言包括面向对象的程序设计语言—诸如Java、Smalltalk、C++,还包括常规的过程式程序设计语言—诸如”C”语言或类似的程序设计语言。程序代码可以完全地在用户计算机上执行、部分地在用户计算机上执行、作为一个独立的软件包执行、部分在用户计算机上部分在远程计算机上执行、或者完全在远程计算机或服务器上执行。在涉及远程计算机的情形中,远程计算机可以通过任意种类的网络——包括局域网(LAN)或广域网(WAN)—连接到用户计算机,或者,可以连接到外部计算机(例如利用因特网服务提供商来通过因特网连接)。
注意,上述仅为本发明的较佳实施例及所运用技术原理。本领域技术人员会理解,本发明不限于这里所述的特定实施例,对本领域技术人员来说能够进行各种明显的变化、重新调整和替代而不会脱离本发明的保护范围。因此,虽然通过以上实施例对本发明实施例进行了较为详细的说明,但是本发明实施例不仅仅限于以上实施例,在不脱离本发明构思的情况下,还可以包括更多其他等效实施例,而本发明的范围由所附的权利要求范围决定。
Claims (14)
1.一种序列内容的回答类型识别方法,其特征在于,包括:
依据序列内容中包括的各实体确定序列内容的实体向量表示和/或依据序列内容中包括的各词语的词性确定序列内容的词性向量表示;
采用预设的问答类型识别模型依据所述实体向量表示和/或词性向量表示,确定序列内容的回答类型。
2.根据权利要求1所述的方法,其特征在于,所述采用预设的问答类型识别模型依据所述实体向量表示和/或词性向量表示,确定序列内容的回答类型,包括:
将所述实体向量表示作为预设的实体问答类型模型的输入,得到序列内容的实体回答类型;其中,所述实体问答类型模型是预先基于双向循环神经网络构建的。
3.根据权利要求1所述的方法,其特征在于,所述采用预设的问答类型识别模型依据所述实体向量表示和/或词性向量表示,确定序列内容的回答类型,包括:
将所述词性向量表示作为预设的词性问答类型模型的输入,得到序列内容的词性回答类型;其中,所述词性问答类型模型是基于循环神经网络和卷积神经网络构建的。
4.根据权利要求3所述的方法,其特征在于,所述将所述词性向量表示作为预设的词性问答类型模型的输入,得到序列内容的词性回答类型,包括:
依次通过词性问答类型模型中的正向循环神经网络层和第一全连通层对所述词性向量表示进行处理得到第一全连通向量;
依次通过词性问答类型模型中的负向循环神经网络层和第二全连通层对所述词性向量表示进行处理得到第二全连通向量;
通过词性问答类型模型中的第三全连通层对所述词性向量表示进行处理得到第三全连通向量;
将所述第一全连通向量、所述第二全连通向量和所述第三全连通向量作为词性问答类型模型中的卷积神经网络层的输入,得到序列内容的词性回答类型。
5.根据权利要求1所述的方法,其特征在于,在所述采用预设的问答类型识别模型依据所述实体向量表示和/或词性向量表示,确定序列内容的回答类型之前,还包括:
获取不同领域的词语;
依据获取的词语语义和浏览量,对各词语所属的类型进行归纳得到候选的各问答类型。
6.根据权利要求1所述的方法,其特征在于,在所述采用预设的问答类型识别模型依据所述实体向量表示和/或词性向量表示,确定序列内容的回答类型之后,还包括:
若所述序列内容中包括目标实体和目标实体的至少一个候选属性词,且所述序列内容的回答类型是非问答型,则确定所述目标实体不具备所述至少一个候选属性。
7.一种序列内容的回答类型识别装置,其特征在于,包括:
向量表示确定模块,用于依据序列内容中包括的各实体确定序列内容的实体向量表示和/或依据序列内容中包括的各词语的词性确定序列内容的词性向量表示;
回答类型确定模块,用于采用预设的问答类型识别模型依据所述实体向量表示和/或词性向量表示,确定序列内容的回答类型。
8.根据权利要求7所述的装置,其特征在于,所述回答类型确定模块,包括:
实体回答类型确定单元,用于将所述实体向量表示作为预设的实体问答类型模型的输入,得到序列内容的实体回答类型;其中,所述实体问答类型模型是预先基于双向循环神经网络和知识图谱构建的。
9.根据权利要求7所述的装置,其特征在于,所述回答类型确定模块,包括:
词性回答类型确定单元,用于将所述词性向量表示作为预设的词性问答类型模型的输入,得到序列内容的词性回答类型;其中,所述词性问答类型模型是基于循环神经网络和卷积神经网络构建的。
10.根据权利要求9所述的装置,其特征在于,所述词性回答类型确定单元具体用于:
依次通过词性问答类型模型中的正向循环神经网络层和第一全连通层对所述词性向量表示进行处理得到第一全连通向量;
依次通过词性问答类型模型中的负向循环神经网络层和第二全连通层对所述词性向量表示进行处理得到第二全连通向量;
通过词性问答类型模型中的第三全连通层对所述词性向量表示进行处理得到第三全连通向量;
将所述第一全连通向量、所述第二全连通向量和所述第三全连通向量作为词性问答类型模型中的卷积神经网络层的输入,得到序列内容的词性回答类型。
11.根据权利要求7所述的装置,其特征在于,所述装置还包括问答类型归纳模块;所述问答类型归纳模块包括:
词语获取单元,用于在所述采用预设的问答类型识别模型依据所述实体向量表示和/或词性向量表示,确定序列内容的回答类型之前,获取不同领域的词语;
问答类型归纳单元,用于依据获取的词语语义和浏览量,对各词语所属的类型进行归纳得到候选的各问答类型。
12.根据权利要求7所述的装置,其特征在于,所述装置还包括:
属性确认模块,用于在所述采用预设的问答类型识别模型依据所述实体向量表示和/或词性向量表示,确定序列内容的回答类型之后,若所述序列内容中包括目标实体和目标实体的至少一个候选属性词,且所述序列内容的回答类型是非问答型,则确定所述目标实体不具备所述至少一个候选属性。
13.一种服务器,其特征在于,包括:
一个或多个处理器;
存储器,用于存储一个或多个程序;
当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如权利要求1至6中任一项所述的序列内容的回答类型识别方法。
14.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现如权利要求1至6中任一项所述的序列内容的回答类型识别方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810897819.0A CN109189882A (zh) | 2018-08-08 | 2018-08-08 | 序列内容的回答类型识别方法、装置、服务器和存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810897819.0A CN109189882A (zh) | 2018-08-08 | 2018-08-08 | 序列内容的回答类型识别方法、装置、服务器和存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN109189882A true CN109189882A (zh) | 2019-01-11 |
Family
ID=64920664
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201810897819.0A Pending CN109189882A (zh) | 2018-08-08 | 2018-08-08 | 序列内容的回答类型识别方法、装置、服务器和存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN109189882A (zh) |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110287284A (zh) * | 2019-05-23 | 2019-09-27 | 北京百度网讯科技有限公司 | 语义匹配方法、装置及设备 |
CN110795569A (zh) * | 2019-10-08 | 2020-02-14 | 北京百度网讯科技有限公司 | 知识图谱的向量表示生成方法、装置及设备 |
CN111241285A (zh) * | 2020-01-15 | 2020-06-05 | 北京百度网讯科技有限公司 | 问题回答类型的识别方法、装置、设备及存储介质 |
CN113157890A (zh) * | 2021-04-25 | 2021-07-23 | 深圳壹账通智能科技有限公司 | 智能问答方法、装置、电子设备及可读存储介质 |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105786798A (zh) * | 2016-02-25 | 2016-07-20 | 上海交通大学 | 一种人机交互中自然语言意图理解方法 |
US20170177715A1 (en) * | 2015-12-21 | 2017-06-22 | Adobe Systems Incorporated | Natural Language System Question Classifier, Semantic Representations, and Logical Form Templates |
CN107562792A (zh) * | 2017-07-31 | 2018-01-09 | 同济大学 | 一种基于深度学习的问答匹配方法 |
CN107977361A (zh) * | 2017-12-06 | 2018-05-01 | 哈尔滨工业大学深圳研究生院 | 基于深度语义信息表示的中文临床医疗实体识别方法 |
CN108287817A (zh) * | 2017-05-08 | 2018-07-17 | 腾讯科技(深圳)有限公司 | 一种信息处理方法及设备 |
CN108334499A (zh) * | 2018-02-08 | 2018-07-27 | 海南云江科技有限公司 | 一种文本标签标注设备、方法和计算设备 |
-
2018
- 2018-08-08 CN CN201810897819.0A patent/CN109189882A/zh active Pending
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20170177715A1 (en) * | 2015-12-21 | 2017-06-22 | Adobe Systems Incorporated | Natural Language System Question Classifier, Semantic Representations, and Logical Form Templates |
CN105786798A (zh) * | 2016-02-25 | 2016-07-20 | 上海交通大学 | 一种人机交互中自然语言意图理解方法 |
CN108287817A (zh) * | 2017-05-08 | 2018-07-17 | 腾讯科技(深圳)有限公司 | 一种信息处理方法及设备 |
CN107562792A (zh) * | 2017-07-31 | 2018-01-09 | 同济大学 | 一种基于深度学习的问答匹配方法 |
CN107977361A (zh) * | 2017-12-06 | 2018-05-01 | 哈尔滨工业大学深圳研究生院 | 基于深度语义信息表示的中文临床医疗实体识别方法 |
CN108334499A (zh) * | 2018-02-08 | 2018-07-27 | 海南云江科技有限公司 | 一种文本标签标注设备、方法和计算设备 |
Cited By (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110287284A (zh) * | 2019-05-23 | 2019-09-27 | 北京百度网讯科技有限公司 | 语义匹配方法、装置及设备 |
CN110287284B (zh) * | 2019-05-23 | 2021-07-06 | 北京百度网讯科技有限公司 | 语义匹配方法、装置及设备 |
CN110795569A (zh) * | 2019-10-08 | 2020-02-14 | 北京百度网讯科技有限公司 | 知识图谱的向量表示生成方法、装置及设备 |
CN110795569B (zh) * | 2019-10-08 | 2021-06-15 | 北京百度网讯科技有限公司 | 知识图谱的向量表示生成方法、装置及设备 |
US11995560B2 (en) | 2019-10-08 | 2024-05-28 | Beijing Baidu Netcom Science And Technology Co., Ltd. | Method and apparatus for generating vector representation of knowledge graph |
CN111241285A (zh) * | 2020-01-15 | 2020-06-05 | 北京百度网讯科技有限公司 | 问题回答类型的识别方法、装置、设备及存储介质 |
CN111241285B (zh) * | 2020-01-15 | 2023-09-01 | 北京百度网讯科技有限公司 | 问题回答类型的识别方法、装置、设备及存储介质 |
CN113157890A (zh) * | 2021-04-25 | 2021-07-23 | 深圳壹账通智能科技有限公司 | 智能问答方法、装置、电子设备及可读存储介质 |
CN113157890B (zh) * | 2021-04-25 | 2024-06-11 | 深圳壹账通智能科技有限公司 | 智能问答方法、装置、电子设备及可读存储介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11734375B2 (en) | Automatic navigation of interactive web documents | |
CN112131366B (zh) | 训练文本分类模型及文本分类的方法、装置及存储介质 | |
US10878191B2 (en) | Iterative ontology discovery | |
CN110196894A (zh) | 语言模型的训练方法和预测方法 | |
US11030416B2 (en) | Latent ambiguity handling in natural language processing | |
JP2022177242A (ja) | テキスト認識モデルの訓練方法、テキスト認識方法及び装置 | |
CN109189882A (zh) | 序列内容的回答类型识别方法、装置、服务器和存储介质 | |
US11709893B2 (en) | Search method, electronic device and storage medium | |
CN111062217A (zh) | 语言信息的处理方法、装置、存储介质及电子设备 | |
CN113326374B (zh) | 基于特征增强的短文本情感分类方法及系统 | |
US11604929B2 (en) | Guided text generation for task-oriented dialogue | |
CN113849623B (zh) | 文本视觉问答方法和装置 | |
US20220147719A1 (en) | Dialogue management | |
CN112364167A (zh) | 基于深度学习的意图识别方法、系统、设备及存储介质 | |
CN111414746A (zh) | 一种匹配语句确定方法、装置、设备及存储介质 | |
WO2021129411A1 (zh) | 文本处理方法及装置 | |
CN112185361B (zh) | 一种语音识别模型训练方法、装置、电子设备及存储介质 | |
CN114078468B (zh) | 语音的多语种识别方法、装置、终端和存储介质 | |
WO2021129410A1 (zh) | 文本处理方法及装置 | |
CN113705207A (zh) | 语法错误识别方法及装置 | |
CN112100389A (zh) | 一种长文本分类方法及装置 | |
CN116578707A (zh) | 一种专利层级分类方法、装置、电子设备及存储介质 | |
CN114417898B (zh) | 数据处理方法、装置、设备及可读存储介质 | |
US20230376537A1 (en) | Multi-chunk relationship extraction and maximization of query answer coherence | |
CN114048319B (zh) | 基于注意力机制的幽默文本分类方法、装置、设备、介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |