CN109871446A - 意图识别中的拒识方法、电子装置及存储介质 - Google Patents

意图识别中的拒识方法、电子装置及存储介质 Download PDF

Info

Publication number
CN109871446A
CN109871446A CN201910100204.5A CN201910100204A CN109871446A CN 109871446 A CN109871446 A CN 109871446A CN 201910100204 A CN201910100204 A CN 201910100204A CN 109871446 A CN109871446 A CN 109871446A
Authority
CN
China
Prior art keywords
information
input information
model
intention assessment
similarity
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201910100204.5A
Other languages
English (en)
Other versions
CN109871446B (zh
Inventor
许开河
杨坤
王少军
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ping An Technology Shenzhen Co Ltd
Original Assignee
Ping An Technology Shenzhen Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ping An Technology Shenzhen Co Ltd filed Critical Ping An Technology Shenzhen Co Ltd
Priority to CN201910100204.5A priority Critical patent/CN109871446B/zh
Publication of CN109871446A publication Critical patent/CN109871446A/zh
Priority to PCT/CN2019/118278 priority patent/WO2020155766A1/zh
Application granted granted Critical
Publication of CN109871446B publication Critical patent/CN109871446B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/35Clustering; Classification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Abstract

本发明属于人工智能技术领域,公开了一种意图识别中的拒识方法,包括:获取待识别的输入信息;将所述输入信息输入意图识别模型,所述意图识别模块包括文本分类模型和文本相似度模型,通过所述意图识别模型获取与所述输入信息对应的分类类别和置信度得分;判断所述置信度得分是否超过预设阈值,若超过预设阈值,则从知识库中获取所述分类类别对应的知识点信息,若未超过预设阈值,则拒绝识别所述输入信息。本发明还公开了一种电子装置和存储介质。本发明通过对文本分类模型获取的条件概率进行修正,得到置信度得分,并以置信度得分作为判断依据,拒识输入信息,提高了意图识别的准确率。

Description

意图识别中的拒识方法、电子装置及存储介质
技术领域
本发明涉及人工智能技术领域,尤其涉及一种意图识别中的拒识方法、电子装置及存储介质。
背景技术
意图识别,即识别一种行为的意图,是问答机器人最重要的组成部分。意图识别往往由两个重要方向组成,基于检索的意图识别:类似于搜索引擎,机器人检索自己的知识库并返回最能回答用户问题的答案。基于文本分类的意图识别算法:使用知识库的知识点训练文本分类模型并使用文本分类模型对用户的问题进行分类得到知识点并返回知识点相应的答案。基于深度网络的文本分类模型往往会比检索模型问答准确率高,但是文本分类模型无法正确识别知识库之外的问题,对于用户的每一个问题分类模型都会强行给予一个分类。现有的文本分类模型最后的输出层往往都使用softmax对样本属于每个分类的概率进行打分。首先计算样本属于每一个分类的得分,再用这个得分除以总分得到属于该类的概率。这样得到的概率其实是一个条件概率:在样本属于知识库的条件下,它属于某个类的概率;当样本不属于知识库时,这个概率完全随机。因为样本可能跟知识库中的每一个知识点都不像,属于每个知识点的打分都很低,softmax相当于把这些很小的数归一化到0-1之间。因此完全可能某个类别被放大,输出一个比较大的概率,导致文本分类模型对问题的分类准确度较低,使得意图识别的准确率较低。
发明内容
本发明提供一种意图识别中的拒识方法、电子装置及存储介质,以解决现有技术中意图识别的准确率较低的问题。
为了实现上述目的,本发明的一个方面是提供一种意图识别中的拒识方法,包括:
获取待识别的输入信息;
将所述输入信息输入经过训练得到的意图识别模型,通过所述意图识别模型获取与所述输入信息对应的分类类别和置信度得分;
判断所述置信度得分是否超过预设阈值,若超过预设阈值,则从知识库中获取所述分类类别对应的知识点信息,若未超过预设阈值,则拒绝识别所述输入信息;
其中,所述意图识别模型包括文本分类模型和文本相似度模型,通过所述文本分类模型获取所述输入信息对应的分类类别和所述输入信息属于所述分类类别的条件概率,通过所述文本相似度模型和所述条件概率获取所述置信度得分。
优选地,通过所述文本相似度模型和所述条件概率获取所述置信度得分的步骤包括:将所述输入信息和知识库中的知识点信息输入所述文本相似度模型中;通过所述文本相似度模型分别获取所述输入信息和所述知识库中各个知识点信息的相似度;从获取的多个相似度中选取最大相似度;将所述最大相似度与所述条件概率相乘得到所述置信度得分。
优选地,通过所述文本相似度模型和所述条件概率获取所述置信度得分的步骤包括:将所述输入信息和知识库中与所述分类类别对应的知识点信息输入所述文本相似度模型中;通过所述文本相似度模型获取所述输入信息和所述分类类别对应的知识点信息的相似度;将所述条件概率与所述文本相似度模型获取的所述相似度相乘得到所述置信度得分。
优选地,所述文本相似度模型采用基于孪生网络的网络模型,包括两个并行的相同神经网络,将输入信息和知识库中知识点信息各输入一个神经网络中,通过两个神经网络分别将所述输入信息转化为第一向量,将所述知识点信息转化为第二向量,通过计算所述第一向量和所述第二向量的相似度获取所述输入信息和所述知识点信息的相似度并输出。
优选地,所述第一向量和所述第二向量的相似度通过下式计算得到:
式中,Y1为第一向量,Y2为第二向量,sim(Y1,Y2)为第一向量和第二向量的相似度。
优选地,获取待识别的输入信息的步骤包括:获取待识别的语音信息;将获取的语音信息转化为预设格式的文本信息;对所述文本信息进行处理得到待识别的输入信息。
优选地,对所述文本信息进行处理包括:对所述文本信息进行去噪处理和分词处理。
优选地,所述文本分类模型包括:输入层、嵌入层、卷积层、池化层、归一化层和输出层,将所述输入信息输入所述输入层,通过嵌入层将输入信息转化为词向量矩阵,通过卷积层进行卷积运算,通过池化层进行池化操作,通过归一化层将所述输入信息属于每一个分类的得分进行归一化处理,通过所述输出层输出与所述输入信息对应的分类类别和所述输入信息属于所述分类类别的条件概率。
为了实现上述目的,本发明的另一个方面是提供一种电子装置,该电子装置包括:
处理器;
存储器,所述存储器中包括意图识别中的拒识程序,所述拒识程序被所述处理器执行时实现如上所述的意图识别中的拒识方法的步骤。
为了实现上述目的,本发明的再一个方面是提供一种计算机可读存储介质,所述计算机可读存储介质中包括意图识别中的拒识程序,所述拒识程序被处理器执行时,实现如上所述的意图识别中的拒识方法的步骤。
相对于现有技术,本发明具有以下优点和有益效果:
本发明的意图识别模型包括文本分类模型和文本相似度模型,通过对文本分类模型获取的条件概率进行修正,得到置信度得分,根据置信度得分判断是否对输入信息拒识,提高了意图识别的准确率。
附图说明
图1为本发明所述意图识别中的拒识方法的流程示意图;
图2为本发明中意图识别模型与现有文本分类模型对知识库之内的问题识别结果对比图;
图3为本发明中意图识别模型与现有文本分类模型对知识库之外的问题识别结果对比图;
图4为本发明中意图识别中的拒识程序的模块示意图。
本发明目的的实现、功能特点及优点将结合实施例,参照附图做进一步说明。
具体实施方式
下面将参考附图来描述本发明所述的实施例。本领域的普通技术人员可以认识到,在不偏离本发明的精神和范围的情况下,可以用各种不同的方式或其组合对所描述的实施例进行修正。因此,附图和描述在本质上是说明性的,仅仅用以解释本发明,而不是用于限制权利要求的保护范围。此外,在本说明书中,附图未按比例画出,并且相同的附图标记表示相同的部分。
本发明所述意图识别中的拒识方法应用于问答机器人中,对于用户的某一个问题,意图识别模型会输出一个分类结果和一个分数,其中,分类结果表示知识库中对应的知识点信息,分数表示置信度得分,对于置信度得分较低的情况,可以进行拒识,从而识别出输入问题属于知识库之外的情况。知识库由一个或多个知识点信息构成,每个知识点信息对应一个针对问题具体的解答方案,接收到用户问题之后,可以向用户反馈与该问题对应的知识点信息,或者对所述问题拒识。
图1为本发明所述意图识别中的拒识方法的流程示意图,如图1所示,所述拒识方法包括:
步骤S1、获取待识别的输入信息;
步骤S2、将所述输入信息输入经过训练得到的意图识别模型,通过所述意图识别模型获取与所述输入信息对应的分类类别和置信度得分;
步骤S3、判断所述置信度得分是否超过预设阈值,若超过预设阈值,则从知识库中获取所述分类类别对应的知识点信息,若未超过预设阈值,则拒绝识别所述输入信息;
其中,所述意图识别模型包括文本分类模型和文本相似度模型,通过所述文本分类模型获取所述输入信息对应的分类类别和所述输入信息属于所述分类类别的条件概率,通过所述文本相似度模型和所述条件概率获取所述置信度得分。
本发明利用意图识别模型中的文本相似度模型,对文本分类模型获取的条件概率进行修正,得到置信度得分,并以置信度得分作为判断依据,拒识输入信息,提高了意图识别的准确率。
本发明中,待识别的输入信息是经过处理之后,可以直接输入意图识别模型中的信息,进一步地,待识别的输入信息可以直接输入文本分类模型中获取分类类别,也可以直接输入相似度模型获取与知识点信息的相似度。优选地,获取待识别的输入信息的步骤包括:
获取待识别的语音信息;将获取的语音信息转化为预设格式的文本信息;对所述文本信息进行处理得到待识别的输入信息。
其中,获取待识别的语音信息可以是用户通过语音命令或聊天语音等。进一步地,对所述文本信息进行处理包括对文本信息进行去噪处理和分词处理等,通过去噪处理可以去除无意义的词组,且不会影响输入信息的真实意思,通过分词处理对文本信息进行分词,并可以进一步标注各词组的词性并识别命名实体。
本发明中,待识别的输入信息可以是句子或词组等,待识别的输入信息中包括用户想要咨询的问题表述,例如,问题表述为“我有网上银行怎么申请信用卡?”,对应的知识点信息为“信用卡申请”等。进一步地,所述输入信息中包括用户信息,用户信息包括但不限于用户年龄、性别、身份、职业、地域、家乡等信息,以便于通过用户信息对用户的输入信息进行偏好聚类,识别用户的倾向兴趣。
本发明根据文本相似度模型的输出结果获取置信度得分,在本发明的一个可选实施例中,通过所述文本相似度模型和所述条件概率获取所述置信度得分的步骤包括:将所述输入信息和知识库中的知识点信息输入所述文本相似度模型中;通过所述文本相似度模型分别获取所述输入信息和所述知识库中各个知识点信息的相似度;从获取的多个相似度中选取最大相似度;将所述最大相似度与所述条件概率相乘得到所述置信度得分。
如下式所示:
式中,x表示输入信息;Ci表示知识库中第i类知识点信息;C表示知识库;Score(x∈Ci)表示输入信息x属于知识库中第i类知识点信息的置信度得分;P(x∈Ci,x∈C)表示输入信息x在知识库范围之内,并属于第i类知识点信息的概率;表示输入信息x不在知识库范围之内,并属于第i类知识点信息的概率,一般为0;P(x∈Ci|x∈C)表示输入信息x在知识库范围之内,并属于第i类知识点信息的条件概率,通过文本分类模型输出,可对其进行贝叶斯公式展开联合概率计算;j表示知识库中知识点信息类别的索引;P(x∈C)表示输入信息属于知识库的概率;sim(x,Cj)表示输入信息x与知识库中第j类知识点信息的相似度,若输入信息x与知识库中的任意一个知识点信息很相似,则认为该输入信息x属于知识库,因此取其中相似度的最大值计算置信度得分。
本发明的一个实施例中,对置信度的预设阈值设定等级,例如,将置信度得分为0.9设置为一级阈值,将置信度得分为0.8设置为二级阈值,将置信度得分为0.6设置为三级阈值,将置信度得分为0.4设置为四级阈值;以置信度得分为依据获取意图识别结果时,根据置信度得分所属的阈值级别获取与输入信息对应的一个或多个知识点信息。具体地,将通过文本相似度模型获取的多个相似度按照从大到小的顺序排列,从中依次选取排序靠前的几个相似度,并得到相对应的多个置信度得分,根据实际需求,可以选择超过某一级别阈值的多个置信度得分对应的知识点信息反馈给用户,而若多个置信度得分中的最大值低于设定的最低级别阈值,则拒绝识别对应的输入信息;例如,通过意图识别模型得到的置信度得分分别为0.95、0.85和0.5,若选择一级阈值,则仅反馈置信度得分为0.95对应的知识点信息,若选择二级阈值,则可以反馈置信度得分为0.95和0.8对应的知识点信息供用户参考。若通过意图识别模型得到的置信度得分分别为0.38、0.3和0.25,其中最大的置信度得分为0.38,低于设定的四级阈值,则拒绝识别对应的输入信息。
假设文本分类模型中的分类算法是可信任的,那么如果输入信息x属于知识库,则通过文本分类模型必然将输入信息分类成为与该输入信息最相似的知识点信息类别。优选地,通过所述文本相似度模型和所述条件概率获取所述置信度得分的步骤包括:将所述输入信息和知识库中与所述分类类别对应的知识点信息输入所述文本相似度模型中;通过所述文本相似度模型获取所述输入信息和所述分类类别对应的知识点信息的相似度;将所述条件概率与所述文本相似度模型获取的所述相似度相乘得到所述置信度得分。
如下式所示:
式中,x表示输入信息,Ci表示知识库中第i类知识点信息,C表示知识库,Score(x∈Ci)表示输入信息x属于知识库中第i类知识点信息的置信度得分,P(x∈Ci,x∈C)表示输入信息x在知识库范围之内,并属于第i类知识点信息的概率;表示输入信息x不在知识库范围之内,并属于第i类知识点信息的概率,一般为0;P(x∈Ci|x∈C)表示输入信息x在知识库范围之内,并属于第i类知识点信息的条件概率,通过文本分类模型输出,P(x∈C)表示输入信息属于知识库的概率;sim(x,Ci)表示输入信息x与第i类知识点信息的相似度。
通过先使用文本分类模型得到一个分类结果,获取输入信息对应的分类类别,再使用这个分类结果计算文本相似度,得到置信度得分,大幅度地减少了文本相似度的匹配次数,提高运算效率,判断一个输入信息是否属于知识库不再需要遍历地计算该输入信息和知识库中每个知识点信息的相似度。
所述文本分类模型用于对输入信息(可以是句子或词组等)进行分类,输出分类类别和相应的得分。优选地,所述文本分类模型包括:输入层、嵌入层、卷积层、池化层、归一化层和输出层,将所述输入信息输入所述输入层,通过嵌入层将输入信息转化为词向量矩阵,通过卷积层进行卷积运算,通过池化层进行池化操作,通过归一化层将所述输入信息属于每一个分类的得分进行归一化处理,通过所述输出层输出所述输入信息对应的分类类别和所述输入信息属于所述分类类别的得分。通过获取输入信息属于每一个分类的得分,再用这个得分除以总分得到输入信息属于该分类类别的概率,如下式所示:
式中,x为输入信息,Ci为知识库中第i类知识点信息,s为得分,P(x∈Ci)为输入信息x属于知识库中第i类知识点信息的概率,s(x∈Ci)为输入信息x属于知识库中第i类知识点信息的得分,j为知识库中知识点信息类别的索引,n为知识库中知识点信息类别的总数量。
本发明中,文本分类模型可以使用cnn网络结构模型,也可以使用dnn网络结构模型等。
本发明的一个实施例中,所述文本相似度模型采用基于孪生网络的网络模型,包括两个并行的相同神经网络,将输入信息和知识库中知识点信息各输入一个神经网络中,通过两个神经网络分别将所述输入信息转化为第一向量,将所述知识点信息转化为第二向量,通过计算第一向量和第二向量的相似度获取输入信息与知识点信息的相似度并输出。通过文本相似度模型可以分别获取输入信息与知识库中各个知识点信息的相似度,也可以仅获取输入信息与文本分类模型输出的分类类别对应的知识点信息的相似度。
进一步地,所述第一向量和所述第二向量的相似度通过下式计算得到:
式中,Y1为第一向量,Y2为第二向量,sim(Y1,Y2)为第一向量和第二向量的相似度。
通过计算第一向量和第二向量的相似度表征输入信息与知识点信息的相似度,确定输入信息所对应的知识点信息在知识库之内的可能性
所述文本相似度模型中的两个神经网络的参数相同。神经网络可以是RNN神经网络、CNN神经网络、LSTM神经网络等,本发明优选为双向LSTM神经网络。
采用知识库中的知识点信息作为训练样本训练文本相似度模型。每个训练样本包括两个知识点信息,并对所述训练样本进行标签标注,若训练样本的两个知识点信息的语义一致,则标注标签为1,若不一致,则标注标签为0。根据两个知识点信息的相似性将训练样本划分为正样本和负样本,正样本表示两个知识点信息相似,相应的标签为1,负样本表示两个知识点信息不相似,相应的标签为0。例如,知识库中的多个知识点信息中,一个标准问匹配有多个扩展问,相匹配的标准问和扩展问是相似的,正样本包括一个标准问和与之相匹配的扩展问,负样本包括一个标准问和与之不匹配的扩展问或另一个标准问。通过对正样本和负样本的划分提高文本相似度模型的准确度。
本发明可以利用现有的训练方法训练孪生网络的参数,本发明对此并无限定。
图2为本发明中意图识别模型与现有文本分类模型对知识库之内的问题识别结果对比图,如图2所示,对于知识库之内的问题识别,通过本发明的意图识别模型对待识别的输入信息处理得到的该输入信息属于某个知识点信息的得分分布与通过现有文本分类模型得到的得分分布相差不大。图3为本发明中意图识别模型与现有文本分类模型对知识库之外的问题识别结果对比图,如图3所示,对于知识库之外的问题识别,通过现有文本分类模型得到的得分普遍偏高,而通过本发明的意图识别模型得到的得分分布普遍偏低,以便于根据得分与预设阈值的比较进行拒识,从而提高意图识别的正确率。图2和图3中的横坐标均表示输入信息属于某个分类类别的得分,纵坐标表示输入模型的样本个数,图中的现有模型指的是现有意图识别中使用的文本分类模型。
本发明所述意图识别中的拒识方法应用于电子装置,所述电子装置可以是电视机、智能手机、平板电脑、计算机等终端设备。
所述电子装置包括:处理器;存储器,用于存储意图识别中的拒识程序,处理器执行所述意图识别中的拒识程序,实现以下的意图识别中的拒识方法的步骤:
获取待识别的输入信息;
将所述输入信息输入经过训练得到的意图识别模型,通过所述意图识别模型获取与所述输入信息对应的分类类别和置信度得分;
判断所述置信度得分是否超过预设阈值,若超过预设阈值,则从知识库中获取所述分类类别对应的知识点信息,若未超过预设阈值,则拒绝识别所述输入信息;
其中,所述意图识别模型包括文本分类模型和文本相似度模型,通过所述文本分类模型获取所述输入信息对应的分类类别和所述输入信息属于所述分类类别的条件概率,通过所述文本相似度模型和所述条件概率获取所述置信度得分。
所述电子装置还包括网络接口和通信总线等。其中,网络接口可以包括标准的有线接口、无线接口,通信总线用于实现各个组件之间的连接通信。
存储器包括至少一种类型的可读存储介质,可以是闪存、硬盘、光盘等非易失性存储介质,也可以是插接式硬盘等,且并不限于此,可以是以非暂时性方式存储指令或软件以及任何相关联的数据文件并向处理器提供指令或软件程序以使该处理器能够执行指令或软件程序的任何装置。本发明中,存储器存储的软件程序包括意图识别中的拒识程序,并可以向处理器提供该意图识别中的拒识程序,以使得处理器可以执行该意图识别中的拒识程序,实现意图识别中的拒识方法的步骤。
处理器可以是中央处理器、微处理器或其他数据处理芯片等,可以运行存储器中的存储程序,例如,本发明中意图识别中的拒识程序。
所述电子装置还可以包括显示器,显示器也可以称为显示屏或显示单元。在一些实施例中显示器可以是LED显示器、液晶显示器、触控式液晶显示器以及有机发光二极管(Organic Light-Emitting Diode,OLED)触摸器等。显示器用于显示在电子装置中处理的信息以及用于显示可视化的工作界面,包括输入信息和通过意图识别模型的输出信息等。
所述电子装置还可以包括用户接口,用户接口可以包括输入单元(比如键盘)、语音输出装置(比如音响、耳机)等。
本发明中,待识别的输入信息是经过处理之后,可以直接输入意图识别模型中的信息,进一步地,待识别的输入信息可以直接输入文本分类模型中获取分类类别,也可以直接输入相似度模型获取与知识点信息的相似度。优选地,所述电子装置通过执行以下步骤实现获取待识别的输入信息:
获取待识别的语音信息;将获取的语音信息转化为预设格式的文本信息;对所述文本信息进行处理得到待识别的输入信息。
其中,获取待识别的语音信息可以是用户通过语音命令或聊天语音等。进一步地,对所述文本信息进行处理包括对文本信息进行去噪处理和分词处理等,通过去噪处理可以去除无意义的词组,且不会影响输入信息的真实意思,通过分词处理对文本信息进行分词,并可以进一步标注各词组的词性并识别命名实体。
本发明中,待识别的输入信息可以是句子或词组等,待识别的输入信息中包括用户想要咨询的问题表述,例如,问题表述为“我有网上银行怎么申请信用卡?”,对应的知识点信息为“信用卡申请”等。进一步地,所述输入信息中包括用户信息,用户信息包括但不限于用户年龄、性别、身份、职业、地域、家乡等信息,以便于通过用户信息对用户的输入信息进行偏好聚类,识别用户的倾向兴趣。
本发明所述电子装置包括置信度获取模块,根据文本相似度模型的输出结果获取置信度得分,在本发明的一个可选实施例中,所述置信度获取模块包括:第一信息输入单元,将所述输入信息和知识库中的知识点信息输入所述文本相似度模型中;第一相似度获取单元,通过所述文本相似度模型分别获取所述输入信息和所述知识库中各个知识点信息的相似度;选取单元,从获取的多个相似度中选取最大相似度;第一置信度计算单元,将所述最大相似度与所述条件概率相乘得到所述置信度得分。
如下式所示:
式中,x表示输入信息;Ci表示知识库中第i类知识点信息;C表示知识库;Score(x∈Ci)表示输入信息x属于知识库中第i类知识点信息的置信度得分;P(x∈Ci,x∈C)表示输入信息x在知识库范围之内,并属于第i类知识点信息的概率;表示输入信息x不在知识库范围之内,并属于第i类知识点信息的概率,一般为0;P(x∈Ci|x∈C)表示输入信息x在知识库范围之内,并属于第i类知识点信息的条件概率,通过文本分类模型输出,可对其进行贝叶斯公式展开联合概率计算;j表示知识库中知识点信息类别的索引;P(x∈C)表示输入信息属于知识库的概率;sim(x,Cj)表示输入信息x与知识库中第j类知识点信息的相似度,若输入信息x与知识库中的任意一个知识点信息很相似,则认为该输入信息x属于知识库,因此取其中相似度的最大值计算置信度得分。
假设文本分类模型中的分类算法是可信任的,那么如果输入信息x属于知识库,则通过文本分类模型必然将输入信息分类成为与该输入信息最相似的知识点信息类别。优选地,所述置信度获取模块包括:第二信息输入单元,将所述输入信息和知识库中与所述分类类别对应的知识点信息输入所述文本相似度模型中;第二相似度获取单元,通过所述文本相似度模型获取所述输入信息和所述分类类别对应的知识点信息的相似度;第二置信度计算单元,将所述条件概率与所述文本相似度模型获取的所述相似度相乘得到所述置信度得分。
如下式所示:
式中,x表示输入信息,Ci表示知识库中第i类知识点信息,C表示知识库,Score(x∈Ci)表示输入信息x属于知识库中第i类知识点信息的置信度得分,P(x∈Ci,x∈C)表示输入信息x在知识库范围之内,并属于第i类知识点信息的概率;表示输入信息x不在知识库范围之内,并属于第i类知识点信息的概率,一般为0;P(x∈Ci|x∈C)表示输入信息x在知识库范围之内,并属于第i类知识点信息的条件概率,通过文本分类模型输出,P(x∈C)表示输入信息属于知识库的概率;sim(x,Ci)表示输入信息x与第i类知识点信息的相似度。
通过先使用文本分类模型得到一个分类结果,获取输入信息对应的分类类别,再使用这个分类结果计算文本相似度,得到置信度得分,大幅度地减少了文本相似度的匹配次数,提高运算效率,判断一个输入信息是否属于知识库不再需要遍历地计算该输入信息和知识库中每个知识点信息的相似度。
所述文本分类模型用于对输入信息(可以是句子或词组等)进行分类,输出分类类别和相应的得分。优选地,所述文本分类模型包括:输入层、嵌入层、卷积层、池化层、归一化层和输出层,将所述输入信息输入所述输入层,通过嵌入层将输入信息转化为词向量矩阵,通过卷积层进行卷积运算,通过池化层进行池化操作,通过归一化层将所述输入信息属于每一个分类的得分进行归一化处理,通过所述输出层输出所述输入信息对应的分类类别和所述输入信息属于所述分类类别的得分。通过获取输入信息属于每一个分类的得分,再用这个得分除以总分得到输入信息属于该分类类别的概率,如下式所示:
式中,x为输入信息,Ci为知识库中第i类知识点信息,s为得分,P(x∈Ci)为输入信息x属于知识库中第i类知识点信息的概率,s(x∈Ci)为输入信息x属于知识库中第i类知识点信息的得分,j为知识库中知识点信息类别的索引,n为知识库中知识点信息类别的总数量。
本发明中,文本分类模型可以使用cnn网络结构模型,也可以使用dnn网络结构模型等。
本发明的一个实施例中,所述文本相似度模型采用基于孪生网络的网络模型,包括两个并行的相同神经网络,将输入信息和知识库中知识点信息各输入一个神经网络中,通过两个神经网络分别将所述输入信息转化为第一向量,将所述知识点信息转化为第二向量,通过计算第一向量和第二向量的相似度获取输入信息与知识点信息的相似度并输出。通过文本相似度模型可以分别获取输入信息与知识库中各个知识点信息的相似度,也可以仅获取输入信息与文本分类模型输出的分类类别对应的知识点信息的相似度。
进一步地,所述第一向量和所述第二向量的相似度通过下式计算得到:
式中,Y1为第一向量,Y2为第二向量,sim(Y1,Y2)为第一向量和第二向量的相似度。
通过计算第一向量和第二向量的相似度表征输入信息与知识点信息的相似度,确定输入信息所对应的知识点信息在知识库之内的可能性。
所述文本相似度模型中的两个神经网络的参数相同。神经网络可以是RNN神经网络、CNN神经网络、LSTM神经网络等,本发明优选为双向LSTM神经网络。
采用知识库中的知识点信息作为训练样本训练文本相似度模型。每个训练样本包括两个知识点信息,并对所述训练样本进行标签标注,若训练样本的两个知识点信息的语义一致,则标注标签为1,若不一致,则标注标签为0。根据两个知识点信息的相似性将训练样本划分为正样本和负样本,正样本表示两个知识点信息相似,相应的标签为1,负样本表示两个知识点信息不相似,相应的标签为0。例如,知识库中的多个知识点信息中,一个标准问匹配有多个扩展问,相匹配的标准问和扩展问是相似的,正样本包括一个标准问和与之相匹配的扩展问,负样本包括一个标准问和与之不匹配的扩展问或另一个标准问。通过对正样本和负样本的划分提高文本相似度模型的准确度。
本发明可以利用现有的训练方法训练孪生网络的参数,本发明对此并无限定。
在其他实施例中,意图识别中的拒识程序还可以被分割为一个或者多个模块,一个或者多个模块被存储于存储器中,并由处理器执行,以完成本发明。本发明所称的模块是指能够完成特定功能的一系列计算机程序指令段。图4为本发明中意图识别中的拒识程序的模块示意图,如图4所示,所述意图识别中的拒识程序可以被分割为:输入信息获取模块1、识别模块2、置信度获取模块3和判断模块4。上述模块所实现的功能或操作步骤均与上文类似,此处不再详述,示例性地,例如其中:
输入信息获取模块1,获取待识别的输入信息;
识别模块2,将所述输入信息输入经过训练得到的意图识别模型,其中,所述意图识别模型包括文本分类模型和文本相似度模型,通过所述文本分类模型获取所述输入信息对应的分类类别和所述输入信息属于所述分类类别的条件概率,通过所述文本相似度模型和所述条件概率获取所述置信度得分;
置信度获取模块3,通过所述意图识别模型获取与所述输入信息对应的分类类别和置信度得分;
判断模块4,判断所述置信度得分是否超过预设阈值,若超过预设阈值,则从知识库中获取所述分类类别对应的知识点信息,若未超过预设阈值,则拒绝识别所述输入信息。
本发明的一个实施例中,计算机可读存储介质可以是任何包含或存储程序或指令的有形介质,其中的程序可以被执行,通过存储的程序指令相关的硬件实现相应的功能。例如,计算机可读存储介质可以是计算机磁盘、硬盘、随机存取存储器、只读存储器等。本发明并不限于此,可以是以非暂时性方式存储指令或软件以及任何相关数据文件或数据结构并且可提供给处理器以使处理器执行其中的程序或指令的任何装置。所述计算机可读存储介质中包括意图识别中的拒识程序,所述意图识别中的拒识程序被处理器执行时,实现如下的意图识别中的拒识方法:
获取待识别的输入信息;
将所述输入信息输入经过训练得到的意图识别模型,通过所述意图识别模型获取与所述输入信息对应的分类类别和置信度得分;
判断所述置信度得分是否超过预设阈值,若超过预设阈值,则从知识库中获取所述分类类别对应的知识点信息,若未超过预设阈值,则拒绝识别所述输入信息;
其中,所述意图识别模型包括文本分类模型和文本相似度模型,通过所述文本分类模型获取所述输入信息对应的分类类别和所述输入信息属于所述分类类别的条件概率,通过所述文本相似度模型和所述条件概率获取所述置信度得分。
本发明之计算机可读存储介质的具体实施方式与上述意图识别中的拒识方法、电子装置的具体实施方式大致相同,在此不再赘述。
需要说明的是,在本文中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、装置、物品或者方法不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、装置、物品或者方法所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括该要素的过程、装置、物品或者方法中还存在另外的相同要素。
上述本发明实施例序号仅仅为了描述,不代表实施例的优劣。通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在如上所述的一个存储介质(如ROM/RAM、磁碟、光盘)中,包括若干指令用以使得一台终端设备(可以是手机,计算机,服务器,或者网络设备等)执行本发明各个实施例所述的方法。
以上仅为本发明的优选实施例,并非因此限制本发明的专利范围,凡是利用本发明说明书及附图内容所作的等效结构或等效流程变换,或直接或间接运用在其他相关的技术领域,均同理包括在本发明的专利保护范围内。

Claims (10)

1.一种意图识别中的拒识方法,应用于电子装置,其特征在于,包括:
获取待识别的输入信息;
将所述输入信息输入经过训练得到的意图识别模型,通过所述意图识别模型获取与所述输入信息对应的分类类别和置信度得分;
判断所述置信度得分是否超过预设阈值,若超过预设阈值,则从知识库中获取所述分类类别对应的知识点信息,若未超过预设阈值,则拒绝识别所述输入信息;
其中,所述意图识别模型包括文本分类模型和文本相似度模型,通过所述文本分类模型获取所述输入信息对应的分类类别和所述输入信息属于所述分类类别的条件概率,通过所述文本相似度模型和所述条件概率获取所述置信度得分。
2.根据权利要求1所述的意图识别中的拒识方法,其特征在于,通过所述文本相似度模型和所述条件概率获取所述置信度得分的步骤包括:
将所述输入信息和知识库中的知识点信息输入所述文本相似度模型中;
通过所述文本相似度模型分别获取所述输入信息和所述知识库中各个知识点信息的相似度;
从获取的多个相似度中选取最大相似度;
将所述最大相似度与所述条件概率相乘得到所述置信度得分。
3.根据权利要求1所述的意图识别中的拒识方法,其特征在于,通过所述文本相似度模型和所述条件概率获取所述置信度得分的步骤包括:
将所述输入信息和知识库中与所述分类类别对应的知识点信息输入所述文本相似度模型中;
通过所述文本相似度模型获取所述输入信息和所述分类类别对应的知识点信息的相似度;
将所述条件概率与所述文本相似度模型获取的所述相似度相乘得到所述置信度得分。
4.根据权利要求1所述的意图识别中的拒识方法,其特征在于,所述文本相似度模型采用基于孪生网络的网络模型,包括两个并行的相同神经网络,将输入信息和知识库中知识点信息各输入一个神经网络中,通过两个神经网络分别将所述输入信息转化为第一向量,将所述知识点信息转化为第二向量,通过计算所述第一向量和所述第二向量的相似度获取所述输入信息和所述知识点信息的相似度并输出。
5.根据权利要求4所述的意图识别中的拒识方法,其特征在于,所述第一向量和所述第二向量的相似度通过下式计算得到:
式中,Y1为第一向量,Y2为第二向量,sim(Y1,Y2)为第一向量和第二向量的相似度。
6.根据权利要求1所述的意图识别中的拒识方法,其特征在于,获取待识别的输入信息的步骤包括:
获取待识别的语音信息;
将获取的语音信息转化为预设格式的文本信息;
对所述文本信息进行处理得到待识别的输入信息。
7.根据权利要求6所述的意图识别中的拒识方法,其特征在于,对所述文本信息进行处理包括:对所述文本信息进行去噪处理和分词处理。
8.根据权利要求1所述的意图识别中的拒识方法,其特征在于,所述文本分类模型包括:输入层、嵌入层、卷积层、池化层、归一化层和输出层,将所述输入信息输入所述输入层,通过嵌入层将输入信息转化为词向量矩阵,通过卷积层进行卷积运算,通过池化层进行池化操作,通过归一化层将所述输入信息属于每一个分类的得分进行归一化处理,通过所述输出层输出与所述输入信息对应的分类类别和所述输入信息属于所述分类类别的条件概率。
9.一种电子装置,其特征在于,该电子装置包括:
处理器;
存储器,所述存储器中包括意图识别中的拒识程序,所述拒识程序被所述处理器执行时实现如权利要求1至8中任一项所述的意图识别中的拒识方法的步骤。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质中包括意图识别中的拒识程序,所述拒识程序被处理器执行时,实现如权利要求1至8中任一项所述的意图识别中的拒识方法的步骤。
CN201910100204.5A 2019-01-31 2019-01-31 意图识别中的拒识方法、电子装置及存储介质 Active CN109871446B (zh)

Priority Applications (2)

Application Number Priority Date Filing Date Title
CN201910100204.5A CN109871446B (zh) 2019-01-31 2019-01-31 意图识别中的拒识方法、电子装置及存储介质
PCT/CN2019/118278 WO2020155766A1 (zh) 2019-01-31 2019-11-14 意图识别中的拒识方法、装置、设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910100204.5A CN109871446B (zh) 2019-01-31 2019-01-31 意图识别中的拒识方法、电子装置及存储介质

Publications (2)

Publication Number Publication Date
CN109871446A true CN109871446A (zh) 2019-06-11
CN109871446B CN109871446B (zh) 2023-06-06

Family

ID=66918490

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910100204.5A Active CN109871446B (zh) 2019-01-31 2019-01-31 意图识别中的拒识方法、电子装置及存储介质

Country Status (2)

Country Link
CN (1) CN109871446B (zh)
WO (1) WO2020155766A1 (zh)

Cited By (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110414005A (zh) * 2019-07-31 2019-11-05 深圳前海达闼云端智能科技有限公司 意图识别方法、电子设备及存储介质
CN110472007A (zh) * 2019-07-04 2019-11-19 深圳追一科技有限公司 信息推送方法、装置、设备及存储介质
CN110503143A (zh) * 2019-08-14 2019-11-26 平安科技(深圳)有限公司 基于意图识别的阈值选取方法、设备、存储介质及装置
CN111078846A (zh) * 2019-11-25 2020-04-28 青牛智胜(深圳)科技有限公司 一种基于业务场景的多轮对话体系构建方法及系统
CN111310441A (zh) * 2020-01-20 2020-06-19 上海眼控科技股份有限公司 基于bert的语音识别后文本修正方法、装置、终端及介质
CN111400473A (zh) * 2020-03-18 2020-07-10 北京三快在线科技有限公司 意图识别模型的训练方法及装置、存储介质及电子设备
WO2020155766A1 (zh) * 2019-01-31 2020-08-06 平安科技(深圳)有限公司 意图识别中的拒识方法、装置、设备及存储介质
CN111625636A (zh) * 2020-05-28 2020-09-04 深圳追一科技有限公司 一种人机对话的拒绝识别方法、装置、设备、介质
CN111859986A (zh) * 2020-07-27 2020-10-30 中国平安人寿保险股份有限公司 基于多任务孪生网络的语义匹配方法、装置、设备和介质
CN112232269A (zh) * 2020-10-29 2021-01-15 南京莱斯网信技术研究院有限公司 一种基于孪生网络的船舶身份智能识别方法及系统
WO2021017296A1 (zh) * 2019-08-01 2021-02-04 平安科技(深圳)有限公司 信息识别的方法、装置、设备及存储介质
CN112347776A (zh) * 2019-08-09 2021-02-09 金色熊猫有限公司 医疗数据处理方法及装置、存储介质、电子设备
CN112699909A (zh) * 2019-10-23 2021-04-23 中移物联网有限公司 信息识别方法、装置、电子设备及计算机可读存储介质
CN112733869A (zh) * 2019-10-28 2021-04-30 中移信息技术有限公司 训练文本识别模型的方法、装置、设备及存储介质
US11972219B2 (en) 2020-05-20 2024-04-30 Beijing Baidu Netcom Science Technology Co., Ltd. Intent recognition optimization processing method, apparatus, and storage medium

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112015921B (zh) * 2020-09-15 2024-04-16 重庆广播电视大学重庆工商职业学院 一种基于学习辅助知识图谱的自然语言处理方法
CN112396111A (zh) * 2020-11-20 2021-02-23 平安普惠企业管理有限公司 文本意图分类方法、装置、计算机设备及存储介质
CN112667076A (zh) * 2020-12-23 2021-04-16 广州橙行智动汽车科技有限公司 一种语音交互的数据处理方法和装置

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2013097645A (ja) * 2011-11-02 2013-05-20 Fujitsu Ltd 認識支援装置、認識支援方法、およびプログラム
US8515736B1 (en) * 2010-09-30 2013-08-20 Nuance Communications, Inc. Training call routing applications by reusing semantically-labeled data collected for prior applications
US20150348551A1 (en) * 2014-05-30 2015-12-03 Apple Inc. Multi-command single utterance input method
CN105957516A (zh) * 2016-06-16 2016-09-21 百度在线网络技术(北京)有限公司 多语音识别模型切换方法及装置
CN107657284A (zh) * 2017-10-11 2018-02-02 宁波爱信诺航天信息有限公司 一种基于语义相似性扩展的商品名称分类方法及系统
US20180150455A1 (en) * 2016-11-30 2018-05-31 Baidu Online Network Technology (Beijing) Co., Ltd. Method and apparatus for processing semantic analysis result based on artificial intelligence
CN108334891A (zh) * 2017-12-15 2018-07-27 北京奇艺世纪科技有限公司 一种任务型意图分类方法及装置
CN108509463A (zh) * 2017-02-28 2018-09-07 华为技术有限公司 一种问题的应答方法及装置

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106095845B (zh) * 2016-06-02 2021-04-06 腾讯科技(深圳)有限公司 文本分类方法和装置
CN106326984A (zh) * 2016-08-09 2017-01-11 北京京东尚科信息技术有限公司 用户意图识别方法和装置、自动应答系统
CN109241255B (zh) * 2018-08-20 2021-05-18 华中师范大学 一种基于深度学习的意图识别方法
CN109871446B (zh) * 2019-01-31 2023-06-06 平安科技(深圳)有限公司 意图识别中的拒识方法、电子装置及存储介质

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8515736B1 (en) * 2010-09-30 2013-08-20 Nuance Communications, Inc. Training call routing applications by reusing semantically-labeled data collected for prior applications
JP2013097645A (ja) * 2011-11-02 2013-05-20 Fujitsu Ltd 認識支援装置、認識支援方法、およびプログラム
US20150348551A1 (en) * 2014-05-30 2015-12-03 Apple Inc. Multi-command single utterance input method
CN105957516A (zh) * 2016-06-16 2016-09-21 百度在线网络技术(北京)有限公司 多语音识别模型切换方法及装置
US20180150455A1 (en) * 2016-11-30 2018-05-31 Baidu Online Network Technology (Beijing) Co., Ltd. Method and apparatus for processing semantic analysis result based on artificial intelligence
CN108509463A (zh) * 2017-02-28 2018-09-07 华为技术有限公司 一种问题的应答方法及装置
CN107657284A (zh) * 2017-10-11 2018-02-02 宁波爱信诺航天信息有限公司 一种基于语义相似性扩展的商品名称分类方法及系统
CN108334891A (zh) * 2017-12-15 2018-07-27 北京奇艺世纪科技有限公司 一种任务型意图分类方法及装置

Cited By (19)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2020155766A1 (zh) * 2019-01-31 2020-08-06 平安科技(深圳)有限公司 意图识别中的拒识方法、装置、设备及存储介质
CN110472007A (zh) * 2019-07-04 2019-11-19 深圳追一科技有限公司 信息推送方法、装置、设备及存储介质
CN110414005A (zh) * 2019-07-31 2019-11-05 深圳前海达闼云端智能科技有限公司 意图识别方法、电子设备及存储介质
CN110414005B (zh) * 2019-07-31 2023-10-10 达闼机器人股份有限公司 意图识别方法、电子设备及存储介质
WO2021017296A1 (zh) * 2019-08-01 2021-02-04 平安科技(深圳)有限公司 信息识别的方法、装置、设备及存储介质
CN112347776A (zh) * 2019-08-09 2021-02-09 金色熊猫有限公司 医疗数据处理方法及装置、存储介质、电子设备
CN110503143A (zh) * 2019-08-14 2019-11-26 平安科技(深圳)有限公司 基于意图识别的阈值选取方法、设备、存储介质及装置
CN110503143B (zh) * 2019-08-14 2024-03-19 平安科技(深圳)有限公司 基于意图识别的阈值选取方法、设备、存储介质及装置
CN112699909A (zh) * 2019-10-23 2021-04-23 中移物联网有限公司 信息识别方法、装置、电子设备及计算机可读存储介质
CN112699909B (zh) * 2019-10-23 2024-03-19 中移物联网有限公司 信息识别方法、装置、电子设备及计算机可读存储介质
CN112733869A (zh) * 2019-10-28 2021-04-30 中移信息技术有限公司 训练文本识别模型的方法、装置、设备及存储介质
CN111078846A (zh) * 2019-11-25 2020-04-28 青牛智胜(深圳)科技有限公司 一种基于业务场景的多轮对话体系构建方法及系统
CN111310441A (zh) * 2020-01-20 2020-06-19 上海眼控科技股份有限公司 基于bert的语音识别后文本修正方法、装置、终端及介质
CN111400473A (zh) * 2020-03-18 2020-07-10 北京三快在线科技有限公司 意图识别模型的训练方法及装置、存储介质及电子设备
US11972219B2 (en) 2020-05-20 2024-04-30 Beijing Baidu Netcom Science Technology Co., Ltd. Intent recognition optimization processing method, apparatus, and storage medium
CN111625636A (zh) * 2020-05-28 2020-09-04 深圳追一科技有限公司 一种人机对话的拒绝识别方法、装置、设备、介质
CN111859986A (zh) * 2020-07-27 2020-10-30 中国平安人寿保险股份有限公司 基于多任务孪生网络的语义匹配方法、装置、设备和介质
CN112232269A (zh) * 2020-10-29 2021-01-15 南京莱斯网信技术研究院有限公司 一种基于孪生网络的船舶身份智能识别方法及系统
CN112232269B (zh) * 2020-10-29 2024-02-09 南京莱斯网信技术研究院有限公司 一种基于孪生网络的船舶身份智能识别方法及系统

Also Published As

Publication number Publication date
CN109871446B (zh) 2023-06-06
WO2020155766A1 (zh) 2020-08-06

Similar Documents

Publication Publication Date Title
CN109871446A (zh) 意图识别中的拒识方法、电子装置及存储介质
CN112632385B (zh) 课程推荐方法、装置、计算机设备及介质
Bucak et al. Multi-label learning with incomplete class assignments
Dekhtyar et al. Re data challenge: Requirements identification with word2vec and tensorflow
CN112819023B (zh) 样本集的获取方法、装置、计算机设备和存储介质
CN103577989B (zh) 一种基于产品识别的信息分类方法及信息分类系统
CN111444344B (zh) 实体分类方法、装置、计算机设备和存储介质
CN102999635A (zh) 语义可视搜索引擎
CN113505586A (zh) 一种融合语义分类与知识图谱的坐席辅助问答方法与系统
CN111274371B (zh) 一种基于知识图谱的智能人机对话方法及设备
CN110427480B (zh) 个性化文本智能推荐方法、装置及计算机可读存储介质
CN112395421B (zh) 课程标签的生成方法、装置、计算机设备及介质
CN111898374A (zh) 文本识别方法、装置、存储介质和电子设备
CN110347789A (zh) 文本意图智能分类方法、装置及计算机可读存储介质
CN110827797B (zh) 语音应答事件分类处理方法和装置
CN109359198A (zh) 一种文本分类方法及装置
CN112632258A (zh) 文本数据处理方法、装置、计算机设备和存储介质
CN109460462A (zh) 一种中文相似问题生成系统与方法
Celikyilmaz et al. A graph-based semi-supervised learning for question-answering
CN114491079A (zh) 知识图谱构建和查询方法、装置、设备和介质
CN112527985A (zh) 未知问题处理方法、装置、设备及介质
CN113095073B (zh) 语料标签生成方法、装置、计算机设备和存储介质
CN111708862B (zh) 文本匹配方法、装置及电子设备
CN113553419A (zh) 民航知识图谱问答系统
CN113988057A (zh) 基于概念抽取的标题生成方法、装置、设备及介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant