CN111177349A - 问答匹配方法、装置、设备及存储介质 - Google Patents
问答匹配方法、装置、设备及存储介质 Download PDFInfo
- Publication number
- CN111177349A CN111177349A CN201911327723.1A CN201911327723A CN111177349A CN 111177349 A CN111177349 A CN 111177349A CN 201911327723 A CN201911327723 A CN 201911327723A CN 111177349 A CN111177349 A CN 111177349A
- Authority
- CN
- China
- Prior art keywords
- question
- similarity
- original
- answer
- sentence
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/332—Query formulation
- G06F16/3329—Natural language query formulation or dialogue systems
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/3331—Query processing
- G06F16/334—Query execution
- G06F16/3344—Query execution using natural language analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/22—Matching criteria, e.g. proximity measures
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- General Engineering & Computer Science (AREA)
- Artificial Intelligence (AREA)
- General Physics & Mathematics (AREA)
- Mathematical Physics (AREA)
- Databases & Information Systems (AREA)
- Computational Linguistics (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Evolutionary Computation (AREA)
- Evolutionary Biology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Bioinformatics & Computational Biology (AREA)
- Human Computer Interaction (AREA)
- Life Sciences & Earth Sciences (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明公开了一种问答匹配方法,该方法包括:获取原始问句;从问答库中获取所有问句;分别基于所述问答库中的每个问句及所述原始问句,并利用训练好的基于孪生网络的语义相似度计算模型,计算每个问句与所述原始问句的相似度;根据所述每个问句与所述原始问句的相似度,确定与所述原始问句匹配的目标问句;将从所述问答库中获取所述目标问句对应的答句,并展示给用户。本发明提高机器人回答问题的准确性,使机器更加智能化。
Description
技术领域
本发明涉及数据处理技术领域,尤其涉及一种问答匹配方法、装置、设备及存储介质。
背景技术
随着人工智能的发展和普及,智能客服在社会的需求越来越大,而采用智能客服回答客户的问题基本都有一个行业内的知识库,常常称为FAQ问答对,FAQ问答对知识库的规模决定了一部分机器人的智能程度,机器人另外一部分的智能程度由相似问句检索决定,尤其是相似问句检索精度,如果知识库中存在相应的知识,但是相似度检索模块却没能检索到库中存在的问答对会导致机器人无法给出回答,显得智能程度很低;如果相似度检索模块检索到了错误的问答对,就会导致答非所问,会显得机器人非常傻,大幅度降低用户体验,如何提升FAQ检索精度成为智能客服的关键技术。
发明内容
本发明提供一种问答匹配方法、装置、设备、及计算机可读存储介质,其主要目的在于实现了能根据输入问句的语义,提高电子设备对相似的问句搜索准确性,从而提高智能回答用户的问题的准确性。
为实现上述目的,本发明还提供一种问答匹配方法,应用于电子设备,所述方法包括:
获取原始问句;
从问答库中获取所有问句;
分别基于所述问答库中的每个问句及所述原始问句,并利用训练好的基于孪生网络的语义相似度计算模型,计算每个问句与所述原始问句的相似度;
根据所述每个问句与所述原始问句的相似度,确定与所述原始问句匹配的目标问句;
将从所述问答库中获取所述目标问句对应的答句,并展示给用户。
优选地,所述分别基于所述问答库中的每个问句及所述原始问句,并利用训练好的基于孪生网络的语义相似度计算模型,计算每个问句与所述原始问句的相似度包括:
分别将每个问句作为所述基于孪生网络的语义相似度计算模型的第一输入,将所述原始问句作为基于孪生网络的语义相似度计算模型的第二输入,并分别计算每个问句与所述原始问句的第一相似度;
分别将每个问句作为所述第二输入,将所述原始问句作为所述第一输入,并分别计算每个问句与所述原始问句的第二相似度;
根据所述每个问句与所述原始问句的第一相似度及所述每个问句与所述原始问句的第二相似度,确定每个问句与所述原始问句的相似度。
优选地,所述根据所述每个问句与所述原始问句的第一相似度及所述每个问句与所述原始问句的第二相似度,确定每个问句与所述原始问句的相似度包括:
将所述每个问句与所述原始问句的第一相似度及所述每个问句与所述原始问句的第二相似度中相似度最大的值作为每个问句与所述原始问句的相似度。
优选地,所述根据所述每个问句与所述原始问句的相似度,确定与所述原始问句匹配的目标问句包括以下至少一种:
基于所述每个问句与所述原始问句的相似度,将最大相似度对应的问句确定为所述目标问句;或
基于所述每个问句与所述原始问句的相似度,确定最大相似度对应的问句,并且在所述最大相似度大于或者等于相似度阈值时,将最大相似度对应的问句确定为所述目标问句;或
基于所述每个问句与所述原始问句的相似度,确定最大相似度对应的问句,并且在所述最大相似度小于相似度阈值时,确定所述问答库中没有与所述原始问句匹配的目标问句。
优选地,所述方法还包括:
训练所述基于孪生网络的语义相似度计算模型;
其中训练所述基于孪生网络的语义相似度计算模型包括:
获取第一预设数量的训练数据;其中所述训练数据包括正样本数据及负样本数据,其中所述正样本数据是前后关联相似的多个语句,所述负样本数据是不相似的多个语句;
从将所述第一预设数量的正样本数据/负样本数据中中选两条语句分别作为所述基于孪生网络的语义相似度计算模型的第一输入及第二输入,再将所述两条语句分别作为所述基于孪生网络的语义相似度计算模型的第二输入及第一输入,并利用第二预设数量的训练数据校验训练后的基于孪生网络的语义相似度计算模型;
利用第二预设数量的训练数据校验训练后的基于孪生网络的语义相似度计算模型,若训练后的基于孪生网络的语义相似度计算模型的计算准确率大于或等于预设阈值,则训练完成;
若训练后的基于孪生网络的语义相似度计算模型的计算准确率小于预设阈值,则发出提醒信息,提醒用户增加样本数量重新训练所述基于孪生网络的语义相似度计算模型。
优选地,所述方法还包括:
在确定没有与所述原始问句匹配的目标问句时,接入人工客服;
获取所述人工客服对所述原始问句输入的回答内容;
将所述原始问句与所述回答内容作为一组问答对添加至所述问答库中。
优选地,在所述问答库中每对问答对应一个主题,所述方法还包括:
获取所述原始问句的主题关键词;
从所述问答库中确定与所述主题关键词匹配的目标主题;
将所述目标主题关联下的问答对展示给用户。
为实现上述目的,本发明还提供一种电子设备,所述电子设备包括存储器和处理器,所述存储器上存储有可在所述处理器上运行的问答匹配程序,所述问答匹配程序被所述处理器执行时实现如下步骤:
获取原始问句;
从问答库中获取所有问句;
分别基于所述问答库中的每个问句及所述原始问句,并利用训练好的基于孪生网络的语义相似度计算模型,计算每个问句与所述原始问句的相似度;
根据所述每个问句与所述原始问句的相似度,确定与所述原始问句匹配的目标问句;
将从所述问答库中获取所述目标问句对应的答句,并展示给用户。
为实现上述目的,本发明还提供一种电子设备,其特征在于,所述电子设备包括:
获取模块,用于获取原始问句;
所述获取模块还用于从问答库中获取所有问句;
计算模块,用于分别基于所述问答库中的每个问句及所述原始问句,并利用训练好的基于孪生网络的语义相似度计算模型,计算每个问句与所述原始问句的相似度;
确定模块,用于根据所述每个问句与所述原始问句的相似度,确定与所述原始问句匹配的目标问句;
展示模块,用于将从所述问答库中获取所述目标问句对应的答句,并展示给用户。
此外,为实现上述目的,本发明还提供一种计算机可读存储介质,所述计算机可读存储介质上存储有问答匹配程序,所述问答匹配程序可被一个或者多个处理器执行,以实现如上所述的问答匹配方法的步骤
本发明通过获取原始问句;从问答库中获取所有问句;分别基于所述问答库中的每个问句及所述原始问句,并利用训练好的基于孪生网络的语义相似度计算模型,计算每个问句与所述原始问句的相似度;根据所述每个问句与所述原始问句的相似度,确定与所述原始问句匹配的目标问句;将从所述问答库中获取所述目标问句对应的答句,并展示给用户。本发明实现了基于孪生网络建立的语义相似度模型,利用相似的传递性,通过一个简单的原输入和对偶输入同时用作孪生网络的预测输出,以提高基于孪生网络的语义相似度的精度,并提高了电子设备对相似的问句搜索准确性,从而提高智能回答用户的问题的准确性。
附图说明
图1为本发明一实施例提供的问答匹配方法的流程示意图;
图2为本发明一实施例提供的电子设备的内部结构示意图;
图3为本发明一实施例提供的问答匹配程序的模块示意图。
本发明目的的实现、功能特点及优点将结合实施例,参照附图做进一步说明。
具体实施方式
应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
本发明一实施例提供问答匹配方法,该方法应用于电子设备中,所述电子设备包括,但不限于医美机器人,终端,电子设备等等。电子设备接收用户输入的问句,并利用训练好的基于孪生网络的语义相似度计算模型计算用户输入的问句与问答库中的问句的相似度,从而找到与用户输入的问句匹配的目标问句。本实施例基于孪生网络建立的语义相似度模型,利用相似的传递性,通过一个简单的原输入和对偶输入同时用作孪生网络的预测输出,以提高基于孪生网络的语义相似度的精度,并提高了电子设备对相似的问句搜索准确性,从而提高智能回答用户的问题的准确性。
以下结合实施例详细阐述本发明的内容。
本发明提供一种问答匹配方法。参照图1所示,为本发明一实施例提供的问答匹配方法的流程示意图,流程示意图应用于电子设备中。该方法可以由一个电子设备执行,该电子设备可以由软件和/或硬件实现。本实施例问答匹配方法并不限于流程图中所示步骤,此外流程图中所示步骤中,某些步骤可以省略、步骤之间的顺序可以改变。
在本实施例中,该问答匹配方法应用于电子设备中,问答匹配方法包括:
S10、获取原始问句。
在本实施例中,电子设备提供用户界面,在用户界面上用户可以输入自己需要回答的问题,所述用户界面上包括文字输入部分和语音输入部分。因此,所述原始问句包括以下至少一种或者多种:文字需求描述及语音需求描述。
在一实施例中,所述原始问句也可以是对用户输入的问句进行处理的语句。例如对用户输入的语句做了降噪处理,等等。
S11、从问答库中获取所有问句。
在一实施例中,问答库中包括多个问答对,每个问句对应至少一个答句。
S12、分别基于所述问答库中的每个问句及所述原始问句,并利用训练好的基于孪生网络的语义相似度计算模型,计算每个问句与所述原始问句的相似度。
在一实施例中,所述分别基于所述问答库中的每个问句及所述原始问句,并利用训练好的基于孪生网络的语义相似度计算模型,计算每个问句与所述原始问句的相似度包括:
分别将每个问句作为所述基于孪生网络的语义相似度计算模型的第一输入,将所述原始问句作为基于孪生网络的语义相似度计算模型的第二输入,并分别计算每个问句与所述原始问句的第一相似度;
分别将每个问句作为所述第二输入,将所述原始问句作为所述第一输入,并分别计算每个问句与所述原始问句的第二相似度;
根据所述每个问句与所述原始问句的第一相似度及所述每个问句与所述原始问句的第二相似度,确定每个问句与所述原始问句的相似度。
在一实施例中,所述根据所述每个问句与所述原始问句的第一相似度及所述每个问句与所述原始问句的第二相似度,确定每个问句与所述原始问句的相似度包括:
将所述每个问句与所述原始问句的第一相似度及所述每个问句与所述原始问句的第二相似度中相似度最大的值作为每个问句与所述原始问句的相似度。
例如,计算第一问句与第二问句的相似度,分别将第一问句作为所述基于孪生网络的语义相似度计算模型的第一输入,将第二问句作为基于孪生网络的语义相似度计算模型的第二输入,得到第一相似度为0.4785;在将第一问句作为所述基于孪生网络的语义相似度计算模型的第二输入,将第二问句作为基于孪生网络的语义相似度计算模型的第一输入,得到第二相似度0.6874,则第一问句与第二问句的相似度为0.6874。
在一实施例中,在训练所述基于孪生网络的语义相似度计算模型包括:
获取第一预设数量的训练数据;其中所述训练数据包括正样本数据及负样本数据,其中所述正样本数据是前后关联相似的多个语句,所述负样本数据是不相似的多个语句;
从将所述第一预设数量的正样本数据/负样本数据中中选两条语句分别作为所述基于孪生网络的语义相似度计算模型的第一输入及第二输入,再将所述两条语句分别作为所述基于孪生网络的语义相似度计算模型的第二输入及第一输入,并利用第二预设数量的训练数据校验训练后的基于孪生网络的语义相似度计算模型;
利用第二预设数量的训练数据校验训练后的基于孪生网络的语义相似度计算模型,若训练后的基于孪生网络的语义相似度计算模型的计算准确率大于或等于预设阈值,则训练完成;
若训练后的基于孪生网络的语义相似度计算模型的计算准确率小于预设阈值,则发出提醒信息,提醒用户增加样本数量重新训练所述基于孪生网络的语义相似度计算模型。
对于孪生网络的训练,将以上类似的句子输入进去训练是目前所有的孪生网络所共有的,但由于权值共享以及相似的传递性,可以将第一语句和第二语句输入孪生网络模型预测得到一个相似度值a,再将第二语句和第一语句输入孪生网络模型预测得到一个相似度值b。利用相似的传递性,通过一个简单的原输入和对偶输入同时用作孪生网络的预测输出,从而提高相似度计算的准确性。
S13、根据所述每个问句与所述原始问句的相似度,确定与所述原始问句匹配的目标问句。
在一实施例中,基于所述每个问句与所述原始问句的相似度,将最大相似度对应的问句确定为所述目标问句。
在一实施例中,基于所述每个问句与所述原始问句的相似度,确定最大相似度对应的问句,并且在所述最大相似度大于或者等于相似度阈值时,将最大相似度对应的问句确定为所述目标问句。在满足最大相似度大于或者等于相似度阈值时,才能表示与用户输入的问句的语义相似。相似度值越大,语义越相似,回答用户的问题就越准确。
在一实施例中,基于所述每个问句与所述原始问句的相似度,确定最大相似度对应的问句,并且在所述最大相似度小于相似度阈值时,确定所述问答库中没有与所述原始问句匹配的目标问句。在最大相似度比较小时,表示问题库没有与用户输入的问句语义相似的问句。如果将直接将最大相似度对应的问句的答句展示给用户,就会让用户觉得答非所问。因此,在在所述最大相似度小于相似度阈值时,转入其他步骤。
在一实施例中,所述方法还包括:
在确定没有与所述原始问句匹配的目标问句时,接入人工客服;
获取所述人工客服对所述原始问句输入的回答内容;
将所述原始问句与所述回答内容作为一组问答对添加至所述问答库中。
由于问答库中没有与用户输入的问句语义相似的问句,此时需要将用户的问句更新到问答库中,这样在下次遇到这种语义类似的问句时,电子设备能够找到相关答句,从而更能丰富问答库的知识。
在一实施例中,在所述问答库中每对问答对应一个主题,所述方法还包括:
获取所述原始问句的主题关键词;
从所述问答库中确定与所述主题关键词匹配的目标主题;
将所述目标主题关联下的问答对展示给用户。
例如用户输入的语句的主题是纹眉,就可以纹眉相关的主题的问答对展示给用户,以便用户能自主选择自己的需求回答。从而更能体现电子设备在自动回答问题的智能化。
S14、将从所述问答库中获取所述目标问句对应的答句,并展示给用户。
本发明通过获取原始问句;从问答库中获取所有问句;分别基于所述问答库中的每个问句及所述原始问句,并利用训练好的基于孪生网络的语义相似度计算模型,计算每个问句与所述原始问句的相似度;根据所述每个问句与所述原始问句的相似度,确定与所述原始问句匹配的目标问句;将从所述问答库中获取所述目标问句对应的答句,并展示给用户。本发明实现了基于孪生网络建立的语义相似度模型,利用相似的传递性,通过一个简单的原输入和对偶输入同时用作孪生网络的预测输出,以提高基于孪生网络的语义相似度的精度,并提高了电子设备对相似的问句搜索准确性,从而提高智能回答用户的问题的准确性。
图2为本发明一实施例提供的电子设备的内部结构示意图;在本实施例中,电子设备1至少包括存储器11、处理器12,通信总线13,以及网络接口14。
在本实施例中,电子设备1可以是个人电脑(Personal Computer,PC),也可以是智能手机、平板电脑、便携计算机、机器人等终端设备。
其中,存储器11至少包括一种类型的可读存储介质,所述可读存储介质包括闪存、硬盘、多媒体卡、卡型存储器(例如,SD或DX存储器等)、磁性存储器、磁盘、光盘等。存储器11在一些实施例中可以是电子设备1的内部存储单元,例如该电子设备1的硬盘。存储器11在另一些实施例中也可以是外部存储设备,例如电子设备1上配备的插接式硬盘,智能存储卡(Smart Media Card,SMC),安全数字(Secure Digital,SD)卡,闪存卡(Flash Card)等。进一步地,存储器11还可以既包括电子设备1的内部存储单元也包括外部存储设备。存储器11不仅可以用于存储安装于电子设备1的应用软件及各类数据,例如问答匹配程序01的代码等,还可以用于暂时地存储已经输出或者将要输出的数据。
处理器12在一些实施例中可以是一中央处理器(Central Processing Unit,CPU)、控制器、微控制器、微处理器或其他数据处理芯片,用于运行存储器11中存储的程序代码或处理数据,例如执行问答匹配程序01等。
通信总线13用于实现这些组件之间的连接通信。
网络接口14可选的可以包括标准的有线接口、无线接口(如WI-FI接口),通常用于在该装置1与其他电子设备之间建立通信连接。
可选地,该电子设备1还可以包括用户接口,用户接口可以包括显示器(Display)、输入单元比如键盘(Keyboard),可选的用户接口还可以包括标准的有线接口、无线接口。可选地,在一些实施例中,显示器可以是LED显示器、液晶显示器、触控式液晶显示器以及OLED(Organic Light-Emitting Diode,有机发光二极管)触摸器等。其中,显示器也可以适当的称为显示屏或显示单元,用于显示处理的信息以及用于显示可视化的用户界面。
图2仅示出了具有组件11-14以及问答匹配程序01的电子设备1,本领域技术人员可以理解的是,图2示出的结构并不构成对电子设备1的限定,可以包括比图示更少或者更多的部件,或者组合某些部件,或者不同的部件布置。
在图2所示的电子设备1实施例中,存储器11中存储有问答匹配程序01;处理器12执行存储器11中存储的问答匹配程序01时实现如下步骤:
获取原始问句;
从问答库中获取所有问句;
分别基于所述问答库中的每个问句及所述原始问句,并利用训练好的基于孪生网络的语义相似度计算模型,计算每个问句与所述原始问句的相似度;
根据所述每个问句与所述原始问句的相似度,确定与所述原始问句匹配的目标问句;
将从所述问答库中获取所述目标问句对应的答句,并展示给用户。
上述步骤被执行时所实现的功能或操作步骤与上述实施例大体相同,在此不再赘述。
可选地,在其他实施例中,问答匹配程序还可以被分割为一个或者多个模块,一个或者多个模块被存储于存储器11中,并由一个或多个处理器(本实施例为处理器12)所执行以完成本发明,本发明所称的模块是指能够完成特定功能的一系列计算机程序指令段,用于描述问答匹配程序在问答匹配装置中的执行过程。
例如,参照图3所示,为本发明电子设备一实施例中的问答匹配程序的程序模块示意图,该实施例中,问答匹配程序可以被分割为获取模块10、计算模块20、确定模块30及展示模块40,示例性地:
获取模块10,用于获取原始问句;
所述获取模块10还用于从问答库中获取所有问句;
计算模块20,用于分别基于所述问答库中的每个问句及所述原始问句,并利用训练好的基于孪生网络的语义相似度计算模型,计算每个问句与所述原始问句的相似度;
确定模块30,用于根据所述每个问句与所述原始问句的相似度,确定与所述原始问句匹配的目标问句;
展示模块40,用于将从所述问答库中获取所述目标问句对应的答句,并展示给用户。
上述获取模块10、计算模块20、确定模块30及展示模块40等程序模块被执行时所实现的功能或操作步骤与上述实施例大体相同,在此不再赘述。
此外,本发明实施例还提出一种计算机可读存储介质,所述计算机可读存储介质上存储有问答匹配程序,所述问答匹配程序可被一个或多个处理器执行,所实现的功能或操作步骤与上述实施例大体相同,在此不再赘述。
需要说明的是,上述本发明实施例序号仅仅为了描述,不代表实施例的优劣。并且本文中的术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、装置、物品或者方法不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、装置、物品或者方法所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括该要素的过程、装置、物品或者方法中还存在另外的相同要素。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在如上所述的一个存储介质(如ROM/RAM、磁碟、光盘)中,包括若干指令用以使得一台终端设备(可以是手机,计算机,电子设备,或者网络设备等)执行本发明各个实施例所述的方法。
以上仅为本发明的优选实施例,并非因此限制本发明的专利范围,凡是利用本发明说明书及附图内容所作的等效结构或等效流程变换,或直接或间接运用在其他相关的技术领域,均同理包括在本发明的专利保护范围内。
Claims (10)
1.一种问答匹配方法,其特征在于,所述方法包括:
获取原始问句;
从问答库中获取所有问句;
分别基于所述问答库中的每个问句及所述原始问句,并利用训练好的基于孪生网络的语义相似度计算模型,计算每个问句与所述原始问句的相似度;
根据所述每个问句与所述原始问句的相似度,确定与所述原始问句匹配的目标问句;
将从所述问答库中获取所述目标问句对应的答句,并展示给用户。
2.如权利要求1所述的问答匹配方法,其特征在于,所述分别基于所述问答库中的每个问句及所述原始问句,并利用训练好的基于孪生网络的语义相似度计算模型,计算每个问句与所述原始问句的相似度包括:
分别将每个问句作为所述基于孪生网络的语义相似度计算模型的第一输入,将所述原始问句作为基于孪生网络的语义相似度计算模型的第二输入,并分别计算每个问句与所述原始问句的第一相似度;
分别将每个问句作为所述第二输入,将所述原始问句作为所述第一输入,并分别计算每个问句与所述原始问句的第二相似度;
根据所述每个问句与所述原始问句的第一相似度及所述每个问句与所述原始问句的第二相似度,确定每个问句与所述原始问句的相似度。
3.如权利要求1所述的问答匹配方法,其特征在于,所述根据所述每个问句与所述原始问句的第一相似度及所述每个问句与所述原始问句的第二相似度,确定每个问句与所述原始问句的相似度包括:
将所述每个问句与所述原始问句的第一相似度及所述每个问句与所述原始问句的第二相似度中相似度最大的值作为每个问句与所述原始问句的相似度。
4.如权利要求1所述的问答匹配方法,其特征在于,所述根据所述每个问句与所述原始问句的相似度,确定与所述原始问句匹配的目标问句包括以下至少一种:
基于所述每个问句与所述原始问句的相似度,将最大相似度对应的问句确定为所述目标问句;或
基于所述每个问句与所述原始问句的相似度,确定最大相似度对应的问句,并且在所述最大相似度大于或者等于相似度阈值时,将最大相似度对应的问句确定为所述目标问句;或
基于所述每个问句与所述原始问句的相似度,确定最大相似度对应的问句,并且在所述最大相似度小于相似度阈值时,确定所述问答库中没有与所述原始问句匹配的目标问句。
5.如权利要求1所述的问答匹配方法,其特征在于,所述方法还包括:
训练所述基于孪生网络的语义相似度计算模型;
其中训练所述基于孪生网络的语义相似度计算模型包括:
获取第一预设数量的训练数据;其中所述训练数据包括正样本数据及负样本数据,其中所述正样本数据是前后关联相似的多个语句,所述负样本数据是不相似的多个语句;
从将所述第一预设数量的正样本数据/负样本数据中中选两条语句分别作为所述基于孪生网络的语义相似度计算模型的第一输入及第二输入,再将所述两条语句分别作为所述基于孪生网络的语义相似度计算模型的第二输入及第一输入,并利用第二预设数量的训练数据校验训练后的基于孪生网络的语义相似度计算模型;
利用第二预设数量的训练数据校验训练后的基于孪生网络的语义相似度计算模型,若训练后的基于孪生网络的语义相似度计算模型的计算准确率大于或等于预设阈值,则训练完成;
若训练后的基于孪生网络的语义相似度计算模型的计算准确率小于预设阈值,则发出提醒信息,提醒用户增加样本数量重新训练所述基于孪生网络的语义相似度计算模型。
6.如权利要求1所述的问答匹配方法,其特征在于,所述方法还包括:
在确定没有与所述原始问句匹配的目标问句时,接入人工客服;
获取所述人工客服对所述原始问句输入的回答内容;
将所述原始问句与所述回答内容作为一组问答对添加至所述问答库中。
7.如权利要求1所述的问答匹配方法,其特征在于,在所述问答库中每对问答对应一个主题,所述方法还包括:
获取所述原始问句的主题关键词;
从所述问答库中确定与所述主题关键词匹配的目标主题;
将所述目标主题关联下的问答对展示给用户。
8.一种电子设备,其特征在于,所述电子设备包括存储器和处理器,所述存储器上存储有可在所述处理器上运行的问答匹配程序,所述问答匹配程序被所述处理器执行时实现如下步骤:
获取原始问句;
从问答库中获取所有问句;
分别基于所述问答库中的每个问句及所述原始问句,并利用训练好的基于孪生网络的语义相似度计算模型,计算每个问句与所述原始问句的相似度;
根据所述每个问句与所述原始问句的相似度,确定与所述原始问句匹配的目标问句;
将从所述问答库中获取所述目标问句对应的答句,并展示给用户。
9.一种电子设备,其特征在于,所述电子设备包括
获取模块,用于获取原始问句;
所述获取模块还用于从问答库中获取所有问句;
计算模块,用于分别基于所述问答库中的每个问句及所述原始问句,并利用训练好的基于孪生网络的语义相似度计算模型,计算每个问句与所述原始问句的相似度;
确定模块,用于根据所述每个问句与所述原始问句的相似度,确定与所述原始问句匹配的目标问句;
展示模块,用于将从所述问答库中获取所述目标问句对应的答句,并展示给用户。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有问答匹配程序,所述问答匹配程序可被一个或者多个处理器执行,以实现如权利要求1至7中任一项所述的问答匹配方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201911327723.1A CN111177349B (zh) | 2019-12-20 | 2019-12-20 | 问答匹配方法、装置、设备及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201911327723.1A CN111177349B (zh) | 2019-12-20 | 2019-12-20 | 问答匹配方法、装置、设备及存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN111177349A true CN111177349A (zh) | 2020-05-19 |
CN111177349B CN111177349B (zh) | 2022-05-17 |
Family
ID=70653958
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201911327723.1A Active CN111177349B (zh) | 2019-12-20 | 2019-12-20 | 问答匹配方法、装置、设备及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111177349B (zh) |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111611781A (zh) * | 2020-05-27 | 2020-09-01 | 北京妙医佳健康科技集团有限公司 | 数据标注方法、问答方法、装置及电子设备 |
CN111930920A (zh) * | 2020-09-30 | 2020-11-13 | 恒生电子股份有限公司 | 基于知识增强处理的faq相似度计算方法、装置及电子设备 |
CN112182175A (zh) * | 2020-09-25 | 2021-01-05 | 北京字节跳动网络技术有限公司 | 智能问答方法、装置、设备及可读存储介质 |
CN112287085A (zh) * | 2020-11-06 | 2021-01-29 | 中国平安财产保险股份有限公司 | 语义匹配方法、系统、设备及存储介质 |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2009003814A (ja) * | 2007-06-22 | 2009-01-08 | National Institute Of Information & Communication Technology | 質問応答方法及びシステム |
CN107273350A (zh) * | 2017-05-16 | 2017-10-20 | 广东电网有限责任公司江门供电局 | 一种实现智能问答的信息处理方法及其装置 |
CN108595619A (zh) * | 2018-04-23 | 2018-09-28 | 海信集团有限公司 | 一种问答方法及设备 |
CN109376847A (zh) * | 2018-08-31 | 2019-02-22 | 深圳壹账通智能科技有限公司 | 用户意图识别方法、装置、终端及计算机可读存储介质 |
CN109829045A (zh) * | 2018-12-30 | 2019-05-31 | 贝壳技术有限公司 | 一种问答方法和装置 |
CN110362665A (zh) * | 2019-06-12 | 2019-10-22 | 深圳追一科技有限公司 | 一种基于语义相似度的问答系统及方法 |
-
2019
- 2019-12-20 CN CN201911327723.1A patent/CN111177349B/zh active Active
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2009003814A (ja) * | 2007-06-22 | 2009-01-08 | National Institute Of Information & Communication Technology | 質問応答方法及びシステム |
CN107273350A (zh) * | 2017-05-16 | 2017-10-20 | 广东电网有限责任公司江门供电局 | 一种实现智能问答的信息处理方法及其装置 |
CN108595619A (zh) * | 2018-04-23 | 2018-09-28 | 海信集团有限公司 | 一种问答方法及设备 |
CN109376847A (zh) * | 2018-08-31 | 2019-02-22 | 深圳壹账通智能科技有限公司 | 用户意图识别方法、装置、终端及计算机可读存储介质 |
CN109829045A (zh) * | 2018-12-30 | 2019-05-31 | 贝壳技术有限公司 | 一种问答方法和装置 |
CN110362665A (zh) * | 2019-06-12 | 2019-10-22 | 深圳追一科技有限公司 | 一种基于语义相似度的问答系统及方法 |
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111611781A (zh) * | 2020-05-27 | 2020-09-01 | 北京妙医佳健康科技集团有限公司 | 数据标注方法、问答方法、装置及电子设备 |
CN111611781B (zh) * | 2020-05-27 | 2023-08-18 | 北京妙医佳健康科技集团有限公司 | 数据标注方法、问答方法、装置及电子设备 |
CN112182175A (zh) * | 2020-09-25 | 2021-01-05 | 北京字节跳动网络技术有限公司 | 智能问答方法、装置、设备及可读存储介质 |
CN111930920A (zh) * | 2020-09-30 | 2020-11-13 | 恒生电子股份有限公司 | 基于知识增强处理的faq相似度计算方法、装置及电子设备 |
CN112287085A (zh) * | 2020-11-06 | 2021-01-29 | 中国平安财产保险股份有限公司 | 语义匹配方法、系统、设备及存储介质 |
CN112287085B (zh) * | 2020-11-06 | 2023-12-05 | 中国平安财产保险股份有限公司 | 语义匹配方法、系统、设备及存储介质 |
Also Published As
Publication number | Publication date |
---|---|
CN111177349B (zh) | 2022-05-17 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111177349B (zh) | 问答匹配方法、装置、设备及存储介质 | |
CN110334272B (zh) | 基于知识图谱的智能问答方法、装置及计算机存储介质 | |
CN108491433B (zh) | 聊天应答方法、电子装置及存储介质 | |
CN110502608B (zh) | 基于知识图谱的人机对话方法及人机对话装置 | |
US20190251087A1 (en) | Method and apparatus for providing aggregate result of question-and-answer information | |
WO2021135455A1 (zh) | 语义召回方法、装置、计算机设备及存储介质 | |
JP6507541B2 (ja) | 情報表示機器、情報表示プログラムおよび情報表示方法 | |
CN111898643A (zh) | 一种语义匹配方法及装置 | |
CN110795548A (zh) | 智能问答方法、装置及计算机可读存储介质 | |
CN112507139B (zh) | 基于知识图谱的问答方法、系统、设备及存储介质 | |
CN112836521A (zh) | 问答匹配方法、装置、计算机设备及存储介质 | |
CN113127621A (zh) | 对话模块的推送方法、装置、设备及存储介质 | |
CN114398910A (zh) | 智能问答方法、装置、设备及存储介质 | |
CN112231452A (zh) | 基于自然语言处理的问答方法、装置、设备及存储介质 | |
US20170249646A1 (en) | Automatically prepopulating answers to questions contained in a computerized document | |
CN110232920B (zh) | 语音处理方法和装置 | |
CN110222144B (zh) | 文本内容提取方法、装置、电子设备及存储介质 | |
CN109033082B (zh) | 语义模型的学习训练方法、装置及计算机可读存储介质 | |
CN114780701A (zh) | 自动问答匹配方法、装置、计算机设备及存储介质 | |
CN111506596A (zh) | 信息检索方法、装置、计算机设备和存储介质 | |
CN111930901B (zh) | 知识点向量获取、推荐题目确定方法及相关装置 | |
CN117932022A (zh) | 一种智能问答方法、装置、电子设备及存储介质 | |
CN111460816B (zh) | 基于语义特征的数据检索方法、电子装置及存储介质 | |
CN113505786A (zh) | 试题拍照评判方法、装置及电子设备 | |
CN110750633A (zh) | 用于确定问题的答案的方法及装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |