CN118113822A - 问答匹配方法、装置、及电子设备 - Google Patents
问答匹配方法、装置、及电子设备 Download PDFInfo
- Publication number
- CN118113822A CN118113822A CN202211530372.6A CN202211530372A CN118113822A CN 118113822 A CN118113822 A CN 118113822A CN 202211530372 A CN202211530372 A CN 202211530372A CN 118113822 A CN118113822 A CN 118113822A
- Authority
- CN
- China
- Prior art keywords
- preset
- target
- feature
- feature vector
- similarity
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 67
- 239000013598 vector Substances 0.000 claims abstract description 180
- 238000012549 training Methods 0.000 claims abstract description 31
- 238000004364 calculation method Methods 0.000 claims description 26
- 230000008569 process Effects 0.000 claims description 23
- 230000009467 reduction Effects 0.000 claims description 21
- 238000012545 processing Methods 0.000 claims description 14
- 239000011159 matrix material Substances 0.000 claims description 10
- 238000004422 calculation algorithm Methods 0.000 claims description 8
- 238000004590 computer program Methods 0.000 claims description 7
- 230000006870 function Effects 0.000 claims description 7
- 238000000513 principal component analysis Methods 0.000 claims description 5
- 238000013473 artificial intelligence Methods 0.000 abstract description 2
- 238000004891 communication Methods 0.000 description 4
- 238000012216 screening Methods 0.000 description 4
- 230000009471 action Effects 0.000 description 3
- 230000000694 effects Effects 0.000 description 3
- 230000000052 comparative effect Effects 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000013459 approach Methods 0.000 description 1
- 230000002457 bidirectional effect Effects 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 230000010365 information processing Effects 0.000 description 1
- 238000012847 principal component analysis method Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/332—Query formulation
- G06F16/3329—Natural language query formulation or dialogue systems
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/31—Indexing; Data structures therefor; Storage structures
- G06F16/316—Indexing structures
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/3331—Query processing
- G06F16/334—Query execution
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N20/00—Machine learning
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Mathematical Physics (AREA)
- Databases & Information Systems (AREA)
- Software Systems (AREA)
- Artificial Intelligence (AREA)
- Computational Linguistics (AREA)
- Evolutionary Computation (AREA)
- Computing Systems (AREA)
- Medical Informatics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Human Computer Interaction (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本申请涉及一种问答匹配方法、装置、及电子设备,涉及人工智能技术领域,包括:将目标问题输入至目标模型,得到所述目标问题的第一特征向量,其中,所述目标模型是基于多个正样本对和多个负样本对的对比学习训练得到的;计算所述第一特征向量与预设问题对应第二特征向量的特征相似度,其中,所述第二特征向量是利用所述预设问题和所述目标模型预先确定的;将与所述目标问题对应所述特征相似度大于预设相似度阈值的预设问题,确定为所述目标问题的相似问题,并返回对应答案。本申请可以提高问答系统中问题匹配的准确率,提升用户体验。
Description
技术领域
本公开涉及人工智能技术领域,尤其涉及到一种问答匹配方法、装置、及电子设备。
背景技术
问答系统(Question Answering,QA)是信息检索系统的一种高级形式,能够用准确、简洁的自然语言回答用户用自然语言提出的问题。基于常见问题集的问答系统(Frequently asked Questions,FAQ)是目前应用最广泛的问答系统。
这种问答系统结构框架清晰、实现较为简单,但其效果取决于构建的问答对数据集的质量以及问句匹配算法。在现有问答匹配中容易匹配到不相关问题,出现答非所问的现象,从而导致问题回答的准确性低,使用户体验不佳。
发明内容
有鉴于此,本申请提供了一种问答匹配方法、装置、及电子设备,可以提高问答系统中问题匹配的准确率,提升用户体验。
根据本申请的一个方面,提供了一种问答匹配方法,包括:
将目标问题输入至目标模型,得到所述目标问题的第一特征向量,其中,所述目标模型是基于多个正样本对和多个负样本对的对比学习训练得到的;
计算所述第一特征向量与预设问题对应第二特征向量的特征相似度,其中,所述第二特征向量是利用所述预设问题和所述目标模型预先确定的;
将与所述目标问题对应所述特征相似度大于预设相似度阈值的预设问题,确定为所述目标问题的相似问题,并返回对应答案。
根据本公开的第二个方面,提供了一种问答匹配装置,包括:
第一输入模块,用于将目标问题输入至目标模型,得到所述目标问题的第一特征向量,其中,所述目标模型是基于多个正样本对和多个负样本对的对比学习训练得到的;
计算模块,用于计算所述第一特征向量与预设问题对应第二特征向量的特征相似度,其中,所述第二特征向量是利用所述预设问题和所述目标模型预先确定的;
确定模块,用于将与所述目标问题对应所述特征相似度大于预设相似度阈值的预设问题,确定为所述目标问题的相似问题,并返回对应答案。
根据本公开的第三个方面,提供了一种电子设备,包括:至少一个处理器;以及与至少一个处理器通信连接的存储器;其中,存储器存储有可被至少一个处理器执行的指令,指令被至少一个处理器执行,以使至少一个处理器能够执行前述第一方面的方法。
根据本公开的第四个方面,提供了一种存储有计算机指令的非瞬时计算机可读存储介质,其中,计算机指令用于使计算机执行前述第一方面的方法。
根据本公开的第五个方面,提供了一种计算机程序产品,包括计算机程序,计算机程序在被处理器执行时实现如前述第一方面的方法。
根据本公开的第六个方面,提供了一种芯片,该芯片包括一个或多个接口电路和一个或多个处理器;接口电路用于从电子设备的存储器接收信号,并向处理器发送信号,信号包括存储器中存储的计算机指令,当处理器执行计算机指令时,使得电子设备执行本公开第一方面实施例中描述的方法。
本公开提供的问答匹配方法、装置、及电子设备,首先可将目标问题输入至目标模型,得到目标问题的第一特征向量,其中,目标模型是基于多个正样本对和多个负样本对的对比学习训练得到的;之后计算第一特征向量与预设问题对应第二特征向量的特征相似度,其中,第二特征向量是利用预设问题和目标模型预先确定的;最后将与目标问题对应特征相似度大于预设相似度阈值的预设问题,确定为目标问题的相似问题,并返回对应答案。本公开中的技术方案,通过预先利用多个正样本对和多个负样本对的对比学习训练目标模型,能够保证目标模型所输出特征向量的精准度,进一步利用目标模型输出的目标问题的第一特征向量和预设问题对应第二特征向量,计算特征相似度,可以提高相似问题的相似度,降低不相似问题的相似度,从而能够提高问答系统中问题匹配的准确率,提升用户体验。
上述说明仅是本申请技术方案的概述,为了能够更清楚了解本申请的技术手段,而可依照说明书的内容予以实施,并且为了让本申请的上述和其它目的、特征和优点能够更明显易懂,以下特举本申请的具体实施方式。
附图说明
此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本公开的实施例,并与说明书一起用于解释本公开的原理。应当理解的是,附图用于更好地理解本方案,不构成对本公开的限定。其中:
图1为本公开实施例提供的一种问答匹配方法的流程示意图;
图2为本公开实施例提供的另一种问答匹配方法的流程示意图;
图3为本公开实施例提供的一种问答匹配装置的结构示意图;
图4为本公开实施例提供的一种问答匹配装置的结构示意图。
具体实施方式
以下结合附图对本公开的示范性实施例做出说明,其中包括本公开实施例的各种细节以助于理解,应当将它们认为仅仅是示范性的。因此,本领域普通技术人员应当认识到,可以对这里描述的实施例做出各种改变和修改,而不会背离本公开的范围和精神。同样,为了清楚和简明,以下的描述中省略了对公知功能和结构的描述。
下面参考附图描述本公开实施例的问答匹配方法、装置、及电子设备。
常见问题集的问答系统(Frequently asked Questions,FAQ)是目前应用最广泛的问答系统。这种问答系统结构框架清晰、实现较为简单,但其效果取决于构建的问答对数据集的质量以及问句匹配算法。在现有问答匹配中容易匹配到不相关问题,出现答非所问的现象,从而导致问题回答的准确性低,使用户体验不佳。
为进行上述技术问题的解决,本发明提供一种问答匹配方法、装置、及电子设备,能够提高问答系统中问题匹配的准确率,提升用户体验。
如图1所示,本公开的实施例提供一种问答匹配方法,包括:
步骤101、将目标问题输入至目标模型,得到目标问题的第一特征向量,其中,目标模型是基于多个正样本对和多个负样本对的对比学习训练得到的。
其中,目标问题为用户输入的待进行问题匹配,以获取问题答案的待解答问题。
对于本公开实施例,在获取到用户上传的目标问题后,可将目标问题输入训练完成的目标模型中,利用目标模型进语义特征识别,输出目标问题对应的第一特征向量。目标模型可为利用多个正样本对和多个负样本对联合训练,得到的能够适用于语义特征向量提取的模型。在目标模型的训练过程中,可获取通用领域的预训练语言模型(即预设语言模型),进而利用多个正样本对和多个负样本对对预训练语言模型进行更深入的任务训练,使其输出的特征向量更为精准,缩小相似问题间的特征差异,同时加大不相似问题间的特征差异。其中,用于训练得到目标模型的预训练语言模型可为通用领域的任意一种预训练语言模型,如语义匹配算法(Bidirectional Encoder Representation from Transformers,BERT)模型,在此不进行具体的限定。正样本对中可包括目标语料和目标语料对应的多个正标签语料,负样本对可包括目标语料和目标语料对应的多个负标签语料,目标语料可为预设的标准问题,目标语料对应的多个正标签语料为与标准问题属于同一语义的相似问题,目标语料对应的多个负标签语料为与标准问题属于不同语义的不相似问题。
相应的,目标模型的训练过程可为:确定用于对比学习的目标语料、目标语料对应的多个正标签语料和多个负标签语料,其中,目标语料为预设的标准问题,正标签语料为标准问题的相似问题,负标签语料为标准问题的不相似问题;利用目标语料和多个正标签语料构建正样本对,利用目标语料和多个负标签语料构建负样本对;基于正样本对和负样本对重复执行下预设语言模型的联合训练过程,直至预设语言模型的多标签损失函数小于预设阈值,将预设语言模型确定为目标模型。预设语言模型的联合训练过程可为:将正样本对和负样本对输入预设语言模型,并调整预设语言模型的模型参数,以使所输出正样本对的特征向量的相似度大于第一预设阈值,且所输出负样本对的特征向量的相似度小于第二预设阈值,其中,第一预设阈值大于第二预设阈值。
其中,预设语言模型的多标签损失函数可为使用了优化后的多标签损失函数,单条训练数据的损失函数可为:
式中,h为目标语料的语义特征向量,hi为负标签语料的语义特征向量,hj为正标签语料的语义特征向量。
步骤102、计算第一特征向量与预设问题对应第二特征向量的特征相似度,其中,第二特征向量是利用预设问题和目标模型预先确定的。
在具体的应用场景中,可预先构建知识库,在知识库中设置多个不同问题类型的标准问题,并针对每一个标准问题衍生出多个用于表达相同语义的相似问题。进一步利用多个标准问题以及多个标准问题中每一个标准问题对应的多个相似问题,一同构建得到本公开中用于与用户录入的目标问题进行相似度匹配的预设问题。为了提高特征相似度的计算速度,可预先利用训练得到的目标模型确定出每个预设问题对应的第二特征向量。对于本公开实施例,可直接将第一特征向量与预先计算得到的每一个预设问题对应的第二特征向量,逐一进行特征相似度的计算。特征相似度越高,代表该预设问题与目标问题越匹配。
步骤103、将与目标问题对应特征相似度大于预设相似度阈值的预设问题,确定为目标问题的相似问题,并返回对应答案。
对于本公开实施例,作为一种可能的实现方式,可在计算目标问题与知识库中每个预设问题的特征相似度后,在预设问题中筛选出对应特征相似度最高或者对应特征相似度大于预设相似度阈值的预设问题,作为目标问题的相似问题,并获取该相似问题对应的预设答案,返回给用户。其中,预设相似度阈值为0到1之间的数值,设置的预设相似度阈值越接近于1,表示所筛选出的相似问题与目标问题的匹配度越高,反之则越低。预设相似度阈值的具体数值可根据实际应用场景进行设定,在此不进行具体的限定。
综上,根据本公开提供的一种问答匹配方法,首先可将目标问题输入至目标模型,得到目标问题的第一特征向量,其中,目标模型是基于多个正样本对和多个负样本对的对比学习训练得到的;之后计算第一特征向量与预设问题对应第二特征向量的特征相似度,其中,第二特征向量是利用目标模型预先确定的;最后根据特征相似度在多个预设问题中筛选目标问题的相似问题,并返回对应答案。本公开中的技术方案,通过预先利用多个正样本对和多个负样本对的对比学习训练目标模型,能够保证目标模型所输出特征向量的精准度,进一步利用目标模型输出的目标问题的第一特征向量和预设问题对应第二特征向量,计算特征相似度,可以提高相似问题的相似度,降低不相似问题的相似度,从而能够提高问答系统中问题匹配的准确率,提升用户体验。
进一步的,作为上述实施例的细化和扩展,为了完整说明本实施例方法的具体实现过程,本实施例提供了如图2所示的具体方法,该方法包括:
步骤201、将目标问题输入至目标模型,得到目标问题的第一特征向量,其中,目标模型是基于多个正样本对和多个负样本对的对比学习训练得到的。
在本公开的模型任务中,将第一个隐藏层的隐藏状态向量和最后一个隐藏层的隐藏状态向量,会有更好的语义表达效果。基于此,对于本公开实施例,在利用目标模型确定目标问题的第一特征向量时,可将用户所上传的目标问题输入目标模型,获取目标模型关于第一个隐藏层的隐藏状态向量和最后一个隐藏层的隐藏状态向量;计算第一个隐藏层和最后一个隐藏层关于隐藏状态向量的平均值,将该平均值确定为目标问题的第一特征向量。
在具体的应用场景中,为了提高特征相似度的计算速度,作为一种可选方式,可对第一特征向量进行特征降维处理,得到目标问题对应预设维度的第一特征向量。其中,第一特征向量的降维维度与第二特征向量的降维维度相同。相应的,实施例步骤可包括:利用主成分分析算法确定第一特征向量对应预设维度的降维矩阵;利用降维矩阵对第一特征向量进行特征降维处理,得到目标问题对应预设维度的第一特征向量。
示例性的,目标模型确定的第一特征向量的维度为768,利用主成分分析方法对第一特征向量进行关键特征提取和降维,得到降维矩阵为768*128,之后利用降维矩阵对第一特征向量进行特征降维处理,得到目标问题对应预设维度的第一特征向量可为128。
步骤202、获取按照预设层级结构构建的多个预设问题关于第二特征向量的向量检索索引。
在具体的应用场景中,为了提高特征相似度的计算速度,可预先利用经过实施例步骤101中训练得到的目标模型确定出每个预设问题对应的第二特征向量。在确定预设问题对应的第二特征向量时,可分别获取目标模型对应第一个隐藏层输出的隐藏状态向量和最后一个隐藏层输出的隐藏状态向量。进而计算第一个隐藏层和最后一个隐藏层关于隐藏状态向量的平均值,将该平均值确定为预设问题的第二特征向量。此外,为了提高特征的匹配速度,在得到预设问题的第二特征向量后,可进一步利用主成分分析算法对第二特征向量进行特征降维处理,得到预设问题对应预设维度的第二特征向量;之后可按照预设层级结构构建多个预设问题关于第二特征向量的向量检索索引。其中,预设层级结构可为树形结构,具体可按照个预设问题的优先级或相应排布规则,配置多个预设问题对应树形结构的层级分布。
其中,在对第二特征向量进行特征降维处理,得到预设问题对应预设维度的第二特征向量时,实施例步骤可包括:利用主成分分析算法确定第二特征向量对应预设维度的降维矩阵;利用降维矩阵对第二特征向量进行特征降维处理,得到预设问题对应预设维度的第二特征向量。其中,第二特征向量的降维维度与第一特征向量的降维维度相同。
对于本公开实施例,在每次执行问答匹配时,可直接获取按照预设层级结构构建的多个预设问题关于第二特征向量的向量检索索引,以便根据向量检索索引快速进行目标问题与预设问题的匹配筛选。
步骤203、基于向量检索索引,按照预设层级结构由高到低的层级顺序,执行第一特征向量与预设问题对应第二特征向量的特征遍历计算过程。
其中,特征遍历计算过程包括:按照预设层级结构由高到低的层级顺序,依次将各个预设问题对应的第二特征向量,确定为待与第一特征向量进行特征相似度计算的目标特征向量;计算第一特征向量与目标特征向量的特征相似度。
例如,预设层级结构共包括三个层级,按照预设层级结构由高到低的层级顺序,在最高层级的第一层级中包含一个预设问题A对应的第二特征向量a,在第二层级中包含两个预设问题对应的第二特征向量:预设问题B对应的第二特征向量b、预设问题C对应的第二特征向量c,且预设问题B的优先级大于预设问题C的优先级;在第三层级种包含两个预设问题对应的第二特征向量:预设问题D对应的第二特征向量d、预设问题E对应的第二特征向量e,且预设问题D的优先级大于预设问题E的优先级。在特征遍历计算过程中,可按照预设层级结构由高到低的层级顺序,依次将各个预设问题(A—B—C—D—E)对应的第二特征向量,确定为待与第一特征向量进行特征相似度计算的目标特征向量,并计算第一特征向量与目标特征向量的特征相似度。
步骤204、将特征遍历计算过程中,与目标问题对应特征相似度大于预设相似度阈值的首个预设问题,确定为目标问题的相似问题。
对于本公开实施例,作为一种可能的实现方式,在进行问题匹配时,可将目标问题与知识库中每个预设问题进行特征相似度的逐一计算,进而筛选出对应特征相似度最高的预设问题,作为目标问题的相似问题。然而此种方式将耗费大量的计算资源,且导致相似问题的筛选效率较低。基于此,作为一种可能的实现方式,还可通过向量检索索引,按照预设层级结构由高到低的层级顺序向下依次进行特征相似度的匹配计算,直到查询到对应特征相似度大于预设相似度阈值的首个预设问题,查询停止,不再继续进行特征相似度的匹配,将查询到的该预设问题确定为目标问题的相似问题,并返回对应答案。此种匹配方式仅需要计算目标问题与部分预设问题的特征相似度,进而可提高匹配速度,且节省计算资源。
例如,承接实施例步骤203的实例,在特征遍历计算过程中,可按照预设层级结构由高到低的层级顺序,依次将各个预设问题(A—B—C—D—E)对应的第二特征向量,确定为待与第一特征向量进行特征相似度计算的目标特征向量,并计算第一特征向量与目标特征向量的特征相似度。若确定预设问题C为与目标问题对应特征相似度大于预设相似度阈值的首个预设问题,则可停止特征遍历计算过程,即不再继续计算预设问题D、E对应的第二特征向量与第一特征向量的特征相似度,直接将预设问题C确定为目标问题的相似问题,并返回预设问题C对应的预设答案,作为对目标问题的问题回答。当知识库中存在大量预设问题时,通过此种特征遍历计算方式,可大大节省计算资源,且提高问题匹配速度。
综上,根据本公开提供的问答匹配方法,可将目标问题输入至目标模型,得到目标问题的第一特征向量,其中,目标模型是基于多个正样本对和多个负样本对的对比学习训练得到的;之后计算第一特征向量与预设问题对应第二特征向量的特征相似度,其中,第二特征向量是利用目标模型预先确定的;最后根据特征相似度在多个预设问题中筛选目标问题的相似问题,并返回对应答案。本公开中的技术方案,通过预先利用多个正样本对和多个负样本对的对比学习训练目标模型,能够保证目标模型所输出特征向量的精准度,进一步利用目标模型输出的目标问题的第一特征向量和预设问题对应第二特征向量,计算特征相似度,可以提高相似问题的相似度,降低不相似问题的相似度,从而能够提高问答系统中问题匹配的准确率,提升用户体验。
基于上述图1、图2所示方法的具体实现,本实施例提供了一种问答匹配装置,如图3所示,该装置包括:第一输入模块31、第一计算模块32、确定模块33;
第一输入模块31,可用于将目标问题输入至目标模型,得到目标问题的第一特征向量,其中,目标模型是基于多个正样本对和多个负样本对的对比学习训练得到的;
第一计算模块32,可用于计算第一特征向量与预设问题对应第二特征向量的特征相似度,其中,第二特征向量是利用预设相似度阈值预设问题和目标模型预先确定的;
确定模块33,可用于将与预设相似度阈值目标问题对应预设相似度阈值特征相似度大于预设相似度阈值的预设问题,确定为预设相似度阈值目标问题的相似问题,并返回对应答案。
在具体的应用场景中,如图4所示,该装置还包括:训练模块34;
训练模块34,可用于确定用于对比学习的目标语料、目标语料对应的多个正标签语料和多个负标签语料,其中,目标语料为预设的标准问题,正标签语料为标准问题的相似问题,负标签语料为标准问题的不相似问题;利用目标语料和多个正标签语料构建正样本对,利用目标语料和多个负标签语料构建负样本对;基于正样本对和负样本对重复执行预设语言模型的联合训练过程,直至预设语言模型的多标签损失函数小于预设阈值,将预设语言模型确定为目标模型。
在具体的应用场景中,预设语言模型的联合训练过程可为:将正样本对和负样本对输入预设语言模型,并调整预设语言模型的模型参数,以使所输出正样本对的特征向量的相似度大于第一预设阈值,且所输出负样本对的特征向量的相似度小于第二预设阈值,其中,第一预设阈值大于第二预设阈值。
在具体的应用场景中,如图4所示,该装置还包括:第二输入模块35、第二计算模块36、处理模块37。
第一输入模块35,可用于将预设问题输入目标模型,获取目标模型关于第一个隐藏层的隐藏状态向量和最后一个隐藏层的隐藏状态向量;
第二计算模块36,可用于计算第一个隐藏层和最后一个隐藏层关于隐藏状态向量的平均值,将平均值确定为预设问题的第二特征向量;
处理模块37,可用于对第二特征向量进行特征降维处理,得到预设问题对应预设维度的第二特征向量。
在具体的应用场景中,处理模块37,可用于利用主成分分析算法确定第二特征向量对应预设维度的降维矩阵;利用降维矩阵对第二特征向量进行特征降维处理,得到预设问题对应预设维度的第二特征向量。
在具体的应用场景中,第一计算模块32,可用于基于向量检索索引,按照预设层级结构由高到低的层级顺序,执行第一特征向量与预设问题对应第二特征向量的特征遍历计算过程;向量检索索引是按照预设层级结构构建的、多个预设问题关于第二特征向量的向量检索索引;
其中,特征遍历计算过程包括:
按照预设层级结构由高到低的层级顺序,依次将各个预设问题对应的第二特征向量,确定为待与第一特征向量进行特征相似度计算的目标特征向量;计算第一特征向量与目标特征向量的特征相似度。
在具体的应用场景中,确定模块33,可用于将特征遍历计算过程中,与目标问题对应特征相似度大于预设相似度阈值的首个预设问题,确定为目标问题的相似问题。
需要说明的是,本实施例提供的一种问答匹配装置所涉及各功能单元的其它相应描述,可以参考图1和图2中的对应描述,在此不再赘述。
基于上述如图1和图2所示方法,相应的,本实施例还提供了一种计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现上述如图1和图2所示的方法。
基于这样的理解,本申请的技术方案可以以软件产品的形式体现出来,该软件产品可以存储在一个非易失性存储介质(可以是CD-ROM,U盘,移动硬盘等)中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本申请各个实施场景的方法。
基于上述如图1和图2所示的方法,以及图3和图4所示的虚拟装置实施例,为了实现上述目的,本申请实施例还提供了一种电子设备,可配置在车辆(如电动汽车)端侧,该设备包括存储介质和处理器;存储介质,用于存储计算机程序;处理器,用于执行计算机程序以实现上述如图1和图2所示的方法。
可选的,上述实体设备还可以包括用户接口、网络接口、摄像头、射频(RadioFrequency,RF)电路,传感器、音频电路、WI-FI模块等等。用户接口可以包括显示屏(Display)、输入单元比如键盘(Keyboard)等,可选用户接口还可以包括USB接口、读卡器接口等。网络接口可选的可以包括标准的有线接口、无线接口(如WI-FI接口)等。
本领域技术人员可以理解,本实施例提供的上述实体设备结构并不构成对该实体设备的限定,可以包括更多或更少的部件,或者组合某些部件,或者不同的部件布置。
存储介质中还可以包括操作系统、网络通信模块。操作系统是管理上述实体设备硬件和软件资源的程序,支持信息处理程序以及其它软件和/或程序的运行。网络通信模块用于实现存储介质内部各组件之间的通信,以及与信息处理实体设备中其它硬件和软件之间通信。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到本申请可以借助软件加必要的通用硬件平台的方式来实现,也可以通过硬件实现。本公开中的技术方案,通过预先利用多个正样本对和多个负样本对的对比学习训练目标模型,能够保证目标模型所输出特征向量的精准度,进一步利用目标模型输出的目标问题的第一特征向量和预设问题对应第二特征向量,计算特征相似度,可以提高相似问题的相似度,降低不相似问题的相似度,从而能够提高问答系统中问题匹配的准确率,提升用户体验。
需要说明的是,在本文中,诸如“第一”和“第二”等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括要素的过程、方法、物品或者设备中还存在另外的相同要素。
以上仅是本申请的具体实施方式,使本领域技术人员能够理解或实现本申请。对这些实施例的多种修改对本领域的技术人员来说将是显而易见的,本文中所定义的一般原理可以在不脱离本申请的精神或范围的情况下,在其它实施例中实现。因此,本申请将不会被限制于本文的这些实施例,而是要符合与本文所申请的原理和新颖特点相一致的最宽的范围。
Claims (12)
1.一种问答匹配方法,其特征在于,包括:
将目标问题输入至目标模型,得到所述目标问题的第一特征向量,其中,所述目标模型是基于多个正样本对和多个负样本对的对比学习训练得到的;
计算所述第一特征向量与预设问题对应第二特征向量的特征相似度,其中,所述第二特征向量是利用所述预设问题和所述目标模型预先确定的;
将与所述目标问题对应所述特征相似度大于预设相似度阈值的预设问题,确定为所述目标问题的相似问题,并返回对应答案。
2.根据权利要求1所述的方法,其特征在于,所述目标模型的训练方法包括:
确定用于对比学习的目标语料、所述目标语料对应的多个正标签语料和多个负标签语料,其中,所述目标语料为预设的标准问题,所述正标签语料为所述标准问题的相似问题,所述负标签语料为所述标准问题的不相似问题;
利用所述目标语料和所述多个正标签语料构建正样本对,利用所述目标语料和所述多个负标签语料构建负样本对;
基于所述正样本对和所述负样本对重复执行预设语言模型的联合训练过程,直至所述预设语言模型的多标签损失函数小于预设阈值,将所述预设语言模型确定为所述目标模型。
3.根据权利要求2所述的方法,其特征在于,所述预设语言模型的联合训练过程,包括:
将所述正样本对和所述负样本对输入所述预设语言模型,并调整所述预设语言模型的模型参数,以使所输出所述正样本对的特征向量的相似度大于第一预设阈值,且所输出所述负样本对的特征向量的相似度小于第二预设阈值,其中,所述第一预设阈值大于所述第二预设阈值。
4.根据权利要求1所述的方法,其特征在于,所述第二特征向量的确定方法包括:
将所述预设问题输入所述目标模型,获取所述目标模型关于第一个隐藏层的隐藏状态向量和最后一个隐藏层的隐藏状态向量;
计算所述第一个隐藏层和所述最后一个隐藏层关于隐藏状态向量的平均值,将所述平均值确定为所述预设问题的第二特征向量;
对所述第二特征向量进行特征降维处理,得到所述预设问题对应预设维度的第二特征向量。
5.根据权利要求4所述的方法,其特征在于,所述对所述第二特征向量进行特征降维处理,得到所述预设问题对应预设维度的第二特征向量,包括:
利用主成分分析算法确定所述第二特征向量对应预设维度的降维矩阵;
利用所述降维矩阵对所述第二特征向量进行特征降维处理,得到所述预设问题对应预设维度的第二特征向量。
6.根据权利要求4所述的方法,其特征在于,所述计算所述第一特征向量与预设问题对应第二特征向量的特征相似度,包括:
基于向量检索索引,按照预设层级结构由高到低的层级顺序,执行所述第一特征向量与预设问题对应第二特征向量的特征遍历计算过程;所述向量检索索引是按照所述预设层级结构构建的、多个预设问题关于所述第二特征向量的向量检索索引;
其中,所述特征遍历计算过程包括:
按照所述预设层级结构由高到低的层级顺序,依次将各个预设问题对应的第二特征向量,确定为待与所述第一特征向量进行特征相似度计算的目标特征向量;计算所述第一特征向量与所述目标特征向量的特征相似度。
7.根据权利要求6所述的方法,其特征在于,所述将与所述目标问题对应所述特征相似度大于预设相似度阈值的预设问题,确定为所述目标问题的相似问题,包括:
将所述特征遍历计算过程中,与所述目标问题对应所述特征相似度大于预设相似度阈值的首个预设问题,确定为所述目标问题的相似问题。
8.一种问答匹配装置,其特征在于,包括:
第一输入模块,用于将目标问题输入至目标模型,得到所述目标问题的第一特征向量,其中,所述目标模型是基于多个正样本对和多个负样本对的对比学习训练得到的;
计算模块,用于计算所述第一特征向量与预设问题对应第二特征向量的特征相似度,其中,所述第二特征向量是利用所述预设问题和所述目标模型预先确定的;
确定模块,用于将与所述目标问题对应所述特征相似度大于预设相似度阈值的预设问题,确定为所述目标问题的相似问题,并返回对应答案。
9.一种电子设备,其特征在于,包括:
至少一个处理器;以及
与所述至少一个处理器通信连接的存储器;其中,
所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行权利要求1-7中任一项所述的方法。
10.一种存储有计算机指令的非瞬时计算机可读存储介质,其特征在于,所述计算机指令用于使所述计算机执行根据权利要求1-7中任一项所述的方法。
11.一种计算机程序产品,其特征在于,包括计算机程序,所述计算机程序在被处理器执行时实现根据权利要求1-7中任一项所述的方法。
12.一种芯片,其特征在于,包括一个或多个接口电路和一个或多个处理器;所述接口电路用于从电子设备的存储器接收信号,并向所述处理器发送所述信号,所述信号包括存储器中存储的计算机指令,当所述处理器执行所述计算机指令时,使得所述电子设备执行权利要求1-7中任一项所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211530372.6A CN118113822A (zh) | 2022-11-30 | 2022-11-30 | 问答匹配方法、装置、及电子设备 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211530372.6A CN118113822A (zh) | 2022-11-30 | 2022-11-30 | 问答匹配方法、装置、及电子设备 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN118113822A true CN118113822A (zh) | 2024-05-31 |
Family
ID=91218495
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202211530372.6A Pending CN118113822A (zh) | 2022-11-30 | 2022-11-30 | 问答匹配方法、装置、及电子设备 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN118113822A (zh) |
-
2022
- 2022-11-30 CN CN202211530372.6A patent/CN118113822A/zh active Pending
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN112164391B (zh) | 语句处理方法、装置、电子设备及存储介质 | |
CN107329949B (zh) | 一种语义匹配方法和系统 | |
CN108846077B (zh) | 问答文本的语义匹配方法、装置、介质及电子设备 | |
CN111046133A (zh) | 基于图谱化知识库的问答方法、设备、存储介质及装置 | |
CN111737426B (zh) | 问答模型的训练方法、计算机设备以及可读存储介质 | |
CN111079418B (zh) | 命名体识别方法、装置、电子设备和存储介质 | |
CN112287069B (zh) | 基于语音语义的信息检索方法、装置及计算机设备 | |
EP3620994A1 (en) | Methods, apparatuses, devices, and computer-readable storage media for determining category of entity | |
US20200364216A1 (en) | Method, apparatus and storage medium for updating model parameter | |
US11461613B2 (en) | Method and apparatus for multi-document question answering | |
CN110134777B (zh) | 问题去重方法、装置、电子设备和计算机可读存储介质 | |
CN111078837A (zh) | 智能问答信息处理方法、电子设备及计算机可读存储介质 | |
CN110162596B (zh) | 自然语言处理的训练方法、装置、自动问答方法和装置 | |
CN112686051B (zh) | 语义识别模型训练方法、识别方法、电子设备、存储介质 | |
CN109492085B (zh) | 基于数据处理的答案确定方法、装置、终端及存储介质 | |
CN110795541A (zh) | 文本查询方法、装置、电子设备及计算机可读存储介质 | |
CN114239805A (zh) | 跨模态检索神经网络及训练方法、装置、电子设备、介质 | |
CN110852071B (zh) | 知识点检测方法、装置、设备及可读存储介质 | |
CN116150306A (zh) | 问答机器人的训练方法、问答方法及装置 | |
CN110969005B (zh) | 一种确定实体语料之间的相似性的方法及装置 | |
CN112307210B (zh) | 一种文档标签预测方法、系统、介质及电子器件 | |
CN113420139B (zh) | 一种文本匹配方法、装置、电子设备及存储介质 | |
CN118113822A (zh) | 问答匹配方法、装置、及电子设备 | |
CN111666770B (zh) | 一种语义匹配方法及装置 | |
CN113963235A (zh) | 一种跨类别图像识别模型重用方法和系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |