CN110674272B - 一种问题答案确定方法及相关装置 - Google Patents

一种问题答案确定方法及相关装置 Download PDF

Info

Publication number
CN110674272B
CN110674272B CN201910838088.7A CN201910838088A CN110674272B CN 110674272 B CN110674272 B CN 110674272B CN 201910838088 A CN201910838088 A CN 201910838088A CN 110674272 B CN110674272 B CN 110674272B
Authority
CN
China
Prior art keywords
candidate
question
entity
statement
determining
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201910838088.7A
Other languages
English (en)
Other versions
CN110674272A (zh
Inventor
李锐
刘权
陈志刚
缪磊
胡国平
王智国
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
iFlytek Co Ltd
Original Assignee
iFlytek Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by iFlytek Co Ltd filed Critical iFlytek Co Ltd
Priority to CN201910838088.7A priority Critical patent/CN110674272B/zh
Publication of CN110674272A publication Critical patent/CN110674272A/zh
Application granted granted Critical
Publication of CN110674272B publication Critical patent/CN110674272B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/332Query formulation
    • G06F16/3329Natural language query formulation or dialogue systems

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Mathematical Physics (AREA)
  • Theoretical Computer Science (AREA)
  • Artificial Intelligence (AREA)
  • Human Computer Interaction (AREA)
  • Computational Linguistics (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本申请实施例公开了一种问题答案确定方法及相关装置,应用于电子设备,其中,该方法包括:获取第一问题语句;确定所述第一问题语句的至少一个主实体,其中主实体为所述第一问题语句的预设句子成分的文本内容;根据所述至少一个主实体和所述第一问题语句确定候选问题集;根据所述候选问题集确定目标候选问题语句;确定所述目标候选问题语句的候选答案为所述第一问题语句的答案。如此,通过确定所述第一问题语句的至少一个主实体,并利用所述候选问题集确定目标候选问题语句,以提高查找问题答案的效率和准确性。

Description

一种问题答案确定方法及相关装置
技术领域
本申请涉及自然语言处理技术领域,具体涉及一种问题答案确定方法及相关装置。
背景技术
随着深度学习在人工智能领域的持续发展,人们普遍期望能用更简单、更自然的方式与机器进行交互,尤其是自然语言处理领域中的智能问答。以自然语言为交互方式的智能机器人广受青睐,而其底层核心技术之一,即为自然语言问答系统。
发明内容
本申请实施例提供了一种问题答案确定方法及相关装置,以期提高问答系统中查找问题答案的效率和可靠性。
第一方面,本申请实施例提供一种问题答案确定方法,其特征在于,应用于一种问答系统,所述方法包括:
获取第一问题语句;
确定所述第一问题语句的至少一个主实体,其中主实体为所述第一问题语句的预设句子成分的文本内容;
根据所述至少一个主实体和所述第一问题语句确定候选问题集,所述候选问题集包括所述至少一个主实体中一个或多个主实体对应的候选问题子集,所述候选问题子集包括至少一个第一候选问题语句,所述至少一个第一候选问题语句中每个第一候选问题语句的主实体的类型与所述每个第一候选问题语句所属候选问题子集对应的主实体的类型相同;
根据所述候选问题集确定目标候选问题语句;
确定所述目标候选问题语句的候选答案为所述第一问题语句的答案。
第二方面,本申请实施例提供一种问题答案确定装置,应用于一种问答系统,所述问题答案确定装置,包括处理单元和通信单元,其中,
所述处理单元,用于通过所述通信单元获取第一问题语句;以及用于确定所述第一问题语句的至少一个主实体,其中主实体为所述第一问题语句的预设句子成分的文本内容;以及用于根据所述至少一个主实体和所述第一问题语句确定候选问题集,所述候选问题集包括所述至少一个主实体中一个或多个主实体对应的候选问题子集,所述候选问题子集包括至少一个第一候选问题语句,所述至少一个第一候选问题语句中每个第一候选问题语句的主实体的类型与所述每个第一候选问题语句所属候选问题子集对应的主实体的类型相同;以及用于根据所述候选问题集确定目标候选问题语句;以及用于确定所述目标候选问题语句的答案为所述第一问题语句的答案。
第三方面,本申请实施例提供了一种电子设备,包括处理器、存储器、通信接口以及一个或多个程序,其中,上述一个或多个程序被存储在上述存储器中,并且被配置由上述处理器执行,上述程序包括用于执行本申请实施例第一方面任一方法中的步骤的指令。
第四方面,本申请实施例提供了一种计算机可读存储介质,其中,上述计算机可读存储介质存储用于电子数据交换的计算机程序,其中,上述计算机程序使得计算机执行如本申请实施例第一方面任一方法中所描述的部分或全部步骤。
第五方面,本申请实施例提供了一种计算机程序产品,其中,上述计算机程序产品包括存储了计算机程序的非瞬时性计算机可读存储介质,上述计算机程序可操作来使计算机执行如本申请实施例第一方面任一方法中所描述的部分或全部步骤。该计算机程序产品可以为一个软件安装包。
可以看出,本申请实施例中,通过确定第一问题语句的至少一个主实体,利用该至少一个主实体和第一问题语句确定候选问题集,由于该候选问题集中包括与第一问题语句的主实体的类型相同的多个候选问题子集,故而能够从该候选问题集中进一步筛选适配当前第一问题语句的目标问题语句,并根据目标问题语句的候选答案确定第一问题语句的答案,且相对于现有技术中的答案确定机制,处理步骤更加简化,有利于提高查找问题答案的效率和准确性。
附图说明
为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1a是本申请实施例提供的一种问答系统的系统架构示意图;
图1b是本申请实施例提供的另一种问答系统的系统架构示意图;
图2a是本申请实施例提供的一种问题答案确定方法的流程示意图;
图2b是本申请实施例提供的一种实体表征模型示意图;
图2c是本申请实施例提供的一种消歧模型的示意图;
图3是本申请实施例提供的一种问题答案确定方法的流程示意图;
图4是本申请实施例提供的一种电子设备的结构示意图;
图5是本申请实施例提供的一种问题答案确定装置的功能单元组成框图。
具体实施方式
为了使本技术领域的人员更好地理解本申请方案,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
本申请的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别不同对象,而不是用于描述特定顺序。此外,术语“包括”和“具有”以及它们任何变形,意图在于覆盖不排他的包含。例如包含了一系列步骤或单元的过程、方法、系统、产品或设备没有限定于已列出的步骤或单元,而是可选地还包括没有列出的步骤或单元,或可选地还包括对于这些过程、方法、产品或设备固有的其他步骤或单元。
在本文中提及“实施例”意味着,结合实施例描述的特定特征、结构或特性可以包含在本申请的至少一个实施例中。在说明书中的各个位置出现该短语并不一定均是指相同的实施例,也不是与其它实施例互斥的独立的或备选的实施例。本领域技术人员显式地和隐式地理解的是,本文所描述的实施例可以与其它实施例相结合。
目前现有的问答系统局限于特定领域,针对其特定的领域构建语义理解模型来获取实体以及意图,语义理解模型多采用模板匹配的方法进行构建,其对于问句进行理解的泛化性较差,存在输入问句与问答系统中的问题答案不匹配的问题,在查找问题进行相似问题匹配时,需要全局进行匹配,查找问题答案不够准确且效率低。
针对上述问题,本申请实施例提供一种问题答案确定方法方法,下面结合附图进行详细介绍。
请参阅图1a,图1a是本申请实施例提供的一种问答系统的系统架构示意图,该问答系统包括本地设备和服务器,所示本地设备与服务器通信连接,用户可以通过本地设备输入问题语句,并将该问题语句发送给服务器,由服务器进行处理得到该问题语句的答案,并回传给本地设备进行输出显示。
请参阅图1b,图1b是本申请实施例提供的另一种问答系统的系统架构示意图,该问答系统可以包括本地设备,用户可以通过本地设备输入问题语句,由本地设备进行处理得到该问题语句的答案,并在该本地设备进行输出显示。
上述本地设备可以包括各种具有无线通信功能的手持设备、车载设备、可穿戴设备(例如智能手表、智能手环、计步器等)、计算设备或连接到无线调制解调器的其他处理设备,以及各种形式的用户设备(User Equipment,UE),移动台(Mobile Station,MS),终端设备(terminal device)等,上述服务器可以云服务器或者传统物理服务器。
为了解决所述问答系统在查找问题答案时的问题,本申请实施例提供一种问题答案确定方法,具体如图2a所示,该方法可以包括但不限于如下步骤:
S201、获取第一问题语句。
其中,所述获取第一问题语句的执行主体可以是图1a中的本地设备或者是图1b中的本地设备。
具体实现中,所述第一问题语句包括:主谓宾结构、主谓宾结构和定语或状语或补语的组合。例如:所述第一问题语句可以是“花是什么?”、“小娜是谁?”、“月季的花期是什么时候?”。
S202、确定所述第一问题语句的至少一个主实体,其中主实体为所述第一问题语句的预设句子成分的文本内容。
具体实现中,所述主实体可以是所述第一问题语句句子成分中的主语、谓语、宾语、定语、状语、补语。例如所述第一问题语句为“月季的花期是什么时候?”所述第一问题语句的主实体可以是“月季”、“花期”、“是”、“什么”、“时候”。所述主实体可以是动词、名词、形容词、数词、量词、代词、副词、介词、连词、助词、拟声词、叹词。
具体实现中,所述主实体是指通用知识领域的词汇,不限于人名、地名、机构名。
S203、根据所述至少一个主实体和所述第一问题语句确定候选问题集,所述候选问题集包括所述至少一个主实体中一个或多个主实体对应的候选问题子集,所述候选问题子集包括至少一个第一候选问题语句,所述至少一个第一候选问题语句中每个第一候选问题语句的主实体的类型与所述每个第一候选问题语句所属候选问题子集对应的主实体的类型相同。
具体实现中,根据所述至少一个主实体和所述第一问题语句确定候选问题集
S204、根据所述候选问题集确定目标候选问题语句。
具体实现中,所述目标候选问题语句从所述候选问题集中的第一候选问题中筛选出来的。
S205、确定所述目标候选问题语句的候选答案为所述第一问题语句的答案。
其中,所述目标候选问题语句的候选答案与所述目标候选问题语句是对应的。
具体实现中,所述目标候选问题语句的答案与所述目标候选问题语句是预先建立好对应关系。
可以看出,本申请实施例中,首先通过确定所述第一问题语句的至少一个主实体,并利用所述至少一个主实体和所述第一问题语句确定候选问题集,并从所述候选问题集中筛选出目标问题语句,确定所述目标问题语句的答案是所述第一问题语句的答案,有利于提高查找问题答案的效率和准确性。
在一个可能的示例中,所述根据所述候选问题集确定目标候选问题语句,包括:计算所述候选问题集中每个第一候选问题语句与所述第一问题语句的相似度;确定所述候选问题集中所述相似度满足第一预设条件的至少一个第二候选问题语句,所述第一预设条件用于约束第一候选问题语句与所述第一问题语句的关联性;若所述至少一个第二候选问题语句包括单个第二候选问题语句,则确定所述单个第二候选问题语句为目标候选问题语句;若所述至少一个第二候选问题语句包括多个第二候选问题语句,则确定所述多个第二候选问题语句中主实体的使用热度满足第二预设条件的至少一个第三候选问题语句,所述第二预设条件用于约束第二候选问题语句的被使用概率;确定所述至少一个第三候选问题语句为目标候选问题语句。
具体实现中,所述相似度的计算通过如下步骤得到:分别计算第一问题语句和至少一个第二候选问题语句中每个第二候选问题语句的句子表征;利用语言模型训练好的词向量(word-embedding)作为输入特征;通过卷积神经网络进行卷积和池化操作,获取到句子的向量化表征,将其转化为一个200维的向量;计算输入问句与每个候选问句之间的余弦距离;得到第一问题语句和至少一个第二候选问题语句中每个第二候选问题语句的相似度。
可见,本示例中,通过相似度和候选问题语句中主实体的使用热度,从所述候选问题集中筛选出与第一问题语句最匹配的目标问题语句,有利于提高查找问题答案的准确性。
在一个可能的示例中,所述第一预设条件是指第二候选问题语句的相似度为多个相似度按照由大到小的顺序排序在前N个的相似度,或者按照由小到大的顺序排序在后N个的相似度,N为正整数;或者,所述第一预设条件是指第二候选问题语句的相似度大于或等于预设阈值;所述第二预设条件是指第三候选问题语句的使用热度为多个使用热度中的最高值。
具体实现中,按照由大到小的顺序排序在前N个的相似度,或者按照由小到大的顺序排序在后N个的相似度,N为正整数,N可以取1、3、5、6、2、8、15。
举例说明,比如所述第一预设条件的示例按照由大到小的顺序排序在前3个的相似度,或者按照由小到大的顺序排序在后3个的相似度,或者相似度得分大于等于0.8。
具体实现中,第三候选问题语句的使用热度为多个使用热度中的最高值,需要根据使用热度对候选答案进行排序。
举例说明,比如第一问题语句为:小娜有多高?第三候选问题语句为:小娜的身高是多少?所述第三候选问题语句、第一问题语句的相似度、候选答案和相关知识库三元组的关系如下表1所示。利用使用热度对候选答案进行排序,由于网球运动员小娜的热度最高,因此这里第三候选问题语句:小娜的身高是多少?的候选答案是“172cm”。
表1
Figure BDA0002192828780000071
在一个可能的示例中,所述根据所述候选问题集确定目标候选问题语句,包括:计算所述候选问题集中每个第一候选问题语句中主实体的使用热度;确定所述候选问题集中所述使用热度满足第一预设条件的至少一个第二候选问题语句,所述第一预设条件用于约束候选问题语句与所述第一问题语句的关联性;若所述至少一个第二候选问题语句包括单个第二候选问题语句,则确定所述单个第二候选问题语句为目标候选问题语句;若所述至少一个第二候选问题语句包括多个第二候选问题语句,则确定所述多个第二候选问题语句中所述相似度满足第二预设条件的至少一个第三候选问题语句,所述第二预设条件用于约束第二候选问题语句的被使用概率;确定所述至少一个第三候选问题语句为目标候选问题语句。
具体实现中,通过所述使用热度与所述相似度的满足不同预设条件,对所述候选问题集确定目标候选问题语句。
可以看出,本示例通过确定所述第一问题语句的至少一个主实体,利用所述至少一个主实体和所述第一问题语句确定候选问题集,从所述候选问题集中筛选出目标问题语句,通过使用热度和相似度确定所述目标问题语句的答案是所述第一问题语句的答案,有利于提高查找问题答案准确性。
在一个可能的示例中,所述第一预设条件是指第二候选问题语句的中主实体的使用热度为多个使用热度按照由大到小的顺序排序在前M个的使用热度,或者按照由小到大的顺序排序在后M个的使用热度,M为正整数;或者,所述第一预设条件是指第二候选问题语句的使用热度大于或等于预设阈值;所述第二预设条件是指第三候选问题语句的相似度为多个相似度中的最高值。
具体实现中,按照由大到小的顺序排序在前M个的使用热度,或者按照由小到大的顺序排序在后M个的相似度,M为正整数,例如M为1、3、5、6、2、8、15,预设阈值为0.9、0.8、0.89、0.97、0.75。
举例说明,比如所述第一预设条件的示例按照由大到小的顺序排序在前5个的使用热度,或者按照由小到大的顺序排序在后5个的使用热度,或者使用热度得分大于等于0.9。
具体实现中,第三候选问题语句的使用热度为多个相似度中的最高值,需要根据相似度对候选答案进行排序。
在一个可能的示例中,所述确定所述第一问题语句的至少一个主实体,包括:将所述第一问题语句进行拆分得到第一候选实体集;将所述第一候选实体集与预设实体集进行匹配,得到匹配后的第二候选实体集,所述预设实体集包括预配置的多个主实体;确定所述第二候选实体集中每个第二候选实体与所述第一问题语句的相关度;根据所述相关度从所述第二候选实体集筛选至少一个第二候选实体,所述至少一个第二候选实体为所述第一问题语句的至少一个主实体。
其中,第一候选实体集包括第一问题语句按字拆分得到实体。
具体实现中,将所述第一问题语句进行拆分得到第一候选实体集,例如,所述第一问题语句为“月季的花期有多长”,拆分得到第一候选实体集中的第一候选实体包括:“月”、“季”、“的”、“花”、“期”、“有”、“多”、“长”、“月季”、“花期”。
其中,所述预设实体集由预先构建的知识库三元组所有主实体构成,所述知识库三元组包含实体、所述实体的属性、属性值。
具体实现中,所述知识库三元组由非结构化文本数据处理得到,例如:小明的哥哥是大明,表示成三元组是<小明、哥哥、大明>,其中“小明”为主实体,“哥哥”为属性,“大明”为属性值。
具体实现中,所述第一候选实体集与预设实体集进行匹配,匹配一致则筛选出来,得到第二候选实体。
具体实现中,利用消歧模型对所述第二候选实体集中每个第二候选实体与所述第一问题语句的相关度进行计算,所述计算策略包括以下方式:预先构建实体表征模型,所述实体表征模型用于消歧模型的初始化;构建消歧模型;通过所示消歧模型对所示第一问题语句和每个第二候选实体的相关度进行计算。
其中,利用消歧模型对所述第二候选实体集中每个第二候选实体与所述第一问题语句的相关度进行计算,需要预先构建实体表征模型。实体表征模型如图2b所示。所述实体表征模型包括实体1的页面信息和实体2页面信息,实体1的页面信息与实体2的页面信息都包括实体描述、信息框的属性名、所述实体的标签类型。实体1的页面信息的实体描述利用转换模型(transformer)获得实体表征向量,实体1的页面信息的信息框的属性名利用自注意力(Self-attention)方案获得属性名的表征向量,实体1的页面信息的实体的标签利用自注意力(Self-attention)方案获得标签的表征向量,实体表征向量、属性名的表征向量和标签的表征向量经过多层感知器神经网络(MLP)-全连层,进行编码(encode)。实体2的页面信息处理方式如实体1的页面信息处理方式。将经过处理的实体1的编码与经过处理的实体2的编码进行相互作用(interact),若与实体1页面信息有关联的实体2页面信息作为正例实体背景,则标记为1;若与实体1页面信息没有关联的实体2页面信息作为负例实体背景,则标记为1。实体1的页面信息和实体2的页面信息,利用百科实体页面中的锚链接,构建训练数据。
具体实现中,利用消歧模型对所述第二候选实体集中每个第二候选实体与所述第一问题语句的相关度进行计算,其中,消歧模型如图2c所示。所述消歧模型包括Q网络和E网络,Q网络输入实体页面中获取与实体相关的句子文本,利用转换模型(transformer)获得实体表征向量,E网络输入经训练的实体表征模型得到的正例实体背景和负例实体背景,正例实体背景的编码(encoding)做E+,负例实体背景的编码(encoding)做E-。通过等级(Rank)模型的合页损失函数(Hinge-Loss)进行训练。第一问题语句与每个候选实体的相关度的计算公式下:
L=max{0,λ,(cos(Q,E+)-cos(Q,E-))},
其中λ人工设定的参数,λ可以取:0.1、0.5、0.34、0.64、0.2,此处λ取0.2。
具体实现中,若最高相关度对应的至少一个第二候选实体包括单个第二候选实体,则所述单个第二候选实体为所述第一问题语句的主实体;若最高相关度对应的至少一个第二候选实体包括多个第二候选实体,则所述多个第二候选实体为所述第一问题语句的多个主实体。
可见,本示例中,通过所述实体表征模型和所述消歧模型计算出候选实体与所述第一问题语句的最高相关度,确定最高相关度的至少一个主实体,便于进一步对至少一个主实体进行扩展策略操作,有利于提高查找问题答案的效率和准确性。
在一个可能的示例中,所述根据所述至少一个主实体和所述第一问题语句确定候选问题集,包括:获取所述至少一个主实体中的每个主实体的属性、属性名和所述属性名的同义词;根据所述属性名、所述属性名的同义词和预设的语句扩展策略,创建一个或多个第一候选问题语句,得到所述每个主实体对应的候选问题子集,所述语句扩展策略包括以下至少一个:同义词替换、句式替换、属性扩展;根据所述至少一个主实体对应的至少一个候选问题子集确定所述第一问题语句的候选问题集。
其中,每个主实体的属性、属性名和所述属性名的同义词从预设的知识库三元组中得到。
具体实现中,通过预先构建的常见属性名集和同义词词典获取所述至少一个主实体中的每个主实体的属性名和所述属性名的同义词。所述句式替换是预先对每个属性名进行人工编写句子模块。
举例来说,比如“小明”代表当前主实体,“身高”和“妻子”是属性名,对每个属性名进行句子模块的人工编写:“身高”:小明的身高是多少、小明有多高;“妻子”:小明的妻子是谁、小明妻子是哪个、谁是小明的妻子。
具体实现中,基于属性名的同义词对句子模块进行同义词替换,得到进一步的。
举例来说,比如“妻子”的同义词是“老婆”、“夫人”,则句子模块可扩展成:妻子:小明的妻子是谁、小明妻子是哪个、谁是小明的妻子、小明的老婆是谁、小明老婆是哪个、谁是小明的老婆、小明的夫人是谁、小明夫人是哪个、谁是小明的夫人,其中“小明”是代表当前主实体。
具体实现中,将主实体及其自身的属性进行候选问题语句扩展,即可得到候选问题语句。
上述通过主实体及其自身的属性进行句式扩展后的示例候选问题语句如下表2所示,其中,主实体以“小明”为例:
表2
Figure BDA0002192828780000111
可以看出,本示例中,通过所述至少一个主实体的属性、属性名及其属性名的同义词对第一问题语句进行同义词替换、句式替换、属性扩展操作,确定候选问题集,增大了候选问题的范围,便于进一步对候选问题集中的候选问题进行筛选,有利于提高查找问题答案准确性。
与上述图2a所示的实施例一致,请参阅图3,图3是本申请实施例提供的一种问题答案确定方法的流程示意图;本问题答案确定方法包括:
S301、获取第一问题语句,并将所述第一问题语句进行拆分得到第一候选实体集。
S302、将所述第一候选实体集与预设实体集进行匹配,得到匹配后的第二候选实体集,并根据所述相关度从所述第二候选实体集筛选至少一个第二候选实体,所述预设实体集包括预配置的多个主实体,所述至少一个第二候选实体为所述第一问题语句的至少一个主实体。
S303、获取所述至少一个主实体中的每个主实体的属性、属性名和所述属性名的同义词;
S304、根据所述属性、所述属性名、所述属性名的同义词和预设的语句扩展策略,创建一个或多个第一候选问题语句,得到所述每个主实体对应的候选问题集。
S305、计算所述候选问题集中每个第一候选问题语句与所述第一问题语句的相似度,并确定所述候选问题集中所述相似度满足第一预设条件的至少一个第二候选问题语句,所述第一预设条件用于约束第一候选问题语句与所述第一问题语句的关联性。
S306、若所述至少一个第二候选问题语句包括单个第二候选问题语句,则确定所述单个第二候选问题语句为目标候选问题语句。
S307、若所述至少一个第二候选问题语句包括多个第二候选问题语句,则确定所述多个第二候选问题语句中主实体的使用热度满足第二预设条件的至少一个第三候选问题语句,所述第二预设条件用于约束第二候选问题语句的被使用概率。
S308、确定所述至少一个第三候选问题语句为目标候选问题语句。
S309、确定所述目标候选问题语句的候选答案为所述第一问题语句的答案。
可以看出,本示例中,通过相关度确定主实体,并通过所述至少一个主实体的属性、属性名及其属性名的同义词对所述第一问题语句进行扩展操作,确定候选问题集,并根据所述第一预设条件和所述第二预设条件从所述候选问题集中筛选出目标问题语句,与现有技术相比,其步骤简化,有利于提高查找问题答案的效率和准确性。
在一个可能的示例中,请参阅图4,图4是本申请实施例提供的一种电子设备400的结构示意图,如图所示,所述电子设备400包括应用处理器410、存储器420、通信接口430以及一个或多个程序421,其中,所述一个或多个程序421被存储在上述存储器420中,并且被配置由上述应用处理器410执行,所述一个或多个程序421包括用于执行以下步骤:
获取第一问题语句;
确定所述第一问题语句的至少一个主实体,其中主实体为所述第一问题语句的预设句子成分的文本内容;
根据所述至少一个主实体和所述第一问题语句确定候选问题集,所述候选问题集包括所述至少一个主实体中一个或多个主实体对应的候选问题子集,所述候选问题子集包括至少一个第一候选问题语句,所述至少一个第一候选问题语句中每个第一候选问题语句的主实体的类型与所述每个第一候选问题语句所属候选问题子集对应的主实体的类型相同;
根据所述候选问题集确定目标候选问题语句;
确定所述目标候选问题语句的候选答案为所述第一问题语句的答案。
可以看出,本示例中,通过根据所述至少一个主实体和所述第一问题语句确定候选问题集,该候选问题集中包含与并根据目标问题语句的候选答案确定第一问题语句的答案,有利于以提高查找问题答案的效率和准确性。
在一个可能的示例中,在所述根据所述候选问题集确定目标候选问题语句方面,所述程序中的指令具体用于执行以下操作:计算所述候选问题集中每个第一候选问题语句与所述第一问题语句的相似度;确定所述候选问题集中所述相似度满足第一预设条件的至少一个第二候选问题语句,所述第一预设条件用于约束第一候选问题语句与所述第一问题语句的关联性;若所述至少一个第二候选问题语句包括单个第二候选问题语句,则确定所述单个第二候选问题语句为目标候选问题语句;若所述至少一个第二候选问题语句包括多个第二候选问题语句,则确定所述多个第二候选问题语句中主实体的使用热度满足第二预设条件的至少一个第三候选问题语句,所述第二预设条件用于约束第二候选问题语句的被使用概率;确定所述至少一个第三候选问题语句为目标候选问题语句。
在一个可能的示例中,所述第一预设条件是指第二候选问题语句的相似度为多个相似度按照由大到小的顺序排序在前N个的相似度,或者按照由小到大的顺序排序在后N个的相似度,N为正整数;或者,所述第一预设条件是指第二候选问题语句的相似度大于或等于预设阈值;所述第二预设条件是指第三候选问题语句的使用热度为多个使用热度中的最高值。
在一个可能的示例中,在所述根据所述候选问题集确定目标候选问题语句方面,所述程序中的指令具体用于执行以下操作:计算所述候选问题集中每个第一候选问题语句中主实体的使用热度;确定所述候选问题集中所述使用热度满足第一预设条件的至少一个第二候选问题语句,所述第一预设条件用于约束候选问题语句与所述第一问题语句的关联性;若所述至少一个第二候选问题语句包括单个第二候选问题语句,则确定所述单个第二候选问题语句为目标候选问题语句;若所述至少一个第二候选问题语句包括多个第二候选问题语句,则确定所述多个第二候选问题语句中所述相似度满足第二预设条件的至少一个第三候选问题语句,所述第二预设条件用于约束第二候选问题语句的被使用概率;确定所述至少一个第三候选问题语句为目标候选问题语句。
在一个可能的示例中,所述第一预设条件是指第二候选问题语句的中主实体的使用热度为多个使用热度按照由大到小的顺序排序在前N个的使用热度,或者按照由小到大的顺序排序在后N个的使用热度,N为正整数,或者,所述第一预设条件是指第二候选问题语句的使用热度大于或等于预设阈值;所述第二预设条件是指第三候选问题语句的相似度为多个相似度中的最高值。
在一个可能的示例中,在所述确定所述第一问题语句的至少一个主实体方面,所述程序中的指令具体用于执行以下操作:将所述第一问题语句进行拆分得到第一候选实体集;将所述第一候选实体集与预设实体集进行匹配,得到匹配后的第二候选实体集,所述预设实体集包括预配置的多个主实体;确定所述第二候选实体集中每个第二候选实体与所述第一问题语句的相关度;根据所述相关度从所述第二候选实体集筛选至少一个第二候选实体,所述至少一个第二候选实体为所述第一问题语句的至少一个主实体。
在一个可能的示例中,在所述根据所述至少一个主实体和所述第一问题语句确定候选问题集方面,所述程序中的指令具体用于执行以下操作:获取所述至少一个主实体中的每个主实体的属性、属性名和所述属性名的同义词;根据所述属性、所述属性名、所述属性名的同义词和预设的语句扩展策略,创建一个或多个第一候选问题语句,得到所述每个主实体对应的候选问题子集,所述语句扩展策略包括以下至少一个:同义词替换、句式替换、属性扩展;根据所述至少一个主实体对应的至少一个候选问题子集确定所述第一问题语句的候选问题集。
上述主要从方法侧执行过程的角度对本申请实施例的方案进行了介绍。可以理解的是,电子设备为了实现上述功能,其包含了执行各个功能相应的硬件结构和/或软件模块。本领域技术人员应该很容易意识到,结合本文中所提供的实施例描述的各示例的单元及算法步骤,本申请能够以硬件或硬件和计算机软件的结合形式来实现。某个功能究竟以硬件还是计算机软件驱动硬件的方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用使用不同方法来实现所描述的功能,但是这种实现不应认为超出本申请的范围。
本申请实施例可以根据上述方法示例对电子设备进行功能单元的划分,例如,可以对应各个功能划分各个功能单元,也可以将两个或两个以上的功能集成在一个处理单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。需要说明的是,本申请实施例中对单元的划分是示意性的,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式。
图5是本申请实施例中所涉及的数据传输装置500的功能单元组成框图。该数据传输装置500应用于混合通信组网系统中的第一电子设备,所述混合通信组网系统包括所述第一电子设备、可见光通信网络、无线高保真Wi-Fi通信网络,所述第一电子设备接入所述可见光通信网络和所述Wi-Fi通信网络;所述数据传输装置包括处理单元501、通信单元502。
其中,所述处理单元,用于通过所述通信单元获取第一问题语句;以及用于确定所述第一问题语句的至少一个主实体,其中主实体为所述第一问题语句的预设句子成分的文本内容;以及用于根据所述至少一个主实体和所述第一问题语句确定候选问题集,所述候选问题集包括所述至少一个主实体中一个或多个主实体对应的候选问题子集,所述候选问题子集包括至少一个第一候选问题语句,所述至少一个第一候选问题语句中每个第一候选问题语句的主实体的类型与所述每个第一候选问题语句所属候选问题子集对应的主实体的类型相同;用于根据所述候选问题集确定目标候选问题语句;以及用于确定所述目标候选问题语句的答案为所述第一问题语句的答案。
在一个可能的示例中,在所述根据所述候选问题集确定目标候选问题语句方面,所述处理单元具体用于:计算所述候选问题集中每个第一候选问题语句与所述第一问题语句的相似度;确定所述候选问题集中所述相似度满足第一预设条件的至少一个第二候选问题语句,所述第一预设条件用于约束第一候选问题语句与所述第一问题语句的关联性;若所述至少一个第二候选问题语句包括单个第二候选问题语句,则确定所述单个第二候选问题语句为目标候选问题语句;若所述至少一个第二候选问题语句包括多个第二候选问题语句,则确定所述多个第二候选问题语句中主实体的使用热度满足第二预设条件的至少一个第三候选问题语句,所述第二预设条件用于约束第二候选问题语句的被使用概率;确定所述至少一个第三候选问题语句为目标候选问题语句。
在一个可能的示例中,所述第一预设条件是指第二候选问题语句的相似度为多个相似度按照由大到小的顺序排序在前N个的相似度,或者按照由小到大的顺序排序在后N个的相似度,N为正整数;或者,所述第一预设条件是指第二候选问题语句的相似度大于或等于预设阈值;所述第二预设条件是指第三候选问题语句的使用热度为多个使用热度中的最高值。
在一个可能的示例中,在所述根据所述候选问题集确定目标候选问题语句方面,所述处理单元具体用于:计算所述候选问题集中每个第一候选问题语句中主实体的使用热度;确定所述候选问题集中所述使用热度满足第一预设条件的至少一个第二候选问题语句,所述第一预设条件用于约束候选问题语句与所述第一问题语句的关联性;若所述至少一个第二候选问题语句包括单个第二候选问题语句,则确定所述单个第二候选问题语句为目标候选问题语句;若所述至少一个第二候选问题语句包括多个第二候选问题语句,则确定所述多个第二候选问题语句中所述相似度满足第二预设条件的至少一个第三候选问题语句,所述第二预设条件用于约束第二候选问题语句的被使用概率;确定所述至少一个第三候选问题语句为目标候选问题语句。
在一个可能的示例中,所述第一预设条件是指第二候选问题语句的中主实体的使用热度为多个使用热度按照由大到小的顺序排序在前N个的使用热度,或者按照由小到大的顺序排序在后N个的使用热度,N为正整数;或者,所述第一预设条件是指第二候选问题语句的使用热度大于或等于预设阈值;所述第二预设条件是指第三候选问题语句的相似度为多个相似度中的最高值。
在一个可能的示例中,在所述确定所述第一问题语句的至少一个主实体方面,所述处理单元具体用于:将所述第一问题语句进行拆分得到第一候选实体集;将所述第一候选实体集与预设实体集进行匹配,得到匹配后的第二候选实体集,所述预设实体集包括预配置的多个主实体;确定所述第二候选实体集中每个第二候选实体与所述第一问题语句的相关度;根据所述相关度从所述第二候选实体集筛选至少一个第二候选实体,所述至少一个第二候选实体为所述第一问题语句的至少一个主实体。
在一个可能的示例中,在所述根据所述至少一个主实体和所述第一问题语句确定候选问题集方面,所述处理单元具体用于:获取所述至少一个主实体中的每个主实体的属性、属性名和所述属性名的同义词;根据所述属性、所述属性名、所述属性名的同义词和预设的语句扩展策略,创建一个或多个第一候选问题语句,得到所述每个主实体对应的候选问题子集,所述语句扩展策略包括以下至少一个:同义词替换、句式替换、属性扩展;根据所述至少一个主实体对应的至少一个候选问题子集确定所述第一问题语句的候选问题集。
其中,所述数据传输装置500还可以包括存储单元503,用于存储电子设备的程序代码和数据。所述处理单元501可以是处理器,所述通信单元502可以是触控显示屏或者收发器,存储单元503可以是存储器。
本申请实施例还提供一种计算机存储介质,其中,该计算机存储介质存储用于电子数据交换的计算机程序,该计算机程序使得计算机执行如上述方法实施例中记载的任一方法的部分或全部步骤,上述计算机包括电子设备。
本申请实施例还提供一种计算机程序产品,上述计算机程序产品包括存储了计算机程序的非瞬时性计算机可读存储介质,上述计算机程序可操作来使计算机执行如上述方法实施例中记载的任一方法的部分或全部步骤。该计算机程序产品可以为一个软件安装包,上述计算机包括电子设备。
需要说明的是,对于前述的各方法实施例,为了简单描述,故将其都表述为一系列的动作组合,但是本领域技术人员应该知悉,本申请并不受所描述的动作顺序的限制,因为依据本申请,某些步骤可以采用其他顺序或者同时进行。其次,本领域技术人员也应该知悉,说明书中所描述的实施例均属于优选实施例,所涉及的动作和模块并不一定是本申请所必须的。
在上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述的部分,可以参见其他实施例的相关描述。
在本申请所提供的几个实施例中,应该理解到,所揭露的装置,可通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如上述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性或其它的形式。
上述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本申请各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
上述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储器中。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储器中,包括若干指令用以使得一台计算机设备(可为个人计算机、服务器或者网络设备等)执行本申请各个实施例上述方法的全部或部分步骤。而前述的存储器包括:U盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、移动硬盘、磁碟或者光盘等各种可以存储程序代码的介质。
本领域普通技术人员可以理解上述实施例的各种方法中的全部或部分步骤是可以通过程序来指令相关的硬件来完成,该程序可以存储于一计算机可读存储器中,存储器可以包括:闪存盘、只读存储器(英文:Read-Only Memory,简称:ROM)、随机存取器(英文:Random Access Memory,简称:RAM)、磁盘或光盘等。
以上对本申请实施例进行了详细介绍,本文中应用了具体个例对本申请的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本申请的方法及其核心思想;同时,对于本领域的一般技术人员,依据本申请的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本申请的限制。

Claims (10)

1.一种问题答案确定方法,其特征在于,包括:
获取第一问题语句;
确定所述第一问题语句的至少一个主实体,其中主实体为所述第一问题语句的预设句子成分的文本内容;
根据所述至少一个主实体和所述第一问题语句确定候选问题集,所述候选问题集包括所述至少一个主实体中一个或多个主实体对应的候选问题子集,所述候选问题子集包括至少一个第一候选问题语句,所述至少一个第一候选问题语句中每个第一候选问题语句的主实体的类型与所述每个第一候选问题语句所属候选问题子集对应的主实体的类型相同;
根据所述候选问题集确定目标候选问题语句;
确定所述目标候选问题语句的候选答案为所述第一问题语句的答案;
确定所述候选问题子集,包括:获取所述至少一个主实体中的每个主实体的属性、属性名和所述属性名的同义词;根据所述属性、所述属性名、所述属性名的同义词和预设的语句扩展策略,创建一个或多个第一候选问题语句,得到所述每个主实体对应的候选问题子集。
2.根据权利要求1所述的方法,其特征在于,所述根据所述候选问题集确定目标候选问题语句,包括:
计算所述候选问题集中每个第一候选问题语句与所述第一问题语句的相似度;
确定所述候选问题集中所述相似度满足第一预设条件的至少一个第二候选问题语句,所述第一预设条件用于约束第一候选问题语句与所述第一问题语句的关联性;
若所述至少一个第二候选问题语句包括单个第二候选问题语句,则确定所述单个第二候选问题语句为目标候选问题语句;
若所述至少一个第二候选问题语句包括多个第二候选问题语句,则确定所述多个第二候选问题语句中主实体的使用热度满足第二预设条件的至少一个第三候选问题语句,所述第二预设条件用于约束第二候选问题语句的被使用概率;
确定所述至少一个第三候选问题语句为目标候选问题语句。
3.根据权利要求2所述的方法,其特征在于,所述第一预设条件是指第二候选问题语句的相似度为多个相似度按照由大到小的顺序排序在前N个的相似度,或者按照由小到大的顺序排序在后N个的相似度,N为正整数;或者,所述第一预设条件是指第二候选问题语句的相似度大于或等于预设阈值;
所述第二预设条件是指第三候选问题语句的使用热度为多个使用热度中的最高值。
4.根据权利要求1所述的方法,其特征在于,所述根据所述候选问题集确定目标候选问题语句,包括:
计算所述候选问题集中每个第一候选问题语句中主实体的使用热度;
确定所述候选问题集中所述使用热度满足第一预设条件的至少一个第二候选问题语句,所述第一预设条件用于约束第一候选问题语句的被使用概率;
若所述至少一个第二候选问题语句包括单个第二候选问题语句,则确定所述单个第二候选问题语句为目标候选问题语句;
若所述至少一个第二候选问题语句包括多个第二候选问题语句,则确定所述多个第二候选问题语句中相似度满足第二预设条件的至少一个第三候选问题语句,所述第二预设条件用于约束第二候选问题语句与所述第一问题语句的关联性;
确定所述至少一个第三候选问题语句为目标候选问题语句。
5.根据权利要求4所述的方法,其特征在于,所述第一预设条件是指第二候选问题语句的中主实体的使用热度为多个使用热度按照由大到小的顺序排序在前N个的使用热度,或者按照由小到大的顺序排序在后N个的使用热度,N为正整数;或者,所述第一预设条件是指第二候选问题语句的使用热度大于或等于预设阈值;
所述第二预设条件是指第三候选问题语句的相似度为多个相似度中的最高值。
6.根据权利要求1-5任一项所述的方法,其特征在于,所述确定所述第一问题语句的至少一个主实体,包括:
将所述第一问题语句进行拆分得到第一候选实体集;
将所述第一候选实体集与预设实体集进行匹配,得到匹配后的第二候选实体集,所述预设实体集包括预配置的多个主实体;
确定所述第二候选实体集中每个第二候选实体与所述第一问题语句的相关度;
根据所述相关度从所述第二候选实体集筛选至少一个第二候选实体,所述至少一个第二候选实体为所述第一问题语句的至少一个主实体。
7.根据权利要求1所述的方法,其特征在于,所述语句扩展策略包括以下至少一个:同义词替换、句式替换、属性扩展;所述根据所述至少一个主实体和所述第一问题语句确定候选问题集,包括:
根据所述至少一个主实体对应的至少一个候选问题子集确定所述第一问题语句的候选问题集。
8.一种问题答案确定装置,其特征在于,包括处理单元和通信单元,其中,所述处理单元,用于通过所述通信单元获取第一问题语句;以及用于确定所述第一问题语句的至少一个主实体,其中主实体为所述第一问题语句的预设句子成分的文本内容;以及用于根据所述至少一个主实体和所述第一问题语句确定候选问题集,所述候选问题集包括所述至少一个主实体中一个或多个主实体对应的候选问题子集,所述候选问题子集包括至少一个第一候选问题语句,所述至少一个第一候选问题语句中每个第一候选问题语句的主实体的类型与所述每个第一候选问题语句所属候选问题子集对应的主实体的类型相同;以及用于根据所述候选问题集确定目标候选问题语句;以及用于确定所述目标候选问题语句的答案为所述第一问题语句的答案;
确定所述候选问题子集,包括:获取所述至少一个主实体中的每个主实体的属性、属性名和所述属性名的同义词;根据所述属性、所述属性名、所述属性名的同义词和预设的语句扩展策略,创建一个或多个第一候选问题语句,得到所述每个主实体对应的候选问题子集。
9.一种电子设备,其特征在于,包括处理器、存储器、通信接口,以及一个或多个程序,所述一个或多个程序被存储在所述存储器中,并且被配置由所述处理器执行,所述程序包括用于执行如权利要求1-7任一项所述的方法中的步骤的指令。
10.一种计算机可读存储介质,其特征在于,存储用于电子数据交换的计算机程序,其中,所述计算机程序使得计算机执行如权利要求1-7任一项所述的方法。
CN201910838088.7A 2019-09-05 2019-09-05 一种问题答案确定方法及相关装置 Active CN110674272B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910838088.7A CN110674272B (zh) 2019-09-05 2019-09-05 一种问题答案确定方法及相关装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910838088.7A CN110674272B (zh) 2019-09-05 2019-09-05 一种问题答案确定方法及相关装置

Publications (2)

Publication Number Publication Date
CN110674272A CN110674272A (zh) 2020-01-10
CN110674272B true CN110674272B (zh) 2022-12-06

Family

ID=69076566

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910838088.7A Active CN110674272B (zh) 2019-09-05 2019-09-05 一种问题答案确定方法及相关装置

Country Status (1)

Country Link
CN (1) CN110674272B (zh)

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111984774B (zh) * 2020-08-11 2024-02-27 北京百度网讯科技有限公司 搜索方法、装置、设备以及存储介质
CN111930913A (zh) * 2020-08-14 2020-11-13 上海茂声智能科技有限公司 一种基于知识图谱的问答方法、系统、装置、设备及介质
CN112163083B (zh) * 2020-10-20 2023-11-03 珠海格力电器股份有限公司 智能问答方法、装置、电子设备和存储介质
CN112685548B (zh) * 2020-12-31 2023-09-08 科大讯飞(北京)有限公司 问题回答方法以及电子设备、存储装置
CN113722465B (zh) * 2021-11-02 2022-01-21 北京卓建智菡科技有限公司 一种意图识别方法及装置
CN114579712B (zh) * 2022-05-05 2022-07-15 中科雨辰科技有限公司 基于动态模型的文本属性提取匹配方法

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109344240A (zh) * 2018-09-21 2019-02-15 联想(北京)有限公司 一种数据处理方法、服务器及电子设备
CN109783624A (zh) * 2018-12-27 2019-05-21 联想(北京)有限公司 基于知识库的答案生成方法、装置和智能会话系统
CN110019698A (zh) * 2017-09-04 2019-07-16 珠海健康云科技有限公司 一种医学问答的智能服务方法及系统

Family Cites Families (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2016121048A1 (ja) * 2015-01-29 2016-08-04 株式会社日立製作所 文章生成装置及び方法
CN105956168B (zh) * 2016-05-20 2019-05-28 北京市农林科学院 一种信息检索方法及信息检索装置
US10607153B2 (en) * 2016-06-28 2020-03-31 International Business Machines Corporation LAT based answer generation using anchor entities and proximity
US9996525B2 (en) * 2016-10-19 2018-06-12 International Business Machines Corporation System and method for supplementing a question answering system with mixed-language source documents
CN106649768B (zh) * 2016-12-27 2021-03-16 北京百度网讯科技有限公司 基于深度问答的问答澄清方法和装置
US10275515B2 (en) * 2017-02-21 2019-04-30 International Business Machines Corporation Question-answer pair generation
CN108304437B (zh) * 2017-09-25 2020-01-31 腾讯科技(深圳)有限公司 一种自动问答方法、装置及存储介质
CN107977415B (zh) * 2017-11-22 2019-02-05 北京寻领科技有限公司 自动问答方法及装置
CN108287822B (zh) * 2018-01-23 2022-03-01 北京容联易通信息技术有限公司 一种中文相似问题生成系统与方法
CN108595619A (zh) * 2018-04-23 2018-09-28 海信集团有限公司 一种问答方法及设备
CN109325040B (zh) * 2018-07-13 2020-11-10 众安信息技术服务有限公司 一种faq问答库泛化方法、装置及设备

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110019698A (zh) * 2017-09-04 2019-07-16 珠海健康云科技有限公司 一种医学问答的智能服务方法及系统
CN109344240A (zh) * 2018-09-21 2019-02-15 联想(北京)有限公司 一种数据处理方法、服务器及电子设备
CN109783624A (zh) * 2018-12-27 2019-05-21 联想(北京)有限公司 基于知识库的答案生成方法、装置和智能会话系统

Also Published As

Publication number Publication date
CN110674272A (zh) 2020-01-10

Similar Documents

Publication Publication Date Title
CN110674272B (zh) 一种问题答案确定方法及相关装置
CN112131366B (zh) 训练文本分类模型及文本分类的方法、装置及存储介质
CN111639163A (zh) 问题生成模型的训练方法、问题生成方法及其相关设备
WO2020233380A1 (zh) 缺失语义补全方法及装置
CN110286778B (zh) 一种中文深度学习输入法、装置及电子设备
CN106484682A (zh) 基于统计的机器翻译方法、装置及电子设备
CN112287069B (zh) 基于语音语义的信息检索方法、装置及计算机设备
CN110866098B (zh) 基于transformer和lstm的机器阅读方法、装置及可读存储介质
CN110795572B (zh) 一种实体对齐方法、装置、设备及介质
CN112199473A (zh) 一种知识问答系统中的多轮对话方法与装置
CN112581327B (zh) 基于知识图谱的法律推荐方法、装置和电子设备
CN114492661B (zh) 文本数据分类方法和装置、计算机设备、存储介质
CN117271736A (zh) 一种问答对的生成方法和系统、电子设备及存储介质
CN113342944B (zh) 一种语料泛化方法、装置、设备及存储介质
CN115129862A (zh) 语句实体处理方法、装置、计算机设备及存储介质
CN116796730A (zh) 基于人工智能的文本纠错方法、装置、设备及存储介质
CN108874786B (zh) 机器翻译方法及装置
US11880664B2 (en) Identifying and transforming text difficult to understand by user
CN111783435A (zh) 共享词汇的选择方法、装置及存储介质
CN113673702B (zh) 一种预训练语言模型的评测方法、装置以及存储介质
CN112016281B (zh) 错误医疗文本的生成方法、装置及存储介质
CN114297353A (zh) 数据处理方法、装置、存储介质及设备
CN111401070B (zh) 词义相似度确定方法及装置、电子设备及存储介质
CN111159339A (zh) 一种文本匹配处理方法和装置
CN114564562B (zh) 基于答案指导的题目生成方法、装置、设备及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant