CN110297897A - 问答处理方法及相关产品 - Google Patents
问答处理方法及相关产品 Download PDFInfo
- Publication number
- CN110297897A CN110297897A CN201910542646.5A CN201910542646A CN110297897A CN 110297897 A CN110297897 A CN 110297897A CN 201910542646 A CN201910542646 A CN 201910542646A CN 110297897 A CN110297897 A CN 110297897A
- Authority
- CN
- China
- Prior art keywords
- question
- answer
- paragraph
- target
- output
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000003672 processing method Methods 0.000 title claims abstract description 38
- 238000012545 processing Methods 0.000 claims abstract description 98
- 238000012549 training Methods 0.000 claims description 113
- 238000005070 sampling Methods 0.000 claims description 31
- 238000000034 method Methods 0.000 claims description 19
- 238000007781 pre-processing Methods 0.000 claims description 8
- 230000003993 interaction Effects 0.000 abstract description 5
- 239000013598 vector Substances 0.000 description 20
- 230000008569 process Effects 0.000 description 12
- 230000006870 function Effects 0.000 description 5
- 230000008878 coupling Effects 0.000 description 3
- 238000010168 coupling process Methods 0.000 description 3
- 238000005859 coupling reaction Methods 0.000 description 3
- 230000006399 behavior Effects 0.000 description 2
- 238000004891 communication Methods 0.000 description 2
- 238000004590 computer program Methods 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 230000007246 mechanism Effects 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 2
- 238000013473 artificial intelligence Methods 0.000 description 1
- 230000002457 bidirectional effect Effects 0.000 description 1
- 238000013500 data storage Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 239000000835 fiber Substances 0.000 description 1
- 239000013505 freshwater Substances 0.000 description 1
- 239000011159 matrix material Substances 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
- 230000026676 system process Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/332—Query formulation
- G06F16/3329—Natural language query formulation or dialogue systems
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Mathematical Physics (AREA)
- Theoretical Computer Science (AREA)
- Artificial Intelligence (AREA)
- Human Computer Interaction (AREA)
- Computational Linguistics (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本申请公开了一种问答处理方法及相关产品。问答处理方法包括获取目标问题;从预设数据库查找与所述目标问题有关的目标相关段落;根据所述目标问题及所述目标相关段落利用问答处理模型生成输出问题和与所述目标问题对应的答案。这样当获取到目标问题之后,不仅可以输出与目标问题对应的答案,还能输出新的输出问题,这样在自动问答的场景中,可以丰富与用户的交互场景。
Description
技术领域
本申请涉及自动问答技术领域,尤其涉及了一种问答处理方法及相关产品。
背景技术
随着大数据和人工智能技术的快速发展,自动回答问题技术广泛应用于各行各业,例如教育、银行等。现有技术中,往往是根据用户输入的问题,然后从相关数据库检索该问题对应的答案,然后输出给用户,功能较单一。
发明内容
本申请实施例提供一种问答处理方法及相关产品。
第一方面,本申请实施例提供了一种问答处理方法,包括:
获取目标问题;
从预设数据库查找与所述目标问题有关的目标相关段落;
根据所述目标问题及所述目标相关段落,利用预先训练的问答处理模型生成输出问题和与所述目标问题对应的答案。
在某些实施例中,所述根据所述目标问题及所述目标相关段落,利用预先训练的问答处理模型生成输出问题和与所述目标问题对应的答案包括:
根据所述目标问题及所述目标相关段落,得到段落隐藏层信息和问题段落对齐信息;
根据所述段落隐藏层信息和所述问题段落对齐信息,得到所述输出问题和与所述目标问题对应的答案。
在某些实施例中,所述问题段落对齐信息包括第一问题段落对齐信息和第二问题段落对齐信息,所述根据所述目标问题及所述目标段落,得到段落隐藏层信息和问题段落对齐信息包括:
对所述目标段落和对应的问答逻辑关系特征进行处理得到段落隐藏层信息,对所述目标问题进行处理得到问题隐藏层信息,所述问答逻辑关系特征是对所述目标段落进行预处理从所述目标段落中提取出的;
对所述问题隐藏层信息和所述段落隐藏层信息进行对齐处理,得到第一问题段落对齐信息;
根据所述第一问题段落对齐信息对所述段落隐藏层信息进行自匹配处理,得到第二问题段落对齐信息;
所述根据所述段落隐藏层信息和所述问题段落对齐信息得到所述输出问题和与所述目标问题对应的答案包括:
根据所述段落隐藏层信息和所述第一问题段落对齐信息得到输出问题,根据所述第二问题段落对齐信息得到与所述目标问题对应的答案。
在某些实施例中,所述根据所述段落隐藏层信息和所述第一问题段落对齐信息得到输出问题包括:
利用变分自编码器对所述段落隐藏层信息和所述第一问题段落对齐信息进行处理,得到输出问题。
在某些实施例中,所述利用变分自编码器对所述段落隐藏层信息和所述第一问题段落对齐信息进行处理,得到输出问题包括:
将所述段落隐藏层信息和所述第一问题段落对齐信息作为变分自编码器的输入数据,利用变分自编码器对所述输入数据进行编码,得到第一中间数据;
获取第一词集和第二词集,所述第一词集中包含多个常见词,所述第二词集为第一子集和第二子集的差集,所述第一子集为所述目标相关段落中的各词汇形成的词集,所述第二子集为预设的高频词汇集;
根据所述第一词集、所述第二词集和所述第一中间数据得到所述输出问题。
在某些实施例中,所述根据所述第二问题段落对齐信息得到与所述目标问题对应的答案包括:
对所述第二问题段落对齐信息进行解码得到第二中间数据;
获取第一词集和第二词集,所述第一词集中包含多个常见词,所述第二词集为第一子集和第二子集的差集,所述第一子集为所述目标相关段落中的各词汇形成的词集,所述第二子集为预设的高频词汇集;
根据所述第一词集、所述第二词集和所述第二中间数据得到与所述目标问题对应的答案。
在某些实施例中,所述问答处理模型的训练方法包括:
获取多个训练数据组,所述多个训练数据组中的每个训练数据组包括样本目标问题、与所述样本目标问题对应的标准答案、包含有与所述标准答案相关的信息的样本相关段落,及所述样本相关段落包含的标准输出问题;
对各训练数据组中的样本段落进行预处理,提取出对应的问答逻辑关系特征;
将所述多个训练数据组中,至少一个训练数据组的样本目标问题、样本相关段落及对应的问答逻辑关系特征作为输入,将与所述样本目标问题对应的标准答案及所述样本相关段落包含的标准输出问题作为期望输出,对预设的待训练模型进行训练得到所述问答处理模型。
在某些实施例中,所述获取多个训练数据组包括:
获取问答知识库,所述问答知识库中包括至少一个标准问答对,每个标准问答对包括问题及对应的答案;
利用所述问答知识库中的标准问答对多次执行预设的训练数据获取操作,得到所述多个训练数据组。
在某些实施例中,所述训练数据获取操作包括:从所述问答知识库中提取一个标准问答对;从第一数据库获得采样文本,所述采样文本包含有与提取的所述标准问答对中的答案对应的文本信息;从所述采样文本中提取出符合问答逻辑要求的采样问答对,得到一个训练数据组,其中,所述训练数据组中的样本目标问题为提取的所述标准问答对中的问题,所述训练数据组中的标准答案为提取的所述标准问答对中的答案,所述训练数据组中的样本相关段落为所述采样文本,所述训练数据组中的标准输出问题为所述采样问答对中的问题;将所述采样问答对作为标准问答对存储至所述问答知识库;其中,每次执行所述训练数据获取操作时,从问答知识库中提取的标准问答对是不同的。
第二方面,本申请还提供一种问答处理系统,包括:
问题获取模块,用于获取目标问题;
段落查找模块,用于从预设数据库查找与所述目标问题有关的目标相关段落;
处理模块,用于根据所述目标问题及所述目标相关段落,利用预先训练的问答处理模型生成输出问题和与所述目标问题对应的答案。
第三方面,本申请实施例还提供一种电子装置,包括处理器、存储器、以及存储在所述存储器上并可被所述处理器执行的问答处理程序,其中所述问答处理程序被所述处理器执行时,实现上述任一项实施例所述的问答处理方法中的步骤的指令。
第四方面,本申请还提供一种计算机可读存储介质,计算机可读存储介质上存储有问答处理程序,其中所述问答处理程序被处理器执行时,实现上述任一项所述的问答处理方法。
本申请的技术方案中,获取目标问题之后,从预设数据库查找与目标问题有关的目标相关段落;根据目标问题及目标相关段落利用问答处理模型生成输出问题和与目标问题对应的答案。这样当获取到目标问题之后,不仅可以输出与目标问题对应的答案,还能输出新的输出问题,这样在自动问答的场景中,可以丰富与用户的交互场景。
附图说明
下面将对本申请实施例涉及的一些附图进行说明。
图1为本申请实施例的电子装置的硬件结构示意图;
图2为本申请实施例的问答处理方法的流程示意图;
图3为本申请实施例的问答处理方法的另一流程示意图;
图4为本申请实施例的问答处理方法的又一流程示意图;
图5为本申请实施例的问答处理方法的再又一流程示意图;
图6为本申请实施例的问答处理方法涉及的问答处理模型的训练过程的流程示意图;
图7为本申请实施例的问答处理方法涉及的问答处理模型的训练过程的另一流程示意图。
具体实施方式
在相关技术中,自动问答系统通常是根据用户输入的问题,从问答数据库中检索与问题对应的答案,然后输出给用户。这样的自动问答系统只能回答用户的问题,功能单一,不能给出除回答问题之外的反馈,显得笨拙。
本申请的问答处理方法,获取目标问题之后,从预设数据库查找与目标问题有关的目标相关段落;根据目标问题及目标相关段落利用问答处理模型生成输出问题和与目标问题对应的答案。这样当获取到目标问题之后,不仅可以输出与目标问题对应的答案,还能输出新的输出问题,这样在自动问答的场景中,可以丰富与用户的交互场景。
下面结合本申请实施例中的附图对本申请实施例进行描述。显然,所描述的实施例是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
请参阅图1,图1是本申请实施例提供的电子装置100的硬件结构示意图。电子装置100包括处理器101、存储器102、输入输出接口103,以及一个或多个程序,一个或多个程序被存储在存储器102中,并且被配置由处理器101执行,程序包括用以下任一实施例的问答处理方法的步骤的指令。电子装置100可以是服务器,也可以是终端。存储器102可以是高速RAM存储器,也可以是稳定的存储器(non-volatile memory),例如磁盘存储器,存储器102可选的还可以是独立于前述处理器101的存储装置。输入输出接口103可选的可以包括标准的有线接口、无线接口(如WI-FI接口)。
请参阅图2,图2是本申请实施例提供的一种问答处理方法的流程示意图,这种方法可包括但不限于如下步骤:
21、获取目标问题;
目标问题可以为用户在自动问答的聊天对话框中,通过自行输入或选择的方式发送的问题;也可以为终端根据用户操作分析用户需求得到的目标问题。
例如,用户可以在终端的自动问答界面直接输入问题“如何保存图片”,那么目标问题则为“如何保存图片”。也可以在检测到用户在打开图片链接的时长超过预设时长的时候,由于用户一直停留在显示该图片的界面而无其他操作,则可以根据用户的这种操作行为,分析用户可能需要保存图片,终端将“如何保存图片”发送至问答处理系统作为目标问题。
22、从预设数据库查找与目标问题有关的目标相关段落;
可以利用搜索引擎查找与目标问题有关的目标相关段落。例如可以先从目标问题的文本中提取出搜索关键词,然后根据搜索关键词从预设数据库搜索与搜索关键词有关的段落,并根据各关键词的权重及频率的乘积计算各个有关的段落的相关度值,将相关度值最高的段落作为目标相关段落。预设数据库可以是本地的数据库,也可以是云端的数据库。
预设数据库可以为不断更新的数据库,例如可以按时更新或按需更新。预设数据库例如可以为互联网上的各类信息构成的数据库。那么,步骤22中可利用搜索引擎从互联网上查找与目标问题有关的目标相关段落。
还可以对常见问题进行分类,为各类型常见问题预先建立对应的分类段落数据库。还可以在获取目标问题时,也获取目标问题的分类信息,然后根据目标问题的分类信息找到与分类信息对应的分类数据库,然后从与目标问题的分类信息对应的分类数据库中查找与目标问题有关的目标相关段落。
23、根据目标问题及目标相关段落,利用预先训练的问答处理模型生成输出问题和与目标问题对应的答案。
问答处理模型可根据输入的目标问题及目标相关段落,从目标相关段落获得输出问题和与目标问题对应的答案并输出。输出问题为与目标问题不同的新问题。
本申请的问答处理方法,获取目标问题之后,从预设数据库查找与目标问题有关的目标相关段落;根据目标问题及目标相关段落利用问答处理模型生成输出问题和与目标问题对应的答案。这样当获取到目标问题之后,不仅可以输出与目标问题对应的答案,还能输出新的输出问题,这样在自动问答的场景中,可以丰富与用户的交互场景。
在一个例子中,目标问题为“苏州为什么被称为东方威尼斯”,在获得目标问题之后,可利用搜索引擎搜索与“苏州为什么被称为东方威尼斯”有关的段落,并从有关的段落中选择出强相关的作为目标相关段落。在这个例子中,找到的目标相关段落为“苏州位于江苏省南部的长三角中部,东邻上海,南邻浙江、西邻无锡市,北邻长江。由于42%的城市面积被积水覆盖,包括大量的池塘和溪流,苏州被誉为东方威尼斯。太湖,其中五分之四位于苏州境内,是中国四大淡水湖之一,附近有东山,西山等景区。这座城市由北京至南京的京杭大运河切断。连同其温和的气候,使其成为全年可用的目的地,其还拥有肥沃的景观和丰富的产品,难怪苏州被称为人间天堂”。那么将该目标问题和该目标相关段落输入问答处理模型之后,可得到与目标问题对应的答案“因为苏州42%的城市面积被积水覆盖,包括大量的池塘和溪流”和输出问题“为什么苏州被称为人间天堂”。
进一步地,本申请实施例的问答处理方法,还可以用于通过分析用户操作获得目标问题,在这样的场景中,也能够在提供解决方案的同时,对用户进一步询问,以更好地采集用户数据及获取用户需求。
在另一个例子中,终端在检测到用户在打开图片链接的时长超过预设时长的时候,由于用户一直停留在显示该图片的界面而无其他操作,则可以根据用户的这种操作行为,分析用户可能需要保存图片,终端将“如何保存图片”的询问请求发送至问答处理系统,问答处理系统获取到“如何保存图片”的询问指令之后将“如何保存图片”作为目标问题,执行本申请实施例的问答处理方法的步骤来获得与目标问题对应的答案和输出问题。
具体地,可以从预设数据库查找与目标问题“如何保存图片”有关的目标相关段落,预设数据库例如可以是预设的包含有多个常见问题的解决方法的数据库。本实施例中找到的目标相关段落为“用户可通过长按图片将图片保存。当用户将图片保存之后,可以通过对终端执行摇一摇的操作进入图片编辑页面,以实现编辑图片”。那么问答处理系统将该目标问题和该目标相关段落经问答处理模型处理之后,可以得到与目标问题对应的答案“长按图片将图片保存”和输出问题“如何编辑图片”,终端可以在获得问答处理系统得到的输出问题“如何编辑图片”之后,将该输出问题显示出来,以询问用户是否需要知道“如何编辑图片”的解决方案。那么这样就可以实现预测用户下一步的问题,无需用户手动多次输入问题。
请参阅图3,在某些实施例中,根据目标问题及目标相关段落,利用预先训练的问答处理模型生成输出问题和与目标问题对应的答案具体包括以下步骤:
231、根据目标问题及目标相关段落,得到段落隐藏层信息和问题段落对齐信息;
具体地,可根据目标相关段落得到段落隐藏层信息、根据目标问题及段落隐藏层信息得到问题段落对齐信息。段落隐藏层信息可以理解为对目标相关段落进行处理得到的段落隐藏层向量。可利用注意力机制对目标问题及段落隐藏层向量进行处理得到问题段落对齐信息。
232、根据段落隐藏层信息、问题段落对齐信息,得到输出问题和与目标问题对应的答案。
问题段落对齐信息包含目标相关段落中与目标问题有关的信息,从而可以根据问题段落对齐信息得到与目标问题对应的答案。段落隐藏层信息是包含有段落文本信息的向量,问题段落对齐信息中包含了目标问题与段落中对应的内容之间的行文关系信息。那么可根据段落隐藏层信息得到输出问题的内容信息、根据目标问题与段落中对应的内容之间的行文关系得到输出问题的句式信息,将输出问题的内容信息和输出问题的句式信息结合得到输出问题。
请参阅图4,基于上述实施例,在某些实施例中,根据目标问题及目标相关段落,得到段落隐藏层信息和问题段落对齐信息具体包括以下步骤:
2311、对目标段落和对应的问答逻辑关系特征进行处理得到段落隐藏层信息,和对目标问题进行处理得到问题隐藏层信息。
问答逻辑关系特征是对目标段落进行预处理从目标段落中提取出的。问答逻辑关系特征可以通过分析目标段落的中体现问答逻辑关系的句式、语意得到。体现问答逻辑关系的句式例如可以包括“因为……,所以……”、“由于……。使得……”、“通过……,达到……的目的”等。
步骤2311在问答处理模型中对应的层级可以理解为编码表示层,也即是说,步骤2311可以由问答处理模型中的编码表示层实现。具体地可以为,编码表示层对目标段落和问答逻辑关系进行编码得到段落隐藏层向量作为段落隐藏层信息,对目标问题进行编码得到问题隐藏层向量作为问题隐藏层信息。编码表示层具体可以包括第一BiLSTM(双向长短记忆)网络。公式如下:
其中,为段落隐藏层向量,为目标相关段落的词向量,ft c为目标相关段落对应的问答逻辑特征;为问题隐藏层向量,为目标问题的词向量。
2312、对问题隐藏层信息和段落隐藏层信息进行对齐处理,得到第一问题段落对齐信息;
第一问题段落对齐信息中,包含目标相关段落中与目标问题有关的相关信息,例如与目标问题有关的关键词信息及对应的上下文信息、问题与对应的问答逻辑特征的对应关系等。
步骤2312可以与问答处理模型的问题-段落注意力对齐层对应,也即,步骤2312可以由问答处理模型的问题-段落注意力对齐层实现。具体可以为,问题-段落注意力对齐层通过注意力(attention)机制来对问题隐藏层信息和段落隐藏层信息进行对齐处理的得到的包含有上下文信息的第一问题段落对齐向量作为第一问题段落对齐信息。
对齐模型对齐权重
第一问题段落对齐向量
其中,为问题隐藏层向量,为段落隐藏向量。wA,wC,battn为在问答处理模型的训练阶段通过训练得到的超参数。
2313、根据第一问题段落对齐信息对段落隐藏层信息进行自匹配处理,得到第二问题段落对齐信息;
第二问题段落对齐信息中包含了与目标问题强相关的重要信息和目标相关段落中其他重要的信息。第一问题段落对齐信息中的与问题有关的信息可能有一些不是与问题强相关,而且第一问题段落对齐信息中可能也仅仅只包含了目标相关段落中与目标问题有关的信息,而忽略了其他重要的内容。那么可根据第一问题段落对齐信息,对段落隐藏层进行段落自匹配,并对第一问题段落对齐信息进一步提取得到与目标问题强相关的重要信息和目标相关段落中其他重要的信息。
步骤2313可与问答处理模型中的段落自匹配层对应,也即,步骤2313可以由问答处理模型中的段落自匹配层实现。具体可以为,可先对段落隐藏层向量进行段落自匹配处理得到段落自匹配向量,然后将段落自匹配向量和第一问题段落对齐信息输入第二BiLSTM网络得到第二问题段落对齐向量作为第二问题段落信息。具体算法如下:
其中,表示段落自匹配对齐向量,为段落隐藏层向量,At,i为段落自匹配的对齐权重矩阵,At,i可在问答处理模型的训练过程得到。
第二问题段落对齐向量
需要说明的是,第二BiLSTM网络与第一BiLSTM网络虽然计算整体框架相同,但是BiLSTM网络中的具体参数不同,第一BiLSTM网络和第二BiLSTM网络中的具体参数可在问答处理模型的训练过程得到。
根据段落隐藏层信息和问题段落对齐信息,得到输出问题和与目标问题对应的答案具体包括:
2321、根据段落隐藏层信息和第一问题段落对齐信息得到输出问题,根据第二问题段落对齐信息得到与目标问题对应的答案。
段落隐藏层信息中包含了问答逻辑关系特征和问答逻辑关系特征对应的上下文关系,第一问题段落对齐信息中包含了目标问题与段落中对应的内容之间的行文关系信息。那么可根据问答逻辑关系特征对应的上下文关系的输出问题的内容信息、目标问题与段落中对应的内容之间的行文关系得到输出问题的句式,将两者结合得到输出问题。第二段落对齐信息中与目标问题强相关的内容和目标相关段落中其他重要的内容,那么可以根据第二段落对齐信息中与目标问题强相关的信息和目标相关段落中其他重要的信息,得到与目标问题对应的答案。
步骤2321可以由问答处理模型中的解码输出层实现。解码输出层用于根据段落隐藏层信息和第一问题段落对齐信息得到输出问题,根据第二问题段落对齐信息得到与目标问题对应的答案。具体地,解码输出层可利用变分自编码器对段落隐藏层信息和第一问题段落对齐信息进行处理得到输出问题,这样可以使得输出的数据与输入的数据的内容存在差异,这样可以避免输出问题与目标问题相同,保证输出问题的有效性。当然,在其他实施例中,也可以利用其它解码器对段落隐藏层信息和第一问题段落对齐信息进行处理得到输出问题。
在一个实施例中,根据段落隐藏层信息和第一问题段落对齐信息得到输出问题包括:将段落隐藏层信息和第一问题段落对齐信息作为变分自编码器的输入数据,利用变分自编码器对输入数据进行编码得到第一中间数据;获取第一词集和第二词集,第一词集中包含多个常见词,第二词集为第一子集和第二子集的差集,第一子集为目标相关段落中的各词汇形成的词集,第二子集为预设的高频词汇集;根据第一词集、第二词集和第一中间数据得到输出问题。目标相关段落中的各词汇形成的词集与预设的高频词汇集的差集为目标相关段落中的各词汇形成的词集中的低频词,这样将经过变分自编码器编码得到的第一中间数据、低频词信息和常见词结合之后再解码输出,可更加有效地确保输出的输出问题与目标问题不同,也能够使得输出问题语句更通顺。第一词集中例如可以但不限于包含“的”、“地”、“和”、“可”等常用的虚词,还可以包括“输入”、“输出”、“处理”等常用的实词。
在另一个实施例中,根据第二问题段落对齐信息得到与目标问题对应的答案包括:对第二问题段落对齐信息进行解码得到第二中间数据;获取第一词集和第二词集,第一词集中包含多个常见词,第二词集为第一子集和第二子集的差集,第一子集为目标相关段落中的各词汇形成的词集,第二子集为预设的高频词汇集;根据第一词集、第二词集和第二中间数据得到与目标问题对应的答案。这样,在生成答案时,将对第二问题段落对齐信息进行编码得到的第二中间数据、低频词和常见词结合之后,再形成输出答案,可以避免输出的答案中由有连续重复的词汇,使得输出的答案的语序更加符合语言使用习惯。在本实施例中,也可以利用变分自编码器对第二问题段落对齐信息进行编码得到第二中间数据。第一词集中例如可以但不限于包含“的”、“地”、“和”、“可”等常用的虚词,还可以包括“输入”、“输出”、“处理”等常用的实词。
请参阅图5,在进一步的实施例中,在步骤23之后,问答处理方法还包括:
24、将目标问题及对应的答案作为一组问答数据对保存至问答数据库;
25、执行预设操作,预设操作包括以下操作:获取问答处理模型前一次的输出结果中的输出问题,从预设数据库查找与输出问题有关的目标段落,将输出问题和与输出问题有关的目标段落导入问答处理模型,得到本次的输出结果,将本次的输出结果中的答案和前一次输出结果中的输出问题作为一组问答数据对保存至问答数据库;
本实施例中,执行预设操作时,问答处理模型的处理过程可以参照上述实施例,为避免冗余,在此不再赘述。
需要说明的是,每次执行预设操作的输出结果中,可以包括一个输出问题,也可以包括多个输出问题,当输出结果中包括多个输出问题时,在下一次执行预设操作时,分别获取各输出问题对应的答案。
26、判断执行预设操作的次数是否大于或等于预设次数;
若执行预设操作的次数小于预设次数,则返回步骤25;
27、若执行预设操作的次数大于或等于预设次数,则输出包含有一组或多组问答数据对的问答数据库。
本申请实施例的问答处理方法还可以用于形成问答数据库或扩充问答数据库。可以理解,每执行一次预设操作,可以得到问答处理模型上一次输出的输出问题对应的答案和至少一个新的问题,这样循环执行预设操作,则可以得到多个问题和对应的答案。将这些问题和对应的答案保存至问答数据库中,即可得到包含有一组或多组问答数据对的问答数据库。问答数据库可以用于其他实施方式的自动问答过程,例如可以在获取到问题之后,从问答数据库直接查找与问题对应的答案。
问答处理模型可在步骤23之前通过训练得到,问答处理模型的训练过程可以由本申请实施例的电子装置完成,也可以由其他电子装置完成。可在完成训练得到问答处理模型之后,将问答处理模型存储在预设地址,该预设地址可以是本地地址,也可以是云端地址。本申请的问答处理系统或电子装置实现本申请的问答处理方法时,从预设地址调用该问答处理模型以得到输出问题和与输出问题对应的答案。
具体地,可利用多个训练数据组对预设的待训练模型进行训练得到问答处理模型,请参阅图6,问答处理模型的训练方法包括:
31、获取多个训练数据组,多个训练数据组中的每个训练数据组包括样本目标问题、与样本目标问题对应的标准答案、包含有与标准答案相关的信息的样本相关段落,及样本相关段落包含的标准输出问题;
32、对各训练数据组中的样本段落进行预处理提取出对应的问答逻辑关系特征;
33、将多个训练数据组中至少一个训练数据组的样本目标问题、样本相关段落及对应的问答逻辑关系特征作为输入,将与样本目标问题对应的标准答案及样本相关段落包含的标准输出问题作为期望输出,对预设的待训练模型进行训练得到问答处理模型。
具体地,获取多个训练数据组包括:获取问答知识库,问答知识库中包括至少一个标准问答对,每个标准问答对包括问题及对应的答案;利用问答知识库中的标准问答对多次执行预设的训练数据获取操作,得到多个训练数据组。
可以从问答数据库中提取问题及对应的答案作为问答知识库中的标准问答对中的问题及对应的答案,问答数据库例如可以是但不限于是通过上述步骤24-27获得的。
问答知识库中的标准问答对还可以由相应领域的专业人员人工设置。例如需要获得某个领域的问答处理模型,那么需要先获得该领域的多个训练数据组,可以由该领域的专业人士设定该领域强相关的多个标准问答对。这样利用该领域的多个标准问答对得到的多个训练数据组与该领域关联度较大,从而可以使得利用该多个训练数据组进行训练得到问答处理模型能够更准确地输出与输入问题对应的答案。
进一步地,训练数据获取操作包括:从问答知识库中提取一个标准问答对;从第一数据库获得采样文本,采样文本包含有与提取的标准问答对中的答案对应的文本信息;从采样文本中提取出符合问答逻辑要求的采样问答对,得到一个训练数据组,其中,训练数据组中的样本目标问题为提取的标准问答对中的问题,训练数据组中的标准答案为提取的标准问答对中的答案,训练数据组中的样本相关段落为采样文本,训练数据组中的标准输出问题为采样问答对中的问题;将采样问答对作为标准问答对存储至问答知识库。其中,每次执行训练数据获取操作时,从问答知识库中提取的标准问答对是不同的。
每次执行训练数据获取操作时,从问答知识库中提取的标准问答对是不同的,每次执行训练数据获取操作时,是从经过上一次训练操作之后得到的问答知识库中,提取目标问答对。
需要说明的是,在多次执行训练数据获取操作时,执行一次训练数据获取操作,得到一个标准问答对,将该标准问答对存储至问答知识库之后,得到更新后的问答知识库,下一次执行训练数据获取操作时,从更新后的问答知识库中提取一个未处理过的标准问答对。
第一数据库例如可以是互联网上的各类信息构成的数据库。可利用搜索引擎从互联网获得包含有与标准问答对中的答案对应的文本信息的采样文本。从第一数据库获得采样文本时,可以先从第一数据库获得包含有关文本,该有关文本包含有与提取的标准问答对中的答案对应的文本信息,然后再从该有关文本中,提取出包含有标准问答对中的答案对应的文本信息的文本段落作为采样文本。
例如,当提取的标准问答对的问题为Q,答案为AS,第一数据库为互联网上的各类信息构成的数据库时,可利用搜索引擎从互联网上搜索包含有Q和AS的有关文本,然后在从找到的有关文本中截取包含有AS的段落作为采样文本。
当然,在其他实施例中,也可以直接从第一数据库获得包含有标准问答对中的答案对应的文本信息的文本段落,并作为采样文本。
问答逻辑要求可为与问答逻辑对应的句式要求,句式要求例如可以是但不限于“因为A,所以B”、“之所以A,才D”、“通过A,以实现B”。可通过分析采样文本的句式结构从采样文本中提取出符合问答逻辑要求的采样问答对。
利用多组训练数据组,对预设的待训练模型进行训练即可得到问答处理模型。
请参阅图7,对预设的待训练模型进行训练得到问答处理模型包括:
331、获取待训练模型,将多个训练数据组中的一个训练数据组输入训练模型得到对应的参考答案和参考输出问题。
待训练模型包括待训练的第一算法、待训练的第二算法、待训练的第三算法、待训练的第四算法和待训练的第五算法,待训练的第一算法用于对样本段落和对应的问答逻辑关系特征进行处理得到段落隐藏层信息,和对样本问题进行处理得到问题隐藏层信息;待训练的第二算法用于对问题隐藏层信息和段落隐藏层信息进行对齐处理得到第一问题段落对齐信息;待训练的第三算法用于根据第一问题段落对齐信息对段落隐藏层信息进行自匹配处理得到第二问题段落对齐信息;待训练的第四算法用于根据段落隐藏层信息和第一问题段落对齐信息得到参考输出问题,待训练的第五算法用于根据第二问题段落对齐信息得到与样本问题对应的参考答案。
332、获取训练差异;
训练差异包括答案差异和问题差异,答案差异为参考答案与对应的训练数据组中的标准答案之间的差异,问题差异为参考输出问题与对应的训练数据组中的标准问题之间的差异;
333、判断训练差异是否在预设范围内;
334、当训练差异不在预设范围内时,根据训练差异调整待训练模型,并将多个训练数据组中的下一个训练数据组输入调整后的训练模型得到对应的参考答案和参考输出问题,再返回步骤332获取训练差异。
具体地,根据参考答案与对应的标准答案的答案差异调整待训练模型中的待训练的第一算法、待训练的第二算法、待训练的第三算法和待训练的第五算法,根据参考输出问题与对应的标准输出问题之间的问题差异调整待训练模型中的待训练的第一算法、待训练的第二算法和待训练的第四算法。
335、当训练差异在预设范围内时,结束训练,将训练差异在预设范围内时对应的待训练模型作为问答处理模型。
本申请实施例还提供一种问答处理系统。本申请实施例的问答处理方法可以由本申请实施例的问答处理系统实现,也可以由本申请实施例的电子装置实现。本申请实施例的问答处理系统包括:
问题获取模块,用于获取目标问题;
段落查找模块,用于从预设数据库查找与所述目标问题有关的目标相关段落;
处理模块,用于根据所述目标问题及所述目标相关段落,利用预先训练的问答处理模型生成输出问题和与所述目标问题对应的答案。
本申请的问答处理系统,获取目标问题之后,从预设数据库查找与目标问题有关的目标相关段落;根据目标问题及目标相关段落利用问答处理模型生成输出问题和与目标问题对应的答案。这样当获取到目标问题之后,不仅可以输出与目标问题对应的答案,还能输出新的输出问题,这样在自动问答的场景中,可以丰富与用户的交互场景。
在某些实施例中,处理模块包括:
信息获取单元,用于根据所述目标问题及所述目标相关段落,得到段落隐藏层信息和问题段落对齐信息;
输出单元,用于根据所述段落隐藏层信息和所述问题段落对齐信息,得到所述输出问题和与所述目标问题对应的答案。
在某些实施例中,所述信息获取单元包括:
第一获取子单元,用于对所述目标段落和对应的问答逻辑关系特征进行处理得到段落隐藏层信息,和对所述目标问题进行处理得到问题隐藏层信息,所述问答逻辑关系特征是对所述目标段落进行预处理从所述目标段落中提取出的;
第二获取子单元,用于对所述问题隐藏层信息和所述段落隐藏层信息进行对齐处理,得到第一问题段落对齐信息;
第三获取子单元,根据所述第一问题段落对齐信息对所述段落隐藏层信息进行自匹配处理,得到第二问题段落对齐信息;
输出单元具体用于根据所述段落隐藏层信息和所述第一问题段落对齐信息得到输出问题,根据所述第二问题段落对齐信息得到与所述目标问题对应的答案。
在某些实施例中,输出单元具体用于:
利用变分自编码器对所述段落隐藏层信息和所述第一问题段落对齐信息进行处理,得到输出问题。
在某些实施例中,输出单元具体用于:
将所述段落隐藏层信息和所述第一问题段落对齐信息作为变分自编码器的输入数据,利用变分自编码器对所述输入数据进行编码得到第一中间数据;
获取第一词集和第二词集,所述第一词集中包含多个常见词,所述第二词集为第一子集和第二子集的差集,所述第一子集为所述目标相关段落中的各词汇形成的词集,所述第二子集为预设的高频词汇集;
根据所述第一词集、所述第二词集和所述第一中间数据得到所述输出问题。
在某些实施例中,输出单元具体用于:
对所述第二问题段落对齐信息进行解码得到第二中间数据;
获取第一词集和第二词集,所述第一词集中包含多个常见词,所述第二词集为第一子集和第二子集的差集,所述第一子集为所述目标相关段落中的各词汇形成的词集,所述第二子集为预设的高频词汇集;
根据所述第一词集、所述第二词集和所述第二中间数据得到与所述目标问题对应的答案。
在某些实施例中,问答处理系统还包括训练模块,用于得到问答处理模型,训练模块具体用于:
训练数组获取单元,用于获取多个训练数据组,所述多个训练数据组中的每个训练数据组包括样本目标问题、与所述样本目标问题对应的标准答案、包含有与所述标准答案相关的信息的样本相关段落,及所述样本相关段落包含的标准输出问题;
逻辑特征获取单元,用于对各训练数据组中的样本段落进行预处理,提取出对应的问答逻辑关系特征;
训练单元,用于将所述多个训练数据组中,至少一个训练数据组的样本目标问题、样本相关段落及对应的问答逻辑关系特征作为输入,将与所述样本目标问题对应的标准答案及所述样本相关段落包含的标准输出问题作为期望输出,对预设的待训练模型进行训练得到所述问答处理模型。
在某些实施例中,训练数组获取单元具体用于:
获取问答知识库,所述问答知识库中包括至少一个标准问答对,每个标准问答对包括问题及对应的答案;
利用所述问答知识库中的标准问答对多次执行预设的训练数据获取操作,得到所述多个训练数据组。
在某些实施例中,所述训练数据获取操作包括:从所述问答知识库中提取一个标准问答对;从第一数据库获得采样文本,所述采样文本包含有与提取的所述标准问答对中的答案对应的文本信息;从所述采样文本中提取出符合问答逻辑要求的采样问答对,得到一个训练数据组,其中,所述训练数据组中的样本目标问题为提取的所述标准问答对中的问题,所述训练数据组中的标准答案为提取的所述标准问答对中的答案,所述训练数据组中的样本相关段落为所述采样文本,所述训练数据组中的标准输出问题为所述采样问答对中的问题;将所述采样问答对作为标准问答对存储至所述问答知识库;其中,每次执行所述训练数据获取操作时,从问答知识库中提取的标准问答对是不同的。
在某些实施例中,问答处理系统还包括:
保存模块,用于将所述目标问题及对应的答案作为一组问答数据对保存至问答数据库;
执行模块,用于执行预设操作,所述预设操作包括以下操作:获取所述问答处理模型前一次的输出结果中的输出问题,从预设数据库查找与所述输出问题有关的目标段落,将所述输出问题和所述与所述输出问题有关的目标段落导入所述问答处理模型,得到本次的输出结果,将本次的输出结果中的答案和前一次输出结果中的输出问题作为一组问答数据对保存至问答数据库;
判断模块,用于判断执行所述预设操作的次数是否大于或等于预设次数;
执行模块还用于在执行预设操作的次数小于预设次数时,执行所述预设操作直到执行所述预设操作的次数大于或等于预设次数。
其中,上述问答处理系统中各个模块的功能实现及技术效果与上述问答处理方法实施例中各步骤相对应,其功能和实现过程在此处不再一一赘述。
本申请还提供一种计算机可读存储介质,计算机可读存储介质上存储有问答处理程序,其中问答处理程序被处理器执行时,实现上述任一实施例的问答处理方法的步骤。
其中,问答处理程序被执行时所实现的方法及对应的技术效果可参照本申请问答处理方法的各个实施例,此处不再赘述。
在上述实施例中,可全部或部分地通过软件、硬件、固件、或其任意组合来实现。当使用软件实现时,可以全部或部分地以计算机程序产品的形式实现。所述计算机程序产品包括一个或多个计算机指令。在计算机上加载和执行所述计算机程序指令时,全部或部分地产生按照本申请实施例所述的流程或功能。所述计算机可以是通用计算机、专用计算机、计算机网络、或者其他可编程装置。所述计算机指令可以存储在计算机可读存储介质中,或者从一个计算机可读存储介质向另一个计算机可读存储介质传输,例如,所述计算机指令可以从一个网站站点、计算机、服务器或数据中心通过有线(例如同轴电缆、光纤、数字用户线)或无线(例如红外、无线、微波等)方式向另一个网站站点、计算机、服务器或数据中心进行传输。所述计算机可读存储介质可以是计算机能够存取的任何可用介质或者是包含一个或多个可用介质集成的服务器、数据中心等数据存储设备。所述可用介质可以是磁性介质(例如软盘、硬盘、磁带)、光介质(例如光盘)、或者半导体介质(例如固态硬盘)等。
在上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述的部分,可以参见其他实施例的相关描述。
在本申请所提供的几个实施例中,应该理解到,所揭露的装置,也可以通过其它的方式实现。例如以上所描述的装置实施例仅仅是示意性的,例如所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可结合或者可以集成到另一个系统,或一些特征可以忽略或不执行。另一点,所显示或讨论的相互之间的间接耦合或者直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者,也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例的方案的目的。
另外,在本申请各实施例中的各功能单元可集成在一个处理单元中,也可以是各单元单独物理存在,也可两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,或者也可以采用软件功能单元的形式实现。
所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本申请技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可为个人计算机、服务器或者网络设备等)执行本申请各个实施例所述方法的全部或部分步骤。而前述的存储介质例如可包括:U盘、移动硬盘、只读存储器(ROM,Read-OnlyMemory)、随机存取存储器(RAM,Random Access Memory)、磁碟或光盘等各种可存储程序代码的介质。
Claims (11)
1.一种问答处理方法,其特征在于,包括:
获取目标问题;
从预设数据库查找与所述目标问题有关的目标相关段落;
根据所述目标问题及所述目标相关段落,利用预先训练的问答处理模型生成输出问题和与所述目标问题对应的答案。
2.根据权利要求1所述的问答处理方法,其特征在于,所述根据所述目标问题及所述目标相关段落,利用预先训练的问答处理模型生成输出问题和与所述目标问题对应的答案包括:
根据所述目标问题及所述目标相关段落,得到段落隐藏层信息和问题段落对齐信息;
根据所述段落隐藏层信息和所述问题段落对齐信息,得到所述输出问题和与所述目标问题对应的答案。
3.根据权利要求2所述的问答处理方法,其特征在于,所述问题段落对齐信息包括第一问题段落对齐信息和第二问题段落对齐信息,所述根据所述目标问题及所述目标段落,得到段落隐藏层信息和问题段落对齐信息包括:
对所述目标段落和对应的问答逻辑关系特征进行处理得到段落隐藏层信息,对所述目标问题进行处理得到问题隐藏层信息,所述问答逻辑关系特征是对所述目标段落进行预处理从所述目标段落中提取出的;
对所述问题隐藏层信息和所述段落隐藏层信息进行对齐处理,得到第一问题段落对齐信息;
根据所述第一问题段落对齐信息对所述段落隐藏层信息进行自匹配处理,得到第二问题段落对齐信息;
所述根据所述段落隐藏层信息和所述问题段落对齐信息得到所述输出问题和与所述目标问题对应的答案包括:
根据所述段落隐藏层信息和所述第一问题段落对齐信息得到输出问题,根据所述第二问题段落对齐信息得到与所述目标问题对应的答案。
4.根据权利要求3所述的问答处理方法,其特征在于,所述根据所述段落隐藏层信息和所述第一问题段落对齐信息得到输出问题包括:
利用变分自编码器对所述段落隐藏层信息和所述第一问题段落对齐信息进行处理,得到输出问题。
5.根据权利要求4所述的问答处理方法,其特征在于,所述利用变分自编码器对所述段落隐藏层信息和所述第一问题段落对齐信息进行处理,得到输出问题包括:
将所述段落隐藏层信息和所述第一问题段落对齐信息作为变分自编码器的输入数据,利用变分自编码器对所述输入数据进行编码,得到第一中间数据;
获取第一词集和第二词集,所述第一词集中包含多个常见词,所述第二词集为第一子集和第二子集的差集,所述第一子集为所述目标相关段落中的各词汇形成的词集,所述第二子集为预设的高频词汇集;
根据所述第一词集、所述第二词集和所述第一中间数据得到所述输出问题。
6.根据权利要求3所述的问答处理方法,其特征在于,所述根据所述第二问题段落对齐信息得到与所述目标问题对应的答案包括:
对所述第二问题段落对齐信息进行解码得到第二中间数据;
获取第一词集和第二词集,所述第一词集中包含多个常见词,所述第二词集为第一子集和第二子集的差集,所述第一子集为所述目标相关段落中的各词汇形成的词集,所述第二子集为预设的高频词汇集;
根据所述第一词集、所述第二词集和所述第二中间数据得到与所述目标问题对应的答案。
7.根据权利要求1-6任一项所述的问答处理方法,其特征在于,所述问答处理模型的训练方法包括:
获取多个训练数据组,所述多个训练数据组中的每个训练数据组包括样本目标问题、与所述样本目标问题对应的标准答案、包含有与所述标准答案相关的信息的样本相关段落,及所述样本相关段落包含的标准输出问题;
对各训练数据组中的样本段落进行预处理,提取出对应的问答逻辑关系特征;
将所述多个训练数据组中,至少一个训练数据组的样本目标问题、样本相关段落及对应的问答逻辑关系特征作为输入,将与所述样本目标问题对应的标准答案及所述样本相关段落包含的标准输出问题作为期望输出,对预设的待训练模型进行训练得到所述问答处理模型。
8.根据权利要求7所述的问答处理方法,其特征在于,所述获取多个训练数据组包括:
获取问答知识库,所述问答知识库中包括至少一个标准问答对,每个标准问答对包括问题及对应的答案;
利用所述问答知识库中的标准问答对多次执行预设的训练数据获取操作,得到所述多个训练数据组。
9.根据权利要求8所述的问答处理方法,其特征在于,所述训练数据获取操作包括:从所述问答知识库中提取一个标准问答对;从第一数据库获得采样文本,所述采样文本包含有与提取的所述标准问答对中的答案对应的文本信息;从所述采样文本中提取出符合问答逻辑要求的采样问答对,得到一个训练数据组,其中,所述训练数据组中的样本目标问题为提取的所述标准问答对中的问题,所述训练数据组中的标准答案为提取的所述标准问答对中的答案,所述训练数据组中的样本相关段落为所述采样文本,所述训练数据组中的标准输出问题为所述采样问答对中的问题;将所述采样问答对作为标准问答对存储至所述问答知识库;
其中,每次执行所述训练数据获取操作时,从问答知识库中提取的标准问答对是不同的。
10.一种问答处理系统,其特征在于,包括:
问题获取模块,用于获取目标问题;
段落查找模块,用于从预设数据库查找与所述目标问题有关的目标相关段落;
处理模块,用于根据所述目标问题及所述目标相关段落,利用预先训练的问答处理模型生成输出问题和与所述目标问题对应的答案。
11.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有问答处理程序,其中所述问答处理程序被处理器执行时,实现权利要求1至9中任一项所述的问答处理方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910542646.5A CN110297897B (zh) | 2019-06-21 | 2019-06-21 | 问答处理方法及相关产品 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910542646.5A CN110297897B (zh) | 2019-06-21 | 2019-06-21 | 问答处理方法及相关产品 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN110297897A true CN110297897A (zh) | 2019-10-01 |
CN110297897B CN110297897B (zh) | 2020-11-24 |
Family
ID=68028501
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910542646.5A Active CN110297897B (zh) | 2019-06-21 | 2019-06-21 | 问答处理方法及相关产品 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN110297897B (zh) |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111382232A (zh) * | 2020-03-09 | 2020-07-07 | 联想(北京)有限公司 | 问答信息处理方法、装置及计算机设备 |
CN112560620A (zh) * | 2020-12-08 | 2021-03-26 | 齐鲁工业大学 | 一种基于目标检测和特征融合的目标跟踪方法及系统 |
CN112711657A (zh) * | 2021-01-06 | 2021-04-27 | 北京中科深智科技有限公司 | 一种问答方法及问答系统 |
CN113127729A (zh) * | 2020-01-16 | 2021-07-16 | 深圳绿米联创科技有限公司 | 家居方案的推荐方法、装置、电子设备及存储介质 |
CN114328852A (zh) * | 2021-08-26 | 2022-04-12 | 腾讯科技(深圳)有限公司 | 一种文本处理的方法、相关装置及设备 |
Citations (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105554139A (zh) * | 2015-12-24 | 2016-05-04 | 上海智臻智能网络科技股份有限公司 | 在线客服服务方法、在线客服服务器及在线客服系统 |
CN106649760A (zh) * | 2016-12-27 | 2017-05-10 | 北京百度网讯科技有限公司 | 基于深度问答的提问型搜索词搜索方法及装置 |
US20180131645A1 (en) * | 2016-09-29 | 2018-05-10 | Admit Hub, Inc. | Systems and processes for operating and training a text-based chatbot |
CN108446320A (zh) * | 2018-02-09 | 2018-08-24 | 北京搜狗科技发展有限公司 | 一种数据处理方法、装置和用于数据处理的装置 |
CN108763529A (zh) * | 2018-05-31 | 2018-11-06 | 苏州大学 | 一种智能检索方法、装置和计算机可读存储介质 |
CN109492086A (zh) * | 2018-11-26 | 2019-03-19 | 北京羽扇智信息科技有限公司 | 一种答案输出方法、装置、电子设备及存储介质 |
CN109635098A (zh) * | 2018-12-20 | 2019-04-16 | 东软集团股份有限公司 | 一种智能问答方法、装置、设备及介质 |
CN109697288A (zh) * | 2018-12-25 | 2019-04-30 | 北京理工大学 | 一种基于深度学习的实例对齐方法 |
CN109885672A (zh) * | 2019-03-04 | 2019-06-14 | 中国科学院软件研究所 | 一种面向在线教育的问答式智能检索系统及方法 |
WO2019118254A1 (en) * | 2017-12-15 | 2019-06-20 | Microsoft Technology Licensing, Llc | Chatbot integrating derived user intent |
-
2019
- 2019-06-21 CN CN201910542646.5A patent/CN110297897B/zh active Active
Patent Citations (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105554139A (zh) * | 2015-12-24 | 2016-05-04 | 上海智臻智能网络科技股份有限公司 | 在线客服服务方法、在线客服服务器及在线客服系统 |
US20180131645A1 (en) * | 2016-09-29 | 2018-05-10 | Admit Hub, Inc. | Systems and processes for operating and training a text-based chatbot |
CN106649760A (zh) * | 2016-12-27 | 2017-05-10 | 北京百度网讯科技有限公司 | 基于深度问答的提问型搜索词搜索方法及装置 |
WO2019118254A1 (en) * | 2017-12-15 | 2019-06-20 | Microsoft Technology Licensing, Llc | Chatbot integrating derived user intent |
CN108446320A (zh) * | 2018-02-09 | 2018-08-24 | 北京搜狗科技发展有限公司 | 一种数据处理方法、装置和用于数据处理的装置 |
CN108763529A (zh) * | 2018-05-31 | 2018-11-06 | 苏州大学 | 一种智能检索方法、装置和计算机可读存储介质 |
CN109492086A (zh) * | 2018-11-26 | 2019-03-19 | 北京羽扇智信息科技有限公司 | 一种答案输出方法、装置、电子设备及存储介质 |
CN109635098A (zh) * | 2018-12-20 | 2019-04-16 | 东软集团股份有限公司 | 一种智能问答方法、装置、设备及介质 |
CN109697288A (zh) * | 2018-12-25 | 2019-04-30 | 北京理工大学 | 一种基于深度学习的实例对齐方法 |
CN109885672A (zh) * | 2019-03-04 | 2019-06-14 | 中国科学院软件研究所 | 一种面向在线教育的问答式智能检索系统及方法 |
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113127729A (zh) * | 2020-01-16 | 2021-07-16 | 深圳绿米联创科技有限公司 | 家居方案的推荐方法、装置、电子设备及存储介质 |
CN111382232A (zh) * | 2020-03-09 | 2020-07-07 | 联想(北京)有限公司 | 问答信息处理方法、装置及计算机设备 |
CN112560620A (zh) * | 2020-12-08 | 2021-03-26 | 齐鲁工业大学 | 一种基于目标检测和特征融合的目标跟踪方法及系统 |
CN112560620B (zh) * | 2020-12-08 | 2023-02-28 | 齐鲁工业大学 | 一种基于目标检测和特征融合的目标跟踪方法及系统 |
CN112711657A (zh) * | 2021-01-06 | 2021-04-27 | 北京中科深智科技有限公司 | 一种问答方法及问答系统 |
CN114328852A (zh) * | 2021-08-26 | 2022-04-12 | 腾讯科技(深圳)有限公司 | 一种文本处理的方法、相关装置及设备 |
Also Published As
Publication number | Publication date |
---|---|
CN110297897B (zh) | 2020-11-24 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110297897B (zh) | 问答处理方法及相关产品 | |
US11605226B2 (en) | Video data processing method and apparatus, and readable storage medium | |
CN109086303B (zh) | 基于机器阅读理解的智能对话方法、装置、终端 | |
CN108829822B (zh) | 媒体内容的推荐方法和装置、存储介质、电子装置 | |
US11544474B2 (en) | Generation of text from structured data | |
US20180336193A1 (en) | Artificial Intelligence Based Method and Apparatus for Generating Article | |
US8577882B2 (en) | Method and system for searching multilingual documents | |
CN109657054A (zh) | 摘要生成方法、装置、服务器及存储介质 | |
US20230082605A1 (en) | Visual dialog method and apparatus, method and apparatus for training visual dialog model, electronic device, and computer-readable storage medium | |
CN110347790B (zh) | 基于注意力机制的文本查重方法、装置、设备及存储介质 | |
CN109284502B (zh) | 一种文本相似度计算方法、装置、电子设备及存储介质 | |
CN109740158B (zh) | 一种文本语义解析方法及装置 | |
CN112487139A (zh) | 基于文本的自动出题方法、装置及计算机设备 | |
CN114390218B (zh) | 视频生成方法、装置、计算机设备和存储介质 | |
DE102018008188A1 (de) | Erstellen von Inhalt basierend auf einer Mehr-Satz-Komprimierung eines Quellinhalts | |
CN109635303B (zh) | 特定领域意义改变词的识别方法 | |
CN110968664A (zh) | 一种文书检索方法、装置、设备及介质 | |
CN110895656A (zh) | 一种文本相似度计算方法、装置、电子设备及存储介质 | |
CN117093739A (zh) | 图像生成以及图文对齐方法、装置、终端设备及存储介质 | |
CN105069034A (zh) | 一种生成推荐信息的方法及装置 | |
CN110347916B (zh) | 跨场景的项目推荐方法、装置、电子设备及存储介质 | |
CN117150044A (zh) | 基于知识图谱的专利处理方法、装置及存储介质 | |
WO2023245523A1 (zh) | 用于生成训练数据的方法以及装置 | |
CN116186312A (zh) | 用于数据敏感信息发现模型的多模态数据增强方法 | |
CN110659419B (zh) | 确定目标用户的方法及相关装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |