WO2017181834A1 - 一种智能问答方法及装置 - Google Patents

一种智能问答方法及装置 Download PDF

Info

Publication number
WO2017181834A1
WO2017181834A1 PCT/CN2017/078844 CN2017078844W WO2017181834A1 WO 2017181834 A1 WO2017181834 A1 WO 2017181834A1 CN 2017078844 W CN2017078844 W CN 2017078844W WO 2017181834 A1 WO2017181834 A1 WO 2017181834A1
Authority
WO
WIPO (PCT)
Prior art keywords
question
current
ellipsis
complete
current question
Prior art date
Application number
PCT/CN2017/078844
Other languages
English (en)
French (fr)
Inventor
李春霞
鲍焱
冯军
郭斌
Original Assignee
中兴通讯股份有限公司
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 中兴通讯股份有限公司 filed Critical 中兴通讯股份有限公司
Publication of WO2017181834A1 publication Critical patent/WO2017181834A1/zh

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/3331Query processing
    • G06F16/3332Query translation
    • G06F16/3335Syntactic pre-processing, e.g. stopword elimination, stemming
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/332Query formulation
    • G06F16/3329Natural language query formulation or dialogue systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/205Parsing
    • G06F40/211Syntactic parsing, e.g. based on context-free grammar [CFG] or unification grammars

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Artificial Intelligence (AREA)
  • Mathematical Physics (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • General Health & Medical Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Human Computer Interaction (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

一种智能问答方法及装置。该装置包括:获取模块(21),设置为获取当前问句,所述当前问句包括用户当前输入的问句;确定模块(22),设置为根据所述当前问句,确定所述当前问句是否为非完整问句,所述非完整问句存在省略词,所述省略词包括缺少检索所述当前问句答案的关键词;完整性恢复模块(23),设置为若确定所述当前问句为非完整问句,则将所述当前问句进行完整性恢复操作,以获得完整问句,所述完整问句包括不存在省略词的的问句;检索模块(24),设置为根据所述完整问句,在数据库中检索所述完整问句的答案。实现了对非完整问句的完整性恢复,从而可以在数据库中检索到精确的答案。

Description

一种智能问答方法及装置 技术领域
本申请涉及但不限于计算机技术,尤指一种智能问答方法及装置。
背景技术
随着计算机技术的不断发展,用户可以与计算机进行智能问答,也就是说,通过一问一答的形式,计算机可以精确的定位用户所提问题的答案。
在智能问答系统中,用户向计算机提出一个问题,计算机可以从知识库中正确选择出用户所提问题的答案,接着,用户向计算机提出一个新问题,计算机继续从知识库中正确选择出用户所提新问题的答案。
然而,用户提出的新问题可能是非完整问句,例如,用户提出的第一个问题是:4008业务是什么?第二个问题是:怎么办理?计算机将无法处理非完整问句,从而导致无法为用户提供精确的答案。
发明概述
以下是对本文详细描述的主题的概述。本概述并非是为了限制权利要求的保护范围。
本文提供了一种智能问答方法及装置,以使计算机为用户提供精确答案。
本发明实施例提供了一种智能问答方法,包括:
获取当前问句,所述当前问句包括用户当前输入的问句;
根据所述当前问句,确定所述当前问句是否为非完整问句,所述非完整问句存在省略词,所述省略词包括缺少检索所述当前问句答案的关键词;
若确定所述当前问句为非完整问句,则将所述当前问句进行完整性恢 复操作,以获得完整问句;
根据所述完整问句,在数据库中检索所述完整问句的答案。
在一实施方式中,所述将所述当前问句进行完整性恢复操作,以获得完整问句之前,还包括:
获取所述当前问句中省略词的至少一省略判定结果特征向量,所述省略判定结果特征向量包括根据以下任一信息或其组合获得的特征向量:省略类型、代词类型、省略成分位置、省略成分语法角色。
在一实施方式中,所述将所述当前问句进行完整性恢复操作,以获得完整问句之前,还包括:
获取前问句的至少一个第一关键词,所述前问句包括在所述当前问句之前获取的,与所述当前问句同一用户标识输入的问句;
根据所述第一关键词,获取一省略候选词特征值向量,所述省略候选词特征值向量包括根据以下任一信息或其组合获得的特征向量:实体类别、实体在所述前问句的语法角色、间隔距离,所述间隔距离包括所述第一关键词所在的所述前问句距离所述当前问句的距离。
在一实施方式中,所述将所述当前问句进行完整性恢复操作,以获得完整问句,还包括:
将所述省略候选词特征值向量与所述省略判定结果特征向量相乘,获得相乘结果;
根据所述相乘结果,确定所述相乘结果对应在第一列表的分值;
将所有分值按照从大到小的顺序排序,确定前N个分值对应的关键词为候补关键词;
将所述候补关键词补充到所述当前问句,获得恢复问句;
将所述恢复问句进行句法分析,获得所述句法分析的打分结果;
根据所述打分结果,将所述打分结果最高的所述恢复问句作为所述当前问句的所述完整问句。
在一实施方式中,所述获取前问句的至少一个第一关键词之前,还包 括:
确定所述前问句与所述当前问句是否存在相关性;
若存在相关性,则执行所述获取前问句的至少一个第一关键词;
若不存在相关性,则执行在数据库中检索所述当前问句的答案。
本发明实施例还提供了一种智能问答装置,包括:
获取模块,设置为获取当前问句,所述当前问句包括用户当前输入的问句;
确定模块,设置为根据所述当前问句,确定所述当前问句是否为非完整问句,所述非完整问句存在省略词,所述省略词包括缺少检索所述当前问句答案的关键词;
完整性恢复模块,设置为若确定所述当前问句为非完整问句,则将所述当前问句进行完整性恢复操作,以获得完整问句;
检索模块,设置为根据所述完整问句,在数据库中检索所述完整问句的答案。
在一实施方式中,所述获取模块,还设置为获取所述当前问句中省略词的至少一省略判定结果特征向量,所述省略判定结果特征向量包括根据以下任一信息或其组合获得的特征向量:省略类型、代词类型、省略成分位置、省略成分语法角色。
在一实施方式中,所述获取模块,还设置为获取前问句的至少一个第一关键词,所述前问句包括在所述当前问句之前获取的,与所述当前问句同一用户标识输入的问句;根据所述第一关键词,获取一省略候选词特征值向量,所述省略候选词特征值向量包括根据以下任一信息或其组合获得的特征向量:实体类别、实体在所述前问句的语法角色、间隔距离,所述间隔距离包括所述第一关键词所在的所述前问句距离所述当前问句的距离。
在一实施方式中,所述完整性恢复模块,设置为将所述省略候选词特征值向量与所述省略判定结果特征向量相乘,获得相乘结果;根据所述相乘结果,确定所述相乘结果对应在第一列表的分值;将所有分值按照从大 到小的顺序排序,确定前N个分值对应的关键词为候补关键词;将所述候补关键词补充到所述当前问句,获得恢复问句;将所述恢复问句进行句法分析,获得所述句法分析的打分结果;根据所述打分结果,将所述打分结果最高的所述恢复问句作为所述当前问句的所述完整问句。
在一实施方式中,还包括:处理模块;
所述处理模块,设置为确定所述前问句与所述当前问句是否存在相关性;若存在相关性,则通知所述获取模块执行所述获取前问句的至少一个第一关键词;若不存在相关性,则通知所述检索模块执行在数据库中检索所述当前问句的答案。
本发明实施例还提供了一种计算机可读存储介质,存储有计算机可执行指令,所述计算机可执行指令被处理器执行时实现上述智能问答方法。
本发明实施例包括:获取当前问句,所述当前问句包括用户当前输入的问句;根据所述当前问句,确定所述当前问句是否为非完整问句,所述非完整问句存在省略词,所述省略词包括缺少检索所述当前问句答案的关键词;若确定所述当前问句为非完整问句,则将所述当前问句进行完整性恢复操作,以获得完整问句;根据所述完整问句,在数据库中检索所述完整问句的答案。实现了对非完整问句的完整性恢复,从而可以在数据库中检索到精确的答案。
在阅读并理解了附图和详细描述后,可以明白其他方面。
附图概述
图1为本发明智能问答方法一实施例的流程示意图;
图2为本发明智能问答装置一实施例的结构示意图;
图3为本发明智能问答装置二实施例的结构示意图。
详述
下文中将结合附图对本发明的实施例进行详细说明。需要说明的是, 在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互任意组合。
本发明实施例提供的智能问答方法可以应用于计算机提供智能回答时。本实施例提供的智能问答方法可以通过智能问答装置来执行,该智能问答装置可以集成在移动终端,计算机,或者单独设置,其中,该智能问答装置可以采用软件和/或硬件的方式来实现。以下对本实施例提供的智能问答方法及装置进行详细地说明。
图1为本发明智能问答方法一实施例的流程示意图;如图1所示,本实施例的执行主体可以是智能问答装置,本发明实施例提供的智能问答方法,包括:
步骤101、获取当前问句。
在本实施例中,所述当前问句包括用户当前输入的问句。
步骤102、根据所述当前问句,确定所述当前问句是否为非完整问句。
在本实施例中,所述非完整问句存在省略词,所述省略词包括缺少检索所述当前问句答案的关键词。
其中,首先判别当前问句中是否有省略的现象,如果有,根据其上文内容和实体识别结果对省略成分进行恢复。此处的省略指省略了关键成分或关键成分用代词指代。在省略现象的判别工作中,需要先标注语料,提取有效特征,训练省略判定模型,利用这个模型来判断句子中的词是否存在省略现象,并对存在省略的情况,判定出省略成分的位置、语法角色等信息。
举例来讲,可以将当前问句通过省略判定模型,确定所述当前问句是否为非完整问句。其中,该省略判定模型训练方式包括:将多个问句进行预处理,即标注问句中的词语词性、词序、省略特征等,举例来讲,该省略特征可以是省略主语、动词等。接着,读取预处理后的语料,提取特征值,进行模型的离线训练;特征值包括代词成分、省略特征、语义特征、实体词信息等。然后,进行离线训练生成省略恢复模型。
步骤103、若确定所述当前问句为非完整问句,则将所述当前问句进行 完整性恢复操作,以获得完整问句。
在本实施例中,所述完整问句包括不存在省略词的问句。
其中,确定了省略成分位置后,接下确定恢复内容。
恢复候选词为同一用户的前几句问句中,通过实体识别提取出来一个或多个实体词。通过算法计算和句法分析,选取出最佳候选词,作为省略恢复词。
步骤104、根据所述完整问句,在数据库中检索所述完整问句的答案。
该数据库可以是传统关系型数据库,或者,索引的数据库,在此不做限制。
在本实施例中,获取当前问句,所述当前问句包括用户当前输入的问句;根据所述当前问句,确定所述当前问句是否为非完整问句,所述非完整问句存在省略词,所述省略词包括缺少检索所述当前问句答案的关键词;若确定所述当前问句为非完整问句,则将所述当前问句进行完整性恢复操作,以获得完整问句;根据所述完整问句,在数据库中检索所述完整问句的答案。实现了对非完整问句的完整性恢复,从而可以在数据库中检索到精确的答案。
在上述实施例的基础上,所述根据所述当前问句,确定所述当前问句是否为非完整问句,还包括:
若确定所述当前问句不是非完整问句,则在数据库中检索所述当前问句的答案。
在上述实施例的基础上,所述将所述当前问句进行完整性恢复操作,以获得完整问句之前,还包括:
获取所述当前问句中省略词的至少一省略判定结果特征向量,所述省略判定结果特征向量包括根据以下任一信息或其组合获得的特征向量:省略类型、代词类型、省略成分位置、省略成分语法角色。
在上述实施例的基础上,所述将所述当前问句进行完整性恢复操作,以获得完整问句之前,还包括:
获取前问句的至少一个第一关键词,所述前问句包括在所述当前问句 之前获取的,与所述当前问句同一用户标识输入的问句;
根据所述第一关键词,获取一省略候选词特征值向量,所述省略候选词特征值向量包括根据以下任一信息或其组合获得的特征向量:实体类别、实体在所述前问句的语法角色、间隔距离,所述间隔距离包括所述第一关键词所在的所述前问句距离所述当前问句的距离。
在上述实施例的基础上,所述将所述当前问句进行完整性恢复操作,以获得完整问句,还包括:
将所述省略候选词特征值向量与所述省略判定结果特征向量相乘,获得相乘结果;
根据所述相乘结果,确定所述相乘结果对应在第一列表的分值;
将所有分值按照从大到小的顺序排序,确定前N个分值对应的关键词为候补关键词;
将所述候补关键词补充到所述当前问句,获得恢复问句;
将所述恢复问句进行句法分析,获得所述句法分析的打分结果;
根据所述打分结果,将所述打分结果最高的所述恢复问句作为所述当前问句的所述完整问句。
其中,所述获取前问句的至少一个第一关键词之前,还包括:
确定所述前问句与所述当前问句是否存在相关性;
若存在相关性,则执行所述获取前问句的至少一个第一关键词;
若不存在相关性,则执行在数据库中检索所述当前问句的答案。
举例来讲,用户User:乐享4G套餐是什么?智能客服IQA:乐享4G套餐是中国电信的某一种套餐。接着,用户User:怎么办理?智能客服IQA在回答之前,可以进行如下操作:
步骤1,准备领域语料并标注,离线训练模型。分别训练语境识别模型、实体识别模型、省略判定模型;
步骤2,判断用户是否存在缓存,若存在继续执行步骤3语境识别,否则执行步骤7搜索;本例存在缓存;
步骤3,调用语境识别模型判断是否为同一语境,如果是,继续执行步骤4省略判定,否则执行步骤7搜索;本例为同一语境;
步骤4,调用省略判定模型判断是否存在省略,如果存在,确定省略位置和成分,获得省略判定结果特征向量A,并继续执行步骤5实体识别。否则执行步骤7搜索;本例存在省略,并且缺少主语,省略位置在“怎么”前面;
步骤5,调用实体识别模型识别出可用于省略恢复的实体;继续执行步骤6省略恢复;本例实体识别模型识别出前一问句实体“乐享4G套餐”;
步骤6,对于每一个实体,提取出一组省略候选词特征值向量,包括实体类别、实体在原句中的语法角色、间隔距离等,其中,间隔距离指与当前问句的距离,以问句作为距离单位;通过省略候选词特征值向量计算候选实体词的得分,根据得分选取恢复词。其中步骤4中得到的省略判定结果特征向量A为候选词特征向量的权重系数;本例识别出的实体在前一问句中是主语,且与当前问句间隔距离为1,经计算为最佳恢复词;恢复后,当前问句为:乐享4G套餐怎么办理?
步骤7,搜索语料库,进行结果后处理,筛选查询结果(若命中多条,则用相似度计算选取最佳答案)并缓存用户的查询条件;
步骤8,将最终结果返回给用户。
再举例来讲,本实施例适用于生活服务APP。用户User:北京的天气怎么样?智能客服IQA:北京的天气情况:多云转晴。User:南京呢?智能客服IQA在回答之前,可以进行如下操作:
步骤1,准备领域语料并标注,离线训练模型。分别训练语境识别模型、实体识别模型、省略判定模型;
步骤2,判断用户是否存在缓存,若存在继续执行步骤3语境识别,否则执行步骤7搜索;本例存在缓存;
步骤3,调用语境识别模型判断是否为同一语境,如果是,继续执行步骤4省略判定,否则执行步骤7搜索;本例为同一语境;
步骤4,调用省略判定模型判断是否存在省略,如果存在,确定省略位 置和成分,获得省略判定结果特征向量A,并继续执行步骤5实体识别。否则执行步骤7搜索;本例存在省略,并且已有地区词主语”南京”,缺少宾语,省略位置在主语后面;
步骤5,调用实体识别模型识别出可用于省略恢复的实体;继续执行步骤6省略恢复;本例实体识别模型识别出前一问句实体有“南京”和“天气”;
步骤6,对于每一个实体,提取出一组省略候选词特征值向量,包括实体类别、实体在原句中的语法角色、间隔距离(这里指与当前问句的距离,以问句作为距离单位)等;通过省略候选词特征值向量计算候选实体词的得分,根据得分选取恢复词。其中步骤4中得到的省略判定结果特征向量A为候选词特征向量的权重系数;本例识别出的实体在前一问句中是主语和宾语,与当前问句间隔距离为1,当前问句缺少宾语,经计算“天气”为最佳恢复词;恢复后,当前问句为:南京天气呢?
步骤7,搜索语料库,进行结果后处理,筛选查询结果(若命中多条,则用相似度计算选取最佳答案)并缓存用户的查询条件;
步骤8,将最终结果返回给用户。
图2为本发明智能问答装置一实施例的结构示意图;如图2所示,本发明实施例提供的智能问答装置,包括:获取模块21、确定模块22、完整性恢复模块23和检索模块24。其中,
获取模块21,设置为获取当前问句,所述当前问句包括用户当前输入的问句;
确定模块22,设置为根据所述当前问句,确定所述当前问句是否为非完整问句,所述非完整问句存在省略词,所述省略词包括缺少检索所述当前问句答案的关键词;
完整性恢复模块23,设置为若确定所述当前问句为非完整问句,则将所述当前问句进行完整性恢复操作,以获得完整问句,所述完整问句包括不存在省略词的问句;
检索模块24,设置为根据所述完整问句,在数据库中检索所述完整问 句的答案。
在本实施例中,获取当前问句,所述当前问句包括用户当前输入的问句;根据所述当前问句,确定所述当前问句是否为非完整问句,所述非完整问句存在省略词,所述省略词包括缺少检索所述当前问句答案的关键词;若确定所述当前问句为非完整问句,则将所述当前问句进行完整性恢复操作,以获得完整问句;根据所述完整问句,在数据库中检索所述完整问句的答案。实现了对非完整问句的完整性恢复,从而可以在数据库中检索到精确的答案。
在上述实施例的基础上,所述获取模块21,还设置为获取所述当前问句中省略词的至少一省略判定结果特征向量,所述省略判定结果特征向量包括根据以下任一信息或其组合获得的特征向量:省略类型、代词类型、省略成分位置、省略成分语法角色。
在上述实施例的基础上,所述获取模块21,还设置为获取前问句的至少一个第一关键词,所述前问句包括在所述当前问句之前获取的,与所述当前问句同一用户标识输入的问句;根据所述第一关键词,获取一省略候选词特征值向量,所述省略候选词特征值向量包括根据以下任一信息或其组合获得的特征向量:实体类别、实体在所述前问句的语法角色、间隔距离,所述间隔距离包括所述第一关键词所在的所述前问句距离所述当前问句的距离。
在上述实施例的基础上,所述完整性恢复模块23,设置为将所述省略候选词特征值向量与所述省略判定结果特征向量相乘,获得相乘结果;根据所述相乘结果,确定所述相乘结果对应在第一列表的分值;将所有分值按照从大到小的顺序排序,确定前N个分值对应的关键词为候补关键词;将所述候补关键词补充到所述当前问句,获得恢复问句;将所述恢复问句进行句法分析,获得所述句法分析的打分结果;根据所述打分结果,将所述打分结果最高的所述恢复问句作为所述当前问句的所述完整问句。
图3为本发明智能问答装置二实施例的结构示意图;如图3所示,在上述实施例的基础上,本发明实施例提供的智能问答装置,还可以包括:处理模块25;
所述处理模块25,设置为确定所述前问句与所述当前问句是否存在相关性;若存在相关性,则通知所述获取模块21执行所述获取前问句的至少一个第一关键词;若不存在相关性,则通知所述检索模块24执行在数据库中检索所述当前问句的答案。
在本实施例中,实现了对非完整问句的完整性恢复,并获取多词组成的实体,从而可以在数据库中检索到精确的答案,提高了答案的准确性。
本发明实施例还提供了一种计算机可读存储介质,存储有计算机可执行指令,所述计算机可执行指令被处理器执行时实现上述智能问答方法。
本领域普通技术人员可以理解上述方法中的全部或部分步骤可通过程序来指令相关硬件(例如处理器)完成,所述程序可以存储于计算机可读存储介质中,如只读存储器、磁盘或光盘等。上述实施例的全部或部分步骤也可以使用一个或多个集成电路来实现。相应地,上述实施例中的各模块/单元可以采用硬件的形式实现,例如通过集成电路来实现其相应功能,也可以采用软件功能模块的形式实现,例如通过处理器执行存储于存储器中的程序/指令来实现其相应功能。本发明实施例不限制于任何特定形式的硬件和软件的结合。
虽然本申请所揭露的实施方式如上,但所述的内容仅为便于理解本申请而采用的实施方式,并非用以限定本申请。任何本申请所属领域内的技术人员,在不脱离本申请所揭露的精神和范围的前提下,可以在实施的形式及细节上进行任何的修改与变化,但本申请的专利保护范围,仍须以所附的权利要求书所界定的范围为准。
工业实用性
在本实施例中,实现了对非完整问句的完整性恢复,并获取多词组成的实体,从而可以在数据库中检索到精确的答案,提高了答案的准确性。

Claims (11)

  1. 一种智能问答方法,包括:
    获取当前问句,所述当前问句包括用户当前输入的问句;
    根据所述当前问句,确定所述当前问句是否为非完整问句,所述非完整问句存在省略词,所述省略词包括缺少检索所述当前问句答案的关键词;
    若确定所述当前问句为非完整问句,则将所述当前问句进行完整性恢复操作,以获得完整问句;
    根据所述完整问句,在数据库中检索所述完整问句的答案。
  2. 根据权利要求1所述的方法,其中,所述将所述当前问句进行完整性恢复操作,以获得完整问句之前,还包括:
    获取所述当前问句中省略词的至少一省略判定结果特征向量,所述省略判定结果特征向量包括根据以下任一信息或其组合获得的特征向量:省略类型、代词类型、省略成分位置、省略成分语法角色。
  3. 根据权利要求2所述的方法,其中,所述将所述当前问句进行完整性恢复操作,以获得完整问句之前,还包括:
    获取前问句的至少一个第一关键词,所述前问句包括在所述当前问句之前获取的,与所述当前问句同一用户标识输入的问句;
    根据所述第一关键词,获取一省略候选词特征值向量,所述省略候选词特征值向量包括根据以下任一信息或其组合获得的特征向量:实体类别、实体在所述前问句的语法角色、间隔距离,所述间隔距离包括所述第一关键词所在的所述前问句距离所述当前问句的距离。
  4. 根据权利要求3所述的方法,其中,所述将所述当前问句进行完整性恢复操作,以获得完整问句,包括:
    将所述省略候选词特征值向量与所述省略判定结果特征向量相乘,获得相乘结果;
    根据所述相乘结果,确定所述相乘结果对应在第一列表的分值;
    将所有分值按照从大到小的顺序排序,确定前N个分值对应的关键词 为候补关键词;
    将所述候补关键词补充到所述当前问句,获得恢复问句;
    将所述恢复问句进行句法分析,获得所述句法分析的打分结果;
    根据所述打分结果,将所述打分结果最高的所述恢复问句作为所述当前问句的所述完整问句。
  5. 根据权利要求3或4所述的方法,其中,所述获取前问句的至少一个第一关键词之前,还包括:
    确定所述前问句与所述当前问句是否存在相关性;
    若存在相关性,则执行所述获取前问句的至少一个第一关键词;
    若不存在相关性,则执行在数据库中检索所述当前问句的答案。
  6. 一种智能问答装置,包括:
    获取模块,设置为获取当前问句,所述当前问句包括用户当前输入的问句;
    确定模块,设置为根据所述当前问句,确定所述当前问句是否为非完整问句,所述非完整问句存在省略词,所述省略词包括缺少检索所述当前问句答案的关键词;
    完整性恢复模块,设置为若确定所述当前问句为非完整问句,则将所述当前问句进行完整性恢复操作,以获得完整问句;
    检索模块,设置为根据所述完整问句,在数据库中检索所述完整问句的答案。
  7. 根据权利要求6所述的装置,其中,所述获取模块,还设置为获取所述当前问句中省略词的至少一省略判定结果特征向量,所述省略判定结果特征向量包括根据以下任一信息或其组合获得的特征向量:省略类型、代词类型、省略成分位置、省略成分语法角色。
  8. 根据权利要求7所述的装置,其中,所述获取模块,还设置为获取前问句的至少一个第一关键词,所述前问句包括在所述当前问句之前获取的,与所述当前问句同一用户标识输入的问句;根据所述第一关键词,获取 一省略候选词特征值向量,所述省略候选词特征值向量包括根据以下任一信息或其组合获得的特征向量:实体类别、实体在所述前问句的语法角色、间隔距离,所述间隔距离包括所述第一关键词所在的所述前问句距离所述当前问句的距离。
  9. 根据权利要求8所述的装置,其中,所述完整性恢复模块,设置为将所述省略候选词特征值向量与所述省略判定结果特征向量相乘,获得相乘结果;根据所述相乘结果,确定所述相乘结果对应在第一列表的分值;将所有分值按照从大到小的顺序排序,确定前N个分值对应的关键词为候补关键词;将所述候补关键词补充到所述当前问句,获得恢复问句;将所述恢复问句进行句法分析,获得所述句法分析的打分结果;根据所述打分结果,将所述打分结果最高的所述恢复问句作为所述当前问句的所述完整问句。
  10. 根据权利要求8或9所述的装置,还包括:处理模块;
    所述处理模块,设置为确定所述前问句与所述当前问句是否存在相关性;若存在相关性,则通知所述获取模块执行所述获取前问句的至少一个第一关键词;若不存在相关性,则通知所述检索模块执行在数据库中检索所述当前问句的答案。
  11. 一种计算机可读存储介质,存储有计算机可执行指令,所述计算机可执行指令用于执行权利要求1-5任一项的智能问答方法。
PCT/CN2017/078844 2016-04-19 2017-03-30 一种智能问答方法及装置 WO2017181834A1 (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
CN201610244036.3A CN107305550A (zh) 2016-04-19 2016-04-19 一种智能问答方法及装置
CN201610244036.3 2016-04-19

Publications (1)

Publication Number Publication Date
WO2017181834A1 true WO2017181834A1 (zh) 2017-10-26

Family

ID=60115675

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/CN2017/078844 WO2017181834A1 (zh) 2016-04-19 2017-03-30 一种智能问答方法及装置

Country Status (2)

Country Link
CN (1) CN107305550A (zh)
WO (1) WO2017181834A1 (zh)

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109933779A (zh) * 2017-12-18 2019-06-25 苏宁云商集团股份有限公司 用户意图识别方法及系统
CN110377803A (zh) * 2019-06-14 2019-10-25 阿里巴巴集团控股有限公司 信息处理方法以及装置
CN111563147A (zh) * 2020-04-03 2020-08-21 北京明略软件系统有限公司 一种知识问答系统中实体链接方法和装置
CN111813916A (zh) * 2020-07-21 2020-10-23 润联软件系统(深圳)有限公司 一种智能问答方法、装置、计算机设备和介质
CN111984763A (zh) * 2020-08-28 2020-11-24 海信电子科技(武汉)有限公司 一种答问处理方法及智能设备
CN112380836A (zh) * 2020-11-12 2021-02-19 华侨大学 一种智能侨情问句生成方法
CN112988987A (zh) * 2019-12-16 2021-06-18 科沃斯商用机器人有限公司 人机交互方法、装置、智能机器人和存储介质
US11423068B2 (en) * 2018-11-27 2022-08-23 Google Llc Canonicalizing search queries to natural language questions

Families Citing this family (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108170792B (zh) * 2017-12-27 2021-12-28 北京百度网讯科技有限公司 基于人工智能的问答引导方法、装置和计算机设备
CN108763356A (zh) * 2018-05-16 2018-11-06 深圳市三宝创新智能有限公司 一种基于相似句搜索的智能机器人闲聊系统及方法
CN109344238A (zh) * 2018-09-18 2019-02-15 阿里巴巴集团控股有限公司 用户问句的补词方法和装置
CN109284503B (zh) * 2018-10-22 2023-08-18 传神语联网网络科技股份有限公司 翻译语句结束判断方法与系统
CN111984766B (zh) * 2019-05-21 2023-02-24 华为技术有限公司 缺失语义补全方法及装置
CN110334268B (zh) * 2019-07-05 2022-01-14 李晨 一种区块链项目热词生成方法以及装置
CN112347297A (zh) * 2019-07-22 2021-02-09 中兴通讯股份有限公司 语音信息的处理方法及装置、存储介质和电子装置
CN111507088B (zh) * 2020-04-15 2022-12-16 深圳前海微众银行股份有限公司 语句补全方法、设备及可读存储介质
CN112328762B (zh) * 2020-11-04 2023-12-19 平安科技(深圳)有限公司 基于文本生成模型的问答语料生成方法和装置

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20140119531A1 (en) * 2012-10-30 2014-05-01 Kenneth D. Tuchman Method for providing support using answer engine and dialog rules
CN103995870A (zh) * 2014-05-21 2014-08-20 百度在线网络技术(北京)有限公司 交互式搜索方法和装置
CN105159996A (zh) * 2015-09-07 2015-12-16 百度在线网络技术(北京)有限公司 基于人工智能的深度问答服务提供方法和装置
CN105373527A (zh) * 2014-08-27 2016-03-02 中兴通讯股份有限公司 一种省略恢复方法及问答系统
CN105589844A (zh) * 2015-12-18 2016-05-18 北京中科汇联科技股份有限公司 一种用于多轮问答系统中缺失语义补充的方法
CN106294340A (zh) * 2015-05-12 2017-01-04 中兴通讯股份有限公司 一种智能客服处理方法及其装置

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20140119531A1 (en) * 2012-10-30 2014-05-01 Kenneth D. Tuchman Method for providing support using answer engine and dialog rules
CN103995870A (zh) * 2014-05-21 2014-08-20 百度在线网络技术(北京)有限公司 交互式搜索方法和装置
CN105373527A (zh) * 2014-08-27 2016-03-02 中兴通讯股份有限公司 一种省略恢复方法及问答系统
CN106294340A (zh) * 2015-05-12 2017-01-04 中兴通讯股份有限公司 一种智能客服处理方法及其装置
CN105159996A (zh) * 2015-09-07 2015-12-16 百度在线网络技术(北京)有限公司 基于人工智能的深度问答服务提供方法和装置
CN105589844A (zh) * 2015-12-18 2016-05-18 北京中科汇联科技股份有限公司 一种用于多轮问答系统中缺失语义补充的方法

Cited By (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109933779A (zh) * 2017-12-18 2019-06-25 苏宁云商集团股份有限公司 用户意图识别方法及系统
US20220391428A1 (en) * 2018-11-27 2022-12-08 Google Llc Canonicalizing search queries to natural language questions
US11423068B2 (en) * 2018-11-27 2022-08-23 Google Llc Canonicalizing search queries to natural language questions
CN110377803A (zh) * 2019-06-14 2019-10-25 阿里巴巴集团控股有限公司 信息处理方法以及装置
CN110377803B (zh) * 2019-06-14 2023-04-07 创新先进技术有限公司 信息处理方法以及装置
CN112988987A (zh) * 2019-12-16 2021-06-18 科沃斯商用机器人有限公司 人机交互方法、装置、智能机器人和存储介质
CN111563147A (zh) * 2020-04-03 2020-08-21 北京明略软件系统有限公司 一种知识问答系统中实体链接方法和装置
CN111563147B (zh) * 2020-04-03 2023-09-22 北京明略软件系统有限公司 一种知识问答系统中实体链接方法和装置
CN111813916A (zh) * 2020-07-21 2020-10-23 润联软件系统(深圳)有限公司 一种智能问答方法、装置、计算机设备和介质
CN111813916B (zh) * 2020-07-21 2024-03-05 华润数字科技有限公司 一种智能问答方法、装置、计算机设备和介质
CN111984763A (zh) * 2020-08-28 2020-11-24 海信电子科技(武汉)有限公司 一种答问处理方法及智能设备
CN111984763B (zh) * 2020-08-28 2023-09-19 海信电子科技(武汉)有限公司 一种答问处理方法及智能设备
CN112380836A (zh) * 2020-11-12 2021-02-19 华侨大学 一种智能侨情问句生成方法

Also Published As

Publication number Publication date
CN107305550A (zh) 2017-10-31

Similar Documents

Publication Publication Date Title
WO2017181834A1 (zh) 一种智能问答方法及装置
CN107480143B (zh) 基于上下文相关性的对话话题分割方法和系统
US9613166B2 (en) Search suggestions of related entities based on co-occurrence and/or fuzzy-score matching
US20180341871A1 (en) Utilizing deep learning with an information retrieval mechanism to provide question answering in restricted domains
KR101895249B1 (ko) 지능 문답 구현 방법, 시스템 및 저장 매체
JP5936698B2 (ja) 単語意味関係抽出装置
US8073877B2 (en) Scalable semi-structured named entity detection
CN101878476B (zh) 用于查询扩展的机器翻译
US20240028837A1 (en) Device and method for machine reading comprehension question and answer
US10592571B1 (en) Query modification based on non-textual resource context
CN112035730B (zh) 一种语义检索方法、装置及电子设备
CN104050256A (zh) 基于主动学习的问答方法及采用该方法的问答系统
US20150154286A1 (en) Method for disambiguated features in unstructured text
WO2018045646A1 (zh) 基于人工智能的人机交互方法和装置
CN112487140A (zh) 问答对话评测方法、装置、设备及存储介质
CN109508460B (zh) 基于主题聚类的无监督作文跑题检测方法及系统
CN109213998A (zh) 中文错字检测方法及系统
US20170075915A1 (en) Search suggestions using fuzzy-score matching and entity co-occurrence
CN117251455A (zh) 一种基于大模型的智能报表生成方法及其系统
Juan An effective similarity measurement for FAQ question answering system
CN109992651B (zh) 一种问题目标特征自动识别和抽取方法
CN112905752A (zh) 一种智能交互方法、装置、设备以及存储介质
CN111859148A (zh) 主题的提取方法、装置、设备及计算机可读存储介质
Thenmozhi et al. An open information extraction for question answering system
CN109492085B (zh) 基于数据处理的答案确定方法、装置、终端及存储介质

Legal Events

Date Code Title Description
NENP Non-entry into the national phase

Ref country code: DE

121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 17785319

Country of ref document: EP

Kind code of ref document: A1

122 Ep: pct application non-entry in european phase

Ref document number: 17785319

Country of ref document: EP

Kind code of ref document: A1