CN111897915A - 问答设备和答复信息确定方法 - Google Patents
问答设备和答复信息确定方法 Download PDFInfo
- Publication number
- CN111897915A CN111897915A CN202010722247.XA CN202010722247A CN111897915A CN 111897915 A CN111897915 A CN 111897915A CN 202010722247 A CN202010722247 A CN 202010722247A CN 111897915 A CN111897915 A CN 111897915A
- Authority
- CN
- China
- Prior art keywords
- question
- template
- information
- target
- matching
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 43
- 230000004044 response Effects 0.000 claims abstract description 17
- 230000011218 segmentation Effects 0.000 claims description 74
- 230000008569 process Effects 0.000 claims description 8
- 238000010276 construction Methods 0.000 abstract description 8
- 238000013473 artificial intelligence Methods 0.000 abstract description 2
- 238000010586 diagram Methods 0.000 description 19
- 238000012545 processing Methods 0.000 description 15
- 230000006870 function Effects 0.000 description 9
- 238000004891 communication Methods 0.000 description 8
- 238000004590 computer program Methods 0.000 description 7
- 230000000694 effects Effects 0.000 description 5
- 238000002474 experimental method Methods 0.000 description 5
- 230000005540 biological transmission Effects 0.000 description 3
- 239000000284 extract Substances 0.000 description 3
- 238000012986 modification Methods 0.000 description 3
- 230000004048 modification Effects 0.000 description 3
- 230000003287 optical effect Effects 0.000 description 3
- 230000005236 sound signal Effects 0.000 description 3
- 238000005516 engineering process Methods 0.000 description 2
- 230000003993 interaction Effects 0.000 description 2
- 230000001133 acceleration Effects 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 230000000295 complement effect Effects 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/332—Query formulation
- G06F16/3329—Natural language query formulation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/3331—Query processing
- G06F16/334—Query execution
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Mathematical Physics (AREA)
- Computational Linguistics (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Artificial Intelligence (AREA)
- Human Computer Interaction (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本申请实施例提供一种问答设备和答复信息确定方法,涉及人工智能技术领域。通过从输入的问题语句中提取多个关键信息,并确定每个关键信息对应的词性信息;根据确定的词性信息对应的词性代码生成问题语句的问题识别码;基于问题语句的问题识别码从问题模板表中查找问题语句对应的目标问题模板;若从问题模板表中查找到问题语句对应的目标问题模板,根据目标问题模板输出问题语句对应的答复信息。由于参数不同的同类问题所生成的问题识别码可以是相同的,因此,针对参数不同的同类问题可以只编写一个问题模板,相比现有技术中一个问题编写一个问题模板的方案,减少了问答知识库的人工构建工作。
Description
技术领域
本申请涉及人工智能技术领域,特别是涉及一种问答设备和答复信息确定方法。
背景技术
ALICE(Artificial Linguistic Internet Computer Entity,人工语言网络计算机实体)是一个智能聊天机器人程序,其问答知识库由AIML语言编写的文件组成。目前,很多应用系统通过使用ALICE建立AIML问答知识库,来实现智能问答系统或聊天机器人应用,从而针对用户问题进行匹配并回复精确的答复信息。
问答系统的答复效果很大程度上取决于问答知识库的丰富程度。然而,ALICE在编写AIML问答知识库时,通常每个问题对应一个问题模板,每个问题模板对应一个答复模板,对于同一类问题只是参数不同时仍需要重新编写一个问题模板。如果要完善问答系统的答复效果,就需要人工对海量的问题一一配置问题模板和答复模板,因此人工构建工作十分庞大。
发明内容
本申请实施例提供了一种问答设备和答复信息确定方法,有利于减少问答知识库的人工构建工作。
第一方面,本申请实施例提供了一种问答设备,包括处理器、存储器和输入组件;
所述输入组件用于接收用户输入的问题语句;
所述存储器用于存储终端设备运行时所使用的数据或程序代码;
所述处理器用于执行所述程序代码,以实现如下过程:从通过所述输入组件输入的问题语句中提取多个关键信息,并确定每个所述关键信息对应的词性信息;根据确定的词性信息对应的词性代码生成所述问题语句的问题识别码;基于所述问题语句的问题识别码从问题模板表中查找所述问题语句对应的目标问题模板;若从问题模板表中查找到所述问题语句对应的目标问题模板,根据所述目标问题模板输出所述问题语句对应的答复信息。
本申请实施例提供的问答设备,首先确定输入的问题语句的多个关键信息对应的词性信息,该词性信息可以是预先设定的,同类关键信息的词性信息是相同的,根据确定的词性信息对应的词性代码生成问题语句的问题识别码;对于参数(属于关键信息)不同的同类问题,其生成的问题识别码可以是相同的,进而基于相同的问题识别码可以从问题模板表中查找到相同的问题模板,当查找到目标问题模板后,根据目标问题模板输出问题语句对应的答复信息。因此,本申请对于参数不同的同类问题,可以只编写一个问题模板,相比现有技术中一个问题编写一个问题模板的方案,减少了问答知识库的人工构建工作。
在一种可能的实现方式中,所述处理器具体用于:
对所述问题语句进行分词,从得到的多个分词中提取多个关键信息。
该实施例提供的问答设备,通过在问题语句的多个分词中提取关键信息,可以便于快速提取多个关键信息。
在一种可能的实现方式中,所述处理器还用于:
若从问题模板表中未查找到所述问题语句对应的目标问题模板,在问法匹配树中查找所述问题语句对应的匹配路径,所述匹配路径用于指明在问题问法表中所述问题语句对应的目标问法语句;
根据所述目标问法语句输出所述问题语句对应的答复信息。
在该实施例中,由于同一问题可能有多种不同的问法,因此,不同问法中的一个或多个问法,在问题模板表中可能没有相匹配的问题模板,当基于问题语句的问题识别码不能从问题模板表中查找到对应的目标问题模板时,可以在问法匹配树中查找问题语句对应的匹配路径,匹配路径用于指明在问题问法表中问题语句对应的目标问法语句,问题问法表中存储了针对同一问题的不同问法;进而根据目标问法语句输出问题语句对应的答复信息。因此,本实施例对于同一问题的不同问法也可以匹配到对应的问法语句。
在一种可能的实现方式中,所述问题问法表存储的问法语句中包含词性代码,所述词性代码为问法语句中的关键信息的词性信息对应的词性代码,所述问法匹配树包括对应不同分词词语设置的根部节点、分支节点和叶子节点,每个叶子节点具有对应的匹配路径,所述问法匹配树中的分词词语对应所述问题问法表中的问法语句的分词;所述处理器具体用于:
对所述问题语句进行分词,将得到的多个分词依次与所述问法匹配树中的分词词语进行匹配;
若匹配到的分词词语中存在目标叶子节点对应的分词词语,将所述目标叶子节点对应的匹配路径作为所述问题语句对应的匹配路径;
若匹配到的分词词语中不存在目标叶子节点对应的分词词语,将所述问题语句的多个分词中的关键信息,替换为所述关键信息的词性信息对应的词性代码;
将替换后的问题语句的多个分词依次与所述问法匹配树中的分词词语进行匹配,确定所述问题语句对应的匹配路径。
在该实施例中,在通过问法匹配树查找问题语句对应的匹配路径时,首先将完整的问题语句的多个分词依次与所述问法匹配树中的分词词语进行匹配;若匹配成功,得到问题语句对应的匹配路径;若匹配失败,将问题语句的多个分词中的关键信息,替换为关键信息的词性信息对应的词性代码;将替换后的问题语句的多个分词依次与问法匹配树中的分词词语进行匹配,确定问题语句对应的匹配路径。从而既可以对不包含关键信息的问题语句进行匹配,也可以对包含关键信息的问题语句进行匹配。
在一种可能的实现方式中,所述处理器具体用于:
在问题模板表中,确定所述目标问题模板对应的答复模板标识;
根据确定的答复模板标识,在答复模板表中查找所述问题语句对应的目标答复模板;其中,所述目标答复模板包括模板文本、查询语句和数据源标识;
根据所述目标问题模板中的输入关键信息的词性代码确定查询条件信息;
根据所述数据源标识得到对应的知识库地址,并连接所述知识库地址对应的知识库;
根据所述查询语句和所述查询条件信息查询所述知识库,得到输出参数信息;其中,所述查询语句为知识库的结构化查询语句;
将所述输出参数信息填入所述模板文本中,得到所述问题语句对应的答复信息;
输出所述问题语句对应的答复信息。
现有技术中的问答知识库是由AIML语言编写的文件组成,由于AIML文件为xml文件,不能使用数据库进行存储和查询。而在该实施例中,知识库可以是多种类型的数据库,例如图数据库、关系型数据库等,根据知识库的结构化查询语句和查询条件信息从知识库中查询答复内容。因此,在构建问答知识库时,可以直接通过数据库存储答复信息中的内容,方便存储,并且便于查询。
第二方面,本申请实施例提供了一种答复信息确定方法,包括:
从输入的问题语句中提取多个关键信息,并确定每个所述关键信息对应的词性信息;
根据确定的词性信息对应的词性代码生成所述问题语句的问题识别码;
基于所述问题语句的问题识别码从问题模板表中查找所述问题语句对应的目标问题模板;
若从问题模板表中查找到所述问题语句对应的目标问题模板,根据所述目标问题模板输出所述问题语句对应的答复信息。
在一种可能的实现方式中,所述从输入的问题语句中提取多个关键信息,包括:
对所述问题语句进行分词,从得到的多个分词中提取多个关键信息。
在一种可能的实现方式中,所述方法还包括:
若从问题模板表中未查找到所述问题语句对应的目标问题模板,在问法匹配树中查找所述问题语句对应的匹配路径,所述匹配路径用于指明在问题问法表中所述问题语句对应的目标问法语句;
根据所述目标问法语句输出所述问题语句对应的答复信息。
在一种可能的实现方式中,所述问题问法表存储的问法语句中包含词性代码,所述词性代码为问法语句中的关键信息的词性信息对应的词性代码,所述问法匹配树包括对应不同分词词语设置的根部节点、分支节点和叶子节点,每个叶子节点具有对应的匹配路径,所述问法匹配树中的分词词语对应所述问题问法表中的问法语句的分词;
所述在问法匹配树中查找所述问题语句对应的匹配路径,包括:
对所述问题语句进行分词,将得到的多个分词依次与所述问法匹配树中的分词词语进行匹配;
若匹配到的分词词语中存在目标叶子节点对应的分词词语,将所述目标叶子节点对应的匹配路径作为所述问题语句对应的匹配路径;
若匹配到的分词词语中不存在目标叶子节点对应的分词词语,将所述问题语句的多个分词中的关键信息,替换为所述关键信息的词性信息对应的词性代码;
将替换后的问题语句的多个分词依次与所述问法匹配树中的分词词语进行匹配,确定所述问题语句对应的匹配路径。
在一种可能的实现方式中,所述根据所述目标问题模板输出所述问题语句对应的答复信息,包括:
在问题模板表中,确定所述目标问题模板对应的答复模板标识;
根据确定的答复模板标识,在答复模板表中查找所述问题语句对应的目标答复模板;其中,所述目标答复模板包括模板文本、查询语句和数据源标识;
根据所述目标问题模板中的输入关键信息的词性代码确定查询条件信息;
根据所述数据源标识得到对应的知识库地址,并连接所述知识库地址对应的知识库;
根据所述查询语句和所述查询条件信息查询所述知识库,得到输出参数信息;其中,所述查询语句为知识库的结构化查询语句;
将所述输出参数信息填入所述模板文本中,得到所述问题语句对应的答复信息;
输出所述问题语句对应的答复信息。
第二方面任意一种实现方式所带来的技术效果可参见第一方面中对应的实现方式所带来的技术效果,此处不再赘述。
附图说明
为了更清楚地说明本申请实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简要介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域的普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1为本申请实施例提供的一种问答设备的结构示意图;
图2为本申请实施例提供的一种问答设备的处理流程示意图;
图3为本申请实施例提供的一种机器人的结构示意图;
图4为本申请实施例提供的一种移动终端的结构示意图;
图5为本申请实施例提供的一种移动终端上的用户界面的示意图;
图6为本申请实施例提供的一种答复信息确定方法的流程示意图;
图7为本申请实施例提供的一种问答设备的结构框图。
具体实施方式
为了使本申请的目的、技术方案和优点更加清楚,下面将结合附图对本申请作进一步地详细描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其它实施例,都属于本申请保护的范围。
目前,很多应用系统通过使用ALICE建立AIML问答知识库,来实现智能问答系统或聊天机器人应用,从而针对用户问题进行匹配并回复精确的答案内容。问答系统答复的效果很大程度上取决于问答知识库的丰富程度。然而,ALICE在编写AIML问答知识库时,只能是一个问题对应一个问题模板,每个问题模板又对应一个答复模板,对于同一类问题只是参数不同时仍需要重新编写一个问题模板,要想完善问答效果,人工构建工作十分庞大。
基于此,本申请实施例提供一种问答设备和答复信息确定方法。通过从输入的问题语句中提取多个关键信息,并确定每个关键信息对应的词性信息;根据确定的词性信息对应的词性代码生成问题语句的问题识别码;基于问题语句的问题识别码从问题模板表中查找问题语句对应的目标问题模板;若从问题模板表中查找到问题语句对应的目标问题模板,根据目标问题模板输出问题语句对应的答复信息。
对于参数不同的同类问题,其中的不同参数对应的词性信息可以是相同的,而相同的词性信息对应的词性代码是相同的,因此,参数不同的同类问题生成的问题识别码可以是相同的,进而基于相同的问题识别码可以从问题模板表中查找到相同的问题模板,当查找到目标问题模板后,根据目标问题模板输出问题语句对应的答复信息。因此,本申请实施例对于参数不同的同类问题,可以只编写一个问题模板,相比现有技术中一个问题编写一个问题模板的方案,减少了问答知识库的人工构建工作。
为了使本申请的发明目的、技术方案和优点更加清楚,下面将结合附图对本发明作进一步地详细描述,显然,所描述的实施例仅仅是本申请一部份实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其它实施例,都属于本申请保护的范围。
需要说明的是,本申请实施例中术语“问答设备”可以是机器人、移动终端、音箱、服务器等,其中,移动终端可以是手机(mobile phone)、平板电脑(pad)等。
为了实现上述发明目的,本申请实施例提供的一种问答设备的结构示意图,具体如图1所示,问答设备100包括输入组件102、存储器102和处理器103。
输入组件101,用于接收用户输入的问题语句,如语音输入模块、按键输入模块、触摸面板等。
存储器102,用于存储处理器102运行时所使用的数据或程序代码,如本申请实施例提供的答复信息确定方法的程序代码等,其中,程序代码可以由处理器103执行。
处理器103,可以包括一个或多个中央处理单元(central processing unit,CPU),或者数字处理单元等等。处理器103,用于调用存储器102中存储的程序代码以实现如下过程:从通过输入组件101输入的问题语句中提取多个关键信息,并确定每个关键信息对应的词性信息;根据确定的词性信息对应的词性代码生成问题语句的问题识别码;基于问题语句的问题识别码从问题模板表中查找所述问题语句对应的目标问题模板;若从问题模板表中查找到问题语句对应的目标问题模板,根据目标问题模板输出问题语句对应的答复信息。
本申请实施例中不限定上述输入组件101、存储器102和处理器103之间的具体连接介质。本申请实施例在图1中,输入组件101、存储器102和处理器103之间通过总线104连接,其它部件之间的连接方式,仅是进行示意性说明,并不引以为限。所述总线104可以分为地址总线、数据总线、控制总线等。为便于表示,图1中仅用一条粗线表示,但并不表示仅有一根总线或一种类型的总线。
上述关键信息可以指问题语句中具有词性信息的关键词,其中的词性信息可以包括如下至少一类:地点参数、各个类别的专有名词、属性名词、问句句式词;每一类词性信息对应一个词性代码,该词性代码可以是自定义的代码。其中,地点参数可以指具体的地点,如xx地区xx街道xx号;各个类别的专有名词可以根据不同领域进行划分,比如问及教育入学相关问题时,可以将小学、中学、大学的学校校名按小学、中学、大学分类,每个类别都对应一个词性代码;属性名词例如“地址”、“位置”、“学校”等表示某一属性的名词;问句句式词例如“是什么”、“在哪里”等问句词。需要说明的是,词性信息的类别还可以增加其他类别,例如时间参数等。
在具体实施中,可以预先归纳出问句语料中的关键信息,并将关键词按问句语料中的语法意义分为上述多类词性信息。每类词性信息设置一个自定义的词性代号。预先将关键词、该词的词性信息和该词的词性代码的对应关系进行存储,例如存储到数据库中。
上述处理器103从问题语句中提取多个关键信息,并确定每个关键信息对应的词性信息后,可以将各个关键信息的词性信息对应的词性代码,按照关键信息在问题语句中的先后顺序依次拼在一起后,编码生成问题识别码。示例性的,输入的问题语句为“北京路小学的地址是什么?”,提取该问题语句的关键信息包括“北京路小学”、“地址”、“是什么”,根据预先存储的关键词、该词的词性信息和该词的词性代码的对应关系,可以确定“北京路小学”、“地址”、“是什么”分别属于小学类专有名词、属性名词、问句句式词,以及确定它们分别对应的词性代码,将这三个词性代码依次拼在一起后,编码生成问题识别码。
上述问题模板表(questiontemplate)用于存储问题模板,每个问题模板作为表中的一条记录,该问题模板表可以存储在数据库中。问题模板具体可以包括如下部分或者全部:问题模板标识、问题示例、问题识别码、输入关键信息的词性代码和答复模板标识。其中,问题示例是一个完整的问题语句,问题识别码根据该问题示例生成,生成方式如上述,在此不再赘述。输入关键信息的词性代码用于提取一个问题语句中的关键信息,将该关键信息作为后面查询语句的查询条件使用。当从问题模板表中查找到输入的问题语句对应的目标问题模板时,根据目标问题模板可以查找到对应的答复模板,进而根据答复模板获取答复信息,最后输出问题语句对应的答复信息。
本申请实施例的问答设备,对于输入的参数不同的同类问题,例如,“北京路小学的地址是什么”和“南京路小学的地址是什么”,其中的不同参数“北京路小学”和“南京路小学”对应的词性信息可以是相同的;又例如“北京路小学的地址是什么”和“北京路小学的位置在哪儿”,其中,“地址”和“位置”对应的词性信息可以是相同的,“是什么”和“在哪儿”对应的词性信息可以是相同的。由于相同的词性信息对应的词性代码是相同的,因此,参数不同的同类问题(包括同一问题的不同问法)生成的问题识别码可以是相同的,进而基于相同的问题识别码可以从问题模板表中查找到相同的问题模板,当查找到目标问题模板后,根据目标问题模板输出问题语句对应的答复信息。因此,对于参数不同的同类问题,可以只编写一个问题模板,相比现有技术中一个问题编写一个问题模板的方案,减少了问答知识库的人工构建工作。
在一种实施方式中,处理器103具体可以对问题语句进行分词,从得到的多个分词中提取多个关键信息。
该实施例中,处理器103可以采用分词工具对问题语句进行分词,例如HanLP(HanLanguage Processing,汉语言处理)分词工具,在对输入的问题语句进行处理之前,处理器103将上述预先存储的关键词、该词的词性信息和该词的词性代码的对应关系加载入分词工具中。通过分词工具将问题语句分词后,从得到的多个分词中过滤掉不具有词性信息的分词、停用词等,提取到具有词性信息的关键词作为关键信息。
在一些实施例中,同一问题可能有多种不同问法,例如,“北京路小学的地址是什么”,还可以是另一种问法“北京路小学在哪儿”,对于不同问法中的一个或多个问法,在问题模板表中可能没有相匹配的问题模板,此时,基于问题识别码不能从问题模板表中查找到对应的目标问题模板,处理器103还可以在问法匹配树中查找问题语句对应的匹配路径,匹配路径用于指明在问题问法表中问题语句对应的目标问法语句;根据目标问法语句输出问题语句对应的答复信息。因此,本申请实施例对于同一问题的不同问法也可以匹配到对应的问法语句。
该实施例中,针对同一问题存在不同问法的情况,设置问题问法表(questionpattern)来存储问法语句,该问题问法表可以存储在数据库中。具体的,与一个问法语句对应存储的内容包括如下部分或者全部:问法标识、输入关键信息的词性代码和答复模板标识,这些内容作为问题问法表中的一条记录。其中,问法语句是一个问题的另一种问句,该问句中的关键信息由该关键信息对应的词性代码代替。例如问句“实验小学的地址在哪?”,其中xx小学应该用小学的词性代码nzp代替,所以问法内容应该是“nzp的地址在哪”。
上述问法匹配树的生成方式为:将上述问题问法表中的问法语句依次采用分词工具进行分词,将各个问法语句分出的第一个分词分别作为匹配树的根下面的第一个分支,然后将各个问法语句的其它分词在对应的第一个分词处进行分支,如此生成树。因此,该问法匹配树包括对应不同分词词语设置的根部节点、分支节点和叶子节点,并且其中的分词词语对应问题问法表中的问法语句的分词;每个叶子节点具有对应的匹配路径,该匹配路径具体可以包括上述问题问法表中的问法标识、答复模板标识中的一种或两种。上述问法匹配树可以基于现有的ALICE的匹配算法为输入的问题语句匹配相应的问法语句。
可选的,在对问题问法表中的问法语句进行分词时,可以采用IK分词工具进行最小分词,从而时生成的问法匹配树的粒度更细,以便使匹配精度更高。示例性的,问法语句为“实验小学的地址是什么?”,采用ik分词工具进行最小分词后,得到以下分词:“实验”、“小学”、“的”、“地址”、“是”、“什么”;而采用HanLP分词工具进行分词,得到以下分词:“实验小学”、“的”、“地址”、“是什么”。可见,采用IK分词工具进行最小分词得到的分词粒度更细。
在一种实施方式中,问题问法表存储的问法语句中包含词性代码,词性代码为问法语句中的关键信息的词性信息对应的词性代码。处理器103在对问题语句进行问法匹配树匹配时,具体可以通过以下方式实现:对问题语句进行分词,将得到的多个分词依次与问法匹配树中的分词词语进行匹配;若匹配到的分词词语中存在目标叶子节点对应的分词词语,将目标叶子节点对应的匹配路径作为问题语句对应的匹配路径;若匹配到的分词词语中不存在目标叶子节点对应的分词词语,将问题语句的多个分词中的关键信息,替换为关键信息的词性信息对应的词性代码;将替换后的问题语句的多个分词依次与问法匹配树中的分词词语进行匹配,确定问题语句对应的匹配路径。
可选地,当问法匹配树中的分词词语为最小分词时,可以对输入的问题语句进行最小分词,例如采用IK分词工具进行最小分词。首先将整个问题语句的多个分词依次和问法匹配树中从根部节点到各个叶子节点中的分词词语进行比较,如果最终查找到与问法匹配树中的分词词语相同的一个从根部节点到叶子节点的路径,则为匹配成功;如果匹配失败,则将问题语句的多个分词中的关键信息,替换为关键信息的词性信息对应的词性代码;将替换后的问题语句的多个分词按照上述匹配方式依次与问法匹配树中的分词词语进行匹配,以确定问题语句对应的匹配路径。
通过上述问法匹配树的匹配方式,既可以对不包含关键信息的问题语句进行匹配,也可以对包含关键信息的问题语句进行匹配。
在一种实施方式中,处理器103在根据目标问题模板输出问题语句对应的答复信息时,具体可以通过以下方式实现:在问题模板表中,确定目标问题模板对应的答复模板标识;根据确定的答复模板标识,在答复模板表中查找问题语句对应的目标答复模板;其中,目标答复模板包括模板文本、查询语句和数据源标识;根据目标问题模板中的输入关键信息的词性代码确定查询条件信息;根据数据源标识得到对应的知识库地址,并连接知识库地址对应的知识库;根据查询语句和查询条件信息查询知识库,得到输出参数信息;其中,查询语句为知识库的结构化查询语句;将输出参数信息填入模板文本中,得到问题语句对应的答复信息;输出问题语句对应的答复信息。
上述答复模板表(answertemplate)用于存储答复模板,该答复模板表可以存储在数据库中。答复模板具体可以包括以下部分或全部:答复模板标识、模板文本、查询语句、数据源标识、输出参数信息的名称。其中,模板文本是用来生成答复信息的语句,当答复信息包括输入关键信息和输出参数信息时,该语句中空出输入关键信息和输出参数信息的位置。其中,输入关键信息是问题语句中的需要填入答复信息中的关键信息,在后面确定问题语句对应的输入关键信息并查询到输出参数信息时,将确定的输入关键信息和查询到的输出参数信息填入模板文本,生成答复信息。数据源是对应知识库的链接地址,答复模板中存放对应知识库地址的数据源标识。查询语句是知识库的结构化查询语句(SQL),知识库支持图数据库和关系型数据库等多种数据库。
现有技术中的问答知识库是由AIML语言编写的文件组成,由于AIML文件为xml文件,不能使用数据库进行存储和查询。而本申请实施例在构建问答知识库时,可以直接通过数据库存储答复信息中的内容,方便存储,并且便于查询。
下面详细介绍一下问答设备对于输入的问题语句进行问题匹配以及生成答复信息的具体流程。
示例性的,参照图2所示,针对输入的问题语句,问答设备首先采用分词器工具对问题语句进行分词,然后进行关键词处理,即提取分词结果中所有具有词性信息的关键信息。根据各个关键信息对应的词性代码生成问题识别码。通过该问题识别码查询问题模板表,如果匹配到目标问题模板,则为匹配成功。如果匹配失败,则对问题语句进行问法匹配树匹配。首先通过IK分词工具对问题语句进行最小分词,然后将得到的多个分词在问法匹配树中进行匹配,具体的匹配过程参见前述的问法匹配树匹配过程,在此不再赘述。如果匹配成功,得到一个匹配路径,该匹配路径对应问题问法表中的目标问法语句。
通过上述问题匹配方式匹配到问模板表中的目标问题模板,或者匹配到问题问法表中的目标问法语句后,获取目标问题模板中的输入关键信息的词性代码或者目标问法语句对应的输入关键信息的词性代码,根据输入关键信息的词性代码从上述问题语句的多个关键词中筛选与该词性代码对应的关键词,将得到的关键词作为答复信息的查询条件信息。例如,输入的问题语句为“实验小学的地址是什么?”,输入关键信息为实验小学,目标问题模板中的存储有“实验小学”的词性代码。
根据上述目标问题模板或者上述目标问题语句可以得到对应的答复模板标识。通过答复模板标识可以查询到答复模板表中对应的目标答复模板,得到模板文本、查询语句和数据源标识等。首先通过数据源标识得到对应的知识库地址,通过数据源链接池与知识库地址对应的知识库建立连接。然后根据查询语句和上面得到的查询条件信息的组合从知识库中进行查询,得到输出参数信息。将输出参数信息组合到模板文本中得到答复信息。
示例性的,输入问题语句“实验小学的地址是什么?”对应的答复模板中的模板文本为“_的地址是_”,其中“_”表示空白,前一空白处需要填入的是输入关键信息“实验小学”,后一空白处需要填入的是后面查询到的输出参数信息;查询语句为“nzp的地址是什么?”,其中,nzp为“实验小学”的词性代码。将查询语句“nzp的地址是什么?”和查询条件信息“实验小学”组合起来即原问题语句“实验小学的地址是什么?”,从知识库中查询到输出参数信息,即实验小学的具体地址信息,进而输出答复信息。
需要说明的是,由于上述答复模板可以通过数据源标识确定对应的知识库地址,因此可以支持多类知识库的查询,例如图2中的知识库1、知识库2等等,并且知识库可以为多种数据库类型。另外,对于直接回答不用查询知识库的问题语句,也可以直接根据答复模板的模板文本生成答复信息,不用配置数据源从知识库中查询输出参数信息。
本申请实施例通过对关键词设置自定义的词性信息,并且每类词性信息设置一个词性代码,进而根据词性信息对应的词性代码可以生成每个问题语句的问题识别码,基于问题识别码进行问题匹配,以及基于问法匹配树进行问题匹配,解决了现有技术中对于同类问题不同参数,无法使用ALICE的原始AIML进行匹配的问题,同时解决了同一问题不同问法的匹配问题,减少了问答知识库的人工构建工作。通过设置的支持多知识库的答复模板,使得问答设备在答复问题知识领域的拓展方面比单一知识库的问答设备更加灵活,适配性更强。
本申请实施例的问答设备可以是机器人,图3示例性示出了一种机器人的示意图。机器人300的内部可以设置存储器和处理器,外部可以设置输入组件,该输入组件可以是语音输入模块,也可以是触摸面板等。应该理解的是,图3所示的机器人仅是一个范例。
本申请实施例的问答设备还可以是移动终端。移动终端400的结构可以参照图4所示。应该理解的是,图4所示的移动终端400仅是一个范例,并且移动终端400可以具有比图4中所示的更多的或者更少的部件,可以组合两个或多个的部件,或者可以具有不同的部件配置。图中所示出的各种部件可以在包括一个或多个信号处理和/或专用集成电路在内的硬件、软件、或硬件和软件的组合中实现。
图4中示例性示出了根据示例性实施例中移动终端400的硬件配置框图。如图4所示,移动终端400包括:通信组件410、存储器420、显示单元430、摄像头440、传感器450、音频电路460、蓝牙模块470、处理器480以及电源490等部件。其中,显示单元430和音频电路460都可以作为本申请实施例的输入组件。
通信组件410用于与网络侧设备进行通信,可以接收基站的下行数据后交给处理器480处理,可以将上行数据发送给基站,也可以用于监测节能指示信息等。通信组件410可以包括但不限于天线、至少一个放大器、发射器、接收器、信号监听器、耦合器、低噪声放大器、双工器等器件,其中,信号监听器可以是接收器中的一个。
在一些实施例中,通信组件410可以包括RF(radio frequency,射频)电路,用于在收发信息或通话过程中信号的接收和发送。
在另一些实施例中,通讯组件410还可以包括WiFi(Wireless Fidelity,电路无线保真)模块,WiFi模块属于短距离无线传输技术,移动终端400通过WiFi模块可以帮助用户收发信息、电子邮件、浏览网页和访问流式媒体等,它为用户提供了无线的宽带互联网访问。可以理解的是,WiFi模块并不属于通讯组件410的必须构成,完全可以根据需要在不改变发明的本质的范围内而省略。
存储器420可用于存储软件程序及数据。处理器480通过运行存储在存储器420的软件程序或数据,从而执行移动终端400的各种功能以及数据处理。存储器420可以包括高速随机存取存储器,还可以包括非易失性存储器,例如至少一个磁盘存储器件、闪存器件、或其他易失性固态存储器件。存储器420存储有使得移动终端400能运行的操作系统。本申请中存储器420可以存储操作系统及各种应用程序,还可以存储执行本申请实施例所述答复信息确定方法的代码。
显示单元430可用于接收输入的数字或字符信息,产生与移动终端400的用户设置以及功能控制有关的信号输入,具体地,显示单元430可以包括设置在移动终端400正面的触摸屏431,可收集用户在其上或附近的触摸操作,例如点击按钮,拖动滚动框等。
显示单元430还可用于显示由用户输入的信息或提供给用户的信息以及移动终端400的各种菜单的图形用户界面(graphical user interface,GUI)。具体地,显示单元430可以包括设置在移动终端400正面的显示屏432。其中,显示屏432可以采用液晶显示器、发光二极管等形式来配置。显示单元430可以用于显示本申请中所述的各种图形用户界面。
其中,触摸屏431可以覆盖在显示屏432之上,也可以将触摸屏431与显示屏432集成而实现移动终端400的输入和输出功能,集成后可以简称触摸显示屏。本申请中显示单元430可以显示应用程序以及对应的操作步骤。
摄像头440可用于捕获静态图像或视频。摄像头440可以是一个,也可以是多个。物体通过镜头生成光学图像投射到感光元件。感光元件可以是电荷耦合器件(chargecoupled device,CCD)或互补金属氧化物半导体(complementary metal-oxide-semiconductor,CMOS)光电晶体管。感光元件把光信号转换成电信号,之后将电信号传递给处理器480转换成数字图像信号。
移动终端400还可以包括至少一种传感器450,比如加速度传感器451、距离传感器452、指纹传感器453、温度传感器454。移动终端400还可配置有陀螺仪、气压计、湿度计、温度计、红外线传感器、光传感器、运动传感器等其他传感器。
音频电路460、扬声器461、麦克风462可提供用户与移动终端400之间的音频接口。音频电路460可将接收到的音频数据转换后的电信号,传输到扬声器461,由扬声器461转换为声音信号输出。移动终端400还可配置音量按钮,用于调节声音信号的音量。另一方面,麦克风462将收集的声音信号转换为电信号,由音频电路460接收后转换为音频数据,再将音频数据输出至通信组件410以发送给比如另一终端设备,或者将音频数据输出至存储器420以便进一步处理。本申请中麦克风462可以获取用户的语音。
蓝牙模块470用于通过蓝牙协议来与其他具有蓝牙模块的蓝牙设备进行信息交互。例如,移动终端400可以通过蓝牙模块470与同样具备蓝牙模块的可穿戴电子设备(例如智能手表)建立蓝牙连接,从而进行数据交互。
处理器480是移动终端400的控制中心,利用各种接口和线路连接整个终端的各个部分,通过运行或执行存储在存储器420内的软件程序,以及调用存储在存储器420内的数据,执行移动终端400的各种功能和处理数据。在一些实施例中,处理器480可包括一个或多个处理单元;处理器480还可以集成应用处理器和基带处理器,其中,应用处理器主要处理操作系统、用户界面和应用程序等,基带处理器主要处理无线通信。可以理解的是,上述基带处理器也可以不集成到处理器480中。本申请中处理器480可以运行操作系统、应用程序、用户界面显示及触控响应,以及本申请实施例的答复信息确定方法。另外,处理器480与显示单元430耦接。
图5示出了本申请实施例提供的一种移动终端上的用户界面的示意图。移动终端以手机为例,如图5所示,在手机界面中显示出了输入的同一问题的不同问法,以及针对同一问题的不同问法所输出的答复信息;其中,同一问题的不同问法可以通过手机的触摸显示屏文字输入,也可以语音输入。
示例性的,如图5所示,用户在手机的触摸显示屏中输入“北京路小学的地址是什么”,手机的处理器接收到该问题语句,首先对该问题语句进行分词,得到以下分词:“北京路小学”、“的”、“地址”、“是什么”,提取其中的关键信息“北京路小学”、“地址”、“是什么”;然后根据这三个关键信息的词性信息(依次为小学专有名词、属性名词、问句句式词)分别对应的词性代码生成问题识别码,基于该问题识别码从问题模板表中查找对应的目标问题模板;当查找到目标问题模板后,根据目标问题模板中的答复模板标识从答复模板表中查找对应的目标答复模板,进而根据目标答复模板获取答复信息,最后输出该答复信息,即“北京路小学的地址是山东省青岛市市南区北京路65号”。
对于第一个问题语句的同类问题(包括第一个问题语句的另一种问法)“北京路小学的位置在哪儿”,提取其关键信息“北京路小学”、“位置”、“在哪儿”;这三个关键信息的词性信息(依次为小学专有名词、属性名词、问句句式词)与上述问题语句的三个关键信息都相同,因此,该问法语句与第一个问题语句对应相同的问题识别码;进而根据问题识别码匹配到相同的问题模板,并且最后获取到相同的答复信息。
对于第一个问题语句的又一种问法“北京路小学在哪儿”,手机的处理器接收到该问题语句,首先对该问题语句进行分词,得到以下分词:“北京路小学”、“在哪儿”,提取其中的关键信息“北京路小学”、“在哪儿”;然后根据这两个关键信息的词性信息(依次为小学专有名词、问句句式词)分别对应的词性代码生成问题识别码,基于该问题识别码从问题模板表中查找对应的目标问题模板;如果未查找到目标问题模板,则将上述问题语句进行问法匹配树匹配,具体匹配过程参见前述,最后得到一个匹配路径,根据该匹配路径获取到问题语句对应得问题问法表中得目标问法语句。根据目标问法语句对应得答复模板标识从答复模板表中查找对应的目标答复模板,进而根据目标答复模板获取答复信息,最后输出该答复信息,即“北京路小学的地址是山东省青岛市市南区北京路65号”。
因此,本申请实施例对于输入的参数不同的同类问题可以匹配到相同的问题模板,并且针对输入的同一问题的不同问法,可以匹配到相应的问法语句,进而可以输出同一问题对应的相同的答复信息。
基于同一发明构思,本发明实施例中还提供了一种答复信息确定方法,该答复信息确定方法可以由问答设备执行。由于该答复信息确定方法对应的是本发明实施例问答设备对应的方法,并且该方法解决问题的原理与该问答设备相似,因此该方法的实施可以参见上述问答设备的实施,重复之处不再赘述。
图6示出了本申请实施例提供的一种答复信息确定方法的流程示意图。如图6所示,该答复信息确定方法具体包括如下步骤:
步骤S601,从输入的问题语句中提取多个关键信息,并确定每个关键信息对应的词性信息。
步骤S602,根据确定的词性信息对应的词性代码生成问题语句的问题识别码。
步骤S603,基于问题语句的问题识别码从问题模板表中查找问题语句对应的目标问题模板。
步骤S604,若从问题模板表中查找到问题语句对应的目标问题模板,根据目标问题模板输出问题语句对应的答复信息。
在一种可能的实现方式中,步骤S601包括:
对问题语句进行分词,从得到的多个分词中提取多个关键信息。
在一种可能的实现方式中,方法还包括以下步骤:
步骤1)若从问题模板表中未查找到问题语句对应的目标问题模板,在问法匹配树中查找问题语句对应的匹配路径,匹配路径用于指明在问题问法表中问题语句对应的目标问法语句;
步骤2)根据目标问法语句输出问题语句对应的答复信息。
在一种可能的实现方式中,问题问法表存储的问法语句中包含词性代码,词性代码为问法语句中的关键信息的词性信息对应的词性代码,问法匹配树包括对应不同分词词语设置的根部节点、分支节点和叶子节点,每个叶子节点具有对应的匹配路径,问法匹配树中的分词词语对应问题问法表中的问法语句的分词;上述步骤1)具体可以包括以下步骤:
(1)对问题语句进行分词,将得到的多个分词依次与问法匹配树中的分词词语进行匹配;
(2)若匹配到的分词词语中存在目标叶子节点对应的分词词语,将目标叶子节点对应的匹配路径作为问题语句对应的匹配路径;
(3)若匹配到的分词词语中不存在目标叶子节点对应的分词词语,将问题语句的多个分词中的关键信息,替换为关键信息的词性信息对应的词性代码;
(4)将替换后的问题语句的多个分词依次与问法匹配树中的分词词语进行匹配,确定问题语句对应的匹配路径。
在一种可能的实现方式中,步骤S604具体可以包括以下步骤:
a.在问题模板表中,确定目标问题模板对应的答复模板标识;
b.根据确定的答复模板标识,在答复模板表中查找问题语句对应的目标答复模板;其中,目标答复模板包括模板文本、查询语句和数据源标识;
c.根据目标问题模板中的输入关键信息的词性代码确定查询条件信息;
d.根据数据源标识得到对应的知识库地址,并连接知识库地址对应的知识库;
e.根据查询语句和查询条件信息查询知识库,得到输出参数信息;其中,查询语句为知识库的结构化查询语句;
f.将输出参数信息填入模板文本中,得到问题语句对应的答复信息;
g.输出问题语句对应的答复信息。
基于同一发明构思,本发明实施例中还提供了一种问答设备,如图7所示的问答设备的结构框图,该问答设备包括:
提取单元701,用于从输入的问题语句中提取多个关键信息,并确定每个关键信息对应的词性信息。
生成单元702,用于根据确定的词性信息对应的词性代码生成问题语句的问题识别码。
第一查找单元703,用于基于问题语句的问题识别码从问题模板表中查找问题语句对应的目标问题模板。
第一输出单元704,用于若从问题模板表中查找到问题语句对应的目标问题模板,根据目标问题模板输出问题语句对应的答复信息。
在一种可能的实现方式中,提取单元701还用于:
对问题语句进行分词,从得到的多个分词中提取多个关键信息。
在一种可能的实现方式中,问答设备还包括:
第二查找单元,用于若从问题模板表中未查找到问题语句对应的目标问题模板,在问法匹配树中查找问题语句对应的匹配路径,匹配路径用于指明在问题问法表中问题语句对应的目标问法语句;
第二输出单元,用于根据目标问法语句输出问题语句对应的答复信息。
在一种可能的实现方式中,问题问法表存储的问法语句中包含词性代码,词性代码为问法语句中的关键信息的词性信息对应的词性代码,问法匹配树包括对应不同分词词语设置的根部节点、分支节点和叶子节点,每个叶子节点具有对应的匹配路径,问法匹配树中的分词词语对应问题问法表中的问法语句的分词;
第二查找单元还用于:
对问题语句进行分词,将得到的多个分词依次与问法匹配树中的分词词语进行匹配;
若匹配到的分词词语中存在目标叶子节点对应的分词词语,将目标叶子节点对应的匹配路径作为问题语句对应的匹配路径;
若匹配到的分词词语中不存在目标叶子节点对应的分词词语,将问题语句的多个分词中的关键信息,替换为关键信息的词性信息对应的词性代码;
将替换后的问题语句的多个分词依次与问法匹配树中的分词词语进行匹配,确定问题语句对应的匹配路径。
在一种可能的实现方式中,第一输出单元704还用于:
在问题模板表中,确定目标问题模板对应的答复模板标识;
根据确定的答复模板标识,在答复模板表中查找问题语句对应的目标答复模板;其中,目标答复模板包括模板文本、查询语句和数据源标识;
根据目标问题模板中的输入关键信息的词性代码确定查询条件信息;
根据数据源标识得到对应的知识库地址,并连接知识库地址对应的知识库;
根据查询语句和查询条件信息查询知识库,得到输出参数信息;其中,查询语句为知识库的结构化查询语句;
将输出参数信息填入模板文本中,得到问题语句对应的答复信息;
输出问题语句对应的答复信息。
本领域内的技术人员应明白,本申请的实施例可提供为方法、系统、或计算机程序产品。因此,本申请可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本申请是参照根据本申请的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
显然,本领域的技术人员可以对本申请进行各种改动和变型而不脱离本申请的精神和范围。这样,倘若本申请的这些修改和变型属于本申请权利要求及其等同技术的范围之内,则本申请也意图包含这些改动和变型在内。
Claims (10)
1.一种问答设备,其特征在于,包括处理器、存储器和输入组件;
所述输入组件用于接收用户输入的问题语句;
所述存储器用于存储终端设备运行时所使用的数据或程序代码;
所述处理器用于执行所述程序代码,以实现如下过程:从通过所述输入组件输入的问题语句中提取多个关键信息,并确定每个所述关键信息对应的词性信息;根据确定的词性信息对应的词性代码生成所述问题语句的问题识别码;基于所述问题语句的问题识别码从问题模板表中查找所述问题语句对应的目标问题模板;若从问题模板表中查找到所述问题语句对应的目标问题模板,根据所述目标问题模板输出所述问题语句对应的答复信息。
2.根据权利要求1所述的问答设备,其特征在于,所述处理器具体用于:
对所述问题语句进行分词,从得到的多个分词中提取多个关键信息。
3.根据权利要求1所述的问答设备,其特征在于,所述处理器还用于:
若从问题模板表中未查找到所述问题语句对应的目标问题模板,在问法匹配树中查找所述问题语句对应的匹配路径,所述匹配路径用于指明在问题问法表中所述问题语句对应的目标问法语句;
根据所述目标问法语句输出所述问题语句对应的答复信息。
4.根据权利要求3所述的问答设备,其特征在于,所述问题问法表存储的问法语句中包含词性代码,所述词性代码为问法语句中的关键信息的词性信息对应的词性代码,所述问法匹配树包括对应不同分词词语设置的根部节点、分支节点和叶子节点,每个叶子节点具有对应的匹配路径,所述问法匹配树中的分词词语对应所述问题问法表中的问法语句的分词;所述处理器具体用于:
对所述问题语句进行分词,将得到的多个分词依次与所述问法匹配树中的分词词语进行匹配;
若匹配到的分词词语中存在目标叶子节点对应的分词词语,将所述目标叶子节点对应的匹配路径作为所述问题语句对应的匹配路径;
若匹配到的分词词语中不存在目标叶子节点对应的分词词语,将所述问题语句的多个分词中的关键信息,替换为所述关键信息的词性信息对应的词性代码;
将替换后的问题语句的多个分词依次与所述问法匹配树中的分词词语进行匹配,确定所述问题语句对应的匹配路径。
5.根据权利要求1所述的问答设备,其特征在于,所述处理器具体用于:
在问题模板表中,确定所述目标问题模板对应的答复模板标识;
根据确定的答复模板标识,在答复模板表中查找所述问题语句对应的目标答复模板;其中,所述目标答复模板包括模板文本、查询语句和数据源标识;
根据所述目标问题模板中的输入关键信息的词性代码确定查询条件信息;
根据所述数据源标识得到对应的知识库地址,并连接所述知识库地址对应的知识库;
根据所述查询语句和所述查询条件信息查询所述知识库,得到输出参数信息;其中,所述查询语句为知识库的结构化查询语句;
将所述输出参数信息填入所述模板文本中,得到所述问题语句对应的答复信息;
输出所述问题语句对应的答复信息。
6.一种答复信息确定方法,其特征在于,包括:
从输入的问题语句中提取多个关键信息,并确定每个所述关键信息对应的词性信息;
根据确定的词性信息对应的词性代码生成所述问题语句的问题识别码;
基于所述问题语句的问题识别码从问题模板表中查找所述问题语句对应的目标问题模板;
若从问题模板表中查找到所述问题语句对应的目标问题模板,根据所述目标问题模板输出所述问题语句对应的答复信息。
7.根据权利要求6所述的方法,其特征在于,所述从输入的问题语句中提取多个关键信息,包括:
对所述问题语句进行分词,从得到的多个分词中提取多个关键信息。
8.根据权利要求6所述的方法,其特征在于,所述方法还包括:
若从问题模板表中未查找到所述问题语句对应的目标问题模板,在问法匹配树中查找所述问题语句对应的匹配路径,所述匹配路径用于指明在问题问法表中所述问题语句对应的目标问法语句;
根据所述目标问法语句输出所述问题语句对应的答复信息。
9.根据权利要求8所述的方法,其特征在于,所述问题问法表存储的问法语句中包含词性代码,所述词性代码为问法语句中的关键信息的词性信息对应的词性代码,所述问法匹配树包括对应不同分词词语设置的根部节点、分支节点和叶子节点,每个叶子节点具有对应的匹配路径,所述问法匹配树中的分词词语对应所述问题问法表中的问法语句的分词;
所述在问法匹配树中查找所述问题语句对应的匹配路径,包括:
对所述问题语句进行分词,将得到的多个分词依次与所述问法匹配树中的分词词语进行匹配;
若匹配到的分词词语中存在目标叶子节点对应的分词词语,将所述目标叶子节点对应的匹配路径作为所述问题语句对应的匹配路径;
若匹配到的分词词语中不存在目标叶子节点对应的分词词语,将所述问题语句的多个分词中的关键信息,替换为所述关键信息的词性信息对应的词性代码;
将替换后的问题语句的多个分词依次与所述问法匹配树中的分词词语进行匹配,确定所述问题语句对应的匹配路径。
10.根据权利要求6所述的方法,其特征在于,所述根据所述目标问题模板输出所述问题语句对应的答复信息,包括:
在问题模板表中,确定所述目标问题模板对应的答复模板标识;
根据确定的答复模板标识,在答复模板表中查找所述问题语句对应的目标答复模板;其中,所述目标答复模板包括模板文本、查询语句和数据源标识;
根据所述目标问题模板中的输入关键信息的词性代码确定查询条件信息;
根据所述数据源标识得到对应的知识库地址,并连接所述知识库地址对应的知识库;
根据所述查询语句和所述查询条件信息查询所述知识库,得到输出参数信息;其中,所述查询语句为知识库的结构化查询语句;
将所述输出参数信息填入所述模板文本中,得到所述问题语句对应的答复信息;
输出所述问题语句对应的答复信息。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010722247.XA CN111897915B (zh) | 2020-07-24 | 2020-07-24 | 问答设备和答复信息确定方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010722247.XA CN111897915B (zh) | 2020-07-24 | 2020-07-24 | 问答设备和答复信息确定方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN111897915A true CN111897915A (zh) | 2020-11-06 |
CN111897915B CN111897915B (zh) | 2024-04-12 |
Family
ID=73190868
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010722247.XA Active CN111897915B (zh) | 2020-07-24 | 2020-07-24 | 问答设备和答复信息确定方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111897915B (zh) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113254614A (zh) * | 2021-05-25 | 2021-08-13 | 平安证券股份有限公司 | 智能问答方法、装置、设备及计算机可读存储介质 |
CN113886474A (zh) * | 2021-08-31 | 2022-01-04 | 阿里巴巴达摩院(杭州)科技有限公司 | 数据处理方法及装置 |
CN114328852A (zh) * | 2021-08-26 | 2022-04-12 | 腾讯科技(深圳)有限公司 | 一种文本处理的方法、相关装置及设备 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2017010652A1 (ko) * | 2015-07-15 | 2017-01-19 | 포항공과대학교 산학협력단 | 자동질의응답 방법 및 그 장치 |
CN110263142A (zh) * | 2019-06-27 | 2019-09-20 | 北京百度网讯科技有限公司 | 用于输出信息的方法和装置 |
-
2020
- 2020-07-24 CN CN202010722247.XA patent/CN111897915B/zh active Active
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2017010652A1 (ko) * | 2015-07-15 | 2017-01-19 | 포항공과대학교 산학협력단 | 자동질의응답 방법 및 그 장치 |
CN110263142A (zh) * | 2019-06-27 | 2019-09-20 | 北京百度网讯科技有限公司 | 用于输出信息的方法和装置 |
Non-Patent Citations (1)
Title |
---|
时雨;古天龙;宾辰忠;孙彦鹏;: "基于知识图谱的旅游景点问答系统", 桂林电子科技大学学报, no. 04 * |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113254614A (zh) * | 2021-05-25 | 2021-08-13 | 平安证券股份有限公司 | 智能问答方法、装置、设备及计算机可读存储介质 |
CN114328852A (zh) * | 2021-08-26 | 2022-04-12 | 腾讯科技(深圳)有限公司 | 一种文本处理的方法、相关装置及设备 |
CN113886474A (zh) * | 2021-08-31 | 2022-01-04 | 阿里巴巴达摩院(杭州)科技有限公司 | 数据处理方法及装置 |
Also Published As
Publication number | Publication date |
---|---|
CN111897915B (zh) | 2024-04-12 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110795528B (zh) | 一种数据查询方法、装置、电子设备及存储介质 | |
CN110334347B (zh) | 基于自然语言识别的信息处理方法、相关设备及存储介质 | |
CN111897915B (zh) | 问答设备和答复信息确定方法 | |
CN110969012B (zh) | 文本纠错方法、装置、存储介质及电子设备 | |
CN111309863B (zh) | 基于知识图谱的自然语言问答方法及装置 | |
CN111738010B (zh) | 用于生成语义匹配模型的方法和装置 | |
CN104077294A (zh) | 一种信息推荐方法、装置及信息资源推荐系统 | |
CN111563151B (zh) | 一种信息采集的方法、会话配置的方法、装置及存储介质 | |
CN110852109A (zh) | 语料生成方法、语料生成装置、和存储介质 | |
CN110825863B (zh) | 一种文本对融合方法及装置 | |
CN111597804B (zh) | 一种实体识别模型训练的方法以及相关装置 | |
CN108345608A (zh) | 一种搜索方法、装置及设备 | |
WO2024088039A1 (zh) | 人机对话方法、对话网络模型的训练方法及装置 | |
CN112214605A (zh) | 一种文本分类方法和相关装置 | |
CN113868427A (zh) | 一种数据处理方法、装置及电子设备 | |
CN114328852A (zh) | 一种文本处理的方法、相关装置及设备 | |
CN114880480A (zh) | 一种基于知识图谱的问答方法及装置 | |
CN111553163A (zh) | 文本相关度的确定方法、装置、存储介质及电子设备 | |
CN117112593A (zh) | Sql语句生成方法、介质和计算机设备 | |
CN111241815A (zh) | 文本增量方法、装置及终端设备 | |
CN110781274A (zh) | 一种问答对生成的方法与装置 | |
CN114219443A (zh) | 单据数据处理方法、装置及设备 | |
CN115730047A (zh) | 一种智能问答方法、设备、装置及存储介质 | |
CN114756677A (zh) | 样本生成方法、文本分类模型的训练方法及文本分类方法 | |
CN117370361B (zh) | 数据表操作方法、装置、电子设备和计算机可读介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
TA01 | Transfer of patent application right |
Effective date of registration: 20201127 Address after: Donghai West Road 266071 Shandong city of Qingdao province No. 17 Applicant after: HISENSE Co.,Ltd. Address before: 266555 Qingdao economic and Technological Development Zone, Shandong, Hong Kong Road, No. 218 Applicant before: QINGDAO HISENSE ELECTRONIC INDUSTRY HOLDING Co.,Ltd. |
|
TA01 | Transfer of patent application right | ||
GR01 | Patent grant | ||
GR01 | Patent grant |