CN103853842B - 一种自动问答方法和系统 - Google Patents
一种自动问答方法和系统 Download PDFInfo
- Publication number
- CN103853842B CN103853842B CN201410104275.XA CN201410104275A CN103853842B CN 103853842 B CN103853842 B CN 103853842B CN 201410104275 A CN201410104275 A CN 201410104275A CN 103853842 B CN103853842 B CN 103853842B
- Authority
- CN
- China
- Prior art keywords
- question
- answer
- data
- answer pair
- query
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/332—Query formulation
- G06F16/3329—Natural language query formulation or dialogue systems
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Mathematical Physics (AREA)
- Theoretical Computer Science (AREA)
- Artificial Intelligence (AREA)
- Human Computer Interaction (AREA)
- Computational Linguistics (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明实施例提供一种自动问答方法和系统,包括:获取用户的查询信息;根据查询信息和至少一个知识场景的问答对数据,查询场景关联查询结果,并向用户返回,其中,所述知识场景的问答对数据中包括至少一个问答对,所述问答对之间具有设定的关联关系。本发明实施例的技术方案,将各种问答对以知识场景的形式进行组织,且建立了问答对之间的关联,则用户进行查询时,可以获得与场景相关联的查询结果,且能利用问答对之间的关联关系得到丰富灵活的结果,避免了问答结果单一的问题。
Description
技术领域
本发明实施例涉及计算机数据处理技术,尤其涉及一种自动问答方法和系统。
背景技术
自动问答是指用户与计算机进行交互,由用户提出问题计算机自动返回答案的技术。
现有的自动问答技术是依靠计算机收集大量知识数据,以问题-答案对的形式进行存储,构成问答对数据库,为用户提供需要的信息。当接收到用户提出的问题,即查询信息时,系统根据查询信息中的关键词在数据库中查找相匹配的问题,然后返回该问题的答案。
但现有的数据库中收集的信息是相对独立的数据,基于现有的数据库进行查询时,查询到的答案结果单一,只能针对用户提出的具体问题返回单一的答案,或者当用户提出比较宽泛的问题时,无法进行有针对性的查询。
发明内容
本发明实施例提供一种自动问答方法和系统,以使问答方法返回的答案更加丰富并具有针对性。
第一方面,本发明实施例提供一种自动问答方法,该方法包括:
获取用户的查询信息;
根据查询信息和至少一个知识场景的问答对数据,查询场景关联查询结果,并向用户返回,其中,所述知识场景的问答对数据中包括至少一个问答对,所述问答对之间具有设定的关联关系。
第二方面,本发明提供一种自动问答系统,该系统包括:
信息获取模块,用于获取用户的查询信息;
查询结果模块,用于根据查询信息和至少一个知识场景的问答对数据,查询场景关联查询结果,并向用户返回,其中,所述知识场景的问答对数据中包括至少一个问答对,所述问答对之间具有设定的关联关系。
本发明实施例的技术方案,将各种问答对以知识场景的形式进行组织,且建立了问答对之间的关联,则用户进行查询时,可以获得与场景相关联的查询结果,且能利用问答对之间的关联关系得到丰富灵活的结果,避免了问答结果单一的问题。
附图说明
图1为本发明实施例一提供的自动问答方法的流程图;
图2是本发明实施例二提供的自动问答方法中构建知识场景的流程图;
图3是本发明实施例三提供的自动问答方法中构建知识场景的流程图;
图4是本实施例四提供的自动问答方法中查询并返回结果的流程图;
图5是本实施例五提供的自动问答方法的一种查询并返回结果的流程图;
图6是本实施例六提供的自动问答方法的一种查询并返回结果的流程图;
图7是本发明实施例七提供的一种自动问答系统结构示意图。
具体实施方式
下面结合附图和实施例对本发明作进一步的详细说明。可以理解的是,此处所描述的具体实施例仅仅用于解释本发明,而非对本发明的限定。另外还需要说明的是,为了便于描述,附图中仅示出了与本发明相关的部分而非全部结构。
实施例一
图1为本发明实施例一提供的自动问答方法的流程图,本实施例可适用于网页自动答复服务,用户可通过用户端登陆指定网站进行提问,服务器应用本方法查询出答案并发送给用户端。
110,获取用户的查询信息;
其中,查询信息可以是用户输入的文字信息。例如,用户在个人计算机上登陆自动答复服务网站,在指定栏中输入查询信息,服务器获取该查询信息;或者用户可以在个人计算机上安装自动答复服务软件,在软件中输入查询信息,并发送给服务器,服务器获取该查询信息。用户也可以输入语音信息,通过语音识别软件对语音进行识别得到文字信息,即查询信息。
120,根据查询信息和至少一个知识场景的问答对数据,查询场景关联查询结果,并向用户返回,其中,所述知识场景的问答对数据中包括至少一个问答对,所述问答对之间具有设定的关联关系。
其中,问答对数据是问题和答案组成的具有对应关系的数据,即一个问题和对应该问题的答案为一个问答对数据。多个问答对数据之间可能具有共同点,例如知识领域相同。一个知识场景中可包括多个相互具有共同点问答对数据,并且可为多个相互具有共同点问答对数据设定关联关系。例如,关于疾病知识的问答数据,疾病具有不同的名称,但不同名称的疾病都属于医疗健康领域,并且疾病普遍包括:病因、治疗方法、预防方法等因素,所以关于疾病知识的问答数据具有共同点,多个疾病知识问答对可以组成一个知识场景。
本发明实施例的技术方案,将各种问答对以知识场景的形式进行组织,且建立了问答对之间的关联,则用户进行查询时,可以获得与场景相关联的查询结果,且能利用问答对之间的关联关系得到丰富灵活的结果,避免了问答结果单一的问题。
基于设定知识场景下关联问答对数据进行结果查询的方式有多种,且知识场景构建模式也有不同的实现方案,下面通过实施例分别介绍。
实施例二
图2是本发明实施例二提供的自动问答方法中构建知识场景的流程图。如图2所示,本实施例是在上述实施例的基础上增加了构建知识场景的操作。
在根据查询信息和至少一个知识场景的问答对数据查询场景关联查询结果之前,本实施例提供的自动问答方法还包括:
210,从数据源中获取项目和项目的至少一个属性。
其中,数据源可以是载有知识素材的网站、知识百科网站等,自动问答系统从上述网站获取数据。数据源中的知识数据的存储形式一般是把同一主题的所有相关信息作为一个单元存在一起。例如某网站存有关于一种疾病的知识数据,该数据可能是一篇文章,文章中可能包括关于该疾病的病因、治疗方法、预防方法等知识,该文章即为一个项目,其中的病因、治疗方法、预防方法等内容即为属性,自动问答系统获取该文章即获取了一个项目和该项目中的属性。
220,根据所述项目的至少一个属性构建至少一个问答对。
获取了项目和属性后,知识数据可能属于叙述式语句,例如一篇知识文章,对一个主题下的多种因素进行叙述,而不属于问答形式的语句。本操作是自动问答系统根据项目的属性构建问答对数据,例如一个疾病项目的其中一个属性:病因,自动问答系统可以构建如下问答对数据:问题-“A疾病的病因是什么”、答案-“A疾病的病因是a”。同理,自动问答系统可以根据项目中的所有属性构建问答对数据。
230,按照所述项目的属性之间的关联设置至少两个问答对之间的关联关系。
属于同一项目的属性之间存在关联关系,例如存在因果逻辑顺序,同样以疾病项目为例,疾病属性的逻辑顺序是病因、临床表现、治疗方法,则自动问答系统可以按照该逻辑顺序对上述属性的问答对数据设置关联关系,如病因的问答对与临床表现的问答对相关联。
240,将所述问答对和问答对之间的关联关系存储为知识场景的问答对数据。
上述的问答对数据以及问答对之间的关联关系组成了知识场景,知识场景可以有多个,上述与疾病相关的问答对数据构成了医疗健康知识场景。同理,还可以将人物的身高、体重、履历等信息按照上述方法构建成问答对以及建立它们的关联关系,组成人物信息知识场景。
本实施例更为适用于问题的确定性明显,所归属的知识场景清晰的情况,可称为强模式的知识场景。在此类场景中,问答对数据有明确的归属,且关联性往往有设定的规律。
实施例三
图3是本发明实施例三提供的自动问答方法中构建知识场景的流程图。如图3所示,,本实施例提供了另一种构建知识场景的方案,本实施例更适用于问答对的问题与知识场景之间的归属不明确的情况,可称为弱模式的知识场景。
具体是,在根据查询信息和至少一个知识场景的问答对数据查询场景关联查询结果之前,本实施例提供的自动问答方法还包括:
310,从数据源中获取至少一个问答对。
其中,数据源可以是以问答形式存储知识信息的网站,自动问答系统从该网站上直接获取问题与答案。
320,根据所述问答对的至少一个关键词和关键词的设定权值,计算所述问答对之间的相似度。
自动问答系统获取的问答对数据可能具有一定的相似度,但多个相似的问答对的文字表达上并不完全相同。例如人类情感话题,同一种情感状态可以用多个近义词来表示,而使用不同的近义词表达的多个问答对,其主题是一致的。所以可以对词汇设定相似度,即设定权值,然后提取问答数据的关键词,根据关键词间的相似度计算出对应的问答对数据的相似度。
330,根据所述相似度对至少一个问答对进行聚类,获取聚类后问答对的项目名称,建立聚类问答对之间的关联关系。
自动问答系统可以为相似度设定阀值,如果问答对相似度大于该阀值,则将这些问答对归为同一类。类聚在一起的问答对必然具有一个共同的主题,可以将该主题名称作为项目名称,用于概括这一类问答对的内容,并且还可以根据相似度建立多个问答对数据间的关联关系。
340,将所述问答对和问答对之间的关联关系存储为知识场景的问答对数据。
上述的问答对数据以及问答对之间的关联关系组成了知识场景,并且知识场景可以有多个。
本实施例所述自动问答方法中,可以将所述项目的名称作为所述知识场景中问答对的标签。自动问答系统可以对问答对数据设置标签,标签的内容可以是项目名称。上述过程中自动问答系统已经获取了多个问答对的项目名称,在本操作中将该名称作为标签内容,为每一个属于该项目问答对数据设置上所述标签,以便于进一步明确问答对之间的关联关系,为用户查询提供基础条件。另外,自动问答系统还可以对知识场景设置标签,知识场景的标签内容可以是该场景中知识领域的领域名称,或者将属于该场景中的项目的名称作为知识场景的标签内容,在查找问答对之前可以先确定查询信息属于哪个知识场景,然后再在该知识场景中查询问答对,这样则可以缩小查询问答对数据的范围。
实施例四
图4是本实施例四提供的自动问答方法中查询并返回结果的流程图。如图4所示,本实施例在上述各实施例的基础上,优选是将根据查询信息和至少一个知识场景的问答对数据查询场景关联查询结果,并向用户返回的操作优选为:
410,识别所述查询信息。
本操作主要用于识别查询信息为确定问题,还是一个泛化的查询需求。用户提供的查询信息可能是一个提问句,确定问题是指提问句中有明确的实体和提问的属性,且能对应唯一的答案问题,例如“太阳表面的温度是多少”。
420,如果识别到所述查询信息为确定问题,则根据所述确定问题在知识场景的问答对中进行问题匹配,获取基础问答对。
对查询信息进行识别后,根据查询信息的内容可以判断出提问的类型,提问类型包括确定问题,即针对某一事物提出具体疑问,例如“什么是A”、“A是多少”即属于确定问题。自动问答系统可以根据查询信息确定该问题属于某一个知识场景,例如根据查询信息中的关键词与知识场景的标签进行匹配,识别该查询信息属于哪个知识场景,然后在该知识场景中再用查询信息的关键词与该场景中的问答对的标签进行匹配,找到相同或相近的问题对数据,从而确定与该问题相对应的答案,即获取该问答对。该问答对数据中的问题数据与用户的查询信息相同或相近,答案数据则是对用户查询信息的解答,该问答对数据即为基础问答对。
430,获取与所述基础问答对具有设定关联关系的问答对,作为推荐问答对。
由于上述各实施例中,知识场景中的问答对数据间已经设置了关联关系,所以系统还可以在知识场景中找到某些与基础问答对设有关联关系的问答对,这些问答对即为推荐问答对。
440,将所述基础问答对和推荐问答对作为所述场景关联查询结果,向用户返回。
最终系统向用户端返回的查询结果即为基础问答对,也可以是只返回基础问答对中的答案,同时向用户端返回推荐问答对,或者也可以是只返回推荐问答对中的问题。
本实施例提供的自动问答方法向用户返回答案的同时,还向用户提供了与原提问相关的其他信息,使用户可以了解到更广泛的知识信息。
实施例五
图5是本实施例五提供的自动问答方法的一种查询并返回结果的流程图。如图5所示,本实施例在上述各实施例的基础上,优选是将根据查询信息和至少一个知识场景的问答对数据查询场景关联查询结果,并向用户返回的操作优选为:
510,识别所述查询信息。
用户提供的查询信息可能是一个泛化需求,泛化需求是指只限定了范围而答案不唯一的问题,例如“什么是养生知识”。
520,如果识别到所述查询信息为泛化需求,则根据所述泛化需求确定对应的知识场景。
属于泛化需求的提问,提问的范围较宽泛,用户没有提出具体的问题,问答系统则根据查询信息的关键词确定该提问所涉及的知识属于哪一个知识场景。例如某一知识场景中所有的问答对数据都设有相同的标签,而该标签的内容与用户的查询信息中的关键词相同,则可以确定该查询信息涉及的知识对应该知识场景。
530,根据所述泛化需求在对应的知识场景中按照设定规则选择至少一个问答对。
在确定了用户查询信息对应的知识场景后,则在该知识场景中选择一个问答对,选择问答对的规则可以有多种。例如,用户查询信息为“养生知识”,在医疗健康知识场景中,该知识场景中所有的问答对都设有“养生”标签,系统可以从概括到具体的逻辑顺序,选择概括性的问答对,在本例中可以将问题-“什么是养生”和与之相对应答案作为选定的问答对。
540,将选择的所述至少一个问答对作为所述场景关联查询结果,向用户返回。
最终向用户端返回选定的问答对作为结果,或者只返回问答对数据中的答案作为结果。
应用本实施例提供的方法进行自动问答,自动问答系统根据用户的查询信息在知识场景中确定了具体的问答对数据,针对用户提供的宽泛性提问返回了结果。
实施例六
图6是本实施例六提供的自动问答方法的一种查询并返回结果的流程图。如图6所示,本实施例在上述各实施例的基础上,优选是将根据查询信息和至少一个知识场景的问答对数据查询场景关联查询结果,并向用户返回的操作优选为:
610,识别所述查询信息。
620,如果识别到所述查询信息为泛化需求,则根据所述泛化需求确定对应的知识场景。
630,根据所述泛化需求在对应的知识场景中按照设定规则选择引导式提问,并返回给所述用户。
在上述方法中,问答系统虽然可以针对宽泛的提问提供答案,但是在某些情况下,返回的答案同样比较宽泛,也许该答案并不能满足用户的需求。所以在本实施例中,根据用户的泛化需求确定对应的知识场景之后,问答系统根据该知识场景中问答对的关联关系,向用户返回至少一个问答对数据中的问题作为引导式提问,目的在于提示用户再次提出一个确定性的提问。
640,根据所述用户针对引导式提问的至少一个答复信息,在所述对应的知识场景中查询所述场景关联查询结果,向用户返回。
用户可以在系统提供的引导式提问中选择一个问题作为新的查询信息提交给自动问答系统,自动问答系统可以按照前述任意一个实施例提供的自动问答方法重新进行查询并返回结果。
本实施例提供的自动问答方法,对用户提供的宽泛性查询信息在知识场景中进行分析,返回引导提问引导用户将宽泛的问题转化为具体问题,然后对具体问题进行准确的答复,进一步提高了自动问答系统的答复效率与答案准确度。
实施例七
图7是本发明实施例七提供的一种自动问答系统结构示意图。本实施例提供的系统可用于实现上述各实施例所述的方法,该自动问答系统的具体结构如下:包括信息获取模块和查询结果模块。
其中,信息获取模块用于获取用户的查询信息;查询结果模块用于根据查询信息和至少一个知识场景的问答对数据,查询场景关联查询结果,并向用户返回,所述知识场景的问答对数据中包括至少一个问答对,所述问答对之间具有设定的关联关系。
本发明实施例的技术方案,利用将各种问答对以知识场景的形式进行组织,且建立了问答对之间的关联,则信息获取模块获取用户进行查询时,查询结果模块可以获得与场景相关联的查询结果,且能利用问答对之间的关联关系得到丰富灵活的结果,避免了问答结果单一的问题。
在上述技术方案的基础上,该系统还可包括:第一资源获取模块、数据构建模块、第一数据关联模块和第一数据存储模块。
其中,第一资源获取模块用于在根据查询信息和至少一个知识场景的问答对数据查询场景关联查询结果之前,从数据源中获取项目和项目的至少一个属性。
数据构建模块用于根据所述项目的至少一个属性构建至少一个问答对。
第一数据关联模块用于按照所述项目的属性之间的关联设置至少两个问答对之间的关联关系。
第一数据存储模块用于将所述问答对和问答对之间的关联关系存储为知识场景的问答对数据。
本实施例更为适用于问题的确定性明显、所归属的知识场景清晰的情况,可称为强模式的知识场景。在此类场景中,问答对数据有明确的归属,且关联性往往有设定的规律。
在上述技术方案的基础上,该系统还可包括:第二资源获取模块、相似度计算模块、第二数据关联模块和第二数据存储模块。
其中,第二资源获取模块用于在根据查询信息和至少一个知识场景的问答对数据查询场景关联查询结果之前,从数据源中获取至少一个问答对。
相似度计算模块用于根据所述问答对的至少一个关键词和关键词的设定权值,计算所述问答对之间的相似度。
第二数据关联模块用于根据所述相似度对至少一个问答对进行聚类,获取聚类后问答对的项目名称,建立聚类问答对之间的关联关系。
第二数据存储模块用于将所述问答对和问答对之间的关联关系存储为知识场景的问答对数据。
在上述技术方案的基础上,该系统的查询结果模块可以优化为:第一信息识别单元、基础数据获取单元、关联数据获取单元和第一结果返回单元。
其中,第一信息识别单元用于识别所述查询信息。
基础数据获取单元用于在所述信息识别单元识别到所述查询信息为确定问题之时,根据所述确定问题在知识场景的问答对中进行问题匹配,获取基础问答对。
关联数据获取单元用于获取与所述基础问答对具有设定关联关系的问答对,作为推荐问答对。
第一结果返回单元用于将所述基础问答对和推荐问答对作为所述场景关联查询结果,向用户返回。
本实施例提供的自动问答系统向用户返回答案的同时,系统还向用户提供了与原提问相关的其他信息,使用户可以了解到更广泛的知识信息。
在上述技术方案的基础上,该系统的查询结果模块还可以优化为:第二信息识别单元、第一场景确定单元、数据选择单元和第二结果返回单元。
其中,第二信息识别单元用于识别所述查询信息。
第一场景确定单元用于在所述第二信息识别单元识别到所述查询信息为泛化需求之时,根据所述泛化需求确定对应的知识场景。
数据选择单元用于根据所述泛化需求在对应的知识场景中按照设定规则选择至少一个问答对。
第二结果返回单元用于将选择的所述至少一个问答对作为所述场景关联查询结果,向用户返回。
应用本实施例提供的系统进行自动问答,系统根据用户的查询信息在知识场景中确定了具体的问答对数据,针对用户提供的宽泛性提问返回了结果。
在上述技术方案的基础上,该系统的查询结果模块还可以优化为:第三信息识别单元、第二场景确定单元、引导提问单元和第三结果返回单元。
其中,第三信息识别单元用于识别所述查询信息。
第二场景确定单元用于在所述第三信息识别单元识别到所述查询信息为泛化需求之时,根据所述泛化需求确定对应的知识场景。
引导提问单元用于根据所述泛化需求在对应的知识场景中按照设定规则选择引导式提问,并返回给所述用户。
第三结果返回单元用于根据所述用户针对引导式提问的至少一个答复信息,在所述对应的知识场景中查询所述场景关联查询结果,向用户返回。
本实施例提供的自动问答系统,对用户提供的宽泛性查询信息在知识场景中进行分析,返回引导提问引导用户将宽泛的问题转化为具体问题,然后对具体问题进行准确的答复,进一步提高了自动问答系统的答复效率与答案准确度。
注意,上述仅为本发明的较佳实施例及所运用技术原理。本领域技术人员会理解,本发明不限于这里所述的特定实施例,对本领域技术人员来说能够进行各种明显的变化、重新调整和替代而不会脱离本发明的保护范围。因此,虽然通过以上实施例对本发明进行了较为详细的说明,但是本发明不仅仅限于以上实施例,在不脱离本发明构思的情况下,还可以包括更多其他等效实施例,而本发明的范围由所附的权利要求范围决定。
Claims (16)
1.一种自动问答方法,其特征在于,包括:
获取用户的查询信息;
根据查询信息和至少一个知识场景的问答对数据,查询场景关联查询结果,并向用户返回,其中,所述知识场景的问答对数据中包括至少一个问答对,所述问答对之间具有设定的关联关系;
其中,根据查询信息和知识场景的问答对数据查询场景关联查询结果,并向用户返回包括:
识别所述查询信息;
如果识别到所述查询信息为泛化需求,则根据所述泛化需求确定对应的知识场景;
根据所述泛化需求在对应的知识场景中按照设定规则选择至少一个问答对;
将选择的所述至少一个问答对作为所述场景关联查询结果,向用户返回。
2.根据权利要求1所述的方法,其特征在于,在根据查询信息和至少一个知识场景的问答对数据查询场景关联查询结果之前,还包括:
从数据源中获取项目和项目的至少一个属性;
根据所述项目的至少一个属性构建至少一个问答对;
按照所述项目的属性之间的关联设置至少两个问答对之间的关联关系;
将所述问答对和问答对之间的关联关系存储为知识场景的问答对数据。
3.根据权利要求1所述的方法,其特征在于,在根据查询信息和至少一个知识场景的问答对数据查询场景关联查询结果之前,还包括:
从数据源中获取至少一个问答对;
根据所述问答对的至少一个关键词和关键词的设定权值,计算所述问答对之间的相似度;
根据所述相似度对至少一个问答对进行聚类,获取聚类后问答对的项目名称,建立聚类问答对之间的关联关系;
将所述问答对和问答对之间的关联关系存储为知识场景的问答对数据。
4.根据权利要求1-3任一所述的方法,其特征在于,根据查询信息和至少一个知识场景的问答对数据查询场景关联查询结果,并向用户返回包括:
识别所述查询信息;
如果识别到所述查询信息为确定问题,则根据所述确定问题在知识场景的问答对中进行问题匹配,获取基础问答对;
获取与所述基础问答对具有设定关联关系的问答对,作为推荐问答对;
将所述基础问答对和推荐问答对作为所述场景关联查询结果,向用户返回。
5.一种自动问答方法,其特征在于,包括:
获取用户的查询信息;
根据查询信息和至少一个知识场景的问答对数据,查询场景关联查询结果,并向用户返回,其中,所述知识场景的问答对数据中包括至少一个问答对,所述问答对之间具有设定的关联关系;
其中,根据查询信息和知识场景的问答对数据查询场景关联查询结果,并向用户返回包括:
识别所述查询信息;
如果识别到所述查询信息为泛化需求,则根据所述泛化需求确定对应的知识场景;
根据所述泛化需求在对应的知识场景中按照设定规则选择引导式提问,并返回给所述用户;
根据所述用户针对引导式提问的至少一个答复信息,在所述对应的知识场景中查询所述场景关联查询结果,向用户返回。
6.根据权利要求5所述的方法,其特征在于,在根据查询信息和至少一个知识场景的问答对数据查询场景关联查询结果之前,还包括:
从数据源中获取项目和项目的至少一个属性;
根据所述项目的至少一个属性构建至少一个问答对;
按照所述项目的属性之间的关联设置至少两个问答对之间的关联关系;
将所述问答对和问答对之间的关联关系存储为知识场景的问答对数据。
7.根据权利要求5所述的方法,其特征在于,在根据查询信息和至少一个知识场景的问答对数据查询场景关联查询结果之前,还包括:
从数据源中获取至少一个问答对;
根据所述问答对的至少一个关键词和关键词的设定权值,计算所述问答对之间的相似度;
根据所述相似度对至少一个问答对进行聚类,获取聚类后问答对的项目名称,建立聚类问答对之间的关联关系;
将所述问答对和问答对之间的关联关系存储为知识场景的问答对数据。
8.根据权利要求5-7任一所述的方法,其特征在于,根据查询信息和至少一个知识场景的问答对数据查询场景关联查询结果,并向用户返回包括:
识别所述查询信息;
如果识别到所述查询信息为确定问题,则根据所述确定问题在知识场景的问答对中进行问题匹配,获取基础问答对;
获取与所述基础问答对具有设定关联关系的问答对,作为推荐问答对;
将所述基础问答对和推荐问答对作为所述场景关联查询结果,向用户返回。
9.一种自动问答系统,其特征在于,包括:
信息获取模块,用于获取用户的查询信息;
查询结果模块,用于根据查询信息和至少一个知识场景的问答对数据,查询场景关联查询结果,并向用户返回,其中,所述知识场景的问答对数据中包括至少一个问答对,所述问答对之间具有设定的关联关系;
其中,查询模块包括:
第二信息识别单元,用于识别所述查询信息;
第一场景确定单元,用于在所述第二信息识别单元识别到所述查询信息为泛化需求之时,根据所述泛化需求确定对应的知识场景;
数据选择单元,用于根据所述泛化需求在对应的知识场景中按照设定规则选择至少一个问答对;
第二结果返回单元,用于将选择的所述至少一个问答对作为所述场景关联查询结果,向用户返回。
10.根据权利要求9所述的系统,其特征在于,还包括:
第一资源获取模块,用于在根据查询信息和至少一个知识场景的问答对数据查询场景关联查询结果之前,从数据源中获取项目和项目的至少一个属性;
数据构建模块,用于根据所述项目的至少一个属性构建至少一个问答对;
第一数据关联模块,用于按照所述项目的属性之间的关联设置至少两个问答对之间的关联关系;
第一数据存储模块,用于将所述问答对和问答对之间的关联关系存储为知识场景的问答对数据。
11.根据权利要求9所述的系统,其特征在于,还包括:
第二资源获取模块,用于在根据查询信息和至少一个知识场景的问答对数据查询场景关联查询结果之前,从数据源中获取至少一个问答对;
相似度计算模块,用于根据所述问答对的至少一个关键词和关键词的设定权值,计算所述问答对之间的相似度;
第二数据关联模块,用于根据所述相似度对至少一个问答对进行聚类,获取聚类后问答对的项目名称,建立聚类问答对之间的关联关系;
第二数据存储模块,用于将所述问答对和问答对之间的关联关系存储为知识场景的问答对数据。
12.根据权利要求9-11任一所述的系统,其特征在于,所述查询结果模块包括:
第一信息识别单元,用于识别所述查询信息;
基础数据获取单元,用于在所述信息识别单元识别到所述查询信息为确定问题之时,根据所述确定问题在知识场景的问答对中进行问题匹配,获取基础问答对;
关联数据获取单元,用于获取与所述基础问答对具有设定关联关系的问答对,作为推荐问答对;
第一结果返回单元,用于将所述基础问答对和推荐问答对作为所述场景关联查询结果,向用户返回。
13.一种自动问答系统,其特征在于,包括:
信息获取模块,用于获取用户的查询信息;
查询结果模块,用于根据查询信息和至少一个知识场景的问答对数据,查询场景关联查询结果,并向用户返回,其中,所述知识场景的问答对数据中包括至少一个问答对,所述问答对之间具有设定的关联关系;
其中,查询模块包括:
第三信息识别单元,用于识别所述查询信息;
第二场景确定单元,用于在所述第三信息识别单元识别到所述查询信息为泛化需求之时,根据所述泛化需求确定对应的知识场景;
引导提问单元,用于根据所述泛化需求在对应的知识场景中按照设定规则选择引导式提问,并返回给所述用户;
第三结果返回单元用于根据所述用户针对引导式提问的至少一个答复信息,在所述对应的知识场景中查询所述场景关联查询结果,向用户返回。
14.根据权利要求13所述的系统,其特征在于,还包括:
第一资源获取模块,用于在根据查询信息和至少一个知识场景的问答对数据查询场景关联查询结果之前,从数据源中获取项目和项目的至少一个属性;
数据构建模块,用于根据所述项目的至少一个属性构建至少一个问答对;
第一数据关联模块,用于按照所述项目的属性之间的关联设置至少两个问答对之间的关联关系;
第一数据存储模块,用于将所述问答对和问答对之间的关联关系存储为知识场景的问答对数据。
15.根据权利要求13所述的系统,其特征在于,还包括:
第二资源获取模块,用于在根据查询信息和至少一个知识场景的问答对数据查询场景关联查询结果之前,从数据源中获取至少一个问答对;
相似度计算模块,用于根据所述问答对的至少一个关键词和关键词的设定权值,计算所述问答对之间的相似度;
第二数据关联模块,用于根据所述相似度对至少一个问答对进行聚类,获取聚类后问答对的项目名称,建立聚类问答对之间的关联关系;
第二数据存储模块,用于将所述问答对和问答对之间的关联关系存储为知识场景的问答对数据。
16.根据权利要求13-15任一所述的系统,其特征在于,所述查询结果模块包括:
第一信息识别单元,用于识别所述查询信息;
基础数据获取单元,用于在所述信息识别单元识别到所述查询信息为确定问题之时,根据所述确定问题在知识场景的问答对中进行问题匹配,获取基础问答对;
关联数据获取单元,用于获取与所述基础问答对具有设定关联关系的问答对,作为推荐问答对;
第一结果返回单元,用于将所述基础问答对和推荐问答对作为所述场景关联查询结果,向用户返回。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201410104275.XA CN103853842B (zh) | 2014-03-20 | 2014-03-20 | 一种自动问答方法和系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201410104275.XA CN103853842B (zh) | 2014-03-20 | 2014-03-20 | 一种自动问答方法和系统 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN103853842A CN103853842A (zh) | 2014-06-11 |
CN103853842B true CN103853842B (zh) | 2017-07-18 |
Family
ID=50861497
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201410104275.XA Active CN103853842B (zh) | 2014-03-20 | 2014-03-20 | 一种自动问答方法和系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN103853842B (zh) |
Families Citing this family (25)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104036015A (zh) * | 2014-06-24 | 2014-09-10 | 北京奇虎科技有限公司 | 一种电子终端问题分类及解决方案提供方法、系统及装置 |
CN104462024B (zh) * | 2014-10-29 | 2018-07-13 | 百度在线网络技术(北京)有限公司 | 生成对话动作策略模型的方法和装置 |
CN105786871B (zh) * | 2014-12-23 | 2019-03-19 | 北京奇虎科技有限公司 | 基于搜索词的问答类搜索结果呈现方法和装置 |
CN104809062B (zh) * | 2015-04-22 | 2017-12-01 | 北京京东尚科信息技术有限公司 | 一种人工智能应答系统的测试方法及系统 |
CN105095069B (zh) * | 2015-06-19 | 2018-06-08 | 北京京东尚科信息技术有限公司 | 一种人工智能应答系统测试方法及系统 |
CN105630960B (zh) * | 2015-12-24 | 2019-02-12 | 百度在线网络技术(北京)有限公司 | 测试领域任务型对话系统的方法和装置 |
CN106095941B (zh) * | 2016-06-14 | 2020-03-20 | 华南师范大学 | 基于大数据知识库的解决方案推荐方法和系统 |
CN106202476B (zh) * | 2016-07-14 | 2017-06-06 | 广州安望信息科技有限公司 | 一种基于知识图谱的人机对话的方法及装置 |
CN106484801B (zh) * | 2016-09-23 | 2019-10-11 | 厦门快商通科技股份有限公司 | 一种智能客服机器人的对话方法及其知识库管理系统 |
CN106682137A (zh) * | 2016-12-19 | 2017-05-17 | 武汉市灯塔互动文化传播有限公司 | 一种智能股票投顾问答交互方法与系统 |
CN107357855B (zh) * | 2017-06-29 | 2018-06-08 | 北京神州泰岳软件股份有限公司 | 支持场景关联的智能问答方法及装置 |
CN107992554A (zh) * | 2017-11-28 | 2018-05-04 | 北京百度网讯科技有限公司 | 提供问答信息的聚合结果的搜索方法和装置 |
CN108021556A (zh) * | 2017-12-20 | 2018-05-11 | 北京百度网讯科技有限公司 | 用于获取信息的方法及装置 |
CN108519998B (zh) * | 2018-03-07 | 2021-05-14 | 云知声智能科技股份有限公司 | 基于知识图谱的问题引导方法及装置 |
CN108549710B (zh) * | 2018-04-20 | 2023-06-27 | 腾讯科技(深圳)有限公司 | 智能问答方法、装置、存储介质及设备 |
CN110471538B (zh) * | 2018-05-10 | 2023-11-03 | 北京搜狗科技发展有限公司 | 一种输入预测方法及装置 |
CN109165286A (zh) * | 2018-09-03 | 2019-01-08 | 深圳前海微众银行股份有限公司 | 自动问答方法、装置及计算机可读存储介质 |
CN109284383A (zh) * | 2018-10-09 | 2019-01-29 | 北京来也网络科技有限公司 | 文本处理方法及装置 |
CN111125321A (zh) * | 2018-10-31 | 2020-05-08 | 广东万丈金数信息技术股份有限公司 | 问答方法、装置、终端设备和存储介质 |
CN109271503A (zh) * | 2018-11-06 | 2019-01-25 | 北京猎户星空科技有限公司 | 智能问答方法、装置、设备及存储介质 |
CN109800286B (zh) * | 2018-12-17 | 2021-05-11 | 北京百度网讯科技有限公司 | 对话生成方法和装置 |
CN109829048B (zh) * | 2019-01-23 | 2023-06-23 | 平安科技(深圳)有限公司 | 电子装置、访谈辅助方法和计算机可读存储介质 |
CN110674268B (zh) * | 2019-08-23 | 2021-03-19 | 深圳追一科技有限公司 | 人机对话方法及相关设备 |
CN111382232A (zh) * | 2020-03-09 | 2020-07-07 | 联想(北京)有限公司 | 问答信息处理方法、装置及计算机设备 |
CN111460085A (zh) * | 2020-04-17 | 2020-07-28 | 支付宝(杭州)信息技术有限公司 | 基于图结构的知识点推荐方法及装置 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101339551A (zh) * | 2007-07-05 | 2009-01-07 | 日电(中国)有限公司 | 自然语言查询需求扩展设备及其方法 |
CN101986293A (zh) * | 2010-09-03 | 2011-03-16 | 百度在线网络技术(北京)有限公司 | 用于在搜索界面中呈现搜索答案信息的方法及设备 |
JP2011103018A (ja) * | 2009-11-10 | 2011-05-26 | Nippon Telegr & Teleph Corp <Ntt> | 質問応答装置、質問応答方法、質問応答プログラム |
US8412514B1 (en) * | 2005-10-27 | 2013-04-02 | At&T Intellectual Property Ii, L.P. | Method and apparatus for compiling and querying a QA database |
CN103577557A (zh) * | 2013-10-21 | 2014-02-12 | 北京奇虎科技有限公司 | 一种确定网络资源点的抓取频率的装置和方法 |
-
2014
- 2014-03-20 CN CN201410104275.XA patent/CN103853842B/zh active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8412514B1 (en) * | 2005-10-27 | 2013-04-02 | At&T Intellectual Property Ii, L.P. | Method and apparatus for compiling and querying a QA database |
CN101339551A (zh) * | 2007-07-05 | 2009-01-07 | 日电(中国)有限公司 | 自然语言查询需求扩展设备及其方法 |
JP2011103018A (ja) * | 2009-11-10 | 2011-05-26 | Nippon Telegr & Teleph Corp <Ntt> | 質問応答装置、質問応答方法、質問応答プログラム |
CN101986293A (zh) * | 2010-09-03 | 2011-03-16 | 百度在线网络技术(北京)有限公司 | 用于在搜索界面中呈现搜索答案信息的方法及设备 |
CN103577557A (zh) * | 2013-10-21 | 2014-02-12 | 北京奇虎科技有限公司 | 一种确定网络资源点的抓取频率的装置和方法 |
Also Published As
Publication number | Publication date |
---|---|
CN103853842A (zh) | 2014-06-11 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN103853842B (zh) | 一种自动问答方法和系统 | |
US10387437B2 (en) | Query rewriting using session information | |
US9898554B2 (en) | Implicit question query identification | |
CN111417940B (zh) | 用于生成问题答案的方法、系统和介质 | |
US8332426B2 (en) | Indentifying referring expressions for concepts | |
CN106844658A (zh) | 一种中文文本知识图谱自动构建方法及系统 | |
KR101220557B1 (ko) | 사람의 활동 지식 데이터베이스를 이용한 모바일 어플리케이션 검색 방법 및 시스템 | |
US20150379087A1 (en) | Apparatus and method for replying to query | |
KR101827764B1 (ko) | 시각적 어의적 복잡계 네트워크 및 그의 형성 방법 | |
CN104834679B (zh) | 一种行为轨迹的表示、查询方法及装置 | |
KR101625863B1 (ko) | 연구자 논문 투고처 추천 시스템 및 방법 | |
CN110443571A (zh) | 基于知识图谱进行简历评估的方法、装置及设备 | |
CN105808590A (zh) | 搜索引擎实现方法、搜索方法以及装置 | |
CN106326422B (zh) | 一种基于知识本体的食品安全数据信息检索的方法及系统 | |
CN105243149B (zh) | 一种基于语义的查询推荐方法和系统 | |
CN104268192A (zh) | 一种网页信息提取方法、装置及终端 | |
KR101638535B1 (ko) | 사용자 검색어 연관 이슈패턴 검출 방법, 이를 수행하는 이슈패턴 검출 서버 및 이를 저장하는 기록매체 | |
CN110765348B (zh) | 一种热词的推荐方法、装置、电子设备及存储介质 | |
CN104239570A (zh) | 论文的搜索方法及装置 | |
JP2019086940A (ja) | 関連スコア算出システム、方法およびプログラム | |
Mazloom et al. | Few-example video event retrieval using tag propagation | |
CN114297351A (zh) | 语句问答方法、装置、设备、存储介质及计算机程序产品 | |
CN113571196A (zh) | 构建医疗训练样本的方法及装置、医疗文本的检索方法 | |
KR20160120583A (ko) | 지식 관리 시스템 및 이의 지식 구조 기반의 자료 관리 방법 | |
Jin et al. | A domain knowledge based method on active and focused information service for decision support within big data environment |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant | ||
TR01 | Transfer of patent right | ||
TR01 | Transfer of patent right |
Effective date of registration: 20180116 Address after: 100085 Beijing, Haidian District, No. ten on the ground floor, No. 10 Baidu building, layer 2 Patentee after: BEIJING BAIDU NETCOM SCIENCE AND TECHNOLOGY Co.,Ltd. Address before: 100085 Beijing, Haidian District, No. ten on the ground floor, No. 10 Baidu building, layer three Patentee before: BEIJING BAIDU NETCOM SCIENCE AND TECHNOLOGY Co.,Ltd. |