CN103853842B - 一种自动问答方法和系统 - Google Patents

一种自动问答方法和系统 Download PDF

Info

Publication number
CN103853842B
CN103853842B CN201410104275.XA CN201410104275A CN103853842B CN 103853842 B CN103853842 B CN 103853842B CN 201410104275 A CN201410104275 A CN 201410104275A CN 103853842 B CN103853842 B CN 103853842B
Authority
CN
China
Prior art keywords
question
answer
data
answer pair
query
Prior art date
Application number
CN201410104275.XA
Other languages
English (en)
Other versions
CN103853842A (zh
Inventor
邹红建
呼大为
Original Assignee
百度在线网络技术(北京)有限公司
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 百度在线网络技术(北京)有限公司 filed Critical 百度在线网络技术(北京)有限公司
Priority to CN201410104275.XA priority Critical patent/CN103853842B/zh
Publication of CN103853842A publication Critical patent/CN103853842A/zh
Application granted granted Critical
Publication of CN103853842B publication Critical patent/CN103853842B/zh

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING; COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/332Query formulation
    • G06F16/3329Natural language query formulation or dialogue systems

Abstract

本发明实施例提供一种自动问答方法和系统,包括:获取用户的查询信息;根据查询信息和至少一个知识场景的问答对数据,查询场景关联查询结果,并向用户返回,其中,所述知识场景的问答对数据中包括至少一个问答对,所述问答对之间具有设定的关联关系。本发明实施例的技术方案,将各种问答对以知识场景的形式进行组织,且建立了问答对之间的关联,则用户进行查询时,可以获得与场景相关联的查询结果,且能利用问答对之间的关联关系得到丰富灵活的结果,避免了问答结果单一的问题。

Description

一种自动问答方法和系统
技术领域
[0001]本发明实施例涉及计算机数据处理技术,尤其涉及一种自动问答方法和系统。
背景技术
[0002]自动问答是指用户与计算机进行交互,由用户提出问题计算机自动返回答案的技 术。
[0003]现有的自动问答技术是依靠计算机收集大量知识数据,以问题-答案对的形式进 行存储,构成问答对数据库,为用户提供需要的信息。当接收到用户提出的问题,即查询信 息时,系统根据查询信息中的关键词在数据库中查找相匹配的问题,然后返回该问题的答 案。
[0004]但现有的数据库中收集的信息是相对独立的数据,基于现有的数据库进行查询 时,查询到的答案结果单一,只能针对用户提出的具体问题返回单一的答案,或者当用户提 出比较宽泛的问题时,无法进行有针对性的查询。
发明内容
[0005] 本发明实施例提供一种自动问答方法和系统,以使问答方法返回的答案更加丰富 并具有针对性。
[0006] 第一方面,本发明实施例提供一种自动问答方法,该方法包括:
[0007] 获取用户的查询信息;
[0008] 根据查询信息和至少一个知识场景的问答对数据,查询场景关联查询结果,并向 用户返回,其中,所述知识场景的问答对数据中包括至少一个问答对,所述问答对之间具有 设定的关联关系。
[0009] 第二方面,本发明提供一种自动问答系统,该系统包括:
[0010] 信息获取模块,用于获取用户的查询信息;
[0011] 查询结果模块,用于根据查询信息和至少一个知识场景的问答对数据,查询场景 关联查询结果,并向用户返回,其中,所述知识场景的问答对数据中包括至少一个问答对, 所述问答对之间具有设定的关联关系。
[0012] 本发明实施例的技术方案,将各种问答对以知识场景的形式进行组织,且建立了 问答对之间的关联,则用户进行查询时,可以获得与场景相关联的查询结果,且能利用问答 对之间的关联关系得到丰富灵活的结果,避免了问答结果单一的问题。
附图说明
[0013] 图1为本发明实施例一提供的自动问答方法的流程图;
[0014] 图2是本发明实施例二提供的自动问答方法中构建知识场景的流程图;
[0015] 图3是本发明实施例三提供的自动问答方法中构建知识场景的流程图;
[0016] 图4是本实施例四提供的自动问答方法中查询并返回结果的流程图;
[0017]图5是本实施例五提供的自动问答方法的一种查询并返回结果的流程图;
[0018]图6是本实施例六提供的自动问答方法的一种查询并返回结果的流程图;
[0019] 图7是本发明实施例七提供的一种自动问答系统结构示意图。
具体实施方式
[0020] 下面结合附图和实施例对本发明作进一步的详细说明。可以理解的是,此处所描 述的具体实施例仅仅用于解释本发明,而非对本发明的限定。另外还需要说明的是,为了便 于描述,附图中仅示出了与本发明相关的部分而非全部结构。
[0021] 实施例一
[0022]图1为本发明实施例一提供的自动问答方法的流程图,本实施例可适用于网页自 动答复服务,用户可通过用户端登陆指定网站进行提问,服务器应用本方法查询出答案并 发送给用户端。
[0023] 110,获取用户的查询信息;
[0024] 其中,查询信息可以是用户输入的文字信息。例如,用户在个人计算机上登陆自动 答复服务网站,在指定栏中输入查询信息,服务器获取该查询信息;或者用户可以在个人计 算机上安装自动答复服务软件,在软件中输入查询信息,并发送给服务器,服务器获取该查 询信息。用户也可以输入语音信息,通过语音识别软件对语音进行识别得到文字信息,即查 询信息。
[0025] 120,根据查询信息和至少一个知识场景的问答对数据,查询场景关联查询结果, 并向用户返回,其中,所述知识场景的问答对数据中包括至少一个问答对,所述问答对之间 具有设定的关联关系。
[0026] 其中,问答对数据是问题和答案组成的具有对应关系的数据,即一个问题和对应 该问题的答案为一个问答对数据。多个问答对数据之间可能具有共同点,例如知识领域相 同。一个知识场景中可包括多个相互具有共同点问答对数据,并且可为多个相互具有共同 点问答对数据设定关联关系。例如,关于疾病知识的问答数据,疾病具有不同的名称,但不 同名称的疾病都属于医疗健康领域,并且疾病普遍包括:病因、治疗方法、预防方法等因素, 所以关于疾病知识的问答数据具有共同点,多个疾病知识问答对可以组成一个知识场景。 [0027] 本发明实施例的技术方案,将各种问答对以知识场景的形式进行组织,且建立了 问答对之间的关联,则用户进行查询时,可以获得与场景相关联的查询结果,且能利用问答 对之间的关联关系得到丰富灵活的结果,避免了问答结果单一的问题。
[0028] 基于设定知识场景下关联问答对数据进行结果查询的方式有多种,且知识场景构 建模式也有不同的实现方案,下面通过实施例分别介绍。
[0029] 实施例二
[0030]图2是本发明实施例二提供的自动问答方法中构建知识场景的流程图。如图2所 示,本实施例是在上述实施例的基础上增加了构建知识场景的操作。
[0031]在根据查询信息和至少一个知识场景的问答对数据查询场景关联查询结果之前, 本实施例提供的自动问答方法还包括:
[0032] 210,从数据源中获取项目和项目的至少一个属性。
[0033]其中,数据源可以是载有知识素材的网站、知识百科网站等,自动问答系统从上述 网站获取数据。数据源中的知识数据的存储形式一般是把同一主题的所有相关信息作为一 个单元存在一起。例如某网站存有关于一种疾病的知识数据,该数据可能是一篇文章,文章 中可能包括关于该疾病的病因、治疗方法、预防方法等知识,该文章即为一个项目,其中的 病因、治疗方法、预防方法等内容即为属性,自动问答系统获取该文章即获取了一个项目和 该项目中的属性。
[0034] 220,根据所述项目的至少一个属性构建至少一个问答对。
[0035]获取了项目和属性后,知识数据可能属于叙述式语句,例如一篇知识文章,对一个 主题下的多种因素进行叙述,而不属于问答形式的语句。本操作是自动问答系统根据项目 的属性构建问答对数据,例如一个疾病项目的其中一个属性:病因,自动问答系统可以构建 如下问答对数据:问题-“A疾病的病因是什么”、答案-“A疾病的病因是a”。同理,自动问答系 统可以根据项目中的所有属性构建问答对数据。
[0036] 230,按照所述项目的属性之间的关联设置至少两个问答对之间的关联关系。
[0037]属于同一项目的属性之间存在关联关系,例如存在因果逻辑顺序,同样以疾病项 目为例,疾病属性的逻辑顺序是病因、临床表现、治疗方法,则自动问答系统可以按照该逻 辑顺序对上述属性的问答对数据设置关联关系,如病因的问答对与临床表现的问答对相关 联。
[0038] 240,将所述问答对和问答对之间的关联关系存储为知识场景的问答对数据。
[0039]上述的问答对数据以及问答对之间的关联关系组成了知识场景,知识场景可以有 ^个,上述与疾病相关的问答对数据构成了医疗健康知识场景。同理,还可以将人物的身 高、体重、履历等信息按照上述方法构建成问答对以及建立它们的关联关系,组成人物信息 知识场景。
[0040]本实施例更为适用于问题的确定性明显,所归属的知识场景清晰的情况,可称为 强模式的知识场景。在此类场景中,问答对数据有明确的归属,且关联性往往有设定的规 律。
[0041] 实施例三
[0042]图3是本发明实施例三提供的自动问答方法中构建知识场景的流程图。如图3所 示,,本实施例提供了另一种构建知识场景的方案,本实施例更适用于问答对的问题与知识 场景之间的归属不明确的情况,可称为弱模式的知识场景。
[0043]具体是,在根据查询信息和至少一个知识场景的问答对数据查询场景关联查询结 果之前,本实施例提供的自动问答方法还包括:
[0044] 310,从数据源中获取至少一个问答对。
[0045]其中,数据源可以是以问答形式存储知识信息的网站,自动问答系统从该网站上 直接获取问题与答案。
[0046] 320,根据所述问答对的至少一个关键词和关键词的设定权值,计算所述问答对之 间的相似度。
[0047]自动问答系统获取的问答对数据可能具有一定的相似度,但多个相似的问答对的 文字表达上并不完全相同。例如人类情感话题,同一种情感状态可以用多个近义词来表示, 而使用不同的近义词表达的多个问答对,其主题是一致的。所以可以对词汇设定相似度,即 设定权值,然后提取问答数据的关键词,根据关键词间的相似度计算出对应的问答对数据 的相似度。
[0048] 330,根据所述相似度对至少一个问答对进行聚类,获取聚类后问答对的项目名 称,建立聚类问答对之间的关联关系。
[0049]自动问答系统可以为相似度设定阀值,如果问答对相似度大于该阀值,则将这些 问答对归为同一类。类聚在一起的问答对必然具有一个共同的主题,可以将该主题名称作 为项目名称,用于概括这一类问答对的内容,并且还可以根据相似度建立多个问答对数据 间的关联关系。
[0050] 340,将所述问答对和问答对之间的关联关系存储为知识场景的问答对数据。
[0051]上述的问答对数据以及问答对之间的关联关系组成了知识场景,并且知识场景可 以有多个。
[0052] 本实施例所述自动问答方法中,可以将所述项目的名称作为所述知识场景中问答 对的标签。自动问答系统可以对问答对数据设置标签,标签的内容可以是项目名称。上述过 程中自动问答系统已经获取了多个问答对的项目名称,在本操作中将该名称作为标签内 容,为每一个属于该项目问答对数据设置上所述标签,以便于进一步明确问答对之间的关 联关系,为用户查询提供基础条件。另外,自动问答系统还可以对知识场景设置标签,知识 场景的标签内容可以是该场景中知识领域的领域名称,或者将属于该场景中的项目的名称 作为知识场景的标签内容,在查找问答对之前可以先确定查询信息属于哪个知识场景,然 后再在该知识场景中查询问答对,这样则可以缩小查询问答对数据的范围。
[0053] 实施例四
[0054]图4是本实施例四提供的自动问答方法中查询并返回结果的流程图。如图4所示, 本实施例在上述各实施例的基础上,优选是将根据查询信息和至少一个知识场景的问答对 数据查询场景关联查询结果,并向用户返回的操作优选为:
[0055] 410,识别所述查询信息。
[0056] 本操作主要用于识别查询信息为确定问题,还是一个泛化的查询需求。用户提供 的查询信息可能是一个提问句,确定问题是指提问句中有明确的实体和提问的属性,且能 对应唯一的答案问题,例如“太阳表面的温度是多少”。
[0057] 420,如果识别到所述查询信息为确定问题,则根据所述确定问题在知识场景的问 答对中进行问题匹配,获取基础问答对。
[0058] 对查询信息进行识别后,根据查询信息的内容可以判断出提问的类型,提问类型 包括确定问题,即针对某一事物提出具体疑问,例如“什么是A”、“A是多少”即属于确定问 题。自动问答系统可以根据查询信息确定该问题属于某一个知识场景,例如根据查询信息 中的关键词与知识场景的标签进行匹配,识别该查询信息属于哪个知识场景,然后在该知 识场景中再用查询信息的关键词与该场景中的问答对的标签进行匹配,找到相同或相近的 问题对数据,从而确定与该问题相对应的答案,即获取该问答对。该问答对数据中的问题数 据与用户的查询信息相同或相近,答案数据则是对用户查询信息的解答,该问答对数据即 为基础问答对。
[0059] 430,获取与所述基础问答对具有设定关联关系的问答对,作为推荐问答对。
[0060]由于上述各实施例中,知识场景中的问答对数据间已经设置了关联关系,所以系 统还可以在知识场景中找到某些与基础问答对设有关联关系的问答对,这些问答对即为推 存M眘对。
[0061] 440,将所述基础问答对和推荐问答对作为所述场景关联查询结果,向用户返回。 [0062]最终系统向用户端返回的查询结果即为基础问答对,也可以是只返回基础问答对 中的答案,同时向用户端返回推荐问答对,或者也可以是只返回推荐问答对中的问题。
[0063]本实施例提供的自动问答方法向用户返回答案的同时,还向用户提供了与原提问 相关的其他信息,使用户可以了解到更广泛的知识信息。
[0064] 实施例五 2〇65]图5是本实施例五提供的自动问答方法的—种查询并返回结果的流程图。如图5所 示,本实施例在上述各实施例的基础上,优选是将根据查询信息和至少一个知识场景的问 答对数据查询场景关联查询结果,并向用户返回的操作优选为:
[0066] 510,识别所述查询信息。 ’
[0067]用户提供的查询信息可能是一个泛化需求,泛化需求是指只限定了范围而答案不 唯一的问题,例如“什么是养生知识”。
[0068] 5 2 0,如果识别到所述查询彳目息为泛化需求,则根据所述泛化需求确定对应的知识 场景。
[0069]属于泛化需求的提问,提问的范围较宽泛,用户没有提出具体的问题,问答系统则 根据查询信息的关键词确定该提问所涉及的知识属于哪一个知识场景。例如某一知识场景 中所有的问答对数据都设有相同的标签,而该标签的内容与用户的查询信息中的关键词相 同,则可以确定该查询信息涉及的知识对应该知识场景。
[0070] 530,根据所述泛化需求在对应的知识场景中按照设定规则选择至少一个问答对。
[0071]在确定了用户查询信息对应的知识场景后,则在该知识场景中选择一个问答对, 选择向答对的规则可以有多种。例如,用户查询信息为“养生知识”,在医疗健康知识场景 中,该知识场景中所有的问答对都设有“养生”标签,系统可以从概括到具体的逻辑顺序,选 择概括性的问答对,在本例中可以将问题什么是养生”和与之相对应答案作为选定的问 答对。
[0072] 540,将选择的所述至少一个问答对作为所述场景关联查询结果,向用户返回。
[0073]最终向用户端返回选定的问答对作为结果,或者只返回问答对数据中的答案作为 结果。
[0074]应用本实施例提供的方法进行自动问答,自动问答系统根据用户的查询信息在知 识场景中确定了具体的问答对数据,针对用户提供的宽泛性提问返回了结果。
[0075] 实施例六
[0076]图6是本实施例六提供的自动问答方法的一种查询并返回结果的流程图。如图6所 示,本实施例在上述各实施例的基础上,优选是将根据查询信息和至少一个知识场景的问 答对数据查询场景关联查询结果,并向用户返回的操作优选为:
[0077] 610,识别所述查询信息。
[0078] 620,如果识别到所述查询信息为泛化需求,则根据所述泛化需求确定对应的知识 场景。
[0079] 630,根据所述泛化需求在对应的知识场景中按照设定规则选择引导式提问,并返 回给所述用户。
[0_ 在上述方法中,问答系统虽然可以针对宽泛的提问提供答案,但是在某些情况下, 返回的答案同样比较宽泛,也许该答案并不能满足用户的需求。所以在本实施例中,根据用 户的泛化需求确定对应的知识场景之后,问答系统根据该知识场景中问答对的关联关系, 向用户返回至少一个问答对数据中的问题作为引导式提问,目的在于提示用户再次提出一 个确定性的提问。
[0081] 640,根据所述用户针对引导式提问的至少一个答复信息,在所述对应的知识场景 中查询所述场景关联查询结果,向用户返回。
[0082]用户可以在系统提供的引导式提问中选择一个问题作为新的查询信息提交给自 动问答系统,自动问答系统可以按照前述任意一个实施例提供的自动问答方法重新进行查 询并返回结果。
[0083]本实施例提供的自动问答方法,对用户提供的宽泛性查询信息在知识场景中进行 分析,返回引导提问引导用户将宽泛的问题转化为具体问题,然后对具体问题进行准确的 答复,进一步提高了自动问答系统的答复效率与答案准确度。
[0084] 实施例七
[0085]图7是本发明实施例七提供的一种自动问答系统结构示意图。本实施例提供的系 统可用于实现上述各实施例所述的方法,该自动问答系统的具体结构如下:包括信息获取 模块和查询结果模块。
[0086] 其中,信息获取模块用于获取用户的查询信息;查询结果模块用于根据查询信息 和至少一个知识场景的问答对数据,查询场景关联查询结果,并向用户返回,所述知识场景 的问答对数据中包括至少一个问答对,所述问答对之间具有设定的关联关系。
[0087] 本发明实施例的技术方案,利用将各种问答对以知识场景的形式进行组织,且建 立了问答对之间的关联,则信息获取模块获取用户进行查询时,查询结果模块可以获得与 场景相关联的查询结果,且能利用问答对之间的关联关系得到丰富灵活的结果,避免了问 答结果单一的问题。
[0088] 在上述技术方案的基础上,该系统还可包括:第一资源获取模块、数据构建模块、 第一数据关联模块和第一数据存储模块。
[0089] 其中,第一资源获取模块用于在根据查询信息和至少一个知识场景的问答对数据 查询场景关联查询结果之前,从数据源中获取项目和项目的至少一个属性。
[0090] 数据构建模块用于根据所述项目的至少一个属性构建至少一个问答对。
[0091] 第一数据关联模块用于按照所述项目的属性之间的关联设置至少两个问答对之 间的关联关系。
[0092] 第一数据存储模块用于将所述问答对和问答对之间的关联关系存储为知识场景 的问答对数据。
[0093] 本实施例更为适用于问题的确定性明显、所归属的知识场景清晰的情况,可称为 强模式的知识场景。在此类场景中,问答对数据有明确的归属,且关联性往往有设定的规 律。
[0094] 在上述技术方案的基础上,该系统还可包括:第二资源获取模块、相似度计算模 块、第二数据关联模块和第二数据存储模块。
[0095]其中,第二资源获取模块用于在根据查询信息和至少一个知识场景的问答对数据 查询场景关联查询结果之前,从数据源中获取至少一个问答对。
[0096] 相似度计算模块用于根据所述问答对的至少一个关键词和关键词的设定权值,计 算所述问答对之间的相似度。
[0097] 第二数据关联模块用于根据所述相似度对至少一个问答对进行聚类,获取聚类后 问答对的项目名称,建立聚类问答对之间的关联关系。
[0098]第二数据存储模块用于将所述问答对和问答对之间的关联关系存储为知识场景 的问答对数据。
[0099] 在上述技术方案的基础上,该系统的查询结果模块可以优化为:第一信息识别单 元、基础数据获取单元、关联数据获取单元和第一结果返回单元。
[0100] 其中,第一信息识别单元用于识别所述查询信息。
[0101] 基础数据获取单元用于在所述信息识别单元识别到所述查询信息为确定问题之 时,根据所述确定问题在知识场景的问答对中进行问题匹配,获取基础问答对。
[0102] 关联数据获取单元用于获取与所述基础问答对具有设定关联关系的问答对,作为 推荐问答对。
[0103] 第一结果返回单元用于将所述基础问答对和推荐问答对作为所述场景关联查询 结果,向用户返回。
[0104] 本实施例提供的自动问答系统向用户返回答案的同时,系统还向用户提供了与原 提问相关的其他信息,使用户可以了解到更广泛的知识信息。
[0105] 在上述技术方案的基础上,该系统的查询结果模块还可以优化为:第二信息识别 单元、第一场景确定单元、数据选择单元和第二结果返回单元。
[0106] 其中,第二信息识别单元用于识别所述查询信息。
[0107] 第一场景确定单元用于在所述第二信息识别单元识别到所述查询信息为泛化需 求之时,根据所述泛化需求确定对应的知识场景。
[0108] 数据选择单元用于根据所述泛化需求在对应的知识场景中按照设定规则选择至 少一个问答对。
[0109] 第二结果返回单元用于将选择的所述至少一个问答对作为所述场景关联查询结 果,向用户返回。
[0110] 应用本实施例提供的系统进行自动问答,系统根据用户的查询信息在知识场景中 确定了具体的问答对数据,针对用户提供的宽泛性提问返回了结果。
[0111] 在上述技术方案的基础上,该系统的查询结果模块还可以优化为:第三信息识别 单元、第二场景确定单元、引导提问单元和第三结果返回单元。
[0112] 其中,第三信息识别单元用于识别所述查询信息。
[0113] 第二场景确定单元用于在所述第三信息识别单元识别到所述查询信息为泛化需 求之时,根据所述泛化需求确定对应的知识场景。
[0114] 引导提问单元用于根据所述泛化需求在对应的知识场景中按照设定规则选择引 导式提问,并返回给所述用户。
[0115] 第三结果返回单元用于根据所述用户针对引导式提问的至少一个答复信息,在所 述对应的知识场景中查询所述场景关联查询结果,向用户返回。
[0116] 本实施例提供的自动问答系统,对用户提供的宽泛性查询信息在知识场景中进行 分析,返回引导提问引导用户将宽泛的问题转化为具体问题,然后对具体问题进行准确的 答复,进一步提高了自动问答系统的答复效率与答案准确度。
[0117]注意,上述仅为本发明的较佳实施例及所运用技术原理。本领域技术人员会理解, 本发明不限于这里所述的特定实施例,对本领域技术人员来说能够进行各种明显的变化、 重新调整和替代而不会脱离本发明的保护范围。因此,虽然通过以上实施例对本发明进行 了较为详细的说明,但是本发明不仅仅限于以上实施例,在不脱离本发明构思的情况下,还 可以包括更多其他等效实施例,而本发明的范围由所附的权利要求范围决定。

Claims (16)

1. 一种自动问答方法,其特征在于,包括: 获取用户的查询信息; 根据查询信息和至少一个知识场景的问答对数据,查询场景关联查询结果,并向用户 返回,其中,所述知识场景的问答对数据中包括至少一个问答对,所述问答对之间具有设定 的关联关系; 其中,根据查询信息和知识场景的问答对数据查询场景关联查询结果,并向用户返回 包括: 识别所述查询信息; 如果识别到所述查询信息为泛化需求,则根据所述泛化需求确定对应的知识场景; 根据所述泛化需求在对应的知识场景中按照设定规则选择至少一个问答对; 将选择的所述至少一个问答对作为所述场景关联查询结果,向用户返回。
2.根据权利要求1所述的方法,其特征在于,在根据查询信息和至少一个知识场景的问 答对数据查询场景关联查询结果之前,还包括: 从数据源中获取项目和项目的至少一个属性; 根据所述项目的至少一个属性构建至少一个问答对; 按照所述项目的属性之间的关联设置至少两个问答对之间的关联关系; 将所述问答对和问答对之间的关联关系存储为知识场景的问答对数据。
3. 根据权利要求1所述的方法,其特征在于,在根据查询信息和至少一个知识场景的问 答对数据查询场景关联查询结果之前,还包括: 从数据源中获取至少一个问答对; 根据所述问答对的至少一个关键词和关键词的设定权值,计算所述问答对之间的相似 度; 根据所述相似度对至少一个问答对进行聚类,获取聚类后问答对的项目名称,建立聚 类问答对之间的关联关系; 将所述问答对和问答对之间的关联关系存储为知识场景的问答对数据。
4. 根据权利要求1-3任一所述的方法,其特征在于,根据查询信息和至少一个知识场景 的问答对数据查询场景关联查询结果,并向用户返回包括: 识别所述查询信息; 如果识别到所述查询信息为确定问题,则根据所述确定问题在知识场景的问答对中进 行问题匹配,获取基础问答对; 获取与所述基础问答对具有设定关联关系的问答对,作为推荐问答对; 将所述基础问答对和推荐问答对作为所述场景关联查询结果,向用户返回。
5. —种自动问答方法,其特征在于,包括: 获取用户的查询信息; 根据查询信息和至少一个知识场景的问答对数据,查询场景关联查询结果,并向用户 返回,其中,所述知识场景的问答对数据中包括至少一个问答对,所述问答对之间具有设定 的关联关系; 其中,根据查询信息和知识场景的问答对数据查询场景关联查询结果,并向用户返回 包括: 识别所述查询信息; 如果识别到所述查询信息为泛化需求,则根据所述泛化需求确定对应的知识场景; 根据所述泛化需求在对应的知识场景中按照设定规则选择引导式提问,并返回给所述 用户; 根据所述用户针对引导式提问的至少一个答复信息,在所述对应的知识场景中查询所 述场景关联查询结果,向用户返回。
6.根据权利要求5所述的方法,其特征在于,在根据查询信息和至少一个知识场景的问 答对数据查询场景关联查询结果之前,还包括: 从数据源中获取项目和项目的至少一个属性; 根据所述项目的至少一个属性构建至少一个问答对; 按照所述项目的属性之间的关联设置至少两个问答对之间的关联关系; 将所述问答对和问答对之间的关联关系存储为知识场景的问答对数据。
7. 根据权利要求5所述的方法,其特征在于,在根据查询信息和至少一个知识场景的问 答对数据查询场景关联查询结果之前,还包括: 从数据源中获取至少一个问答对; 根据所述问答对的至少一个关键词和关键词的设定权值,计算所述问答对之间的相似 度; 根据所述相似度对至少一个问答对进行聚类,获取聚类后问答对的项目名称,建立聚 类问答对之间的关联关系; 将所述问答对和问答对之间的关联关系存储为知识场景的问答对数据。
8. 根据权利要求5-7任一所述的方法,其特征在于,根据查询信息和至少一个知识场景 的问答对数据查询场景关联查询结果,并向用户返回包括: 识别所述查询信息; 如果识别到所述查询信息为确定问题,则根据所述确定问题在知识场景的问答对中进 行问题匹配,获取基础问答对; 获取与所述基础问答对具有设定关联关系的问答对,作为推荐问答对; 将所述基础问答对和推荐问答对作为所述场景关联查询结果,向用户返回。
9. 一种自动问答系统,其特征在于,包括: 信息获取模块,用于获取用户的查询信息; 查询结果模块,用于根据查询信息和至少一个知识场景的问答对数据,查询场景关联 查询结果,并向用户返回,其中,所述知识场景的问答对数据中包括至少一个问答对,所述 问答对之间具有设定的关联关系; 其中,查询模块包括: 第二信息识别单元,用于识别所述查询信息; 第一场景确定单元,用于在所述第二信息识别单元识别到所述查询信息为泛化需求之 时,根据所述泛化需求确定对应的知识场景; 数据选择单元,用于根据所述泛化需求在对应的知识场景中按照设定规则选择至少一 个问答对; 第二结果返回单元,用于将选择的所述至少一个问答对作为所述场景关联查询结果, 向用户返回。
10. 根据权利要求9所述的系统,其特征在于,还包括: 第一资源获取模块,用于在根据查询信息和至少一个知识场景的问答对数据查询场景 关联查询结果之前,从数据源中获取项目和项目的至少一个属性; 数据构建模块,用于根据所述项目的至少一个属性构建至少一个问答对; 第一数据关联模块,用于按照所述项目的属性之间的关联设置至少两个问答对之间的 关联关系; 第一数据存储模块,用于将所述问答对和问答对之间的关联关系存储为知识场景的问 答对数据。
11. 根据权利要求9所述的系统,其特征在于,还包括: 第二资源获取模块,用于在根据查询信息和至少一个知识场景的问答对数据查询场景 关联查询结果之前,从数据源中获取至少一个问答对; 相似度计算模块,用于根据所述问答对的至少一个关键词和关键词的设定权值,计算 所述问答对之间的相似度; 第二数据关联模块,用于根据所述相似度对至少一个问答对进行聚类,获取聚类后问 答对的项目名称,建立聚类问答对之间的关联关系; 第二数据存储模块,用于将所述问答对和问答对之间的关联关系存储为知识场景的问 答对数据。
12.根据权利要求9-11任一所述的系统,其特征在于,所述查询结果模块包括: 第一信息识别单元,用于识别所述查询信息; 基础数据获取单元,用于在所述信息识别单元识别到所述查询信息为确定问题之时, 根据所述确定问题在知识场景的问答对中进行问题匹配,获取基础问答对; 关联数据获取单元,用于获取与所述基础问答对具有设定关联关系的问答对,作为推 荐问答对; 第一结果返回单元,用于将所述基础问答对和推荐问答对作为所述场景关联查询结 果,向用户返回。
13. —种自动问答系统,其特征在于,包括: 信息获取模块,用于获取用户的查询信息; 查询结果模块,用于根据查询信息和至少一个知识场景的问答对数据,查询场景关联 查询结果,并向用户返回,其中,所述知识场景的问答对数据中包括至少一个问答对,所述 问答对之间具有设定的关联关系; 其中,查询模块包括: 第三信息识别单元,用于识别所述查询信息; 第二场景确定单元,用于在所述第三信息识别单元识别到所述查询信息为泛化需求之 时,根据所述泛化需求确定对应的知识场景; 引导提问单元,用于根据所述泛化需求在对应的知识场景中按照设定规则选择引导式 提问,并返回给所述用户; 第三结果返回单元用于根据所述用户针对引导式提问的至少一个答复信息,在所述对 应的知识场景中查询所述场景关联查询结果,向用户返回。
14. 根据权利要求13所述的系统,其特征在于,还包括: 第一资源获取模块,用于在根据查询信息和至少一个知识场景的问答对数据查询场景 关联查询结果之前,从数据源中获取项目和项目的至少一个属性; 数据构建模块,用于根据所述项目的至少一个属性构建至少一个问答对; 第一数据关联模块,用于按照所述项目的属性之间的关联设置至少两个问答对之间的 关耳关关系; 第一数据存储模块,用于将所述问答对和问答对之间的关联关系存储为知识场景的问 答对数据。
15. 根据权利要求13所述的系统,其特征在于,还包括: 第二资源获取模块,用于在根据查询信息和至少一个知识场景的问答对数据查询场景 关联查询结果之前,从数据源中获取至少一个问答对; 相似度计算模块,用于根据所述问答对的至少一个关键词和关键词的设定权值,计算 所述问答对之间的相似度; 第二数据关联模块,用于根据所述相似度对至少一个问答对进行聚类,获取聚类后问 答对的项目名称,建立聚类问答对之间的关联关系; 第二数据存储模块,用于将所述问答对和问答对之间的关联关系存储为知识场景的问 答对数据。
16. 根据权利要求13-15任一所述的系统,其特征在于,所述查询结果模块包括: 第一信息识别单元,用于识别所述查询信息; 基础数据获取单元,用于在所述信息识别单元识别到所述查询信息为确定问题之时, 根据所述确定问题在知识场景的问答对中进行问题匹配,获取基础问答对; 关联数据获取单元,用于获取与所述基础问答对具有设定关联关系的问答对,作为推 荐问答对; 第一结果返回单元,用于将所述基础问答对和推荐问答对作为所述场景关联查询结 果,向用户返回。
CN201410104275.XA 2014-03-20 2014-03-20 一种自动问答方法和系统 CN103853842B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201410104275.XA CN103853842B (zh) 2014-03-20 2014-03-20 一种自动问答方法和系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201410104275.XA CN103853842B (zh) 2014-03-20 2014-03-20 一种自动问答方法和系统

Publications (2)

Publication Number Publication Date
CN103853842A CN103853842A (zh) 2014-06-11
CN103853842B true CN103853842B (zh) 2017-07-18

Family

ID=50861497

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201410104275.XA CN103853842B (zh) 2014-03-20 2014-03-20 一种自动问答方法和系统

Country Status (1)

Country Link
CN (1) CN103853842B (zh)

Families Citing this family (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104036015A (zh) * 2014-06-24 2014-09-10 北京奇虎科技有限公司 一种电子终端问题分类及解决方案提供方法、系统及装置
CN104462024B (zh) * 2014-10-29 2018-07-13 百度在线网络技术(北京)有限公司 生成对话动作策略模型的方法和装置
CN105786871B (zh) * 2014-12-23 2019-03-19 北京奇虎科技有限公司 基于搜索词的问答类搜索结果呈现方法和装置
CN104809062B (zh) * 2015-04-22 2017-12-01 北京京东尚科信息技术有限公司 一种人工智能应答系统的测试方法及系统
CN105095069B (zh) * 2015-06-19 2018-06-08 北京京东尚科信息技术有限公司 一种人工智能应答系统测试方法及系统
CN105630960B (zh) * 2015-12-24 2019-02-12 百度在线网络技术(北京)有限公司 测试领域任务型对话系统的方法和装置
CN106095941B (zh) * 2016-06-14 2020-03-20 华南师范大学 基于大数据知识库的解决方案推荐方法和系统
CN106202476B (zh) * 2016-07-14 2017-06-06 广州安望信息科技有限公司 一种基于知识图谱的人机对话的方法及装置
CN106484801B (zh) * 2016-09-23 2019-10-11 厦门快商通科技股份有限公司 一种智能客服机器人的对话方法及其知识库管理系统
CN106682137A (zh) * 2016-12-19 2017-05-17 武汉市灯塔互动文化传播有限公司 一种智能股票投顾问答交互方法与系统
CN107357855B (zh) * 2017-06-29 2018-06-08 北京神州泰岳软件股份有限公司 支持场景关联的智能问答方法及装置
CN108021556A (zh) * 2017-12-20 2018-05-11 北京百度网讯科技有限公司 用于获取信息的方法及装置
CN108519998A (zh) * 2018-03-07 2018-09-11 北京云知声信息技术有限公司 基于知识图谱的问题引导方法及装置
CN109284383A (zh) * 2018-10-09 2019-01-29 北京来也网络科技有限公司 文本处理方法及装置
CN110674268B (zh) * 2019-08-23 2021-03-19 深圳追一科技有限公司 人机对话方法及相关设备

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101339551A (zh) * 2007-07-05 2009-01-07 日电(中国)有限公司 自然语言查询需求扩展设备及其方法
CN101986293A (zh) * 2010-09-03 2011-03-16 百度在线网络技术(北京)有限公司 用于在搜索界面中呈现搜索答案信息的方法及设备
JP2011103018A (ja) * 2009-11-10 2011-05-26 Nippon Telegr & Teleph Corp <Ntt> 質問応答装置、質問応答方法、質問応答プログラム
US8412514B1 (en) * 2005-10-27 2013-04-02 At&T Intellectual Property Ii, L.P. Method and apparatus for compiling and querying a QA database
CN103577557A (zh) * 2013-10-21 2014-02-12 北京奇虎科技有限公司 一种确定网络资源点的抓取频率的装置和方法

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8412514B1 (en) * 2005-10-27 2013-04-02 At&T Intellectual Property Ii, L.P. Method and apparatus for compiling and querying a QA database
CN101339551A (zh) * 2007-07-05 2009-01-07 日电(中国)有限公司 自然语言查询需求扩展设备及其方法
JP2011103018A (ja) * 2009-11-10 2011-05-26 Nippon Telegr & Teleph Corp <Ntt> 質問応答装置、質問応答方法、質問応答プログラム
CN101986293A (zh) * 2010-09-03 2011-03-16 百度在线网络技术(北京)有限公司 用于在搜索界面中呈现搜索答案信息的方法及设备
CN103577557A (zh) * 2013-10-21 2014-02-12 北京奇虎科技有限公司 一种确定网络资源点的抓取频率的装置和方法

Also Published As

Publication number Publication date
CN103853842A (zh) 2014-06-11

Similar Documents

Publication Publication Date Title
CN105068661B (zh) 基于人工智能的人机交互方法和系统
Zuccala et al. Altmetrics for the humanities: Comparing Goodreads reader ratings with citations to history books
US9230041B2 (en) Search suggestions of related entities based on co-occurrence and/or fuzzy-score matching
US9183511B2 (en) System and method for universal translating from natural language questions to structured queries
JP6284643B2 (ja) 非構造化テキストにおける特徴の曖昧性除去方法
US9558264B2 (en) Identifying and displaying relationships between candidate answers
US20170116203A1 (en) Method of automated discovery of topic relatedness
US9613317B2 (en) Justifying passage machine learning for question and answer systems
US9830381B2 (en) Scoring candidates using structural information in semi-structured documents for question answering systems
KR101895249B1 (ko) 지능 문답 구현 방법, 시스템 및 저장 매체
Liu et al. Author name disambiguation for p ub m ed
AU2013222184B2 (en) Related entities
US9009134B2 (en) Named entity recognition in query
CN106776711A (zh) 一种基于深度学习的中文医学知识图谱构建方法
KR20170018832A (ko) 사용자 관계 데이터 결합에 기초하는 검색
JP5816936B2 (ja) 質問に対する解答を自動的に生成するための方法、システム、およびコンピュータ・プログラム
US9348900B2 (en) Generating an answer from multiple pipelines using clustering
Amigó et al. WePS-3 evaluation campaign: Overview of the online reputation management task
US9135291B2 (en) System and method for determining similarities between online entities
Roda et al. CLEF-IP 2009: retrieval experiments in the Intellectual Property domain
JP5379696B2 (ja) 概念ベースの検索とランク付けを伴う情報検索のシステム、方法およびソフトウェア
US9201931B2 (en) Method for obtaining search suggestions from fuzzy score matching and population frequencies
US8407781B2 (en) Information providing support device and information providing support method
US20120323839A1 (en) Entity recognition using probabilities for out-of-collection data
US20080294628A1 (en) Ontology-content-based filtering method for personalized newspapers

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
TR01 Transfer of patent right
TR01 Transfer of patent right

Effective date of registration: 20180116

Address after: 100085 Beijing, Haidian District, No. ten on the ground floor, No. 10 Baidu building, layer 2

Patentee after: Beijing Baidu Network Information Technology Co., Ltd.

Address before: 100085 Beijing, Haidian District, No. ten on the ground floor, No. 10 Baidu building, layer three

Patentee before: Baidu In Line Network Technology Co., Ltd. (Beojing)