CN113961679A - 智能问答的处理方法、系统、电子设备及存储介质 - Google Patents

智能问答的处理方法、系统、电子设备及存储介质 Download PDF

Info

Publication number
CN113961679A
CN113961679A CN202111098225.1A CN202111098225A CN113961679A CN 113961679 A CN113961679 A CN 113961679A CN 202111098225 A CN202111098225 A CN 202111098225A CN 113961679 A CN113961679 A CN 113961679A
Authority
CN
China
Prior art keywords
layer
understanding
data
question
module
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202111098225.1A
Other languages
English (en)
Inventor
姜文斌
吕雅娟
朱勇
吴华
王海峰
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Baidu Netcom Science and Technology Co Ltd
Original Assignee
Beijing Baidu Netcom Science and Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Baidu Netcom Science and Technology Co Ltd filed Critical Beijing Baidu Netcom Science and Technology Co Ltd
Priority to CN202111098225.1A priority Critical patent/CN113961679A/zh
Publication of CN113961679A publication Critical patent/CN113961679A/zh
Priority to EP22186185.9A priority patent/EP4152176A1/en
Priority to US17/872,318 priority patent/US20230092736A1/en
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/3331Query processing
    • G06F16/3332Query translation
    • G06F16/3334Selection or weighting of terms from queries, including natural language queries
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/332Query formulation
    • G06F16/3329Natural language query formulation or dialogue systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/30Semantic analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/042Knowledge-based neural networks; Logical representations of neural networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N5/00Computing arrangements using knowledge-based models
    • G06N5/02Knowledge representation; Symbolic representation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N5/00Computing arrangements using knowledge-based models
    • G06N5/04Inference or reasoning models
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods

Abstract

本公开提供了一种智能问答的处理方法、系统、电子设备及存储介质,涉及机器学习与自然语言处理等人工智能技术领域。具体实现方案为:获取输入的问题以及数据资料;基于所述问题、所述数据资料以及多个知识库,采用多层理解模块,通过多层理解决策所述问题的答案。本公开的技术方案,能够有效地提高智能问答的效率,增强智能性。

Description

智能问答的处理方法、系统、电子设备及存储介质
技术领域
本公开涉及计算机技术领域,具体涉及机器学习与自然语言处理等人工智能技术领域,尤其涉及一种智能问答的处理方法、系统、电子设备及存储介质。
背景技术
智能问答是一类具有代表性的复杂认知任务,旨在根据用户问题从数据资料中获取和计算问题答案。
现有技术中,可以采用基于人工智能(Artificial Intelligence;AI)的智能问答系统来实现智能问答。实际应用中,智能问答系统可以遍布各种领域的各种应用场景中。例如,可以在家庭里的智能音箱、各种会场的智能引导机器人以及各种专业学习系统等等场景中,引入智能问答系统,实现对用户的问题进行智能的解答。
发明内容
本公开提供了一种智能问答的处理方法、系统、电子设备及存储介质。
根据本公开的一方面,提供了一种智能问答的处理方法,其中,所述方法包括:
获取输入的问题以及数据资料;
基于所述问题、所述数据资料以及多个知识库,采用预先训练的多层理解模型,通过多层理解决策所述问题的答案。
根据本公开的另一方面,提供了一种智能问答系统,包括:
获取单元,用于获取输入的问题以及数据资料;
决策功能单元,用于基于所述问题、所述数据资料以及多个知识库,采用多层理解模块,通过多层理解决策所述问题的答案。
根据本公开的再一方面,提供了一种电子设备,包括:
至少一个处理器;以及
与所述至少一个处理器通信连接的存储器;其中,
所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行如上所述的方面和任一可能的实现方式的方法。
根据本公开的又一方面,提供了一种存储有计算机指令的非瞬时计算机可读存储介质,所述计算机指令用于使所述计算机执行如上所述的方面和任一可能的实现方式的方法。
根据本公开的再另一方面,提供了一种计算机程序产品,包括计算机程序,所述计算机程序在被处理器执行时实现如上所述的方面和任一可能的实现方式的方法。
根据本公开的技术,能够有效地提高智能问答的效率,增强智能性。
应当理解,本部分所描述的内容并非旨在标识本公开的实施例的关键或重要特征,也不用于限制本公开的范围。本公开的其它特征将通过以下的说明书而变得容易理解。
附图说明
附图用于更好地理解本方案,不构成对本公开的限定。其中:
图1是根据本公开第一实施例的示意图;
图2是根据本公开第二实施例的示意图;
图3是本实施例的智能问答系统的原理图;
图4是根据本公开第三实施例的示意图;
图5是根据本公开第四实施例的示意图;
图6是用来实现本公开实施例的智能问答的处理方法的电子设备的框图。
具体实施方式
以下结合附图对本公开的示范性实施例做出说明,其中包括本公开实施例的各种细节以助于理解,应当将它们认为仅仅是示范性的。因此,本领域普通技术人员应当认识到,可以对这里描述的实施例做出各种改变和修改,而不会背离本公开的范围和精神。同样,为了清楚和简明,以下的描述中省略了对公知功能和结构的描述。
显然,所描述的实施例是本公开一部分实施例,而不是全部的实施例。基于本公开中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的全部其他实施例,都属于本公开保护的范围。
需要说明的是,本公开实施例中所涉及的终端设备可以包括但不限于手机、个人数字助理(Personal Digital Assistant,PDA)、无线手持设备、平板电脑(TabletComputer)等智能设备;显示设备可以包括但不限于个人电脑、电视等具有显示功能的设备。
另外,本文中术语“和/或”,仅仅是一种描述关联对象的关联关系,表示可以存在三种关系,例如,A和/或B,可以表示:单独存在A,同时存在A和B,单独存在B这三种情况。另外,本文中字符“/”,一般表示前后关联对象是一种“或”的关系。
现有的智能问答系统,可以先接收用户输入的用户问题以及数据资料。然后对用户问题和数据资料进行理解;并根据理解的结果,获取用户问题对应的答案。其中,智能问题在理解用户问题和数据资料的过程中,也可以结合外部数据库的知识,从外部数据库中检索与用户问题、数据资料相关的实体和关系,并将这些实体或关系对应的知识一次性引入,以辅助智能问答系统对用户问题和数据资料的理解。
图1是根据本公开第一实施例的示意图;如图1所示,本实施例提供一种智能问答的处理方法,具体可以包括如下步骤:
S101、获取输入的问题以及数据资料;
S102、基于问题、数据资料以及多个知识库,采用预先训练的多层理解模块型,通过多层理解决策问题的答案。
本实施例的智能问答的处理方法的执行主体可以为智能问答系统,该智能问答系统可以为电子实体,或者也可以为采用软件集成的应用,使用时,用户向该智能问答系统输入问题和数据资料,该智能问答系统可以基于问题、数据资料和多个知识库,采用多层理解模型,通过多层理解,决策出该问题的答案,并输出。
本实施例的用户输入的问题可以是自然语言形式的语句,数据资料则可以是图谱、表格、文档、视频等形态,根据数据资料的形态不同,本实施例的智能问答也可以相应的分为图谱问答、表格问答、文本问答和视频问答等具体类型。由于用户的问题是由自然语言描述的,其表达灵活和富有歧义的特性决定了理解的难度。数据资料无论是结构化的图谱和表格还是非结构化的文档和视频,都是不易理解的复杂数据对象。而且,智能问答的难度不仅在于问题和数据资料的各自理解,更在于二者理解过程的交互推理。需要对用户的问题和数据资料进行综合的理解和推理,才能制定出从数据资料中获取问题答案的求解路径。因此,对用户的问题和数据资料进行深度理解和推理是智能问答的核心难点。
另外,考虑到人类对用户的问题和数据资料的理解和推理过程展现出明显的层次,并在不同的层次调用不同类型的知识以辅助理解。例如,给定一张描述食物功用和禁忌的表格,回答“夏天吃啥比较好?”这样的问题。人类根据语言知识将问题理解为“在夏天这个季节适合吃什么食物”,根据常识知识得知“夏天”会产生“高温”并导致“烦躁”以及人类饮食需要遵循禁忌原则,最终通过词法、句法、语义、语用等多层面的理解和推理,结合表格中食物的功效和禁忌给出合理的答案,“…苦瓜清热解暑,黄瓜消渴解烦,苦瓜不宜与生黄瓜同食…”。用户的问题和数据资料是对人类需求和信息内容的自然表达,很多与之相关却习以为常的知识并没有显式地给出。而若要使用智能问答系统模拟人类理解推理的过程,则需要在每一层的理解和推理过程中,显式地给出不同类型的知识才能使得智能问答系统实现模拟人类的理解和推理过程。
基于以上所述,本实施例的智能问答的处理方法,在获取输入的问题以及数据资料之后,可以基于问题、数据资料以及多个知识库,采用多层理解模型,通过多层理解,决策问题的答案,与现有技术的知识一次性引入相比,能够更加真实地实现模拟人类的理解和推理过程,获取更加准确的答案。进一步提高了智能问答系统的效率,增强了智能问答系统的智能性。
例如,本实施例的多个知识库可以采用知识图谱的形式。多个知识库可以存储在智能问答系统的本地,或者也可以为外部的,使用时,能够被智能问答系统调用即可。
图2是根据本公开第二实施例的示意图;本实施例的智能问答的处理方法,在上述图1所示实施例的技术方案的基础上,进一步更加详细地描述本公开的技术方案。如图2所示,本实施例的智能问答的处理方法,具体可以包括如下步骤:
S201、获取输入的问题以及数据资料;
该步骤详细可以参考上述图1所示实施例的步骤S101的记载,在此不再赘述。
S202、基于问题和数据资料,采用多层理解模型中的各层理解模块,借助于多个知识库进行逐层的理解,得到多层理解后的问题和数据资料;
本实施例,可以以本实施例的智能问答的处理方法应用在智能问答系统中,来详细描述本公开的技术方案。
例如,图3是本实施例的智能问答系统的原理图。如图3所示,将智能问答系统分为输入层、决策层和输出层,其中决策层具体采用的是多层理解模型,具体可以包括多层理解模块和决策模块。如图3所示,以包括N个知识库为例。其中N个知识库中每个知识库可以对应一个知识读取模块来从对应的知识库中读取知识。但是每一层理解模块从N个知识库中的哪些知识库中读取知识,读取的知识的权重,是在智能问答系统的训练过程中确定。
上述步骤S201获取输入的问题和数据资料可以在输入层中执行。具体地,输入层中获取用户输入的问题为自然语句,数据资料可以为图谱、表格、文档、视频等形态,但也是基于文字表示的。所以在输入层中,还可以对获取到的问题和数据资料进行嵌入表示,以得到向量形式的问题和数据资料。当然,可选地,嵌入表示可以在决策层中做。
进一步地,该步骤S202在具体实施时,可以包括:
首先,采用多层理解模型中的第一层理解模块,参考多个知识库对问题和数据资料进行理解,得到理解后的第一问题和第一数据资料;
接下来,依次采用多层理解模型的第二层理解模块到最后一层理解模块中的每一层理解模块,参考多个知识库对上一层理解后的问题和数据资料进行理解,得到理解后的问题和数据资料。
具体地,可以采用多层理解模型中的第一层理解模块,基于问题和数据资料,先从多个知识库中引入第一层知识信息;然后基于引入的第一层知识信息,对问题和数据资料进行理解,得到理解后的第一问题和第一数据资料。
对于多层理解模型的第二层理解模块到第M层理解模块,处理逻辑相同。
例如,对于第二层理解模块,可以基于上一层理解模块即第一层理解模块理解后的第一问题和第一数据资料,从多个知识库中引入第二层知识信息;然后基于引入的第二层知识信息,对上一层理解后的第一问题和第一数据资料再次进行理解,得到理解后的第二问题和第二数据资料。
对于第三层理解模块,可以基于上一层理解模块即第二层理解模块理解后的第二问题和第二数据资料,从多个知识库中引入第三层知识信息;然后基于引入的第三层知识信息,对上一层理解后的第二问题和第二数据资料再次进行理解,得到理解后的第三问题和第三数据资料。
以此类推,可以得知,对于第j层理解模块,i大于2、且小于M,可以基于上一层理解模块即第j-1层理解模块理解后的第j-1问题和第j-1数据资料,从多个知识库中引入第j层知识信息;然后基于引入的第j层知识信息,对上一层理解后的第j-1问题和第j-1数据资料再次进行理解,得到理解后的第j问题和第j数据资料。
对于最后一层理解模块即第M层理解模块,可以基于上一层理解模块即第M-1层理解模块理解后的第M-1问题和第M-1数据资料,从多个知识库中引入第M层知识信息;然后基于引入的第M层知识信息,对上一层理解后的第M-1问题和第M-1数据资料再次进行理解,得到理解后的第M问题和第M数据资料,此时得到的第M问题和第M数据资料,即为M层理解后得到的问题和数据资料。
总体而言,本实施例的多层理解模型中的每一层理解模块基于上一层理解模块的理解结果,借助于多个知识库的知识,再进行深入理解。例如基于输入的问题和数据资料,第一层理解模块进行第一层理解,第二层理解模块基于第一层理解后的第一问题和第一数据资料进行第二层理解,得到第二问题和第二数据资料;依次类推,第j层理解模块基于第j-1层理解后的第j-1问题和第j-1数据资料进行第j层理解,得到第j问题和第j数据资料,等等,直到最后一层理解模块的理解,最终得到多层理解后的问题和数据资料。也就是说,每一层理解模块并非对原始的问题和数据资料进行理解,而是基于上一层理解模块理解的结果进行深入的理解。
在本公开的一个实施例中,以多层理解模型包括M层理解模块为例,可以基于问题和数据资料,采用多层理解模型中第1层理解模块到第i层理解模块的i-1层的理解模块,借助于多个知识库进行词法和/或句法层面的逐层深入的理解,得到第i层理解后的第i问题和第i数据资料;其中i为大于1、且小于M的正整数
进一步地,可以基于第i层理解模块理解的第i问题和第i数据资料,依次采用多层理解模型中第i+1层理解模块到第M层理解模块的M-i层理解模块,借助于多个知识库进行语义和/或语用层面的逐层深入的理解,得到多层理解后的问题和数据资料。
基于以上所述,可以理解为,在低层的理解模块中,进行的是类似于词法和/或句法层面的信息处理,此时需要从多个知识库中读取词法和/或句法层面的相关知识。在较高层的理解模块中,进行的是类似于语义和/或语用层面的信息处理,此时需要从多个知识库中读取语义和/或语用层面的相关知识。这样,可以通过层层深入理解的方式充分地模拟人类的思维过程,以更加准确地多问题和数据资料进行深入的理解,进而可以更加准确地获取到问题的答案。
本实施例的多层理解模型中包括的理解模块的具体层数可以在训练之前预先确定,例如可以为3层、5层或者其他大于或等于2的其他正整数层。其中知识库的数量也可以大于或者等于2,知识库可以按照领域划分,如基础语言领域、通信领域、无线电领域、财经领域、体育领域、娱乐领域等等。当然也可以按照其他类型来划分,此处不再赘述。
基于以上所述,可以得知,本实施例中,第一层理解模块引入知识信息时,是基于问题和数据资料的驱动并获取的。问题和数据资料可以作为当前理解模块的上下文信息,基于该上下文信息,可以动态地读取外部多个知识库中的相关的知识信息。然后根据该上下文信息将读取到的相关的知识信息动态整合起来,最后将整合的知识信息与该上下文信息一起形成知识增强的语义表示,作为下一层的上下文信息。其中形成的知识增强的语义表示即为基于引入的知识信息,得到的理解后的问题和数据资料。
对于第二层理解模块到最后一层理解模块,是将上一层的理解后的问题和数据资料驱动作为上下文信息,受上下文信息的驱动,动态地读取外部多个知识库中的相关的知识信息。后续推理过程相同,得到下一层的上下文信息。采用该层层深入的理解方式,可以每一层可以基于上一层的理解结果,动态地从外部的多个知识库获取相关的知识,再次进行更加深入的理解,能够对问题和数据资料进行层层深入的理解,能够有效地辅助答案的获取。
本实施例的多层理解模型可以采用多层的Transformer或者多层的图神经网络(Graph Neural Networks;GNN)、或者其他专门设计的多层神经网络。本实施例的多个知识库可以为外部的专业的知识库,在使用时,外部的多个知识库可以采用不同的知识图谱的向量化的知识表示。对于每种知识库,可以采用不同的知识读取模块,该知识读取模块根据当前理解或推理的上下文信息,动态地决定读取该知识库中的哪些知识。知识读取模块可以采用注意力机制,也可以采用其他专门设计的神经网络。需要说明的是,每一层理解模块对应动态地读取哪些知识库,都是在智能问答系统训练的时候预先学习到的。
S203、基于多层理解后的问题和数据资料,采用答案范围标定、程序指令生成或者答案选择的方式,决策问题的答案;
该步骤可以由决策层中的决策模块来执行。
基于数据资料的不同,决策模块决策问题的答案的方式可以不同。例如,对于知识图谱问答,决策问题的答案的最终操作可以是Gremlin语句的程序指令生成;对于表格问答,决策问题的答案的最终的操作可以是结构化查询语言(Structured Query Language;SQL)语句的程序指令生成。对于阅读理解,输出即为答案范围;对于表格问答和图谱问答,输出即为程序指令。无论采用哪种方式标注的答案,均能够有效地保证答案的准确性。
S204、输出问题的答案。
参考上述步骤S203的三种形式,该步骤输出的可以是答案的起止位置、生成的程序指令、答案选项。其中生成的程序指令可以为结构化查询语言(Structured QueryLanguage;SQL)/gremlin语句等。对于输出的答案为答案的起止位置、生成的程序指令时,可以基于答案的起止位置或者生成的程序指令,从数据资料中,获取最终的答案。
需要说明的是,本实施例的智能问答系统,在使用之前,需要经过预训练。在训练之前,可以预先采集多条训练数据,每一条训练数据中可以包括训练问题、对应的训练数据资料、以及标注的真实答案。其中,标注的真实答案的形式可以参考上述步骤S203的输出答案的形式。同时,还提供有可供智能问答系统读取的多个知识库。
训练时,对于任一条训练数据,将该训练数据中的训练问题和训练数据资料输入至智能问答系统中,该智能问答系统可以基于输入的信息,采用多层理解模块,借助于多个知识库进行层层深入的理解,然后基于多层理解模块推理后的训练问题和数据资料,决策出训练问题的预测答案。然后基于预测答案和标注的真实答案,构建损失函数。判断损失函数是否收敛,若不收敛,调整整个智能问答系统的参数,例如包括读取多个知识库的参数、每一层理解模块的参数以及决策模块决策答案的参数等等。本实施例中调整智能问答系统的参数的调整方法,是以损失函数朝向收敛的方向为准。采用多条训练数据,按照上述方式不断地对智能问答系统进行训练,直至在连续多轮的训练中,损失函数始终收敛,此时确定智能问答系统的全部参数,进而可以确定智能问答系统。
本实施例的智能问答的处理方法,通过采用多层理解模型进行层层引入相关的知识信息,与一次性知识引入方式相比,能够有效地契合深层理解和推理的层次化结构,不同层的理解模块,根据上一层理解后的问题和数据资料动态地引入不同的知识信息,能够实现对外部的知识信息更有效的运用,最终实现更好的理解和推理效果。因此,本实施例的技术方案,能够更加真实地模拟人类的理解和推理过程,有效地提高答案的准确性和智能问答的效率,增强问答的智能性。
图4是根据本公开第三实施例的示意图;如图4所示,本实施例提供一种智能问答系统400,包括:
获取单元401,用于获取输入的问题以及数据资料;
决策功能单元402,用于基于问题、数据资料以及多个知识库,采用预先训练的多层理解模型,通过多层理解决策问题的答案。
本实施例的智能问答系统400,通过采用上述单元实现智能问答的处理的实现原理以及技术效果,与上述相关方法实施例的实现相同,详细可以参考上述相关实施例的记载,在此不再赘述。
图5是根据本公开第四实施例的示意图;如图5所示,本实施例的智能问答系统500,在上述图4所示实施例的技术方案的基础上,进一步更加详细地描述本申请的技术方案。
如图5所示,本实施例的智能问答系统500中,决策功能单元502包括:
多层理解模块5021,用于基于问题和数据资料,借助于多个知识库进行逐层深入的理解,得到多层理解后的问题和数据资料;
决策模块5022,用于基于多层理解后的问题和数据资料,决策问题的答案。
可选地,多层理解模块5021在具体实施时,多层理解模型中的第一层理解模块,可以用于基于问题和数据资料,先从多个知识库中引入第一层知识信息;然后基于引入的第一层知识信息,对问题和数据资料进行理解,得到理解后的第一问题和第一数据资料。
多层理解模型的第二层理解模块到最后一层理解模块,处理逻辑相同。
例如,第二层理解模块,可以用于基于上一层理解模块即第一层理解模块理解后的第一问题和第一数据资料,从多个知识库中引入第二层知识信息;然后基于引入的第二层知识信息,对上一层理解后的第一问题和第一数据资料再次进行理解,得到理解后的第二问题和第二数据资料。
第三层理解模块,可以用于基于上一层理解模块即第二层理解模块理解后的第二问题和第二数据资料,从多个知识库中引入第三层知识信息;然后基于引入的第三层知识信息,对上一层理解后的第二问题和第二数据资料再次进行理解,得到理解后的第三问题和第三数据资料。
以此类推,可以得知,第j层理解模块,j大于1、且小于M,可以用于基于上一层理解模块即第j-1层理解模块理解后的第j-1问题和第j-1数据资料,从多个知识库中引入第j层知识信息;然后基于引入的第j层知识信息,对上一层理解后的第j-1问题和第j-1数据资料再次进行理解,得到理解后的第j问题和第j数据资料。
最后一层理解模块即第M层理解模块,可以用于基于上一层理解模块即第M-1层理解模块理解后的第M-1问题和第M-1数据资料,从多个知识库中引入第M层知识信息;然后基于引入的第M层知识信息,对上一层理解后的第M-1问题和第M-1数据资料再次进行理解,得到理解后的第M问题和第M数据资料,此时得到的第M问题和第M数据资料,即为M层理解后得到的问题和数据资料。
进一步可选地,多层理解模块5021中的第1层理解模块到第i层理解模块的i-1层理解模块,用于:
基于问题和数据资料,借助于多个知识库进行词法和/或句法层面的逐层的理解,得到第i问题和第i数据资料;其中i为大于1、且小于M的正整数。
进一步可选地,多层理解模块5021中的第i+1层理解模块到第M层理解模块的M-i层理解模块,用于:
基于第i层理解后的第i问题和第i数据资料,借助于多个知识库进行语义和/或语用层面的逐层深入的理解,得到多层理解后的问题和数据资料。
进一步可选地,决策模块5022,用于:
基于多层理解后的问题和数据资料,采用答案范围标定、程序指令生成或者答案选择的方式,决策问题的答案。
进一步可选地,本实施例的智能问答系统500中,还可以包括输出单元503,用于输出决策模块5022决策的问题的答案。
本实施例的智能问答系统500中的获取单元501与上述图4所示实施例的获取单元401功能相同,在此不再赘述。
本实施例的智能问答系统500,通过采用上述单元实现智能问答的处理的实现原理以及技术效果,与上述相关方法实施例的实现相同,详细可以参考上述相关实施例的记载,在此不再赘述。
本公开的技术方案中,所涉及的用户个人信息的获取,存储和应用等,均符合相关法律法规的规定,且不违背公序良俗。
根据本公开的实施例,本公开还提供了一种电子设备、一种可读存储介质和一种计算机程序产品。
图6示出了可以用来实施本公开的实施例的示例电子设备600的示意性框图。电子设备旨在表示各种形式的数字计算机,诸如,膝上型计算机、台式计算机、工作台、个人数字助理、服务器、刀片式服务器、大型计算机、和其它适合的计算机。电子设备还可以表示各种形式的移动装置,诸如,个人数字处理、蜂窝电话、智能电话、可穿戴设备和其它类似的计算装置。本文所示的部件、它们的连接和关系、以及它们的功能仅仅作为示例,并且不意在限制本文中描述的和/或者要求的本公开的实现。
如图6所示,设备600包括计算单元601,其可以根据存储在只读存储器(ROM)602中的计算机程序或者从存储单元608加载到随机访问存储器(RAM)603中的计算机程序,来执行各种适当的动作和处理。在RAM 603中,还可存储设备600操作所需的各种程序和数据。计算单元601、ROM 602以及RAM 603通过总线604彼此相连。输入/输出(I/O)接口605也连接至总线604。
设备600中的多个部件连接至I/O接口605,包括:输入单元606,例如键盘、鼠标等;输出单元607,例如各种类型的显示器、扬声器等;存储单元608,例如磁盘、光盘等;以及通信单元609,例如网卡、调制解调器、无线通信收发机等。通信单元609允许设备600通过诸如因特网的计算机网络和/或各种电信网络与其他设备交换信息/数据。
计算单元601可以是各种具有处理和计算能力的通用和/或专用处理组件。计算单元601的一些示例包括但不限于中央处理单元(CPU)、图形处理单元(GPU)、各种专用的人工智能(AI)计算芯片、各种运行机器学习模型算法的计算单元、数字信号处理器(DSP)、以及任何适当的处理器、控制器、微控制器等。计算单元601执行上文所描述的各个方法和处理,例如智能问答的处理方法。例如,在一些实施例中,智能问答的处理方法可被实现为计算机软件程序,其被有形地包含于机器可读介质,例如存储单元608。在一些实施例中,计算机程序的部分或者全部可以经由ROM 602和/或通信单元609而被载入和/或安装到设备600上。当计算机程序加载到RAM 603并由计算单元601执行时,可以执行上文描述的智能问答的处理方法的一个或多个步骤。备选地,在其他实施例中,计算单元601可以通过其他任何适当的方式(例如,借助于固件)而被配置为执行智能问答的处理方法。
本文中以上描述的系统和技术的各种实施方式可以在数字电子电路系统、集成电路系统、场可编程门阵列(FPGA)、专用集成电路(ASIC)、专用标准产品(ASSP)、芯片上系统的系统(SOC)、负载可编程逻辑设备(CPLD)、计算机硬件、固件、软件、和/或它们的组合中实现。这些各种实施方式可以包括:实施在一个或者多个计算机程序中,该一个或者多个计算机程序可在包括至少一个可编程处理器的可编程系统上执行和/或解释,该可编程处理器可以是专用或者通用可编程处理器,可以从存储系统、至少一个输入装置、和至少一个输出装置接收数据和指令,并且将数据和指令传输至该存储系统、该至少一个输入装置、和该至少一个输出装置。
用于实施本公开的方法的程序代码可以采用一个或多个编程语言的任何组合来编写。这些程序代码可以提供给通用计算机、专用计算机或其他可编程数据处理装置的处理器或控制器,使得程序代码当由处理器或控制器执行时使流程图和/或框图中所规定的功能/操作被实施。程序代码可以完全在机器上执行、部分地在机器上执行,作为独立软件包部分地在机器上执行且部分地在远程机器上执行或完全在远程机器或服务器上执行。
在本公开的上下文中,机器可读介质可以是有形的介质,其可以包含或存储以供指令执行系统、装置或设备使用或与指令执行系统、装置或设备结合地使用的程序。机器可读介质可以是机器可读信号介质或机器可读储存介质。机器可读介质可以包括但不限于电子的、磁性的、光学的、电磁的、红外的、或半导体系统、装置或设备,或者上述内容的任何合适组合。机器可读存储介质的更具体示例会包括基于一个或多个线的电气连接、便携式计算机盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦除可编程只读存储器(EPROM或快闪存储器)、光纤、便捷式紧凑盘只读存储器(CD-ROM)、光学储存设备、磁储存设备、或上述内容的任何合适组合。
为了提供与用户的交互,可以在计算机上实施此处描述的系统和技术,该计算机具有:用于向用户显示信息的显示装置(例如,CRT(阴极射线管)或者LCD(液晶显示器)监视器);以及键盘和指向装置(例如,鼠标或者轨迹球),用户可以通过该键盘和该指向装置来将输入提供给计算机。其它种类的装置还可以用于提供与用户的交互;例如,提供给用户的反馈可以是任何形式的传感反馈(例如,视觉反馈、听觉反馈、或者触觉反馈);并且可以用任何形式(包括声输入、语音输入或者、触觉输入)来接收来自用户的输入。
可以将此处描述的系统和技术实施在包括后台部件的计算系统(例如,作为数据服务器)、或者包括中间件部件的计算系统(例如,应用服务器)、或者包括前端部件的计算系统(例如,具有图形用户界面或者网络浏览器的用户计算机,用户可以通过该图形用户界面或者该网络浏览器来与此处描述的系统和技术的实施方式交互)、或者包括这种后台部件、中间件部件、或者前端部件的任何组合的计算系统中。可以通过任何形式或者介质的数字数据通信(例如,通信网络)来将系统的部件相互连接。通信网络的示例包括:局域网(LAN)、广域网(WAN)和互联网。
计算机系统可以包括客户端和服务器。客户端和服务器一般远离彼此并且通常通过通信网络进行交互。通过在相应的计算机上运行并且彼此具有客户端-服务器关系的计算机程序来产生客户端和服务器的关系。服务器可以是云服务器,也可以为分布式系统的服务器,或者是结合了区块链的服务器。
应该理解,可以使用上面所示的各种形式的流程,重新排序、增加或删除步骤。例如,本发公开中记载的各步骤可以并行地执行也可以顺序地执行也可以不同的次序执行,只要能够实现本公开公开的技术方案所期望的结果,本文在此不进行限制。
上述具体实施方式,并不构成对本公开保护范围的限制。本领域技术人员应该明白的是,根据设计要求和其他因素,可以进行各种修改、组合、子组合和替代。任何在本公开的精神和原则之内所作的修改、等同替换和改进等,均应包含在本公开保护范围之内。

Claims (17)

1.一种智能问答的处理方法,其中,所述方法包括:
获取输入的问题以及数据资料;
基于所述问题、所述数据资料以及多个知识库,采用预先训练的多层理解模型,通过多层理解决策所述问题的答案。
2.根据权利要求1所述的方法,其中,基于所述问题、所述数据资料以及多个知识库,采用预先训练的多层理解模型,通过多层理解决策所述问题的答案,包括:
基于所述问题和所述数据资料,采用所述多层理解模型中的各层理解模块,借助于所述多个知识库进行逐层的理解,得到多层理解后的问题和数据资料;
基于所述多层理解后的问题和数据资料,决策所述问题的答案。
3.根据权利要求2所述的方法,所述多层理解模型包括M层理解模块,其中M为正整数;其中,基于所述问题和所述数据资料,采用所述多层理解模型中的各层理解模块,借助于所述多个知识库进行逐层的理解,得到多层理解后的问题和数据资料,包括:
基于所述问题和所述数据资料,采用所述多层理解模型中第1层理解模块到第i层理解模块的i-1层理解模块,借助于所述多个知识库进行词法和/或句法层面的逐层的理解,得到第i问题和第i数据资料;其中i为大于1、且小于M的正整数。
4.根据权利要求3所述的方法,其中,基于所述问题和所述数据资料,采用所述多层理解模型中的各层理解模块,借助于所述多个知识库进行逐层的理解,得到多层理解后的问题和数据资料,还包括:
基于所述第i层理解模块理解的所述第i问题和所述第i数据资料,依次采用所述多层理解模型中第i+1层理解模块到第M层理解模块的M-i层理解模块,借助于所述多个知识库进行语义和/或语用层面的逐层的理解,得到所述多层理解后的问题和数据资料。
5.根据权利要求2或3所述的方法,其中,基于所述问题和所述数据资料,采用所述多层理解模型中的各层理解模块,借助于所述多个知识库进行逐层的理解,得到多层理解后的问题和数据资料,包括:
基于所述问题和所述数据资料,采用所述多层理解模型中的第1层理解模块,从所述多个知识库中引入第1层知识信息;
基于引入的所述第1层知识信息,对所述问题和所述数据资料进行理解,得到经第1层理解模块理解的第一问题和第一数据资料。
6.根据权利要求2或3所述的方法,其中,基于所述问题和所述数据资料,采用所述多层理解模型中的各层理解模块,借助于所述多个知识库进行逐层的理解,得到多层理解后的问题和数据资料,包括:
基于第j-1层理解模块理解的第j-1问题和第j-1数据资料,采用所述多层理解模型中的第j层理解模块,从所述多个知识库中引入第j层知识信息;其中j为大于1、且小于或者等于M的正整数;
基于引入的所述第j层知识信息,对所述第j-1问题和第j-1数据资料进行理解,得到第j问题和第j数据资料。
7.根据权利要求2-6任一所述的方法,其中,基于所述多层理解后的问题和数据资料,决策所述问题的答案,包括:
基于所述多层理解后的问题和数据资料,采用答案范围标定、程序指令生成或者答案选择的方式,决策所述问题的答案。
8.一种智能问答系统,包括:
获取单元,用于获取输入的问题以及数据资料;
决策功能单元,用于基于所述问题、所述数据资料以及多个知识库,采用预先训练的多层理解模型,通过多层理解决策所述问题的答案。
9.根据权利要求8所述的系统,其中,所述决策功能单元包括:
多层理解模块,用于基于所述问题和所述数据资料,借助于所述多个知识库进行逐层的理解,得到多层理解后的问题和数据资料;
决策模块,用于基于所述多层理解后的问题和数据资料,决策所述问题的答案。
10.根据权利要求7所述的系统,其中,所述多层理解模型中的多层理解模块包括M层理解模块,其中M为正整数;所述多层理解模型中的第1层理解模块到第i层理解模块的i-1层理解模块,用于:
基于所述问题和所述数据资料,借助于所述多个知识库进行词法和/或句法层面的逐层的理解,得到第i问题和第i数据资料;其中i为大于1、且小于M的正整数。
11.根据权利要求10所述的系统,其中,所述多层理解模型中的第i+1层理解模块到第M层理解模块的M-i层理解模块,用于:
基于所述第i层理解模块理解的所述第i问题和所述第i数据资料,借助于所述多个知识库进行语义和/或语用层面的逐层的理解,得到所述多层理解后的问题和数据资料。
12.根据权利要求9或10所述的系统,其中,所述多层理解模型中的第一层理解模块,用于:
基于所述问题和所述数据资料,采用所述多层理解模型中的第1层理解模块,从所述多个知识库中引入第1层知识信息;
基于引入的所述第1层知识信息,对所述问题和所述数据资料进行理解,得到第一问题和第一数据资料。
13.根据权利要求9或10所述的系统,其中,所述多层理解模型中的第j层理解模块,用于:
基于第j-1层理解模块理解的第j-1问题和第j-1数据资料,采用所述多层理解模型中的第j层理解模块,从所述多个知识库中引入第j层知识信息;其中j为大于1、且小于M的正整数;
基于引入的所述第j层知识信息,对所述第j-1问题和所述第j-1数据资料进行理解,得到第j问题和第j数据资料。
14.根据权利要求9-13任一所述的系统,其中,所述决策模块,用于:
基于所述多层理解后的问题和数据资料,采用答案范围标定、程序指令生成或者答案选择的方式,决策所述问题的答案。
15.一种电子设备,包括:
至少一个处理器;以及
与所述至少一个处理器通信连接的存储器;其中,
所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行权利要求1-7中任一项所述的方法。
16.一种存储有计算机指令的非瞬时计算机可读存储介质,其中,所述计算机指令用于使所述计算机执行根据权利要求1-7中任一项所述的方法。
17.一种计算机程序产品,包括计算机程序,所述计算机程序在被处理器执行时实现根据权利要求1-7中任一项所述的方法。
CN202111098225.1A 2021-09-18 2021-09-18 智能问答的处理方法、系统、电子设备及存储介质 Pending CN113961679A (zh)

Priority Applications (3)

Application Number Priority Date Filing Date Title
CN202111098225.1A CN113961679A (zh) 2021-09-18 2021-09-18 智能问答的处理方法、系统、电子设备及存储介质
EP22186185.9A EP4152176A1 (en) 2021-09-18 2022-07-21 Intelligent question-answering processing method and system, electronic device and storage medium
US17/872,318 US20230092736A1 (en) 2021-09-18 2022-07-25 Intelligent question-answering processing method and system, electronic device and storage medium

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202111098225.1A CN113961679A (zh) 2021-09-18 2021-09-18 智能问答的处理方法、系统、电子设备及存储介质

Publications (1)

Publication Number Publication Date
CN113961679A true CN113961679A (zh) 2022-01-21

Family

ID=79461764

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202111098225.1A Pending CN113961679A (zh) 2021-09-18 2021-09-18 智能问答的处理方法、系统、电子设备及存储介质

Country Status (3)

Country Link
US (1) US20230092736A1 (zh)
EP (1) EP4152176A1 (zh)
CN (1) CN113961679A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114610752A (zh) * 2022-05-10 2022-06-10 阿里巴巴(中国)有限公司 基于表格问答的回复生成及模型训练方法、装置及设备

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116881426B (zh) * 2023-08-30 2023-11-10 环球数科集团有限公司 一种基于aigc的自解释问答系统

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20150356142A1 (en) * 2014-06-06 2015-12-10 Xerox Corporation Question answering system adapted to style of user requests
CN111078836A (zh) * 2019-12-10 2020-04-28 中国科学院自动化研究所 基于外部知识增强的机器阅读理解方法、系统、装置
CN112559727A (zh) * 2020-12-15 2021-03-26 北京百度网讯科技有限公司 用于输出信息的方法、装置、设备、存储介质和程序
CN112749262A (zh) * 2020-07-24 2021-05-04 腾讯科技(深圳)有限公司 基于人工智能的问答处理方法、装置、电子设备及存储介质
CN112949286A (zh) * 2021-03-09 2021-06-11 北京汉雅天诚教育科技有限公司 一种基于句式结构的汉语自动句法分析器
WO2021120543A1 (zh) * 2019-12-17 2021-06-24 北京百度网讯科技有限公司 基于自然语言和知识图谱的表示学习方法及装置

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109582798A (zh) * 2017-09-29 2019-04-05 阿里巴巴集团控股有限公司 自动问答方法、系统及设备
CN111797870A (zh) * 2019-04-09 2020-10-20 Oppo广东移动通信有限公司 算法模型的优化方法、装置、存储介质及电子设备
CN111382255B (zh) * 2020-03-17 2023-08-01 北京百度网讯科技有限公司 用于问答处理的方法、装置、设备和介质

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20150356142A1 (en) * 2014-06-06 2015-12-10 Xerox Corporation Question answering system adapted to style of user requests
CN111078836A (zh) * 2019-12-10 2020-04-28 中国科学院自动化研究所 基于外部知识增强的机器阅读理解方法、系统、装置
WO2021120543A1 (zh) * 2019-12-17 2021-06-24 北京百度网讯科技有限公司 基于自然语言和知识图谱的表示学习方法及装置
CN112749262A (zh) * 2020-07-24 2021-05-04 腾讯科技(深圳)有限公司 基于人工智能的问答处理方法、装置、电子设备及存储介质
CN112559727A (zh) * 2020-12-15 2021-03-26 北京百度网讯科技有限公司 用于输出信息的方法、装置、设备、存储介质和程序
CN112949286A (zh) * 2021-03-09 2021-06-11 北京汉雅天诚教育科技有限公司 一种基于句式结构的汉语自动句法分析器

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
ADNAN ARDHIAN等: "Learning explicit and implicit knowledge with differentiate neural computer", 《IEEE》 *
李东奇等: "基于知识库的开放域问答研究", 《电脑知识与技术》, vol. 16, no. 36 *
陈鄞主编: "《人工智能 大数据与人工智能技术"大数据与人工智能技术"精品教材》", 哈尔滨工业大学出版社, pages: 24 - 25 *

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114610752A (zh) * 2022-05-10 2022-06-10 阿里巴巴(中国)有限公司 基于表格问答的回复生成及模型训练方法、装置及设备

Also Published As

Publication number Publication date
US20230092736A1 (en) 2023-03-23
EP4152176A1 (en) 2023-03-22

Similar Documents

Publication Publication Date Title
CN110019701B (zh) 用于问答服务的方法、问答服务系统以及存储介质
US10650102B2 (en) Method and apparatus for generating parallel text in same language
CN112164391B (zh) 语句处理方法、装置、电子设备及存储介质
WO2022022421A1 (zh) 语言表示模型系统、预训练方法、装置、设备及介质
US20200019876A1 (en) Predicting user question in question and answer system
CN112507040A (zh) 多元关系生成模型的训练方法、装置、电子设备及介质
WO2020244475A1 (zh) 用于语言序列标注的方法、装置、存储介质及计算设备
CN111652378B (zh) 学习来选择类别特征的词汇
CN113127624B (zh) 问答模型的训练方法及装置
EP4152176A1 (en) Intelligent question-answering processing method and system, electronic device and storage medium
CN113806552B (zh) 信息提取方法、装置、电子设备和存储介质
US11947920B2 (en) Man-machine dialogue method and system, computer device and medium
CN113239169A (zh) 基于人工智能的回答生成方法、装置、设备及存储介质
CN111813909A (zh) 一种智能问答方法和装置
CN113408284A (zh) 文本处理模型的训练方法、装置、电子设备及存储介质
US20230013796A1 (en) Method and apparatus for acquiring pre-trained model, electronic device and storage medium
CN114417878B (zh) 语义识别方法、装置、电子设备及存储介质
CN115062718A (zh) 语言模型训练方法、装置、电子设备及存储介质
CN114120166A (zh) 视频问答方法、装置、电子设备及存储介质
CN114970666B (zh) 一种口语处理方法、装置、电子设备及存储介质
CN116244442A (zh) 文本分类方法、装置、存储介质及电子设备
CN112527127B (zh) 输入法长句预测模型的训练方法、装置、电子设备及介质
CN114817476A (zh) 语言模型的训练方法、装置、电子设备和存储介质
CN114490965A (zh) 问题处理方法、装置、电子设备和存储介质
CN109446518B (zh) 语言模型的解码方法及解码器

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination