CN108595494B - 答复信息的获取方法及装置 - Google Patents

答复信息的获取方法及装置 Download PDF

Info

Publication number
CN108595494B
CN108595494B CN201810215381.3A CN201810215381A CN108595494B CN 108595494 B CN108595494 B CN 108595494B CN 201810215381 A CN201810215381 A CN 201810215381A CN 108595494 B CN108595494 B CN 108595494B
Authority
CN
China
Prior art keywords
information
target
reply
category
question
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201810215381.3A
Other languages
English (en)
Other versions
CN108595494A (zh
Inventor
晁阳
陆遥
李东
孙广元
卫然
郑滔
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Tencent Technology Shenzhen Co Ltd
Original Assignee
Tencent Technology Shenzhen Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tencent Technology Shenzhen Co Ltd filed Critical Tencent Technology Shenzhen Co Ltd
Priority to CN201810215381.3A priority Critical patent/CN108595494B/zh
Publication of CN108595494A publication Critical patent/CN108595494A/zh
Priority to PCT/CN2019/074185 priority patent/WO2019174428A1/zh
Priority to US16/895,992 priority patent/US20200301954A1/en
Application granted granted Critical
Publication of CN108595494B publication Critical patent/CN108595494B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/903Querying
    • G06F16/90335Query processing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/3331Query processing
    • G06F16/3332Query translation
    • G06F16/3338Query expansion
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/31Indexing; Data structures therefor; Storage structures
    • G06F16/313Selection or weighting of terms for indexing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/31Indexing; Data structures therefor; Storage structures
    • G06F16/316Indexing structures
    • G06F16/328Management therefor
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/332Query formulation
    • G06F16/3329Natural language query formulation or dialogue systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/3331Query processing
    • G06F16/3332Query translation
    • G06F16/3334Selection or weighting of terms from queries, including natural language queries
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/3331Query processing
    • G06F16/334Query execution
    • G06F16/3344Query execution using natural language analysis

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Databases & Information Systems (AREA)
  • Data Mining & Analysis (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Artificial Intelligence (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Business, Economics & Management (AREA)
  • Human Computer Interaction (AREA)
  • General Business, Economics & Management (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Machine Translation (AREA)

Abstract

本发明公开了一种答复信息的获取方法及装置。其中,该方法包括:根据客户端获取到的目标提问信息确定与目标提问信息对应的目标关键词;根据目标关键词在多个信息类别中确定目标提问信息所属的目标信息类别;从多个信息分组中的目标信息分组中获取目标提问信息对应的目标答复信息,其中,目标信息分组中包括多对具有对应关系的提问信息和答复信息,目标信息分组中包括的提问信息属于目标信息类别。本发明解决了相关技术中获取答复信息的效率较低的技术问题。

Description

答复信息的获取方法及装置
技术领域
本发明涉及计算机领域,具体而言,涉及一种答复信息的获取方法及装置。
背景技术
传统的自然语言理解(Nature Language Understand,简称为NLU)采用的人工智能标记语言(Artificial Intelligence Markup Language简称为 AIML)主要依赖于大量的问答对(QA-pairs)模板,在对用户输入的问题的答案进行检索时往往需要查询大量的QA-pairs模板,效率较低,功能有限。
针对上述的问题,目前尚未提出有效的解决方案。
发明内容
本发明实施例提供了一种答复信息的获取方法及装置,以至少解决相关技术中获取答复信息的效率较低的技术问题。
根据本发明实施例的一个方面,提供了一种答复信息的获取方法,包括:根据客户端获取到的目标提问信息确定与所述目标提问信息对应的目标关键词;根据所述目标关键词在多个信息类别中确定所述目标提问信息所属的目标信息类别;从多个信息分组中的目标信息分组中获取所述目标提问信息对应的目标答复信息,其中,所述目标信息分组中包括多对具有对应关系的提问信息和答复信息,所述目标信息分组中包括的所述提问信息属于所述目标信息类别。
根据本发明实施例的另一方面,还提供了一种答复信息的获取装置,包括:第一确定模块,用于根据客户端获取到的目标提问信息确定与所述目标提问信息对应的目标关键词;第二确定模块,用于根据所述目标关键词在多个信息类别中确定所述目标提问信息所属的目标信息类别;第一获取模块,用于从多个信息分组中的目标信息分组中获取所述目标提问信息对应的目标答复信息,其中,所述目标信息分组中包括多对具有对应关系的提问信息和答复信息,所述目标信息分组中包括的所述提问信息属于所述目标信息类别。
根据本发明实施例的另一方面,还提供了一种存储介质,其特征在于,所述存储介质中存储有计算机程序,其中,所述计算机程序被设置为运行时执行上述任一项中所述的方法。
根据本发明实施例的另一方面,还提供了一种电子装置,包括存储器和处理器,其特征在于,所述存储器中存储有计算机程序,所述处理器被设置为通过所述计算机程序执行上述任一项中所述的方法。
在本发明实施例中,采用根据客户端获取到的目标提问信息确定与目标提问信息对应的目标关键词;根据目标关键词在多个信息类别中确定目标提问信息所属的目标信息类别;从多个信息分组中的目标信息分组中获取目标提问信息对应的目标答复信息,其中,目标信息分组中包括多对具有对应关系的提问信息和答复信息,目标信息分组中包括的提问信息属于目标信息类别的方式,将具有对应关系的提问信息和答复信息按照提问信息的信息类别划分为多个信息分组,在对目标提问信息对应的目标答复信息进行获取时,首先确定目标提问信息所属的目标信息类别,在从该目标信息类别对应的目标信息分组中获取目标提问信息对应的目标答复信息,从而能够准确定位目标提问信息的提问意图,将目标提问信息定位到相同意图对应的目标信息类别上,再从目标信息类别对应的目标信息分组中获取目标答复信息,从而避免了查询大量的QA-pairs模板,提高了获取答复信息的效率,进而解决了相关技术中获取答复信息的效率较低的技术问题。
附图说明
此处所说明的附图用来提供对本发明的进一步理解,构成本申请的一部分,本发明的示意性实施例及其说明用于解释本发明,并不构成对本发明的不当限定。在附图中:
图1是根据本发明实施例的一种可选的答复信息的获取方法的示意图;
图2是根据本发明实施例的一种可选的答复信息的获取方法的应用环境示意图一;
图3是根据本发明实施例的一种可选的答复信息的获取方法的应用环境示意图二;
图4是根据本发明可选的实施方式的一种可选的答复信息的获取方法的示意图;
图5是根据本发明可选的实施方式的另一种可选的答复信息的获取方法的示意图;
图6是根据本发明实施例的一种可选的答复信息的获取装置的示意图;
图7是根据本发明实施例的一种可选的答复信息的获取方法的应用场景示意图一;
图8是根据本发明实施例的一种可选的答复信息的获取方法的应用场景示意图二;以及
图9是根据本发明实施例的一种可选的电子装置的示意图。
具体实施方式
为了使本技术领域的人员更好地理解本发明方案,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分的实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本发明保护的范围。
需要说明的是,本发明的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本发明的实施例能够以除了在这里图示或描述的那些以外的顺序实施。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
根据本发明实施例的一个方面,提供了一种答复信息的获取方法,如图1所示,该方法包括:
S102,根据客户端获取到的目标提问信息确定与目标提问信息对应的目标关键词;
S104,根据目标关键词在多个信息类别中确定目标提问信息所属的目标信息类别;
S106,从多个信息分组中的目标信息分组中获取目标提问信息对应的目标答复信息,其中,目标信息分组中包括多对具有对应关系的提问信息和答复信息,目标信息分组中包括的提问信息属于目标信息类别。
可选地,在本实施例中,上述答复信息的获取方法可以应用于如图2 所示的客户端202和服务器204所构成的硬件环境中。如图2所示,客户端202获取用户输入的目标提问信息,将该目标提问信息显示在显示界面上并将该目标提问信息发送至服务器204。服务器204根据该目标提问信息确定与目标提问信息对应的目标关键词,根据目标关键词在多个信息类别(信息类别1-信息类别N)中确定目标提问信息所属的目标信息类别,从多个信息分组(信息分组1-信息分组M)中的目标信息分组中获取目标提问信息对应的目标答复信息,其中,目标信息分组中包括多对具有对应关系的提问信息和答复信息,目标信息分组中包括的提问信息属于目标信息类别。服务器204将获取到的目标答复信息返回给客户端202。客户端 202将服务器204返回的目标答复信息显示在上述显示界面上。
可选地,在本实施例中,上述答复信息的获取方法可以应用于如图3 所示的目标设备302所构成的硬件环境中。如图3所示,目标设备302上配置了接收装置304、显示器306和处理器308。接收装置304获取用户输入的目标提问信息,将该目标提问信息显示在显示器306上并将该目标提问信息发送至处理器308。处理器306根据该目标提问信息确定与目标提问信息对应的目标关键词,根据目标关键词在多个信息类别中确定目标提问信息所属的目标信息类别,从多个信息分组中的目标信息分组中获取目标提问信息对应的目标答复信息,其中,目标信息分组中包括多对具有对应关系的提问信息和答复信息,目标信息分组中包括的提问信息属于目标信息类别。处理器308将获取到的目标答复信息发送给显示器306。显示器306将该目标答复信息显示在屏幕上。
可选地,在本实施例中,上述答复信息的获取方法可以但不限于应用于获取提问信息对应的答复信息的场景中。其中,上述客户端可以但不限于为各种类型的应用,例如,在线教育应用、即时通讯应用、社区空间应用、游戏应用、购物应用、浏览器应用、金融应用、多媒体应用、直播应用等。具体的,可以但不限于应用于在上述游戏应用中获取提问信息对应的答复信息的场景中,或还可以但不限于应用于在上述购物应用中获取提问信息对应的答复信息的场景中,以提高获取答复信息的效率。上述仅是一种示例,本实施例中对此不做任何限定。
可选地,在本实施例中,目标提问信息可以但不限于为以下形式:文字信息、语音信息等等。例如:在目标提问信息为语音信息的形式的情况下,可以首先将目标提问信息的语音转换成文字信息,再根据该文字信息确定与目标提问信息对应的目标关键词,从而根据目标关键词确定目标信息类别,再在目标信息类别对应的目标信息分组中获取目标答复信息。
可选地,在本实施例中,目标提问信息对应的目标关键词可以但不限于包括从目标提问信息中提取的关键词,还可以包括根据提取的关键词生成的关键词,或者还可以包括用于表示提取的关键词之间上下位关系的信息。例如:从目标提问信息中提取的关键词包括关键词A和关键词B,还获取到关键词A是关键词B的上位关键词,并且关键词A是关键词C的上位关键词,关键词C是关键词B的上位关键词,那么目标关键词可以包括关键词A、关键词B以及关键词A是关键词B的上位关键词,或者目标关键词可以包括关键词A、关键词B以及关键词C。
可选地,在本实施例中,关键词之间上下位关系可以但不限于用于表示关键词所在领域的从属关系。关键词1是关键词2的上位关键词可以但不限于表示关键词2所属的领域是关键词1所属领域的子领域。比如:猫科动物、老虎和东北虎,老虎所属的领域是猫科动物所属领域的子领域,东北虎所属的领域是老虎所属领域的子领域。
可选地,在本实施例中,多个信息类别可以用于表示关键词的领域(例如:天气、地理、历史等等),还可以表示提问信息所传达的意图所需要实现的功能,比如:提问信息所传达的意图是希望联系客服得到售后服务,则该提问信息所属的信息类别可以为客服。通过该方式,不但可以根据提问信息将提问信息定位到对应的领域,还可以精确识别提问信息所表达的意图,从而为用户提供多种功能的服务。
在一个可选的实施方式中,以游戏客户端中的问答系统为例,如图4 所示,接收到玩家的输入的目标提问信息:“如何打开三界副本?”时,对该目标提问信息进行过滤处理,过滤掉标点,虚词副词等不重要的词,得到一个完整的词序列“如何,打开,三界,副本”。然后根据词语的上下位关系去获得和查询和这些词最相关的词“三界副本”,这些词进入到AIML的解释器(interpreter)中,最终确定玩家的目的是想获得打开三界副本的方法,把上述目标提问信息定位到了“三界副本”这个信息类别 (topic)上,从三界副本对应的知识库中检索对应的答复信息。将获取的目标答复信息“三界副本简介”、“三界副本进入方式”、“三界副本通关攻略”等信息显示在客户端的显示界面上。
可见,通过上述步骤,将具有对应关系的提问信息和答复信息按照提问信息的信息类别划分为多个信息分组,在对目标提问信息对应的目标答复信息进行获取时,首先确定目标提问信息所属的目标信息类别,在从该目标信息类别对应的目标信息分组中获取目标提问信息对应的目标答复信息,从而能够准确定位目标提问信息的提问意图,将目标提问信息定位到相同意图对应的目标信息类别上,再从目标信息类别对应的目标信息分组中获取目标答复信息,从而避免了查询大量的QA-pairs模板,提高了获取答复信息的效率,进而解决了相关技术中获取答复信息的效率较低的技术问题。
作为一种可选的方案,根据目标关键词在多个信息类别中确定目标提问信息所属的目标信息类别包括:
S1,从多个信息类别中查找目标关键词中每个关键词所属的信息类别;
S2,将目标关键词中每个关键词所属的信息类别确定为目标提问信息所属的目标信息类别。
可选地,在本实施例中,可以将目标关键词中每个关键词对应的信息类别确定为目标提问信息对应的目标信息类别,从而实现对目标提问信息表达意图的定位。
可选地,在本实施例中,目标关键词中每个关键词所属的信息类别可能会具有一定的关系,那么可以根据这些关系对目标关键词中每个关键词所属的信息类别进行合并。比如:如果两个词所属的信息类别为上下位关系,则可以筛除掉上位的词所属的信息类别,仅将下位词所属的信息类别作为目标信息类别。或者也可以筛除掉下位的词所属的信息类别,仅将上位词所属的信息类别作为目标信息类别。从而控制对目标提问信息定位时的范围。
作为一种可选的方案,从多个信息分组中的目标信息分组中获取目标提问信息对应的目标答复信息包括:
S1,获取目标信息类别对应的目标标签,其中,目标标签用于标识目标信息类别;
S2,从具有对应关系的标签和信息分组中获取目标标签对应的目标信息分组;
S3,从目标信息分组的每个信息分组中分别查找目标提问信息对应的答复信息;
S4,将目标提问信息在每个信息分组中对应的答复信息合并为目标答复信息。
可选地,在本实施例中,可以为各个信息类别分配对应的标签来标识信息类别,并建立标签与信息分组之间的对应关系,在确定了目标提问信息的目标信息类别后,可以根据目标信息类别对应的标签获取目标信息分组。
可选地,在本实施例中,目标信息分组可以为一个或者多个信息分组。如果目标信息分组为多个,可以从各个目标信息分组中分别获取到目标提问信息对应的各个答复信息,再将各个答复信息合并成目标答复信息。
作为一种可选的方案,根据客户端获取到的目标提问信息确定与目标提问信息对应的目标关键词包括:
S1,从目标提问信息中提取第一关键词,得到包括第一关键词的词序列;
S2,从知识图谱中获取词序列对应的关系序列,其中,知识图谱以多个信息类别为节点,知识图谱用于记录节点之间的上下位关系,关系序列用于指示第一关键词之间的上下位关系;
S3,确定目标关键词包括词序列和关系序列。
可选地,在本实施例中,从目标提问信息中提取第一关键词的过程可以包括预处理过程,分词过程和关键词确定过程以及词序列的生成过程,通过预处理过程对目标提问信息进行预处理和清洗,从而去除符号、停用词等冗余信息,再通过分词过程将目标提问信息分解成不同粒度的词语,通过关键词确定过程从不同粒度的词语中提取合适的词语作为第一关键词,通过词序列的生成过程使用确定的第一关键词生成词序列。例如:用户输入一句话后,经过数据预处理和清洗过程,去掉特殊符号、停用词,利用隐马尔科夫模型(HMM)+条件随机场(CRF)的概率标注模型得到词序列。
可选地,在本实施例中,可以通过知识图谱的方式记录多个信息类别之间的上下位关系。例如:如图5所示,知识图谱以多个信息类别(信息类别A、信息类别B、信息类别C、信息类别D、信息类别E、信息类别 F、信息类别G)为节点,通过各节点之间的连接关系来表示信息类别之前的上下位关系,例如使用箭头连接关联的两个信息类别,其中,箭头起点的信息类别是箭头终点的信息类别的上位信息类别,箭头终点的信息类别是箭头起点的信息类别的下位信息类别。信息类别A的下位信息类别包括信息类别B、信息类别C和信息类别D,信息类别B的下位信息类别包括信息类别E,信息类别C的下位信息类别包括信息类别F和信息类别G。
可选地,在本实施例中,用于标识信息类别的标签可以但不限于为人工智能标记语言(AIML)中的标签,标签与信息类别之间具有对应关系,获取到词序列所属的第一信息类别和关系序列所属的第二信息类别之后,可以获取到第一信息类别对应的第一标签和第二信息类别对应的第二标签,使用第一标签和第二标签来精确指示目标提问信息所表达的意图,将第一标签和第二标签添加到AIML文件中,通过执行该AIML文件调用第一标签对应的第一信息分组得到第一答复信息,并调用第二标签对应的第二信息分组得到第二答复信息,将第一答复信息和第二答复信息合并成目标答复信息。
例如:获取词序列在多个信息类别中所属的第一信息类别,并获取关系序列在多个信息类别中所属的第二信息类别,获取第一信息类别对应的第一标签,并获取第二信息类别对应的第二标签,生成携带有第一标签和第二标签的人工智能标记语言文件,执行人工智能标记语言文件,从第一标签对应的第一信息分组中查找目标提问信息对应的第一答复信息,并从第二标签对应的第二信息分组中查找目标提问信息对应的第二答复信息;将第一答复信息和第二答复信息合并,得到目标答复信息。
可选地,在本实施例中,标签可以但不限于用于表示AIML文件能够实现的功能,例如:天气,数据库,笑话,成语,客服,上下文,时间,递归,记忆,知识等功能。举例来说,天气功能可以用来查询天气,客服功能可以用来连接客服系统,上下文功能可以用于进行上下文分析等等,其他功能与此类似,在此不再赘述。
需要说明的是,本实施例中标签能够实现的以上功能指示一种示例,其他功能(比如:历史、美食、影讯、音乐、影视、娱乐、游戏等等)也可以进行配置,本实施例对此不作限定。
作为一种可选的方案,在从多个信息分组中的目标信息分组中未获取到目标提问信息对应的目标答复信息的情况下,还包括:
S1,将目标提问信息输入到预定信息分组中;
S2,获取预定信息分组输出的目标提问信息对应的多个答复信息;
S3,从多个答复信息中获取满足目标条件的答复信息,并将满足目标条件的答复信息确定为目标答复信息。
可选地,在本实施例中,如果在目标信息分组中没有命中目标答复信息,则可以通过预定信息分组中的深度学习模型来获取目标答复信息。
可选地,在本实施例中,通过深度学习模型获取的目标提问信息对饮的答复信息可以为多个,再在这多个答复信息中找出满足目标条件的答复信息作为目标答复信息。
作为一种可选的方案,从多个答复信息中获取满足目标条件的答复信息包括:
S1,获取多个答复信息中每个答复信息与目标提问信息之间的相关度;
S2,将多个答复信息中对应的相关度最高的目标数量的答复信息确定为满足目标条件的答复信息。
可选地,在本实施例中,可以按照每个答复信息与目标提问信息之间的相关度对多个答复信息进行排序,将相关度最高的几个答复信息作为满足目标条件的答复信息。
可选地,在本实施例中,还可以实现学习更新的功能,例如:可以检测用户在多个满足条件的信息中选择的答复信息,并建立目标提问信息与该答复信息的对应关系记录在目标提问信息所属的目标信息类别对应的目标信息分组中。从而在下一次获取到与目标提问信息类似的提问信息时将该答复信息作为目标答复信息。
作为一种可选的方案,在从多个信息分组中的目标信息分组中获取目标提问信息对应的目标答复信息之后,还包括:
S1,将目标答复信息传输给客户端,以指示客户端在客户端的显示界面上显示目标答复信息;或者,
S2,在客户端的显示界面上显示目标答复信息。
可选地,在本实施例中,上述答复信息的获取方法的执行主体可以是服务器,也可以是客户端。在获取到目标答复信息之后,可以将目标答复信息显示在客户端上。如果由服务器获取目标答复信息,那么服务器可以将目标答复信息传输给客户端,以指示客户端在客户端的显示界面上显示目标答复信息,并由客户端将其显示在显示界面上。如果由客户端获取目标答复信息,那么客户端可以在显示界面上显示获取到的该目标答复信息。
可选地,在本实施例中,上述答复信息的获取方法还可以是由客户端和服务器交互执行的。比如:由客户端获取目标提问信息,并根据获取到的目标提问信息确定与目标提问信息对应的目标关键词。客户端将目标关键词发送给服务器,服务器根据目标关键词在多个信息类别中确定目标提问信息所属的目标信息类别,并从多个信息分组中的目标信息分组中获取目标提问信息对应的目标答复信息。服务器将目标答复信息返回给客户端,由客户端将其显示在显示界面上。
需要说明的是,对于前述的各方法实施例,为了简单描述,故将其都表述为一系列的动作组合,但是本领域技术人员应该知悉,本发明并不受所描述的动作顺序的限制,因为依据本发明,某些步骤可以采用其他顺序或者同时进行。其次,本领域技术人员也应该知悉,说明书中所描述的实施例均属于优选实施例,所涉及的动作和模块并不一定是本发明所必须的。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到根据上述实施例的方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质(如 ROM/RAM、磁碟、光盘)中,包括若干指令用以使得一台终端设备(可以是手机,计算机,服务器,或者网络设备等)执行本发明各个实施例所述的方法。
根据本发明实施例的另一个方面,还提供了一种用于实施上述答复信息的获取方法的答复信息的获取装置,如图6所示,该装置包括:
1)第一确定模块62,用于根据客户端获取到的目标提问信息确定与目标提问信息对应的目标关键词;
2)第二确定模块64,用于根据目标关键词在多个信息类别中确定目标提问信息所属的目标信息类别;
3)第一获取模块66,用于从多个信息分组中的目标信息分组中获取目标提问信息对应的目标答复信息,其中,目标信息分组中包括多对具有对应关系的提问信息和答复信息,目标信息分组中包括的提问信息属于目标信息类别。
可选地,在本实施例中,上述答复信息的获取方法可以应用于如图2 所示的客户端202和服务器204所构成的硬件环境中。如图2所示,客户端202获取用户输入的目标提问信息,将该目标提问信息显示在显示界面上并将该目标提问信息发送至服务器204。服务器204根据该目标提问信息确定与目标提问信息对应的目标关键词,根据目标关键词在多个信息类别中确定目标提问信息所属的目标信息类别,从多个信息分组中的目标信息分组中获取目标提问信息对应的目标答复信息,其中,目标信息分组中包括多对具有对应关系的提问信息和答复信息,目标信息分组中包括的提问信息属于目标信息类别。服务器204将获取到的目标答复信息返回给客户端202。客户端202将服务器204返回的目标答复信息显示在上述显示界面上。
可选地,在本实施例中,上述答复信息的获取装置可以应用于如图3 所示的目标设备302所构成的硬件环境中。如图3所示,目标设备302上配置了接收装置304、显示器306和处理器306。接收装置304获取用户输入的目标提问信息,将该目标提问信息显示在显示器306上并将该目标提问信息发送至处理器306。处理器306根据该目标提问信息确定与目标提问信息对应的目标关键词,根据目标关键词在多个信息类别中确定目标提问信息所属的目标信息类别,从多个信息分组中的目标信息分组中获取目标提问信息对应的目标答复信息,其中,目标信息分组中包括多对具有对应关系的提问信息和答复信息,目标信息分组中包括的提问信息属于目标信息类别。处理器306将获取到的目标答复信息发送给显示器306。显示器306将该目标答复信息显示在屏幕上。
可选地,在本实施例中,上述答复信息的获取装置可以但不限于应用于获取提问信息对应的答复信息的场景中。其中,上述客户端可以但不限于为各种类型的应用,例如,在线教育应用、即时通讯应用、社区空间应用、游戏应用、购物应用、浏览器应用、金融应用、多媒体应用、直播应用等。具体的,可以但不限于应用于在上述游戏应用中获取提问信息对应的答复信息的场景中,或还可以但不限于应用于在上述购物应用中获取提问信息对应的答复信息的场景中,以提高获取答复信息的效率。上述仅是一种示例,本实施例中对此不做任何限定。
可选地,在本实施例中,目标提问信息可以但不限于为以下形式:文字信息、语音信息等等。例如:在目标提问信息为语音信息的形式的情况下,可以首先将目标提问信息的语音转换成文字信息,再根据该文字信息确定与目标提问信息对应的目标关键词,从而根据目标关键词确定目标信息类别,再在目标信息类别对应的目标信息分组中获取目标答复信息。
可选地,在本实施例中,目标提问信息对应的目标关键词可以但不限于包括从目标提问信息中提取的关键词,还可以包括根据提取的关键词生成的关键词,或者还可以包括用于表示提取的关键词之间上下位关系的信息。例如:从目标提问信息中提取的关键词包括关键词A和关键词B,还获取到关键词A是关键词B的上位关键词,并且关键词A是关键词C的上位关键词,关键词C是关键词B的上位关键词,那么目标关键词可以包括关键词A、关键词B以及关键词A是关键词B的上位关键词,或者目标关键词可以包括关键词A、关键词B以及关键词C。
可选地,在本实施例中,关键词之间上下位关系可以但不限于用于表示关键词所在领域的从属关系。关键词1是关键词2的上位关键词可以但不限于表示关键词2所属的领域是关键词1所属领域的子领域。比如:猫科动物、老虎和东北虎,老虎所属的领域是猫科动物所属领域的子领域,东北虎所属的领域是老虎所属领域的子领域。
可选地,在本实施例中,多个信息类别可以用于表示关键词的领域(例如:天气、地理、历史等等),还可以表示提问信息所传达的意图所需要实现的功能,比如:提问信息所传达的意图是希望联系客服得到售后服务,则该提问信息所属的信息类别可以为客服。通过该方式,不但可以根据提问信息将提问信息定位到对应的领域,还可以精确识别提问信息所表达的意图,从而为用户提供多种功能的服务。
在一个可选的实施方式中,以游戏客户端中的问答系统为例,如图4 所示,接收到玩家的输入的目标提问信息:“如何打开三界副本?”时,对该目标提问信息进行过滤处理,过滤掉标点,虚词副词等不重要的词,得到一个完整的词序列“如何,打开,三界,副本”。然后根据词语的上下位关系去获得和查询和这些词最相关的词“三界副本”,这些词进入到AIML的解释器(interpreter)中,最终确定玩家的目的是想获得打开三界副本的方法,把上述目标提问信息定位到了“三界副本”这个信息类别 (topic)上,从三界副本对应的知识库中检索对应的答复信息。将获取的目标答复信息“三界副本简介”、“三界副本进入方式”、“三界副本通关攻略”等信息显示在客户端的显示界面上。
可见,通过上述装置,将具有对应关系的提问信息和答复信息按照提问信息的信息类别划分为多个信息分组,在对目标提问信息对应的目标答复信息进行获取时,首先确定目标提问信息所属的目标信息类别,在从该目标信息类别对应的目标信息分组中获取目标提问信息对应的目标答复信息,从而能够准确定位目标提问信息的提问意图,将目标提问信息定位到相同意图对应的目标信息类别上,再从目标信息类别对应的目标信息分组中获取目标答复信息,从而避免了查询大量的QA-pairs模板,提高了获取答复信息的效率,进而解决了相关技术中获取答复信息的效率较低的技术问题。
作为一种可选的方案,第二确定模块包括:
1)第一查找单元,用于从多个信息类别中查找目标关键词中每个关键词所属的信息类别;
2)第一确定单元,用于将目标关键词中每个关键词所属的信息类别确定为目标提问信息所属的目标信息类别。
可选地,在本实施例中,可以将目标关键词中每个关键词对应的信息类别确定为目标提问信息对应的目标信息类别,从而实现对目标提问信息表达意图的定位。
可选地,在本实施例中,目标关键词中每个关键词所属的信息类别可能会具有一定的关系,那么可以根据这些关系对目标关键词中每个关键词所属的信息类别进行合并。比如:如果两个词所属的信息类别为上下位关系,则可以筛除掉上位的词所属的信息类别,仅将下位词所属的信息类别作为目标信息类别。或者也可以筛除掉下位的词所属的信息类别,仅将上位词所属的信息类别作为目标信息类别。从而控制对目标提问信息定位时的范围。
作为一种可选的方案,第一获取模块包括:
1)第一获取单元,用于获取目标信息类别对应的目标标签,其中,目标标签用于标识目标信息类别;
2)第二获取单元,用于从具有对应关系的标签和信息分组中获取目标标签对应的目标信息分组;
3)第二查找单元,用于从目标信息分组的每个信息分组中分别查找目标提问信息对应的答复信息;
4)合并单元,用于将目标提问信息在每个信息分组中对应的答复信息合并为目标答复信息。
可选地,在本实施例中,可以为各个信息类别分配对应的标签来标识信息类别,并建立标签与信息分组之间的对应关系,在确定了目标提问信息的目标信息类别后,可以根据目标信息类别对应的标签获取目标信息分组。
可选地,在本实施例中,目标信息分组可以为一个或者多个信息分组。如果目标信息分组为多个,可以从各个目标信息分组中分别获取到目标提问信息对应的各个答复信息,再将各个答复信息合并成目标答复信息。
作为一种可选的方案,第一确定模块包括:
1)提取单元,用于从目标提问信息中提取第一关键词,得到包括第一关键词的词序列;
2)第三获取单元,用于从知识图谱中获取词序列对应的关系序列,其中,知识图谱以多个信息类别为节点,知识图谱用于记录节点之间的上下位关系,关系序列用于指示第一关键词之间的上下位关系;
3)第二确定单元,用于确定目标关键词包括词序列和关系序列。
可选地,在本实施例中,从目标提问信息中提取第一关键词的过程可以包括预处理过程,分词过程和关键词确定过程以及词序列的生成过程,通过预处理过程对目标提问信息进行预处理和清洗,从而去除符号、停用词等冗余信息,再通过分词过程将目标提问信息分解成不同粒度的词语,通过关键词确定过程从不同粒度的词语中提取合适的词语作为第一关键词,通过词序列的生成过程使用确定的第一关键词生成词序列。例如:用户输入一句话后,经过数据预处理和清洗过程,去掉特殊符号、停用词,利用隐马尔科夫模型(HMM)+条件随机场(CRF)的概率标注模型得到词序列。
可选地,在本实施例中,可以通过知识图谱的方式记录多个信息类别之间的上下位关系。例如:如图5所示,知识图谱以多个信息类别(信息类别A、信息类别B、信息类别C、信息类别D、信息类别E、信息类别 F、信息类别G)为节点,通过各节点之间的连接关系来表示信息类别之前的上下位关系,例如使用箭头连接关联的两个信息类别,其中,箭头起点的信息类别是箭头终点的信息类别的上位信息类别,箭头终点的信息类别是箭头起点的信息类别的下位信息类别。信息类别A的下位信息类别包括信息类别B、信息类别C和信息类别D,信息类别B的下位信息类别包括信息类别E,信息类别C的下位信息类别包括信息类别F和信息类别G。
可选地,在本实施例中,用于标识信息类别的标签可以但不限于为人工智能标记语言(AIML)中的标签,标签与信息类别之间具有对应关系,获取到词序列所属的第一信息类别和关系序列所属的第二信息类别之后,可以获取到第一信息类别对应的第一标签和第二信息类别对应的第二标签,使用第一标签和第二标签来精确指示目标提问信息所表达的意图,将第一标签和第二标签添加到AIML文件中,通过执行该AIML文件调用第一标签对应的第一信息分组得到第一答复信息,并调用第二标签对应的第二信息分组得到第二答复信息,将第一答复信息和第二答复信息合并成目标答复信息。
例如:第二确定模块用于:获取词序列在多个信息类别中所属的第一信息类别,并获取关系序列在多个信息类别中所属的第二信息类别;获取模块用于:获取第一信息类别对应的第一标签,并获取第二信息类别对应的第二标签;生成携带有第一标签和第二标签的人工智能标记语言文件;执行人工智能标记语言文件,从第一标签对应的第一信息分组中查找目标提问信息对应的第一答复信息,并从第二标签对应的第二信息分组中查找目标提问信息对应的第二答复信息;将第一答复信息和第二答复信息合并,得到目标答复信息。
可选地,在本实施例中,标签可以但不限于用于表示AIML文件能够实现的功能,例如:天气,数据库,笑话,成语,客服,上下文,时间,递归,记忆,知识等功能。举例来说,天气功能可以用来查询天气,客服功能可以用来连接客服系统,上下文功能可以用于进行上下文分析等等,其他功能与此类似,在此不再赘述。
需要说明的是,本实施例中标签能够实现的以上功能指示一种示例,其他功能(比如:历史、美食、影讯、音乐、影视、娱乐、游戏等等)也可以进行配置,本实施例对此不作限定。
作为一种可选的方案,在从多个信息分组中的目标信息分组中未获取到目标提问信息对应的目标答复信息的情况下,装置还包括:
1)输入模块,用于将目标提问信息输入到预定信息分组中;
2)第二获取模块,用于获取预定信息分组输出的目标提问信息对应的多个答复信息;
3)第三获取模块,用于从多个答复信息中获取满足目标条件的答复信息,并将满足目标条件的答复信息确定为目标答复信息。
可选地,在本实施例中,如果在目标信息分组中没有命中目标答复信息,则可以通过预定信息分组中的深度学习模型来获取目标答复信息。
可选地,在本实施例中,通过深度学习模型获取的目标提问信息对饮的答复信息可以为多个,再在这多个答复信息中找出满足目标条件的答复信息作为目标答复信息。
作为一种可选的方案,第三获取模块包括:
1)第四获取单元,用于获取多个答复信息中每个答复信息与目标提问信息之间的相关度;
2)第三确定单元,用于将多个答复信息中对应的相关度最高的目标数量的答复信息确定为满足目标条件的答复信息。
可选地,在本实施例中,可以按照每个答复信息与目标提问信息之间的相关度对多个答复信息进行排序,将相关度最高的几个答复信息作为满足目标条件的答复信息。
可选地,在本实施例中,还可以实现学习更新的功能,例如:可以检测用户在多个满足条件的信息中选择的答复信息,并建立目标提问信息与该答复信息的对应关系记录在目标提问信息所属的目标信息类别对应的目标信息分组中。从而在下一次获取到与目标提问信息类似的提问信息时将该答复信息作为目标答复信息。
作为一种可选的方案,上述装置还包括:
1)传输模块,用于将目标答复信息传输给客户端,以指示客户端在客户端的显示界面上显示目标答复信息;或者,
2)显示模块,用于在客户端的显示界面上显示目标答复信息。
可选地,在本实施例中,上述答复信息的获取装置可以设置在服务器上,也可以设置在客户端上。在获取到目标答复信息之后,可以将目标答复信息显示在客户端上。如果由服务器获取目标答复信息,那么服务器可以将目标答复信息传输给客户端,以指示客户端在客户端的显示界面上显示目标答复信息,并由客户端将其显示在显示界面上。如果由客户端获取目标答复信息,那么客户端可以在显示界面上显示获取到的该目标答复信息。
可选地,在本实施例中,上述答复信息的获取装置还可以分别设置在客户端和服务器上。比如:由客户端获取目标提问信息,并根据获取到的目标提问信息确定与目标提问信息对应的目标关键词。客户端将目标关键词发送给服务器,服务器根据目标关键词在多个信息类别中确定目标提问信息所属的目标信息类别,并从多个信息分组中的目标信息分组中获取目标提问信息对应的目标答复信息。服务器将目标答复信息返回给客户端,由客户端将其显示在显示界面上。
本发明实施例的应用环境可以但不限于参照上述实施例中的应用环境,本实施例中对此不再赘述。本发明实施例提供了用于实施上述实时通信的连接方法的一种可选的具体应用示例。
作为一种可选的实施例,上述答复信息的获取方法可以但不限于应用于如图7所示的获取提问信息对应的答复信息的场景中。在本场景中,利用了重构规则模板的AIML模块来解决垂直领域识别NLU困难的问题。本场景中提供的规则NLU解析系统包括以下三个模块:
1)AIML 1.0-2.0模块:该模块基于常见的4个AIML标签构成, <aiml><category><pattern><template>构成了XML-extend文本库,利用标签实现最基本的正则匹配。pattern作为关键key的输入,template作为回答模板的生成。垂直领域的QA-pairs分别对应AIML的pattern和template。
2)AIML 3.0模块:该模块新增了多个标签,涉及天气,数据库,笑话,成语,客服,上下文,时间,递归,记忆,知识等标签,并封装了知识图谱和深度学习的标签模块,使AIML3.0具有了真正意义上处理中文 NLU的能力,尤其是记忆和上下文语义理解的功能,可以应用到任何垂直领域的智能客服NLU系统。
3)结果输出模块:本系统采用跳表的形式,采用了跳跃式查找的方式使得插入查找标签数据的复杂度大大降低,在1亿级别的数据中,单机单线程做到了平均0.12S的效果。
本系统利用AIML3.0自定义标签的特性,可以解决小样本数据的问题,作为一种半生成式人工智能标记语言,本方案可以通过很少的精准的样本去生成质量较高的大量样本,同时利用语义标签去实现相关的上下文语义理解。
可选地,在本场景中,上述系统基于HMM+CRF算法对获取的目标提问信息进行中文分词。当用户输入一句话后,经过数据预处理,去除停用词,并进行分词处理,得到一系列的词序列,利用空间向量表示和句子依存分析树可以生成相应的AIML模板。
可选地,在本场景中,上述AIML 3.0模块大大扩展了AIML本身的功能。本方案构建了一个知识图谱(Graph master),每个AIML标签对应一个节点(node),每个标签负责一个功能模块,构成AIML对应的解释器(interpreter),interpreter在获得用户的词序列后,去遍历最相似的模板,返回给用户答复信息。
在本场景中,本系统可以利用功能齐全的标签去覆盖和组合生成复杂的标签interpreter去解决大部分的NLU问题。例如:在手游游戏问答系统场景下,当获得用户输入的目标提问信息后,经过数据预处理得到相应的词序列,通过模型计算出使用概率最高的top3词语,去匹配对应的标签,返回相应的答复信息,把NLU语义理解问题变成了正则检索问题,在垂直领域场景下取得了明显的效果。本系统还将知识图谱封装为标签模块,在得到用户输入词序列时,会去检索对应的图数据库和三元组,得到更精准的用户意图,很大程度上避免了歧义问题。
可选地,在本场景中,上述系统还包括:深度学习模块,该模块采用了seq2seq的框架,AIML 1.0-2.0模块以及AIML 3.0模块还没有解决的 NLU问题,会交给深度学习模块来解决。深度学习模块采用卷积神经网络(CNN)+长短期记忆网络(LSTM)的模型框架,通过CNN模型实现对Char字符级别的高辨识度,配合LSTM的序列标注模型,对NLU任务进行处理。
在一个可选的实施方式中,如图7所示,用户输入一句话后,经常数据预处理模块,去掉特殊符号和停用词,并利用HMM+CRF的概率标注模型得到词序列。同时查询图数据库,根据知识图谱记录的上下位关系获得更精确的词序列和关系序列,然后利用AIML1.0+2.0+3.0模块得到了用户的精确意图,然后在interpreter1.0-3.0中检索返回答案,如果没有检索到相应的答案,通过深度学习模型返回相关度最高的3个答案。
通过上述系统吗,解决了机器学习和深度学习方法解决NLU需要大量数据的问题,同时准确率和召回率得到了明显的提升。此外,功能可定制化,灵活应用于各个垂直领域场景。
可选的,在本实施例中,上述系统可以应用于如图8所示的由各业务客户端web端、中心服务器和规则NLU解析模块构成的硬件场景中,上述规则NLU解析系统布置于规则NLU解析模块中。各业务客户端web 端向中心服务端发起请求以请求获取目标提问信息对应的答复信息,中心服务端做分布式调度,然后向规则NLU解析模块提供的接口发送该请求,请求中携带有目标提问信息和客户端ID。规则NLU解析模块可以设置于 java MVC框架中,服务器端收到目标提问信息和客户端ID后,去调用java MVC框架中的规则NLU解析模块获取目标答复信息,如果未能获取到目标答复信息则可以调用深度学习框架模型,得到相关度最高的3个答案作为结果返回给规则NLU解析模块。规则NLU解析模块接口处理完毕,以json的形式返回中心服务端,然后中心服务器根据缓存和话语过滤模块返回给客户端,用户得到对应的答案。
可选地,上述规则NLU解析模块的程序可以部署在目标服务器上,目标服务器可以使用如下配置参数:Intel(R)Xeon(R)CPU E5-2620v3,40G 内存。深度学习模块可以基于python,调用tensorflow检测模块,配置了深度学习模块的服务器的配置参数可以为Intel(R)Xeon(R)CPU E5-2620 v3,60G内存,512SSD。
通过上述系统,解决了垂直领域问答系统NLU识别难和精度不高的问题,弥补了机器学习和深度学习解决NLU问题的不足,对问答系统的准确率和召回率有了明显的提高。
根据本发明实施例的又一个方面,还提供了一种用于实施上述答复信息的获取的电子装置,如图9所示,该电子装置包括:一个或多个(图中仅示出一个)处理器902、存储器904、传感器906、编码器908以及传输装置910,该存储器中存储有计算机程序,该处理器被设置为通过计算机程序执行上述任一项方法实施例中的步骤。
可选地,在本实施例中,上述电子装置可以位于计算机网络的多个网络设备中的至少一个网络设备。
可选地,在本实施例中,上述处理器可以被设置为通过计算机程序执行以下步骤:
S1,根据客户端获取到的目标提问信息确定与目标提问信息对应的目标关键词;
S2,根据目标关键词在多个信息类别中确定目标提问信息所属的目标信息类别;
S3,从多个信息分组中的目标信息分组中获取目标提问信息对应的目标答复信息,其中,目标信息分组中包括多对具有对应关系的提问信息和答复信息,目标信息分组中包括的提问信息属于目标信息类别。
可选地,本领域普通技术人员可以理解,图9所示的结构仅为示意,电子装置也可以是智能手机(如Android手机、iOS手机等)、平板电脑、掌上电脑以及移动互联网设备(Mobile Internet Devices,MID)、PAD等终端设备。图9其并不对上述电子装置的结构造成限定。例如,电子装置还可包括比图9中所示更多或者更少的组件(如网络接口、显示装置等),或者具有与图9所示不同的配置。
其中,存储器902可用于存储软件程序以及模块,如本发明实施例中的答复信息的获取方法和装置对应的程序指令/模块,处理器904通过运行存储在存储器902内的软件程序以及模块,从而执行各种功能应用以及数据处理,即实现上述的目标组件的控制方法。存储器902可包括高速随机存储器,还可以包括非易失性存储器,如一个或者多个磁性存储装置、闪存、或者其他非易失性固态存储器。在一些实例中,存储器902可进一步包括相对于处理器904远程设置的存储器,这些远程存储器可以通过网络连接至终端。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。
上述的传输装置910用于经由一个网络接收或者发送数据。上述的网络具体实例可包括有线网络及无线网络。在一个实例中,传输装置910包括一个网络适配器(NetworkInterface Controller,NIC),其可通过网线与其他网络设备与路由器相连从而可与互联网或局域网进行通讯。在一个实例中,传输装置910为射频(Radio Frequency,RF)模块,其用于通过无线方式与互联网进行通讯。
其中,具体地,存储器902用于存储应用程序。
本发明的实施例还提供了一种存储介质,该存储介质中存储有计算机程序,其中,该计算机程序被设置为运行时执行上述任一项方法实施例中的步骤。
可选地,在本实施例中,上述存储介质可以被设置为存储用于执行以下步骤的计算机程序:
S1,根据客户端获取到的目标提问信息确定与目标提问信息对应的目标关键词;
S2,根据目标关键词在多个信息类别中确定目标提问信息所属的目标信息类别;
S3,从多个信息分组中的目标信息分组中获取目标提问信息对应的目标答复信息,其中,目标信息分组中包括多对具有对应关系的提问信息和答复信息,目标信息分组中包括的提问信息属于目标信息类别。
可选地,存储介质还被设置为存储用于执行上述实施例中的方法中所包括的步骤的计算机程序,本实施例中对此不再赘述。
可选地,在本实施例中,本领域普通技术人员可以理解上述实施例的各种方法中的全部或部分步骤是可以通过程序来指令终端设备相关的硬件来完成,该程序可以存储于一计算机可读存储介质中,存储介质可以包括:闪存盘、只读存储器(Read-Only Memory,ROM)、随机存取器(Random Access Memory,RAM)、磁盘或光盘等。
上述本发明实施例序号仅仅为了描述,不代表实施例的优劣。
上述实施例中的集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在上述计算机可读取的存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在存储介质中,包括若干指令用以使得一台或多台计算机设备(可为个人计算机、服务器或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。
在本发明的上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述的部分,可以参见其他实施例的相关描述。
在本申请所提供的几个实施例中,应该理解到,所揭露的客户端,可通过其它的方式实现。其中,以上所描述的装置实施例仅仅是示意性的,例如所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,单元或模块的间接耦合或通信连接,可以是电性或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
以上所述仅是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本发明的保护范围。

Claims (12)

1.一种答复信息的获取方法,其特征在于,包括:
根据客户端获取到的目标提问信息确定与所述目标提问信息对应的词序列和关系序列,其中,所述词序列为从所述目标提问信息中提取的第一关键词,所述关系序列用于指示第一关键词之间的上下位关系;
获取所述词序列在多个信息类别中所属的信息类别,根据获取到的所述信息类别之间具有的上下位关系合并获取到的所述信息类别,确定所述词序列在多个信息类别中所属的第一信息类别;获取所述关系序列在所述多个信息类别中所属的第二信息类别;根据所述第一信息类别和所述第二信息类别确定所述目标提问信息所属的目标信息类别;获取所述第一信息类别对应的第一标签;获取所述第二信息类别对应的第二标签;根据所述第一标签和所述第二标签确定所述目标信息类别对应的目标标签,其中,所述目标标签用于标识所述目标信息类别;
从具有对应关系的标签和信息分组中获取所述第一标签对应的第一信息分组,获取所述第二标签对应的第二信息分组,根据所述第一信息分组和所述第二信息分组确定所述目标标签对应的目标信息分组,其中,所述目标信息分组中包括多对具有对应关系的提问信息和答复信息,所述目标信息分组中包括的所述提问信息属于所述目标信息类别;
从所述第一标签对应的第一信息分组中查找所述目标提问信息对应的第一答复信息,从所述第二标签对应的第二信息分组中查找所述目标提问信息对应的第二答复信息;将所述第一答复信息和所述第二答复信息合并,得到目标答复信息。
2.根据权利要求1所述的方法,其特征在于,根据客户端获取到的目标提问信息确定与所述目标提问信息对应的词序列和关系序列包括:
从所述目标提问信息中提取第一关键词,得到包括所述第一关键词的词序列;
从知识图谱中获取所述词序列对应的关系序列,其中,所述知识图谱以所述多个信息类别为节点,所述知识图谱用于记录所述节点之间的上下位关系,所述关系序列用于指示所述第一关键词之间的上下位关系。
3.根据权利要求1所述的方法,其特征在于,
从多个信息分组中的所述第一信息分组和第二信息分组中获取所述目标提问信息对应的所述目标答复信息包括:获取所述第一信息类别对应的第一标签,并获取所述第二信息类别对应的第二标签;生成携带有所述第一标签和所述第二标签的人工智能标记语言文件;执行所述人工智能标记语言文件,从所述第一标签对应的第一信息分组中查找所述目标提问信息对应的第一答复信息,并从所述第二标签对应的第二信息分组中查找所述目标提问信息对应的第二答复信息;将所述第一答复信息和所述第二答复信息合并,得到所述目标答复信息。
4.根据权利要求1所述的方法,其特征在于,在从多个信息分组中的目标信息分组中未获取到所述目标提问信息对应的目标答复信息的情况下,所述方法还包括:
将所述目标提问信息输入到预定信息分组中;
获取所述预定信息分组输出的所述目标提问信息对应的多个答复信息;
从所述多个答复信息中获取满足目标条件的答复信息,并将所述满足目标条件的答复信息确定为所述目标答复信息。
5.根据权利要求4所述的方法,其特征在于,从所述多个答复信息中获取满足目标条件的答复信息包括:
获取所述多个答复信息中每个答复信息与所述目标提问信息之间的相关度;
将所述多个答复信息中对应的所述相关度最高的目标数量的答复信息确定为所述满足目标条件的答复信息。
6.根据权利要求1至5中任一项所述的方法,其特征在于,其中,在从多个信息分组中的目标信息分组中获取所述目标提问信息对应的目标答复信息之后,还包括:
将所述目标答复信息传输给所述客户端,以指示所述客户端在所述客户端的显示界面上显示所述目标答复信息;或者,
在所述客户端的显示界面上显示所述目标答复信息。
7.一种答复信息的获取装置,其特征在于,包括:
第一确定模块,用于根据客户端获取到的目标提问信息确定与所述目标提问信息对应的词序列和关系序列,其中,所述词序列为从所述目标提问信息中提取的第一关键词,所述关系序列用于指示第一关键词之间的上下位关系;
第二确定模块,用于获取所述词序列在多个信息类别中所属的信息类别,根据获取到的所述信息类别之间具有的上下位关系合并获取到的所述信息类别,确定所述词序列在多个信息类别中所属的第一信息类别;获取所述关系序列在所述多个信息类别中所属的第二信息类别;根据所述第一信息类别和所述第二信息类别确定所述目标提问信息所属的目标信息类别;获取所述第一信息类别对应的第一标签;获取所述第二信息类别对应的第二标签;根据所述第一标签和所述第二标签确定所述目标信息类别对应的目标标签,其中,所述目标标签用于标识所述目标信息类别;
第一获取模块,用于从所述第一标签对应的第一信息分组中查找所述目标提问信息对应的第一答复信息,从所述第二标签对应的第二信息分组中查找所述目标提问信息对应的第二答复信息;将所述第一答复信息和所述第二答复信息合并,得到目标答复信息。
8.根据权利要求7所述的装置,其特征在于,其中,所述第二确定模块包括:
第一查找单元,用于从所述多个信息类别中查找所述词序列中每个关键词所属的信息类别;
第一确定单元,用于将所述词序列中所述每个关键词所属的信息类别确定为所述目标提问信息所属的所述目标信息类别。
9.根据权利要求7所述的装置,其特征在于,所述第一确定模块包括:
提取单元,用于从所述目标提问信息中提取第一关键词,得到包括所述第一关键词的词序列;
第三获取单元,用于从知识图谱中获取所述词序列对应的关系序列,其中,所述知识图谱以所述多个信息类别为节点,所述知识图谱用于记录所述节点之间的上下位关系,所述关系序列用于指示所述第一关键词之间的上下位关系。
10.根据权利要求7所述的装置,其特征在于,在从多个信息分组中的目标信息分组中未获取到所述目标提问信息对应的目标答复信息的情况下,所述装置还包括:
输入模块,用于将所述目标提问信息输入到预定信息分组中;
第二获取模块,用于获取所述预定信息分组输出的所述目标提问信息对应的多个答复信息;
第三获取模块,用于从所述多个答复信息中获取满足目标条件的答复信息,并将所述满足目标条件的答复信息确定为所述目标答复信息。
11.一种存储介质,其特征在于,所述存储介质中存储有计算机程序,其中,所述计算机程序被设置为运行时执行所述权利要求1至6任一项中所述的方法。
12.一种电子装置,包括存储器和处理器,其特征在于,所述存储器中存储有计算机程序,所述处理器被设置为通过所述计算机程序执行所述权利要求1至6任一项中所述的方法。
CN201810215381.3A 2018-03-15 2018-03-15 答复信息的获取方法及装置 Active CN108595494B (zh)

Priority Applications (3)

Application Number Priority Date Filing Date Title
CN201810215381.3A CN108595494B (zh) 2018-03-15 2018-03-15 答复信息的获取方法及装置
PCT/CN2019/074185 WO2019174428A1 (zh) 2018-03-15 2019-01-31 答复信息的获取方法及装置
US16/895,992 US20200301954A1 (en) 2018-03-15 2020-06-08 Reply information obtaining method and apparatus

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810215381.3A CN108595494B (zh) 2018-03-15 2018-03-15 答复信息的获取方法及装置

Publications (2)

Publication Number Publication Date
CN108595494A CN108595494A (zh) 2018-09-28
CN108595494B true CN108595494B (zh) 2022-05-20

Family

ID=63626426

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810215381.3A Active CN108595494B (zh) 2018-03-15 2018-03-15 答复信息的获取方法及装置

Country Status (3)

Country Link
US (1) US20200301954A1 (zh)
CN (1) CN108595494B (zh)
WO (1) WO2019174428A1 (zh)

Families Citing this family (21)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108595494B (zh) * 2018-03-15 2022-05-20 腾讯科技(深圳)有限公司 答复信息的获取方法及装置
CN109635098B (zh) * 2018-12-20 2020-08-21 东软集团股份有限公司 一种智能问答方法、装置、设备及介质
CN109726279B (zh) * 2018-12-30 2021-05-18 联想(北京)有限公司 一种数据处理方法及装置
CN109840255B (zh) * 2019-01-09 2023-09-19 平安科技(深圳)有限公司 答复文本生成方法、装置、设备及存储介质
CN109977419B (zh) * 2019-04-09 2023-04-07 厦门美域中央信息科技有限公司 一种知识图谱构建系统
CN110413739B (zh) * 2019-08-01 2021-11-12 思必驰科技股份有限公司 用于口语语义理解的数据增强方法及系统
CN110597952A (zh) * 2019-08-20 2019-12-20 深圳壹账通智能科技有限公司 信息处理方法、服务器及计算机存储介质
CN110929027B (zh) * 2019-09-30 2022-08-12 珠海格力电器股份有限公司 提示系统、提示方法、计算机及废物容纳装置
CN110826341A (zh) * 2019-11-26 2020-02-21 杭州微洱网络科技有限公司 一种基于seq2seq模型的语义相似度计算方法
CN111311308A (zh) * 2020-01-19 2020-06-19 深圳市云歌人工智能技术有限公司 基于交互内容分配奖励的方法、装置以及存储介质
CN111709232A (zh) * 2020-05-22 2020-09-25 湖南映客互娱网络信息有限公司 一种直播客服队列式咨询处理方法与系统
CN111899823A (zh) * 2020-06-11 2020-11-06 上海梅斯医药科技有限公司 一种量表信息处理方法、系统、终端设备和存储介质
CN111782785B (zh) * 2020-06-30 2024-04-19 北京百度网讯科技有限公司 自动问答方法、装置、设备以及存储介质
CN112597292B (zh) * 2020-12-29 2024-04-26 招联消费金融股份有限公司 问题回复推荐方法、装置、计算机设备和存储介质
CN112765336B (zh) * 2021-01-29 2023-12-05 中国平安人寿保险股份有限公司 弹幕管理方法、装置、终端设备及存储介质
CN112883177A (zh) * 2021-02-18 2021-06-01 联想(北京)有限公司 一种智能回复方法及装置
CN112925898B (zh) * 2021-04-13 2023-07-18 平安科技(深圳)有限公司 基于人工智能的问答方法、装置、服务器及存储介质
CN113505262B (zh) * 2021-08-17 2022-03-29 深圳华声医疗技术股份有限公司 超声图像搜索方法、装置、超声设备及存储介质
CN113569580A (zh) * 2021-09-24 2021-10-29 太极计算机股份有限公司 基于语义理解的知识图谱构建方法、检索方法及其系统
CN115412745B (zh) * 2022-08-12 2024-02-27 联想(北京)有限公司 一种信息处理方法及电子设备
CN116778032B (zh) * 2023-07-03 2024-04-16 北京博思创成技术发展有限公司 答题卡生成方法、装置、设备和存储介质

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103902652A (zh) * 2014-02-27 2014-07-02 深圳市智搜信息技术有限公司 自动问答系统
CN106682030A (zh) * 2015-11-10 2017-05-17 阿里巴巴集团控股有限公司 信息处理方法及装置
CN107193811A (zh) * 2016-03-09 2017-09-22 阿里巴巴集团控股有限公司 信息处理方法及装置
CN107301213A (zh) * 2017-06-09 2017-10-27 腾讯科技(深圳)有限公司 智能问答方法及装置

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8086443B2 (en) * 2007-08-24 2011-12-27 Siemens Medical Solutions Usa, Inc. System and method for text tagging and segmentation using a generative/discriminative hybrid hidden markov model
CN104376045A (zh) * 2014-10-24 2015-02-25 北京奇虎科技有限公司 一种基于搜索场景实现问答的方法和装置
US10229188B2 (en) * 2015-12-04 2019-03-12 International Business Machines Corporation Automatic corpus expansion using question answering techniques
CN106649258A (zh) * 2016-09-22 2017-05-10 北京联合大学 一种智能的问答系统
CN106802941B (zh) * 2016-12-30 2019-12-03 网易(杭州)网络有限公司 一种答复信息的生成方法和设备
CN108595494B (zh) * 2018-03-15 2022-05-20 腾讯科技(深圳)有限公司 答复信息的获取方法及装置

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103902652A (zh) * 2014-02-27 2014-07-02 深圳市智搜信息技术有限公司 自动问答系统
CN106682030A (zh) * 2015-11-10 2017-05-17 阿里巴巴集团控股有限公司 信息处理方法及装置
CN107193811A (zh) * 2016-03-09 2017-09-22 阿里巴巴集团控股有限公司 信息处理方法及装置
CN107301213A (zh) * 2017-06-09 2017-10-27 腾讯科技(深圳)有限公司 智能问答方法及装置

Also Published As

Publication number Publication date
CN108595494A (zh) 2018-09-28
US20200301954A1 (en) 2020-09-24
WO2019174428A1 (zh) 2019-09-19

Similar Documents

Publication Publication Date Title
CN108595494B (zh) 答复信息的获取方法及装置
CN108304439B (zh) 一种语义模型优化方法、装置及智能设备、存储介质
CN111859160B (zh) 一种基于图神经网络会话序列推荐方法及系统
CN107862553A (zh) 广告实时推荐方法、装置、终端设备及存储介质
CN110597962B (zh) 搜索结果展示方法、装置、介质及电子设备
CN106997549A (zh) 一种广告信息的推送方法及系统
CN106663104A (zh) 学习和使用用于查询消歧的上下文内容检索规则
CN106126524B (zh) 信息推送方法和装置
CN109408821B (zh) 一种语料生成方法、装置、计算设备及存储介质
CN108959531A (zh) 信息搜索方法、装置、设备及存储介质
CN112084413B (zh) 一种信息推荐的方法、装置及存储介质
CN112507139B (zh) 基于知识图谱的问答方法、系统、设备及存储介质
US20230049839A1 (en) Question Answering Method for Query Information, and Related Apparatus
CN108959550B (zh) 用户关注点挖掘方法、装置、设备及计算机可读介质
CN108140055A (zh) 触发应用信息
CN112182186A (zh) 智能客服的运行方法、装置以及系统
CN114780709A (zh) 文本匹配方法、装置及电子设备
CN112966076A (zh) 智能问答问题的生成方法、装置、计算机设备及存储介质
KR20190066156A (ko) 빅데이터 및 머신러닝 기반 스마트 관광 채팅로봇 시스템
CN111813899A (zh) 基于多轮会话的意图识别方法及装置
CN116956183A (zh) 多媒体资源推荐方法、模型训练方法、装置及存储介质
CN116775815B (zh) 对话数据的处理方法、装置、电子设备及存储介质
CN110852338A (zh) 用户画像的构建方法及装置
CN111597306B (zh) 语句识别方法和装置、存储介质及电子设备
CN113821592A (zh) 一种数据处理方法、装置、设备以及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant