CN109947907A - 聊天机器人的构造、响应方法及装置、存储介质、服务器 - Google Patents

聊天机器人的构造、响应方法及装置、存储介质、服务器 Download PDF

Info

Publication number
CN109947907A
CN109947907A CN201711049821.4A CN201711049821A CN109947907A CN 109947907 A CN109947907 A CN 109947907A CN 201711049821 A CN201711049821 A CN 201711049821A CN 109947907 A CN109947907 A CN 109947907A
Authority
CN
China
Prior art keywords
corpus
block
information
layering
chat robots
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201711049821.4A
Other languages
English (en)
Inventor
顾抑扬
俞晨光
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shanghai Dig Internet Technology Co Ltd
Original Assignee
Shanghai Dig Internet Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shanghai Dig Internet Technology Co Ltd filed Critical Shanghai Dig Internet Technology Co Ltd
Priority to CN201711049821.4A priority Critical patent/CN109947907A/zh
Publication of CN109947907A publication Critical patent/CN109947907A/zh
Pending legal-status Critical Current

Links

Landscapes

  • Information Transfer Between Computers (AREA)

Abstract

一种聊天机器人的构造、响应方法及装置、存储介质、服务器,所述构造方法包括:获取对话语料,并将对话语料组织为语料块,其中,对话语料包括上下文信息和所述上下文信息对应的响应信息;对语料块进行分层,以得到层级自顶向下的多个分层语料块,每个分层语料块包括至少一个语料块,分层语料块的层级越高,其中的语料块的语义越下位;将分层语料块输入至聊天机器人;所述响应方法包括:提供聊天机器人,聊天机器人由上述构造方法构造而成;接收用户的输入信息;按照层级自顶向下的顺序,将输入信息与聊天机器人内的分层语料块进行匹配,以得到应答信息;将应答信息输出至用户。本发明技术方案解决了聊天机器人语料不足的问题,提高用户体验。

Description

聊天机器人的构造、响应方法及装置、存储介质、服务器
技术领域
本发明涉及信息处理技术领域,具体地涉及一种聊天机器人的构造、响应方法及装置、存储介质、服务器。
背景技术
近年来,在人工智能研究热潮的推动下,智能聊天机器人被定位成未来各种产品和服务的入口,已成为各相关领域公司的重点研究项目。智能问答作为人机交互的主要方式具有广泛的应用场景。
现有的聊天机器人的语料一般来自于预先录入的模板,模板依靠人工编写,丰富性和实时性比较差,从用户角度而言,相同的提问总是会获得相同的回答,体验较差。实现一个聊天机器人需要大量语料,但在实现一个特定人物形象的聊天机器人时,由于原始素材限制,往往会遇到语料不足的问题,例如,如果要实现一个西游记机器人,由于属于《西游记》剧本中的语料数量有限,扩展使用其他的语料又会导致聊天机器人性格不一致,导致无法得到满足用户聊天需求的机器人。
由上,现有的技术方案无法解决建立特定的聊天机器人时语料内容不足的问题,难以满足用户订制特定人物形象的聊天机器人的需求。
发明内容
本发明解决的技术问题是在语料内容不足时如何满足用户订制个性化聊天机器人的需求,从而提高用户体验。
为解决上述技术问题,本发明实施例提供一种聊天机器人的构造方法,所述构造方法包括:获取对话语料,并将所述对话语料组织为语料块,其中,所述对话语料包括上下文信息和所述上下文信息对应的响应信息;对所述语料块进行分层,以得到层级自顶向下的多个分层语料块,每个分层语料块包括至少一个语料块,所述分层语料块的层级越高,其中的语料块的语义越下位;将所述分层语料块输入至聊天机器人。
可选的,所述获取对话语料的步骤包括:从互联网获取资讯信息;对所述资讯信息进行清洗,以得到所述对话语料,所述清洗指的是删除所述资讯信息中的重复和冗余内容后,将所述资讯信息整理成对话格式的对话语料。
可选的,所述将所述对话语料组织为语料块包括:将来源于同一信息源的对话语料组织于同一语料块中。
为解决上述技术问题,本发明实施例还提供一种聊天机器人的响应方法,所述响应方法包括:提供聊天机器人,所述聊天机器人由上述构造方法构造而成;接收用户的输入信息;按照层级自顶向下的顺序,将所述输入信息与所述聊天机器人内的分层语料块进行匹配,以得到应答信息;将所述应答信息输出至用户。
可选的,所述按照层级自顶向下的顺序,将所述输入信息与所述聊天机器人内的分层语料块进行匹配的步骤包括:按照层级自顶向下的顺序,将所述输入信息与所述分层语料块的语料块内的上下文信息进行匹配;将与所述输入信息匹配的上下文信息对应的响应信息作为所述应答信息。
可选的,所述按照层级自顶向下的顺序,将所述输入信息与所述分层语料块的语料块内的上下文信息进行匹配包括:在最顶层层级的分层语料块的各个语料块中搜索与所述输入信息的匹配度高于预设阈值的上下文信息,如果找到,则将找到的上下文信息作为匹配的上下文信息;如果未找到,则在下一层级的分层语料块的各个语料块中搜索与所述输入信息的匹配度高于预设阈值的上下文信息,直至找到或者搜索完全部的分层语料块。
可选的,所述将所述输入信息与所述分层语料块的语料块内的上下文信息进行匹配的步骤包括:对于静态语料块,将所述输入信息与所述静态语料块中的全部对话语料进行匹配,所述静态语料块是内容不随时间改变的语料块;对于动态语料块,将所述输入信息与所述动态语料块中更新时间在预设期限内的对话语料进行匹配,所述动态语料块是内容随时间改变的语料块。
为解决上述技术问题,本发明实施例还提供一种聊天机器人的构造装置,包括:组织模块,适于获取对话语料,并将所述对话语料组织为语料块,其中,所述对话语料包括上下文信息和所述上下文的响应信息;分层模块,适于对所述语料块进行分层,以得到层级自顶向下的多个分层语料块,每个分层语料块包括至少一个所述语料块,所述分层语料块的层级越高,其中的语料块的语义越下位;构造模块,适于将所述分层语料块输入至聊天机器人。
可选的,所述组织模块包括:获取子模块,适于从互联网获取资讯信息;清洗子模块,适于对所述资讯信息进行清洗,以得到所述对话语料,所述清洗指的是删除所述资讯信息中的重复和冗余内容后,将所述资讯信息整理成对话格式的语料。
可选的,所述组织模块还包括:组织子模块,适于将来源于同一信息源的对话语料组织于同一语料块中。
为解决上述技术问题,本发明实施例还提供一种聊天机器人的响应装置,包括:提供模块,适于提供聊天机器人,所述聊天机器人由上述构造装置构造而成;接收模块,适于接收用户的输入信息;匹配模块,适于按照层级自顶向下的顺序,将所述输入信息与聊天机器人内的分层语料块进行匹配,以得到应答信息;输出模块,适于将所述应答信息输出至用户。
可选的,所述匹配模块包括:匹配子模块,适于按照层级自顶向下的顺序,将所述输入信息与所述分层语料块的语料块内的上下文信息进行匹配;确定子模块,适于将与所述输入信息匹配的上下文信息对应的响应信息作为所述应答信息。
可选的,所述匹配子模块包括:搜索单元,适于在最顶层层级的分层语料块的各个语料块中搜索与所述输入信息的匹配度高于预设阈值的上下文信息,如果找到,则所述搜索单元适于将找到的上下文信息作为匹配的上下文信息;控制单元,如果所述搜索单元未找到,则所述控制单元控制所述搜索单元在下一层级的分层语料块的各个语料块中搜索与所述输入信息的匹配度高于预设阈值的上下文信息,直至找到或者搜索完全部的分层语料块。
可选的,所述匹配子模块还包括:第一匹配单元,对于静态语料块,所述第一匹配单元适于将所述输入信息与所述静态语料块中的全部对话语料进行匹配,所述静态语料块是内容不随时间改变的语料块;第二匹配单元,对于动态语料块,所述第二匹配单元适于将所述输入信息与所述动态语料块中更新时间在预设期限内的对话语料进行匹配,所述动态语料块是内容随时间改变的语料块。
为解决上述技术问题,本发明实施例还提供一种存储介质,其上存储有计算机指令,所述计算机指令运行时上述聊天机器人的构造方法或上述聊天机器人的响应方法的步骤。
为解决上述技术问题,本发明实施例还提供一种服务器,包括存储器和处理器,所述存储器上存储有可在所述处理器上运行的计算机指令,所述处理器运行所述计算机指令时执行上述聊天机器人的构造方法或上述聊天机器人的响应方法的步骤。
与现有技术相比,本发明实施例的技术方案具有以下有益效果:
本发明提供的技术方案首先通过获取包括上下文信息和所述上下文信息对应的响应信息的对话语料得到语料块;然后按照语义从下位至上位的顺序排列所述语料块,以得到层级自顶向下的分层语料块;接着将所述分层语料块输入至聊天机器人,以便所述聊天机器人一方面优先利用语义最下位的顶层层级的分层语料块与用户进行交流,能够充分展现聊天机器人的特定属性特征,满足用户订制个性化聊天机器人的需求;另一方面将语义更上位的语料块置于分层语料块的更下层层级,当所述聊天机器人顶层的分层语料块包含的语料无法回答用户问题时,可以逐步采用更下层层级的分层语料块扩大回答范围,以增加所述聊天机器人可用的语料数量,由此可以解决语料内容不足的问题,从而尽量保证所述聊天机器人能够与用户顺畅交流,提高用户体验。
进一步地,本发明技术方案从互联网获取资讯信息,并对所述资讯信息进行清洗,以得到所述对话语料。从互联网的资讯信息中获取对话语料,可以适时更新对话语料,丰富语料内容。
进一步,本发明技术方案提供所述聊天机器人的响应方法,在接收用户的输入信息后,按照层级自顶向下的顺序,将所述输入信息与所述聊天机器人内的分层语料块进行匹配,以得到应答信息,并将所述应答信息输出至用户。通过本发明技术方案提供的响应方法,一方面,可以将语义最下位的分层语料块置于顶层层级,并将语义更上位的语料块置于分层语料块的更下层层级,在进行匹配时,优先将所述聊天机器人顶层层级的分层语料块与所述输入信息进行匹配,并将匹配度最高的上下文信息对应的响应信息作为所述聊天机器人的应答信息,充分展现了聊天机器人的特定属性特征,能够满足用户订制个性化聊天机器人的需求;另一方面,若所述顶层层级的分层语料块无法回答用户的提问,则可以采用下层层级的分层语料块进行回答,以扩大回答范围,增加所述聊天机器人的可用语料数量,避免出现所述聊天机器人语料内容不足的问题,提高了用户体验。
附图说明
图1是本发明第一实施例的一种聊天机器人的构造方法的流程示意图;
图2是本发明第二实施例的一种聊天机器人的构造方法的流程示意图;
图3是本发明第三实施例的一种聊天机器人的响应方法的流程示意图;
图4是本发明第四实施例的一种聊天机器人的构造装置的结构示意图;
图5是本发明第五实施例的一种聊天机器人的响应装置的结构示意图。
具体实施方式
本领域技术人员理解,如背景技术所言,现有训练聊天机器人的技术方案无法解决建立特定的聊天机器人时语料内容不足的问题,难以满足用户订制个性化聊天机器人的需求。
本发明提供的技术方案首先通过获取包括上下文信息和所述上下文信息对应的响应信息的对话语料得到语料块;然后按照语义从下位至上位的顺序排列所述语料块,以得到层级自顶向下的分层语料块;接着将所述分层语料块输入至聊天机器人,以便所述聊天机器人一方面优先利用语义更下位的顶层层级的分层语料块与用户进行回答,能够充分展现聊天机器人的特定属性特征,满足用户订制个性化聊天机器人的需求;另一方面将语义更上位的语料块置于分层语料块的更下层层级,当所述聊天机器人顶层层级的分层语料块包含的语料无法回答用户问题时,可以逐步采用更下层层级的分层语料块以扩大回答范围,以增加所述聊天机器人可用的语料数量,由此可以解决语料内容不足的问题,从而尽量保证所述聊天机器人能够与用户顺畅交流,提高用户体验。
为使本发明的上述目的、特征和有益效果能够更为明显易懂,下面结合附图对本发明的具体实施例做详细的说明。
应注意到:相似的标号和字母在下面的附图中表示类似项,因此,一旦某一项在一个附图中被定义,则在随后的附图中不需要对其进行进一步定义和解释。同时,在本发明实施例的描述中,术语“第一”、“第二”等仅用于区分描述,而不能理解为指示或暗示相对重要性。
图1是本发明第一实施例的一种聊天机器人的构造方法的流程示意图。一般而言,为满足用户订制特定人物形象的聊天机器人(为简便计,简称聊天机器人)的需求,所述聊天机器人可以从小说、剧本和漫画等文学作品中获取到对话语料,以实现人机对话。然而,单纯地从所述文学作品中获取到的对话语料是十分有限的,经常导致聊天机器人出现语料不足的问题。例如,拟实现一个孙悟空机器人,由于《西游记》剧本中的孙悟空的对话语料数量有限,若扩展使用其他人物形象的对话语料则会导致孙悟空机器人性格不一致,由此可见,为所述聊天机器人补充符合其身份、性格的对话语料是构造聊天机器人过程中的重要环节。具体地,如图1所示,本发明实施例提供的聊天机器人的构造方法可以包括如下步骤:
步骤S101:获取对话语料,并将所述对话语料组织为语料块,其中,所述对话语料包括上下文信息和所述上下文信息对应的响应信息;
步骤S102:对所述语料块进行分层,以得到层级自顶向下的多个分层语料块,每个分层语料块包括至少一个语料块,所述分层语料块的层级越高,其中的语料块的语义越下位;
步骤S103:将所述分层语料块输入至聊天机器人。
具体而言,在步骤S101中,根据聊天机器人预设的人物身份和性格,从相关的文学作品等原始作品中获取对话语料,所述对话语料可以包括上下文信息和所述上下文信息对应的响应信息。所述上下文信息相当于用户提出的问题,而所述响应信息相当于所述问题的回答。
进一步地,可以将属于同一个信息源的对话语料作为一个语料块,一个语料块可以包含若干条(例如,可以达到数万条)对话语料,例如将从《西游记》中的全部对话语料组织为一个包含若干条对话语料的语料块,又例如,将《水浒传》中的全部对话语料组织为另一个包含若干条对话语料的语料块。本领域技术人员理解,所述信息源并非局限于文学作品中,也可以来源于互联网,例如可以将知乎科技话题下的所有问题及回答作为对话语料,组织成一个数万条的语料块。
进一步地,考虑到信息源范围庞大,从不同信息源得到的语料块数量也将十分庞大,因而可以在构造聊天机器人之前,将语料块进行分层。在步骤S102中,通过对各个语料块进行分层,可以得到不同层级的语料块。为满足聊天机器人充分体现人物性格特征的需求,可以按照自顶向下的方式对语料块逐级分层,以得到语义逐渐上位的多个分层语料块。每个分层语料块可以包括一个或多个语料块。具体而言,所述分层语料块的层级越高,其中的语料块的语义越下位,也即所述语料块中的对话语料越特殊,越具有显著的人物性格特征;所述分层语料块的层级越低,其中的语料块的语义越上位,也即所述语料块中的对话语料越普遍,越趋向于一般化人物性格特征。
进一步地,在步骤S103中,服务器可以将各个分层语料块输入至聊天机器人中,以得到具有特定人物形象的聊天机器人。其中,所述分层语料块的语料块中的对话语料可以体现聊天机器人拟代表的人物性格。
作为一个非限定实施例,在实现芈月机器人的例子中,我们可以在芈月机器人的顶层放置《芈月传》剧本中芈月的对话语料组成的语料块。由于芈月的台词(也即对话语料)过少,考虑到芈月的身份是宫女,我们可以在芈月机器人的第二层放置若干个古装剧中宫女台词组成的语料块,又因为芈月是女性,我们还可以在芈月机器人的最底层放置多个女性角色的语料块。可见,由自顶向下的多个分层语料块构造的聊天机器人可以大大扩展特定人物形象的聊天机器人所使用的对话语料的数量。本领域技术人员理解,还可以根据实际需要构造其它人物形象的聊天机器人,在此不再赘述。
图2是本发明第二实施例的一种聊天机器人的构造方法的流程示意图。如图2所示,作为一个优选实施例,所述构造方法可以包括如下步骤:
步骤S201:从互联网获取资讯信息;
步骤S202:对所述资讯信息进行清洗,以得到所述对话语料,所述清洗指的是删除所述资讯信息中的重复和冗余内容后,将所述资讯信息整理成对话格式的对话语料。
步骤S203:获取对话语料,并将所述对话语料组织为语料块,其中,所述对话语料包括上下文信息和所述上下文信息对应的响应信息;
步骤S204:对所述语料块进行分层,以得到层级自顶向下的多个分层语料块,每个分层语料块包括至少一个语料块,所述分层语料块的层级越高,其中的语料块的语义越下位;
步骤S205:将所述分层语料块输入至聊天机器人。
具体而言,在步骤S201中,可以利用爬虫或其它工具从互联网中抓取网页或应用内容,以获取资讯信息。所述资讯信息可以是时事要闻、技术动态、政策条目、观点评论、学术讨论等任何可用信息。所述资讯信息可以大大扩充语料内容。
进一步地,在步骤S202中,所述服务器可以对获取到的资讯信息进行清洗。由于互联网资讯信息来源多样、格式多样,且可能存在冲突,甚至存在错误,有很多干扰信息,因而需要对资讯信息进行清洗,以删除重复和冗余信息,纠正错误信息并整理为对话语料。所述对话语料可以包括相当于用户提问的上下文信息和相当于用户提问的回答信息,也即所述上下文信息对应的响应信息。
进一步地,在步骤S203中,获取对话语料,并将所述对话语料组织为语料块,其中,所述对话语料包括上下文信息和所述上下文信息对应的响应信息。接着在步骤S204中,可以对所述语料块进行分层,以得到层级自顶向下的多个分层语料块,每个分层语料块包括至少一个语料块,所述分层语料块的层级越高,其中的语料块的语义越下位。最后在步骤S205中,将所述分层语料块输入至聊天机器人。具体地,本领域技术人员可以一并参考上述图1所示实施例中所述步骤S101至步骤S103,在此不予赘述。
图3是本发明第三实施例的一种聊天机器人的响应方法的流程示意图。图3所示的响应方法可以包括如下步骤:
步骤S301:提供聊天机器人,所述聊天机器人由上述构造方法构造而成;
步骤S302:接收用户的输入信息;
步骤S303:按照层级自顶向下的顺序,将所述输入信息与所述聊天机器人内的分层语料块进行匹配,以得到应答信息;
步骤S304:将所述应答信息输出至用户。
具体而言,步骤S301中提供的聊天机器人可以是由图1或图2所示的构造方法构造而成的。所述聊天机器人的具体构造方式及工作原理可以一并参考图1和图2所示的构造方法,这里不再赘述。
进一步地,在步骤S302中,所述聊天机器人可以通过人机界面接收用户的输入信息,也即接收用户提出的问题。
进一步地,在步骤S303中,所述聊天机器人在接收到用户的输入信息之后,将按层级搜索所述聊天机器人。具体实施中,可以按照自顶向下的层级顺序搜索所述聊天机器人内的分层语料块,以匹配所述用户的输入信息,从而得到应答信息。如果分层语料块包括两个或两个以上的语料块,则在搜索过程中,对同一分层语料块中的多个语料块以并行搜索的方式进行匹配。
作为一个非限定性例子,所述聊天机器人可以按照层级自顶向下的顺序,将所述输入信息与所述分层语料块的各个语料块内包含的对话语料中的上下文信息进行匹配。例如,以语义相关度作为基准设置匹配度阈值。如果所述上下文信息与所述输入信息的语义相关度高于所述匹配度阈值,则得到与所述输入信息相匹配的上下文信息,此时可将所述上下文信息对应的响应信息作为用户的输入信息的应答信息。本领域技术人员理解,实际应用中,可以选取与所述输入信息相匹配的K(例如K≥1)条对话语料中的上下文信息对应的响应信息作为所述应答信息。其中,K是预先为所述分层语料块配置的参数。如果在搜索完所述分层语料块后得到大于K条的响应信息,则可以按照匹配度降序排列并选取前K条响应信息。当K>1时,可以选取匹配度最高的响应信息作为所述应答信息,也可以从K条响应信息中随机选取一条作为所述应答信息。
具体而言,所述聊天机器人可以在最顶层的分层语料块中的所有语料块中搜索与所述输入信息匹配的上下文信息,如果找到高于所述匹配度阈值的上下文信息,则找到的上下文信息对应的响应信息即为所述应答信息。
进一步地,如果在最顶层的分层语料块中未找到高于所述匹配度阈值的上下文信息,则所述聊天机器人继续搜索下一层的分层语料块中的所有语料块内包含的对话语料中的上下文信息,并以此类推,直到最底层。如果此时仍未得到高于匹配度阈值的上下文信息,则所述聊天机器人可以将“抱歉!不知道您在说什么?”之类的回答作为所述应答信息。
进一步地,所述聊天机器人可以在步骤S304中将所述应答信息通过人机交互界面输出至用户。
作为又一个非限定性例子,当所述聊天机器人在搜索所述分层语料块各个语料块内的对话语料中的上下文信息以匹配所述输入信息时,可以根据各个语料块的特点采用不同的搜索策略进行搜索。具体实施中,如果所述语料块是静态语料块(也即内容不随时间改变的语料块或者不常更新的语料块,例如文学作品),则可以采用穷尽搜索算法对所述分层语料块中的上下文信息进行搜索,并返回匹配度最高的K条语料。
作为一个变化例,如果所述语料块是动态语料块(也即内容随时间改变的语料块或者更新频率较高的语料块,例如时事新闻),则可以只选取所述动态语料块中的部分对话语料的上下文信息进行搜索。具体实施中,可以预先设置一个时间阈值,将在此时间阈值内的对话语料与所述输入信息进行匹配,并可以按所述对话语料的时间顺序返回匹配度最高的前K条语料。
综上所述,本领域技术人员理解,采用本发明实施例提供的技术方案,可以适时通过清洗从互联网中获取的资讯信息中得到所述对话语料,并添加到所述聊天机器人的分层语料块的语料块中,一方面可以大大降低训练聊天机器人的成本,使得每个用户可以订制专属于自己的个性化机器人;另一方面,设置合理的分层语料块,使得所述聊天机器人回答用户输入信息时可在一定程度上模仿人类的思考过程,在实现特定人物形象的聊天机器人时可以解决训练语料不足的问题。
图4是本发明第四实施例的一种聊天机器人的构造装置的结构示意图。本领域技术人员理解,本发明实施例所述构造装置4可以用于实施上述图1和图2所示实施例中所述的方法技术方案。图4所示的构造装置4可以包括组织模块41、分层模块42和构造模块43。
具体实施中,所述组织模块41适于获取对话语料,并将所述对话语料组织为语料块,其中,所述对话语料包括上下文信息和所述上下文的响应信息。所述分层模块42适于对所述语料块进行分层,以得到层级自顶向下的多个分层语料块,每个分层语料块包括至少一个所述语料块,所述分层语料块的层级越高,其中的语料块的语义越下位。所述构造模块43适于将所述分层语料块输入至聊天机器人。
进一步地,所述组织模块41可以包括获取子模块411和清洗子模块412。具体而言,所述获取子模块411适于从互联网获取资讯信息;所述清洗子模块412适于对所述资讯信息进行清洗,以得到所述对话语料,所述清洗指的是删除所述资讯信息中的重复和冗余内容后,将所述资讯信息整理成对话格式的语料。
进一步地,所述组织模块41还可以包括组织子模块413。所述组织子模块413适于将来源于同一信息源的对话语料组织于同一语料块中。
关于所述构造装置4的工作原理、工作方式的更多内容,可以参照上述图1和图2中关于所述构造方法的相关描述,这里不再赘述。
图5是本发明第五实施例的一种聊天机器人的响应装置的结构示意图。本领域技术人员理解,本实施例所述响应装置5可以用于实施上述图3所示实施例中所述的方法技术方案。图5所示的所述响应装置5可以包括提供模块51、接收模块52、匹配模块53和输出模块54。
具体而言,所述提供模块51适于提供聊天机器人,所述聊天机器人可以由图4所示的构造装置4构造而成,图4所示的构造装置4的工作原理和工作方式可以一并参考图1和图2所示的构造方法,这里不再赘言。所述接收模块52适于接收用户的输入信息;所述匹配模块53适于按照层级自顶向下的顺序,将所述输入信息与聊天机器人内的分层语料块进行匹配,以得到应答信息;所述输出模块54适于将所述应答信息输出至用户。
进一步地,所述匹配模块53可以包括匹配子模块531和确定子模块532。具体实施中,所述匹配子模块531适于按照层级自顶向下的顺序,将所述输入信息与所述分层语料块的语料块内的上下文信息进行匹配。所述确定子模块532适于将与所述输入信息匹配的上下文信息对应的响应信息作为所述应答信息。
进一步地,所述匹配子模块531可以包括搜索单元5311和控制单元5312。其中,所述搜索单元5311适于在最顶层层级的分层语料块的各个语料块中搜索与所述输入信息的匹配度高于预设阈值的上下文信息,如果找到,则所述搜索单元5311适于将找到的上下文信息作为匹配的上下文信息;如果所述搜索单元5311未找到,则所述控制单元5312控制所述搜索单元5311在下一层级的分层语料块的各个语料块中搜索与所述输入信息的匹配度高于预设阈值的上下文信息,直至找到或者搜索完全部的分层语料块。
作为一个优选变化例,所述匹配子模块53还可以包括第一匹配单元5313和第二匹配单元5314。具体地,对于静态语料块,所述第一匹配单元5313适于将所述输入信息与所述静态语料块中的全部对话语料进行匹配,所述静态语料块是内容不随时间改变的语料块;对于动态语料块,所述第二匹配单元5314适于将所述输入信息与所述动态语料块中更新时间在预设期限内的对话语料进行匹配,所述动态语料块是内容随时间改变的语料块。
关于所述响应装置5的工作原理、工作方式的更多内容,可以参照图3中的相关描述,这里不再赘述。
进一步地,本发明实施例还公开了一种存储介质,其上存储有计算机指令,所述计算机指令运行时执行上述图1和图2所示实施例中的所述聊天机器人的构造方法或上述图3所示实施例中的所述聊天机器人的响应方法的步骤。优选地,所述存储介质可以包括计算机可读存储介质。在具体实施中,所述存储介质可以包括ROM、RAM、磁盘或光盘等。
进一步地,本发明实施例还公开了一种服务器,包括存储器和处理器,所述存储器上存储有能够在所述处理器上运行的计算机指令,所述处理器运行所述计算机指令时执行上述图1和图2所示实施例中的所述聊天机器人的构造方法或上述图3所示实施例中的所述聊天机器人的响应方法的步骤。
虽然本发明披露如上,但本发明并非限定于此。任何本领域技术人员,在不脱离本发明的精神和范围内,均可作各种更动与修改,因此本发明的保护范围应当以权利要求所限定的范围为准。

Claims (16)

1.一种聊天机器人的构造方法,其特征在于,包括:
获取对话语料,并将所述对话语料组织为语料块,其中,所述对话语料包括上下文信息和所述上下文信息对应的响应信息;
对所述语料块进行分层,以得到层级自顶向下的多个分层语料块,每个分层语料块包括至少一个语料块,所述分层语料块的层级越高,其中的语料块的语义越下位;
将所述分层语料块输入至聊天机器人。
2.根据权利要求1所述的构造方法,其特征在于,所述获取对话语料的步骤包括:
从互联网获取资讯信息;
对所述资讯信息进行清洗,以得到所述对话语料,所述清洗指的是删除所述资讯信息中的重复和冗余内容后,将所述资讯信息整理成对话格式的对话语料。
3.根据权利要求1或2所述的构造方法,其特征在于,所述将所述对话语料组织为语料块包括:将来源于同一信息源的对话语料组织于同一语料块中。
4.一种聊天机器人的响应方法,其特征在于,包括:
提供聊天机器人,所述聊天机器人由权利要求1至3任一项所述的构造方法构造而成;
接收用户的输入信息;
按照层级自顶向下的顺序,将所述输入信息与所述聊天机器人内的分层语料块进行匹配,以得到应答信息;
将所述应答信息输出至用户。
5.根据权利要求4所述的响应方法,其特征在于,所述按照层级自顶向下的顺序,将所述输入信息与所述聊天机器人内的分层语料块进行匹配的步骤包括:
按照层级自顶向下的顺序,将所述输入信息与所述分层语料块的语料块内的上下文信息进行匹配;
将与所述输入信息匹配的上下文信息对应的响应信息作为所述应答信息。
6.根据权利要求5所述的响应方法,其特征在于,所述按照层级自顶向下的顺序,将所述输入信息与所述分层语料块的语料块内的上下文信息进行匹配包括:
在最顶层层级的分层语料块的各个语料块中搜索与所述输入信息的匹配度高于预设阈值的上下文信息,如果找到,则将找到的上下文信息作为匹配的上下文信息;
如果未找到,则在下一层级的分层语料块的各个语料块中搜索与所述输入信息的匹配度高于预设阈值的上下文信息,直至找到或者搜索完全部的分层语料块。
7.根据权利要求5或6所述的响应方法,其特征在于,所述将所述输入信息与所述分层语料块的语料块内的上下文信息进行匹配的步骤包括:
对于静态语料块,将所述输入信息与所述静态语料块中的全部对话语料进行匹配,所述静态语料块是内容不随时间改变的语料块;
对于动态语料块,将所述输入信息与所述动态语料块中更新时间在预设期限内的对话语料进行匹配,所述动态语料块是内容随时间改变的语料块。
8.一种聊天机器人的构造装置,其特征在于,包括:
组织模块,适于获取对话语料,并将所述对话语料组织为语料块,其中,所述对话语料包括上下文信息和所述上下文的响应信息;
分层模块,适于对所述语料块进行分层,以得到层级自顶向下的多个分层语料块,每个分层语料块包括至少一个所述语料块,所述分层语料块的层级越高,其中的语料块的语义越下位;
构造模块,适于将所述分层语料块输入至聊天机器人。
9.根据权利要求8所述的构造装置,其特征在于,所述组织模块包括:
获取子模块,适于从互联网获取资讯信息;
清洗子模块,适于对所述资讯信息进行清洗,以得到所述对话语料,所述清洗指的是删除所述资讯信息中的重复和冗余内容后,将所述资讯信息整理成对话格式的语料。
10.根据权利要求8或9任一项所述的构造装置,其特征在于,所述组织模块还包括:
组织子模块,适于将来源于同一信息源的对话语料组织于同一语料块中。
11.一种聊天机器人的响应装置,其特征在于,包括:
提供模块,适于提供聊天机器人,所述聊天机器人由权利要求8至10任一项所述的构造装置构造而成;
接收模块,适于接收用户的输入信息;
匹配模块,适于按照层级自顶向下的顺序,将所述输入信息与聊天机器人内的分层语料块进行匹配,以得到应答信息;
输出模块,适于将所述应答信息输出至用户。
12.根据权利要求11所述的响应装置,其特征在于,所述匹配模块包括:
匹配子模块,适于按照层级自顶向下的顺序,将所述输入信息与所述分层语料块的语料块内的上下文信息进行匹配;
确定子模块,适于将与所述输入信息匹配的上下文信息对应的响应信息作为所述应答信息。
13.根据权利要求12所述的响应装置,其特征在于,所述匹配子模块包括:
搜索单元,适于在最顶层层级的分层语料块的各个语料块中搜索与所述输入信息的匹配度高于预设阈值的上下文信息,如果找到,则所述搜索单元适于将找到的上下文信息作为匹配的上下文信息;
控制单元,如果所述搜索单元未找到,则所述控制单元控制所述搜索单元在下一层级的分层语料块的各个语料块中搜索与所述输入信息的匹配度高于预设阈值的上下文信息,直至找到或者搜索完全部的分层语料块。
14.根据权利要求12或13所述的响应装置,其特征在于,所述匹配子模块还包括:
第一匹配单元,对于静态语料块,所述第一匹配单元适于将所述输入信息与所述静态语料块中的全部对话语料进行匹配,所述静态语料块是内容不随时间改变的语料块;
第二匹配单元,对于动态语料块,所述第二匹配单元适于将所述输入信息与所述动态语料块中更新时间在预设期限内的对话语料进行匹配,所述动态语料块是内容随时间改变的语料块。
15.一种存储介质,其上存储有计算机指令,其特征在于,所述计算机指令运行时执行权利要求1至3中任一项所述的聊天机器人的构造方法或权利要求4至7任一项所述的聊天机器人的响应方法的步骤。
16.一种服务器,包括存储器和处理器,所述存储器上存储有可在所述处理器上运行的计算机指令,其特征在于,所述处理器运行所述计算机指令时执行权利要求1至3中任一项所述的聊天机器人的构造方法或权利要求4至7任一项所述的聊天机器人的响应方法的步骤。
CN201711049821.4A 2017-10-31 2017-10-31 聊天机器人的构造、响应方法及装置、存储介质、服务器 Pending CN109947907A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201711049821.4A CN109947907A (zh) 2017-10-31 2017-10-31 聊天机器人的构造、响应方法及装置、存储介质、服务器

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201711049821.4A CN109947907A (zh) 2017-10-31 2017-10-31 聊天机器人的构造、响应方法及装置、存储介质、服务器

Publications (1)

Publication Number Publication Date
CN109947907A true CN109947907A (zh) 2019-06-28

Family

ID=67003988

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201711049821.4A Pending CN109947907A (zh) 2017-10-31 2017-10-31 聊天机器人的构造、响应方法及装置、存储介质、服务器

Country Status (1)

Country Link
CN (1) CN109947907A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112114728A (zh) * 2020-09-18 2020-12-22 北京搜狗科技发展有限公司 一种输入方法、装置和电子设备

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7328157B1 (en) * 2003-01-24 2008-02-05 Microsoft Corporation Domain adaptation for TTS systems
CN101128864A (zh) * 2005-02-15 2008-02-20 塞奥夫有限公司 对话用户接口
CN106021233A (zh) * 2016-05-24 2016-10-12 仲恺农业工程学院 基于文本语境信息层级量化的转喻加工实验方法及应用
US20160352656A1 (en) * 2015-05-31 2016-12-01 Microsoft Technology Licensing, Llc Context-sensitive generation of conversational responses
CN106326452A (zh) * 2016-08-26 2017-01-11 宁波薄言信息技术有限公司 一种基于上下文的人机对话方法
CN106547925A (zh) * 2016-12-13 2017-03-29 竹间智能科技(上海)有限公司 调整对话系统响应性格的方法及装置
CN107133305A (zh) * 2017-04-28 2017-09-05 上海斐讯数据通信技术有限公司 一种聊天机器人知识库自动构建装置及其方法

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7328157B1 (en) * 2003-01-24 2008-02-05 Microsoft Corporation Domain adaptation for TTS systems
CN101128864A (zh) * 2005-02-15 2008-02-20 塞奥夫有限公司 对话用户接口
US20160352656A1 (en) * 2015-05-31 2016-12-01 Microsoft Technology Licensing, Llc Context-sensitive generation of conversational responses
CN106021233A (zh) * 2016-05-24 2016-10-12 仲恺农业工程学院 基于文本语境信息层级量化的转喻加工实验方法及应用
CN106326452A (zh) * 2016-08-26 2017-01-11 宁波薄言信息技术有限公司 一种基于上下文的人机对话方法
CN106547925A (zh) * 2016-12-13 2017-03-29 竹间智能科技(上海)有限公司 调整对话系统响应性格的方法及装置
CN107133305A (zh) * 2017-04-28 2017-09-05 上海斐讯数据通信技术有限公司 一种聊天机器人知识库自动构建装置及其方法

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112114728A (zh) * 2020-09-18 2020-12-22 北京搜狗科技发展有限公司 一种输入方法、装置和电子设备
CN112114728B (zh) * 2020-09-18 2022-02-15 北京搜狗科技发展有限公司 一种输入方法、装置和电子设备

Similar Documents

Publication Publication Date Title
Xi et al. The rise and potential of large language model based agents: A survey
Powell et al. Networks and institutions
CN109493166A (zh) 一种针对电子商务导购场景任务型对话系统的构建方法
CN106934032B (zh) 一种城市知识图谱构建方法及装置
CN106445147B (zh) 基于人工智能的对话系统的行为管理方法及装置
CN106326440B (zh) 一种面向智能机器人的人机交互方法及装置
CN109947915B (zh) 一种基于知识管理系统的人工智能专家系统及其构建方法
CN107589828A (zh) 基于知识图谱的人机交互方法及系统
CN110199274A (zh) 用于自动化查询回答生成的系统和方法
CN104951219B (zh) 一种移动终端文本输入的方法及移动终端
CN106126636B (zh) 一种面向智能机器人的人机交互方法及装置
CN107239489A (zh) 基于soar模型的突发事件中网络舆情的预测与仿真方法
CN108573062A (zh) 一种基于异构社交关系的个性化推荐方法
Nasution Industry 4.0
TW201820172A (zh) 對話模式分析系統、方法及非暫態電腦可讀取記錄媒體
CN110222176A (zh) 一种文本数据的清洗方法、系统及可读存储介质
Yildirim Text-to-image generation ai in architecture
CN108846043A (zh) 基于互联网大数据的网络痕迹挖掘分析方法及系统
CN109947907A (zh) 聊天机器人的构造、响应方法及装置、存储介质、服务器
CN113344648A (zh) 一种基于机器学习的广告推荐方法及系统
CN107256226B (zh) 一种知识库的构建方法及装置
CN106919321A (zh) 一种信息交互方法及装置、用户设备
CN110020007A (zh) 机器人交互控制方法及装置、存储介质、服务器
Xu et al. CNN-based skip-gram method for improving classification accuracy of chinese text
CN110060083A (zh) 基于机器学习的个性化繁忙等待服务的方法、装置和设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20190628

WD01 Invention patent application deemed withdrawn after publication