CN112632246A - 基于深度学习的机器人对话方法、装置和计算机设备 - Google Patents
基于深度学习的机器人对话方法、装置和计算机设备 Download PDFInfo
- Publication number
- CN112632246A CN112632246A CN202011523483.5A CN202011523483A CN112632246A CN 112632246 A CN112632246 A CN 112632246A CN 202011523483 A CN202011523483 A CN 202011523483A CN 112632246 A CN112632246 A CN 112632246A
- Authority
- CN
- China
- Prior art keywords
- information
- user
- user intention
- data
- operation content
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/332—Query formulation
- G06F16/3329—Natural language query formulation or dialogue systems
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/335—Filtering based on additional data, e.g. user or group profiles
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/35—Clustering; Classification
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/279—Recognition of textual entities
Abstract
本申请涉及人工智能,提供一种基于深度学习的机器人对话方法、装置和计算机设备。所述方法包括:当检测到基于对话框的输入操作时,获取用户在对话框中的操作内容,操作内容包括输入内容和/或删除内容。获取与操作内容关联的历史搜索日志,并根据操作内容和历史搜索日志生成待识别信息。根据训练好的用户意图识别模型,对待识别信息进行用户意图识别,确定与操作内容对应的用户意图识别结果,并将与用户意图识别结果相匹配的数据条目进行展示。采用本方法通过实时获取用户在对话框输入或删除的内容,扩大了输入信息源,进而能够快速准确识别客户的意图,提升智能客服或智能问答机器人等在用户意图识别应用场景下的识别准确率和服务质量。
Description
技术领域
本申请涉及人工智能技术领域,特别是涉及一种基于深度学习的机器人对话方法、装置和计算机设备。
背景技术
随着人工智能技术的日益发展,以及人工智能客服,比如聊天机器人等的广泛应用,通过人工智能客服识别用户意图的手段日益成熟。其中,用户意图识别指的是当用户与聊天机器人进行沟通时,机器人能够根据用户提出的直接或者间接的信息来快速判断用户的真实意图。举例来说,聊天机器人可根据用户的问题,识别出用户的出行消费意图,比如订机票和酒店等。
传统上多采用对话式语义理解技术,来实现对用户意图的识别,对话式语义理解技术的实现方案主要分为面向泛用场景和面向特定场景。其中,面向泛用场景的对话式人工智能,可以同用户进行闲聊,但无法理解用户的业务需求,往往需要用户对话信息从网络数据中匹配对应的答案,导致得到的答案准确度较低,或者并不符合当前的实际应用场景。
同样地,面向特定场景虽然可以应付业务需求,但是需要大量人力分析用户对话特征以构建规则模板,针对多业务场景所需要的工作量呈直线上升,导致模型的可延展性较差,进而通常需要客户完整明确的输入内容提交后,才了得到较准确的反馈信息,操作较为繁琐,使用便利性不足。
因此,传统的对话式语义理解技术,在用户意图识别的应用场景下,智能客服或智能对话机器人等的识别准确率仍较为低下。
发明内容
基于此,有必要针对上述技术问题,提供一种能够提升用户意图识别应用场景下的识别准确率的基于深度学习的机器人对话方法、装置和计算机设备。
一种基于深度学习的机器人对话方法,所述方法包括:
当检测到基于对话框的输入操作时,获取用户在对话框中的操作内容,所述操作内容包括输入内容和/或删除内容;
获取与所述操作内容关联的历史搜索日志,并根据所述操作内容和所述历史搜索日志生成待识别信息;
根据训练好的用户意图识别模型,对待识别信息进行用户意图识别,确定与所述操作内容对应的用户意图识别结果;
将与所述用户意图识别结果相匹配的数据条目进行展示。
在其中一个实施例中,所述方法还包括:
检测针对各所述数据条目的选定操作;
获取与所选定的所述数据条目对应的反馈结果。
在其中一个实施例中,所述方法还包括:
根据所述反馈结果和所述历史搜索日志,对所述训练好的用户意图识别模型进行优化更新。
在其中一个实施例中,在所述实当检测到基于对话框的输入操作时,获取用户在对话框中的操作内容之前,包括:
当检测到用户接入操作时,跳转至对话页面;
基于所述对话页面,实时监听所接入的用户的输入操作。
在其中一个实施例中,所述用户意图识别模型包括文本识别模型和非文本识别模型;所述根据训练好的用户意图识别模型,对待识别信息进行用户意图识别,确定对应的用户意图识别结果,包括:
对所述待识别信息进行分类处理,并提取所述待识别信息中的文本数据;
根据所述文本识别模型对所述待识别信息中的文本数据进行识别,生成与所述文本数据对应的第一识别结果;
提取所述待识别信息中的非文本数据,并对所述非文本数据进行分类处理,生成不同形式类别的非文本数据;
分别对各不同形式类别的所述非文本数据进行类别编码;
根据所述非文本识别模型,确定与不同所述类别编码相匹配的识别方式;
采用各所述识别方式,分别对所述非文本数据进行识别,生成与所述非文本数据对应的第二识别结果;
结合所述第一识别结果和所述第二识别结果,生成对应的用户意图识别结果。
在其中一个实施例中,所述获取与所述操作内容关联的历史搜索日志,并根据所述操作内容和所述历史搜索日志生成待识别信息,包括:
获取与所述操作内容关联的历史搜索日志,所述历史搜索日志包括历史查询串、与所述历史查询串关联的相似信息以及与所述历史查询串对应的场景信息;
对所述操作内容进行数据预处理,生成与所述操作内容对应的关键信息;
根据所述关键信息和所述历史搜索日志,生成待识别信息。
在其中一个实施例中,所述方法还包括:
根据针对所述数据条目的选定操作和所述反馈结果,分别对所展示的各数据条目进行展示优先级调整。
一种基于深度学习的机器人对话装置,所述装置包括:
操作内容获取模块,用于当检测到基于对话框的输入操作时,获取用户在对话框中的操作内容,所述操作内容包括输入内容和/或删除内容;
待识别信息生成模块,用于获取与所述操作内容关联的历史搜索日志,并根据所述操作内容和所述历史搜索日志生成待识别信息;
用户意图识别结果确定模块,用于根据训练好的用户意图识别模型,对待识别信息进行用户意图识别,确定与所述操作内容对应的用户意图识别结果;
数据条目展示模块,用于将与所述用户意图识别结果相匹配的数据条目进行展示。
一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,所述处理器执行所述计算机程序时实现以下步骤:
当检测到基于对话框的输入操作时,获取用户在对话框中的操作内容,所述操作内容包括输入内容和/或删除内容;
获取与所述操作内容关联的历史搜索日志,并根据所述操作内容和所述历史搜索日志生成待识别信息;
根据训练好的用户意图识别模型,对待识别信息进行用户意图识别,确定与所述操作内容对应的用户意图识别结果;
将与所述用户意图识别结果相匹配的数据条目进行展示。
一种计算机存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现以下步骤:
当检测到基于对话框的输入操作时,获取用户在对话框中的操作内容,所述操作内容包括输入内容和/或删除内容;
获取与所述操作内容关联的历史搜索日志,并根据所述操作内容和所述历史搜索日志生成待识别信息;
根据训练好的用户意图识别模型,对待识别信息进行用户意图识别,确定与所述操作内容对应的用户意图识别结果;
将与所述用户意图识别结果相匹配的数据条目进行展示。
上述基于深度学习的机器人对话方法、装置和计算机设备,当检测到基于对话框的输入操作时,获取用户在对话框中的操作内容,其中,操作内容包括输入内容和/或删除内容。通过获取与操作内容关联的历史搜索日志,并根据操作内容和历史搜索日志生成待识别信息,进而根据训练好的用户意图识别模型,对待识别信息进行用户意图识别,确定与操作内容对应的用户意图识别结果,并将与用户意图识别结果相匹配的数据条目进行展示。实现了在用户还未提交提问信息之前,实时获取用户在对话框输入或删除的内容,而不必局限于用户提交的内容,扩大了输入信息源,进一步提升根据用户在对话框输入或删除的内容,以及与其关联的历史搜索日志,匹配出关联的数据条目的准确度,进而能够快速准确识别客户的意图,提升智能客服或智能问答机器人等在用户意图识别应用场景下的识别准确率和服务质量。
附图说明
图1为一个实施例中基于深度学习的机器人对话方法的应用场景图;
图2为一个实施例中基于深度学习的机器人对话方法的流程示意图;
图3为另一个实施例中基于深度学习的机器人对话方法的流程示意图;
图4为一个实施例中基于深度学习的机器人对话装置的结构框图;
图5为一个实施例中计算机设备的内部结构图。
具体实施方式
为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本申请进行进一步详细说明。应当理解,此处描述的具体实施例仅仅用以解释本申请,并不用于限定本申请。
本申请提供的基于深度学习的机器人对话方法,可以应用于如图1所示的应用环境中。其中,终端102通过网络与服务器104通过网络进行通信。当检测到用户在终端102基于对话框的输入操作时,获取用户在对话框中的操作内容,操作内容包括输入内容和/或删除内容。通过获取与操作内容关联的历史搜索日志,并根据操作内容和历史搜索日志生成待识别信息。其中,与操作内容关联的历史搜索日志可存储至终端102的本地存储中,或与终端102连接的服务器104的云端存储中。进而根据训练好的用户意图识别模型,对待识别信息进行用户意图识别,确定与操作内容对应的用户意图识别结果,并将与用户意图识别结果相匹配的数据条目在终端102的对话页面进行展示。其中,终端102可以但不限于是各种个人计算机、笔记本电脑、智能手机、平板电脑和便携式可穿戴设备,服务器104可以用独立的服务器或者是多个服务器组成的服务器集群来实现。
在一个实施例中,如图2所示,提供了一种基于深度学习的机器人对话方法,以该方法应用于图1中的服务器为例进行说明,包括以下步骤:
步骤S202,当检测到基于对话框的输入操作时,获取用户在对话框中的操作内容。
具体地,当检测到用户接入操作时,跳转至对话页面,基于对话页面,实时监听所接入的用户的输入操作,并在检测到用户基于对话框的输入操作时,获取用户在对话框中的操作内容。其中,操作内容包括输入内容和/或删除内容。
进一步地,在用户提交最终信息之前,实时获取用户在对话页面的对话框输入或删除的信息,包括文字、图片、语音以及视频等不同形式的信息,得到对应的操作内容。
步骤S204,获取与操作内容关联的历史搜索日志,并根据操作内容和历史搜索日志生成待识别信息。
具体地,通过获取与操作内容关联的历史搜索日志,并对操作内容进行数据预处理,生成与操作内容对应的关键信息,进而根据关键信息和历史搜索日志,生成待识别信息。
其中,通过获取同一终端设备上在预设时间段内的历史搜索记录,并将所获取的历史搜索记录确定为与关键信息相关联的历史搜索日志,例如在同一终端设备上30分钟至60分钟内的历史查询信息,包括历史查询信息对应的标题、时间、近义词等信息。其中,历史搜索日志包括历史查询串、与历史查询串关联的相似信息以及与历史查询串对应的场景信息,其中,在特定应用场景下需加入地点信息,例如地图搜索时,则需要加入相应的地点信息。
进一步地,通过将与操作内容相关联的历史搜索日志,和关键信息进行拆解分析,得到待识别信息。其中,拆解分析是通过将输入的数据,包括将历史搜索日志和关键信息各自进行拆解后,再进行整合,并通过将拆解够的历史搜索日志和关键信息,分别与预设关键字库进行匹配。通过获取击中预设关键字库的数据,并对击中预设关键字库的数据进一步组合,进而得到待识别信息。
在一个实施例中,对操作内容进行数据预处理,生成与操作内容对应的关键信息,包括:
对操作内容进行数据清洗,删除无效信息,并提取出完整的词语或句子。进而根据所提取的词语或句子的含义,对词语和句子进行分类,比如划分为地址、人物、购物等不同类别,并将分类后的操作内容,确定为有效数据。通过利用预设关键字库,对所确定出的有效数据进行匹配,将击中关键字库的有效数据确定为关键信息。
其中,对词语和句子的进行分类得到的类别,还包括贷款类疑问或系统类疑问,贷款类疑问表示用户对贷款业务具有相应的疑问,可初步识别出用户具有贷款意向,而系统类疑问则可表示用户对相应业务系统进行使用时,存在的相应疑问。
步骤S206,根据训练好的用户意图识别模型,对待识别信息进行用户意图识别,确定对应的用户意图识别结果。
具体地,根据训练好的用户意图识别模型,对根据与操作内容相关联的历史搜索日志,和操作内容生成的待识别信息,进行用户意图识别,生成对应的用户意图识别结果。
进一步地,根据训练好的用户意图识别模型,采用提取核心关键词或索引等方式,提取待识别信息的关键词句,并将所提取得到的关键词语与后台的问题知识库中的知识条目进行匹配,生成对应的用户意图识别结果。其中,根据用户意图识别结果,可返回匹配成功的数据条目,即为待展示的问题条目。
在一个实施例中,训练得到用户意图识别模型的方式,具体包括:
获取初始文本识别模型和初始非文本识别模型;
采集提问数据和匹配的答案数据;所述提问数据和所述答案数据,包括文本类型数据和非文本类型数据;
根据所采集的文本类型的提问数据和相匹配的答案数据,对初始文本模型进行训练,得到训练后的文本识别模型;
根据所采集的文非本类型的提问数据和相匹配的答案数据,对初始非文本模型进行训练,得到训练后的非文本识别模型;
根据训练后的文本识别模型和非文本识别模式,得到训练后的用户意图识别模型。
其中,所采集的提问数据和相匹配的答案数据,可以是历史人机对话数据,也可以是第三方数据库中已有的对应存储的提问数据和答案数据。其中,非文本类型数据包括语音数据、图片数据以及视频数据。
步骤S208,将与用户意图识别结果相匹配的数据条目进行展示。
具体地,通过将用户意图识别结果相匹配的数据条目进行展示,可包括多个与用户意图识别结果相匹配的问题条目。其中,当存在多个问题条目时,则根据待识别信息与后台的问题知识库中的知识条目之间匹配程度进行排序。
优选地,可采用待识别信息与后台的问题知识库中的知识条目之间匹配程度高低进行排序,优先展示匹配程度高的问题条目。
举例来说,当用户在对话框中实时录入信息时,机器人在对话框中也显示‘…正在输入中’的信息,当完成如上数据分析后,将匹配到的答案条目返回给用户,比如:‘您是否想咨询以下内容:问题1,问题2,问题3…’,以供用户点击选择。当检测到用户的点击操作时,将与所选定的问题相匹配的答案内容,在对话页面进行展示。
上述基于深度学习的机器人对话方法中,当检测到基于对话框的输入操作时,获取用户在对话框中的操作内容,其中,操作内容包括输入内容和/或删除内容。通过获取与操作内容关联的历史搜索日志,并根据操作内容和历史搜索日志生成待识别信息,进而根据训练好的用户意图识别模型,对待识别信息进行用户意图识别,确定与操作内容对应的用户意图识别结果,并将与用户意图识别结果相匹配的数据条目进行展示。实现了在用户还未提交提问信息之前,实时获取用户在对话框输入或删除的内容,而不必局限于用户提交的内容,扩大了输入信息源,进一步提升根据用户在对话框输入或删除的内容,以及与其关联的历史搜索日志,匹配出关联的数据条目的准确度,进而能够快速准确识别客户的意图,提升智能客服或智能问答机器人等在用户意图识别应用场景下的识别准确率和服务质量。
在一个实施例中,提供了一种基于深度学习的机器人对话方法,具体包括以下步骤:
检测针对各数据条目的选定操作;
获取针对所选定的数据条目的反馈结果;
根据反馈结果和历史搜索日志,对训练好的用户意图识别模型进行优化更新。
具体地,通过检测用户针对所展示的各个数据条目的选定操作,并获取用户针对选定的数据条目的反馈结果。其中,反馈结果包括满意和不满意,即满意表示用户意图识别结果准确度高,而不满意则表示用户意图识别结果准确度较低,需对用户意图识别模型进行更新和优化。
举例来说,可通过在数据条目中增加客户反馈选项,包括让客户选择‘是否是想问的问题:是/否’等选项,得到用户对选定的数据条目的反馈结果。
进一步地,通过根据反馈结果和历史搜索日志,对训练好的用户意图识别模型进行优化更新。
其中,用户意图识别模型包括文本识别模型和非文本识别模型,可根据文本识别模型对待识别信息中的文本数据进行识别,而非文本识别模型可对待识别信息中的语音、图片或视频等非文本数据进行识别。可通过根据反馈结果和历史搜索日志,对文本识别模型、非文本识别模型进行进一步优化更新。其中,如检测到新增数据,还可将检测到的新增数据、用户发送的反馈结果、同一终端设备在预设时间段内的历史搜索日志以及初始的训练数据进行结合,即将检测到的新增数据,以及用户发送的反馈结果和同一终端设备在预设时间段内的历史搜索日志同时添加至初始的训练数据,进而得到更新后的训练数据,对文本识别模型以及非文本识别模型进行优化。
具体地,通过获取检测到的新增数据,以及用户发送的反馈结果和同一终端设备在预设时间段内的历史搜索日志,并将新增数据,以及用户发送的反馈结果和同一终端设备在预设时间段内的历史搜索日志,同时加入初始的训练数据,得到更新后的训练数据。进而根据更新后的训练数据,对已训练好的用户意图识别模型进行重复训练,实现利用更新后的训练数据实现对用户意图识别模型的更新和优化。
在一个实施例中,在获取针对所选定的数据条目的反馈结果之后,还包括:
根据针对数据条目的选定操作和反馈结果,分别对所展示的各数据条目进行展示优先级调整。
具体地,通过根据用户所选定的数据条目,以及对该数据条目的反馈结果,升高该数据条目的展示优先级,并对其他已展示的数据条目的展示优先级进行调整,包括升高或降低,得到更新后的数据条目展示列表。
上述基于深度学习的机器人对话方法中,通过检测针对各数据条目的选定操作,并获取针对所选定的数据条目的反馈结果,进而根据反馈结果和历史搜索日志,对训练好的用户意图识别模型进行优化更新。实现了对用户意图识别模型的进一步优化,使得根据优化后的意图识别模型得到的用户意图识别结果更加准确,进而能够快速准确识别客户的意图,提升智能客服或智能问答机器人等在用户意图识别应用场景下的识别准确率和服务质量。在一个实施例中,用户意图识别模型包括文本识别模型和非文本识别模型,根据训练好的用户意图识别模型,对待识别信息进行用户意图识别,生成对应的用户意图识别结果的步骤,具体包括:
对待识别信息进行分类处理,并提取待识别信息中的文本数据;
根据文本识别模型对待识别信息中的文本数据进行识别,生成与文本数据对应的第一识别结果;
提取待识别信息中的非文本数据,并对非文本数据进行分类处理,生成不同形式类别的非文本数据;
分别对各不同形式类别的非文本数据进行类别编码;
根据非文本识别模型,确定与不同类别编码相匹配的识别方式;
采用各识别方式,分别对非文本数据进行识别,生成与非文本数据对应的第二识别结果;
结合第一识别结果和第二识别结果,生成对应的用户意图识别结果。
具体地,针对文本模型,通过对待识别信息进行分类处理,并提取待识别信息中的文本数据,进而根据文本识别模型对待识别信息中的文本数据进行识别,生成与文本数据对应的第一识别结果。其中,
其中,针对非文本识别模型,还包括对待识别信息进行分类,分为语音、图片以及视频等不同类别,并进行类别编码,针对不同类别的待识别信息,采用相匹配的识别方式进行用户意图识别。
举例来说,针对语音,则需将语音转化成文本数据,进行进一步识别,生成第二识别结果。而针对图片,则对图片内容进行识别,同时对图片文字进行提取,将图片内容的识别结果和对所提取的图片文字的识别结果进行结合,得到相应第二识别结果。
同样地,针对视频,则需获取视频长度,并对根据视频长度以及预设切割长度,对视频进行切割,得到多帧视频,进而采用多帧视频同时识别的方式,提取视频帧的内容,包括图片内容、语音或文字内容等,进行进一步识别,得到相应的第二识别结果。
进一步地,结合第一识别结果和第二识别结果,则得到针对包括文本数据和非文本数据的待识别信息的用户意图识别结果。
本实施例中,通过对待识别信息进行分类处理,并得到文本数据和非文本数据,根据文本识别模型对待识别信息中的文本数据进行识别,生成与文本数据对应的第一识别结果,根据非文本识别模型,分别对非文本数据进行识别,生成与非文本数据对应的第二识别结果。通过结合第一识别结果和第二识别结果,生成对应的用户意图识别结果。实现了利用用户意图识别模型对待识别信息的不同类型进行精确识别,减少误识别的情况,提升了识别成功率,进而能够准确且快速识别客户的意图。
在一个实施例中,如图3所示,提供了一种基于深度学习的机器人对话方法,具体包括以下步骤:
1)当检测到用户接入操作时,跳转至对话页面。
2)基于对话页面,实时监听所接入的用户的输入操作。
3)当检测到基于对话框的输入操作时,获取用户在对话框中的操作内容。
其中,操作内容包括输入内容和/或删除内容。4)对操作内容进行数据预处理,生成与操作内容对应的关键信息。
5)获取与关键信息关联的历史搜索日志,并根据关键信息和历史搜索日志生成待识别信息。
6)对待识别信息进行分类处理,并提取待识别信息中的文本数据。
7)根据文本识别模型对待识别信息中的文本数据进行识别,生成与文本数据对应的第一识别结果。
8)提取待识别信息中的非文本数据,并对非文本数据进行分类处理,生成不同形式类别的非文本数据。
9)分别对各不同形式类别的非文本数据进行类别编码。
10)根据非文本识别模型,确定与不同类别编码相匹配的识别方式。
11)采用各识别方式,分别对非文本数据进行识别,生成与非文本数据对应的第二识别结果。
12)结合第一识别结果和第二识别结果,生成对应的用户意图识别结果。
13)将与用户意图识别结果相匹配的数据条目进行展示。
14)检测针对各数据条目的选定操作,并获取针对所选定的数据条目的反馈结果。
15)根据反馈结果和历史搜索日志,对训练好的用户意图识别模型进行优化更新。
上述基于深度学习的机器人对话方法中,当检测到基于对话框的输入操作时,获取用户在对话框中的操作内容,其中,操作内容包括输入内容和/或删除内容。通过获取与操作内容关联的历史搜索日志,并根据操作内容和历史搜索日志生成待识别信息,进而根据训练好的用户意图识别模型,对待识别信息进行用户意图识别,确定与操作内容对应的用户意图识别结果,并将与用户意图识别结果相匹配的数据条目进行展示。实现了在用户还未提交提问信息之前,实时获取用户在对话框输入或删除的内容,而不必局限于用户提交的内容,扩大了输入信息源,进一步提升根据用户在对话框输入或删除的内容,以及与其关联的历史搜索日志,匹配出关联的数据条目的准确度,进而能够快速准确识别客户的意图,提升智能客服或智能问答机器人等在用户意图识别应用场景下的识别准确率和服务质量。
应该理解的是,虽然上述实施例涉及的各流程图中的各个步骤按照箭头的指示依次显示,但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明,这些步骤的执行并没有严格的顺序限制,这些步骤可以以其它的顺序执行。而且,上述实施例涉及的各流程图中的至少一部分步骤可以包括多个步骤或者多个阶段,这些步骤或者阶段并不必然是在同一时刻执行完成,而是可以在不同的时刻执行,这些步骤或者阶段的执行顺序也不必然是依次进行,而是可以与其它步骤或者其它步骤中的步骤或者阶段的至少一部分轮流或者交替地执行。
在一个实施例中,如图4所示,提供了一种基于深度学习的机器人对话装置,包括:操作内容获取模块402、待识别信息生成模块404、用户意图识别结果确定模块406以及数据条目展示模块408,其中:
操作内容获取模块402,用于当检测到基于对话框的输入操作时,获取用户在对话框中的操作内容,操作内容包括输入内容和/或删除内容。
待识别信息生成模块404,用于获取与操作内容关联的历史搜索日志,并根据操作内容和历史搜索日志生成待识别信息。
用户意图识别结果确定模块406,用于根据训练好的用户意图识别模型,对待识别信息进行用户意图识别,确定与操作内容对应的用户意图识别结果。
数据条目展示模块408,用于将与用户意图识别结果相匹配的数据条目进行展示。
上述基于深度学习的机器人对话方法中,当检测到基于对话框的输入操作时,获取用户在对话框中的操作内容,其中,操作内容包括输入内容和/或删除内容。通过获取与操作内容关联的历史搜索日志,并根据操作内容和历史搜索日志生成待识别信息,进而根据训练好的用户意图识别模型,对待识别信息进行用户意图识别,确定与操作内容对应的用户意图识别结果,并将与用户意图识别结果相匹配的数据条目进行展示。实现了在用户还未提交提问信息之前,实时获取用户在对话框输入或删除的内容,而不必局限于用户提交的内容,扩大了输入信息源,进一步提升根据用户在对话框输入或删除的内容,以及与其关联的历史搜索日志,匹配出关联的数据条目的准确度,进而能够快速准确识别客户的意图,提升智能客服或智能问答机器人等在用户意图识别应用场景下的识别准确率和服务质量。
在一个实施例中,提供了一种基于深度学习的机器人对话装置,还包括:
选定操作检测模块,用于检测针对各数据条目的选定操作。
反馈结果获取模块,用于获取针对所选定的数据条目的反馈结果。
模型优化模块,用于根据反馈结果和历史搜索日志,对训练好的用户意图识别模型进行优化更新。
上述基于深度学习的机器人对话装置中,通过检测针对各数据条目的选定操作,并获取针对所选定的数据条目的反馈结果,进而根据反馈结果和历史搜索日志,对训练好的用户意图识别模型进行优化更新。实现了对用户意图识别模型的进一步优化,使得根据优化后的意图识别模型得到的用户意图识别结果更加准确,进而能够快速准确识别客户的意图,提升智能客服或智能问答机器人等在用户意图识别应用场景下的识别准确率和服务质量。
在一个实施例中,用户意图识别结果确定模块,还包括:
第一识别结果生成单元,用于:
对待识别信息进行分类处理,并提取待识别信息中的文本数据;根据文本识别模型对待识别信息中的文本数据进行识别,生成与文本数据对应的第一识别结果;
第二识别结果生成单元,用于:
提取待识别信息中的非文本数据,并对非文本数据进行分类处理,生成不同形式类别的非文本数据;分别对各不同形式类别的非文本数据进行类别编码;根据非文本识别模型,确定与不同类别编码相匹配的识别方式;采用各识别方式,分别对非文本数据进行识别,生成与非文本数据对应的第二识别结果;
用户意图识别结果生成单元,用于结合第一识别结果和第二识别结果,生成对应的用户意图识别结果。
本实施例中,通过对待识别信息进行分类处理,并得到文本数据和非文本数据,根据文本识别模型对待识别信息中的文本数据进行识别,生成与文本数据对应的第一识别结果,根据非文本识别模型,分别对非文本数据进行识别,生成与非文本数据对应的第二识别结果。通过结合第一识别结果和第二识别结果,生成对应的用户意图识别结果。实现了利用用户意图识别模型对待识别信息的不同类型进行精确识别,减少误识别的情况,提升了识别成功率,进而能够准确且快速识别客户的意图。
在一个实施例中,提供了一种基于深度学习的机器人对话装置,还包括:用户接入操作检测模块,用于当检测到用户接入操作时,跳转至对话页面。
用户输入操作监听模块,用于基于对话页面,实时监听所接入的用户的输入操作。
在一个实施例中,提供了一种基于深度学习的机器人对话装置,还包括展示优先级调整模块,用于:
根据针对数据条目的选定操作和反馈结果,分别对所展示的各数据条目进行展示优先级调整。
在一个实施例中,待识别信息生成模块,还用于:
获取与操作内容关联的历史搜索日志,历史搜索日志包括历史查询串、与历史查询串关联的相似信息以及与历史查询串对应的场景信息;
对操作内容进行数据预处理,生成与操作内容对应的关键信息;
根据关键信息和历史搜索日志,生成待识别信息。
关于基于深度学习的机器人对话装置的具体限定可以参见上文中对于基于深度学习的机器人对话方法的限定,在此不再赘述。上述基于深度学习的机器人对话装置中的各个模块可全部或部分通过软件、硬件及其组合来实现。上述各模块可以硬件形式内嵌于或独立于计算机设备中的处理器中,也可以以软件形式存储于计算机设备中的存储器中,以便于处理器调用执行以上各个模块对应的操作。
在一个实施例中,提供了一种计算机设备,该计算机设备可以是服务器,其内部结构图可以如图5所示。该计算机设备包括通过系统总线连接的处理器、存储器、网络接口和数据库。其中,该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作系统、计算机程序和数据库。该内存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该计算机设备的数据库用于存储关键信息、待识别信息以及用户意图识别结果。该计算机设备的网络接口用于与外部的终端通过网络连接通信。该计算机程序被处理器执行时以实现一种基于深度学习的机器人对话方法。
本领域技术人员可以理解,图5中示出的结构,仅仅是与本申请方案相关的部分结构的框图,并不构成对本申请方案所应用于其上的计算机设备的限定,具体的计算机设备可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。
在一个实施例中,提供了一种计算机设备,包括存储器和处理器,该存储器存储有计算机程序,该处理器执行计算机程序时实现以下步骤:
当检测到基于对话框的输入操作时,获取用户在对话框中的操作内容,操作内容包括输入内容和/或删除内容;
获取与操作内容关联的历史搜索日志,并根据操作内容和历史搜索日志生成待识别信息;
根据训练好的用户意图识别模型,对待识别信息进行用户意图识别,确定与操作内容对应的用户意图识别结果;
将与用户意图识别结果相匹配的数据条目进行展示。
在一个实施例中,处理器执行计算机程序时还实现以下步骤:
检测针对各数据条目的选定操作;
获取与所选定的数据条目对应的反馈结果。
在一个实施例中,处理器执行计算机程序时还实现以下步骤:
根据反馈结果和历史搜索日志,对训练好的用户意图识别模型进行优化更新。
在一个实施例中,处理器执行计算机程序时还实现以下步骤:
当检测到用户接入操作时,跳转至对话页面;
基于对话页面,实时监听所接入的用户的输入操作。
在一个实施例中,处理器执行计算机程序时还实现以下步骤:
对待识别信息进行分类处理,并提取待识别信息中的文本数据;
根据文本识别模型对待识别信息中的文本数据进行识别,生成与文本数据对应的第一识别结果;
提取待识别信息中的非文本数据,并对非文本数据进行分类处理,生成不同形式类别的非文本数据;
分别对各不同形式类别的非文本数据进行类别编码;
根据非文本识别模型,确定与不同类别编码相匹配的识别方式;
采用各识别方式,分别对非文本数据进行识别,生成与非文本数据对应的第二识别结果;
结合第一识别结果和第二识别结果,生成对应的用户意图识别结果。
在一个实施例中,处理器执行计算机程序时还实现以下步骤:
获取与操作内容关联的历史搜索日志,历史搜索日志包括历史查询串、与历史查询串关联的相似信息以及与历史查询串对应的场景信息;
对操作内容进行数据预处理,生成与操作内容对应的关键信息;
根据关键信息和历史搜索日志,生成待识别信息。
在一个实施例中,处理器执行计算机程序时还实现以下步骤:
根据针对数据条目的选定操作和反馈结果,分别对所展示的各数据条目进行展示优先级调整。
在一个实施例中,提供了一种计算机存储介质,其上存储有计算机程序,计算机程序被处理器执行时实现以下步骤:
当检测到基于对话框的输入操作时,获取用户在对话框中的操作内容,操作内容包括输入内容和/或删除内容;
获取与操作内容关联的历史搜索日志,并根据操作内容和历史搜索日志生成待识别信息;
根据训练好的用户意图识别模型,对待识别信息进行用户意图识别,确定与操作内容对应的用户意图识别结果;
将与用户意图识别结果相匹配的数据条目进行展示。
在一个实施例中,计算机程序被处理器执行时还实现以下步骤:
检测针对各数据条目的选定操作;
获取与所选定的数据条目对应的反馈结果。
在一个实施例中,计算机程序被处理器执行时还实现以下步骤:
根据反馈结果和历史搜索日志,对训练好的用户意图识别模型进行优化更新。
在一个实施例中,计算机程序被处理器执行时还实现以下步骤:
当检测到用户接入操作时,跳转至对话页面;
基于对话页面,实时监听所接入的用户的输入操作。
在一个实施例中,计算机程序被处理器执行时还实现以下步骤:
对待识别信息进行分类处理,并提取待识别信息中的文本数据;
根据文本识别模型对待识别信息中的文本数据进行识别,生成与文本数据对应的第一识别结果;
提取待识别信息中的非文本数据,并对非文本数据进行分类处理,生成不同形式类别的非文本数据;
分别对各不同形式类别的非文本数据进行类别编码;
根据非文本识别模型,确定与不同类别编码相匹配的识别方式;
采用各识别方式,分别对非文本数据进行识别,生成与非文本数据对应的第二识别结果;
结合第一识别结果和第二识别结果,生成对应的用户意图识别结果。
在一个实施例中,计算机程序被处理器执行时还实现以下步骤:
获取与操作内容关联的历史搜索日志,历史搜索日志包括历史查询串、与历史查询串关联的相似信息以及与历史查询串对应的场景信息;
对操作内容进行数据预处理,生成与操作内容对应的关键信息;
根据关键信息和历史搜索日志,生成待识别信息。
在一个实施例中,计算机程序被处理器执行时还实现以下步骤:
根据针对数据条目的选定操作和反馈结果,分别对所展示的各数据条目进行展示优先级调整。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一非易失性计算机可读取存储介质中,该计算机程序在执行时,可包括如上述各方法的实施例的流程。其中,本申请所提供的各实施例中所使用的对存储器、存储、数据库或其它介质的任何引用,均可包括非易失性和/或易失性存储器。非易失性存储器可包括只读存储器(ROM)、可编程ROM(PROM)、电可编程ROM(EPROM)、电可擦除可编程ROM(EEPROM)或闪存。易失性存储器可包括随机存取存储器(RAM)或者外部高速缓冲存储器。作为说明而非局限,RAM以多种形式可得,诸如静态RAM(SRAM)、动态RAM(DRAM)、同步DRAM(SDRAM)、双数据率SDRAM(DDRSDRAM)、增强型SDRAM(ESDRAM)、同步链路(Synchlink)DRAM(SLDRAM)、存储器总线(Rambus)直接RAM(RDRAM)、直接存储器总线动态RAM(DRDRAM)、以及存储器总线动态RAM(RDRAM)等。
以上实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。
以上所述实施例仅表达了本申请的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本申请构思的前提下,还可以做出若干变形和改进,这些都属于本申请的保护范围。因此,本申请专利的保护范围应以所附权利要求为准。
Claims (10)
1.一种基于深度学习的机器人对话方法,其特征在于,所述方法包括:
当检测到基于对话框的输入操作时,获取用户在对话框中的操作内容,所述操作内容包括输入内容和/或删除内容;
获取与所述操作内容关联的历史搜索日志,并根据所述操作内容和所述历史搜索日志生成待识别信息;
根据训练好的用户意图识别模型,对待识别信息进行用户意图识别,确定与所述操作内容对应的用户意图识别结果;将与所述用户意图识别结果相匹配的数据条目进行展示。
2.根据权利要求1所述的方法,其特征在于,所述方法还包括:
检测针对各所述数据条目的选定操作;
获取与所选定的所述数据条目对应的反馈结果。
3.根据权利要求2所述的方法,其特征在于,所述方法还包括:
根据所述反馈结果和所述历史搜索日志,对所述训练好的用户意图识别模型进行优化更新。
4.根据权利要求1至3任意一项所述的方法,其特征在于,在所述实当检测到基于对话框的输入操作时,获取用户在对话框中的操作内容之前,包括:
当检测到用户接入操作时,跳转至对话页面;
基于所述对话页面,实时监听所接入的用户的输入操作。
5.根据权利要求1至3任意一项所述的方法,其特征在于,所述用户意图识别模型包括文本识别模型和非文本识别模型;所述根据训练好的用户意图识别模型,对待识别信息进行用户意图识别,确定对应的用户意图识别结果,包括:
对所述待识别信息进行分类处理,并提取所述待识别信息中的文本数据;
根据所述文本识别模型对所述待识别信息中的文本数据进行识别,生成与所述文本数据对应的第一识别结果;
提取所述待识别信息中的非文本数据,并对所述非文本数据进行分类处理,生成不同形式类别的非文本数据;
分别对各不同形式类别的所述非文本数据进行类别编码;
根据所述非文本识别模型,确定与不同所述类别编码相匹配的识别方式;
采用各所述识别方式,分别对所述非文本数据进行识别,生成与所述非文本数据对应的第二识别结果;
结合所述第一识别结果和所述第二识别结果,生成对应的用户意图识别结果。
6.根据权利要求1至3任意一项所述的方法,其特征在于,所述获取与所述操作内容关联的历史搜索日志,并根据所述操作内容和所述历史搜索日志生成待识别信息,包括:
获取与所述操作内容关联的历史搜索日志,所述历史搜索日志包括历史查询串、与所述历史查询串关联的相似信息以及与所述历史查询串对应的场景信息;
对所述操作内容进行数据预处理,生成与所述操作内容对应的关键信息;
根据所述关键信息和所述历史搜索日志,生成待识别信息。
7.根据权利要求2所述的方法,其特征在于,所述方法还包括:
根据针对所述数据条目的选定操作和所述反馈结果,分别对所展示的各数据条目进行展示优先级调整。
8.一种基于深度学习的机器人对话装置,其特征在于,所述装置包括:
操作内容获取模块,用于当检测到基于对话框的输入操作时,获取用户在对话框中的操作内容,所述操作内容包括输入内容和/或删除内容;
待识别信息生成模块,用于获取与所述操作内容关联的历史搜索日志,并根据所述操作内容和所述历史搜索日志生成待识别信息;
用户意图识别结果确定模块,用于根据训练好的用户意图识别模型,对待识别信息进行用户意图识别,确定与所述操作内容对应的用户意图识别结果;
数据条目展示模块,用于将与所述用户意图识别结果相匹配的数据条目进行展示。
9.一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1至7中任一项所述的方法的步骤。
10.一种计算机存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至7中任一项所述的方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011523483.5A CN112632246A (zh) | 2020-12-21 | 2020-12-21 | 基于深度学习的机器人对话方法、装置和计算机设备 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011523483.5A CN112632246A (zh) | 2020-12-21 | 2020-12-21 | 基于深度学习的机器人对话方法、装置和计算机设备 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN112632246A true CN112632246A (zh) | 2021-04-09 |
Family
ID=75321908
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202011523483.5A Pending CN112632246A (zh) | 2020-12-21 | 2020-12-21 | 基于深度学习的机器人对话方法、装置和计算机设备 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112632246A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113360618A (zh) * | 2021-06-07 | 2021-09-07 | 暨南大学 | 一种基于离线强化学习的智能机器人对话方法及系统 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109446407A (zh) * | 2018-09-18 | 2019-03-08 | 深圳壹账通智能科技有限公司 | 关联推荐方法、装置、计算机设备和存储介质 |
CN109857848A (zh) * | 2019-01-18 | 2019-06-07 | 深圳壹账通智能科技有限公司 | 交互内容生成方法、装置、计算机设备及存储介质 |
CN112035655A (zh) * | 2020-09-02 | 2020-12-04 | 中国银行股份有限公司 | 银行人力资源系统及工作方法 |
-
2020
- 2020-12-21 CN CN202011523483.5A patent/CN112632246A/zh active Pending
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109446407A (zh) * | 2018-09-18 | 2019-03-08 | 深圳壹账通智能科技有限公司 | 关联推荐方法、装置、计算机设备和存储介质 |
CN109857848A (zh) * | 2019-01-18 | 2019-06-07 | 深圳壹账通智能科技有限公司 | 交互内容生成方法、装置、计算机设备及存储介质 |
CN112035655A (zh) * | 2020-09-02 | 2020-12-04 | 中国银行股份有限公司 | 银行人力资源系统及工作方法 |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113360618A (zh) * | 2021-06-07 | 2021-09-07 | 暨南大学 | 一种基于离线强化学习的智能机器人对话方法及系统 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN112632385B (zh) | 课程推荐方法、装置、计算机设备及介质 | |
CN110457431B (zh) | 基于知识图谱的问答方法、装置、计算机设备和存储介质 | |
CN109446302B (zh) | 基于机器学习的问答数据处理方法、装置和计算机设备 | |
CN108874992B (zh) | 舆情分析方法、系统、计算机设备和存储介质 | |
US10733197B2 (en) | Method and apparatus for providing information based on artificial intelligence | |
WO2021253904A1 (zh) | 测试案例集生成方法、装置、设备及计算机可读存储介质 | |
CN109829629B (zh) | 风险分析报告的生成方法、装置、计算机设备和存储介质 | |
CN108388558B (zh) | 问题匹配方法、装置、客服机器人和存储介质 | |
CN107590224B (zh) | 基于大数据的用户偏好分析方法与装置 | |
CN111666401B (zh) | 基于图结构的公文推荐方法、装置、计算机设备及介质 | |
CN110110038B (zh) | 话务预测方法、装置、服务器及存储介质 | |
CN112328762A (zh) | 基于文本生成模型的问答语料生成方法和装置 | |
CN113094578B (zh) | 基于深度学习的内容推荐方法、装置、设备及存储介质 | |
CN110825956A (zh) | 一种信息流推荐方法、装置、计算机设备及存储介质 | |
CN110866093A (zh) | 机器问答方法及装置 | |
CN107943792B (zh) | 一种语句分析方法、装置及终端设备、存储介质 | |
CN110362798B (zh) | 裁决信息检索分析方法、装置、计算机设备和存储介质 | |
CN114840671A (zh) | 对话生成方法、模型的训练方法、装置、设备及介质 | |
CN113343108B (zh) | 推荐信息处理方法、装置、设备及存储介质 | |
CN112926308B (zh) | 匹配正文的方法、装置、设备、存储介质以及程序产品 | |
CN116501960B (zh) | 内容检索方法、装置、设备及介质 | |
WO2020233381A1 (zh) | 基于语音识别的服务请求方法、装置及计算机设备 | |
CN112632258A (zh) | 文本数据处理方法、装置、计算机设备和存储介质 | |
CN113704436A (zh) | 基于会话场景的用户画像标签挖掘方法及装置 | |
CN114253990A (zh) | 数据库查询方法、装置、计算机设备和存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |