CN106649694A - 语音交互中确定用户意图的方法及装置 - Google Patents

语音交互中确定用户意图的方法及装置 Download PDF

Info

Publication number
CN106649694A
CN106649694A CN201611178869.0A CN201611178869A CN106649694A CN 106649694 A CN106649694 A CN 106649694A CN 201611178869 A CN201611178869 A CN 201611178869A CN 106649694 A CN106649694 A CN 106649694A
Authority
CN
China
Prior art keywords
data information
text data
classification
probability matrix
user
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201611178869.0A
Other languages
English (en)
Other versions
CN106649694B (zh
Inventor
崇伟峰
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Unisound Intelligent Technology Co Ltd
Original Assignee
Beijing Yunzhisheng Information Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Yunzhisheng Information Technology Co Ltd filed Critical Beijing Yunzhisheng Information Technology Co Ltd
Priority to CN201611178869.0A priority Critical patent/CN106649694B/zh
Publication of CN106649694A publication Critical patent/CN106649694A/zh
Application granted granted Critical
Publication of CN106649694B publication Critical patent/CN106649694B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/35Clustering; Classification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Machine Translation (AREA)

Abstract

本发明是关于一种语音交互中确定用户意图的方法及装置,其中,方法包括:接收用户当前输入的语音数据信息;对所述语音数据信息进行识别,得到所述语音数据信息对应的文本数据信息;获取根据所述用户的日志记录得到的用户意图分类模型和目标转移概率矩阵;根据所述用户意图分类模型和所述目标转移概率矩阵确定所述文本数据信息所属的目标意图类别;在所述目标意图类别对应的数据库中查找与所述文本数据信息对应的应答信息。通过该技术方案,不但可以为用户提供更准确的应答信息,还可以减少查找时间,提高查找效率,提升用户的使用体验。

Description

语音交互中确定用户意图的方法及装置
技术领域
本发明涉及数据分类技术领域,尤其涉及一种语音交互中确定用户意图的方法及装置。
背景技术
相关技术中,当终端等设备接收到用户输入的语音查询请求时,会根据该查询请求从预设数据库中查找与该请求对应的答案或者回复,但在整个预设数据库中进行查找,不但不能保证查找到的答案或者回复的准确性,而且查找时间也相对较长。
发明内容
本发明实施例提供一种语音交互中确定用户意图的方法及装置,用以实现在保证查找的答案或者回复的准确率的基础上,提高查找效率,从而提升用户的使用体验。
根据本发明实施例的第一方面,提供一种语音交互中确定用户意图的方法,包括:
接收用户当前输入的语音数据信息;
对所述语音数据信息进行识别,得到所述语音数据信息对应的文本数据信息;
获取根据所述用户的日志记录得到的用户意图分类模型和目标转移概率矩阵;
根据所述用户意图分类模型和所述目标转移概率矩阵确定所述文本数据信息所属的目标意图类别;
在所述目标意图类别对应的数据库中查找与所述文本数据信息对应的应答信息。
在该实施例中,在接收到用户当前输入的语音数据信息后,先确定语音数据信息对应的文本数据信息所属的目标意图类别,进而在目标意图类别对应的数据中查找与其对应的应答信息,这样,不但可以为用户提供更准确的应答信息,还可以减少查找时间,提高查找效率,提升用户的使用体验。
在一个实施例中,所述获取根据所述用户的日志记录得到的用户意图分类模型和目标转移概率矩阵,包括:
获取预设的卷积神经网络模型和预设的转移概率矩阵;
根据预设的文本模板从所述日志记录中提取出意图分类训练语料;
利用所述意图分类训练语料和所述预设的卷积神经网络模型进行训练,得到所述用户意图分类模型;
利用预设上下文训练语料和预设的转移概率矩阵进行训练,得到初始转移概率矩阵;
利用所述日志记录修正所述初始概率矩阵,得到所述目标转移概率矩阵。
在该实施例中,利用所述意图分类训练语料和所述预设的卷积神经网络模型进行训练,得到所述用户意图分类模型,利用预设上下文训练语料和预设的转移概率矩阵进行训练,得到初始转移概率矩阵,并根据用户意图历史日志记录修正初始转移概率矩阵得到目标转移概率矩阵,这样,根据用户意图分类模型和目标转移概率矩阵进行意图分类,可以保证分类结果的准确性。
在一个实施例中,所述文本数据信息包括以下至少一项:文本信息和拼音信息;
所述意图分类训练语料包括以下至少一种形式:
文本语料和拼音预料。
在该实施例中,在进行卷积神经网络训练时,不但可以采用训练语料的文本形式进行训练,还可以采用训练语料的拼音形式进行训练,这样,可以有效的过滤噪音,避免错误累积。
在一个实施例中,所述根据所述用户意图分类模型和所述目标转移概率矩阵确定所述文本数据信息所属的目标意图类别,包括:
将所述文本数据信息作为所述用户意图分类模型的输入,得到所述文本数据信息对应的第一分类结果;
获取所述文本数据信息对应的上一句文本数据信息所属的意图类别;
根据所述上一句文本数据信息所属的意图类别和所述目标转移概率矩阵,确定所述文本数据信息对应的第二分类结果;
根据所述第一分类结果和所述第二分类结果确定所述文本数据信息所属的目标意图分类。
在一个实施例中,所述根据所述第一分类结果和所述第二分类结果确定所述文本数据信息所属的目标意图分类,包括:
根据所述第一分类结果和所述第二分类结果的乘积,确定所述文本数据信息所属的目标意图分类。
在该实施例中,将文本数据信息作为用户意图分类模型的输入,得到文本数据信息对应的第一分类结果,该第一分类结果表明文本数据信息属于各个意图分类的概率,其是一个1*N维的特征向量,并根据上一句文本数据信息和目标转移概率矩阵计算出文本数据信息属于每个意图类别的概率矩阵,该矩阵可以是N*N维的,进而根据两者的乘积得到文本数据信息属于每个意图类别的总概率,进而将总概率值最高对应的意图类别确定为目标意图类别。
根据本发明实施例的第二方面,提供一种语音交互中确定用户意图的装置,包括:
接收模块,用于接收用户当前输入的语音数据信息;
识别模块,用于对所述语音数据信息进行识别,得到所述语音数据信息对应的文本数据信息;
获取模块,用于获取根据所述用户的日志记录得到的用户意图分类模型和目标转移概率矩阵;
确定模块,用于根据所述用户意图分类模型和所述目标转移概率矩阵确定所述文本数据信息所属的目标意图类别;
查找模块,用于在所述目标意图类别对应的数据库中查找与所述文本数据信息对应的应答信息。
在一个实施例中,所述获取模块包括:
第一获取子模块,用于获取预设的卷积神经网络模型和预设的转移概率矩阵;
提取子模块,用于根据预设的文本模板从所述日志记录中提取出意图分类训练语料;
第一训练子模块,用于利用所述意图分类训练语料和所述预设的卷积神经网络模型进行训练,得到所述用户意图分类模型;
第二训练子模块,用于利用预设上下文训练语料和预设的转移概率矩阵进行训练,得到初始转移概率矩阵;
修正子模块,用于利用所述日志记录修正所述初始概率矩阵,得到所述目标转移概率矩阵。
在一个实施例中,所述文本数据信息包括以下至少一项:文本信息和拼音信息;
所述意图分类训练语料包括以下至少一种形式:
文本语料和拼音预料。
在一个实施例中,所述确定模块包括:
处理子模块,用于将所述文本数据信息作为所述用户意图分类模型的输入,得到所述文本数据信息对应的第一分类结果;
第二获取子模块,用于获取所述文本数据信息对应的上一句文本数据信息所属的意图类别;
第一确定子模块,用于根据所述上一句文本数据信息所属的意图类别和所述目标转移概率矩阵,确定所述文本数据信息对应的第二分类结果;
第二确定子模块,用于根据所述第一分类结果和所述第二分类结果确定所述文本数据信息所属的目标意图分类。
在一个实施例中,所述第二确定子模块用于:
根据所述第一分类结果和所述第二分类结果的乘积,确定所述文本数据信息所属的目标意图分类。
应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本发明。
本发明的其它特征和优点将在随后的说明书中阐述,并且,部分地从说明书中变得显而易见,或者通过实施本发明而了解。本发明的目的和其他优点可通过在所写的说明书、权利要求书、以及附图中所特别指出的结构来实现和获得。
下面通过附图和实施例,对本发明的技术方案做进一步的详细描述。
附图说明
此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本发明的实施例,并与说明书一起用于解释本发明的原理。
图1是根据一示例性实施例示出的一种语音交互中确定用户意图的方法的流程图。
图2是根据一示例性实施例示出的一种语音交互中确定用户意图的方法中步骤S103的流程图。
图3是根据一示例性实施例示出的一种语音交互中确定用户意图的方法中步骤S104的流程图。
图4是根据一示例性实施例示出的一种语音交互中确定用户意图的装置的框图。
图5是根据一示例性实施例示出的一种语音交互中确定用户意图的装置中获取模块的框图。
图6是根据一示例性实施例示出的一种语音交互中确定用户意图的装置中确定模块的框图。
具体实施方式
这里将详细地对示例性实施例进行说明,其示例表示在附图中。下面的描述涉及附图时,除非另有表示,不同附图中的相同数字表示相同或相似的要素。以下示例性实施例中所描述的实施方式并不代表与本发明相一致的所有实施方式。相反,它们仅是与如所附权利要求书中所详述的、本发明的一些方面相一致的装置和方法的例子。
图1是根据一示例性实施例示出的一种语音交互中确定用户意图的方法的流程图。该语音交互中确定用户意图的方法应用于终端设备中,该终端设备可以是移动电话,计算机,数字广播终端,消息收发设备,游戏控制台,平板设备,医疗设备,健身设备,个人数字助理等任一具有语音识别功能的设备。如图1所示,该方法包括步骤S101-S105:
在步骤S101中,接收用户当前输入的语音数据信息;
在步骤S102中,对语音数据信息进行识别,得到语音数据信息对应的文本数据信息;
在步骤S103中,获取根据用户的日志记录得到的用户意图分类模型和目标转移概率矩阵;
其中,用户的日志记录可以是之前对语音数据信息进行意图分类的历史记录。而目标转移概率矩阵是根据语音数据信息的上文确定该语音数据信息属于某个意图类别的概率。即目标转移概率矩阵不关心当前的语音数据信息属于哪个意图类别,只获取上一个语音数据信息属于哪个意图类别。根据上一个语音数据信息的意图类别,预测当前的语音数据信息属于各个意图类别的概率。
在步骤S104中,根据用户意图分类模型和目标转移概率矩阵确定文本数据信息所属的目标意图类别;
在步骤S105中,在目标意图类别对应的数据库中查找与文本数据信息对应的应答信息。
在该实施例中,在接收到用户当前输入的语音数据信息后,先确定语音数据信息对应的文本数据信息所属的目标意图类别,进而在目标意图类别对应的数据中查找与其对应的应答信息,这样,不但可以为用户提供更准确的应答信息,还可以减少查找时间,提高查找效率,提升用户的使用体验。
图2是根据一示例性实施例示出的一种语音交互中确定用户意图的方法中步骤S103的流程图。
如图2所示,在一个实施例中,上述步骤S103包括步骤S201-S205:
在步骤S201中,获取预设的卷积神经网络模型和预设的转移概率矩阵;
在步骤S202中,根据预设的文本模板从日志记录中提取出意图分类训练语料;
预设的文本模板是一类语言规范。利用模板从日志中提取出规范的语言,作为意图分类训练语料。一类模板提取出的语言用于训练相应的分类,因此,可以预设多类模板。
在步骤S203中,利用意图分类训练语料和预设的卷积神经网络模型进行训练,得到用户意图分类模型;
意图可以分层级的,如歌曲的意图,下面分搜歌曲、搜歌手、播放等意图,因此,意图分类训练语料是有层级的,训练出的用户意图分类模型也是有层级的。先训练出最下层的分类,逐层向上抽取,得到上层分类。每层训练时输入的语料是相同的,但是训练的目标是不同的,训练的参数和不变的参数是不同的。
在步骤S204中,利用预设上下文训练语料和预设的转移概率矩阵进行训练,得到初始转移概率矩阵;
在步骤S205中,利用日志记录修正初始概率矩阵,得到目标转移概率矩阵。
其中,可以先人为的用一些语料训练得到初始转移概率矩阵,后期针对每个用户的日志,可以不断的修正该用户的转移概率矩阵,得到与用户对应的目标转移概率矩阵。
在该实施例中,利用意图分类训练语料和预设的卷积神经网络模型进行训练,得到用户意图分类模型,利用预设上下文训练语料和预设的转移概率矩阵进行训练,得到初始转移概率矩阵,并根据用户意图历史日志记录修正初始转移概率矩阵得到目标转移概率矩阵,这样,根据用户意图分类模型和目标转移概率矩阵进行意图分类,可以保证分类结果的准确性。
在一个实施例中,所述文本数据信息包括以下至少一项:文本信息和拼音信息;
意图分类训练语料包括以下至少一种形式:
文本语料和拼音预料。
在该实施例中,在进行卷积神经网络训练时,不但可以采用训练语料的文本形式进行训练,还可以采用训练语料的拼音形式进行训练,这样,可以有效的过滤噪音,避免错误累积。
图3是根据一示例性实施例示出的一种语音交互中确定用户意图的方法中步骤S104的流程图。
如图3所示,在一个实施例中,上述步骤S104包括步骤S301-S304:
在步骤S301中,将文本数据信息作为用户意图分类模型的输入,得到文本数据信息对应的第一分类结果;
在步骤S302中,获取文本数据信息对应的上一句文本数据信息所属的意图类别;
在步骤S303中,根据上一句文本数据信息所属的意图类别和目标转移概率矩阵,确定文本数据信息对应的第二分类结果;
在步骤S304中,根据第一分类结果和第二分类结果确定文本数据信息所属的目标意图分类。
在一个实施例中,上述步骤S304可以包括:
根据第一分类结果和第二分类结果的乘积,确定文本数据信息所属的目标意图分类。
在该实施例中,将文本数据信息作为用户意图分类模型的输入,得到文本数据信息对应的第一分类结果,该第一分类结果表明文本数据信息属于各个意图分类的概率,其是一个1*N维的特征向量,并根据上一句文本数据信息和目标转移概率矩阵计算出文本数据信息属于每个意图类别的概率矩阵,该矩阵可以是N*N维的,进而根据两者的乘积得到文本数据信息属于每个意图类别的总概率,进而将总概率值最高对应的意图类别确定为目标意图类别。
下述为本发明装置实施例,可以用于执行本发明方法实施例。
图4是根据一示例性实施例示出的一种语音交互中确定用户意图的装置的框图,该装置可以通过软件、硬件或者两者的结合实现成为终端设备的部分或者全部。如图4所示,该语音交互中确定用户意图的装置包括:
接收模块41,用于接收用户当前输入的语音数据信息;
识别模块42,用于对所述语音数据信息进行识别,得到所述语音数据信息对应的文本数据信息;
获取模块43,用于获取根据所述用户的日志记录得到的用户意图分类模型和目标转移概率矩阵;
确定模块44,用于根据所述用户意图分类模型和所述目标转移概率矩阵确定所述文本数据信息所属的目标意图类别;
查找模块45,用于在所述目标意图类别对应的数据库中查找与所述文本数据信息对应的应答信息。
在该实施例中,在接收到用户当前输入的语音数据信息后,先确定语音数据信息对应的文本数据信息所属的目标意图类别,进而在目标意图类别对应的数据中查找与其对应的应答信息,这样,不但可以为用户提供更准确的应答信息,还可以减少查找时间,提高查找效率,提升用户的使用体验。
图5是根据一示例性实施例示出的一种语音交互中确定用户意图的装置中获取模块的框图。
如图5所示,在一个实施例中,所述获取模块43包括:
第一获取子模块51,用于获取预设的卷积神经网络模型和预设的转移概率矩阵;
提取子模块52,用于根据预设的文本模板从所述日志记录中提取出意图分类训练语料;
第一训练子模块53,用于利用所述意图分类训练语料和所述预设的卷积神经网络模型进行训练,得到所述用户意图分类模型;
第二训练子模块54,用于利用预设上下文训练语料和预设的转移概率矩阵进行训练,得到初始转移概率矩阵;
修正子模块55,用于利用所述日志记录修正所述初始概率矩阵,得到所述目标转移概率矩阵。
其中,可以先人为的用一些语料训练得到初始转移概率矩阵,后期针对每个用户的日志,可以不断的修正该用户的转移概率矩阵,得到与用户对应的目标转移概率矩阵。
在该实施例中,利用所述意图分类训练语料和所述预设的卷积神经网络模型进行训练,得到所述用户意图分类模型,利用预设上下文训练语料和预设的转移概率矩阵进行训练,得到初始转移概率矩阵,并根据用户意图历史日志记录修正初始转移概率矩阵得到目标转移概率矩阵,这样,根据用户意图分类模型和目标转移概率矩阵进行意图分类,可以保证分类结果的准确性。
在一个实施例中,所述文本数据信息包括以下至少一项:文本信息和拼音信息;
所述意图分类训练语料包括以下至少一种形式:
文本语料和拼音预料。
在该实施例中,在进行卷积神经网络训练时,不但可以采用训练语料的文本形式进行训练,还可以采用训练语料的拼音形式进行训练,这样,可以有效的过滤噪音,避免错误累积。
图6是根据一示例性实施例示出的一种语音交互中确定用户意图的装置中确定模块的框图。
如图6所示,在一个实施例中,所述确定模块44包括:
处理子模块61,用于将所述文本数据信息作为所述用户意图分类模型的输入,得到所述文本数据信息对应的第一分类结果;
第二获取子模块62,用于获取所述文本数据信息对应的上一句文本数据信息所属的意图类别;
第一确定子模块63,用于根据所述上一句文本数据信息所属的意图类别和所述目标转移概率矩阵,确定所述文本数据信息对应的第二分类结果;
第二确定子模块64,用于根据所述第一分类结果和所述第二分类结果确定所述文本数据信息所属的目标意图分类。
在一个实施例中,所述第二确定子模块62用于:
根据所述第一分类结果和所述第二分类结果的乘积,确定所述文本数据信息所属的目标意图分类。
在该实施例中,将文本数据信息作为用户意图分类模型的输入,得到文本数据信息对应的第一分类结果,该第一分类结果表明文本数据信息属于各个意图分类的概率,其是一个1*N维的特征向量,并根据上一句文本数据信息和目标转移概率矩阵计算出文本数据信息属于每个意图类别的概率矩阵,该矩阵可以是N*N维的,进而根据两者的乘积得到文本数据信息属于每个意图类别的总概率,进而将总概率值最高对应的意图类别确定为目标意图类别。
本领域内的技术人员应明白,本发明的实施例可提供为方法、系统、或计算机程序产品。因此,本发明可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器和光学存储器等)上实施的计算机程序产品的形式。
本发明是参照根据本发明实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
显然,本领域的技术人员可以对本发明进行各种改动和变型而不脱离本发明的精神和范围。这样,倘若本发明的这些修改和变型属于本发明权利要求及其等同技术的范围之内,则本发明也意图包含这些改动和变型在内。

Claims (10)

1.一种语音交互中确定用户意图的方法,其特征在于,包括:
接收用户当前输入的语音数据信息;
对所述语音数据信息进行识别,得到所述语音数据信息对应的文本数据信息;
获取根据所述用户的日志记录得到的用户意图分类模型和目标转移概率矩阵;
根据所述用户意图分类模型和所述目标转移概率矩阵确定所述文本数据信息所属的目标意图类别;
在所述目标意图类别对应的数据库中查找与所述文本数据信息对应的应答信息。
2.根据权利要求1所述的方法,其特征在于,所述获取根据所述用户的日志记录得到的用户意图分类模型和目标转移概率矩阵,包括:
获取预设的卷积神经网络模型和预设的转移概率矩阵;
根据预设的文本模板从所述日志记录中提取出意图分类训练语料;
利用所述意图分类训练语料和所述预设的卷积神经网络模型进行训练,得到所述用户意图分类模型;
利用预设上下文训练语料和预设的转移概率矩阵进行训练,得到初始转移概率矩阵;
利用所述日志记录修正所述初始概率矩阵,得到所述目标转移概率矩阵。
3.根据权利要求1所述的方法,其特征在于,所述文本数据信息包括以下至少一项:文本信息和拼音信息;
所述意图分类训练语料包括以下至少一种形式:
文本语料和拼音预料。
4.根据权利要求1所述的方法,其特征在于,所述根据所述用户意图分类模型和所述目标转移概率矩阵确定所述文本数据信息所属的目标意图类别,包括:
将所述文本数据信息作为所述用户意图分类模型的输入,得到所述文本数据信息对应的第一分类结果;
获取所述文本数据信息对应的上一句文本数据信息所属的意图类别;
根据所述上一句文本数据信息所属的意图类别和所述目标转移概率矩阵,确定所述文本数据信息对应的第二分类结果;
根据所述第一分类结果和所述第二分类结果确定所述文本数据信息所属的目标意图分类。
5.根据权利要求4所述的方法,其特征在于,所述根据所述第一分类结果和所述第二分类结果确定所述文本数据信息所属的目标意图分类,包括:
根据所述第一分类结果和所述第二分类结果的乘积,确定所述文本数据信息所属的目标意图分类。
6.一种语音交互中确定用户意图的装置,其特征在于,包括:
接收模块,用于接收用户当前输入的语音数据信息;
识别模块,用于对所述语音数据信息进行识别,得到所述语音数据信息对应的文本数据信息;
获取模块,用于获取根据所述用户的日志记录得到的用户意图分类模型和目标转移概率矩阵;
确定模块,用于根据所述用户意图分类模型和所述目标转移概率矩阵确定所述文本数据信息所属的目标意图类别;
查找模块,用于在所述目标意图类别对应的数据库中查找与所述文本数据信息对应的应答信息。
7.根据权利要求6所述的装置,其特征在于,所述获取模块包括:
第一获取子模块,用于获取预设的卷积神经网络模型和预设的转移概率矩阵;
提取子模块,用于根据预设的文本模板从所述日志记录中提取出意图分类训练语料;
第一训练子模块,用于利用所述意图分类训练语料和所述预设的卷积神经网络模型进行训练,得到所述用户意图分类模型;
第二训练子模块,用于利用预设上下文训练语料和预设的转移概率矩阵进行训练,得到初始转移概率矩阵;
修正子模块,用于利用所述日志记录修正所述初始概率矩阵,得到所述目标转移概率矩阵。
8.根据权利要求6所述的装置,其特征在于,所述文本数据信息包括以下至少一项:文本信息和拼音信息;
所述意图分类训练语料包括以下至少一种形式:
文本语料和拼音预料。
9.根据权利要求6所述的装置,其特征在于,所述确定模块包括:
处理子模块,用于将所述文本数据信息作为所述用户意图分类模型的输入,得到所述文本数据信息对应的第一分类结果;
第二获取子模块,用于获取所述文本数据信息对应的上一句文本数据信息所属的意图类别;
第一确定子模块,用于根据所述上一句文本数据信息所属的意图类别和所述目标转移概率矩阵,确定所述文本数据信息对应的第二分类结果;
第二确定子模块,用于根据所述第一分类结果和所述第二分类结果确定所述文本数据信息所属的目标意图分类。
10.根据权利要求9所述的装置,其特征在于,所述第二确定子模块用于:
根据所述第一分类结果和所述第二分类结果的乘积,确定所述文本数据信息所属的目标意图分类。
CN201611178869.0A 2016-12-19 2016-12-19 语音交互中确定用户意图的方法及装置 Active CN106649694B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201611178869.0A CN106649694B (zh) 2016-12-19 2016-12-19 语音交互中确定用户意图的方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201611178869.0A CN106649694B (zh) 2016-12-19 2016-12-19 语音交互中确定用户意图的方法及装置

Publications (2)

Publication Number Publication Date
CN106649694A true CN106649694A (zh) 2017-05-10
CN106649694B CN106649694B (zh) 2020-05-26

Family

ID=58834824

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201611178869.0A Active CN106649694B (zh) 2016-12-19 2016-12-19 语音交互中确定用户意图的方法及装置

Country Status (1)

Country Link
CN (1) CN106649694B (zh)

Cited By (26)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107357875A (zh) * 2017-07-04 2017-11-17 北京奇艺世纪科技有限公司 一种语音搜索方法、装置及电子设备
CN109146610A (zh) * 2018-07-16 2019-01-04 众安在线财产保险股份有限公司 一种智能保险推荐方法、装置及智能保险机器人设备
CN109410948A (zh) * 2018-09-07 2019-03-01 北京三快在线科技有限公司 通信方法、装置、系统、计算机设备以及可读存储介质
CN109616108A (zh) * 2018-11-29 2019-04-12 北京羽扇智信息科技有限公司 多轮对话交互处理方法、装置、电子设备及存储介质
CN109902158A (zh) * 2019-01-24 2019-06-18 平安科技(深圳)有限公司 语音交互方法、装置、计算机设备及存储介质
CN110019777A (zh) * 2017-09-05 2019-07-16 腾讯科技(深圳)有限公司 一种信息分类的方法及设备
WO2019153522A1 (zh) * 2018-02-09 2019-08-15 卫盈联信息技术(深圳)有限公司 智能交互方法、电子装置及存储介质
CN110188199A (zh) * 2019-05-21 2019-08-30 北京鸿联九五信息产业有限公司 一种用于智能语音交互的文本分类方法
CN110309273A (zh) * 2018-03-09 2019-10-08 北京国双科技有限公司 问答方法和装置
CN110377713A (zh) * 2019-07-16 2019-10-25 杭州微洱网络科技有限公司 一种基于概率转移改善问答系统上下文的方法
CN110399465A (zh) * 2019-07-30 2019-11-01 北京百度网讯科技有限公司 用于处理信息的方法和装置
CN110517672A (zh) * 2018-05-03 2019-11-29 阿里巴巴集团控股有限公司 用户意图识别方法、用户指令执行方法、系统及设备
TWI679548B (zh) * 2018-05-09 2019-12-11 鼎新電腦股份有限公司 虛擬助理的自動學習方法及系統
CN110830661A (zh) * 2019-11-11 2020-02-21 科大国创软件股份有限公司 一种用于智能语音客服的自动拨测方法
CN110992940A (zh) * 2019-11-25 2020-04-10 百度在线网络技术(北京)有限公司 语音交互的方法、装置、设备和计算机可读存储介质
CN110990598A (zh) * 2019-11-18 2020-04-10 北京声智科技有限公司 资源检索方法、装置、电子设备及计算机可读存储介质
CN111050002A (zh) * 2019-12-17 2020-04-21 北京鸿博信通科技有限公司 一种智能电话总机及其工作方法和系统
CN111147905A (zh) * 2019-12-31 2020-05-12 深圳Tcl数字技术有限公司 媒体资源查找方法、电视机、存储介质及装置
CN111159346A (zh) * 2019-12-27 2020-05-15 深圳物控智联科技有限公司 基于意图识别的智能答疑方法、服务器及存储介质
CN111309990A (zh) * 2018-12-12 2020-06-19 北京嘀嘀无限科技发展有限公司 一种语句应答方法及装置
WO2020140612A1 (zh) * 2019-01-04 2020-07-09 平安科技(深圳)有限公司 基于卷积神经网络的意图识别方法、装置、设备及介质
CN111782792A (zh) * 2020-08-05 2020-10-16 支付宝(杭州)信息技术有限公司 用于信息处理的方法和装置
CN112257427A (zh) * 2020-10-23 2021-01-22 岭东核电有限公司 作业问题处理方法、装置、计算机设备和存储介质
CN112380331A (zh) * 2020-11-16 2021-02-19 北京京东尚科信息技术有限公司 信息推送的方法和装置
WO2021098318A1 (zh) * 2019-11-21 2021-05-27 北京沃东天骏信息技术有限公司 应答方法、终端及存储介质
WO2023212993A1 (zh) * 2022-05-05 2023-11-09 青岛海尔科技有限公司 设备控制方法、存储介质及电子装置

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105094315A (zh) * 2015-06-25 2015-11-25 百度在线网络技术(北京)有限公司 基于人工智能的人机智能聊天的方法和装置
US20150370787A1 (en) * 2014-06-18 2015-12-24 Microsoft Corporation Session Context Modeling For Conversational Understanding Systems
CN105389307A (zh) * 2015-12-02 2016-03-09 上海智臻智能网络科技股份有限公司 语句意图类别识别方法及装置
CN106095834A (zh) * 2016-06-01 2016-11-09 竹间智能科技(上海)有限公司 基于话题的智能对话方法及系统

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20150370787A1 (en) * 2014-06-18 2015-12-24 Microsoft Corporation Session Context Modeling For Conversational Understanding Systems
CN105094315A (zh) * 2015-06-25 2015-11-25 百度在线网络技术(北京)有限公司 基于人工智能的人机智能聊天的方法和装置
CN105389307A (zh) * 2015-12-02 2016-03-09 上海智臻智能网络科技股份有限公司 语句意图类别识别方法及装置
CN106095834A (zh) * 2016-06-01 2016-11-09 竹间智能科技(上海)有限公司 基于话题的智能对话方法及系统

Cited By (33)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107357875A (zh) * 2017-07-04 2017-11-17 北京奇艺世纪科技有限公司 一种语音搜索方法、装置及电子设备
CN107357875B (zh) * 2017-07-04 2021-09-10 北京奇艺世纪科技有限公司 一种语音搜索方法、装置及电子设备
CN110019777A (zh) * 2017-09-05 2019-07-16 腾讯科技(深圳)有限公司 一种信息分类的方法及设备
WO2019153522A1 (zh) * 2018-02-09 2019-08-15 卫盈联信息技术(深圳)有限公司 智能交互方法、电子装置及存储介质
CN110309273A (zh) * 2018-03-09 2019-10-08 北京国双科技有限公司 问答方法和装置
CN110517672B (zh) * 2018-05-03 2023-08-15 阿里巴巴集团控股有限公司 用户意图识别方法、用户指令执行方法、系统及设备
CN110517672A (zh) * 2018-05-03 2019-11-29 阿里巴巴集团控股有限公司 用户意图识别方法、用户指令执行方法、系统及设备
TWI679548B (zh) * 2018-05-09 2019-12-11 鼎新電腦股份有限公司 虛擬助理的自動學習方法及系統
CN109146610A (zh) * 2018-07-16 2019-01-04 众安在线财产保险股份有限公司 一种智能保险推荐方法、装置及智能保险机器人设备
CN109410948A (zh) * 2018-09-07 2019-03-01 北京三快在线科技有限公司 通信方法、装置、系统、计算机设备以及可读存储介质
CN109616108A (zh) * 2018-11-29 2019-04-12 北京羽扇智信息科技有限公司 多轮对话交互处理方法、装置、电子设备及存储介质
CN109616108B (zh) * 2018-11-29 2022-05-31 出门问问创新科技有限公司 多轮对话交互处理方法、装置、电子设备及存储介质
CN111309990B (zh) * 2018-12-12 2024-01-23 北京嘀嘀无限科技发展有限公司 一种语句应答方法及装置
CN111309990A (zh) * 2018-12-12 2020-06-19 北京嘀嘀无限科技发展有限公司 一种语句应答方法及装置
WO2020140612A1 (zh) * 2019-01-04 2020-07-09 平安科技(深圳)有限公司 基于卷积神经网络的意图识别方法、装置、设备及介质
CN109902158A (zh) * 2019-01-24 2019-06-18 平安科技(深圳)有限公司 语音交互方法、装置、计算机设备及存储介质
CN110188199A (zh) * 2019-05-21 2019-08-30 北京鸿联九五信息产业有限公司 一种用于智能语音交互的文本分类方法
CN110377713B (zh) * 2019-07-16 2023-09-15 广州探域科技有限公司 一种基于概率转移改善问答系统上下文的方法
CN110377713A (zh) * 2019-07-16 2019-10-25 杭州微洱网络科技有限公司 一种基于概率转移改善问答系统上下文的方法
CN110399465A (zh) * 2019-07-30 2019-11-01 北京百度网讯科技有限公司 用于处理信息的方法和装置
CN110830661A (zh) * 2019-11-11 2020-02-21 科大国创软件股份有限公司 一种用于智能语音客服的自动拨测方法
CN110990598A (zh) * 2019-11-18 2020-04-10 北京声智科技有限公司 资源检索方法、装置、电子设备及计算机可读存储介质
CN110990598B (zh) * 2019-11-18 2020-11-27 北京声智科技有限公司 资源检索方法、装置、电子设备及计算机可读存储介质
WO2021098318A1 (zh) * 2019-11-21 2021-05-27 北京沃东天骏信息技术有限公司 应答方法、终端及存储介质
CN110992940A (zh) * 2019-11-25 2020-04-10 百度在线网络技术(北京)有限公司 语音交互的方法、装置、设备和计算机可读存储介质
US11250854B2 (en) 2019-11-25 2022-02-15 Baidu Online Network Technology (Beijing) Co., Ltd. Method and apparatus for voice interaction, device and computer-readable storage medium
CN111050002A (zh) * 2019-12-17 2020-04-21 北京鸿博信通科技有限公司 一种智能电话总机及其工作方法和系统
CN111159346A (zh) * 2019-12-27 2020-05-15 深圳物控智联科技有限公司 基于意图识别的智能答疑方法、服务器及存储介质
CN111147905A (zh) * 2019-12-31 2020-05-12 深圳Tcl数字技术有限公司 媒体资源查找方法、电视机、存储介质及装置
CN111782792A (zh) * 2020-08-05 2020-10-16 支付宝(杭州)信息技术有限公司 用于信息处理的方法和装置
CN112257427A (zh) * 2020-10-23 2021-01-22 岭东核电有限公司 作业问题处理方法、装置、计算机设备和存储介质
CN112380331A (zh) * 2020-11-16 2021-02-19 北京京东尚科信息技术有限公司 信息推送的方法和装置
WO2023212993A1 (zh) * 2022-05-05 2023-11-09 青岛海尔科技有限公司 设备控制方法、存储介质及电子装置

Also Published As

Publication number Publication date
CN106649694B (zh) 2020-05-26

Similar Documents

Publication Publication Date Title
CN106649694A (zh) 语音交互中确定用户意图的方法及装置
CN110795543B (zh) 基于深度学习的非结构化数据抽取方法、装置及存储介质
US10777207B2 (en) Method and apparatus for verifying information
CN106649696A (zh) 信息分类方法及装置
US8886635B2 (en) Apparatus and method for recognizing content using audio signal
CN111046133A (zh) 基于图谱化知识库的问答方法、设备、存储介质及装置
CN107871506A (zh) 语音识别功能的唤醒方法及装置
CN107610695A (zh) 驾驶人语音唤醒指令词权重的动态调整方法
CN112533051A (zh) 弹幕信息显示方法、装置、计算机设备和存储介质
CN109408821B (zh) 一种语料生成方法、装置、计算设备及存储介质
CN114465737B (zh) 一种数据处理方法、装置、计算机设备及存储介质
CN106782529B (zh) 语音识别的唤醒词选择方法及装置
US20230093746A1 (en) Video loop recognition
CN106601236A (zh) 语音识别方法及装置
CN108519998B (zh) 基于知识图谱的问题引导方法及装置
CN112528637A (zh) 文本处理模型训练方法、装置、计算机设备和存储介质
CN106328145A (zh) 语音修正方法及装置
CN111984821A (zh) 确定视频动态封面的方法、装置、存储介质及电子设备
CN113094478B (zh) 表情回复方法、装置、设备及存储介质
CN112259078A (zh) 一种音频识别模型的训练和非正常音频识别的方法和装置
CN110610698B (zh) 一种语音标注方法及装置
CN108810625A (zh) 一种多媒体数据的播放控制方法、装置及终端
CN106847273B (zh) 语音识别的唤醒词选择方法及装置
CN108829777A (zh) 一种聊天机器人的问题答复方法及装置
CN114598933A (zh) 一种视频内容处理方法、系统、终端及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
CP03 Change of name, title or address

Address after: Room 101, 1st floor, building 1, Xisanqi building materials City, Haidian District, Beijing 100096

Patentee after: Yunzhisheng Intelligent Technology Co.,Ltd.

Address before: 100191 Beijing, Huayuan Road, Haidian District No. 2 peony technology building, 5 floor, A503

Patentee before: BEIJING UNISOUND INFORMATION TECHNOLOGY Co.,Ltd.

CP03 Change of name, title or address