CN113435196A - 意图识别方法、装置、设备及存储介质 - Google Patents

意图识别方法、装置、设备及存储介质 Download PDF

Info

Publication number
CN113435196A
CN113435196A CN202110692211.6A CN202110692211A CN113435196A CN 113435196 A CN113435196 A CN 113435196A CN 202110692211 A CN202110692211 A CN 202110692211A CN 113435196 A CN113435196 A CN 113435196A
Authority
CN
China
Prior art keywords
information
voice
historical
current
acquiring
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202110692211.6A
Other languages
English (en)
Other versions
CN113435196B (zh
Inventor
李茂昌
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ping An Technology Shenzhen Co Ltd
Original Assignee
Ping An Technology Shenzhen Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ping An Technology Shenzhen Co Ltd filed Critical Ping An Technology Shenzhen Co Ltd
Priority to CN202110692211.6A priority Critical patent/CN113435196B/zh
Publication of CN113435196A publication Critical patent/CN113435196A/zh
Application granted granted Critical
Publication of CN113435196B publication Critical patent/CN113435196B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/30Semantic analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/279Recognition of textual entities
    • G06F40/289Phrasal analysis, e.g. finite state techniques or chunking
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/48Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use
    • G10L25/51Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for comparison or discrimination

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Health & Medical Sciences (AREA)
  • General Physics & Mathematics (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • Artificial Intelligence (AREA)
  • General Engineering & Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Data Mining & Analysis (AREA)
  • Evolutionary Computation (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Signal Processing (AREA)
  • Evolutionary Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明涉及人工智能,提供一种意图识别方法、装置、设备及存储介质。该方法能够获取语音信息及对话场次,检测语音信息的输出用户是否为预设用户,若否,根据对话场次确定语音信息所在的当前轮次,获取当前轮次中预设用户的对话信息,根据语音信息及对话信息生成当前轮次的当前交互信息,根据当前交互信息对当前交互信息进行向量化处理,得到当前编码信息,获取历史轮次,获取历史轮次中的历史特征信息及历史意愿结果,将当前编码信息、历史特征信息及历史意愿结果输入至意图识别模型中,得到意图识别结果。本发明能够准确并快速的识别出用户意图。此外,本发明还涉及区块链技术,所述意图识别结果可存储于区块链中。

Description

意图识别方法、装置、设备及存储介质
技术领域
本发明涉及人工智能技术领域,尤其涉及一种意图识别方法、装置、设备及存储介质。
背景技术
在电话销售领域中,通常需要对代理人与客户在电话中的交互信息进行挖掘,进而识别交互信息中的情感特征,从而通过交互信息中的情感特征确定出客户的购买意愿。然而,发明人意识到,通过识别出的情感特征无法准确地分析出交互信息所表征出的意图,从而导致这种方式无法准确的识别出客户的购买意愿。
发明内容
鉴于以上内容,有必要提供一种意图识别方法、装置、设备及存储介质,能够准确并快速的识别出用户意图。
一方面,本发明提出一种意图识别方法,所述意图识别方法包括:
获取意图识别请求,并根据所述意图识别请求获取语音信息及对话场次;
检测所述语音信息的输出用户是否为预设用户;
若否,根据所述对话场次确定所述语音信息所在的当前轮次,并获取所述当前轮次中所述预设用户的对话信息;
根据所述语音信息及所述对话信息中的目标特征获得多个文本信息,并根据所述多个文本信息生成所述当前轮次的当前交互信息;
根据所述当前交互信息中的信息分词及实体信息对所述当前交互信息进行向量化处理,得到当前编码信息;
获取所述对话场次中的历史轮次,并从配置库中获取所述历史轮次中的历史特征信息及历史意愿结果;
将所述当前编码信息、所述历史特征信息及所述历史意愿结果输入至预先训练好的意图识别模型中,得到意图识别结果。
根据本发明优选实施例,所述检测所述语音信息的输出用户是否为预设用户包括:
将与所述意图识别请求中所携带的存储路径关联的设备确定为所述语音信息的输出设备;
获取所述输出设备的设备标识,并获取所述预设用户的使用设备的标识作为多个预设标识;
将所述设备标识与所述多个预设标识进行比较;
若所述设备标识与所述预设标识中的任一标识相同,从所述语音信息中提取所述输出用户的语音特征,并对所述语音特征进行编码,得到第一特征向量;
获取所述预设用户的音色特征,并对所述音色特征进行编码,得到第二特征向量;
计算所述第一特征向量与所述第二特征向量的相似度;
若所述相似度小于预设阈值,确定所述输出用户不为所述预设用户。
根据本发明优选实施例,所述根据所述对话场次确定所述语音信息所在的当前轮次包括:
获取与所述对话场次对应的场次日志;
从所述场次日志中获取交互语音,并从所述场次日志中获取所述交互语音的交互时间;
根据所述交互时间从小至大的顺序对所述交互语音进行排序,得到语音序列,所述语音序列中包含有所述语音信息;
根据所述音色特征从所述交互语音中提取所述预设用户的用户语音,并根据所述用户语音对所述语音序列进行切分,得到多个轮次,每个轮次中包含有所述语音序列中切分后的语音;
从所述多个轮次中确定出包含有所述语音信息的轮次作为所述当前轮次。
根据本发明优选实施例,所述根据所述语音信息及所述对话信息中的目标特征获得多个文本信息,并根据所述多个文本信息生成所述当前轮次的当前交互信息包括:
拼接所述对话信息及所述语音信息,得到目标语音;
提取所述目标语音中的所述目标特征,并对所述目标特征进行文本转换,得到所述多个文本信息;
根据预设词典对每个文本信息进行分词处理,得到每个文本信息的分词序列;
从所述预设词典中获取所述分词序列中所有分词的分词权重,并计算每个分词序列中所述分词权重的总和,得到每个文本信息的文本概率;
将所述文本概率最大的所述文本信息确定为所述当前交互信息。
根据本发明优选实施例,所述根据所述当前交互信息中的信息分词及实体信息对所述当前交互信息进行向量化处理,得到当前编码信息包括:
对所述当前交互信息进行分词处理,得到所述信息分词;
从所述信息分词中提取所述当前交互信息的所述实体信息,并确定所述实体信息在所述当前交互信息中的实体位置;
根据所述实体位置对所述当前交互信息进行编码,得到实体编码向量;
获取预设向量映射表;
从所述预设向量映射表中获取所述信息分词的编码值;
根据所述信息分词在所述当前交互信息中的位置拼接所述编码值,得到映射编码向量;
计算所述实体编码信息与所述映射编码向量的平均值,得到所述当前编码信息。
根据本发明优选实施例,在从配置库中获取所述历史轮次中的历史特征信息及历史意愿结果之前,所述意图识别方法还包括:
获取历史交互信息,并对所述历史交互信息进行向量化处理,得到目标编码向量;
基于多个预设矩阵处理所述目标编码向量,得到多个文本矩阵;
从所述多个文本矩阵中提取矩阵对及目标矩阵,所述矩阵对中包括第一矩阵及第二矩阵;
根据所述矩阵对计算所述历史交互信息中每个特征分词在所述历史交互信息中的重要度;
对所述第一矩阵进行转置处理,得到转置结果,并将所述转置结果乘以所述第二矩阵,得到所述历史交互信息中每个特征分词的特征分数;
计算所述第二矩阵的行数,并将所述特征分数除以所述行数的平方值,得到所述重要度;
将所述重要度乘以所述目标矩阵的转置,得到所述历史交互信息的运算矩阵;
计算所述第二矩阵与所述运算矩阵的矩阵和,得到所述历史特征信息;
将所述历史特征信息输入至预先训练好的意图分类器中,得到所述历史意愿结果;
存储所述历史轮次、所述历史特征信息与所述历史意愿结果的映射关系至所述配置库中。
根据本发明优选实施例,所述将所述当前编码信息、所述历史特征信息及所述历史意愿结果输入至预先训练好的意图识别模型中,得到意图识别结果包括:
拼接所述当前编码信息、所述历史特征信息及所述历史意愿结果,得到拼接向量;
将所述拼接向量乘以所述意图识别模型中的权重矩阵,得到运算向量;
计算所述意图识别模型中的偏置值与所述运算向量中每个元素的总和,得到输出向量;
对所述输出向量进行归一化处理,得到概率向量;
将所述概率向量中取值最大的维度确定为目标维度;
获取与所述目标维度对应的类别作为所述意图识别结果。
另一方面,本发明还提出一种意图识别装置,所述意图识别装置包括:
获取单元,用于获取意图识别请求,并根据所述意图识别请求获取语音信息及对话场次;
检测单元,用于检测所述语音信息的输出用户是否为预设用户;
所述获取单元,还用于若否,根据所述对话场次确定所述语音信息所在的当前轮次,并获取所述当前轮次中所述预设用户的对话信息;
生成单元,用于根据所述语音信息及所述对话信息中的目标特征获得多个文本信息,并根据所述多个文本信息生成所述当前轮次的当前交互信息;
处理单元,用于根据所述当前交互信息中的信息分词及实体信息对所述当前交互信息进行向量化处理,得到当前编码信息;
所述获取单元,还用于获取所述对话场次中的历史轮次,并从配置库中获取所述历史轮次中的历史特征信息及历史意愿结果;
输入单元,用于将所述当前编码信息、所述历史特征信息及所述历史意愿结果输入至预先训练好的意图识别模型中,得到意图识别结果。
另一方面,本发明还提出一种电子设备,所述电子设备包括:
存储器,存储计算机可读指令;及
处理器,执行所述存储器中存储的计算机可读指令以实现所述意图识别方法。
另一方面,本发明还提出一种计算机可读存储介质,所述计算机可读存储介质中存储有计算机可读指令,所述计算机可读指令被电子设备中的处理器执行以实现所述意图识别方法。
由以上技术方案可以看出,本发明通过结合当前编码信息、历史特征信息及历史意愿结果进行购买意愿分析,能够准确地解析出所述对话场次中交互信息的语义,从而能够准确的识别出用户意图。此外,本发明直接对所述历史轮次中的所述历史特征信息及所述历史意愿结果进行分析,而无需对所述历史轮次中的历史对话进行重新分词,因此能够提高用户意图的识别效率。
附图说明
图1是本发明意图识别方法的较佳实施例的流程图。
图2是本发明意图识别装置的较佳实施例的功能模块图。
图3是本发明实现意图识别方法的较佳实施例的电子设备的结构示意图。
具体实施方式
为了使本发明的目的、技术方案和优点更加清楚,下面结合附图和具体实施例对本发明进行详细描述。
如图1所示,是本发明意图识别方法的较佳实施例的流程图。根据不同的需求,该流程图中步骤的顺序可以改变,某些步骤可以省略。
所述意图识别方法应用于一个或者多个电子设备中,所述电子设备是一种能够按照事先设定或存储的计算机可读指令,自动进行数值计算和/或信息处理的设备,其硬件包括但不限于微处理器、专用集成电路(Application Specific Integrated Circuit,ASIC)、可编程门阵列(Field-Programmable Gate Array,FPGA)、数字信号处理器(Digital Signal Processor,DSP)、嵌入式设备等。
所述电子设备可以是任何一种可与用户进行人机交互的电子产品,例如,个人计算机、平板电脑、智能手机、个人数字助理(Personal Digital Assistant,PDA)、游戏机、交互式网络电视(Internet Protocol Television,IPTV)、智能穿戴式设备等。
所述电子设备可以包括网络设备和/或用户设备。其中,所述网络设备包括,但不限于单个网络电子设备、多个网络电子设备组成的电子设备组或基于云计算(CloudComputing)的由大量主机或网络电子设备构成的云。
所述电子设备所处的网络包括,但不限于:互联网、广域网、城域网、局域网、虚拟专用网络(Virtual Private Network,VPN)等。
S10,获取意图识别请求,并根据所述意图识别请求获取语音信息及对话场次。
在本发明的至少一个实施例中,所述意图识别请求可以由任意代理人触发,所述意图识别请求也可以在代理人与客户之间建立通话连接后触发。
所述意图识别请求是由报文及报文头组成。
所述语音信息是指代理人与客户通话过程中的任意信息。所述语音信息可以是代理人的语音,所述语音信息也可以是客户的语音。
所述对话场次是指触发所述意图识别请求生成的通话场次。
在本发明的至少一个实施例中,所述根据所述意图识别请求获取语音信息及对话场次包括:
解析所述意愿识别请求的报文,得到所述报文携带的数据信息;
从所述数据信息中获取指示位置的信息作为存储路径;
从所述存储路径中获取所述语音信息;
从所述数据信息中获取指示场次的信息作为所述对话场次。
其中,所述数据信息包括,但不限于:指示位置的标签、所述存储路径、指示场次的标签、所述对话场次等。
所述存储路径中仅存储有所述语音信息。
通过上述实施方式,由于只需解析所述报文,因此,能够快速获取到所述存储路径及所述对话场次,进一步地,由于所述存储路径中仅存储有所述语音信息,因此,能够准确的获取到所述语音信息。
S11,检测所述语音信息的输出用户是否为预设用户。
在本发明的至少一个实施例中,所述输出用户是指发出所述语音信息的用户。
所述预设用户是指预先设定好的代理人,例如:所述预设用户可以是保险销售过程中的销售人员。
在本发明的至少一个实施例中,所述电子设备检测所述语音信息的输出用户是否为预设用户包括:
将与所述意图识别请求中所携带的存储路径关联的设备确定为所述语音信息的输出设备;
获取所述输出设备的设备标识,并获取所述预设用户的使用设备的标识作为多个预设标识;
将所述设备标识与所述多个预设标识进行比较;
若所述设备标识与所述预设标识中的任一标识相同,从所述语音信息中提取所述输出用户的语音特征,并对所述语音特征进行编码,得到第一特征向量;
获取所述预设用户的音色特征,并对所述音色特征进行编码,得到第二特征向量;
计算所述第一特征向量与所述第二特征向量的相似度;
若所述相似度小于预设阈值,确定所述输出用户不为所述预设用户。
其中,所述输出设备是指输出所述语音信息的设备。例如,所述输出设备可以是话筒,所述输出设备也可以是带有话筒功能的设备。
所述设备标识是指能够唯一识别出所述输出设备的标识。
所述预设标识可以有多个,每个预设用户对应有一个预设标识。
所述语音特征是指能够表征所述语音信息的特征。
所述音色特征是指能够表征所述预设用户所发出的语音的特征。
所述预设阈值是指根据需求设定的数值。
通过上述实施方式,由于所述语音信息是从所述存储路径中获取的,因此,通过所述存储路径与设备的关联关系能够准确的确定出所述输出设备,进而在判定出所述设备标识与所述预设标识中的任一标识相同时,利用所述语音特征与所述音色特征的相似度对所述输出用户的判定,能够避免因所述预设用户的使用设备被盗用而无法准确的确定出所述输出用户是否为预设用户。
在本发明的至少一个实施例中,所述方法还包括:
若所述设备标识与所述预设标识均不相同,确定所述输出用户不为所述预设用户。
在本发明的至少一个实施例中,所述方法还包括:
若所述相似度大于或者等于所述预设阈值,确定所述输出用户为所述预设用户。
S12,若否,根据所述对话场次确定所述语音信息所在的当前轮次,并获取所述当前轮次中所述预设用户的对话信息。
在本发明的至少一个实施例中,所述当前轮次是指在所述对话场次中所述语音信息所处的轮次。
所述对话信息是指在所述对话场次的所述当前轮次中,所述预设用户发出的语音。
在本发明的至少一个实施例中,所述电子设备根据所述对话场次确定所述语音信息所在的当前轮次包括:
获取与所述对话场次对应的场次日志;
从所述场次日志中获取交互语音,并从所述场次日志中获取所述交互语音的交互时间;
根据所述交互时间从小至大的顺序对所述交互语音进行排序,得到语音序列,所述语音序列中包含有所述语音信息;
根据所述音色特征从所述交互语音中提取所述预设用户的用户语音,并根据所述用户语音对所述语音序列进行切分,得到多个轮次,每个轮次中包含有所述语音序列中切分后的语音;
从所述多个轮次中确定出包含有所述语音信息的轮次作为所述当前轮次。
其中,所述场次日志是指记载有所述对话场次中的相关信息的日志。所述场次日志存储有代理人与客户的交互语音,以及所述代理人或者所述客户发出所述交互语音的时间。
所述交互语音是指所述代理人与所述客户在所述对话场次中的交互信息。
所述用户语音是指所述预设用户在所述对话场次中所发出的语音。
通过上述实施方式,由于所述对话场次中的每轮对话都是由所述预设用户发起的,因此,通过所述用户语音对所述语音序列进行切分,能够准确的确定出所述多个轮次,进而基于所述语音信息对所述多个轮次的筛选,能够准确的确定出所述当前轮次。
在本发明的至少一个实施例中,所述电子设备获取所述当前轮次中所述预设用户的对话信息包括:
从所述当前轮次中获取与所述音色特征对应的信息作为所述对话信息。
其中,所述对话信息可以是一段语音。
S13,根据所述语音信息及所述对话信息中的目标特征获得多个文本信息,并根据所述多个文本信息生成所述当前轮次的当前交互信息。
在本发明的至少一个实施例中,所述当前交互信息是指在所述当前轮次中,代理人与客户交互过程中的文本信息。
在本发明的至少一个实施例中,所述电子设备根据所述语音信息及所述对话信息中的目标特征所转换出的多个文本信息生成所述当前轮次的当前交互信息包括:
拼接所述对话信息及所述语音信息,得到目标语音;
提取所述目标语音中的所述目标特征,并对所述目标特征进行文本转换,得到所述多个文本信息;
根据预设词典对每个文本信息进行分词处理,得到每个文本信息的分词序列;
从所述预设词典中获取所述分词序列中所有分词的分词权重,并计算每个分词序列中所述分词权重的总和,得到每个文本信息的文本概率;
将所述文本概率最大的所述文本信息确定为所述当前交互信息。
其中,所述预设词典中包含有多个词汇及每个词汇的权值。
通过提取所述目标语音中的目标特征,能够剔除掉所述目标特征中的干扰信息,进而能够准确的生成所述多个文本信息,通过所述预设词典能够准确地确定出组成每个文本信息的概率,从而有利于从所述多个文本信息中准确选取出所述当前交互信息。
S14,根据所述当前交互信息中的信息分词及实体信息对所述当前交互信息进行向量化处理,得到当前编码信息。
在本发明的至少一个实施例中,所述当前编码信息是指能够表征所述当前交互信息的向量。
在本发明的至少一个实施例中,所述电子设备根据所述当前交互信息中的信息分词及实体信息对所述当前交互信息进行向量化处理,得到当前编码信息包括:
对所述当前交互信息进行分词处理,得到所述信息分词;
从所述信息分词中提取所述当前交互信息的所述实体信息,并确定所述实体信息在所述当前交互信息中的实体位置;
根据所述实体位置对所述当前交互信息进行编码,得到实体编码向量;
获取预设向量映射表;
从所述预设向量映射表中获取所述信息分词的编码值;
根据所述信息分词在所述当前交互信息中的位置拼接所述编码值,得到映射编码向量;
计算所述实体编码信息与所述映射编码向量的平均值,得到所述当前编码信息。
其中,所述实体信息是指词性为名词、动词的信息分词,所述实体位置是指所述实体信息在所述当前交互信息中的顺序。
所述预设向量映射表中存储有多个词汇及每个词汇的编码。
通过所述实体信息对所述当前交互信息进行编码,使生成的所述实体编码向量能够表征出所述实体信息的特征,通过所述信息分词的编码值对所述当前交互信息进行编码,使生成的所述映射编码向量中具有每个所述信息分词的特征,进而使生成的所述当前编码信息中兼容有所述实体信息的特征及每个所述信息分词的特征。
S15,获取所述对话场次中的历史轮次,并从配置库中获取所述历史轮次中的历史特征信息及历史意愿结果。
在本发明的至少一个实施例中,所述历史轮次是指在所述对话场次中,代理人与客户的交互时间小于所述当前轮次的轮次。
所述配置库中存储有所述历史轮次、所述历史特征信息与所述历史意愿结果的映射关系。
所述历史特征信息是指所述历史轮次中历史交互信息的上下文信息。
所述历史意愿结果是指所述历史轮次中所述历史交互信息所表征的意愿。
在本发明的至少一个实施例中,所述电子设备获取所述对话场次中的历史轮次包括:
将所述当前轮次从所述多个轮次中剔除,得到所述历史轮次。
通过上述实施方式,能够快速的获取到所述历史轮次。
在本发明的至少一个实施例中,在从配置库中获取所述历史轮次中的历史特征信息及历史意愿结果之前,所述意图识别方法还包括:
获取历史交互信息,并对所述历史交互信息进行向量化处理,得到目标编码向量;
基于多个预设矩阵处理所述目标编码向量,得到多个文本矩阵;
从所述多个文本矩阵中提取矩阵对及目标矩阵,所述矩阵对中包括第一矩阵及第二矩阵;
根据所述矩阵对计算所述历史交互信息中每个特征分词在所述历史交互信息中的重要度;
对所述第一矩阵进行转置处理,得到转置结果,并将所述转置结果乘以所述第二矩阵,得到所述历史交互信息中每个特征分词的特征分数;
计算所述第二矩阵的行数,并将所述特征分数除以所述行数的平方值,得到所述重要度;
将所述重要度乘以所述目标矩阵的转置,得到所述历史交互信息的运算矩阵;
计算所述第二矩阵与所述运算矩阵的矩阵和,得到所述历史特征信息;
将所述历史特征信息输入至预先训练好的意图分类器中,得到所述历史意愿结果;
存储所述历史轮次、所述历史特征信息与所述历史意愿结果的映射关系至所述配置库中。
通过所述矩阵对计算出的特征分数以及所述第二矩阵的行数,能够降低所述历史特征信息的计算量,通过所述重要度及所述目标矩阵能够使生成的所述运算矩阵中具有所述历史交互信息中所有特征分词的关联强度,进而能够生成具有所述历史交互信息的上下文语义的历史特征信息,从而提高了所述历史特征信息的生成拟合度。
在本发明的至少一个实施例中,所述电子设备从配置库中获取所述历史轮次中的历史特征信息及历史意愿结果包括:
获取第一预设标签及第二预设标签;
从所述配置库中获取同时与所述历史轮次及所述第一预设标签对应的信息作为所述历史特征信息;
从所述配置库中获取同时与所述历史轮次及所述第二预设标签对应的信息作为所述历史意愿结果。
通过上述实施方式,能够快速并准确的获取到所述历史特征信息及历史意愿结果。
S16,将所述当前编码信息、所述历史特征信息及所述历史意愿结果输入至预先训练好的意图识别模型中,得到意图识别结果。
需要强调的是,为进一步保证上述意图识别结果的私密和安全性,上述意图识别结果还可以存储于一区块链的节点中。
在本发明的至少一个实施例中,所述意图识别结果是指所述对话场次中用户的购买意愿。
在本发明的至少一个实施例中,所述意图识别模型是根据训练数据训练得到的。
在本发明的至少一个实施例中,所述电子设备将所述当前编码信息、所述历史特征信息及所述历史意愿结果输入至预先训练好的意图识别模型中,得到意图识别结果包括:
拼接所述当前编码信息、所述历史特征信息及所述历史意愿结果,得到拼接向量;
将所述拼接向量乘以所述意图识别模型中的权重矩阵,得到运算向量;
计算所述意图识别模型中的偏置值与所述运算向量中每个元素的总和,得到输出向量;
对所述输出向量进行归一化处理,得到概率向量;
将所述概率向量中取值最大的维度确定为目标维度;
获取与所述目标维度对应的类别作为所述意图识别结果。
其中,所述权重矩阵及所述偏置值是根据训练数据训练所述意图识别模型而得到的。
通过上述实施方式,能够使所述拼接向量中具有每个轮次的交互信息,进而能够全方位地解析出所述对话场次中的交互信息,从而提高所述识别结果的准确性,此外,通过直接对所述历史轮次中的所述历史特征信息及所述历史意愿结果进行分析,能够快速的确定出所述意图识别结果。
在本发明的至少一个实施例中,在得到意图识别结果后,所述方法还包括:
获取所述意愿识别请求的请求编号;
根据所述请求编号及所述识别结果生成提示信息;
采用对称加密技术加密所述提示信息,得到密文;
将所述密文发送至指定联系人的终端设备。
通过上述实施方式,能够提高所述意图识别结果的安全性,同时,还能够提高所述意图识别结果的发送及时性。
由以上技术方案可以看出,本发明通过结合当前编码信息、历史特征信息及历史意愿结果进行购买意愿分析,能够准确地解析出所述对话场次中交互信息的语义,从而能够准确的识别出用户意图。此外,本发明直接对所述历史轮次中的所述历史特征信息及所述历史意愿结果进行分析,而无需对所述历史轮次中的历史对话进行重新分词,因此能够提高用户意图的识别效率。
如图2所示,是本发明意图识别装置的较佳实施例的功能模块图。所述意图识别装置11包括获取单元110、检测单元111、生成单元112、处理单元113、输入单元114、确定单元115、提取单元116、计算单元117、存储单元118、加密单元119及发送单元120。本发明所称的模块/单元是指一种能够被处理器13所获取,并且能够完成固定功能的一系列计算机可读指令段,其存储在存储器12中。在本实施例中,关于各模块/单元的功能将在后续的实施例中详述。
获取单元110获取意图识别请求,并根据所述意图识别请求获取语音信息及对话场次。
在本发明的至少一个实施例中,所述意图识别请求可以由任意代理人触发,所述意图识别请求也可以在代理人与客户之间建立通话连接后触发。
所述意图识别请求是由报文及报文头组成。
所述语音信息是指代理人与客户通话过程中的任意信息。所述语音信息可以是代理人的语音,所述语音信息也可以是客户的语音。
所述对话场次是指触发所述意图识别请求生成的通话场次。
在本发明的至少一个实施例中,所述获取单元110根据所述意图识别请求获取语音信息及对话场次包括:
解析所述意愿识别请求的报文,得到所述报文携带的数据信息;
从所述数据信息中获取指示位置的信息作为存储路径;
从所述存储路径中获取所述语音信息;
从所述数据信息中获取指示场次的信息作为所述对话场次。
其中,所述数据信息包括,但不限于:指示位置的标签、所述存储路径、指示场次的标签、所述对话场次等。
所述存储路径中仅存储有所述语音信息。
通过上述实施方式,由于只需解析所述报文,因此,能够快速获取到所述存储路径及所述对话场次,进一步地,由于所述存储路径中仅存储有所述语音信息,因此,能够准确的获取到所述语音信息。
检测单元111检测所述语音信息的输出用户是否为预设用户。
在本发明的至少一个实施例中,所述输出用户是指发出所述语音信息的用户。
所述预设用户是指预先设定好的代理人,例如:所述预设用户可以是保险销售过程中的销售人员。
在本发明的至少一个实施例中,所述检测单元111检测所述语音信息的输出用户是否为预设用户包括:
将与所述意图识别请求中所携带的存储路径关联的设备确定为所述语音信息的输出设备;
获取所述输出设备的设备标识,并获取所述预设用户的使用设备的标识作为多个预设标识;
将所述设备标识与所述多个预设标识进行比较;
若所述设备标识与所述预设标识中的任一标识相同,从所述语音信息中提取所述输出用户的语音特征,并对所述语音特征进行编码,得到第一特征向量;
获取所述预设用户的音色特征,并对所述音色特征进行编码,得到第二特征向量;
计算所述第一特征向量与所述第二特征向量的相似度;
若所述相似度小于预设阈值,确定所述输出用户不为所述预设用户。
其中,所述输出设备是指输出所述语音信息的设备。例如,所述输出设备可以是话筒,所述输出设备也可以是带有话筒功能的设备。
所述设备标识是指能够唯一识别出所述输出设备的标识。
所述预设标识可以有多个,每个预设用户对应有一个预设标识。
所述语音特征是指能够表征所述语音信息的特征。
所述音色特征是指能够表征所述预设用户所发出的语音的特征。
所述预设阈值是指根据需求设定的数值。
通过上述实施方式,由于所述语音信息是从所述存储路径中获取的,因此,通过所述存储路径与设备的关联关系能够准确的确定出所述输出设备,进而在判定出所述设备标识与所述预设标识中的任一标识相同时,利用所述语音特征与所述音色特征的相似度对所述输出用户的判定,能够避免因所述预设用户的使用设备被盗用而无法准确的确定出所述输出用户是否为预设用户。
在本发明的至少一个实施例中,若所述设备标识与所述预设标识均不相同,确定单元115确定所述输出用户不为所述预设用户。
在本发明的至少一个实施例中,若所述相似度大于或者等于所述预设阈值,所述确定单元115确定所述输出用户为所述预设用户。
若否,所述获取单元110根据所述对话场次确定所述语音信息所在的当前轮次,并获取所述当前轮次中所述预设用户的对话信息。
在本发明的至少一个实施例中,所述当前轮次是指在所述对话场次中所述语音信息所处的轮次。
所述对话信息是指在所述对话场次的所述当前轮次中,所述预设用户发出的语音。
在本发明的至少一个实施例中,所述获取单元110根据所述对话场次确定所述语音信息所在的当前轮次包括:
获取与所述对话场次对应的场次日志;
从所述场次日志中获取交互语音,并从所述场次日志中获取所述交互语音的交互时间;
根据所述交互时间从小至大的顺序对所述交互语音进行排序,得到语音序列,所述语音序列中包含有所述语音信息;
根据所述音色特征从所述交互语音中提取所述预设用户的用户语音,并根据所述用户语音对所述语音序列进行切分,得到多个轮次,每个轮次中包含有所述语音序列中切分后的语音;
从所述多个轮次中确定出包含有所述语音信息的轮次作为所述当前轮次。
其中,所述场次日志是指记载有所述对话场次中的相关信息的日志。所述场次日志存储有代理人与客户的交互语音,以及所述代理人或者所述客户发出所述交互语音的时间。
所述交互语音是指所述代理人与所述客户在所述对话场次中的交互信息。
所述用户语音是指所述预设用户在所述对话场次中所发出的语音。
通过上述实施方式,由于所述对话场次中的每轮对话都是由所述预设用户发起的,因此,通过所述用户语音对所述语音序列进行切分,能够准确的确定出所述多个轮次,进而基于所述语音信息对所述多个轮次的筛选,能够准确的确定出所述当前轮次。
在本发明的至少一个实施例中,所述获取单元110获取所述当前轮次中所述预设用户的对话信息包括:
从所述当前轮次中获取与所述音色特征对应的信息作为所述对话信息。
其中,所述对话信息可以是一段语音。
所述生成单元112根据所述语音信息及所述对话信息中的目标特征获得多个文本信息,并根据所述多个文本信息生成所述当前轮次的当前交互信息。
在本发明的至少一个实施例中,所述当前交互信息是指在所述当前轮次中,代理人与客户交互过程中的文本信息。
在本发明的至少一个实施例中,所述生成单元112根据所述语音信息及所述对话信息中的目标特征所转换出的多个文本信息生成所述当前轮次的当前交互信息包括:
拼接所述对话信息及所述语音信息,得到目标语音;
提取所述目标语音中的所述目标特征,并对所述目标特征进行文本转换,得到所述多个文本信息;
根据预设词典对每个文本信息进行分词处理,得到每个文本信息的分词序列;
从所述预设词典中获取所述分词序列中所有分词的分词权重,并计算每个分词序列中所述分词权重的总和,得到每个文本信息的文本概率;
将所述文本概率最大的所述文本信息确定为所述当前交互信息。
其中,所述预设词典中包含有多个词汇及每个词汇的权值。
通过提取所述目标语音中的目标特征,能够剔除掉所述目标特征中的干扰信息,进而能够准确的生成所述多个文本信息,通过所述预设词典能够准确地确定出组成每个文本信息的概率,从而有利于从所述多个文本信息中准确选取出所述当前交互信息。
处理单元113根据所述当前交互信息中的信息分词及实体信息对所述当前交互信息进行向量化处理,得到当前编码信息。
在本发明的至少一个实施例中,所述当前编码信息是指能够表征所述当前交互信息的向量。
在本发明的至少一个实施例中,所述处理单元113根据所述当前交互信息中的信息分词及实体信息对所述当前交互信息进行向量化处理,得到当前编码信息包括:
对所述当前交互信息进行分词处理,得到所述信息分词;
从所述信息分词中提取所述当前交互信息的所述实体信息,并确定所述实体信息在所述当前交互信息中的实体位置;
根据所述实体位置对所述当前交互信息进行编码,得到实体编码向量;
获取预设向量映射表;
从所述预设向量映射表中获取所述信息分词的编码值;
根据所述信息分词在所述当前交互信息中的位置拼接所述编码值,得到映射编码向量;
计算所述实体编码信息与所述映射编码向量的平均值,得到所述当前编码信息。
其中,所述实体信息是指词性为名词、动词的信息分词,所述实体位置是指所述实体信息在所述当前交互信息中的顺序。
所述预设向量映射表中存储有多个词汇及每个词汇的编码。
通过所述实体信息对所述当前交互信息进行编码,使生成的所述实体编码向量能够表征出所述实体信息的特征,通过所述信息分词的编码值对所述当前交互信息进行编码,使生成的所述映射编码向量中具有每个所述信息分词的特征,进而使生成的所述当前编码信息中兼容有所述实体信息的特征及每个所述信息分词的特征。
所述获取单元110获取所述对话场次中的历史轮次,并从配置库中获取所述历史轮次中的历史特征信息及历史意愿结果。
在本发明的至少一个实施例中,所述历史轮次是指在所述对话场次中,代理人与客户的交互时间小于所述当前轮次的轮次。
所述配置库中存储有所述历史轮次、所述历史特征信息与所述历史意愿结果的映射关系。
所述历史特征信息是指所述历史轮次中历史交互信息的上下文信息。
所述历史意愿结果是指所述历史轮次中所述历史交互信息所表征的意愿。
在本发明的至少一个实施例中,所述获取单元110获取所述对话场次中的历史轮次包括:
将所述当前轮次从所述多个轮次中剔除,得到所述历史轮次。
通过上述实施方式,能够快速的获取到所述历史轮次。
在本发明的至少一个实施例中,在从配置库中获取所述历史轮次中的历史特征信息及历史意愿结果之前,所述处理单元113获取历史交互信息,并对所述历史交互信息进行向量化处理,得到目标编码向量;
所述处理单元113基于多个预设矩阵处理所述目标编码向量,得到多个文本矩阵;
提取单元116从所述多个文本矩阵中提取矩阵对及目标矩阵,所述矩阵对中包括第一矩阵及第二矩阵;
计算单元117根据所述矩阵对计算所述历史交互信息中每个特征分词在所述历史交互信息中的重要度;
所述计算单元117对所述第一矩阵进行转置处理,得到转置结果,并将所述转置结果乘以所述第二矩阵,得到所述历史交互信息中每个特征分词的特征分数;
所述计算单元117计算所述第二矩阵的行数,并将所述特征分数除以所述行数的平方值,得到所述重要度;
所述计算单元117将所述重要度乘以所述目标矩阵的转置,得到所述历史交互信息的运算矩阵;
所述计算单元117计算所述第二矩阵与所述运算矩阵的矩阵和,得到所述历史特征信息;
输入单元114将所述历史特征信息输入至预先训练好的意图分类器中,得到所述历史意愿结果;
存储单元118存储所述历史轮次、所述历史特征信息与所述历史意愿结果的映射关系至所述配置库中。
通过所述矩阵对计算出的特征分数以及所述第二矩阵的行数,能够降低所述历史特征信息的计算量,通过所述重要度及所述目标矩阵能够使生成的所述运算矩阵中具有所述历史交互信息中所有特征分词的关联强度,进而能够生成具有所述历史交互信息的上下文语义的历史特征信息,从而提高了所述历史特征信息的生成拟合度。
在本发明的至少一个实施例中,所述获取单元110从配置库中获取所述历史轮次中的历史特征信息及历史意愿结果包括:
获取第一预设标签及第二预设标签;
从所述配置库中获取同时与所述历史轮次及所述第一预设标签对应的信息作为所述历史特征信息;
从所述配置库中获取同时与所述历史轮次及所述第二预设标签对应的信息作为所述历史意愿结果。
通过上述实施方式,能够快速并准确的获取到所述历史特征信息及历史意愿结果。
所述输入单元114将所述当前编码信息、所述历史特征信息及所述历史意愿结果输入至预先训练好的意图识别模型中,得到意图识别结果。
需要强调的是,为进一步保证上述意图识别结果的私密和安全性,上述意图识别结果还可以存储于一区块链的节点中。
在本发明的至少一个实施例中,所述意图识别结果是指所述对话场次中用户的购买意愿。
在本发明的至少一个实施例中,所述意图识别模型是根据训练数据训练得到的。
在本发明的至少一个实施例中,所述输入单元114将所述当前编码信息、所述历史特征信息及所述历史意愿结果输入至预先训练好的意图识别模型中,得到意图识别结果包括:
拼接所述当前编码信息、所述历史特征信息及所述历史意愿结果,得到拼接向量;
将所述拼接向量乘以所述意图识别模型中的权重矩阵,得到运算向量;
计算所述意图识别模型中的偏置值与所述运算向量中每个元素的总和,得到输出向量;
对所述输出向量进行归一化处理,得到概率向量;
将所述概率向量中取值最大的维度确定为目标维度;
获取与所述目标维度对应的类别作为所述意图识别结果。
其中,所述权重矩阵及所述偏置值是根据训练数据训练所述意图识别模型而得到的。
通过上述实施方式,能够使所述拼接向量中具有每个轮次的交互信息,进而能够全方位地解析出所述对话场次中的交互信息,从而提高所述识别结果的准确性,此外,通过直接对所述历史轮次中的所述历史特征信息及所述历史意愿结果进行分析,能够快速的确定出所述意图识别结果。
在本发明的至少一个实施例中,在得到意图识别结果后,所述获取单元110获取所述意愿识别请求的请求编号;
所述生成单元112根据所述请求编号及所述识别结果生成提示信息;
加密单元119采用对称加密技术加密所述提示信息,得到密文;
发送单元120将所述密文发送至指定联系人的终端设备。
通过上述实施方式,能够提高所述意图识别结果的安全性,同时,还能够提高所述意图识别结果的发送及时性。
由以上技术方案可以看出,本发明通过结合当前编码信息、历史特征信息及历史意愿结果进行购买意愿分析,能够准确地解析出所述对话场次中交互信息的语义,从而能够准确的识别出用户意图。此外,本发明直接对所述历史轮次中的所述历史特征信息及所述历史意愿结果进行分析,而无需对所述历史轮次中的历史对话进行重新分词,因此能够提高用户意图的识别效率。
如图3所示,是本发明实现意图识别方法的较佳实施例的电子设备的结构示意图。
在本发明的一个实施例中,所述电子设备1包括,但不限于,存储器12、处理器13,以及存储在所述存储器12中并可在所述处理器13上运行的计算机可读指令,例如意图识别程序。
本领域技术人员可以理解,所述示意图仅仅是电子设备1的示例,并不构成对电子设备1的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件,例如所述电子设备1还可以包括输入输出设备、网络接入设备、总线等。
所述处理器13可以是中央处理单元(Central Processing Unit,CPU),还可以是其他通用处理器、数字信号处理器(Digital Signal Processor,DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现场可编程门阵列(Field-Programmable Gate Array,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等,所述处理器13是所述电子设备1的运算核心和控制中心,利用各种接口和线路连接整个电子设备1的各个部分,及执行所述电子设备1的操作系统以及安装的各类应用程序、程序代码等。
示例性的,所述计算机可读指令可以被分割成一个或多个模块/单元,所述一个或者多个模块/单元被存储在所述存储器12中,并由所述处理器13执行,以完成本发明。所述一个或多个模块/单元可以是能够完成特定功能的一系列计算机可读指令段,该计算机可读指令段用于描述所述计算机可读指令在所述电子设备1中的执行过程。例如,所述计算机可读指令可以被分割成获取单元110、检测单元111、生成单元112、处理单元113、输入单元114、确定单元115、提取单元116、计算单元117、存储单元118、加密单元119及发送单元120。
所述存储器12可用于存储所述计算机可读指令和/或模块,所述处理器13通过运行或执行存储在所述存储器12内的计算机可读指令和/或模块,以及调用存储在存储器12内的数据,实现所述电子设备1的各种功能。所述存储器12可主要包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需的应用程序(比如声音播放功能、图像播放功能等)等;存储数据区可存储根据电子设备的使用所创建的数据等。存储器12可以包括非易失性和易失性存储器,例如:硬盘、内存、插接式硬盘,智能存储卡(SmartMedia Card,SMC),安全数字(Secure Digital,SD)卡,闪存卡(Flash Card)、至少一个磁盘存储器件、闪存器件、或其他存储器件。
所述存储器12可以是电子设备1的外部存储器和/或内部存储器。进一步地,所述存储器12可以是具有实物形式的存储器,如内存条、TF卡(Trans-flash Card)等等。
所述电子设备1集成的模块/单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明实现上述实施例方法中的全部或部分流程,也可以通过计算机可读指令来指令相关的硬件来完成,所述的计算机可读指令可存储于一计算机可读存储介质中,该计算机可读指令在被处理器执行时,可实现上述各个方法实施例的步骤。
其中,所述计算机可读指令包括计算机可读指令代码,所述计算机可读指令代码可以为源代码形式、对象代码形式、可执行文件或某些中间形式等。所述计算机可读介质可以包括:能够携带所述计算机可读指令代码的任何实体或装置、记录介质、U盘、移动硬盘、磁碟、光盘、计算机存储器、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)。
本发明所指区块链是分布式数据存储、点对点传输、共识机制、加密算法等计算机技术的新型应用模式。区块链(Blockchain),本质上是一个去中心化的数据库,是一串使用密码学方法相关联产生的数据块,每一个数据块中包含了一批次网络交易的信息,用于验证其信息的有效性(防伪)和生成下一个区块。区块链可以包括区块链底层平台、平台产品服务层以及应用服务层等。
结合图1,所述电子设备1中的所述存储器12存储计算机可读指令实现一种意图识别方法,所述处理器13可执行所述计算机可读指令从而实现:
获取意图识别请求,并根据所述意图识别请求获取语音信息及对话场次;
检测所述语音信息的输出用户是否为预设用户;
若否,根据所述对话场次确定所述语音信息所在的当前轮次,并获取所述当前轮次中所述预设用户的对话信息;
根据所述语音信息及所述对话信息中的目标特征获得多个文本信息,并根据所述多个文本信息生成所述当前轮次的当前交互信息;
根据所述当前交互信息中的信息分词及实体信息对所述当前交互信息进行向量化处理,得到当前编码信息;
获取所述对话场次中的历史轮次,并从配置库中获取所述历史轮次中的历史特征信息及历史意愿结果;
将所述当前编码信息、所述历史特征信息及所述历史意愿结果输入至预先训练好的意图识别模型中,得到意图识别结果。
具体地,所述处理器13对上述计算机可读指令的具体实现方法可参考图1对应实施例中相关步骤的描述,在此不赘述。
在本发明所提供的几个实施例中,应该理解到,所揭露的系统,装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述模块的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式。
所述计算机可读存储介质上存储有计算机可读指令,其中,所述计算机可读指令被处理器13执行时用以实现以下步骤:
获取意图识别请求,并根据所述意图识别请求获取语音信息及对话场次;
检测所述语音信息的输出用户是否为预设用户;
若否,根据所述对话场次确定所述语音信息所在的当前轮次,并获取所述当前轮次中所述预设用户的对话信息;
根据所述语音信息及所述对话信息中的目标特征获得多个文本信息,并根据所述多个文本信息生成所述当前轮次的当前交互信息;
根据所述当前交互信息中的信息分词及实体信息对所述当前交互信息进行向量化处理,得到当前编码信息;
获取所述对话场次中的历史轮次,并从配置库中获取所述历史轮次中的历史特征信息及历史意愿结果;
将所述当前编码信息、所述历史特征信息及所述历史意愿结果输入至预先训练好的意图识别模型中,得到意图识别结果。
所述作为分离部件说明的模块可以是或者也可以不是物理上分开的,作为模块显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。
另外,在本发明各个实施例中的各功能模块可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用硬件加软件功能模块的形式实现。
因此,无论从哪一点来看,均应将实施例看作是示范性的,而且是非限制性的,本发明的范围由所附权利要求而不是上述说明限定,因此旨在将落在权利要求的等同要件的含义和范围内的所有变化涵括在本发明内。不应将权利要求中的任何附关联图标记视为限制所涉及的权利要求。
此外,显然“包括”一词不排除其他单元或步骤,单数不排除复数。所述的多个单元或装置也可以由一个单元或装置通过软件或者硬件来实现。第一、第二等词语用来表示名称,而并不表示任何特定的顺序。
最后应说明的是,以上实施例仅用以说明本发明的技术方案而非限制,尽管参照较佳实施例对本发明进行了详细说明,本领域的普通技术人员应当理解,可以对本发明的技术方案进行修改或等同替换,而不脱离本发明技术方案的精神和范围。

Claims (10)

1.一种意图识别方法,其特征在于,所述意图识别方法包括:
获取意图识别请求,并根据所述意图识别请求获取语音信息及对话场次;
检测所述语音信息的输出用户是否为预设用户;
若否,根据所述对话场次确定所述语音信息所在的当前轮次,并获取所述当前轮次中所述预设用户的对话信息;
根据所述语音信息及所述对话信息中的目标特征获得多个文本信息,并根据所述多个文本信息生成所述当前轮次的当前交互信息;
根据所述当前交互信息中的信息分词及实体信息对所述当前交互信息进行向量化处理,得到当前编码信息;
获取所述对话场次中的历史轮次,并从配置库中获取所述历史轮次中的历史特征信息及历史意愿结果;
将所述当前编码信息、所述历史特征信息及所述历史意愿结果输入至预先训练好的意图识别模型中,得到意图识别结果。
2.如权利要求1所述的意图识别方法,其特征在于,所述检测所述语音信息的输出用户是否为预设用户包括:
将与所述意图识别请求中所携带的存储路径关联的设备确定为所述语音信息的输出设备;
获取所述输出设备的设备标识,并获取所述预设用户的使用设备的标识作为多个预设标识;
将所述设备标识与所述多个预设标识进行比较;
若所述设备标识与所述预设标识中的任一标识相同,从所述语音信息中提取所述输出用户的语音特征,并对所述语音特征进行编码,得到第一特征向量;
获取所述预设用户的音色特征,并对所述音色特征进行编码,得到第二特征向量;
计算所述第一特征向量与所述第二特征向量的相似度;
若所述相似度小于预设阈值,确定所述输出用户不为所述预设用户。
3.如权利要求2所述的意图识别方法,其特征在于,所述根据所述对话场次确定所述语音信息所在的当前轮次包括:
获取与所述对话场次对应的场次日志;
从所述场次日志中获取交互语音,并从所述场次日志中获取所述交互语音的交互时间;
根据所述交互时间从小至大的顺序对所述交互语音进行排序,得到语音序列,所述语音序列中包含有所述语音信息;
根据所述音色特征从所述交互语音中提取所述预设用户的用户语音,并根据所述用户语音对所述语音序列进行切分,得到多个轮次,每个轮次中包含有所述语音序列中切分后的语音;
从所述多个轮次中确定出包含有所述语音信息的轮次作为所述当前轮次。
4.如权利要求1所述的意图识别方法,其特征在于,所述根据所述语音信息及所述对话信息中的目标特征获得多个文本信息,并根据所述多个文本信息生成所述当前轮次的当前交互信息包括:
拼接所述对话信息及所述语音信息,得到目标语音;
提取所述目标语音中的所述目标特征,并对所述目标特征进行文本转换,得到所述多个文本信息;
根据预设词典对每个文本信息进行分词处理,得到每个文本信息的分词序列;
从所述预设词典中获取所述分词序列中所有分词的分词权重,并计算每个分词序列中所述分词权重的总和,得到每个文本信息的文本概率;
将所述文本概率最大的所述文本信息确定为所述当前交互信息。
5.如权利要求1所述的意图识别方法,其特征在于,所述根据所述当前交互信息中的信息分词及实体信息对所述当前交互信息进行向量化处理,得到当前编码信息包括:
对所述当前交互信息进行分词处理,得到所述信息分词;
从所述信息分词中提取所述当前交互信息的所述实体信息,并确定所述实体信息在所述当前交互信息中的实体位置;
根据所述实体位置对所述当前交互信息进行编码,得到实体编码向量;
获取预设向量映射表;
从所述预设向量映射表中获取所述信息分词的编码值;
根据所述信息分词在所述当前交互信息中的位置拼接所述编码值,得到映射编码向量;
计算所述实体编码信息与所述映射编码向量的平均值,得到所述当前编码信息。
6.如权利要求1所述的意图识别方法,其特征在于,在从配置库中获取所述历史轮次中的历史特征信息及历史意愿结果之前,所述意图识别方法还包括:
获取历史交互信息,并对所述历史交互信息进行向量化处理,得到目标编码向量;
基于多个预设矩阵处理所述目标编码向量,得到多个文本矩阵;
从所述多个文本矩阵中提取矩阵对及目标矩阵,所述矩阵对中包括第一矩阵及第二矩阵;
根据所述矩阵对计算所述历史交互信息中每个特征分词在所述历史交互信息中的重要度;
对所述第一矩阵进行转置处理,得到转置结果,并将所述转置结果乘以所述第二矩阵,得到所述历史交互信息中每个特征分词的特征分数;
计算所述第二矩阵的行数,并将所述特征分数除以所述行数的平方值,得到所述重要度;
将所述重要度乘以所述目标矩阵的转置,得到所述历史交互信息的运算矩阵;
计算所述第二矩阵与所述运算矩阵的矩阵和,得到所述历史特征信息;
将所述历史特征信息输入至预先训练好的意图分类器中,得到所述历史意愿结果;
存储所述历史轮次、所述历史特征信息与所述历史意愿结果的映射关系至所述配置库中。
7.如权利要求1所述的意图识别方法,其特征在于,所述将所述当前编码信息、所述历史特征信息及所述历史意愿结果输入至预先训练好的意图识别模型中,得到意图识别结果包括:
拼接所述当前编码信息、所述历史特征信息及所述历史意愿结果,得到拼接向量;
将所述拼接向量乘以所述意图识别模型中的权重矩阵,得到运算向量;
计算所述意图识别模型中的偏置值与所述运算向量中每个元素的总和,得到输出向量;
对所述输出向量进行归一化处理,得到概率向量;
将所述概率向量中取值最大的维度确定为目标维度;
获取与所述目标维度对应的类别作为所述意图识别结果。
8.一种意图识别装置,其特征在于,所述意图识别装置包括:
获取单元,用于获取意图识别请求,并根据所述意图识别请求获取语音信息及对话场次;
检测单元,用于检测所述语音信息的输出用户是否为预设用户;
所述获取单元,还用于若否,根据所述对话场次确定所述语音信息所在的当前轮次,并获取所述当前轮次中所述预设用户的对话信息;
生成单元,用于根据所述语音信息及所述对话信息中的目标特征获得多个文本信息,并根据所述多个文本信息生成所述当前轮次的当前交互信息;
处理单元,用于根据所述当前交互信息中的信息分词及实体信息对所述当前交互信息进行向量化处理,得到当前编码信息;
所述获取单元,还用于获取所述对话场次中的历史轮次,并从配置库中获取所述历史轮次中的历史特征信息及历史意愿结果;
输入单元,用于将所述当前编码信息、所述历史特征信息及所述历史意愿结果输入至预先训练好的意图识别模型中,得到意图识别结果。
9.一种电子设备,其特征在于,所述电子设备包括:
存储器,存储有计算机可读指令;及
处理器,执行所述存储器中存储的计算机可读指令以实现如权利要求1至7中任意一项所述的意图识别方法。
10.一种计算机可读存储介质,其特征在于:所述计算机可读存储介质中存储有计算机可读指令,所述计算机可读指令被电子设备中的处理器执行以实现如权利要求1至7中任意一项所述的意图识别方法。
CN202110692211.6A 2021-06-22 2021-06-22 意图识别方法、装置、设备及存储介质 Active CN113435196B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110692211.6A CN113435196B (zh) 2021-06-22 2021-06-22 意图识别方法、装置、设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110692211.6A CN113435196B (zh) 2021-06-22 2021-06-22 意图识别方法、装置、设备及存储介质

Publications (2)

Publication Number Publication Date
CN113435196A true CN113435196A (zh) 2021-09-24
CN113435196B CN113435196B (zh) 2022-07-29

Family

ID=77756915

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110692211.6A Active CN113435196B (zh) 2021-06-22 2021-06-22 意图识别方法、装置、设备及存储介质

Country Status (1)

Country Link
CN (1) CN113435196B (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116229955A (zh) * 2023-05-09 2023-06-06 海尔优家智能科技(北京)有限公司 基于生成式预训练gpt模型的交互意图信息确定方法
WO2023116500A1 (zh) * 2021-12-24 2023-06-29 广州小鹏汽车科技有限公司 语音交互方法及其装置、服务器和可读存储介质
CN116881429A (zh) * 2023-09-07 2023-10-13 四川蜀天信息技术有限公司 一种基于多租户的对话模型交互方法、装置及存储介质

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110704588A (zh) * 2019-09-04 2020-01-17 平安科技(深圳)有限公司 基于长短期记忆网络的多轮对话语义分析方法和系统
CN111429895A (zh) * 2018-12-21 2020-07-17 广东美的白色家电技术创新中心有限公司 多轮交互的语义理解方法、装置及计算机存储介质
CN111783439A (zh) * 2020-06-28 2020-10-16 平安普惠企业管理有限公司 人机交互对话处理方法、装置、计算机设备及存储介质
WO2021022816A1 (zh) * 2019-08-07 2021-02-11 南京硅基智能科技有限公司 一种基于深度学习网络的意图识别方法
CN112613308A (zh) * 2020-12-17 2021-04-06 中国平安人寿保险股份有限公司 用户意图识别方法、装置、终端设备及存储介质
CN112786041A (zh) * 2020-12-23 2021-05-11 平安普惠企业管理有限公司 语音处理方法及相关设备
CN112836521A (zh) * 2020-12-23 2021-05-25 平安普惠企业管理有限公司 问答匹配方法、装置、计算机设备及存储介质

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111429895A (zh) * 2018-12-21 2020-07-17 广东美的白色家电技术创新中心有限公司 多轮交互的语义理解方法、装置及计算机存储介质
WO2021022816A1 (zh) * 2019-08-07 2021-02-11 南京硅基智能科技有限公司 一种基于深度学习网络的意图识别方法
CN110704588A (zh) * 2019-09-04 2020-01-17 平安科技(深圳)有限公司 基于长短期记忆网络的多轮对话语义分析方法和系统
CN111783439A (zh) * 2020-06-28 2020-10-16 平安普惠企业管理有限公司 人机交互对话处理方法、装置、计算机设备及存储介质
CN112613308A (zh) * 2020-12-17 2021-04-06 中国平安人寿保险股份有限公司 用户意图识别方法、装置、终端设备及存储介质
CN112786041A (zh) * 2020-12-23 2021-05-11 平安普惠企业管理有限公司 语音处理方法及相关设备
CN112836521A (zh) * 2020-12-23 2021-05-25 平安普惠企业管理有限公司 问答匹配方法、装置、计算机设备及存储介质

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2023116500A1 (zh) * 2021-12-24 2023-06-29 广州小鹏汽车科技有限公司 语音交互方法及其装置、服务器和可读存储介质
CN116229955A (zh) * 2023-05-09 2023-06-06 海尔优家智能科技(北京)有限公司 基于生成式预训练gpt模型的交互意图信息确定方法
CN116229955B (zh) * 2023-05-09 2023-08-18 海尔优家智能科技(北京)有限公司 基于生成式预训练gpt模型的交互意图信息确定方法
CN116881429A (zh) * 2023-09-07 2023-10-13 四川蜀天信息技术有限公司 一种基于多租户的对话模型交互方法、装置及存储介质
CN116881429B (zh) * 2023-09-07 2023-12-01 四川蜀天信息技术有限公司 一种基于多租户的对话模型交互方法、装置及存储介质

Also Published As

Publication number Publication date
CN113435196B (zh) 2022-07-29

Similar Documents

Publication Publication Date Title
CN113435196B (zh) 意图识别方法、装置、设备及存储介质
CN111695352A (zh) 基于语义分析的评分方法、装置、终端设备及存储介质
CN106919661B (zh) 一种情感类型识别方法及相关装置
CN113032528B (zh) 案件分析方法、装置、设备及存储介质
CN112989826B (zh) 基于人工智能的试题分数确定方法、装置、设备及介质
CN113094478B (zh) 表情回复方法、装置、设备及存储介质
CN113408278B (zh) 意图识别方法、装置、设备及存储介质
CN113656547B (zh) 文本匹配方法、装置、设备及存储介质
CN110704618B (zh) 确定对话数据对应的标准问题的方法及装置
CN111309905A (zh) 一种对话语句的聚类方法、装置、电子设备及存储介质
CN111814467A (zh) 催收通话的标签建立方法、装置、电子设备及介质
CN113408268A (zh) 槽位填充方法、装置、设备及存储介质
CN113535925B (zh) 语音播报方法、装置、设备及存储介质
CN114860742A (zh) 基于人工智能的ai客服交互方法、装置、设备及介质
CN113903361A (zh) 基于人工智能的语音质检方法、装置、设备及存储介质
CN113705468A (zh) 基于人工智能的数字图像识别方法及相关设备
CN113536770A (zh) 基于人工智能的文本解析方法、装置、设备及存储介质
CN113064972A (zh) 智能问答方法、装置、设备及存储介质
CN112949305B (zh) 负反馈信息采集方法、装置、设备及存储介质
CN112786041B (zh) 语音处理方法及相关设备
CN113627186B (zh) 基于人工智能的实体关系检测方法及相关设备
CN115618415A (zh) 敏感数据识别方法、装置、电子设备和存储介质
CN112989044B (zh) 文本分类方法、装置、设备及存储介质
CN113035240A (zh) 语音播报方法、装置、设备及存储介质
CN113420143B (zh) 文书摘要生成方法、装置、设备及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant