CN114678012A - 语音交互数据的处理方法和装置、存储介质及电子装置 - Google Patents

语音交互数据的处理方法和装置、存储介质及电子装置 Download PDF

Info

Publication number
CN114678012A
CN114678012A CN202210153613.3A CN202210153613A CN114678012A CN 114678012 A CN114678012 A CN 114678012A CN 202210153613 A CN202210153613 A CN 202210153613A CN 114678012 A CN114678012 A CN 114678012A
Authority
CN
China
Prior art keywords
data
voice interaction
bad case
record
voice
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202210153613.3A
Other languages
English (en)
Inventor
贾勇
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Qingdao Haier Technology Co Ltd
Haier Smart Home Co Ltd
Original Assignee
Qingdao Haier Technology Co Ltd
Haier Smart Home Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Qingdao Haier Technology Co Ltd, Haier Smart Home Co Ltd filed Critical Qingdao Haier Technology Co Ltd
Priority to CN202210153613.3A priority Critical patent/CN114678012A/zh
Publication of CN114678012A publication Critical patent/CN114678012A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/08Speech classification or search
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/242Query formulation
    • G06F16/243Natural language query formulation
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/27Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the analysis technique
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/48Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use
    • G10L25/51Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for comparison or discrimination
    • G10L25/54Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for comparison or discrimination for retrieval
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/08Speech classification or search
    • G10L2015/088Word spotting
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • G10L2015/223Execution procedure of a spoken command

Abstract

本申请公开了一种语音交互数据的处理方法和装置、存储介质及电子装置,其中,上述方法包括:对第一对象的语音交互数据进行解析,得到语音交互数据中的关键字;在确定关键字与坏例数据库中的坏例数据匹配成功的情况下,获取坏例数据对应的第一对象的语音交互记录,其中,坏例数据保存有第一对象对语音交互记录的评价数据;根据语音交互记录对语音交互数据进行分析,向第二对象发送语音交互数据的分析结果,采用上述技术方案,解决了在用户与家电设备的语音交互场景中,存在语音交互数据处理效率低下的问题。

Description

语音交互数据的处理方法和装置、存储介质及电子装置
技术领域
本申请涉及通信领域,具体而言,涉及一种语音交互数据的处理方法和装置、存储介质及电子装置。
背景技术
目前,在用户与家电设备的语音交互场景中,往往无法实时获取用户对产品的体验结果,相关技术中,一般是通过人工对后台日志和数据进行手工数据标注,并对标注好的数据统一进行处理。但是这种方案,从得到用户的体验结果到分析出用户反馈的问题的过程中,耗费周期过长,导致问题发现不够及时,并且,人工整合数据的整合效率过于低下,加之,不同坏例(badcase)数据的语音交互场景存在差异,会进一步加大数据处理的难度,并影响对数据进行处理的效率。
因此,相关技术中,在用户与家电设备的语音交互场景中,存在语音交互数据处理效率低下的问题。
针对相关技术中,在用户与家电设备的语音交互场景中,存在语音交互数据处理效率低下的问题,尚未提出有效的解决方案。
发明内容
本申请实施例提供了一种语音交互数据的处理方法和装置、存储介质及电子装置,以至少解决相关技术中,在用户与家电设备的语音交互场景中,存在语音交互数据处理效率低下的问题。
根据本申请实施例的一个实施例,提供了一种语音交互数据的处理方法,包括:对第一对象的语音交互数据进行解析,得到所述语音交互数据中的关键字;在确定所述关键字与坏例数据库中的坏例数据匹配成功的情况下,获取所述坏例数据对应的第一对象的语音交互记录,其中,所述坏例数据保存有所述第一对象对所述语音交互记录的评价数据;根据所述语音交互记录对所述语音交互数据进行分析,向第二对象发送所述语音交互数据的分析结果。
在一个示例性实施例中,对第一对象的语音交互数据进行解析,得到所述语音交互数据中的关键字之后,所述方法还包括:在确定所述关键字不存在于所述坏例数据库中的情况下,获取所述关键字在所述语音交互数据中对应的坏例数据;将所述关键字和所述关键字在所述语音交互数据中对应的坏例数据按照第一预设规则存储至所述坏例数据库中,其中,所述第一预设规则用于指示所述坏例数据库的存储规则。
在一个示例性实施例中,对第一对象的语音交互数据进行解析,得到所述语音交互数据中的关键字,包括:根据第二预设规则对语音交互过程中的语音交互数据进行解析,确定所述语音交互数据中的关键字,其中,所述第二预设规则为所述语音交互数据设置的解析关键字的规则,且所述第二预设规则至少包括以下之一:关键字字长、关键字类型、关键字语种。
在一个示例性实施例中,获取坏例数据对应的第一对象的语音交互记录,包括:从所述坏例数据库中的存储队列中确定第一存储队列,其中,所述第一存储队列用于存储所述第一对象的语音交互记录,所述第一对象的语音交互记录中包括所述第一对象的坏例数据,所述坏例数据库中包括:与不同目标对象对应的多个存储队列,且所述多个存储队列之间相互独立;从所述第一存储队列中获取第一对象与家电设备的语音交互记录。
在一个示例性实施例中,根据所述语音交互记录对所述语音交互数据进行分析,包括:从所述语音交互记录中确定所述坏例数据的记录频次、所述坏例数据的记录时间和所述坏例数据的记录场景;根据所述坏例数据的记录频次、所述坏例数据的记录时间、所述坏例数据的记录场景和所述坏例数据对应的第一对象确定所述坏例数据的交互规律,所述交互规律用于指示所述第一对象对家电设备进行评价的规律;解析所述坏例数据的交互规律,得到所述第一对象对所述家电设备的评价结果,其中,所述评价结果至少包括以下之一:在所述记录时间内的所述记录频次最多的坏例数据对应的评价结果,在所述记录场景下的所述记录频次最多的坏例数据对应的评价结果。
在一个示例性实施例中,获取坏例数据对应的第一对象的语音交互记录,包括:按照第一时间段划分所述第一对象与家电设备的语音交互记录,得到多个子交互记录;统计所述关键字在每一个子交互记录中的出现的次数;根据所述次数的大小顺序对所述多个子交互记录进行排序,得到所述次数最大的子交互记录;将所述次数最大的子交互记录确定为所述坏例数据对应的第一对象的语音交互记录。
在一个示例性实施例中,获取坏例数据对应的第一对象的语音交互记录,包括:按照第二时间段划分所述第一对象与家电设备的语音交互记录,得到多个子交互记录;获取所述多个子交互记录中的记录时间;从所述多个子交互记录中查找到所述记录时间最晚的目标子交互记录;将所述目标子交互记录确定为所述坏例数据对应的第一对象的语音交互记录。
根据本申请实施例的另一个实施例,还提供了一种语音交互数据的处理装置,包括:解析模块,用于对第一对象的语音交互数据进行解析,得到所述语音交互数据中的关键字;获取模块,用于在确定所述关键字与坏例数据库中的坏例数据匹配成功的情况下,获取所述坏例数据对应的第一对象的语音交互记录,其中,所述坏例数据保存有所述第一对象对所述语音交互记录的评价数据;发送模块,用于根据所述语音交互记录对所述语音交互数据进行分析,向第二对象发送所述语音交互数据的分析结果。
根据本申请实施例的又一方面,还提供了一种计算机可读的存储介质,该计算机可读的存储介质中存储有计算机程序,其中,该计算机程序被设置为运行时执行上述语音交互数据的处理方法。
根据本申请实施例的又一方面,还提供了一种电子装置,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其中,上述处理器通过计算机程序执行上述的语音交互数据的处理方法。
在本申请实施例中,对第一对象的语音交互数据进行解析,得到所述语音交互数据中的关键字;在确定所述关键字与坏例数据库中的坏例数据匹配成功的情况下,获取所述坏例数据对应的第一对象的语音交互记录,其中,所述坏例数据保存有所述第一对象对所述语音交互记录的评价数据;根据所述语音交互记录对所述语音交互数据进行分析,向第二对象发送所述语音交互数据的分析结果;采用上述技术方案,解决了在用户与家电设备的语音交互场景中,存在语音交互数据处理效率低下的问题,进而提高了语音交互数据处理效率。
附图说明
此处所说明的附图用来提供对本申请的进一步理解,构成本申请的一部分,本申请的示意性实施例及其说明用于解释本申请,并不构成对本申请的不当限定。在附图中:
图1是本申请实施例的一种语音交互数据的处理方法的计算机终端的硬件结构框图;
图2是根据本申请实施例的语音交互数据的处理方法的流程图;
图3是根据本申请实施例的语音交互数据的处理方法的示意图;
图4是根据本申请实施例的一种语音交互数据的处理装置的结构框图(一);
图5是根据本申请实施例的一种语音交互数据的处理装置的结构框图(二)。
具体实施方式
为了使本技术领域的人员更好地理解本申请方案,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分的实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本申请保护的范围。
需要说明的是,本申请的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本申请的实施例能够以除了在这里图示或描述的那些以外的顺序实施。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
本申请实施例所提供的方法实施例可以在计算机终端或者类似的运算装置中执行。以运行在计算机终端上为例,图1是本申请实施例的一种语音交互数据的处理方法的计算机终端的硬件结构框图。如图1所示,计算机终端可以包括一个或多个(图1中仅示出一个)处理器102(处理器102可以包括但不限于微处理器MCU或可编程逻辑器件FPGA等的处理装置)和用于存储数据的存储器104,在一个示例性实施例中,上述计算机终端还可以包括用于通信功能的传输设备106以及输入输出设备108。本领域普通技术人员可以理解,图1所示的结构仅为示意,其并不对上述计算机终端的结构造成限定。例如,计算机终端还可包括比图1中所示更多或者更少的组件,或者具有与图1所示等同功能或比图1所示功能更多的不同的配置。
存储器104可用于存储计算机程序,例如,应用软件的软件程序以及模块,如本申请实施例中的语音交互数据的处理方法对应的计算机程序,处理器102通过运行存储在存储器104内的计算机程序,从而执行各种功能应用以及数据处理,即实现上述的方法。存储器104可包括高速随机存储器,还可包括非易失性存储器,如一个或者多个磁性存储装置、闪存、或者其他非易失性固态存储器。在一些实例中,存储器104可进一步包括相对于处理器102远程设置的存储器,这些远程存储器可以通过网络连接至计算机终端。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。
传输设备106用于经由一个网络接收或者发送数据。上述的网络具体实例可包括计算机终端的通信供应商提供的无线网络。在一个实例中,传输设备106包括一个网络适配器(Network Interface Controller,简称为NIC),其可通过基站与其他网络设备相连从而可与互联网进行通讯。在一个实例中,传输设备106可以为射频(Radio Frequency,简称为RF)模块,其用于通过无线方式与互联网进行通讯。
在本实施例中提供了一种语音交互数据的处理方法,应用于上述计算机终端,图2是根据本申请实施例的语音交互数据的处理方法的流程图,该流程包括如下步骤:
步骤S202,对第一对象的语音交互数据进行解析,得到所述语音交互数据中的关键字;
需要说明的是,上述第一对象可以理解为与家电设备进行语音交互的交互对象,可以为人,也可以为机器人,本申请对此不做限定。
需要说明的是,上述关键字可以理解为预先设置的坏例数据对应的关键词,可以包括家电设备的运行效果,家电设备的类型等,关键词可以包括一个或多个,其中,多个关键词还可以组合为关键句,关键句也可以用来与坏例数据进行匹配。例如,在关键词为家电设备的运行效果的情况下,可以设置关键词为“速度慢”、“没反应”等,在关键词为家电设备的类型的情况下,可以设置关键词为“冰箱”、“扫地机器人等”。
步骤S204,在确定所述关键字与坏例数据库中的坏例数据匹配成功的情况下,获取所述坏例数据对应的第一对象的语音交互记录,其中,所述坏例数据保存有所述第一对象对所述语音交互记录的评价数据;
需要说明的是,上述坏例(badcase)数据中保存的评价数据可以理解为第一对象拥有不好的家电设备的体验的情况下,对家电设备的做出的评价数据。例如,坏例数据可以包括“这个音箱播放的歌曲不对”,“扫地机器人扫的不干净”等。
步骤S206,根据所述语音交互记录对所述语音交互数据进行分析,向第二对象发送所述语音交互数据的分析结果。
通过上述步骤,对第一对象的语音交互数据进行解析,得到所述语音交互数据中的关键字;在确定所述关键字与坏例数据库中的坏例数据匹配成功的情况下,获取所述坏例数据对应的第一对象的语音交互记录,其中,所述坏例数据保存有所述第一对象对所述语音交互记录的评价数据;根据所述语音交互记录对所述语音交互数据进行分析,向第二对象发送所述语音交互数据的分析结果,解决了相关技术中,在用户与家电设备的语音交互场景中,存在语音交互数据处理效率低下的问题,进而提高了语音交互数据处理效率。
需要说明的是,上述语音交互数据可以通过语音获取设备获取到,语音获取设备可以包括家电设备、移动终端等,但不限于此。
在本申请一可选实施例中,为了更好的理解上述步骤S204如何在确定所述关键字与坏例数据库中的坏例数据匹配成功的情况下,获取所述坏例数据对应的第一对象的语音交互记录,可以通过以下方式确定所述关键字与坏例数据库中的坏例数据匹配成功:在确定所述关键字存在于所述坏例数据库中的情况下,根据预先设置的对应关系在所述坏例数据库中查找与所述关键字对应的坏例数据,其中,所述对应关系用于指示关键字与坏例数据之间的对应关系;在所述坏例数据库中查找到与所述关键字对应的坏例数据的情况下,确定所述关键字与坏例数据库中的坏例数据匹配成功。
通过上述实施例,可以确定所述关键字与坏例数据库中的坏例数据匹配成功,进而提高坏例数据的匹配准确率。
在本申请一可选实施例中,在对第一对象的语音交互数据进行解析,得到所述语音交互数据中的关键字之后,还提供了一种技术方案,具体步骤包括:在确定所述关键字不存在于所述坏例数据库中的情况下,获取所述关键字在所述语音交互数据中对应的坏例数据;将所述关键字和所述关键字在所述语音交互数据中对应的坏例数据按照第一预设规则存储至所述坏例数据库中,其中,所述第一预设规则用于指示所述坏例数据库的存储规则。
在本申请一可选实施例中,为了更好的理解上述步骤S202如何对第一对象的语音交互数据进行解析,得到所述语音交互数据中的关键字,提供了一种技术方案,具体步骤包括:根据第二预设规则对语音交互过程中的语音交互数据进行解析,确定所述语音交互数据中的关键字,其中,所述第二预设规则为所述语音交互数据设置的解析关键字的规则,且所述第二预设规则至少包括以下之一:关键字字长、关键字类型、关键字语种。
在本申请一可选实施例中,为了更好的理解上述步骤S204如何获取坏例数据对应的第一对象的语音交互记录,可以从所述坏例数据库中的存储队列中确定第一存储队列,其中,所述第一存储队列用于存储所述第一对象的语音交互记录,所述第一对象的语音交互记录中包括所述第一对象的坏例数据,所述坏例数据库中包括:与不同目标对象对应的多个存储队列,且所述多个存储队列之间相互独立;从所述第一存储队列中获取第一对象与所述家电设备的语音交互记录。
在本申请一可选实施例中,可以通过以下方案更好的理解上述步骤S206如何根据所述语音交互记录对所述语音交互数据进行分析,具体步骤包括:从所述语音交互记录中确定所述坏例数据的记录频次、所述坏例数据的记录时间和所述坏例数据的记录场景;根据所述坏例数据的记录频次、所述坏例数据的记录时间、所述坏例数据的记录场景和所述坏例数据对应的第一对象确定所述坏例数据的交互规律,所述交互规律用于指示所述第一对象对所述家电设备进行评价的规律;解析所述坏例数据的交互规律,得到所述第一对象对所述家电设备的评价结果,其中,所述评价结果至少包括以下之一:在所述记录时间内的所述记录频次最多的坏例数据对应的评价结果,在所述记录场景下的所述记录频次最多的坏例数据对应的评价结果。
需要说明的是,上述坏例数据的记录场景可以包括“厨房场景”、“客厅场景”、“卫生间场景”等,但不限于此。
在一个实施例中,在确定上述坏例数据为“冰箱没反应”,上述坏例数据的记录频次为5次,上述坏例数据的记录时间为2022年1月1日星期一11点11分至2022年1月24日星期一11点11分,上述坏例数据的记录场景为“厨房场景”的情况下,可以得到用户对厨房里的冰箱在2022年1月1日星期一11点11分至2022年1月24日星期一11点11分内的已经发生5次没有反应的问题的评价结果。
在本申请一可选实施例中,可以通过以下方案更好的理解上述步骤S204如何获取坏例数据对应的第一对象的语音交互记录,具体步骤包括:按照第一时间段划分所述第一对象与所述家电设备的语音交互记录,得到多个子交互记录;统计所述关键字在每一个子交互记录中的出现的次数;根据所述次数的大小顺序对所述多个子交互记录进行排序,得到所述次数最大的子交互记录;将所述次数最大的子交互记录确定为所述坏例数据对应的第一对象的语音交互记录。
需要说明的是,上述第一时间段的时间单位可以包括年、月、日、小时等。
在本申请一可选实施例中,为了更好的理解上述步骤S204中如何获取坏例数据对应的第一对象的语音交互记录,具体步骤包括:按照第二时间段划分所述第一对象与所述家电设备的语音交互记录,得到多个子交互记录;获取所述多个子交互记录中的记录时间;从所述多个子交互记录中查找到所述记录时间最晚的目标子交互记录;将所述目标子交互记录确定为所述坏例数据对应的第一对象的语音交互记录。
需要说明的是,上述第二时间段的时间单位可以包括年、月、日、小时等。
通过上述实施例,通过不同方式获取坏例数据对应的第一对象的语音交互记录,丰富了语音交互记录的获取方法,扩大了语音交互记录的匹配范围,进而提高了语音交互记录的匹配准确性。
为了更好的理解上述语音交互数据的处理方法的过程,以下再结合可选实施例对上述语音交互数据的处理的实现方法流程进行说明,但不用于限定本申请实施例的技术方案。
在本实施例中提供了一种语音交互数据的处理方法,图3是根据本申请实施例的语音交互数据的处理方法的示意图,如图3所示,具体如下步骤:
步骤S301:获取用户(相当于上述第一对象)与家电设备的语音交互数据;
步骤S302:对语音交互数据进行语音识别,得到识别结果,分别执行步骤S303与步骤S307;
步骤S303:获取badcase库(相当于上述坏例数据库)的badcase数据(相当于上述坏例数据);
步骤S304:确定识别结果与badcase数据是否匹配,若是,则执行步骤S305,若否,则执行步骤S306;
步骤S305:基于Kafka中间件获取后台应用;
需要说明的是,Kafka是由Apache软件基金会开发的一个开源流处理平台,由Scala和Java编写。是一款低延迟、高可靠、可伸缩、易于使用的消息中间件。
步骤S306:根据识别结果更新badcase库。
步骤S307:查找到识别结果对应的缓存队列。
需要说明的是,用户的语音交互数据可以根据用户ID通过先进先出的方式缓存在高速缓存数据库中,这种缓存方式缓存速度快,另外为每个用户建立独立的,可以调整存储空间大小的存储队列;
其中,高速缓存数据库包括Redis数据库,Redis数据库是一个高性能的key-value(键值对)数据库,能够支持数据的持久化,支持多种数据结构,支持数据的备份,可减轻数据库压力,提高整体性能,带来更优的用户体验。
步骤S308:通过后台应用从缓存队列中获取用户最近的语音交互记录;
步骤S309:根据用户最近的语音交互记录确定用户的语音交互数据是否存在异常,若是,则执行步骤S310,若否,则执行步骤S311;
步骤S310:通过邮件或者短信实时反馈给开发和运营人员(相当于上述第二对象),同时更新badcase库;
步骤S311:对用户的语音交互数据存在异常的原因进行分析。
通过上述步骤,能够实现以下技术效果:1.badcase库可随时更新。2.体验跟踪过程与正常过程相互独立,对用户无感知。3.基于高速缓存redis,大大提升处理效率,可以近乎实时的将用户异常体验反馈给相关人员。还能够在不影响用户正常交互的情况下,对用户的异常语音记录进行快速跟踪,并实时反馈给开发和产品人员进行处理,部署简单,提高了用户体验。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到根据上述实施例的方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质(如ROM/RAM、磁碟、光盘)中,包括若干指令用以使得一台终端设备(可以是手机,计算机,服务器,或者网络设备等)执行本申请各个实施例的方法。
图4是根据本申请实施例的一种语音交互数据的处理装置的结构框图;如图4所示,包括:
解析模块42,用于对第一对象的语音交互数据进行解析,得到所述语音交互数据中的关键字;
需要说明的是,上述第一对象可以理解为与家电设备进行语音交互的交互对象,可以为人,也可以为机器人,本申请对此不做限定。
需要说明的是,上述关键字可以理解为预先设置的坏例数据对应的关键词,可以包括家电设备的运行效果,家电设备的类型等,关键词可以包括一个或多个,其中,多个关键词还可以组合为关键句,关键句也可以用来与坏例数据进行匹配。例如,在关键词为家电设备的运行效果的情况下,可以设置关键词为“速度慢”、“没反应”等,在关键词为家电设备的类型的情况下,可以设置关键词为“冰箱”、“扫地机器人等”。
获取模块44,用于在确定所述关键字与坏例数据库中的坏例数据匹配成功的情况下,获取所述坏例数据对应的第一对象的语音交互记录,其中,所述坏例数据保存有所述第一对象对所述语音交互记录的评价数据;
需要说明的是,上述坏例(badcase)数据中保存的评价数据可以理解为第一对象拥有不好的家电设备的体验的情况下,对家电设备的做出的评价数据。例如,坏例数据可以包括“这个音箱播放的歌曲不对”,“扫地机器人扫的不干净”等。
发送模块46,用于根据所述语音交互记录对所述语音交互数据进行分析,向第二对象发送所述语音交互数据的分析结果。
通过上述装置,对第一对象的语音交互数据进行解析,得到所述语音交互数据中的关键字;在确定所述关键字与坏例数据库中的坏例数据匹配成功的情况下,获取所述坏例数据对应的第一对象的语音交互记录,其中,所述坏例数据保存有所述第一对象对所述语音交互记录的评价数据;根据所述语音交互记录对所述语音交互数据进行分析,向第二对象发送所述语音交互数据的分析结果,解决了相关技术中,在用户与家电设备的语音交互场景中,存在语音交互数据处理效率低下的问题,进而提高了语音交互数据处理效率。
在本申请一可选实施例中,获取模块44还用于,通过以下方式确定所述关键字与坏例数据库中的坏例数据匹配成功:在确定所述关键字存在于所述坏例数据库中的情况下,根据预先设置的对应关系在所述坏例数据库中查找与所述关键字对应的坏例数据,其中,所述对应关系用于指示关键字与坏例数据之间的对应关系;在所述坏例数据库中查找到与所述关键字对应的坏例数据的情况下,确定所述关键字与坏例数据库中的坏例数据匹配成功。
通过上述实施例,可以确定所述关键字与坏例数据库中的坏例数据匹配成功,进而提高坏例数据的匹配准确率。
在本申请一可选实施例中,解析模块42还用于,根据第二预设规则对语音交互过程中的语音交互数据进行解析,确定所述语音交互数据中的关键字,其中,所述第二预设规则为所述语音交互数据设置的解析关键字的规则,且所述第二预设规则至少包括以下之一:关键字字长、关键字类型、关键字语种。
在本申请一可选实施例中,获取模块44还用于,从所述坏例数据库中的存储队列中确定第一存储队列,其中,所述第一存储队列用于存储所述第一对象的语音交互记录,所述第一对象的语音交互记录中包括所述第一对象的坏例数据,所述坏例数据库中包括:与不同目标对象对应的多个存储队列,且所述多个存储队列之间相互独立;从所述第一存储队列中获取第一对象与家电设备的语音交互记录。
在本申请一可选实施例中,发送模块46还用于,从所述语音交互记录中确定所述坏例数据的记录频次、所述坏例数据的记录时间和所述坏例数据的记录场景;根据所述坏例数据的记录频次、所述坏例数据的记录时间、所述坏例数据的记录场景和所述坏例数据对应的第一对象确定所述坏例数据的交互规律,所述交互规律用于指示所述第一对象对家电设备进行评价的规律;解析所述坏例数据的交互规律,得到所述第一对象对所述家电设备的评价结果,其中,所述评价结果至少包括以下之一:在所述记录时间内的所述记录频次最多的坏例数据对应的评价结果,在所述记录场景下的所述记录频次最多的坏例数据对应的评价结果。
需要说明的是,上述坏例数据的记录场景可以包括“厨房场景”、“客厅场景”、“卫生间场景”等,但不限于此。
在一个实施例中,在确定上述坏例数据为“冰箱没反应”,上述坏例数据的记录频次为5次,上述坏例数据的记录时间为2022年1月1日星期一11点11分至2022年1月24日星期一11点11分,上述坏例数据的记录场景为“厨房场景”的情况下,可以得到用户对厨房里的冰箱在2022年1月1日星期一11点11分至2022年1月24日星期一11点11分内的已经发生5次没有反应的问题的评价结果。
在本申请一可选实施例中,获取模块44还用于,按照第一时间段划分所述第一对象与家电设备的语音交互记录,得到多个子交互记录;统计所述关键字在每一个子交互记录中的出现的次数;根据所述次数的大小顺序对所述多个子交互记录进行排序,得到所述次数最大的子交互记录;将所述次数最大的子交互记录确定为所述坏例数据对应的第一对象的语音交互记录。
在本申请一可选实施例中,获取模块44还用于,按照第二时间段划分所述第一对象与家电设备的语音交互记录,得到多个子交互记录;获取所述多个子交互记录中的记录时间;从所述多个子交互记录中查找到所述记录时间最晚的目标子交互记录;将所述目标子交互记录确定为所述坏例数据对应的第一对象的语音交互记录。
通过上述实施例,通过不同方式获取坏例数据对应的第一对象的语音交互记录,丰富了语音交互记录的获取方法,扩大了语音交互记录的匹配范围,进而提高了语音交互记录的匹配准确性。
图5是根据本申请实施例的一种语音交互数据的处理装置的结构框图;如图5所示,包括:解析模块42,获取模块44,发送模块46,存储模块52。
其中,存储模块52用于对第一对象的语音交互数据进行解析,得到所述语音交互数据中的关键字之后,所述方法还包括:在确定所述关键字不存在于所述坏例数据库中的情况下,获取所述关键字在所述语音交互数据中对应的坏例数据;将所述关键字和所述关键字在所述语音交互数据中对应的坏例数据按照第一预设规则存储至所述坏例数据库中,其中,所述第一预设规则用于指示所述坏例数据库的存储规则。
通过上述装置,对第一对象的语音交互数据进行解析,得到所述语音交互数据中的关键字;在确定所述关键字与坏例数据库中的坏例数据匹配成功的情况下,获取所述坏例数据对应的第一对象的语音交互记录,其中,所述坏例数据保存有所述第一对象对所述语音交互记录的评价数据;根据所述语音交互记录对所述语音交互数据进行分析,向第二对象发送所述语音交互数据的分析结果,解决了相关技术中,在用户与家电设备的语音交互场景中,存在语音交互数据处理效率低下的问题,进而提高了语音交互数据处理效率。
本申请的实施例还提供了一种存储介质,该存储介质包括存储的程序,其中,上述程序运行时执行上述任一项的方法。
可选地,在本实施例中,上述存储介质可以被设置为存储用于执行以下步骤的程序代码:
S1,对第一对象的语音交互数据进行解析,得到所述语音交互数据中的关键字;
S2,在确定所述关键字与坏例数据库中的坏例数据匹配成功的情况下,获取所述坏例数据对应的第一对象的语音交互记录,其中,所述坏例数据保存有所述第一对象对所述语音交互记录的评价数据;
S3,根据所述语音交互记录对所述语音交互数据进行分析,向第二对象发送所述语音交互数据的分析结果。
本申请的实施例还提供了一种电子装置,包括存储器和处理器,该存储器中存储有计算机程序,该处理器被设置为运行计算机程序以执行上述任一项方法实施例中的步骤。
可选地,上述电子装置还可以包括传输设备以及输入输出设备,其中,该传输设备和上述处理器连接,该输入输出设备和上述处理器连接。
可选地,在本实施例中,上述处理器可以被设置为通过计算机程序执行以下步骤:
S1,对第一对象的语音交互数据进行解析,得到所述语音交互数据中的关键字;
S2,在确定所述关键字与坏例数据库中的坏例数据匹配成功的情况下,获取所述坏例数据对应的第一对象的语音交互记录,其中,所述坏例数据保存有所述第一对象对所述语音交互记录的评价数据;
S3,根据所述语音交互记录对所述语音交互数据进行分析,向第二对象发送所述语音交互数据的分析结果。
可选地,在本实施例中,上述存储介质可以包括但不限于:U盘、只读存储器(Read-Only Memory,简称为ROM)、随机存取存储器(RandomAccess Memory,简称为RAM)、移动硬盘、磁碟或者光盘等各种可以存储程序代码的介质。
可选地,本实施例中的具体示例可以参考上述实施例及可选实施方式中所描述的示例,本实施例在此不再赘述。
显然,本领域的技术人员应该明白,上述的本申请的各模块或各步骤可以用通用的计算装置来实现,它们可以集中在单个的计算装置上,或者分布在多个计算装置所组成的网络上,可选地,它们可以用计算装置可执行的程序代码来实现,从而,可以将它们存储在存储装置中由计算装置来执行,并且在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤,或者将它们分别制作成各个集成电路模块,或者将它们中的多个模块或步骤制作成单个集成电路模块来实现。这样,本申请不限制于任何特定的硬件和软件结合。
以上所述仅为本申请的优选实施例而已,并不用于限制本申请,对于本领域的技术人员来说,本申请可以有各种更改和变化。凡在本申请的原则之内,所作的任何修改、等同替换、改进等,均应包含在本申请的保护范围之内。

Claims (10)

1.一种语音交互数据的处理方法,其特征在于,包括:
对第一对象的语音交互数据进行解析,得到所述语音交互数据中的关键字;
在确定所述关键字与坏例数据库中的坏例数据匹配成功的情况下,获取所述坏例数据对应的第一对象的语音交互记录,其中,所述坏例数据保存有所述第一对象对所述语音交互记录的评价数据;
根据所述语音交互记录对所述语音交互数据进行分析,向第二对象发送所述语音交互数据的分析结果。
2.根据权利要求1所述的语音交互数据的处理方法,其特征在于,对第一对象的语音交互数据进行解析,得到所述语音交互数据中的关键字之后,所述方法还包括:
在确定所述关键字不存在于所述坏例数据库中的情况下,获取所述关键字在所述语音交互数据中对应的坏例数据;
将所述关键字和所述关键字在所述语音交互数据中对应的坏例数据按照第一预设规则存储至所述坏例数据库中,其中,所述第一预设规则用于指示所述坏例数据库的存储规则。
3.根据权利要求1所述的语音交互数据的处理方法,其特征在于,对第一对象的语音交互数据进行解析,得到所述语音交互数据中的关键字,包括:
根据第二预设规则对语音交互过程中的语音交互数据进行解析,确定所述语音交互数据中的关键字,其中,所述第二预设规则为所述语音交互数据设置的解析关键字的规则,且所述第二预设规则至少包括以下之一:关键字字长、关键字类型、关键字语种。
4.根据权利要求1所述的语音交互数据的处理方法,其特征在于,获取坏例数据对应的第一对象的语音交互记录,包括:
从所述坏例数据库中的存储队列中确定第一存储队列,其中,所述第一存储队列用于存储所述第一对象的语音交互记录,所述第一对象的语音交互记录中包括所述第一对象的坏例数据,所述坏例数据库中包括:与不同目标对象对应的多个存储队列,且所述多个存储队列之间相互独立;
从所述第一存储队列中获取第一对象与家电设备的语音交互记录。
5.根据权利要求1所述的语音交互数据的处理方法,其特征在于,根据所述语音交互记录对所述语音交互数据进行分析,包括:
从所述语音交互记录中确定所述坏例数据的记录频次、所述坏例数据的记录时间和所述坏例数据的记录场景;
根据所述坏例数据的记录频次、所述坏例数据的记录时间、所述坏例数据的记录场景和所述坏例数据对应的第一对象确定所述坏例数据的交互规律,所述交互规律用于指示所述第一对象对家电设备进行评价的规律;
解析所述坏例数据的交互规律,得到所述第一对象对所述家电设备的评价结果,其中,所述评价结果至少包括以下之一:在所述记录时间内的所述记录频次最多的坏例数据对应的评价结果,在所述记录场景下的所述记录频次最多的坏例数据对应的评价结果。
6.根据权利要求1所述的语音交互数据的处理方法,其特征在于,获取坏例数据对应的第一对象的语音交互记录,包括:
按照第一时间段划分所述第一对象与家电设备的语音交互记录,得到多个子交互记录;
统计所述关键字在每一个子交互记录中的出现的次数;
根据所述次数的大小顺序对所述多个子交互记录进行排序,得到所述次数最大的子交互记录;
将所述次数最大的子交互记录确定为所述坏例数据对应的第一对象的语音交互记录。
7.根据权利要求1所述的语音交互数据的处理方法,其特征在于,获取坏例数据对应的第一对象的语音交互记录,包括:
按照第二时间段划分所述第一对象与家电设备的语音交互记录,得到多个子交互记录;
根据每一所述子交互记录的记录时间,从所述多个子交互记录中查找到所述记录时间最晚的目标子交互记录;
将所述目标子交互记录确定为所述坏例数据对应的第一对象的语音交互记录。
8.一种语音交互数据的处理装置,其特征在于,包括:
解析模块,用于对第一对象的语音交互数据进行解析,得到所述语音交互数据中的关键字;
获取模块,用于在确定所述关键字与坏例数据库中的坏例数据匹配成功的情况下,获取所述坏例数据对应的第一对象的语音交互记录,其中,所述坏例数据保存有所述第一对象对所述语音交互记录的评价数据;发送模块,用于根据所述语音交互记录对所述语音交互数据进行分析,向第二对象发送所述语音交互数据的分析结果。
9.一种计算机可读的存储介质,其特征在于,所述计算机可读的存储介质包括存储的程序,其中,所述程序运行时执行上述权利要求1至7任一项中所述的方法。
10.一种电子装置,包括存储器和处理器,其特征在于,所述存储器中存储有计算机程序,所述处理器被设置为通过所述计算机程序执行所述权利要求1至7任一项中所述的方法。
CN202210153613.3A 2022-02-18 2022-02-18 语音交互数据的处理方法和装置、存储介质及电子装置 Pending CN114678012A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210153613.3A CN114678012A (zh) 2022-02-18 2022-02-18 语音交互数据的处理方法和装置、存储介质及电子装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210153613.3A CN114678012A (zh) 2022-02-18 2022-02-18 语音交互数据的处理方法和装置、存储介质及电子装置

Publications (1)

Publication Number Publication Date
CN114678012A true CN114678012A (zh) 2022-06-28

Family

ID=82071820

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210153613.3A Pending CN114678012A (zh) 2022-02-18 2022-02-18 语音交互数据的处理方法和装置、存储介质及电子装置

Country Status (1)

Country Link
CN (1) CN114678012A (zh)

Citations (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006227564A (ja) * 2005-01-20 2006-08-31 Advanced Telecommunication Research Institute International 音響評定装置、およびプログラム
CN101231660A (zh) * 2008-02-19 2008-07-30 林超 电话自然对话中关键信息的挖掘系统及其方法
CN101604233A (zh) * 2004-02-06 2009-12-16 刘新斌 一种用于交互控制的语音虚拟键盘的使用方法
CA2808578A1 (en) * 2010-04-26 2011-10-26 Research In Motion Limited Systems and methods of voice call setup involving mobile devices
WO2015132829A1 (ja) * 2014-03-07 2015-09-11 パナソニックIpマネジメント株式会社 音声対話装置、音声対話システムおよび音声対話方法
CN107016044A (zh) * 2017-02-17 2017-08-04 阿里巴巴集团控股有限公司 一种数据可视化处理的方法及装置
CN107464564A (zh) * 2017-08-21 2017-12-12 腾讯科技(深圳)有限公司 语音交互方法、装置及设备
CN109712618A (zh) * 2018-12-06 2019-05-03 珠海格力电器股份有限公司 一种语音服务的控制方法、装置、存储介质及空调
CN110265013A (zh) * 2019-06-20 2019-09-20 平安科技(深圳)有限公司 语音的识别方法及装置、计算机设备、存储介质
CN111582193A (zh) * 2020-05-09 2020-08-25 北京世纪好未来教育科技有限公司 坏例识别及其模型优化方法、装置及计算机存储介质
CN111898918A (zh) * 2020-08-07 2020-11-06 上海明略人工智能(集团)有限公司 一种设备使用跟踪管理方法、装置、设备及存储介质
CN112256576A (zh) * 2020-10-22 2021-01-22 中国平安人寿保险股份有限公司 人机对话语料测试方法、装置、设备及存储介质
KR20210038460A (ko) * 2020-03-17 2021-04-07 베이징 바이두 넷컴 사이언스 테크놀로지 컴퍼니 리미티드 음성 인터랙션 처리 방법, 장치와 전자기기
US20210127003A1 (en) * 2019-10-28 2021-04-29 Baidu Online Network Technology (Beijing) Co., Ltd. Interactive voice-control method and apparatus, device and medium
CN113590771A (zh) * 2021-01-26 2021-11-02 腾讯科技(深圳)有限公司 一种数据挖掘方法、装置、设备及存储介质
CN113810548A (zh) * 2021-09-17 2021-12-17 广州科天视畅信息科技有限公司 基于iot的智能通话质检方法系统

Patent Citations (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101604233A (zh) * 2004-02-06 2009-12-16 刘新斌 一种用于交互控制的语音虚拟键盘的使用方法
JP2006227564A (ja) * 2005-01-20 2006-08-31 Advanced Telecommunication Research Institute International 音響評定装置、およびプログラム
CN101231660A (zh) * 2008-02-19 2008-07-30 林超 电话自然对话中关键信息的挖掘系统及其方法
CA2808578A1 (en) * 2010-04-26 2011-10-26 Research In Motion Limited Systems and methods of voice call setup involving mobile devices
WO2015132829A1 (ja) * 2014-03-07 2015-09-11 パナソニックIpマネジメント株式会社 音声対話装置、音声対話システムおよび音声対話方法
CN107016044A (zh) * 2017-02-17 2017-08-04 阿里巴巴集团控股有限公司 一种数据可视化处理的方法及装置
CN107464564A (zh) * 2017-08-21 2017-12-12 腾讯科技(深圳)有限公司 语音交互方法、装置及设备
CN109712618A (zh) * 2018-12-06 2019-05-03 珠海格力电器股份有限公司 一种语音服务的控制方法、装置、存储介质及空调
CN110265013A (zh) * 2019-06-20 2019-09-20 平安科技(深圳)有限公司 语音的识别方法及装置、计算机设备、存储介质
US20210127003A1 (en) * 2019-10-28 2021-04-29 Baidu Online Network Technology (Beijing) Co., Ltd. Interactive voice-control method and apparatus, device and medium
KR20210038460A (ko) * 2020-03-17 2021-04-07 베이징 바이두 넷컴 사이언스 테크놀로지 컴퍼니 리미티드 음성 인터랙션 처리 방법, 장치와 전자기기
CN111582193A (zh) * 2020-05-09 2020-08-25 北京世纪好未来教育科技有限公司 坏例识别及其模型优化方法、装置及计算机存储介质
CN111898918A (zh) * 2020-08-07 2020-11-06 上海明略人工智能(集团)有限公司 一种设备使用跟踪管理方法、装置、设备及存储介质
CN112256576A (zh) * 2020-10-22 2021-01-22 中国平安人寿保险股份有限公司 人机对话语料测试方法、装置、设备及存储介质
CN113590771A (zh) * 2021-01-26 2021-11-02 腾讯科技(深圳)有限公司 一种数据挖掘方法、装置、设备及存储介质
CN113810548A (zh) * 2021-09-17 2021-12-17 广州科天视畅信息科技有限公司 基于iot的智能通话质检方法系统

Similar Documents

Publication Publication Date Title
CN110321387B (zh) 数据同步方法、设备及终端设备
US11676576B2 (en) Organizational-based language model generation
CN110909063A (zh) 一种用户行为的分析方法、装置、应用服务器及存储介质
CN110659121A (zh) 任务数据获取方法及装置、任务配置方法及装置和服务器
CN110209809B (zh) 文本聚类方法和装置、存储介质及电子装置
CN113553310B (zh) 数据的采集方法及装置、存储介质、电子设备
CN111752807A (zh) 一种基于Kubernetes的资源监控方法
CN109448710B (zh) 语音处理方法及装置、家电设备、存储介质电子装置
CN105553770B (zh) 一种数据采集控制方法和装置
CN111680016A (zh) 分布式服务器集群日志数据处理方法、装置及系统
CN106713011A (zh) 一种获取测试数据的方法与系统
CN111736938A (zh) 信息的显示方法及装置、存储介质和电子装置
CN114493028A (zh) 预测模型的建立方法和装置、存储介质及电子装置
CN113468196B (zh) 用于处理数据的方法、装置、系统、服务器和介质
CN106940710B (zh) 信息推送方法及装置
CN112732663A (zh) 一种日志信息处理方法及装置
CN114678012A (zh) 语音交互数据的处理方法和装置、存储介质及电子装置
CN112184138A (zh) 结合rpa和ai的电网工单处理方法、装置及电子设备
CN110109803B (zh) 一种用户行为上报方法及系统
CN111782901A (zh) 数据采集方法以及装置
CN111581518A (zh) 信息推送方法和装置
CN116257571A (zh) 用于Clickhouse的指标统计方法、装置和指标统计系统
CN111089396A (zh) 控制空调的方法及空调
CN113486237B (zh) 一种航班信息的推荐方法、系统、存储介质和电子设备
CN111651338B (zh) 日志格式化时间的获取系统及其方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination