CN105681546A - 一种语音处理的方法、装置以及终端 - Google Patents

一种语音处理的方法、装置以及终端 Download PDF

Info

Publication number
CN105681546A
CN105681546A CN201511022337.3A CN201511022337A CN105681546A CN 105681546 A CN105681546 A CN 105681546A CN 201511022337 A CN201511022337 A CN 201511022337A CN 105681546 A CN105681546 A CN 105681546A
Authority
CN
China
Prior art keywords
voice
information
responsive
vocabulary
voice information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201511022337.3A
Other languages
English (en)
Inventor
聂影
刘东海
许行
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Yulong Computer Telecommunication Scientific Shenzhen Co Ltd
Original Assignee
Yulong Computer Telecommunication Scientific Shenzhen Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Yulong Computer Telecommunication Scientific Shenzhen Co Ltd filed Critical Yulong Computer Telecommunication Scientific Shenzhen Co Ltd
Priority to CN201511022337.3A priority Critical patent/CN105681546A/zh
Publication of CN105681546A publication Critical patent/CN105681546A/zh
Priority to PCT/CN2016/104016 priority patent/WO2017113974A1/zh
Pending legal-status Critical Current

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M1/00Substation equipment, e.g. for use by subscribers
    • H04M1/72Mobile telephones; Cordless telephones, i.e. devices for establishing wireless links to base stations without route selection
    • H04M1/724User interfaces specially adapted for cordless or mobile telephones
    • H04M1/72448User interfaces specially adapted for cordless or mobile telephones with means for adapting the functionality of the device according to specific conditions
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/48Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use
    • G10L25/51Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for comparison or discrimination
    • G10L25/63Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for comparison or discrimination for estimating an emotional state
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M1/00Substation equipment, e.g. for use by subscribers
    • H04M1/72Mobile telephones; Cordless telephones, i.e. devices for establishing wireless links to base stations without route selection
    • H04M1/724User interfaces specially adapted for cordless or mobile telephones
    • H04M1/72403User interfaces specially adapted for cordless or mobile telephones with means for local support of applications that increase the functionality
    • H04M1/7243User interfaces specially adapted for cordless or mobile telephones with means for local support of applications that increase the functionality with interactive means for internal management of messages
    • H04M1/72436User interfaces specially adapted for cordless or mobile telephones with means for local support of applications that increase the functionality with interactive means for internal management of messages for text messaging, e.g. SMS or e-mail
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M1/00Substation equipment, e.g. for use by subscribers
    • H04M1/72Mobile telephones; Cordless telephones, i.e. devices for establishing wireless links to base stations without route selection
    • H04M1/725Cordless telephones

Abstract

本发明实施例提供了一种语音处理的方法、装置以及终端,其中,所述方法包括:当检测到语音通话事件时,确定用户当前的情绪状态信息;根据所述情绪状态信息,确定是否开启语音处理功能;当确定到开启所述语音处理功能时,根据预置的语音响应表对获取的语音信息进行语音处理;其中,所述对获取的语音信息进行语音处理包括:对获取的语音信息中的敏感词汇的转换处理或提示处理。采用本发明,可提升语音信息传递的真实性。

Description

一种语音处理的方法、装置以及终端
技术领域
本发明涉及语音通信技术领域,尤其涉及一种语音处理的方法、装置以及终端。
背景技术
现代社会下,人们的每日生活节奏越来越快,用户的情绪也会随之产生较大波动,而根据心理学原理来说,可以分为以下几个步骤:事件发生(可观察)→根据情感需求进行的心理活动(难自我觉察,不可观察)→情绪(可自我觉察,难观察)→行为(可自我觉察,可观察)。可见当用户情绪低落时,趋于情感上的需求,可能希望从手机中获取一些信息进行情绪的调整。现有技术中,通信终端可以检测获取终端用户的情绪状态,并根据所述情绪状态发出对应的控制指令,以便开启预设的能够调节终端用户情绪状态的应用。
然而,在实践中发现,当终端用户处于某种不良情绪(如愤怒、生气等)下往往会做出一些冲动的行为,如在通话过程中会将一些错误信息传递给对方这样会影响信息传递的真实性。
发明内容
本发明实施例所要解决的技术问题在于,提供一种语音处理的方法、装置以及终端,可提升语音信息传递的真实可靠性。
一方面,本发明实施例公开提供了一种语音处理的方法,所述方法包括:
当检测到语音通话事件时,确定用户当前的情绪状态信息;
根据所述情绪状态信息,确定是否开启语音处理功能;
当确定到开启所述语音处理功能时,根据预置的语音响应表对获取的语音信息进行语音处理;
其中,所述对获取的语音信息进行语音处理包括:对获取的语音信息中的敏感词汇的转换处理或提示处理。
其中可选地,所述根据确定的所述情绪状态信息,确定是否开启语音处理功能之前,还包括:
获取用户情绪状态信息对应的状态类型;
为每一个状态类型配置对应的语音处理权限;所述语音处理权限用于判断是否开启所述语音处理功能;
根据所述用户情绪状态信息和所述语音处理权限生成预置的语音开关配置表,以便根据所述预置的语音开关配置表执行所述根据确定的所述情绪状态信息,确定是否开启语音处理功能。
其中可选地,所述根据预置的语音响应表对获取的语音信息进行语音处理,包括:
检测所述语音信息中是否包括敏感词汇;
当检测到所述语音信息中包括敏感词汇时,将所述敏感词汇转换为所述预置的语音响应表中与所述敏感词汇对应的替换词汇。
其中可选地,所述根据预置的语音响应表对获取的语音信息进行语音处理,包括:
检测所述语音信息中是否包括敏感词汇;
当检测到所述语音信息中包括敏感词汇时,判断所述敏感词汇所指示的敏感信息是否合理;
若判断到不合理,则拦截所述语音信息,并发送提示信息,所述提示信息用于提示所述语音信息中的敏感词汇所指示的敏感信息不合理。
其中可选地,
所述情绪状态信息为根据所述语音信息的音量、声调、频率、类型中的一种或多种组合确定;或者,通过采集语音通话过程中用户的脸部特征信息确定。
另一方面,本发明实施例公开提供了一种语音处理的装置,所述装置包括:
确定模块,用于当检测到语音通话事件时,确定用户当前的情绪状态信息;并根据确定到的情绪状态信息,进一步确定是否开启语音处理功能;
处理模块,用于当所述确定模块确定到开启所述语音处理功能时,根据预置的语音响应表对获取的语音信息进行语音处理;
其中,所述对获取的语音信息进行语音处理包括:对获取的语音信息中的敏感词汇的转换处理或提示处理。
其中可选地,所述装置还包括:
获取模块,用于获取用户情绪状态信息对应的状态类型;
配置模块,用于为所述获取模块获取到的每一个状态类型配置对应的语音处理权限;所述语音处理权限用于判断是否开启所述语音处理功能;
生成模块,用于根据所述获取模块获取的用户情绪状态信息和所述配置模块配置的语音处理权限生成预置的语音开关配置表,以便所述确定模块根据所述预置的语音开关配置表执行所述根据确定的所述情绪状态信息,确定是否开启语音处理功能。
其中可选地,
所述处理模块,具体用于检测所述语音信息中是否包括敏感词汇;当检测到所述语音信息中包括敏感词汇时,将所述敏感词汇转换为所述预置的语音响应表中与所述敏感词汇对应的替换词汇。
其中可选地,
所述处理模块,具体用于检测所述语音信息中是否包括敏感词汇;当检测到所述语音信息中包括敏感词汇时,判断所述敏感词汇所指示的敏感信息是否合理,若判断到不合理,则拦截所述语音信息,并发送提示信息,所述提示信息用于提示所述语音信息中的敏感词汇所指示的敏感信息不合理。
其中可选地,
所述情绪状态信息为根据所述语音信息的音量、声调、频率、类型中的一种或多种确定;或者,通过采集语音通话过程中用户的脸部特征信息确定。
再一方面,本发明实施例还公开提供了一种终端,所述终端包括所述的语音处理装置。
本发明实施例中可通过当检测到语音通话事件时,确定用户当前的情绪状态信息,并根据所述情绪状态信息确定是否开启语音处理功能;当确定到开启所述语音处理功能时,根据预置的语音响应表对获取的语音信息进行语音处理,其中,所述对获取的语音信息进行语音处理包括:对获取的语音信息中的敏感词汇的转换处理或提示处理,这样可避免终端用户处于某种不良情绪状态下发送错误的语音信息给接听方,从而提升了语音信息传递的真实性和可靠性。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本发明实施例的一种语音处理方法的流程示意图;
图2是本发明实施例的另一种语音处理方法的流程示意图;
图3是本发明实施例的一种语音处理装置的结构示意图;
图4是本发明实施例的另一种语音处理装置的结构示意图;
图5是本发明实施例的一种终端的结构示意图。
具体实施方式
本发明实施例提供了一种处理结果的展示方法及装置,以期可以对关键词进行快速搜索,获取用户最想得到的结果信息,操作简单,效率高。
为了使本技术领域的人员更好地理解本发明方案,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分的实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本发明保护的范围。
本发明的说明书和权利要求书及上述附图中的术语“第一”、“第二”和“第三”等是用于区别不同对象,而非用于描述特定顺序。此外,术语“包括”以及它们任何变形,意图在于覆盖不排他的包含。例如包含了一系列步骤或单元的过程、方法、系统、产品或设备没有限定于已列出的步骤或单元,而是可选地还包括没有列出的步骤或单元,或可选地还包括对于这些过程、方法、产品或设备固有的其它步骤或单元。
请参见图1,是本发明实施例的一种语音处理方法的流程示意图,本发明实施例的所述方法可以应用在诸如智能手机、平板电脑、智能可穿戴设备等带通信网络功能的终端中,具体可由这些通信终端的处理器来实现。本发明实施例的所述方法还包括如下步骤。
S101、当检测到语音通话事件时,确定用户当前的情绪状态信息。
本发明实施例中,当通信终端检测到终端用户使用本终端进行语音通话(如语音聊天、语音视频等)时,本终端可触发开启本终端的摄像头,拍摄采集用户当前的面部表情特征信息,根据所述面部表情特征信息确定用户当前的情绪状态信息(如拍摄采集到的面部表情特征信息为愤怒,则通信终端确定出来的当前用户情绪状态信息为愤怒);或者,通信终端通过采集语音通话过程中的语音信息,通过分析所述语音信息中的音量、声调、频率、类型等特征中的一种或多种来确定用户当前的情绪状态信息(如语音信息中的音量大,语速快(也即是频率快),那么通信终端确定出来的用户当前的情绪状态信息为狂躁)。
其中可选地,所述通信终端可以将本终端采集到的用户当前的面部特征表情信息上传至云端服务器,云端服务器接收并分析所述面部特征表情信息对应的用户当前的情绪状态信息,所述云端服务器还可以将分析出的用户当前的情绪状态信息返回至所述通信终端,所述通信终端接收所述云端服务器返回的所述用户当前的情绪状态信息;同理,所述通信终端还可以将本终端在语音通话过程中采集到的所述语音信息发送至云端服务器,所述云端服务器接收所述语音信息,并通过分析所述语音信息中的音量、声调、频率、类型等特征中的一种或多种来来分析出与所述语音信息对应的用户当前的情绪状态信息,所述云端服务器还可以将分析出的用户当前的情绪状态信息返回至所述通信终端,所述通信终端接收所述云端服务器返回的所述用户当前的情绪状态信息。
所述通信终端可以包括个人电脑、智能手机(如Android手机、iOS手机等)、平板电脑、掌上电脑、移动互联网设备(MID,MobileInternetDevices)或穿戴式智能设备等互联网设备,本发明实施例不作限定。
S102、根据所述情绪状态信息,确定是否开启语音处理功能。
本发明实施例中,通信终端可以采集用户在语音通过程中的面部特征表情信息和/或语音信息,所述通信终端根据采集到的所述面部特征表情信息和/或所述语音信息确定出用户情绪状态信息(如开心、兴奋、喜悦、伤心、生气等),所述通信终端还可以为确定到的所有或者部分所述用户情绪状态信息进行分类,得到至少一个状态类型。示例性地,如下表1给出了常见的几种用户情绪状态信息以及与所述用户情绪状态信息对应的状态类型。
表1
所述通信终端还可以为分类得到的每一个状态类型配置相应的语音处理权限,其中,所述语音处理权限用于所述通信终端判断本终端是否开启本终端的语音处理功能;所述通信终端可以根据所述状态类型中的各个用户状态信息和为所述状态类型配置的语音处理权限生成预置的语音开关配置表。示例性地,如下表2给出了预置的语音开关配置表。
表2
状态类型 是否开启语音处理功能
所述通信终端可以根据S101确定到的所述情绪状态信息和生成的所述预置的语音开关配置表,确定出所述通信终端是否开启本终端的语音处理功能。
示例性地,假设S101通信终端确定出的用户当前的情绪状态信息为生气,引用表1的用户情绪状态信息与状态类型的对应关系,所述通信终端可以获取到与所述情绪状态信息为生气对应的状态类型为怒,引用表2预置的语音开关配置表,所述通信终端可以确定出当所述状态类型为怒时,所述通信终端开启本终端的语音处理功能。
S103、当确定到开启所述语音处理功能时,根据预置的语音响应表对获取的语音信息进行语音处理;其中,所述对获取的语音信息进行语音处理包括:对获取的语音信息中的敏感词汇的转换处理或提示处理。
本发明实施例中,终端用户或者系统可以预先在通信终端中设置进行语音处理的语音响应表;当通信终端在S102中确定到开启本终端的语音处理功能时,所述通信终端可以根据本终端中预置的语音响应表对获取的语音信息进行语音处理。示例性地,如下表3所示,给出了一张预置的语音响应表。
表3
具体实现中,所述通信终端可以检测所述语音信息中是否包括敏感词汇(如粗鲁词汇等),若所述通信终端检测到所述语音信息中存在敏感词汇,则所述通信终端根据本终端中的预置的语音响应表将所述敏感词汇替换为所述语音响应表中与所述敏感词汇对应的替换词汇(如表3中将“滚蛋”替换为“请走开”),所述通信终端可以将处理之后的语音信息(也即是,包括替换词汇的语音信息)发送给接听方;和/或,
所述通信终端可以检测所述语音信息中是否包括敏感词汇(如关于金钱方面的决策等),若所述通信终端检测到所述语音信息中存在敏感词汇,则所述通信终端可以根据预置的语音响应表判断所述敏感词汇所指示的敏感信息是否合理,当所述通信终端判断到所述敏感词汇所指示的敏感信息不合理时,所述通信终端将拦截包括敏感词汇的语音信息,并发送一个或多个提示信息,所述提示信息用于提示终端用户发送的所述包括敏感词汇的语音信息不合理或者提示用户请三思等。
本发明实施例中可通过当检测到语音通话事件时,确定用户当前的情绪状态信息,并根据所述情绪状态信息确定是否开启语音处理功能;当确定到开启所述语音处理功能时,根据预置的语音响应表对获取的语音信息进行语音处理,其中,所述对获取的语音信息进行语音处理包括:对获取的语音信息中的敏感词汇的转换处理或提示处理,这样可避免终端用户处于某种不良情绪状态下发送错误的语音信息给接听方,从而提升了语音信息传递的真实性和可靠性。
请参见图2,是本发明实施例的另一种语音处理方法的流程示意图,本发明实施例的所述方法可以应用在诸如智能手机、平板电脑、智能可穿戴设备等带通信网络功能的终端中,具体可由这些通信终端的处理器来实现。本发明实施例的所述方法还包括如下步骤。
S201、获取用户情绪状态信息对应的状态类型。
S202、为每一个状态类型配置对应的语音处理权限;所述语音处理权限用于判断是否开启所述语音处理功能。
S203、根据所述用户情绪状态信息和所述语音处理权限生成预置的语音开关配置表。
S204、当检测到语音通话事件时,确定用户当前的情绪状态信息。
S205、根据所述情绪状态信息和所述预置的语音开关配置表,确定是否开启语音处理功能。
S206、当确定到开启所述语音处理功能时,检测所述语音信息中是否包括敏感词汇。
S207、当检测到所述语音信息中包括敏感词汇时,将所述敏感词汇转换为所述预置的语音响应表中与所述敏感词汇对应的替换词汇。
本发明实施例中,终端用户或者系统可以预先在通信终端中设置进行语音处理的语音响应表;当通信终端在S206中确定到开启本终端的语音处理功能,且检测到所述语音信息中包括敏感词汇时,所述通信终端可以根据本终端中预置的语音响应表将获取的语音信息中的敏感词汇替换为所述语音响应表中与所述敏感词汇对应的替换词汇(如上表3中将“滚蛋”替换为“请走开”)。
S208、当检测到所述语音信息中包括敏感词汇时,判断所述敏感词汇所指示的敏感信息是否合理。
本发明实施例中,当通信终端在S206中确定到开启本终端的语音处理功能,且检测到所述语音信息中包括敏感词汇时,所述通信终端可以根据预置的语音响应表判断所述敏感词汇所指示的敏感信息是否合理;当所述通信终端判断到合理时,继续执行S210步骤;当所述通信终端判断到不合理时,继续执行S209步骤。
具体实现中,所述通信终端可以将所述语音信息中的敏感词汇上传至云端服务器,其中,所述云端服务器存储有终端用户在所述通信终端上记录的所有或者部分日常数据;所述云端服务器可以根据本服务器中存储的用于影响判断所述敏感词汇所指示的敏感信息是否合理的数据,分析判断所述敏感词汇所指示的敏感信息是否合理,所述云端服务器将判断结果返回至所述通信终端,所述通信终端根据所述云端服务器返回的判断结果进一步执行操作,也即是,当所述通信终端接收到的判断结果为合理时,所述通信终端可以将包括所述敏感词汇的语音信息发送给接听方;当所述通信终端接收到的判断结果为不合理时,继续执行S209步骤;或者,当所述云端服务器判断到所述敏感词汇所指示的敏感信息不合理时,发送拦截提示指令给所述通信终端,所述通信终端响应所述拦截提示指令,以便执行S209步骤;当当所述云端服务器判断到所述敏感词汇所指示的敏感信息合理时,向所述通信终端发送语音信息发送指令,所述通信终端响应所述语音信息发送指令,将包括所述敏感词汇的语音信息发送给接听方。
或者,所述通信终端根据本终端中存储的用于影响判断所述敏感词汇所指示的敏感信息是否合理的数据,分析判断所述敏感词汇所指示的敏感信息是否合理,当所述通信终端判断到合理时,所述通信终端可以将包括所述敏感词汇的语音信息发送给接听方;当所述通信终端判断到不合理时,继续执行S209步骤。
需要说明的是,步骤S207和步骤S208可以是并列的,也即是通信终端可以选择S207和S208中任意一步骤进行执行,也可以S207和S208都执行,且S207和S208的顺序是可变的,即通信终端可以先执行S208后执行S207,本发明实施例不作限定。
S209、若判断到不合理,则拦截所述语音信息,并发送提示信息,所述提示信息用于提示所述语音信息中的敏感词汇所指示的敏感信息不合理。
S210、将包括所述敏感词汇的语音信息发送给接听方。
本发明实施例中可通过当检测到语音通话事件时,确定用户当前的情绪状态信息,并根据所述情绪状态信息确定是否开启语音处理功能;当确定到开启所述语音处理功能时,根据预置的语音响应表对获取的语音信息进行语音处理,其中,所述对获取的语音信息进行语音处理包括:对获取的语音信息中的敏感词汇的转换处理或提示处理,这样可避免终端用户处于某种不良情绪状态下发送错误的语音信息给接听方,从而提升了语音信息传递的真实性和可靠性。
请参见图3,是本发明实施例的一种语音处理装置的结构示意图,本发明实施例的所述装置可以可设置在诸如智能手机、平板电脑、智能可穿戴设备等带通信网络功能的终端中,所述装置3包括:
确定模块30,用于当检测到语音通话事件时,确定用户当前的情绪状态信息;并根据确定到的情绪状态信息,进一步确定是否开启语音处理功能;
处理模块31,用于当所述确定模块30确定到开启所述语音处理功能时,根据预置的语音响应表对获取的语音信息进行语音处理;
其中,所述对获取的语音信息进行语音处理得到语音处理信息包括:对获取的语音信息中的敏感词汇的转换处理或提示处理。
本发明实施例中可通过当检测到语音通话事件时,确定用户当前的情绪状态信息,并根据所述情绪状态信息确定是否开启语音处理功能;当确定到开启所述语音处理功能时,根据预置的语音响应表对获取的语音信息进行语音处理,其中,所述对获取的语音信息进行语音处理包括:对获取的语音信息中的敏感词汇的转换处理或提示处理,这样可避免终端用户处于某种不良情绪状态下发送错误的语音信息给接听方,从而提升了语音信息传递的真实性和可靠性。
本发明实施例中涉及的各个模块、单元的具体实现可参考图1至图2对象实施例中相关功能模块的描述,在此不赘述。
请一并参见图4,是本发明实施例的另一种语音处理装置的结构示意图,本发明实施例的所述装置可以可设置在诸如智能手机、平板电脑、智能可穿戴设备等带通信网络功能的终端中,所述装置4包括确定模块30、处理模块31,还包括:
获取模块32,用于获取用户情绪状态信息对应的状态类型;
配置模块33,用于为所述获取模块32获取到的每一个状态类型配置对应的语音处理权限;所述语音处理权限用于判断是否开启所述语音处理功能;
生成模块34,用于根据所述获取模块32获取的用户情绪状态信息和所述配置模块33配置的语音处理权限生成预置的语音开关配置表,以便所述确定模块根据所述预置的语音开关配置表执行所述根据确定的所述情绪状态信息,确定是否开启语音处理功能。
其中可选地,本发明实施例中,
所述处理模块31,具体用于检测所述语音信息中是否包括敏感词汇;当检测到所述语音信息中包括敏感词汇时,将所述敏感词汇转换为所述预置的语音响应表中与所述敏感词汇对应的替换词汇。
其中可选地,本发明实施例中,
所述处理模块31,具体用于检测所述语音信息中是否包括敏感词汇;当检测到所述语音信息中包括敏感词汇时,判断所述敏感词汇所指示的敏感信息是否合理,若判断到不合理,则拦截所述语音信息,并发送提示信息,所述提示信息用于提示所述语音信息中的敏感词汇所指示的敏感信息不合理。
其中可选地,本发明实施例中,
所述情绪状态信息为根据所述语音信息的音量、声调、频率、类型中的一种或多种来确定;或者,通过采集语音通话过程中用户的脸部特征信息来确定。
本发明实施例中可通过当检测到语音通话事件时,确定用户当前的情绪状态信息,并根据所述情绪状态信息确定是否开启语音处理功能;当确定到开启所述语音处理功能时,根据预置的语音响应表对获取的语音信息进行语音处理,其中,所述对获取的语音信息进行语音处理包括:对获取的语音信息中的敏感词汇的转换处理或提示处理,这样可避免终端用户处于某种不良情绪状态下发送错误的语音信息给接听方,从而提升了语音信息传递的真实性和可靠性。
本发明实施例中涉及的各个模块、单元的具体实现可参考图1至图2对象实施例中相关功能模块的描述,在此不赘述。
再请参见图5,是本发明实施例的一种终端的结构示意图。所述终端可以为智能手机、平板电脑、智能可穿戴设备等带通信网络功能的设备,如图5所示,本发明实施例的所述终端可以包括显示屏、按键、扬声器、拾音器等模块,并且还包括:至少一个总线501、与总线501相连的至少一个处理器502以及与总线501相连的至少一个存储器503,实现通信功能的通信装置505,为通信终端各耗电模块供电的电源装置504。
所述处理器502可通过总线501,调用存储器503中存储的代码以执行相关的功能。
所述处理器502,用于当检测到语音通话事件时,确定用户当前的情绪状态信息;根据所述情绪状态信息,确定是否开启语音处理功能;当确定到开启所述语音处理功能时,根据预置的语音响应表对获取的语音信息进行语音处理;其中,所述对获取的语音信息进行语音处理包括:对获取的语音信息中的敏感词汇的转换处理或提示处理。
进一步可选地,所述处理器502还用于获取用户情绪状态信息对应的状态类型;为每一个状态类型配置对应的语音处理权限;所述语音处理权限用于判断是否开启所述语音处理功能;根据所述用户情绪状态信息和所述语音处理权限生成预置的语音开关配置表,以便根据所述预置的语音开关配置表执行所述根据确定的所述情绪状态信息,确定是否开启语音处理功能。
进一步可选地,所述处理器502还用于检测所述语音信息中是否包括敏感词汇;当检测到所述语音信息中包括敏感词汇时,将所述敏感词汇转换为所述预置的语音响应表中与所述敏感词汇对应的替换词汇。
进一步可选地,所述处理器502还用于检测所述语音信息中是否包括敏感词汇;当检测到所述语音信息中包括敏感词汇时,判断所述敏感词汇所指示的敏感信息是否合理;若判断到不合理,则拦截所述语音信息,并发送提示信息,所述提示信息用于提示所述语音信息中的敏感词汇所指示的敏感信息不合理。
进一步可选地,所述处理器502还用于所述情绪状态信息为根据所述语音信息的音量、声调、频率、类型中的一种或多种组合来确定;或者,通过采集语音通话过程中用户的脸部特征信息来确定。
本发明实施例中可通过当检测到语音通话事件时,确定用户当前的情绪状态信息,并根据所述情绪状态信息确定是否开启语音处理功能;当确定到开启所述语音处理功能时,根据预置的语音响应表对获取的语音信息进行语音处理,其中,所述对获取的语音信息进行语音处理包括:对获取的语音信息中的敏感词汇的转换处理或提示处理,这样可避免终端用户处于某种不良情绪状态下发送错误的语音信息给接听方,从而提升了语音信息传递的真实性和可靠性。
本发明实施例还提供一种计算机存储介质,其中,该计算机存储介质可存储有程序,该程序执行时包括上述方法实施例中记载的任何音频播放应用的操作方法的部分或全部步骤。
需要说明的是,对于前述的各方法实施例,为了简单描述,故将其都表述为一系列的动作组合,但是本领域技术人员应该知悉,本发明并不受所描述的动作顺序的限制,因为依据本发明,某些步骤可以采用其他顺序或者同时进行。其次,本领域技术人员也应该知悉,说明书中所描述的实施例均属于优选实施例,所涉及的动作和模块并不一定是本发明所必须的。
在上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述的部分,可以参见其他实施例的相关描述。
在本申请所提供的几个实施例中,应该理解到,所揭露的装置,可通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本发明的各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可为个人计算机、服务器或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、只读存储器(ROM,Read-OnlyMemory)、随机存取存储器(RAM,RandomAccessMemory)、移动硬盘、磁碟或者光盘等各种可以存储程序代码的介质。
以上所述,以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的范围。

Claims (11)

1.一种语音处理的方法,其特征在于,所述方法包括:
当检测到语音通话事件时,确定用户当前的情绪状态信息;
根据所述情绪状态信息,确定是否开启语音处理功能;
当确定到开启所述语音处理功能时,根据预置的语音响应表对获取的语音信息进行语音处理;
其中,所述对获取的语音信息进行语音处理包括:对获取的语音信息中的敏感词汇的转换处理或提示处理。
2.如权利要求1所述的方法,其特征在于,所述根据确定的所述情绪状态信息,确定是否开启语音处理功能之前,还包括:
获取用户情绪状态信息对应的状态类型;
为每一个状态类型配置对应的语音处理权限;所述语音处理权限用于判断是否开启所述语音处理功能;
根据所述用户情绪状态信息和所述语音处理权限生成预置的语音开关配置表,以便根据所述预置的语音开关配置表执行所述根据确定的所述情绪状态信息,确定是否开启语音处理功能。
3.如权利要求1所述的方法,其特征在于,所述根据预置的语音响应表对获取的语音信息进行语音处理,包括:
检测所述语音信息中是否包括敏感词汇;
当检测到所述语音信息中包括敏感词汇时,将所述敏感词汇转换为所述预置的语音响应表中与所述敏感词汇对应的替换词汇。
4.如权利要求1所述的方法,其特征在于,所述根据预置的语音响应表对获取的语音信息进行语音处理,包括:
检测所述语音信息中是否包括敏感词汇;
当检测到所述语音信息中包括敏感词汇时,判断所述敏感词汇所指示的敏感信息是否合理;
若判断到不合理,则拦截所述语音信息,并发送提示信息,所述提示信息用于提示所述语音信息中的敏感词汇所指示的敏感信息不合理。
5.如权利要求1-4中任意一项所述的方法,其特征在于,所述情绪状态信息为根据所述语音信息的音量、声调、频率、类型中的一种或多种组合确定;或者,通过采集语音通话过程中用户的脸部特征信息确定。
6.一种语音处理的装置,其特征在于,所述装置包括:
确定模块,用于当检测到语音通话事件时,确定用户当前的情绪状态信息;并根据确定到的情绪状态信息,进一步确定是否开启语音处理功能;
处理模块,用于当所述确定模块确定到开启所述语音处理功能时,根据预置的语音响应表对获取的语音信息进行语音处理;
其中,所述对获取的语音信息进行语音处理得到语音处理信息包括:对获取的语音信息中的敏感词汇的转换处理或提示处理。
7.如权利要求6所述的装置,其特征在于,所述装置还包括:
获取模块,用于获取用户情绪状态信息对应的状态类型;
配置模块,用于为所述获取模块获取到的每一个状态类型配置对应的语音处理权限;所述语音处理权限用于判断是否开启所述语音处理功能;
生成模块,用于根据所述获取模块获取的用户情绪状态信息和所述配置模块配置的语音处理权限生成预置的语音开关配置表,以便所述确定模块根据所述预置的语音开关配置表执行所述根据确定的所述情绪状态信息,确定是否开启语音处理功能。
8.如权利要求6所述的装置,其特征在于,
所述处理模块,具体用于检测所述语音信息中是否包括敏感词汇;当检测到所述语音信息中包括敏感词汇时,将所述敏感词汇转换为所述预置的语音响应表中与所述敏感词汇对应的替换词汇。
9.如权利要求6所述的装置,其特征在于,
所述处理模块,具体用于检测所述语音信息中是否包括敏感词汇;当检测到所述语音信息中包括敏感词汇时,判断所述敏感词汇所指示的敏感信息是否合理;若判断到不合理,则拦截所述语音信息,并发送提示信息,所述提示信息用于提示所述语音信息中的敏感词汇所指示的敏感信息不合理。
10.如权利要求6-9中任意一项所述的装置,其特征在于,所述情绪状态信息为根据所述语音信息的音量、声调、频率、类型中的一种或多种确定;或者,通过采集语音通话过程中用户的脸部特征信息确定。
11.一种终端,其特征在于,所述终端包括如权利要求6至10中的任意一项所述的语音处理装置。
CN201511022337.3A 2015-12-30 2015-12-30 一种语音处理的方法、装置以及终端 Pending CN105681546A (zh)

Priority Applications (2)

Application Number Priority Date Filing Date Title
CN201511022337.3A CN105681546A (zh) 2015-12-30 2015-12-30 一种语音处理的方法、装置以及终端
PCT/CN2016/104016 WO2017113974A1 (zh) 2015-12-30 2016-10-31 一种语音处理的方法、装置以及终端

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201511022337.3A CN105681546A (zh) 2015-12-30 2015-12-30 一种语音处理的方法、装置以及终端

Publications (1)

Publication Number Publication Date
CN105681546A true CN105681546A (zh) 2016-06-15

Family

ID=56298149

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201511022337.3A Pending CN105681546A (zh) 2015-12-30 2015-12-30 一种语音处理的方法、装置以及终端

Country Status (2)

Country Link
CN (1) CN105681546A (zh)
WO (1) WO2017113974A1 (zh)

Cited By (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2017113974A1 (zh) * 2015-12-30 2017-07-06 宇龙计算机通信科技(深圳)有限公司 一种语音处理的方法、装置以及终端
CN107659538A (zh) * 2016-07-25 2018-02-02 北京优朋普乐科技有限公司 一种视频处理的方法及设备
CN107919138A (zh) * 2017-11-30 2018-04-17 维沃移动通信有限公司 一种语音中的情绪处理方法及移动终端
CN107948417A (zh) * 2017-11-22 2018-04-20 周燕红 一种语音数据监控的方法、装置、终端及存储介质
CN108197115A (zh) * 2018-01-26 2018-06-22 上海智臻智能网络科技股份有限公司 智能交互方法、装置、计算机设备和计算机可读存储介质
CN109256151A (zh) * 2018-11-21 2019-01-22 努比亚技术有限公司 通话语音调控方法、装置、移动终端及可读存储介质
CN109714248A (zh) * 2018-12-26 2019-05-03 联想(北京)有限公司 一种数据处理方法及装置
CN110085221A (zh) * 2018-01-26 2019-08-02 上海智臻智能网络科技股份有限公司 语音情感交互方法、计算机设备和计算机可读存储介质
CN110085262A (zh) * 2018-01-26 2019-08-02 上海智臻智能网络科技股份有限公司 语音情绪交互方法、计算机设备和计算机可读存储介质
CN110085220A (zh) * 2018-01-26 2019-08-02 上海智臻智能网络科技股份有限公司 智能交互装置
WO2020038102A1 (zh) * 2018-08-23 2020-02-27 阿里巴巴集团控股有限公司 一种语音播放方法和装置

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20190385711A1 (en) 2018-06-19 2019-12-19 Ellipsis Health, Inc. Systems and methods for mental health assessment
WO2019246239A1 (en) 2018-06-19 2019-12-26 Ellipsis Health, Inc. Systems and methods for mental health assessment
CN112309403A (zh) * 2020-03-05 2021-02-02 北京字节跳动网络技术有限公司 用于生成信息的方法和装置
CN111783447B (zh) * 2020-05-28 2023-02-03 中国平安财产保险股份有限公司 基于ngram距离的敏感词检测方法、装置、设备及存储介质
CN111696538B (zh) * 2020-06-05 2023-10-31 北京搜狗科技发展有限公司 语音处理方法、装置和介质

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103093752A (zh) * 2013-01-16 2013-05-08 华南理工大学 一种基于手机语音的情感分析方法及其系统
CN103269405A (zh) * 2013-05-23 2013-08-28 深圳市中兴移动通信有限公司 友好提示的方法及装置
CN103491251A (zh) * 2013-09-24 2014-01-01 深圳市金立通信设备有限公司 一种监控用户通话的方法及终端
CN103516915A (zh) * 2012-06-27 2014-01-15 百度在线网络技术(北京)有限公司 在移动终端通话过程中敏感词汇的替换方法、系统及装置
CN103903627A (zh) * 2012-12-27 2014-07-02 中兴通讯股份有限公司 一种语音数据的传输方法及装置
CN104113634A (zh) * 2013-04-22 2014-10-22 三星电子(中国)研发中心 一种对语音进行处理的方法
CN104616666A (zh) * 2015-03-03 2015-05-13 广东小天才科技有限公司 一种基于语音分析改善对话沟通效果的方法及装置

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20070286386A1 (en) * 2005-11-28 2007-12-13 Jeffrey Denenberg Courteous phone usage system
CN101662546A (zh) * 2009-09-16 2010-03-03 中兴通讯股份有限公司 情绪监控的方法及装置
CN105681546A (zh) * 2015-12-30 2016-06-15 宇龙计算机通信科技(深圳)有限公司 一种语音处理的方法、装置以及终端

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103516915A (zh) * 2012-06-27 2014-01-15 百度在线网络技术(北京)有限公司 在移动终端通话过程中敏感词汇的替换方法、系统及装置
CN103903627A (zh) * 2012-12-27 2014-07-02 中兴通讯股份有限公司 一种语音数据的传输方法及装置
CN103093752A (zh) * 2013-01-16 2013-05-08 华南理工大学 一种基于手机语音的情感分析方法及其系统
CN104113634A (zh) * 2013-04-22 2014-10-22 三星电子(中国)研发中心 一种对语音进行处理的方法
CN103269405A (zh) * 2013-05-23 2013-08-28 深圳市中兴移动通信有限公司 友好提示的方法及装置
CN103491251A (zh) * 2013-09-24 2014-01-01 深圳市金立通信设备有限公司 一种监控用户通话的方法及终端
CN104616666A (zh) * 2015-03-03 2015-05-13 广东小天才科技有限公司 一种基于语音分析改善对话沟通效果的方法及装置

Cited By (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2017113974A1 (zh) * 2015-12-30 2017-07-06 宇龙计算机通信科技(深圳)有限公司 一种语音处理的方法、装置以及终端
CN107659538A (zh) * 2016-07-25 2018-02-02 北京优朋普乐科技有限公司 一种视频处理的方法及设备
CN107948417A (zh) * 2017-11-22 2018-04-20 周燕红 一种语音数据监控的方法、装置、终端及存储介质
CN107919138A (zh) * 2017-11-30 2018-04-17 维沃移动通信有限公司 一种语音中的情绪处理方法及移动终端
CN107919138B (zh) * 2017-11-30 2021-01-08 维沃移动通信有限公司 一种语音中的情绪处理方法及移动终端
CN110085220A (zh) * 2018-01-26 2019-08-02 上海智臻智能网络科技股份有限公司 智能交互装置
CN110085221A (zh) * 2018-01-26 2019-08-02 上海智臻智能网络科技股份有限公司 语音情感交互方法、计算机设备和计算机可读存储介质
CN110085262A (zh) * 2018-01-26 2019-08-02 上海智臻智能网络科技股份有限公司 语音情绪交互方法、计算机设备和计算机可读存储介质
CN108197115A (zh) * 2018-01-26 2018-06-22 上海智臻智能网络科技股份有限公司 智能交互方法、装置、计算机设备和计算机可读存储介质
WO2020038102A1 (zh) * 2018-08-23 2020-02-27 阿里巴巴集团控股有限公司 一种语音播放方法和装置
CN109256151A (zh) * 2018-11-21 2019-01-22 努比亚技术有限公司 通话语音调控方法、装置、移动终端及可读存储介质
CN109256151B (zh) * 2018-11-21 2023-06-27 努比亚技术有限公司 通话语音调控方法、装置、移动终端及可读存储介质
CN109714248A (zh) * 2018-12-26 2019-05-03 联想(北京)有限公司 一种数据处理方法及装置
CN109714248B (zh) * 2018-12-26 2021-05-18 联想(北京)有限公司 一种数据处理方法及装置

Also Published As

Publication number Publication date
WO2017113974A1 (zh) 2017-07-06

Similar Documents

Publication Publication Date Title
CN105681546A (zh) 一种语音处理的方法、装置以及终端
CN103456314B (zh) 一种情感识别方法以及装置
CN109062479A (zh) 分屏应用切换方法、装置、存储介质和电子设备
WO2015120341A1 (en) Systems and methods for identifying a sound event
CN108334202B (zh) 壁纸更新方法及相关产品
CN108470034A (zh) 一种智能设备服务提供方法及系统
CN103796125A (zh) 一种基于耳机播放的声音调节方法
CN105551498A (zh) 一种语音识别的方法及装置
CN108847222B (zh) 语音识别模型生成方法、装置、存储介质及电子设备
CN104992715A (zh) 一种智能设备的界面切换方法及系统
CN109005480A (zh) 信息处理方法及相关产品
CN110223696B (zh) 一种语音信号的采集方法、装置及终端设备
CN104505108B (zh) 一种信息定位方法及终端
CN109710799B (zh) 语音交互方法、介质、装置和计算设备
CN108038243A (zh) 音乐推荐方法、装置、存储介质及电子设备
CN104461235A (zh) 一种应用图标处理方法
CN105677152A (zh) 一种语音触屏操作处理的方法、装置以及终端
CN110910874A (zh) 一种互动课堂语音控制方法、终端设备、服务器和系统
CN111081275B (zh) 基于声音分析的终端处理方法、装置、存储介质及终端
CN108447478A (zh) 一种终端设备的语音控制方法、终端设备及装置
CN102024484A (zh) 音频文件的播放方法及终端
CN101813973A (zh) 情绪共鸣系统
CN108231074A (zh) 一种数据处理方法、语音助手设备及计算机可读存储介质
CN109121042A (zh) 语音数据处理方法及相关产品
CN103050140A (zh) 音频文件的播放方法及设备

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20160615