CN111933184B - 一种语音信号处理方法、装置、电子设备和存储介质 - Google Patents
一种语音信号处理方法、装置、电子设备和存储介质 Download PDFInfo
- Publication number
- CN111933184B CN111933184B CN202011055238.6A CN202011055238A CN111933184B CN 111933184 B CN111933184 B CN 111933184B CN 202011055238 A CN202011055238 A CN 202011055238A CN 111933184 B CN111933184 B CN 111933184B
- Authority
- CN
- China
- Prior art keywords
- voice
- voice signal
- information type
- processing
- target
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000003672 processing method Methods 0.000 title claims abstract description 10
- 238000000034 method Methods 0.000 claims abstract description 35
- 238000004458 analytical method Methods 0.000 claims abstract description 29
- 238000007405 data analysis Methods 0.000 claims abstract description 27
- 239000000463 material Substances 0.000 claims description 24
- 230000003313 weakening effect Effects 0.000 claims description 16
- 238000004590 computer program Methods 0.000 claims description 9
- 238000004891 communication Methods 0.000 claims description 7
- 239000003623 enhancer Substances 0.000 claims description 5
- 230000002708 enhancing effect Effects 0.000 claims description 5
- 238000001514 detection method Methods 0.000 claims description 3
- 238000005516 engineering process Methods 0.000 abstract description 3
- 201000010099 disease Diseases 0.000 description 7
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 description 7
- 238000002955 isolation Methods 0.000 description 6
- 238000010586 diagram Methods 0.000 description 5
- 230000006870 function Effects 0.000 description 3
- 230000010365 information processing Effects 0.000 description 3
- 239000000284 extract Substances 0.000 description 2
- 238000000605 extraction Methods 0.000 description 2
- 238000007781 pre-processing Methods 0.000 description 2
- 238000003491 array Methods 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 238000013500 data storage Methods 0.000 description 1
- 230000007613 environmental effect Effects 0.000 description 1
- 238000009432 framing Methods 0.000 description 1
- 238000003062 neural network model Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000013550 semantic technology Methods 0.000 description 1
- 230000001960 triggered effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/48—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use
- G10L25/51—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for comparison or discrimination
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/08—Speech classification or search
- G10L15/18—Speech classification or search using natural language modelling
- G10L15/1822—Parsing for meaning understanding
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
Landscapes
- Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Artificial Intelligence (AREA)
- Quality & Reliability (AREA)
- Telephone Function (AREA)
Abstract
本申请实施例提供了一种语音信号处理方法、装置、电子设备和存储介质,可应用于医疗科技领域,该方法包括:对采集到的语音信号进行语义解析,确定语音信号对应内容的信息类型;若检测到信息类型与预设信息类型不关联,则提取语音信号的声音特征;调用语音处理模型对声音特征进行数据分析,确定语音信号所属的目标语音等级;从预先建立的语音等级与语音信号处理策略的对应关系中,确定目标语音等级对应的目标语音信号处理策略,对语音信号进行目标处理,能够保证用户获取环境中较为重要的语音信号,本申请涉及区块链技术,如可将语音等级与语音信号处理策略的对应关系写入区块链中,以用于根据目标语音信号处理策略对语音信号进行目标处理等场景。
Description
技术领域
本申请涉及语音语义技术领域,具体用于医疗科技领域,尤其涉及一种语音信号处理方法、装置、电子设备和存储介质。
背景技术
生活中存在这样的情况,当用户处于比较嘈杂的环境中,周围环境声音总会对用户造成一定的影响,一般针对上述情况,有两种方式进行解决,第一种是用户可以采取佩戴耳机来进行隔离该环境声音,但是通过佩戴耳机的方式无法完全隔离环境声音,第二种是完全隔离环境声音,但是这种方式很可能导致用户错过环境中比较重要的声音,因此,如何对环境中的语音进行处理,使得用户能够获得环境中较为重要的语音信号是亟待解决的问题。
发明内容
本申请实施例提供了一种语音信号处理方法、装置、电子设备和存储介质,通过对环境声音采取不同处理方式,保证用户能够获取环境中较为重要的语音信号。
本申请实施例第一方面提供了一种语音信号处理方法,应用电子设备,所述电子设备与终端设备预先建立了通信连接,包括:
采集环境中的语音信号,对采集到的语音信号进行语义解析;
基于语义解析结果确定所述语音信号对应内容的信息类型;
检测所述信息类型与预设信息类型是否关联;
若检测到所述信息类型与所述预设信息类型不关联,则提取所述语音信号的声音特征;
调用语音处理模型对所述声音特征进行数据分析,并基于数据分析结果确定所述语音信号所属的目标语音等级;
从预先建立的语音等级与语音信号处理策略的对应关系中,确定所述目标语音等级对应的目标语音信号处理策略;
依照所述目标语音信号处理策略的指示对所述语音信号进行目标处理,所述目标处理包括以下任一种或者多种:对所述语音信号进行弱化处理、对所述语音信号进行隔离处理和对所述语音信号进行增强处理。
本申请实施例第二方面提供了一种语音信号处理装置,其特征在于,所述装置应用于电子设备,包括:
采集模块,用于采集环境中的语音信号,对采集到的语音信号进行语义解析;
处理模块,用于基于语义解析结果确定所述语音信号对应内容的信息类型;
检测模块,用于检测所述信息类型与预设信息类型是否关联;
所述处理模块,还用于若检测到所述信息类型与所述预设信息类型不关联,则提取所述语音信号的声音特征;
所述处理模块,还用于调用语音处理模型对所述声音特征进行数据分析,并基于数据分析结果确定所述语音信号所属的目标语音等级;
所述处理模块,还用于从预先建立的语音等级与语音信号处理策略的对应关系中,确定所述目标语音等级对应的目标语音信号处理策略;
所述处理模块,还用于依照所述目标语音信号处理策略的指示对所述语音信号进行目标处理,所述目标处理包括以下任一种或者多种:对所述语音信号进行弱化处理、对所述语音信号进行隔离处理和对所述语音信号进行增强处理。
本申请实施例第三方面提供了一种电子设备,包括处理器和存储器,所述处理器和存储器相互连接,其中,所述存储器用于存储计算机程序,所述计算机程序包括程序指令,所述处理器被配置用于调用所述程序指令,执行上述第一方面的方法。
本申请实施例第四方面提供了一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序包括程序指令,所述程序指令当被处理器执行时使所述处理器执行上述第一方面的方法。
在本申请实施例中,电子设备采集环境中的语音信号,对采集到的语音信号进行语义解析,并基于语义解析结果确定语音信号对应内容的信息类型,进一步地,检测信息类型与预设信息类型是否关联,若检测到信息类型与预设信息类型不关联,则提取语音信号的声音特征,并调用语音处理模型对声音特征进行数据分析,并基于数据分析结果确定语音信号所属的目标语音等级,从预先建立的语音等级与语音信号处理策略的对应关系中,确定目标语音等级对应的目标语音信号处理策略,依照目标语音信号处理策略的指示对语音信号进行目标处理,其中,该目标处理包括以下任一种或者多种:对语音信号进行弱化处理、对语音信号进行隔离处理和对语音信号进行增强处理,电子设备通过对环境中的语音信号进行语音等级判断后,根据语音等级采取不同处理方式,从而可以保证用户能够获取环境中较为重要的语音信号。
附图说明
为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本申请实施例提供的一种语音信号处理系统的结构示意图;
图2是本申请实施例提供的一种语音信号处理方法的流程示意图;
图3是本申请实施例提供的一种语音信号处理装置的结构示意图;
图4是本申请实施例提供的一种电子设备的结构示意图。
具体实施方式
下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
请参阅图1,图1为本申请实施例提供的一种语音信号处理系统的结构示意图。该语音信号处理系统包括电子设备101和终端设备102,其中:
电子设备101可以与终端设备102建立连接,例如该电子设备101可以包括但不限于耳机,如有线耳机、无线耳机,如蓝牙/无线保真(Wireless Fidelity,WIFI)耳机等等,进一步地,上述耳机还可分为普通耳机和高保真(High Fidelity,HIFI)耳机,本申请实施例对其不做限制。终端设备102可以包括但不限于智能手机、平板电脑、笔记本电脑、台式电脑、MP3、MP4等智能终端。
当电子设备101检测到用户的操作指令后,根据该操作指令可以对终端设备102中的某些应用程序进行操作,例如,终端设备102在某个音乐应用程序中播放音乐,则通过检测用户的操作指令对该音乐应用程序进行控制,即可以进行音乐播放或者音乐暂停等等。
在一种可行的实施例中,该电子设备101可以采集环境中的语音信号,并对采集到的语音信号进行语义解析,并基于语义解析结果确定该语音信号对应内容的信息类型。其中,该采集到的环境中语音信号可以是一个或者多个语音信号,该信息类型可以是金融类、游戏类、医疗类等等,更为具体,例如该信息类型可以是某种游戏、可以某种疾病。
在一种可行的实施例中,进一步地,电子设备101检测该信息类型与预设信息类型是否关联,若检测到信息类型与预设信息类型不关联,则提取该语音信号的声音特征,并调用语音处理模型对该声音特征进行数据分析,基于该数据分析结果确定语音信号所属的目标语音等级。其中,在检测该信息类型与预设信息类型是否关联之前,需要预先设置预设信息类型,该预设信息类型与用户相关。可以理解的是,检测该信息类型与预设信息类型是否关联,是指检测该信息类型与预设信息类型是否相同。
在一种可行的实施例中,电子设备101在基于该数据分析结果确定语音信号所属的目标语音等级之后,电子设备101可以从预先建立的语音等级与语音信号处理策略的对应关系中,确定目标语音等级对应的目标语音信号处理策略,并依照目标语音信号处理策略的指示对语音信号进行目标处理,其中,目标处理包括以下任一种或者多种:对语音信号进行弱化处理、对语音信号进行隔离处理和对语音信号进行增强处理。电子设备101中预先建立语音等级和语音信息处理策略的对应关系。
实例性地,电子设备101对语音等级设置1-10个等级,根据该10个等级设置对应的目标语音信息处理策略,即语音等级1-4,语音信号处理策略为对该语音信号进行隔离处理,语音等级5-7,该语音信号处理策略对该语音信号进行弱化处理,语音等级8-10,该语音信号处理策略对该语音信号进行增强处理。电子设备101在获取语音信号所属的目标语音等级之后,从上述语音等级与语音信号处理策略的对应关系中确定出确定目标语音等级对应的目标语音信号处理策略,然后依照目标语音信号处理策略的指示对语音信号进行目标处理,假设该语音信号所属的目标语音等级为7,则从上述语音等级与语音信号处理策略的对应关系中确定出确定目标语音等级对应的目标语音信号处理策略,然后依照目标语音信号处理策略的指示对语音信号进行增加处理。
由上述可知,电子设备通过对环境语音信号进行语音等级判断后,根据语音等级采取不同处理方式,从而可以保证用户能够获取环境中较为重要的语音信号。
请参阅图2,图2为本申请实施例提供的一种语音信号处理方法的流程示意图。本实施例中所描述的语音信号处理方法,应用电子设备,该电子设备与终端设备预先建立了通信连接,包括:
201、采集环境中的语音信号,对采集到的语音信号进行语义解析。
其中,该语音信号可以是一个或者多个,当电子设备处于嘈杂的环境时,可能会采集环境中的多个语音信号,当电子设备处于比较安静的环境中,此时该电子设备可能采集环境中的语音信号较少(如一个语音信号)。
具体的,电子设备采集环境中的语音信号后,可以对该语音信号进行语义解析,得到该语义解析结果,该语义解析结果包括该语音信号对应的内容。例如,电子设备采集的是关于游戏的语音信号,电子设备对采集到的语音信号进行语义解析,得到语义解析结果,该语义解析结果为游戏内容。
在一种可行的实施例中,当检测到用户处于特定嘈杂的环境时,可以触发采集环境中语音信号的操作,例如,该特定嘈杂的环境可以是医院环境,当检测到用户处于医院环境时,电子设备采集医院环境中的语音信号,并对该采集到的语音信号进行语义解析,该语义解析结果可以是医生呼叫某个患者的姓名、或者谈论某种疾病等等。
202、基于语义解析结果确定语音信号对应内容的信息类型。
其中,该语音信号对应内容的信息类型可以是金融类、游戏类等等。
例如,步骤201中,该语义解析结果为游戏内容,电子设备可以确定该语音信号对应的内容的信息类型为游戏类,该语义解析结果是医生呼叫某个用户的姓名、或者谈论某种疾病,则基于语义解析结果确定语音信号对应内容的信息类型为患者信息、或者某种疾病类型。
203、检测信息类型与预设信息类型是否关联。
其中,检测该信息类型与预设信息类型是否关联是指检测该信息类型与预设信息类型是否相同,该预设信息类型是游戏类、娱乐类等等,更为具体地,该预设信息类型可以是某种音乐、某种游戏等等。
具体的,电子设备可以确定预设信息类型后,检测信息类型与预设信息类型是否关联。
在一种可行的实施例中,终端设备中安装有多个应用程序,电子设备从终端设备获取用户对各应用程序的使用频率,基于使用频率和各应用程序的类型,确定预设信息类型。在具体实现中,电子设备从终端设备获取用户对各应用程序的使用频率,并从获取到的用户对各应用程序的使用频率确定出使用频率最高的应用程序,并获取该应用程序的类型,并将该应用程序的类型确定为预设信息类型。
实例性地,电子设备从终端设备获取用户对微博和游戏的使用频率,该微博的使用频率小于游戏使用频率,则确定出该使用频率最大的应用程序为游戏,则电子获取该应用程序的类型为游戏,将该游戏确定为预设信息类型。
在一种可行的实施例中,电子设备从终端设备获取用户在浏览器的浏览记录,并基于该浏览记录确定用户的偏好信息类型,根据用户的偏好信息类型确定预设信息类型。在具体实现方式中,电子设备从终端设备获取用户在浏览器的浏览记录,并根据该浏览记录确定用户经常浏览哪种类型的信息,即用户经常浏览的信息类型确定为该用户的偏好信息类型,并根据该用户的偏好信息确定预设信息类型。
实例性地,电子设备从终端设备获取用户在浏览器的浏览记录,并根据浏览记录确定该用户经常浏览某种疾病类型的信息,则可以将该疾病类型的信息确定为用户的偏好信息类型,并将该疾病类型确定为预设信息类型。
在一种可行的实施例中,电子设备获取播放的多个历史语音信号,并对多个历史语音信号进行语义解析,得到多个语音信号中各语音信号对应的内容的信息类型,并获取各语音信号对应的内容的信息类型播放的频率,根据各语音信号对应的内容的信息类型播放的频率确定预设信息类型。在具体实现中,该电子设备经常播放语音信号,该语音信号可以是即时通讯中语音通过该电子设备进行播放,或者其他语音通过该电子设备进行播放,电子设备获取播放的多个历史语音信号,并对该多个历史语音信号进行语义解析,可以得到多个语音信号中各语音信号对应的内容,并根据各语音信号对应的内容确定该各语音信号对应的内容对应的信息类型。进一步,电子设备在根据各语音信号对应的内容确定该各语音信号对应的内容对应的信息类型后,可以获取各语音信号对应的内容的信息类型播放的频率,并将播放频率最高的语音信号对应的内容的信息类型确定为预设信息类型。
实例性地,电子设备获取播放的4个历史语音信号,并对该4个历史语音信号进行语义解析,得到4个语音信号对应的内容的信息类型,其中该4个语音信号分别对应的内容的信息类型为游戏类、娱乐类、医疗类、医疗类,电子设备获取4个语音信号对应的内容的信息类型播放的频率,确定信息类型为医疗类的播放频率高,则将医疗确定为预设信息类型。
204、若检测到信息类型与预设信息类型不关联,则提取语音信号的声音特征。
其中,检测到信息类型与预设信息类型不关联是指检测到信息类型与预设信息类型不相同,该声音特征包括声音强度、声音响度、音高、基音周期、基音频率、振幅能量、共振峰中的一种或者多种。
具体的,电子设备检测到上述信息类型与预设类型不相同,则需要进一步对该语音信号进行预处理操作,并提取预处理后的语音信号的声音特征,进行第二次该语音信号是否重要。其中,该预处理操作包括预加重、分帧、加窗。
在一种可行的实施例中,电子设备检测到信息类型与预设信息类型关联(即检测到信息类型与预设信息类型相同),则电子设备可以对该语音信号进行增强处理。
205、调用语音处理模型对声音特征进行数据分析,并基于数据分析结果确定语音信号所属的目标语音等级。
具体的,电子设备在调用语音处理模型之前,需要获取大量的语音素材和语音素材对应语音等级对预设语音处理模型进行训练,在得到语音处理模型后,调用该语音处理模型对声音特征进行数据分析,并基于数据分析结果确定语音信号所属的目标语音等级。
在一种可行的实施例中,电子设备可以从预设存储空间中获取多个语音素材和多个语音素材中各语音素材对应的语音等级,并对各语音素材进行特征提取,得到各语音素材的声音特征,进而根据各语音素材的声音特征和对应的语音等级对预设语音处理模型进行训练,得到语音处理模型。其中,声音特征包括声音强度、声音响度、音高、基音周期、基音频率、振幅能量、共振峰中的一种或者多种,由于该电子设备与终端设备预先建立通信连接,则该预设存储空间可以是终端设备的存储空间,其中该语音处理模型可以是神经网络模型或者贝叶斯网络模型,本申请实施不做限定。
206、从预先建立的语音等级与语音信号处理策略的对应关系中,确定目标语音等级对应的目标语音信号处理策略。
在一种可行的实施例中,可以预先设置语音等级和语音信号处理策略的对应关系,其中,该语音信号处理策略可以是对语音信号进行弱化处理、对语音信号进行隔离处理和对语音信号进行增强处理。例如,电子设备对语音等级设置1-20个等级,根据该20个等级设置对应的目标语音信息处理策略,假设该语音等级为1-6,对应的语音信号处理策略为对该语音信号进行隔离处理,该语音等级为7-15,对应的语音信号处理策略为对该语音信号进行弱化处理,该语音等级为15-20,对应的该语音信号处理策略为对该语音信号进行增强处理。
进一步地,电子设备根据目标语音等级可以从上述设置的语音等级和语音信号处理策略的对应关系确定出目标语音处理策略,若该目标语音等级为10,则对应的语音信号处理策略为对该语音信号进行弱化处理。
207、依照目标语音信号处理策略的指示对语音信号进行目标处理,目标处理包括以下任一种或者多种:对语音信号进行弱化处理、对语音信号进行隔离处理和对语音信号进行增强处理。
其中,对语音信号进行弱化处理可以是调小语音信号的声音强度,对语音信号进行隔离处理可以是将该语音信号进行屏蔽处理,对语音信号进行增强处理可以是利用语音信号增强器对该语音信号进行信号增强或者利用能够将语音信号进行增强处理的某种方式。其中,对语音信号进行隔离处理可以保证用户不受环境中不重要声音的影响,对语音信号进行增强处理可以保证用户能够获得重要的语音信号。
在一种可行的实施例中,该目标处理为对语音信号进行弱化处理,依照目标语音信号处理策略的指示对该语音信号进行目标处理的实现方式为:设置一弱化处理阈值,可以根据该弱化处理阈值进行判断是否进行弱化处理。电子设备获取语音信号的声音强度值,判断声音强度值是否大于弱化处理强度阈值,若声音强度值大于弱化处理强度阈值,则将语音信号的声音强度值调整至预设强度阈值,该预设强度阈值小于该声音强度值。
在一种可行的实施例中,该电子设备包括语音信号接收端,该目标处理为对该语音信号进行增强处理,电子设备依照目标语音信号处理策略的指示对语音信号进行目标处理的具体实现方式为:在语音信号接收端通过语音信号增强器对语音信号进行增强处理。其中,该语音信号接收端可以是电子设备的麦克风。
可选地,该目标处理为对该语音信号进行增强处理,电子设备依照目标语音信号处理策略的指示对语音信号进行目标处理的具体实现方式为:若电子设备检测到正在播放多媒体文件,则暂停该多媒体文件的播放,其中,该多媒体文件可以是某首歌、某个视频。可以理解的是,当暂停该多媒体文件的播放后,该语音信号相对增强,从而实现对该语音信号的增强处理。
在本申请实施例中,电子设备采集环境中的语音信号,对采集到的语音信号进行语义解析,并基于语义解析结果确定语音信号对应内容的信息类型,进一步地,检测信息类型与预设信息类型是否关联,若检测到信息类型与预设信息类型不关联,则提取语音信号的声音特征,并调用语音处理模型对声音特征进行数据分析,并基于数据分析结果确定语音信号所属的目标语音等级,从预先建立的语音等级与语音信号处理策略的对应关系中,确定目标语音等级对应的目标语音信号处理策略,依照目标语音信号处理策略的指示对语音信号进行目标处理,其中,该目标处理包括以下任一种或者多种:对语音信号进行弱化处理、对语音信号进行隔离处理和对语音信号进行增强处理,电子设备通过对环境语音信号进行语音等级判断后,根据语音等级采取不同处理方式,从而可以保证用户能够获取环境中较为重要的语音信号。
基于上述语音信号处理方法实施例的描述,本申请实施例还提供了一种语音信号处理装置。请参阅图3,为本申请实施例提供的一种语音信号处理装置的结构示意图。该装置可以应用于电子设备,包括:
采集模块301,用于采集环境中的语音信号,对采集到的语音信号进行语义解析;
所述处理模块302,用于基于语义解析结果确定所述语音信号对应内容的信息类型;
检测模块303,用于检测所述信息类型与预设信息类型是否关联;
所述处理模块302,还用于若检测到所述信息类型与所述预设信息类型不关联,则提取所述语音信号的声音特征;
所述处理模块302,还用于调用语音处理模型对所述声音特征进行数据分析,并基于数据分析结果确定所述语音信号所属的目标语音等级;
所述处理模块302,还用于从预先建立的语音等级与语音信号处理策略的对应关系中,确定所述目标语音等级对应的目标语音信号处理策略;
所述处理模块302,还用于依照所述目标语音信号处理策略的指示对所述语音信号进行目标处理,所述目标处理包括以下任一种或者多种:对所述语音信号进行弱化处理、对所述语音信号进行隔离处理和对所述语音信号进行增强处理。
在一种可行的实施例中,所述终端设备中安装有多个应用程序,所述装置还包括:所述获取模块304,其中:
所述获取模块304,用于从所述终端设备获取用户对各应用程序的使用频率;
所述处理模块302,还用于基于所述使用频率和各应用程序的类型,确定预设信息类型。
在一种可行的实施例中,所述终端设备中安装有多个应用程序,所述获取模块304,还用于从所述终端设备获取用户在浏览器的浏览记录;
所述处理模块302,还用于基于所述浏览记录确定所述用户的偏好信息类型;
所述处理模块302,还用于根据所述用户的偏好信息类型确定预设信息类型。
在一种可行的实施例中,所述获取模块304,还用于所述获取播放的多个历史语音信号,并对所述多个历史语音信号进行语义解析,得到所述多个语音信号中各语音信号对应的内容的信息类型;
所述获取模块304,还用于获取所述各语音信号对应的内容的信息类型播放的频率;
所述处理模块302,还用于根据所述各语音信号对应的内容的信息类型播放的频率确定预设信息类型。
在一种可行的实施例中,所述调用语音处理模型对所述声音特征进行数据分析之前,所述获取模块304,还用于从预设存储空间中获取多个语音素材和所述多个语音素材中各语音素材对应的语音等级;
所述处理模块302,还用于对所述各语音素材进行特征提取,得到所述各语音素材的声音特征,所述声音特征包括声音强度、声音响度、音高、基音周期、基音频率、振幅能量、共振峰中的一种或者多种;
所述处理模块302,还用于根据所述各语音素材的声音特征和对应的语音等级对预设语音处理模型进行训练,得到所述语音处理模型。
在一种可行的实施例中,所述目标处理为对所述语音信号进行弱化处理,所述获取模块304,用于获取所述语音信号的声音强度值;
所述处理模块302,用于判断所述声音强度值是否大于弱化处理强度阈值;
所述处理模块302,用于若所述声音强度值大于所述弱化处理强度阈值,则将所述语音信号的声音强度值调整至预设强度阈值,所述预设强度阈值小于所述声音强度值。
在一种可行的实施例中,所述电子设备包括语音信号接收端,所述处理模块302,具体用于:
在所述语音信号接收端通过语音信号增强器对所述语音信号进行增强处理;或者若检测到正在播放多媒体文件,则暂停所述多媒体文件的播放。
需要说明的是,本申请实施例所描述的语音信号处理装置的各单元模块的功能可根据图2所述的方法实施例中的方法具体实现,其具体实现过程可以参照图2的方法实施例的相关描述,此处不再赘述。
基于上述方法实施例以及装置项实施例的描述,本申请实施例还提供一种电子设备。请参见图4,该电子设备可至少包括处理器401、通信接口402以及存储器403;其中,处理器401、通信接口402以及存储器403可通过总线或者其它连接方式进行连接。所述存储器403中还可以包括计算机可读存储介质,该计算机可读存储介质用于存储计算机程序,所述计算机程序包括程序指令,所述处理器401用于执行所述存储器403存储的程序指令。处理器401(或称CPU(Central Processing Unit,中央处理器))是服务器的计算核心以及控制核心,其适于实现一条或多条指令,具体适于加载并执行一条或多条指令从而实现上述数据处理方法实施例中的相应方法流程或相应功能。其中,处理器401被配置调用所述程序指令执行:采集环境中的语音信号,对采集到的语音信号进行语义解析;检测所述信息类型与预设信息类型是否关联;若检测到所述信息类型与所述预设信息类型不关联,则提取所述语音信号的声音特征;调用语音处理模型对所述声音特征进行数据分析,并基于数据分析结果确定所述语音信号所属的目标语音等级;从预先建立的语音等级与语音信号处理策略的对应关系中,确定所述目标语音等级对应的目标语音信号处理策略;依照所述目标语音信号处理策略的指示对所述语音信号进行目标处理,所述目标处理包括以下任一种或者多种:对所述语音信号进行弱化处理、对所述语音信号进行隔离处理和对所述语音信号进行增强处理。
在一种可行的实施例中,所述处理器401,还用于:
从所述终端设备获取用户对各应用程序的使用频率,基于所述使用频率和各应用程序的类型,确定预设信息类型。
在一种可行的实施例中,所述处理器401,还用于:从所述终端设备获取用户在浏览器的浏览记录,并基于所述浏览记录确定所述用户的偏好信息类型;根据所述用户的偏好信息类型确定预设信息类型。
在一种可行的实施例中,所述处理器401,还用于:
获取播放的多个历史语音信号,并对所述多个历史语音信号进行语义解析,得到所述多个语音信号中各语音信号对应的内容的信息类型;
获取所述各语音信号对应的内容的信息类型播放的频率;
根据所述各语音信号对应的内容的信息类型播放的频率确定预设信息类型。
在一种可行的实施例中,所述处理器401调用语音处理模型对所述声音特征进行数据分析之前,还用于:
从预设存储空间中获取多个语音素材和所述多个语音素材中各语音素材对应的语音等级;
对所述各语音素材进行特征提取,得到所述各语音素材的声音特征,所述声音特征包括声音强度、声音响度、音高、基音周期、基音频率、振幅能量、共振峰中的一种或者多种;
根据所述各语音素材的声音特征和对应的语音等级对预设语音处理模型进行训练,得到所述语音处理模型。
在一种可行的实施例中,所述目标处理为对所述语音信号进行弱化处理,所述处理器401,具体用于:
获取所述语音信号的声音强度值;
判断所述声音强度值是否大于弱化处理强度阈值;
若所述声音强度值大于所述弱化处理强度阈值,则将所述语音信号的声音强度值调整至预设强度阈值,所述预设强度阈值小于所述声音强度值。
在一种可行的实施例中,所述目标处理为对所述语音信号进行增强处理,所述处理器401,具体用于:
在所述语音信号接收端通过语音信号增强器对所述语音信号进行增强处理;或者若检测到正在播放多媒体文件,则暂停所述多媒体文件的播放。
应当理解,在本申请实施例中,所称处理器401可以是中央处理单元(CentralProcessing Unit,CPU),该处理器401还可以是其他通用处理器、数字信号处理器(DigitalSignal Processor,DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现成可编程门阵列(Field-Programmable Gate Array,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。
该存储器403可以包括只读存储器和随机存取存储器,并向处理器401提供指令和数据。存储器403的一部分还可以包括非易失性随机存取存储器。例如,存储器403还可以存储设备类型的信息。
具体实现中,本申请实施例中所描述的处理器401、通信接口402和存储器403可执行本申请实施例提供的图2所述的方法实施例所描述的实现方式,也可执行本申请实施例图3所描述的语音信号处理装置的实现方法,在此不再赘述。
在本申请的另一实施例中提供一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序包括程序指令,所述程序指令被处理器执行时实现本申请实施例提供的图2所述的方法实施所描述的实现方式,所述计算机可读存储介质可以是前述任一实施例所述的服务器的内部存储单元,例如服务器的硬盘或内存。所述计算机可读存储介质也可以是所述服务器的外部存储设备,例如所述服务器上配备的插接式硬盘,智能存储卡(Smart Media Card,SMC),安全数字(Secure Digital,SD)卡,闪存卡(Flash Card)等。进一步地,所述计算机可读存储介质还可以既包括所述服务器的内部存储单元也包括外部存储设备。所述计算机可读存储介质用于存储所述计算机程序以及所述服务器所需的其他程序和数据。所述计算机可读存储介质还可以用于暂时地存储已经输出或者将要输出的数据。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的程序可存储于一计算机可读取可读存储介质中,该程序在执行时,可包括如上述各方法的实施例的流程。
其中,所述的可读存储介质可为磁碟、光盘、只读存储记忆体(Read-Only Memory,ROM)或随机存储记忆体(Random Access Memory,RAM)等。所述的计算机可读存储介质可主要包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需的应用程序等;存储数据区可存储根据区块链节点的使用所创建的数据等。
其中,本申请所指区块链是分布式数据存储、点对点传输、共识机制、加密算法等计算机技术的新型应用模式。区块链(Blockchain),本质上是一个去中心化的数据库,是一串使用密码学方法相关联产生的数据块,每一个数据块中包含了一批次网络交易的信息,用于验证其信息的有效性(防伪)和生成下一个区块。区块链可以包括区块链底层平台、平台产品服务层以及应用服务层等。
以上所揭露的仅为本申请一种较佳实施例而已,当然不能以此来限定本申请之权利范围,本领域普通技术人员可以理解实现上述实施例的全部或部分流程,并依本申请权利要求所作的等同变化,仍属于发明所涵盖的范围。
Claims (10)
1.一种语音信号处理方法,其特征在于,应用电子设备,所述电子设备与终端设备预先建立了通信连接,包括:
采集环境中的语音信号,对采集到的语音信号进行语义解析;
基于语义解析结果确定所述语音信号对应内容的信息类型;
检测所述信息类型与预设信息类型是否关联;
若检测到所述信息类型与所述预设信息类型不关联,则提取所述语音信号的声音特征;
调用语音处理模型对所述声音特征进行数据分析,并基于数据分析结果确定所述语音信号所属的目标语音等级;
从预先建立的语音等级与语音信号处理策略的对应关系中,确定所述目标语音等级对应的目标语音信号处理策略;
依照所述目标语音信号处理策略的指示对所述语音信号进行目标处理,所述目标处理包括以下任一种或者多种:对所述语音信号进行弱化处理、对所述语音信号进行隔离处理和对所述语音信号进行增强处理。
2.根据权利要求1所述的方法,其特征在于,所述终端设备中安装有多个应用程序,所述方法还包括:
从所述终端设备获取用户对各应用程序的使用频率,基于所述使用频率和各应用程序的类型,确定预设信息类型。
3.根据权利要求1所述的方法,其特征在于,所述方法还包括:从所述终端设备获取用户在浏览器的浏览记录,并基于所述浏览记录确定所述用户的偏好信息类型;
根据所述用户的偏好信息类型确定预设信息类型。
4.根据权利要求1所述的方法,其特征在于,所述方法还包括:
获取播放的多个历史语音信号,并对所述多个历史语音信号进行语义解析,得到所述多个历史语音信号中各历史语音信号对应的内容的信息类型;
获取所述各历史语音信号对应的内容的信息类型播放的频率;
根据所述各历史语音信号对应的内容的信息类型播放的频率确定预设信息类型。
5.根据权利要求1所述的方法,其特征在于,所述调用语音处理模型对所述声音特征进行数据分析之前,所述方法还包括:
从预设存储空间中获取多个语音素材和所述多个语音素材中各语音素材对应的语音等级;
对所述各语音素材进行特征提取,得到所述各语音素材的声音特征,所述声音特征包括声音强度、声音响度、音高、基音周期、基音频率、振幅能量、共振峰中的一种或者多种;
根据所述各语音素材的声音特征和对应的语音等级对预设语音处理模型进行训练,得到所述语音处理模型。
6.根据权利要求1所述的方法,其特征在于,所述目标处理为对所述语音信号进行弱化处理,所述依照所述目标语音信号处理策略的指示对所述语音信号进行目标处理,包括:
获取所述语音信号的声音强度值;
判断所述声音强度值是否大于弱化处理强度阈值;
若所述声音强度值大于所述弱化处理强度阈值,则将所述语音信号的声音强度值调整至预设强度阈值,所述预设强度阈值小于所述声音强度值。
7.根据权利要求1所述的方法,其特征在于,所述电子设备包括语音信号接收端,所述目标处理为对所述语音信号进行增强处理,所述依照所述目标语音信号处理策略的指示对所述语音信号进行目标处理,包括:
在所述语音信号接收端通过语音信号增强器对所述语音信号进行增强处理;
或者若检测到正在播放多媒体文件,则暂停所述多媒体文件的播放。
8.一种语音信号处理装置,其特征在于,所述装置应用于电子设备,包括:
采集模块,用于采集环境中的语音信号,对采集到的语音信号进行语义解析;
处理模块,用于基于语义解析结果确定所述语音信号对应内容的信息类型;
检测模块,用于检测所述信息类型与预设信息类型是否关联;
所述处理模块,还用于若检测到所述信息类型与所述预设信息类型不关联,则提取所述语音信号的声音特征;
所述处理模块,还调用语音处理模型对所述声音特征进行数据分析,并基于数据分析结果确定所述语音信号所属的目标语音等级;
所述处理模块,还用于从预先建立的语音等级与语音信号处理策略的对应关系中,确定所述目标语音等级对应的目标语音信号处理策略;
所述处理模块,还用于依照所述目标语音信号处理策略的指示对所述语音信号进行目标处理,所述目标处理包括以下任一种或者多种:对所述语音信号进行弱化处理、对所述语音信号进行隔离处理和对所述语音信号进行增强处理。
9.一种电子设备,其特征在于,所述电子设备包括处理器和存储器,所述处理器和存储器相互连接,其中,所述存储器用于存储计算机程序,所述计算机程序包括程序指令,所述处理器被配置用于调用所述程序指令,执行如权利要求1-7任一项所述的方法。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质中存储有程序指令,所述程序指令被执行时,用于实现如权利要求1-7任一项所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011055238.6A CN111933184B (zh) | 2020-09-29 | 2020-09-29 | 一种语音信号处理方法、装置、电子设备和存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011055238.6A CN111933184B (zh) | 2020-09-29 | 2020-09-29 | 一种语音信号处理方法、装置、电子设备和存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN111933184A CN111933184A (zh) | 2020-11-13 |
CN111933184B true CN111933184B (zh) | 2021-01-08 |
Family
ID=73334938
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202011055238.6A Active CN111933184B (zh) | 2020-09-29 | 2020-09-29 | 一种语音信号处理方法、装置、电子设备和存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111933184B (zh) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114822570B (zh) * | 2021-01-22 | 2023-02-14 | 腾讯科技(深圳)有限公司 | 一种音频数据处理方法、装置、设备及可读存储介质 |
Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103796125A (zh) * | 2013-11-21 | 2014-05-14 | 广州视源电子科技股份有限公司 | 一种基于耳机播放的声音调节方法 |
CN105554610A (zh) * | 2014-12-29 | 2016-05-04 | 北京小鸟听听科技有限公司 | 耳机环境声音的调节方法和耳机 |
CN106937201A (zh) * | 2017-04-27 | 2017-07-07 | 英华达(南京)科技有限公司 | 动态控制耳机的装置及方法 |
JP2017175405A (ja) * | 2016-03-24 | 2017-09-28 | 株式会社Jvcケンウッド | 再生装置、及び再生方法 |
CN107564523A (zh) * | 2017-09-28 | 2018-01-09 | 歌尔科技有限公司 | 一种耳机接听方法、装置以及耳机 |
CN110475170A (zh) * | 2019-07-10 | 2019-11-19 | 深圳壹账通智能科技有限公司 | 耳机播放状态的控制方法、装置、移动终端及存储介质 |
US10616693B2 (en) * | 2016-01-22 | 2020-04-07 | Staton Techiya Llc | System and method for efficiency among devices |
CN111638751A (zh) * | 2020-05-19 | 2020-09-08 | 广东小天才科技有限公司 | 基于可穿戴设备的安全预警方法及装置、可穿戴设备 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8326635B2 (en) * | 2007-12-25 | 2012-12-04 | Personics Holdings Inc. | Method and system for message alert and delivery using an earpiece |
-
2020
- 2020-09-29 CN CN202011055238.6A patent/CN111933184B/zh active Active
Patent Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103796125A (zh) * | 2013-11-21 | 2014-05-14 | 广州视源电子科技股份有限公司 | 一种基于耳机播放的声音调节方法 |
CN105554610A (zh) * | 2014-12-29 | 2016-05-04 | 北京小鸟听听科技有限公司 | 耳机环境声音的调节方法和耳机 |
US10616693B2 (en) * | 2016-01-22 | 2020-04-07 | Staton Techiya Llc | System and method for efficiency among devices |
JP2017175405A (ja) * | 2016-03-24 | 2017-09-28 | 株式会社Jvcケンウッド | 再生装置、及び再生方法 |
CN106937201A (zh) * | 2017-04-27 | 2017-07-07 | 英华达(南京)科技有限公司 | 动态控制耳机的装置及方法 |
CN107564523A (zh) * | 2017-09-28 | 2018-01-09 | 歌尔科技有限公司 | 一种耳机接听方法、装置以及耳机 |
CN110475170A (zh) * | 2019-07-10 | 2019-11-19 | 深圳壹账通智能科技有限公司 | 耳机播放状态的控制方法、装置、移动终端及存储介质 |
CN111638751A (zh) * | 2020-05-19 | 2020-09-08 | 广东小天才科技有限公司 | 基于可穿戴设备的安全预警方法及装置、可穿戴设备 |
Also Published As
Publication number | Publication date |
---|---|
CN111933184A (zh) | 2020-11-13 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109166593B (zh) | 音频数据处理方法、装置及存储介质 | |
CN112863547A (zh) | 虚拟资源转移处理方法、装置、存储介质及计算机设备 | |
CN113539283A (zh) | 基于人工智能的音频处理方法、装置、电子设备及存储介质 | |
US11749298B2 (en) | Health-related information generation and storage | |
WO2021184837A1 (zh) | 诈骗电话的识别方法、装置、存储介质及终端 | |
CN109151211A (zh) | 语音处理方法、装置以及电子设备 | |
CN111933184B (zh) | 一种语音信号处理方法、装置、电子设备和存储介质 | |
CN113851136A (zh) | 基于聚类的说话人识别方法、装置、设备及存储介质 | |
WO2020228226A1 (zh) | 一种纯音乐检测方法、装置及存储介质 | |
CN105280203B (zh) | 一种音频播放方法及用户设备 | |
US20120053937A1 (en) | Generalizing text content summary from speech content | |
CN112233676A (zh) | 智能设备唤醒方法、装置、电子设备及存储介质 | |
CN114339392B (zh) | 视频剪辑方法、装置、计算机设备及存储介质 | |
CN113284500B (zh) | 音频处理方法、装置、电子设备及存储介质 | |
CN113903338A (zh) | 面签方法、装置、电子设备和存储介质 | |
CN107025597A (zh) | 基于大数据的风险预测方法和装置 | |
CN116746887B (zh) | 一种基于音频的睡眠分期的方法、系统、终端及存储介质 | |
CN115116458B (zh) | 语音数据转换方法、装置、计算机设备及存储介质 | |
CN116156439A (zh) | 智能穿戴电子对讲交互系统 | |
CN208094741U (zh) | 一种基于语音识别技术的智能麦克风 | |
CN114822558A (zh) | 声纹识别方法、装置、电子设备及存储介质 | |
CN106297812A (zh) | 一种数据处理方法及终端 | |
WO2020154916A1 (zh) | 视频字幕合成方法、装置、存储介质及电子设备 | |
CN116074440A (zh) | 一种通话状态检测方法、装置和计算机可读存储介质 | |
CN112802458B (zh) | 唤醒方法和装置、存储介质、电子设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |