CN112992133A - 声音信号控制方法、系统、可读存储介质和设备 - Google Patents
声音信号控制方法、系统、可读存储介质和设备 Download PDFInfo
- Publication number
- CN112992133A CN112992133A CN201911212584.8A CN201911212584A CN112992133A CN 112992133 A CN112992133 A CN 112992133A CN 201911212584 A CN201911212584 A CN 201911212584A CN 112992133 A CN112992133 A CN 112992133A
- Authority
- CN
- China
- Prior art keywords
- voice
- sound
- voiceprint
- signal
- control
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 230000005236 sound signal Effects 0.000 title claims abstract description 116
- 238000000034 method Methods 0.000 title claims abstract description 49
- 238000013528 artificial neural network Methods 0.000 claims description 73
- 230000006870 function Effects 0.000 claims description 29
- 238000001228 spectrum Methods 0.000 abstract description 19
- 238000012545 processing Methods 0.000 abstract description 2
- 230000000875 corresponding effect Effects 0.000 description 25
- 230000001276 controlling effect Effects 0.000 description 12
- 230000007958 sleep Effects 0.000 description 11
- 238000013135 deep learning Methods 0.000 description 5
- 230000008569 process Effects 0.000 description 5
- 238000010586 diagram Methods 0.000 description 3
- 238000005516 engineering process Methods 0.000 description 3
- 230000002596 correlated effect Effects 0.000 description 2
- 230000005059 dormancy Effects 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 238000012549 training Methods 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 238000004590 computer program Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/08—Speech classification or search
- G10L15/16—Speech classification or search using artificial neural networks
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L17/00—Speaker identification or verification techniques
- G10L17/18—Artificial neural networks; Connectionist approaches
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L17/00—Speaker identification or verification techniques
- G10L17/22—Interactive procedures; Man-machine interfaces
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
- G10L2015/223—Execution procedure of a spoken command
Landscapes
- Engineering & Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Artificial Intelligence (AREA)
- Evolutionary Computation (AREA)
- Computational Linguistics (AREA)
- Selective Calling Equipment (AREA)
Abstract
本发明涉及一种声音信号控制方法、系统、可读存储介质和设备,属于音频信号处理技术领域,通过声音传感器接收声音信号,该声音信号是用于控制智能设备的,从声音信号中获取第一声纹和用于模式切换的目标词,第一声纹是声音信号的声波频谱,不同声源发出的声音的声波频谱不同,通过辨别声纹,可以提高声音控制的安全性,目标词是用于触发声音控制模式切换的,在第一声纹符合要求,且目标词正确时,可以进行声音控制模式切换,确定对应目标词的声音控制模式,然后在该声音控制模式下对智能设备进行声音信号控制,如此可以根据用户的实际需要对声音控制模式进行智能切换,使智能设备能适应不同的声控应用场景,提高智能设备的适用性。
Description
技术领域
本发明涉及音频信号处理技术领域,特别是涉及一种声音信号控制方法、系统、可读存储介质和设备。
背景技术
随着科学技术的发展,对于智能设备的控制由按键控制逐渐发展为触摸控制。随着用户对语音控制的需求的增加,现有的很多智能设备都搭载了智能语音系统。
传统的智能语音系统进行语音控制的主要原理是:通过麦克风进行语音输入,对输入的语音信号进行关键词识别,进而控制智能设备进行相应的操作;或者辨别用户发出的声音,在确认是授权操作对象后,控制智能设备进行相应的操作,但是,传统的语音控制技术都是直接固化在智能设备中,在不同场合下,语音控制方式会出现并不适用的问题,限制了智能设备的适用性。
发明内容
基于此,有必要针对传统的智能设备语音控制方式适用性差的问题,提供一种声音信号控制方法、系统、可读存储介质和设备。
一种声音信号控制方法,包括以下步骤:
通过声音传感器接收声音信号,从声音信号中获取第一声纹和用于模式切换的目标词;
根据第一声纹和目标词进行声音控制模式切换,确定声音控制模式;
根据声音控制模式对智能设备进行声音信号控制。
根据上述的声音信号控制方法,其通过声音传感器接收声音信号,该声音信号是用于控制智能设备的,从声音信号中获取第一声纹和用于模式切换的目标词,第一声纹是声音信号的声波频谱,不同声源发出的声音的声波频谱不同,通过辨别声纹,可以提高声音控制的安全性,目标词是用于触发声音控制模式切换的,在第一声纹符合要求,且目标词正确时,可以进行声音控制模式切换,确定对应目标词的声音控制模式,然后在该声音控制模式下对智能设备进行声音信号控制,如此可以根据用户的实际需要对声音控制模式进行智能切换,使智能设备能适应不同的声控应用场景,提高智能设备的适用性。
在其中一个实施例中,若确定的声音控制模式为关键词识别模式,根据声音控制模式对智能设备进行声音信号控制的步骤包括以下步骤:
通过声音传感器接收第一语音信号,将第一语音信号输入至语音识别神经网络,通过语音识别神经网络从第一语音信号中获取关键词,根据关键词对智能设备进行唤醒或休眠。
在其中一个实施例中,若确定的声音控制模式为命令词识别模式,根据声音控制模式对智能设备进行声音信号控制的步骤包括以下步骤:
通过声音传感器接收第二语音信号,将第二语音信号输入至语音识别神经网络,通过语音识别神经网络从第二语音信号中获取命令词,根据命令词对智能设备进行功能控制。
在其中一个实施例中,若确定的声音控制模式为关键词和命令词识别模式,根据声音控制模式对智能设备进行声音信号控制的步骤包括以下步骤:
通过声音传感器接收第三语音信号,将第三语音信号输入至语音识别神经网络,通过语音识别神经网络从第三语音信号中获取关键词和命令词,根据关键词对智能设备进行唤醒或休眠,根据命令词对智能设备进行功能控制。
在其中一个实施例中,若确定的声音控制模式为关键词和声纹识别模式,根据声音控制模式对智能设备进行声音信号控制的步骤包括以下步骤:
通过声音传感器接收第四语音信号,将第四语音信号输入至语音识别神经网络,通过语音识别神经网络从第四语音信号中获取第二声纹和关键词,若第二声纹和预设声纹相匹配,根据关键词对智能设备进行唤醒或休眠。
在其中一个实施例中,若确定的声音控制模式为命令词和声纹识别模式,根据声音控制模式对智能设备进行声音信号控制的步骤包括以下步骤:
通过声音传感器接收第五语音信号,将第五语音信号输入至语音识别神经网络,通过语音识别神经网络从第五语音信号中获取第三声纹和命令词,若第三声纹和预设声纹相匹配,根据命令词对智能设备进行功能控制。
在其中一个实施例中,若确定的声音控制模式为关键词、命令词和声纹识别模式,根据声音控制模式对智能设备进行声音信号控制的步骤包括以下步骤:
通过声音传感器接收第六语音信号,将第六语音信号输入至语音识别神经网络,通过语音识别神经网络从第六语音信号中获取第四声纹和关键词,或者,第四声纹和命令词;
若第四声纹和预设声纹相匹配,根据关键词对智能设备进行唤醒或休眠;
或者,若第四声纹和预设声纹相匹配,根据命令词对智能设备进行功能控制。
在其中一个实施例中,声音信号控制方法还包括以下步骤:
获取用户根据提示发出的语音,从获取的语音中提取声纹样本作为预设声纹。
一种声音信号控制系统,包括:
声音接收单元,用于通过声音传感器接收声音信号,从声音信号中获取第一声纹和用于模式切换的目标词;
模式切换单元,用于根据第一声纹和目标词进行声音控制模式切换,确定声音控制模式;
信号控制单元,用于根据声音控制模式对智能设备进行语音信号控制。
根据上述的声音信号控制系统,其包括声音接收单元、模式切换单元和信号控制单元,声音接收单元可以通过声音传感器接收声音信号,该声音信号是用于控制智能设备的,从声音信号中获取第一声纹和用于模式切换的目标词,第一声纹是声音信号的声波频谱,不同声源发出的声音的声波频谱不同,通过辨别声纹,可以提高声音控制的安全性,目标词是用于触发声音控制模式切换的,在第一声纹符合要求,且目标词正确时,可以进行声音控制模式切换,模式切换单元可以根据第一声纹和目标词进行声音控制模式确定对应目标词的声音控制模式,然后信号控制单元可以在该声音控制模式下对智能设备进行声音信号控制,如此可以根据用户的实际需要对声音控制模式进行智能切换,使智能设备能适应不同的声控应用场景,提高智能设备的适用性。
在其中一个实施例中,在确定的声音控制模式为关键词识别模式时,声音接收单元用于通过声音传感器接收第一语音信号,信号控制单元用于将第一语音信号输入至语音识别神经网络,通过语音识别神经网络从第一语音信号中获取关键词,根据关键词对智能设备进行唤醒或休眠。
在其中一个实施例中,在确定的声音控制模式为命令词识别模式时,声音接收单元用于通过声音传感器接收第二语音信号,信号控制单元用于将第二语音信号输入至语音识别神经网络,通过语音识别神经网络从第二语音信号中获取命令词,根据命令词对智能设备进行功能控制。
在其中一个实施例中,在确定的声音控制模式为关键词和命令词识别模式时,声音接收单元用于通过声音传感器接收第三语音信号,信号控制单元用于将第三语音信号输入至语音识别神经网络,通过语音识别神经网络从第三语音信号中获取关键词和命令词,根据关键词对智能设备进行唤醒或休眠,根据命令词对智能设备进行功能控制。
在其中一个实施例中,在确定的声音控制模式为关键词和声纹识别模式时,声音接收单元用于通过声音传感器接收第四语音信号,信号控制单元用于将第四语音信号输入至语音识别神经网络,通过语音识别神经网络从第四语音信号中获取第二声纹和关键词,若第二声纹和预设声纹相匹配,根据关键词对智能设备进行唤醒或休眠。
在其中一个实施例中,在确定的声音控制模式为命令词和声纹识别模式时,声音接收单元用于通过声音传感器接收第五语音信号,信号控制单元用于将第五语音信号输入至语音识别神经网络,通过语音识别神经网络从第五语音信号中获取第三声纹和命令词,若第三声纹和预设声纹相匹配,根据命令词对智能设备进行功能控制。
在其中一个实施例中,在确定的声音控制模式为关键词、命令词和声纹识别模式时,声音接收单元用于通过声音传感器接收第六语音信号,信号控制单元用于将第六语音信号输入至语音识别神经网络,通过语音识别神经网络从第六语音信号中获取第四声纹和关键词,或者,第四声纹和命令词;
在第四声纹和预设声纹相匹配时,信号控制单元根据关键词对智能设备进行唤醒或休眠;
或者,在第四声纹和预设声纹相匹配时,信号控制单元根据命令词对智能设备进行功能控制。
在其中一个实施例中,声音信号控制系统还包括声纹预置单元,用于获取用户根据提示发出的语音,从获取的语音中提取声纹样本作为预设声纹。
一种可读存储介质,其上存储有可执行程序,可执行程序被处理器执行时实现上述的声音信号控制方法的步骤。
上述可读存储介质,通过其存储的可执行程序,可以实现通过声音传感器接收声音信号,该声音信号是用于控制智能设备的,从声音信号中获取第一声纹和用于模式切换的目标词,第一声纹是声音信号的声波频谱,不同声源发出的声音的声波频谱不同,通过辨别声纹,可以提高声音控制的安全性,目标词是用于触发声音控制模式切换的,在第一声纹符合要求,且目标词正确时,可以进行声音控制模式切换,确定对应目标词的声音控制模式,然后在该声音控制模式下对智能设备进行声音信号控制,如此可以根据用户的实际需要对声音控制模式进行智能切换,使智能设备能适应不同的声控应用场景,提高智能设备的适用性。
一种声音信号控制设备,包括存储器和处理器,存储器存储有可执行程序,处理器执行可执行程序时实现上述的声音信号控制方法的步骤。
上述声音信号控制设备,通过在处理器上运行可执行程序,可以实现通过声音传感器接收声音信号,该声音信号是用于控制智能设备的,从声音信号中获取第一声纹和用于模式切换的目标词,第一声纹是声音信号的声波频谱,不同声源发出的声音的声波频谱不同,通过辨别声纹,可以提高声音控制的安全性,目标词是用于触发声音控制模式切换的,在第一声纹符合要求,且目标词正确时,可以进行声音控制模式切换,确定对应目标词的声音控制模式,然后在该声音控制模式下对智能设备进行声音信号控制,如此可以根据用户的实际需要对声音控制模式进行智能切换,使智能设备能适应不同的声控应用场景,提高智能设备的适用性。
附图说明
图1为一个实施例中的声音信号控制方法的流程示意图;
图2为一个实施例中的声音信号控制系统的结构示意图;
图3为另一个实施例中的声音信号控制系统的结构示意图。
具体实施方式
为使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明进行进一步的详细说明。应当理解,此处所描述的具体实施方式仅仅用以解释本发明,并不限定本发明的保护范围。
需要说明的是,本发明实施例所涉及的术语“第一\第二”仅仅是是区别类似的对象,不代表针对对象的特定排序,可以理解地,“第一\第二”在允许的情况下可以互换特定的顺序或先后次序。应该理解“第一\第二”区分的对象在适当情况下可以互换,以使这里描述的本发明的实施例能够以除了在这里图示或描述的那些以外的顺序实施。
本发明实施例的术语“包括”和“具有”以及它们任何变形,意图在于覆盖不排他的包含。例如包含了一系列步骤或(模块)单元的过程、方法、系统、产品或设备没有限定于已列出的步骤或单元,而是可选地还包括没有列出的步骤或单元,或可选地还包括对于这些过程、方法、产品或设备固有的其它步骤或单元。
在本文中提及“实施例”意味着,结合实施例描述的特定特征、结构或特性可以包含在本申请的至少一个实施例中。在说明书中的各个位置出现该短语并不一定均是指相同的实施例,也不是与其它实施例互斥的独立的或备选的实施例。本领域技术人员显式地和隐式地理解的是,本文所描述的实施例可以与其它实施例相结合。
在本文中提及的“多个”是指两个或两个以上。“和/或”,描述关联对象的关联关系,表示可以存在三种关系,例如,A和/或B,可以表示:单独存在A,同时存在A和B,单独存在B这三种情况。字符“/”一般表示前后关联对象是一种“或”的关系。
本申请提供的声音信号控制方法,可以应用于各种可实现无线传输的智能设备中,用于对智能设备(如智能耳机、便捷式穿戴设备等等)进行控制,智能设备可以通过声音控制执行各种命令和操作。
参见图1所示,为一个实施例的声音信号控制方法的流程示意图。该实施例中的声音信号控制方法包括以下步骤:
步骤S110:通过声音传感器接收声音信号,从声音信号中获取第一声纹和用于模式切换的目标词;
在本步骤中,声音传感器可以是麦克风等可以接收声音信号的器件,声音传感器若是麦克风,智能设备若是智能耳机,可以直接将智能耳机的麦克风作为声音传感器,若智能耳机上没有麦克风,可以设置一声音传感器来接收声音信号,为了提高信号接收的准确度,声音传感器可以设置在智能耳机的表面;声音信号可以是语音信号,如用户发出的话语、歌声、旋律音等,也可以是其他播放设备播放的语音、音乐、旋律等;第一声纹是声音信号的声波频谱,通过对声音信号的识别,可以获取声音词,并从中得到用于模式切换的目标词,如“模式切换”、“控制变换”、“改变控制方式”等等。
步骤S120:根据第一声纹和目标词进行声音控制模式切换,确定声音控制模式;
在本步骤中,利用第一声纹和目标词进行声音控制模式切换,可以确定切换后的声音控制模式,第一声纹的作用是判断是否是合法的用户发出的声音,若是,且目标词也是指示模式切换的词,则可以进行声音控制模式切换,具体的,可以将第一声纹与预设声纹进行比较,若两者相匹配,则第一声纹对应的用户合法,反之则非法,即使目标词正确,也不进行声音控制模式切换;在利用目标词进行声音控制切换时,可以直接切换到指定的声音控制模式,或者切换到下一种声音控制模式,当前声音控制模式和下一种声音控制模式是按预设顺序排列的多种声音控制模式中的相邻两种,如目标词可以是“切换至声纹识别模式”、“切换至非声纹识别模式”、“切换至下一种控制模式”等等。
步骤S130:根据声音控制模式对智能设备进行声音信号控制。
在本步骤中,在确定声音控制模式后,可以将相应的调整控制信号传输至智能设备的主控芯片,用于调整声音控制模式,以调整后的声音控制模式对外界的声音进行响应。
在本实施例中,声音信号控制方法通过声音传感器接收声音信号,该声音信号是用于控制智能设备的,从声音信号中获取第一声纹和用于模式切换的目标词,第一声纹是声音信号的声波频谱,不同声源发出的声音的声波频谱不同,通过辨别声纹,可以提高声音控制的安全性,目标词是用于触发声音控制模式切换的,在第一声纹符合要求,且目标词正确时,可以进行声音控制模式切换,确定对应目标词的声音控制模式,然后在该声音控制模式下对智能设备进行声音信号控制,如此可以根据用户的实际需要对声音控制模式进行智能切换,使智能设备能适应不同的声控应用场景,提高智能设备的适用性。
进一步的,从声音信号中获取第一声纹和用于模式切换的目标词可以通过深度学习神经网络来实现,将声音信号输入至预先训练好的深度学习神经网络中,可以输出第一声纹和目标词。
在一个实施例中,若确定的声音控制模式为关键词识别模式,根据声音控制模式对智能设备进行声音信号控制的步骤包括以下步骤:
通过声音传感器接收第一语音信号,将第一语音信号输入至语音识别神经网络,通过语音识别神经网络从第一语音信号中获取关键词,根据关键词对智能设备进行唤醒或休眠。
在本实施例中,可以采用关键词识别模式控制智能设备,在进行声音信号控制时,可以通过声音传感器接收第一语音信号,与上述声音信号不同,此处的第一语音信号是用于具体控制智能设备的工作状态,通过语音识别神经网络对第一语音信号进行识别,得到其中包含的关键词,对关键词进行解析,得到相应的指令,发送至智能设备的主控芯片,唤醒或休眠智能设备,关键词与唤醒、休眠指令之间具备关联关系,只要语音识别神经网络识别到关键词,就可以解析得到相应的指令,关键词可以预先指定,如“开机”、“开启”、“关机”、“关闭”、“休眠”、“睡眠”等等,如此可以通过包含指定关键词的语音实现对智能设备的唤醒或休眠。
在一个实施例中,若确定的声音控制模式为命令词识别模式,根据声音控制模式对智能设备进行声音信号控制的步骤包括以下步骤:
通过声音传感器接收第二语音信号,将第二语音信号输入至语音识别神经网络,通过语音识别神经网络从第二语音信号中获取命令词,根据命令词对智能设备进行功能控制。
在本实施例中,可以采用命令词识别模式控制智能设备,在进行声音信号控制时,可以通过声音传感器接收第二语音信号,与第一声音信号不同,此处的第二语音信号是用于具体控制智能设备的功能,通过语音识别神经网络对第二语音信号进行识别,得到其中包含的命令词,对命令词进行解析,得到相应的指令,发送至智能设备的主控芯片,驱动智能设备执行指令相应的功能,命令词与功能指令之间具备关联关系,只要语音识别神经网络识别到命令词,就可以解析得到相应的指令,命令词可以预先指定,如“播放音乐”、“调高音量”、“调低音量”、“下一首”、“上一首”等等,如此可以通过包含指定命令词的语音实现对智能设备的功能控制。
在一个实施例中,若确定的声音控制模式为关键词和命令词识别模式,根据声音控制模式对智能设备进行声音信号控制的步骤包括以下步骤:
通过声音传感器接收第三语音信号,将第三语音信号输入至语音识别神经网络,通过语音识别神经网络从第三语音信号中获取关键词和命令词,根据关键词对智能设备进行唤醒或休眠,根据命令词对智能设备进行功能控制。
在本实施例中,声音控制模式可以是关键词和命令词同时识别模式,在此模式下进行声音信号控制时,可以通过声音传感器接收第三语音信号,通过语音识别神经网络对第三语音信号进行识别,得到其中包含的关键词和命令词,对关键词和命令词进行解析,得到相应的指令,发送至智能设备的主控芯片,唤醒或休眠智能设备,驱动智能设备执行指令相应的功能,如此可以通过包含指定关键词和命令词的语音实现对智能设备的唤醒或休眠。
进一步的,即使第三语音信号中只包含关键词,或只包含命令词,可以通过关键词和命令词同时识别模式进行控制。
在一个实施例中,若确定的声音控制模式为关键词和声纹识别模式,根据声音控制模式对智能设备进行声音信号控制的步骤包括以下步骤:
通过声音传感器接收第四语音信号,将第四语音信号输入至语音识别神经网络,通过语音识别神经网络从第四语音信号中获取第二声纹和关键词,若第二声纹和预设声纹相匹配,根据关键词对智能设备进行唤醒或休眠。
在本实施例中,可以采用关键词和声纹识别模式控制智能设备,在进行声音信号控制时,可以通过声音传感器接收第四语音信号,通过语音识别神经网络对第四语音信号进行识别,得到第四语音信号对应的第二声纹,以及第四语音信号中包含的关键词,将第二声纹与预设声纹进行比较,在两者相匹配时,对关键词进行解析,得到相应的指令,发送至智能设备的主控芯片,唤醒或休眠智能设备,可以实现只有与预设声纹相关联的关键词才能唤醒、休眠智能设备,可以提高声音控制的安全性。
在一个实施例中,若确定的声音控制模式为命令词和声纹识别模式,根据声音控制模式对智能设备进行声音信号控制的步骤包括以下步骤:
通过声音传感器接收第五语音信号,将第五语音信号输入至语音识别神经网络,通过语音识别神经网络从第五语音信号中获取第三声纹和命令词,若第三声纹和预设声纹相匹配,根据命令词对智能设备进行功能控制。
在本实施例中,可以采用命令词和声纹识别模式控制智能设备,在进行声音信号控制时,可以通过声音传感器接收第五语音信号,通过语音识别神经网络对第五语音信号进行识别,得到第五语音信号对应的第三声纹,以及第四语音信号中包含的命令词,将第三声纹与预设声纹进行比较,在两者相匹配时,对命令词进行解析,得到相应的指令,发送至智能设备的主控芯片,对智能设备进行功能控制,可以实现只有与预设声纹相关联的命令词才能对智能设备的功能进行控制,可以提高声音控制的安全性。
在一个实施例中,若确定的声音控制模式为关键词、命令词和声纹识别模式,根据声音控制模式对智能设备进行声音信号控制的步骤包括以下步骤:
通过声音传感器接收第六语音信号,将第六语音信号输入至语音识别神经网络,通过语音识别神经网络从第六语音信号中获取第四声纹和关键词,或者,第四声纹和命令词;
若第四声纹和预设声纹相匹配,根据关键词对智能设备进行唤醒或休眠;
或者,若第四声纹和预设声纹相匹配,根据命令词对智能设备进行功能控制。
在本实施例中,可以采用关键词、命令词和声纹识别模式控制智能设备,在进行声音信号控制时,可以通过声音传感器接收第六语音信号,通过语音识别神经网络对第六语音信号进行识别,得到第六语音信号对应的第四声纹,以及第六语音信号中包含的关键词、命令词,将第四声纹与预设声纹进行比较,在两者相匹配时,对关键词、命令词进行解析,得到相应的指令,发送至智能设备的主控芯片,对智能设备进行功能控制,可以实现只有与预设声纹相关联的关键词、命令词才能对智能设备进行控制,可以提高声音控制的安全性。
需要说明的是,在声音控制模式为关键词和声纹识别模式时,可以只对满足声纹要求的关键词进行响应,不对命令词进行响应;在声音控制模式为命令词和声纹识别模式时,可以只对满足声纹要求的命令词进行响应,不对关键词进行响应;在声音控制模式为关键词、命令词和声纹识别模式时,可以同时对满足声纹要求的关键词和命令词进行响应;以此可以满足针对不同权限的应用场景需求。
在一个实施例中,声音信号控制方法还包括以下步骤:
获取用户根据提示发出的语音,从获取的语音中提取声纹样本作为预设声纹。
在本实施例中,用户可以按照提示发出语音,在得到该语音后,提取与之对应的声纹作为声纹样本,将其作为预设声纹。这一过程可以在初次使用声音信号控制方法时使用。
进一步的,在原预设声纹录制之后,可以通过相同声纹的语音开启声纹修改功能,进而录制新的声纹。
在一个实施例中,声音信号控制方法还包括以下步骤:
采集各种不同声音的声纹、关键词、命令词,对深度学习神经网络进行训练,使之能够识别不同声纹、关键词、命令词,在训练的过程中,还可以对声纹、关键词、命令词进行不同的组合,在不同组合形势下,单独对深度学习神经网络,使之能适应不同的场景。
根据上述声音信号控制,本发明实施例还提供一种声音信号控制系统,以下就声音信号控制系统的实施例进行详细说明。
参见图2所示,为一个实施例的声音信号控制系统的结构示意图。该实施例中的声音信号控制系统包括:
声音接收单元210,用于通过声音传感器接收声音信号,从声音信号中获取第一声纹和用于模式切换的目标词;
模式切换单元220,用于根据第一声纹和目标词进行声音控制模式切换,确定声音控制模式;
信号控制单元230,用于根据声音控制模式对智能设备进行语音信号控制。
在本实施例中,声音信号控制系统包括声音接收单元210、模式切换单元220和信号控制单元230,声音接收单元210可以通过声音传感器接收声音信号,该声音信号是用于控制智能设备的,从声音信号中获取第一声纹和用于模式切换的目标词,第一声纹是声音信号的声波频谱,不同声源发出的声音的声波频谱不同,通过辨别声纹,可以提高声音控制的安全性,目标词是用于触发声音控制模式切换的,在第一声纹符合要求,且目标词正确时,可以进行声音控制模式切换,模式切换单元220可以根据第一声纹和目标词进行声音控制模式确定对应目标词的声音控制模式,然后信号控制单元230可以在该声音控制模式下对智能设备进行声音信号控制,如此可以根据用户的实际需要对声音控制模式进行智能切换,使智能设备能适应不同的声控应用场景,提高智能设备的适用性。
在一个实施例中,在确定的声音控制模式为关键词识别模式时,声音接收单元210用于通过声音传感器接收第一语音信号,信号控制单元230用于将第一语音信号输入至语音识别神经网络,通过语音识别神经网络从第一语音信号中获取关键词,根据关键词对智能设备进行唤醒或休眠。
在一个实施例中,在确定的声音控制模式为命令词识别模式时,声音接收单元210用于通过声音传感器接收第二语音信号,信号控制单元230用于将第二语音信号输入至语音识别神经网络,通过语音识别神经网络从第二语音信号中获取命令词,根据命令词对智能设备进行功能控制。
在一个实施例中,在确定的声音控制模式为关键词和命令词识别模式时,声音接收单元210用于通过声音传感器接收第三语音信号,信号控制单元230用于将第三语音信号输入至语音识别神经网络,通过语音识别神经网络从第三语音信号中获取关键词和命令词,根据关键词对智能设备进行唤醒或休眠,根据命令词对智能设备进行功能控制。
在一个实施例中,在确定的声音控制模式为关键词和声纹识别模式时,声音接收单元210用于通过声音传感器接收第四语音信号,信号控制单元230用于将第四语音信号输入至语音识别神经网络,通过语音识别神经网络从第四语音信号中获取第二声纹和关键词,若第二声纹和预设声纹相匹配,根据关键词对智能设备进行唤醒或休眠。
在一个实施例中,在确定的声音控制模式为命令词和声纹识别模式时,声音接收单元210用于通过声音传感器接收第五语音信号,信号控制单元230用于将第五语音信号输入至语音识别神经网络,通过语音识别神经网络从第五语音信号中获取第三声纹和命令词,若第三声纹和预设声纹相匹配,根据命令词对智能设备进行功能控制。
在一个实施例中,在确定的声音控制模式为关键词、命令词和声纹识别模式时,声音接收单元210用于通过声音传感器接收第六语音信号,信号控制单元230用于将第六语音信号输入至语音识别神经网络,通过语音识别神经网络从第六语音信号中获取第四声纹和关键词,或者,第四声纹和命令词;
在第四声纹和预设声纹相匹配时,信号控制单元230根据关键词对智能设备进行唤醒或休眠;
或者,在第四声纹和预设声纹相匹配时,信号控制单元230根据命令词对智能设备进行功能控制。
在一个实施例中,如图3所示,声音信号控制系统还包括声纹预置单元240,用于获取用户根据提示发出的语音,从获取的语音中提取声纹样本作为预设声纹。
本发明实施例的声音信号控制系统与上述声音信号控制方法一一对应,在上述声音信号控制方法的实施例阐述的技术特征及其有益效果均适用于声音信号控制系统的实施例中。
根据上述声音信号控制方法,本发明实施例还提供一种可读存储介质和声音信号控制设备。
一种可读存储介质,其上存储有可执行程序,可执行程序被处理器执行时实现上述的声音信号控制方法的步骤。
上述可读存储介质,通过其存储的可执行程序,可以实现通过声音传感器接收声音信号,该声音信号是用于控制智能设备的,从声音信号中获取第一声纹和用于模式切换的目标词,第一声纹是声音信号的声波频谱,不同声源发出的声音的声波频谱不同,通过辨别声纹,可以提高声音控制的安全性,目标词是用于触发声音控制模式切换的,在第一声纹符合要求,且目标词正确时,可以进行声音控制模式切换,确定对应目标词的声音控制模式,然后在该声音控制模式下对智能设备进行声音信号控制,如此可以根据用户的实际需要对声音控制模式进行智能切换,使智能设备能适应不同的声控应用场景,提高智能设备的适用性。
一种声音信号控制设备,包括存储器和处理器,存储器存储有可执行程序,处理器执行可执行程序时实现上述的声音信号控制方法的步骤。
上述声音信号控制设备,通过在处理器上运行可执行程序,可以实现通过声音传感器接收声音信号,该声音信号是用于控制智能设备的,从声音信号中获取第一声纹和用于模式切换的目标词,第一声纹是声音信号的声波频谱,不同声源发出的声音的声波频谱不同,通过辨别声纹,可以提高声音控制的安全性,目标词是用于触发声音控制模式切换的,在第一声纹符合要求,且目标词正确时,可以进行声音控制模式切换,确定对应目标词的声音控制模式,然后在该声音控制模式下对智能设备进行声音信号控制,如此可以根据用户的实际需要对声音控制模式进行智能切换,使智能设备能适应不同的声控应用场景,提高智能设备的适用性。
本领域普通技术人员可以理解实现上述实施例用于声音信号控制方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,程序可存储于一非易失性的计算机可读取存储介质中,如实施例中,该程序可存储于计算机系统的存储介质中,并被该计算机系统中的至少一个处理器执行,以实现包括如上述声音信号控制方法的实施例的流程。其中,存储介质可为磁碟、光盘、只读存储记忆体(Read-Only Memory,ROM)或随机存储记忆体(Random Access Memory,RAM)等。
以上所述实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分步骤是可以通过程序来指令相关的硬件来完成。所述的程序可以存储于可读取存储介质中。该程序在执行时,包括上述方法所述的步骤。所述的存储介质,包括:ROM/RAM、磁碟、光盘等。
以上所述实施例仅表达了本发明的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本发明构思的前提下,还可以做出若干变形和改进,这些都属于本发明的保护范围。因此,本发明专利的保护范围应以所附权利要求为准。
Claims (11)
1.一种声音信号控制方法,其特征在于,包括以下步骤:
通过声音传感器接收声音信号,从所述声音信号中获取第一声纹和用于模式切换的目标词;
根据所述第一声纹和所述目标词进行声音控制模式切换,确定声音控制模式;
根据所述声音控制模式对智能设备进行声音信号控制。
2.根据权利要求1所述的声音信号控制方法,其特征在于,若确定的声音控制模式为关键词识别模式,所述根据所述声音控制模式对智能设备进行声音信号控制的步骤包括以下步骤:
通过所述声音传感器接收第一语音信号,将所述第一语音信号输入至语音识别神经网络,通过所述语音识别神经网络从第一语音信号中获取关键词,根据所述关键词对所述智能设备进行唤醒或休眠。
3.根据权利要求1所述的声音信号控制方法,其特征在于,若确定的声音控制模式为命令词识别模式,所述根据所述声音控制模式对智能设备进行声音信号控制的步骤包括以下步骤:
通过所述声音传感器接收第二语音信号,将所述第二语音信号输入至语音识别神经网络,通过所述语音识别神经网络从第二语音信号中获取命令词,根据所述命令词对所述智能设备进行功能控制。
4.根据权利要求1所述的声音信号控制方法,其特征在于,若确定的声音控制模式为关键词和命令词识别模式,所述根据所述声音控制模式对智能设备进行声音信号控制的步骤包括以下步骤:
通过所述声音传感器接收第三语音信号,将所述第三语音信号输入至语音识别神经网络,通过所述语音识别神经网络从第三语音信号中获取关键词和命令词,根据所述关键词对所述智能设备进行唤醒或休眠,根据所述命令词对所述智能设备进行功能控制。
5.根据权利要求1所述的声音信号控制方法,其特征在于,若确定的声音控制模式为关键词和声纹识别模式,所述根据所述声音控制模式对智能设备进行声音信号控制的步骤包括以下步骤:
通过所述声音传感器接收第四语音信号,将所述第四语音信号输入至语音识别神经网络,通过所述语音识别神经网络从第四语音信号中获取第二声纹和关键词,若所述第二声纹和预设声纹相匹配,根据所述关键词对所述智能设备进行唤醒或休眠。
6.根据权利要求1所述的声音信号控制方法,其特征在于,若确定的声音控制模式为命令词和声纹识别模式,所述根据所述声音控制模式对智能设备进行声音信号控制的步骤包括以下步骤:
通过所述声音传感器接收第五语音信号,将所述第五语音信号输入至语音识别神经网络,通过所述语音识别神经网络从第五语音信号中获取第三声纹和命令词,若所述第三声纹和预设声纹相匹配,根据所述命令词对所述智能设备进行功能控制。
7.根据权利要求1所述的声音信号控制方法,其特征在于,若确定的声音控制模式为关键词、命令词和声纹识别模式,所述根据所述声音控制模式对智能设备进行声音信号控制的步骤包括以下步骤:
通过所述声音传感器接收第六语音信号,将所述第六语音信号输入至语音识别神经网络,通过所述语音识别神经网络从第六语音信号中获取第四声纹和关键词,或者,第四声纹和命令词;
若所述第四声纹和预设声纹相匹配,根据所述关键词对所述智能设备进行唤醒或休眠;
或者,若所述第四声纹和预设声纹相匹配,根据所述命令词对所述智能设备进行功能控制。
8.根据权利要求5至7中任意一项所述的声音信号控制方法,其特征在于,还包括以下步骤:
获取用户根据提示发出的语音,从获取的语音中提取声纹样本作为所述预设声纹。
9.一种声音信号控制系统,其特征在于,包括:
声音接收单元,用于通过声音传感器接收声音信号,从所述声音信号中获取第一声纹和用于模式切换的目标词;
模式切换单元,用于根据所述第一声纹和所述目标词进行声音控制模式切换,确定声音控制模式;
信号控制单元,用于根据所述声音控制模式对智能设备进行语音信号控制。
10.一种可读存储介质,其上存储有可执行程序,其特征在于,所述可执行程序被处理器执行时实现权利要求1至8中任意一项所述的影视任务排期方法的步骤。
11.一种声音信号控制设备,包括存储器和处理器,所述存储器存储有可执行程序,其特征在于,所述处理器执行所述可执行程序时实现权利要求1至8中任意一项所述的声音信号控制方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201911212584.8A CN112992133A (zh) | 2019-12-02 | 2019-12-02 | 声音信号控制方法、系统、可读存储介质和设备 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201911212584.8A CN112992133A (zh) | 2019-12-02 | 2019-12-02 | 声音信号控制方法、系统、可读存储介质和设备 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN112992133A true CN112992133A (zh) | 2021-06-18 |
Family
ID=76330996
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201911212584.8A Pending CN112992133A (zh) | 2019-12-02 | 2019-12-02 | 声音信号控制方法、系统、可读存储介质和设备 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112992133A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115567336A (zh) * | 2022-09-28 | 2023-01-03 | 四川启睿克科技有限公司 | 一种基于智慧家居的无唤醒语音控制系统及方法 |
Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104092932A (zh) * | 2013-12-03 | 2014-10-08 | 腾讯科技(深圳)有限公司 | 一种声控拍摄方法及装置 |
US20160035349A1 (en) * | 2014-07-29 | 2016-02-04 | Samsung Electronics Co., Ltd. | Electronic apparatus and method of speech recognition thereof |
CN108766441A (zh) * | 2018-05-29 | 2018-11-06 | 广东声将军科技有限公司 | 一种基于离线声纹识别和语音识别的语音控制方法及装置 |
CN108766446A (zh) * | 2018-04-18 | 2018-11-06 | 上海问之信息科技有限公司 | 声纹识别方法、装置、存储介质及音箱 |
CN108806672A (zh) * | 2017-04-28 | 2018-11-13 | 辛雪峰 | 一种语音双模式的风扇控制方法 |
CN108847242A (zh) * | 2018-05-30 | 2018-11-20 | Oppo广东移动通信有限公司 | 电子设备控制方法、装置、存储介质及电子设备 |
CN109712621A (zh) * | 2018-12-27 | 2019-05-03 | 维沃移动通信有限公司 | 一种语音交互控制方法及终端 |
US20190281361A1 (en) * | 2018-03-09 | 2019-09-12 | Baidu Online Network Technology (Beijing) Co., Ltd. | Method for switching control modes of a smart tv set, device and computer readable medium |
-
2019
- 2019-12-02 CN CN201911212584.8A patent/CN112992133A/zh active Pending
Patent Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104092932A (zh) * | 2013-12-03 | 2014-10-08 | 腾讯科技(深圳)有限公司 | 一种声控拍摄方法及装置 |
US20160035349A1 (en) * | 2014-07-29 | 2016-02-04 | Samsung Electronics Co., Ltd. | Electronic apparatus and method of speech recognition thereof |
CN108806672A (zh) * | 2017-04-28 | 2018-11-13 | 辛雪峰 | 一种语音双模式的风扇控制方法 |
US20190281361A1 (en) * | 2018-03-09 | 2019-09-12 | Baidu Online Network Technology (Beijing) Co., Ltd. | Method for switching control modes of a smart tv set, device and computer readable medium |
CN108766446A (zh) * | 2018-04-18 | 2018-11-06 | 上海问之信息科技有限公司 | 声纹识别方法、装置、存储介质及音箱 |
CN108766441A (zh) * | 2018-05-29 | 2018-11-06 | 广东声将军科技有限公司 | 一种基于离线声纹识别和语音识别的语音控制方法及装置 |
CN108847242A (zh) * | 2018-05-30 | 2018-11-20 | Oppo广东移动通信有限公司 | 电子设备控制方法、装置、存储介质及电子设备 |
CN109712621A (zh) * | 2018-12-27 | 2019-05-03 | 维沃移动通信有限公司 | 一种语音交互控制方法及终端 |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115567336A (zh) * | 2022-09-28 | 2023-01-03 | 四川启睿克科技有限公司 | 一种基于智慧家居的无唤醒语音控制系统及方法 |
CN115567336B (zh) * | 2022-09-28 | 2024-04-16 | 四川启睿克科技有限公司 | 一种基于智慧家居的无唤醒语音控制系统及方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN106463112B (zh) | 语音识别方法、语音唤醒装置、语音识别装置及终端 | |
US10657945B2 (en) | Noise control method and device | |
JP2019117623A (ja) | 音声対話方法、装置、デバイス及び記憶媒体 | |
CN105190746B (zh) | 用于检测目标关键词的方法和设备 | |
US20180152163A1 (en) | Noise control method and device | |
CN111161714B (zh) | 一种语音信息处理方法、电子设备及存储介质 | |
CN111105796A (zh) | 无线耳机控制装置及控制方法、语音控制设置方法和系统 | |
CN105210146A (zh) | 用于控制语音激活的方法和设备 | |
CN108711429B (zh) | 电子设备及设备控制方法 | |
US20190147890A1 (en) | Audio peripheral device | |
CN108052195B (zh) | 一种麦克风设备的控制方法及终端设备 | |
CN110070863A (zh) | 一种语音控制方法及装置 | |
CN104282307A (zh) | 唤醒语音控制系统的方法、装置及终端 | |
CN106161755A (zh) | 一种关键词语音唤醒系统及唤醒方法及移动终端 | |
CN103903606A (zh) | 一种噪声控制方法及设备 | |
CN112700782A (zh) | 语音处理方法和电子设备 | |
CN110910876A (zh) | 物品声寻装置及控制方法、语音控制设置方法和系统 | |
CN110544468A (zh) | 应用唤醒方法、装置、存储介质及电子设备 | |
CN110689887B (zh) | 音频校验方法、装置、存储介质及电子设备 | |
CN112992133A (zh) | 声音信号控制方法、系统、可读存储介质和设备 | |
EP3793275B1 (en) | Location reminder method and apparatus, storage medium, and electronic device | |
WO2019071723A1 (zh) | 语音翻译方法、装置和翻译机 | |
CN109922397B (zh) | 音频智能处理方法、存储介质、智能终端及智能蓝牙耳机 | |
CN108922523B (zh) | 位置提示方法、装置、存储介质及电子设备 | |
CN110083392B (zh) | 音频唤醒预录的方法、存储介质、终端及其蓝牙耳机 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |