发明内容
要使麦克风具有灵敏的指向性,则需要排列多个振动膜,所以难以实现小型化。
另外,要利用声波的到达时刻差来高精度地检测出声波的到达方向,则需要以可听声波的数波长分之1左右的间隔设置多个振动膜,因此难以实现小型化。
另外,若利用多个麦克风所取得的声波的差分信号,则在麦克风的制造过程中产生的延迟或增益的偏差有时会对噪音去除精度产生影响。
本发明多个实施方式的目的在于,提供一种具有噪音成分去除功能的语音输入装置及其制造方法以及信息处理系统。
(1)本发明是一种语音输入装置,包括:第一麦克风,其具有第一振动膜,
第二麦克风,其具有第二振动膜,
差分信号生成部,其根据所述第一麦克风所取得的第一电压信号和所述第二麦克风所取得的第二电压信号,生成第一电压信号和第二电压信号的差分信号;
其特征在于,
所述第一以及第二振动膜被配置成噪音强度比小于输入语音强度比,其中,所述噪音强度比表示包含在所述差分信号中的噪音成分的强度相对包含在所述第一或第二电压信号中的所述噪音成分的强度的比例,所述输入语音强度比表示包含在所述差分信号中的输入语音成分的强度相对包含在所述第一或第二电压信号中的所述输入语音成分的强度的比例,
所述差分信号生成部包括:
增益部,其对所述第一麦克风所取得的第一电压信号赋予规定的增益;
差分信号输出部,其接收通过所述增益部赋予了规定增益的第一电压信号以及所述第二麦克风所取得的第二电压信号,生成并输出赋予了规定增益的第一电压信号和第二电压信号的差分信号。
增益部具有对输入信号赋予规定增益的功能,当作为模拟信号进行处理时,可以由模拟放大器电路构成增益部,当作为数字信号进行处理时,可以由数字乘法器构成增益部。
由于制造工序中的电气或机械结构的原因,在麦克风的感度(增益)多发生偏差。因此,有时会产生第一麦克风和所述第二麦克风所输出的电压信号的振幅的偏差(麦克风的增益的偏差),通常会产生±3dB左右的偏差。通过实验确认到:若存在该偏差,则这会成为差动麦克风的远方噪声抑制效果降低的原因。
根据本发明,通过对第一电压信号赋予规定的增益(可以是提高增益的情况,也可以是降低增益的情况),能够校正第一电压信号以及第二电压信号的振幅的偏差(增益的偏差)。也可以校正为:使相对于输入声压的第一电压信号以及第二电压信号的振幅相同,或者使第一电压信号和第二电压信号的振幅差收敛在规定的范围内。由此,能够防止因制造工序中产生的麦克风的个体差所引起的感度偏差而噪声抑制效果降低。
根据该语音输入装置,第一以及第二麦克风(第一以及第二振动膜)被配置成满足规定的条件。由此,可以将表示第一以及第二麦克风所取得的第一以及第二电压信号之差的差分信号视为噪音成分被去除的、表示输入语音的信号。因此,根据本发明,能够提供一种只通过生成差分信号的简单的结构就可实现噪音去除功能的语音输入装置。
此外,在该语音输入装置中,差分信号生成部无需对第一以及第二电压信号进行解析处理(傅立叶解析处理等),就能够生成差分信号。因此,可以减轻差分信号生成部的信号处理负担,或者,能够通过非常简单的电路来实现差分信号生成部。
由此,根据本发明,能够提供可实现小型化、且能够实现高精度的噪音去除功能的语音输入装置。
此外,在该语音输入装置中,可以将第一以及第二振动膜配置成:噪音成分的相位差成分的强度比小于基于输入语音成分的振幅的强度比。
(2)本发明的语音输入装置的特征在于,
所述差分信号生成部包括:
增益部,其根据施加在规定的端子上的电压或在规定的端子上流过的电流,改变放大率,
增益控制部,其对施加在所述规定的端子上的电压或在规定的端子上流过的电流进行控制;
所述增益控制部,包括串联或并联连接有多个电阻的电阻阵列,并切断构成所述电阻阵列的电阻体或导体的一部分,或者,包括至少一个电阻体,并切断该电阻体的一部分,由此能够改变施加在增益部的规定的端子上的电压或在增益部的规定的端子上流过的电流。
可以通过激光来剪切构成电阻阵列的电阻体或导体的一部分,或者,通过施加高电压或者高电流来熔断构成电阻阵列的电阻体或导体的一部分,由此变更电阻值,也可以通过在一个电阻体的一部分上形成切痕来变更电阻值。
检查由在麦克风的制造过程中产生的个体差引起的增益的偏差,并决定第一电压信号的放大率,以消除由该偏差产生的振幅差。而且,切断构成所述电阻阵列的电阻体或导体(例如,熔丝)的一部分,将增益控制部的电阻值设定为适当的值,使得能够向规定的端子供给用于实现所决定的放大率的电压或电流。由此,能够调整增益部的输出和所述第二麦克风所取得的第二电压信号之间的振幅平衡。
(3)本发明的语音输入装置的特征在于,
所述差分信号生成部包括:
振幅差检测部,其接收被输入至所述差分信号输出部的第一电压信号和第二电压信号,并根据接收到的第一电压信号和第二电压信号,检测在生成差分信号时的第一电压信号和第二电压信号之间的振幅差,根据检测结果生成振幅差信号并进行输出;
增益控制部,其根据所述振幅差信号,进行使所述增益部中的放大率变化的控制。
振幅差检测部可以包括:第一振幅检测部,其用于检测增益部的输出信号振幅;第二振幅检测部,其用于检测所述第二麦克风所取得的第二电压信号的信号振幅;振幅差信号生成部,其用于检测通过所述第一振幅检测单元来检测出的振幅信号和通过所述第二振幅检测单元来检测出的振幅信号的差分信号。
例如,作为增益调整用的声源准备测试用的声源,将来自该声源的声音设定为以相同的声压输入至第一麦克风和第二麦克风,监测第一麦克风和第二麦克风接收声音并输出的第一电压信号和第二电压信号的波形(例如,可以利用示波器(Oscilloscope)等进行监测),并变更放大率,以使两者的振幅一致或者振幅差在规定的范围内。
(4)本发明的语音输入装置的特征在于,所述增益控制部控制增益部的放大率,使所述增益部的输出信号和所述第二麦克风所取得的第二电压信号之间的振幅差相对其中任一信号的比例为规定的比例以下,或者得到规定分贝的噪声抑制效果。
例如,可以使振幅差相对于增益部的输出信号或第二电压信号在-3%以上、+3%以下的范围内,也可以使其在-6%以上、+6%以下的范围内。在前者的情况下,对于1kHz的声波,噪声抑制效果为约10分贝,在后者的情况下,噪声抑制效果为约6分贝,能够发挥适当的抑制效果。
或者,也可以对放大进行控制,使得能够得到规定分贝(例如,约10分别)的噪声抑制效果。
(5)本发明的语音输入装置的特征在于,在权利要求3或4中,包括声源部,该声源部设置在离所述第一麦克风和所述第二麦克风等距离的位置,
所述差分信号生成部进行根据来自所述声源部的声音使所述增益部中的放大率变化的控制。
所述差分信号生成部可以根据所述第一麦克风以及所述第二麦克风接收到的来自声源部的声音来进行调整,使得增益部输出和所述第二麦克风所取得的第二电压信号的信号振幅变为相同。
(6)本发明的语音输入装置的特征在于,
包括:
第一麦克风,其具有第一振动膜,
第二麦克风,其具有第二振动膜,
差分信号生成部,其根据所述第一麦克风所取得的第一电压信号和所述第二麦克风所取得的第二电压信号,生成第一电压信号和第二电压信号的差分信号,
声源部,其设置在离所述第一麦克风和所述第二麦克风等距离的位置;
所述差分信号生成部包括:
增益部,其对所述第一麦克风所取得的第一电压信号赋予规定的增益,
振幅差检测部,其接收被输入至所述差分信号输出部的第一电压信号和第二电压信号,并根据接收到的第一电压信号和第二电压信号,检测在生成差分信号时的第一电压信号和第二电压信号之间的振幅差,根据检测结果生成振幅差信号并进行输出,
增益控制部,其根据所述振幅差信号,进行使所述增益部中的放大率变化的控制;
根据来自所述声源部的声音,调整所述增益部中的放大率,使得所述第一电压信号和第二电压信号的振幅变为相同。
根据本发明,能够调整根据使用时的状况(环境或使用年限)等而变化的麦克风的增益偏差。
(7)本发明的语音输入装置的特征在于,所述声源部是用于发出单一频率的声音的声源。
(8)本发明的语音输入装置的特征在于,所述声源部的频率被设定为可听频带外的频率。
若将所述声源部的频率设定为可听频带外的频率,则在用户使用时也不造成障碍的情况下,能够利用声源部来调整输入信号的相位差或延迟差。根据本发明,在使用时能够动态地调整增益,因此能够根据温度变化等周围环境来进行增益调整。
(9)本发明的语音输入装置的特征在于,
所述振幅差检测部包括带通滤波器,该带通滤波器使被输入至差分信号输出部的第一电压信号和第二电压信号的所述单一频率附近的频带通过,
检测通过所述带通滤波器后的所述第一电压信号和所述第二电压信号的振幅差,根据检测结果生成振幅差信号。
根据本发明,能够选择性地捕捉并调整声源部的语音信号,因此能够实现高精度的调整。而且,能够实时或间歇地检测并调整根据使用时的状况(环境或使用年限)等而变化的麦克风的增益偏差。
(10)本发明的语音输入装置的特征在于,所述差分信号生成部包括低通滤波器部,该低通滤波器部用于去除所述差分信号的高频成分。
差动麦克风具有强调(提高增益)声音的高频成分的特性,听觉上,高频的噪声有时会成为刺耳的音质。因此,利用低通滤波器使所述差分信号的高频成分衰减,由此能够使频率特性变得平坦,从而能够防止产生听觉上的不协调感。
(11)本发明的语音输入装置的特征在于,所述低通滤波器部是具有一阶遮断特性的滤波器。
由于差分信号的高频以一阶特性(20dB/dec)上升,因此,若利用具有该逆特性的一阶低通滤波器使高频衰减,则能够使差分信号的频率特性保持平坦,从而能够防止产生听觉上的不协调感。
(12)本发明的语音输入装置的特征在于,所述低通滤波器部的截止频率被设定为1kHz以上且5kHz以下的任意值。
若将低通滤波器部的截止频率设定得低,则声音会变得厚实,若设定得高,则高频噪声会变得刺耳,因此,优选地,根据麦克风之间的距离,将截止频率设定为适当的值。最佳的截止频率会根据麦克风之间的距离而变化,但是,例如,当麦克风之间的距离约为5mm左右时,优选地,将低通滤波器部的截止频率设定为1.5kHz以上且2kHz以下。
(13)本发明的语音输入装置的特征在于,
还包括:
第一AD转换单元,其对所述第一电压信号进行模拟/数字转换,
第二AD转换单元,其对所述第二电压信号进行模拟/数字转换;
所述差分信号生成部根据通过所述第一AD转换单元转换成数字信号的所述第一电压信号以及通过所述第二AD转换单元转换成数字信号的所述第二电压信号,生成第一电压信号和第二电压信号的差分信号。
(14)本发明的语音输入装置的特征在于,
包括:
第一麦克风,其具有第一振动膜,
第二麦克风,其具有第二振动膜,
差分信号生成部,其用于生成差分信号,该差分信号表示所述第一麦克风所取得的第一电压信号和所述第二麦克风所取得的第二电压信号之差;
所述第一以及第二振动膜被配置成噪音强度比小于输入语音强度比,其中,所述噪音强度比表示包含在所述差分信号中的噪音成分的强度相对包含在所述第一或第二电压信号中的所述噪音成分的强度的比例,所述输入语音强度比表示包含在所述差分信号中的输入语音成分的强度相对包含在所述第一或第二电压信号中的所述输入语音成分的强度的比例。
根据该语音输入装置,第一以及第二麦克风(第一以及第二振动膜)被配置成满足规定的条件。由此,能够将表示第一以及第二麦克风所取得的第一以及第二电压信号之差的差分信号视为噪音成分被去除的、表示输入语音的信号。因此,根据本发明,能够提供一种只通过生成差分信号的简单的结构就可以实现噪音去除功能的语音输入装置。
此外,在该语音输入装置中,差分信号生成部无需对第一以及第二电压信号进行解析处理(傅立叶解析处理等),就能够生成差分信号。因此,能够减轻差分信号生成部的信号处理负担,或者,能够通过非常简单的电路实现差分信号生成部。
由此,根据本发明,能够提供可实现小型化且可实现高精度的噪音去除功能的语音输入装置。
此外,在该语音输入装置中,第一以及第二振动膜被配置成:噪音成分的相位差成分的强度比小于基于输入语音成分的振幅的强度比。
(15)本发明的语音输入装置的特征在于,
还包括基部,在该基部的主面上形成有凹部,
所述第一振动膜设置在所述凹部的底面上,
所述第二振动膜设置在所述主面上。
(16)本发明的语音输入装置的特征在于,所述基部被设置成与所述凹部连通的开口配置在比所述主面上的所述第二振动膜的形成区域更靠近所述输入语音的模型声源的位置。
根据该语音输入装置,能够减小向第一以及第二振动膜入射的输入语音的相位偏移。因此,能够生成噪声少的差分信号,从而能够提供具有高精度的噪音去除功能的语音输入装置。
(17)本发明的语音输入装置的特征在于,所述凹部比所述开口和所述第二振动膜的形成区域之间的间隔浅。
(18)本发明的语音输入装置的特征在于,
还包括基部,在该基部的主面上形成有第一凹部和比所述第一凹部浅的第二凹部,
所述第一振动膜设置在所述第一凹部的底面上,
所述第二振动膜设置在所述第二凹部的底面上。
(19)本发明的语音输入装置的特征在于,所述基部被设置成与所述第一凹部连通的第一开口配置在比与所述第二凹部连通的第二开口更靠近所述输入语音的模型声源的位置。
根据该语音输入装置,能够减小向第一以及第二振动膜入射的输入语音的相位偏移。因此,能够生成噪声少的差分信号,从而能够提供具有高精度的噪音去除功能的语音输入装置。
(20)本发明的语音输入装置的特征在于,所述第一凹部和第二凹部的深度差小于所述第一开口和第二开口之间的间隔。
(21)本发明的语音输入装置的特征在于,所述基部被设置成使所述输入语音同时到达第一振动膜和第二振动膜。
由此,能够生成不包含输入语音的相位偏移的差分信号,因此能够提供具有高精度的噪音去除功能的语音输入装置。
(22)本发明的语音输入装置的特征在于,所述第一以及第二振动膜被配置成两者的法线相互平行。
(23)本发明的语音输入装置的特征在于,所述第一以及第二振动膜被配置成两者的法线不在同一直线上。
(24)本发明的语音输入装置的特征在于,所述第一以及第二麦克风被构成为半导体器件。
例如,第一以及第二麦克风可以是硅麦克风(Si麦克风)。另外,第一以及第二麦克风可以形成在一个半导体衬底上。此时,第一以及第二麦克风和差分信号生成部可以形成在一个半导体衬底上。第一以及第二麦克风和差分信号生成部也可以被构成为所谓的微电子机械系统(MEMS:Micro ElectroMechanical Systems)。另外,振动膜可以采用无机压电薄膜或有机压电薄膜,通过压电效果来进行声电变换。
(25)本发明的语音输入装置的特征在于,所述第一振动膜和第二振动膜的中心间距离为5.2mm以下。
此外,第一以及第二振动膜可以被配置成两者的法线相互平行且法线之间的间隔为5.2mm以下。
(26)本发明是一种信息处理系统,其特征在于,包括:
上述任意技术方案中的语音输入装置;以及
解析处理部,其根据所述差分信号,对输入至所述语音输入装置中的语音信息进行解析处理。
若采用该信息处理系统,则根据语音输入装置所取得的差分信号,对语音信息进行解析处理,其中,在所述语音输入装置中,第一以及第二振动膜被配置成满足规定的条件。根据该语音输入装置,差分信号是表示噪音成分被去除的语音成分的信号,因此,通过对该差分信号进行解析处理,能够基于输入语音进行各种信息处理。
本发明的信息处理系统可以是进行语音识别处理、语音认证处理或基于语音的命令生成处理等的系统。
(27)本发明是一种信息处理系统,其特征在于,
包括:
上述任意技术方案中的语音输入装置;以及
主计算机,其根据所述差分信号,对输入至所述语音输入装置中的语音信息进行解析处理;
通过所述通信处理部,经由网络与所述主计算机进行通信处理。
若采用该信息处理系统,则根据语音输入装置所取得的差分信号,对语音信息进行解析处理,其中,在所述语音输入装置中,第一以及第二振动膜被配置成满足规定的条件。根据该语音输入装置,差分信号是表示噪音成分被去除的语音成分的信号,因此,通过对该差分信号进行解析处理,能够基于输入语音进行各种信息处理。
本发明的信息处理系统可以是进行语音识别处理、语音认证处理或基于语音的命令生成处理等的系统。
(28)本发明是一种语音输入装置的制造方法,用于制造具有噪音成分去除功能的语音输入装置,该语音输入装置包括:
第一麦克风,其具有第一振动膜,
第二麦克风,其具有第二振动膜,
差分信号生成部,其用于生成差分信号,该差分信号表示所述第一麦克风所取得的第一电压信号和所述第二麦克风所取得的第二电压信号之差;
其特征在于,包括:
准备表示Δr/λ值和噪音强度比之间的对应关系的数据的步骤,其中,所述Δr/λ值表示所述第一振动膜和第二振动膜的中心间距离Δr与噪音的波长λ的比例,所述噪音强度比表示包含在所述差分信号中的所述噪音成分的强度相对包含在所述第一或第二电压信号中的所述噪音成分的强度的比例;
根据所述数据,设定所述Δr/λ值的步骤;
根据所设定的所述Δr/λ值以及所述噪音的波长,设定所述中心间距离的步骤。
根据本发明,能够提供可实现小型化、且具有高精度的噪音去除功能的语音输入装置的制造方法。
(29)本发明的语音输入装置的制造方法的特征在于,在设定所述Δr/λ值的步骤中,根据所述数据,设定所述Δr/λ值,使得所述噪音强度比小于输入语音强度比,其中,所述输入语音强度比表示包含在所述差分信号中的输入语音成分的强度相对包含在所述第一或第二电压信号中的所述输入语音成分的强度的比例。
(30)本发明的语音输入装置的制造方法的特征在于,所述输入语音强度比是所述输入语音的振幅成分的强度比。
(31)本发明的语音输入装置的制造方法的特征在于,所述噪音强度比是基于所述噪音成分的相位差的强度比。
(32)本发明的语音输入装置的制造方法的特征在于,
所述语音输入装置的差分信号生成部包括:
增益部,其根据施加在规定的端子上的电压或在规定的端子上流过的电流,对所述第一麦克风所取得的第一电压信号赋予规定的增益,
增益控制部,其对施加在所述规定的端子上的电压或在规定的端子上流过的电流进行控制,
差分信号输出部,其接收通过所述增益部赋予了规定增益的第一电压信号以及所述第二麦克风所取得的第二电压信号,生成赋予了规定增益的第一电压信号和第二电压信号的差分信号并进行输出;
所述语音输入装置的制造方法包括下述任一步骤:
将所述增益控制部构成为包括串联或并联连接有多个电阻的电阻阵列,并切断构成所述电阻阵列的电阻体或导体的一部分的步骤;
将所述增益控制部构成为包括至少一个电阻体,并切断该电阻体的一部分的步骤。
(33)本发明的语音输入装置的制造方法的特征在于,
在离所述第一麦克风和所述第二麦克风等距离的位置设置声源,
根据来自所述声源部的声音,判断第一麦克风和所述第二麦克风的振幅差,并切断构成所述电阻阵列的电阻体或导体的一部分,或者切断所述至少一个电阻体的一部分,使其变为使该振幅差在规定的范围内的电阻值。
具体实施方式
下面,参照附图对应用本发明的实施方式进行说明。但是,本发明并不限定于以下实施方式。另外,本发明包括以下内容的自由组合。
1.第一实施方式的语音输入装置的结构
首先,参照图1~图3,对应用本发明的实施方式的语音输入装置1的结构进行说明。此外,以下所说明的语音输入装置1是近讲式的语音输入装置,例如能够应用于移动电话机及无线电收发两用机(transceiver)等语音通信设备或利用了对所输入的语音进行解析的技术的信息处理系统(语音认证系统、语音识别系统、命令生成系统、电子辞典、翻译机、语音输入方式的遥控器等),或者能够应用于录音设备、放大系统(喇叭)、麦克风系统等。
本实施方式的语音输入装置包括具有第一振动膜12的第一麦克风10以及具有第二振动膜22的第二麦克风20。在此,麦克风是指将音响信号变换为电信号的电声变换器。第一以及第二麦克风10、20也可以分别是将第一以及第二振动膜12、22(振动板)的振动输出为电压信号的变换器。
在本实施方式的语音输入装置中,第一麦克风10生成第一电压信号。另外,第二麦克风20生成第二电压信号。即,可以分别将第一以及第二麦克风10、20所生成的电压信号称为第一以及第二电压信号。
关于第一以及第二麦克风10、20的机构没有特别的限定。在图2中,作为可适用于第一以及第二麦克风10、20的麦克风的一例,示出了电容式麦克风100的结构。电容式麦克风100具有振动膜102。振动膜102是接收声波就振动的膜(薄膜),具有导电性,并形成电极的一端。电容式麦克风100还具有电极104。电极104配置成与振动膜102相对。由此,振动膜102和电极104形成电容。当声波入射到电容式麦克风100中时,振动膜102振动以使振动膜102和电极104之间的间隔发生变化,从而使振动膜102和电极104之间的静电电容发生变化。通过将该静电电容的变化例如输出为电压变化,能够将向电容式麦克风100入射的声波变换为电信号。此外,在电容式麦克风100中,电极104也可以具有不受声波影响的结构。例如,电极104也可以具有网状(mesh)结构。
但是,可适用于本发明的麦克风并不限定于电容式麦克风,而可以应用已公知的任何麦克风。例如,作为第一以及第二麦克风10、20,也可以应用动态式(dynamic式)、电磁式(magnetic式)、压电式(crystal式)等麦克风。
第一以及第二麦克风10、20也可以是由硅构成第一以及第二振动膜12、22的硅麦克风(Si麦克风)。通过利用硅麦克风,能够实现第一以及第二麦克风10、20的小型化以及高性能化。此时,第一以及第二麦克风10、20可以构成为一个集成电路装置。即,第一以及第二麦克风10、20可以形成在一个半导体衬底上。此时,也可以将后述的差分信号生成部30形成在同一个半导体衬底上。即,第一以及第二麦克风10、20可以构成为所谓的微电子机械系统(MEMS:Micro Electro Mechanical Systems)。其中,也可以将第一麦克风10和第二麦克风20构成为各自独立的硅麦克风。
在本实施方式的语音输入装置中,如后所述,利用表示第一以及第二电压信号之差的差分信号,实现噪音成分去除功能。为了实现该功能,使第一以及第二麦克风(第一以及第二振动膜12、22)的配置满足一定的条件。关于第一以及第二振动膜12、22应满足的条件,将在后面叙述其细节,但在本实施方式中,第一以及第二振动膜12、22(第一以及第二麦克风10、20)被配置成噪音强度比小于输入语音强度比。由此,能够将差分信号视为表示噪音成分被去除的语音成分的信号。第一以及第二振动膜12、22例如也可以被配置成中心间距离为5.2mm以下。
此外,在本实施方式的语音输入装置中,并未特别限定第一以及第二振动膜12、22的朝向。第一以及第二振动膜12、22可以被配置成两者的法线平行。此时,第一以及第二振动膜12、22可以被配置成两者的法线不在同一直线上。例如,第一以及第二振动膜12、22可以拉开间隔配置在未图示的基部(例如,电路基板)的表面上。或者,第一以及第二振动膜12、22也可以被配置成在法线方向上相互错位。然而,第一以及第二振动膜12、22也可以被配置成两者的法线不平行。第一以及第二振动膜12、22也可以被配置成两者的法线垂直。
而且,本实施方式的语音输入装置具有差分信号生成部30。差分信号生成部30生成差分信号,所述差分信号表示第一麦克风10所取得的第一电压信号和第二麦克风20所取得的第二电压信号之差(电压差)。在差分信号生成部30中,无需对第一以及第二电压信号进行例如傅立叶解析等解析处理,就可进行用于生成在时间区域上表示两者之差的差分信号的处理。差分信号生成部30的功能可以通过专用的硬件电路(差分信号生成电路)来实现,也可以通过CPU等的信号处理来实现。
本实施方式的语音输入装置还可以包括增益部,该增益部用于放大(意味着包括提高增益的情况和降低增益的情况)差分信号。可以通过一个控制电路来实现差分信号生成部30和增益部。但是,本实施方式的语音输入装置也可以形成为在内部不具有增益部的结构。
图3示出了可实现差分信号生成部30和增益部的电路的一例。若采用图3所示的电路,则在接收第一以及第二电压信号后,输出将用于表示其差的差分信号放大了10倍的信号。但是,用于实现差分信号生成部30以及增益部的电路结构并不限定于此。
本实施方式的语音输入装置还可以包括框体40。此时,语音输入装置的外形可以由框体40构成。可以对框体40设定基本姿势,由此能够限制输入语音的前进路径。第一以及第二振动膜12、22也可以形成在框体40的表面上。或者,第一以及第二振动膜12、22也可以与形成在框体40上的开口(语音入射口)相对地配置在框体40的内部。而且,第一以及第二振动膜12、22也可以被配置成离声源(入射语音的模型声源)的距离互不相同。例如,如图1所示,可以对框体40设定使输入语音的前进路径沿着框体40表面延伸的基本姿势。而且,可以沿着输入语音的前进路径配置第一以及第二振动膜12、22。而且,可以将配置在输入语音的前进路径的上游侧的振动膜作为第一振动膜12,将配置在下游侧的振动膜作为第二振动膜22。
本实施方式的语音输入装置还可以包括运算处理部50。运算处理部50基于差分信号生成部30所生成的差分信号,进行各种运算处理。运算处理部50也可以对差分信号进行解析处理。运算处理部50也可以通过解析差分信号来进行用于确定发出了输入语音的人的处理(所谓的语音认证处理)。或者,运算处理部50也可以通过对差分信号进行解析处理来进行用于确定输入语音的内容的处理(所谓的语音识别处理)。运算处理部50也可以基于输入语音来进行用于生成各种命令的处理。运算处理部50也可以进行用于放大差分信号的处理。另外,运算处理部50也可以控制后述的通信处理部60的动作。另外,运算处理部50也可以通过CPU、存储器的信号处理来实现上述各功能。
运算处理部50既可以配置在框体40的内部,也可以配置在框体40的外部。当运算处理部50配置在框体40的外部时,运算处理部50可以通过后述的通信处理部60来取得差分信号。
本实施方式的语音输入装置还可以包括通信处理部60。通信处理部60用于控制语音输入装置和其它终端(移动电话终端、主计算机等)的通信。通信处理部60可以具有通过网络向其它终端发送信号(差分信号)的功能。另外,通信处理部60也可以具有通过网络从其它终端接收信号的功能。而且,例如,也可以在主计算机中对通过通信处理部60来取得的差分信号进行解析处理,以此进行语音识别处理或语音认证处理、命令生成处理、数据存储处理等各种信息处理。即,语音输入装置可以通过与其它终端的协作来构成信息处理系统。换言之,可以将语音输入装置视为用于构筑信息处理系统的信息输入终端。但是,语音输入装置也可以形成为不具有通信处理部60的结构。
本实施方式的语音输入装置还可以具有显示面板等显示装置、扬声器等语音输入装置。另外,本实施方式的语音输入装置还可以包括用于输入操作信息的操作键。
本实施方式的语音输入装置可以具有以上结构。若采用该语音输入装置,则通过输出第一以及第二电压信号之差的简单的处理,能够生成表示噪音成分被去除的语音成分的信号(电压信号)。因此,根据本发明,能够提供可实现小型化、且具有优异的噪音去除功能的语音输入装置。此外,关于其原理,在后面进行详细的叙述。
2.噪音去除功能
下面,对本实施方式的语音输入装置所采用的语音去除原理以及用于实现该原理的条件进行说明。
(1)噪音去除原理
首先,对本实施方式的语音输入装置的噪音去除原理进行说明。
声波随着在介质中前进而衰减,而且其声压(声波的强度/振幅)下降。由于声压与离声源的距离成反比,因此可以将声压P和离声源的距离r之间的关系表示成:
此外,在式(1)中,k是比例常数。图4示出了表示式(1)的曲线图,从本图可知,声压(声波的振幅)在离声源近的位置(曲线图的左侧)急剧衰减,而且越远离声源越平稳地衰减。在本实施方式的语音输入装置中,利用该衰减特性来去除噪音成分。
即,在近讲式的语音输入装置中,用户在比噪音的声源更接近第一以及第二麦克风10、20(第一以及第二振动膜12、22)的位置发出语音。因此,在第一以及第二振动膜12、22之间,用户的语音大幅度衰减,所以在第一以及第二电压信号所包含的用户语音的强度之间出现差异。相反地,噪音成分与用户的语音相比其声源较远,因此在第一以及第二振动膜12、22之间几乎不发生衰减。因此,可以认为在第一以及第二电压信号所包含的噪音的强度中不出现差异。从上述可知,若检测出第一以及第二电压信号之差,则能够消除噪音,因此能够取得不含有噪音成分的、仅表示用户的语音成分的电压信号(差分信号)。即,能够将差分信号视为表示噪音成分被去除的用户语音的信号。
其中,声波具有相位成分。因此,要实现可靠性高的噪音去除功能,则需要考虑在第一以及第二电压信号中含有的语音成分以及噪音成分的相位差。
下面,说明语音输入装置为了通过生成差分信号来实现噪音去除功能而应满足的具体条件。
(2)语音输入装置应满足的具体条件
如前面所述,本实施方式的语音输入装置将表示第一以及第二电压信号的差分的差分信号视为不包含噪音的输入语音信号。在采用该语音输入装置的情况下,若包含在差分信号中的噪音成分小于包含在第一或第二电压信号中的噪音成分,则能够评价为实现了噪音去除功能。详细地说,若表示包含在差分信号中的噪音成分的强度相对包含在第一或第二电压信号中的噪音成分的强度的比的噪音强度比,小于表示包含在差分信号中的语音成分的强度相对包含在第一或第二电压信号中的语音成分的强度的比的语音强度比,则能够评价为实现了该噪音去除功能。
下面,说明语音输入装置(第一以及第二振动膜12、22)为了实现该噪音去除功能而应满足的具体条件。
首先,研究向第一以及第二麦克风10、20(第一以及第二振动膜12、22)入射的语音的声压。设从输入语音(用户的语音)的声源到第一振动膜12的距离为R,而且忽略相位差,那么可以将第一以及第二麦克风10、20可取得的输入语音的声压(强度)P(S1)以及P(S2)表示为:
因此,可以将语音强度比ρ(p)表示为:
所述语音强度比ρ(p)是指,表示包含在差分信号中的输入语音成分的强度相对忽略了输入语音的相位差时的第一麦克风10所取得的输入语音成分的强度的比例。
在此,本实施方式的语音输入装置是近讲式的语音输入装置,可以认为Δr足够小于R。
因此,可以将上述式(4)变形为:
即,从上述可知,在忽略了输入语音的相位差的情况下,能够将语音强度比表示为式(A)。
然而,当考虑输入语音的相位差时,可以将用户语音的声压Q(S1)以及Q(S2)表示为:
此外,在式中,α是相位差。
此时,语音强度比ρ(S)为:
当考虑式(7)时,可以将语音强度比ρ(S)的大小表示为:
在式(8)中,sinωt-sin(ωt-α)项表示相位成分的强度比,Δr/Rsinωt项表示振幅成分的强度比。即使是输入语音成分,但相位差成分对于振幅成分来说是噪声,因此为了高精度地提取输入语音(用户语音),必须使相位成分的强度比足够小于振幅成分的强度比。即,sinωt-sin(ωt-α)和Δr/Rsinωt需要满足如下关系:
其中,
因此,可以将上述式(B)表示为:
从上述可知,若考虑式(10)的振幅成分,则本实施方式的语音输入装置需要满足如下公式:
此外,如上所述,可以认为Δr足够小于R,所以可以认为sin(α/2)足够小,因此可以将其近似为:
因此,可以将式(C)变形为:
另外,若将作为相位差的α和Δr之间的关系表示为如下公式:
则,可以将式(D)变形为:
即,在本实施方式中,为了高精度地提取输入语音(用户语音),需要将语音输入装置制造成满足式(E)所示的关系。
接着,研究向第一以及第二麦克风10、20(第一以及第二振动膜12、22)入射的噪音的声压。
若将第一以及第二麦克风所取得的噪音成分的振幅设为A、A′,则可将考虑了相位差成分的噪音的声压Q(N1)以及Q(N2)表示为:
可以将噪音强度比ρ(N)表示为:
所述噪音强度比ρ(N)是指,表示包含在差分信号中的噪音成分的强度相对第一麦克风10所取得的噪音成分的强度的比例。
此外,如前面所述,第一以及第二麦克风所取得的噪音成分的振幅(强度)大致相同,所以可以视为A=A′。因此,可以将上述式(15)变形为:
而且,可以将噪音强度比的大小表示为:
在此,若考虑上述式(9),则可以将式(17)变形为:
然后,若考虑式(11),则可以将式(18)变形为:
ρ(N)=α (19)
在此,若参照式(D),则可以将噪音强度比表示为:
此外,如式(A)所示,Δr/R是输入语音(用户语音)的振幅成分的强度比。
从式(F)可知,在该语音输入装置中,噪音强度比小于输入语音的强度比Δr/R。
从上述可知,在设计成输入语音的相位成分的强度比小于振幅成分的强度比的语音输入装置(参照式(B))中,噪音强度比小于输入语音强度比(参照式(F))。相反地,若采用设计成噪音强度比小于输入语音强度比的语音输入装置,则能够实现精度高的噪音去除功能。
即,若采用将第一以及第二振动膜12、22(第一以及第二麦克风10、20)配置成噪音强度比小于输入语音强度比的本实施方式的语音输入装置,则能够实现精度高的噪音去除功能。
3.语音输入装置的制造方法
下面,对本实施方式的语音输入装置的制造方法进行说明。在本实施方式中,利用表示Δr/λ的值和噪音强度比(噪音的相位成分的强度比)之间的对应关系的数据来制造语音输入装置,其中,所述Δr/λ的值表示第一以及第二振动膜12、22的中心间距离Δr和噪音的波长λ的比率。
可以将噪音的相位成分的强度比表示为上述式(18)。因此,可以将噪音的相位成分的强度比的分贝值表示为:
而且,对式(20)的α代入各值,则能够明确相位差α和噪音的相位成分的强度比之间的对应关系。图5示出了表示横轴取α/2π、纵轴取噪音的相位成分的强度比(分贝值)时的相位差和强度比之间的对应关系的数据的一例。
此外,如式(12)所示,能够利用距离Δr和波长λ的比Δr/λ的函数来表示相位差α,所以可以将图5的横轴视为Δr/λ。即,可以说图5是用于表示噪音的相位成分的强度比和Δr/λ之间的对应关系的数据。
在本实施方式中,利用该数据来制造语音输入装置。图6是用于说明利用该数据来制造语音输入装置的步骤的流程图。
首先,准备表示噪音的强度比(噪音的相位成分的强度比)和Δr/λ之间的对应关系的数据(参照图5)(步骤S10)。
接着,根据用途,设定噪音的强度比(步骤S12)。此外,在本实施方式中,需要以使噪音的强度下降的方式设定噪音的强度比。因此,在本步骤中,将噪音的强度比设定为0dB以下。
接着,根据该数据,推导与噪音的强度比对应的Δr/λ的值(步骤S14)。
然后,通过对λ代入主要噪音的波长,推导Δr/λ应满足的条件(步骤S16)。
作为具体例,考虑制造如下的语音输入装置的情况:在该语音输入装置中,在主要噪音为1kHz、其波长为0.347m的环境下,噪音的强度下降20dB。
首先,作为必要条件,研究使噪音的强度比变为0dB以下的条件。参照图5可知,要使噪音的强度比变为0dB以下,则将Δr/λ的值设为0.16以下即可。即,将Δr值设为55.46mm以下即可,这就是该语音输入装置的必要条件。
接着,考虑用于使1kHz的噪音的强度下降20dB的条件。参照图5可知,要使噪音的强度下降20dB,只要将Δr/λ的值设为0.015即可。而且,若设λ=0.347m,则当Δr的值为5.20mm以下时满足该条件。即,若将Δr设定为约5.2mm以下,则能够制造具有噪音去除功能的近讲式的语音输入装置。
此外,本实施方式的语音输入装置是近讲式的语音输入装置,而且用户语音的声源和第一或第二振动膜12、22之间的间隔通常为5cm以下。另外,可以通过对框体40的设计,能够控制用户语音的声源和第一以及第二振动膜12、22之间的间隔。因此,输入语音(用户语音)的强度比Δr/λ的值大于0.1(噪音的强度比),所以能够实现噪音去除功能。
此外,通常,噪音并不限定于单一频率。但是,频率比设想为主要噪音的噪音低的噪音,其波长比该主要噪音更长,因此Δr/λ的值变小,所以能够被该语音输入装置去除。另外,声波若频率越高则能量的衰减就越快。因此,频率比设想为主要噪音的噪音高的噪音比该主要噪音更快速地衰减,因此能够忽略对语音输入装置所带来的影响。从上述可知,即使在存在频率与设想为主要噪音的噪音不同的噪音的环境下,本实施方式的语音输入装置也能够发挥优异的噪音去除功能。
另外,在本实施方式中,从式(12)也可以知道,本实施方式的前提为,噪音沿着连接第一以及第二振动膜12、22的直线上方入射。该噪音是使第一以及第二振动膜12、22的外观上的间隔变得最大的噪音,而且是在现实的使用环境下使相位差变得最大的噪音。即,本实施方式的语音输入装置具有能够去除相位差最大的噪音的结构。因此,若采用本实施方式的语音输入装置,则能够去除从所有方向入射的噪音。
4.效果
下面,对本实施方式的语音输入装置的效果进行说明。
如前面所述,若采用本实施方式的语音输入装置,则仅通过生成差分信号就能够取得噪音成分被去除的语音成分,所述差分信号表示第一以及第二麦克风10、20所取得的电压信号的差分。即,在该语音输入装置中,无需进行复杂的解析运算处理就能够实现噪音去除功能。因此,根据本实施方式,能够提供以简单的结构就能够实现精度高的噪音去除功能的语音输入装置。
另外,在该语音输入装置中,使基于相位差的噪音的强度比小于输入语音的强度比,由此实现噪音去除功能。然而,基于相位差的噪音强度比会根据第一以及第二振动膜12、22的排列方向和噪音的入射方向而变化。即,相对于噪音的第一以及第二振动膜12、22之间的间隔(外观上的间隔)越宽,则噪音的相位差就越大,使基于相位差的噪音强度比变大。然而,在本实施方式中,从式(12)也可知,语音输入装置具有能够去除使第一以及第二振动膜12、22的外观上的间隔变得最宽的噪音的结构。换言之,在本实施方式中,将第一以及第二振动膜12、22配置成能够去除使基于相位差的噪音强度比变得最大地入射的噪音。因此,若采用该语音输入装置,就能够去除从全方位入射的噪音。即,根据本发明,能够提供可去除从全方位入射的噪音的语音输入装置。
此外,若采用该语音输入装置,还能够去除被墙壁等反射后入射到语音输入装置中的用户语音成分。详细地说,可以认为被墙壁等反射的用户语音的声源比通常的用户语音的声源远,并且因反射而丢失了大量的能量,因此与噪音成分同样,声压不会在第一以及第二振动膜12、22之间大幅度衰减。因此,若采用该语音输入装置,则与噪音同样地,被墙壁等反射后入射到语音输入装置中的用户语音成分(作为噪音的一种)也被去除。
而且,若利用该语音输入装置,就能够取得不包含噪音的表示输入语音的信号。因此,通过利用该语音输入装置,能够实现精度高的语音识别、语音认证或命令生成处理。
另外,若将该语音输入装置适用于麦克风系统,则从扬声器输出的用户的声音也作为噪音而被去除。因此,能够提供不易发生振鸣(howling)的麦克风系统。
5.第二实施方式的语音输入装置
接着,参照图7,对应用了本发明的第二实施方式的语音输入装置进行说明。
本实施方式的语音输入装置包括基部70。在基部70的主面72上形成有凹部74。而且,在本实施方式的语音输入装置中,在凹部74的底面75上配置有第一振动膜12(第一麦克风10),在基部70的主面72上配置有第二振动膜22(第二麦克风20)。此外,凹部74可以与主面72垂直地延伸,凹部74的底面75可以是与主面72平行的面。底面75也可以是与凹部74垂直的面。另外,凹部74也可以具有与第一振动膜12相同的外形。
在本实施方式中,凹部74可以比区域76和开口78之间的间隔更浅。即,若将凹部74的深度设为d,将区域76和开口78之间的间隔设为ΔG,则基部70可以满足d≤ΔG。基部70也可以满足2d=ΔG。此外,ΔG可以是5.2mm以下。或者,基部70也可以具有连接第一以及第二振动膜12、22的中心的直线距离为5.2mm以下的结构。
基部70被设置成:与凹部74连通的开口78配置在比主面72上配置第二振动膜22的区域76更靠近输入语音的声源的位置。基部70可以被设置成输入语音同时到达第一以及第二振动膜12、22。例如,基部70可以被配置成使输入语音的声源(模型声源)和第一振动膜12之间的间隔与模型声源和第二振动膜22之间的间隔相同。基部70也可以被设置在设定有满足上述条件的基本姿势的框体内。
若采用本实施方式的语音输入装置,则能够减少向第一以及第二振动膜12、22入射的输入语音(用户语音)的入射时间之差。即,由于能够以不包含输入语音的相位差成分的方式生成差分信号,所以能够高精度地提取输入语音的振幅成分。
此外,声波在凹部74内不扩散,因此声波的振幅几乎不衰减。因此,在该语音输入装置中,可以认为使第一振动膜12振动的输入语音的强度(振幅)与开口78处的输入语音的强度相同。由此,即使在语音输入装置具有使输入语音同时到达第一以及第二振动膜12、22的情况下,也会在使第一以及第二振动膜12、22振动的输入语音的强度上出现差异。因此,通过取得表示第一以及第二电压信号之差的差分信号,能够提取输入语音。
综上所述,若采用该语音输入装置,则能够以不包含输入语音的相位差成分的噪声的方式取得输入语音的振幅成分(差分信号)。因此,能够实现精度高的噪音去除功能。
此外,通过将凹部74的深度设为ΔG以下(5.2mm以下),能够将凹部74的共振频率设定得较高,因此能够防止在凹部74处产生共振噪声。
图8示出了本实施方式的语音输入装置的变形例。
本实施方式的语音输入装置包括基部80。在基部80的主面82上,形成有第一凹部84以及比第一凹部84浅的第二凹部86。第一以及第二凹部84、86的深度之差Δd可以小于与第一凹部84连通的第一开口85和与第二凹部86连通的第二开口87之间的间隔ΔG。而且,第一振动膜12配置在第一凹部84的底面,第二振动膜22配置在第二凹部86的底面。
即使采用该语音输入装置,也可以发挥与上述同样的效果,因此能够实现高精度的噪音去除功能。
最后,在图9~图11中,作为本发明实施方式的语音输入装置的例子,分别表示移动电话机300、麦克风(麦克风系统)400以及遥控器500。另外,图12示出了包括作为信息输入终端的语音输入装置602和主计算机604的信息处理系统600的概略图。
6.第三实施方式的语音输入装置的结构
图13是第三实施方式的语音输入装置的结构的一例的示意图。
第三实施方式的语音输入装置700包括具有第一振动膜的第一麦克风710-1。另外,第三实施方式的语音输入装置700包括具有第二振动膜的第二麦克风710-2。
第一麦克风710-1的第一振动膜以及第二麦克风710-2的第一振动膜被配置成噪音强度比小于输入语音强度比,其中,所述噪音强度比表示包含在差分信号742中的噪音成分的强度相对包含在所述第一或第二电压信号712-1、712-2中的所述噪音成分的强度的比例,所述输入语音强度比表示包含在所述差分信号742中的输入语音成分的强度相对包含在所述第一或第二电压信号中的所述输入语音成分的强度的比例。
另外,具有第一振动膜的第一麦克风710-1和具有第二振动膜的第二麦克风710-2,也可以具有如图1~图8所述的结构。
第三实施方式的语音输入装置700包括差分信号生成部720,该差分信号生成部720根据所述第一麦克风710-1所取得的第一电压信号712-1和所述第二麦克风所取得的第二电压信号712-2,生成第一电压信号712-1和第二电压信号712-2的差分信号742。
另外,差分信号生成部720包括延迟部730。延迟部730对在所述第一麦克风所取得的第一电压信号712-1以及所述第二麦克风所取得的第二电压信号712-2中的至少一个电压信号赋予规定延迟后输出。
另外,差分信号生成部720包括差分信号输出部740。差分信号输出部740接收通过所述延迟部对在所述第一麦克风所取得的第一电压信号以及所述第二麦克风所取得的第二电压信号中的至少一个电压信号赋予了延迟的信号,生成第一电压信号和第二电压信号的差分信号并进行输出。
延迟部730可以设置对第一麦克风所取得的第一电压信号712-1赋予规定延迟后输出的第一延迟部732-1和对第二电压信号712-2赋予规定延迟后输出的第二延迟部782-2中的某一个,使某一个电压信号发生延迟,从而生成差分信号。也可以设置第一延迟部732-1和第二延迟部732-2两者,使第一电压信号712-1和第二电压信号712-2两者发生延迟,从而生成差分信号。当设置第一延迟部732-1和第二延迟部732-2的两者时,可以将其中某一个延迟部作为赋予固定延迟的延迟部,将另一个延迟部作为能够可变地调整延迟的可变延迟部。
由此,通过对第一电压信号712-1以及第二电压信号712-2中的至少一个电压信号赋予规定延迟,能够校正由制造麦克风时的个体差引起的、第一电压信号以及第二电压信号的延迟的偏差,因此能够防止因第一电压信号以及第二电压信号的延迟的偏差而导致的噪声抑制效果下降。
图14是第三实施方式的语音输入装置的结构的一例的示意图。
本实施方式的差分信号生成部720可以包括延迟控制部734。延迟控制部734进行使延迟部(在此为第一延迟部732-1)中的延迟量变化的控制。也可以通过延迟控制部734动态或者静态地控制延迟部(在此为第一延迟部732-1)的延迟量,由此调整延迟部输出S1和所述第二麦克风所取得的第二电压信号712-2之间的信号延迟平衡。
图15是延迟部和延迟控制部的具体结构的一例的示意图。例如,可以由群延迟滤波器等模拟滤波器构成延迟部(在此为第一延迟部732-1)。例如,延迟控制部734可以根据群延迟滤波器732-1的控制端子736-GND之间的电压或流过控制端子736-GND之间的电流量,动态或静态地控制群延迟滤波器的延迟量。
图16A(图16B)是静态地控制群延迟滤波器的延迟量的结构的一例。
例如,如图16A所示,可以包括串联连接有多个电阻体(r)的电阻阵列,并通过该电阻阵列向延迟部的规定的端子(图15的控制端子734)供给规定大小的电流。在此,在制造过程中,可以根据规定电流的大小,利用激光来剪切构成所述电阻阵列的电阻体(r)或导体(738的F),或者,通过施加高电压或者高电流来熔断构成所述电阻阵列的电阻体(r)或导体(738的F)。
另外,例如,如图16B所示,可以包括并联连接有多个电阻体(r)的电阻阵列,并通过该电阻阵列向延迟部的规定的端子(图15的控制端子734)供给规定大小的电流。在此,在制造过程中,可以根据规定电流的大小,利用激光来剪切构成所述电阻阵列的电阻体(r)或导体(F),或者,通过施加高电压或者高电流来熔断构成所述电阻阵列的电阻体(r)或导体(F)。
在此,根据在制造过程中产生的延迟的偏差,将流过延迟部的规定的端子的电流的大小设定为能够消除该偏差的值即可。如图16A(图16B)所示,通过利用串联或并联连接有多个电阻体(r)的电阻阵列,能够制作成与在制造过程中产生的延迟的偏差对应的电阻值,发挥延迟控制部的功能,该延迟控制部与规定的端子连接,供给用于控制所述延迟部的延迟量的电流。
此外,在上述实施方式中,举例说明了多个电阻体(r)通过熔丝(F)来连接在一起的结构,但是并不限定于此。也可以采用多个电阻(r)不通过熔丝(F)而直接串联或并联连接的结构,此时,可以切断至少一个电阻。
另外,也可以采用所谓的激光微调来调整电阻值的结构,例如,如图40所示,由一个电阻体构成图33的电阻R1或R2,并切断电阻体的一部分的结构。
图17是第三实施方式的语音输入装置的结构的一例的示意图。
差分信号生成部720可以包括相位差检测部750。相位差检测部750接收成为差分信号输出部740的输入的第一电压信号(S1)和第二电压信号(S2),并根据接收到的第一电压信号(S1)和第二电压信号(S2),检测生成差分信号742时的第一电压信号(S1)和第二电压信号(S2)的相位差,并根据检测结果,生成并输出相位差信号(FD)。
延迟控制部734根据相位差信号(FD),可以改变延迟部(在此为第一延迟部732-1)中的延迟量。
另外,差分信号生成部720可以包括增益部760。增益部760对在第一麦克风710-1所取得的第一电压信号以及所述第二麦克风710-2所取得的第二电压信号中的至少一个电压信号赋予规定增益后输出。
差分信号输出部740可以通过接收由增益部760对在第一麦克风710-1所取得的第一电压信号以及所述第二麦克风710-2所取得的第二电压信号中的至少一个电压信号赋予了增益的信号(S2),生成并输出第一电压信号(S1)和第二电压信号(S2)的差分信号。
例如,相位差检测部740可以对延迟部(在此为第一延迟部732-1)输出S1和增益部输出S2的相位差进行运算后输出相位差信号FD,延迟控制部734可以根据相位差信号FD的极性,使延迟部(在此为第一延迟部732-1)的延迟量动态地发生变化。
第一延迟部732-1接收第一麦克风710-1所取得的第一电压信号712-1,输出根据延迟控制信号(例如,规定电流)735来赋予了规定的延迟的电压信号S1。增益部760接收第二麦克风710-2所取得的第二电压信号712-2,输出赋予了规定的增益的电压信号S2。相位差信号输出部754接收第一延迟部732-1所输出的电压信号S1和增益部760所输出的电压信号S2,输出相位差信号FD。延迟控制部734接收相位差信号输出部754所输出的相位差信号FD,输出延迟控制信号(例如,规定电流)735。可以通过该延迟控制信号(例如,规定电流)735来控制第一延迟部732-1的延迟量,由此对第一延迟部732-1的延迟量进行反馈控制。
图18是第三实施方式的语音输入装置的结构的一例的示意图。
相位差检测部720可以包括第一2值化部752-1。第一2值化部752-1以规定电平(level)对接收到的所述第一电压信号S1进行2值化,从而转换为第一数字信号D1。
另外,相位差检测部720可以包括第二2值化部752-2。第二2值化部752-2以规定电平对接收到的所述第二电压信号S2进行2值化,从而转换为第二数字信号D2。
相位差检测部720包括相位差信号输出部754。相位差信号输出部754计算第一数字信号D1和所述第二数字信号D2之间的相位差,从而输出相位差信号FD。
第一延迟部732-1接收第一麦克风710-1所取得的第一电压信号712-1,并输出根据延迟控制信号(例如,规定电流)735来赋予了规定的延迟的信号S1。增益部760接收第二麦克风710-2所取得的第二电压信号712-2,并输出赋予了规定的增益的信号S2。第一2值化部752-1接收第一延迟部732-1所输出的第一电压信号S1,并输出以规定电平进行了2值化的第一数字信号D1。第二2值化部752-2接收增益部760所输出的第二电压信号S2,并输出以规定电平进行了2值化的第二数字信号D2。相位差信号输出部754接收第一2值化部752-1所输出的第一数字信号D1和第二2值化部752-2所输出的第二数字信号D2,并输出相位差信号FD。延迟控制部734接收相位差信号输出部754所输出的相位差信号FD,输出延迟控制信号(例如,规定电流)735。可以通过该延迟控制信号(例如,规定电流)735来控制第一延迟部732-1的延迟量,由此进行
对第一延迟部732-1进行延迟量的反馈控制。
图19是相位差检测部的时序图。S1是第一延迟部732-1所输出的电压信号,S2是增益部所输出的电压信号。电压信号S2相对于电压信号S1,相位延迟了Δφ。
D1是电压信号S1的2值化信号,D2是电压信号S2的2值化信号。例如,D1或D2的信号是,在使电压信号S1或S2通过高通滤波器后,通过比较器(comparator)电路进行2值化所得到的信号。
FD是根据2值化信号D1和2值化信号D2所生成的相位差信号。例如,如图19所示,当第一电压信号的相位比第二电压信号的相位超前时,可以对各周期分别生成与超前相位差对应的脉冲宽度的正脉冲P,当第一电压信号的相位比第二电压信号的相位滞后时,可以对各周期分别生成与滞后相位差对应的脉冲宽度的负脉冲。
图21是第三实施方式的语音输入装置的结构的一例的示意图。
相位差检测部750包括第一带通滤波器756-1。第一带通滤波器756-1是,在输入所接收到的第一电压信号S1后,使规定的单一频率的信号K1通过的带通滤波器。
相位差检测部750包括第二带通滤波器756-2。第二带通滤波器756-2是,在输入所接收到的第二电压信号S2后,使规定的单一频率的信号K2通过的带通滤波器。
相位差检测部750可以根据通过了第一带通滤波器756-1以及第二带通滤波器756-2后的第一电压信号K1和第二电压信号K2来检测相位差。
例如,如图20所示,将声源部770配置在离第一麦克风710-1和第二麦克风710-2等距离的位置,生成单一频率的声音并接收该声音,在利用第一带通滤波器756-1和第二带通滤波器756-2来切断除了该单一频率的声音以外的频率的声音之后,检测相位差,由此能够改善相位比较信号的SN比,从而能够高精度地检测相位差或延迟量。
此外,即使在语音输入装置本身不具有声源部770的情况下,也可以在测试时将测试用声源临时设置在语音输入装置的附近,并将测试用声源设定为使声音以相同相位输入至第一麦克风和第二麦克风,并通过第一麦克风和第二麦克风接收声音,对所输出的第一电压信号和第二电压信号的波形进行监测并变更延迟部的延迟量,使得第一电压信号和第二电压信号两者的相位一致。
第一延迟部732-1接收第一麦克风710-1所取得的第一电压信号712-1,输出按照延迟控制信号(例如,规定电流)735赋予了规定的延迟的信号S1。增益部760接收第二麦克风710-2所取得的第二电压信号712-2,输出赋予了规定的增益的信号S2。第一带通滤波器756-1接收第一延迟部732-1所输出的第一电压信号S1,输出单一频率的信号K1。第二带通滤波器756-2接收增益部760所输出的第二电压信号S2,输出单一频率的信号K2。第一2值化部752-1接收第一带通滤波器756-1所输出的单一频率的信号K1,输出以规定电平进行了2值化的第一数字信号D1。第二2值化部752-2接收第二带通滤波器756-2所输出的单一频率的信号K2,输出以规定电平进行了2值化的第二数字信号D2。相位差信号输出部754接收第一2值化部752-1所输出的第一数字信号D1和第二2值化部752-2所输出的第二数字信号D2,输出相位差信号FD。延迟控制部734接收相位差信号输出部754所输出的相位差信号FD,输出延迟控制信号(例如,规定电流)735。可以通过该延迟控制信号(例如,规定电流)735来控制第一延迟部732-1的延迟量,由此对第一延迟部732-1的延迟量进行反馈控制。
图22A(图22B)是差动麦克风的指向性的说明图。
图22A表示在两个麦克风M1、M2的相位未发生偏移的状态下的指向特性。圆状的区域810-1和810-2表示根据两个麦克风M1、M2的输出的差分来得到的指向特性,该指向特性表示双指向性,既,假设连接两个麦克风M1、M2的直线方向为0度、180度,与连接两个麦克风M1、M2的直线方向垂直的方向设为90度、270度,则在0度、180度方向上具有最大感度,在90度、270度方向上不具有感度。
当对两个麦克风M1、M2所取得的信号中的一个信号赋予了延迟时,指向特性发生变化。例如,当对于麦克风M1的输出,赋予了相当于将麦克风间隔d除以音速C而得的时间的延迟时,表示两个麦克风M1、M2的指向性的区域变成图22B的820所示的心形。在这种情况下,能够实现对于0度的说话者方向不具有感度(无效(null))的指向特性,所以能够选择性地遮断说话者的语音,从而能够仅获取周围的声音(周围的噪音)。
利用上述特性,能够检测周围的噪音电平(level)的状态。
图23是具有噪声检测单元的语音输入装置的结构的一例的示意图。
本实施方式的语音输入装置包括噪声检测用延迟部780。噪声检测用延迟部780对第二麦克风710-2所取得的第二电压信号712-2赋予噪声检测用的延迟后将其输出。
本实施方式的语音输入装置包括噪声检测用差分信号生成部782。噪声检测用差分信号生成部782生成噪声检测用的差分信号783,该差分信号783表示噪声检测用延迟部780赋予了噪声检测用的规定延迟的信号781和所述第一麦克风710-1所取得的第一电压信号712-1之差。
本实施方式的语音输入装置包括噪声检测部784。噪声检测部784根据噪声检测用的差分信号783来判断噪声的电平,并根据判断结果来输出噪声检测信号785。噪声检测部784也可以计算出噪声检测用的差分信号的平均电平,并根据平均电平来生成噪声检测用的差分信号785。
本实施方式的语音输入装置包括信号切换部786。信号切换部786接收差分信号生成部720所输出的差分信号742和所述第一麦克风所取得的第一电压信号712-1,并根据所述噪声检测信号785来切换输出第一电压信号712-1和所述差分信号742。信号切换部786可以在噪声电平为规定电平以下时,输出所述第一麦克风所取得的第一电压信号,在所述平均电平大于规定电平时输出差分信号。这样,在安静的环境(噪声电平为规定电平以下)下,输出SNR(Signal to Noise Ratio:SN比,信噪比)良好的单一麦克风所获取的声音。另外,在高噪音的环境(噪声电平为规定电平以上)下,输出噪音去除性能良好的差动麦克风所获取的声音。
在此,差分信号生成部可以具有在图13、图14、图17、图18、图21中说明的结构,也可以具有众所周知的一般的差动麦克风的结构。另外,第一麦克风710-1的第一振动膜和第二麦克风710-1的第二振动膜可以具有被配置成噪音强度比小于输入语音强度比的结构,但也可以具有没有这样的限定的其他结构,其中,所述噪音强度比表示包含在所述差分信号742中的噪音成分的强度相对包含在所述第一或第二电压信号中的所述噪音成分的强度的比例,所述输入语音强度比表示包含在所述差分信号中的输入语音成分的强度相对包含在所述第一或第二电压信号中的所述输入语音成分的强度的比例。
另外,所述噪声检测用的延迟也可以不是将第一以及第二振动膜的中心间距离(参照图20中的d)除以音速所得的时间。即使在说话者的方向不是0度方向的情况下,只要能够将指向特性的不具有感度的方向(无效)设定在说话者方向上,就能够实现适于具有遮断说话者语音而拾取周围噪音的指向性的噪声检测的特性。例如,也可以将延迟设定为具有高心形(hypercardioid)、超心形(supercardioid)的指向特性,从而遮断说话者语音。
差分信号生成部720接收第一麦克风710-1所取得的第一电压信号712-1和第二麦克风710-2所取得的第二电压信号712-2,生成并输出差分信号742。
噪声检测用延迟部780接收第二麦克风710-2所取得的第二电压信号712-2,并输出赋予了噪声检测用的延迟的信号781。噪声检测用差分信号生成部782生成并输出噪声检测用的差分信号783,该差分信号783表示噪声检测用延迟部780赋予了噪声检测用的规定延迟的信号781和所述第一麦克风710-1所取得的第一电压信号712-1之差。噪声检测部784接收噪声检测用的差分信号783,根据噪声检测用的差分信号783来判断噪声的电平,并根据判断结果来输出噪声检测信号785。
信号切换部786接收差分信号生成部720所输出的差分信号742、所述第一麦克风所取得的第一电压信号712-1以及噪声检测信号785,并根据噪声检测信号785来切换输出第一电压信号712-1和所述差分信号742。
图24是表示通过噪声检测来进行的信号切换动作的例子的流程图。
当噪声检测部所输出的噪声检测信号小于规定的阈值(LTH)时(步骤S120),信号切换部输出单一麦克风的信号(步骤S112),当噪声检测部所输出的噪声检测信号不小于规定的阈值(LTH)时(步骤S110),信号切换部输出差动麦克风的信号(步骤S114)。
此外,具有用于输出声音信息的扬声器的语音输入装置,也可以包括根据噪声检测信号来控制扬声器的音量的音量控制部。
图25是表示通过噪声检测来进行的扬声器的音量控制动作的例子的流程图。
当噪声检测部所输出的噪声检测信号小于规定的阈值(LTH)时(步骤120),将扬声器的音量设定为第一值(步骤S122),当噪声检测部所输出的噪声检测信号不小于规定的阈值(LTH)时(步骤S120),将扬声器的音量设定为第二值,第二值的音量大于第一值的音量(步骤S124)。
另外,也可以当噪声检测部所输出的噪声检测信号小于规定的阈值(LTH)时,降低扬声器的音量,当噪声检测部所输出的噪声检测信号不小于规定的阈值(LTH)时,提高扬声器的音量。
图26是具有AD转换单元的语音输入装置的结构的一例的示意图。
本实施方式的语音输入装置可以包括第一AD转换单元790-1。第一AD转换单元790-1对第一麦克风710-1所取得的第一电压信号712-1进行模拟/数字转换。
本实施方式的语音输入装置可以包括第二AD转换单元790-2。第二AD转换单元790-2对第二麦克风710-2所取得的第二电压信号712-2进行模拟/数字转换。
本实施方式的语音输入装置包括差分信号生成部720。差分信号生成部720可以根据通过第一AD转换单元790-1转换成数字信号的所述第一电压信号782-1以及通过所述第二AD转换单元790-2转换成数字信号的所述第二电压信号782-2,生成第一电压信号和第二电压信号的差分信号742。
在此,差分信号生成部720可以采用在图13、图14、图17、图18、图21中说明的结构。可以将差分信号生成部720的延迟设定为第一AD转换单元790-1或第二AD转换单元790-2的模拟/数字转换的转换周期的整数倍。这样,延迟部通过触发器(flip-flop)以数字方式使输入信号偏移1时钟(clock)或数时钟,由此能够实现延迟。
另外,可以将第一麦克风710-1的第一振动膜和第二麦克风710-2的第二振动膜的中心间距离设定为对模拟/数字转换的转换周期乘以音速所得到的值或其整数倍。
这样,在噪声检测用延迟部中,通过使输入电压信号偏移n时钟(n为整数)的简单的动作,能够高精度地实现适于拾取周围噪声的指向特性(例如,心形)。
例如,当进行模拟/数字转换时的采样频率为44.1kHz时,第一和第二振动膜的中心间距离约为7.7mm左右,当采样频率为16kHz时,第一和第二振动膜的中心间距离约为21mm左右。
图27是具有增益调整单元的语音输入装置的结构的一例的示意图。
本实施方式的语音输入装置的差分信号生成部720包括增益控制部910。增益控制部910进行使增益部760中的放大率(增益)发生变化的控制。在增益控制部910中,可以根据振幅差检测部所输出的振幅差信号AD,动态地控制增益部760的放大率,由此调整第一麦克风710-1所取得的第一电压信号712-1和第二麦克风710-2所取得的第二电压信号712-2之间的振幅的平衡。
差分信号生成部720包括第一振幅检测单元920-1。第一振幅检测单元920-1检测第一延迟部732-1的输出信号S1的振幅,输出第一振幅信号A1。
差分信号生成部720包括第二振幅检测单元920-2。第二振幅检测单元920-2检测增益部760的输出信号S2的振幅,输出第二振幅信号A2。
差分信号生成部720包括振幅差检测部930。振幅差检测部930接收第一振幅检测单元920-1所输出的第一振幅信号A1以及第二振幅检测单元920-2所输出的第二振幅信号A2,求出它们之间的振幅差后输出振幅差信号AD。可以根据振幅差信号AD来控制增益部760的增益,由此对增益部760的增益进行反馈控制。
7.第四实施方式的语音输入装置的结构
图28、图29是第四实施方式的语音输入装置的结构的一例的示意图。
第四实施方式的语音输入装置700包括具有第一振动膜的第一麦克风710-1。另外,第四实施方式的语音输入装置700包括具有第二振动膜的第二麦克风710-2。
第一麦克风710-1的第一振动膜以及第二麦克风710-2的第一振动膜被配置成噪音强度比小于输入语音强度比,其中,所述噪音强度比表示包含在差分信号742中的噪音成分的强度相对包含在所述第一或第二电压信号712-1、712-2中的所述噪音成分的强度的比例,所述输入语音强度比表示包含在所述差分信号742中的输入语音成分的强度相对包含在所述第一或第二电压信号中的所述输入语音成分的强度的比例。
另外,具有第一振动膜的第一麦克风710-1和具有第二振动膜的第二麦克风710-2,可以具有在图1~图8中所说明的结构。
第四实施方式的语音输入装置700包括差分信号生成部720,该差分信号生成部720根据所述第一麦克风710-1所取得的第一电压信号712-1和所述第二麦克风所取得的第二电压信号712-2,生成第一电压信号712-1和第二电压信号712-2的差分信号742。
另外,差分信号生成部720包括增益部760。增益部760以规定的增益放大并输出第一麦克风710-1所取得的第一电压信号712-1。
另外,差分信号生成部720包括差分信号输出部740。差分信号输出部740接收增益部760以规定的增益放大的第一电压信号S1和所述第二麦克风所取得的第二电压信号,生成并输出以规定的增益放大的第一电压信号S1和第二电压信号的差分信号。
通过以规定的增益放大第一电压信号712-1(意味着包括提高增益的情况和降低增益的情况),能够将其校正为第一电压信号和第二电压信号的振幅差为零,因此能够防止差动麦克风的噪声抑制效果由于因制造偏差等引起的两个麦克风间的感度差而劣化。
图30、图31是第四实施方式的语音输入装置的结构的一例的示意图。
本实施方式的差分信号生成部720可以包括增益控制部910。增益控制部910进行使增益部760中的增益发生变化的控制。在增益控制部910中,可以通过动态或静态地控制增益部760的增益,调整增益部输出S1和所述第二麦克风所取得的第二电压信号712-2之间的振幅的平衡。
图32是增益部和增益控制部的具体结构的一例的示意图。例如,当对模拟信号进行处理时,可以由运算放大器(op amp)(例如,如图32所示的非翻转放大电路)等模拟电路构成增益部760。可以通过变更电阻R1、R2的值,或者例如在制造时将电阻R1、R2的值微调设定为规定的值,来动态或静态地控制施加在运算放大器的一端子上的电压,由此控制运算放大器的放大率。
图33A(图33B)是静态地控制增益部的放大率的结构的一例。
例如,图32的电阻R1或R2包括如图33A所示那样串联连接有多个电阻的电阻阵列,可以经由该电阻阵列对增益部的规定的端子(图32的一端子)施加规定大小的电压。可以求出适当的放大率,并在制造过程中,通过激光来剪切构成所述电阻阵列的电阻体(r)或导体(912的F),或者,通过施加高电压或者高电流来熔断构成所述电阻阵列的电阻体(r)或导体(912的F),使得所述电阻R1或R2取用于实现该放大率的电阻值。
另外,例如,也可以将图32的电阻R1或R2构成为:包括如图33所示地并联连接有多个电阻的电阻阵列,并经由该电阻阵列对增益部的规定的端子(图32的一端子)施加规定大小的电压。可以求出适当的放大率,并在制造过程中,通过激光来剪切构成所述电阻阵列的电阻体(r)或导体(912的F),或者,通过施加高电压或者高电流来熔断构成所述电阻阵列的电阻体(r)或导体(912的F),使得所述电阻R1或R2取用于实现该放大率的电阻值。
在此,将适当的放大值设定为能够消除在制造工序中产生的麦克风的增益平衡的值即可。通过利用如图33A(图33B)所示地串联或并联连接有多个电阻的电阻阵列,能够做成与在制造工序中产生的麦克风的增益平衡对应的电阻值,从而能够发挥增益控制部的功能,该增益控制部与规定的端子连接,用于控制所述增益部的增益。
此外,在上述实施方式中,举例说明了多个电阻体(r)通过熔丝(F)连接在一起的结构,但并不限定于此。也可以采用多个电阻(r)不通过熔丝(F)而直接串联或并联连接的结构,此时,可以切断至少一个电阻。
另外,也可以采用所谓的激光微调来调整电阻值的结构,例如,如图40所示,由一个电阻体构成图33的电阻R1或R2,并切断电阻体的一部分的结构。
图34是第四实施方式的语音输入装置的结构的一例的示意图。
差分信号生成部720可以包括振幅差检测部940。振幅差检测部940接收成为差分信号输出部740的输入的第一电压信号(S1)和第二电压信号(S2),并根据接收到的第一电压信号(S1)和第二电压信号(S2),检测生成差分信号742时的第一电压信号(S1)和第二电压信号(S2)的振幅差,并根据检测结果来生成并输出振幅差信号942。
增益控制部910根据振幅差信号942,可以使增益部760中的增益发生变化。
振幅差检测部940可以包括:第一振幅检测部,其用于检测增益部760的输出信号的振幅;第二振幅检测部922-1,其用于检测所述第二麦克风所取得的第二电压信号的信号振幅;振幅差信号生成部930,其取得所述第一振幅检测部922-2所检测的第一振幅信号922-1和第二振幅检测部920-1所检测的第二振幅信号922-1的差分,生成振幅差信号942。
也可以是:第一振幅检测单元920-1接收增益部760的输出信号S1并检测振幅,根据检测结果输出第一振幅信号922-1;第二振幅检测单元920-2接收第二麦克风所取得的第二电压信号912-2并检测振幅,根据检测结果输出第二振幅信号922-2;振幅差信号生成部930接收第一振幅检测单元920-1所输出的第一振幅信号922-1和第二振幅信号922-2所输出的第二振幅信号922-2并取得差分,生成并输出振幅差信号942。
增益控制部910接收振幅差信号输出部930所输出的振幅差信号942,输出增益控制信号(例如,规定电流)912。可以通过该增益控制信号(例如,规定电流)912来控制增益部760的增益,由此对增益部760的增益进行反馈控制。
根据本实施方式,能够实时地检测并调整在使用时因各种原因而变化的振幅差。
所述增益控制部可以将增益部的输出信号S1和所述第二麦克风所取得的第二电压信号712-2(S2)的振幅差调整为其相对任意信号(S1或S2)的比例为规定的比例值以下。或者,也可以调整增益部的放大率,取得规定的噪声抑制效果(例如,约10以上)。
例如,可以将信号S1和S2的振幅差调整为相对于S1或S2处于-3%以上、+3%以下的范围内,也可以将所述振幅差调整为处于-6%以上、+6%以下的范围内。在前者的情况下,能够将噪声抑制约10分贝,在后者的情况下,能够将噪声抑制约6分贝。
图35、图36、图37是第四实施方式的语音输入装置的结构的一例的示意图。
差分信号生成部720可以包括低通滤波器部950。低通滤波器部950去除差分信号的高频成分。低通滤波器部950可以采用具有一阶遮断特性的滤波器。另外,可以将低通滤波器部950的截止频率设定为1kHz以上且5kHz以下范围内的任意值K。例如,优选地,将低通滤波器部950的截止频率设定为1.5kHz以上且2kHz以下程度。
增益部760接收第一麦克风710-1所取得的第一电压信号712-1后以规定的放大率(增益)进行放大,输出以规定的增益放大过的第一电压信号S1。差分信号输出部740接收通过增益部760以规定的增益放大的第一电压信号S1以及所述第二麦克风710-2所取得的第二电压信号S2,生成并输出以规定的增益放大的第一电压信号S1和第二电压信号的差分信号742。低通滤波器部950接收差分信号输出部740所输出的差分信号742,输出使包含在差分信号742中的高频(K以上频带的频率)衰减的差分信号952。
图37是差动麦克风的增益特性的说明图。横轴表示频率,纵轴表示增益。1020是表示单一麦克风(single mike)的频率和增益之间的关系的曲线图。单一麦克风具有平坦的频率特性。1010是表示在差动麦克风的说话者设想位置处的频率和增益之间的关系的曲线图,例如,表示离第一麦克风710-1以及第二麦克风710-2的中心相距50mm的位置处的频率特性。即使第一麦克风710-1以及第二麦克风710-2具有平坦的频率特性,但由于差分信号的高频从约1kHz附近以一阶特性(20dB/dec)上升,因此,若利用具有与此相反特性的一阶低通滤波器使高频衰减,则能够使差分信号的频率特性变得平坦,从而能够防止产生听觉上的不协调感。
因此,如图36所示,使差分信号通过低通滤波器以校正其频率特性,由此能够得到如1012所示的几乎平坦的频率特性。由此,能够防止说话者语音的高频或噪声的高频被强调而成为刺耳的音质。
图38是具有AD转换单元的语音输入装置的结构的一例的示意图。
本实施方式的语音输入装置可以包括第一AD转换单元790-1。第一AD转换单元790-1对第一麦克风710-1所取得的第一电压信号712-1进行模拟/数字转换。
本实施方式的语音输入装置可以包括第二AD转换单元790-2。第二AD转换单元790-2对第二麦克风710-2所取得的第二电压信号712-2进行模拟/数字转换。
本实施方式的语音输入装置包括差分信号生成部720。差分信号生成部720可以根据通过第一AD转换单元790-1转换成数字信号的所述第一电压信号782-1以及通过所述第二AD转换单元790-2转换成数字信号的所述第二电压信号782-2,均通过数字信号处理运算来进行增益平衡调整以及延迟平衡调整,生成第一电压信号和第二电压信号的差分信号742。
在此,差分信号生成部720可以具有在图29、图31、图34、图36等中说明的结构。
8.第五实施方式的语音输入装置的结构
图20是第五实施方式的语音输入装置的结构的一例的示意图。
本实施方式的语音输入装置可以包括设置在离第一麦克风(的第一振动膜711-1)以及所述第二麦克风(的第二振动膜711-2)等距离的位置处的声源部770。声源部770可以由振荡器等构成,可以在离第一麦克风710-1的第一振动膜(薄膜(diaphragm))711-1的中心点C1和第二麦克风710-2的第二振动膜(薄膜)711-2的中心点C2等距离的位置处设置声源部770。
而且,可以根据来自声源部770的声音,将成为差分信号生成部740的输入的第一电压信号S1和第二电压信号S2的相位差或者延迟差调整为零。
另外,也可以进行根据来自声源部770的声音使增益部760中的放大率发生变化的控制。
而且,也可以根据来自声源部770的声音,将成为差分信号生成部740的输入的第一电压信号S1和第二电压信号S2的振幅差调整为零。
在此,声源部770可以使用发出单一频率的声音的声源。例如,可以发出1kHz的声音。
另外,可以将声源部770的频率设定为可听频带外的频率。例如,若使用比20kHz高的频率(例如,30kHz)的声音,则人的耳朵听不到声音。若将声源部770的频率设定为可听频带外的频率,则在用户使用时也不造成障碍的情况下,能够利用声源部770来调整输入信号的相位差或延迟差,以及感度(增益)差。
例如,当由模拟滤波器构成延迟部时,延迟量可能会根据温度特性而变化,但若采用本实施方式,则能够进行与温度变化等周围的环境变化对应的延迟调整。延迟调整,可以时常进行,也可以间歇地进行,也可以在接通电源等时进行。
9.第六实施方式的语音输入装置的结构
图39是第六实施方式的语音输入装置的结构的一例的示意图。
本实施方式的语音输入装置可以包括:第一麦克风710-1,其具有第一振动膜;第二麦克风710-2,其具有第二振动膜;以及未图示的差分信号生成部,其生成表示所述第一麦克风所取得的第一电压信号和所述第二麦克风所取得的第二电压信号之差的差分信号,所述第一振动膜以及所述第二振动膜中的至少一振动膜通过设置成与膜面垂直的筒状的导音管1100来取得声波。
导音管1100可以设置在振动膜周围的基板1110上,以使从筒的开口部1102接收到的声波经由音响孔714-2不向外部泄漏地到达第二麦克风710-2的振动膜。这样,进入导音管1100的声音在不会衰减的情况下到达第二麦克风710-2的振动膜。根据本实施方式,通过在所述第一振动膜以及所述第二振动膜中的至少一方设置导音管,能够改变声音到达振动膜为止的距离。因此,根据延迟平衡的偏差来设置适当长度(例如,数毫米)的导音管,由此能够消除延迟。
此外,本发明并不限定于上述实施方式,而可以进行各种变形。本发明包括实质上与实施方式中说明的结构相同的结构(例如,功能、方法以及结果相同的结构,或者目的及效果相同的结构)。另外,本发明包括从实施方式中说明的结构中置换掉非本质性的部分的结构。另外,本发明包括发挥与实施方式中说明的结构相同的作用效果的结构或能够实现相同目的的结构。另外,本发明包括在实施方式中说明的结构的基础上增加了公知技术的结构。