CN101661753A - 噪声抑制装置、移动电话和噪声抑制方法 - Google Patents

噪声抑制装置、移动电话和噪声抑制方法 Download PDF

Info

Publication number
CN101661753A
CN101661753A CN200910151327A CN200910151327A CN101661753A CN 101661753 A CN101661753 A CN 101661753A CN 200910151327 A CN200910151327 A CN 200910151327A CN 200910151327 A CN200910151327 A CN 200910151327A CN 101661753 A CN101661753 A CN 101661753A
Authority
CN
China
Prior art keywords
unit
environment
microphone array
mobile phone
use pattern
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN200910151327A
Other languages
English (en)
Other versions
CN101661753B (zh
Inventor
早川昭二
松尾直司
片山浩
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Publication of CN101661753A publication Critical patent/CN101661753A/zh
Application granted granted Critical
Publication of CN101661753B publication Critical patent/CN101661753B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Processing of the speech or voice signal to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Processing of the speech or voice signal to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • G10L21/0216Noise filtering characterised by the method used for estimating noise
    • G10L2021/02161Number of inputs available containing the signal or the noise to be suppressed
    • G10L2021/02165Two microphones, one receiving mainly the noise signal and the other one mainly the speech signal
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Processing of the speech or voice signal to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • G10L21/0216Noise filtering characterised by the method used for estimating noise
    • G10L2021/02161Number of inputs available containing the signal or the noise to be suppressed
    • G10L2021/02166Microphone arrays; Beamforming

Abstract

一种噪声抑制装置、移动电话和噪声抑制方法,该装置通过多个声音接收单元来接收声音信号,并抑制在输入的声音信号中包含的噪声分量。噪声抑制装置包括:检测单元,从多种使用模式中检测噪声抑制装置的使用模式,在多种使用模式中,多个声音接收单元的位置关系和/或多个声音接收单元与目标声音源之间的位置关系彼此不同;转换单元,将在对多个声音接收单元输入的每个声音信号进行噪声抑制处理中所使用的使用环境信息转换成与由所述检测单元检测出的使用模式一致的使用环境信息;以及抑制单元,使用由所述转换单元转换的使用环境信息来对声音信号执行噪声抑制处理。所述噪声抑制装置即使在使用模式改变之后仍能够在通信时保持噪声抑制性能。

Description

噪声抑制装置、移动电话和噪声抑制方法
技术领域
本申请涉及一种噪声抑制装置、包括所述噪声抑制装置的移动电话、噪声抑制方法以及记录介质,其中所述噪声抑制装置对通过接收声音获得的声音信号中所包含的噪声分量进行抑制。
背景技术
有这样一种麦克风阵列装置被开发出来,其包括将接收到的声音转换成声音信号以输出该声音信号的多个声音接收单元(例如电容式麦克风),并基于从所述声音接收单元输出的声音信号来执行各种声音处理操作。该麦克风阵列装置可配置为执行延迟-相加处理,该延迟-相加处理同步地将从声音接收单元输出的声音信号相加,以相对于噪音而更突出目标声音(提高SNR(信噪比))。该麦克风阵列装置还可配置为通过同步相减处理来抑制噪声,所述同步相减处理使得声音信号彼此同步以从一个声音信号减去另一个声音信号,由此而形成噪声的死区(dead space)(例如,参见Yutaka Kaneda的Applications of digital filters to microphone systems,The Journal of theAcoustical Society of Japan 45(2),125-128页,1989)。
在延迟-相加处理、同步相减处理等中,麦克风阵列装置执行的麦克风阵列处理是依赖于状态的处理,所述状态例如是多个声音接收单元与目标声音源之间的位置关系以及多个声音接收单元设置。例如,声音接收单元与目标声音源之间的位置关系包括:当多个声音接收单元沿与目标声音源的方向相垂直的方向设置时获得的位置关系,当多个声音接收单元设置在与目标声音源的方向同一直线时获得的位置关系等。多个声音接收单元的设置包括多个声音接收单元之间的距离、多个声音接收单元的孔眼(hole)等。
更具体地,在麦克风阵列处理中,当状态改变时,例如当声音接收单元与目标声音源之间的位置关系或多个声音接收单元的设置改变时,需要依次切换各种处理或依次切换在各种处理中使用的参数。
近来的翻盖式移动电话配置为能够在多种使用模式下使用(打电话或通信),例如在翻开状态下的普通方式或在合盖时显示屏朝外(表面)的观看(viewer style)方式。在大多数翻盖式移动电话中,设有显示屏的第一壳体与设有操作按钮的第二壳体通过铰接部互连,并且将扬声器设置于与第一壳体的铰接部的连接部分相对的端部。因此,在这样的移动电话中,常常将一个麦克风安装在铰接部附近,以防止处于观看方式下的麦克风过于靠近扬声器。
在将麦克风设置在铰接部附近的移动电话中,在使用正常方式或使用观看方式时,用户(讲话者)的嘴部位置与麦克风的位置是分开的,语音声音的SNR会降低,从而语音质量下降。因此,就需要执行能够增加SNR的噪声抑制处理(例如麦克风阵列处理)。
如上所述,在麦克风阵列处理中,当移动电话的使用状态(使用模式)改变时,需要切换各种处理或切换在各种处理中使用的参数。因此,当麦克风阵列处理配置为在所有使用模式(例如正常方式和观看方式)下执行时,可能要独立地准备对应于多个使用模式的多个麦克风阵列处理单元,并且可能需要切换依靠使用模式进行操作的麦克风阵列处理单元。
图24是示出现有噪声抑制装置的配置的方框图。现有噪声抑制装置包括第一声音输入单元101、第二声音输入单元102、传感器103、壳体状态确定单元104、声音输入/输出切换单元105、开关106、107及110、第一麦克风阵列处理单元108、第二麦克风阵列处理单元109等。
第一声音输入单元101和第二声音输入单元102中的每一个都包括麦克风和模拟/数字转换器(以下称为A/D转换器)。第一声音输入单元101和第二声音输入单元102通过麦克风接收声音,将接收到的声音转换为时间序列模拟电信号,通过放大器放大所述电信号,通过A/D转换器将放大的电信号转换为数字声音信号,然后将所述数字声音信号分别传送至开关106和107。
当把噪声抑制装置例如设置在翻盖式移动电话中时,传感器103为连接至所述移动电话的铰接部的传感器。传感器103基于移动电话是处于正常方式(翻开状态)或是处于观看方式(合盖状态)而检测铰接部的状态,并将检测结果传送到壳体状态确定单元104。该壳体状态确定单元104基于从传感器103获取的检测结果确定所述移动电话处于正常方式还是观看方式,并将确定结果传送至声音输入/输出切换单元105。
声音输入/输出切换单元105基于从壳体状态确定单元104获取的确定结果来控制开关106、107及110的切换。例如,当从壳体状态确定单元104获取的确定结果是正常方式时,声音输入/输出切换单元105控制开关106和107的切换,以使来自第一声音输入单元101和第二声音输入单元102的声音信号自第一麦克风阵列处理单元108输入。同时,声音输入/输出切换单元105控制开关110的切换,以使来自第一麦克风阵列处理单元108的声音信号向外部输出。
另一方面,当从壳体状态确定单元104获取的确定结果是观看方式时,声音输入/输出切换单元105控制开关106和107的切换以使来自第一声音输入单元101和第二声音输入单元102的声音信号输出到第二麦克风阵列处理单元109。同时,声音输入/输出切换单元105控制开关110的切换以使来自第二麦克风阵列处理单元109的声音信号向外部输出。
第一麦克风阵列处理单元108和第二麦克风阵列处理单元109获取从开关106和107输出的声音信号,并且基于所获取的声音信号执行麦克风阵列处理,例如执行延迟-相加处理或同步相减处理。第一麦克风阵列处理单元108执行移动电话使用正常方式时所执行的麦克风阵列处理,并且第二麦克风阵列处理单元109执行移动电话使用观看方式时所执行的麦克风阵列处理。
通过这样的配置,噪声抑制装置可以基于移动电话的使用模式(正常方式或观看方式)来执行麦克风阵列处理。通过这种依赖于使用模式的处理,能够适当地抑制噪声,从而提高了声音质量。
此外,当把噪声抑制装置设置在视频摄像机中时,就提出以下配置:其中安装在视频摄像机上的变焦麦克风的指向和记录水平是与摄像机的变焦信息一起被控制的(例如,参见日本特开第2002-204493号公报)。
当移动电话的使用模式改变时,包括上述配置的噪声抑制装置切换将要操作的麦克风阵列处理单元。受控开始操作的麦克风阵列处理单元从此刻开始对用在麦克风阵列处理中的各种信息进行估算处理,并且基于估算信息开始进行麦克风阵列处理。因此,直到估算出用于麦克风阵列处理的适当信息之前,麦克风阵列处理都是基于不适当信息(例如,预设初始信息)而执行的。由此,噪声抑制处理的操作就不够稳定。特别地,在使用移动电话(打电话)的过程中切换使用模式时,糟糕的是,接收方(intended party)会收到由不稳定的操作所处理的令人不舒服的声音。
发明内容
考虑到现有技术的上述情况,本申请的一个目的是提供一种噪声抑制装置、包括该噪声抑制装置的移动电话、噪声抑制方法以及记录介质,其中所述噪声抑制装置即使在使用模式改变之后仍能在进行通信时保持噪声抑制性能。
根据本发明的方案,一种噪声抑制装置,其通过多个声音接收单元来接收声音信号,并且抑制在输入的声音信号中包含的噪声分量,该装置包括:检测单元,从多种使用模式中检测噪声抑制装置的使用模式,在多种使用模式中,多个声音接收单元之间的位置关系和/或多个声音接收单元与目标声音源之间的位置关系互不相同;转换单元,将在对多个声音接收单元输入的每个声音信号进行噪声抑制处理中所使用的使用环境信息转换成与由检测单元检测出的使用模式一致的使用环境信息;以及抑制单元,使用由转换单元所转换的使用环境信息对声音信号执行噪声抑制处理。
本发明的噪声抑制装置可以在使用模式改变后立即执行优化的噪声抑制处理,并且可以防止由于使用模式改变引起的声音质量的下降。
本发明的目的和优点将通过权利要求书中特指的元件及组合而实现和获得。
应当理解,前述概括描述和随后的详细描述都是示意性的和示例性的,且并不用于限制本发明所请求保护的范围。
附图说明
图1A、图1B和图1C是描述根据实施例1的移动电话配置的例子的示意图;
图2是描述根据实施例1的移动电话配置的例子的方框图;
图3是描述根据实施例1的移动电话功能配置的例子的功能方框图;
图4是描述麦克风阵列处理单元的功能配置的例子的功能方框图;
图5A和图5B为分别描述根据实施例1的移动电话中指向图案(patternof directivity)的例子的示意图;
图6是描述背景噪声频谱和语音部(section)中的频谱的例子的示意图;
图7A和图7B是描述由根据实施例1的移动电话获得的效果的示意图;
图8是描述噪声抑制处理过程的例子的操作图;
图9是描述麦克风阵列处理过程的例子的操作图;
图10是描述根据实施例2的移动电话功能配置的例子的功能方框图;
图11是描述根据实施例3的移动电话功能配置的例子的功能方框图;
图12是描述噪声抑制处理过程的例子的操作图;
图13是描述根据实施例4的移动电话功能配置的功能方框图;
图14是描述显示屏幕的配置例子的示意图;
图15是麦克风阵列处理过程的例子的操作图;
图16是噪声抑制处理过程的例子的操作图;
图17A和图17B为分别根据实施例5的移动电话配置的例子的示意图;
图18是描述根据实施例5的移动电话功能配置的例子的功能方框图;
图19A和图19B为分别描述根据实施例5的移动电话中指向图案的例子的示意图;
图20是描述根据实施例6的移动电话功能配置的例子的功能方框图;
图21A和图21B为分别描述根据实施例6的移动电话中指向图案的例子的示意图;
图22是描述根据实施例7的移动电话功能配置的例子的功能方框图;
图23A、图23B和图23C为分别描述根据实施例8的移动电话配置的例子的示意图;以及
图24是描述现有噪声抑制装置的配置例子的方框图。
具体实施方式
以下将参考描述应用到移动电话的实施例的附图,描述本申请中公开的噪声抑制装置。本申请中公开的噪声抑制装置、噪声抑制方法以及计算机程序不仅可以应用到用于移动电话的配置,还可以应用到例如对获得的声音信号执行各种处理的声音处理装置(例如语音识别装置,其通过使用由接收声音而获得的语音信号来执行语音识别)。
(实施例1)
以下将描述根据实施例1的移动电话。图1A、图1B和图1C是描述根据实施例1的移动电话配置的例子的示意图。根据实施例1的移动电话1是翻盖式移动电话。图1A描述了未合盖的移动电话1的外部立体图,图1B描述了合盖并使得显示单元11面朝内的移动电话1的外部立体图,以及图1C描述了合盖并使得显示单元11面朝外的移动电话1的外部立体图。
根据实施例1的移动电话1包括:包含显示单元11的第一壳体1a、包含操作单元10的第二壳体1b、以及连接壳体1a和1b的第三壳体1c。壳体1b和1c通过铰接部1d连接,并且壳体1a和1c通过枢轴部1e连接。
第一壳体1a可以配置为能够相对于枢轴部1e枢转180°。当移动电话1合盖时,其状态可能变为显示单元11面对操作单元10的状态和显示单元11不面对操作单元10的状态。壳体1a和1c配置为能够在铰接部1d处相对于壳体1b而合盖。作为本申请公开的噪声抑制装置所应用的移动电话,其不仅可以是翻盖式移动电话,还可以是用于多种使用模式(包括壳体的形状或麦克风的使用状态)的任何移动电话。
移动电话1包括扬声器8a,该扬声器8a位于与壳体1a和枢轴部1e之间的连接位置相对的一侧的端部。移动电话1包括位于铰接部1d和壳体1c之间的连接位置的侧面上的麦克风6a,并且还包括麦克风7a,其位于当移动电话1合盖时与面向操作单元10的表面相对的表面上。
如图1A所示,通过将设置在壳体1a上的扬声器8a设定为在翻开状态下靠近他/她的耳朵,根据实施例1的移动电话1可以用于用户执行语音动作的使用模式(也称为正常方式)。如图1C所示,通过将扬声器8a设定为在显示单元11面朝外的合盖状态下靠近他/她的耳朵,根据实施例1的移动电话1也可以用于用户执行语音动作的使用模式(也称为观看方式)。
图2是描述根据实施例1的移动电话1的配置的方框图。根据实施例1的移动电话1包括计算单元2、ROM(只读存储器)3、RAM(随机存取存储器)4、传感器5、第一声音输入单元6、第二声音输入单元7、声音输出单元8、通信单元9、操作单元10、显示单元11等。以上描述的硬件单元通过数据总线2a互连。
计算单元2可以是CPU(中央处理单元)、MPU(微处理单元)等,且控制硬件单元的操作,并任意地将存储在ROM 3中的控制程序预先读取到RAM 4上以执行所述控制程序。ROM 3存储操作移动电话1所需的各种控制程序。RAM 4可以是SRAM、闪存等,并且暂时存储在由计算单元2执行控制程序中产生的各种数据。
传感器5连接至铰接部1d,并且通过铰接部1d检测移动电话1是翻开的(正常方式)还是合盖的(观看方式)。传感器5基于由设置在铰接部1d上的磁体所获得的磁信息,输出基于移动电话1是被设定为正常方式还是观看方式而获得的检测结果。
如图3所示,第一声音输入单元6和第二声音输入单元7(声音接收单元)均具有麦克风6a和7a、放大器6b和7b、以及A/D转换器6c和7c。麦克风6a和7a例如是电容式麦克风,其基于接收的声音产生模拟声音信号,并且将产生的声音信号分别发送给放大器6b和7b。
放大器6b和7b,例如是增益放大器,将从麦克风6a和7a输入的声音信号放大,并且将所获得的声音信号分别发送到A/D转换器6c和7c。在移动电话中,A/D转换器6c和7c通过使用诸如LPF(低通滤波器)之类的滤波器,以8000Hz的采样频率对从放大器6b和7b输入的声音信号进行采样,以将声音信号转换成数字声音信号。第一声音输入单元6和第二声音输入单元7将由A/D转换器6c和7c获得的数字声音信号发送到指定目的地。
声音输出单元8包括输出声音的扬声器8a、数字/模拟转换器、放大器(后两者未图示)等。声音输出单元8通过数字/模拟转换器将要作为声音输出的数字声音信号转换成模拟声音信号,通过放大器放大模拟声音信号,并且基于来自扬声器8a的放大后的声音信号来输出声音。
通信单元9是用于连接到网络(未图示)的接口,并且通过网络(通信线)执行与外部装置(例如另一移动电话或计算机)的通信。通信单元9例如将由第一声音输入单元6或第二声音输入单元7获得的声音信号输出到受话方(接收方)的移动电话。
操作单元10包括用户操作移动电话1所需的各种操作键。当用户操作操作键时,操作单元10将与被操作的操作键对应的控制信号发送给计算单元2,并且计算单元2执行与从操作单元10获得的控制信号对应的处理。
显示单元11例如是液晶显示器(LCD),并且根据计算单元2的指示,显示移动电话1的操作状态、通过操作单元10输入的信息、要通知用户的信息等。
以下将描述在包括上述配置的移动电话1中,通过使计算单元2执行存储在ROM 3中的各种控制程序而实现的移动电话1的功能。图3是描述根据实施例1的移动电话1的功能配置的例子的功能方框图。在根据实施例1的移动电话1中,计算单元2执行存储在ROM 3中的控制程序以实现以下元件的多种功能,例如,壳体状态确定单元21、开关22、23和28、麦克风阵列处理控制单元24、信息转换单元25、第一麦克风阵列处理单元26以及第二麦克风阵列处理单元27。
上述功能并不局限于通过使计算单元2执行存储在ROM 3中的控制程序而实现的配置。例如,上述功能还可由合并了本申请公开的计算机程序和各种数据的DSP(数字信号处理器)来实现。
第一声音输入单元6和第二声音输入单元7将由接收信号获得的声音信号发送至开关22和23。第一声音输入单元6和第二声音输入单元7接收的声音中包含如下声音:从作为目标声音源的讲话者的口中发出的声音(目标声音),以及来自于移动电话1周围的其它声音(噪声)。
开关22和23将从第一声音输入单元6和第二声音输入单元7输入的声音信号发送至第一麦克风阵列处理单元26以及第二麦克风阵列处理单元27中的一个。第一麦克风阵列处理单元26以及第二麦克风阵列处理单元27(抑制单元)中的每一个将受到麦克风阵列处理的声音信号发送到开关28。开关28将从第一麦克风阵列处理单元26以及第二麦克风阵列处理单元27中的一个输入的声音信号发送至指定目的地。以下参见图4描述第一麦克风阵列处理单元26以及第二麦克风阵列处理单元27的详细配置。
壳体状态确定单元(检测单元)21基于传感器5输出的检测结果,确定移动电话1是设定在正常方式还是观看方式,并将确定结果通知麦克风阵列处理控制单元24。
当壳体状态确定单元21通知麦克风阵列处理控制单元24,确定结果指示移动电话1设定为正常方式时,麦克风阵列处理控制单元24控制开关22和23的选择,以将来自声音输入单元6和7的声音信号发送至第一麦克风阵列处理单元26。同时,麦克风阵列处理控制单元24控制开关28的选择,以将来自第一麦克风阵列处理单元26的声音信号发送至指定目的地。
另一方面,当壳体状态确定单元21通知麦克风阵列处理控制单元24,确定结果指示移动电话1设定为观看方式时,麦克风阵列处理控制单元24控制开关22和23的选择,以将来自声音输入单元6和7的声音信号发送至第二麦克风阵列处理单元27。同时,麦克风阵列处理控制单元24控制开关28的选择,以将来自第二麦克风阵列处理单元27的声音发送至指定目的地。
而且,麦克风阵列处理控制单元24基于壳体状态确定单元21通知的确定结果,来控制信息转换单元25的操作。更具体地,当移动电话1设定为正常方式时,信息转换单元25受到麦克风阵列处理控制单元24的指示,将第二麦克风阵列处理单元27使用的使用环境信息转换成第一麦克风阵列处理单元26使用的使用环境信息。当移动电话1设定为观看方式时,信息转换单元25受到麦克风阵列处理控制单元24的指示,将第一麦克风阵列处理单元26使用的使用环境信息转换成第二麦克风阵列处理单元27使用的使用环境信息。
信息转换单元(转换单元)25根据来自麦克风阵列处理控制单元24的指示,在第一麦克风阵列处理单元26使用的使用环境信息与第二麦克风阵列处理单元27使用的使用环境信息之间执行转换处理。在实施例1中,第一麦克风阵列处理单元26和第二麦克风阵列处理单元27两者均做以下配置:基于通过两个麦克风6a和7a接收声音获得的声音信号来执行麦克风阵列处理。因此,信息转换单元25可以配置为对第一麦克风阵列处理单元26使用的使用环境信息和第二麦克风阵列处理单元27使用的使用环境信息进行简单置换。
以下将描述第一麦克风阵列处理单元26以及第二麦克风阵列处理单元27的详细配置的例子。图4是描述第一和第二麦克风阵列处理单元26和27的功能配置的功能方框图。在根据实施例1的移动电话1中,第一麦克风阵列处理单元26以及第二麦克风阵列处理单元27中的每一个都具有以下元件的功能:使用环境估算单元261和271、使用环境信息存储单元262和272、抑制增益计算单元263和273、噪声抑制单元264和274等。
尽管未在图中示出,第一麦克风阵列处理单元26以及第二麦克风阵列处理单元27具有成帧(framing)处理单元和信号转换单元。成帧处理单元执行成帧处理,以针对从第一声音输入单元6和第二声音输入单元7输入的声音信号,将时间轴上的声音信号转换成频率轴上的声音信号。在成帧处理中,例如,将32ms的帧长度处理为一个块(block),将具有32ms并且帧移位为20ms的部分(section)处理为一个新的帧。重复移位以推进处理。帧长度和帧移位的量不限于32ms和20ms。
对于受到成帧处理的声音信号,信号转换单元将时间轴上的声音信号转换成(在移动电话中,以8kHz采样256个点)频率轴上的声音信号(频谱),以获得麦克风6a和麦克风7a两者的复频谱。信号转换单元将获得的复频谱发送到使用环境估算单元261和271和噪声抑制单元264和274。声音转换单元例如执行诸如快速傅里叶变换(FFT)等时间-频率转换处理。
使用环境估算单元(估算单元)261和271对麦克风阵列处理单元26和27执行的噪声抑制处理中所使用的各种使用环境信息进行估算处理,并且在使用环境信息存储单元262和272中存储所估算出的使用环境信息。所述使用环境信息存储单元262和272例如可以用RAM 4的给定区域或额外设置的存储单元来充当。
通过使用例如从信号中获得的复频谱和麦克风6a和麦克风7a之间的相位差频谱,使用环境估算单元261和271计算各种使用环境信息。在这种情况下,抑制增益计算单元263和273基于计算出的使用环境信息和相位差频谱来确定抑制增益,并且噪声抑制单元264和274基于所确定的抑制增益来执行噪声抑制处理。这样,可以形成适当的指向,并且基于由第一声音输入单元6和第二声音输入单元7获取的声音信号,产生强调突出来自目标声音源的声音的声音信号。
图5A和图5B为分别描述根据实施例1的移动电话1中指向图案的示意图。在根据实施例1的移动电话1中,麦克风6a设置在铰接部1d附近,这样,在如图1A所示正常方式中,麦克风6a就设置在操作单元10这一侧,而在如图1C所示的观看方式中,麦克风6a的孔眼设置在外侧。在移动电话1中,在观看方式下,麦克风7a的声音孔眼设置在壳体1c的外侧,如图1C所示。
通过这样的配置,在根据实施例1的移动电话1中,在正常方式下,可以接收到包括图5A所示的指向图案的声音。在观看方式下,可以接收到具有图5B所示的指向图案的声音。图5A所示的指向图案是锥形(cone-shaped)的指向图案,其以两个麦克风7a和6a的连线来作为中心线。在这个指向图案中,执行噪声抑制,使得在设置有麦克风7a的侧表面这一侧形成指向的死区(dead space)。图5B示出的指向图案是盘状指向图案。在这个指向图案中,执行噪声抑制,使得在与从目标声音源(讲话者的嘴)到麦克风6a和7a的方向垂直的方向上形成指向的死区。
因此,在根据实施例1的移动电话1中,在正常方式和观看方式的任一种情况下,可以实现由麦克风阵列接收的具有指向的声音。第一麦克风阵列处理单元26和第二麦克风阵列处理单元27还包括信号恢复单元(未示出)。信号恢复单元将受到由噪声抑制单元264和274进行的噪声抑制处理并将频率轴上绘出的声音信号转换成时间轴上的声音信号,以将声音信号发送到开关28。信号恢复单元执行由信号转换单元执行的转换处理的逆转换处理,例如执行快速傅里叶逆变换处理(IFFT处理)。
当例如由声音输入单元6和7获取的声音信号发送到接收方的移动电话时,开关28将由第一麦克风阵列处理单元26或第二麦克风阵列处理单元27获取的噪声抑制的声音信号发送至通信单元9。该通信单元9将所获取的声音信号发送到接收方的终端,以作为电话通信。当移动电话1具有包括语音识别处理单元的配置并且基于由声音输入单元6和7所获取的声音信号来执行语音识别处理时,开关28将经噪声抑制的声音信号发送至语音识别处理单元。
麦克风阵列处理单元26和27的使用环境估算单元261和271例如估算背景噪声电平、背景噪声频谱的统计值、S/N比(SNR)、表示语音部/噪声部的信息、表示噪声频带的信息、表示给定声音源方向(讲话者的嘴)的方向信息、表示噪声源方向的方向信息、校正麦克风6a和7a的灵敏度的校正值(麦克风灵敏度校正值)等,以作为使用环境信息。
背景噪声电平表示包含在由麦克风6a和7a接收的声音信号中的相对稳定的噪声分量的电平。通过从相位差频谱(所述相位差频谱由麦克风6a和7a计算)计算出声音的传来方向,并使用来自除给定声音源方向之外的其它方向的信号,来估算并且更新背景噪声电平。由上述处理估算出的背景噪声电平是基于来源于设置有麦克风7a的侧表面这一侧的声音的噪声电平。麦克风阵列处理单元26和27基于所述背景噪声电平来执行噪声抑制处理,以能够获得基于周围噪声电平的指向。
背景噪声频谱表示在由麦克风6a和7a接收的声音信号中包含的噪声分量的频率分量的平均电平。通过从相位差频谱(所述相位差频谱由麦克风6a和7a计算)计算出声音的传来方向,并使用来自除给定声音源方向之外的其它方向的信号,来估算并更新背景噪声频谱。图6是描述背景噪声频谱和语音部中的频谱的例子的示意图。图6描述了背景噪声频谱和语音部中的频谱,其横坐标被设定为频率并且纵坐标被设定为电平(声音强度)。
例如,如日本特开第2007-183306号公报中所公开的技术中,第一麦克风阵列处理单元26和第二麦克风阵列处理单元27基于背景噪声频谱来执行噪声抑制处理,以通过使用背景噪声频谱的值作为目标来确定抑制的最大量,从而可以抑制音乐噪声(啸声(squealing sound))。
SNR是由用户发出的声音的声音强度电平相对于背景噪声电平的信息。对SNR的计算是通过计算在噪声抑制单元264和274执行噪声抑制处理之后获得的声音信号功率(Pinput)与在噪声抑制处理之后获得的平均噪声功率(Pnoise)之比来获得的。例如,可以使用下面的公式1来计算。通过执行基于SNR的噪声抑制处理,麦克风阵列处理单元26和27执行包括在抑制量和声音质量之间进行适当平衡的麦克风阵列处理。
SNR[dB]=10log10(Pinput/Pnoise)                        (公式1)
由麦克风6a和7a接收的声音信号中,包含来自目标声音源的声音(目标声音)的部分是语音部,而不包含目标声音的声音信号的部分是噪声部。已知的作为确定是否包含目标声音的部分的方法有:当所获取的声音信号的相位差频谱为随机时确定目标声音未接收到;以及使用噪声电平(其通过在不包括朝向目标声音源的方向的方向上设定指向来估算)与输入声音电平之间的差值(SNR)的方法,等等。基于表示所述语音部/噪声部的信息,通过使用噪声部中的声音信号,麦克风阵列处理单元26和27可以估算并且更新背景噪声电平和背景噪声频谱。
表示噪声频带的信息是表示在由麦克风6a和7a接收的声音信号中包含的噪声分量的频率的信息。例如通过使用相位差频谱来估算来自于不是给定声音源方向的其它方向的声音的频带,以作为噪声频带。通过使用在由麦克风6a和7a接收的声音信号中包含的噪声分量,麦克风阵列处理单元26和27可以基于所述表示噪声频带的信息来估算并且更新背景噪声电平和背景噪声频谱。
作为表示朝向给定声音源(讲话者的嘴)方向的方向信息,可以基于由麦克风6a和7a接收的声音信号的语音部中的相位差频谱信息,从相位差频谱的频率轴向的斜度估算出给定声音源的方向。
作为表示噪声源方向的方向信息,可以基于由麦克风6a和7a接收的声音信号的噪声部中的相位差频谱的信息,从相位差频谱的频率轴向的斜度估算噪声源的方向。
基于由麦克风6a和7a接收的声音信号的噪声部中估算出的平均频谱的比率,来估算用于校正麦克风6a和7a的灵敏度的校正值(麦克风灵敏度校正值)。即使在同类型的麦克风部件中,其灵敏度也经常发生±3dB或更大的变化。基于麦克风灵敏度校正值,麦克风阵列处理单元26和27校正由麦克风6a和7a的灵敏度之间的差异引起的声音信号之间的电平(信号值)差值。
在这种情况下,如上所述,根据实施例1的信息转换单元25配置成在其它麦克风阵列处理单元26和27中使用由麦克风阵列处理单元26和27估算和存储的多种使用环境信息。更具体地,当移动电话1的使用模式(正常方式或观看方式)改变时,通知到所述信息转换单元25。当移动电话1的使用模式的改变通知给信息转换单元25时,信息转换单元25将在使用模式改变前的使用模式中存储于麦克风阵列处理单元26(或27)的使用环境信息存储单元262(或272)中的使用环境信息发送给在使用模式改变后的使用模式中的麦克风阵列处理单元27(或26)的使用环境估算单元271(或261)。
通过使用由信息转换单元25获取的使用环境信息作为初始值,在改变后的使用模式中的麦克风阵列处理单元27(或26)开始麦克风阵列处理。因此,即使改变了移动电话1的使用模式,对应于使用模式改变后的使用模式的麦克风阵列处理单元27(或26)也可以移走(take over)由使用模式改变前的使用模式中的麦克风阵列处理单元26(或27)估算出的使用环境信息。
因此,对应于使用模式改变前的使用模式的麦克风阵列处理单元26(或27)中估算出的使用环境信息并不会浪费掉。而且,在对应于使用模式改变后的使用模式的麦克风阵列处理单元27(或26)中,可以在切换使用模式后立即执行基于适当的使用环境信息的噪声抑制处理。这样,在移动电话1的使用模式刚刚改变之后,不会切断用户语音的开头单词,并且即使在使用模式改变时也会持续执行噪声抑制处理以抑制大部分噪声,由此可以保证语音质量。
更具体地,当从对应于使用模式改变前的使用模式的麦克风阵列处理单元27(或26)中获取背景噪声电平或背景噪声频谱时,在切换使用模式后,对应于使用模式改变后的使用模式的麦克风阵列处理单元26(或27)可以紧接着基于适当的背景噪声电平或适当的背景噪声频谱而执行噪声抑制处理。因此,可以防止接收方听到在使用模式切换后紧接着出现的音乐噪声。
当对应于使用模式改变后的使用模式的麦克风阵列处理单元26(或27)从对应于使用模式改变前的使用模式的麦克风阵列处理单元27(或26)获取S/N比时,在切换使用模式后,紧接着执行包括在抑制量和声音质量之间进行适当平衡的麦克风阵列处理。
另外,当对应于使用模式改变后的使用模式的麦克风阵列处理单元26(或27)从对应于使用模式改变前的使用模式的麦克风阵列处理单元27(或26)获取给定声音源的方向信息时,麦克风阵列处理单元26(或27)开始噪声抑制处理,其形成更宽的指向(directivity),使得由所获取的方向信息指示的方向被设定为指向的中心。这样,可以防止在使用模式切换后由于紧接着对语音的初始部分进行抑制而引发的对用户发出的开头单词的切断。由于在使用模式改变前的使用模式中估算出的目标声音源方向可以作为一个线索(hint),因此,与从初始值执行估算相比,可以减少在找到目标声音源的方向之前所花费的时间,并可以早些时候将指向限缩至目标声音源的方向。
而且,当对应于使用模式改变后的使用模式的麦克风阵列处理单元26(或27)从对应于使用模式改变前的使用模式的麦克风阵列处理单元27(或26)获取麦克风灵敏度校正值时,可以在使用模式切换后立即校正麦克风6a和7a之间的灵敏度的差。
图7A和图7B是用于描述由根据实施例1的移动电话1获得的效果的示意图。在图7A和图7B中,背景噪声电平被作为使用环境信息的例子而描述。图7A描述了由噪声抑制装置执行噪声抑制后获得的声音信号的振幅和背景噪声电平,该噪声抑制装置包括这样的配置,其中每当麦克风阵列处理开始操作时都重启对使用环境信息的估算。图7B描述了由根据实施例1的移动电话1执行的噪声抑制处理执行噪声抑制之后,声音信号的振幅和背景噪声电平。
在这种配置中,当切换移动电话1的使用模式时,在使用模式改变后的使用模式中,噪声抑制处理不使用使用模式改变前的使用模式中的使用环境信息,使用模式改变后的使用模式中的使用环境信息是从给定初始值进行估算的。因此,如图7A所示,背景噪声电平在使用模式切换的时刻返回到初始值,并且大约需要四秒才能估算出适当的背景噪声电平。在这个期间,由于没有进行充分的噪声抑制,因此没有充分抑制噪声的不自然的声音会被发送到接收方。
另一方面,当如实施例1所描述的移动电话1的使用模式切换时,在使用模式改变后的使用模式中,噪声抑制处理使用使用模式改变前的使用模式中的使用环境信息的这种配置时,如图7B所示,在使用模式切换后可以立即估算适当的背景噪声电平。因此,由于在使用模式切换后立即执行了充分的噪声抑制,因此即使在打电话过程中移动电话1的使用模式切换,也不会有不自然的声音发送到接收方。
以下将参考操作图描述根据实施例1的移动电话1的噪声抑制处理。图8是描述噪声抑制处理的过程的操作示意图。以下处理由计算单元2根据存储在移动电话1的ROM 3中的程序来执行。
当开始与另一个移动电话通信(语音通信)时,移动电话1的计算单元2(壳体状态确定单元21)基于传感器5的检测结果来确定移动电话1的使用模式(正常方式或观看方式),如步骤S1。计算单元2(麦克风阵列处理控制单元24)基于所确定的使用模式来控制开关22、23和28的选择(如步骤S2),并且将来自声音输入单元6和7的声音信号发送到第一麦克风阵列处理单元26或第二麦克风阵列处理单元27。
计算单元2(第一麦克风阵列处理单元26或二麦克风阵列处理单元27)对从声音输入单元6和7获取的声音信号进行麦克风阵列处理(如步骤S3),并且将抑制噪声后的声音信号通过通信单元9发送到受话方的移动电话。以下将参考图9描述麦克风阵列处理的细节。
计算单元2确定与另一个移动电话的语音通信是否结束,如步骤S4。当确定语音通信未结束时(步骤S4:否),基于传感器5的检测结果来确定移动电话1的使用模式,如步骤S5。基于在步骤S5中确定的使用模式,计算单元2(麦克风阵列处理控制单元24)确定使用模式是否改变,如步骤S6。当确定使用模式未改变时(步骤S6:否),计算单元2向与当前使用模式不对应的麦克风阵列处理单元发送与当前使用模式对应的麦克风阵列处理单元中估算出的使用环境信息,如步骤S8。计算单元2将处理返回到步骤S4以重复步骤S4-S6中的处理。
当确定使用模式改变时(步骤S6:是),计算单元2(信息转换单元25)从对应于使用模式改变前的使用模式的麦克风阵列处理单元26(或27)获得使用环境信息,并且切换使用环境信息的交换方向以向对应于使用模式改变后的使用模式的麦克风阵列处理单元27(或26)发送使用环境信息,如步骤S7。
更具体地,当从正常方式改变为观看方式时,计算单元2(信息转换单元25)读取在第一麦克风阵列处理单元26的使用环境信息存储单元262中存储的使用环境信息,以向第二麦克风阵列处理单元27发送使用环境信息。另一方面,当从观看方式改变为正常方式时,计算单元2(信息转换单元25)读取在第二麦克风阵列处理单元27的使用环境信息存储单元272中存储的使用环境信息,以向第一麦克风阵列处理单元26发送使用环境信息。麦克风阵列处理单元26和27的使用环境估算单元261和271从信息转换单元25获取使用环境信息,将所获取的使用环境信息存储在使用环境信息存储单元262和272中,并分别使用所存储的使用环境信息。
计算单元2将处理返回到步骤S2,基于步骤S5中确定的使用模式来控制开关22、23和28的选择(如步骤S2),并且将来自声音输入单元6和7的声音信号发送到麦克风阵列处理单元26或麦克风阵列处理单元27。计算单元2重复步骤S2-S7中的处理。当确定与另一个移动电话的语音通信结束时(步骤S4:是),计算单元2结束处理。
以下将描述在上述噪声抑制处理中的麦克风阵列处理(图8中的操作步骤S3)。图9是描述噪声抑制处理的过程的操作图。以下处理由计算单元2根据存储在移动电话1的ROM 3中的控制程序来执行。
计算单元2(使用环境估算单元261和271)基于从声音输入单元6和7输入的声音信号并根据移动电话1的使用模式来估算使用环境(如步骤S11),并且在使用环境信息存储单元262和272中存储表示所估算出的使用环境的使用环境信息,如步骤S 12。计算单元2(抑制增益计算单元263和273)使用所估算出的使用环境信息来计算通过噪声抑制单元264和274抑制的抑制增益,如步骤S13。计算单元2(噪声抑制单元264和274)基于计算的抑制增益来执行抑制处理(如步骤S14),并且返回到噪声抑制处理。
在实施例1中,当切换移动电话1的使用模式时,对应于使用模式改变后的使用模式的麦克风阵列处理单元26(或27)使用由对应于使用模式改变前的使用模式的麦克风阵列处理单元27(或26)估算出的使用环境信息。因此,即使麦克风阵列处理单元26和27的操作通过使用模式的改变而切换,也可以基于到此刻为止估算出的使用环境信息,来执行优化的噪声抑制处理。这样,可以在使用模式改变后立即执行优化的噪声抑制处理,并且可以防止由于改变使用模式引起的声音质量的下降。
(实施例2)
以下将描述根据实施例2的移动电话。由于根据实施例2的移动电话可以由与根据实施例1的移动电话1相似的配置实现,因此相似的配置用相似的附图标记表示,并且省略了对相似配置的说明。
根据实施例1的移动电话1具有这样的配置,其中在正常方式和观看方式的任何一种方式下都执行麦克风阵列处理。与此相反,根据实施例2的移动电话配置为在正常方式中执行麦克风阵列处理,而在观看方式中基于由一个麦克风6a接收的声音信号来执行噪声抑制处理。
图10是描述根据实施例2的移动电话1的功能配置的功能方框图。在根据实施例2的移动电话1中,计算单元2具有噪声抑制单元29的功能,以替代图3中描述的第二麦克风阵列处理单元27。根据实施例2的信息转换单元25具有滤波器单元251和逆滤波器单元252。除上述之外的其他配置与实施例1中的配置相同。
尽管没有图示,与第一麦克风阵列处理单元26相似,噪声抑制单元29具有使用环境信息估算单元、使用环境信息存储单元、抑制增益计算单元以及噪声抑制单元的功能。
与实施例1相似,当壳体状态确定单元21通知麦克风阵列处理控制单元24确定结果表示移动电话1处于正常方式时,根据实施例2的麦克风阵列处理控制单元24控制开关22和23的选择,以将来自声音输入单元6和7的声音信号发送到第一麦克风阵列处理单元26。
另一方面,当壳体状态确定单元21通知麦克风阵列处理控制单元24确定结果表示移动电话1处于观看方式时,麦克风阵列处理控制单元24控制开关22和23的选择,以仅将来自声音输入单元6的声音信号发送到噪声抑制单元29。这时,麦克风阵列处理控制单元24控制开关28的选择,以将来自噪声抑制单元29的声音信号发送至给定目的地。
在这种情况下,在实施例2中,尽管第一麦克风阵列处理单元26执行麦克风阵列处理,噪声抑制单元29却使用单个麦克风执行噪声抑制处理。因此,将由第一麦克风阵列处理单元26估算出的使用环境信息简单地替换为由噪声抑制单元29估算出的使用环境信息是很困难的。
因此,当用于第一麦克风阵列处理单元26的使用环境信息发送给噪声抑制单元29以及当噪声抑制单元29的使用环境信息发送给第一麦克风阵列处理单元26时,根据实施例2的信息转换单元25需要将这些使用环境信息转换成用于噪声抑制单元29或第一麦克风阵列处理单元26的使用环境信息。
例如,当噪声抑制单元29使用背景噪声频谱作为使用环境信息时,噪声抑制单元29执行应用高通滤波器的处理来抑制背景噪声频谱的低频分量。因此,在噪声抑制单元29的使用环境信息存储单元中存储的背景噪声频谱是应用了高通滤波器的背景噪声频谱。另一方面,当第一麦克风阵列处理单元26使用背景噪声频谱作为使用环境信息时,第一麦克风阵列处理单元26不执行应用高通滤波器的处理以抑制背景噪声频谱的低频分量。因此,存储在第一麦克风阵列处理单元26的使用环境信息存储单元262中的背景噪声频谱是没有应用高通滤波器的背景噪声频谱。
信息转换单元25具有滤波器单元251和逆滤波器单元252,该滤波器单元251执行应用滤波器的处理,所述滤波器包括与噪声抑制单元29通过使用背景噪声频谱执行噪声抑制处理时所使用的高通滤波器的特性相同,该逆滤波器单元252执行应用滤波器的处理,所述滤波器包括与滤波器单元251所应用的滤波器的特性相反的特性。当在第一麦克风阵列处理单元26的使用环境信息存储单元262存储中的背景噪声频谱发送至噪声抑制单元29时,信息转换单元25通过滤波器单元251执行滤波处理。当存储在噪声抑制单元29的使用环境信息存储单元中的背景噪声频谱发送至第一麦克风阵列处理单元26时,信息转换单元25通过逆滤波器单元252执行滤波处理,以消除高通滤波器的影响。
通过上述配置,在实施例2中,即使在基于移动电话1的使用模式而切换麦克风阵列处理和噪声抑制处理的配置中,麦克风阵列处理中所使用的使用环境信息和噪声抑制处理中所使用的使用环境信息可以是共用的。因此,即使第一麦克风阵列处理单元26和噪声抑制单元29的操作通过移动电话1的使用模式的改变而切换,也可以基于到此刻为止估算出的使用环境信息来执行优化的噪声抑制处理。这样,可以在使用模式改变后立即执行优化的噪声抑制处理,并且可以防止由于改变使用模式而引起的声音质量的下降。
由于根据实施例2的移动电话1执行的噪声抑制处理与实施例1中描述的处理相似,因此将省略对上述的说明。在图8所示操作图中的步骤S7的处理中,当使用环境信息发送给第一麦克风阵列处理单元26或噪声抑制单元29时,根据实施例2的计算单元2(信息转换单元25)会执行给定的转换处理。
(实施例3)
以下将描述根据实施例3的移动电话。由于根据实施例3的移动电话可以由与根据实施例1的移动电话1相似的配置实现,因此相似的配置用相似的附图标记表示,并且省略了对相似配置的说明。
根据实施例1的移动电话1具有如下配置:控制如图3所示的开关22和23的选择,以在使用正常方式中操作第一麦克风阵列处理单元26并且在使用观看方式中操作第二麦克风阵列处理单元27。与上述不同的是,根据实施例3的移动电话具有如下配置:第一麦克风阵列处理单元26和第二麦克风阵列处理单元27两者的操作均不考虑移动电话1的使用模式(即正常方式和观看方式)。
图11是描述根据实施例3的移动电话1的功能配置的功能方框图。在根据实施例3的移动电话1中,计算单元2不包括图3描述的开关22和23的功能。因此,由第一声音输入单元6和第二声音输入单元7获取的声音信号分别发送给第一麦克风阵列处理单元26和第二麦克风阵列处理单元27。因此,第一麦克风阵列处理单元26和第二麦克风阵列处理单元27总是执行麦克风阵列处理而不考虑移动电话1的使用模式。至于对应于不是实际使用模式的实施例的麦克风阵列处理单元26(或27),仅操作使用环境估算单元261(或271)。
当壳体状态确定单元21通知根据实施例3的麦克风阵列处理控制单元24移动电话1处于正常方式时,麦克风阵列处理控制单元24控制开关28的选择以将来自第一麦克风阵列处理单元26的声音信号发送至给定目的地。当壳体状态确定单元21通知麦克风阵列处理控制单元24移动电话1处于观看方式时,麦克风阵列处理控制单元24控制开关28的选择以将来自第二麦克风阵列处理单元27的声音信号发送至给定目的地。这样,基于移动电话1的使用模式的来自第一麦克风阵列处理单元26的声音信号就被发送至给定目的地。
这样,当麦克风阵列处理单元26和27的使用环境估算单元261和271总是不考虑移动电话1的使用模式而操作时,即使在使用模式刚刚改变之后,也能预先估算出使用模式改变后的麦克风阵列处理单元26(或27)中的使用环境信息。由此,可以执行基于优化的使用环境信息的麦克风阵列处理。因此,由于避免了移动电话1的使用模式切换引起的麦克风阵列处理性能的下降,就能够维持良好的声音质量。
另一方面,例如,用于语音部和噪声部的确定处理需要不同的技术。对于与实际移动电话1的使用模式对应的麦克风阵列处理单元26(或27)进行的处理,通过此处理所执行的估算而获得的结果具有相对更高的可靠性实例。因此,如在实施例3中,即使在所有麦克风阵列处理单元26和27都不考虑移动电话1的使用模式而进行操作的这种配置中,仅仅语音部和噪声部的这种使用环境信息可以被麦克风阵列处理单元26和27共享。
因此,当移动电话1的使用模式改变时,根据实施例3的信息转换单元25读取来自对应于使用模式改变前的使用模式的麦克风阵列处理单元26(或27)的使用环境信息存储单元262(或272)的给定使用环境信息。信息转换单元25将读取的使用环境信息发送给对应于使用模式改变后的使用模式的麦克风阵列处理单元27(或26)。
通过上述配置,信息转换单元25总是给出在麦克风阵列处理单元26(或27)(其对应于麦克风阵列处理单元27(或26)当前使用模式)的使用环境信息存储单元262(或272)中存储的语音部和噪声部的确定结果。对应于非当前使用模式的使用模式的麦克风阵列处理单元27(或26)例如使用信息转换单元25获取的语音部和噪声部的确定结果,来估算和更新背景噪声频谱。
这样,当由另一个麦克风阵列处理单元27(或26)估算出的使用环境信息更为优化时,麦克风阵列处理单元26(或27)可以使用更优化的使用环境信息来执行麦克风阵列处理。因此,即使通过移动电话1的使用模式改变而切换麦克风阵列处理单元26和27的操作,麦克风阵列处理单元26和27也可以基于到此刻为止由麦克风阵列处理单元26和27分别估算出的这些使用环境信息来执行优化的噪声抑制处理。这样,可以在使用模式改变后立即执行优化的噪声抑制处理,并且可以防止由于使用模式改变而引起的声音质量的下降。
以下将参考操作图描述由根据实施例3的移动电话1执行的噪声抑制处理。图12是描述噪声抑制处理的过程的操作图。以下处理由计算单元2根据存储在移动电话1的ROM 3中的控制程序来执行。
例如,当开始与另一移动电话通信(语音通信)时,移动电话1的计算单元2(壳体状态确定单元21)基于传感器5的检测结果来确定移动电话1的使用模式(正常方式或观看方式),如步骤S21。计算单元2(第一麦克风阵列处理单元26和第二麦克风阵列处理单元27)对从声音输入单元6和7获取的声音信号执行两种方式的麦克风阵列处理,如步骤S22。麦克风阵列处理的细节与参考图9的实施例1描述的处理相同。至于对应于并非步骤S21中确定的使用模式的使用模式的麦克风阵列处理单元26(或27),仅仅操作使用环境估算单元261(或271)。
计算单元2(麦克风阵列处理控制单元24)基于步骤S21中确定的使用模式来控制开关28的选择(如步骤S23),并且由第一麦克风阵列处理单元26或第二麦克风阵列处理单元27抑制噪声之后的声音信号通过通信单元9发送至受话方的移动电话。
计算单元2确定与另一移动电话的语音通信是否结束,如步骤S24。当确定语音通信没有结束时(步骤S24:否),基于传感器5的检测结果来确定移动电话1的使用模式,如步骤S25。计算单元2(麦克风阵列处理控制单元24)基于在步骤S25中确定的使用模式,确定使用模式是否改变(,如步骤S26。当确定使用模式没有改变时(步骤S26:否),在对应于当前使用模式的麦克风阵列处理单元中估算出的使用环境信息发送给不对应于当前使用模式的麦克风阵列处理单元,如步骤S28。计算单元2将处理返回至步骤S24,以重复步骤S24-S26中的处理。
当确定使用模式改变时(步骤S26:是),计算单元2(信息转换单元25)从对应于使用模式改变前的使用模式的麦克风阵列处理单元26(或27)获取给定的使用环境信息,以切换使用环境信息的交换方向,从而将所述使用环境信息发送给对应于使用模式改变后的使用模式的麦克风阵列处理单元27(或26),如步骤S27。更具体地,将使用环境信息(例如对由实际使用模式的麦克风阵列处理单元26(或27)估算出的语音部和噪声部的确定结果)发送为优化的使用环境信息。
计算单元2将处理返回至步骤S23,以基于在步骤S25中确定的使用模式来控制开关28的选择,如步骤S23。计算单元2重复步骤S23-S27中的处理。当确定与另一移动电话的语音通信结束时(步骤S24:是),计算单元2结束处理。
尽管实施例3被描述为是对实施例1的改进,但也可以将实施例3应用到实施例2的配置中。
(实施例4)
以下描述根据实施例4的移动电话。由于根据实施例4的移动电话可以由与根据实施例3的移动电话1相似的配置实现,因而相似的配置用相似的附图标记表示,并且省略了对相似配置的说明。
根据实施例3的移动电话1具有这样的配置,其中,由麦克风阵列处理单元26和27的使用环境估算单元261和271这两者不考虑使用模式而估算使用环境信息。根据实施例4的移动电话不仅执行使用环境信息的估算,还由噪声抑制单元264和274执行噪声抑制处理以对比由噪声抑制单元264和274执行的麦克风阵列处理所抑制的噪声抑制量,并且将比较结果通知用户(讲话者)。
图13是描述根据实施例4的移动电话1d的功能配置的功能方框图。在根据实施例4的移动电话1中,计算单元2不仅具有图11描述的配置,还具有SNR比较单元30和屏幕显示控制单元31的功能。根据实施例4的麦克风阵列处理单元26和27不仅具有图4描述的配置,还具有SNR计算单元265和275。
根据实施例4的麦克风阵列处理单元26和27的SNR计算单元265和275,基于公式1使用由噪声抑制单元264和274的噪声抑制处理来计算SNR。SNR是用户发出的语音信号电平和噪声分量电平之比。SNR越高,意味着声音质量越高。SNR计算单元265和275将计算出的SNR发给SNR比较单元30。
SNR比较单元30比较从SNR计算单元265和275获取的SNR,以确定对应于由壳体状态确定单元21确定的当前使用模式的麦克风阵列处理单元26(或27)中的SNR是否小于另一个麦克风阵列处理单元27(或26)中的SNR。当对应于当前使用模式的麦克风阵列处理单元26(或27)中的SNR小于另一个麦克风阵列处理单元27(或26)中的SNR时,SNR比较单元30将结果通知屏幕显示控制单元31。
基于ROM 3中预先存储的屏幕信息,屏幕显示控制单元31产生屏幕信息以使显示单元11显示所述屏幕信息,所述屏幕信息显示在非当前使用模式的使用模式中获得了更高的SNR。图14是描述显示屏的配置的示意图。图14描述的显示屏幕是这样的屏幕,其通知在观看方式下使用移动电话1的用户,在正常方式下的语音通信会比在观看方式下具有更高的质量。
这样,当通知用户在非当前使用模式的使用模式下可以以更高的质量执行语音通信时,用户可以知道适于噪声抑制处理的使用模式。当用户切换成通知的使用模式时,可以执行基于优化的噪声抑制的声音信号的语音通信。根据实施例4的移动电话1配置为通过图14描述的通知屏幕来通知使用另一使用模式会更好。但是,例如,也可以由音频导语来进行通知。除了使用SNR的配置外,还可以使用其中对麦克风阵列处理单元26和27的噪声抑制的抑制量进行对比的配置。
以下将描述由实施例4中的麦克风阵列处理单元26和27执行的麦克风阵列处理。图15是描述麦克风阵列处理过程的操作图。下述处理由计算单元2根据存储在移动电话1的ROM 3中的控制程序来执行。
计算单元2(使用环境估算单元261和271)基于从声音输入单元6和7输入的声音信号来估算基于移动电话1的使用模式的使用环境(如步骤S31),并且在使用环境信息存储单元262和272中存储表示估算出的使用环境的使用环境信息,如步骤S32。计算单元2(抑制增益计算单元263和273)通过使用所估算出的使用环境信息来计算由噪声抑制单元264和274抑制的抑制增益,如步骤S33。计算单元2(噪声抑制单元264和274)基于所计算的抑制增益来执行抑制处理,如步骤S34。计算单元2(SNR计算单元265和275)通过噪声抑制单元264和274使用公式1来计算SNR(如步骤S35),以返回至噪声抑制处理。
以将参考操作图来描述根据实施例4的移动电话1的噪声抑制处理,该移动电话1包括执行麦克风阵列处理的麦克风阵列处理单元26和27。图16是描述噪声抑制处理过程的操作图。计算单元2根据存储在移动电话1的ROM 3中的控制程序来执行下述处理。
例如,当开始与另一移动电话通信(语音通信)时,移动电话1的计算单元2(壳体状态确定单元21)基于传感器5的检测结果确定移动电话1的使用模式(正常方式或观看方式),如步骤S41。参考图15描述计算单元2(第一麦克风阵列处理单元26和第二麦克风阵列处理单元27)对从声音输入单元6和7获取的声音信号执行麦克风阵列处理,如步骤S42。
计算单元2(麦克风阵列处理控制单元24)基于在步骤S41中确定的使用模式来控制开关28的选择(如步骤S43),且经由第一麦克风阵列处理单元26或第二麦克风阵列处理单元27抑制噪声之后的声音信号通过通信单元9发送至受话方的移动电话。
计算单元2(SNR比较单元30)比较由麦克风阵列处理单元26和27的SNR计算单元265和275计算出的SNR,如步骤S44。基于对麦克风阵列处理单元26(或27)(其对应于当前使用模式)中的SNR是否小于另一麦克风阵列处理单元27(或26)中的SNR的确定,计算单元2确定是否有必要通知客户,如步骤S45。当对应于当前使用模式的麦克风阵列处理单元26(或27)中的SNR小于另一麦克风阵列处理单元27(或26)中的SNR时,计算单元2确定有必要通知客户。
当确定有必要通知客户时(步骤S45:是),计算单元2产生屏幕信息以显示屏幕(如图14所示),并且使得显示单元11显示所述屏幕信息,如步骤S46。当确定没必要通知客户时(步骤S45:否),计算单元2跳过步骤S46的处理以确定与另一移动电话的语音通信是否结束,如步骤S47。
当确定语音通信未结束时(步骤S47:否),计算单元2基于传感器5的检测结果确定移动电话1的使用模式,如步骤S48。计算单元2(麦克风阵列处理控制单元24)基于在步骤S48中确定的使用模式来确定使用模式是否改变,如S49。当确定使用模式未改变(步骤S49:否)时,计算单元2将对应于当前使用模式的麦克风阵列处理单元中估算出的使用环境信息发送给不对应于当前使用模式的麦克风阵列处理单元,如步骤S51。计算单元2将处理返回到步骤S47以重复步骤S47-S49中的处理。
当确定使用模式改变时(步骤S49:是),计算单元2(信息转换单元25)从对应于使用模式改变前的使用模式的麦克风阵列处理单元26(或27)中获取给定使用环境信息,并且切换使用环境信息的交换方向以将使用环境信息发送给对应于使用模式改变后的使用模式的麦克风阵列处理单元27(或26),如步骤S50。
计算单元2将处理返回到步骤S43,以基于步骤S48中确定的使用模式来控制开关28的选择,如步骤S43。计算单元2重复步骤S43-S51中的处理。当确定与另一移动电话的语音通信结束时(步骤S47:是),处理结束。
(实施例5)
以下将描述根据实施例5的移动电话。根据实施例5的移动电话可以由与根据实施例1的移动电话1相似的配置实现,相似的配置用相似的附图标记表示,并且省略了对相似配置的说明。
根据实施例1-4的移动电话1配置有两个麦克风6a和7a。而根据实施例5的移动电话1配置有三个麦克风。注意,麦克风的数量不限于两个或三个。
图17A和图17B为分别描述根据实施例5的移动电话配置的示意图。图17A和图17B仅描述移动电话1的合盖状态。图17A是移动电话1的外部立体图,其中壳体1a具有面朝上的显示单元11,而图17B是移动电话1的外部立体图,其中壳体1b具有面朝上的操作单元10。
除了根据图1A、图1B和图1C描述的实施例1的移动电话1中所包括的配置元件之外,根据实施例5的移动电话1还具有麦克风12a,该麦克风12a位于与设置有壳体1b的操作单元10的表面相对的表面的适当位置处。
以下将描述在根据实施例5的移动电话1中,通过由计算单元2执行存储在ROM 3中的各种控制程序而实现的移动电话1的功能。图18是描述根据实施例5的移动电话1的功能配置的功能方框图。根据实施例5的移动电话1的计算单元2可以具有输入切换单元32,以替换图3中描述的配置中的开关22和23。
根据实施例5的移动电话1具有包括麦克风12a、放大器及A/D转换器(未图示)的第三声音输入单元12。第一声音输入单元6、第二声音输入单元7及第三声音输入单元12将通过接收声音而获得的声音信号发送到输入切换单元32。
根据实施例5的麦克风阵列处理控制单元24基于由壳体状态确定单元21通知的移动电话的使用模式,通过输入切换单元32来控制选择,以将来自声音输入单元6、7及12其中两个的声音信号发送至麦克风阵列处理单元26(或27)。
更具体地,当通知麦克风阵列处理控制单元24处于正常方式时,麦克风阵列处理控制单元24控制输入切换单元32将来自声音输入单元6和7的声音信号发送至第一麦克风阵列处理单元26。当通知麦克风阵列处理控制单元24处于观看方式时,麦克风阵列处理控制单元24控制输入切换单元32将从声音输入单元6和12输入的声音信号发送至第二麦克风阵列处理单元27。
通过这样的配置,根据实施例5的移动电话1可以获得图19A和图19B中描述的指向图案。图19A和图19B为分别描述根据实施例5的移动电话1中指向图案的示意图。在根据实施例5的移动电话1中,如图19A所示,在正常方式下,可以接收到包括锥形指向图案(以两个麦克风7a和6a的连线作为中心线)的声音,并且执行噪声抑制,使得指向的死区形成在设置有麦克风7a的侧表面这一侧。而且,如图19B所示,在观看方式下,可以接收到包括锥形指向图案(以两个麦克风12a和6a的连线作为中心线)的声音,并且执行噪声抑制,使得指向的死区形成在设置有麦克风12a的侧表面这一侧。
这样,在根据实施例5的移动电话1中,基于使用模式适当地切换用于麦克风阵列处理的两个麦克风,从而总能形成锥形指向图案,其中该锥形指向图案不会形成与朝向目标声音源(讲话者的嘴)的方向相反的方向上的指向。因此,在根据实施例5的移动电话1中,由于可以执行优化的噪声抑制处理而不用考虑使用模式,但可以维持优选的声音质量。
由于根据实施例5的移动电话1执行的噪声抑制处理与实施例1中描述的处理相似,因此省略了对相似处理的说明。在图8描述的操作图中的步骤S2的处理中,根据实施例5的计算单元2(麦克风阵列处理控制单元24)从三个声音输入单元6、7及12中选择两个,并且控制输入切换单元32以将来自所选择的两个声音输入单元的声音信号发送至麦克风阵列处理单元26和27中的任一个。
(实施例6)
以下将描述根据实施例6的移动电话。由于根据实施例6的移动电话可以由与根据实施例5的移动电话1相似的配置实现,因此相似的配置用相似的附图标记表示,并且省略了对相似配置的说明。
根据实施例5的移动电话1可以配置为使从三个麦克风6a、7a和12a中选择的两个麦克风在使用于正常方式和使用于观看方式之间切换,以执行麦克风阵列处理。在根据实施例6的移动电话1中,除了使用于正常方式和使用与观看方式之外,还可以在正常方式下、讲话者将扬声器8a靠近讲话者的耳朵时使用移动电话1的语音通信方式(在实施例6中也叫做正常方式)和讲话者观看显示单元11的显示屏幕时使用移动电话1的方式(以下叫做电视电话方式)之间切换。
因此,根据实施例6的移动电话1具有这样的配置,其中执行麦克风阵列处理,使得三个麦克风6a、7a及12a在使用于正常方式、使用于观看方式及使用于电视电话方式之间切换。在根据实施例6的移动电话中,在观看方式状态中讲话者观看显示单元11的显示屏幕时使用移动电话1的方式也是可用的。但是,为了简化说明,在实施例6中,将描述上述正常方式、观看方式及电视电话方式的配置的例子。
图20是描述根据实施例6的移动电话1的功能配置的功能方框图。在根据实施例6的移动电话1中,除了图18中描述的功能之外,计算单元2还具有第三麦克风阵列处理单元33的功能。第三麦克风阵列处理单元33具有与图4中描述的第一麦克风阵列处理单元26和第二麦克风阵列处理单元27相似的配置。
根据实施例6的移动电话1配置为能够选择语音通信和电视电话通信。根据实施例6的移动电话1仅向接收方的移动电话发送音频信号。当选择电视电话通信时,根据实施例6的移动电话1向接收方的移动电话发送音频信号以及由设置在移动电话1上的摄像机(未图示)拍摄所得的图像信号。
将表示语音通信或电视电话通信的信息输入到根据实施例6的麦克风阵列控制单元24。基于表示语音通信或电视电话通信的信息以及由壳体状态确定单元21通知的移动电话1的使用模式,麦克风阵列处理控制单元24确定方式是正常方式、观看方式还是电视电话方式。麦克风阵列处理控制单元24基于确定的方式控制由输入切换单元32所执行的选择,以将来自于声音输入单元6、7和12其中两个的声音信号发送至麦克风阵列处理单元26(或27或33)。
更具体地,当确定其设置为正常方式时,麦克风阵列处理控制单元24控制输入切换单元32发送来自声音输入单元6和7的声音信号。当麦克风阵列处理控制单元24被通知其设置为观看方式时,麦克风阵列处理控制单元24控制输入切换单元32以将来自声音输入单元6和12的声音信号发送至第二麦克风阵列处理单元27。而且,当确定其设置为电视电话方式时,麦克风阵列处理控制单元24控制输入切换单元32以将来自声音输入单元6和12的声音信号发送至第三麦克风阵列处理单元33。
当从两个声音输入单元输入声音信号时,麦克风阵列处理单元26、27及33中的每一个都使用存储在每个使用环境信息存储单元262、272及332中的使用环境信息来执行麦克风阵列处理,从而将抑制噪声后的声音信号通过开关28发送至给定目的地。
通过上述配置,根据实施例6的移动电话1可以获得图21A和图21B描述的指向图案。图21A和图21B为分别描述根据实施例6的移动电话中的指向图案的示意图。在根据实施例6的移动电话1中,如图21A所示,在正常方式下,可以接收到包括锥形指向图案(以两个麦克风7a和6a的连线作为中心线)的声音,并且执行噪声抑制,使得指向的死区形成在设置有麦克风7a的侧表面这一侧。
如图21B所示,在电视电话方式下,可以接收到包括锥形指向图案(以两个麦克风12a和6a的连线作为中心线)的声音,并且执行噪声抑制,使得指向的死区形成在设置有麦克风12a的侧表面这一侧。在观看方式下,获得如图19B所示的指向图案。
在根据实施例6的移动电话1中,待执行的麦克风阵列处理单元26、27及33不仅通过壳体状态(正常方式和观看方式)的改变而切换,还通过声音输入方式(例如语音通信和电视电话通信)的改变而切换。因此,即使切换了声音输入方式,也可以执行优化的麦克风阵列处理。如图21A和图21B所示,不管使用模式如何,根据实施例6的移动电话1均会形成锥形指向图案,该锥形指向图案不会形成与朝向目标声音源(讲话者的嘴)的方向相反的方向上的指向图案。这样,在任意使用模式下,噪声抑制处理的性能都不会降低。
由于根据实施例6的移动电话1执行的噪声抑制处理与实施例1中描述的处理执行相似的处理,因此省略了对相似处理的说明。在图8描述的操作图中的步骤S1和S5的处理中,根据实施例6的计算单元2(麦克风阵列处理控制单元24)确定使用模式是正常方式、观看方式还是电视电话方式。更具体地,基于由壳体状态确定单元21通知的移动电话1的壳体状态以及表示语音通信或电视电话通信的信息,麦克风阵列处理控制单元24确定所使用的使用模式是哪一个。
(实施例7)
以下将描述根据实施例7的移动电话。由于根据实施例7的移动电话优选由与根据实施例1的移动电话1相似的配置实现,因此相似的配置用相似的附图标记表示,并且省略了对相似配置的说明。
根据实施例1-6的移动电话1具有这样的配置,其中麦克风阵列处理单元26、27和33中的每一个均具有使用环境信息存储单元262、272和332。更具体地,当移动电话1的使用模式改变时,信息转换单元25从麦克风阵列处理单元26(或27或33)(其对应于使用模式改变前的使用模式)的使用环境信息存储单元262(或272、332)读取使用环境信息,以将使用环境信息发送至对应于使用模式改变后的使用模式的麦克风阵列处理单元27(或26或33)。与上述相反的是,根据实施例7的移动电话1具有这样的配置,其中麦克风阵列处理单元26、27和33中的每一个都不包括使用环境信息存储单元262、272和332。
图22是描述根据实施例7的移动电话1的功能配置的功能方框图。在根据实施例7的移动电话1中,计算单元2具有与图3中相似的功能,并且将使用环境信息存储单元(存储单元)251连接到信息转换单元25。作为应用环境信息存储单元251,例如可以用RAM 4的给定区域、以及用额外设置的内存单元来实现。麦克风阵列处理单元26和27包括与图4中相似的配置。但是,麦克风阵列处理单元26和27不包括使用环境信息存储单元262和272。
根据实施例7的信息转换单元25依次获取由麦克风阵列处理单元26和27估算出的那些使用环境信息,并将所述使用环境信息存储至使用环境信息存储单元251。当将使用环境信息存储在使用环境信息存储单元251中时,信息转换单元25可以存储与用来识别麦克风阵列处理单元26和27的信息(所述识别信息用来估算使用环境信息)相关联的这些使用环境信息,或者可以将这些使用环境信息转换成用于与给定使用模式对应的使用模式中的使用环境信息并加以存储。信息转换单元25的配置不限于其中将由麦克风阵列处理单元26和27估算出的这些使用环境信息依次存储在使用环境信息存储单元251中的配置。信息转换单元25还可以具有这样的配置,其中当移动电话1的使用模式改变时,将使用环境信息存储在使用环境信息存储单元251中。
信息转换单元25读取存储在使用环境信息存储单元251中的使用环境信息,以根据麦克风阵列处理控制单元24的指示而将使用环境信息发送至麦克风阵列处理单元26(或27)。更具体地,当用于正常方式时,信息转换单元25将使用环境信息发送至第一麦克风阵列处理单元26,当用于观看方式时,将使用环境信息发送至第二麦克风阵列处理单元27。当信息转换单元25将从使用环境信息存储单元251读取的这些使用环境信息发送至麦克风阵列处理单元26和27中的每一个时,信息转换单元25根据需要对与麦克风阵列处理单元26和27对应的使用环境信息执行转换处理。
通过这样的配置,在根据实施例7的移动电话1中,由多个麦克风阵列处理单元26和27估算出的那些使用环境信息在使用环境信息存储单元251中统一管理。因此,在包括三个或更多个麦克风阵列处理单元的配置的移动电话1中,可以简化针对使用环境信息的发送处理。
更具体地,在如根据实施例6的移动电话1中包括三个麦克风阵列处理单元26、27及33的配置中,麦克风阵列处理单元26(或27或33)中的任一个都必须基于使用模式改变前后的使用模式,将使用环境信息发送至麦克风阵列处理单元27(或26或33)。但是,在根据实施例7的移动电话1中,由于从使用环境信息存储单元251读取的使用环境信息可以发送至麦克风阵列处理单元中的任一个,因此可以简化处理。
由于根据实施例7的移动电话1执行的噪声抑制处理执行与实施例1描述的相似处理,因此省略了相应的说明。在图8描述的操作图的步骤S7的处理中,根据实施例7的计算单元2(信息转换单元25)执行将从使用环境信息存储单元251读取的使用环境信息发送至对应于使用模式改变后的使用模式的麦克风阵列处理单元26(或27)的处理。
(实施例8)
以下描述根据实施例8的移动电话。实施例8描述了对根据实施例1-7的移动电话1的外观的改型。图23A、图23B和图23C为分别描述根据实施例8的移动电话1的配置的示意图。图23A是处于翻开状态的移动电话1的外部立体图,图23B是处于合盖状态的移动电话1从壳体1a这一侧观看时的外部立体图,而图23C是处于合盖状态的移动电话1从壳体1b这一侧观看时的外部立体图。
在根据实施例8的移动电话1中,包括显示单元11的第一壳体1a和包括操作单元10的第二壳体1b通过铰接部1d互连。铰接部1d可以将图23A、图23B和图23C中的竖直方向用作枢转轴并相对于壳体1b枢转180°。如图23A所示,移动电话1的状态可以改变成如图23A所示操作单元10翻开的状态和如图23B所示操作单元10关闭的状态。在根据实施例8的移动电话1中,麦克风6a设置在铰接部(可移动部)1d上,而麦克风7a设置在与设置有壳体1b的操作单元10的表面相对的表面上。
这样,通过将麦克风6a设置在枢转铰接部1d上,在根据实施例8的移动电话1中,使用两个麦克风6a和7a的麦克风阵列处理可以在使用正常方式或使用观看方式中执行。
在此针对所有例子和条件性语言的描述均是用于教示(pedagogical)意图,以帮助读者理解发明人为发展本技术领域所贡献的发明和概念,这些描述应该解释(construed)为不局限于这里特别列举的例子和条件,也不局限于说明书中涉及本发明的优点和缺点的这些例子的组合。尽管已对本发明的实施例做了详细描述,但应当理解在不偏离本发明的构思和范围的情况下,可以对其作出各种变更、替换和改型。

Claims (11)

1.一种噪声抑制装置,通过多个声音接收单元来接收声音信号,并且抑制在输入的声音信号中包含的噪声分量,该装置包括:
检测单元,从多种使用模式中检测所述噪声抑制装置的使用模式,在所述多种使用模式中,所述多个声音接收单元的位置关系和/或所述多个声音接收单元与目标声音源之间的位置关系彼此不同;
转换单元,将在对所述多个声音接收单元输入的每个声音信号进行噪声抑制处理中所使用的使用环境信息转换成与由所述检测单元检测出的使用模式一致的使用环境信息;以及
抑制单元,使用由所述转换单元转换的使用环境信息对所述声音信号执行噪声抑制处理。
2.根据权利要求1所述的噪声抑制装置,还包括估算单元,估算根据所述使用模式的使用环境,其中
对于由所述估算单元估算出的使用环境,所述转换单元将表示此使用环境的使用环境信息转换成与由所述检测单元检测出的使用模式一致的使用环境信息。
3.根据权利要求2所述的噪声抑制装置,还包括存储单元,对于与由所述估算单元估算出的使用模式一致的使用环境,所述存储单元将表示此使用环境的多条使用环境信息与所述使用模式相关地存储,其中
所述转换单元将存储在所述存储单元中的使用环境信息转换成与由所述检测单元检测出的使用模式一致的使用环境信息。
4.根据权利要求2所述的噪声抑制装置,其中所述估算单元
根据由所述检测单元检测出的使用模式,通过使用由所述声音接收单元输入的声音信号中的语音部和噪声部、以及所述语音部和所述噪声部的信息,来估算背景噪声电平和/或背景噪声频谱,以及
通过使用针对当前使用模式估算出的所述语音部和所述噪声部的信息,估算与非当前使用模式的使用模式对应的背景噪声电平和/或背景噪声频谱。
5.根据权利要求2所述的噪声抑制装置,还包括:
计算单元,根据所述使用模式来计算受到所述抑制单元的噪声抑制处理的声音信号的S/N比和/或所述抑制单元在噪声抑制处理中的抑制量;
比较单元,比较根据使用模式计算出的S/N比和/或所述抑制量;以及
通知单元,将比较结果通知到外部;其中
所述估算单元基于由所述声音接收单元输入的声音信号,来估算与所述使用模式对应的使用环境,以及
对于与由所述估算单元估算出的使用模式对应的使用环境,所述抑制单元通过使用表示此使用环境的多条使用环境信息,对所述声音信号执行噪声抑制处理。
6.根据权利要求1所述的噪声抑制装置,其中所述声音接收单元的使用模式是可互选的,并且还包括:
方向信息存储单元,将表示给定声音源的方向的多条方向信息与所述声音输入单元的使用模式相关地存储,其中
对于由所述检测单元检测出的声音输入单元的使用模式,所述抑制单元通过使用与此使用模式相关地存储的方向信息、并基于所述使用模式来执行噪声抑制处理。
7.根据权利要求1所述的噪声抑制装置,其中
所述噪声抑制装置包括至少三个声音接收单元,以及
选择单元,根据所述使用模式来选择多个声音输入单元,其中
所述抑制单元对输入到所选择的声音接收单元的声音信号执行噪声抑制处理。
8.根据权利要求1所述的噪声抑制装置,其中
所述使用环境信息是包括以下至少之一的信息:背景噪声电平、背景噪声频谱的统计值、表示语音部和噪声部的信息、表示给定声音源方向的方向信息、表示噪声源方向的方向信息、S/N比以及校正所述多个声音接收单元的灵敏度变化的校正值。
9.一种移动电话,包括:
根据权利要求1-8中任一项所述的噪声抑制装置,其中
所述噪声抑制装置中包括的多个声音接收单元是麦克风。
10.根据权利要求9所述的移动电话,还包括:
壳体,包括可移动部,在所述可移动部上设置所述声音接收单元中的至少一个,其中
移动所述可移动部,以改变所述多个声音接收单元的设置位置。
11.一种噪声抑制方法,其中噪声抑制装置通过多个声音接收单元来接收声音信号,并抑制在输入的声音信号中包含的噪声分量,所述方法包括:
用于多种使用模式中,且在所述多种使用模式中,所述多个声音接收单元的位置关系和/或所述多个声音接收单元与目标声音源之间的位置关系彼此不同;
检测接收声音时的使用模式;
对通过多个声音接收单元输入的声音信号进行噪声抑制处理时,将其中所使用的使用环境信息转换成基于所检测出的使用模式的使用环境信息;以及
使用转换后的使用环境信息对声音信号执行噪声抑制处理。
CN2009101513278A 2008-08-27 2009-06-30 噪声抑制装置、移动电话和噪声抑制方法 Expired - Fee Related CN101661753B (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
JP2008218610A JP5206234B2 (ja) 2008-08-27 2008-08-27 雑音抑圧装置、携帯電話機、雑音抑圧方法及びコンピュータプログラム
JP2008-218610 2008-08-27
JP2008218610 2008-08-27

Publications (2)

Publication Number Publication Date
CN101661753A true CN101661753A (zh) 2010-03-03
CN101661753B CN101661753B (zh) 2012-07-04

Family

ID=40999940

Family Applications (1)

Application Number Title Priority Date Filing Date
CN2009101513278A Expired - Fee Related CN101661753B (zh) 2008-08-27 2009-06-30 噪声抑制装置、移动电话和噪声抑制方法

Country Status (5)

Country Link
US (1) US8620388B2 (zh)
EP (1) EP2159791B1 (zh)
JP (1) JP5206234B2 (zh)
KR (1) KR101084420B1 (zh)
CN (1) CN101661753B (zh)

Cited By (70)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102946493A (zh) * 2012-11-27 2013-02-27 康佳集团股份有限公司 一种移动终端通话环境音调节方法
CN103002171A (zh) * 2011-09-30 2013-03-27 斯凯普公司 处理音频信号
CN103077725A (zh) * 2012-12-31 2013-05-01 东莞宇龙通信科技有限公司 语音处理的方法及装置
CN103929557A (zh) * 2013-01-11 2014-07-16 华为技术有限公司 语音会议噪声处理方法及装置
CN105357566A (zh) * 2015-10-29 2016-02-24 青岛歌尔声学科技有限公司 一种语音遥控器及其供电方法
CN105469806A (zh) * 2014-09-12 2016-04-06 联想(北京)有限公司 一种声音处理方法、装置及系统
CN105654960A (zh) * 2015-09-21 2016-06-08 宇龙计算机通信科技(深圳)有限公司 一种对终端声音消噪的处理方法及装置
CN105957527A (zh) * 2016-05-16 2016-09-21 珠海格力电器股份有限公司 一种语音控制电器的方法、装置及语音控制空调
CN107087208A (zh) * 2017-05-25 2017-08-22 深圳市酷开网络科技有限公司 一种全景视频播放方法、系统及存储装置
CN109997370A (zh) * 2016-09-30 2019-07-09 搜诺思公司 多取向回放设备麦克风
US10606555B1 (en) 2017-09-29 2020-03-31 Sonos, Inc. Media playback system with concurrent voice assistance
US10614807B2 (en) 2016-10-19 2020-04-07 Sonos, Inc. Arbitration-based voice recognition
US10692518B2 (en) 2018-09-29 2020-06-23 Sonos, Inc. Linear filtering for noise-suppressed speech detection via multiple network microphone devices
US10714115B2 (en) 2016-06-09 2020-07-14 Sonos, Inc. Dynamic player selection for audio signal processing
US10743101B2 (en) 2016-02-22 2020-08-11 Sonos, Inc. Content mixing
US10811015B2 (en) 2018-09-25 2020-10-20 Sonos, Inc. Voice detection optimization based on selected voice assistant service
US10847178B2 (en) 2018-05-18 2020-11-24 Sonos, Inc. Linear filtering for noise-suppressed speech detection
US10847164B2 (en) 2016-08-05 2020-11-24 Sonos, Inc. Playback device supporting concurrent voice assistants
US10847143B2 (en) 2016-02-22 2020-11-24 Sonos, Inc. Voice control of a media playback system
US10871943B1 (en) 2019-07-31 2020-12-22 Sonos, Inc. Noise classification for event detection
US10880644B1 (en) 2017-09-28 2020-12-29 Sonos, Inc. Three-dimensional beam forming with a microphone array
US10880650B2 (en) 2017-12-10 2020-12-29 Sonos, Inc. Network microphone devices with automatic do not disturb actuation capabilities
US10878811B2 (en) 2018-09-14 2020-12-29 Sonos, Inc. Networked devices, systems, and methods for intelligently deactivating wake-word engines
US10891932B2 (en) 2017-09-28 2021-01-12 Sonos, Inc. Multi-channel acoustic echo cancellation
US10959029B2 (en) 2018-05-25 2021-03-23 Sonos, Inc. Determining and adapting to changes in microphone performance of playback devices
US10970035B2 (en) 2016-02-22 2021-04-06 Sonos, Inc. Audio response playback
US11017789B2 (en) 2017-09-27 2021-05-25 Sonos, Inc. Robust Short-Time Fourier Transform acoustic echo cancellation during audio playback
US11024331B2 (en) 2018-09-21 2021-06-01 Sonos, Inc. Voice detection optimization using sound metadata
US11042355B2 (en) 2016-02-22 2021-06-22 Sonos, Inc. Handling of loss of pairing between networked devices
US11076035B2 (en) 2018-08-28 2021-07-27 Sonos, Inc. Do not disturb feature for audio notifications
US11080005B2 (en) 2017-09-08 2021-08-03 Sonos, Inc. Dynamic computation of system response volume
US11100923B2 (en) 2018-09-28 2021-08-24 Sonos, Inc. Systems and methods for selective wake word detection using neural network models
US11132989B2 (en) 2018-12-13 2021-09-28 Sonos, Inc. Networked microphone devices, systems, and methods of localized arbitration
US11138969B2 (en) 2019-07-31 2021-10-05 Sonos, Inc. Locally distributed keyword detection
US11138975B2 (en) 2019-07-31 2021-10-05 Sonos, Inc. Locally distributed keyword detection
US11159880B2 (en) 2018-12-20 2021-10-26 Sonos, Inc. Optimization of network microphone devices using noise classification
US11175880B2 (en) 2018-05-10 2021-11-16 Sonos, Inc. Systems and methods for voice-assisted media content selection
US11183181B2 (en) 2017-03-27 2021-11-23 Sonos, Inc. Systems and methods of multiple voice services
US11183183B2 (en) 2018-12-07 2021-11-23 Sonos, Inc. Systems and methods of operating media playback systems having multiple voice assistant services
US11184969B2 (en) 2016-07-15 2021-11-23 Sonos, Inc. Contextualization of voice inputs
US11189286B2 (en) 2019-10-22 2021-11-30 Sonos, Inc. VAS toggle based on device orientation
US11197096B2 (en) 2018-06-28 2021-12-07 Sonos, Inc. Systems and methods for associating playback devices with voice assistant services
US11200889B2 (en) 2018-11-15 2021-12-14 Sonos, Inc. Dilated convolutions and gating for efficient keyword spotting
US11200894B2 (en) 2019-06-12 2021-12-14 Sonos, Inc. Network microphone device with command keyword eventing
US11200900B2 (en) 2019-12-20 2021-12-14 Sonos, Inc. Offline voice control
US11302326B2 (en) 2017-09-28 2022-04-12 Sonos, Inc. Tone interference cancellation
US11308958B2 (en) 2020-02-07 2022-04-19 Sonos, Inc. Localized wakeword verification
US11308962B2 (en) 2020-05-20 2022-04-19 Sonos, Inc. Input detection windowing
US11315556B2 (en) 2019-02-08 2022-04-26 Sonos, Inc. Devices, systems, and methods for distributed voice processing by transmitting sound data associated with a wake word to an appropriate device for identification
US11343614B2 (en) 2018-01-31 2022-05-24 Sonos, Inc. Device designation of playback and network microphone device arrangements
US11361756B2 (en) 2019-06-12 2022-06-14 Sonos, Inc. Conditional wake word eventing based on environment
US11380322B2 (en) 2017-08-07 2022-07-05 Sonos, Inc. Wake-word detection suppression
US11405430B2 (en) 2016-02-22 2022-08-02 Sonos, Inc. Networked microphone device control
US11432030B2 (en) 2018-09-14 2022-08-30 Sonos, Inc. Networked devices, systems, and methods for associating playback devices based on sound codes
US11482224B2 (en) 2020-05-20 2022-10-25 Sonos, Inc. Command keywords with input detection windowing
US11482978B2 (en) 2018-08-28 2022-10-25 Sonos, Inc. Audio notifications
US11501773B2 (en) 2019-06-12 2022-11-15 Sonos, Inc. Network microphone device with command keyword conditioning
US11551700B2 (en) 2021-01-25 2023-01-10 Sonos, Inc. Systems and methods for power-efficient keyword detection
US11556307B2 (en) 2020-01-31 2023-01-17 Sonos, Inc. Local voice data processing
US11556306B2 (en) 2016-02-22 2023-01-17 Sonos, Inc. Voice controlled media playback system
US11562740B2 (en) 2020-01-07 2023-01-24 Sonos, Inc. Voice verification for media playback
US11641559B2 (en) 2016-09-27 2023-05-02 Sonos, Inc. Audio playback settings for voice interaction
US11646023B2 (en) 2019-02-08 2023-05-09 Sonos, Inc. Devices, systems, and methods for distributed voice processing
US11664023B2 (en) 2016-07-15 2023-05-30 Sonos, Inc. Voice detection by multiple devices
US11676590B2 (en) 2017-12-11 2023-06-13 Sonos, Inc. Home graph
US11698771B2 (en) 2020-08-25 2023-07-11 Sonos, Inc. Vocal guidance engines for playback devices
US11727919B2 (en) 2020-05-20 2023-08-15 Sonos, Inc. Memory allocation for keyword spotting engines
US11798553B2 (en) 2019-05-03 2023-10-24 Sonos, Inc. Voice assistant persistence across multiple network microphone devices
US11899519B2 (en) 2018-10-23 2024-02-13 Sonos, Inc. Multiple stage network microphone device with reduced power consumption and processing load
US11983463B2 (en) 2021-10-04 2024-05-14 Sonos, Inc. Metadata exchange involving a networked playback system and a networked microphone system

Families Citing this family (43)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7856252B2 (en) * 2007-11-02 2010-12-21 Agere Systems Inc. Method for seamless noise suppression on wideband to narrowband cell switching
JP5407848B2 (ja) * 2009-12-25 2014-02-05 富士通株式会社 マイクロホンの指向性制御装置
JP5672770B2 (ja) 2010-05-19 2015-02-18 富士通株式会社 マイクロホンアレイ装置及び前記マイクロホンアレイ装置が実行するプログラム
US9313306B2 (en) 2010-12-27 2016-04-12 Rohm Co., Ltd. Mobile telephone cartilage conduction unit for making contact with the ear cartilage
JP5494468B2 (ja) 2010-12-27 2014-05-14 富士通株式会社 状態検出装置、状態検出方法および状態検出のためのプログラム
KR101489612B1 (ko) 2010-12-27 2015-02-04 로무 가부시키가이샤 휴대 전화
JP5783352B2 (ja) 2011-02-25 2015-09-24 株式会社ファインウェル 会話システム、会話システム用指輪、携帯電話用指輪、指輪型携帯電話、及び、音声聴取方法
GB2493327B (en) 2011-07-05 2018-06-06 Skype Processing audio signals
GB2495128B (en) 2011-09-30 2018-04-04 Skype Processing signals
GB2495131A (en) * 2011-09-30 2013-04-03 Skype A mobile device includes a received-signal beamformer that adapts to motion of the mobile device
GB2495129B (en) 2011-09-30 2017-07-19 Skype Processing signals
GB2495278A (en) 2011-09-30 2013-04-10 Skype Processing received signals from a range of receiving angles to reduce interference
GB2495130B (en) 2011-09-30 2018-10-24 Skype Processing audio signals
GB2495472B (en) 2011-09-30 2019-07-03 Skype Processing audio signals
CN102368793B (zh) 2011-10-12 2014-03-19 惠州Tcl移动通信有限公司 手机及其通话信号处理方法
GB2496660B (en) 2011-11-18 2014-06-04 Skype Processing audio signals
GB201120392D0 (en) 2011-11-25 2012-01-11 Skype Ltd Processing signals
US20130136282A1 (en) 2011-11-30 2013-05-30 David McClain System and Method for Spectral Personalization of Sound
GB2497343B (en) 2011-12-08 2014-11-26 Skype Processing audio signals
JP6162386B2 (ja) * 2012-11-05 2017-07-12 株式会社ファインウェル 携帯電話
CN104247453B (zh) 2012-01-20 2018-06-05 罗姆股份有限公司 移动电话
US8831686B2 (en) * 2012-01-30 2014-09-09 Blackberry Limited Adjusted noise suppression and voice activity detection
TWI571133B (zh) 2012-06-29 2017-02-11 Rohm Co Ltd stereophone
JP6003510B2 (ja) * 2012-10-11 2016-10-05 富士ゼロックス株式会社 音声解析装置、音声解析システムおよびプログラム
JP5931707B2 (ja) * 2012-12-03 2016-06-08 日本電信電話株式会社 ビデオ会議システム
US9426573B2 (en) 2013-01-29 2016-08-23 2236008 Ontario Inc. Sound field encoder
US20140211949A1 (en) * 2013-01-29 2014-07-31 Qnx Software Systems Limited Sound field reproduction
US9307337B2 (en) * 2013-03-11 2016-04-05 Arris Enterprises, Inc. Systems and methods for interactive broadcast content
WO2015025829A1 (ja) 2013-08-23 2015-02-26 ローム株式会社 携帯電話
US9705548B2 (en) 2013-10-24 2017-07-11 Rohm Co., Ltd. Wristband-type handset and wristband-type alerting device
JP6551919B2 (ja) 2014-08-20 2019-07-31 株式会社ファインウェル 見守りシステム、見守り検知装置および見守り通報装置
JP6446913B2 (ja) 2014-08-27 2019-01-09 富士通株式会社 音声処理装置、音声処理方法及び音声処理用コンピュータプログラム
CN104538040A (zh) * 2014-11-28 2015-04-22 广东欧珀移动通信有限公司 一种动态选择通话语音信号的方法和装置
CN110312181B (zh) 2014-12-18 2020-12-15 株式会社精好 自行车行驶用接听装置及自行车系统
KR101683480B1 (ko) * 2015-04-17 2016-12-07 (주)에스앤아이스퀘어 근거리 무선 통신망을 기반으로 하는 음성인식 통역기 및 음성인식 통역기의 동작 방법
EP3323567B1 (en) 2015-07-15 2020-02-12 FINEWELL Co., Ltd. Robot and robot system
JP6596689B2 (ja) * 2015-07-24 2019-10-30 株式会社オーディオテクニカ マイクロホン装置
JP6551929B2 (ja) 2015-09-16 2019-07-31 株式会社ファインウェル 受話機能を有する腕時計
CN108496345B (zh) 2016-01-19 2021-02-26 株式会社精好 笔型呼入呼出通话装置
JP7013789B2 (ja) * 2017-10-23 2022-02-01 富士通株式会社 音声処理用コンピュータプログラム、音声処理装置及び音声処理方法
US10522167B1 (en) * 2018-02-13 2019-12-31 Amazon Techonlogies, Inc. Multichannel noise cancellation using deep neural network masking
JP2020053948A (ja) 2018-09-28 2020-04-02 株式会社ファインウェル 聴取装置
US10741164B1 (en) * 2019-05-28 2020-08-11 Bose Corporation Multipurpose microphone in acoustic devices

Family Cites Families (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6377680B1 (en) * 1998-07-14 2002-04-23 At&T Corp. Method and apparatus for noise cancellation
EP1202602B1 (en) 2000-10-25 2013-05-15 Panasonic Corporation Zoom microphone device
JP4138290B2 (ja) 2000-10-25 2008-08-27 松下電器産業株式会社 ズームマイクロホン装置
JP2004228920A (ja) * 2003-01-23 2004-08-12 Sony Ericsson Mobilecommunications Japan Inc 携帯通信端末
JP2005148163A (ja) 2003-11-11 2005-06-09 Canon Inc 音声認識装置およびその制御方法
DE102004000043A1 (de) * 2004-11-17 2006-05-24 Siemens Ag Verfahren zur selektiven Aufnahme eines Schallsignals
JP4863713B2 (ja) 2005-12-29 2012-01-25 富士通株式会社 雑音抑制装置、雑音抑制方法、及びコンピュータプログラム
CN101410900A (zh) * 2006-03-24 2009-04-15 皇家飞利浦电子股份有限公司 用于可佩戴装置的数据处理
JP4912036B2 (ja) 2006-05-26 2012-04-04 富士通株式会社 指向性集音装置、指向性集音方法、及びコンピュータプログラム
WO2009069184A1 (ja) 2007-11-26 2009-06-04 Fujitsu Limited 音処理装置、補正装置、補正方法及びコンピュータプログラム

Cited By (135)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103002171A (zh) * 2011-09-30 2013-03-27 斯凯普公司 处理音频信号
CN103002171B (zh) * 2011-09-30 2015-04-29 斯凯普公司 处理音频信号的方法和装置
CN102946493B (zh) * 2012-11-27 2019-01-29 康佳集团股份有限公司 一种移动终端通话环境音调节方法
CN102946493A (zh) * 2012-11-27 2013-02-27 康佳集团股份有限公司 一种移动终端通话环境音调节方法
CN103077725B (zh) * 2012-12-31 2015-12-23 东莞宇龙通信科技有限公司 语音处理的方法及装置
CN103077725A (zh) * 2012-12-31 2013-05-01 东莞宇龙通信科技有限公司 语音处理的方法及装置
CN103929557A (zh) * 2013-01-11 2014-07-16 华为技术有限公司 语音会议噪声处理方法及装置
CN103929557B (zh) * 2013-01-11 2016-04-13 华为技术有限公司 语音会议噪声处理方法及装置
WO2014107949A1 (zh) * 2013-01-11 2014-07-17 华为技术有限公司 语音会议噪声处理方法及装置
CN105469806A (zh) * 2014-09-12 2016-04-06 联想(北京)有限公司 一种声音处理方法、装置及系统
CN105654960A (zh) * 2015-09-21 2016-06-08 宇龙计算机通信科技(深圳)有限公司 一种对终端声音消噪的处理方法及装置
CN105357566A (zh) * 2015-10-29 2016-02-24 青岛歌尔声学科技有限公司 一种语音遥控器及其供电方法
WO2017071193A1 (zh) * 2015-10-29 2017-05-04 青岛歌尔声学科技有限公司 一种语音遥控器及其供电方法
US10418031B2 (en) 2015-10-29 2019-09-17 Qingdao Goertek Technology Co., Ltd. Voice remote control apparatus and power supply method thereof
CN105357566B (zh) * 2015-10-29 2019-05-24 歌尔智能科技有限公司 一种语音遥控器及其供电方法
US11832068B2 (en) 2016-02-22 2023-11-28 Sonos, Inc. Music service selection
US11736860B2 (en) 2016-02-22 2023-08-22 Sonos, Inc. Voice control of a media playback system
US11405430B2 (en) 2016-02-22 2022-08-02 Sonos, Inc. Networked microphone device control
US11212612B2 (en) 2016-02-22 2021-12-28 Sonos, Inc. Voice control of a media playback system
US11513763B2 (en) 2016-02-22 2022-11-29 Sonos, Inc. Audio response playback
US11514898B2 (en) 2016-02-22 2022-11-29 Sonos, Inc. Voice control of a media playback system
US11184704B2 (en) 2016-02-22 2021-11-23 Sonos, Inc. Music service selection
US11556306B2 (en) 2016-02-22 2023-01-17 Sonos, Inc. Voice controlled media playback system
US10743101B2 (en) 2016-02-22 2020-08-11 Sonos, Inc. Content mixing
US10764679B2 (en) 2016-02-22 2020-09-01 Sonos, Inc. Voice control of a media playback system
US11726742B2 (en) 2016-02-22 2023-08-15 Sonos, Inc. Handling of loss of pairing between networked devices
US11042355B2 (en) 2016-02-22 2021-06-22 Sonos, Inc. Handling of loss of pairing between networked devices
US11750969B2 (en) 2016-02-22 2023-09-05 Sonos, Inc. Default playback device designation
US10847143B2 (en) 2016-02-22 2020-11-24 Sonos, Inc. Voice control of a media playback system
US11863593B2 (en) 2016-02-22 2024-01-02 Sonos, Inc. Networked microphone device control
US11006214B2 (en) 2016-02-22 2021-05-11 Sonos, Inc. Default playback device designation
US10970035B2 (en) 2016-02-22 2021-04-06 Sonos, Inc. Audio response playback
US10971139B2 (en) 2016-02-22 2021-04-06 Sonos, Inc. Voice control of a media playback system
CN105957527A (zh) * 2016-05-16 2016-09-21 珠海格力电器股份有限公司 一种语音控制电器的方法、装置及语音控制空调
US11545169B2 (en) 2016-06-09 2023-01-03 Sonos, Inc. Dynamic player selection for audio signal processing
US10714115B2 (en) 2016-06-09 2020-07-14 Sonos, Inc. Dynamic player selection for audio signal processing
US11133018B2 (en) 2016-06-09 2021-09-28 Sonos, Inc. Dynamic player selection for audio signal processing
US11664023B2 (en) 2016-07-15 2023-05-30 Sonos, Inc. Voice detection by multiple devices
US11979960B2 (en) 2016-07-15 2024-05-07 Sonos, Inc. Contextualization of voice inputs
US11184969B2 (en) 2016-07-15 2021-11-23 Sonos, Inc. Contextualization of voice inputs
US11531520B2 (en) 2016-08-05 2022-12-20 Sonos, Inc. Playback device supporting concurrent voice assistants
US10847164B2 (en) 2016-08-05 2020-11-24 Sonos, Inc. Playback device supporting concurrent voice assistants
US11641559B2 (en) 2016-09-27 2023-05-02 Sonos, Inc. Audio playback settings for voice interaction
US10873819B2 (en) 2016-09-30 2020-12-22 Sonos, Inc. Orientation-based playback device microphone selection
US11516610B2 (en) 2016-09-30 2022-11-29 Sonos, Inc. Orientation-based playback device microphone selection
CN109997370A (zh) * 2016-09-30 2019-07-09 搜诺思公司 多取向回放设备麦克风
US10614807B2 (en) 2016-10-19 2020-04-07 Sonos, Inc. Arbitration-based voice recognition
US11727933B2 (en) 2016-10-19 2023-08-15 Sonos, Inc. Arbitration-based voice recognition
US11308961B2 (en) 2016-10-19 2022-04-19 Sonos, Inc. Arbitration-based voice recognition
US11183181B2 (en) 2017-03-27 2021-11-23 Sonos, Inc. Systems and methods of multiple voice services
CN107087208B (zh) * 2017-05-25 2020-07-07 深圳市酷开网络科技有限公司 一种全景视频播放方法、系统及存储装置
CN107087208A (zh) * 2017-05-25 2017-08-22 深圳市酷开网络科技有限公司 一种全景视频播放方法、系统及存储装置
US11380322B2 (en) 2017-08-07 2022-07-05 Sonos, Inc. Wake-word detection suppression
US11900937B2 (en) 2017-08-07 2024-02-13 Sonos, Inc. Wake-word detection suppression
US11080005B2 (en) 2017-09-08 2021-08-03 Sonos, Inc. Dynamic computation of system response volume
US11500611B2 (en) 2017-09-08 2022-11-15 Sonos, Inc. Dynamic computation of system response volume
US11646045B2 (en) 2017-09-27 2023-05-09 Sonos, Inc. Robust short-time fourier transform acoustic echo cancellation during audio playback
US11017789B2 (en) 2017-09-27 2021-05-25 Sonos, Inc. Robust Short-Time Fourier Transform acoustic echo cancellation during audio playback
US11302326B2 (en) 2017-09-28 2022-04-12 Sonos, Inc. Tone interference cancellation
US11538451B2 (en) 2017-09-28 2022-12-27 Sonos, Inc. Multi-channel acoustic echo cancellation
US10880644B1 (en) 2017-09-28 2020-12-29 Sonos, Inc. Three-dimensional beam forming with a microphone array
US11769505B2 (en) 2017-09-28 2023-09-26 Sonos, Inc. Echo of tone interferance cancellation using two acoustic echo cancellers
US10891932B2 (en) 2017-09-28 2021-01-12 Sonos, Inc. Multi-channel acoustic echo cancellation
US11893308B2 (en) 2017-09-29 2024-02-06 Sonos, Inc. Media playback system with concurrent voice assistance
US11288039B2 (en) 2017-09-29 2022-03-29 Sonos, Inc. Media playback system with concurrent voice assistance
US10606555B1 (en) 2017-09-29 2020-03-31 Sonos, Inc. Media playback system with concurrent voice assistance
US11175888B2 (en) 2017-09-29 2021-11-16 Sonos, Inc. Media playback system with concurrent voice assistance
US10880650B2 (en) 2017-12-10 2020-12-29 Sonos, Inc. Network microphone devices with automatic do not disturb actuation capabilities
US11451908B2 (en) 2017-12-10 2022-09-20 Sonos, Inc. Network microphone devices with automatic do not disturb actuation capabilities
US11676590B2 (en) 2017-12-11 2023-06-13 Sonos, Inc. Home graph
US11343614B2 (en) 2018-01-31 2022-05-24 Sonos, Inc. Device designation of playback and network microphone device arrangements
US11689858B2 (en) 2018-01-31 2023-06-27 Sonos, Inc. Device designation of playback and network microphone device arrangements
US11175880B2 (en) 2018-05-10 2021-11-16 Sonos, Inc. Systems and methods for voice-assisted media content selection
US11797263B2 (en) 2018-05-10 2023-10-24 Sonos, Inc. Systems and methods for voice-assisted media content selection
US11715489B2 (en) 2018-05-18 2023-08-01 Sonos, Inc. Linear filtering for noise-suppressed speech detection
US10847178B2 (en) 2018-05-18 2020-11-24 Sonos, Inc. Linear filtering for noise-suppressed speech detection
US10959029B2 (en) 2018-05-25 2021-03-23 Sonos, Inc. Determining and adapting to changes in microphone performance of playback devices
US11792590B2 (en) 2018-05-25 2023-10-17 Sonos, Inc. Determining and adapting to changes in microphone performance of playback devices
US11197096B2 (en) 2018-06-28 2021-12-07 Sonos, Inc. Systems and methods for associating playback devices with voice assistant services
US11696074B2 (en) 2018-06-28 2023-07-04 Sonos, Inc. Systems and methods for associating playback devices with voice assistant services
US11076035B2 (en) 2018-08-28 2021-07-27 Sonos, Inc. Do not disturb feature for audio notifications
US11482978B2 (en) 2018-08-28 2022-10-25 Sonos, Inc. Audio notifications
US11563842B2 (en) 2018-08-28 2023-01-24 Sonos, Inc. Do not disturb feature for audio notifications
US11432030B2 (en) 2018-09-14 2022-08-30 Sonos, Inc. Networked devices, systems, and methods for associating playback devices based on sound codes
US11778259B2 (en) 2018-09-14 2023-10-03 Sonos, Inc. Networked devices, systems and methods for associating playback devices based on sound codes
US10878811B2 (en) 2018-09-14 2020-12-29 Sonos, Inc. Networked devices, systems, and methods for intelligently deactivating wake-word engines
US11551690B2 (en) 2018-09-14 2023-01-10 Sonos, Inc. Networked devices, systems, and methods for intelligently deactivating wake-word engines
US11790937B2 (en) 2018-09-21 2023-10-17 Sonos, Inc. Voice detection optimization using sound metadata
US11024331B2 (en) 2018-09-21 2021-06-01 Sonos, Inc. Voice detection optimization using sound metadata
US11727936B2 (en) 2018-09-25 2023-08-15 Sonos, Inc. Voice detection optimization based on selected voice assistant service
US11031014B2 (en) 2018-09-25 2021-06-08 Sonos, Inc. Voice detection optimization based on selected voice assistant service
US10811015B2 (en) 2018-09-25 2020-10-20 Sonos, Inc. Voice detection optimization based on selected voice assistant service
US11790911B2 (en) 2018-09-28 2023-10-17 Sonos, Inc. Systems and methods for selective wake word detection using neural network models
US11100923B2 (en) 2018-09-28 2021-08-24 Sonos, Inc. Systems and methods for selective wake word detection using neural network models
US11501795B2 (en) 2018-09-29 2022-11-15 Sonos, Inc. Linear filtering for noise-suppressed speech detection via multiple network microphone devices
US10692518B2 (en) 2018-09-29 2020-06-23 Sonos, Inc. Linear filtering for noise-suppressed speech detection via multiple network microphone devices
US11899519B2 (en) 2018-10-23 2024-02-13 Sonos, Inc. Multiple stage network microphone device with reduced power consumption and processing load
US11741948B2 (en) 2018-11-15 2023-08-29 Sonos Vox France Sas Dilated convolutions and gating for efficient keyword spotting
US11200889B2 (en) 2018-11-15 2021-12-14 Sonos, Inc. Dilated convolutions and gating for efficient keyword spotting
US11557294B2 (en) 2018-12-07 2023-01-17 Sonos, Inc. Systems and methods of operating media playback systems having multiple voice assistant services
US11183183B2 (en) 2018-12-07 2021-11-23 Sonos, Inc. Systems and methods of operating media playback systems having multiple voice assistant services
US11538460B2 (en) 2018-12-13 2022-12-27 Sonos, Inc. Networked microphone devices, systems, and methods of localized arbitration
US11132989B2 (en) 2018-12-13 2021-09-28 Sonos, Inc. Networked microphone devices, systems, and methods of localized arbitration
US11159880B2 (en) 2018-12-20 2021-10-26 Sonos, Inc. Optimization of network microphone devices using noise classification
US11540047B2 (en) 2018-12-20 2022-12-27 Sonos, Inc. Optimization of network microphone devices using noise classification
US11646023B2 (en) 2019-02-08 2023-05-09 Sonos, Inc. Devices, systems, and methods for distributed voice processing
US11315556B2 (en) 2019-02-08 2022-04-26 Sonos, Inc. Devices, systems, and methods for distributed voice processing by transmitting sound data associated with a wake word to an appropriate device for identification
US11798553B2 (en) 2019-05-03 2023-10-24 Sonos, Inc. Voice assistant persistence across multiple network microphone devices
US11361756B2 (en) 2019-06-12 2022-06-14 Sonos, Inc. Conditional wake word eventing based on environment
US11200894B2 (en) 2019-06-12 2021-12-14 Sonos, Inc. Network microphone device with command keyword eventing
US11501773B2 (en) 2019-06-12 2022-11-15 Sonos, Inc. Network microphone device with command keyword conditioning
US11854547B2 (en) 2019-06-12 2023-12-26 Sonos, Inc. Network microphone device with command keyword eventing
US11710487B2 (en) 2019-07-31 2023-07-25 Sonos, Inc. Locally distributed keyword detection
US11138975B2 (en) 2019-07-31 2021-10-05 Sonos, Inc. Locally distributed keyword detection
US10871943B1 (en) 2019-07-31 2020-12-22 Sonos, Inc. Noise classification for event detection
US11551669B2 (en) 2019-07-31 2023-01-10 Sonos, Inc. Locally distributed keyword detection
US11138969B2 (en) 2019-07-31 2021-10-05 Sonos, Inc. Locally distributed keyword detection
US11714600B2 (en) 2019-07-31 2023-08-01 Sonos, Inc. Noise classification for event detection
US11354092B2 (en) 2019-07-31 2022-06-07 Sonos, Inc. Noise classification for event detection
US11189286B2 (en) 2019-10-22 2021-11-30 Sonos, Inc. VAS toggle based on device orientation
US11862161B2 (en) 2019-10-22 2024-01-02 Sonos, Inc. VAS toggle based on device orientation
US11869503B2 (en) 2019-12-20 2024-01-09 Sonos, Inc. Offline voice control
US11200900B2 (en) 2019-12-20 2021-12-14 Sonos, Inc. Offline voice control
US11562740B2 (en) 2020-01-07 2023-01-24 Sonos, Inc. Voice verification for media playback
US11556307B2 (en) 2020-01-31 2023-01-17 Sonos, Inc. Local voice data processing
US11961519B2 (en) 2020-02-07 2024-04-16 Sonos, Inc. Localized wakeword verification
US11308958B2 (en) 2020-02-07 2022-04-19 Sonos, Inc. Localized wakeword verification
US11482224B2 (en) 2020-05-20 2022-10-25 Sonos, Inc. Command keywords with input detection windowing
US11727919B2 (en) 2020-05-20 2023-08-15 Sonos, Inc. Memory allocation for keyword spotting engines
US11308962B2 (en) 2020-05-20 2022-04-19 Sonos, Inc. Input detection windowing
US11694689B2 (en) 2020-05-20 2023-07-04 Sonos, Inc. Input detection windowing
US11698771B2 (en) 2020-08-25 2023-07-11 Sonos, Inc. Vocal guidance engines for playback devices
US11551700B2 (en) 2021-01-25 2023-01-10 Sonos, Inc. Systems and methods for power-efficient keyword detection
US11983463B2 (en) 2021-10-04 2024-05-14 Sonos, Inc. Metadata exchange involving a networked playback system and a networked microphone system
US11984123B2 (en) 2021-11-11 2024-05-14 Sonos, Inc. Network device interaction by range

Also Published As

Publication number Publication date
EP2159791B1 (en) 2013-02-13
JP2010054731A (ja) 2010-03-11
KR20100025463A (ko) 2010-03-09
JP5206234B2 (ja) 2013-06-12
CN101661753B (zh) 2012-07-04
KR101084420B1 (ko) 2011-11-21
EP2159791A1 (en) 2010-03-03
US20100056227A1 (en) 2010-03-04
US8620388B2 (en) 2013-12-31

Similar Documents

Publication Publication Date Title
CN101661753B (zh) 噪声抑制装置、移动电话和噪声抑制方法
CN101783828B (zh) 声音信号调节装置、程序和方法以及电话装置
CN105981408B (zh) 用于塑形音频声道之间的次级路径信息的系统和方法
US8842851B2 (en) Audio source localization system and method
US9135924B2 (en) Noise suppressing device, noise suppressing method and mobile phone
US9807522B2 (en) Hearing device adapted for estimating a current real ear to coupler difference
EP2192794B1 (en) Improvements in hearing aid algorithms
CN104284278B (zh) 具有回波抑制的通信装置
US20180350381A1 (en) System and method of noise reduction for a mobile device
KR20160130832A (ko) 트랜스듀서 상태의 검출에 기초하여 오디오 트랜스듀서의 성능을 향상시키는 방법들 및 시스템들
US20100184488A1 (en) Sound signal adjuster adjusting the sound volume of a distal end voice signal responsively to proximal background noise
CN111385713B (zh) 麦克风设备和头戴式耳机
EP2996352A1 (en) Audio system and method using a loudspeaker output signal for wind noise reduction
JP2007214976A (ja) エコーキャンセル装置、テレビ電話端末、及びエコーキャンセル方法
CN113228710A (zh) 听力装置中的声源分离及相关方法
KR101395329B1 (ko) 두 개의 마이크로폰을 이용하여 잡음을 제거하는 방법 및이동통신 단말기
US20230254649A1 (en) Method of detecting a sudden change in a feedback/echo path of a hearing aid
CN112447184A (zh) 语音信号处理方法及装置、电子设备、存储介质
CN113411417A (zh) 无线扩音系统及终端
US20230044509A1 (en) Hearing device comprising a feedback control system
CN113612881B (zh) 基于单移动终端的扬声方法、装置及存储介质
US20220240026A1 (en) Hearing device comprising a noise reduction system
US20230206936A1 (en) Audio device with audio quality detection and related methods
CN114333867A (zh) 音频数据处理方法和装置、通话方法、音频处理芯片、电子设备以及计算机可读存储介质
JP2015220482A (ja) 送受話端末、エコー消去システム、エコー消去方法、プログラム

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20120704

Termination date: 20180630