CN101877237A

CN101877237A - 降噪装置和噪声确定方法

Info

Publication number: CN101877237A
Application number: CN201010154460.1A
Authority: CN
Inventors: 小泽一彦
Original assignee: Sony Corp
Current assignee: Sony Corp
Priority date: 2009-04-13
Filing date: 2010-04-02
Publication date: 2010-11-03
Anticipated expiration: 2030-04-02
Also published as: CN101877237B; JP2010249939A; US8320583B2; US20100260353A1

Abstract

本发明提供一种降噪装置和噪声确定方法。所述降噪装置包括：声音信号输入单元，用于输入声音信号；时间-频率转换单元，用于把通过由声音信号输入单元输入而获得的输入声音信号转换成频率信号；模式化单元，用于对于频率信号的每个分割频率，计算作为内插采样点的多项式的n次多项式(n是自然数)，并获得包括多项式的各个次数的系数值的组的系数模式；匹配数据存储单元，用于与分割频率关联地保存指示匹配范围的匹配数据，所述匹配范围作为被视为噪声的系数模式的范围；和噪声确定单元，用于根据通过比较由模式化单元获得的系数模式和匹配数据指示的匹配范围而获得的结果，至少确定在与被比较的系数模式的数据对应的分割频率处有没有发生噪声。

Description

降噪装置和噪声确定方法

技术领域

本发明涉及消除(降低)包括在声音信号中的噪声中的降噪装置，和确定噪声的发生状态的噪声确定方法。

背景技术

麦克风包含在诸如摄像机、数字静态照相机、蜂窝电话机和IC记录器之类的电子设备中。在这样的电子设备中，会出现时间上间歇地和不规则地发生的噪声(比如所包含的盘驱动器的头寻道声音和缩回声音)，透镜机构中的透镜驱动声音，和用户操作等的点击声音和触摸声音。在电子设备中，麦克风拾取噪声。

于是，如JP-A-2008-52772，JP-A-2008-71374和JP-A-2008-77707中所述，提出一种从声音信号或者振荡传感器的传感器输出中检测噪声发生定时，并在与检测的噪声发生定时对应的期间中对声音信号执行噪声消除(降噪)的结构。

发明内容

当作为消除目标的噪声是如上所述时间上间歇地和不规则地发生的噪声时，有利的是有效使用资源和声学准确地识别噪声的发生状态，并根据识别结果进行消噪处理。

于是，理想的是与过去相比，能够更准确地确定作为消除目标的噪声的发生状态，以便进行噪声消除。

按照本发明的一个实施例，提供一种降噪装置，包括：声音信号输入单元，用于输入声音信号；时间-频率转换单元，用于把通过由声音信号输入单元输入而获得的输入声音信号转换成频率信号；模式化单元，用于对于频率信号的每个分割频率，计算作为内插采样点的多项式的n次多项式(n是自然数)，并获得包括多项式的各个次数的系数值的组的系数模式；匹配数据存储单元，用于与分割频率关联地保存指示匹配范围的匹配数据，所述匹配范围作为被视为噪声的系数模式的范围；和噪声确定单元，用于根据通过比较由模式化单元获得的系数模式和匹配数据指示的匹配范围而获得的结果，至少确定在与被比较的系数模式的数据对应的分割频率处有没有发生噪声。

在上面说明的结构中，输入声音信号被转换成频率信号，随后对于形成频率信号的每个分割频率，计算用于内插分割频率的采样点的多项式。根据由多项式的系数形成的模式(系数模式)和与表示成系数模式的噪声对应的匹配范围的比较，确定噪声的有无。

按照如上所述计算的多项式，对于仅仅离散获得的每个分割频率，能够连续处理沿时间轴的振幅变化。从而，对于基于多项式的噪声识别结果，能够获得更高的精度。

如上所述，按照本发明的实施例，就噪声识别处理来说，能够比过去更精确地获得识别结果。

附图说明

图1是说明由按照本发明的实施例的降噪装置执行的程序的流程的流程图；

图2是按照实施例的噪声识别处理单元的结构例子(第一例子)的方框图；

图3图解说明由按照实施例的FFT单元执行的FFT处理的例子的示意图；

图4是由按照实施例的FFT单元执行的以帧为单位的FFT处理的例子的示意图；

图5是按照实施例的三维模式化(patterning)单元的结构例子的示图；

图6是由按照实施例的FFT单元表示成三维波形的处理结果的例子的示图；

图7是由按照实施例的峰值检测单元执行的峰值检测处理的示意图；

图8图解说明由采样点的时间系列表示的分割频率信号的例子的示图；

图9图解说明其中对经历峰值检测的分割频率信号进行四次多项式化，时间方向归一化，和振幅方向归一化的例子的示图；

图10图解说明其中对经历峰值检测的分割频率信号进行二次多项式化，时间方向归一化，和振幅方向归一化的例子的示图；

图11是由按照实施例的匹配表指示的系数模式的匹配范围的示意图；

图12是按照实施例的匹配表的内容的例子的示图；

图13是按照实施例的噪声识别处理单元的结构例子(第二例子)的方框图；

图14是按照实施例的降噪装置的结构例子(第一例子)的方框图；

图15是按照实施例的降噪装置的结构例子(第二例子)的方框图；

图16是插值信号源生成单元的结构例子的方框图；

图17是第二例子的降噪装置中的插值信号生成处理的例子的示意图；

图18图解说明切换经过噪声消除和插值的声音信号和输入的声音信号的定时的形态例子的示图；

图19是计算噪声发生期间的处理例子的示意图；

图20是按照实施例的降噪装置的结构例子(第三例子)的方框图；

图21是按照实施例的降噪装置的结构例子(第四例子)的方框图；

图22是可应用于第三和第四例子的降噪装置的基于基音的插值信号生成处理(第一例子和第二例子)的基音计算和原始插值信号生成的流程的示意图；

图23图解说明第一例子的基于基音的插值信号生成处理的示意图；

图24图解说明第二例子的基于基音的插值信号生成处理的示意图；

图25是可应用于第三和第四例子的降噪装置的基于基音的插值信号生成处理(第三例子)的基音计算和原始插值信号生成的流程的示意图；

图26图解说明第三例子的基于基音的插值信号生成处理的示意图。

具体实施方式

下面按照下述顺序说明本发明的实施例。

<1.降噪处理的整个流程>

<2.噪声识别处理单元的结构例子(第一例子)>

2-1.整体结构

2-2.FFT处理

2-3.峰值检测

2-4.多项式运算/归一化处理

2-5.噪声有无确定处理

<3.噪声识别处理单元的结构例子(第二例子)>

<4.降噪装置的结构例子(第一例子)>

4-1.整体结构

4-2.噪声发生期间确定处理

<5.降噪装置的结构例子(第二例子)>

<6.降噪装置的结构例子(第三例子)>

6-1.整体结构例子

6-2.基于基音的插值信号生成处理(第一例子)

6-3.基于基音的插值信号生成处理(第二例子)

6-4.基于基音的插值信号生成处理(第三例子)

<7.降噪装置的结构例子(第四例子)>

在下面的说明中，使用涉及噪声的用语“消除”和“降低”。不过，在本申请中，涉及噪声的用语“消除”和“降低”具有等同的含义。噪声的消除可被视为涉及消除叠加在声音信号上的噪声的操作和处理的用语。作为噪声消除的结果，例如，在一些情况下，严格地说噪声并未被完全消除，在某种程度上残留噪声的分量。于是，降噪可被看作鉴于噪声消除处理的结果而定义的用语。

<1.降噪处理的整个流程>

图1是说明能够应用于按照本发明实施例的降噪装置的降噪处理的整个过程例子的流程图。

作为前提，按照本实施例的降噪装置消除作为叠加在声音上的噪声的、时间上间歇地和不规则地发生的噪声。例如，当电子设备是包含盘驱动器装置的记录和再现设备等时，所包含的盘驱动器装置的头寻道声音、缩回声音等可以是这种时间上间歇地和不规则地发生的噪声的发生源。当电子设备包括诸如摄像机或数字静态照相机之类的成像单元时，透镜机构中的透镜驱动声音或者用户操作的点击声音或触摸声音可以是噪声的发生源。

在图1中，首先，在步骤S101中，输入其中很可能结合有作为消除目标的噪声的声音信号。例如，在步骤S101中输入的声音信号源是由后面说明的麦克风收集而获得的声音。

在步骤S102，从在步骤S101中输入的声音信号中提取与噪声等同的声音分量的特征值(噪声特征值)。根据与步骤S104对应的噪声定义，从声音信号中提取具体的特征值。

在步骤S103，比较在步骤S102中提取的有关噪声特征值的信息和在步骤S104中输入的有关噪声定义的信息。有关噪声定义的信息包括从由预先假定的噪声发生源引起的噪声中获得的噪声特征值的数据。

作为步骤S104中的比较的结果，当确定存在等于或大于有关噪声定义的信息与有关噪声特征值的信息之间的固定比率的近似比率时，确定有噪声。另一方面，当确定所述近似比率小于固定比率时，确定没有噪声。

当在步骤S104中获得指示没有噪声的确定结果时，不进行噪声消除处理，输出在步骤S107中输入的声音信号。

另一方面，当获得指示有噪声的确定结果时，执行步骤S105和S106中的处理。

在步骤S105，检测噪声发生期间。具体地说，在步骤S105，检测在步骤S104中检测的噪声的发生期间(发生定时)。

在步骤S106，按照在步骤S105中检测的噪声发生期间，执行从在步骤S101中输入的声音信号中除去噪声的处理。

降噪处理消除作为噪声的声音分量。从而，在原始输入声音信号的降噪目标区间中，缺少与被消除的噪声对应的声音信号。于是，这种情况下，执行内插声音信号分量的处理，以补充声音信息的缺失。在步骤S107，输出经过噪声消除和插值的声音信号。

<2.噪声识别处理单元的结构例子(第一例子)>

2-1.整体结构

图1中所示的步骤S101-S105中的处理可被视为应由按照本实施例的降噪装置中的噪声识别处理单元1执行的处理的一般化。

图2是与图1中所示的步骤S101-S105对应的处理，即，作为呈按照本实施例进一步具体化的形式的噪声识别处理单元1的第一例子的整体结构例子的示图。

图2中所示降噪处理单元1包括成帧单元11，FFT单元12，三维模式化单元13，噪声确定单元14，和匹配表15。

成帧单元11按照图1中所示的步骤S101输入声音信号。成帧单元11，FFT单元12和三维模式化单元13的处理对应于步骤S102中的噪声特征值提取处理。

2-2.FFT处理

在本实施例中，借助例如FFT(快速傅里叶变换)，把时间轴上的输入声音信号转换成频域中的信号(频率信号)。

作为FFT的预处理，成帧单元11以作为FFT的处理单位的帧为单位对输入的声音信号进行处理。

成帧单元11输入的输入声音信号是时域中的实数数据(时域数据)，包括预定的采样频率fs和量化比特的数目。作为一个具体例子，假定输入声音信号的采样频率fs为44.1kHz，成帧单元11用与预定时间宽度对应的1024个数据形成一帧，如图3的(a)中所示。

FFT单元12对一帧的每个数据执行FFT处理，以把数据转换成包括实数数据Re和虚数数据Im的频域数据(频率信号)，如图3的(b)和(c)中所示。由于频域数据被转换成复数数据，因此众所周知的是能够在频域中表现包含相位的波。

当如图3的(a)中所示，一帧的数据的数目为1024，并且采样频率fs为44.1kHz时，实数数据Re和虚数数据Im分别为22.05kHz(44.1kHz/2)的Nyquist频率和512个数据，如图3的(b)和(c)中所示。这种情况下，实数数据Re和虚数数据Im的频率分辨率约为43Hz(22.05/512：Nyquist频率/数据的数目)。换句话说，按照这种情况下的FFT处理，由通过把0-22.05kHz的频带范围分成每个43Hz的512个频带范围而获得的每个频率(下面称为分割频率)的数据获得频率信号。

FFT单元12输出的频率信号的数据可被计算为下面的绝对振幅Va。

绝对振幅

对应于图3，例如，通过利用形成每个实数数据Re和虚数数据Im的512个数据之中的相同分割频率的数据Re，计算公式(1)中的绝对振幅Va。获得与每个分割频率对应的512个绝对振幅Va。

在本实施例中，位于FFT单元12后一级的三维模式化单元13接收绝对振幅Va的输入，并执行处理。

如图4中所示，按照本实施例的成帧单元11执行输入的声音信号的成帧，以致关于沿输入声音信号的时间(T轴)连续的各帧获得重叠区间。FFT单元12对按照这种方式获得的每一帧进行FFT，把输入的声音信号转换成频率信号。

提供连续各帧之间的重叠区间的原因如下所述。

FFT处理是利用帧中的多于一个的数据进行的。于是，在接近帧的开始位置和结束位置的FFT处理中，最初必须使用在一帧的开始位置之前的数据，或者在一帧的结束位置之后的数据。但是，由于该数据可能不能被使用，因此难以获得准确值作为FFT处理之后的数据。

于是，如果提供了重叠区间，那么可利用与一帧重叠的其它帧中的所有必需数据，正确地执行在一帧中的开始位置和结束位置附近的FFT处理。从而，能够提高FFT处理的时间分辨率，获得更准确的FFT处理的算术运算结果。

有关重叠区间的重叠比，即，重叠连续帧的时间和一帧的时间之比应被酌情设为0％-100％之间，同时考虑到FFT处理的频率分辨率和时间分辨率之间的平衡。

2-3.峰值检测

FFT单元12获得的频率信号被输出给图2中所示的三维模式化单元13。

如下所述，三维模式化单元13根据FFT单元12获得的频率信号，对声音信号的每个噪声分量进行多项式化，获得多项式的系数模式。换句话说，三维模式化单元13对噪声进行模式识别(模式化)。噪声模式识别等同于步骤S102中的噪声特征值的提取。

图5中表示了三维模式化单元13的结构例子。

图中表示的三维模式化单元13包括峰值检测单元21和n个多项式运算/归一化单元22-1～22-n。

从FFT单元12输出的频率信号被输入峰值检测单元21。

如上所述，从FFT单元12输出的频率信号包括在图3的(b)和(c)中所示的实数数据Re和虚数数据Im。例如，获得频率信号，作为关于实数数据Re和虚数数据Im中的每个数据，即，在图3中所示的例子中，关于频率分辨率约43Hz的每个频带(分割频率)1-512的公式(1)的算术运算计算的512个绝对振幅Va(1)-Va(512)。

FFT单元12的处理结果的例子可被表示成图6中所示的三维波形。通过按照时间序列收集针对每一帧作为FFT单元12获得的频率信号获得的512个绝对振幅Va(1)-Va(512)，能够形成所述三维波形。

在该三维波形中，频率轴(F轴)和时间轴(T轴)被设置成沿平面方向相互正交。绝对振幅值被设为垂直方向的A轴。在图中所示的状态下，在三维波形图中由实线围绕的区域部分An中，基本同时地在不同的频带中获得三个峰值。与对应于峰值的周围部分相比更突出的波形部分实际意味发生了噪声。换句话说，区域部分An指示认为其中出现噪声的时间-频率区(噪声发生区)。

图5中所示的峰值检测单元21检测在图6中所示的噪声发生区(An)中所示的三维波形上的峰值。

于是，峰值检测单元21利用输入的频率数据的数据(每个分割频率的绝对振幅数据)进行数据地图标示，从而获得图7中所示的地图数据。地图数据代表图6中图解说明的三维波形。

在图7中所示的地图数据中，横坐标表示时间，纵坐标表示频率。作为地图数据的一部分，表示了时间T1、T2、T3、T4、T5等和频率F1、F2、F3、F4、F5等的矩阵的一部分。频率F1、F2、F3、F4、F5等中的每一个等同于与形成实数数据Re和虚数数据Im的512个数据中的每一个对应的每个分割频率。时间T1、T2、T3、T4、T5等中的每一个等同于获得一帧时的数据。

与图7相对应，首先，峰值检测单元21标示分别与在对应于一帧的时间T1获得的频率信号中的频率(分割频率)F1、F2、F3、F4、F5等对应的绝对振幅1、17、33、83、90等。之后，峰值检测单元21顺序标示分别与作为对应于时间T2、T3、T4、T5等的频率信号、以帧为单位输入的频率信号中的频率F1、F2、F3、F4、F5等对应的绝对振幅。

当如上所述创建地图数据时，峰值检测单元21从地图数据上的振幅值分布中检测一个或多个绝对振幅Va的峰值。作为利用地图数据的峰值检测方法和算法的一个例子，一组3×3矩阵的正方形(采样点)被设为峰值检测范围。

在峰值检测范围中，沿由虚线箭头所示的相同时间方向和相同频率方向搜索峰值。当通过搜索沿时间方向和频率方向在相同采样点获得峰值时，与该采样点对应的时间-频率坐标被设为第一临时峰值点。

此外，在相同的峰值检测范围中，沿与时间方向和频率方向正交的两个方向搜索峰值，以在频率和时间上延续。当沿时间方向和频率方向在相同的采样点获得峰值时，与该采样点对应的时间-频率坐标被设为第二临时峰值点。

当第一临时峰值点和第二临时峰值点是相同采样点时，该采样点的时间-频率坐标被检测为真实的峰值点。

在图7中所示的例子中，利用峰值检测算法在地图数据上检测的峰值是与在绝对振幅141的采样点对应的坐标(T2，F4)，和与在绝对振幅166的采样点对应的坐标(T4，F2)。

这样，在本实施例中，当检测了分割频率信号中的峰值时，不仅考虑了与之对应的分割频率中的时间序列的变化，而且考虑了频率方向的振幅变化。换句话说，峰值是根据频率轴和时间轴上的绝对振幅的二维分布检测的。这使得能够更准确地检测峰值。

上面说明的峰值检测方法只是一个例子。实际上，可以增大形成峰值检测范围的采样点的数目。可在方法例子中说明的四个方向中选择至少一个方向，作为用于峰值检测的待搜索轴。

2-4.多项式运算/归一化处理

在图8的(a)和(b)中，根据从FFT单元12输出的频率信号获得的时间序列的频带信号(分割频率信号)被表示成在特定频率Fa和Fb下，与时间的流逝对应的绝对振幅的变化。横坐标(T轴)表示时间，纵坐标(A轴)表示绝对振幅。

本实施例中处理的声音信号是数字数据。于是，时间上离散地对声音信号采样。例如，在图8的(a)中表示的频率Fa的频带信号中，在时间T1、T2、T3、T4、T5、T6和T7的采样点的绝对振幅的值分别被表示成A1a、A2a、A3a、A4a、A5a、A6a和A7a。在图8的(b)中所示的频率Fb的频带信号中，在时间T1、T2、T3、T4、T5、T6和T7的采样点的绝对振幅的值分别被表示成A1b、A2b、A3b、A4b、A5b、A6b和A7b。

当如上所述离散地对绝对振幅采样时，这意味采样的绝对振幅中的峰值并不总是指示频带信号的真实峰值。

例如，在图8的(a)中所示的各个采样点的绝对振幅的峰值是在时间T4的A4a。但是，通过用曲线(图中用虚线表示)假想地连接在时间T1-T7的绝对值振幅A1a-A7a而估计的真实峰值在时间T4之前的定时出现。

类似地，在图8的(b)中所示的采样绝对振幅的峰值是在时间T5的A5b。但是，通过用曲线(图中用虚线表示)假想地连接在时间T1-T7的绝对振幅A1b-A7b而估计的真实峰值在时间T5之前的定时出现。

当希望根据采样的绝对振幅计算尽可能逼近真实峰值的值时，仅仅必须提高时间分辨率。换句话说，仅仅必须增大采样频率。但是，由于时间分辨率和频率分辨率是折衷关系，因此轻率地提高时间分辨率并不可取。为了提高时间分辨率，同时对此进行补偿，如图4中所示，例如在以帧为单位的FFT处理中提供重叠区间。但是，当增大重叠比时，处理量增大到非常大。于是，实际上，不得不按恰当的时间间隔分散采样点。

另外从分别用图8的(a)和(b)中的虚线所示的采样点的包络可看出，每次检测峰值时，按照检测的峰值获得的频带信号的波形可能不同。这意味按照峰值检测单元21检测的峰值而获得的波形可能具有噪声的波形模式，或者可能具有除噪声外的必要声音的波形模式。

于是，当用峰值检测单元21检测采样点的峰值时，在获得与高度准确地估计真实峰值位置的波形对应的模式的有关信息之后，必须比较对应于峰值的频带信号和预先准备的噪声的模式。

三维模式化单元13中的多项式运算/归一化单元22-1～22-n执行下面说明的处理，以便获得与检测的峰值对应的模式。

在三维模式化单元13中，峰值检测单元21分别输出所检测的峰值1-n的峰值检测信号1-n。

与图7对应，首先在时间T2，峰值检测单元21检测频率F4的峰值1，并输出与峰值1对应的峰值检测信号1。随后，在时间T4，峰值检测单元21检测频率F2的峰值2，并输出与峰值2对应的峰值检测信号2。

作为峰值检测信号，在作为峰值检测的样本位置的绝对振幅点被设为基准采样点的情况下，首先，峰值检测单元21输出基准采样点的绝对振幅，在频率与基准采样点的频率相同的采样点之中、在时间轴上紧接在基准采样点之前的N个采样点的绝对振幅，和在所述采样点之中、在时间轴上紧接在基准采样点之后的N个采样点的绝对振幅。

基准采样点之前和之后的采样点的数目N是按照由如下所述的多项式运算/归一化单元22(22-1～22-n)的算术运算计算的多项式的次数的设定确定的。

首先，多项式运算/归一化单元22计算经过与如上所述作为峰值检测信号输入的一个具体频率对应的基准采样点(具有绝对振幅的值)和时间上在基准采样点之前和之后的N个采样点(下面把基准采样点以及在基准采样点之前和之后的N个采样点称为算术运算用采样点)的曲线，或者接近采样点的曲线的多项式。采样点用与之对应的分别设为x坐标和y坐标的采样时间和绝对振幅表示。

按照这种方式计算的多项式表示在其中检测峰值的基带信号的波形。

作为通过内插多于一个的采样点(即，坐标)计算曲线的多项式的方法，已知诸如Lagrange插值法，样条(spline)插值法和最小二乘逼近法之类的各种方法。在本实施例中，可以采用这些方法中的任意一种。不过，在下面的说明中，作为例子，采用Lagrange插值法。

下面简要解释Lagrange插值法。

假定存在位于n+1个离散采样点x0、x1、x2、…、和xn(x0＜x1＜x2＜…xn)的数据y0、y1、y2、…、和yn。作为经过这些点(x0，y0)、(x1，y1)、(x2、y2)、…、和(xn，yn)的Lagrange插值曲线的函数F(x)是n次多项式，并可根据下面的公式(2)计算。

F (x) = y 0 \cdot g 0 (x) / g 0 (x 0) + y 1 \cdot g 1 (x) / g 1 (x 1) + y 2 \cdot g 2 (x) / g 2 (x 2) + \cdot \cdot \cdot \cdot \cdot \cdot

+ yn \cdot gn (x) / gn (xn) = Σ_{i = 0}^{n} {yi (n) \cdot gi (x) / gi (xi)}

gi(x)＝L(x)/(x-xi)、(i＝0，1，2，……，n)

L(x)＝(x-x0)(x-x1)(x-x2)……(x-xn) (2)

图9的(a)中表示了根据峰值的峰值检测信号，用四次多项式表示在其中检测峰值的频带信号的例子。

就四次多项式来说，必需五个(＝n+1)采样点。于是，作为这种情况下的峰值检测信号，基准采样点，频率与基准采样点的频率相同、时间上在基准采样点之前的两个采样点和时间上在基准采样点之后的两个采样点被输出给多项式运算/归一化单元22。

在图9的(a)中，五个坐标(0.0，7.0)、(-1.0，6.0)、(-2.0，1.0)、(1.0，3.0)和(2.0，1.0)被表示成这五个采样点。

在这些坐标中，坐标(0.0，7.0)是基准采样点，坐标(-1.0，6.0)、(-2.0，1.0)是紧接在基准采样点之前的两个采样点，(1.0，3.0)和(2.0，1.0)是紧接在基准采样点之后的两个采样点。

多项式运算/归一化单元22计算经过这些采样点的四次多项式。如图中所示，四次多项式由下面的公式(3)表示。

F(x)＝0.3x^4+0.5x^3-2.8x^2-2.0x+7.0 (3)

在图9的(a)中所示的曲线用公式(3)表示。

从在图9的(a)中所示的曲线可看出，由公式(3)表示的四次多项式的最大值(极值)不同于基准采样点的y坐标值。在本实施例中，通过多项式化频带信号，可以为频带信号(分割频率信号)计算接近于真实波形的波形。从而，例如，也能够更准确地计算频带信号的峰值水平和峰值时间。

多项式化频带信号的处理可被看作对具有频率轴和振幅轴的二维表现的频率信号再增加一个时间轴(图9和10中的x轴)，从而三维表现频率信号的处理。

随后，多项式运算/归一化单元22归一化以公式(3)的形式计算的四次多项式。根据下面的说明可理解，归一化是把奇数次项的系数近似为0或者达到可被视为0的程度的值的处理。该处理能够简化与匹配表15进行比较以确定噪声的处理。

作为归一化，首先，多项式运算/归一化单元22对第一次计算的四次多项式的最大值的x坐标应用四次多项式变换，以致x坐标被设为0。换句话说，多项式运算/归一化单元22进行x坐标(即时间方向)的归一化。

表示在图9的(b)中所示的曲线的四次多项式，即，由沿时间方向的归一化获得的四次多项式用下面的公式(4)表示。

F(x)＝0.3x^4+0.1x^3-3.1x^2+7.3 (4)

当比较公式(4)和公式(3)时可看出，奇数次项x^3的系数被变换成0.1，即，可被视为0的值。奇数次项x的系数为0。

根据作为一个特性、“时间上间歇地和不规则地发生的噪声”在固定时间内具有相对陡峭的上升和下降的事实，进行时间方向的归一化。换句话说，具有这种特性的噪声关于峰值点具有强对称性。于是，波形很可能是偶函数的曲线。于是，如果如图9的(b)中所示进行时间轴方向的归一化，那么奇数次项的系数为0或者等同于0。从而，能够抑制后面说明的系数模式的波动。如后所述，能够把系数模式限制在应在匹配表15中准备的匹配范围中，并减小匹配表15的容量。

按照本实施例的多项式运算/归一化单元22还沿振幅方向进行归一化，如从图9的(b)和(c)的转变所示。换句话说，在图9的(b)中所示的最大值的坐标为(0.0，7.3)。y坐标值7.3表示截距(section)。但是，在此阶段，截距的值不是整数值。于是，多项式运算/归一化单元22进行归一化，以致该截距具有整数值。例如，假定多项式运算/归一化单元22进行归一化，以致截距具有与归一化之前的截距坐标的值最接近的整数值。

从而，四次多项式用下面的公式(5)表示。在四次多项式的曲线中，如图9的(c)中所示，最大值的坐标为(0.0，7.0)。

F(x)＝0.3x^4+0.1x^3-3.1x^2+7.0 (5)

如果截距被改变成整数，那么对于系数模式中的截距的值，只需要准备整数值。进一步使坐标模式的简化更容易。

下面参考图10说明在其中检测如图9中一样的峰值的频带信号的二次多项式化。

就二次多项式(n＝2)来说，作为峰值检测信号，多项式运算/归一化单元22总共捕捉三个(n+1)采样点，即，基准采样点、时间上在基准采样点之前的一个采样点和时间上在基准采样点之后的一个采样点。随后，就和图9中所不相同的频带信号来说，如在图10的(a)中所示，获得三个采样点(0.0，7.0)、(-1.0，6.0)和(1.0，3.0)作为峰值检测信号。

下面的公式(6)表示了利用这些采样点，用Lagrange插值法计算的二次多项式。该二次多项式的曲线是在图10的(a)中所示的曲线。

F(x)＝-2.5x^2-1.5x+7.0 (6)

通过对公式(6)应用时间轴方向的归一化而获得的二次多项式用下面的公式(7)表示。通过时间轴方向的归一化而获得的二次多项式的曲线示于图10的(b)中。

F(x)＝-2.5x^2+7.2 (7)

从公式(7)可看出，按照时间轴方向的归一化，作为奇数次项的x的坐标被设为0。

通过应用振幅方向的归一化，即，把截距的值变成整数值而获得的二次多项式用下面的公式(8)表示。该二次多项式的曲线示于图10的(c)中。

F(x)＝-2.5x^2+7.0 (8)

作为多项式运算/归一化单元22采用的多项式，作为例子说明了四次多项式或二次多项式。不过，在本实施例中，可以采用除二次多项式和四次多项式外的多项式，比如六次多项式。

在上面的说明中，作为归一化处理，首先，进行时间方向的归一化，随后进行振幅方向的归一化。实际上，例如，时间方向和振幅方向只需要最终收敛，以便被正确地归一化。在到完成收敛为止的过程中，可以采用执行时间方向的归一化和振幅方向的归一化，同时彼此进行相互调整的算法。

当完成了在其中检测峰值的频带信号的多项式化和归一化时，多项式运算/归一化单元22输出指示归一化的多项式的系数的数据。

换句话说，如果多项式是四次多项式，那么其通式可被表示成：

F(x)＝ax^4+bx^3+cx^2+dx+e

于是，多项式运算/归一化单元22输出指示归一化的四次多项式的系数[a，b，c，d，e]的组合的数据。截距(e)被看作x^0的系数。

如果多项式是二次多项式，那么其通式可被表示成：

F(x)＝ax^2+bx+c

于是，多项式运算/归一化单元22输出指示归一化的二次多项式的系数[a，b，c]的组合的数据。

如上所述，每个多项式运算/归一化单元22-1～22-n输出指示与之对应的频带信号的系数(峰值1系数数据～峰值n系数数据)的组合。峰值1系数数据～峰值n系数数据是三维模式化单元13的输出。换句话说，峰值1系数数据～峰值n系数数据是通过模式化在其中检测到峰值的频带信号(即，假定为噪声的频带信号)而获得的数据。如图2和5中所示，为了便于说明，基于作为峰值1系数数据～峰值n系数数据的模式化数据是由Lagrange插值法计算的函数F(x)的系数的事实，把该模式化数据描述成F(x)。

2-5.噪声有无确定处理

从三维模式化单元13输出的模式化数据F(x)被输入噪声确定单元14，如图2中所示。

噪声确定单元14比较模式化数据F(x)和保存在匹配表15的基准模式数据P(x)，根据比较结果确定对每个分割频率来说是否存在噪声。

下面说明基准模式数据P(x)。

首先，假想被设置为按照本实施例的降噪装置的消除目标的噪声。对该噪声(假想噪声)应用多项式运算和归一化处理，以计算归一化的多项式。假定计算了二次多项式(归一化的二次多项式)。

图11是如上所述计算的假想噪声的归一化二次多项式的系数a、b和c可以采用的数值范围和频率之间的关系的示意图。

在该图中，纵坐标表示多项式的系数值，横坐标表示频率。如图中所示，假想噪声的归一化二次多项式应采用的系数的数值范围取决于频率。

在本实施例中，按照这种方式计算的假想噪声的归一化多项式的系数模式的范围被设为匹配范围。在图11中，系数a，系数b和关于系数a和c的系数比-c/a被定义为匹配范围。

例如，通常可把系数c，而不是系数比-c/a定义为匹配范围。不过，就本实施例中的归一化多项式来说，当系数a较大时，系数c(截距)也趋向于较大。于是，例如，定义系数比-c/a，而不是系数c。从而，与当简单地把系数c定义为匹配范围时相比，可使系数变化更水平。从而，由于匹配范围的波动受到抑制，因此能够缩小匹配范围，并预期更准确的噪声确定结果。

保存基准模式数据P(x)的匹配表15是指示关于图11中所示的利用系数a和b及系数比-c/a的系数模式的匹配范围的表格式的数据(匹配数据)。于是，图12中表示了匹配表15的具体内容例子。实际上，保存在匹配表15中的数据保存在存储器等中。

图12中所示的匹配表15是当在FFT处理之后，作为数据获得在图3的(b)和(c)中所示的数据时形成的匹配表。为了便于说明，把FFT之后的信号的频带(Nyquist频率)设为22.1kHz。

首先，对于关于FFT之后的数据位置1-512的每个预定范围，分割图中所示的匹配表15。匹配表15被分成数据位置1-8、数据位置9-40、数据位置41-53和数据位置54-512的范围。这意味在FFT之后的数据(频率信号)的频带22.1kHz(原始信号的Nyquist频率)被四个频带范围(分割的频带范围)分割。换句话说，对每个分割频带范围来说，与数据位置1-512对应的512个分割频率被分成四组。

如图中所示，与相应的分割频带范围对应的实际频率的范围是数据位置1-8的43.1Hz-344.5Hz，数据位置9-40的387.6Hz-1.72kHz，数据位置41-53的1.77kHz-2.28kHz，和数据位置54-512的2.33kHz-22.1kHz。

对于与分别对应于数据位置1-8、数据位置9-40和数据位置41-53的三个分割频带范围43.1Hz-344.5Hz、387.6Hz-1.72kHz和1.77kHz-2.28kHz关联的每个系数a和b以及系数比-c/a，表示了上限值和下限值。就与数据位置54-512对应的最高分割频带范围2.33kHz-22.1kHz来说，未保存有效匹配范围的上限值和下限值。这是因为在高于约2.3kHz的频带中，不会出现这种情况下假想的噪声。换句话说，假想的噪声出现在等于或小于约2.3kHz(2.28kHz)的频带中。

这种情况下，匹配表15实际应具有的数据仅仅必须是在与数据位置1-8(分割频带范围43.1Hz-344.5Hz)，数据位置9-40(分割频带范围387.6Hz-1.72kHz)，数据位置41-53(分割频带范围1.77kHz-2.28kHz)对应的匹配范围(上限值和下限值)中的数据。这样，匹配表15并不总是需要具有在对应于与在FFT之后的数据对应的所有分割频率的匹配范围中的数据，只需要具有在仅仅与其中出现噪声的频带范围中的分割频率对应的匹配范围中的数据。从而，能够减小匹配表15实际所需的数据大小。

如上所述，匹配表15可以仅仅具有系数c的匹配范围，而不是系数比-c/a的匹配范围。在图12中，在用虚线表示的框架中表示了系数c的匹配范围的上限和下限。

对应于具有图12中所示结构的匹配表15，由噪声确定单元14进行的噪声确定处理如下所述。

首先，噪声确定单元14从三维模式化单元13接收与其中检测到峰值的每个频带信号对应的峰值1系数数据-峰值n系数数据的输入，作为模式化数据F(x)。噪声确定单元14从匹配表15接收和分别对应于峰值1系数数据-峰值n系数数据的分割频率(数据位置)相关联的系数a和b以及系数比-c/a(或者系数c)的匹配范围(上限值和下限值)的数据，作为基准模式数据P(x)。

随后，作为比较处理，噪声确定单元14确定峰值1系数数据指示的系数a和b以及系数比-c/a是否均包括在与相同的分割频率(数据位置)相关的系数a和b以及系数比-c/a的匹配范围中。

如果峰值1系数数据指示的系数a和b以及系数比-c/a都包括在匹配范围中，那么噪声确定单元14确定作为峰值1系数数据的来源的频带信号是噪声。换句话说，噪声确定单元14获得有噪声的确定结果。另一方面，如果峰值1系数数据指示的系数a和b以及系数比-c/a至少之一未被包括在匹配范围中，那么噪声确定单元14获得没有噪声的确定结果。

至于其它峰值2系数数据-峰值n系数数据中的每一个，噪声确定单元14按照如上所述的相同方式，根据由系数数据指示的所有系数a和b以及系数比-c/a是否包括在匹配范围中，关于分别与峰值2系数数据-峰值n系数数据对应的分割频率确定噪声的有无。

这样，在本实施例中，对于每个分割频率，确定噪声的有无。

作为如上所述确定噪声的有无的算法，可以设想其它算法。例如，可以设想采用如果并非系数数据指示的所有系数，但是至少固定数目或者更多的系数包括在匹配范围中，则确定有噪声的算法。也可设想关于系数数据指示的系数值，计算与对应于匹配范围中的基准值的距离对应的评估值，并根据评估值确定噪声的有无的算法。

在用峰值检测单元21对位于相应分割频率的频带信号应用峰值检测之后，三维模式化单元13只对其中检测到峰值的频带信号执行多项式运算/归一化处理。

在本实施例中，还可采用其中省略峰值检测单元21，从而不进行峰值检测的结构。这种情况下，对应于相应的分割频率提供多项式运算/归一化单元22-1～22-n。对应于图3，由于数据的数目，即，分割频率的分割数目为512，因此对应于分割数目提供512个多项式运算/归一化单元22-1～22-512。但是，如图12中所示，当噪声的频率特性局限于在FFT之后获得的所有频带中的一部分时，只需要提供与包括在对应于噪声的频带中的相应分割频率对应的多项式运算/归一化单元22。

这种情况下，多项式运算/归一化单元22-1～22-n对于输入的频带信号的每个样本不断地执行多项式运算和归一化处理，并顺序输出系数数据。如果频带信号是噪声，那么按照这种方式输出的系数数据包括在匹配表15的匹配范围中。如果频带信号不是噪声，那么系数数据偏离所述匹配范围。

于是，噪声确定单元14比较作为模式化数据F(x)不断地从三维模式化单元13输出的每个分割频率(频带信号)的系数数据与从匹配表15读取的基准模式数据P(x)，即，每个分割频率的系数的匹配范围。作为比较的结果，如果系数数据指示的系数值包括在匹配范围中，那么噪声确定单元14确定在频带信号中存在噪声。如果系数值未包括在匹配范围中，那么噪声确定单元14确定没有噪声。

但是，就如上所述的其中省略峰值检测单元21的峰值检测的结构来说，多项式运算/归一化单元22-1～22-n需要不断地执行多项式运算和归一化处理。噪声确定单元14也需要不断地执行确定噪声的有无的处理。于是，降低装置的处理相当繁重。

于是，在本实施例中，如上所述进行峰值检测。在本实施例中设为消除目标的“时间上间歇地和不规则地发生的噪声”具有如上所述的噪声相对陡峭地上升的特性。于是，当发生噪声时，获得非常明显的峰值。这意味在没有检测到峰值的状态下，可认为没有出现噪声。于是，即使只有当检测到峰值时才进行多项式运算/归一化处理和确定有无噪声的处理，也不会错过噪声发生的检测。由于不必不断地进行多项式运算/归一化处理和确定有无噪声的处理，因此降噪装置的处理负荷较轻。例如，可以节省处理所必需的资源。

这样，按照本实施例的噪声确定单元14能够确定噪声的有无。当需要时，连同噪声有无的确定结果一起，噪声确定单元14能够输出在获得噪声有无的确定结果的过程中得到的算术运算结果，作为噪声识别信息。

<3.噪声识别处理单元的结构例子(第二例子)>

图13是噪声识别处理单元的另一结构例子(第二例子)的示图。图13中，和图12中所示相同的组件用相同的附图标记表示，并省略这些组件的说明。

在图13中所示的噪声识别处理单元1A中，在图2中所示的结构中增加了二维模式化单元16，模式匹配单元17，和噪声模式存储单元18。

二维模式化单元16捕捉在FFT单元12的FFT处理之后的数据(图3的(b)和(c))，并把该数据保存为频率信号F(n)。在本实施例中，保存和获得由频率轴(F轴)和振幅(A轴)二维表现的频率信号F(n)的处理被视为声音信号的模式化。

噪声模式存储单元18是保存噪声模式P(n)的存储器。通过模拟假想噪声的频率分布，能够获得噪声模式P(n)的数据。

作为模式匹配处理，模式匹配单元17计算频率信号F(n)和噪声模式P(n)之间的关联度Ef。

例如，可利用下面的公式(9)计算关联度Ef。

Ef = \frac{Σ_{n = 1}^{N} {F (n) \times P (n)}}{\sqrt{Σ_{n = 1}^{N} {F (n)}^{2} \times Σ_{n = 1}^{N} {P (n)}^{2}}} - - - (9)

在公式(9)中，N表示一帧中的FFT点(样本点)的数目。具体地说，当样本点n＝1～N的噪声模式和声音信号之间的相关性较高时，相关度Ef逼近1。换句话说，当相关度Ef更接近于1时，声音信号很可能是噪声。

在图13中所示的结构中，噪声确定单元14捕捉相关度Ef的值。

基本上，按照如上所述的相同方式，噪声确定单元14通过比较每个频带信号的系数模式和匹配表15的匹配范围，确定噪声的有无。但是，在图13中，在利用匹配表15获得的确定结果中增加确定要素，该确定要素是关于相关度Ef来确定是否出现预先设定的阈值异常性的。具体地说，作为对应于一个频带信号的噪声确定，当频带信号的系数模式包括在匹配表15的匹配范围中，并且频域具有等于或大于阈值的相关度Ef时，噪声确定单元14确定有噪声。即使频带信号的系数模式包括在匹配表15的匹配范围中，当频域具有小于阈值的相关度Ef时，噪声确定单元14仍然确定不存在噪声。

这使得能够获得更准确的噪声有无确定结果。

<4.降噪装置的结构例子(第一例子)>

4-1.整体结构

图14是按照本实施例的降噪装置的第一例子的示图，它包括作为第一例子的噪声识别处理单元1或作为第二例子的噪声识别处理单元1A。

图14中所示的降噪装置包括麦克风31，放大器32，消噪滤波器33，加法器34，插值信号源生成单元35，插值滤波器36，噪声识别处理单元37，噪声定时生成处理单元38和开关39。

麦克风31包含在装有图中所示的降噪装置的电子设备中，或者与电子设备外部连接。例如，当电子设备是摄像机等时，提供麦克风31以便收集记录声音。作为本实施例中的消除目标的噪声连同原本应收集的声音一起被麦克风31收集。

输入麦克风31的声音被转换成声音信号，并由放大器32放大。

这种情况下，从放大器32输出的数字格式的声音信号(输入的声音信号)被提供给开关39的端子tm3。声音信号被分割并输入到消噪滤波器33和噪声识别处理单元37。

消噪滤波器33是BEF(带阻滤波器)等。消噪滤波器33按照从噪声识别处理单元37输出的指示确定发生了噪声的频率(分割频率)的信息(噪声发生频率指示信息)，设定应被截断(阻止)的频率。从而，通过消噪滤波器33的声音信号是从中消除了确定已发生噪声的频率的声音分量的声音信号。

加法器34组合从消噪滤波器33输出的声音信号和从插值滤波器36输出的插值信号。

插值信号由插值信号源生成单元35和插值滤波器36生成。

首先，插值信号源生成单元35生成具有在本实施例中被视为噪声的频带(例如，对应于图12，43.1Hz-2.28kHz)的频率特性的信号，作为插值信号源。

图16是插值信号源生成单元35的结构例子的示图。

图中所示的插值信号源生成单元35包括音信号生成单元41，M序列信号生成单元42，和组合单元43。

音信号生成单元41生成由单个或多于一个的具有预定周期的正弦波、脉冲波等构成的音信号(tone signal)。由于其频率特性，音信号具有在预定频率的单个或多于一个的峰值。

M序列信号生成单元42生成在所有频带中具有均匀电平的随机信号，所谓的M序列信号。白噪声是这种信号的一个例子。

组合单元43以预先设置的组合比，组合由音信号生成单元41生成的音信号和由M序列信号生成单元42生成的M序列信号，并输出组合的信号。从组合单元43输出的组合信号是插值信号源。

可以设想的是自适应地改变组合比，而不是固定组合比。例如，分析麦克风31获得的收集声音，以计算关于音信号分量和M序列信号分量的近似比率等。根据该近似比率改变组合比。从而，例如当收集的声音具有大量的音信号分量时，能够输出由与音信号分量接近的分量的组合形成的插值信号源。当收集的声音具有大量的M序列信号时，能够输出由与M序列信号接近的分量的组合构成的插值信号源。从而，对于插值后的声音信号，能够获得更自然的听感。

在一些情况下，可以固定地设定组合比，以致只有音信号或M序列信号被输出为插值信号源。

从插值信号源生成单元35输出的插值信号源被输出给插值滤波器36。插值滤波器36是接收与输出给消噪滤波器33相同的噪声发生频率指示信息的输入的滤波器。在插值滤波器36中设定与消噪滤波器33的滤波器特性相反的滤波器特性。具体地说，在消噪滤波器33中设定的阻带在插值滤波器36中被设为其通带。在消噪滤波器33中设定的通带在插值滤波器36中被设为其阻带。

从而，从插值滤波器36输出消噪滤波器33仅仅从中截断与某一频带对应的频带分量的插值信号源。插值信号源作为插值信号被输出给加法器34。

加法器34相加和组合从消噪滤波器33输出的声音信号和从插值滤波器36输出的插值信号，并把组合的信号输出给开关39的端子tm2。

与上面的说明对应，噪声识别处理单元37具有和图2中所示的噪声识别处理单元1或图13中所示的噪声识别处理单元1A一样的结构。在作为噪声识别处理单元37的噪声识别处理单元1或1A中，成帧单元11输入的输入声音信号改变成由麦克风31和放大器32获得的数字收集声音信号。作为噪声识别处理单元37的噪声识别处理单元1或1A把噪声发生频率指示信息作为噪声识别信息输出给消噪滤波器33和插值滤波器36。

当噪声识别处理单元37确定在某一频带信号(分割频率)中存在噪声时，噪声定时生成处理单元38执行确定认为存在的噪声的发生期间(噪声发生期间)的处理。后面说明确定噪声发生期间的处理的例子。

根据确定结果，噪声定时发生单元38把指示噪声发生期间的时间定时的噪声定时信号tmg_ng输出给开关39。

开关39连接端子tm1和端子tm3，从而在不输出噪声定时信号tmg_ng的期间，即，当不出现噪声时(噪声不发生期间)，直接输出从放大器32输出的输入声音信号。

另一方面，开关39连接端子tm1和端子tm2，从而在输出噪声定时信号tmg_ng的期间，即，在确定出现了噪声的期间，输出从加法器34输出的声音信号，即，经过消噪和插值处理的声音信号。

例如，当按照本实施例的降噪装置被安装在可记录设备上时，从开关39输出的声音信号，即，从降噪装置输出的声音信号被记录。

在图18的(a)中，按照时间的流逝，示意表示了从开关39的端子tm1输出的声音信号。在该图中，横坐标表示时间，纵坐标表示声音信号的功率。

在该图中，噪声发生期间对应于输出噪声定时信号tmg_ng的期间。

在噪声发生期间之前的时期中，从开关39输出直接从放大器32输入的声音信号(输入声音信号)。换句话说，输出未经过消噪和插值处理的声音信号。在噪声发生期间之前的时期中输出的未经过消噪和插值处理的声音信号被表示成前噪声信号。

随后，当按照噪声定时信号tmg_ng开始输出，开始噪声发生期间时，停止此时进行的未经过消噪和插值处理的声音信号的输出。改为开始输出加法器34的输出信号，即，经过消噪和插值处理的声音信号。

当噪声定时信号tmg_ng的输出被停止，从而确定噪声发生期间已结束时，开关39把到此为止进行的来自加法器34的声音信号(经过消噪和插值处理的声音信号)的输出切换成来自放大器32的声音信号(未经过消噪和插值处理的声音信号)的输出。在噪声发生期间之后的周期中输出的未经过消噪和插值处理的声音信号被表示成后噪声信号。

在噪声发生周期内从开关39输出的经过消噪和插值处理的声音信号可被看作通过组合消噪信号和插值信号而获得的声音信号，如图18的(a)中示意所示。

消噪信号是从消噪滤波器33输出的声音信号。换句话说，消噪信号是通过从原始声音信号中除去发生噪声的分割频率的频带分量而获得的声音信号。由于发生噪声的频带被消除，因此消噪信号的信号功率低于原始声音信号的信号功率。但是，由于插值信号是由从原始声音信号中消除的频带构成的声音信号，因此当加法器34组合消噪信号和插值信号时，从开关39输出的经过消噪处理的声音信号具有与原始声音信号相等的信号功率。在图18的(a)中，噪声发生期间中的声音信号的包络与前噪声信号和后噪声信号的包络连接。这表示经过消噪处理的声音信号的信号功率(电平)和原始声音信号的信号功率(电平)相等。

在本实施例中，在噪声发生期间(进行消噪的消噪期间)中，不进行原始声音信号的所有频带的分量的消除。

还可设想采用作为噪声消除和插值，首先通过在噪声发生期间中消除原始声音信号的所有频带的分量进行消噪，随后组合经过消噪的声音信号和具有原始声音信号的所有频带的插值信号，从而生成经过消噪和插值处理的声音信号的方法。不过，这种情况下，由于噪声发生期间中的声音信号的所有频带变成插值信号，因此声音的听感不自然。

另一方面，在本实施例中，根据上面说明的消噪滤波器33和插值滤波器36的操作可理解，在噪声发生(消除)期间中，通过从原始声音信号中仅仅消除确定存在噪声的分割频率的频带，来进行消噪。换句话说，原始声音信号中未出现噪声的频带被保留。从而，与插值信号组合和补充的仅仅是因消噪而失去的频带的声音信号分量。从而，与上面说明的方法的情况相比，能够进一步改善噪声发生期间中的声音与噪声发生期间前后的声音之间的连续性。从而，掩蔽效果更有效地发挥作用，从而，能够获得不会破坏原始声音的自然听感。

图18的(b)是作为前噪声信号和后噪声信号的原始声音信号(放大器32的输出声音信号)与消噪和插值信号(加法器34的输出声音信号)的沿时间轴方向的组合形式的另一例子的示图。

在图18的(a)中，在噪声发生期间的起点，前噪声信号被立即切换成消噪和插值信号，类似地，消噪和插值信号被立即切换成后噪声信号。就信号的这种变化来说，例如，在进行消噪的频带中，作为前噪声信号的原始声音信号分量被立即切换成插值信号，插值信号被立即切换成作为后噪声信号的原始声音信号。于是，在切换时可能产生谐波，并且所述谐波听起来不自然。

于是，在图18的(b)中，提供一个在其间进行所谓的交叉衰落的时期(交叉衰落期间)，其中在从噪声发生期间的起点开始的固定时期内，前噪声信号被逐渐衰减，消噪和插值信号被逐渐增大到原始水平。类似地，提供一个交叉衰落时期，其中在到噪声发生期间的终点为止的固定时期内，后噪声信号被逐渐增大到原始水平，消噪和插值信号被逐渐降低。

这样，在噪声发生期间的开始和结束时的固定时期中，进行原始声音信号及消噪和插值信号的交叉衰落。这使得能够显著抑制谐波的生成，并防止诸如鸣震和超调之类的现象。于是，能够获得更自然的听感。

通过用交叉衰落开关构成开关39，能够实现交叉衰落时期中声音信号的电平变化。例如，交叉衰落开关借助具有可变控制系数的衰减器组合输入的两个声音信号，并输出组合的声音信号。例如，控制系数c是在0到1范围中的值。衰减器输出具有通过把原始信号电平乘以c而获得的电平的声音信号。

在交叉衰落时期中，改变一个衰减器的控制系数c1，以按照时间的流逝从0增大到1。对另一个衰减器的控制系数c2给予计算为c2＝1-c1的变化。交叉衰落时期的时间只需要能够根据噪声定时信号tmg_ng来确定。例如，形成噪声定时信号tmg_ng，以指示噪声发生期间的开始和结束时间。例如，作为交叉衰落开关的开关39首先在从噪声发生期间的开始时间起的固定时间中执行交叉衰落处理。开关39指定从噪声发生期间的结束时间起倒退交叉衰落时期的时间，并且最后在从规定时间到噪声发生期间的结束时间的时期中执行交叉衰落处理。

例如，只有经过消噪和插值处理的信号，即，从加法器34输出的声音信号可不断从降噪装置输出。但是，由于即使在除噪声发生期间外的时期中，从加法器34输出的声音信号也通过消噪和插值处理系统，因此与输入的声音信号相比，声音信号被恶化。于是，在按照本实施例的降噪装置中，在除噪声发生期间外的时期中，来自开关39的输入声音信号被直接输出，以致输出质量尽可能高的声音信号。

4-2.噪声发生期间确定处理

下面参考图19，说明图14中所示的噪声定时生成处理单元38执行的确定噪声发生定时的处理。在参考图19的说明中，对于多项式算术运算，采用了二次多项式。

当噪声识别处理单元37(噪声识别处理单元1或1A)确定在某一频带信号(分割频率)中存在噪声时，噪声定时生成处理单元38执行确定噪声的发生期间的处理。

例如，按照噪声识别处理单元37的存在噪声的确定，噪声识别处理单元37把确定存在噪声的分割频率的系数数据作为噪声识别信息传给噪声定时生成处理单元38。

噪声定时生成处理单元38根据由确定存在噪声的分割频率的系数数据表示的二次多项式，计算图19中所示的坐标P、Q和R。作为图19中所示的坐标轴，横坐标代表时间，纵坐标(A轴)代表频带信号的绝对振幅Va。就横坐标上的时间来说，当二次多项式为最大值时的时间被看作0。

坐标Q(0，y1)是由用系数数据表示的二次多项式代表的曲线的最大值。坐标P(-1，y0)是由二次多项式代表的曲线上的时间上在坐标Q之前的任意坐标。坐标R(1，y2)是由二次多项式代表的曲线上的时间上在坐标Q之后的任意坐标。坐标P是曲线上的时间轴的坐标值为-1的点。坐标R是曲线上的时间轴的坐标值为1的点。

经过坐标P(-1，y0)的切线TLp和经过坐标R(1，y2)的切线TLr被计算为与二次多项式的曲线对应的切线。例如，切线TLp和TLr可用线性函数表示。

对于坐标，设定阈值线Lm。如图中所示，阈值线是与时间轴平行的直线x＝y3。作为这种情况下的阈值的y3是计算成关于最大值y1被表示成y3＝y1*a(a＜1)的值。换句话说，阈值y3被计算成比最大值小固定比例的值。具体地说，可设想把阈值y3设成约为最大值y1的10％(a＝0.1)。

计算阈值线Lm和切线TLp的交点坐标。在本实施例中，交点坐标的x坐标实际对应的时间被设为所发生噪声的起点，即，噪声起点S。

类似地，计算阈值线Lm和切线TLr的交点坐标。交点坐标的x坐标实际对应的时间被设为所发生噪声的终点，即，噪声终点E。

换句话说，如图中所示，检测到的噪声发生期间Tn是从作为噪声起点S的时间开始到作为噪声终点E的时间结束的时期。

噪声定时生成处理单元38对确定存在噪声的每个频带信号(分割频率)进行这种噪声发生期间的检测。

对噪声发生期间的检测(确定)来说，使用利用频带信号的采样点计算的多项式。通过使频带信号多项式化，如上所述，能够获得更接近真实频带信号波形的频带信号波形。这使得对于每个分割频率，能够高度准确地进行有无噪声的确定。噪声发生期间是根据相同的多项式计算的。于是，与过去相比，能够以更高的准确性检测噪声发生期间的开始时间和结束时间。

随后，噪声定时生成处理单元38根据如上所述关于每个分割频率确定的噪声发生期间，产生噪声定时信号tmg_ng。

例如，噪声定时生成处理单元38计算关于分割频率确定的噪声发生期间的OR，并把OR的输出设为噪声定时信号tmg_ng。这种情况下，作为在其中确定在至少一个分割频率下出现噪声的期间中为H电平、当确定在任意一个分割频率下都没有出现噪声时为L电平的信号，获得噪声定时信号tmg_ng。当噪声定时信号tmg_ng为H电平时，开关39连接端子tm2和端子tm1，并输出经过消噪处理的声音信号(加法器34的输出声音信号)。当噪声定时信号tmg_ng为L电平时，开关39连接端子tm3和端子tm1，并输出未经过消噪处理的声音信号(放大器32的输出声音信号)。

<5.降噪装置的结构例子(第二例子)>

图15是按照本实施例的降噪装置的第二例子的结构的示图。在该图中，与图14中相同的组件用相同的附图标记表示，并省略这些组件的说明。

在图15中，代替图14中所示的插值信号源生成单元35，提供原始插值信号生成单元35A。

来自放大器32的原始声音信号被输入原始插值信号生成单元35A。来自噪声定时生成处理单元38的噪声识别信息被输入原始插值信号生成单元35A。

图14中所示的插值信号源生成单元35被配置成独立生成插值信号源，即，作为插值信号的来源的信号。但是，图15中所示的原始插值信号生成单元35A根据从放大器32输入的声音信号(输入声音信号)产生作为插值信号的来源的声音信号。原始插值信号生成单元35A生成的声音信号被称为原始插值信号，并且区别于由图14中所示的插值信号源生成单元35生成的诸如白噪声之类的插值信号。

下面参考图17，说明原始插值信号生成单元35A生成原始插值信号的处理。

图17是原始声音信号的波形的示图。在图17中，横坐标表示时间(T轴)，纵坐标表示振幅(A轴)。

作为来自噪声定时生成处理单元38的噪声识别信息，原始插值信号生成单元35A接收指示作为噪声发生期间ts到te的时间的信号输入，和指示噪声发生期间中的声音信号(即，噪声)处于峰值时的时间(峰值时间tq)的信号输入。

指示作为噪声发生期间ts到te的时间的信号只需要是和噪声定时生成处理单元38输出给开关39的噪声定时信号tmg_ng相同的信号。指示峰值时间tq的信号可根据从噪声识别处理单元37捕捉的噪声识别信息(归一化的多项式的系数)来计算。从而，原始插值信号生成单元35A能够识别声音信号中开始出现噪声和结束出现噪声的开始时间ts和结束时间te，以及出现在声音信号中的噪声的振幅处于峰值时的峰值时间tq。

如上所述，由噪声定时信号tmg_ng指示的噪声发生期间ts到te对应于一个或多个分割频率的噪声发生期间的OR。于是，作为图17中所示的声音信号的状态，在噪声发生期间ts到te中出现噪声，但是在时间ts之前和时间te之后不出现噪声。

如图17中所示，原始插值信号生成单元35A产生前插值信号，产生后插值信号，并组合前插值信号和后插值信号，以产生原始插值信号。

首先，作为生成前插值信号的处理，原始插值信号生成单元35A计算噪声发生期间中，从开始时间ts到峰值时间tq的时间宽度(时间长度)W1。随后，原始插值信号生成单元35A计算从开始时间ts后退时间宽度W1的点tpr。原始插值信号生成单元35A获得在时期tpr到te的区间中的声音信号，即紧接在开始时间ts之前的时间宽度W1的区间中的声音信号(前噪声信号)，作为前插值信号。

作为生成后插值信号的处理，原始插值信号生成单元35A计算噪声发生期间中，从峰值时间tq到结束时间te的时间宽度W2，并计算在结束时间te前面时间宽度W2的点tps。原始插值信号生成单元35A获得在时期te到tps的区间中的声音信号，即紧接在结束时间te之后的时间宽度W2的区间中的声音信号(后噪声信号)，作为后插值信号。

原始插值信号生成单元35A连接如上所述生成的前插值信号和后插值信号，以致前插值信号在前，后插值信号在后。通过连接前插值信号和后插值信号而形成的声音信号具有和图17中所示的噪声发生期间相同的时间长度。该声音信号是原始插值信号。

插值滤波器36接收如上所述由原始插值信号生成单元35A生成的原始插值信号的输入。和第一例子的情况一样，根据与输出给消噪滤波器33相同的噪声发生频率指示信息，插值滤波器36只允许与被消噪滤波器33截断的频带对应的频带分量通过，并把该频带分量作为插值信号输出给加法器34。

这种情况下，和上面说明的情况一样，从加法器34输出的声音信号是通过用消噪滤波器33仅仅截断确定其中出现了噪声的分割频带并消除噪声分量，随后用插值信号补充被消噪滤波器33丢失的频率而产生的声音信号。换句话说，获得经过消噪和插值处理的声音信号。

在第二例子中，如图17中所示，通过利用紧接在噪声发生期间之前和之后的声音信号区间，产生插值信号(原始插值信号)。紧接在噪声发生期间之前和之后的声音信号是在所有频带中都未出现噪声的声音信号。由于声音信号是时间上紧接在噪声发生期间之前和之后的声音信号，因此与除在噪声发生区间中获得的噪声之外的噪声的相关性和连续性较强。

换句话说，在本实施例中，可以认为其中没有出现噪声并且具有与噪声发生区间的声音内容具有高连续性的声音内容的声音信号被用作插值信号。这使得可预期在经过消噪处理的声音中，获得更自然的听感。

例如，作为原始插值信号生成单元35A的更简单的原始插值信号生成处理，还可设想仅仅利用前噪声信号或后噪声信号生成原始插值信号。该处理和后面说明的图22中所示的生成原始插值信号的处理相同。

不过，在噪声出现之前和在噪声出现之后，声音信号的声音内容可能变化。例如，声音内容往往会在所出现噪声的峰值之后变化。于是，优先考虑自然听感的获得，如图17中所示，可取的是生成前插值信号和后插值信号，并把前插值信号和后插值信号的连接点设定在噪声发生期间中与噪声的峰值对应的时间。

作为用前插值信号和后插值信号生成原始插值信号的改进，还可设想采用简单地在预先固定设置的边界点，比如噪声发生期间的中间点连接前插值信号和后插值信号的方法。

<6.降噪装置的结构例子(第三例子)>

6-1.整体结构例子

下面说明按照第三实施例的降噪装置的第三和第四例子。就第三和第四例子来说，应用基于后面说明的基音(pitch)周期的插值信号生成处理。

图20是作为按照本实施例的降噪装置的第三例子的结构例子的示图。图20中所示的结构可被看作其中根据基音周期，进行作为第二例子的图15中所示的降噪装置中的插值信号生成处理的结构。在图20中，和图15中所示相同的组件用相同的附图标记表示，并省略这些组件的说明。

在图20中所示的结构中，在图15中所示的结构中增加了基音计算单元51。代替图15中的原始插值信号生成单元35A，提供了原始插值信号生成单元35B，原始插值信号生成单元35B在基于输入声音信号(使用中的声音信号)的基音的插值信号生成处理(基于基音的插值信号生成处理)中生成原始插值信号。

在图20中，包括消噪滤波器33，加法器34，插值信号源生成单元35，原始插值信号生成单元35B，插值滤波器36和基音计算单元51的部分被表示成消噪和插值单元50。噪声定时生成处理单元38把噪声识别信息输出给消噪和插值单元50。

基音计算单元51从放大器32接收输入声音信号的输入，并计算输入声音信号的基音。基音意味与声音信号中的基本频率对应的周期时间。

已知各种计算基音的方法。作为一个例子，下面简要说明AMDF(平均幅度差函数)。AMDF被认为是一种具有较高基音提取精度的方法，尽管作为算术处理，该方法只有加法和减法，并且与采用例如自相关或FFT的处理相比，该方法更简单和处理负荷更轻。

可用下面的公式(10)计算使用AMDF得到的基音。

D (m) = (1 / N) \cdot Σ_{n = 1}^{N} | X (n) - X (n - m) | - - - (10)

在公式(10)中，X表示在时间1-N的时间窗口中剪取的输入信号，D(m)表示输入信号X的时间差m方面的差分之和。使D(m)之值降至最小的m被计算为基音。当两个信号x之间的相差为360°，即，由于产生一个周期的时间差，相同的波形形状重叠时，D(m)的值被降至最小。

关于如上所述计算的基音的信息被输入原始插值信号生成单元35B，用于生成原始插值信号。

原始插值信号生成单元35B生成的原始插值信号是频带与输入声音信号对应的声音信号。类似于第一和第二例子的降噪装置，插值滤波器36设定只允许由从噪声识别处理单元37输入的噪声识别信息指示的确定已出现噪声的频率通过的滤波器特性，并且允许原始插值信号通过。从而，获得仅仅具有确定为已出现噪声的频率的频带特性的插值信号，并输出给加法器34。

加法器34组合来自消噪滤波器33的声音信号和插值信号，并输出组合的信号，作为经过消噪和插值处理的声音信号。

6-2.基于基音的插值信号生成处理(第一例子)

下面说明在图20中所示的第三例子的降噪装置中执行的基于输入声音信号(使用中的声音信号)的基音的插值信号生成处理(基于基音的插值信号生成处理)。作为基于基音的插值信号生成处理，说明第一到第三例子的三种形式。

图22是图20中所示的降噪装置中的基音计算单元51的基音计算的示意图，和在原始插值信号生成单元35B生成原始插值信号(生成的原始信号)之前的流程。

首先，图20中所示的基音计算单元51接收作为从噪声定时生成处理单元38输出的噪声识别信息，指示噪声发生期间的信号(例如，噪声定时信号tmg_ng)的输入，并识别噪声发生期间Tn的开始时间ts。

随后，基音计算单元51把时间上在识别的开始时间ts之前并且接近噪声发生期间Tn的预定时间的时期设为基音计算期间Tp。在图22中所示的例子中，紧接在开始时间ts之前设置基音计算期间Tp。

基音计算单元51利用如上所述设置的基音计算期间Tp中的输入声音信号，按照诸如上所述AMDF之类的方法，进行计算输入声音信号的基音的处理。

基音计算期间Tp是在噪声发生期间Tn之前的声音信号区间。换句话说，基音计算期间Tp中的信号是其中在输入声音信号的所有频带中都不出现噪声的信号。这样，在本实施例中，通过利用其中不出现噪声的区间中的声音信号进行基音计算。这使得能够稳定地获得准确的基音计算结果。

随后，为了生成原始插值信号，原始插值信号生成单元35B接收作为从噪声定时生成处理单元38输出的噪声识别信息的指示噪声发生期间的信号(例如，噪声定时信号tmg_ng)的输入，并识别作为噪声发生期间Tn的时间长度，和噪声发生期间Tn的开始时间Ts。

原始插值信号生成单元35B依据由噪声发生期间Tn＝1.5*Ts1表示的时间长度，设置前噪声原始信号区间Ts1。如图22中所示，在输入声音信号中紧接在开始时间ts之前设定前噪声原始信号区间Ts1。

原始插值信号生成单元35B利用前噪声原始信号区间Ts1中的输入声音信号，进行如图23中所示的生成原始插值信号的处理。

图23的(a)中表示了前噪声原始信号区间Ts1的输入声音信号中的开始部分。

如图23的(a)中所示，原始插值信号生成单元35B以作为由基音计算单元51计算的基音的周期时间基音的一半(＝基音/2)为单位，按时间序列分割前噪声原始信号区间Ts1中的输入声音信号。按照这种方式分割的信号单元按时间顺序被称为区间信号1、2等等。

如图23的(a)到(b)的迁移所示，原始插值信号生成单元35B利用基音/2周期的区间信号1、2等，产生原始插值信号。

具体地说，首先，前向时间方向的区间信号1被复制到原始插值信号的第一个基音/2周期区间。该复制仅仅需要被处理成按照FIFO(先入先出)直接读出在图23的(a)中所示的输入声音信号的区间信号1。换句话说，区间信号只需要按时间序列被一次写入存储器中，并按照和写入期间相同的顺序被读出。

在第二个基音/2周期区间中，使用时间序列被转换成与原始信号的时间方向相反的时间方向的区间信号1和2。作为反向时间方向的区间信号，在图23的(a)中所示的输入声音信号的区间信号按照LIFO(后入先出)被输出。换句话说，区间信号按时间序列被一次写入存储器中，并按照和写入期间相反的顺序被输出。

随后，使反向时间方向的区间信号1和2经过组合处理，从而彼此交叉衰落(重叠)，以致例如随着时间的流逝，区间信号1从100％衰减到0％，区间信号2从0％增大到100％。按照这种方式获得的声音信号被组合为第二个基音/2周期区间的声音信号。

在接下来的第三个基音/2周期区间中，连接前向时间方向的区间信号2。

这样，在第一例子的基于基音的插值信号生成处理中，用连续的两个基音/2周期区间中的区间信号，生成连续的三个基音/2周期区间的原始插值信号。随后，在与对区间信号1和2的处理相同的处理中，通过利用输入声音信号中的接下来的连续区间信号3和4，生成接下来的连续三个(第四到第六)基音/2周期区间的原始插值信号。之后，执行相同的处理，直到前噪声原始信号区间Ts1的结尾为止。

这种情况下，如图22中所示，通过利用形成前噪声原始信号区间Ts1的所有区间信号形成的原始插值信号的时间长度用1.5*Ts1表示。换句话说，这种情况下的原始插值信号可被看作是通过沿时间方向把前噪声原始信号区间Ts1的长度延长为前噪声原始信号区间Ts1的1.5倍而生成的。

通过排列按照这种方式，根据从输入声音信号计算的基音设定的周期区间中的区间信号而生成的插值信号具有与输入声音信号的基音对应的频率特性。换句话说，在输入声音信号和插值信号中，能够获得频率特性方面的连续性。

在图23的(b)中的第一个基音/2周期区间的结束位置，和第二个基音/2周期区间的开始位置，由于按照前向时间方向和反向时间方向的顺序连接相同的区间信号1，因此其振幅彼此相符。换句话说，能够获得振幅波形在第一和第二个基音/2周期区间之间的边界连续的状态。

就第二个基音/2周期区间的结束位置和第三个基音/2周期区间的开始位置来说，按照相同的方式，按照反向时间方向和前向时间方向的顺序连接相同的区间信号2。于是，获得振幅波形在第二个基音/2周期区间和第三个基音/2周期区间之间的边界连续的状态。换句话说，获得一般在原始插值信号中的基音/2周期区间之间的边界连接区间信号的状态。

例如，在JP-A-2008-52772，JP-A-2008-71374和JP-A-2008-77707中公开的生成插值信号的方法如下所述。

通过交叉衰落在噪声发生期间的起点之前和之后的一个基音周期的两个信号区间，生成一个基音周期的加权加法信号。反复连接相同的一个加权加法信号，以生成噪声发生期间的前半部分信号。按照相同的方式生成后半部分信号。具体地说，通过交叉衰落在噪声发生期间的终点之前和之后的一个基音周期的两个信号区间，生成一个基音周期的加权加法信号，并重复连接相同的一个加权加法信号，以生成噪声发生期间的后半部分信号。

随后，交叉衰落如上所述生成的前半部分信号和后半部分信号，以生成噪声发生期间的插值信号。

专利文献中的插值信号是通过简单地反复连接一个基音周期的加权加法信号形成的。当按照这种方式简单地重复相同信号时，重新出现与该重复周期对应的称为振音的噪声。随着重复次数的增大，例如，当消噪期间增大，或者基音周期减小时，更容易出现振音。

在专利文献中的插值信号中，加权的加法信号是由两个声音信号的交叉衰落形成的。最终获得的插值信号是通过前半部分信号和后半部分信号的交叉衰落形成的。通过这样交叉衰落信号，与使用单一声音信号的情况相比，能够更容易地保持前半部分信号和后半部分信号的连续性。

但是，取决于待交叉衰落的两个声音信号之间的相差的条件，作为结果，声音信号相互抵消。信号电平的降低的可能性不可避免。如果发生这样的电平下降，在消噪处理期间，该状态重复或者持续。预期可能不能获得足够的插值效果。

专利文献中的插值信号是根据输入声音信号生成的。于是，在这方面，易于获得在噪声发生期间之前和之后的声音信号和插值信号的连续性。但是，一半的加权加法信号使用在噪声发生期间的开始或结尾的声音信号。于是，噪声有可能混合在插值信号中。预期噪声会妨碍自然听感。

另一方面，按照与参考图22和23说明的本实施例相应的基于基音的插值信号生成处理，如上所述，获得其中在其连接位置连接原始插值信号中的区间信号的包络(振幅波形)的状态。从而，在本实施例中，有效地抑制归因于区间信号的重复的振音的发生。如果简单地连接相同的前向时间方向的区间信号，那么在其连接位置，包络急剧变化，具有明显的谐波分量，往往会发生振音。

在本实施例中的原始插值信号中时间方向反转的相同区间信号的连接位置中，尽管连接其振幅波形，不过连接通常是点连接，难以获得平滑的切线连接。于是，在具有反转的时间方向的区间信号的连接位置中，出现显著的谐波分量。但是，当与如上所述的其中简单地连接区间信号，振幅波形变得不连续的状态相比，谐波分量的量较小，于是，能够抑制振音的发生。

此外，插值滤波器36把原始插值信号生成单元35B生成的原始插值信号限制为仅仅确定发生了噪声的频率。由于按照点连接发生的谐波分量通常完全被消除，因此谐波分量不会造成问题。

在本实施例中的原始插值信号中，和专利文献中的插值信号中一样，存在归因于半基音周期的交叉衰落区间。但是，根据图23的(b)可理解，每次半基音周期持续三次，才出现一次交叉衰落区间。换句话说，交叉衰落区间是整个原始插值信号的三分之一。从而，与其中在原始插值信号的整个区间中进行交叉衰落的情况相比，由于交叉衰落区间中的相位条件而发生电平降低的可能性减小。即使发生电平降低，由于电平降低在短时间内结束，因此电平降低也不太明显。

此外，在本实施例中，由于通过利用在未发生噪声的区间中的输入声音信号生成原始插值信号，因此噪声未被混合在原始插值信号中。于是，能够改善插值信号及在插值信号之前和之后的输入声音信号的连续性。

如上所述，在本实施例中，消噪滤波器33仅仅消除其中发生噪声的频带。其中未发生噪声的频带被保持为输入声音信号。从而，改善插值信号及在插值信号之前和之后的输入声音信号的连续性，以获得自然的听感。对进行基于基音的插值信号生成处理的降噪装置来说，同样如此。

在图22中，当生成原始插值信号时，在噪声发生期间Tn之前的输入声音信号被用作其中未发生噪声的区间中的输入声音信号。但是，在第一例子的基于基音的插值信号生成处理，和下面说明的第二例子的基于基音的插值信号生成处理中，可以使用在噪声发生期间Tn之后的输入声音信号生成原始插值信号。

在第一例子的基音的插值信号生成处理中，如图23中所示，可以认为对于每个区间信号，连接前向时间方向的一个区间信号和反向时间方向的一个区间信号，以形成单位插值信号部分part，随后把单位插值信号部分part按照作为生成源的区间信号的时间顺序排列在时间轴上。

随后，在这种情况下，可以认为前一单位插值信号部分part中的最后区间信号的半基音周期区间和后一单位插值信号部分part中的最初区间信号的半基音周期区间被重叠。在重叠的半基音周期区间中，通过交叉衰落组合区间信号。

第一个例子可被看作当通过使用相同顺序(单位周期区间)的偶数区间信号形成单位插值信号部分part时，通过具体使用两个区间信号进行的处理。

6-3.基于基音的插值信号生成处理(第二例子)

下面参考图24，说明按照本实施例的基于基音的插值信号生成处理的第二例子。

图24是其中当用相同时间(单位周期区间)中的奇数区间信号形成单位插值信号部分part时，用最小数目(三个)区间信号形成单位插值信号部分part的例子的示图。

降噪装置中的基音计算单元51进行的基音计算和原始插值信号生成单元35B进行的原始插值信号(生成源信号)的生成的概况与如图22中所示的第一例子的基于基音的插值信号生成处理中的对应概况相同。

在图24的(a)中，和图23的(a)中一样，表示了前噪声原始信号区间Ts1中的输入声音信号中的开始部分。具体地说，第二例子的原始插值信号生成单元35B把前噪声原始信号区间Ts1中的输入声音信号分成基音/2周期区间中的区间信号1，2等，和第一例子中一样。

随后如图24的(b)中所示，这种情况下，原始插值信号生成单元35B在原始插值信号中的第一个基音/2周期区间中，沿前向时间方向排列区间信号1。随后，原始插值信号生成单元35B在第二个基音/2周期区间中沿反向时间方向排列区间信号1，并在第三个基音/2周期区间中沿前向时间方向排列区间信号3。

随后，原始插值信号生成单元35B在原始插值信号中的第四个基音/2周期区间中，沿前向时间方向排列区间信号2。原始插值信号生成单元35B在第五个基音/2周期区间中沿反向时间方向排列区间信号2，并在第六个基音/2周期区间中沿前向时间方向排列区间信号2。

换句话说，在第二例子的基于基音的插值信号生成处理中，按照前向时间方向、反向时间方向和前向时间方向的顺序排列一个区间信号，并按照时间区间的时间序列顺序重复这种排列。

在按照这种方式形成的原始插值信号中，区间信号之间的连接位置中的振幅波形的包络的点连接被保持。

当如第二例子中一样，用奇数区间信号形成单位插值信号部分part时，能够按照前向时间方向设置前一个单位插值信号部分part的最后一个区间信号和下一个单位插值信号部分part的第一个区间信号。换句话说，在包括前一个单位插值信号部分part的最后一个区间信号和下一个单位插值信号部分part的第一个区间信号的时期中，最初，两个时间上连续的区间信号被直接连接。于是，在在区间信号之间的边界中，振幅波形是点连接的。结果，获得令人满意的切线连接的状态。换句话说，当单位插值信号部分part由奇数区间信号形成时，只需要按照作为生成源的区间信号的时间顺序，连接单位插值信号部分part。

从而，不必形成其中在原始插值信号中区间信号彼此交叉衰落的区间。于是，不会发生由两个交叉衰落的信号的相位条件引起的电平降低的问题。

此外，这种情况下，原始插值信号可具有扩展到前噪声原始信号区间Ts1的三倍的时间长度。换句话说，作为前噪声原始信号区间Ts1和对应于原始插值信号的噪声发生期间Tn之间的关系，Tn＝3*Ts1成立。这意味前噪声原始信号区间Ts1只需要具有为噪声发生期间Tn的三分之一的长度。例如，与第一例子相比，按照相同的噪声发生期间Tn，必需的前噪声原始信号区间Ts1可被减小到一半。

这样，在第二例子中，生成原始插值信号所需的输入声音信号的时间可以较短，能够减轻降噪装置的处理。作为本实施例中的消除目标的噪声是时间上间歇地和不规则地发生的噪声。当在短时间内发生多个这样的噪声时，在一些情况下，当前噪声发生期间和前一噪声发生期间之间不出现噪声的时期较短。但是，即使在这种情况下，也很可能能够获得其中不出现噪声的前噪声原始信号。

6-4.基于基音的插值信号生成处理(第三例子)

下面参考图25和26，说明按照本实施例的基于基音的插值信号生成处理的第三例子。

图25是对应于第三例子的降噪装置中的基音计算单元51的基音计算，和原始插值信号生成单元35B的原始插值信号(生成源信号)的生成的示意图。

这种情况下，和上面说明的情况中一样，作为从噪声定时生成处理单元38输出的噪声识别信息，指示噪声发生期间的信号(例如，噪声定时信号tmg_ng)被输入基音计算单元51。基音计算单元51根据该信号识别噪声发生期间Tn的开始时间ts和结束时间te。这种情况下，基音计算单元51还按照作为从噪声定时生成处理单元38输出的噪声识别信息输出的，指示噪声发生期间Tn中的声音信号(噪声)的振幅的峰值时间tp的信号，识别峰值时间tp。

和第一例子的情况中一样，按照输入声音信号的时间序列，基音计算单元51把紧接在开始时间ts之前的固定时期设为基音计算期间Tp1，并利用基音计算期间Tp1中的输入声音信号进行基音计算。按照基音计算期间Tp1计算的基音被称为前基音。

此外，这种情况下，基音计算单元51按照输入声音信号的时间序列，把时间上在结束时间te之后并且接近噪声发生期间Tn的预定时间的时期设为基音计算期间Tp2。在图24中，紧接在结束时间te之后设置基音计算期间Tp2。基音计算单元51利用基音计算期间Tp2中的输入声音信号计算后基音。

为了生成原始插值信号，原始插值信号生成单元35B从噪声定时生成处理单元38接收噪声识别信息的输入，并识别噪声发生期间Tn的开始时间ts，结束时间te和峰值时间tp。

如图中所示，这种情况下，原始插值信号生成单元35B连接前插值信号(在先生成源信号)和在前插值信号之后的后插值信号(在后生成源信号)，从而生成噪声发生期间Tn的原始插值信号。

于是，原始插值信号生成单元35B识别作为从识别的开始时间ts到峰值时间tp的前插值信号时期Tn-1的时间长度，并根据前插值信号时期Tn-1的时间长度，计算紧接在噪声发生期间之前应被设为前噪声原始信号区间Ts1的时间长度。

类似地，原始插值信号生成单元35B识别作为从识别的峰值时间tp到结束时间te的后插值信号时期Tn-2的时间长度，并根据后插值信号时期Tn-2的时间长度，计算紧接在噪声发生期间之后应被设为后噪声原始信号区间Ts2的时间长度。

下面参考图26，说明计算前噪声原始信号区间Ts1和后噪声原始信号区间Ts2的时间长度的方法。

下面解释由按照第三例子的原始插值信号生成单元35B执行的基于基音的插值信号生成处理。

首先，在第三例子中，和上面说明的例子中一样，原始插值信号生成单元35B把前噪声原始信号区间Ts1和后噪声原始信号区间Ts2中的输入声音信号分成半基音周期的区间信号单元。

在图26的(a)中，作为前噪声原始信号区间Ts1中的输入声音信号，表示了位于前噪声原始信号区间Ts1的尾部的两个区间信号N-1和N。在图26的(b)中，作为后噪声原始信号区间Ts2中的输入声音信号，表示了位于后噪声原始信号区间Ts2的首部的两个区间信号N+1和N+2。

作为生成前插值信号和后插值信号的基于基音的插值信号生成处理，可以采用与第一例子对应的处理(用于利用偶数区间信号形成单位插值信号部分part)，或者可以采用与第二例子对应的处理(用于利用奇数区间信号形成单位插值信号部分part)。在图26中所示的例子中，和第二例子中一样，用三个(奇数)区间信号形成单位插值信号部分part。

首先，用和对应于第二例子的图24中所示的处理相同的处理生成前插值信号。在图26的(c)中，在前插值信号的尾部和后插值信号的首部之间的边界附近的信号被表示成原始插值信号。

在图26的(c)中所示的状态中，首先，按照前向时间方向、反向时间方向和前向时间方向的顺序排列前噪声原始信号区间Ts1中紧接在最后一个区间信号之前的区间信号N-1，作为前插值信号的尾部，从而形成一个单位插值信号部分part。

下一个半基音区间是与前插值信号和后插值信号之间的边界对应的区间。该半基音区间之后的半基音区间是后插值信号的区间。如图中所示，对于每个半基音区间，按照前向时间方向、反向时间方向和前向时间方向的顺序排列后噪声原始信号区间Ts2中的第二个区间信号N+2。之后，按照前向时间方向、反向时间方向和前向时间方向的顺序，把第三及后续每个区间顺序排列在半基音区间中。当进行这种排列，直到后噪声原始信号区间Ts2中的最后区间信号时，最终形成后插值信号。

随后，如图26的(c)中所示，在前插值信号中的最后一个单位插值信号部分part和后插值信号中的第一个单位插值信号部分part之间提供一个半基音周期区间的连接部分comb。

在连接部分comb中，排列通过交叉衰落前噪声信号源区间Ts1中的最后一个区间信号N和后噪声原始信号区间Ts2的第一个区间信号N+1而获得的声音信号。这种情况下，进行交叉衰落，以致区间信号N从0％增大到100％，区间信号N+1从100％衰减到0％。从而，在紧接在前的半基音区间和交叉衰落的半基音区间之间的边界中，获得前向时间方向的区间信号N-1的结束位置和前向时间方向的区间信号N的开始位置的点连接。在交叉衰落的半基音区间和紧接在后的半基音区间之间的边界中，获得前向时间方向的区间信号N+1的结束位置和前向时间方向的区间信号N+2的开始位置的点连接。

作为利用前插值信号和后插值信号生成原始插值信号的最简单方法，在仅仅由单位插值信号部分part的连接形成的前插值信号之后，只需要连接同样仅仅由单位插值信号部分part的连接形成的后插值信号。换句话说，原始插值信号具有通过从图26的(c)中除去连接部分comb并连接前插值信号和后插值信号而获得的结构。但是，在这种原始插值信号中，难以在前插值信号的结束位置和后插值信号的开始位置中获得点连接。于是，在图26中所示的例子中，如上所述提供了连接部分comb。

在生成前插值信号和后插值信号的处理中，和第二例子的基于基音的插值信号生成处理中一样，后噪声原始信号区间中的输入声音信号被扩展到其大小的三倍。于是，对于前噪声原始信号区间Ts1，只需要设置为前插值信号区间Tn-1的三分之一的时间宽度。类似地，对于后噪声原始信号区间Ts2，只需要设置为后插值信号区间Tn-2的三分之一的时间宽度。

通过这样连接前插值信号和后插值信号，生成原始插值信号。和作为第二例子的降噪装置的情况一样，这使得能够保持插值信号和在插值信号前后的输入声音信号之间的高连续性。不过，在噪声发生期间Tn前后的输入声音信号的基音中自然可能发生变化。不过，特别地，第三例子的基于基音的插值信号生成处理能够应付噪声发生期间前后的基音周期的这种变化，并保持高连续性。于是，能够预期更自然的听感。

就第三例子来说，还有在具有相同时间宽度的噪声发生期间Tn中，与第二例子的图22中所示的噪声前原始信号区间Ts1相比，噪声前原始信号区间Ts1和噪声后原始信号区间Ts2能够被设置成较短的优点。

<7.降噪装置的结构例子(第四例子)>

图21是作为第四例子的降噪装置的结构例子的示图。

在图21中，和作为第一例子的图14中所示组件相同的组件用相同的附图标记表示，并省略这些组件的说明。图21中所示的结构和图14中所示的第一例子的结构相同，因为插值信号是根据由插值信号源生成单元35生成的插值信号源(使用中的声音信号)、而不是根据输入声音信号生成的。

在图21中，除了图14中所示的结构之外，还提供基音计算单元51和原始插值信号生成单元35B。

在图21中，和图20中一样，包括消噪滤波器33，加法器34，插值信号源生成单元35，原始插值信号生成单元35B，插值滤波器36和基音计算单元51的部分被表示成消噪和插值单元50。噪声定时生成处理单元38把噪声识别信息输出给消噪和插值单元50。

基音计算单元51采用和图20中所示的第三例子的降噪装置的基音计算单元51相同的结构。基音计算单元51计算来自放大器32的输入声音信号的基音，并把指示计算的基音的信息输出给原始插值信号生成单元35B。

原始插值信号生成单元35B接收作为插值信号的生成源信号的插值信号源的输入，并根据计算的输入声音信号的基音，如下所述生成原始插值信号。

作为基于基音的插值信号生成处理，作为第四例子的降噪装置能够执行按照所有的第一到第三例子的处理。

当进行按照第一和第二例子的基于基音的插值信号生成处理时，基音计算单元51被配置成执行和图22中所示相同的处理。具体地说，基音计算单元51利用噪声发生期间Tn前后的输入声音信号之一计算基音。当进行按照第三例子的基于基音的插值信号生成处理时，基音计算单元51被配置成执行和图25中所示相同的处理。

首先，说明按照第一例子的基于基音的插值信号生成处理。

这种情况下，原始插值信号生成单元35B从作为插值信号源的声音信号中提取时间宽度为噪声发生期间Tn的三分之二的声音信号。这等同于设定图22中的前噪声原始信号区间Ts1，并提取前噪声原始信号区间Ts1中的声音信号的处理。但是，插值信号源是连续生成的声音信号。不同于输入声音信号，噪声未被混合在插值信号源中。于是，从插值信号源中提取时间宽度为噪声发生期间Tn的三分之二的声音信号的定时可以是任意定时。

原始插值信号生成单元35B把插值信号源分成半基音周期的区间信号，按照和参考图23说明的处理相同的处理，生成具有噪声发生期间Tn的时间宽度的原始插值信号，并把原始插值信号输出给插值滤波器36。

当进行按照第二例子的基于基音的插值信号生成处理时，原始插值信号生成单元35B在任意定时从作为插值信号源的声音信号中，提取时间宽度为噪声发生期间Tn的三分之一的声音信号。

随后，原始插值信号生成单元35B把插值信号源分成半基音周期的区间信号，按照和参考图24说明的处理相同的处理，产生具有噪声发生期间Tn的时间宽度的原始插值信号，并把原始插值信号输出给插值滤波器36。

当进行按照第三例子的基于基音的插值信号生成处理时，原始插值信号生成单元35B在任意定时从作为插值信号源的声音信号中，提取时间宽度为前插值信号期间Tn-1的三分之一(与图25中所示的前噪声原始信号区间Ts1相同)的声音信号，并把该声音信号设为前噪声原始信号。类似地，原始插值信号生成单元35B在任意定时从作为插值信号源的声音信号中，提取时间宽度为后插值信号期间Tn-2的三分之一(与图25中所示的后噪声原始信号区间Ts2相同)的声音信号，并把该声音信号设为后噪声原始信号。

随后，原始插值信号生成单元35B把前噪声原始信号和后噪声原始信号分成半基音周期的区间信号，并按照和图26中所示的处理相同的处理生成原始插值信号。

就第四例子的降噪装置来说，基于基音的插值信号生成处理生成的原始插值信号不是输入声音信号，而是插值信号源，即，通过组合音信号和M序列信号而获得的声音信号。

但是，即使当用不同于这种输入声音信号的信号进行插值时，按照基于输入声音信号的基音的处理，仍然生成原始插值信号。从而，与其中简单地沿前向时间方向连接插值信号源，从而生成原始插值信号的情况相比，获得更自然的听感。发明人通过实验确认了这一点。

执行基于基音的插值信号生成处理(第一到第三例子)的第三和第四例子(图20和21)的降噪装置都包括消噪滤波器33和插值滤波器36。于是，在噪声发生期间中，从输入声音信号中只除去出现噪声的分割频率，未出现噪声的分割频率被保留，从而生成消噪信号。随后，利用具有仅仅包括消除的分割频率的频带特性的插值信号对消噪信号插值。从而，如上所述，噪声发生期间中的输入声音信号的分量被尽可能地保留，以改善输入声音信号与在噪声发生期间前后的时期的连续性。

但是，就基于基音的插值信号生成处理(第一到第三例子)来说，在噪声发生期间中，也可消除输入声音信号的所有频带，改为内插具有和所有频带的特性相同的频带特性的插值信号。

即使当采用这样的消噪和插值方法时，插值信号本身仍然是通过作为图23、24和26中所示的基于基音的插值信号生成处理(第一到第三例子)的处理生成的。于是，例如，对于每个半基音周期区间来说，波形是点连接的，谐波的出现被抑制，消除了由相位条件引起的电平降低的发生，因为交叉衰落时期较短，或者不存在交叉衰落时期。本发明有效地获得这些优点。

在作为按照本实施例的例子的降噪装置，示于附图中的结构中，包括位于麦克风31的后级的放大器32在内的组件可用硬件构成。组件可被配置为DSP(数字信号处理器)。换句话说，组件可由应被提供给充当DSP的硬件的计算机程序(指令)构成。组件可被实现成由CPU(中央处理器)执行的计算机程序。通过恰当地选择和组合硬件、DSP和CPU的计算机程序中的至少两个，可构成所述组件。

计算机程序被保存在辅助存储装置中，所述辅助存储装置可由降噪装置的ROM、HDD、闪速存储器等构成。此外，计算机程序可被保存在例如可拆卸的存储介质中。计算机程序还可被保存在网络上的服务器等中，并可通过网络下载，以使用户能够获得计算机程序。

按照本实施例的例子的降噪装置适用于的设备的例子包括具有麦克风，并且能够把收集的声音记录在记录介质中的记录和再现设备，比如摄像机，具有记录功能的数字静态照相机，蜂窝电话机，和IC记录器。在这样的设备中，必须几乎实时地从麦克风收集的声音中除去噪声和记录噪声。按照本实施例的降噪装置的结构可用于进行噪声确定和噪声消除，同时这样保护实时性。

但是，可包括由按照本实施例的降噪装置输入的噪声的声音源并不局限于麦克风收集的声音。声音可以是通过读出已记录在记录介质中的声音而获得的声音信号。换句话说，获得输入声音信号的声音信号输入单元并不局限于包括麦克风的声音输入系统。

本申请包含与在2009年4月13日向日本专利局提交的日本优先权专利申请JP 2009-097189中公开的主题相关的主题。

本领域的技术人员应明白根据设计要求和其它因素，可产生各种修改、组合、子组合和变更，只要它们在附加权利要求或其等同物的范围之内。

Claims

1.一种降噪装置，包括：

声音信号输入单元，用于输入声音信号；

时间-频率转换单元，用于把通过由声音信号输入单元输入而获得的输入声音信号转换成频率信号；

模式化单元，用于对于频率信号的每个分割频率，计算作为内插采样点的多项式的n次多项式，并获得包括多项式的各个次数的系数值的组的系数模式，其中n是自然数；

匹配数据存储单元，用于与分割频率关联地保存指示匹配范围的匹配数据，所述匹配范围作为被视为噪声的系数模式的范围；和

噪声确定单元，用于根据通过比较由模式化单元获得的系数模式和匹配数据指示的匹配范围而获得的结果，至少确定在与被比较的系数模式的数据对应的分割频率处有没有发生噪声。

2.按照权利要求1所述的降噪装置，其中模式化单元关于多项式执行与时间方向对应的归一化，以致在多项式的极值时的x坐标值为0。

3.按照权利要求2所述的降噪装置，其中模式化单元关于多项式执行与振幅方向对应的归一化，以致作为多项式的极值时的y坐标值为整数值。

4.按照权利要求1-3任意之一所述的降噪装置，其中

按照存在噪声的确定，噪声确定单元在多项式的曲线上计算经过值比在极值时的x坐标小的x坐标的第一切线，和经过值比在极值时的x坐标大的x坐标的第二切线，把与当第一切线与设为阈值的y坐标值相交时的x坐标值对应的时间设为噪声发生起点，把与当第二切线与设为阈值的y坐标值相交时的x坐标值对应的时间设为噪声发生终点。

5.按照权利要求1-4任意之一所述的降噪装置，还包括峰值确定单元，用于根据频率信号确定频率信号的振幅是峰值的采样点，其中

多项式计算单元计算采样点被峰值确定单元确定为具有峰值的分割频率的多项式。

6.按照权利要求5所述的降噪装置，其中峰值确定单元沿包括频率轴和时间轴的二维方向标示作为频率信号的采样点的绝对振幅，并根据标示的绝对振幅的分布状态确定位于峰值的采样点。

7.按照权利要求1-6任意之一所述的降噪装置，其中匹配数据存储单元与分割频率关联地保存匹配数据，所述分割频率仅仅对应于被确定为发生噪声的频带。

8.按照权利要求1-7任意之一所述的降噪装置，还包括：

消噪滤波器，所述消噪滤波器设定仅仅截断被噪声确定单元确定为存在噪声的分割频率的通带特性，并允许输入声音信号通过，从而输出除去噪声的声音信号；

插值信号生成单元，用于生成只包括被噪声确定单元确定为存在噪声的分割频率的频带分量的插值信号；和

组合单元，用于输出通过合成除去噪声的声音信号和插值信号而获得的声音信号。

9.按照权利要求1-8任意之一所述的降噪装置，其中插值信号生成单元包括：

原始插值信号生成单元，用于从输入声音信号中提取时间轴上在根据噪声确定单元的确定结果识别的噪声发生期间之前的区间的前噪声信号，和时间轴上在噪声发生期间之后的区间的后噪声信号，并在前噪声信号之后连接后噪声信号，从而生成时间宽度与噪声发生期间对应的原始插值信号；和

插值滤波器单元，用于设定只允许被噪声确定单元确定为存在噪声的分割频率通过的通带特性，并允许原始插值信号通过，从而生成插值信号。

10.按照权利要求9所述的降噪装置，其中原始插值信号生成单元提取从根据噪声确定单元的确定结果识别的噪声发生期间的起点到噪声发生期间中振幅处于峰值的峰值点的时间宽度中的前噪声信号，并提取从所述峰值点到根据噪声确定单元的确定结果识别的噪声发生期间的终点的时间宽度中的后噪声信号。

11.按照权利要求1-8任意之一所述的降噪装置，其中插值信号生成单元包括插值滤波器，用于从输入声音信号中提取时间轴上在根据噪声确定单元的确定结果识别的噪声发生期间之前的区间中具有噪声发生期间的时间宽度的前噪声信号，或者时间轴上在噪声发生期间之后的区间中具有噪声发生期间的时间宽度的后噪声信号，并把前噪声信号和后噪声信号设为原始插值信号，设定只允许被噪声确定单元确定为存在噪声的分割频率通过的通带特性，并允许原始插值信号通过，从而生成插值信号。

12.按照权利要求8所述的降噪装置，其中插值信号生成单元包括：

插值信号源生成单元，用于生成作为不是基于输入声音信号的输入的声音信号的插值信号源；和

插值滤波器单元，用于设定只允许被噪声确定单元确定为存在噪声的分割频率通过的通带特性，并且允许作为插值信号源的声音信号通过，从而生成插值信号。

13.按照权利要求1-12任意之一所述的降噪装置，还包括相关度计算单元，用于计算频率信号的模式和被视为噪声的频率信号的模式之间的相关度，其中

噪声确定单元根据通过比较由模式化单元获得的系数模式数据和由匹配数据指示的匹配范围而获得的结果以及相关度，至少确定有没有发生噪声。

14.按照权利要求1-13任意之一所述的降噪装置，还包括开关单元，用于接收从组合单元输出的声音信号和输入声音信号的输入，在根据噪声确定单元的确定结果识别的噪声发生期间中输出从组合单元输出的声音信号，在根据噪声确定单元的确定结果识别的非噪声发生期间中输出输入声音信号。

15.按照权利要求14所述的降噪装置，其中开关单元执行交叉衰落处理，以致在噪声发生期间的开始期间中，从组合单元输出的声音信号的电平被逐渐增大，输入声音信号的电平被逐渐衰减，在噪声发生期间的结束期间中，从组合单元输出的声音信号的电平被逐渐衰减，输入声音信号的电平被逐渐增大。

16.一种噪声确定方法，包括下述步骤：

输入声音信号；

把通过在输入步骤中输入而获得的输入声音信号转换成频率信号；

对于频率信号的每个分割频率，计算作为内插采样点的多项式的n次多项式，并获得包括多项式的各个次数的系数值的组的系数模式，其中n是自然数；

与分割频率关联地保存指示匹配范围的匹配数据，所述匹配范围作为被视为噪声的系数模式的范围；和

根据通过比较在模式化步骤中获得的系数模式和由匹配数据指示的匹配范围而获得的结果，至少确定在与被比较的系数模式的数据对应的分割频率处有没有发生噪声。