CN103688307A

CN103688307A - 音频信号处理装置、成像装置、音频信号处理方法、程序和记录介质

Info

Publication number: CN103688307A
Application number: CN201280035699.4A
Authority: CN
Inventors: 大迫庆一; 关矢俊之; 安部素嗣
Original assignee: Sony Corp
Current assignee: Sony Corp
Priority date: 2011-07-26
Filing date: 2012-05-29
Publication date: 2014-03-26
Also published as: WO2013015011A1; US20140169581A1; JP5741281B2; US9495950B2; JP2013025291A

Abstract

【问题】为了以高精度仅从所收集的音频信号中检测包括脉冲操作声音的噪声部分而不使用来自驱动设备的驱动控制信息，并且为了改善噪声减少的精度。【解决方案】提供了一种音频信号处理装置，包括：特征量提取单元，其被配置为从通过声音收集单元获得的音频信号提取特征量，所述特征量指示从在与所述声音收集单元相同的外壳中设置的声音产生单元产生的脉冲操作声音；以及噪声确定单元，其被配置为基于所述特征量来确定是否在所述音频信号中包括所述操作声音。

Description

音频信号处理装置、成像装置、音频信号处理方法、程序和记录介质

技术领域

本公开涉及音频信号处理装置、成像装置、音频信号处理方法、程序和记录介质。

背景技术

作为收集和记录外部声音的声音记录装置，已知摄像机、具有运动图像捕获功能的数字相机和IC记录机。当操作这样的装置时，存在下述情况：其中，从装置的主体产生的脉冲操作声音包含在所记录的声音内。

例如，配备了运动图像捕获功能的成像装置使用麦克风来收集在装置周围的外部声音，并且当捕获到运动图像时与运动图像一起记录声音。在运动图像的捕获期间，在成像装置的外壳中产生脉冲操作声音，诸如变焦驱动声音、光圈驱动声音、自动聚焦驱动声音或操作按钮的按压声音等。具体地说，当驱动成像光学系统的驱动装置（变焦电机、光圈机构或聚焦电机等）的操作开始或结束时，产生脉冲机械驱动声音，诸如当例如电机与齿轮接合时发出的“咔哒声”。

如果这样的脉冲操作声音包含在用户期望记录的外部声音内或作为噪声被记录在用户期望记录的外部声音上，则很不令人愉快。因为这个原因，声音记录装置需要提供静音或噪声消除，以便减少在记录期间产生的这样的脉冲操作声音。

作为用于减少脉冲机械驱动声音的方法，已经提出了几种方法。例如，专利文献1提出，为了降低当要减少从驱动装置产生的机械驱动声音时要承受的减少处理负载时，根据用于控制驱动装置的驱动信号的发送来执行减少处理。另外，专利文献2提出，基于用于控制透镜驱动单元的驱动信号（控制信号）将与其中从透镜驱动单元产生大的噪声的时间段对应的输入音频数据利用在该时间段之前和之后产生的音频数据片内插。

引用列表

专利文献

专利文献1：JP2011-2723A

专利文献2：JP H8-124299A

发明内容

技术问题

然而，在专利文献1和专利文献2的技术中，因为根据发送用于控制驱动装置的驱动信号的时刻来执行噪声减少处理。所以减少脉冲噪声的精度低，并且由此，原始声音的质量变差。换句话说，对于真实的成像装置等，存在其中在控制装置发送驱动信号后驱动装置的操作延迟的情况。此外，专利文献1的方法未考虑从机械驱动声音的产生到声音到达麦克风处所花费的时间。因此，如果按在专利文献1中公开的根据驱动信号的发送来执行减少处理，则实际噪声部分偏离噪声减少处理部分。因为这个原因，由于甚至在非噪声部分中执行噪声减少处理，所以显著地降低原始声音的保真，这导致声音质量的变差。

另外，专利文献2的技术考虑了所产生的噪声相对于驱动信号的延迟，使得在从驱动信号的发送起预定延迟时间过去后执行噪声减少处理。然而，因为所设置的延迟时间是固定值，并且未考虑其中实际延迟时间变化的情况，所以难以精确地指定噪声部分。因此，难以使用实际噪声部分来精确匹配噪声减少处理部分，不可能实现高度精确的噪声减少处理，并且因此，声音质量的变差是担心的问题。

此外，在专利文献2中，基于在驱动信号的时刻处的输入音频数据和内插音频数据的电平（音量）来确定是否要执行噪声减少处理。因此，当围绕装置存在大的外部声音时，噪声相对不明显，并且因此，不执行减少处理，相反，当装置外围安静并且噪声不明显时，执行所述减少处理，并且因此可以去除噪声。然而，音量不是影响是否人耳感知到噪声的唯一因素。因此，在其中像在专利文献2中那样仅基于音量来确定噪声部分的方法中，噪声部分的确定精度不可靠，有可能在其中未感知到噪声的部分中执行减少处理或者相反在其中感知到噪声的部分中不执行减少处理。

因此，期望提供一种技术，该技术使得能够仅从收集的音频信号高度精确地检测包括脉冲操作声音的噪声部分，而不使用驱动装置的驱动控制信息，并且使得能够改善噪声减少的精度。

对于问题的解决方案

根据本公开，提供了一种音频信号处理装置，包括：特征量提取单元，其被配置为从通过声音收集单元获得的音频信号提取特征量，所述特征量指示从在与所述声音收集单元相同的外壳中设置的声音产生单元产生的脉冲操作声音；以及噪声确定单元，其被配置为基于所述特征量来确定是否在所述音频信号中包括所述操作声音。

根据本公开，提供了一种成像装置，包括：声音收集单元，其被配置为将外部声音转换为音频信号；声音产生单元，其被配置为被设置在与所述声音收集单元相同的外壳中，并且产生脉冲操作声音；特征量提取单元，其被配置为从自所述声音收集单元输出的所述音频信号提取用于指示所述操作声音的特征量；噪声确定单元，其被配置为基于所述特征量来确定是否在所述音频信号中包括所述操作声音；以及噪声减少单元，其被配置为当所述噪声确定单元确定在所述音频信号中包括所述操作声音时对于所述音频信号执行噪声减少处理。

根据本公开，提供了一种音频信号处理方法，包括：从通过声音收集单元获得的音频信号提取用于指示从在与所述声音收集单元相同的外壳中设置的声音产生单元产生的脉冲操作声音的特征量；以及基于所述特征量来确定是否在所述音频信号中包括所述操作声音。

根据本公开，提供了一种程序，用于使得计算机执行：从通过声音收集单元获得的音频信号提取用于指示从在与所述声音收集单元相同的外壳中设置的声音产生单元产生的脉冲操作声音的特征量；以及基于所述特征量来确定是否在所述音频信号中包括所述操作声音。

根据本公开，提供了一种非暂时计算机可读记录介质，其中记录了程序，所述程序使得计算机执行：从通过声音收集单元获得的音频信号提取用于指示从在与所述声音收集单元相同的外壳中设置的声音产生单元产生的脉冲操作声音的特征量；以及基于所述特征量来确定是否在所述音频信号中包括所述操作声音。

根据所述配置，从通过声音收集单元获得的音频信号提取用于指示从在与所述声音收集单元相同的外壳中设置的声音产生单元产生的脉冲操作声音的特征量；以及基于所述特征量来确定是否在所述音频信号中包括所述操作声音。因此，使用从音频信号提取的特征量，可以高精度地确定脉冲操作声音的存在或不存在。

本发明的有益效果

根据如上所述的本公开的实施例，能够仅从所收集的音频信号以高精度来检测脉冲操作声音的噪声部分，而不使用驱动装置的驱动控制信息，并且改善噪声减少的精度。

附图说明

图1是图示根据本公开的第一实施例的音频信号处理装置被应用到的数字相机的硬件配置的框图。

图2是图示根据实施例的音频信号处理装置的功能配置的框图。

图3A至3C是根据实施例的包括脉冲机械声音的音频信号的波形图。

图4是示出根据实施例的脉冲机械声音的确定方法的描述图。

图5是用于描述根据实施例的音频信号处理方法的流程图。

图6是图示根据本公开的第二实施例的音频信号处理装置的功能配置的框图。

图7是示出根据实施例的脉冲机械声音的确定方法的描述图。

图8是图示根据本公开的第三实施例的音频信号处理装置的功能配置的框图。

图9是图示根据本公开的第四实施例的音频信号处理装置的功能配置的框图。

图10是图示根据本公开的第五实施例的音频信号处理装置的功能配置的框图。

图11是用于描述根据实施例的音频信号处理方法的流程图。

图12是图示根据本公开的第六实施例的音频信号处理装置的功能配置的框图。

图13是图示根据本公开的第六实施例的修改示例的音频信号处理装置的功能配置的框图。

图14是图示根据本公开的第七实施例的音频信号处理装置的功能配置的框图。

具体实施方式

以下，将参考附图详细描述本公开的优选实施例。注意，在本说明书和附图中，使用相同的附图标记来表示具有基本上相同的功能和结构的元件，并且省略重复的解释。

以下面的顺序来提供说明

1.第一实施例

1.1.机械声音减少方法的概述

1.2.音频信号处理装置的配置

1.2.1.音频信号处理装置的硬件配置

1.2.2.音频信号处理装置的功能配置

1.3.脉冲机械声音的确定方法的具体示例

1.3.1.使用统计识别方法的确定方法

1.3.2.使用表格确定的确定方法

1.4.音频信号处理方法

1.5.效果

2.第二实施例

2.1.音频信号处理装置的功能配置

2.2.脉冲机械声音的确定方法的具体示例

2.2.1.使用统计识别方法的确定方法

2.2.2.使用表格确定的确定方法

2.3.效果

3.第三实施例

3.1.音频信号处理装置的功能配置

3.2.脉冲机械声音的确定方法的具体示例

3.2.1.使用统计识别方法的确定方法

3.2.2.使用表格确定的确定方法

3.3效果

4.第四实施例

4.1.音频信号处理装置的功能配置

4.2.效果

5.第五实施例

5.1.音频信号处理装置的功能配置

5.2.音频信号处理方法

5.3.效果

6.第六实施例

6.1.噪声确定方法的概述

6.2.音频信号处理装置的功能配置

6.3.音频信号处理装置的修改示例

6.4.效果

7.第七实施例

7.1.音频信号处理装置的功能配置

7.2.效果

8.结论

<1.第一实施例>

[1.1.机械声音减少方法的概述]

首先，将描述使用根据本公开的第一实施例的音频信号处理装置和方法的机械声音减少方法的概述。

根据本实施例的音频信号处理装置和方法涉及用于减少从在声音记录装置或声音再现装置的外壳中安装的声音产生单元（例如，驱动装置）产生的脉冲操作声音（噪声）的技术。具体地说，在本实施例中，当配备了运动图像捕获功能的成像装置在捕获运动图像的同时记录外围声音时，当开始或结束在成像装置中安装的驱动装置的操作时产生的脉冲机械驱动声音是减少的目标。

在此，驱动装置是在用于使用成像光学系统来执行成像操作的成像装置中安装的驱动装置，并且包括例如：变焦电机，用于移动变焦透镜；聚焦电机，用于移动聚焦透镜；光圈机构；用于控制快门的驱动机构等等。驱动装置设置在与成像装置的声音收集单元相同的外壳中。另外，脉冲机械驱动声音（以下称为“脉冲机械声音”）是当例如如上所述的各种驱动装置开始或结束它们的操作时产生的瞬时声音（例如，变焦电机的驱动声音、聚焦电机的驱动声音、光圈机构的驱动声音、快门声音或操作按钮的按压声音等）。脉冲机械声音例如是当变焦电机等的操作开始或结束时从电机与齿轮的接合产生的“咔哒”或“噼啪”声音。

以下，将描述下述示例：其中，音频信号处理装置是具有运动图像捕获功能的数字相机，并且作为要减少的噪声的脉冲机械声音是当在数字相机中开始光学变焦的操作时产生的变焦开始声音。然而，根据本公开的实施例的音频信号处理装置和脉冲机械声音不限于该示例。

当用户在由数字相机执行的成像和声音记录期间执行变焦操作时，在相机内的变焦电机被驱动以与驱动变焦透镜的齿轮接合，并且因此，瞬时产生大的脉冲机械声音（变焦开始声音）。然后，数字相机的麦克风不仅收集用户期望记录的、在相机周围的外部声音（包括例如由麦克风收集的任意声音，诸如环境声音或人的语音等；以下称为“期望声音”或“背景声音”），此外还收集从相机的内部产生的这样的脉冲机械声音。因此，在其中脉冲机械声音被包含到期望声音中的状态中执行声音的记录，并且当再现记录的声音时，用户听见期望声音内包含的脉冲机械声音，这是不令人愉快的。因为脉冲机械声音在例如200Hz或更低的频率上引起外壳的振动，并且在麦克风周围被产生，所以以比期望声音更大的音量收集了脉冲机械声音。因为在如上所述的脉冲机械声音和期望声音之间存在音量差，所以如果期望声音内包含机械声音，则脉冲机械声音在记录的声音的再现期间明显。因此，已经要求下述技术：该技术使得能够在运动图像和声音的记录或再现期间在适当地去除诸如变焦开始声音等的脉冲机械声音后仅记录期望声音。

在如在如上所述的专利文献1和专利文献2中公开的现有技术的噪声减少技术中，基于用于控制驱动装置的驱动信号的发送时刻来估计其中产生机械驱动声音的部分（噪声部分），并且对于该噪声部分执行噪声减少处理。然而，因为实际记录的噪声相对于驱动信号的延迟等，难以精确地从驱动信号的发送时刻估计噪声部分。另外，使用在专利文献2中公开的仅基于音频信号的电平（音量）来确定噪声的存在或不存在的方法，难以精确地检测其中实际上产生由人耳感知的噪声的部分。

因此，在本实施例中，从由成像装置的声音收集单元收集的音频信号提取用于指示脉冲机械声音的特征量，仅使用特征量而不是驱动信号来确定脉冲机械声音的存在或不存在，并且因此，检测包括脉冲机械声音的噪声部分。在此，用于指示脉冲机械声音的特征量优选地包括：（1）用于指示脉冲机械声音的脉冲分量的特征量（其对应于第一特征量）；以及（2）用于指示脉冲机械声音的混响分量的混响特征量（其对应于第二特征量）。通过使用如上所述的用于指示脉冲机械声音的脉冲分量和混响分量的两种特征量，可以精确地检测在音频信号中包括的脉冲机械声音。

此外，（1）如上所述的脉冲特征量优选地包括：（a）脉冲机械声音的脉冲分量的最大幅度值A；以及（b）脉冲分量的脉冲宽度W，并且，（2）混响特征量优选地包括（c）用于指示脉冲机械声音的混响分量的窄带信号的功率P。（a）最大幅度值A和（b）脉冲宽度W是脉冲特征量的代表参数。另外，（c）用于指示脉冲机械声音的混响分量的窄带信号的功率P（以下称为“混响分量功率P”）是混响特征量的代表参数。窄带信号是在低频带（例如，200Hz或更低）中的音频信号中的、对于脉冲机械声音的混响分量唯一的信号，并且混响分量功率P例如是在预定部分中的信号的幅度的积分值（信号电平）。

根据本实施例的音频信号处理装置的特征量提取单元从音频信号提取三个特征量：（a）脉冲机械声音的脉冲分量的最大幅度值A；（b）脉冲分量的脉冲宽度W；以及（c）混响分量功率P。然后，音频信号处理装置的噪声确定单元使用三个提取的特征量的向量x（A、W和P）和确定系数综合来确定音频信号是否包括脉冲机械声音。从先前的学习或先前的设置来获得确定所需的确定系数。以这种方式，可以使用三个特征量（A、W和P）来更精确地检测在音频信号中包括的脉冲机械声音。以下，将详细描述根据本实施例的脉冲机械声音的减少方法。

[1.2.音频信号处理装置的配置]

[1.2.1.音频信号处理装置的硬件配置]

首先，参考图1，将描述根据本实施例的音频信号处理装置被应用到的数字相机的硬件配置。图1是图示根据本实施例的音频信号处理装置被应用到的数字相机1的硬件配置的框图。

根据本实施例的数字相机1例如是当捕获运动图像时可以记录运动图像和声音的成像装置。数字相机1将对象成像，将从成像获得的所捕获的图像（其可以是静止图像或运动图像）转换为数字图像数据，并且将该数据与声音一起记录在记录介质上。

如图1中所示，根据本实施例的数字相机1广义上具有成像单元10、图像信号处理单元20、显示单元30、记录介质40、声音收集单元50、音频信号处理单元60、控制单元70和操作单元80。

成像单元10成像对象，并且输出用于指示所捕获的图像的模拟图像信号。成像单元10包括成像光学系统11、成像传感器12、时刻产生器13和驱动装置14。

成像光学系统11由下述部分构成：光学组件，其包括各种透镜，诸如聚焦透镜、变焦透镜和校正透镜；滤光器，其去除不必要的波长；快门；以及光圈等。从对象入射的光学图像（对象图像）经由成像光学系统11的光学组件形成在成像传感器12的曝光表面上。成像传感器12由诸如CCD（电荷耦合器件）或CMOS（互补金属氧化物半导体）等的固态图像传感器配置。成像传感器12对于从成像光学系统11引导的光学图像执行光电转换，并且输出用于指示所捕获的图像的电信号（模拟图像信号）。

成像光学系统11机械地连接到驱动装置14，驱动装置14驱动成像光学系统11的光学组件。驱动装置14例如包括变焦电机15、聚焦电机16和光圈机构（未示出）等。驱动装置14根据下述的控制单元70的指令来驱动成像光学系统11的光学组件，以便移动变焦透镜和聚焦透镜，或者调整光圈。例如，变焦电机15执行通过在远摄或宽方向上移动变焦透镜而调整视角的变焦操作。另外，聚焦电机16通过移动聚焦透镜来执行聚焦在对象上的聚焦操作。

另外，时刻产生器13（以下称为TG13）根据控制单元70的指令来产生成像传感器12所需的操作脉冲。例如，TG13产生各种脉冲，诸如用于垂直传送的四相位脉冲、场移位脉冲、用于水平传送的两相位脉冲和快门脉冲，并且将这些脉冲供应到成像传感器12。当TG13驱动成像传感器12时，捕获对象图像。另外，当TG13调整成像传感器12的快门速度时，控制所捕获的图像的曝光量和曝光时间段（电子快门功能）。由成像传感器12输出的图像信号被输入到图像信号处理单元20。

图像信号处理单元20被诸如宏控制器的电子电路配置，对于从成像传感器12输出的图像信号执行预定图像处理，并且向显示单元30和控制单元70输出已经进行了图像处理的图像信号。图像信号处理单元20具有模拟信号处理单元21、模数（A/D）转换器22和数字信号处理单元23。

模拟信号处理单元21是所谓的模拟前端，其对于图像信号执行预处理。模拟信号处理单元21对于从成像传感器12输出的图像信号执行例如CDS（相关双采样）处理或通过可编程增益放大器（PGA）的增益处理等。A/D转换器22将从模拟信号处理单元21输入的模拟图像信号转换为数字图像信号，并且然后将该信号输出到数字信号处理单元23。数字信号处理单元23对于输入的数字图像信号执行数字信号处理，诸如噪声去除、白平衡调整、颜色校正、边缘加重或伽马校正等，并且然后向显示单元30和控制单元70输出该信号。

显示单元30被配置为显示装置，例如液晶显示器（LCD）或有机EL显示器等。显示单元30根据控制单元70的控制来显示各种输入图像数据。例如，显示单元30在成像期间实时地显示从图像信号处理单元20输入的所捕获的图像（通过图像）。因此，用户可以在观看被数字相机1捕获的通过图像的同时操作数字相机1。另外，当在记录介质40上记录的所捕获的图像被再现时，显示单元30显示再现的图像。因此，用户可以识别在记录介质40上记录的所捕获的图像的内容。

记录介质40在其上记录各种数据，诸如捕获的图像数据、音频数据和该数据的元数据。对于记录介质40，例如，可以使用诸如存储卡的半导体存储器、或者诸如光盘的盘型记录介质、或者硬盘。光盘例如包括蓝光盘、DVD（数字通用盘）和CD（致密盘）等。记录介质40可以被内置在数字相机1中，或者可以是可以在数字相机1上安装或卸下的可装卸介质。

声音收集单元50收集在数字相机1周围的外部声音。根据本实施例的声音收集单元50是由用于记录外部声音的一个麦克风51构成的单声道麦克风，但是可以被配置为由两个麦克风构成的立体声麦克风。麦克风51输出通过收集外部声音而获得的音频信号。使用声音收集单元50，可以收集外部声音，并且在运动图像捕获期间与运动图像一起被记录外部声音。麦克风51被设置于数字相机1的外壳中以便收集外部声音（期望声音），但是也收集在外壳中设置的声音产生单元（驱动装置14）的机械驱动声音作为噪声。

音频信号处理单元60由诸如宏控制器的电子电路配置，对于音频信号执行预定声音处理，并且输出用于记录的音频信号。声音处理例如包括A/D转换处理和噪声减少处理等。本实施例特征在于通过音频信号处理单元60执行噪声减少处理，并且下面将提供其详细说明。

控制单元70被诸如宏控制器的电子电路配置，并且控制数字相机1的整体操作。控制单元70例如包括CPU71、EEPROM（电子可擦除可编程ROM）72、ROM（只读存储器）73和RAM（随机存取存储器）74。控制单元70控制在数字相机1内的单元的每一个。例如，当从由麦克风51收集的音频信号减少作为噪声由驱动装置14产生的机械声音时，控制单元70控制音频信号处理单元60的操作。

控制单元70的ROM73存储程序，该程序使得CPU71执行各种控制处理。CPU71基于该程序来操作，并且在使用RAM74的同时执行算术运算和各种控制所需的控制处理。可以在数字相机1中安装的存储器装置（例如，EEPROM72和ROM73等）中预先存储程序。另外，可以通过在诸如盘类记录介质或存储卡的可装卸介质中存储程序来向数字相机1提供程序，并且可以经由诸如LAN或因特网的网络来在数字相机1中下载程序。

在此，将描述控制单元70的控制的具体示例。控制单元70控制成像单元10的TG13和驱动装置14，以控制由成像单元10执行的成像处理。例如，控制单元70通过下述方式来执行自动曝光控制（AE功能）：调整成像光学系统11的光圈，设置成像传感器12的电子快门速度，并且设置模拟信号处理单元21的AGC的增益，等等。另外，控制单元70执行自动聚焦控制（AF功能），用于通过移动成像光学系统11的聚焦透镜并且由此改变聚焦位置来将成像光学系统11自动聚焦在特定对象上。此外，控制单元70通过下述方式来调整所捕获的图像的视角：移动成像光学系统11的变焦透镜，并且由此改变变焦位置。此外，控制单元70使得在记录介质40上记录诸如所捕获的图像和元数据等的各种数据，并且使得读取和再现在记录介质40上记录的数据。另外，控制单元70使得产生要在显示单元30上显示的各种显示图像，并且控制显示单元30显示该显示图像。

操作单元80和显示单元30作为用户界面，其使得用户能够操作数字相机1。操作单元80被诸如按钮或杆的操作按键或触摸板配置，并且例如包括变焦按钮、快门按钮和电源按钮等。操作单元80根据用户操作来向控制单元70输出用于指令各种成像操作的指令信息。

[1.2.2.音频信号处理装置的功能配置]

接下来，参考图2，将描述根据本实施例的、被应用到数字相机1的音频信号处理装置的功能配置示例。图2是图示根据该实施例的音频信号处理装置100的功能配置的框图。

如在图2中所示，音频信号处理装置100包括信号输入单元110、A/D转换器120、特征量提取单元130、噪声确定单元140、确定系数保留单元150、噪声减少单元160和信号记录单元170。信号输入单元110具有如上所述的图1的麦克风51。另外，A/D转换器120、特征量提取单元130、噪声确定单元140、确定系数保留单元150和噪声减少单元160构成如上所述的图1的音频信号处理单元60。信号记录单元170由如上所述的图1的控制单元70和记录介质40构成。

音频信号处理装置100的单元的每个可以被专用硬件或软件配置。当使用软件时，音频信号处理装置100的处理器可以执行程序，用于实现下述的功能单元的功能。可以经由计算机可读记录介质（例如，光盘、硬盘或半导体存储器等）向音频信号处理装置100提供程序，或者可以经由各种通信手段来向该装置提供程序。以下，将描述音频信号处理装置100的单元的每一个。

信号输入单元110由在数字相机1的外壳中安装的麦克风51构成。信号输入单元110的麦克风51收集在数字相机1周围的期望声音（要记录的声音），将外部声音转换为音频信号，并且然后输出。该音频信号不仅包括期望声音，而是还包括诸如脉冲机械声音和其中包含的从数字相机1的驱动装置14产生的其他机械驱动声音的噪声。

A/D转换器120将从麦克风51输出的模拟音频信号转换为数字音频信号。该数字音频信号被输入到特征量提取单元130和噪声减少单元160。

特征量提取单元130从自麦克风51输出的音频信号提取用于指示脉冲机械声音的特征量。特征量提取单元130用作：（1）脉冲特征量提取单元，其提取用于指示脉冲机械声音的脉冲分量的脉冲特征量；以及（2）混响特征量提取单元，其提取用于指示脉冲机械声音的混响分量的混响特征量。具体地说，特征量提取单元130包括作为脉冲特征量提取单元的最大幅度值获取部131和脉冲宽度计算部132与作为混响特征量提取单元的混响功率计算部133。

最大幅度值获取部131获取音频信号的脉冲分量的幅度（信号电平）的最大值，并且将最大幅度值A输出为脉冲特征量。脉冲宽度计算部132计算音频信号的脉冲分量的脉冲宽度W，并且输出脉冲宽度W作为脉冲特征量。混响功率计算部133计算用于指示音频信号的混响分量的窄带信号的功率P，并且将混响功率P输出为混响特征量。

在此，将参考图3A至3C来描述脉冲机械声音。图3A至3C是包括根据本实施例的脉冲机械声音的音频信号的波形图。

如图3A中所示，当驱动装置14在通过数字相机1的声音记录期间开始操作时，从驱动装置14产生脉冲机械声音，并且该脉冲机械声音作为噪声包含到外部声音（背景声音）的音频信号内。脉冲机械声音包括其幅度瞬间升高的脉冲分量和跟随脉冲分量的混响分量。

脉冲机械声音的脉冲分量是其中脉冲机械声音的信号电平（幅度）在产生的开始在脉冲形状上升高的部分。脉冲分量的信号电平（幅度）的最大值是最大幅度值A（参见图3C）。另外，脉冲宽度W是脉冲分量的时间宽度，并且例如，从最大幅度值A至其一半的信号电平（幅度）的时间宽度（参见图3C）。

另一方面，脉冲机械声音的混响分量是跟随脉冲分量的特定低频带的窄带信号的一部分，并且具有响应于脉冲机械声音的混响的信号特性。数字相机1的从驱动装置14产生的驱动噪声等大多数包括数字相机1的主体的谐振分量，并且当驱动装置14开始操作时产生脉冲分量后，产生包括脉冲分量的谐振分量的混响分量。脉冲机械声音的混响分量的功率集中在与一般背景声音不同的特定频带，诸如等于或小于200Hz的低频带。用于指示混响分量的窄带信号的功率是混响分量功率P。

如上所述，因为脉冲机械声音包括脉冲分量和混响分量的特征分量，所以如果可以检测该两种分量，则可以精确地检测脉冲机械声音的存在或不存在。因此，特征量提取单元130从输入音频信号计算三个特征量（A、W和P）。在该情况下，因为难以计算数字音频信号的每一个采样数据片的特征量，所以特征量提取单元130在缓冲器（未示出）中以预定数量（例如，一个帧）来存储音频信号的数据，并且然后计算音频信号的一个帧数据的特征量。在此，音频信号的一个帧可以例如是512个样本或1024个样本，但是该值不限于此，并且可以是任何数量的数据片。

最大幅度值获取部131计算在音频信号的一个帧中的数据的信号电平（幅度）的绝对值，并且提取在值中的最大值，由此获得最大幅度值A。当脉冲机械声音的脉冲分量的音量增大时，最大幅度值A因此增大。脉冲宽度计算部132计算音频信号的信号电平（幅度）的从最大幅度值A至例如其一半的时间宽度，由此获得脉冲宽度W。当脉冲机械声音的脉冲分量变陡时，脉冲宽度W因此减小。

混响功率计算部133使特定频带通过的带通滤波器（BPF）来计算用于指示脉冲机械声音的混响分量的窄带信号的功率（混响分量功率P）的值。例如，混响功率计算部133从音频信号取出200Hz或更低的低频带的信号，并且积分该信号的信号电平值，由此获得混响分量功率P的值。混响功率计算部133可以根据噪声的特性从与200Hz或更低的频带不同的频带计算混响分量功率P。另外，混响功率计算部133可以从多个频带计算混响分量功率P的值。另外，可以通过使用快速傅立叶变换（FFT）算法计算音频信号的功率谱来计算混响分量功率P的值。

如上所述，由特征量提取单元130获得的三个特征量（最大幅度值A、脉冲宽度W和混响分量功率P）被输入到噪声确定单元140。

参见图2，噪声确定单元140基于用于指示脉冲机械声音的特征量（最大幅度值A、脉冲宽度W和混响分量功率P）来确定是否在音频信号中包括脉冲机械声音。确定系数保留单元150被配置为诸如存储器的存储器装置，并且保留在通过噪声确定单元140确定脉冲机械声音的存在或不存在中使用的确定系数。因为确定系数根据数字相机1或驱动装置14的特性与麦克风51和驱动装置14的位置关系等而不同，所以在确定系数保留单元150中存储通过预先学习从装置产生的脉冲机械声音而设置的确定系数。

噪声确定单元140通过综合使用包括由特征量提取单元130获得的三个特征量的特征量向量x（A、W和P）和在确定系数保留单元中保留的确定系数来确定在音频信号中的脉冲机械声音的存在或不存在。噪声确定单元140确定是否在音频信号中包括脉冲机械声音，并且指定其中包括脉冲机械声音的音频信号的部分。下面更详细地描述该确定方法。

噪声减少单元160根据噪声确定单元140的确定结果来对于音频信号执行噪声减少处理，由此从音频信号去除诸如脉冲机械声音的噪声。具体地说，当确定包括脉冲机械声音时，噪声减少单元160对于其中包括脉冲机械声音的部分的音频信号执行噪声减少处理。另一方面，当确定不包括脉冲机械声音时，噪声减少单元160不执行噪声减少处理。如上所述，因为仅当包括脉冲机械声音时对于其中包括脉冲机械声音的部分（噪声部分）的音频信号执行噪声减少处理，所以增强了噪声减少处理的处理效率，并且因此，可以降低不必要的处理负荷。

作为噪声减少单元160使用的噪声减少处理方法，可以使用现有技术的任意方法，然而，存在例如下面的处理方法。（1）噪声减少单元160可以执行用于减小噪声部分的音量（信号电平）的增益控制。（2）另外，噪声减少单元160可以从输入实际音频信号减去预先建立的脉冲机械声音的模型信号。（3）此外，噪声减少单元160可以使用带阻滤波器来抑制脉冲机械声音的频带（噪声频带）。（4）此外，噪声减少单元160可以基于在噪声部分之前和之后的音频信号来估计其中包括脉冲机械声音的噪声时间段的背景信号的信号波形，并且然后，可以使用估计信号来内插噪声部分的信号。

信号记录单元170在记录介质（未示出）上记录其中通过噪声减少单元160减小脉冲机械声音的数字音频信号。记录介质可以是任意记录介质，诸如：磁记录介质，例如硬盘和磁带；光记录介质，诸如DVD和蓝光盘；或者，半导体存储器，诸如快闪存储器或USB存储器。

[1.3.脉冲机械声音的确定方法的具体示例]

接下来，将描述由根据本实施例的音频信号处理装置100的噪声确定单元140使用的脉冲机械声音的确定方法的具体示例。以下，例示使用统计识别方法的确定方法和使用表格确定的确定方法。

[1.3.1.使用统计识别方法的确定方法]

噪声确定单元140可以基于使用线性识别装置或人工神经网络等的统计识别方法来确定在音频信号中包括的脉冲机械声音的存在或不存在。例如，在使用线性识别装置的统计识别方法中，使用下面的表达式（1）来计算特征量的加权平均值作为确定值y。

y = Σ_{i = 0}^{I - 1} w_{i} \cdot x_{i} + w_{I} . . . (1)

其中，i是用于指示维度的索引，并且I是负载系数向量w_i的维度的总数。x_i指示特征量向量（例如，由特征量提取单元130提取的三个特征量向量是x₀=A，x₁=W并且x₂=P）。w_i是预设的负载（确定系数的示例），并且w_I是用于决定确定的阈值的常数。

噪声确定单元140使用利用上面的表达式（1）获得的确定值y来确定在音频信号的一个帧中的脉冲机械声音的存在或不存在。例如，噪声确定单元140确定确定值y是否等于或大于预定阈值y₀（例如，y₀=0）。结果，如果y≥y₀，则噪声确定单元140确定在这一个帧中存在脉冲机械噪声，并且如果y<y₀，则确定在这一个帧中不存在脉冲机械声音。

负载w_i和阈值y₀对应于确定系数，并且被确定系数保留单元150预先保留。基于用于学习的多个预先记录的噪声样本来建立w_i。例如，向多个噪声样本给出关于某物是否是噪声或非噪声的正确的回答，并且通过使用诸如最陡下降的方法或牛顿方法等的优化方法，可以设置具有噪声和非噪声的最高识别性能的负载w_i。

[1.3.2.使用表格确定的确定方法]

噪声确定单元140可以使用用于指示预设特征量的阈值的表格来确定在音频信号中包括的脉冲机械声音的存在或不存在。噪声确定单元140使用如在例如图4中所示的表格142确定脉冲机械声音的存在或不存在。

如图4中所示，在表格142中，存储了特征量A、W、P、…的阈值A₀、W₀、P₀、…和与确定参考相关的信息。如果例如最大幅度值A的阈值A₀是25000并且实际最大幅度值A超过A₀，则将关于最大幅度值A的确定设置为正的（真）。噪声确定单元140将由特征量提取单元130计算的实际最大幅度值A、脉冲宽度W和混响分量功率P与在表格142中保留的阈值A₀、W₀和P₀作比较，并且然后将特征量的每一个项目确定为正的或负的。在该图的示例中，将最大幅度值A和混响分量功率P的项目确定为正的（真），并且将脉冲宽度W的项目确定为负的（假）。

此外，噪声确定单元140将正地确定的项目z的数量与其阈值z₀作比较。结果，如果z≥z₀，则噪声确定单元140确定在音频信号的一个帧中存在脉冲机械声音，并且如果z<z₀，则确定在这一个帧中不存在脉冲机械声音。当例如z₀=3时，在附图中的示例中，正地确定的项目z的数量是2，因此，确定在音频信号的这一个帧中不存在脉冲机械声音。

如上所述，阈值A₀、W₀、P₀、…和正地确定的项目z的数量的阈值z₀等对应于确定系数。在确定系数保留单元150中预先保留包括确定系数和确定参考的表格142。基于预先记录的噪声样本来建立在表格142中的确定系数。音频信号处理装置100的设计者可以根据实际脉冲机械声音的特性来例如任意设置确定系数。

[1.4.音频信号处理方法]

接下来，参考图5，将描述使用音频信号处理装置100的音频信号处理方法（机械声音减小方法）。图5是用于描述根据本实施例的音频信号处理方法的流程图。

如图5中所示，在通过配备了根据本实施例的音频信号处理装置100的数字相机1进行的成像和声音记录期间，通过麦克风51收集在数字相机周围的外部声音，并且因此输出音频信号。然后，音频信号处理装置100的A/D转换器120将从麦克风51输入的模拟音频信号转换为数字音频信号（S10）。

接下来，特征量提取单元130读取已经经历了在S10中的A/D转换的输入音频信号，并且将该信号存储在缓冲器中（S12）。在缓冲器中存储作为用于在噪声确定处理中的处理的单元的一个帧的音频信号的数据后（S14），特征量提取单元130使用这一个帧的音频信号的数据来计算用于指示脉冲机械声音的特征量（S16）。具体地说，特征量提取单元130计算脉冲机械声音的脉冲分量的最大幅度值A和脉冲宽度W作为脉冲特征量的，并且计算脉冲机械声音的混响分量功率P作为混响特征量。

此外，噪声确定单元140使用在S16中获得的特征量A、W和P和如上所述的确定系数来确定是否在输入音频信号的这一个帧中包括脉冲机械声音（S18）。结果，当确定包括脉冲机械声音时，噪声减少单元160对于输入音频信号的这一个帧执行噪声减少处理，以去除包括脉冲机械声音的噪声（S20）。然后，信号记录单元170在记录介质上记录其噪声在S20中被去除的音频信号（S22）。

另一方面，当在S18中确定不包括脉冲机械声音时，噪声减少单元160不对于输入音频信号的这一个帧执行噪声减少处理，并且信号记录单元170在记录介质上记录输入音频信号的这一个帧（S22）。

然后，在输入音频信号的下一个帧上重复S10至S22的处理，直到通过数字相机1的成像和声音记录操作结束（S24）。

[1.5.效果]

以上，已经描述了根据本公开的第一实施例的音频信号处理装置100的配置和使用该配置的音频信号处理方法。根据本实施例，音频信号处理装置100从自麦克风51输入的音频信号提取用于指示脉冲机械声音的三个特征量，然后使用该特征量来确定脉冲机械声音的存在或不存在。因此，在不使用作为噪声产生源的驱动装置14的驱动控制信息的情况下，可以仅使用实际上收集的声音的输入信号来精确地检测脉冲机械声音的和其部分的存在或不存在。

另外，音频信号处理装置100仅对于其中检测到脉冲机械声音的音频信号的噪声部分执行噪声减少处理。因此，能够精确地将其中实际上包括脉冲机械声音的噪声部分与噪声减少处理部分匹配，并且在非噪声部分中执行减少处理，或者相反，在噪声部分中省略减少处理。因此，在音频信号的非噪声部分中的声音质量的变差不是担心的问题，可以实现高度精确的噪声减少处理，并且可以增强收集的外部声音（期望声音）的保真度。

此外，在噪声确定处理中，可以不仅使用与音频信号的音量（信号电平）相关的特征量（最大幅度值A）此外还使用脉冲机械声音的脉冲宽度W和脉冲机械声音的混响分量功率P来高精度地检测由人耳感知到的脉冲机械声音。因此，对于其中人耳未感知到噪声的非噪声部分执行噪声减少处理，或者相反，在其中感知到噪声的噪声部分中省略噪声减少处理。因此，外部声音的期望声音（背景声音）的质量不变差，并且可以仅适当地去除诸如脉冲机械声音的令人不愉快的噪声。

另外，因为不使用作为噪声产生源的驱动装置14的驱动控制信息，所以可以简化音频信号处理装置100和数字相机1的系统配置。此外，因为仅从记录的音频信号的数据检测噪声（脉冲机械声音），而不使用驱动控制信息，所以可以不仅在通过音频信号记录装置的音频信号的记录期间此外还在通过音频信号再现装置的音频信号的再现期间执行噪声的存在或不存在的确定和减少处理。

<2.第二实施例>

接着，将描述根据本公开的第二实施例的音频信号处理装置和音频信号处理方法。根据第二实施例的音频信号处理装置的特征在于：将用于指示混响分量的信号的过零次数N用作混响特征量（第二特征量）代替了混响分量功率P。因为第二实施例的其他功能配置与第一实施例的那些基本上相同，所以将省略其详细说明。

[2.1.音频信号处理装置的功能配置]

首先，参考图6，将描述根据第二实施例的音频信号处理装置100的功能配置。图6是图示根据第二实施例的音频信号处理装置100的功能配置的框图。

如图6中所示，音频信号处理装置100与在第一实施例中一样包括信号输入单元110、A/D转换器120、特征量提取单元130、噪声确定单元140、确定系数保留单元150、噪声减少单元160和信号记录单元170。另外，特征量提取单元130的特征在于包括与在第一实施例中一样的作为脉冲特征量提取单元的最大幅度值获取部131和脉冲宽度计算部132，并且包括作为混响特征量提取单元的过零次数计算部134。

过零次数计算部134计算用于指示脉冲机械声音的混响分量的窄带信号的过零次数N。在此，过零次数N是窄带信号的过零点的数量。过零点是具有时间波形的音频信号的正信号值达到负值或负信号值达到正值的点。在过零点处，音频信号的信号值是0。当过零次数增大时，音频信号具有高频分量，并且当过零点的数量减小时，音频信号具有低频分量。以这种方式，过零点的数量作为用于指示在音频信号中包括的低频分量的参数。

如上所述，用于指示脉冲机械声音的混响分量的窄带信号是特定的低频带（例如，200Hz或更低）的信号，并且具有与一般的背景声音不同的频带。因此，如果计数在预定部分中的音频信号的过零次数N，则可以使用过零次数N来确定是否在该部分中包括脉冲机械声音的混响分量。

因此，过零次数计算部134从例如音频信号的预定部分（例如，一个帧）取出例如200Hz或更低的低频带的信号，计数该信号的过零点的数量，并且由此获得过零次数N。然后，过零次数计算部134向噪声确定单元140输出过零次数N作为混响特征量（第二特征量）。

过零次数计算部134可以根据噪声的特性来计算与200Hz或更低的频带不同的频带的信号的过零次数N。另外，过零次数计算部134可以计算多个频带的信号的过零次数N。此外，过零次数计算部134可以使用通过将过零次数N除以在音频信号的一个帧中的样本的数量而获得的值作为混响特征量，而不是使用过零次数N。

噪声确定单元140基于用于指示脉冲机械声音的特征量（最大幅度值A、脉冲宽度W和过零次数N）来确定是否在音频信号中包括脉冲机械声音。在该情况下，噪声确定单元140将由过零次数计算部134获得的过零次数N与过零次数N的预设阈值N₀作比较，并且如果N₀>N，则确定在音频信号的部分中存在脉冲机械声音的混响分量。

[2.2.脉冲机械声音的确定方法的具体示例]

接下来，将描述由根据第二实施例的音频信号处理装置100的噪声确定单元140使用的脉冲机械声音的确定方法的具体示例。以与在第一实施例中相同的方式，例如，可以在第二实施例中利用使用统计识别方法的确定方法或使用表格确定的确定方法等。

[2.2.1.使用统计识别方法的确定方法]

噪声确定单元140可以使用统计识别方法来确定在音频信号中的脉冲机械声音的存在或不存在，该统计识别方法使用线性识别装置或人工神经网络等。在使用线性识别装置的统计识别方法中，例如，使用如上所述的表达式（1）来将特征量的加权平均值计算为确定值y。在该情况下，作为在表达式（1）中的x_i，使用通过特征量提取单元130提取的三个特征量的向量{x_i=(A,W,N)}。因为其他点与在第一实施例中相同，所以省略其详细说明。

[2.2.2.使用表格确定的确定方法]

噪声确定单元140可以使用指示特征量的预设阈值的表格来确定在音频信号中的脉冲机械声音的存在或不存在。噪声确定单元140使用例如如图7中所示的表格144来确定脉冲机械声音的存在或不存在。

如图7中所示，在表格144中，存储了特征量A、W、N、…的阈值A₀、W₀、N₀、…和与确定参考相关的信息。例如，如果过零次数N的阈值N₀是50并且实际过零次数N小于N₀，则将过零次数N设置为被确定为正的（真）。噪声确定单元140将由特征量提取单元130计算的实际最大幅度值A、脉冲宽度W和过零次数N与在表格144中存储的阈值A₀、W₀和N₀作比较，并且然后确定特征量的项目的正或负。在该图的示例中，将最大幅度值A和过零次数N的项目确定为正的（真），并且将脉冲宽度W的项目确定为负的（假）。

此外，以与在第一实施例中相同的方式，噪声确定单元140将正地确定的项目z的数量与阈值z₀作比较，并且然后基于比较结果来确定是否在音频信号的一个帧中包括脉冲机械声音。正地确定的项目z的数量的阈值A₀、W₀、N₀、…和阈值Z₀对应于用于确定脉冲机械声音的存在或不存在的确定系数。

[2.3.效果]

以上，已经描述了根据本公开的第二实施例的音频信号处理装置100的配置和使用该配置的噪声确定方法。使用音频信号处理装置100的音频信号处理方法的过程与在第一实施例（参见图5）中相同。

根据第二实施例，因为可以通过使用过零次数N作为混响特征量来适当地确定脉冲机械声音的混响分量的存在或不存在，所以可以精确地检测是否在音频信号中包括脉冲机械声音。因此，在第二实施例中获得与在如上所述的第一实施例中相同的效果。

<3.第三实施例>

接着，将描述根据本公开的第三实施例的音频信号处理装置和音频信号处理方法。根据第三实施例的音频信号处理装置的特征在于：除了三个特征量A、W和P之外，也使用另一个附加特征量（第三特征量）。因为第三实施例的其他功能配置与第一实施例的那些基本上相同，所以将省略其详细说明。

[3.1.音频信号处理装置的功能配置]

首先，参考图8，将描述根据第三实施例的音频信号处理装置100的功能配置。图8是图示根据本公开的第三实施例的音频信号处理装置100的功能配置的框图。

如图8中所示，音频信号处理装置100与在第一实施例中一样包括信号输入单元110、A/D转换器120、特征量提取单元130、噪声确定单元140、确定系数保留单元150、噪声减少单元160和信号记录单元170。另外，特征量提取单元130的特征在于除了最大幅度值获取部131、脉冲宽度计算部132和混响功率计算部133之外进一步包括一个或两个或更多的附加特征量计算部分135-1至N（N是任意自然数）。

附加特征量计算部分135-1至N（以下统称为附加特征量计算部分135）除了在第一实施例中使用的基本特征量（最大幅度值A、脉冲宽度W和混响分量功率P）之外也计算附加特征量B。

在此，附加特征量B例如是：（a）音频信号的均方根（RMS，root meansquare），（b）RMS的改变的值；（c）用于指示脉冲机械声音的混响分量的窄带信号的改变的幅度值；（d）窄带信号的过零次数N；或者，（e）过零次数N的改变的值等。附加特征量计算部分135可以仅计算各种附加特征量的一些或全部。

（a）音频信号的RMS指示在音频信号的部分中的平均能量，并且对应于用于指示脉冲机械声音的脉冲分量的脉冲特征量。当音频信号包括噪声时，RMS指示噪声或在噪声周围的音频信号的能量。因此，当音频信号包括脉冲机械声音时，脉冲分量的部分的RMS增大，在该部分之前和之后的RMS减小，并且因此，可以使用RMS来检测脉冲分量的存在或不存在。

（b）RMS的改变的值指示与用于指示脉冲机械声音的脉冲分量的脉冲特征量对应的RMS的时间进展。通过将在包括脉冲机械声音的部分和在该部分之前和之后的部分之间的音频信号的能量改变与RMS的改变的值作比较，可以更精确地检测脉冲机械声音的存在或不存在，或者，可以紧密地分析脉冲机械声音的脉冲分量的信号波形等。

（c）窄带信号的改变的幅度值指示与用于指示脉冲机械声音的混响分量的混响特征量对应的脉冲机械声音的混响分量的幅度的时间进展。通过将在包括脉冲机械声音的混响分量的部分和在该部分之前和之后的部分之间的音频信号的幅度改变与窄带信号的改变的幅度值作比较，可以更精确地检测脉冲机械声音的存在或不存在，或者，可以紧密地分析脉冲机械声音的混响分量的信号波形等。

（d）窄带信号的过零次数N指示与指示脉冲机械声音的混响分量的混响特征量对应的脉冲机械声音的混响分量的能量。如在第二实施例中所述，可以使用过零次数N来精确地检测脉冲机械声音的混响分量的存在或不存在。

（e）过零次数N的改变的值指示与用于指示脉冲机械声音的混响分量的混响特征量对应的、用于指示脉冲机械声音的混响分量的窄带信号的过零次数N的时间进展。通过将在包括脉冲机械声音的混响分量的部分和在该部分之前和之后的部分之间的音频信号的过零次数与过零次数N的改变的值作比较，可以更精确地检测脉冲机械声音的存在或不存在，或者，可以紧密地分析脉冲机械声音的混响分量的信号波形等。

以这种方式，附加特征量计算部分135计算各种附加特征量B，并且向噪声确定单元140输出该计算的附加特征量B。噪声确定单元140使用附加特征量B（其对应于第一、第二和第三特征量）的至少一个和三个基本特征量（最大幅度值A、脉冲宽度W和混响分量功率P）来确定脉冲机械声音的存在或不存在。

[3.2.脉冲机械声音的确定方法的具体示例]

接下来，将描述由根据第三实施例的音频信号处理装置100的噪声确定单元140使用的脉冲机械声音的确定方法的具体示例。在第三实施例中，例如，可以与在第一实施例中一样利用使用统计识别方法的确定方法或使用表格确定的确定方法等。

[3.2.1.使用统计识别方法的确定方法]

在使用统计识别方法的确定方法中，四个或更多的特征量向量x_i=(A,W,P,B₁,B₂,…,B_N)}，其中，三个基本特征量A、W和P与附加特征量B的至少一个被用作如上所述的表达式（1）的x_i。因为其他点与在第一实施例中相同，所以省略其详细说明。

可以根据特征量的每一个的重要程度和脉冲机械声音的特性来改变在表达式（1）中的每一个特征量的负载w_i。例如，可以将基本特征量A、W和P的负载w_i设置得大于附加特征量B的负载w_i。另外，当使用多个附加特征量B₁、B₂、…和B_N时，可以将负载w_i设置为对于更重要的附加特征量B（例如，过零次数N）更大。因此，确定脉冲机械声音的存在或不存在的精度可以改善。

[3.2.2.使用表格确定的确定方法]

另外，在使用表格确定的确定方法中，与在第一实施例中相同，使用用于指示特征量的预设阈值的表格（参见图4）来确定在音频信号中的脉冲机械声音的存在或不存在。在该表格中，存储了特征量A、W、P、B₁、B₂、…和B_N的阈值A₀、W₀、N₀、B_{1_0}、B_{2_0}、…和B_{N_0}和与确定参考相关的信息。噪声确定单元140将实际特征量A、W、P、B₁、B₂、…和B_N与在表格144中保留的阈值A₀、W₀、N₀、B_{1_0}、B_{2_0}、…和B_{N_0}作比较，并且然后确定特征量的项目的正或负。此外，噪声确定单元140将正地确定的项目z的数量与其阈值z₀作比较，并且然后基于比较结果来确定是否在音频信号的一个帧中包括脉冲机械声音。因为该确定方法与在第一实施例中相同，所以省略其详细说明。

[3.3.效果]

以上，已经描述了根据本公开的第三实施例的音频信号处理装置100的配置和使用该配置的噪声确定方法。使用音频信号处理装置100的音频信号处理方法的过程与在第一实施例（参见图5）中相同。

根据第三实施例，除了基本特征量A、W和P之外使用附加特征量B来确定脉冲机械声音的存在或不存在。因此，第三实施例除了如上所述的第一实施例的效果之外还呈现下述效果：可以更精确地检测脉冲机械声音的存在或不存在，并且可以更精确地检测脉冲机械声音等的信号波形。

在第三实施例中，虽然已经描述了使用混响分量功率P作为基本特征量并且使用过零次数N作为附加特征量的示例，但是本技术不限于该示例。例如，过零次数N和其改变的值可以被用作基本特征量，而不是混响分量功率P，并且混响分量功率P或其改变的值等可以被用作附加特征量。

<4.第四实施例>

接着，将描述根据本公开的第四实施例的音频信号处理装置和音频信号处理方法。根据第四实施例的音频信号处理装置的特征在于：从音频信号的多个部分提取多个特征量，并且，基于该多个特征量来确定脉冲机械声音的存在或不存在。在该情况下，计算该多个特征量（例如，计算和或平均值），并且使用所计算的值作为新的特征量，可以确定脉冲机械声音的存在或不存在。因为第四实施例的其他功能配置与第一或第三实施例的那些基本上相同，所以将省略其详细说明。

[4.1.音频信号处理装置的功能配置]

首先，参考图9，将描述根据第四实施例的音频信号处理装置100的功能配置。图9是图示根据第四实施例的音频信号处理装置100的功能配置的框图。

如图9中所示，音频信号处理装置100与在第一实施例中一样包括信号输入单元110、A/D转换器120、特征量提取单元130、噪声确定单元140、确定系数保留单元150、噪声减少单元160和信号记录单元170。此外，音频信号处理装置100的特征在于包括连接到特征量提取单元130和噪声确定单元140的特征量保留单元152。

在第四实施例中，特征量提取单元130可以设置用于计算在任意位置的特征量的音频信号的部分（帧）。另外，特征量提取单元130从在音频信号的任意位置中的多个部分（多个帧）计算特征量，并且然后将结果输出到噪声确定单元140。噪声确定单元140在特征量保留单元152中存储多个特征量。特征量保留单元152由诸如半导体存储器的存储器装置配置，并且暂时保留由特征量提取单元130计算的特征量。特征量提取单元130可以保留在任意时间段中的特征量，并且为了抑制所存储的数据的数量，可以依序删除旧的特征量数据。

特征量提取单元130可以从音频信号的多个部分计算各种特征量（例如，最大幅度值A、脉冲宽度W、混响分量功率P和附加特征量B）。替代地，特征量提取单元130可以从音频信号的多个部分计算一些特征量（例如，最大幅度值A和脉冲宽度W），并且从音频信号的一个部分计算其他特征量（例如，混响分量功率P和附加特征量B）。

以这种方式，在特征量保留单元152中保留从音频信号的多个部分（帧）计算的特征量。噪声确定单元140从特征量保留单元152读取从音频信号的多个部分计算的特征量，并且基于该多个特征量来确定音频信号的存在或不存在。在该情况下，噪声确定单元140可以计算多个特征量的和或平均值，并且然后基于计算的值来确定音频信号的存在或不存在。

因为像在第一实施例中那样通过噪声确定单元140确定脉冲机械声音的存在或不存在，所以例如，也可以在第四实施例中利用使用统计识别方法的确定方法或使用表格确定的确定方法等。确定方法与在第一或第三实施例中相同，并且省略其详细说明。

[4.2.效果]

以上，已经描述了根据本公开的第四实施例的音频信号处理装置100的配置。使用音频信号处理装置100的音频信号处理方法的过程与在第一实施例（参见图5）中相同。

根据第四实施例，使用从音频信号的多个部分计算的多个特征量确定音频信号的存在或不存在。具体地说，优选的是，通过计算多个特征量的和或平均值并且将计算的值设置为新的特征量，可以基于特征量来确定音频信号的存在或不存在。

因此，确定的稳定性可以提高，并且确定的精度可以改善。当在音频信号中包括除了脉冲机械声音之外的噪声时或当背景声音改变时，例如，存在其中难以仅从音频信号的一个部分计算适当的特征量的情况。因为这个原因，通过如在该实施例中所述从在音频信号中的多个部分计算多个特征量，可以抑制音频信号的异常值或独特值的影响。因此，可以稳定地计算适当的特征量，并且因此，确定脉冲机械声音的存在或不存在的精度可以改善。

虽然如上所述的第四实施例具有其中在特征量提取单元130的后部设置特征量保留单元152以保留所计算的特征量的配置，但是本技术不限于该示例。可以以下述方式从音频信号的多个部分计算特征量：例如，在特征量提取单元130的前部设置保留AD转换的音频信号的一些部分的数据的信号保留单元，并且，特征量提取单元130从该信号保留单元读取音频信号的任意部分的数据。因此，噪声确定单元140可以基于音频信号的多个部分的特征量来确定脉冲机械声音的存在或不存在。

<5.第五实施例>

接着，将描述根据本公开的第五实施例的音频信号处理装置和音频信号处理方法。根据第五实施例的音频信号处理装置的特征在于：获取作为脉冲机械声音的产生源的驱动装置14的控制信号，并且仅在驱动装置14的驱动时间段中执行特征量提取处理和噪声确定处理。因为第五实施例的其他功能配置与第一实施例的那些基本上相同，所以将省略其详细说明。

[5.1.音频信号处理装置的功能配置]

首先，参考图10，将描述根据第五实施例的音频信号处理装置100的功能配置。图10是图示根据第五实施例的音频信号处理装置100的功能配置的框图。

如图10中所示，音频信号处理装置100与在第一实施例中一样包括信号输入单元110、A/D转换器120、特征量提取单元130、噪声确定单元140、确定系数保留单元150、噪声减少单元160和信号记录单元170。此外，音频信号处理装置100的特征在于包括连接到特征量提取单元130的控制信号获取单元180。

根据由数字相机1的控制单元70（参见图1）产生的控制信号来控制作为脉冲机械声音的产生源的驱动装置14。控制信号对应于用于控制驱动装置14的驱动的驱动控制信息，并且例如是用于驱动数字相机1的变焦电机15或聚焦电机16的控制信号。使用该控制信号，确定驱动装置14的驱动或非驱动，并且可以检测其中可以从驱动装置14产生脉冲机械声音的时间段。

当驱动装置14未运行时（非驱动时间段），不产生脉冲机械声音，并且因此，不必执行如上所述的特征量提取处理和噪声确定处理。另一方面，当驱动装置14运行时（驱动时间段），产生脉冲机械声音，并且因此需要执行如上所述的特征量提取处理和噪声确定处理。因此，如果有可能获取控制信号并且然后检测驱动装置14的驱动时间段，则可以仅在该驱动时间段中执行处理，并且可以因此减少计算量。

因此，根据第五实施例的音频信号处理装置100从控制单元70等获取控制信号，并且仅在驱动装置14的驱动时间段中执行如上所述的特征量提取处理和噪声确定处理。更详细而言，音频信号处理装置100包括控制信号获取单元180，该控制信号获取单元180获取用于控制驱动装置14的控制信号，如图10中所示。控制信号获取单元180接收从控制单元70发送的控制信号，并且然后向特征量提取单元130输出该信号。

特征量提取单元130具有在附图中未示出的诸如缓冲器存储器等的存储器部分，用于缓冲从麦克风51输入的音频信号。另外，特征量提取单元130监控控制信号获取单元180是否获取了控制信号。然后，当获取用于指示驱动装置14的驱动开始的控制信号时，特征量提取单元130读取在缓冲器存储器中存储的音频信号，开始执行计算各种特征量的处理，并且然后当获取到用于指示驱动装置14的驱动端的控制信号时结束处理的执行。以这种方式，特征量提取单元130确定其中驱动装置14使用控制信号来运行的时间段，并且然后仅在驱动装置14的驱动时间段中执行特征量提取处理。以相同的方式，噪声确定单元140也使用控制信号来确定驱动装置14的驱动时间段，并且使用从特征量提取单元130获得的特征量仅在驱动装置14的驱动时间段中执行如上所述的噪声确定处理。

[音频信号处理方法]

接下来，参考图11，将描述根据第五实施例的使用音频信号处理装置100的音频信号处理方法（机械声音减少方法）。图11是用于描述根据本实施例的音频信号处理方法的流程图。

如图11中所述，根据第五实施例的音频信号处理装置100首先对于从麦克风51输入的音频信号执行A/D转换（S10），并且在缓冲器中存储该信号（S12）。从S10至S12的处理与第一实施例的那些相同。

然后，在缓冲器中存储作为在噪声确定处理中的处理单位的一个帧的音频信号的数据后（S14），特征量提取单元130确定作为噪声产生源的驱动装置14是否在运行，换句话说，是否在驱动时间段中（S15）。例如，在S15中，特征量提取单元130基于是否已经从数字相机1的主体的控制单元70接收到驱动装置14的控制信号来确定驱动装置是否在驱动时间段中。其中接收到控制信号的时间段被确定为其中驱动装置14运行的驱动时间段，并且另一方面，未接收到控制信号的时间段被确定为其中驱动装置14不运行的非驱动时间段。

结果，当确定为驱动装置14的驱动时间段时，特征量提取单元130从输入音频信号的一个帧的音频信号的数据计算用于指示脉冲机械声音的特征量（S16），并且像在第一实施例中那样，噪声确定单元140使用在S16中获得的特征量A、W和P和确定系数来确定是否在这一个帧中包括脉冲机械声音（S18）。结果，当将脉冲机械声音确定为被包括在其中时，噪声减少单元160对于输入音频信号的一个帧执行噪声减少处理，以去除包括脉冲机械声音的噪声（S20）。然后，信号记录单元170在记录介质上记录在S20中从其去除了噪声的音频信号（S22）。

另一方面，当在S15中确定不是驱动装置14的驱动时间段时，不像在第一实施例中那样，不执行通过噪声确定单元140的特征量计算处理和通过噪声确定单元140的脉冲机械声音的存在或不存在的确定处理。然后，信号记录单元170没有改变地在记录介质上记录输入的音频信号（S22）。

然后，在输入音频信号的下一个帧上重复S10至S22的处理，直到由数字相机1进行的成像和声音记录操作结束（S24）。

[5.3.效果]

以上，已经描述了根据本公开的第五实施例的音频信号处理装置100的配置和使用该装置的音频信号处理方法。

根据第五实施例，使用驱动装置14的控制信息来确定驱动装置14的驱动或非驱动，并且，仅在驱动装置14的操作时间段中执行特征量提取处理和噪声确定处理。因此，可以在驱动装置14的非驱动时间段中不执行计算处理，并且因此，可以减少计算量。具体地说，在数字相机1的成像操作时间段中，诸如变焦电机15的驱动装置14不频繁地运行，并且，驱动装置14的操作时间段仅占在整个成像操作时间段中的短的时间段。因此，当在驱动时间段中执行而不是在非驱动时间段中执行如上所述的处理时，可以显著地减少计算量。

另外，当在驱动装置14的非驱动时间段中执行处理时，存在当错误地将脉冲机械声音确定为存在时的噪声确定错误的担心。然而，根据第五实施例，可以减少这样的噪声确定错误的出现，并且因此，可以记录具有与原始声音接近的高质量的音频信号。

<6.第六实施例>

接着，将描述根据本公开的第六实施例的音频信号处理装置和音频信号处理方法。根据第六实施例的音频信号处理装置的特征在于：根据作为噪声产生源的驱动装置14的特性来改变确定系数，并且使用确定系数和特征量，确定对于驱动装置14唯一的脉冲机械声音的存在或不存在。因为第六实施例的其他功能配置与第一实施例的那些基本上相同，所以将省略其详细说明。

[6.1.噪声确定方法的概述]

脉冲机械声音的特性根据产生脉冲机械声音的声音产生单元（驱动装置14等）的特性来改变。在单镜头反射相机中，例如，可以相对于相机的主体附接或卸下多种可更换透镜装置（例如，与图1的成像单元10对应的那个）。在该情况下，在数字相机1中收集的脉冲机械声音的特性根据安装的透镜装置的特性（例如，驱动透镜的驱动装置14的类型或布置等）改变。因此，优选的是，根据在数字相机1中实际上安装的透镜装置的特性来设置在噪声确定处理中使用的各种系数、表格和特征量的阈值等的参数（以下，称为“确定系数”）。

因此，在第六实施例中，预先设置与每一个可更换的透镜装置的特性对应的确定系数。然后，使用与在实际噪声确定处理中在数字相机1中安装的透镜装置对应的确定系数，确定是否在输入音频信号中包括对于透镜装置唯一的噪声（脉冲机械声音）。以这种方式，通过改变在噪声确定中使用的确定系数，可以以高精度来检测对于每一个透镜装置唯一的噪声。

在此，每一个确定系数是在确定脉冲机械声音的存在或不存在中使用的参数。例如，确定系数包括基于统计识别方法和特征量的阈值A₀、W₀、P₀、…的在表达式（1）中的负载w_i、w_I和阈值y₀和基于表格确定方法的在表格142（参见图4）中的确定项目z的数量的阈值z₀等。如果预先分析从各种透镜装置的驱动装置14产生的脉冲机械声音并且根据分析结果来设置各种确定系数，则可以实现用于每一个透镜装置的适当的噪声减少处理。

[6.2.音频信号处理装置的功能配置]

接下来，参考图12，将描述根据第六实施例的音频信号处理装置100的功能配置。图12是图示根据第六实施例的音频信号处理装置100的功能配置的框图。

如图12中所示，音频信号处理装置100与在第一实施例中一样包括信号输入单元110、A/D转换器120、特征量提取单元130、噪声确定单元140、确定系数保留单元150、噪声减少单元160和信号记录单元170。此外，音频信号处理装置100的特征在于包括确定系数选择单元154，确定系数选择单元154从多个确定系数选择与连接到数字相机1的透镜装置对应的确定系数。

确定系数选择单元154保留用于各种透镜装置的每一个的多个预设确定系数。根据透镜装置的每个的驱动装置14的特性和从驱动装置14产生的脉冲机械声音的特性来预先设置在确定系数选择单元154中保留的确定系数。脉冲机械声音的脉冲分量的最大幅度值和脉冲宽度、混响分量的频带和过零次数等根据透镜装置不同。因此，根据对于在透镜装置的每一个中产生的脉冲机械声音唯一的脉冲分量和混响分量的特性来设置确定系数值。另外，确定系数选择单元154与透镜装置的标识信息相关联地保留与透镜装置对应的确定系数。

另外，确定系数选择单元154从对应的透镜装置或控制单元70等获取用于指示实际上连接到数字相机1的一个透镜装置的信息（连接的透镜信息）。连接的透镜信息是向每种透镜装置有区别地给出的标识信息（例如，透镜装置的型号和标题等）。确定系数选择单元154基于连接的透镜信息来指定连接到数字相机1的透镜装置，并且然后从在确定系数保留单元150中保留的多个确定系数选择与透镜装置对应的一个确定系数。

然后，噪声确定单元140使用由确定系数选择单元154选择的确定系数和由特征量提取单元130获得的特征量来执行噪声确定处理，由此确定对于透镜装置唯一的脉冲机械声音的存在或不存在。在噪声确定处理中，例如，可以以与在第一实施例中相同的方式来利用使用统计识别方法的确定方法或使用表格确定的确定方法等。

在如上所述的图12中所示的配置示例中，在音频信号处理装置100中设置的确定系数保留单元150预先保留多个确定系数，每一个确定系数对应于可以在数字相机1中安装的多种可更换透镜装置。另外，在实际噪声确定处理期间，从在要在噪声确定处理中使用的确定系数保留单元150中保留的多个确定系数选择与在数字相机1中实际上安装的一个透镜装置对应的确定系数。

[6.3.音频信号处理装置的修改示例]

接下来，参考图13，将描述根据第六实施例的音频信号处理装置100的修改示例。图13是图示根据第六实施例的音频信号处理装置100的修改示例的框图。

在图13中所示的示例中，不像如上所述的图12的示例那样，音频信号处理装置100不包括确定系数保留单元150和确定系数选择单元154，并且，在可更换透镜装置156A至156N的每一个中而不是在音频信号处理装置100中保留噪声确定所需的确定系数。预先以与如上所述相同的方式根据透镜装置156A至156N的特性和脉冲机械声音的特性等来设置在可更换透镜装置156A至156N中保留的确定系数。

另外，当透镜装置156A连接到数字相机1时，音频信号处理装置100的噪声确定单元140从透镜装置156A获取与透镜装置156A对应的确定系数。例如，数字相机1的控制单元70与透镜装置156A的标识信息一起获取确定系数，并且噪声确定单元140接收从控制单元70发送的确定系数。此外，噪声确定单元140使用从连接的透镜装置156A获取的确定系数和由特征量提取单元130获得的特征量来确定对于透镜装置156A唯一的脉冲机械声音的存在或不存在。

如上所述，在图13的配置示例中，在相应的透镜装置156中保留噪声确定所需的确定系数。另外，在实际噪声确定处理期间，从要在噪声确定处理中使用的实际上连接到数字相机1的透镜装置156A获取确定系数。

[6.4效果]

以上，已经描述了根据本公开的第六实施例的音频信号处理装置100的配置。使用音频信号处理装置100的音频信号处理方法的过程与第一实施例（参见图5）相同。

根据第六实施例，在噪声确定中使用的确定系数根据连接到数字相机1的可更换透镜装置的特性而改变。因此，由于可以以高精度来确定和检测对于连接的透镜装置唯一的脉冲机械声音，所以噪声减少精度可以锐增。具体地说，在诸如其中可以安装不同种类的透镜装置的单镜头反射相机的设备中，适当地减少与透镜装置不同的脉冲机械声音，并且由此，可以记录高质量背景声音。

此外，在图12中所示的示例中，当音频信号处理装置100的确定系数保留单元150保留与多个不同的透镜装置对应的确定系数时，音频信号处理装置可以灵活地响应于从所有的透镜产生的脉冲机械声音。另外，通过执行在确定系数保留单元150中保留的确定系数的更新（增大、删除或改变），音频信号处理装置也可以响应于新类型的透镜装置。

此外，在图13中所示的示例中，将适当的确定系数设置为被保留在透镜装置中，并且从连接到数字相机1的透镜装置获取确定系数。因此，可以对于像在图12中那样的每一个透镜装置甚至对于新类型的透镜装置156改变确定系数，而不重写在现有的数字相机1中安装的音频信号处理装置100的存储器单元（ROM等）中保留的确定系数。以这种方式，图13的示例的优点在于：可以灵活地执行可更换透镜装置156的增加、删除或改变等，甚至不更新现有的数字相机1的内部信息。

虽然已经上述了当可更换透镜装置连接到数字相机1或从数字相机1断开时改变确定系数的示例，但是本技术不限于该示例。当例如在安装了音频信号处理装置的设备中存在产生具有不同的特性的脉冲机械声音的多个声音产生单元（多个驱动装置14等）时和当多个声音产生单元选择性地附接到该设备或从该设备脱离时等，也可以以与如上所述相同的方式来改变确定系数。

<7.第七实施例>

接下来，将描述根据本公开的第七实施例的音频信号处理装置和音频信号处理方法。在上面，已经描述了其中在诸如数字相机1的记录设备等中设置音频信号处理装置100以在音频信号的记录期间减少噪声的示例。另一方面，第七实施例的特征在于在再现设备中设置音频信号处理装置，并且在记录的音频信号的再现期间减少噪声。因为第七实施例的其他功能配置与第一实施例的那些基本上相同，所以将省略其详细说明。

[7.1.音频信号处理装置的功能配置]

接下来，参考图14，将描述根据第七实施例的音频信号处理装置100的功能配置。图14是图示根据第七实施例的音频信号处理装置100的功能配置的框图。

如图14中所示，音频信号处理装置100被应用到包括信号记录单元190和信号再现单元200的再现设备，并且其特征在于对于从信号记录单元190读取并且要再现的音频信号执行诸如特征量提取、噪声确定和噪声计算等的各种处理。音频信号处理装置100像在第一实施例中那样包括特征量提取单元130、噪声确定单元140、确定系数保留单元150和噪声减少单元160。此外，音频信号处理装置100包括信号获取单元192，信号获取单元192从信号记录单元190获取要再现的音频信号。

信号记录单元190配备了诸如硬盘、光盘、半导体存储器或带的记录介质（未示出）。在该记录介质上，在通过数字相机1的成像和声音记录期间等记录音频信号数据。不必与音频信号相关联地保留变焦电机15和聚焦电机16等的控制信号。

另外，信号记录单元190基于来自未示出的控制单元的指令来从记录介质读取要再现的音频信号。信号获取单元192从信号记录单元190获取要再现的音频信号数据，并且向特征量提取单元130和噪声减少单元160输出该数据。此时，信号获取单元192获取例如作为一个帧的大约512个样本或1024个样本的部分的数据。

然后，以与在第一实施例中相同的方式，特征量提取单元130和噪声确定单元140分别执行特征量计算处理和噪声确定处理。此时，可以在确定系数保留单元150中保留在噪声确定中使用的确定系数，或者可以在信号记录单元190的记录介质上与音频信号相关联地记录该确定系数。

作为确定的结果，当确定在要再现的音频信号中包括脉冲机械声音时，噪声减少单元160从音频信号减少脉冲机械声音。其脉冲机械声音被减少的音频信号被输出到信号再现单元200。信号再现单元200由例如诸如扬声器或耳机的声音再现装置配置，并且再现其噪声被减少的音频信号。

[7.2.效果]

以上，已经描述了根据本公开的第七实施例的音频信号处理装置100的配置。使用音频信号处理装置100的音频信号处理方法的过程与在第一实施例（参见图5）中相同。然而，为了在第七实施例中在声音再现期间减少噪声，图5的A/D转换处理（S10）不是必须的，在S22中再现音频信号，并且，重复S12至S22的处理，直到完成要再现的所有音频信号的数据的再现（S24）。

根据第七实施例，不仅在音频信号的记录（成像或声音记录等）期间，此外还在记录的音频信号的再现期间，可以适当地再现在要再现的音频信号中包括的脉冲机械声音。

<8.结论>

以上，已经描述了根据本公开的示例性实施例的音频信号处理装置和音频信号处理方法。根据该实施例，即使当在驱动装置14的操作开始或结束时产生脉冲机械声音时，也以高精度从通过麦克风51收集的音频信号检测到脉冲机械声音和其部分（噪声部分）。另外，通过在检测的噪声部分中执行噪声减少处理，可以提供高质量的声音，而没有非噪声部分的声音质量变差的担心。

在这样的情况下，可以仅使用实际上输入的音频信号而不使用驱动装置14的控制信号来检测脉冲机械声音。因此，可以通过精确地以其中实际上包括脉冲机械声音的噪声时间段和噪声减少处理时间段为目标来实现噪声减少处理。因此，可以解决噪声减少精度的降低和由在控制信号和噪声部分之间的延迟引起的声音质量变差的问题。

此外，通过基于对于脉冲机械声音唯一的各种特征量（最大幅度值A、脉冲宽度W、混响分量功率P和过零次数N等）的组合综合确定脉冲机械声音的存在或不存在，可以精确地检测到由人耳感知到的脉冲机械声音。因此，可以解决在其中通过人耳未感知到噪声的非噪声部分中执行减少处理或者在其中感知到噪声的噪声部分中不执行减少处理的异常操作。并且由此，可以实现高度精确的噪声减少处理。

另外，因为可以仅基于音频信号而不使用驱动装置14的驱动控制信号（控制信号）来确定脉冲机械声音，所以可以简化音频信号处理装置100被应用到的设备的系统配置。另外，不仅在音频信号的收集和记录期间，此外在记录介质上记录的音频信号的再现期间，可以执行存在或不存在的确定以及噪声的减少处理。

以上，已经参考附图在上面详细描述了本发明的优选实施例，但是当然本发明不限于上面的示例。本领域内的技术人员可以找到在所附的权利要求的范围内的各种改变和修改，并且应当明白，它们将自然的在本发明的技术范围下。

在实施例中，例如，数字相机1主要被例示为音频信号处理装置，并且已经例示了其中在运动图像的捕获和记录声音期间减少机械声音的示例，然而，本技术不限于此。本技术的音频信号处理装置可以被应用到各种音频信号记录装置或诸如音频信号再现装置的电子设备。例如，音频信号处理装置可以被应用到诸如记录和再现装置（例如，蓝光盘和DVD记录器）、电视接收机、系统立体声装置、成像装置（例如，数字照像机和数字摄像机）、移动终端（例如，移动音乐和视频播放机、移动游戏装置和IC记录器）、个人计算机、游戏装置、汽车导航系统、数字照片框、家用电器、自动贩卖机、ATM和商亭等的任意电子设备。

另外，本技术也可以被配置如下。

（1）一种音频信号处理装置，包括：

特征量提取单元，其被配置为从通过声音收集单元获得的音频信号提取特征量，所述特征量指示从在与所述声音收集单元相同的外壳中设置的声音产生单元产生的脉冲操作声音；以及

噪声确定单元，其被配置为基于所述特征量来确定是否在所述音频信号中包括所述操作声音。

（2）根据（1）所述的音频信号处理装置，

其中，所述声音产生单元是在与所述声音收集单元相同的外壳中设置的驱动装置；并且

其中，所述操作声音是当所述驱动装置的操作开始或结束时产生的脉冲机械驱动声音。

（3）根据（1）或（2）所述的音频信号处理装置，

其中，所述特征量提取单元提取作为所述特征量的用于指示所述操作声音的脉冲分量的第一特征量和用于指示所述操作声音的混响分量的第二特征量，并且

其中，所述噪声确定单元基于所述第一和第二特征量来确定是否在所述音频信号中包括所述操作声音。

（4）根据（3）所述的音频信号处理装置，

其中，所述第一特征量包括所述操作声音的所述脉冲分量的最大振幅值和脉冲宽度，并且

其中，所述第二特征量包括用于指示所述操作声音的所述混响分量的窄带信号的功率。

（5）根据（3）所述的音频信号处理装置，

其中，所述第二特征量包括用于指示所述操作声音的所述混响分量的窄带信号的过零次数。

（6）根据（3）至（5）的任何一项所述的音频信号处理装置，

其中，所述特征量提取单元进一步提取作为所述特征量的第三特征量，所述第三特征量包括下述内容的一些或全部：所述音频信号的RMS、所述RMS的改变的值、用于指示所述操作声音的所述混响分量的窄带信号的改变的振幅值、所述窄带信号的过零次数或过零次数的改变的值，并且

其中，所述噪声确定单元基于所述第一、第二和第三特征量来确定是否在所述音频信号中包括所述操作声音。

（7）根据（1）至（6）的任何一项所述的音频信号处理装置，

其中，所述特征量提取单元从所述音频信号的多个部分提取多个特征量，并且

其中，所述噪声确定单元基于从所述多个部分提取的所述多个特征量来确定是否在所述音频信号中包括所述操作声音。

（8）根据（2）所述的音频信号处理装置，进一步包括：

控制信号获取单元，其被配置来获取用于控制所述驱动装置的控制信号，

其中，基于所述控制信号来确定所述驱动装置的驱动周期，并且，仅在所述驱动装置的所述驱动周期中执行通过所述特征量提取单元进行的所述特征量的提取处理和通过所述噪声确定单元进行的确定处理。

（9）根据（1）至（8）的任何一项所述的音频信号处理装置，

其中，所述噪声确定单元使用所述特征量和根据所述声音产生单元的特性设置的确定系数来确定是否在所述音频信号中包括对于所述声音产生单元唯一的所述操作声音。

（10）根据（9）所述的音频信号处理装置，

其中，在成像装置中设置所述音频信号处理装置，

其中，所述声音产生单元是能够附接到所述成像装置的主体或能够从所述主体卸下的可更换透镜装置，

其中，所述音频信号处理装置进一步包括：

确定系数保留单元，其被配置为保留对于每一个透镜装置设置的多个确定系数；以及

确定系数选择单元，其被配置为基于用于指示连接到所述成像装置的所述透镜装置的信息来从所述多个确定系数中选择与该透镜装置对应的确定系数，

其中，所述噪声确定单元使用所述特征量和由所述确定系数选择单元选择的所述确定系数来确定是否在所述音频信号中包括对于连接到所述成像装置的所述透镜装置唯一的所述操作声音。

（11）根据（9）所述的音频信号处理装置，

其中，在成像装置中设置所述音频信号处理装置，

其中，所述透镜装置保留根据该透镜装置的特性设置的确定系数，并且

其中，所述噪声确定单元从连接到所述成像装置的所述透镜装置获取所述确定系数，并且使用所获取的确定系数和所述特征量来确定是否在所述音频信号中包括对于连接到所述成像装置的所述透镜装置唯一的所述操作声音。

（12）根据（1）至（9）的任何一项所述的音频信号处理装置，

其中，在被配置来再现所述音频信号的再现装置中设置所述音频信号处理装置，

其中，所述特征量提取单元在所述音频信号的再现期间从所述音频信号提取所述特征量，并且

其中，所述噪声确定单元基于所述特征量来确定是否在所述音频信号中包括所述操作声音。

（13）一种成像装置，包括：

声音收集单元，其被配置为将外部声音转换为音频信号；

声音产生单元，其被配置为被设置在与所述声音收集单元相同的外壳中，并且产生脉冲操作声音；

特征量提取单元，其被配置为从自所述声音收集单元输出的所述音频信号提取用于指示所述操作声音的特征量；

噪声确定单元，其被配置为基于所述特征量来确定是否在所述音频信号中包括所述操作声音；以及

噪声减少单元，其被配置为当所述噪声确定单元确定在所述音频信号中包括所述操作声音时对于所述音频信号执行噪声减少处理。

（14）一种音频信号处理方法，包括：

从通过声音收集单元获得的音频信号提取用于指示从在与所述声音收集单元相同的外壳中设置的声音产生单元产生的脉冲操作声音的特征量；以及

基于所述特征量来确定是否在所述音频信号中包括所述操作声音。

（15）一种程序，用于使得计算机执行：

（16）一种非暂时计算机可读记录介质，其中记录了程序，所述程序使得计算机执行：

附图标记列表

1 数字相机

2 外壳

3 透镜单元

10 成像单元

14 驱动装置

15 变焦电机

16 聚焦电机

51 麦克风

60 音频信号处理单元

70 控制单元

100 音频信号处理装置

110 信号输入单元

120 A/D转换器

130 特征量提取单元

131 最大幅度值获取部

132 脉冲宽度计算部

133 混响功率计算部

134 过零次数计算部

135 附加特征量计算部

140 噪声确定单元

142、144 表格

150 确定系数保留单元

152 特征量保留单元

154 确定系数选择单元

156 透镜装置

160 噪声减少单元

170、190 信号记录单元

180 控制信号获取单元

192 信号获取单元

200 信号再现单元

Claims

1.一种音频信号处理装置，包括：

2.根据权利要求1所述的音频信号处理装置，

3.根据权利要求1所述的音频信号处理装置，

4.根据权利要求3所述的音频信号处理装置，

5.根据权利要求3所述的音频信号处理装置，

6.根据权利要求3所述的音频信号处理装置，

其中，所述特征量提取单元进一步提取作为所述特征量的第三特征量，所述第三特征量包括下述内容的一些或全部：所述音频信号的均方根RMS、所述RMS的改变的值、用于指示所述操作声音的所述混响分量的窄带信号的改变的振幅值、所述窄带信号的过零次数或过零次数的改变的值，并且

7.根据权利要求1所述的音频信号处理装置，

8.根据权利要求2所述的音频信号处理装置，进一步包括：

9.根据权利要求1所述的音频信号处理装置，

10.根据权利要求9所述的音频信号处理装置，

其中，在成像装置中设置所述音频信号处理装置，

其中，所述音频信号处理装置进一步包括：

11.根据权利要求9所述的音频信号处理装置，

其中，在成像装置中设置所述音频信号处理装置，

12.根据权利要求1所述的音频信号处理装置，

13.一种成像装置，包括：

声音收集单元，其被配置为将外部声音转换为音频信号；

14.一种音频信号处理方法，包括：

15.一种程序，用于使得计算机执行：

16.一种非暂时计算机可读记录介质，其中记录了程序，所述程序使得计算机执行：