JP2009005157A

JP2009005157A - 音声信号補正装置

Info

Publication number: JP2009005157A
Application number: JP2007165062A
Authority: JP
Inventors: Masahiro Yoshida; 昌弘吉田
Original assignee: Sanyo Electric Co Ltd
Current assignee: Sanyo Electric Co Ltd
Priority date: 2007-06-22
Filing date: 2007-06-22
Publication date: 2009-01-08

Abstract

【課題】風雑音を低減する。
【解決手段】４つのマイクロホンを、左斜め前方、右斜め前方、左斜め後方及び左斜め後方に向けて配置し、風を受けにくいマイクロホンを常に存在させる。４つのＬＰＦを用いて各チャンネル信号から風雑音を含む低周波帯域成分を抽出し、チャンネル間における低周波帯域成分の相関に基づいて風雑音の発生有無を検出する。風雑音が発生している場合は、最も出力信号レベルが低いＬＰＦの出力信号を選択し、そのＬＰＦの出力信号を用いて各チャンネル信号の低周波帯域成分を補正する。
【選択図】図５

Description

本発明は、入力された音声信号を補正する音声信号補正装置及び音声信号補正方法に関し、また、該音声信号補正装置を利用した録音装置及び撮像装置に関する。また本発明は、特に、風雑音を低減するための技術に関する。

マイクロホンを備えた録音装置において、マイクロホンに風が当たると音声信号に風雑音が混入する。この風雑音は、マイクロホンの振動板に風圧が加わることによって発生し、本来の音声信号にとっての雑音となるため除去されることが望ましい。

風雑音を低減するための方式が幾つか提案されている。例えば、或る方式では、ステレオ信号間の差信号における低周波成分のレベルに応じて、低音を除去するハイパスフィルタの特性を変更している（例えば、下記特許文献１参照）。また、風雑音の無相関性を利用した方式も提案されている（例えば、下記特許文献２参照）。何れもステレオ録音装置を想定した方式である。

特開平５−１４９８９号公報特開２００１−１８６５８５号公報

上述の従来方式では、ステレオ受信信号を利用して風雑音の発生を検知し、発生時には風雑音を含む低周波成分をカットすることにより風雑音を低減していた。しかし、この方式では、この風雑音と同時に音声のピッチ信号などの必要な信号も低減されてしまうという問題があり、風雑音の低減技術として満足のいくものではない。

そこで本発明は、風雑音の良好なる低減に寄与する音声信号補正装置及び音声信号補正方法並びに録音装置及び撮像装置を提供することを目的とする。

上記目的を達成するために本発明に係る音声信号補正装置は、複数のマイクロホンの出力信号に基づく複数のチャンネル信号を受け、各チャンネル信号を補正する音声信号補正装置において、各チャンネル信号の、風雑音の帯域を含む所定帯域成分に基づいて、前記複数のチャンネル信号の中から１つのチャンネル信号を特定チャンネル信号として選択する選択手段と、前記特定チャンネル信号の前記所定帯域成分を用いて他のチャンネル信号の前記所定帯域成分を補正する補正手段と、を備えたことを特徴とする。

そして例えば、前記選択手段は、前記複数のチャンネル信号の内、前記風雑音の影響が最も少ないチャンネル信号を前記特定チャンネル信号として選択するとよい。

これにより、風雑音を良好に除去することが可能となる。また、補正によって低周波成分をカットするわけではないので、音声のピッチ信号などの必要な信号は残される。

具体的には例えば、当該音声信号補正装置は、各チャンネル信号の前記所定帯域成分を抽出して各チャンネル信号に対応する抽出信号を出力する抽出手段を更に備え、前記選択手段は、各抽出信号の内、最も信号レベルが小さい抽出信号に対応するチャンネル信号を前記特定チャンネル信号として選択する。

また例えば、当該音声信号補正装置は、各チャンネル信号の前記所定帯域成分の相関に基づいて、各チャンネル信号に対する前記風雑音の影響の有無を判定する判定手段を更に備え、前記判定手段の判定結果に応じて前記補正手段による補正の実行可否を切り替え制御する。

また例えば、各マイクロホンは、互いに異なる方向に向けられている。

また例えば、各マイクロホンは、音波又は風圧によって振動する振動体を有して、前記振動体の振動に応じた電気信号を出力し、前記複数のマイクロホンが設置された装置に対して風が作用したときに、各マイクロホンの振動体が互いに異なる風圧を受けるように、各マイクロホンは前記装置に配置されている。

また例えば、前記複数のマイクロホンの出力信号は時間軸上の信号であり、各チャンネル信号は、各マイクロホンの出力信号の信号形式を時間軸上から周波数軸上に変換することによって得られた周波数スペクトルである。

また例えば、前記複数のチャンネル信号を記録した記録媒体の記録信号を受け、前記記録信号に基づく各チャンネル信号を補正する。

また、本発明に係る録音装置は、上記の複数のマイクロホン及び音声信号補正装置を備えたことを特徴とする。

また、本発明に係る撮像装置は、上記の複数のマイクロホン及び音声信号補正装置と、撮像手段と、備えたことを特徴とする。

また、本発明に係る音声信号補正方法は、複数のマイクロホンの出力信号に基づく複数のチャンネル信号を補正する音声信号補正方法において、各チャンネル信号の、風雑音の帯域を含む所定帯域成分に基づいて、前記複数のチャンネル信号の中から１つのチャンネル信号を特定チャンネル信号として選択する選択ステップと、前記特定チャンネル信号の前記所定帯域成分を用いて他のチャンネル信号の前記所定帯域成分を補正する補正ステップと、を備えたことを特徴とする。

本発明によれば、風雑音の良好なる低減に寄与する音声信号補正装置及び音声信号補正方法並びに録音装置及び撮像装置を提供することが可能となる。

本発明の意義ないし効果は、以下に示す実施の形態の説明により更に明らかとなろう。ただし、以下の実施の形態は、あくまでも本発明の一つの実施形態であって、本発明ないし各構成要件の用語の意義は、以下の実施の形態に記載されたものに制限されるものではない。

以下、本発明の実施の形態につき、図面を参照して具体的に説明する。参照される各図において、同一の部分には同一の符号を付し、同一の部分に関する重複する説明を原則として省略する。後に第１〜第５実施例を説明するが、まず、各実施例に共通する事項又は各実施例にて参照される事項について説明する。

図１は、本発明の実施形態に係る撮像装置１０の外観斜視図である。撮像装置１０は、音声録音をも可能なデジタルビデオカメラである。撮像装置１０の筐体の前方左側及び前方右側には、夫々、マイクロホン１Ｌ及び１Ｒが備え付けられている。更に、撮像装置１０の筐体には、マイクロホン１ＳＬ及び１ＳＲが備え付けられている。マイクロホン１ＳＬは、マイクロホン１Ｌの後方側に配置され、マイクロホン１ＳＲは、マイクロホン１Ｒの後方側に配置されている。このように、撮像装置１０には、４チャンネル分のマイクロホンが設置されている。

以下、マイクロホン１Ｌ、１Ｒ、１ＳＬ及び１ＳＲを、総称して「４つのマイクロホン」とも呼ぶ。

図２に、撮像装置１０の電気的構成を表す概略ブロック図を示す。撮像装置１０は、４つのマイクロホンの他、撮像部２、映像信号処理部３、音声信号処理部４及び記録媒体５を備える。図示を省略しているが、撮像装置１０には、更に、シャッタボタン及び録画ボタンを含む操作部、表示ディスプレイ、スピーカ、ＣＰＵ（Central Processing Unit）などが備えられている。

撮像部２は、光学系と、ＣＣＤ（Charge Coupled Devices）又はＣＭＯＳ（Complementary Metal Oxide Semiconductor）イメージセンサなどの撮像素子とを含み、光学系を介して入射する光学像を電子信号に変換する。映像信号処理部３は、その電気信号に基づき、撮像部２の撮影画像を表す映像信号を生成する。音声信号処理部４は、４つのマイクロホンの各出力信号に対して必要な処理を施すことによって所望の特性を有する音声信号を生成する。撮像装置１０に備えられた操作部（不図示）に対する操作に従って、上記映像信号及び音声信号は、メモリカードや光ディスクなどの記録媒体５に記録される。

撮像部２が撮影可能な被写体が存在する方向を前方と定義し（図１参照）、その逆の方向を後方と定義する。前方及び後方は、撮像部２の光軸と平行であるものとする。また、以下の説明において、右及び左とは、後方側から前方側を見たときの右及び左を意味するものとする。

マイクロホン１Ｌ、１Ｒ、１ＳＬ及び１ＳＲは、夫々、指向性を有さない無指向性マイクロホン又は指向性を有する指向性マイクロホン（例えば、単一指向性マイクロホン）である。

図３に、１つのマイクロホン１の構造を示す。この構造は、マイクロホン１Ｌ、１Ｒ、１ＳＬ及び１ＳＲの夫々における構造である。図３は、マイクロホン１の断面図を示している。マイクロホン１は、振動体としての振動板１１を有している。振動板１１は、音波による空気振動によって振動する。但し、振動板１１は、音波だけでなく、振動板１１に作用した風圧によっても振動する。故に、振動板１１に音波と風圧が作用している時、振動板１１は音波と風圧に応じて振動する。マイクロホン１は、この振動板１１の振動を電気信号に変換して出力する。マイクロホン１の出力信号の内、風圧に由来する雑音（雑音成分）を風雑音という。上述の如く、本明細書において、風雑音とは音波として振動板１１に到来する雑音ではない。

マイクロホン１の種類は任意である。例えば、ムービング・コイル型、リボン型又はコンデンサ型のマイクロホンを、マイクロホン１として採用することが可能であり、また、マイクロホン１は、カーボンマイクまたは圧電マイクであってもよい。

振動板１１の周囲には、振動板１１の支持等を目的とした部材が配置されており、この部材によって撮像装置１０に作用した風圧の一部は遮られる。つまり、マイクロホン１に対して、振動板１１の正面側から風圧が作用した場合、その風圧は振動板１１に直接作用するが、振動板１１の裏側から風圧が作用した場合、その風圧は振動板１１に殆ど（或いは完全に）作用しない。

図４に、４つのマイクロホンの配置関係を示す。今、互いに直交するＸ軸及びＹ軸を座標軸とする二次元座標を想定する。この二次元座標は、撮像装置１０を上方から見たときの平面座標に相当する。Ｙ軸は、撮像部２の光軸と平行である。Ｙ軸の正の方向は前方と合致し、Ｙ軸の負の方向は後方と合致する。Ｘ軸の正の方向は右方向と合致し、Ｙ軸の負の方向は左方向と合致する。この二次元座標の原点をＯとする。図４には、４つのマイクロホンの該二次元座標上への投影図が重畳して示されている。今、簡単のため、Ｘ軸及びＹ軸に直交するＺ軸方向の成分（即ち、高さ方向の成分）を無視して考える。

上記の二次元座標上において、右斜め前方に相当する第１象限内にマイクロホン１Ｒが配置され、左斜め前方に相当する第２象限内にマイクロホン１Ｌが配置され、左斜め後方に相当する第３象限内にマイクロホン１ＳＬが配置され、右斜め後方に相当する第４象限内にマイクロホン１ＳＲが配置される。上記の二次元座標上において、マイクロホン１Ｌの振動板の中心の座標を（ｘ_L，ｙ_L）、マイクロホン１Ｒの振動板の中心の座標を（ｘ_R，ｙ_R）、マイクロホン１ＳＬの振動板の中心の座標を（ｘ_SL，ｙ_SL）、マイクロホン１ＳＲの振動板の中心の座標を（ｘ_SR，ｙ_SR）とする。

４つのマイクロホンは互いに異なる方向に向けて配置されており、何れのマイクロホンも正面側が原点Ｏに対して外側を向けられている。これは、風の影響を受けにくいマイクロホンを常に存在させるためである。つまり、マイクロホン１Ｌの振動板の中心から見て原点Ｏ側をマイクロホン１Ｌの裏側とし、マイクロホン１Ｒの振動板の中心から見て原点Ｏ側をマイクロホン１Ｒの裏側とし、マイクロホン１ＳＬの振動板の中心から見て原点Ｏ側をマイクロホン１ＳＬの裏側とし、マイクロホン１ＳＲの振動板の中心から見て原点Ｏ側をマイクロホン１ＳＲの裏側とする。

このように各マイクロホンを配置することにより、例えば撮像装置１０の右斜め前方から風が到来した場合、マイクロホン１Ｒの振動板は大きな風圧を受けてマイクロホン１Ｒの出力信号は風雑音を多く含むことになるが、マイクロホン１ＳＬの振動板は殆ど風圧を受けなくなるためマイクロホン１ＳＬの出力信号に含まれる風雑音は極めて軽微となる。尚、この場合、各マイクロホンの構造にも依存するが、マイクロホン１Ｌ及びマイクロホン１ＳＲの振動板もある程度の風圧を受ける。何れにせよ、撮像装置１０の右斜め前方から風が到来した場合は、４つのマイクロホンの内、マイクロホン１ＳＬの出力信号に含まれる風雑音の量が最も少なくなる。そして、この場合、通常は、マイクロホン１Ｒの出力信号に含まれる風雑音の量が最も多くなり、マイクロホン１Ｌ又は１ＳＲの出力信号に含まれる風雑音の量は、マイクロホン１Ｒのそれとマイクロホン１ＳＬのそれの間となる。

理想的には例えば、マイクロホン１Ｌの振動板の中心とマイクロホン１ＳＲの振動板の中心とを結ぶ直線が原点Ｏを通り且つその直線とＸ軸との成す角度が４５度となるようにマイクロホン１Ｌとマイクロホン１ＳＲを撮像装置１０の筐体に配置し、更に、マイクロホン１Ｒの振動板の中心とマイクロホン１ＳＬの振動板の中心とを結ぶ直線が原点Ｏを通り且つその直線とＸ軸との成す角度が４５度となるようにマイクロホン１Ｒとマイクロホン１ＳＬを撮像装置１０の筐体に配置する。そして、理想的には例えば、ｘ_L＝ｘ_SL、ｘ_R＝ｘ_SR、ｙ_L＝ｙ_R及びｙ_SL＝ｙ_SRとし、且つ、原点Ｏから各マイクロホンの振動板の中心までの距離を全て同じとする。

上述の風雑音の周波数は、比較的低く、高くとも３００Ｈｚ程度である。また、風雑音は、概ね１００Ｈｚ程度で強度が最も強くなる。従って、音声信号処理部４では、３００Ｈｚを境界として取り扱い、３００Ｈｚより小さい周波数帯域を「低周波帯域」として且つ３００Ｈｚ以上の周波数帯域を「高周波帯域」として取り扱う。低周波帯域は、風雑音の周波数帯域を含み、風雑音の影響を多く受ける。高周波帯域は、風雑音の周波数帯域を含まず、風雑音の影響を殆ど受けない。また、低周波帯域の周波数成分を「低周波帯域成分」と呼び、高周波帯域の周波数成分を「高周波帯域成分」と呼ぶことにする。

携帯型のデジタルビデオカメラなどでは筐体サイズの制約から複数のマイクロホンが近接して配置され、本実施形態の撮像装置１０にも、このような制約が加わっている。従って、風雑音の発生する低周波帯域の信号は、何れのマイクロホンで検出した場合も、風雑音が発生していなければ殆ど同じとなる。このような特性に着目して、音声信号処理部４は、風雑音の影響の少ないマイクロホンを選択し、選択したマイクロホンの音声信号を用いて他のマイクロホンの音声信号を補正することにより風雑音の影響が低減された補正信号を生成する。

上述の撮像装置１０を参照しつつ、以下に、詳細な実施例を説明する。

＜＜第１実施例＞＞
まず、第１実施例について説明する。第１実施例では、図２の音声信号処理部４として用いることができる音声信号処理部の構成及び動作について説明する。

図５を参照する。図５は、第１実施例に係る音声信号処理部の内部ブロック図である。図５の音声信号処理部は、Ａ／Ｄ変換器２１Ｌ、２１Ｒ、２１ＳＬ及び２１ＳＲと、ＨＰＦ（ハイパスフィルタ）２２Ｌ、２２Ｒ、２２ＳＬ及び２２ＳＲと、ＬＰＦ（ローパスフィルタ）２３Ｌ、２３Ｒ、２３ＳＬ及び２３ＳＲと、風雑音発生／レベル判定部２４（以下、判定部２４と略記する）と、出力切替部２５と、加算処理部２６と、後処理部２７と、を備える。

図２のマイクロホン１Ｌ、１Ｒ、１ＳＬ及び１ＳＲは、夫々、自身の振動板の振動に応じたアナログの電気信号を出力する。マイクロホン１Ｌ、１Ｒ、１ＳＬ及び１ＳＲの出力信号は、夫々、図５のＡ／Ｄ変換器２１Ｌ、２１Ｒ、２１ＳＬ及び２１ＳＲに与えられる。

Ａ／Ｄ変換器２１Ｌ、２１Ｒ、２１ＳＬ及び２１ＳＲは、夫々、マイクロホン１Ｌ、１Ｒ、１ＳＬ及び１ＳＲの出力信号をデジタルの電気信号に変換するＡ／Ｄ変換を行う。今、Ａ／Ｄ変換器２１Ｌ、２１Ｒ、２１ＳＬ及び２１ＳＲにおけるＡ／Ｄ変換のサンプリング周波数は、４８ｋＨｚ（キロヘルツ）であるとする。また、Ａ／Ｄ変換器２１Ｌ、２１Ｒ、２１ＳＬ及び２１ＳＲから出力されるデジタルの電気信号（デジタル音声信号）を、以下、夫々、原信号Ｌ、原信号Ｒ、原信号ＳＬ及び原信号ＳＲと呼ぶ。原信号Ｌ、原信号Ｒ、原信号ＳＬ及び原信号ＳＲに対して、後に風雑音に関与する補正が施される。従って、原信号Ｌ、原信号Ｒ、原信号ＳＬ及び原信号ＳＲは、夫々、マイクロホン１Ｌ、１Ｒ、１ＳＬ及び１ＳＲに対応する補正前のチャンネル信号と呼べる。

原信号Ｌ、原信号Ｒ、原信号ＳＬ及び原信号ＳＲは、夫々、ＨＰＦ２２Ｌ、２２Ｒ、２２ＳＬ及び２２ＳＲに入力される。ＨＰＦ２２Ｌ、２２Ｒ、２２ＳＬ及び２２ＳＲは、夫々、自身に対する入力信号の高周波帯域成分を通過させ且つ自身に対する入力信号の低周波帯域成分を除去するハイパスフィルタである。従って、ＨＰＦ２２Ｌ、２２Ｒ、２２ＳＬ及び２２ＳＲからは、夫々、低周波帯域成分が除去された原信号Ｌ、原信号Ｒ、原信号ＳＬ及び原信号ＳＲが出力される。

原信号Ｌ、原信号Ｒ、原信号ＳＬ及び原信号ＳＲは、夫々、ＬＰＦ２３Ｌ、２３Ｒ、２３ＳＬ及び２３ＳＲにも入力される。ＬＰＦ２３Ｌ、２３Ｒ、２３ＳＬ及び２３ＳＲは、夫々、自身に対する入力信号の低周波帯域成分を通過させ且つ自身に対する入力信号の高周波帯域成分を除去するローパスフィルタである。従って、ＬＰＦ２３Ｌ、２３Ｒ、２３ＳＬ及び２３ＳＲからは、夫々、高周波帯域成分が除去された原信号Ｌ、原信号Ｒ、原信号ＳＬ及び原信号ＳＲが出力される。

尚、周波数成分に関する「除去」とは「完全な除去」を意味するものではなく、それは「減衰」と読み替えることができる。例えば、本明細書において、「高周波帯域成分を除去する」と「高周波帯域成分を減衰させる」は同義である。

或る時刻ｔにおけるＨＰＦ２２Ｌ、２２Ｒ、２２ＳＬ及び２２ＳＲの出力信号の値を夫々HPF_OUT_L_t、HPF_OUT_R_t、HPF_OUT_SL_t及びHPF_OUT_SR_tにて表し、或る時刻ｔにおけるＬＰＦ２３Ｌ、２３Ｒ、２３ＳＬ及び２３ＳＲの出力信号の値を夫々LPF_OUT_L_t、LPF_OUT_R_t、LPF_OUT_SL_t及びLPF_OUT_SR_tにて表す。或る信号の振幅は、その信号のレベル（強度）を表している。

各信号は、ゼロを基準として正又は負の値をとる。仮に、マイクロホン１Ｌの振動板が全く振動しない場合、マイクロホン１Ｌの出力信号のレベルはゼロとなり、原信号Ｌのレベル並びにHPF_OUT_L_t及びLPF_OUT_L_tもゼロとなる（但し、オフセットやノイズ成分を無視）。マイクロホン１Ｌの振動板が音波によって振動すると、原信号Ｌの値が振動して原信号Ｌのレベルがゼロよりも大きくなるとともに、該音波の周波数に応じてHPF_OUT_L_t及びLPF_OUT_L_tも振動してＨＰＦ２２Ｌ及びＬＰＦ２３Ｌの各出力信号のレベルもゼロよりも大きくなる。マイクロホン１Ｌの振動板が風圧のみによって振動した場合は、理想的には、原信号Ｌは３００Ｈｚ以下の周波数成分のみを有することになり、ＬＰＦ２３Ｌの出力信号のレベルがゼロよりおおきくなる一方でＨＦＦ２２Ｌの出力信号のレベルはゼロとなる。マイクロホン１Ｌ以外のマイクロホンに関しても同様である。

判定部２４は、ＬＰＦ２３Ｌ、２３Ｒ、２３ＳＬ及び２３ＳＲの出力信号に基づいて風雑音の発生有無を判別する。この判別を行うために、具体的には、判定部２４は、風雑音発生指標Ｗｉｎｄ１_t、Ｗｉｎｄ２_t及びＷｉｎｄ３_tを下記式（１ａ）、（１ｂ）及び（１ｃ）に従って算出する。Ｗｉｎｄ１_t、Ｗｉｎｄ２_t及びＷｉｎｄ３_tは、時刻ｔにおける３つの風雑音発生指標である。また、本実施例において、Ｎ＝２０４８であるとする。尚、時刻（ｔ−１）と時刻ｔとの間の期間長さは、４８ｋＨｚの逆数である。

風雑音発生指標Ｗｉｎｄ１_tは、Ｎサンプル分の区間における、原信号Ｌの低周波帯域成分と原信号Ｒの低周波帯域成分との相関（類似性）を表しており、両者の相関が高ければ高いほど風雑音発生指標Ｗｉｎｄ１_tは小さくなる。上述したように、風雑音の発生する低周波帯域の信号は、何れのマイクロホンで検出した場合も風雑音がなければ殆ど同一となるため、原信号Ｌ及びＲに風雑音が含まれていなければＷｉｎｄ１_tはゼロ（或いは殆どゼロ）となる。Ｗｉｎｄ２_t及びＷｉｎｄ３_tについても同様である。

一方において、上述の如く４つのマイクロホンを配置しているため、撮像装置１０に対して或る方向から風が到来すれば、一部又は全部の風雑音発生指標は比較的大きな値をとる。例えばマイクロホン１Ｌの振動板に対して直接風圧が加わった場合、LPF_OUT_SR_tのレベルが比較的低くなる一方でLPF_OUT_L_tのレベルが比較的大きくなるため、風雑音発生指標Ｗｉｎｄ３_tが比較的大きくなる。故に、風雑音発生指標Ｗｉｎｄ１_t〜Ｗｉｎｄ３_tに基づいて風雑音の発生有無を判別可能である。

具体的には、判定部２４は、風雑音発生指標Ｗｉｎｄ１_t〜Ｗｉｎｄ３_tの夫々と所定の風発生閾値（例えば、０．２）とを比較し、風雑音発生指標Ｗｉｎｄ１_t〜Ｗｉｎｄ３_tの内の少なくとも１つが風発生閾値以上である場合に風雑音が発生していると判断し、そうでない場合、風雑音は発生していないと判断する。

風雑音が発生していると判断した場合、判定部２４は、更に、レベル判定処理によって風雑音の影響が最も少ないチャンネル信号を選択する。選択されたチャンネル信号を影響最小チャンネル信号と呼ぶ。実際には、４つのＬＰＦの中から影響最小チャンネル信号に対応するＬＰＦを択一的に選択する。具体的には、レベル判定処理では、下記式（２ａ）、（２ｂ）、（２ｃ）及び（２ｄ）に従って、４つのレベル評価値Pow_L_t、Pow_R_t、Pow_SL_t及びPow_SR_tを算出する。Pow_L_t、Pow_R_t、Pow_SL_t及びPow_SR_tは、夫々、時刻ｔにおけるレベル評価値である。

そして、判定部２４は、４つのレベル評価値Pow_L_t、Pow_R_t、Pow_SL_t及びPow_SR_tの内、最小のレベル評価値に対応する原信号（補正前のチャンネル信号）を影響最小チャンネル信号として選択する。レベル評価値Pow_L_tは原信号Ｌ（マイクロホン１Ｌのチャンネル信号）に対応し、レベル評価値Pow_R_tは原信号Ｒに対応し、レベル評価値Pow_SL_tは原信号ＳＬに対応し、レベル評価値Pow_SR_tは原信号ＳＲに対応している。従って例えば、４つのレベル評価値Pow_L_t、Pow_R_t、Pow_SL_t及びPow_SR_tの内、レベル評価値Pow_L_tが最小である場合、判定部２４は、原信号Ｌ（マイクロホン１Ｌのチャンネル信号）を影響最小チャンネル信号として選択する。

判定部２４による風雑音の発生有無の判別は、例えばＮサンプルごとに行われ、風雑音が発生している場合、影響最小チャンネル信号の切り替えはＮサンプルごとに実行される（但し、切り替えが必要な場合）。式（２ａ）におけるPow_L_t-Nは、前回算出されたＬＰＦ２３Ｌに対応するレベル評価値である（Pow_R_t-N、Pow_SL_t-N及びPow_SR_t-Nも同様）。また、αは、所定の係数であり（０≦α＜１）、α＝０とすることもできる。

出力切替部２５は、各チャンネルに対応する加算器を備えた加算処理部２６を用い、判定部２４の判定結果に応じて各ＬＰＦの出力信号と各ＨＰＦの出力信号を合成することにより、補正信号Ｌ、補正信号Ｒ、補正信号ＳＬ及び補正信号ＳＲを生成する。補正信号Ｌ、補正信号Ｒ、補正信号ＳＬ及び補正信号ＳＲは、夫々、マイクロホン１Ｌ、１Ｒ、１ＳＬ及び１ＳＲに対応する補正後のチャンネル信号である。時刻ｔにおける補正信号Ｌ、補正信号Ｒ、補正信号ＳＬ及び補正信号ＳＲを、夫々、L_t、R_t、SL_t及びSR_tにて表す。

判定部２４によって風雑音が発生していないと判断されている場合は、チャンネルごとにＨＰＦとＬＰＦの出力を単純に合成することによって各補正信号を生成する。即ち、風雑音が発生していないと判断されている場合は、下記式（３ａ）、（３ｂ）、（３ｃ）及び（３ｄ）に従って各補正信号を生成する。この場合、各補正信号は各原信号と合致することになる。

一方、判定部２４によって風雑音が発生していると判断されている場合は、例えば、影響最小チャンネル信号に対応するＬＰＦの出力信号と各ＨＰＦの出力信号とを合成することによって各補正信号を生成する。即ち、影響最小チャンネル信号の低周波帯域成分にて、他のチャンネル信号の低周波帯域成分を差し替える。例えば、風雑音が発生していると判断され且つ影響最小チャンネル信号が原信号ＳＲであると判断されている場合は、下記式（４ａ）、（４ｂ）、（４ｃ）及び（４ｄ）に従って各補正信号を生成する。

尚、出力切替部２５は、各Ａ／Ｄ変換器から各ＨＰＦを介して加算処理部２６に至る経路の信号遅延量と、各Ａ／Ｄ変換器から各ＬＰＦ及び出力切替部２５を介して加算処理部２６に至る経路の信号遅延量と、を一致させるための遅延調整も実施する。

出力切替部２５及び加算処理部２６によって生成された各補正信号（Ｌ、Ｒ、ＳＬ及びＳＲ）は、後処理部２７に与えられる。後処理部２７は、与えられた各補正信号に対して所定の後処理を施してから各補正信号を図２の記録媒体５に保存する。例えば、各補正信号に対して所定の圧縮方式に従った音声圧縮処理を施し、圧縮後の各補正信号を記録媒体５に保存する。

上述の如く構成することにより、簡易な処理にて風雑音の影響を低減することが可能となる。この際、従来技術とは異なり、風雑音の影響の少ないマイクロホンの低周波帯域成分を選択的に使用するため、音声のピッチ信号などの必要な信号は保存される。このため、自然な低音再生を損なうことがない。

また、風圧の影響が異なるマイクロホン対の相関を検出し、これによって風雑音の発生有無を判別するため、風雑音の発生を精度良く検出することが可能である。また、上述の如く４つのマイクロホンを配置することにより、サラウンド感を高めつつ、一定方向からの風に対して風の影響を受けにくいマイクロホンを存在させる。これにより、聴覚上、風雑音を高精度に除去することが可能となる。

尚、従来のステレオ信号を利用した方式（特許文献１等の方式）では、偶発的に風雑音に高い相関が生じる場合があり、風雑音発生の見落としや低減処理レスポンスの遅れにつながることがあったが、本実施例の手法により確実な風雑音の発生検知が可能である。

また、上述の例では低周波帯域成分の差し替えによって低周波帯域成分の補正を行っているが、低周波帯域成分の差し替えによる急激な信号変化を抑制するため、風雑音の影響が最も少ないマイクロホンについての低周波帯域成分と各チャンネルの低周波帯域成分とを加重加算することによって、各補正信号の低周波帯域成分を算出するようにしてもよい。即ち例えば、風雑音が発生していると判断され且つ影響最小チャンネル信号が原信号ＳＲであると判断されている場合は、下記式（５ａ）、（５ｂ）、（５ｃ）及び（５ｄ）に従って各補正信号を生成するようにしてもよい。ここで、βは、風雑音発生指標Ｗｉｎｄ１_t、Ｗｉｎｄ２_t及びＷｉｎｄ３_tの最大値とする。この最大値は、風雑音の強度に応じた値を持つ。

式（５ａ）等に従って各補正信号を生成すれば、急激な信号変化が抑制された滑らかな信号を生成することが可能である。また、各チャンネルの低周波原音が残って各チャンネル間の微妙な信号の相違が保存されるため、補正による臨場感低下が抑制される。

＜＜第２実施例＞＞
また、窓関数を利用することによって、低周波帯域成分の連続性を担保するようにしてもよい。これを第２実施例として説明する。第２実施例は、第１実施例の一部を変形した実施例であり、出力制御部２５（及び加算処理部２６）における動作が第１実施例と異なるだけで、他の点は第１実施例のそれと同様である。以下、第１実施例との相違点のみを説明する。

今、ｔ＝Ｎｍ／２＋ｎとおく。Ｎは、第１実施例と同様、２０４８である。ｍは、０以上の整数値をとる。本実施例において、変数ｎは、０以上且つ１０２３以下の整数値をとり、０を基準としつつｔが１だけ増加するに従って１だけ増加する。但し、変数ｎが１０２３となっている時にｔが１だけ増加すると、変数ｎはゼロに戻されると共に変数ｍが１だけ増加する。

また、図６に示すような配列Ｎの窓関数を定義する。配列Ｎの窓関数は、窓関数Ｗ_nとＷ_N/2+nとに分割して考えることができる。窓関数Ｗ_nは、ｎ＝０の時にゼロとなり、ｎが０から１０２３（＝Ｎ／２−１）に向かうにつれて徐々に増加する。窓関数Ｗ_N/2+nは、ｎ＝０の時に最大となり、ｎが０から１０２３に向かうにつれて徐々に減少し、ｎ＝１０２３の時にゼロとなる。また、任意のｎに対して、等式「Ｗ_n＋Ｗ_N/2+n＝１」が成立する。

変形例２において、出力切替部２５及び加算処理部２６は、下記式（６ａ）、（６ｂ）、（６ｃ）及び（６ｄ）に従って各補正信号を生成する。但し、式（６ａ）、（６ｂ）、（６ｃ）及び（６ｄ）は、現時点での影響最小チャンネル信号が原信号ＳＲであり且つ１０２４サンプル前の影響最小チャンネルが原信号Ｌであった場合における、各補正信号の算出式である。

ここにおける「現時点」とはｎ＝０且つｍ＝ｍ_oの時点を指すとともに、「１０２４サンプル前」とはｎ＝０且つｍ＝（ｍ_o−１）の時点を指すものとし、式（６ａ）、（６ｂ）、（６ｃ）及び（６ｄ）は、ｎ＝０〜１０２３且つｍ＝ｍ_oの各時点に対して適用される（ｍ_oは０以上の整数）。また、本実施例では、判定部２４による風雑音の発生有無の判別は、例えばＮ／２サンプルごとに行われ、風雑音が発生している場合、影響最小チャンネル信号の切り替えはＮ／２サンプルごとに実施されるものとする。

尚、現時点での影響最小チャンネル信号及び１０２４サンプル前の影響最小チャンネル信号が原信号ＳＲ及びＬでない場合、式（６ａ）等が変更されることは言うまでもない。例えば、現時点での影響最小チャンネル信号が原信号Ｒの場合、下記式（６ａ）、（６ｂ）、（６ｃ）及び（６ｄ）の夫々における右辺第１項はＷ_n・LPF_OUT_R_Nm/2+nに置き換えられ、１０２４サンプル前の影響最小チャンネル信号が原信号ＳＬの場合、下記式（６ａ）、（６ｂ）、（６ｃ）及び（６ｄ）の夫々における右辺第２項はＷ_N/2+n・LPF_OUT_SL_Nm/2+nに置き換えられる。

上述のような窓関数を利用することによって、影響最小チャンネル信号が変化した際、過去の影響最小チャンネル信号の寄与度を徐々に減らしつつ最新の影響最小チャンネル信号の寄与度を徐々に増大させていく。これにより、急激な信号変化が抑制された滑らかな信号を生成することが可能である。

＜＜第３実施例＞＞
次に、本発明の第３実施例について説明する。第３実施例でも第１又は第２実施例と同様の原理に基づいて風雑音低減用の補正を実現する。但し、第３実施例では、音声符号化処理における中間生成データを利用して該補正を実現する。

図７を参照する。図７は、第３実施例に係る音声信号処理部の内部ブロック図である。図７の音声信号処理部は、図２の音声信号処理部４として利用される。図７の音声信号処理部は、Ａ／Ｄ変換器２１Ｌ、２１Ｒ、２１ＳＬ及び２１ＳＲと、音声符号化処理部１００と、風雑音発生／レベル判定部６１（以下、判定部６１と略記する）と、を備える。

音声符号化処理部１００は、時間軸上に並ぶ離散信号を周波数軸上に変換する時間周波数変換を用いて、音声信号の符号化処理を行う。具体的には、音声符号化処理部１００は、符号５１〜５３にて参照される各部位を備え、時間周波数変換として修正離散コサイン変換(modified discrete cosine transform；ＭＤＣＴ)を用いる。また、音声符号化処理部１００は、ＡＡＣ（ＭＰＥＧ−ＡＡＣ）に従う符号化処理を行う。

図７のＡ／Ｄ変換器２１Ｌ、２１Ｒ、２１ＳＬ及び２１ＳＲは、図５のそれらと同じものである。Ａ／Ｄ変換器２１Ｌ、２１Ｒ、２１ＳＬ及び２１ＳＲから出力される原信号Ｌ、原信号Ｒ、原信号ＳＬ及び原信号ＳＲは、時間軸上の離散信号（時間領域における離散信号）であり、それらは、順次、ＭＤＣＴ変換部５１に入力される。

ＭＤＣＴ変換部５１は、まず、各原信号を符号化の処理単位であるフレームに分割する。１つのフレームには、１つ以上のブロックが含まれるが、今、１つのフレームが１つのブロックから形成されるものとする。フレームの番号（即ち、ブロックの番号）をｍで表し、各フレームを第ｍのフレームと表現する。ｍは、０以上の整数値をとる。図８に、各フレームの関係を示す。第０のフレーム、第１のフレーム、第２のフレーム、・・・、の順番で時間が進行する。各ブロックは、直前のブロックとの間でブロックの半分の長さの重複部分を有する。今の例の場合、１つのフレームが１つのブロックから形成されるため、各フレームも、直前のフレームとの間で１フレームの半分の長さの重複部分を有する。

１つのブロックの長さをＮで表す。ＡＡＣに従う符号化処理において、Ｎ＝２０４８又はＮ＝２５６となるが、説明の具体化のため、以下、Ｎ＝２０４８であるものとする。そうすると、ＭＤＣＴ変換部５１に与えられた第ｍのフレームにおける原信号Ｌ、原信号Ｒ、原信号ＳＬ及び原信号ＳＲの信号値を、夫々、Ｓ_Ｌ_Nm/2+n、Ｓ_Ｒ_Nm/2+n、Ｓ_ＳＬ_Nm/2+n及びＳ_ＳＲ_Nm/2+nにて表すことができる。第２実施例とは異なるが、本実施例において、ｎは、０≦ｎ≦（Ｎ−１）、を満たす各整数値をとる。尚、後述の式（７ａ）等にも現れる下付き文字「Ｎｍ/２＋ｎ」は、より明確に表記すると、「（Ｎｍ/２）＋ｎ」となる（第２実施例についても同様）。

ＭＤＣＴ変換部５１は、各信号値Ｓ_Ｌ_Nm/2+n、Ｓ_Ｒ_Nm/2+n、Ｓ_ＳＬ_Nm/2+n及びＳ_ＳＲ_Nm/2+nに対して窓関数Ｗ_nを乗じることにより、下記式（７ａ）、（７ｂ）、（７ｃ）及び（７ｄ）の如く、Ｚ_Ｌ_Nm/2+n、Ｚ_Ｒ_Nm/2+n、Ｚ_ＳＬ_Nm/2+n及びＺ_ＳＲ_Nm/2+nを算出する。尚、本実施例における窓関数Ｗ_nは、式（８）にて表される。

そして、ＭＤＣＴ変換部５１は、窓関数Ｗ_nによる切り出しによって得られたＺ_Ｌ_Nm/2+n、Ｚ_Ｒ_Nm/2+n、Ｚ_ＳＬ_Nm/2+n及びＺ_ＳＲ_Nm/2+nに対して修正離散コサイン変換を行うことにより、原信号Ｌ、原信号Ｒ、原信号ＳＬ及び原信号ＳＲの周波数スペクトルを表すＭＤＣＴ係数Ｘ_Ｌ_m,k、Ｘ_Ｒ_m,k、Ｘ_ＳＬ_m,k、Ｘ_ＳＲ_m,kを算出する。ＭＤＣＴ係数Ｘ_Ｌ_m,k、Ｘ_Ｒ_m,k、Ｘ_ＳＬ_m,k、Ｘ_ＳＲ_m,kは、下記式（９ａ）、（９ｂ）、（９ｃ）及び（９ｄ）に従って算出される。

ＭＤＣＴ係数Ｘ_Ｌ_m,kは、原信号Ｌの、第ｍのフレームにおける周波数番号ｋの周波数成分の信号強度を表す。ＭＤＣＴ係数Ｘ_Ｒ_m,kは、原信号Ｒの、第ｍのフレームにおける周波数番号ｋの周波数成分の信号強度を表す。ＭＤＣＴ係数Ｘ_ＳＬ_m,k及びＸ_ＳＲ_m,kについても同様である。ｋは、０〜（Ｎ／２−１）の範囲内の整数値をとる。今の例の場合、Ｎ＝２０４８であるため、ｋは０以上且つ１０２３以下の各整数値をとる。

今の例の場合、各Ａ／Ｄ変換器（２１Ｌ等）のサンプリング周波数は４８ｋＨｚであり、これに対応して、離散信号Ｓ_Ｌ_Nm/2+n等のサンプリング周波数も４８ｋＨｚとなっている。そして、Ｎ＝２０４８であるから、ＭＤＣＴ変換部５１にて得られる周波数スペクトルの周波数間隔、即ち、周波数番号（ｋ−１）とｋの間の周波数間隔は約２３Ｈｚである。従って、風雑音の周波数帯域の上限として考えた３００Ｈｚはｋ＝１３に対応する。故に、０≦ｋ≦１３の範囲内のＭＤＣＴ係数から風雑音の発生有無を判別可能である。

ＭＤＣＴ変換部５１によって得られた各ＭＤＣＴ係数は、判定部６１に与えられる。風雑音の発生有無を３００Ｈｚ以下の信号成分に基づいて行うべく、本実施例における判定部６１は、風雑音発生指標Ｗｉｎｄ１_m、Ｗｉｎｄ２_m及びＷｉｎｄ３_mを下記式（１０ａ）、（１０ｂ）及び（１０ｃ）に従って算出する。Ｗｉｎｄ１_m、Ｗｉｎｄ２_m及びＷｉｎｄ３_mは、第ｍのフレームにおける３つの風雑音発生指標である。

風雑音発生指標Ｗｉｎｄ１_mは、第ｍのフレームにおける、原信号Ｌの低周波帯域成分と原信号Ｒの低周波帯域成分との相関（類似性）を表しており、両者の相関が高ければ高いほど風雑音発生指標Ｗｉｎｄ１_mは小さくなる。原信号Ｌ及びＲに風雑音が含まれていなければＷｉｎｄ１_mはゼロ（或いは殆どゼロ）となる。Ｗｉｎｄ２_m及びＷｉｎｄ３_mについても同様である。故に、第１実施例と同様、風雑音発生指標Ｗｉｎｄ１_m〜Ｗｉｎｄ３_mに基づいて風雑音の発生有無を検出可能である。

具体的には、判定部６１は、風雑音発生指標Ｗｉｎｄ１_m〜Ｗｉｎｄ３_mの夫々と所定の風発生閾値（例えば、０．２）とを比較し、風雑音発生指標Ｗｉｎｄ１_m〜Ｗｉｎｄ３_mの内の少なくとも１つが風発生閾値以上である場合に風雑音が発生していると判断し、そうでない場合、風雑音は発生していないと判断する。

風雑音が発生していると判断した場合、判定部６１は、レベル判定処理によって風雑音の影響が最も少ないチャンネル信号を選択する。選択されたチャンネル信号を影響最小チャンネル信号と呼ぶ。実際には、４チャンネル分のＭＤＣＴ係数の中から影響最小チャンネル信号に対応するＭＤＣＴ係数を択一的に選択する。具体的には、レベル判定処理では、下記式（１１ａ）、（１１ｂ）、（１１ｃ）及び（１１ｄ）に従って、４つのレベル評価値Pow_L_m、Pow_R_m、Pow_SL_m及びPow_SR_mを算出する。Pow_L_m、Pow_R_m、Pow_SL_m及びPow_SR_mは、夫々、第ｍのフレームにおけるレベル評価値である。

そして、判定部６１は、４つのレベル評価値Pow_L_m、Pow_R_m、Pow_SL_m及びPow_SR_mの内、最小のレベル評価値に対応する原信号（補正前のチャンネル信号）を影響最小チャンネル信号として選択する。レベル評価値Pow_L_mは原信号Ｌ（マイクロホン１Ｌのチャンネル信号）に対応し、レベル評価値Pow_R_mは原信号１Ｒに対応し、レベル評価値Pow_SL_mは原信号ＳＬに対応し、レベル評価値Pow_SR_mは原信号ＳＲに対応している。従って例えば、４つのレベル評価値Pow_L_m、Pow_R_m、Pow_SL_m及びPow_SR_mの内、レベル評価値Pow_L_mが最小である場合、判定部６１は、原信号Ｌ（マイクロホン１Ｌのチャンネル信号）を影響最小チャンネル信号として選択する。

判定部６１による風雑音の発生有無の判別は、フレームごとに行われる（Ｗｉｎｄ１_m等に基づく判断は、第ｍのフレームに対する判断である）。そして、風雑音が発生している場合、影響最小チャンネル信号の切り替えはフレームごとに実行される（但し、切り替えが必要な場合）。また、上記式（１１ａ）等におけるαは、所定の係数である（０≦α＜１）。典型的には例えば、α＝０としておけばよい。

ＭＤＣＴ係数補正部５２は、判定部６１の判定結果に応じて、ＭＤＣＴ係数を補正し、補正後のＭＤＣＴ係数を符号化後処理部５３に送る。但し、補正が行われるのは、０≦ｋ≦１３を満たすＭＤＣＴ係数のみであり、１３＜ｋ≦１０２３を満たすＭＤＣＴ係数（Ｘ_Ｌ_m,k、Ｘ_Ｒ_m,k、Ｘ_ＳＬ_m,k及びＸ_ＳＲ_m,k）は、何ら補正が施されることなく、そのまま符号化後処理部５３に送られる。尚、判定部６１によって風雑音が発生していないと判断されたフレームに関しては、０≦ｋ≦１０２３の範囲内の全てのＭＤＣＴ係数が、何ら補正が施されることなく、そのまま符号化後処理部５３に送られる。

判定部６１によって風雑音が発生していると判断されている場合は、例えば、影響最小チャンネル信号に対応するＭＤＣＴ係数にて他のチャンネル信号のＭＤＣＴ係数を差し替える補正を行う。即ち例えば、風雑音が発生していると判断され且つ影響最小チャンネル信号が原信号ＳＲであると判断されている場合は、ＭＤＣＴ係数Ｘ_Ｌ_m,k、Ｘ_Ｒ_m,k及びＸ_ＳＬ_m,kの夫々にＭＤＣＴ係数Ｘ_ＳＲ_m,kを代入し、この代入後の各ＭＤＣＴ係数を符号化後処理部５３に送るようにする（この代入が行われるのは、０≦ｋ≦１３を満たすＭＤＣＴ係数のみである）。

尚、第１実施例において式（５ａ）等を用いて説明したのと同様に、加重加算によってＭＤＣＴ係数の補正を行うようにしてもよい。即ち例えば、風雑音が発生していると判断され且つ影響最小チャンネル信号が原信号ＳＲであると判断されている場合は、下記式（１２ａ）に示す如く、０≦ｋ≦１３の範囲内において式（１２ａ）の右辺をＭＤＣＴ係数Ｘ_Ｌ_m,kに代入する補正を行い、この補正後のＭＤＣＴ係数Ｘ_Ｌ_m,kを符号化後処理部５３に送るようにする。ＭＤＣＴ係数Ｘ_Ｒ_m,k、Ｘ_ＳＬ_m,k及びＸ_ＳＲ_m,kに対しても、下記式（１２ｂ）、（１２ｃ）及び（１２ｄ）に従った同様の処理が行えばよい。尚、βは、風雑音発生指標Ｗｉｎｄ１_m、Ｗｉｎｄ２_m及びＷｉｎｄ３_mの最大値とする。この最大値は、風雑音の強度に応じた値を持つ。

符号化後処理部５３に対して入力された各ＭＤＣＴ係数は、図７の音声信号処理部にて生成されるべき補正された各チャンネル信号を表している。但し、本実施例では、補正された各チャンネル信号が、周波数スペクトルという信号形式で表現されている。符号化後処理部５３は、与えられた各周波数スペクトル（Ｘ_Ｌ_m,k、Ｘ_Ｒ_m,k、Ｘ_ＳＬ_m,k及びＸ_ＳＲ_m,k）を、ＡＡＣの符号化方式に従って量子化することにより、符号化音声信号としてのビットストリームに変換する。この符号化音声信号（ビットストリーム）は、図２の記録媒体５に記録される。

上述の如く構成することにより、第１実施例と同様の効果が得られる。更に、低域のスペクトラムデータの置き換えによる不連続性は、音声符号化処理の過程において元々使用される窓関数によってスムージングされるため、滑らかな記録信号が得られる（これは、上記式（１２ａ）等に従う加重加算を実施しなくても当てはまる）。

また、音声符号化処理における中間生成データを利用して補正処理を行うため、第１又は第２実施例では必要であったＨＰＦ及びＬＰＦが不要となる。音声符号化処理部として撮像装置１０にＡＡＣエンコーダが設けられることが多いが、このＡＡＣエンコーダの中間生成データを利用し、簡素な処理量にて補正処理を行うことが可能である。

図７の音声符号化処理部１００に組み込むことが可能なＡＡＣエンコーダ１１０の内部ブロック図を、図９に示す。ＡＡＣエンコーダ１１０内の各部位の動作は、ＡＡＣの規格に従うものであるため説明を割愛する。ＡＡＣエンコーダ１１０内に設けられたフィルタバンク１１１が、修正離散コサイン変換を行う部分であり、図７のＭＤＣＴ変換部５１の一部又は全部に相当することになる。

ＡＡＣエンコーダ１１０を図７の音声符号化処理部１００に組み込む場合、フィルタバンク１１１にて一旦算出された各ＭＤＣＴ係数をＭＤＣＴ補正部５２にて補正し、その補正後のＭＤＣＴ係数を、フィルタバンク１１１の出力信号を必要とする部位（ＴＮＳ（Temporal Noise Shaping）及びビットストリームマルチプレクサ）に供給するようにする。この補正を介してＡＡＣエンコーダ１１０から出力されるビットストリームが、図７の符号化後処理部５３の出力信号に相当する。

＜＜第４実施例＞＞
上述の第１及び第２実施例では、各マイクロホンの出力信号に対してリアルタイムに風雑音低減用の補正処理を施し、該補正処理後の音声信号を図２の記録媒体５に保存するようにしているが、補正処理を実行するタイミングは任意である。例えば、補正前の各チャンネル信号（原信号Ｌ、Ｒ、ＳＬ及びＳＲ）そのもの、或いは、それらに何らかの信号処理（圧縮処理等）を施した信号を、一旦、記録媒体５に生データとして記録しておく。そして、音声再生時などにおいて、その生データから補正前の各チャンネル信号（原信号Ｌ、Ｒ、ＳＬ及びＳＲ）を再現し、その再現された信号に対して、第１又は第２実施例で述べた処理を施すことによって補正後の各チャンネル信号（補正信号Ｌ、Ｒ、ＳＬ及びＳＲ）を生成するようにしてもよい。そして、音声再生時には、この補正後の各チャンネル信号を再生出力すれば良い。

同様のことが第３実施例に対しても当てはまる。第３実施例における補正処理を音声再生時等に行う場合は、以下のようにすればよい。まず、図７のＭＤＣＴ変換部５１から出力されるＭＤＣＴ係数をそのままＡＡＣの符号化方式に従って量子化し、これによって得られた符号化音声信号を、図２の記録媒体５に生データとして記録しておく。音声再生時には、ＡＡＣデコーダを用いて該生データからＭＤＣＴ係数を生成する。ここで得られるＭＤＣＴ係数は、図７のＭＤＣＴ変換部５１から出力されるそれと同じものである。故に、生データから得たＭＤＣＴ係数に対して、図７のＭＤＣＴ補正部５２及び判定部６１を用いた第３実施例と同様の補正処理を施す。この補正処理後のＭＤＣＴ係数は、第３実施例において符号化後処理部５３に与えられたものと同じＭＤＣＴ係数となる。音声再生時には、この補正処理後のＭＤＣＴ係数から風雑音の影響が抑制された音声信号を再生出力すればよい。

上述の説明から明らかなように、上記の生データから音声を再生する音声再生装置に図２の音声信号処理部４と同様の音声信号処理部を搭載することも可能であり、その場合も、音声信号処理部は有効に機能する。つまり、本発明は、音声再生装置にも適用可能である。集音時には生データを記録しておき、風雑音低減用の補正処理を音声再生装置側に担わせるようにしておけば、該補正処理の実施／不実施を再生時に自由に切り替えることも可能である。

また、音声信号処理部４が設けられる装置として図１の撮像装置１０を例示したが、同様の音声信号処理部を、他の録音装置又は録音機能を備えた装置に設けることが可能である。他の録音装置又は録音機能を備えた装置には、例えば、ＩＣレコーダ等の携帯型録音装置や、録音機能を備えた携帯電話機が含まれる。これらの装置には、図２に示される４つのマイクロホン、音声信号処理部４及び記録媒体５が設けられることになる。

＜＜第５実施例＞＞
４つのマイクロホンを用いて風雑音を低減する手法を説明したが、マイクロホンの個数は４以外であってもよい。即ち、撮像装置を例にとれば、撮像装置に備え付けられるマイクロホンの個数は、２又は３でもよいし、或いは、５以上であってもよい。マイクロホンの個数を４より多くする場合は、より高精度に風雑音を低減することができる。

図１の撮像装置１０を参照しつつ、マイクロホンの個数を３つにする場合について説明する。この場合、例えば、図１におけるマイクロホン１ＳＬ及び１ＳＲを１つに集約する。つまり、撮像装置１０に、マイクロホン１Ｌ、１Ｒ、１ＳＬ及び１ＳＲではなく、マイクロホン１Ｌ、１Ｒ及び１Ｓから成る３つのマイクロホンを設けるようにする。マイクロホン１Ｓは、マイクロホン１Ｌ及び１Ｒと同様のものであり、図３のマイクロホン１と同様の構造を有する。マイクロホン１Ｓは、図１の撮像装置１０では備えられていたマイクロホン１ＳＬと１ＳＲの中間に配置される。

そして、マイクロホン１Ｌ、１Ｒ及び１Ｓを、図１０に示すように配置すればよい。図１０には、図４に示すそれと同じ二次元座標が示されている。そして、図１０には、マイクロホン１Ｌ、１Ｒ及び１Ｓの該二次元座標上への投影図が重畳して示されている。該二次元座標上におけるマイクロホン１Ｌ及び１Ｒの配置位置は、図４を参照して上述したそれと同じである。マイクロホン１Ｓは、Ｙ軸上にＹ軸の負の方向を向けて配置される。上記の二次元座標上において、マイクロホン１Ｌの振動板の中心の座標及びマイクロホン１Ｒの振動板の中心の座標は、上述の如く、夫々（ｘ_L，ｙ_L）及び（ｘ_R，ｙ_R）である。そして、マイクロホン１Ｓの振動板の中心の座標を（ｘ_S，ｙ_S）とする。

マイクロホン１Ｌ、１Ｒ及び１Ｓを互いに異なる方向に向けて配置し、何れのマイクロホンの正面側も原点Ｏに対して外側を向けるようにする。つまり、マイクロホン１Ｌの振動板の中心から見て原点Ｏ側をマイクロホン１Ｌの裏側とし、マイクロホン１Ｒの振動板の中心から見て原点Ｏ側をマイクロホン１Ｒの裏側とし、マイクロホン１Ｓの振動板の中心から見て原点Ｏ側をマイクロホン１Ｓの裏側とする。

理想的には例えば、マイクロホン１Ｌの振動板の中心と原点Ｏとを結ぶ直線とＸ軸との成す角度が４５度となるようにマイクロホン１Ｌを撮像装置１０の筐体に配置し、且つ、マイクロホン１Ｒの振動板の中心と原点Ｏとを結ぶ直線とＸ軸との成す角度が４５度となるようにマイクロホン１Ｒを撮像装置１０の筐体に配置し、且つ、マイクロホン１Ｓの振動板の中心がＹ軸上にのるようにマイクロホン１Ｓを撮像装置１０の筐体に配置する。そして、理想的には例えば、ｙ_L＝ｙ_R、ｘ_L＝−ｘ_R、ｙ_S＜０とし、且つ、原点Ｏから各マイクロホンの振動板の中心までの距離を全て同じとする。

このように各マイクロホンを配置して上述の各実施例と同様の信号処理を行えば、マイクロホンの個数を４つとする場合よりも風雑音低減効果が若干劣るものの、各実施例と同様の効果が得られる。勿論、マイクロホンの個数の変更に伴って音声信号処理部４における信号処理の具体的内容は適宜変更される。信号処理においては、上述の各実施例における原信号ＳＬ及びＳＲを、原信号Ｓに置き換えて考えれば良い。これに伴い、例えば、第１実施例における風雑音発生指標は２つとなり（マイクロホンの個数が４の場合は３つ）、第１実施例におけるレベル評価値は３つとなる（マイクロホンの個数が４の場合は４つ）。

仮に、マイクロホンの個数を２つにするならば、以下のようにすればよい。図１の撮像装置１０を参照しつつ、マイクロホンの個数を２つにする場合について説明する。この場合、単純には例えば、図１の撮像装置１０から、マイクロホン１ＳＬ及び１ＳＲを削除すれば足る。勿論、マイクロホンの個数の変更に伴って音声信号処理部４における信号処理の具体的内容は適宜変更される。例えば、第１実施例における風雑音発生指標は１つとなり、第１実施例におけるレベル評価値は２つとなる。

マイクロホンの個数を２つにした場合、特定の方向から到来する風に対しては或る程度の風雑音低減効果が見込めるものの、それ以外の方向からの風に対しては、あまり風雑音低減効果を期待できない。従って、マイクロホンの個数は３以上とすることが望ましい。

＜＜変形等＞＞
上述した説明文中に示した具体的な数値は、単なる例示であって、当然の如く、それらを様々な数値に変更することができる。上述の実施形態の変形例または注釈事項として、以下に、注釈１及び注釈２を記す。各注釈に記載した内容は、矛盾なき限り、任意に組み合わせることが可能である。

［注釈１］
図５又は図７に示される音声信号処理部は、ハードウェア、ソフトウェア、またはハードウェアとソフトウェアの組み合わせによって実現可能である。ソフトウェアを用いて音声信号処理部を構成する場合、ソフトウェアにて実現される部位についてのブロック図は、その部位の機能ブロック図を表すことになる。

また、図５又は図７の音声信号処理部にて実現される機能の全部または一部を、プログラムとして記述し、該プログラムをプログラム実行装置（例えばコンピュータ）上で実行することによって、その機能の全部または一部を実現するようにしてもよい。

［注釈２］
例えば、以下のように考えることができる。図５の音声信号処理部の一部又は全部は、音声信号補正装置として機能する。図５に関し、音声信号補正装置は、特に、各ＬＰＦ（２３Ｌ等）、判定部２４、出力切替部２５及び加算処理部２６を含む。図５において、各ＬＰＦ（２３Ｌ等）は各原信号から低周波帯域成分を抽出する抽出手段として機能し、判定部２４は、複数のチャンネル信号（原信号）の中から影響最小チャンネル信号を選択する選択手段として機能する。図５において、判定部２４は風雑音の影響の有無を判定する判定手段としても機能し、出力切替部２５及び加算処理部２６が補正手段として機能する。

図７の音声信号処理部の一部又は全部は、音声信号補正装置として機能する。図７に関し、音声信号補正装置は、特に、ＭＤＣＴ変換部５１、ＭＤＣＴ補正部５２及び判定部６１を含む。図７においては、例えば、ＭＤＣＴ変換部５１と判定部６１によって抽出手段が実現されると考えることができる。また図７において、判定部６１は選択手段と判定手段の各機能を兼務し、ＭＤＣＴ補正部５２が補正手段として機能する。

本発明の実施形態に係る撮像装置の外観斜視図である。図１の撮像装置の電気的構成を表す概略ブロック図である。本発明の実施形態に係るマイクロホンの構造を示す図である。図１の撮像装置に設けられた４つのマイクロホンの配置関係を示す図である。本発明の第１実施例に係る音声信号処理部の内部ブロック図である。本発明の第２実施例に係る窓関数を示す図である。本発明の第３実施例に係る音声信号処理部の内部ブロック図である。本発明の第３実施例に係り、符号化の処理単位である各フレームの関係を示す図である。図７の音声符号化処理部に組み込むことが可能なＡＡＣエンコーダの内部ブロック図である。本発明の第５実施例に係り、図１の撮像装置に設けられるマイクロホンの個数を３とした場合における、各マイクロホンの配置関係を示す図である。

符号の説明

１Ｌ、１Ｒ、１ＳＬ、１ＳＲマイクロホン
４音声信号処理部
５記録媒体
１０撮像装置

Claims

複数のマイクロホンの出力信号に基づく複数のチャンネル信号を受け、各チャンネル信号を補正する音声信号補正装置において、
各チャンネル信号の、風雑音の帯域を含む所定帯域成分に基づいて、前記複数のチャンネル信号の中から１つのチャンネル信号を特定チャンネル信号として選択する選択手段と、
前記特定チャンネル信号の前記所定帯域成分を用いて他のチャンネル信号の前記所定帯域成分を補正する補正手段と、を備えた
ことを特徴とする音声信号補正装置。
前記選択手段は、前記複数のチャンネル信号の内、前記風雑音の影響が最も少ないチャンネル信号を前記特定チャンネル信号として選択する
ことを特徴とする請求項１に記載の音声信号補正装置。
各チャンネル信号の前記所定帯域成分を抽出して各チャンネル信号に対応する抽出信号を出力する抽出手段を更に備え、
前記選択手段は、各抽出信号の内、最も信号レベルが小さい抽出信号に対応するチャンネル信号を前記特定チャンネル信号として選択する
ことを特徴とする請求項１または請求項２に記載の音声信号補正装置。
各チャンネル信号の前記所定帯域成分の相関に基づいて、各チャンネル信号に対する前記風雑音の影響の有無を判定する判定手段を更に備え、
前記判定手段の判定結果に応じて前記補正手段による補正の実行可否を切り替え制御する
ことを特徴とする請求項１〜請求項３の何れかに記載の音声信号補正装置。
各マイクロホンは、互いに異なる方向に向けられている
ことを特徴とする請求項１〜請求項４の何れかに記載の音声信号補正装置。
各マイクロホンは、音波又は風圧によって振動する振動体を有して、前記振動体の振動に応じた電気信号を出力し、
前記複数のマイクロホンが設置された装置に対して風が作用したときに、各マイクロホンの振動体が互いに異なる風圧を受けるように、各マイクロホンは前記装置に配置されている
ことを特徴とする請求項１〜請求項５の何れかに記載の音声信号補正装置。
請求項１〜請求項６の何れかに記載の複数のマイクロホン及び音声信号補正装置を備えた
ことを特徴とする録音装置。
請求項１〜請求項６の何れかに記載の複数のマイクロホン及び音声信号補正装置と、
撮像手段と、を備えた
ことを特徴とする撮像装置。
複数のマイクロホンの出力信号に基づく複数のチャンネル信号を補正する音声信号補正方法において、
各チャンネル信号の、風雑音の帯域を含む所定帯域成分に基づいて、前記複数のチャンネル信号の中から１つのチャンネル信号を特定チャンネル信号として選択する選択ステップと、
前記特定チャンネル信号の前記所定帯域成分を用いて他のチャンネル信号の前記所定帯域成分を補正する補正ステップと、を備えた
ことを特徴とする音声信号補正方法。