JP2011002723A - 音声信号処理装置 - Google Patents

音声信号処理装置 Download PDF

Info

Publication number
JP2011002723A
JP2011002723A JP2009146938A JP2009146938A JP2011002723A JP 2011002723 A JP2011002723 A JP 2011002723A JP 2009146938 A JP2009146938 A JP 2009146938A JP 2009146938 A JP2009146938 A JP 2009146938A JP 2011002723 A JP2011002723 A JP 2011002723A
Authority
JP
Japan
Prior art keywords
audio signal
signal
signal processing
period
driving
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2009146938A
Other languages
English (en)
Other versions
JP2011002723A5 (ja
JP5279629B2 (ja
Inventor
Yuichi Ariga
雄一 有賀
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Inc
Original Assignee
Canon Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Inc filed Critical Canon Inc
Priority to JP2009146938A priority Critical patent/JP5279629B2/ja
Publication of JP2011002723A publication Critical patent/JP2011002723A/ja
Publication of JP2011002723A5 publication Critical patent/JP2011002723A5/ja
Application granted granted Critical
Publication of JP5279629B2 publication Critical patent/JP5279629B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Studio Devices (AREA)

Abstract

【課題】 装置の駆動に伴う駆動音の低減処理を行う際に、雑音低減処理の負荷を低減する。
【解決手段】 駆動信号が送信されたことに応じて、駆動信号が送信されたタイミングよりも前の期間の音声信号から、合成音声信号を生成し、駆動信号が送信されたタイミングよりも後の期間の前記音声信号に、合成音声信号を合成する。
【選択図】 図4

Description

本発明は、音声信号処理装置に関し、特に、取得した音声信号に含まれる雑音成分を低減することができる装置に関する。
従来、音声信号を処理する装置として撮像装置が知られている。これらの撮像装置では、画像信号を記録すると共に音声信号を記録するようにしているが、画像記録のための駆動部材(絞り、ズーム機構、レンズ、ハードディスク)の駆動音が記録音声に混入してしまう場合があった。また、画像信号の記録に限らず、音声信号を音声データとしてHDDへ書き込む際にも駆動音が混入することがあった。このような問題に対し、たとえば、カメラに備えられたメカニズム機構部の発生する雑音成分を記録音声信号から低減させる技術が提案されている。例えば、特許文献1の技術では、あらかじめメモリに記録されている雑音成分を、メカニズム機構部の動作タイミングに合わせて、記録音声信号から減算することで雑音を低減させている。
特開11−205891号公報
しかし、実際は、メカニズム機構部で発生する雑音成分が毎回同じになる訳ではない。そのため、特許文献1のような技術では、安定的に記録音声信号から雑音成分を低減することができないという問題があった。
そこで、本発明は、あらかじめ記録した雑音成分を記録音声信号から減算するのではなく、記録音声信号の相関により予測される音声信号を雑音混入区間に合成する音声信号処理装置を提供することを目的とする。
本発明の音声処理装置は、かかる目的を達成するために、外部音声を音声信号に変換する集音手段を備える音声処理装置であって、前記音声処理装置に接続または備えられた駆動部材を駆動信号に応じて駆動する駆動手段と、前記駆動手段に前記駆動信号を送信する制御手段と、前記音声信号を処理する音声信号処理手段とを備え、前記音声信号処理手段は、前記駆動信号が送信されたことに応じて、前記駆動信号が送信されたタイミングよりも前の第1の期間の前記音声信号に基づいて合成音声信号を生成し、前記駆動信号が送信されたタイミングよりも後の第2の期間の前記音声信号に、前記合成音声信号を所定の割合で合成することを特徴とする。
本発明によれば、安定的に記録音声信号から雑音成分を低減することができる。
実施例1、2の撮像装置のブロック図である。 実施例1、2の撮像装置の動画撮影のフローチャートである。 実施例1の雑音低減処理を示すフローチャートである。 実施例1の雑音低減処理を説明するための信号を示す図である。 実施例1の雑音低減処理に使用するFIRフィルタの図である。 実施例1の雑音低減処理の模式図である。 実施例2の雑音低減処理を示すフローチャートである。 実施例2の音声信号のフーリエ変換後の信号を示す図である。 実施例2の雑音低減処理を説明するための信号を示す図である。
以下、図面を参照して本発明の実施例を詳細に説明する。
音声信号を処理、録音することができる撮像装置について説明する。
図1は、実施例1の撮像装置の構成を示すブロック図である。
図1において、100は撮像装置本体、200は前記撮像装置本体に接続可能な交換式の撮影レンズである。本実施例では交換式の撮影レンズを使用するが、特に交換式の撮影レンズに限定されるものではなく、撮影レンズが内蔵されていてもよい。
101は各種の演算処理と撮像装置100と交換レンズ200の全体を統括的に制御する制御部である。
201は被写体の光学像を撮像素子106に結像させる撮像レンズで、202は撮影レンズ201をピント(焦点)が合うように駆動する駆動装置である。203は被写体の光学像の光量を制御する絞り機構で、204は絞り機構203を駆動する駆動装置である。
撮影用の交換レンズ200は、撮像装置100から取り外せるようになっており、不図示の通信部を介し、制御部101と通信を行うようにしている。例えば、撮影レンズ201を駆動させる場合は、制御部101は、レンズ駆動信号をレンズ駆動装置202に出力(送信)することにより、撮影レンズ201を駆動させることができる。また、絞り機構203を駆動する場合は、制御部101は、絞り駆動信号を絞り駆動装置204に出力(送信)することにより、絞り機構203を駆動させることができる。このように、制御部101は、駆動信号の種類を使い分けることにより、複数種類の駆動部材を個別に指定して駆動させることができる。
また、図1において、102は撮影レンズ201を通った光学像を、ファインダー使用時には不図示のファインダーに導き、撮影時は跳ね上がり光学像を撮像素子106へと導くミラーである。103はミラーを駆動するミラー駆動装置である。
104は撮像レンズ201を通ってきた光学像の露光時間の制御と遮光を行うシャッタであり、105はシャッタ機構104のの駆動を行うシャッタ駆動装置である。
106は撮像レンズ201により結像された被写体の光学像を電気信号に変換し、画像信号を得るための撮像素子である。
107は撮像素子106により得られた画像信号の増幅処理や、A/D変換処理、A/D変換後の画像データに対する各種の補正処理、或いは、画像データを圧縮する圧縮処理等を行う画像信号処理部である。108は撮像素子106と画像信号処理部107に対して各種のタイミング信号を出力するタイミング発生部である。
109は画像信号処理部107により処理された画像データ等を一時的に記憶し、また各種の調整値や制御部101による各種の制御を実行させるためのプログラムなどを記憶するためのメモリ部である。また、後述の音声データを一時的に記憶するバッファメモリとしての役割も果たす。
110は記録媒体111に対し、画像データや音声データの記録処理/読出処理を行うための記録媒体制御インターフェース(I/F)部である。111は画像データ等の各種のデータを記録する記録媒体であり、例えば半導体メモリ、磁気ディスク、光ディスクなどが該当する。
112はコンピュータ等の外部装置114と通信するための外部インターフェース(I/F)部である。
113は、撮影した静止画像や動画像等を表示する表示部である。
また、115は動画撮影時や音声録音時などに、被写体が発した音声や環境音といった、外部音声を集音して電気信号に変換し、音声信号を取得するためのマイクロホンである。116はマイクロホン115により得られた音声信号を入力し増幅処理やA/D変換処理を行い、さらに後述する駆動雑音低減処理を行い、音声信号の圧縮処理等を行う音声信号処理部である。
次に、本実施例の撮像装置100での動画撮影の動作について説明する。
図2は、実施例1の動画撮影の動作を示すフローチャートである。
不図示のメイン電源がオンされると、撮像装置100の各ブロックに電源が供給され、撮影動作の準備が整う(S101)。
次に、ユーザにより不図示の動画記録モードボタン等が操作されると、制御部101は、動画撮影モードへ移行させる(S102/YES)。
動画撮影モードが開始するとまず、制御部101は、撮像素子106、画像信号処理部107、タイミング発生部108の初期化を行う(S103)。
続いて、制御部101は、ミラー駆動装置103を通じてミラー102を上げ、シャッタ駆動装置105を通じてシャッタ106を開く(S104)。これにより、撮像レンズ201を通った被写体の光学像を撮像素子106に導くことができる。
撮像素子106は、被写体の光学像を動画用のローリング読み出しに対応したスリットローリング電子シャッタを用いて、蓄積時間を制御しながら露光を行う(S105)。
続いて、制御部101は、タイミング発生部108と画像信号処理部107とを制御し、撮像素子106から動画用の画像信号の読み出しを行う(S106)。
制御部101は、撮像素子106から読み出した動画用の画像信号を画像信号処理部107で信号処理させ、画像信号処理部107において、動画用の画像信号に基づく動画像データを生成する。そして、制御部101は、画像信号処理部107で生成した動画像データを表示部113に表示させる(S107)。
制御部101は、撮像素子106から読み出した画像信号を元に、絞り駆動装置204に絞り駆動信号を送信することで、絞り機構203を制御して露光量を適正に制御する。また、撮像素子106から読み出された画像データから被写体のコントラストを計測して常に被写体にピント(焦点)が合うようにレンズ駆動装置202にレンズ駆動信号を送信し、撮像レンズ201の駆動を行わせる(S108)。これらを制御することにより、撮像素子106に被写体からの光学像がピント(焦点)と露出とが合った状態でを保つことができる。
そして、制御部101は、動画記録が開始されない時(S109/NO)には、S105の露光に戻り周期的に画像を更新することにより、動画画像を表示装置113に表示する。
続いて、ユーザにより不図示の撮影開始ボタンが操作されると、制御部101は、動画記録を開始する(S109/YES)。そうすると、再び動画記録にために制御部101は、タイミング発生部108と画像信号処理部107とタイミング発生部108を介して撮像素子106の初期化を行う(S110)。
撮像素子106は、動画記録画像用のローリング読み出しに対応したスリットローリング電子シャッタを用いて蓄積時間を制御し撮影シーンに適した露光を行う(S111)。
続いて、制御部101は、タイミング発生部108と画像信号処理部107とを制御し、撮像素子106から動画用の画像信号の読み出しを行う(S112)。
撮像素子106から動画用の画像信号の読出された画像信号は、画像信号処理部107で、各種処理が施され動画像データに変換される。画像信号処理部107で得られた動画像データは、記録媒体111に記録するために一時的にメモリ109に保存される(S113)
また、制御部101は、画像信号処理部107で得られた動画像データをを表示部113に表示させる(S114)。
撮影中、制御部101は、撮像素子106から読み出した画像信号を元に、被写体輝度を測定してのスリットローリング電子シャッタや絞り機構203を制御させて露光量を適正に保つ。そのために、制御部101は、絞り駆動装置204に絞り駆動信号を出力し、絞り駆動装置204は、絞り駆動信号に従って、絞り機構203を駆動させる。また、撮像素子106から読み出された画像データから被写体のコントラストを計測して常に被写体にピント(焦点)が合うように撮像レンズ201の駆動させる(S115)。そのために、制御部101は、レンズ駆動装置202にレンズ駆動信号を出力し、レンズ駆動装置202は、レンズ駆動信号に従って、レンズ201を駆動させる。これらの制御により、撮影中は、撮像素子106に被写体からの光学像がピント(焦点)と露出とが合った状態で結像される。
ここで、撮影中の音声の記録について説明する。マイクロホン115により得られた音声信号は、音声信号処理部116で処理され、音声データに変換される。そして、音声信号処理部116で生成された音声データは、記録媒体111に記録するために一時的にメモリ109に保存される(S116)。
音声記録を行う際には、制御部101は、レンズ、絞り等の駆動信号を出力するときに、(S117/YES)音声信号処理部116に、雑音低減処理を行わせる(S118)。ステップS118の雑音低減処理については、後述する。
S119で、S118の雑音低減処理が終わった音声データもしくは雑音低減処理を施す必要のない音声データを、動画像データとともに、開始からの時間が一致するように順次記録媒体に記録していく。
制御部101は、ユーザにより動画撮影終了の指示が有るまでは、S111からS119の処理を繰り返す(S120/NO)。
動画撮影が終了した場合には(S120/Yes)、制御部101は、シャッタ駆動部105を通じてシャッタ106を閉じると共に、ミラー駆動部103を通じてミラー102を下げるように制御する(S121)。
そして、制御部101は、メモリに保存した動画像データと音声データとが全て記録媒体に記録したら、動画撮影動画終了する(S122)。
ここで、図2のS117で、撮影中、制御部101が、レンズ、絞り等の駆動信号を出力するときに、音声信号処理部116に実行させる雑音低減処理(S118)について、図3のフローチャート、図4の信号波形を用いて説明をする。図3は、本実施例の雑音低減処理の手順を示すのフローチャートであり、図4は、本実施例の雑音低減処理を説明するための信号を示す図である。図4(a)は、制御部101が出力するレンズ、絞り等の駆動信号により、レンズ、絞り等が駆動している区間を示している。本実施例では、駆動信号がONの期間、レンズ、絞り等は駆動を続けるようになっている。図4(b)は、マイクロホン115に入力される音声信号の波形を示しており、途中、レンズ、絞り等の駆動している期間には、駆動音がとして混入している。図4(c)は、後述する線形予測処理により、駆動音の混入した期間より前の期間の音声信号を元に生成される、予測波形信号である。図4(d)は、予測波形信号を駆動音の混入した期間に合成する際の合成割合を示している。図4(e)は、駆動音の混入した期間の実際の音声信号の波形を示している。図4(f)は、後述する予測波形信号と実際の音声信号の合成をする際の元の音声信号の合成割合を示している。図4(g)は、雑音低減処理後の補正音声信号を示している。
まず、本実施例の雑音低減処理の概要を説明する。
撮影中に、レンズ、絞り等の駆動信号を受けると、レンズ駆動装置202は、レンズ201を、絞り駆動装置204は絞り203をそれぞれ駆動させる。そうすると、図4(b)に示す音声信号のように、マイクロホン115により集音される音声に、にレンズ201や絞り203の駆動によって生じる駆動音(雑音)が、混入してしまう。
本実施例の雑音低減処理では、このような駆動音が混入する期間の音声信号を処理し、レンズ、絞り等の駆動部材の駆動音(雑音)を低減させる処理を行う。
そのために、まず、駆動信号が出力されるタイミングより前、つまり雑音が混入する期間(補正区間)より前の、雑音が混入していない期間(学習区間)の音声信号から、図4(c)に示すような、予測波形信号を生成する。この予測波形信号は、雑音が混入していない期間の音声信号から線形予測法(第1の生成方法)により求められる。
次に、駆動信号が出力されるタイミングより後、つまり雑音が混入する期間(補正区間)の音声信号と、予測波形信号とを、図4(d)、(f)に示すような割合で合成する。このとき、補正区間の音声信号と、予測波形信号との合成割合は、合成後の音声信号のレベルが、学習区間の音声信号のレベルと略一致するように設定している。言い換えれば、補正区間の音声信号と予測波形信号とを合成した後の音声信号の最大振幅が、学習区間の音声信号の最大振幅と所定量よりも大きくならないように、合成割合を設定する。例えば、図4(d)、(f)に示す合成割合を加算した値が略一定の数(例えば1)になるようにする。本実施例では、駆動信号が出力(送信)されたタイミング近傍における予測波形信号の合成割合を、駆動信号が送信されたタイミング近傍よりも遠い位置における合成割合よりも高している。
このように、一般的には、駆動部材の駆動中に大きい駆動音が発生するので、駆動信号の出力(送信)されたタイミング近傍では予測波形信号の合成割合を高くすることで、雑音低減効果を高くすることができる。また、予測波形信号自体は線形予測法によって生成されているため、駆動信号の出力(送信)されたタイミング近傍の信頼性が高いので、その位置で予測波形信号の合成割合を高くすることで、合成後の音声信号の信頼性を高くできる。
また、駆動部材が複数種類有る場合は、駆動部材の種類によって駆動音(雑音)が異なるので、合成割合についても、駆動部材の種類によって異なるようにする。例えば、絞り駆動信号が出力されるときは、予測波形信号の合成割合を前半部において多くとり、後半部においては、急激に合成比率を下げ、レンズ駆動信号が出力されるときは、予測波形信号の合成割合を徐々に下げてもよい。
このように、予測波形信号と、雑音が混入する期間の音声とを所定の比率で合成した合成音声信号を生成する。そして、雑音が混入する区間の音声に換えて、生成した合成信号を挿入することにより、図4(h)のように、駆動部の駆動音(雑音)を低減させた補正音声信号を得ることができるようになるのである。
以上の処理について、図3のフローチャートを用いて詳細に説明する。
ここでは、レンズ、絞り等の駆動信号が出力されるタイミングより前の所定期間(例えば0.1秒間)を「学習区間」、駆動信号が出力されるタイミングより後の所定区間(例えば0.08秒間)を「補正区間」とする。また、レンズ、絞り等の駆動部材の駆動が終了した後も、駆動に起因する振動が雑音として、マイクロホンに入力されるため、「補正区間」は、レンズ、絞り等の駆動信号よりも長くしている。また、駆動部材が複数種類有る場合は、駆動部材の種類それぞれに対応して、補正区間の長さを決定してもよい。例えば、レンズ駆動の場合は、補正区間は0.2秒とし、絞り駆動の場合は、補正区間は0.06秒としてもよい。
制御部101は、レンズ、絞り等の駆動信号(図4(a))を出力する際に、、雑音低減処理を開始するよう、音声信号処理部116に指示を出す(S201)。これにより、音声信号処理部116は、マイクロホン115により得られた図4(b)のような実際の音声信号の、どの区間に駆動音が含まれるか(学習区間)を検出することができる。
音声信号処理部116は、学習区間の音声信号を、連続したバッファ領域にコピーする(S202)。
次に、バッファ領域にコピーされた学習区間の音声信号を元に、補正区間に所定の割合で合成するための予測波形信号を線形予測法により生成するための、フィルタ特性を算出する(S203)。フィルタ特性の算出方法は、後述するが、予測波形信号が、学習区間の音声信号を図5に示した様な一般的なn次のFIRフィルタで再現出来るものと仮定する事で、このFIRフィルタの係数αからαを算出している。ここで求められるαからαを線形予測係数と呼ぶ。
そして、音声信号処理部116は、S203で算出した線形予測係数αからαを用いて、図4(c)に示すような予測波形信号を演算する(S204)。具体的には図6(a)に示したように学習区間のnサンプルの音声信号(黒点)をFIRフィルタに入力し、線形予測係数を用いて次のn+1個目の音声データ601を演算する。そして、次に図6(b)に示したように、新たなに生成された音声波形データを加えたn個の音声信号をFIRフィルタに入力し、線形予測係数を用いて、次の音声データ602を演算する。この動作をもう一度繰り返し、音声データ603を求め、さらに繰り返し演算することにより、補正区間全域の予測音声波形信号を演算することができる。このようにして、図4(c)に示すような、予測波形信号を演算することができる(第1の生成方法)。
次に、音声信号処理部116は、図4(c)に示すような予測波形信号と、補正区間の音声信号とを図4(d)、(f)に示すような割合で合成し、合成音声信号を生成する(S205)。具体的には、レンズ、絞り等の駆動中は、予測波形信号をほぼ10割の信号で構成し、その後、予測波形信号の合成割合を徐々に低くし、逆に、補正区間の実音声信号の合成割合を徐々に高くしていく。この合成割合は、先述したように、駆動する駆動部材の種類(レンズ、絞り等)によって、合成割合の曲線を切り替えてもよい。これは、駆動部の雑音の残響度合いなどによって、適切に値を調整することが望ましい。また、予測波形信号の合成割合を、補正区間の実際の音声信号のエンベロープに合わせて決定してもよい。言い換えれば、実際の音声信号のレベルに合わせて予測波形信号の合成割合を決定していることになる。この合成割合の曲線は、実際の音声の音量を測定しつつ決定しても良いし、あらかじめ決めてあってもよい。
次に、S205で生成された合成音声信号で、補正区間の音声信号を置き換える(S206)。これにより、図4(g)の補正音声信号が生成される。
以上のS201からS206の処理により、雑音低減処理を完了する(S207)。
そして、図1のS119へ処理が進むことになる。
このような雑音低減処理を行うことにより、駆動部材の駆動音が混入してしまった音声信号から、駆動音成分を低減させた音声信号を得ることができる。そして、安定的に記録音声信号から雑音成分を低減することができる。
本実施例では、撮像装置の、レンズ、絞り等の駆動音を低減する構成について説明したが、これ以外にもズーム機構、ハードディスク等の発する雑音についても低減することができる。また、本実施例では、撮像装置を例にとって、動作を説明したが、これはカメラに限ったものではなく、音声を記録可能な装置であって、駆動音の発生タイミングを検出することができればどのような装置であっても適用可能である。例えば、ICレコーダ、オーディオプレイヤー、携帯電話、パーソナルコンピュータ、カーナビゲーションシステムなどに適用されてもよい。
ここで、線形予測法による予測波形信号の生成方法(第1の生成方法)について説明する。最初に線形予測係数αからαの算出方法(学習動作)について説明し、次に、線形予測係数を用いた予測波形信号の予測(予測動作)について説明する。
線形予測係数の算出あたっては、現在の信号とこれに隣接する有限個(ここではp個とおく)の標本値との間に数1のような線形1次結合関係があるものと仮定している。
Figure 2011002723
但し、数1において、εは平均値0、分散σの互いに無相関な確率変数である。ここでxが過去の値から予測されるように式を変形すると、
Figure 2011002723
数2によると、εが十分に小さければ、近傍p個の線形和によって現在の値が表現される。xを上記の予測によって求めた後、さらにその近似が十分によければxt+1も同じく近傍p個の線形和によって求められる。このようにεを十分に小さくすることが出来れば順次値を予測して信号を求めることが出来る。そこでεを最小にするようなαの求め方を考える。本発明ではεを最小にするようなαを求める動作を学習動作と呼ぶ。
εを最小にするようなαの求めるには、前述した学習区間においてεの2乗和を最小化すればよい。学習の開始時間をt、終了時間をtとすると、
Figure 2011002723
ただしα=1である。ここで式を簡単にするために
Figure 2011002723
とおく。数3を最小化するようにαを決めるためには、数3のα(j=1,2,・・・,p)に関する偏微分を0として解けばよい。
Figure 2011002723
数5はp個の線形連立1次方程式を解けばαを決定できることを示している。数5のうちcijはxt−i(i=1,2,・・・,p)から求めることができる。すなわち数5からαを求めることが出来る(学習動作)。
数5に従ってαを決定した場合、εの2乗和は最小化されている。このとき数2より、xの値は
Figure 2011002723
で良い近似を与えることが出来る。この近似が十分に良いものであれば、xの代わりに
Figure 2011002723
を予測信号として用いることが出来る。さらにxt+1についても同様に近傍のp−1個と予測によって求めた信号から近似値を得ることが出来る。これを順次繰り返すことで予測区間の信号を生成することが出来る。本発明では、求められたαから予測区間の近似を求める動作を予測動作とよんでいる。
このように、実施例1では、学習区間の音声信号の相関を利用し、線形予測法によって、予測波形信号を生成している。
次に、実施例2について説明する。実施例2では、実施例1と異なる雑音低減処理を行う。具体的には、実施例1における、予測波形信号の生成方法が異なるが、それ以外の点については同様である。そこで、予測波形信号の生成方法(第2の生成方法)について図7、図8、図9を用いて説明する。
図7は、実施例2の雑音低減処理について説明するためのフローチャートである。図8は、後述する学習区間の音声信号のフーリエ変換により得られる信号を示す図である。図9は予測波形信号の生成方法について説明するための図である。図9(a)は、マイクロホン115に入力される実際の音声信号の波形を示しており、途中、レンズ、絞り等の駆動している区間には、駆動音が混入している。図9(b)は、後述する演算により、算出された学習区間の音声信号の繰り返し波形を示している。図9(c)は、図9(b)の繰り返し波形を並べて生成した予測波形信号を示している。
実施例2では、駆動信号が出力(送信)されるタイミングより前の所定期間(例えば0.02秒間)を「学習区間」、駆動信号が出力されたタイミングより後の所定期間(例えば0.08秒間)を「補正区間」とする。また、レンズ、絞り等の駆動部材の駆動が終了した後も、駆動に起因する振動が雑音として、マイクロホンに入力されるため、「補正区間」は、レンズ、絞り等の駆動信号よりも長くしている。また、駆動部材が複数種類有る場合は、駆動部材の種類それぞれに対応して、補正区間の長さを決定してもよい。例えば、レンズ駆動の場合は、補正区間は0.2秒とし、絞り駆動の場合は、補正区間は0.06秒としてもよい。
ここで、図7のフローチャートに従って、実施例2の予測波形信号の生成方法について説明する。図7におけるS201からS202、S205からS207については、実施例1と同様の処理であるため説明を省略し、S303から説明をする。
実施例2では、S202で、バッファ領域にコピーされた音声信号の波形の周期を算出する(S303)。周期を算出するには、学習区間の音声波形データをフーリエ変換し、図8のような信号を得る。図8では、横軸に周波数、縦軸にレベルが示されている。そして、図8において、高いレベルを示す周波数は、周期性の高さを示しているので、これからバッファ領域にコピーされた音声信号の周期を検出することができる。
そして、S303で算出した周期で学習区間の音声信号の波形データを切り出し、その波形を繰り返しつなぎ合わせることで、図9(c)のような予測波形信号を得ことができる(S304)。実施例2では、このようにして予測波形信号を演算することができる。
以降は実施例1と同様の処理を行う。
このような雑音低減処理を行うことにより、駆動部材の駆動音が混入してしまった音声信号から、駆動音成分を低減させた音声信号を得ることができる。そして、安定的に記録音声信号から雑音成分を低減することができる。
本実施例では、撮像装置の、レンズ、絞り等の駆動音を低減する構成について説明したが、これ以外にもズーム機構、ハードディスク等の発する雑音についても低減することができる。また、本実施例では、撮像装置を例にとって、動作を説明したが、これはカメラに限ったものではなく、音声を記録可能な装置であって、駆動音の発生タイミングを検出することができればどのような装置であっても適用可能である。例えば、ICレコーダ、オーディオプレイヤー、携帯電話、パーソナルコンピュータ、カーナビゲーションシステムなどに適用されてもよい。
また、実施例1、2の雑音低減処理を組み合わせて使用しても良い。すなわち、雑音低減処理において、予測波形信号の生成方法を選択的に使用することになる。
実施例1、2の雑音低減処理を組み合わせて使用した場合、実施例1の雑音低減処理を使用する場合は、レンズ、絞り等の駆動信号が出力されるより前の所定期間(例えば0.1秒間)を「学習区間」とする。そして、実施例2の雑音低減処理を使用する場合は、レンズ、絞り等の駆動信号が出力されるより前の所定期間(例えば0.02秒間)を「学習区間」とする。このように、学習区間の長さを実施例1の雑音低減処理を使用するか、実施例2の雑音低減処理を使用するかによって異ならせてもよい。これは、それぞれの雑音低減処理によって、必要とする学習区間の長さが異なるからである。
また、実施例1、2の雑音低減処理を組み合わせて使用した場合、予測波形信号の合成割合を示す曲線を、どちらの雑音低減処理を用いるかによって、変更してもよい。例えば、実施例1の雑音低減処理を使用する場合は、予測波形信号の合成割合を全体的に高くする。実施例2の雑音低減処理を使用する場合は、予測波形信号の合成割合を全体的に低くする。このように、雑音低減処理の種類によって、予測波形信号を生成するために参照する音声信号の長さを変更したり、予測波形信号の合成割合を変更したりしてもよい。これは、それぞれの雑音低減処理によって、予測波形信号の形状が異なるなるため、合成割合を調節することが必要だからである。このようにすることで、低減処理後の音声信号の信頼性をユーザの聞きやすい音声とすることができる。
また、実施例1、2の雑音低減処理を組み合わせて使用した場合、制御部101は、撮像装置全体のリソースが低下していると判定したときは、音声信号処理部116に、実施例2の雑音低減処理を選択させる。このようにすることで、予測波形信号の生成処理による負荷を低減することができる。

Claims (14)

  1. 外部音声を音声信号に変換する集音手段を備える音声信号処理装置であって、
    前記音声信号処理装置に接続または備えられた駆動部材を駆動信号に応じて駆動する駆動手段と、
    前記駆動手段に前記駆動信号を送信する制御手段と、
    前記音声信号を処理する音声信号処理手段とを備え、
    前記音声信号処理手段は、前記駆動信号が送信されたことに応じて、前記駆動信号が送信されたタイミングよりも前の第1の期間の前記音声信号に基づいて予測波形信号を生成し、前記駆動信号が送信されたタイミングよりも後の第2の期間の前記音声信号に、前記予測波形信号を所定の割合で合成することを特徴とする音声信号処理装置。
  2. 前記音声信号処理手段は、前記駆動信号が送信されたタイミングに近い期間における前記予測波形信号の合成割合を、前記駆動信号が送信されたタイミングよりも遠い期間における前記予測波形信号の合成割合よりも、高くすることを特徴とする請求項1記載の音声信号処理装置。
  3. 前記駆動手段は、複数種類の駆動部材を個別に駆動することができ、
    前記制御手段は、前記複数種類の駆動部材それぞれを指定して駆動させるための複数種類の駆動信号を送信でき、
    前記音声信号処理部は、前記駆動信号の種類によって、前記予測波形信号の合成割合を変更することを特徴とする請求項1記載の音声信号処理装置。
  4. 前記音声信号処理手段は、前記駆動信号が送信されたタイミングよりも後の第2の期間の前記音声信号のレベルに応じて、前記予測波形信号の合成割合を変更することを特徴とする請求項1または2記載の音声信号処理装置。
  5. 前記音声信号処理手段は、前記駆動信号が送信されたタイミングよりも後の第2の期間の前記音声信号のエンベロープに従って、前記予測波形信号の合成割合を決定することを特徴とする請求項4記載の音声信号処理装置。
  6. 前記音声信号処理装置は、撮像レンズにより被写体の光学像を撮像素子に導き、画像信号を取得する撮像手段を有し、
    前記駆動手段は、前記撮像レンズを駆動し、
    前記制御手段は、撮像レンズを駆動するためのレンズ駆動信号を出力し、
    前記音声信号処理手段は、前記レンズ駆動信号が送信されたことに応じて、前記レンズ駆動信号が送信されたタイミングよりも前の第1の期間の前記音声信号に基づいて予測波形信号を生成し、前記レンズ駆動信号が送信されたタイミングよりも後の第2の期間の前記音声信号に、前記予測波形信号を所定の割合で合成することを特徴とする請求項1から5のいずれか1項記載の音声信号処理装置。
  7. 前記撮像手段は、前記被写体の光学像の光量を制御するための絞りを有し、
    前記駆動手段は、前記絞りを駆動し、
    前記制御手段は、絞りを駆動するための絞り駆動信号を出力し、
    前記音声信号処理手段は、前記絞り駆動信号が送信されたことに応じて、前記絞り駆動信号が送信されたタイミングよりも前の第1の期間の前記音声信号に基づいて予測波形信号を生成し、前記絞り駆動信号が送信されたタイミングよりも後の第2の期間の前記音声信号に、前記予測波形信号を所定の割合で合成することを特徴とする請求項6項記載の音声信号処理装置。
  8. 前記音声信号処理手段は、前記第1の期間の音声信号の相関を利用して前記合成信号を生成することを特徴とする請求項1から7のいずれか1項記載の音声信号処理装置。
  9. 前記音声信号処理手段は、前記第1の期間の音声信号の周期を検出し、前記第1の期間の音声信号の前記検出した周期を繰り返しつなぎ合わせることで、前記予測波形信号を生成することを特徴とする請求項8記載の音声信号処理装置。
  10. 前記音声信号処理手段は、前記第1の期間の音声信号から線形予測法を用いて、前記予測波形信号を生成することを特徴とする請求項8記載の音声信号処理装置。
  11. 前記音声信号処理手段は、前記第1の期間の音声信号の周期を検出し、前記第1の期間の音声信号の前記検出した周期を繰り返しつなぎ合わせて前記予測波形信号を生成する第1の生成方法と、前記第1の期間の音声信号から線形予測法を用いて、前記予測波形信号を生成する第2の生成方法とを選択的に使用することができることを特徴とする請求項8記載の音声信号処理装置。
  12. 前記音声信号処理手段は、前記第1の生成方法を使用する場合と、前記第2の生成方法を使用する場合とで、前記合成音声の合成割合を異ならせることを特徴とする請求項11記載の音声信号処理装置。
  13. 前記音声信号処理手段は、前記第1の生成方法を使用する場合と、前記第2の生成方法を使用する場合とで、前記第1の期間の長さを異ならせることを特徴とする請求項11または12記載の音声信号処理装置。
  14. 制御手段は、前記音声信号処理装置のリソースが低下していると判定したときは、前記第1の生成方法を使用して、予測波形信号を生成するよう音声信号処理手段を制御することを特徴とする請求項11記載の音声信号処理装置。
JP2009146938A 2009-06-19 2009-06-19 撮像装置 Expired - Fee Related JP5279629B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2009146938A JP5279629B2 (ja) 2009-06-19 2009-06-19 撮像装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2009146938A JP5279629B2 (ja) 2009-06-19 2009-06-19 撮像装置

Publications (3)

Publication Number Publication Date
JP2011002723A true JP2011002723A (ja) 2011-01-06
JP2011002723A5 JP2011002723A5 (ja) 2012-08-02
JP5279629B2 JP5279629B2 (ja) 2013-09-04

Family

ID=43560710

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2009146938A Expired - Fee Related JP5279629B2 (ja) 2009-06-19 2009-06-19 撮像装置

Country Status (1)

Country Link
JP (1) JP5279629B2 (ja)

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2013011873A (ja) * 2011-05-27 2013-01-17 Nikon Corp ノイズ低減処理装置、カメラ、およびノイズ低減処理プログラム
WO2013015011A1 (ja) * 2011-07-26 2013-01-31 ソニー株式会社 音声信号処理装置、撮像装置、音声信号処理方法、プログラム及び記録媒体
JP2013117635A (ja) * 2011-12-02 2013-06-13 Canon Inc 音声信号処理装置
JP2013118450A (ja) * 2011-12-01 2013-06-13 Canon Inc 情報処理装置及び方法、並びにプログラム
JP2013117585A (ja) * 2011-12-01 2013-06-13 Canon Inc 撮像装置、情報処理装置及びその制御方法、プログラム、並びに音声処理装置
JP2017011541A (ja) * 2015-06-23 2017-01-12 富士通株式会社 音声処理装置、プログラム、及び通話装置
US9674606B2 (en) 2012-10-26 2017-06-06 Sony Corporation Noise removal device and method, and program

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005228400A (ja) * 2004-02-12 2005-08-25 Fuji Photo Film Co Ltd 音声記録装置及び音声記録方法
JP2005292812A (ja) * 2004-03-09 2005-10-20 Nippon Telegr & Teleph Corp <Ntt> 音声雑音判別方法および装置、雑音低減方法および装置、音声雑音判別プログラム、雑音低減プログラム、およびプログラムの記録媒体
JP2006313181A (ja) * 2005-05-06 2006-11-16 Nissan Motor Co Ltd 音声入力装置及び音声入力方法

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005228400A (ja) * 2004-02-12 2005-08-25 Fuji Photo Film Co Ltd 音声記録装置及び音声記録方法
JP2005292812A (ja) * 2004-03-09 2005-10-20 Nippon Telegr & Teleph Corp <Ntt> 音声雑音判別方法および装置、雑音低減方法および装置、音声雑音判別プログラム、雑音低減プログラム、およびプログラムの記録媒体
JP2006313181A (ja) * 2005-05-06 2006-11-16 Nissan Motor Co Ltd 音声入力装置及び音声入力方法

Cited By (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2013011873A (ja) * 2011-05-27 2013-01-17 Nikon Corp ノイズ低減処理装置、カメラ、およびノイズ低減処理プログラム
WO2013015011A1 (ja) * 2011-07-26 2013-01-31 ソニー株式会社 音声信号処理装置、撮像装置、音声信号処理方法、プログラム及び記録媒体
JP2013025291A (ja) * 2011-07-26 2013-02-04 Sony Corp 音声信号処理装置、撮像装置、音声信号処理方法、プログラム及び記録媒体
CN103688307A (zh) * 2011-07-26 2014-03-26 索尼公司 音频信号处理装置、成像装置、音频信号处理方法、程序和记录介质
US9495950B2 (en) 2011-07-26 2016-11-15 Sony Corporation Audio signal processing device, imaging device, audio signal processing method, program, and recording medium
JP2013118450A (ja) * 2011-12-01 2013-06-13 Canon Inc 情報処理装置及び方法、並びにプログラム
JP2013117585A (ja) * 2011-12-01 2013-06-13 Canon Inc 撮像装置、情報処理装置及びその制御方法、プログラム、並びに音声処理装置
US9277102B2 (en) 2011-12-01 2016-03-01 Canon Kabushiki Kaisha Audio processing apparatus, audio processing method and imaging apparatus
US9282229B2 (en) 2011-12-01 2016-03-08 Canon Kabushiki Kaisha Audio processing apparatus, audio processing method and imaging apparatus
JP2013117635A (ja) * 2011-12-02 2013-06-13 Canon Inc 音声信号処理装置
US9674606B2 (en) 2012-10-26 2017-06-06 Sony Corporation Noise removal device and method, and program
JP2017011541A (ja) * 2015-06-23 2017-01-12 富士通株式会社 音声処理装置、プログラム、及び通話装置

Also Published As

Publication number Publication date
JP5279629B2 (ja) 2013-09-04

Similar Documents

Publication Publication Date Title
JP5279629B2 (ja) 撮像装置
JP5351644B2 (ja) 音声記録装置及び方法、ならびに撮像装置
US9495950B2 (en) Audio signal processing device, imaging device, audio signal processing method, program, and recording medium
JP2008263498A (ja) 風雑音低減装置、音響信号録音装置及び撮像装置
JP5538918B2 (ja) 音声信号処理装置、音声信号処理システム
US20150271439A1 (en) Signal processing device, imaging device, and program
US9288370B2 (en) Imaging apparatus and audio processing apparatus
US20110234821A1 (en) Imaging device
US9232146B2 (en) Imaging device with processing to change sound data
JP5998483B2 (ja) 音声信号処理装置、音声信号処理方法、プログラム及び記録媒体
JP5963430B2 (ja) 撮像装置、音声処理装置、及びそれらの制御方法
US8422690B2 (en) Audio reproduction apparatus and control method for the same
US8855482B2 (en) Imaging apparatus and sound processing apparatus
CN102695027A (zh) 音频信号处理装置
JP6144945B2 (ja) 信号処理装置及び方法
JP2012165219A (ja) 撮像装置
US11729548B2 (en) Audio processing apparatus, control method, and storage medium, each for performing noise reduction using audio signals input from plurality of microphones
JP2013047710A (ja) 音声信号処理装置、撮像装置、音声信号処理方法、プログラム及び記録媒体
JP2010134260A (ja) 電子機器及び音声処理方法
JP2013131894A (ja) 撮像装置と撮像環境判別方法およびプログラム
JP2012168477A (ja) ノイズ推定装置、信号処理装置、撮像装置、及びプログラム
JP2011124959A (ja) 音声信号処理装置
JP2010081395A (ja) 電子機器
JP2016018082A (ja) 音声処理装置及び方法、並びに撮像装置
JP2010130423A (ja) 電子機器及び音声処理方法

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20120619

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20120619

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20130125

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20130129

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20130401

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20130423

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20130521

R151 Written notification of patent or utility model registration

Ref document number: 5279629

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R151

LAPS Cancellation because of no payment of annual fees