JP6912969B2 - 音声処理装置及びその制御方法 - Google Patents

音声処理装置及びその制御方法 Download PDF

Info

Publication number
JP6912969B2
JP6912969B2 JP2017157617A JP2017157617A JP6912969B2 JP 6912969 B2 JP6912969 B2 JP 6912969B2 JP 2017157617 A JP2017157617 A JP 2017157617A JP 2017157617 A JP2017157617 A JP 2017157617A JP 6912969 B2 JP6912969 B2 JP 6912969B2
Authority
JP
Japan
Prior art keywords
noise
unit
microphone
voice
data obtained
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2017157617A
Other languages
English (en)
Other versions
JP2019035875A5 (ja
JP2019035875A (ja
Inventor
祐介 鳥海
祐介 鳥海
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Inc
Original Assignee
Canon Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Inc filed Critical Canon Inc
Priority to JP2017157617A priority Critical patent/JP6912969B2/ja
Priority to US16/058,268 priority patent/US10418049B2/en
Publication of JP2019035875A publication Critical patent/JP2019035875A/ja
Publication of JP2019035875A5 publication Critical patent/JP2019035875A5/ja
Application granted granted Critical
Publication of JP6912969B2 publication Critical patent/JP6912969B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Structure And Mechanism Of Cameras (AREA)
  • Studio Devices (AREA)

Description

本発明は音声処理技術に関するものである。
近年、カメラなどの撮影装置の高機能化が進んでいる。高機能化の一環として動画/静止画の両方を撮影可能なカメラが多数みられる。これらのカメラは、動画撮影において、撮像装置は動画を取得すると同時に音声も取得し、動画と同期させて記録を行う。少なからずのカメラは、光学系の駆動部が発生する駆動音(フォーカシングレンズやズームレンズの駆動音)を雑音として記録されるという問題を抱えている。
このようなフォーカスやズームの駆動の際に発生する駆動音を除去もしくは低減させるノイズ除去手法を開示する文献に特許文献1がある。
特開2011−114465号公報
特許文献1は、駆動部の雑音を検出するためのノイズ録音用マイクを有し、通常の音声録音用マイクで取得した音声信号から、ノイズ録音用マイクで取得した音声信号を減算する事で、駆動ノイズを低減している。
しかし、デジタルカメラのような撮影装置では、小型化、集積化が進んでいる。当然、マイクなどの集音部、画像を確認する表示部、操作部材などが互いに近接した位置に配置される。このため、ノイズ録音用マイクを新たに追加する事は、コストアップや面積増の要因となる。
加えて、交換式レンズの撮影装置では、駆動部の位置がレンズによって異なる。このため、ノイズ録音用マイクを、一意に効果的な位置に配置することは非常に難しい。
また、一般に、駆動部の雑音の除去は、時系列の音声信号を一旦FFTなどにより周波数領域へ変換し、駆動部の雑音を判別、除去し、再度時間領域の信号へ変換(逆FFT)する構成をとる。周波数領域への変換は時系列のまとまったデータを元に行う為、雑音除去処理の実行時には録音音声に遅延が発生してしまうという問題もある。
本発明は、ノイズ検出のための専用マイクを新たに追加することなく、レンズユニットの駆動に起因する雑音の除去もしくは低減を行う技術を提供しようとするものである。
この課題を解決するため、例えば本発明の音声処理装置は以下の構成を備える。すなわち、
音声処理装置であって、
音声データを取得するためのマイクと、
駆動部と、
前記駆動部による駆動に起因する複数のピーク周波数を含む駆動雑音を、前記マイクより得られた音声データから除去する雑音除去手段とを有し、
前記雑音除去手段は、
前記複数のピーク周波数それぞれが設定され、当該ピーク周波数を挟む予め設定された範囲の音声データを通過させるための複数のバンドパスフィルタと、
前記複数のバンドパスフィルタで得られた音声データを加算し、当該加算して得られた音声データを雑音データとして出力する加算手段と、
前記マイクにより得られた音声データと、前記加算手段による加算で得られた雑音データとに基づき、前記音声データから前記雑音データを除去する適応フィルタ処理を行う適応フィルタ手段とを含むことを特徴とする。
本発明によれば、ノイズ検出のための専用マイクを新たに追加することなく、レンズユニットの駆動に起因する雑音の除去もしくは低減することが可能になる。
実施形態における適応フィルタを示すブロック図。 実施形態におけるデジタルカメラのシステム構成を示すブロック図。 実施形態における雑音除去システムを示すブロック図。 実施形態におけるレンズの駆動雑音の周波数分布とテーブルの例を示す図。 実施形態におけるシステム制御回路の処理手順を示すフローチャート。
以下、添付図面に従って本発明に係る実施形態における音声処理装置を詳細に説明する。なお、以下では音声処理装置を搭載する装置としてデジタルカメラに代表される撮像装置を例に説明するが、駆動雑音を発生する駆動部を有する装置であれば適用できるので、これによって本発明が限定されるものではない。具体例を示すことで理解を容易にするためであると認識されたい。
図2は実施形態が適用する撮影装置201のブロック構成図である。シャッター202は絞り機能を備える。撮像素子204は光学像を電気信号に変換し、光の強度を表すアナログ信号を出力する。A/D変換器205は撮像素子204のアナログ信号出力をデジタル信号に変換する。タイミング発生回路206は、メモリ制御回路208及びシステム制御回路218により制御され、撮像素子204、 A/D変換器205、 D/A変換器210にクロック信号や制御信号を供給する。画像処理回路207は、 A/D変換器205からのデータ或いはメモリ制御回路208からのデータに対して所定の画素補間処理や色変換処理を行う。システム制御回路218は1以上のプロセッサを包含している。
また、画像処理回路207は、撮像した画像データを用いて所定の演算処理を行う。そして、システム制御回路218は、画像処理回路207から得た演算結果に基づいて、AF(オートフォーカス)処理、AE(自動露出)処理、不図示のEF(フラッシュ)の発光処理を行う。さらに、画像処理回路207は、撮像した画像データを用いて所定の演算処理を行い、得られた演算結果に基づいてTTL方式のAWB(オートホワイトバランス)処理も行う。
メモリ制御回路208は、A/D変換器205、タイミング発生回路206、画像処理回路207、画像表示メモリ209、D/A変換器210、メモリ213、圧縮・伸長回路214を制御する。A/D変換器205のデータが画像処理回路207、メモリ制御回路208を介して、或いはA/D変換器205のデータが直接メモリ制御回路208を介して、画像表示メモリ209或いはメモリ213に書き込まれる。
外部出力コネクタ211は、D/A変換器210の出力を外部モニタに出力する。システム制御回路218は、外部出力コネクタ211にコネクタが挿されているか否かを外部出力接続検知部235からの信号により検知できる。なお、外部出力コネクタ211は、例えばコンポジットインターフェースである。ただし、HDMI(登録商標)コネクタであっても構わない。
画像表示部212は、TFT LCD等から成り、画像表示メモリ209に書き込まれた表示用の画像データをD/A変換器210を介して受信し、表示する。画像表示部212に、撮像した画像データを逐次表示すれば、ライブビュー機能を実現することが可能である。また、画像表示部212は、システム制御回路218の指示により任意に表示をON/OFFすることが可能であり、表示をOFFにした場合には撮影装置201の電力消費を大幅に低減することが出来る。
メモリ213は、撮影した静止画像や動画像を一時的に格納するためのメモリであり、所定枚数の静止画像や所定時間の動画像を格納するのに十分な記憶量を備えている。これにより、複数枚の静止画像を連続して撮影する連写撮影やパノラマ撮影の場合にも、高速かつ大量の画像書き込みをメモリ213に対して行うことが可能となる。また、メモリ213はシステム制御回路218の作業領域としても使用することが可能である。更に、メモリ213は、記録媒体229の書き込み用バッファとしても使われる。
圧縮・伸長回路214は、適応離散コサイン変換等により画像データを圧縮・伸長する回路であり、メモリ213に格納された画像を読み込んで圧縮処理或いは伸長処理を行い、処理を終えたデータをメモリ213に書き込む。
絞り機能を備えるシャッター202は絞りやシャッターを駆動するモータ等の駆動部を有する。露光制御部215は駆動部の動作を制御することにより、絞り機能を備えるシャッター202を制御する。撮影レンズ203はレンズを駆動するモータなどの駆動部を有する。測距制御部216は撮影レンズ203の駆動部を制御してフォーカシングを制御する。また、ズーム制御部217は撮影レンズ203の駆動部を制御してズーミングを制御する。なお、実施形態においては、撮影レンズ203は、交換可能であるものする。
露光制御部215、測距制御部216はTTL方式を用いた制御を行う。これらの制御は、システム制御回路218が行う。つまり、システム制御部218は、撮像して得た画像データに対する画像処理回路207によって演算した演算結果に基づき、露光制御部215、測距制御部216に対する制御を行う。
システム制御回路218は、撮影装置201全体を制御する回路である。システム制御回路218は、不揮発性メモリ220に記録されたプログラムを実行することで、後述する各実施形態の処理を実現する。
メモリ219は、システム制御回路218の動作用の定数、変数、並びに、不揮発性メモリ220から読み出したプログラム等を展開するメモリであり、メモリ213よりもアクセス速度が早いメモリである。典型的にはメモリ213はDRAM、メモリ219はSRAMである。不揮発性メモリ220は電気的に消去・記録可能なメモリである。不揮発性メモリ220には、システム制御回路218の動作用の定数、プログラム等が記憶される。ここでいう、プログラムとは、後述の各実施形態における各種フローチャートを実行するためのプログラムのことである。
シャッタースイッチSW221、SW222、及び、操作部223は、システム制御回路218の各種の動作指示を入力するための操作部であり、スイッチやダイアル、タッチパネル、音声認識装置等の単数或いは複数の組み合わせで構成される。ここで、これらの操作部の具体的な説明を行う。シャッタースイッチSW221は、シャッターボタンの操作途中でONとなり、AF(オートフォーカス)処理、AE(自動露出)処理、AWB(オートホワイトバランス)処理等の動作開始を指示する。シャッタースイッチSW222は、シャッターボタンの操作完了でONとなる。このシャッタースイッチSW222がONになると、システム制御部218は、撮像素子204からの映像信号をA/D変換器205でデジタルの画像データに変換し、その画像データをメモリ制御回路208を介してメモリ213に画像データを書き込む露光処理を行う。同時に、システム制御部218は、必要に応じて不図示のEF(フラッシュ発光)処理の開始を指示する。また、システム制御部218は、画像処理回路207やメモリ制御回路208での演算を用いた現像処理を行わせる。また、システム制御部218は、メモリ213から画像データを読み出し、圧縮・伸長回路214で圧縮を行い、記録媒体229に画像データを書き込む記録処理という一連の処理を行う。また動画撮影の場合、システム制御部218は、各種回路に動画撮影の開始・停止を指示することになる。
操作部223は各種ボタンやタッチパネル等から構成される。ボタンの種類としては、メニューボタン、セットボタン、マクロボタン、マルチ画面再生改ページボタン、フラッシュ設定ボタン、単写/連写/セルフタイマー切り替えボタン、メニュー移動+(プラス)ボタン、メニュー移動−(マイナス)ボタンが含まれる。また、再生画像移動+(プラス)ボタン、再生画像−(マイナス)ボタン、撮影画質選択ボタン、露出補正ボタン、日付/時間設定ボタン。各種機能の選択及び切り替えを設定する選択/切り替えボタン、各種機能の決定及び実行を設定する決定ボタンが含まれる。また、画像表示部212のON/OFFを設定する表示ボタンも含まれる。撮影直後に撮影した画像データを自動再生するクイックレビュー機能を設定するクイックレビューON/OFFスイッチも含まれる。更に、撮影時にズームと広角を調節や、再生時の画像の拡大/縮小を調節、1画面表示/マルチ画面表示を切り替えるズーム操作部も操作部223に含まれる。更に、JPEG圧縮の圧縮率を選択するため、或いは撮像素子の信号をそのままデジタル化して記録媒体に記録するCCDRAWモードを選択するための圧縮モードスイッチも含まれる。
電源制御部225は、電池の装着の有無、電池の種類、電池残量の検出を行い、検出結果及びシステム制御回路218の指示に基づいて、必要な電圧を必要な期間、記録媒体を含む各部へ供給する。
電源部228は、アルカリ電池やリチウム電池等の一次電池やNiCd電池やNiMH電池、Li電池等の二次電池、ACアダプター等からなる。電源制御部225と電源部228とは、それぞれの電極226、227を介して互いに接続される。
インタフェース224はメモリカードやハードディスク等の記録媒体とのインタフェースである。インタフェース224としては、SDカードやコンパクトフラッシュ(登録商標)カード等の規格に準拠したものを用いて構成して構わない。さらに、インタフェース224に各種通信カードを接続することにより、他機器との間で画像データや画像データに付属した管理情報を転送し合うことが出来る。
保護部231は、装置の電源に連動し、電源OFF時に撮影装置201のレンズ203を含む撮像部を覆う事により、撮像部の汚れや破損を防止するバリアとして機能する。
マイクユニット232は、マイクからの音声データ取得部である。音声処理回路233は、マイクユニット232で得られた音声データをシステム制御回路218で取得するためにA/D変換を行う。また、ステレオマイクユニット232は、2ch以上のマイクユニットであるが、実施形態では簡単のため、2ch(ステレオ)マイクであるものとして説明する。
スピーカユニット234は、スピーカからの音声データへの音声データ出力部である。システム制御回路218は、処理された音声データを音声処理回路233にてD/A変換させ、スピーカユニット234に出力させることで、音声を再生させることになる。
記録媒体229はメモリカードやハードディスク等の記録媒体である。また、この記録媒体229がPCMCIAカードやコンパクトフラッシュ(登録商標)カード等の場合は、性能が記されている情報記憶回路を内蔵している事もある。
姿勢検知部236は、撮影装置201の傾きや回転を検知して該装置姿勢を示す姿勢情報を出力する。加速度検出部237は、装置の3軸方向の移動量に対する加速度を導出し、該加速度情報を出力する。
以上、実施形態における撮像装置201の構造と処理/機能の説明を行った。
次に、図1、3、4を用いて実施形態における駆動雑音の除去処理を詳細に説明する。ここで言う、駆動雑音とは、測距制御部216により撮影レンズ203のフォーカシング制御を行った際に生じる駆動系が発する雑音を指す。
はじめに、図1を用いて適応フィルタ(Adaptive Filter)の構成と適応フィルタ処理を説明する。図1は、適応フィルタの構成をブロック図で示している。この適応フィルタは、図2における、メモリ219にあらかじめ記録された不図示のプログラムにより実施される一連の演算処理でもある。不図示のプログラムをシステム制御回路218がメモリ219から読出し、音声処理回路233を介して入力された音声データに対し逐次実行する。この適応フィルタの構成および演算処理について詳述する。
適応フィルタは、2つの入力A、Bを持ち、入力Bからのデータに対して積和演算を行うトランスバーサルフィルタ回路101と、適応アルゴリズムによる評価関数に基づきトランスバーサルフィルタ回路101が利用する係数を更新する評価部103と、トランスバーサルフィルタ回路101の出力と入力Aを加算する加算器102とを備えている。
一般的に、入力A側を所望信号、入力B側を参照信号、出力側を所望信号と呼ぶ。適応フィルタを雑音除去部として用いる場合、所望信号には除去対象となる雑音源から発生する音声信号を、参照信号には観測したい音声信号に前記雑音が付加された音声信号をそれぞれ印加し、出力信号として雑音の除去された音声信号を得る。
トランスバーサルフィルタ回路101は、入力Bより得られた参照信号x(t)を遅延する不図示の複数の遅延素子と、x(t)及び遅延した各信号x(t−1)、x(t−2)に対して評価部103が評価関数に従って設定した係数h0(t)、h1(t)、h2(t)を乗算する複数の乗算器と、該乗算器の出力を加算して推定信号y(t)を出力する複数の加算器とを備えている。この時、tは時間を表す単位であり、x(t)は、時系列の音声デジタルデータxにおけるt番目のサンプルを表す。
推定信号y(t)は、次式で与えられる。mは係数の個数、Nは自然数を示し、適応フィルタが係数としてh0(t)、h1(t)、h2(t)をもつ場合、m=2、N=3となる。
Figure 0006912969
また、所望信号d(t)から推定信号y(t)を減算する減算器102を備え、減算器の出力である推定信号y(t)と所望信号d(t)の差である誤差信号e(t)が0に近づくように評価関数103によって、トランスバーサルフィルタ回路101の係数を更新する。
係数更新のアルゴリズムとしては、最小平均自乗(LeastMeanSquare:LMS)アルゴリズムが、従来から広く用いられている。このアルゴリズムでは、誤差信号e(t)の平均自乗誤差E[e(t)2]を最小化するように係数の更新が行われる。あらかじめ設定していた係数h0(t)、h1(t)、h2(t)を更新し、h0(t+1)、h1(t+1)、h2(t+1)の導出を行う。
次式に係数更新の一例であるLMSアルゴリズムを示す。
Figure 0006912969
この数式内のμは、ステップサイズと呼ばれ、係数更新の大きさを決める役割を持つ。通常、一定値を用い、0.05〜0.10程度の値を使用する。撮影装置201の構成に合わせてあらかじめ決めておく事が望ましく、小さくすると正確な推定が可能だが、大きすぎるとフィルタ出力が発散してしまう。
参照信号x(t)には除去したい雑音成分、所望信号d(t)には雑音成分の含まれる音声信号を入力する。上記一連の処理を繰り返す事で、誤差信号e(t)を0に近づける、即ち雑音の除去を行う事が可能となる。
また、FFTなどと異なり、まとまった時系列の音声データを使うことなく、1サンプルの音声データ毎に処理を行う事ができる為、該処理による遅延は発生しない。
上記を踏まえ、実施形態における雑音除去システムを図3のブロック構成図を参照して説明する。
図3は実施形態における雑音除去システムの主要部のブロック構成図である。
マイクユニット232は、ステレオマイクを構成するLチャネルマイク232a、及び、Rチャネルマイク202bを有する。A/D変換部301は、Lチャネルマイク232aで得られたアナログ音声信号をデジタルデータに変換する。A/D変換部302は、Rチャネルマイク232bで得られたアナログ音声信号をデジタルデータに変換する。A/D変換部301、302は、共に音声処理回路233に含まれるものである。
Lチャネル雑音除去部310、及び、Rチャネル雑音除去部320は、互いに独立している。そして、Lチャネル雑音除去部310、Rチャネル雑音除去部320は、設定部330から設定されたパラメータに応じた駆動雑音の除去処理(詳細後述)を行い、雑音除去後のL、Rチャネルの音声データを出力する。これらLチャネル雑音除去部310、Rチャネル雑音除去部320、設定部330は、システム制御回路218がメモリ219に格納されたプログラムを実行する実現するものとする。このプログラムは、当初は不揮発性メモリ220に記憶されており、メモリ219に読み出された後に実行されるものである。なお、Lチャネル雑音除去部310、Rチャネル雑音除去部320、設定部330のいずれかをハードウェアにて実現しても構わない。
Lチャネル雑音除去部310、及び、Rチャネル雑音除去部320は共に同じ構成である。そのため、ここでは、Lチャネル雑音除去部310、設定部330について説明する。
Lチャネルマイク232aで収音したアナログ音声信号は、A/D変換部302によりデジタルの音声データに変換され、Lチャネル雑音除去部310に供給される。
Lチャネル雑音除去部310内のBPF(バンドパスフィルタ)311、312、313それぞれは、設定部330により設定されたパラメータ(中心周波数またはピーク周波数)に応じた周波数に制限をかけ、信号の選別を行う。そして、BPF311、312、313それぞれは、帯域濾過後の音声データを加算器314に向けて出力する。加算器314は、適応フィルタ315の入力端子Bに、加算結果の音声データを供給する。また、適応フィルタ315の入力端子Aには、A/D変換部301からのデジタルデータが供給される。適応フィルタ315は、図1に示された構成を同じある。適応フィルタ315は、入力端子Bに入力した音声データを雑音成分データとし、入力端子Aからの音声データから入力端子Bからの雑音成分データを減じて、雑音除去後のLチャネルの音声データとして出力する。
システム制御回路218は、上記のようにしてLチャネル雑音除去部310から得た音声データ、並びに、Rチャネル雑音除去部320から得た音声データの出力を受け、符号化処理等を行い、音声付き動画像データのファイルを記憶媒体230に格納する処理を行うことになる。
本実施形態における撮影装置では、フォーカシング処理のために、搭載されたレンズ203を駆動する駆動部により、特定の周波数(1以上の周波数ピークを持つ)を中心に雑音が生じるものとした。この為、中心周波の帯域毎に分けて一連の処理を行うことで、適応フィルタ処理の収束速度の向上を図る事が可能となる。ただし、レンズ203の種類に応じて、駆動雑音の周波数が異なる。また、レンズ203の駆動速度に応じても、その周波数が異なる。
実施形態では、バンドパスフィルタとしてBPF311、312、313を有する。これは、駆動雑音の周波数ピークが最大3つを想定しているためである。精度を上げるためにBPFの数を更に多くしても構わない。
中心周波数をfcnとした場合、バンドパスフィルタの伝達関数は、次式で表せる。
Figure 0006912969
図4(a)はレンズの駆動により発生する駆動雑音の周波数分布の一例を示している。あるレンズでは、図示のように、レンズを駆動させることにより発生する駆動雑音は、中心周波数f1、f2、f3の三つのピークを持つ。このうち、中心周波数f1とf2のピークは基準レベル401を超えている。図4(b)は、実施形態における駆動雑音除去テーブル群を示している。このテーブル群は、不揮発性メモリ220に記憶され、テーブル群を構成する1つのテーブルは、1つの種類のレンズに対応する。本装置に電源が投入された際、設定部330(システム制御回路218)は、レンズ203の種類を特定し、その種類に応じて駆動雑音除去テーブル群の1つを選択する。
1つのテーブルには、駆動スピード(pps)ごとに、3つのBPFに設定する中心周波数(もしくは中心周波数を特定する情報)が格納されている。1つのテーブルに格納されているBPFの中心周波数は、テーブルに対応するレンズを、対応した駆動速度で駆動した際に発生する駆動雑音に含まれるピークの中心周波数に対応する。レンズの種類の特定法は周知の技術であり、特に問わない。実施形態では、シリアル通信でレンズ内の制御部と通信してレンズの種類(モデル名)を特定するものとする。設定部330は、特定したレンズ203の種類に従って選択したテーブルを参照し、そのレンズ203を駆動する際の駆動速度に応じた中心周波数f1、f2、f3を選択テーブルから読み出し、BPF311、312、313それぞれに設定する。この結果、BPF312、312、313は、それぞれの中心周波数から予め設定された範囲の駆動雑音を通過(濾波)させ、それ以外の周波数帯域の信号を減衰させる。加算器314は、BPF312、312、313からの音声データ(駆動雑音)を合成し、接続されたレンズ203に固有の合成駆動雑音データを生成し、適応フィルタ315に供給する。なお、レンズによっては、駆動時の雑音のピークが2つの場合もある。その場合、テーブルには、3つ周波数のうちの2つはそのピークの中心周波数が格納され、残りの1つはゼロが格納されているものとする。周波数がゼロの場合、該当するBPFは周波数全域を非通過として機能するものとする。
撮影装置201の電源投入後、撮影が可能になるまでの準備動作時等において、システム制御回路218は接続されたレンズユニットと通信を行い、そのレンズの型式を取得し、不揮発性メモリ220から該設定値郡から該当するレンズユニットの設定値の選択を行う。その後、システム制御回路218は、レンズ203を駆動する直前に、駆動速度に対応した中心周波数をそれぞれ読出し、BPF304、306、308へ設定を行う。これにより、BPF304、306、308は、搭載したレンズに応じた雑音の中心周波数を通過域とする周波数特性を持ったバンドパスフィルタを構成できることになる。
図5は、実施形態における雑音除去に係るシステム制御回路218の処理手順を示すフローチャートである。同フローチャートに係るプログラムは、当初は不揮発性メモリ220に格納されており、システム制御部218がメモリ219に読み出し実行されることになる。
まず、ステップS501において、システム制御回路218は、接続されてるレンズ203の種類を判定する。そして、ステップS502にて、システム制御回路218は、レンズ203の種類に基づき、不揮発性メモリ220を参照して、雑音除去テーブルの1つを選択する。
次に、ステップS503にて、システム制御回路218は、撮像装置201のフォーカシング処理のためのレンズの駆動速度を決定する。この駆動速度は、ユーザが操作部223を介して設定した撮像装置201の動作モードに応じて決定するものとする。そして、ステップS504にて、システム制御回路218は、選択したテーブルから、設定された駆動速度に応じた駆動雑音帯域を特定する中心周波数f1、f2、f3を読み出し、それぞれをLチャネル雑音除去部310、Rチャネル雑音除去部320それぞれの3つのBPFに設定する。
この後、ユーザによる撮影記録指示が操作部223を介して入力された場合、ステップS505にて、システム制御回路218は各種部を制御し、撮像処理と集音処理とを実行する。集音処理では、図3で説明した構成により、L,R両チャネルの駆動雑音除去後の音声データが有れる。
そして、ステップS506にて、システム制御回路218は音声付動画像データファイルとして、記憶媒体229への記録を行う。
以上説明したように本実施形態によれば、レンズ203の駆動前に、レンズ203固有の駆動雑音を検出するための周波数帯域のパラメータを読み出し、設定することで、適応処理の収束速度の改善、駆動部により異なる伝搬特性差を吸収した雑音除去を行う事が可能になる。また、実施形態では、駆動雑音をフォーカシングレンズの駆動に起因するものとして説明したが、ズームレンズの駆動に起因する雑音としても良いし、それら両方であっても構わない。
(その他の実施例)
本発明は、上述の実施形態の1以上の機能を実現するプログラムを、ネットワーク又は記憶媒体を介してシステム又は装置に供給し、そのシステム又は装置のコンピュータにおける1つ以上のプロセッサーがプログラムを読出し実行する処理でも実現可能である。また、1以上の機能を実現する回路(例えば、ASIC)によっても実現可能である。
201…撮像装置、218…システム制御回路、232…マイクユニット、233…音声処理回路、301、302…A/D変換部、310…Lチャネル雑音除去部、311、312、313…BPF(バンドパスフィルタ)、314…加算器、315…適応フィルタ、320…Rチャネル雑音除去部、330…設定部

Claims (6)

  1. 音声処理装置であって、
    音声データを取得するためのマイクと、
    駆動部と、
    前記駆動部による駆動に起因する複数のピーク周波数を含む駆動雑音を、前記マイクより得られた音声データから除去する雑音除去手段とを有し、
    前記雑音除去手段は、
    前記複数のピーク周波数それぞれが設定され、当該ピーク周波数を挟む予め設定された範囲の音声データを通過させるための複数のバンドパスフィルタと、
    前記複数のバンドパスフィルタで得られた音声データを加算し、当該加算して得られた音声データを雑音データとして出力する加算手段と、
    前記マイクにより得られた音声データと、前記加算手段による加算で得られた雑音データとに基づき、前記音声データから前記雑音データを除去する適応フィルタ処理を行う適応フィルタ手段とを含む
    ことを特徴とする音声処理装置。
  2. 更に、
    レンズユニットを交換可能な撮像手段と、
    交換可能なレンズユニットの種類に固有の駆動雑音の周波数分布を表す情報を記憶する記憶手段と、
    接続されたレンズユニットの種類を判定する判定手段と、
    前記判定手段による判定の結果に応じた情報を前記記憶手段より読み出し、前記雑音除去手段が有する複数のバンドパスフィルタに設定する制御手段と
    を有することを特徴とする請求項1に記載の音声処理装置。
  3. 前記記憶手段は、更に、レンズユニットの駆動速度ごとの駆動雑音の周波数分布を表す情報を記憶し、
    前記制御手段は、接続されたレンズユニットの種類と駆動速度に応じて、通過させる中心周波数を前記複数のバンドパスフィルタに設定する
    ことを特徴とする請求項2に記載の音声処理装置。
  4. 前記雑音除去手段はステレオマイクの両チャネルに独立して設けられることを特徴とする請求項1乃至3のいずれか1項に記載の音声処理装置。
  5. 駆動部とマイクとを有する音声処理装置の制御方法であって、
    前記駆動部による駆動に起因する複数のピーク周波数を含む駆動雑音を、前記マイクより得られた音声データから除去する雑音除去工程とを有し、
    当該雑音除去工程は、
    前記複数のピーク周波数それぞれが設定され、当該ピーク周波数を挟む予め設定された範囲の音声データを通過させるための複数のバンドパスフィルタ工程と、
    前記複数のバンドパスフィルタ工程で得られた音声データを加算し、当該加算して得られた音声データを雑音データとして出力する加算工程と、
    前記マイクにより得られた音声データと、前記加算工程による加算で得られた雑音データとに基づき、前記音声データから前記雑音データを除去する適応フィルタ処理を行う適応フィルタ工程とを含む
    ことを特徴とする音声処理装置の制御方法。
  6. 駆動部とマイクとを有する音声処理装置におけるプロセッサが読み込み実行することで、前記プロセッサに請求項5に記載の各工程を実行させるためのプログラム。
JP2017157617A 2017-08-17 2017-08-17 音声処理装置及びその制御方法 Active JP6912969B2 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2017157617A JP6912969B2 (ja) 2017-08-17 2017-08-17 音声処理装置及びその制御方法
US16/058,268 US10418049B2 (en) 2017-08-17 2018-08-08 Audio processing apparatus and control method thereof

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2017157617A JP6912969B2 (ja) 2017-08-17 2017-08-17 音声処理装置及びその制御方法

Publications (3)

Publication Number Publication Date
JP2019035875A JP2019035875A (ja) 2019-03-07
JP2019035875A5 JP2019035875A5 (ja) 2020-08-27
JP6912969B2 true JP6912969B2 (ja) 2021-08-04

Family

ID=65637834

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2017157617A Active JP6912969B2 (ja) 2017-08-17 2017-08-17 音声処理装置及びその制御方法

Country Status (1)

Country Link
JP (1) JP6912969B2 (ja)

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4542396B2 (ja) * 2004-08-27 2010-09-15 オリンパス株式会社 録音装置
US20080309786A1 (en) * 2007-06-15 2008-12-18 Texas Instruments Incorporated Method and apparatus for image processing
JP2010193053A (ja) * 2009-02-17 2010-09-02 Ricoh Co Ltd 撮像装置及びノイズ低減方法
JP2011077604A (ja) * 2009-09-29 2011-04-14 Sony Corp ノイズ除去装置、レンズ装置、撮像装置、ノイズ除去方法

Also Published As

Publication number Publication date
JP2019035875A (ja) 2019-03-07

Similar Documents

Publication Publication Date Title
JP5594133B2 (ja) 音声信号処理装置、音声信号処理方法及びプログラム
JP4035543B2 (ja) 撮像装置
JP5806623B2 (ja) 撮像装置、撮像方法およびプログラム
JP2005260970A (ja) 複合撮影装置及びそれを利用したdscレンズ制御方法
JP5741281B2 (ja) 音声信号処理装置、撮像装置、音声信号処理方法、プログラム及び記録媒体
JP6610725B2 (ja) 音処理装置および音処理プログラム
JP2007081732A (ja) 撮像装置
US10418049B2 (en) Audio processing apparatus and control method thereof
JP2016019161A (ja) 撮像装置
US8760552B2 (en) Shooting apparatus
JP6912969B2 (ja) 音声処理装置及びその制御方法
JP2010193053A (ja) 撮像装置及びノイズ低減方法
JP6902961B2 (ja) 音声処理装置及びその制御方法
JP5836578B2 (ja) 撮像装置、撮像装置の制御方法及びプログラム
JP2007019593A (ja) 輪郭強調信号生成回路、画像信号処理装置、撮像装置、輪郭強調信号生成方法、プログラム
US20120060614A1 (en) Image sensing device
US11729548B2 (en) Audio processing apparatus, control method, and storage medium, each for performing noise reduction using audio signals input from plurality of microphones
JP2009296143A (ja) 撮像装置
JP5736839B2 (ja) 信号処理装置、撮像装置、及びプログラム
JP7171376B2 (ja) 撮像装置、撮像装置の制御方法、およびプログラム
JP5004876B2 (ja) 撮像装置
JP5455295B2 (ja) 撮像装置およびその制御方法およびプログラムおよび記録媒体
JP2007201735A (ja) 撮像装置及びその制御方法
JP2006217111A (ja) 動画撮影装置、及び動画撮影方法
JP5754058B2 (ja) 撮影機器

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20200713

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20200713

RD01 Notification of change of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7421

Effective date: 20210103

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20210113

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20210413

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20210611

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20210709

R151 Written notification of patent or utility model registration

Ref document number: 6912969

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R151