JP2012168345A - 機械音除去装置、機械音検出装置、及び、映像撮像装置 - Google Patents

機械音除去装置、機械音検出装置、及び、映像撮像装置 Download PDF

Info

Publication number
JP2012168345A
JP2012168345A JP2011029282A JP2011029282A JP2012168345A JP 2012168345 A JP2012168345 A JP 2012168345A JP 2011029282 A JP2011029282 A JP 2011029282A JP 2011029282 A JP2011029282 A JP 2011029282A JP 2012168345 A JP2012168345 A JP 2012168345A
Authority
JP
Japan
Prior art keywords
signal
sound
mechanical sound
mechanical
unit
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2011029282A
Other languages
English (en)
Inventor
Masato Togami
真人 戸上
Yohei Kawaguchi
洋平 川口
Hiroaki Kokubo
浩明 小窪
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Ltd
Original Assignee
Hitachi Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Ltd filed Critical Hitachi Ltd
Priority to JP2011029282A priority Critical patent/JP2012168345A/ja
Publication of JP2012168345A publication Critical patent/JP2012168345A/ja
Pending legal-status Critical Current

Links

Abstract


【課題】 マイクホン入力信号からのオートフォーカス音やズーム音など機械音の高精度な除去が困難であった。
【解決手段】 本発明では、オートフォーカス音やズーム音といった機械音が,主にモータの回転周期によって決まる一定周期でスペクトルが変動する周期性の雑音であることに着目し、周期性の強い音源を検出することを特徴とする機械音検出部し検出した音源を機械音として記録することにより、事前に雑音測定・設定を行うことなく機械音除去が可能とする。
【選択図】 図4

Description

本発明は複数の音が混ざった中から,特定の音を除去した音声を生成することを特徴とする雑音除去装置の技術分野に属する
複数の音が混ざった中から,特定の音(雑音)だけを除去し,所望の音声を抽出することを目的とした技術は,大きく単一マイクロホンを用いた方法と複数マイクロホンを用いた方法に分けられる。複数マイクロホンを用いた方法は,空間的に異なる場所に存在する音源を抑圧することが可能な技術であり,無線などの分野でよく使われる指向性アンテナと同じく適応型ビームフォーミングを用いて雑音を除去する。複数マイクロホンを用いた方法は,雑音除去性能は高いものの,ハードウェアとして複数のマイクロホンを必要とする点で搭載コスト(設置面積,価格)が高い。これに対して単一マイクロホンを用いた方法は,単一マイクロホンのみ必要とするため搭載コストは低いという利点があるものの,常に音量が一定の雑音のみを消去する技術(例えば非特許文献1参照)か,予めスペクトル特性が既知の雑音(例えば特許文献1参照)を差し引く技術が主である。
特開2008−252389号公報
S.F. Boll, "Suppression of acoustic noise in speech using spectral subtraction," IEEE Trans. ASSP, vol.27, no.2, pp.113-120,1979.
ビデオカメラや携帯電話などのように,カメラユニットと音声録音装置を備える筐体において,動画撮影時に混入するカメラのオートフォーカス音やズーム音といった雑音(機械音)を除去し,所望の音声のみを抽出するような場合では、オートフォーカス音やズーム音は時々刻々音量の大小が変化する雑音であるため、これらの雑音を音量が一定の雑音のみを消去する技術では消去することが困難である。
また事前にオートフォーカス音やズーム音を記憶しておく方式では,工場出荷時に事前に雑音を測定し,設定しておく必要があるという点で手間・コストがかかるという問題がある。
本発明では、オートフォーカス音やズーム音といった機械音が,主にモーターの回転周期によって決まる一定周期で繰り返し発生する音であることに着目する。つまり、本発明における機械音除去装置は、入力された音を信号に変換する入力部と、入力信号から、入力信号中に含まれる一定周期で繰り返し発生する音の信号に基づいて、機械音と推定される機械音信号を検出する機械音検出部と、検出された機械音信号を入力信号中から除去する機械音除去部と、を有する。
また、本発明における機械音検出装置は、入力された音を信号に変換する入力部と、入力信号から、入力信号中に含まれる一定周期で繰り返し発生する音の信号に基づいて、機械音と推定される機械音信号を検出する機械音検出部と、検出された機械音信号の情報を記憶する記憶部と、を有する。
また、本発明における映像撮像装置は、入力された音を信号に変換する入力部と、入力信号から、オートフォーカス又はズームの際に映像装置から生ずる駆動音の信号を、入力信号中に含まれる一定周期で繰り返し発生する音の信号に基づいて検出する駆動音検出部と、検出された駆動音信号を入力信号中から除去する駆動音除去部と、を有する。
また、機械音(駆動音)と推定される機械音信号を検出するに際し、入力信号中に含まれる一定周期で繰り返し発生する音の信号に加えて、入力信号中に含まれる一定周期で繰り返し発生する音のスペクトル形状の時不変性に基づいて、機械音と推定される機械音信号を検出してもよい。
また、本発明において、更に、前記信号から検出された前記機械音信号の情報を記憶する記憶部と、該記憶部に記憶された前記機械音信号の情報に基づいて、前記入力部から入力された信号中に前記機械音信号が存在するかを判定する機械音判定部とを有し、前記機械音除去部は、前記機械音(駆動音)判定部により存在すると判定された前記機械音信号を前記信号中から除去してもよい。
また、本発明において、前記機械音除去部によって前記機械音信号が除去された前記信号の情報を記憶する記憶部を有いてもよい。
また、前記機械音(駆動音)検出部は、所定の時間周期から構成されるマスクパターンを前記信号に重畳し、重畳して得られた重畳信号の音量と前記信号の音量との比率に基づいて、機械音と推定される前記機械音信号を検出してもよい。
また、前記機械音(駆動音)判定部は、前記記憶部から、前記信号とのパワースペクトルの内積が最大となる機械音信号の情報を選択し、該選択された機械音信号を前記信号中に含まれる機械音信号として判定し、前記機械音除去部は、該判定された機械音信号を前記信号中から除去してもよい。
また、前記機械音(駆動音)検出部は、前記信号中に含まれる一定周期で繰り返し発生する音の音量と、前記信号中に含まれる一定周期で繰り返し発生する音以外の音量との比率に基づいて、機械音(駆動音)と推定される前記機械音信号を検出してもよい。
事前(例えば、工場出荷時)に雑音測定・設定を行うことなく機械音(雑音)除去が可能となり、ビデオカメラや携帯電話の動画撮影時に収録した音声を、機械音(雑音)の少ない聞きやすい音声として聞くことができる。
本発明のビデオカメラでの使用シーンを示した図 機械音波形とスペクトルの一例を示した図 本発明の第一実施例のハードウェア構成図 本発明の第一実施例のブロック図 本発明の機械音検出部の詳細なブロック図 本発明の簡易型機械音判定部のブロック図 本発明の機械音除去部のブロック図 各機械音の情報を記憶する機械音データベースのデータ構造 機械音除去の効果を示した図 外部から機械音発生シグナルが与えられたときのブロック構成図 機械音除去の処理フローチャート図 バッチ構成で機械音除去しその音を再生する際の構成図 本発明の第二実施例のハードウェア構成を示した図 本発明の第二実施例のブロック構成図
図1は,本発明が対象とする動画撮影状況の一例を示した図である。ビデオカメラでは,ビデオカメラ筐体101にマイクロホン102が取りつけられ,動画撮影中の音声(ここで音声は、広く一般的な音のことを指し、人の声のみではなく、機械音等の雑音も含むものである。以下同じである。)が録音される。この際,ビデオカメラのカメラノーズ103がオートフォーカス機能又はズーム機能と連動して伸び縮みすることにより,マイクロホンにモーターの駆動音が混入する。通常動画撮影時にはカメラで撮影中の被写体の声だけを取りたいことが多く,このような駆動音は除去したい対象の音となる。
図2にモーターの駆動音の一例を示す。上段は,モーター駆動音の波形を示している。横軸は時間(秒),縦軸は周波数(Hz)となっている。一定の周期(時間間隔)でモーター音が発生していることがわかる。下段は,モーター駆動音のスペクトルを示している。縦軸は周波数(Hz)となっている。スペクトルが波形と同様に一定周期で繰り返す構造となっている事と,スペクトル形状自体は波形と類似していることが分かる。
図3は,本発明の第一実施例のハードウェア構成を示した図である。マイクロホン301で取り込んだ音声波形は,AD/DA変換装置302で,アナログ信号からデジタル信号に変換されて,中央演算装置303を介して,揮発性メモリ304に取り込まれる。取り込んだ信号は,記憶媒体305に記憶されている信号処理プログラムにより,中央演算装置303上で処理され,雑音除去される。雑音除去後の音声波形は,記憶媒体305に記憶されるか,AD/DA変換装置302を介し,デジタル信号からアナログ信号に変換された後,スピーカ306から放射される。
図4は,機械音除去の信号処理プログラムのブロック構成を示した図である。音声取り込み部401は,マイクロホンから入力される音声信号を時々刻々デジタルデータに変換したデジタル信号を取り込む。デジタル信号の取り込みは、1サンプル毎に行っても良いし,複数サンプルまとめて取り込んでも良い。音声バッファリング部402は,取り込んだデジタル信号に変換された音声信号を揮発性メモリ(バッファ)内に蓄える。音声信号を蓄えるバッファは、先入れ先出し方式のバッファとし,バッファ長は予め設定しておく。すなわち、音声バッファリング部402は,最新の音声信号からある一定時間遡った音声信号を全て記憶しておくことになる。新しい音声サンプルがLsサンプル(サンプル同士の時間間隔は,サンプリングレートの逆数秒)溜まるたびに,機械音検出部403は,バッファリングした音声信号中に含まれる機械音の量とそれ以外の音声信号の量を算出し,機械音の量がそれ以外の信号の量と比べて十分に大きい場合,機械音データベース404に,検出した機械音を登録する。または,すでに機械音データベース404に類似の機械音が登録されている場合,すでに登録されている機械音の情報に新しく検出した機械音の情報を追加して記憶する。機械音検出部403では、モーターの動作に応じて同一スペクトル構造の音が繰り返し生じるような機械音を対象とする。
簡易型音声バッファリング部405は,音声バッファリング部402と同様に,音声取り込み部401が取り込んだ音声信号をある一定時間揮発性メモリ内に取り溜める。新しい音声サンプルがLsサンプル溜まるたびに,簡易型機械音判定部406は,取り溜めた音声信号中に機械音が存在するかを判定する。判定は,機械音データベース404に記憶されている機械音の情報を参照する形で行われる。簡易型機械音判定部は,判定結果を出力する。機械音除去部407は,判定結果と,機械音データベース404から引き出された、存在すると判定された機械音に関する情報とを利用し,簡易型音声バッファリング部405が出力する音声信号中の機械音を除去する。機械音を除去した音声が最終的には出力される。機械音検出部,簡易型機械音判定部,機械音除去部の詳細については後述する。
図5は,機械音検出部403の詳細なブロック構成を示した図である。機械音検出部403の入力は,一定長の音声信号x(t)とする。ここで,x(t)は,バッファ中のデジタル化されたtサンプル目の音圧値とする。tは1からLまでの値を取るものとし,Lはバッファ長と一致する。バッファリングされた音声信号は,短時間周波数分析部509に送られ,短時間フーリエ変換により,時間周波数領域信号に変換される。ここで,短時間周波数分析の窓長をLfとし,短時間周波数分析のフレームシフト長をLsとする。ここで,F=floor((L-Lf)/Ls)+1とする。floor(x)は,x以下の最大の整数を返すインデックスとする。Fは,バッファリングした音声サンプルから生成する短時間周波数信号のフレーム数に一致する。短時間周波数分析後の音声信号をx(f,τ)と表記する。ここで,fは短時間周波数分析により離散化された周波数,τはフレームインデックスとする。τは1からFまでの値を取るものとする。
繰り返しマスク重畳部502−1から502−Nは,Fフレームの短時間周波数信号x(f,τ)に予め定めるマスクを重畳した信号を抽出する。マスクはMn(τ)と定義される。ここで,nは1からNまでの値をとるインデックスとし,τはフレームインデックスとする。Mn(τ)は機械音の繰り返し周期及び位相に合わせて設計する。具体的にはMn(τ)=δ(mod(τ―s,K)=0)とする。ここで,δ(x)はxが真であれば1,偽であれば0を返す論理関数とする。mod(x,y)は、xをyで割った余りを返す関数とする。Kは、繰り返し周期,sは位相とする。sは0からK-1までの値とする。Kは1からFまでの値に設定する。機械音を発生させるモーターの回転数に応じて,Kを限定しても良い。設定するKとsの組み合わせによりマスクの数Nを決めるものとする。
Mn(τ)に合致する周期及び位相の機械音は,
で定義されるCが1に近い値となると考えられる。しかし,音声信号も繰り返し構造を持つことから,Cでは,音声信号と機械音の区別をつけることは困難である。音声信号はピッチ周波数によって決まる周期で決まる繰り返し構造を持つが,時間毎のスペクトルは,音韻によって決まる構造を持つ。音声信号の音韻はダイナミックに変化するため,音声信号は繰り返し構造を持つ一方で,時変のスペクトル形状を持つ信号となる。これに対して,機械音は,繰り返し構造を持つことに加え,スペクトル形状が筐体の振動モードにより決まる時不変な形状となるため,時不変のスペクトル形状を持つ信号となると考えられる。本発明ではこのことを利用し,機械音の繰り返し構造に加えて,時不変性を評価する尺度
で定義されるDを使って機械音判別を行う。ここで,A(f)は
で定義される平均スペクトルである。時変のスペクトル形状を持つ信号の場合,時間毎の機械音スペクトルとA(f)との間には乖離があると考えられる。したがってDは0より大きい値をとる。これに対して,時不変のスペクトル形状を持つ信号の場合,時間毎の機械音スペクトルとA(f)との間には乖離が少なく,Dは0に近い値をとる。またDの算出において,
及び
のように関数gを導入しても良い。例えば,gを対数関数に設定することにより,対数スペクトル距離を評価尺度として用いることができる。gは逆関数g-1が定義されているものとする。対象とする機械音の性質に応じて切り替えて用いることが望ましい。
繰り返しマスク重畳部502−1から502−Nは,マスク毎にDと平均スペクトルA(f)を算出して出力する。最小マスク判定部503では,各マスク重畳部で算出したDのうち最小の値をとるDとその最小値を与えるマスクのインデックスを算出する。ここで,最小のDをDmin,最小値を与えるマスクのインデックスをnminとする。またnminに対応する平均スペクトルA(f)もあわせて出力する。マスク閾値判定部504は,Dminが予め定める閾値以下かどうかを判定し判定結果と平均スペクトルA(f)を出力する。仮機械音判定506は,Dminが予め定める閾値以下である場合に機械音が見つかったと判断し,その場合は,仮機械音データベース505に登録されている仮の機械音スペクトルと見つかった機械音のスペクトルとを照らし合わせ,類似の機械音が存在するかどうかを探索する。ここで,仮機械音データベース505に登録されている機械音の数をTとする。それぞれの機械音について,その機械音が検出された回数,及びその機械音の平均スペクトルAt(f),その機械音が最後に検出された時刻の情報が記憶されているものとする。
Dminが予め定める閾値より大きい場合には、機械音が見つからなかったとみなし、その場合は何も処理を行わず、機械音の平均スペクトルを出力しない。機械音が見つかった場合は,仮機械音ごとに,入力信号から得られた機械音スペクトルとの距離Et=|A(f)-At(f)|^2を算出する。Etが最小となるような仮機械音(インデックスをtminとする)を算出し,距離Etが予め定める閾値以下であれば,tminの仮機械音が発生したと判断し、その仮機械音の平均スペクトルを
で更新するとともに,その仮機械音の検出回数Utminを1インクリメントする。またその機械音が最後に検出された時刻を現在の時刻に設定する。検出回数Utminが予め定める閾値を越えた場合、機械音データベース404に存在するR個の各機械音(インデックスをr,平均スペクトルをAr(f)と表記する)とtminに相当する仮機械音との間の距離Er=|Ar(f)-Atmin(f)|^2の距離が最小となる機械音を算出する。その距離が予め定める閾値以下である場合,その機械音のスペクトルとtminに相当する仮機械音スペクトルの重みつき平均を新しい機械音スペクトルとし,機械音データベース404の情報を更新する。重みつき係数は予め定める。また,距離Erが予め定める閾値より大きい場合,仮機械音を新しい機械音とみなして,機械音データベース404に登録する。その後、見つかった仮機械音を仮機械音データベース505から削除し終了する。
機械音データベース404のデータ構造を図8に示す。機械音毎にその機械音の周波数毎の音量が記載されているような構造となる。距離Etが予め定める閾値より大きい場合は,新しい仮機械音が発生したと判断し,A(f)を仮機械音データベース505に登録する。登録された機械音の数がTからT+1に増加する。また登録する機械音の検出回数を1,最後に検出された時刻を現在の時刻に設定する。この場合,真の機械音が見つかったことを表すフラグ及び真の機械音の平均スペクトルを出力しない。
図6は,簡易型機械音判定部601のブロック構成を示した図である。入力は,一定長の音声信号x(t)とする。ここで,x(t)は,バッファ中のデジタル化されたtサンプル目の音圧値とする。tは1からLまでの値を取るものとし,Lはバッファ長と一致する。
バッファリングされた音声信号は,サブバンド化部602に送られ,短時間フーリエ変換により,時間周波数領域信号に変換される。ここで,短時間周波数分析の窓長をLfとし,短時間周波数分析のフレームシフト長をLsとする。ここで,F=floor((L-Lf)/Ls)+1とする。floor(x)は,x以下の最大の整数を返すインデックスとする。Fは,バッファリングした音声サンプルから生成する短時間周波数信号のフレーム数に一致する。短時間周波数分析後の音声信号をx(f,τ)と表記する。ここで,fは短時間周波数分析により離散化された周波数,τはフレームインデックスとする。τは1からFまでの値を取るものとする。
サブバンド化部602では,短時間フーリエ変換後の離散化した周波数の集合を,K個のサブバンドに分割する。サブバンド化は,各サブバンドに含まれる周波数の範囲が等しくなるように分割しても良いし,周波数の範囲の対数値が等しくなるように分割しても良い。後者は人間の聴覚特性と対応し,機械音除去後の音声が聞きやすい音声になることが期待できる。最小内積機械音算出部603−1からKまでは,サブバンド毎に機械音データベース404に記憶されている機械音情報を読み込み,入力信号と比較する。ここで,機械音データベース404に登録されている機械音の数をRとし,k番目のサブバンドを構成する周波数範囲をfs(k)からfe(k)とする。機械音r毎に
で内積値I(r,k,τ)を算出する。K,フレーム毎にI(r,k,τ)を最大とするようなrを算出し,その値をrmax(k,τ)とする。I(rmax(k),k,τ)とrmax(k,τ)を出力して処理を終了する。
図7は,機械音除去部407の詳細ブロック構成を示した図である。入力は,一定長の音声信号x(t)とする。ここで,x(t)は,バッファ中のデジタル化されたtサンプル目の音圧値とする。tは1からLまでの値を取るものとし,Lはバッファ長と一致する。バッファリングされた音声信号は,周波数分析部706に送られ,短時間フーリエ変換により,時間周波数領域信号に変換される。ここで,短時間周波数分析の窓長をLfとし,短時間周波数分析のフレームシフト長をLsとする。ここで,F=floor((L-Lf)/Ls)+1とする。floor(x)は,x以下の最大の整数を返すインデックスとする。Fは,バッファリングした音声サンプルから生成する短時間周波数信号のフレーム数に一致する。短時間周波数分析後の音声信号をx(f,τ)と表記する。ここで,fは短時間周波数分析により離散化された周波数,τはフレームインデックスとする。τは1からFまでの値を取るものとする。
非線形抑圧ゲイン算出部702−1からKは,簡易型機械音判定部が出力するサブバンド毎のI(rmax(k),k,τ)とrmax(k,τ)から雑音除去用の雑音信号N(f,τ)を
で算出する。ここで,zは入力信号に対して単調増加な関数とする。入力が0の時にz=0,1の時に1となるような任意の関数(例えば1次関数またはシグモイド関数)を用いることができる。
周波数毎目的音量算出部703では,時間周波数毎のマイクロホン入力信号中の目的音量S(f)を
で推定する。ウィナーゲイン算出部704では,周波数毎に雑音抑圧用のゲイン関数w(f)を
で推定する。ここで,μは雑音抑圧量を制御するためのパラメータである。μが大きい程雑音抑圧量は大きくなるが,出力音声の歪みも大きくなる。ウィナーゲイン算出704は、w(f,τ)を出力して終了する。ウィナーゲイン重畳部705は,マイクロホン入力信号x(f,τ)にw(f,τ)を重畳し,雑音抑圧後の信号y(f,τ)=w(f,τ)x(f,τ)を得る。
図9に機械音除去前後のスペクトル例を示す。上段が機械音除去前のスペクトルであり,下段が機械音除去後のスペクトルである。高域の繰り返し構造を持った音が機械音であり,機械音除去を行うことで,機械音が除去できていることが分かる。
図10は,外部から機械音の発生シグナルが得られる場合の機械音除去の構成を示した図である。音声取り込み部1001は,マイクロホンから入力される音声信号を時々刻々デジタルデータに変換したデジタル信号を取り込む。デジタル信号の取り込みは、1サンプル毎に行っても良いし,複数サンプルまとめて取り込んでも良い。音声バッファリング部1002は,取り込んだデジタルデータに変換された音声信号を揮発性メモリ(バッファ)内に蓄える。音声信号を蓄えるバッファは、先入れ先出し方式のバッファとし,バッファ長は予め設定しておく。すなわち、音声バッファリング部1002は,最新の音声信号からある一定時間遡った音声信号を全て記憶しておくことになる。
新しい音声サンプルがLsサンプル溜まるたびに,機械音検出部1003は,バッファリングした音声信号中に含まれる機械音の量とそれ以外の音声信号の量を算出し,機械音の量がそれ以外の信号の量と比べて十分に大きい場合,機械音データベース1004に,検出した機械音を登録する。または,すでに機械音データベース1004に類似の機械音が登録されている場合,すでに登録されている機械音の情報に新しく検出した機械音の情報を追加して記憶する。簡易型音声バッファリング部1005は,音声バッファリング部1002と同様に,音声取り込み部401が取り込んだ音声信号をある一定時間揮発性メモリ内に取り溜める。新しい音声サンプルがLsサンプル溜まるたびに,簡易型機械音判定部1006は,取り溜めた音声信号中に機械音が存在するかを判定する。判定は,機械音データベース1004に記憶されている機械音の情報を参照する形で行われる。
簡易型機械音判定部は,判定結果を出力する。機械音除去部1007は,判定結果と,機械音データベース404から引き出された、存在すると判定された機械音に関する情報とを利用し,簡易型音声バッファリング部1005中が出力する音声信号中の機械音を除去する。
本構成の機械音除去部は,外部からの機械音発生シグナルを利用してウィナーフィルタの抑圧係数を変更する点が前述した機械音除去部の構成と異なる。具体的には機械音除去部のウィナーゲイン算出及びウィナーフィルタ重畳において図11に示す処理フローが加わる。ウィナーゲイン算出1101では、
に基づきウィナーフィルタのゲインを算出する。その後、外部からの機械音発生シグナルがあるかどうかを確認し(1102),無い場合にはウィナーフィルタゲインw(f)を全ての周波数において1にする。発生シグナルがある場合は,ウィナーフィルタゲインw(f)の変更は行わない。その後、ウィナーゲイン重畳1104で入力信号にウィナーゲインを重畳して雑音抑圧後の信号を得て終了する。
図12は,予め取り溜めた音声中の機械音を除去する構成を示している。本構成はユーザーが後処理で機械音除去を行うかどうかを切り替えることができ,機械音が大きい時間帯のみ機械音を強く除去するなどの制御を行うことが出来る。音声取り込み部1201では,複数ポイントの音声信号をAD変換装置から取り込み,音声記憶部1202では,記憶媒体上の音声データベース1203に取り込んだ音声波形を逐次記憶していく。同時に機械音検出部1204で機械音検出処理を行い、検出した機械音を機械音データベース1205に書き込んでいく。機械音除去部1206はユーザーリクエストのあった時間帯の音声波形を音声データベース1203から読み出し機械音除去処理を実行する。音声再生部1207では,機械音除去後の音声信号をAD・DA変換装置を介しスピーカから放射する。
図13は本発明を機械の異常音検出に応用した実施例のハードウェア構成を示した図である。マイクロホン1301で取り込んだアナログの音声信号は,AD/DA変換装置1302を介し,アナログ信号からデジタル信号に変換されて,中央演算装置1303を経由して揮発性メモリ1304に取り込まれる。記憶媒体1305に書き込まれたプログラムを中央演算装置1303がロードし,異常検出処理を施した後,検出結果をネットワーク1306を経由してサーバーに送信する。
図14は機械の異常音検出装置のソフトウェアのブロック構成を示した図である。音声取り込み部1401で取り込んだ音声波形は音声バッファリング部1402に送られ複数ポイント溜められる。複数ポイントデータが溜まる毎に機械音検出部1403にデータが送られ機械音検出処理が施される。検出された機械音は機械音データベース1404に書き込まれる。一方,平行して簡易型音声バッファリング部1405も複数ポイントの音声波形を読み込み,一定量溜まるごとに,簡易型機械音判定部1406でその音声信号中に機械音が存在するかどうか判定する。機械音が存在する場合,異常検出部1407では,前述の機械音除去部と同様の方法で機械音を除去した信号を取り出した後,その信号の音量が予め定める値以上か以下かを判定する。予め定める値以上の場合,何か異常な音が発生したと判断しその判断結果を出力する。それ以外のケースは,異常な音が発生していないと判断しその判断結果を出力する。
101…ビデオカメラ筐体、102…マイクロホン、103…カメラノーズ、301…マイクロホン、302…AD/DA変換装置、303…中央演算装置、304…揮発性メモリ、305…記憶媒体、401…音声取り込み部、402…音声バッファリング部、403…機械音検出部、404…機械音データベース、405…簡易型音声バッファリング部、406…簡易型機械音判定部、407…機械音除去部、501…機械音検出部、502…繰り返しマスク重畳部、503…最小マスク判定部、504…マスク閾値判定部、505…仮機械音データベース、506…仮機械音判定登録処理部、507…機械音データベース、509…短時間周波数分析部、601…簡易型機械音判定部、602…サブバンド化、603…最小内積機械音算出、604…機械音データベース、701…機械音除去部、702…雑音量算出、703…周波数毎目的音量算出、704…ウィナーゲイン算出、705…ウィナーゲイン重畳、706…周波数分析部、1001…音声取り込み部、1002…音声バッファリング部、1003…機械音検出部、1004…機械音データベース、1005…簡易型音声バッファリング部、1006…簡易型機械音判定部、1007…機械音除去部、1101…ウィナーゲイン算出、1103…ウィナーゲインを1にする、1104…ウィナーゲイン重畳、1201…音声取り込み部、1202…音声記憶部、1203…音声データベース、1204…機械音検出部、1205…機械音データベース、1206…機械音除去部、1207…音声再生部、1301…マイクロホン、1302…AD/DA変換装置、1303…中央演算装置、1304…揮発性メモリ、1305…記憶媒体、1306…ネットワーク、1401…音声取り込み部、1402…音声バッファリング部、1403…機械音検出部、1405…簡易型音声バッファリング部、1406…簡易型機械音

Claims (16)

  1. 入力された音を信号に変換する入力部と、
    前記信号から、前記信号中に含まれる一定周期で繰り返し発生する音の信号に基づいて、機械音と推定される機械音信号を検出する機械音検出部と、
    検出された前記機械音信号を前記信号中から除去する機械音除去部と、を有することを特徴とする機械音除去装置。
  2. 請求項1に記載の機械音除去装置であって、
    前記信号から検出された前記機械音信号の情報を記憶する記憶部と、
    該記憶部に記憶された前記機械音信号の情報に基づいて、前記入力部から入力された信号中に前記機械音信号が存在するかを判定する機械音判定部と、を有し、
    前記機械音除去部は、前記機械音判定部により存在すると判定された前記機械音信号を前記信号中から除去することを特徴とする機械音除去装置。
  3. 請求項1に記載の機械音除去装置であって、
    前記機械音除去部によって前記機械音信号が除去された前記信号の情報を記憶する記憶部を有することを特徴とする機械音除去装置。
  4. 請求項1に記載の機械音除去装置であって、
    前記機械音検出部は、所定の時間周期から構成されるマスクパターンを前記信号に重畳し、重畳して得られた重畳信号の音量と前記信号の音量との比率に基づいて、機械音と推定される前記機械音信号を検出することを特徴とする機械音除去装置。
  5. 請求項1に記載の機械音除去装置であって、
    前記機械音検出部は、前記信号中に含まれる一定周期で繰り返し発生する音のスペクトル形状の定常性に基づいて、機械音と推定される前記機械音信号を検出することを特徴とする機械音除去装置。
  6. 請求項2に記載の機械音除去装置であって、
    前記機械音判定部は、前記記憶部から、前記信号とのパワースペクトルの内積が最大となる機械音信号の情報を選択し、該選択された機械音信号を前記信号中に含まれる機械音信号として判定し、
    前記機械音除去部は、該判定された機械音信号を前記信号中から除去することを特徴とする機械音除去装置。
  7. 請求項1に記載の機械音除去装置であって、
    前記機械音検出部は、前記信号中に含まれる一定周期で繰り返し発生する音の音量と、 前記信号中に含まれる一定周期で繰り返し発生する音以外の音量との比率に基づいて、機械音と推定される前記機械音信号を検出することを特徴とする機械音除去装置。
  8. 入力された音を信号に変換する入力部と、
    前記信号から、前記信号中に含まれる一定周期で繰り返し発生する音の信号に基づいて、機械音と推定される機械音信号を検出する機械音検出部と、
    検出された前記機械音信号の情報を記憶する記憶部と、を有することを特徴とする機械音検出装置。
  9. 請求項8に記載の機械音検出装置であって、
    前記記憶部に記憶された機械音信号の変化を、前記機械音検出部によって検出された機械音信号に基づいて検出することを特徴とする機械音検出装置。
  10. 請求項8に記載の機械音検出装置であって、
    前記機械音検出部は、所定の時間周期から構成されるマスクパターンを前記信号に重畳し、重畳して得られた重畳信号の音量と前記信号の音量との比率に基づいて、機械音と推定される前記機械音信号を検出することを特徴とする機械音検出装置。
  11. 請求項8に記載の機械音検出装置であって、
    前記機械音検出部は、前記信号中に含まれる一定周期で繰り返し発生する音のスペクトル形状の定常性に基づいて、機械音と推定される前記機械音信号を検出することを特徴とする機械音検出装置。
  12. 映像を撮像する映像撮像装置において、
    入力された音を信号に変換する入力部と、
    前記信号から、オートフォーカス又はズームの際に前記映像装置から生ずる駆動音の信号を、前記信号中に含まれる一定周期で繰り返し発生する音の信号に基づいて検出する駆動音検出部と、
    検出された前記駆動音信号を前記信号中から除去する駆動音除去部と、を有することを特徴とする映像撮像装置。
  13. 請求項12に記載の映像撮像装置であって、
    前記信号から検出された前記駆動音信号の情報を記憶する記憶部と、
    該記憶部に記憶された前記駆動音信号の情報に基づいて、前記入力部から入力された信号中に前記駆動音信号が存在するかを判定する駆動音判定部と、を有し、
    前記駆動音除去部は、前記駆動音判定部により存在すると判定された前記駆動音信号を前記信号中から除去することを特徴とする映像撮像装置。
  14. 請求項12に記載の映像撮像装置であって、
    前記駆動音除去部によって前記駆動音信号が除去された前記信号の情報を記憶する記憶部を有することを特徴とする映像撮像装置。
  15. 請求項12に記載の映像撮像装置であって、
    前記駆動音検出部は、所定の時間周期から構成されるマスクパターンを前記信号に重畳し、重畳して得られた重畳信号の音量と前記信号の音量との比率に基づいて、駆動音と推定される前記駆動音信号を検出することを特徴とする映像撮像装置。
  16. 請求項12に記載の映像撮像装置であって、
    前記駆動音検出部は、前記信号中に含まれる一定周期で繰り返し発生する音のスペクトル形状の定常性に基づいて、駆動音と推定される前記駆動音信号を検出することを特徴とする映像撮像装置。
JP2011029282A 2011-02-15 2011-02-15 機械音除去装置、機械音検出装置、及び、映像撮像装置 Pending JP2012168345A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2011029282A JP2012168345A (ja) 2011-02-15 2011-02-15 機械音除去装置、機械音検出装置、及び、映像撮像装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2011029282A JP2012168345A (ja) 2011-02-15 2011-02-15 機械音除去装置、機械音検出装置、及び、映像撮像装置

Publications (1)

Publication Number Publication Date
JP2012168345A true JP2012168345A (ja) 2012-09-06

Family

ID=46972564

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2011029282A Pending JP2012168345A (ja) 2011-02-15 2011-02-15 機械音除去装置、機械音検出装置、及び、映像撮像装置

Country Status (1)

Country Link
JP (1) JP2012168345A (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2016180833A (ja) * 2015-03-24 2016-10-13 株式会社Jvcケンウッド 雑音低減装置、雑音低減方法及びプログラム
JP2020031270A (ja) * 2018-08-20 2020-02-27 キヤノン株式会社 撮像装置、撮像装置の制御方法、プログラムおよび撮像システム

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2016180833A (ja) * 2015-03-24 2016-10-13 株式会社Jvcケンウッド 雑音低減装置、雑音低減方法及びプログラム
JP2020031270A (ja) * 2018-08-20 2020-02-27 キヤノン株式会社 撮像装置、撮像装置の制御方法、プログラムおよび撮像システム
JP7237488B2 (ja) 2018-08-20 2023-03-13 キヤノン株式会社 撮像装置、撮像装置の制御方法、プログラムおよび撮像システム

Similar Documents

Publication Publication Date Title
JP5998603B2 (ja) 音検出装置、音検出方法、音特徴量検出装置、音特徴量検出方法、音区間検出装置、音区間検出方法およびプログラム
JPH09212196A (ja) 雑音抑圧装置
EP2463856B1 (en) Method to reduce artifacts in algorithms with fast-varying gain
EP2881948A1 (en) Spectral comb voice activity detection
JP5382745B2 (ja) 雑音除去装置及び雑音除去方法
JP5027127B2 (ja) 背景雑音に応じてバイブレータの動作を制御することによる移動通信装置の音声了解度の向上
JP2019079050A (ja) 高調波ノイズ源からのノイズを抑制する方法及び装置
JP6160519B2 (ja) 雑音低減装置
JP4630956B2 (ja) ハウリング周波数成分強調方法およびその装置、ハウリング検出方法およびその装置、ハウリング抑圧方法およびその装置、ピーク周波数成分強調方法およびその装置
CN107452398B (zh) 回声获取方法、电子设备及计算机可读存储介质
JP2016042613A (ja) 目的音声区間検出装置、目的音声区間検出方法、目的音声区間検出プログラム、音声信号処理装置及びサーバ
JP2011077604A (ja) ノイズ除去装置、レンズ装置、撮像装置、ノイズ除去方法
CN106797517B (zh) 用于净化音频信号的多耳mmse分析技术
JP2012168345A (ja) 機械音除去装置、機械音検出装置、及び、映像撮像装置
JP4891805B2 (ja) 残響除去装置、残響除去方法、残響除去プログラム、記録媒体
KR20220098747A (ko) 지수 정규화를 통한 오디오 신호의 핑거프린팅 방법 및 장치
JP4505597B2 (ja) 雑音除去装置
JP2007067549A (ja) 収音装置とその方法とそのプログラムとその記録媒体
JP5887087B2 (ja) 雑音低減処理装置および雑音低減処理方法
JP2013250449A (ja) ノイズ低減装置、撮像装置及びプログラム
CN112235679A (zh) 适用于耳机的信号均衡方法、处理器及耳机
JP6597062B2 (ja) 雑音低減装置、雑音低減方法、雑音低減プログラム
JP5327735B2 (ja) 信号再生装置
JP2016158072A (ja) 集音装置、音声処理方法、および音声処理プログラム
JP2013178458A (ja) 信号処理装置及び信号処理プログラム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20130627

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20140117

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20140204

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20140402

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20150127