JP6528679B2 - 信号処理装置、信号処理方法および信号処理プログラム - Google Patents

信号処理装置、信号処理方法および信号処理プログラム Download PDF

Info

Publication number
JP6528679B2
JP6528679B2 JP2015504258A JP2015504258A JP6528679B2 JP 6528679 B2 JP6528679 B2 JP 6528679B2 JP 2015504258 A JP2015504258 A JP 2015504258A JP 2015504258 A JP2015504258 A JP 2015504258A JP 6528679 B2 JP6528679 B2 JP 6528679B2
Authority
JP
Japan
Prior art keywords
signal
phase
amplitude
unit
sudden change
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2015504258A
Other languages
English (en)
Other versions
JPWO2014136629A1 (ja
Inventor
昭彦 杉山
昭彦 杉山
良次 宮原
良次 宮原
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Publication of JPWO2014136629A1 publication Critical patent/JPWO2014136629A1/ja
Application granted granted Critical
Publication of JP6528679B2 publication Critical patent/JP6528679B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/48Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use
    • G10L25/51Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for comparison or discrimination
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61BDIAGNOSIS; SURGERY; IDENTIFICATION
    • A61B5/00Measuring for diagnostic purposes; Identification of persons
    • A61B5/02Detecting, measuring or recording pulse, heart rate, blood pressure or blood flow; Combined pulse/heart-rate/blood pressure determination; Evaluating a cardiovascular condition not otherwise provided for, e.g. using combinations of techniques provided for in this group with electrocardiography or electroauscultation; Heart catheters for measuring blood pressure
    • A61B5/024Detecting, measuring or recording pulse rate or heart rate
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61BDIAGNOSIS; SURGERY; IDENTIFICATION
    • A61B5/00Measuring for diagnostic purposes; Identification of persons
    • A61B5/72Signal processing specially adapted for physiological signals or for diagnostic purposes
    • A61B5/7203Signal processing specially adapted for physiological signals or for diagnostic purposes for noise prevention, reduction or removal
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61BDIAGNOSIS; SURGERY; IDENTIFICATION
    • A61B5/00Measuring for diagnostic purposes; Identification of persons
    • A61B5/72Signal processing specially adapted for physiological signals or for diagnostic purposes
    • A61B5/7235Details of waveform analysis
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • G10L21/0216Noise filtering characterised by the method used for estimating noise
    • G10L21/0232Processing in the frequency domain
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61BDIAGNOSIS; SURGERY; IDENTIFICATION
    • A61B5/00Measuring for diagnostic purposes; Identification of persons
    • A61B5/0002Remote monitoring of patients using telemetry, e.g. transmission of vital signals via a communication network
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61BDIAGNOSIS; SURGERY; IDENTIFICATION
    • A61B5/00Measuring for diagnostic purposes; Identification of persons
    • A61B5/24Detecting, measuring or recording bioelectric or biomagnetic signals of the body or parts thereof
    • A61B5/316Modalities, i.e. specific diagnostic methods
    • A61B5/318Heart-related electrical modalities, e.g. electrocardiography [ECG]
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/03Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
    • G10L25/18Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters the extracted parameters being spectral information of each sub-band

Landscapes

  • Health & Medical Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Physics & Mathematics (AREA)
  • Signal Processing (AREA)
  • Molecular Biology (AREA)
  • Public Health (AREA)
  • Physiology (AREA)
  • Veterinary Medicine (AREA)
  • Biophysics (AREA)
  • Pathology (AREA)
  • Biomedical Technology (AREA)
  • Heart & Thoracic Surgery (AREA)
  • Medical Informatics (AREA)
  • General Health & Medical Sciences (AREA)
  • Surgery (AREA)
  • Animal Behavior & Ethology (AREA)
  • Acoustics & Sound (AREA)
  • Computational Linguistics (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Multimedia (AREA)
  • Cardiology (AREA)
  • Psychiatry (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Artificial Intelligence (AREA)
  • Quality & Reliability (AREA)
  • Soundproofing, Sound Blocking, And Sound Damping (AREA)
  • Noise Elimination (AREA)
  • Measurement Of Mechanical Vibrations Or Ultrasonic Waves (AREA)

Description

本発明は、信号の変化を検出する技術に関する。
上記技術分野において、特許文献1には、位相成分の時間方向の連続性を評価し、周波数ごとの振幅成分を平滑化する技術が開示されている(段落0135〜0138)。特許文献2には、位相の時間方向変動量を計測することで、周波数急変を検出する記載がある。特許文献3には、段落0024に、「パルス性ノイズが重畳されたことに伴った複素平面上におけるI、Q信号の複素ベクトルの位相変化を常時監視することによって、強電界環境下でのパルス性ノイズを確実に検出する」と記載されている。この位相変化は、時間軸に沿ったものである。また、特許文献4の段落0031には、「位相直線化部25は、直線化により、極座標変換部24から入力された位相信号θのとびを直して、その結果の位相信号θ'を位相検出部26へ出力する」と記載がある。また、特許文献4の段落0051には、位相傾検出手段について記載があり、段落0040には、「図5には、位相検出部26の入出力信号(入力信号である位相θ'、出力信号である位相傾dθ')の一例を示してある」と記載されている。特許文献4の段落0031には、「位相直線化部25は、直線化により、極座標変換部24から入力された位相信号θのとびを直して、その結果の位相信号θ'を位相検出部26へ出力する」と記載がある。特許文献5には、振幅を用いた衝撃音の検出技術が開示されている。
特開2010-237703号公報 特開2011-254122号公報 特開2007-251908号公報 特開2011-199808号公報 WO2008/111462
M. Kato, A. Sugiyama, and M. Serizawa, "Noise suppression with high speech quality based on weighted noise estimation and MMSE STSA," IEICE Trans. Fundamentals (Japanese Edition), vol.J87-A, no.7, pp.851-860, July 2004. R. Martin, "Spectral subtraction based on minimum statistics," EUSPICO-94, pp.1182-1185, Sept. 1994 「ディジタル記録媒体のための動画信号および付随する音響信号の1.5 Mbit/s符号化−第3部 音響」、日本工業規格 JIS X 4323、99ページ、1996年11月。 A. D. Cheveigne and H. Kawahara, "YIN, a fundamental frequency estimator for speech and music," J. Acoustic Soc. Amer., vol. 111, no. 4, pp.1917-1930 J. L. Flanagan et al., "Speech Coding," IEEE Transactions on Communications, Vol. 27, no. 4, April 1979. A. Subramanya et al., "Automatic removal of typed keystrokes from speech signals," IEEE Signal Processing Letters, Vol. 14, No. 5, pp.363-366, May 2007. J. Murphy et al., "Joint Baysian removal of impulse and background noise," IEEE Proceedings of ICASSP, pp.261-264, May 2011. R. Talmon et al., "Transient noise reduction useing nonlocal diffusion filters," IEEE Transactions on Audio, Speech, and Language Processing, Vol. 19, No. 6, pp.1584-1599, Jun. 2011.
しかしながら、上述の先行技術文献に記載の技術の中で、特許文献1および4は、入力信号の急変を検出する技術ではない。また、特許文献2では、「周波数」の急変を検出しようとするものであり、特許文献3では、AM信号の位相の時間変化を用いてパルス性ノイズを検出しようとするものである。特許文献5は、振幅のみを用いた衝撃音の検出技術であり、ロバスト性に不足があった。すなわち、これらの文献に記載の技術では、信号の急変を効果的に検出できなかった。
本発明の目的は、上述の課題を解決する技術を提供することにある。
上記目的を達成するため、本発明に係る装置は、
入力信号を、周波数領域における位相成分信号および振幅成分信号に変換する変換手段と、
前記位相成分信号および前記振幅成分信号の特徴量を計算する計算手段と、
前記計算手段によって計算された前記特徴量に基づいて前記入力信号の急変に関する存在可能性を判定する判定手段と、
を備え
前記計算手段は、前記位相成分信号から、各周波数の位相変化(φn=θn−θn-1)を求め、該位相変化の差(φn−φn-1)を回転角とする回転ベクトルcos(φn−φn-1)+jsin(φn−φn-1)の大きさを前記特徴量として求める
上記目的を達成するため、本発明に係る他の装置は、
入力信号を、周波数領域における位相成分信号に変換する変換手段と、
前記入力信号の急増部の位置に基づいて、第1位相傾きを算出する第1算出手段と、
周波数領域における前記位相成分信号の第2位相傾きを算出する第2算出手段と、
前記第1位相傾きと前記第2位相傾きに基づいて前記入力信号の急変に関する存在可能性を判定する判定手段と、
を備えたことを特徴とする。
上記目的を達成するため、本発明に係るさらに他の装置は、
入力信号を、周波数領域における位相成分信号に変換する変換手段と、
前記入力信号に含まれる時間相関のある成分を前記入力信号から除いて低相関信号を生成する生成手段と、
前記低相関信号と前記位相成分信号とに基づいて、前記入力信号に含まれる急変の存在可能性を判定する判定手段と、
を備えたことを特徴とする。
上記目的を達成するため、本発明に係る方法は、
入力信号を、周波数領域における位相成分信号に変換し、
前記入力信号の急増部の位置に基づいて、第1位相傾きを算出し、
周波数領域における前記位相成分信号の第2位相傾きを算出し、
前記第1位相傾きと前記第2位相傾きとに基づいて前記入力信号の急変の存在可能性を判定する、
各ステップを含むことを特徴とする信号処理方法である。
上記目的を達成するため、本発明に係る他の方法は、
入力信号を、周波数領域における位相成分信号に変換し、
前記入力信号に含まれる時間相関のある成分を前記入力信号から除いて低相関信号を生成し、
前記低相関信号と前記位相成分信号とに基づいて、前記入力信号に含まれる急変の存在可能性を判定する、
各ステップを含むことを特徴とする信号処理方法である。
上記目的を達成するため、本発明に係るプログラムは、
入力信号を、周波数領域における位相成分信号に変換し、前記入力信号の急増部の位置に基づいて、第1位相傾きを算出し、
周波数領域における前記位相成分信号の第2位相傾きを算出し、
前記第1位相傾きと前記第2位相傾きとに基づいて前記入力信号の急変の存在可能性を判定する、各ステップをコンピュータに実行させることを特徴とする信号処理プログラムである。
上記目的を達成するため、本発明に係るプログラムは、
入力信号を、周波数領域における位相成分信号に変換し、
前記入力信号に含まれる時間相関のある成分を前記入力信号から除いて低相関信号を生成し、
前記低相関信号と前記位相成分信号とに基づいて、前記入力信号に含まれる急変の存在可能性を判定する、各ステップをコンピュータに実行させることを特徴とする信号処理プログラムである。
本発明によれば、信号の急変を効果的に検出できる。
本発明の第1実施形態に係る信号処理装置の構成を示すブロック図である。 本発明の第2実施形態に係る雑音抑圧装置の構成を示すブロック図である。 本発明の第2実施形態に係る変換部の構成を示すブロック図である。 本発明の第2実施形態に係る逆変換部の構成を示すブロック図である。 本発明の第2実施形態に係る位相制御部および振幅制御部の構成を示すブロック図である。 本発明の第2実施形態に係る位相制御部の動作を説明する図である。 本発明の第2実施形態に係る位相制御部の動作を説明する図である。 本発明の第2実施形態に係る位相制御部の動作を説明する図である。 本発明の第2実施形態に係る位相制御部の動作を説明する図である。 本発明の第2実施形態に係る位相制御部の動作を説明する図である。 本発明の第2実施形態に係る位相制御部の動作を説明する図である。 本発明の第2実施形態に係る計算部および急変判定部の構成を説明する図である。 本発明の第2実施形態に係る計算部の処理を説明する図である。 本発明の第2実施形態に係る雑音抑圧装置のハードウェア構成を示すブロック図である。 本発明の第2実施形態に係る雑音抑圧装置の処理の流れを説明するフローチャートである。 本発明の第3実施形態に係る雑音抑圧装置の構成を示すブロック図である。 本発明の第3実施形態に係る位相制御部および振幅制御部の構成を示すブロック図である。 本発明の第4実施形態に係る位相制御部および振幅制御部の構成を示すブロック図である。 本発明の第4実施形態に係る雑音抑圧装置の処理の流れを説明するフローチャートである。 本発明の第5実施形態にかかる適用例を説明する図である。 本発明の第5実施形態にかかる適用例を説明する図である。 本発明の第6実施形態に係る信号処理装置の構成を示すブロック図である。 本発明の第7実施形態に係る雑音抑圧装置の構成を示すブロック図である。 本発明の第7実施形態に係る変換部の構成を示すブロック図である。 本発明の第7実施形態に係る逆変換部の構成を示すブロック図である。 本発明の第7実施形態に係る位相制御部および振幅制御部の構成を示すブロック図である。 本発明の第7実施形態に係る算出部および急変判定部の構成を説明する図である。 本発明の第7実施形態に係る算出部の処理を説明する図である。 本発明の第7実施形態に係る雑音抑圧装置のハードウェア構成を示すブロック図である。 本発明の第7実施形態に係る雑音抑圧装置の処理の流れを説明するフローチャートである。 本発明の第7実施形態に係る雑音抑圧装置の処理の流れを説明するフローチャートである。 本発明の第7実施形態に係る雑音抑圧装置の処理の流れを説明するフローチャートである。 本発明の第8実施形態に係る変換部の構成を示すブロック図である。 本発明の第9実施形態に係る雑音抑圧装置の構成を示すブロック図である。 本発明の第10実施形態にかかる適用例を説明する図である。 本発明の第10実施形態にかかる適用例を説明する図である。 本発明の第11実施形態に係る信号処理装置の構成を示すブロック図である。 本発明の第12実施形態に係る雑音抑圧装置の構成を示すブロック図である。 本発明の第13実施形態に係る雑音抑圧装置の構成を示すブロック図である。 本発明の第13実施形態に係る相関除去部の構成の一例を示すブロック図である。 本発明の第13実施形態に係る相関除去部の構成の他の例を示すブロック図である。 本発明の第13実施形態に係る変換部の構成を示すブロック図である。 本発明の第13実施形態に係る逆変換部の構成を示すブロック図である。 本発明の第13実施形態に係る位相制御部および振幅制御部の構成を示すブロック図である。 本発明の第13実施形態に係る算出部および急変判定部の構成を説明する図である。 本発明の第13実施形態に係る算出部の処理を説明する図である。 本発明の第13実施形態に係る雑音抑圧装置のハードウェア構成を示すブロック図である。 本発明の第13実施形態に係る雑音抑圧装置の処理の流れを説明するフローチャートである。 本発明の第13実施形態に係る雑音抑圧装置の処理の流れを説明するフローチャートである。 本発明の第13実施形態に係る雑音抑圧装置の処理の流れを説明するフローチャートである。 本発明の第14実施形態に係る雑音抑圧装置の構成を示すブロック図である。 本発明の第15実施形態に係る雑音抑圧装置の構成を示すブロック図である。 本発明の第16実施形態に係る信号処理装置の構成を示すブロック図である。 本発明の第17実施形態に係る雑音抑圧装置の構成を示すブロック図である。 本発明の第17実施形態に係る変換部の構成を示すブロック図である。 本発明の第17実施形態に係る逆変換部の構成を示すブロック図である。 本発明の第17実施形態に係る位相制御部および振幅制御部の構成を示すブロック図である。 本発明の第17実施形態に係る直線性計算部および急変判定部の構成を説明する図である。 本発明の第17実施形態に係る直線性計算部の処理を説明する図である。 本発明の第17実施形態に係る雑音抑圧装置のハードウェア構成を示すブロック図である。 本発明の第17実施形態に係る雑音抑圧装置の処理の流れを説明するフローチャートである。 本発明の第18実施形態に係る雑音抑圧装置の構成を示すブロック図である。 本発明の第18実施形態に係る位相制御部および振幅制御部の構成を示すブロック図である。 本発明の第19実施形態に係る位相制御部および振幅制御部の構成を示すブロック図である。 本発明の第19実施形態に係る雑音抑圧装置の処理の流れを説明するフローチャートである。 本発明の第20実施形態にかかる適用例を説明する図である。 本発明の第20実施形態にかかる適用例を説明する図である。 本発明の第21実施形態にかかる適用例を説明する図である。 本発明の第21実施形態にかかる適用例を説明する図である。
以下に、図面を参照して、本発明の実施の形態について例示的に詳しく説明する。ただし、以下の実施の形態に記載されている構成要素はあくまで例示であり、本発明の技術範囲をそれらのみに限定する趣旨のものではない。なお、以下の説明中における「音声信号」とは、音声その他の音響に従って生ずる直接的の電気的変化であって、音声その他の音響を伝送するためのものをいい、音声に限定されない。
[第1実施形態]
本発明の第1実施形態としての信号処理装置100について、図1を用いて説明する。信号処理装置100は、入力信号急変を検出するための装置である。
図1に示すように、信号処理装置100は、変換部101と計算部102と信号急変判定部103とを含む。変換部101は、入力信号110を、周波数領域における位相成分信号120および振幅成分信号130に変換する。計算部102は、位相成分信号120および振幅成分信号130の変化を計算する。信号急変判定部103は、計算された変化に基づいて入力信号の急変を判定する。
以上の構成により、周波数領域における位相成分信号と振幅成分信号との変化に応じて、入力信号の急変を効果的に検出することができる。
[第2実施形態]
《全体構成》
本発明の第2実施形態としての雑音抑圧装置について図2乃至図11を用いて説明する。本実施形態の雑音抑圧装置は、例えばデジタルカメラ、ノートパソコン、携帯電話、キーボード、ゲーム機のコントローラ、携帯電話の押しボタンなどの雑音抑圧に適用できる。すなわち、音声、音楽、環境音などの目的とする信号を、これらに重畳された信号(ノイズまたは妨害信号)に対して強調することができる。ただし、本発明はこれに限定されるものではなく、入力信号からの信号急変検出を要求されるあらゆる信号処理装置に適用可能である。なお、本実施形態では、信号の急変の一例として、衝撃音を検出して抑圧する雑音抑圧装置について説明する。本実施形態としての雑音抑圧装置は、例えば、マイクの近くでボタン押下などの操作がなされるような形態において、かかるボタン操作により発生する衝撃音を適切に抑圧する。簡単に説明すると、衝撃音を含む時間領域信号を周波数領域信号に変換し、周波数空間における位相成分および振幅成分の変化を算出する。そして、それらの変化の組合せに応じて、衝撃音の存在を判定する。
図2は、雑音抑圧装置200の全体構成を示すブロック図である。入力端子206には、劣化信号(所望信号と雑音の混在する信号)が、サンプル値系列として供給される。入力端子206に供給された劣化信号は、変換部201においてフーリエ変換などの変換を施されて複数の周波数成分に分割される。複数の周波数成分は周波数ごとに独立して処理される。ここでは、特定の周波数成分に注目して説明を続ける。周波数成分のうち振幅スペクトル(振幅成分)230は雑音抑圧部205および計算部208へ供給され、位相スペクトル(位相成分)220は位相制御部202および計算部208に供給される。なお、ここでは変換部201が雑音抑圧部205に劣化信号振幅スペクトル230を供給しているが、本発明はこれに限定されるものではなく、振幅スペクトルの二乗に相当するパワースペクトルを雑音抑圧部205に供給してもよい。
雑音抑圧部205は、変換部201から供給される劣化信号振幅スペクトル230を用いて、雑音を推定し、推定雑音スペクトルを生成する。また、雑音抑圧部205は、変換部201から供給された劣化信号振幅スペクトル230と、生成した推定雑音スペクトルとを用いて雑音を抑圧し、雑音抑圧結果としての強調信号振幅スペクトルを振幅制御部203に伝達する。さらに雑音抑圧部205は、急変判定部209から判定結果を入力し、信号の急変の有無またはその程度に応じて、雑音の抑圧の程度を変更する。雑音抑圧部205は目的音検出を用いて目的音を保護する一方、信号急変検出時は振幅を推定背景音に置換してもよい。
位相制御部202は、変換部201から供給された劣化信号位相スペクトル220を回転(シフト)させ、強調信号位相スペクトル240として逆変換部204へ供給する。また、位相の回転量(シフト量)を、振幅制御部203へ伝達する。振幅制御部203は、位相制御部202から位相の回転量(シフト量)を受け取って振幅補正量を算出し、その振幅補正量を用いて、強調信号振幅スペクトルを各周波数で補正し、補正振幅スペクトル250を逆変換部204へ供給する。逆変換部204は、位相制御部202から供給された強調信号位相スペクトル240と、振幅制御部203から供給された補正振幅スペクトル250とを合成して逆変換を行い、強調信号として、出力端子207に供給する。
計算部208は、変換部201から供給された位相成分信号220と振幅成分信号230とを用いて、その周波数領域でのそれぞれの変化を計算する。急変判定部209は、計算部208が計算した変化に基づいて、信号の急変がどの程度存在するか(存在可能性)を周波数点ごとに判定する。
《変換部の構成》
図3は、変換部201の構成を示すブロック図である。図3に示すように、変換部201はフレーム分割部301、窓がけ処理部(windowing unit)302、およびフーリエ変換部303を含む。劣化信号サンプルは、フレーム分割部301に供給され、K/2サンプルごとのフレームに分割される。ここで、Kは偶数とする。フレームに分割された劣化信号サンプルは、窓がけ処理部302に供給され、窓関数(window function)であるw(t)との乗算が行なわれる。第nフレームの入力信号yn(t) (t=0, 1, ..., K/2-1) に対するw(t)で窓がけ(windowing)された信号は、次式(1)で与えられる。
Figure 0006528679
また、連続する2フレームの一部を重ね合わせ(オーバラップ)して窓がけしてもよい。オーバラップ長としてフレーム長の50%を仮定すれば、t=0, 1, ..., K/2-1 に対して、以下の式(2)で得られる左辺が、窓がけ処理部302の出力となる。
Figure 0006528679
実数信号に対しては、左右対称窓関数が用いられる。また、窓関数は、変換部201の出力を逆変換部204に直接供給したときの入力信号と出力信号が計算誤差を除いて一致するように設計される。これは、w2(t)+w2 (t+K/2)=1 となることを意味する。
以後、連続する2フレームの50%をオーバラップして窓がけする場合を例として説明を続ける。w(t)としては、例えば、次式(3)に示すハニング窓を用いることができる。
Figure 0006528679
このほかにも、ハミング窓、三角窓など、様々な窓関数が知られている。窓がけされた出力はフーリエ変換部303に供給され、劣化信号スペクトルYn(k)に変換される。劣化信号スペクトルYn(k)は位相と振幅に分離され、劣化信号位相スペクトル arg Yn(k)は、位相制御部202と計算部208に、劣化信号振幅スペクトル|Yn(k)|は、雑音抑圧部205と計算部208に供給される。既に説明したように、振幅スペクトルの代わりにパワースペクトルを利用することもできる。
《逆変換部の構成》
図4は、逆変換部204の構成を示すブロック図である。図4に示すように、逆変換部204は逆フーリエ変換部401、窓がけ処理部402およびフレーム合成部403を含む。逆フーリエ変換部401は、振幅制御部203から供給された強調信号振幅スペクトル250と位相制御部202から供給された強調信号位相スペクトル240 (arg Xn(k))とを乗算して、強調信号(以下の式(4)の左辺)を求める。
Figure 0006528679
得られた強調信号に逆フーリエ変換を施し、1フレームがKサンプルを含む時間領域サンプル値系列xn(t) (t=0, 1, ..., K-1)として、窓がけ処理部402に供給され、窓関数w(t)との乗算が行なわれる。第nフレームの入力信号xn(t) (t=0, 1, ..., K/2-1)に対してw(t)で窓がけされた信号は、次式(5)の左辺で与えられる。
Figure 0006528679
また、連続する2フレームの一部を重ね合わせ(オーバラップ)して窓がけしてもよい。フレーム長の50%をオーバラップ長として仮定すれば、t=0, 1, ..., K/2-1 に対して、以下の式の左辺が、窓がけ処理部402の出力となり、フレーム合成部403に伝達される。
Figure 0006528679
フレーム合成部403は、窓がけ処理部402からの隣接する2フレームの出力を、K/2サンプルずつ取り出して重ね合わせ、以下の式(7)によって、t=0, 1, ..., K-1における出力信号(式(7)の左辺)を得る。得られた強調音声信号260は、フレーム合成部403から出力端子207に伝達される。
Figure 0006528679
なお、図3と図4において変換部と逆変換部における変換をフーリエ変換として説明したが、フーリエ変換に代えて、アダマール変換、ハール変換、ウェーブレット変換など、他の変換を用いることもできる。ハール変換は、乗算が不要となり、LSI化したときの面積を小さくすることができる。ウェーブレット変換は、周波数によって時間解像度を異なったものに変更できるために、雑音抑圧効果の向上が期待できる。
また、変換部201において得られる周波数成分を複数統合してから、雑音抑圧部205で実際の抑圧を行うこともできる。その際、聴覚特性の弁別能力が高い低周波領域から、能力が低い高周波領域に向かって、よりたくさんの周波数成分を統合することによって、高い音質を達成することができる。このように、複数の周波数成分を統合してから雑音抑圧を実行すると、雑音抑圧を適用する周波数成分の数が少なくなり、全体の演算量を削減することができる。
《雑音抑圧部の構成》
雑音抑圧部205は、変換部201から供給される劣化信号振幅スペクトルを用いて雑音を推定し、推定雑音スペクトルを生成する。そして、変換部201からの劣化信号振幅スペクトルと生成した推定雑音スペクトルとを用いて抑圧係数を求め、劣化信号振幅スペクトルに乗じ、強調信号振幅スペクトルとして、振幅制御部203へ供給する。
また、急変判定部209から、急変がどの程度存在するかの情報(信号の急変が存在する確からしさ、存在可能性)を受けて、信号の急変が存在する可能性に応じて、雑音抑圧の程度を変更することもできる。さらに、信号の急変が存在する可能性を周波数成分、周波数帯域(任意の数の連続する周波数成分を統合したもの)、あるいはフレーム単位で判定し、その急変を抑圧すべく、前記周波数成分、周波数帯域、あるいはフレーム単位で異なった信号処理を施すことができる。
雑音の推定には、非特許文献1や非特許文献2に記載の方法など、様々な推定方法が利用できる。
例えば、非特許文献1には、推定雑音スペクトルを、目的音が発生していないフレームの劣化信号振幅スペクトルの平均値とする方法が開示されている。この方法では目的音の発生を検出する必要がある。目的音の発生している区間は、強調信号のパワーで判断することができる。
理想的な動作状態として、強調信号は雑音以外の目的音となっている。また、目的音や雑音のレベルは、隣接フレーム間で大きく変化しない。これらのことから、1フレーム過去の強調信号レベルを雑音区間判定の指標とする。1フレーム過去の強調信号パワーが一定値以下の時には、現フレームを雑音区間と判定する。雑音スペクトルは、雑音区間と判定されたフレームの劣化信号振幅スペクトルを平均化することで推定できる。
また、非特許文献1には、推定雑音スペクトルを、劣化信号振幅スペクトルが供給され始めた推定初期の平均値とする方法も開示されている。この場合、推定が開始された直後には目的音が含まれないという条件を満たす必要がある。条件が満たされる場合、推定初期の劣化信号振幅スペクトルを推定雑音スペクトルとすることができる。
さらに、非特許文献2には、推定雑音スペクトルを、統計的な劣化信号振幅スペクトルの最小値から求める方法が開示されている。この方法では、統計的に一定時間における劣化信号振幅スペクトルの最小値を保持し、その最小値から雑音スペクトルを推定する。劣化信号振幅スペクトルの最小値は、雑音スペクトルのスペクトル形状と似ているため、雑音スペクトル形状の推定値として用いることができる。しかし、最小値では、本来の雑音レベルより小さくなる。そのため、最小値を適切に増幅させたものを推定雑音スペクトルとして用いる。
雑音抑圧部205においては、様々な抑圧を行うことが可能であるが、代表的なものとして、SS(Spectrum Subtraction:スペクトル減算)法とMMSE STSA(Minimum Mean-Square Error Short-Time Spectral Amplitude Estimator:最小二乗平均誤差短時間振幅スペクトル推定)法とが挙げられる。SS法の場合は、変換部201から供給された劣化信号振幅スペクトルから推定雑音スペクトルを減算する。MMSE STSA法の場合は、変換部201から供給された劣化信号振幅スペクトルと生成した推定雑音スペクトルとを用いて、抑圧係数を計算し、この抑圧係数を劣化信号振幅スペクトルに乗算する。この抑圧係数は、強調信号の平均二乗パワーを最小化するように決定される。
また、雑音抑圧部205は、急変判定部209から急変判定結果(信号の急変が存在するか否かの情報)を入力し、信号の急変の有無またはその程度に応じて、雑音抑圧の程度を変更する。例えば、信号急変のあった周波数成分、周波数帯域、あるいはフレーム単位で、その急変を抑圧すべく信号処理を施すことができる。
急変判定部209で急変と判定されたときには、劣化信号振幅スペクトルと推定雑音スペクトルのうち小さい方を、強調信号振幅スペクトルとして、振幅制御部203へ供給する。すなわち、劣化信号振幅スペクトルが推定雑音スペクトルより小さいときには劣化信号振幅スペクトルをそのまま出力し、それ以外のときには入力信号を推定雑音スペクトルで置き換えて出力することもできる。
さらに、この置き換えに先立って、重要な劣化信号振幅スペクトル成分を検出して、検出された重要な劣化信号振幅スペクトル成分を推定雑音スペクトルによる置き換えの対象から除外することもできる。重要な劣化信号振幅スペクトル成分を検出する際の重要度の指標としては、劣化信号振幅スペクトルの大きさを用いることができる。振幅が大きな成分は目的とする信号の成分である確率が高く、これを保持することは目的とする信号の音質劣化を防止することにつながる。
また、重要度の指標として、劣化信号振幅スペクトルのピーク性を用いることもできる。ピーク、すなわち周波数軸に沿って周辺よりも大きな値を有する劣化信号振幅は、目的とする信号の成分である確率が高く、これを保持することは目的とする信号の音質劣化を防止することにつながる。特に、顕著なピーク、すなわち周辺の振幅値よりも著しく大きな振幅値はその重要度が高いので、確実に保護することで目的とする信号の音質をさらに高めることができる。
ピークの検出は、例えば、非特許文献3の純音成分検出方法や、非特許文献4に、その方法が開示されている。さらに、検出されたピークを所定の条件に従って評価し、条件を満たさないピークは除外してもよい。例えば、前記推定雑音よりも小さな値をとるピークは、目的とする信号である可能性は低い。すなわち、推定雑音を基準として、それよりも十分に大きいものだけをピークとして残し、それ以外を除外することができる。十分に大きいかどうかは推定雑音の定数倍と比較することで、判定できる。このように、検出されたピークが所定の条件を満たすかどうかを評価してから最終的なピーク成分を選択することによって、誤ったピークの検出を低減し、信号急変部の抑圧効果を高くすることができる。
また、急変存在の確からしさに応じて、振幅制御部203へ供給する信号を変化させることもできる。前記置き換えを行った結果と劣化信号振幅スペクトルを、急変存在の確からしさに対応して混合したものを、強調信号振幅スペクトルとして出力する。急変存在の確からしさが高いほど、前記置き換えを行った結果に大きな重みをつけて、前記混合処理を実行する。
雑音抑圧部205は、信号の急変の存在可能性に応じて、抑圧度0、抑圧度1、抑圧度2というように多段で抑圧を行なってもよい。あるいは急変判定部の判定結果(例えば0〜1の数値)に応じて無段階に抑圧の程度を変えてもよい。
《位相制御部および振幅制御部の構成》
図5は位相制御部202および振幅制御部203の構成を示すブロック図である。図5に示すように、位相制御部202は位相回転部501と回転量生成部502とを含み、振幅制御部203は、補正量算出部503と振幅補正部504とを含む。
回転量生成部502は、急変判定部209から「信号の急変が存在する」と判定された周波数成分について、劣化信号位相スペクトルの回転量を生成し、位相回転部501と補正量算出部503に供給する。位相回転部501では、回転量生成部502から回転量が供給されると、変換部201から供給された劣化信号位相スペクトル220を、供給された回転量だけ回転(シフト)させ、強調信号位相スペクトル240として逆変換部204へ供給する。
補正量算出部503では、回転量生成部502から供給される回転量に基づいて、振幅の補正係数を決定し、振幅補正部504に供給する。
回転量生成部502は、例えば乱数によって回転量を生成する。乱数により、劣化信号位相スペクトルを各周波数で回転させると、劣化信号位相スペクトル220の形状が変化する。この形状の変化により、衝撃音などの信号急変部の特徴を弱めることができる。
乱数には、その発生確率が一様な一様乱数や、発生確率が正規分布を示す正規乱数などがあるが、まず、一様乱数による回転量の生成法を説明する。一様乱数は線形合同法などで発生させることができる。例えば、線形合同法で発生させた一様乱数は、0〜(2^M)−1の範囲に一様に分布する。ここで、Mは任意の整数であり、^はべき乗を表している。位相の回転量φは、0〜2πの範囲に分布させる必要がある。そこで、発生させた一様乱数を変換する。変換は、以下の式(8)で行う。ここで、Rは一様乱数であり、Rmaxはその一様乱数が発生しうる最大の値である。前述した線形合同法で発生させる場合には、Rmax=(2^M)-1となる。
Figure 0006528679
計算の簡単化のために、Rの値をそのまま回転量とすることもできる。回転量であるので2πはちょうど一回転を表す。位相を2π回転させた場合は回転させていない場合と同一である。よって、2π+αという回転量は、回転量がαの場合と同じになる。ここでは、線形合同法により一様乱数を発生させた場合を説明したが、それ以外の方法で一様乱数を発生させた場合でも、式(8)により回転量φを求めればよい。急変判定部209の判定結果に応じて、いつどのくらい乱数化を行なうのかを決定してもよい。
位相回転部501は、回転量生成部502から回転量を受け取り、劣化信号位相スペクトルを回転させる。もし、劣化信号位相スペクトルが角度で表現されている場合には、その角度に回転量φの値を加算することで回転させることができる。劣化信号位相スペクトルが複素数の正規ベクトルで表現されている場合には、回転量φの正規ベクトルを求め、劣化信号位相スペクトルに乗算することで回転させることができる。
回転量φの正規ベクトルは、式(9)で求められる。ここで、Φは回転ベクトルであり、jはsqrt(-1)を示す。なお、sqrtは二乗根を表している。
Figure 0006528679
補正量算出部503による、補正係数算出方法について説明する。まず、位相の回転により出力レベルの低下が生じることを、図6および図7を用いて説明する。図6および図7は、劣化信号が図2に示すブロック図で処理された場合の信号を示している。図6と図7の違いは位相回転の有無である。図6は位相回転を行わない場合の信号を、図7は位相回転をフレーム3から行った場合の信号を示している。
まず、位相を回転しない場合の信号について図6を用いて説明する。図6の最上部に描かれているのは、劣化信号である。劣化信号はフレーム分割部301においてフレーム分割される。点線で区切られた、上から2番目の信号が、フレーム分割後の信号である。ここでは、連続した4フレーム分の信号を図示した。また、フレームのオーバラップ率は50%としている。
フレームに分割された信号は窓掛け処理部302によって窓掛けが行われる。点線で区切られた、上から3番目の信号が窓掛け処理後の信号である。図6では位相回転による影響を明確に示すため、矩形窓による重み付けをしている。
次に、フーリエ変換部303によって、周波数領域の信号に変換されるが、図6では周波数領域での信号は省略した。位相回転の点線より下部は、逆変換部204の逆フーリエ変換部401により、時間領域へ変換された信号を図示している。点線で区切られた、上から4番目の信号が位相回転後の信号である。ただし、図6では位相回転を行っていないため、窓掛け処理後の信号から変化していない。
逆変換部204の逆フーリエ変換部401から出力された強調信号に対して、窓掛け処理を再度実施する。図6では、矩形窓による重み付けを実施した場合を示している。窓掛け処理された信号は、フレーム合成部403において合成される。この時、フレーム間の時間を揃える必要がある。フレームのオーバラップ率が50%であるので、ちょうど半分ずつフレームが重なる。位相の回転を実施していない場合、図6のように入力信号と出力信号は一致する。
一方、位相を回転する場合の信号について図7を用いて説明する。図7に示したのは位相回転をフレーム3から実施した場合の信号である。最上部に描かれているのは、図6と同じ劣化信号である。フレーム分割後および窓掛け処理後の信号も図6と同様である。
図7では、フレーム3から一定の位相回転を実施した場合を描いている。位相回転処理の点線下部に示した右向き三角形の区間に注目する。位相回転処理により、フレーム3および4の信号が時間方向にシフトしている。位相回転を施した信号を再度窓掛け処理し、フレーム合成する。このとき、フレーム2とフレーム3が重なるiiの区間で、フレーム2とフレーム3の信号に違いが生じる。これにより、フレーム合成後の出力信号レベルがiiの区間において小さくなる。つまり、位相の回転を実施する場合、図7のiiの区間で出力信号レベルが低下する。
この位相回転による出力信号レベルの低下は、時間領域における加算を周波数領域の加算に置き換え、周波数領域のベクトル合成でも説明できる。
図8に、フレーム分割および窓掛け処理後の連続した2フレームの劣化信号を、x1[n]およびx2[m]として示す。なお、オーバラップ率は50%としている。ここで、nはx1の離散時間を、mはx2の離散時間を表しており、オーバラップ率が50%の場合には、以下の式(10)が成立する。
Figure 0006528679
また、x1とx2の関係は、以下の式(11)のようになる。
Figure 0006528679
まず、時間領域信号から周波数領域信号への変換および逆変換の式を示す。周波数領域信号X[k]は、時間領域信号x[n]のフーリエ変換によって、以下の式(12)のように表現される。ここで、kは離散周波数を表し、Lはフレーム長である。
Figure 0006528679
また、周波数領域信号X[k]を逆変換により、時間領域信号x[n]に戻すと、以下の式(13)のように表現される。
Figure 0006528679

これに基づいて、時間領域信号x1[n],x2[m]を、周波数領域信号X1[k],X2[k] に変換すると、以下の式(14)、式(15)のように表現される。
Figure 0006528679

Figure 0006528679
周波数領域信号X1[k],X2[k]を、逆変換によってそれぞれ時間領域信号x1[n],x2[m]に戻すと、式(13)より、以下の式(16)、式(17)のように表現される。
Figure 0006528679

Figure 0006528679

逆変換部は、フーリエ変換により周波数領域信号を時間領域信号に変換する。その後、フレーム合成部により、前フレームと現フレームの強調信号をオーバラップ加算する。例えば、図示した例のオーバラップ率50%では、離散時間m=L/2〜L-1の区間で隣接フレームの加算が行われる。この加算区間m=L/2〜L-1を考える。
時間領域の加算に、式(16)および式(17)を代入すると、以下の式(18)のように表現される。
Figure 0006528679

さらに、式(18)中の周波数領域信号X1[k],X2[k]に式(14),式(15)を代入すると、以下の式(19)のように表現される。
Figure 0006528679

さらに、式(19)を展開すると、以下の式(20)のように表現される。
Figure 0006528679

ここで、式(20)の各項に含まれる総和演算を考える。任意の整数gを導入し、以下の式(21)が成立する。
Figure 0006528679
デルタ関数δ[g]のフーリエ逆変換式は、式(22)で示される。
Figure 0006528679
ここで、デルタ関数δ[g]は、以下の式(23)で示される。
Figure 0006528679

式(22)より、式(21)は、以下の式(24)に変形できる。
Figure 0006528679

式(24)の関係から、式(20)は、以下の式(25)で表わされる。
Figure 0006528679

よって、式(20)は、以下の式(26)となる。
Figure 0006528679
さて、ここで周波数領域信号X2[k]に対し、位相回転を行った場合を考える。このときの時間領域信号は、図9のようになる。
X2[k]の位相スペクトルを、φ[k]回転させたとき、その逆変換は以下の式(27)となる。
Figure 0006528679

これを、式(18)に代入すると、以下の式(28)が成立する。
Figure 0006528679
これを展開すると、以下の式(29)が成立する。
Figure 0006528679
ここで、オーバラップ率50%と仮定し、オーバラップ区間のn=L/2〜L-1について考える。オーバラップ区間では、式(11)より、以下の式(30)のように展開できる。
Figure 0006528679

ここで、それぞれの項にある括弧内の
Figure 0006528679
の項は、ベクトル合成であるから、特定の周波数kに注目すると、図10のように描ける。もし、位相回転が行われていないとき、つまりφ[k]=0の場合は、図11のようになる。
式(31)の絶対値を求めると、以下の式(32)となる。
Figure 0006528679

よって、式(31)の絶対値が最大になる条件は、φ[k]=0の場合であり、その値は2である。つまり、位相回転が行われると、出力信号の大きさが小さくなることがわかる。この出力信号レベルの低下量を補正するように、補正量算出部503において強調信号振幅スペクトルの振幅補正量を決定する。
ここでは、位相回転量が一様乱数によって決定されると仮定し、補正量の算出方法を具体的に説明する。ここでは、問題簡単化のため、位相の回転による大きさの変動に着目し、それぞれの周波数成分が単位ベクトルに正規化されているものとする。
まず、位相回転を行わない場合を考える。連続するフレーム間で位相が同じ場合の合成ベクトルは、図11に示されるSのようになり、そのベクトルの大きさ|S|は、以下の式(33)で表わされる。
Figure 0006528679
一方、一様乱数により位相回転を行う場合、連続するフレーム間位相差φは、-πから+πまでの範囲に一様に分布する。この連続するフレーム間で位相が異なる場合の合成ベクトルは、図10に示されるベクトルS′のようになる。そのベクトルの大きさ|S′|は、以下の式(34)で表わされる。
Figure 0006528679
さて、ここで、期待値E(|S′|^2)を求めると、以下の式(35)のようになる。
Figure 0006528679

ここで、φが-πから+πまで一様分布することから、以下の式(36)のようになる。
Figure 0006528679
このため、|S'|^2の期待値は、以下の式(37)で表わされる。
Figure 0006528679
さて、位相の回転をしない場合の、期待値E(|S|^2)は、式(33)より以下の式(38)で表わされる。
Figure 0006528679

式(37)と式(38)の比を取ると、以下の式(39)が成立する。
Figure 0006528679
つまり、位相を一様乱数で回転させる場合、出力信号のパワー平均値は入力と比較して、1/2だけ小さくなる。振幅補正部504では振幅値に対し補正を行うので、補正量算出部503は補正係数をsqrt(2)とし、振幅補正部504に伝達する。
以上、一様乱数による回転量生成の場合を例に挙げて説明したが、正規乱数などでもその分散と平均値が決まれば、補正係数を一意に定めることができる。正規乱数を使う場合の補正係数の導出を以下に説明する。
正規乱数の場合φの発生確率が正規分布により決定される。そのため、正規乱数による位相回転を実施した場合のパワー期待値を求めるには、φの発生確率に基づいて、重み付けを行う必要がある。
具体的には、φの発生確率に基づいた、重み関数f(φ)を導入する。その重み関数f(φ)により、cos(φ)を重みづけする。さらに、重み付け関数f(φ)の積分値で正規化することにより、パワー期待値を求めることができる。
正規乱数による位相回転を行った場合の出力パワー期待値E(S"^2)は、一様乱数の出力パワー期待値である式(35)に、重み付け関数f(φ)およびその積分値を導入し、以下の式(40)のように表現できる。
Figure 0006528679

重み関数f(φ)は、正規分布により表現できるので、以下の式(41)が成立する。
Figure 0006528679

ここで、σは分散をμは平均を表している。
例えば、平均値μ=0,分散σ=1の標準正規分布では、以下の式(42)となるので、となるので、これを式(40)に代入すると、式(43)のようになる。
Figure 0006528679

Figure 0006528679

ここで、式(43)の右辺、第2項を数値計算すると、式(44)が成立するので、位相の回転をしない場合の、E(|S^2|)との比は、式(45)で表わされる。
Figure 0006528679
Figure 0006528679
補正量算出部503は、位相を標準正規分布の正規乱数で回転させる場合、振幅補正部504に補正係数をsqrt(1/0.805)として、伝達する。位相回転はフレーム内の全ての周波数に対して行ってもよいが、信号の急変を検出した一部の周波数に対して行っても構わない。振幅補正は位相回転を行った周波数、つまり信号急変を検出した周波数に対して行う。よって、位相回転を行わない周波数の補正係数は、1.0とする。位相回転を行った周波数の補正係数のみ、上記で導出した値とする。
このように振幅制御部203では、位相制御部202から伝達された位相の回転量を用いて振幅補正係数を算出し、雑音抑圧部205から供給された強調信号振幅スペクトルに乗じ、逆変換部204に供給する。これにより、劣化信号位相スペクトルを回転させ、強調信号位相スペクトルを得た場合の出力レベル低下を解消することができる。
なお、算出した振幅補正量が無視できる(補正係数が1.0に近い)とき、補正量算出と振幅補正の演算量を削減したいときなど、必要と認めるときには、振幅補正自体を省略することも可能である。そのときには、位相回転部501における位相回転だけを実施する。
また、これまでは乱数を用いて位相を回転する例について説明したが、厳密な意味での乱数を用いない構成でも同様な効果を得ることができる。入力された劣化信号の位相特性に存在する特有のパターンをなくする、あるいは弱くすることが位相回転の目的であるので、その目的を達成することができる数列は何でも位相回転に利用することができる。例えば、フレーム長の半分(振幅およびパワースペクトルが独立な周波数成分の数)より周期が長く、一周期内で相関の小さい数列の利用は有効である。
《計算部および急変判定部の構成》
図12は、計算部208および急変判定部209の内部構成について説明するための図である。図12に示すように、計算部208は、周波数方向に位相の変化量を算出する変化量算出部1201と、位相の変化量の平坦度を算出する平坦度算出部1202と、周波数方向に振幅の平坦度を算出する振幅平坦度算出部1203を含んでいる。
変化量算出部1201は、位相成分信号220(p(k) 、kは周波数)を入力して、隣接する周波数の位相差Δp(k)=p(k)-p(k-1)を位相の変化量1210(位相の傾き)として求める。
平坦度算出部1202は、変化量算出部1201で得られた位相変化量Δp(k)=p(k)-p(k-1)の、周波数軸に沿った平坦度(バラツキ)を調べる。隣接する周波数の位相変化量の差分Δ2p(k)=Δp(k)-Δp(k-1)を平坦度1220とする。位相変化量が平坦であれば差分は0になる。周波数成分ごと、帯域ごと、全周波数のいずれかに対して、一つの平坦度1220を求めてもよい。また、単一あるいは複数の帯域における平坦度を統合して、全周波数における平坦度の代わりに用いてもよい。
位相の周波数方向の変化量が、信号の急変が存在するときに平坦になる理由は次の通りである。変換部201のフレーム内に孤立パルスが存在すると仮定する。孤立パルスをフーリエ変換したときの周波数方向の位相の傾きは、孤立パルスの位置に対応して一意に求まることが知られている。例えば、変換部におけるフレーム長がLサンプルで孤立パルス位置がn0(0≦n0≦L―1)であるとき、位相の傾きは−2πn0/Lとなる。これは、振幅aの孤立パルスに関して、フーリエ変換によって得られるk番目の周波数成分D(k)が、次式で与えられるためである。D(k)=a・exp(-jθ(k))θ(k)=−2π・k・n0/L
位相θ(k)は、明らかにk、すなわち周波数に比例している。このため、位相の微分に相当する周波数方向変化量Δθ(k)=−2π・n0/Lとなり、これは定数である。すなわち、周波数方向の位相の変化量は、一定値(平坦)となる。
ここで、周波数ごとではなく周波数帯域(サブバンド)またはフレームごとに判定すると、より大局的な判定によって、信号急変成分以外の位相成分による判定誤りを低減することができる。さらに、周波数帯域ごとまたはフレームごとの判定結果を用いて、周波数ごとの判定結果を修正してもよい。例えば、ある周波数帯域の判定結果が「信号急変が存在する」であるときに、その周波数帯域内の全周波数の判定結果を強制的に「信号急変が存在する」に設定することで、他の信号成分の妨害による判定誤りを低減することができる。その反対に、ある周波数帯域の判定結果が「信号急変が存在しない」であるときに、その周波数帯域内の全周波数の判定結果を強制的に「信号急変が存在しない」に設定することで、他の信号成分の妨害による判定誤りを低減することもできる。あるいは、前記帯域内の各周波数で、判定の容易さ(閾値)を「存在」と判定しやすい方向へ修正して、各周波数独自に判定を行うという構成自体は維持してもよい。周波数ごとまたは周波数帯域ごとに判定結果を求めると、周波数ごとまたは周波数帯域ごとに急変を抑圧することができ、より精度のより精度の高い抑圧を行なうことが可能となる。
さらに、位相の微分値を位相変化量としてさらにその微分値を平坦度1220としてもよい。その場合、位相の二次微分値が0に近ければ(所定値以下であれば)平坦と判定できる。帯域ごとあるいは周波数成分ごとに判定すると、よりきめ細かな信号急変の判定処理を行なうことができる。つまり、信号急変を帯域ごとあるいは周波数成分ごとに独立して抑圧することもでき、より精度の高い信号急変の抑圧を行なうことが可能となる。
ここでは変化量算出部1201は、隣接周波数間の位相の差分を用いて変化量を算出したが、本発明はこれに限定されるものではない。位相の周波数による微分で直線性(位相変化の平坦度)を判定してもよい。複数の周波数における複数の微分結果のバラツキが小さいほど直線性が高い。局所的な直線性は、局所的な微分結果を用いて評価することができる。特に、隣接する2周波数成分間の微分は差分で近似できるので、その場合は複数の差分のバラツキが小さいほど直線性が高いと判断する。バラツキの指標として、平坦度を用いることができる。
振幅平坦度算出部1203は、周波数軸に沿った振幅変化1225を算出して、急変判定部209に供給する。隣接する周波数間で振幅の変化が小さい周波数が信号急変を表す。振幅変化は、帯域ごと、あるいは全周波数のいずれかに対して、一つの平坦度1225を求めてもよい。具体的には、以下の式(46)のように、平坦度を表わすFM(Flatness Measure)を求める。x(n)は周波数nにおける振幅またはパワースペクトル、Nは平坦度算出区間に含まれる周波数成分の数である。
Figure 0006528679

FMは0.0から1.0の値をとる。完全に平坦な場合、FMは1.0である。平坦度については、非特許文献3に開示がある。
平坦度はまた、別の指標を用いて表すこともできる。例えば、帯域ごと、あるいは全周波数のいずれかに対してx(n)の平均を求め、各周波数成分nにおけるx(n)とその平均値との差分二乗値総和を帯域ごと、あるいは全周波数の平坦度とすることができる。全周波数の代わりに、単一あるいは複数の周波数帯域において前記差分二乗値総和を一つ求め、これを平坦度とすることもできる。このようにして求めた平坦度は、完全に平坦な場合に0.0、平坦度が低下するに従って大きな値をとる。
別の平坦度の指標として、滑らかさを用いてもよい。滑らかさは、周波数軸に沿った隣接サンプル間の差分絶対値総和で表現することができる。凹凸の多い(滑らかでない)波形で滑らかさは大きな値を、少ない(滑らかな)波形で小さな値をとる。この指標は、全変動量(TV: Total Variation)として知られている。
これまで、平坦度として周波数軸に沿った平坦度を用いてきたが、時間軸に沿った平坦度を利用することもできる。信号急変部では急激に振幅およびパワーが増加するので、この性質を用いると、時間軸に沿った平坦度が低いときに、信号急変が存在すると判定することができる。具体的には、現フレームと直前フレームの振幅またはパワーの差が一定値以上となるときに、平坦度が低い、すなわち信号急変が存在すると判定する。また、数フレーム過去のフレームから現在のフレームまでの複数フレームに対して隣接フレーム間の振幅またはパワーの差を求め、これらを線形または非線形結合した結果を平坦度として定義することもできる。過去のフレームの情報を用いることで、低域成分を含むなまった信号急変部を検出しやすくなり、その抑圧性能が向上する。なお、隣接フレームの振幅またはパワー差を計算する際には、これを周波数成分ごと、帯域ごと、あるいは全周波数のいずれかに対して計算してもよい。さらに、単一または複数の帯域に対して前記振幅またはパワー差を計算することもできる。例えば、単一の帯域、特に高周波域で前記振幅またはパワー差を計算することによって、音声やその他の信号の影響を低減することができ、より正確に信号急変部を検出することが可能となる。
これまで説明した2つの平坦度、すなわち周波数軸に沿った平坦度と時間軸に沿った平坦度は、それぞれを単独で用いることもできるし、両方を組み合わせて用いることもできる。組合せの例としては、2つの平坦度の線形または非線形結合に基づく信号急変部の検出や、それぞれの平坦度に基づいた検出結果の組合せなどがある。周波数方向の平坦度は大きいときに、時間方向の平坦度は小さいときに信号急変の検出と判定するので、組合せの際にどちらかを逆数にしてから組み合わせるなどの工夫が必要となる。
急変判定部209は、位相変化量の平坦度と振幅平坦度の2つの指標を用いて、信号の急変を判定する。振幅が周波数軸に沿って平坦である(バラツキが小さい)とき、信号急変部である可能性が高いと考えられるからである。これは、信号急変がパルス性(短時間に振幅が増加して、減少する)であることと、インパルスのフーリエ変換が白色信号(全周波数で振幅およびパワーが等しい)となることから自明である。判定の方法としては例えば以下のいずれかを選択することができる。
(1)位相変化量の平坦度と振幅平坦度が共にそれぞれの条件を満たす場合(例えば位相の二次微分値がN=0.1以下で、振幅平坦度FMがМ=0.8以上の場合)、信号の急変があると判定
(2)平行度と振幅平坦度を単独で用いたときの判定結果の論理和。信号急変の存在可能性を算出するときは、平行度による存在可能性と振幅平坦度による存在可能性のうち、大きい方(または小さい方)に基づく判定
(3)位相変化量の平坦度と振幅平坦度の両方の平均が条件を満たす場合(例えば位相の二次微分値PXと、振幅平坦度FMと1.0との差分値QX=(1.0−FM)との平均AV1=(PX+QX)/2が0.1以下)に、信号の急変があると判定
(4)位相変化量の平坦度と振幅平坦度とに対して重み付けを行ないつつ両方を合わせた複合的な条件を満たす場合(例えば位相の二次微分値PXと、振幅平坦度FMと1.0との差分値QX=(1.0−FM)との重み付け平均AV2=(0.8×PX+0.2×QX)が0.1以下)に、信号の急変があると判定
(5)位相変化量の平坦度と振幅平坦度とを、線形または非線形関数を用いて組み合わせ、組み合わせた結果が一定値より大きいときに信号の急変があると判定。時間方向の振幅平坦度が含まれるときには、その逆数を代わりに用いる。
(6)位相変化量の平坦度と振幅平坦度との中でいずれか大きい方(理想値に近い方)のみを用いて、その大きい方が条件を満たす場合(例えば位相の二次微分値PXと、振幅平坦度FMと1.0との差分値QXと、いずれか大きい方を閾値とを比較する)信号の急変があると判定。時間方向の振幅平坦度が含まれるときには、その逆数を代わりに用いる。
(7)事前に検出しようとする急変信号の振幅またはパワースペクトルに関する情報が得られて、振幅またはパワースペクトルが平坦であれば、位相平坦度の重みを小さくする。
(8)事前に検出しようとする急変信号の振幅またはパワースペクトルに関する情報が得られて、振幅またはパワースペクトルの最小値よりも入力された劣化信号の振幅またはパワースペクトルが小さいときは、信号急変を検出するための閾値を一時的に大きく変更して、検出されにくくする。
特定の信号を処理する場合、例えばノイズが小さくてインパルスに近い衝撃音を検出・抑圧する場合、振幅またはパワーに関する情報の方が位相情報よりも信頼できるときがある。例えば、静かな環境でピストルの発砲音を検出する際には、振幅のみを用いて検出してもよい。一方、ノイズの振幅またはパワーが大きく変化する場合、例えば、空港の警備での発砲音の検出の場合、静かな(ノイズが小さい)状況と、ノイズが大きい状況とで、振幅と位相の重み付けを変えることが効果的である。この場合、振幅と位相の重み付けを、ノイズの有無や時間帯に応じて変化させてもよい。例えば、管制塔からフライトスケジュールの最新情報を入手することができれば、飛行機の離着陸時刻が分かるため、飛行機が来るタイミング(ノイズが多いタイミング)では位相の重み付けを大きくして発砲音の検出に用いることができる。発砲音(検出対象の衝撃音)以外の信号が混在するときには、位相情報を用いた衝撃音の検出が振幅を用いた検出よりも効果的だからである。一方、ノイズが小さい状況では、入力された劣化信号の周波数領域ベクトルの絶対値、つまり振幅値を重視して判定する方が効果的に衝撃音を検出できる。もちろんここでも振幅スペクトルの代わりにパワースペクトルの値を用いてもよい。また、信号の種類によって、衝撃音の振幅が平坦でない場合がある。その場合は、位相平坦度の重みを大きくして検出を行なうことにより高精度で信号の急変を検出できる。さらに、衝撃音の振幅またはパワースペクトルに関する情報が事前に得られるときには、得られた情報を用いて振幅が平坦なときと同じ結果が得られるように、振幅平坦度の計算結果を補正することもできる。具体的には、振幅スペクトル230を衝撃音の振幅またはパワースペクトル形状の逆数を各周波数成分で乗じた後に、振幅平坦度を算出する。
急変判定部209は判定結果1230として、信号急変あり(1)または信号急変無し(0)を出力する。ただし、平坦度の絶対値と対応させた、0と1の間の値を判定結果1230として出力してもよい。その場合、信号急変が存在する尤もらしさ(存在可能性)を得ることが可能となる。存在可能性は、例えば、次のようにして求めることができる。まず、正の値を閾値として定める。閾値が正の値になるのは、前記位相平坦度と振幅平坦度の双方とも、より大きな正の値が信号急変の存在可能性の高さを表すからである。また、両者の最小値は0である。次に、両指標を組み合わせて得られた値(組み合わせ指標)が閾値を超えるとき、信号急変の存在可能性を1とする。また、組み合わせ指標が0になるとき、存在可能性を0とする。存在可能性の一般値は、組み合わせ指標の関数として定義する。このような関数の最も簡単なものは、直線である。存在可能性として、組み合わせ指標に比例した値が定められる。直線の傾きとy切片(前記組み合わせ指標が0のときの関数値)は、前述の組み合わせ指標が0および1に等しいときの境界条件を満足するように定める。関数としては、任意の線形または非線形関数や多項式などを用いてもよい。
図13は、位相およびその変化量をグラフに示したものである。周波数領域において、周波数軸に沿って、グラフ1301のように位相が変化する場合、その位相変化量は、周波数領域において、周波数軸に沿って、グラフ1302に示すように変化する。この変化が平坦な周波数1303を導き出すことにより、位相の直線性を判別する。
信号の急変部では位相が直線的に変化することが分かっているため、このように位相の直線性を求めてその平坦度を判定することにより、信号の急変の存在またはその程度を判定することが可能となる。そして、衝撃音など信号の急変が存在する周波数成分、周波数帯域または全周波数において、位相スペクトルを回転操作することや振幅スペクトルを抑圧することにより、その急変を抑圧したり、その影響を弱くしたりすることができるため、高品質な強調信号を得ることができる。
図14は、本実施形態にかかる雑音抑圧装置200をソフトウェアを用いて実現する場合のハードウェア構成について説明する図である。
雑音抑圧装置200は、プロセッサ1410、ROM(Read Only Memory)1420、RAM(Random Access Memory)1440、ストレージ1450、入出力インタフェース1460、操作部1461、入力部1462、および出力部1463を備えている。雑音抑圧装置200は、カメラ1464を備えていてもよい。プロセッサ1410は中央処理部であって、様々なプログラムを実行することにより雑音抑圧装置200全体を制御する。
ROM1420は、プロセッサ1410が最初に実行すべきブートプログラムの他、各種パラメータ等を記憶している。RAM1440は、不図示のプログラムロード領域の他に、入力信号210、位相成分信号220、振幅成分信号230、強調信号260、位相変化量1210、位相変化平坦度1220、振幅平坦度1225および急変判定結果1230等を記憶する領域を有している。
また、ストレージ1450は、雑音抑圧プログラム1451を格納している。雑音抑圧プログラム1451は、変換モジュール、位相制御モジュール、振幅制御モジュール、逆変換モジュール、雑音抑圧モジュール、位相直線性計算モジュール、振幅平坦度判定モジュール、および急変判定モジュールを含んでいる。雑音抑圧プログラム1451に含まれる各モジュールをプロセッサ1410が実行することにより、図2の変換部201、位相制御部202、振幅制御部203、逆変換部204、雑音抑圧部205、計算部208、急変判定部209の各機能を実現できる。なお、ストレージ1450はノイズデータベースを格納してもよい。
プロセッサ1410が実行した雑音抑圧プログラム1451の出力である強調信号は、入出力インタフェース1460を介して出力部1463から出力される。これにより、例えば、入力部1462から入力した操作部1461の操作音などを抑圧することができる。また、入力部1462から入力した入力信号に信号急変が含まれたことを検出してカメラ1464による撮影を開始するなどといった適用法も可能である。
図15は、上記雑音抑圧プログラム1451による信号急変判定処理の流れを説明するためのフローチャートである。まず、ステップS1501において、入力部1462から信号を入力すると、ステップS1503に進む。ステップS1503では、変換部210が入力信号を周波数領域に変換して、振幅・位相に分割する。次に、ステップS1505では、計算部208が離散周波数kを1に、カウント値I(k)を0に設定して、順次周波数空間での処理を開始する。ステップS1507に進むと、計算部208が、設定された周波数での位相の変化(微分値または差分値)を算出する。さらにステップS1509では、計算部208が位相変化の変化(微分値または差分値)を算出する。さらにステップS1510では、計算部208が上述した式(46)を用いて、振幅A(k)の平坦度FM(k)を算出する。次にステップS1511では、急変判定部209が位相変化の平坦度の絶対値および振幅の平坦度をそれぞれ閾値N、Мと比較する。具体的には位相変化の変化の絶対値が所定の閾値Nを越えず、かつ、振幅の平坦度FMが閾値М以上の場合、ステップS1513に進んで、その周波数kにおいて信号の急変が存在すると判定し、フラグを立てる(I(k)=1とする)。一方、位相変化と振幅の変化が条件に合致しなかった場合、ステップS1514においてI(k)=0とする。以上のステップS1507〜S1514を、k=F(Fはフレーム全体の周波数成分数)になるまで繰り返す。最終的には、ステップS1517において、I(k)=1となったkの周波数で信号急変ありと判定し、判定結果を、雑音抑圧部205および位相制御部202に供給する。以上のステップS1501〜S1514の処理は全フレームに対して繰り返し行なわれる。なお、ステップS1517に変えて、フレーム内でI(k)を積算し、I(k)の積算値が所定の閾値を超えた場合に、急変判定部209は信号急変を含むフレームと判定してもよい。また、この際、急変判定結果を次の周波数帯域に積算してもよい。
また、ハングオーバーの作用として、続くフレームにおける閾値Nを大きく、またМを小さく設定することができる。このように続くフレームの閾値を設定することによって、信号急変(衝撃音)の検出を容易にし、検出漏れを低減することができる。続くフレームにおける閾値NとМの設定は、いずれか一方に対して、または双方を同時に行うことができる。
以上の処理により、信号急変(衝撃音)をより正確に検出することができ、適宜、その信号急変(衝撃音)を適切に抑圧することが可能となる。
[第3実施形態]
次に本発明の第3実施形態に係る雑音抑圧装置について、図16を用いて説明する。図16は、本実施形態に係る雑音抑圧装置1600の機能構成を説明するための図である。本実施形態に係る雑音抑圧装置1600は、上記第2実施形態と比べると、変換部1601が複素信号1650を生成し、計算部1608および急変判定部1609がその複素信号1650に基づいて位相直線性の計算および信号急変の判定を行なう点で異なる。その他の構成および動作は、第2実施形態と同様であるため、同じ構成および動作については同じ符号を付してその詳しい説明を省略する。
図17は、計算部1608および急変判定部209の内部構成について説明するための図である。図17に示すように、計算部1608は、周波数方向に位相の変化量を算出する変化量算出部1701と、位相の変化量の平坦度を算出する平坦度算出部1202を含んでいる。変化量算出部1701は、複素信号1650(q(k)、kは周波数)を入力して、隣接する周波数の位相差Δp(k)=p(k)-p(k-1)を、位相の変化量1210(位相の傾き)として求める。
平坦度算出部1202は、変化量算出部1201で得られた位相変化量Δp(k)=p(k)-p(k-1)の、周波数軸に沿った平坦度(バラツキ)を調べる。隣接する周波数の位相変化量の差Δ2p(k)=Δp(k)-Δp(k-1)を平坦度1220とする。位相変化量が平坦であれば差分は0になる。周波数成分ごと、帯域ごと、全周波数のいずれかに対して、一つの平坦度1220を求めてもよい。また、単一あるいは複数の帯域における平坦度を統合して、全周波数における平坦度の代わりに用いてもよい。
さらに、位相の微分値を位相変化量としてさらにその微分値を平坦度1220としてもよい。その場合、位相の二次微分値が0に近ければ(所定値以下であれば)平坦と判定できる。帯域ごとあるいは周波数成分ごとに判定すると、よりきめ細かな信号急変の検出処理を行なうことができる。つまり、信号急変を帯域ごとあるいは周波数成分ごとに独立して抑圧することもでき、より精度の高い抑圧を行なうことが可能となる。
急変判定部209は、算出された平坦度の絶対値が一定以下の場合、その平坦度に対応する周波数(一つの周波数成分、周波数帯域、または、全周波数(つまり一つのフレーム))は信号急変を含むと判定する。判定結果1230として、信号急変あり(1)または信号急変無し(0)を出力する。ただし、平坦度の絶対値と対応させた、0と1の間の値を判定結果1230として出力してもよい。その場合、信号急変が存在する尤もらしさ(可能性)を得ることが可能となる。
以上説明したとおり本実施形態によれば、位相成分信号の代わりに複素信号を用いて位相の直線性を検出することができる。
[第4実施形態]
次に本発明の第4実施形態に係る雑音抑圧装置について、図18を用いて説明する。本実施形態に係る雑音抑圧装置1800は、上記第3実施形態と比べると、計算部1608に代えて計算部1808を有する点で異なる。図18は、本実施形態に係る雑音抑圧装置に含まれる計算部1808の機能構成を説明するための図である。本実施形態に係る計算部1808は、上記第3実施形態と比べると、単位ベクトル生成部1881と回転ベクトル生成部1882と1883とを備えている点で異なる。また、急変判定部1809が、回転ベクトルに基づいて、信号の急変の有無またはその程度を判定する点でも異なる。その他の構成および動作は、第3実施形態と同様であるため、同じ構成および動作については同じ符号を付してその詳しい説明を省略する。
単位ベクトル生成部1881は、複素信号1650を用いて、入力スペクトル(複素ベクトル)を周波数成分ごとに単位ベクトル化する。具体的には、複素信号1650の実数部と虚数部をそれぞれ振幅値で除算する。
回転ベクトル変換部1882は、単位ベクトル1810を、隣接周波数間の回転ベクトル(第1回転ベクトル1820)に変換する。ここでの回転ベクトルの回転量(位相)は隣接周波数における単位ベクトル間の位相変化量と同義となる。基準ベクトルの共役A*と回転後のベクトルBとの内積をとる乗算を行ない、以下のように回転ベクトルRotVecを求める。RotVec = A*・B
具体的には、基準ベクトルの実部同士の積と虚部同士の積の和が回転ベクトルの実部、基準ベクトルの実部と虚部の積二つの差が回転ベクトルの虚部とすることで、回転ベクトル1820を算出できる。
さらに、回転ベクトル変換部1883は、回転ベクトル変換部1882によって得られた第1回転ベクトル1820の、周波数軸に沿った平坦度(バラツキ)を調べる。周波数軸に沿った位相変化量が一定であると、回転ベクトルのバラツキが小さくなる。そのため、第1回転ベクトル1820の変化量を周波数軸に沿って求める。具体的には、第1回転ベクトル1820について、隣接周波数間の回転ベクトル(第2回転ベクトル1830)を求める。これは第1回転ベクトルを微分したことと同義である。そして、急変判定部1809は、第2回転ベクトル1830の実部を平坦度として認識する。これは、次の理由による。
第2回転ベクトル1830も単位ベクトルなので、その実部は−1から1の値をとる。位相が直線的に変化するほど、第1回転ベクトルの角度変化量が小さい(回転ベクトルのバラツキが小さい)。そして、第1回転ベクトルの変化量が小さい(回転ベクトルのバラツキが小さい)ほど、第2回転ベクトルの角度が小さくなる。第2回転ベクトルの角度が小さいほど、その実部が大きくなる。ここでも、周波数点ごと、帯域ごと、全周波数のいずれかについて、一つの平坦度を求めてもよい。
なお、平坦度の求め方としては、上述したものに限られない。例えば、隣接する周波数成分ごとに前記第1回転ベクトルの差ベクトルを算出した上で、差ベクトルの実部、虚部をそれぞれ二乗して加算することで得られる差ベクトルの大きさを平坦度として用いてもよい。また、第2回転ベクトルの角度を平坦度として用いることもできる。第2回転ベクトルの角度は、隣接する周波数成分の第1回転ベクトルの角度差に相当する。
急変判定部1809は、第2回転ベクトル1830の実部、および、振幅平坦度FMの2つの指標を用いて、信号の急変を判定する。振幅平坦度の判定への利用に関しては、すでに急変判定部209の動作に関して説明した通りである。第2回転ベクトル1830の実部に関しては、実部があらかじめ定められた+1に近い閾値N(例えば0.7や0.8)を越えているか否か、またはNと+1の間のどの位置に存在しているかに応じて、急変の存在またはその程度を判定する。そして、判定結果1840として、信号急変あり(1)または信号急変無し(0)を出力する。ただし、平坦度の絶対値と対応させた、0と1の間の値を判定結果1840として出力してもよい。その場合、信号急変が存在する尤もらしさ(可能性)を得ることが可能となる。例えば、平坦度を、周波数成分ごとに第1閾値と比較し、第1閾値以下と判定された周波数bin数をカウントして、そのカウント値が第2閾値以上であれば、そのフレームに急変部が存在するものとして、フレームごとに検出してもよい。
なお、ここでも、第2実施形態で説明したのと同様に、位相変化の平坦度と振幅の平坦度とを状況に応じてバランスよく用いて、信号の急変を検出することができる。また、帯域ごとあるいは周波数成分ごとに判定すると、よりきめ細かな信号急変の検出処理を行なうことができる。つまり、信号急変を帯域ごとあるいは周波数成分ごとに独立して抑圧することもでき、より精度の高い抑圧を行なうことが可能となる。
図19は、本実施形態にかかる雑音抑圧プログラムを実行した場合の信号急変検出処理の流れを説明するためのフローチャートである。まず、ステップS1501において、入力部1462から音声信号を入力すると、ステップS1903に進む。ステップS1903では、変換部210が入力信号を周波数領域に変換して、周波数成分ごとの複素信号を生成する。次に、ステップS1505では、離散周波数kを1に、カウント値I(k)を0に設定して、順次周波数空間での処理を開始する。ステップS1907に進むと、設定された周波数で複素信号を単位ベクトル化する。次に、ステップS1908では、隣接する周波数成分の単位ベクトルから第1回転ベクトルに変換する。さらにステップS1909では隣接する周波数成分の第1回転ベクトルから第2回転ベクトルに変換する。さらにステップS1510では、計算部1203が上述した式(46)を用いて、振幅A(k)の平坦度FM(k)を算出する。ステップS1911では、第2回転ベクトルの実部を閾値Nと比較し、振幅平坦度を閾値Мと比較する。その結果、実部が閾値Nを越え、かつ振幅平坦度が閾値Мを越えた場合、ステップS1513に進んでI(k)=1とする。一方、実部が所定の閾値N以下または振幅平坦度が閾値М以下の場合、ステップS1514においてI(k)=0とする。以上のステップS1907〜S1514を、k=F(Fはフレーム全体の周波数成分数)になるまで繰り返す。最終的には、ステップS1517において、I(k)=1となったkの周波数で信号急変ありと判定し、判定結果を、雑音抑圧部205および位相制御部202に供給する。
以上説明したとおり本実施形態によれば、複素信号を用いて位相の回転ベクトルの回転ベクトルから直線性を検出し、振幅平坦度と合わせて衝撃音を検出することができる。なお、平坦度の判定で回転ベクトルの実部を使うために単位ベクトル化したが、本発明はこれに限定されるものではない。また、第2回転ベクトルの実部に代えて第2回転ベクトルの角度の大きさを閾値と比較し、角度の大きさが閾値より大きい場合に信号急変ありと判定してもよい。
[第5実施形態]
なお、上記第1乃至第4実施形態では、信号急変部を抑圧することを目的とした雑音抑圧装置に信号急変検出方法を適用した場合について説明したが、本発明はこれに限定されるものではない。衝撃音の検出を目的とした様々な装置、システムおよび状況で利用することができる。さらに検出対象は衝撃音(急激に立ち上がってすぐにたち下がる音声信号)に限定されない。信号が急激に立ち上がって(またはたち下がって)そのままとなる場合であっても、急変部として検出できる。
例えば、現在のオーディオ符号化方式(例えばMPEG AACの符号化部)において、いわゆるアタックと呼ばれる信号急変部では、通常とは異なった情報圧縮方式が採用されているが、その際の信号急変部の検出にも適用することができる。信号急変部では、分析窓長を変更して、プリエコーと呼ばれる先行雑音の抑圧を行うので、検出が必要となる。振幅やエントロピーの変化などを用いて検出する方法に比べて精度良く急変を検出し、効果的に情報圧縮を行なうことができる。
また、図20に示すように、車両2000にマイク2001と計算部208と急変判定部209と映像記録部2002とを搭載する適用例も考えられる。映像記録部2002が衝撃音の検出をトリガーにしてカメラによる撮影画像の上書き保存禁止を行なえば、事故状況の記録を残すことができる。その際に、衝撃音検出から一定時間の遅延の後に、上書き保存禁止を行ってもよい。衝撃そのものをトリガーにした場合と異なり、衝撃が小さい場合や、他の車両が事故にあった場合にも事故状況の自動記録を行なえるという利点がある。
また、図21に示すように、心電計2100に計算部208と急変判定部209とアラーム部2101とを接続する適用例も考える。心電図の異常心拍の検出をより正確かつ効果的に行なうことができる。特に雑音の多い場合に有効である。同様に、胎児のエコーのモニターにも適用できる。雑音による妨害で正しく心音がとれない場合があるが、そのようなときに本技術は有効である。すなわち、生体信号の急変検出に広く適用できる。
[第6実施形態]
本発明の第6実施形態としての信号処理装置2200について、図22を用いて説明する。信号処理装置2200は、入力信号急変を検出するための装置である。図22に示すように、信号処理装置2200は、変換部2201と第1算出部2202と第2算出部2203と信号急変判定部2204とを含む。
変換部2201は、入力信号2210を、周波数領域における位相成分信号2220および振幅成分信号2230に変換する。第1算出部2202は、入力信号2210の時間領域における急増部の位置に基づいて、位相の傾き2250を算出する。孤立パルスをフーリエ変換したときの周波数方向の位相の傾きは、孤立パルスの位置に対応して一意に求まることが知られている。例えば、変換部におけるフレーム長がLサンプルで孤立パルス位置がn0であるとき、位相の傾きは−2πn0/Lとなる。急増部を同定するための指標としては、例えば振幅絶対値の最大値を用いることができる。この指標は、実際の信号が孤立パルスに近いとき(ほぼ単峰性形状)には正確な位置を与える。一方、双峰性の形状を有するパルスのときは、振幅最大値は正確な位置を与えない。このような場合は、振幅絶対値の最大値と振幅絶対値の2番目に大きな値を用いた指標が有効である。例えば、両者の位置の中間値や両者の位置の重みづけ平均などを用いることができる。パルスがより時間軸に沿って広がっているときには、パルスのおおよその中心部を利用することで正確な位置を求めることができる。そのような指標には重心がある。第2算出部2202は、周波数領域における位相成分信号2220の傾き2260を算出する。信号急変判定部2204は、第1算出部2202によって算出された傾きと第2算出部2203によって算出された傾きに基づいて入力信号の急変を判定する。
以上の構成により、周波数領域における位相成分信号の傾きと時間領域信号の急増部の位置から求めた位相の傾きとの一致程度を用いて、入力信号の急変を効果的に検出することができる。
[第7実施形態]
《全体構成》
本発明の第7実施形態としての雑音抑圧装置について図23乃至図30を用いて説明する。本実施形態の雑音抑圧装置は、例えばデジタルカメラ、ノートパソコン、携帯電話、キーボード、ゲーム機のコントローラ、携帯電話の押しボタンなどの雑音抑圧に適用できる。すなわち、音声、音楽、環境音などの目的とする信号を、これらに重畳された信号(ノイズまたは妨害信号)に対して強調することができる。ただし、本発明はこれに限定されるものではなく、入力信号からの信号急変検出を要求されるあらゆる信号処理装置に適用可能である。なお、本実施形態では、信号の急変の一例として、衝撃音を検出して抑圧する雑音抑圧装置について説明する。本実施形態としての雑音抑圧装置は、例えば、マイクの近くでボタン押下などの操作がなされるような形態において、かかるボタン操作により発生する衝撃音を適切に抑圧する。簡単に説明すると、衝撃音を含む時間領域信号を周波数領域信号に変換し、周波数空間における位相成分の傾きを算出する。また、時間領域信号の急増部を孤立パルスとみなしたときの周波数領域の位相の傾き、すなわち−2πn0/Nを求める。そして、それら2種類の位相の傾きの一致程度に応じて、衝撃音の存在を判定する。
図23は、雑音抑圧装置2300の全体構成を示すブロック図である。入力端子2306には、劣化信号(所望信号と雑音の混在する信号)が、サンプル値系列として供給される。入力端子2306に供給された劣化信号は、変換部2301においてフーリエ変換などの変換を施されて複数の周波数成分に分割される。複数の周波数成分は周波数ごとに独立して処理される。ここでは、特定の周波数成分に注目して説明を続ける。周波数成分のうち振幅スペクトル(振幅成分)2330は雑音抑圧部2305へ供給され、位相スペクトル(位相成分)2320は位相制御部2302および算出部2381に供給される。さらに、変換部2301は、フレーム分割後であって高速フーリエ変換などの変換を施す前の時間領域信号2370を算出部2382に供給する。なお、ここでは変換部2301が雑音抑圧部2305に劣化信号振幅スペクトル2330を供給しているが、本発明はこれに限定されるものではなく、振幅スペクトルの二乗に相当するパワースペクトルを雑音抑圧部2305に供給してもよい。
雑音抑圧部2305は、変換部2301から供給される劣化信号振幅スペクトル2330を用いて、雑音を推定し、推定雑音スペクトルを生成する。また、雑音抑圧部2305は、変換部2301から供給された劣化信号振幅スペクトル2330と、生成した推定雑音スペクトルとを用いて雑音を抑圧し、雑音抑圧結果としての強調信号振幅スペクトルを振幅制御部2303に伝達する。さらに雑音抑圧部2305は、急変判定部2309から判定結果を入力し、信号の急変の有無またはその程度に応じて、雑音の抑圧の程度を変更する。雑音抑圧部2305は、所望信号の検出を行って所望信号成分を周波数ごとに保護する一方、信号急変が存在し、所望信号成分が検出されないときには、振幅を推定背景音に置換してもよい。
位相制御部2302は、変換部2301から供給された劣化信号位相スペクトル2320を回転(シフト)させ、強調信号位相スペクトル2340として逆変換部2304へ供給する。また、位相の回転量(シフト量)を、振幅制御部2303へ伝達する。振幅制御部2303は、位相制御部2302から位相の回転量(シフト量)を受け取って振幅補正量を算出し、その振幅補正量を用いて、強調信号振幅スペクトルを各周波数で補正し、補正振幅スペクトル2350を逆変換部2304へ供給する。逆変換部2304は、位相制御部2302から供給された強調信号位相スペクトル2340と、振幅制御部2303から供給された補正振幅スペクトル2350とを合成して逆変換を行い、強調信号として、出力端子2307に供給する。
算出部2381は、変換部2301から供給された位相成分信号2320を周波数で微分することにより、各周波数での位相の傾き(変化)を算出する。一方、算出部2382は、フレームに分割された劣化信号サンプル2370を変換部2301から入力して、フレームの信号絶対値を算出し、急増部を示す時間から、周波数領域の位相の傾きを算出する。急変判定部2309は、算出部2381、2382から提供された位相の傾きを比較し、それらの類似度に基づいて、信号の急変がどの程度存在するか(存在可能性)を周波数点ごとに判定する。
ここで、傾きの類似度は、時間領域信号から求めた傾きと周波数領域信号から求めた傾きの差分絶対値を用いることができるが、これに限定されない。これら2つの傾きの比の値と1との距離や、両者の和をどちらかの傾きの2倍で正規化した値と1との距離などを用いてもよい。類似度に基づく存在可能性は、例えば、次のようにして求めることができる。まず、正の値を閾値として定める。差分絶対値がこの閾値よりも大きいとき、存在可能性を0とする。また、差分絶対値が0に等しいとき、存在可能性を1とする。存在可能性の一般値は、差分絶対値の関数として定義する。このような関数の最も簡単なものは、直線である。存在可能性として、差分絶対値に比例した値が定められる。直線の傾きとy切片(前記差分絶対値がゼロのときの関数値)は、前述の差分絶対値が0および1に等しいときの境界条件を満足するように定める。関数としては、任意の線形または非線形関数や多項式などを用いてもよい。
《変換部の構成》
図24は、変換部2301の構成を示すブロック図である。図24に示すように、変換部2301はフレーム分割部2401、窓がけ処理部(windowing unit)2402、およびフーリエ変換部2403を含む。劣化信号サンプルは、フレーム分割部301に供給され、K/2サンプルごとのフレームに分割される。ここで、Kは偶数とする。フレームに分割された劣化信号サンプル2370は、窓がけ処理部2402と算出部2382に供給され、窓がけ処理部2402では窓関数(window function)であるw(t)との乗算が行なわれる。第nフレームの入力信号yn(t) (t=0, 1, ..., K/2-1) に対するw(t)で窓がけ(windowing)された信号は、次式で与えられる。
Figure 0006528679

また、連続する2フレームの一部を重ね合わせ(オーバラップ)して窓がけしてもよい。オーバラップ長としてフレーム長の50%を仮定すれば、t=0, 1, ..., K/2-1 に対して、以下の式で得られる左辺が、窓がけ処理部2402の出力となる。
Figure 0006528679

実数信号に対しては、左右対称窓関数が用いられる。また、窓関数は、変換部2301の出力を逆変換部2304に直接供給したときの入力信号と出力信号が計算誤差を除いて一致するように設計される。これは、w2(t)+w2 (t+K/2)=1 となることを意味する。
以後、連続する2フレームの50%をオーバラップして窓がけする場合を例として説明を続ける。w(t)としては、例えば、次式に示すハニング窓を用いることができる。
Figure 0006528679

このほかにも、ハミング窓、三角窓など、様々な窓関数が知られている。窓がけされた出力はフーリエ変換部2403に供給され、劣化信号スペクトルYn(k)に変換される。劣化信号スペクトルYn(k)は位相と振幅に分離され、劣化信号位相スペクトル arg Yn(k)は、位相制御部2302と算出部2381に、劣化信号振幅スペクトル|Yn(k)|は、雑音抑圧部2305と算出部2382に供給される。既に説明したように、振幅スペクトルの代わりにパワースペクトルを利用することもできる。
《逆変換部の構成》
図25は、逆変換部2304の構成を示すブロック図である。図25に示すように、逆変換部2304は逆フーリエ変換部2501、窓がけ処理部2502およびフレーム合成部2503を含む。逆フーリエ変換部2501は、振幅制御部2303から供給された強調信号振幅スペクトル2350と位相制御部2302から供給された強調信号位相スペクトル2340(arg Xn(k))とを乗算して、強調信号(以下の式の左辺)を求める。
Figure 0006528679

得られた強調信号に逆フーリエ変換を施し、1フレームがKサンプルを含む時間領域サンプル値系列xn(t) (t=0, 1, ..., K-1)として、窓がけ処理部2502に供給され、窓関数w(t)との乗算が行なわれる。第nフレームの入力信号xn(t) (t=0, 1, ..., K/2-1)に対してw(t)で窓がけされた信号は、次式の左辺で与えられる。
Figure 0006528679

また、連続する2フレームの一部を重ね合わせ(オーバラップ)して窓がけしてもよい。フレーム長の50%をオーバラップ長として仮定すれば、t=0, 1, ..., K/2-1 に対して、以下の式の左辺が、窓がけ処理部2502の出力となり、フレーム合成部2503に伝達される。
Figure 0006528679

フレーム合成部2503は、窓がけ処理部2502からの隣接する2フレームの出力を、K/2サンプルずつ取り出して重ね合わせ、以下の式によって、t=0, 1, ..., K-1における出力信号(左辺)を得る。得られた強調信号2360は、フレーム合成部2503から出力端子2307に伝達される。
Figure 0006528679

なお、図24と図25において変換部と逆変換部における変換をフーリエ変換として説明したが、フーリエ変換に代えて、アダマール変換、ハール変換、ウェーブレット変換など、他の変換を用いることもできる。ハール変換は、乗算が不要となり、LSI化したときの面積を小さくすることができる。ウェーブレット変換は、周波数によって時間解像度を異なったものに変更できるために、雑音抑圧効果の向上が期待できる。
また、変換部2301において得られる周波数成分を複数統合してから、雑音抑圧部2305で実際の抑圧を行うこともできる。統合後の周波数成分の数は、統合前の周波数成分の数よりも小さくなる。具体的には、周波数成分の統合によって得られる統合周波数成分に対して共通の抑圧度を求め、その抑圧度を同一統合周波数成分に属する個別の周波数成分に対して共通に用いる。その際、聴覚特性の弁別能力が高い低周波領域から、能力が低い高周波領域に向かって、よりたくさんの周波数成分を統合することによって、高い音質を達成することができる。このように、複数の周波数成分を統合してから雑音抑圧を実行すると、雑音抑圧を適用する周波数成分の数が少なくなり、全体の演算量を削減することができる。
《雑音抑圧部の構成》
図23に戻ると、雑音抑圧部2305は、変換部2301から供給される劣化信号振幅スペクトルを用いて雑音を推定し、推定雑音スペクトルを生成する。そして、変換部2301からの劣化信号振幅スペクトルと生成した推定雑音スペクトルとを用いて抑圧係数を求め、劣化信号振幅スペクトルに乗じ、強調信号振幅スペクトルとして、振幅制御部2303へ供給する。また、急変判定部2309から急変判定結果(信号の急変が存在するか否かの情報)を受けて、急変と判定されたときには、劣化信号振幅スペクトルと推定雑音スペクトルのうち小さい方を、強調信号振幅スペクトルとして、振幅制御部2303へ供給する。このとき、雑音抑圧部2305は、所望信号の検出を行って所望信号成分を周波数ごとに保護してもよい。
また、急変判定部2309から、急変がどの程度存在するかの情報(信号の急変が存在する確からしさ、存在可能性)を受けて、信号の急変が存在する可能性に応じて、雑音抑圧の程度を変更することもできる。さらに、信号の急変が存在する可能性を周波数成分、周波数帯域(任意の数の連続する周波数成分を統合したもの)、あるいはフレーム単位で判定し、その急変を抑圧すべく、周波数成分、周波数帯域、あるいはフレーム単位で異なった信号処理を施すことができる。
雑音の推定には、非特許文献1や非特許文献2に記載の方法など、様々な推定方法が利用できる。
例えば、非特許文献1には、推定雑音スペクトルを、所望信号が発生していないフレームの劣化信号振幅スペクトルの平均値とする方法が開示されている。この方法では所望信号の存在を検出する必要がある。所望信号の存在する区間は、強調信号のパワーで判断することができる。
理想的な動作状態として、強調信号は雑音以外の所望信号となっている。また、所望信号や雑音のレベルは、隣接フレーム間で大きく変化しない。これらのことから、1フレーム過去の強調信号レベルを雑音区間判定の指標とする。1フレーム過去の強調信号パワーが一定値以下の時には、現フレームを雑音区間と判定する。雑音スペクトルは、雑音区間と判定されたフレームの劣化信号振幅スペクトルを平均化することで推定できる。
また、非特許文献1には、推定雑音スペクトルを、劣化信号振幅スペクトルが供給され始めた推定初期の平均値とする方法も開示されている。この場合、推定が開始された直後には所望信号が含まれないという条件を満たす必要がある。条件が満たされる場合、推定初期の劣化信号振幅スペクトルを推定雑音スペクトルとすることができる。
さらに、非特許文献2には、推定雑音スペクトルを、統計的な劣化信号振幅スペクトルの最小値から求める方法が開示されている。この方法では、統計的に一定時間における劣化信号振幅スペクトルの最小値を保持し、その最小値から雑音スペクトルを推定する。劣化信号振幅スペクトルの最小値は、雑音スペクトルのスペクトル形状と似ているため、雑音スペクトル形状の推定値として用いることができる。しかし、最小値では、本来の雑音レベルより小さくなる。そのため、最小値を適切に増幅させたものを推定雑音スペクトルとして用いる。
雑音抑圧部2305においては、様々な抑圧を行うことが可能であるが、代表的なものとして、SS(Spectrum Subtraction:スペクトル減算)法とMMSE STSA(Minimum Mean-Square Error Short-Time Spectral Amplitude Estimator:最小二乗平均誤差短時間振幅スペクトル推定)法とが挙げられる。SS法の場合は、変換部2301から供給された劣化信号振幅スペクトルから推定雑音スペクトルを減算する。MMSE STSA法の場合は、変換部2301から供給された劣化信号振幅スペクトルと生成した推定雑音スペクトルとを用いて、抑圧係数を計算し、この抑圧係数を劣化信号振幅スペクトルに乗算する。この抑圧係数は、強調信号の平均二乗パワーを最小化するように決定される。
また、雑音抑圧部2305は、急変判定部2309から急変判定結果(信号の急変が存在するか否かの情報)を入力し、信号の急変の有無またはその程度に応じて、雑音抑圧の程度を変更する。例えば、信号急変のあった周波数成分、周波数帯域、あるいはフレーム単位で、その急変を抑圧すべく信号処理を施すことができる。
急変判定部2309で急変と判定されたときには、劣化信号振幅スペクトルと推定雑音スペクトルのうち小さい方を、強調信号振幅スペクトルとして、振幅制御部2303へ供給する。すなわち、劣化信号振幅スペクトルが推定雑音スペクトルより小さいときには劣化信号振幅スペクトルをそのまま出力し、それ以外のときには入力信号を推定雑音スペクトルで置き換えて出力することもできる。
さらに、この置き換えに先立って、重要な劣化信号振幅スペクトル成分を検出して、検出された重要な劣化信号振幅スペクトル成分を推定雑音スペクトルによる置き換えの対象から除外することもできる。重要な劣化信号振幅スペクトル成分を検出する際の重要度の指標としては、劣化信号振幅スペクトルの大きさを用いることができる。振幅が大きな成分は目的とする信号の成分である確率が高く、これを保持することは目的とする信号の音質劣化を防止することにつながる。
また、重要度の指標として、劣化信号振幅スペクトルのピーク性を用いることもできる。ピーク、すなわち周波数軸に沿って周辺よりも大きな値を有する劣化信号振幅は、目的とする信号の成分である確率が高く、これを保持することは目的とする信号の音質劣化を防止することにつながる。特に、顕著なピーク、すなわち周辺の振幅値よりも著しく大きな振幅値はその重要度が高いので、確実に保護することで目的とする信号の音質をさらに高めることができる。
ピークの検出は、例えば、非特許文献3の純音成分検出方法や、非特許文献4に、その方法が開示されている。さらに、検出されたピークを所定の条件に従って評価し、条件を満たさないピークは除外してもよい。例えば、推定雑音よりも小さな値をとるピークは、目的とする信号である可能性は低い。すなわち、推定雑音を基準として、それよりも十分に大きいものだけをピークとして残し、それ以外を除外することができる。十分に大きいかどうかは推定雑音の定数倍と比較することで、判定できる。このように、検出されたピークが所定の条件を満たすかどうかを評価してから最終的なピーク成分を選択することによって、誤ったピークの検出を低減し、信号急変部の抑圧効果を高くすることができる。
また、急変存在の確からしさに応じて、振幅制御部2303へ供給する信号を変化させることもできる。その置き換えを行った結果と劣化信号振幅スペクトルを、急変存在の確からしさに対応して混合したものを、強調信号振幅スペクトルとして出力する。急変存在の確からしさが高いほど、その置き換えを行った結果に大きな重みをつけて、混合処理を実行する。
雑音抑圧部2305は、信号の急変の存在可能性に応じて、抑圧度0、抑圧度1、抑圧度2というように多段で抑圧を行なってもよい。あるいは急変判定部の判定結果(例えば0〜1の数値)に応じて無段階に抑圧の程度を変えてもよい。
《位相制御部および振幅制御部の構成》
図26は位相制御部2302および振幅制御部2303の構成を示すブロック図である。図26に示すように、位相制御部2302は位相回転部2601と回転量生成部2602とを含み、振幅制御部2303は、補正量算出部2603と振幅補正部2604とを含む。
回転量生成部2602は、急変判定部2309から「信号の急変が存在する」と判定された周波数成分について、劣化信号位相スペクトルの回転量を生成し、位相回転部2601と補正量算出部2603に供給する。位相回転部2601では、回転量生成部2602から回転量が供給されると、変換部2301から供給された劣化信号位相スペクトル2320を、供給された回転量だけ回転(シフト)させ、強調信号位相スペクトル2340として逆変換部2304へ供給する。
補正量算出部2603では、回転量生成部2602から供給される回転量に基づいて、振幅の補正係数を決定し、振幅補正部2604に供給する。
回転量生成部2602は、例えば乱数によって回転量を生成する。乱数により、劣化信号位相スペクトルを各周波数で回転させると、劣化信号位相スペクトル2320の形状が変化する。この形状の変化により、衝撃音などの信号急変部の特徴を弱めることができる。
乱数には、その発生確率が一様な一様乱数や、発生確率が正規分布を示す正規乱数などがあるが、まず、一様乱数による回転量の生成法を説明する。一様乱数は線形合同法などで発生させることができる。例えば、線形合同法で発生させた一様乱数は、0〜(2^M)−1の範囲に一様に分布する。ここで、Mは任意の整数であり、^はべき乗を表している。位相の回転量φは、0〜2πの範囲に分布させる必要がある。そこで、発生させた一様乱数を変換する。変換は、以下の式で行う。ここで、Rは一様乱数であり、Rmaxはその一様乱数が発生しうる最大の値である。前述した線形合同法で発生させる場合には、Rmax=(2^M)-1となる。
Figure 0006528679

計算の簡単化のために、Rの値をそのまま回転量とすることもできる。回転量であるので2πはちょうど一回転を表す。位相を2π回転させた場合は回転させていない場合と同一である。よって、2π+αという回転量は、回転量がαの場合と同じになる。ここでは、線形合同法により一様乱数を発生させた場合を説明したが、それ以外の方法で一様乱数を発生させた場合でも、上式により回転量φを求めればよい。急変判定部2309の判定結果に応じて、いつどのくらい乱数化を行なうのかを決定してもよい。
位相回転部2601は、回転量生成部2602から回転量を受け取り、劣化信号位相スペクトルを回転させる。もし、劣化信号位相スペクトルが角度で表現されている場合には、その角度に回転量φの値を加算することで回転させることができる。劣化信号位相スペクトルが複素数の正規ベクトルで表現されている場合には、回転量φの正規ベクトルを求め、劣化信号位相スペクトルに乗算することで回転させることができる。
回転量φの正規ベクトルは、以下の式で求められる。ここで、Φは回転ベクトルであり、jはsqrt(-1)を示す。なお、sqrtは二乗根を表している。
Figure 0006528679

補正量算出部2603による補正係数算出方法は、図5の補正量算出部503について説明した方法と同様であるため、ここでは説明を省略する。
《算出部および急変判定部の構成》
図27は、算出部2381、2382および急変判定部2309の内部構成について説明するための図である。図27に示すように、算出部2382は、急増部検出部2701、遅延時間算出部2702、位相変換部2703および傾き算出部2704を備える。一方、算出部2381は、傾き算出部2705を備える。
急増部検出部2701は、フレーム内の信号の絶対値を算出し、その絶対値の最大値2710を検出する。遅延時間算出部2702は、フレーム内の最大値を示す相対位置(フレーム開始から最大値の存在するタイミングまでの時間)をn0として出力する。
次に、位相変換部2703は、遅延時間n02720を周波数領域の位相に変換する。具体的には以下の式に基づいて変換する。ここで、Lは変換部2301のフレーム長、0≦n0≦L―1である。入力が振幅aの孤立パルスであることを仮定すると、フーリエ変換によって得られるk番目の周波数成分D(k)は、次式で与えられる。 D(k)=a・exp(-jθ(k))θ(k)=−2π・k・n0/L
傾き算出部2704は、このように導き出した位相2730を微分して、周波数領域での位相の傾き2740を以下のように導き出す。傾き2740=−2π・n0/L
一方、傾き算出部2705は、変換部2301から入力した位相成分信号を微分して、周波数領域での位相の傾き2750を導き出す。傾き算出部2704、2705はそれぞれ、位相の周波数による微分によって傾きを算出してもよいし、他の方法で傾きを算出してもよい。
平行度算出部2706は、傾き算出部2704から提供された傾き2740と傾き算出部2705から提供された傾き2750とを、周波数ごとに比較してその傾きの類似度を算出する。つまり、周波数領域における位相成分信号の、算出部2382が算出した直線に対する算出部2381が算出した直線の平行度を各周波数で算出する。急変判定部2707では、そのような平行度が一定値を越えていれば、信号の急変がその周波数に存在すると判定する。
ここで、周波数ごとではなく周波数帯域(サブバンド)またはフレームごとに判定すると、より大局的な判定によって、信号急変成分以外の位相成分による判定誤りを低減することができる。さらに、周波数帯域ごとまたはフレームごとの判定結果を用いて、周波数ごとの判定結果を修正してもよい。例えば、ある周波数帯域の判定結果が「信号急変が存在する」であるときに、その周波数帯域内の全周波数の判定結果を強制的に「信号急変が存在する」に設定することで、他の信号成分の妨害による判定誤りを低減することができる。その反対に、ある周波数帯域の判定結果が「信号急変が存在しない」であるときに、その周波数帯域内の全周波数の判定結果を強制的に「信号急変が存在しない」に設定することで、他の信号成分の妨害による判定誤りを低減することもできる。あるいは、前記帯域内の各周波数で、判定の容易さ(閾値)を「存在」と判定しやすい方向へ修正して、各周波数独自に判定を行うという構成自体は維持してもよい。周波数ごとまたは周波数帯域ごとに判定結果を求めると、周波数ごとまたは周波数帯域ごとに急変を抑圧することができ、より精度の高い信号急変の抑圧を行なうことが可能となる。
急変判定部2309は判定結果2730として、信号急変あり(1)または信号急変無し(0)を出力する。ただし、急変判定部2707が平行度と対応させた、0と1の間の値を急変の存在可能性として出力するときには、判定結果2730は急変の存在可能性を表す0と1の間の値となる。その場合、信号急変が含まれている尤もらしさ(急変の存在可能性)を得ることが可能となる。存在可能性は、例えば、次のようにして求めることができる。まず、逆正接関数(arctangent)を用いて、傾き2740と傾き2750を傾きに対応した角度に変換する。角度の範囲は、-90度から90度とする。これら2角度の差の絶対値が0に近いほど、信号急変の存在可能性が高い。また、2角度の差の絶対値は、180度がその最大値となる。そこで、正の値を閾値として定める。2角度の差が閾値を超えるとき、信号急変の存在可能性を0とする。また、角度の差が0になるとき、存在可能性を1とする。存在可能性の一般値は、角度の差の関数として定義する。このような関数の最も簡単なものは、直線である。存在可能性として、2角度の差に比例した値が定められる。直線の傾きとy切片(2角度の差が0のときの関数値)は、角度の差が0および1に等しいときの境界条件を満足するように定める。関数としては、任意の線形または非線形関数や多項式などを用いてもよい。
図28は、位相およびその変化量をグラフに示したものである。周波数領域において、周波数軸に沿って、グラフ2801のように位相が変化する場合、その位相変化量は、周波数領域において、周波数軸に沿って、グラフ2802に示すように変化する。
一方、急増部のフレーム内相対位置から、周波数領域で直線2803として示される位相を算出できる。
本実施形態では、位相成分信号2801と直線2803とが平行になる部分がどの程度あるかに応じて、信号急変の存在を判定する。
位相の傾きを縦軸にとり、周波数を横軸にとると、直線2803の傾きに近似する範囲は、範囲2840で示される。したがって、範囲2840とグラフ2802との重なる部分が所定の閾値よりも大きい場合に、急変判定部2309は、信号の急変が存在すると判定する。
図29は、本実施形態にかかる雑音抑圧装置2300をソフトウェアを用いて実現する場合のハードウェア構成について説明する図である。
雑音抑圧装置2300は、プロセッサ2910、ROM(Read Only Memory)2920、RAM(Random Access Memory)2940、ストレージ2950、入出力インタフェース2960、操作部2961、入力部2962、および出力部2963を備えている。雑音抑圧装置2300は、カメラ2964を備えていてもよい。プロセッサ2910は中央処理部であって、様々なプログラムを実行することにより雑音抑圧装置2300全体を制御する。
ROM2920は、プロセッサ2910が最初に実行すべきブートプログラムの他、各種パラメータ等を記憶している。RAM2940は、不図示のプログラムロード領域の他に、入力信号2310、位相成分信号2320、振幅成分信号2330、強調信号2360を記憶する領域を有している。さらに、RAM2940は、振幅最大値タイミング2710、遅延時間2720、位相信号2730および位相の傾き2740、2750等を記憶する領域を有している。
また、ストレージ2950は、雑音抑圧プログラム2951を格納している。雑音抑圧プログラム2951は、変換モジュール、位相制御モジュール、振幅制御モジュール、逆変換モジュール、雑音抑圧モジュール、位相傾き算出モジュール、および急変判定モジュールを含んでいる。雑音抑圧プログラム2951に含まれる各モジュールをプロセッサ2910が実行することにより、図23の変換部2301、位相制御部2302、振幅制御部2303、逆変換部2304、雑音抑圧部2305、算出部2381、2382、急変判定部2309の各機能を実現できる。なお、ストレージ2950はノイズデータベースを格納してもよい。
プロセッサ2910が実行した雑音抑圧プログラム2951に関する出力である強調信号は、入出力インタフェース2960を介して出力部2963から出力される。これにより、例えば、入力部2962から入力した操作部1461の操作音などを抑圧することができる。また、入力部2962から入力した入力信号に信号急変が含まれたことを検出してカメラ2964による撮影を開始するなどといった適用法も可能である。
図30Aは、上記雑音抑圧プログラム2951による信号急変判定処理の流れを説明するためのフローチャートである。ステップS3001では、算出部2382において、時間領域での振幅最大値からの位相の傾き算出処理を開始させる。ステップS3002では、算出部2381において、周波数領域での位相の傾き算出処理を開始させる。
次にステップS3005において、ステップS3001とステップS3003の両方で傾きを算出するまで待機し、両方のやり方で傾きが算出できれば、ステップS3007に進み、算出した傾きを周波数ごとに比較する。ステップS3009において、傾きの差分絶対値が所定の閾値N以下か否かを判定し、N以下であれば、ステップS3011に進み、その周波数kについて、フラグを立てる(I(k)=1とする)。一方、N以下でない場合、ステップS3014においてI(k)=0とする。ステップS3015ではk=F(Fはフレーム全体の周波数成分数)を判定し、k=Fでなければ、ステップS3017に進み、k=k+1としてステップS3007に戻り、フレーム全体にわたって周波数ごとに傾き比較を行なう。最終的には、ステップS3019において、I(k)=1となったkの周波数で信号の急変ありと判定し、判定結果を、雑音抑圧部2305および位相制御部2302に供給する。なお、ステップS3019に変えて、フレーム内でI(k)を積算し、I(k)の積算値が所定の閾値を超えた場合に、急変判定部2309は信号の急変を含むフレームと判定してもよい。また、この際、急変判定結果を次の周波数帯域にハングオーバして積算してもよい。
また、ハングオーバの作用として、続くフレームにおける閾値Nを大きく設定することができる。このように続くフレームの閾値を設定することによって、信号急変(例えば衝撃音)の検出を容易にし、検出漏れを低減することができる。
図30Bは、算出部2382が行なう傾き算出処理の流れを説明するためのフローチャートである。まず、ステップS3021で信号を入力すると、ステップS3023に進んでフレーム分割部2401がフレーム分割を行なう。次にステップS3025では、急増部検出部2701が、低相関信号の急増部を検出する。ステップS3027では、遅延時間算出部2702が急増部のフレーム内相対位置(フレーム開始から急増部の存在するタイミングまでの時間)をn0として出力する。
次に、ステップS3029において位相変換部2703は、遅延時間n02720を周波数領域の位相に変換する。ステップS3031において、傾き算出部2704は、導き出した位相を微分して、周波数領域での位相の傾きを導き出し、ステップS3033でバッファリングする。
図30Cは、算出部2381が行なう傾き算出処理の流れを説明するためのフローチャートである。ステップS3051で信号を入力するとステップS3053に進み、フレーム分割、窓処理を経てフーリエ変換により、周波数領域での位相成分信号を抽出する。次にステップS3055で、周波数のステップkを1に設定すると、ステップS3057では、位相P(k)を微分して傾きΔP(k)を算出し、ステップS3059において、その傾きをバッファリングする。ステップS3061では、k=F(Fはフレーム全体の周波数成分数)を判定し、k=Fでなければ、ステップS3063に進み、k=k+1としてステップS3057に戻り、フレーム全体にわたって周波数ごとに傾き算出を行なう。
以上の処理により、信号の急変をより正確に検出することができ、適宜、その急変部を適切に抑圧することが可能となる。なお、本実施形態では位相の傾きを微分値で求めたが、単位ベクトルの回転量など別の指標を求めて、判定に用いてもよい。
[第8実施形態]
次に本発明の第8実施形態に係る雑音抑圧装置について、図31を用いて説明する。図31は、本実施形態に係る雑音抑圧装置の機能構成を説明するための図である。本実施形態に係る雑音抑圧装置は、上記第7実施形態と比べると、変換部3101において、窓がけ処理部2402における窓がけ処理後の信号を、算出部2382に出力する点で異なる。その他の構成および動作は、第7実施形態と同様であるため、同じ構成および動作については同じ符号を付してその詳しい説明を省略する。
本実施形態によれば、窓がけ後の時間領域信号、すなわちフーリエ変換に用いる信号と同じ信号から求めた傾きを用いて平行度を求めることができる。これにより、周波数領域信号を用いて求めた位相の傾きとの整合性が高くなり、より正確な信号の急変判定を行うことができる。
[第9実施形態]
次に本発明の第9実施形態に係る雑音抑圧装置3200について、図32を用いて説明する。図32は、本実施形態に係る雑音抑圧装置3200の機能構成を説明するための図である。本実施形態に係る雑音抑圧装置3200は、上記第7実施形態と比べると、振幅平坦度算出部3201を追加的に備えている点で異なる。その他の構成および動作は、第2実施形態と同様であるため、同じ構成および動作については同じ符号を付してその詳しい説明を省略する。
振幅平坦度算出部3201は、周波数軸に沿った振幅変化を算出して、急変判定部3209に供給する。隣接する周波数間で振幅の変化が小さい周波数が信号急変を表す。振幅変化は、帯域ごと、あるいは全周波数のいずれかに対して、一つの平坦度を求めてもよい。具体的には、以下の式のように、平坦度を表わすFM(Flatness Measure)を求める。x(n)は周波数nにおける振幅またはパワースペクトル、Nは平坦度算出区間に含まれる周波数成分の数である。
Figure 0006528679

FMは0.0から1.0の値をとる。完全に平坦な場合、FMは1.0である。平坦度については、非特許文献3に開示がある。
平坦度はまた、別の指標を用いて表すこともできる。例えば、帯域ごと、あるいは全周波数のいずれかに対してx(n)の平均を求め、各周波数成分nにおけるx(n)とその平均値との差分二乗値総和を帯域ごと、あるいは全周波数の平坦度とすることができる。全周波数の代わりに、単一あるいは複数の周波数帯域において前記差分二乗値総和を一つ求め、これを平坦度とすることもできる。このようにして求めた平坦度は、完全に平坦な場合に0.0、平坦度が低下するに従って大きな値をとる。
別の平坦度の指標として、滑らかさを用いてもよい。滑らかさは、周波数軸に沿った隣接サンプル間の差分絶対値総和で表現することができる。凹凸の多い(滑らかでない)波形で滑らかさは大きな値を、少ない(滑らかな)波形で小さな値をとる。この指標は、全変動量(TV: Total Variation)として知られている。
これまで、平坦度として周波数軸に沿った平坦度を用いてきたが、時間軸に沿った平坦度を利用することもできる。信号急変部では急激に振幅およびパワーが増加するので、この性質を用いると、時間軸に沿った平坦度が低いときに、信号急変が存在すると判定することができる。具体的には、現フレームと直前フレームの振幅またはパワーの差が一定値以上となるときに、平坦度が低い、すなわち信号急変が存在すると判定する。また、数フレーム過去のフレームから現在のフレームまでの複数フレームに対して隣接フレーム間の振幅またはパワーの差を求め、これらを線形または非線形結合した結果を平坦度として定義することもできる。過去のフレームの情報を用いることで、低域成分を含むなまった信号急変部を検出しやすくなり、その抑圧性能が向上する。なお、隣接フレームの振幅またはパワー差を計算する際には、これを周波数成分ごと、帯域ごと、あるいは全周波数のいずれかに対して計算してもよい。さらに、単一または複数の帯域に対して前記振幅またはパワー差を計算することもできる。例えば、単一の帯域、特に高周波域で前記振幅またはパワー差を計算することによって、音声やその他の信号の影響を低減することができ、より正確に信号急変部を検出することが可能となる。
これまで説明した2つの平坦度、すなわち周波数軸に沿った平坦度と時間軸に沿った平坦度は、それぞれを単独で用いることもできるし、両方を組み合わせて用いることもできる。組合せの例としては、2つの平坦度の線形または非線形結合に基づく信号急変部の検出や、それぞれの平坦度に基づいた検出結果の組合せなどがある。周波数方向の平坦度は大きいときに、時間方向の平坦度は小さいときに信号急変の検出と判定するので、組合せの際にどちらかを逆数にしてから組み合わせるなどの工夫が必要となる。
振幅平坦度算出部3203の本質的な機能は、振幅の情報を用いて、信号急変の存在可能性を求めることであるから、その他の方法で代替してもよい。振幅情報を用いて信号急変を検出する技術は、非特許文献6、非特許文献7、非特許文献8などに開示されている。
急変判定部3209は、傾きの類似度(平行度)と振幅平坦度の2つの指標を用いて、信号の急変を判定する。振幅が周波数軸に沿って平坦である(バラツキが小さい)とき、信号急変部である可能性が高いと考えられるからである。これは、信号急変がパルス性(短時間に振幅が増加して、減少する)であることと、インパルスのフーリエ変換が白色信号(全周波数で振幅およびパワーが等しい)となることから自明である。判定の方法としては例えば以下のいずれかを選択することができる。
(1)平行度と振幅平坦度が共にそれぞれの条件を満たす場合(例えば傾きの差分値がN=0.1以下で、振幅平坦度FMがМ=0.8以上の場合)、信号の急変があると判定
(1.5)平行度と振幅平坦度を単独で用いたときの判定結果の論理和。信号急変の存在可能性を算出するときは、平行度による存在可能性と振幅平坦度による存在可能性のうち、大きい方(または小さい方)に基づく判定
(2)平行度と振幅平坦度の両方の平均が条件を満たす場合(例えば傾きの差分値PXと、振幅平坦度FMと1.0との差分値QX=(1.0−FM)との平均AV1=(PX+QX)/2が0.1以下)に、信号の急変があると判定
(3)傾きの差分値と振幅平坦度とに対して重み付けを行ないつつ両方を合わせた複合的な条件を満たす場合(例えば傾きの差分値PXと、振幅平坦度FMと1.0との差分値QX=(1.0−FM)との重み付け平均AV2=(0.8×PX+0.2×QX)が0.1以下)に、信号の急変があると判定
(4)傾きの差分値と振幅平坦度とを、線形または非線形関数を用いて組み合わせ、組み合わせた結果が一定値より大きいときに信号の急変があると判定。時間方向の振幅平坦度が含まれるときには、その逆数を代わりに用いる。
(5)傾きの差分値と振幅平坦度との中でいずれか理想値により近い方(差分値は小さい方、平坦度は大きい方)のみを用いて、その理想値により近い方が条件を満たす場合に信号の急変があると判定。時間方向の振幅平坦度が含まれるときには、その逆数を代わりに用いる。
(6)事前に検出しようとする急変信号の振幅またはパワースペクトルに関する情報が得られて、振幅またはパワースペクトルが平坦であれば、傾きの差分値の重みを小さくする。
(7)事前に検出しようとする急変信号の振幅またはパワースペクトルに関する情報が得られて、振幅またはパワースペクトルの最小値よりも入力された劣化信号の振幅またはパワースペクトルが小さいときは、信号急変を検出するための閾値を一時的に大きく変更して、検出されにくくする。
特定の信号を処理する場合、例えばノイズが小さくてインパルスに近い衝撃音を検出・抑圧する場合、振幅またはパワーに関する情報の方が位相情報よりも信頼できるときがある。例えば、静かな環境でピストルの発砲音を検出する際には、振幅のみを用いて検出してもよい。一方、ノイズの振幅またはパワーが大きく変化する場合、例えば、空港の警備での発砲音の検出の場合、静かな(ノイズが小さい)状況と、ノイズが大きい状況とで、振幅と位相の重み付けを変えることが効果的である。この場合、振幅と位相の重み付けを、ノイズの有無や時間帯に応じて変化させてもよい。例えば、管制塔からフライトスケジュールの最新情報を入手することができれば、飛行機の離着陸時刻が分かるため、飛行機が来るタイミング(ノイズが多いタイミング)では位相の重み付けを大きくして発砲音の検出に用いることができる。発砲音(検出対象の衝撃音)以外の信号が混在するときには、位相情報を用いた衝撃音の検出が振幅を用いた検出よりも効果的だからである。
一方、ノイズが小さい状況では、入力された劣化信号の周波数領域ベクトルの絶対値、つまり振幅値を重視して判定する方が効果的に衝撃音を検出できる。もちろんここでも振幅スペクトルの代わりにパワースペクトルの値を用いてもよい。また、信号の種類によって、衝撃音の振幅が平坦でない場合がある。その場合は、位相平坦度の重みを大きくして検出を行なうことにより高精度で信号の急変を検出できる。さらに、衝撃音の振幅またはパワースペクトルに関する情報が事前に得られるときには、得られた情報を用いて振幅が平坦なときと同じ結果が得られるように、振幅平坦度の計算結果を補正することもできる。具体的には、振幅スペクトル2330を衝撃音の振幅またはパワースペクトル形状の逆数を各周波数成分で乗じた後に、振幅平坦度を算出する。
以上説明したとおり本実施形態によれば、振幅平坦度を併せて用いて信号急変部を検出することができる。これにより、信号急変(衝撃音)をより正確に検出することができ、適宜、その信号急変(衝撃音)を適切に抑圧することが可能となる。
[第10実施形態]
なお、上記第6乃至第9実施形態では、信号急変部を抑圧することを目的とした雑音抑圧装置に信号急変検出方法を適用した場合について説明したが、本発明はこれに限定されるものではない。衝撃音(急激に立ち上がってすぐにたち下がる信号)の検出を目的とした様々な装置、システムおよび状況で利用することができる。また、信号が急激に立ち上がって(またはたち下がって)そのままとなる場合であっても、急変部として検出できる。
例えば、現在のオーディオ符号化方式(例えばMPEG AACの符号化部)において、いわゆるアタックと呼ばれる信号急変部では、通常とは異なった情報圧縮方式が採用されているが、その際の信号急変部の検出にも適用することができる。信号急変部では、分析窓長を変更して、プリエコーと呼ばれる先行雑音の抑圧を行うので、検出が必要となる。振幅やエントロピーの変化などを用いて検出する方法に比べて精度良く急変を検出し、効果的に情報圧縮を行なうことができる。
また、図33に示すように車両3300にマイク3301と算出部2381、2382と急変判定部2309と映像記録部3302とを搭載する適用例も考えられる。映像記録部3302が衝撃音の検出をトリガーにしてカメラによる撮影画像の上書き保存禁止を行なえば、事故状況の記録を残すことができる。その際に、衝撃音検出から一定時間の遅延の後に、上書き保存禁止を行ってもよい。衝撃そのものをトリガーにした場合と異なり、衝撃が小さい場合や、他の車両が事故にあった場合にも事故状況の自動記録を行なえるという利点がある。
また、図34に示すように、心電計3400に算出部2381、2382と急変判定部2309とアラーム部3401とを接続する適用例も考える。心電図の異常心拍の検出をより正確かつ効果的に行なうことができる。特に雑音の多い場合に有効である。同様に、胎児のエコーのモニターにも適用できる。雑音による妨害で正しく心音がとれない場合があるが、そのようなときにも本技術は有効である。すなわち生体信号の急変検出に広く適用できる。
[第11実施形態]
本発明の第11実施形態としての信号処理装置3500について、図35を用いて説明する。信号処理装置3500は、入力信号急変を検出するための装置である。図35に示すように、信号処理装置3500は、変換部3501と相関除去部3502と信号急変検出部3504とを含む。
変換部3501は、入力信号3510を、周波数領域における位相成分信号3520および振幅成分信号3530に変換する。
相関除去部3502は、入力信号3510に含まれる、時間相関のある成分を除去して、入力信号3510よりも時間相関の小さい低相関信号3550を生成する。
信号の急変を構成する成分は、過去の信号に基づいて予測することができず、時間相関が小さい。一方、相関除去部3502では、信号の急変成分以外の時間相関が大きい成分を除去して、信号の急変成分を強調する。
相関除去は、通常、相関成分の予測と予測信号の入力信号からの減算による出力計算の2つの処理から構成される。予測は、過去の信号サンプルの線形結合で表すことができ、線形結合の重み係数、すなわち予測フィルタの係数は、レビンゾン−ダービン法、共分散法、最小二乗法などが知られている。このようにして求めた予測フィルタ係数は、予測誤差を最小化するものとなっている。
信号急変判定部3504は、低相関信号3550と位相成分信号3520とに基づいて、入力信号3510に含まれる急変を判定する。
以上の構成により、信号の急変成分に対応した低相関信号と位相成分信号とを用いるため、入力信号の急変を効果的に検出することができる。
[第12実施形態]
本発明の第12実施形態としての信号処理装置3600について、図36を用いて説明する。信号処理装置3600は、入力信号急変を検出するための装置である。図36に示すように、信号処理装置3600は、変換部3601と相関除去部3602と第1算出部3603と第2算出部3605と信号急変判定部3609とを含む。
変換部3601は、入力信号3610を、周波数領域における位相成分信号3620および振幅成分信号3630に変換する。相関除去部3602は、入力信号3610に含まれる、時間相関のある成分を除去して、入力信号3610よりも時間相関の小さい低相関信号3640を生成し、第1算出部3603に供給する。第1算出部3603は、低相関信号3640の時間領域における急増部の位置に基づいて、位相の傾き3650を算出する。孤立パルスをフーリエ変換したときの周波数方向の位相の傾きは、孤立パルスの位置に対応して一意に求まることが知られている。例えば、変換部におけるフレーム長がNサンプルで孤立パルス位置がn0であるとき、位相の傾きは−2πn0/Nとなる。急増部を同定するための指標としては、例えば振幅絶対値の最大値を用いることができる。この指標は、実際の信号が孤立パルスに近いとき(ほぼ単峰性形状)には正確な位置を与える。一方、双峰性の形状を有するパルスのときは、振幅最大値は正確な位置を与えない。このような場合は、振幅絶対値の最大値と振幅絶対値の2番目に大きな値を用いた指標が有効である。例えば、両者の位置の中間値や両者の位置の重みづけ平均などを用いることができる。パルスがより時間軸に沿って広がっているときには、パルスのおおよその中心部を利用することで正確な位置を求めることができる。そのような指標には重心がある。第2算出部3605は、周波数領域における位相成分信号3620の傾き3660を算出する。信号急変判定部3609は、第1算出部3603によって算出された傾きと第2算出部3605によって算出された傾きに基づいて入力信号の急変を判定する。
以上の構成により、周波数領域における位相成分信号の傾きと信号の急変成分に対応した低相関信号の急増部から求めた位相の傾きとの一致程度を用いて、入力信号の急変を効果的に検出することができる。
[第13実施形態]
《全体構成》
本発明の第13実施形態としての雑音抑圧装置について図37A乃至図45を用いて説明する。本実施形態の雑音抑圧装置は、例えばデジタルカメラ、ノートパソコン、携帯電話、キーボード、ゲーム機のコントローラ、携帯電話の押しボタンなどの雑音抑圧に適用できる。すなわち、音声、音楽、環境音などの目的とする信号を、これらに重畳された信号(ノイズまたは妨害信号)に対して強調することができる。ただし、本発明はこれに限定されるものではなく、入力信号からの信号急変検出を要求されるあらゆる信号処理装置に適用可能である。なお、本実施形態では、信号の急変の一例として、衝撃音を検出して抑圧する雑音抑圧装置について説明する。本実施形態としての雑音抑圧装置は、例えば、マイクの近くでボタン押下などの操作がなされるような形態において、かかるボタン操作により発生する衝撃音を適切に抑圧する。簡単に説明すると、衝撃音を含む時間領域信号を周波数領域信号に変換し、周波数空間における位相成分の傾きを算出する。また、時間領域信号の相関を除去して得られる低相関信号の急増部を孤立パルスとみなしたときの周波数領域の位相の傾き、すなわち−2πn0/Nを求める。n0は急増部の位置である。そして、それら2種類の位相の傾きの一致程度に応じて、衝撃音の存在を判定する。
図37Aは、雑音抑圧装置3700の全体構成を示すブロック図である。入力端子3706には、劣化信号(所望信号と雑音の混在する信号)が、サンプル値系列として供給される。入力端子3706に供給された劣化信号は、変換部3701においてフーリエ変換などの変換を施されて複数の周波数成分に分割される。複数の周波数成分は周波数ごとに独立して処理される。ここでは、特定の周波数成分に注目して説明を続ける。周波数成分のうち振幅スペクトル(振幅成分)3730は雑音抑圧部3705へ供給され、位相スペクトル(位相成分)3720は位相制御部3702および算出部3781に供給される。さらに、入力端子3706に供給された劣化信号は、相関除去部3712で相関成分を除去されて低相関信号3770となり、算出部3782に供給される。なお、ここでは変換部3701が雑音抑圧部3705に劣化信号振幅スペクトル3730を供給しているが、本発明はこれに限定されるものではなく、振幅スペクトルの二乗に相当するパワースペクトルを雑音抑圧部3705に供給してもよい。
雑音抑圧部3705は、変換部3701から供給される劣化信号振幅スペクトル3730を用いて、雑音を推定し、推定雑音スペクトルを生成する。また、雑音抑圧部305は、変換部3701から供給された劣化信号振幅スペクトル3730と、生成した推定雑音スペクトルとを用いて雑音を抑圧し、雑音抑圧結果としての強調信号振幅スペクトルを振幅制御部3703に伝達する。さらに雑音抑圧部3705は、急変判定部3709から判定結果を入力し、信号の急変の有無またはその程度に応じて、雑音の抑圧の程度を変更する。雑音抑圧部3705は目的音検出を用いて保護をする一方、衝撃音検出時は振幅を推定背景音に置換する。
位相制御部3702は、変換部3701から供給された劣化信号位相スペクトル3720を回転(シフト)させ、強調信号位相スペクトル3740として逆変換部3704へ供給する。また、位相の回転量(シフト量)を、振幅制御部3703へ伝達する。振幅制御部3703は、位相制御部3702から位相の回転量(シフト量)を受け取って振幅補正量を算出し、その振幅補正量を用いて、強調信号振幅スペクトルを各周波数で補正し、補正振幅スペクトル3750を逆変換部3704へ供給する。逆変換部3704は、位相制御部3702から供給された強調信号位相スペクトル3740と、振幅制御部3703から供給された補正振幅スペクトル3750とを合成して逆変換を行い、強調信号として、出力端子3707に供給する。
算出部3781は、変換部3701から供給された位相成分信号3720を周波数で微分することにより、各周波数での位相の変化(傾き)を算出する。一方、算出部3782は、フレームに分割された低相関信号3770を入力して信号絶対値を算出し、信号絶対値の急増部を示す位置に基づいて、周波数領域の位相の傾きを算出する。
急変判定部3709は、算出部3781、3782から提供された位相の傾きを比較し、それらの類似度に基づいて、信号の急変がどの程度存在するか(存在可能性)を周波数点ごとに判定する。具体的には、算出部3781、3782から、位相成分信号に対応する回転ベクトルを入力し、それら2つの回転ベクトル同士の回転ベクトルを算出して、その絶対値が0に近い場合(あらかじめ定められた閾値0.1以下の場合)に、信号の急変が存在したと判定する。
傾きの類似度は、時間領域信号から求めた傾きと周波数領域信号から求めた傾きの差分絶対値を用いることができるが、これに限定されない。2つの傾きの比の値と1との距離や、両者の和をどちらかの傾きの2倍で正規化した値と1との距離などを用いてもよい。類似度に基づく存在可能性は、例えば、次のようにして求めることができる。まず、正の値を閾値として定める。差分絶対値がこの閾値よりも大きいとき、存在可能性を0とする。また、差分絶対値が0に等しいとき、存在可能性を1とする。存在可能性の一般値は、差分絶対値の関数として定義する。このような関数の最も簡単なものは、直線である。存在可能性として、差分絶対値に比例した値が定められる。直線の傾きとy切片(前記差分絶対値がゼロのときの関数値)は、前述の差分絶対値が0および1に等しいときの境界条件を満足するように定める。関数としては、任意の線形または非線形関数や多項式などを用いてもよい。
《相関除去部の構成》
図37B、図37Cは、相関除去部3712の構成を示すブロック図である。図37Bに示すように、相関除去部3712は予測部3783、減算器3784、フレーム分割部3785を含む。劣化信号サンプル3710は予測部3783に供給され、予測部3783は相関のある信号3786を予測して減算器3784に供給する。予測の方法としては、適応フィルタを用いた線形予測やレビンソン・ダービン法などが知られている。減算器3784は、予測部3783から供給された予測信号3786を劣化信号3710から減算して、その差を低相関信号3787としてフレーム分割部3785に供給する。フレーム分割部3785は、低相関信号3787に対してフレーム分割を施し、フレーム化された低相関信号3770として出力する。
図37Cは、図37Bとは異なり、まずフレーム分割を行ってから、予測を行うこともできる。フレーム分割の後で予測を行う構成を示す。図37Cは、フレーム分割部3795、予測部3793、減算器3794を含む。フレーム分割部3795は、劣化信号3710に対してフレーム分割を施し、分割された信号サンプル3796を予測部3793と減算器3794に供給する。予測部3793は、フレーム化された劣化信号3796に含まれる相関のある信号を予測して、減算器3794に供給する。減算器3794は、予測部3793から供給された予測信号3797をフレーム化された劣化信号3796から減算して、その差をフレーム化された低相関信号3770として出力する。
《変換部の構成》
図38Aは、変換部3701の構成を示すブロック図である。図38Aに示すように、変換部3701はフレーム分割部3801、窓がけ処理部(windowing unit)3802、およびフーリエ変換部3802を含む。劣化信号サンプルは、フレーム分割部3801に供給され、K/2サンプルごとのフレームに分割される。ここで、Kは偶数とする。フレームに分割された劣化信号サンプル3804は、窓がけ処理部3802に供給され、窓関数(window function)であるw(t)との乗算が行なわれる。第nフレームの入力信号yn(t) (t=0, 1, ..., K/2-1) に対するw(t)で窓がけ(windowing)された信号は、次式で与えられる。
Figure 0006528679

また、連続する2フレームの一部を重ね合わせ(オーバラップ)して窓がけしてもよい。オーバラップ長としてフレーム長の50%を仮定すれば、t=0, 1, ..., K/2-1 に対して、以下の式で得られる左辺が、窓がけ処理部3802の出力となる。
Figure 0006528679

実数信号に対しては、左右対称窓関数が用いられる。また、窓関数は、変換部3701の出力を逆変換部3704に直接供給したときの入力信号と出力信号が計算誤差を除いて一致するように設計される。これは、w2 (t)+w2 (t+K/2)=1 となることを意味する。
以後、連続する2フレームの50%をオーバラップして窓がけする場合を例として説明を続ける。w(t)としては、例えば、次式に示すハニング窓を用いることができる。
Figure 0006528679

このほかにも、ハミング窓、三角窓など、様々な窓関数が知られている。窓がけされた出力はフーリエ変換部3803に供給され、劣化信号スペクトルYn(k)に変換される。劣化信号スペクトルYn(k)は位相と振幅に分離され、劣化信号位相スペクトル arg Yn(k)は、位相制御部3702と算出部3781に、劣化信号振幅スペクトル|Yn(k)|は、雑音抑圧部3705に供給される。既に説明したように、振幅スペクトルの代わりにパワースペクトルを利用することもできる。
《逆変換部の構成》
図38Bは、逆変換部3704の構成を示すブロック図である。図38Bに示すように、逆変換部3704は逆フーリエ変換部3811、窓がけ処理部3812およびフレーム合成部3813を含む。逆フーリエ変換部3811は、振幅制御部3703から供給された強調信号振幅スペクトル3750と位相制御部3702から供給された強調信号位相スペクトル3740 arg Xn(k)とを乗算して、強調信号(以下の式の左辺)を求める。
Figure 0006528679
得られた強調信号に逆フーリエ変換を施し、1フレームがKサンプルを含む時間領域サンプル値系列xn(t) (t=0, 1, ..., K-1)として、窓がけ処理部3812に供給され、窓関数w(t)との乗算が行なわれる。第nフレームの入力信号xn(t) (t=0, 1, ..., K/2-1)に対してw(t)で窓がけされた信号は、次式の左辺で与えられる。
Figure 0006528679
また、連続する2フレームの一部を重ね合わせ(オーバラップ)して窓がけしてもよい。フレーム長の50%をオーバラップ長として仮定すれば、t=0, 1, ..., K/2-1 に対して、以下の式の左辺が、窓がけ処理部3812の出力となり、フレーム合成部3813に伝達される。
Figure 0006528679
フレーム合成部3813は、窓がけ処理部3812からの隣接する2フレームの出力を、K/2サンプルずつ取り出して重ね合わせ、以下の式によって、t=0, 1, ..., K-1における出力信号(式の左辺)を得る。得られた強調信号3760は、フレーム合成部3813から出力端子3707に伝達される。
Figure 0006528679
なお、図38Aと図38Bにおいて変換部と逆変換部における変換をフーリエ変換として説明したが、フーリエ変換に代えて、アダマール変換、ハール変換、ウェーブレット変換など、他の変換を用いることもできる。ハール変換は、乗算が不要となり、LSI化したときの面積を小さくすることができる。ウェーブレット変換は、周波数によって時間解像度を異なったものに変更できるために、雑音抑圧効果の向上が期待できる。
また、変換部3701において得られる周波数成分を複数統合してから、雑音抑圧部3705で実際の抑圧を行うこともできる。その際、聴覚特性の弁別能力が高い低周波領域から、能力が低い高周波領域に向かって、よりたくさんの周波数成分を統合することによって、高い音質を達成することができる。このように、複数の周波数成分を統合してから雑音抑圧を実行すると、雑音抑圧を適用する周波数成分の数が少なくなり、全体の演算量を削減することができる。
《雑音抑圧部の構成》
雑音抑圧部3705は、変換部3701から供給される劣化信号振幅スペクトルを用いて雑音を推定し、推定雑音スペクトルを生成する。そして、変換部3701からの劣化信号振幅スペクトルと生成した推定雑音スペクトルとを用いて抑圧係数を求め、劣化信号振幅スペクトルに乗じ、強調信号振幅スペクトルとして、振幅制御部3703へ供給する。
また、急変判定部3709から急変がどの程度存在するかの情報(信号の急変が存在する確からしさ、存在可能性)を受けて、信号の急変が存在する可能性に応じて、雑音抑圧の程度を変更することもできる。さらに、信号の急変が存在する可能性を周波数成分、周波数帯域(任意の数の連続する周波数成分を統合したもの)、あるいはフレーム単位で判定し、その急変を抑圧すべく、前記周波数成分、周波数帯域、あるいはフレーム単位で異なった信号処理を施すことができる。
雑音の推定には、非特許文献1や非特許文献2に記載の方法など、様々な推定方法が利用できる。
例えば、非特許文献1には、推定雑音スペクトルを、目的音が発生していないフレームの劣化信号振幅スペクトルの平均値とする方法が開示されている。この方法では目的音の発生を検出する必要がある。目的音の発生している区間は、強調信号のパワーで判断することができる。
理想的な動作状態として、強調信号は雑音以外の目的音となっている。また、目的音や雑音のレベルは、隣接フレーム間で大きく変化しない。これらのことから、1フレーム過去の強調信号レベルを雑音区間判定の指標とする。1フレーム過去の強調信号パワーが一定値以下の時には、現フレームを雑音区間と判定する。雑音スペクトルは、雑音区間と判定されたフレームの劣化信号振幅スペクトルを平均化することで推定できる。
また、非特許文献1には、推定雑音スペクトルを、劣化信号振幅スペクトルが供給され始めた推定初期の平均値とする方法も開示されている。この場合、推定が開始された直後には目的音が含まれないという条件を満たす必要がある。条件が満たされる場合、推定初期の劣化信号振幅スペクトルを推定雑音スペクトルとすることができる。
さらに、非特許文献2には、推定雑音スペクトルを、統計的な劣化信号振幅スペクトルの最小値から求める方法が開示されている。この方法では、統計的に一定時間における劣化信号振幅スペクトルの最小値を保持し、その最小値から雑音スペクトルを推定する。劣化信号振幅スペクトルの最小値は、雑音スペクトルのスペクトル形状と似ているため、雑音スペクトル形状の推定値として用いることができる。しかし、最小値では、本来の雑音レベルより小さくなる。そのため、最小値を適切に増幅させたものを推定雑音スペクトルとして用いる。
雑音抑圧部3705においては、様々な抑圧を行うことが可能であるが、代表的なものとして、SS(Spectrum Subtraction:スペクトル減算)法とMMSE STSA(Minimum Mean-Square Error Short-Time Spectral Amplitude Estimator:最小二乗平均誤差短時間振幅スペクトル推定)法とが挙げられる。SS法の場合は、変換部3701から供給された劣化信号振幅スペクトルから推定雑音スペクトルを減算する。MMSE STSA法の場合は、変換部3701から供給された劣化信号振幅スペクトルと生成した推定雑音スペクトルとを用いて、抑圧係数を計算し、この抑圧係数を劣化信号振幅スペクトルに乗算する。この抑圧係数は、強調信号の平均二乗パワーを最小化するように決定される。
また、雑音抑圧部3705は、急変判定部3709から急変判定結果(信号の急変が存在するか否かの情報)を入力し、信号の急変の有無またはその程度に応じて、雑音抑圧の程度を変更する。例えば、信号急変のあった周波数成分、周波数帯域、あるいはフレーム単位で、その急変を抑圧すべく信号処理を施すことができる。
急変判定部3709で急変と判定されたときには、劣化信号振幅スペクトルと推定雑音スペクトルのうち小さい方を、強調信号振幅スペクトルとして、振幅制御部3703へ供給する。すなわち、劣化信号振幅スペクトルが推定雑音スペクトルより小さいときには劣化信号振幅スペクトルをそのまま出力し、それ以外のときには入力信号を推定雑音スペクトルで置き換えて出力することもできる。
さらに、この置き換えに先立って、重要な劣化信号振幅スペクトル成分を検出して、検出された重要な劣化信号振幅スペクトル成分を推定雑音スペクトルによる置き換えの対象から除外することもできる。重要な劣化信号振幅スペクトル成分を検出する際の重要度の指標としては、劣化信号振幅スペクトルの大きさを用いることができる。振幅が大きな成分は目的とする信号の成分である確率が高く、これを保持することは目的とする信号の音質劣化を防止することにつながる。
また、重要度の指標として、劣化信号振幅スペクトルのピーク性を用いることもできる。ピーク、すなわち周波数軸に沿って周辺よりも大きな値を有する劣化信号振幅は、目的とする信号の成分である確率が高く、これを保持することは目的とする信号の音質劣化を防止することにつながる。特に、顕著なピーク、すなわち周辺の振幅値よりも著しく大きな振幅値はその重要度が高いので、確実に保護することで目的とする信号の音質をさらに高めることができる。
ピークの検出は、例えば、非特許文献3の純音成分検出方法や、非特許文献4に、その方法が開示されている。さらに、検出されたピークを所定の条件に従って評価し、条件を満たさないピークは除外してもよい。例えば、前記推定雑音よりも小さな値をとるピークは、目的とする信号である可能性は低い。すなわち、推定雑音を基準として、それよりも十分に大きいものだけをピークとして残し、それ以外を除外することができる。十分に大きいかどうかは推定雑音の定数倍と比較することで、判定できる。このように、検出されたピークが所定の条件を満たすかどうかを評価してから最終的なピーク成分を選択することによって、誤ったピークの検出を低減し、信号急変部の抑圧効果を高くすることができる。
また、急変存在の確からしさに応じて、振幅制御部3703へ供給する信号を変化させることもできる。その置き換えを行った結果と劣化信号振幅スペクトルを、急変存在の確からしさに対応して混合したものを、強調信号振幅スペクトルとして出力する。急変存在の確からしさが高いほど、置き換えを行った結果に大きな重みをつけて、混合処理を実行する。
つまり、雑音抑圧部3705は、信号の急変の存在可能性に応じて、抑圧度0、抑圧度1、抑圧度2というように多段で抑圧を行なってもよい。あるいは急変判定部の判定結果(例えば0〜1の数値)に応じて無段階に抑圧の程度を変えてもよい。
《位相制御部および振幅制御部の構成》
図39は位相制御部3702および振幅制御部3703の構成を示すブロック図である。図39に示すように、位相制御部3702は位相回転部3901と回転量生成部3902とを含み、振幅制御部3703は、補正量算出部3903と振幅補正部3904とを含む。
回転量生成部3902は、急変判定部3709から「信号の急変が存在する」と判定された周波数成分について、劣化信号位相スペクトルの回転量を生成し、位相回転部3901と補正量算出部3903に供給する。位相回転部3901では、回転量生成部3902から回転量が供給されると、変換部3701から供給された劣化信号位相スペクトル3720を、供給された回転量だけ回転(シフト)させ、強調信号位相スペクトル3740として逆変換部3704へ供給する。
補正量算出部3903では、回転量生成部3902から供給される回転量に基づいて、振幅の補正係数を決定し、振幅補正部3904に供給する。
回転量生成部3902は、例えば乱数によって回転量を生成する。乱数により、劣化信号位相スペクトルを各周波数で回転させると、劣化信号位相スペクトル3720の形状が変化する。この形状の変化により、衝撃音などの信号急変部の特徴を弱めることができる。
乱数には、その発生確率が一様な一様乱数や、発生確率が正規分布を示す正規乱数などがあるが、まず、一様乱数による回転量の生成法を説明する。一様乱数は線形合同法などで発生させることができる。例えば、線形合同法で発生させた一様乱数は、0〜(2^M)−1の範囲に一様に分布する。ここで、Mは任意の整数であり、^はべき乗を表している。位相の回転量φは、0〜2πの範囲に分布させる必要がある。そこで、発生させた一様乱数を変換する。変換は、以下の式で行う。ここで、Rは一様乱数であり、Rmaxはその一様乱数が発生しうる最大の値である。前述した線形合同法で発生させる場合には、Rmax=(2^M)-1となる。
Figure 0006528679
計算の簡単化のために、Rの値をそのまま回転量とすることもできる。回転量であるので2πはちょうど一回転を表す。位相を2π回転させた場合は回転させていない場合と同一である。よって、2π+αという回転量は、回転量がαの場合と同じになる。ここでは、線形合同法により一様乱数を発生させた場合を説明したが、それ以外の方法で一様乱数を発生させた場合でも、上式により回転量φを求めればよい。急変判定部3709の判定結果に応じて、いつどのくらい乱数化を行なうのかを決定してもよい。
位相回転部3901は、回転量生成部3902から回転量を受け取り、劣化信号位相スペクトルを回転させる。もし、劣化信号位相スペクトルが角度で表現されている場合には、その角度に回転量φの値を加算することで回転させることができる。劣化信号位相スペクトルが複素数の正規ベクトルで表現されている場合には、回転量φの正規ベクトルを求め、劣化信号位相スペクトルに乗算することで回転させることができる。
回転量φの正規ベクトルは、以下の式で求められる。ここで、Φは回転ベクトルであり、jはsqrt(-1)を示す。なお、sqrtは二乗根を表している。
Figure 0006528679
補正量算出部3903による、補正係数算出方法は、図5の補正量算出部503について説明した方法と同様であるため、ここでは説明を省略する。
《算出部および急変判定部の構成》
図40は、算出部3781、3782および急変判定部3709の内部構成について説明するための図である。図40に示すように、算出部3782は、急増部検出部4001、遅延時間算出部4002、位相変換部4003および傾き算出部4004を備える。一方、算出部3781は、傾き算出部4005を備える。
急増部検出部4001は、フレーム内の信号の絶対値を算出し、その絶対値の最大値4010を検出する。遅延時間算出部4002は、フレーム内の最大値を示す相対位置(フレーム開始から最大値の存在するタイミングまでの時間)をn0として出力する。
次に、位相変換部4003は、遅延時間τ4020を周波数領域の位相に変換する。具体的には以下の式に基づいて変換する。ここで、Lは変換部3701のフレーム長、0≦n0≦L―1である。入力が振幅aの孤立パルスであることを仮定すると、フーリエ変換によって得られるk番目の周波数成分D(k)は、次式で与えられる。
D(k)=a・exp(- jθ(k))θ(k)=−2π・k・n0/L
傾き算出部4004は、このように導き出した位相4030を微分して、周波数領域での位相の傾き4040を以下のように導き出す。傾き4040=−2π・n0/L
一方、傾き算出部4005は、変換部3701から入力した位相成分信号を微分して、周波数領域での位相の傾き4050を導き出す。傾き算出部4004、4005はそれぞれ、位相の周波数による微分によって傾きを算出してもよいし、他の方法で傾きを算出してもよい。
平行度算出部4006は、傾き算出部4004から提供された傾き4040と傾き算出部4005から提供された傾き4050とを、周波数ごとに比較してその傾きの類似度を算出する。つまり、周波数領域における位相成分信号の、算出部3782が算出した直線に対する算出部3781が算出した直線の平行度を各周波数で算出する。急変判定部4007では、そのような平行度が一定値を越えていれば、信号の急変がその周波数に存在すると判定する。
ここで、周波数ごとではなく周波数帯域(サブバンド)またはフレームごとに判定すると、より大局的な判定によって、信号急変成分以外の位相成分による判定誤りを低減することができる。さらに、周波数帯域ごとまたはフレームごとの判定結果を用いて、周波数ごとの判定結果を修正してもよい。例えば、ある周波数帯域の判定結果が「信号急変が存在する」であるときに、その周波数帯域内の全周波数の判定結果を強制的に「信号急変が存在する」に設定することで、他の信号成分の妨害による判定誤りを低減することができる。その反対に、ある周波数帯域の判定結果が「信号急変が存在しない」であるときに、その周波数帯域内の全周波数の判定結果を強制的に「信号急変が存在しない」に設定することで、他の信号成分の妨害による判定誤りを低減することもできる。あるいは、前記帯域内の各周波数で、判定の容易さ(閾値)を「存在」と判定しやすい方向へ修正して、各周波数独自に判定を行うという構成自体は維持してもよい。周波数ごとまたは周波数帯域ごとに判定結果を求めると、周波数ごとまたは周波数帯域ごとに急変を抑圧することができ、より精度の高い信号急変の抑圧を行なうことが可能となる。
急変判定部3709は判定結果4030として、信号急変あり(1)または信号急変無し(0)を出力する。ただし、急変判定部4007が平行度と対応させた、0と1の間の値を急変の存在可能性として出力するときには、判定結果4030は急変の存在可能性を表す0と1の間の値となる。その場合、信号急変が含まれている尤もらしさを得ることが可能となる。
図41は、位相およびその変化量をグラフに示したものである。周波数領域において、周波数軸に沿って、グラフ4101のように位相が変化する場合、その位相変化量は、周波数領域において、周波数軸に沿って、グラフ4102に示すように変化する。
一方、急増部のフレーム内相対位置から、周波数領域で直線4103として示される位相を算出できる。
本実施形態では、位相成分信号4101と直線4103とが平行になる部分がどの程度あるかに応じて、信号急変の存在を判定する。
位相の傾きを縦軸にとり、周波数を横軸にとると、直線4103の傾きに近似する範囲は、範囲4104で示される。したがって、範囲4104とグラフ4102との重なる部分4105が所定の閾値よりも大きい場合に、急変判定部4007は、信号急変が存在すると判定する。
図42は、本実施形態にかかる雑音抑圧装置3700をソフトウェアを用いて実現する場合のハードウェア構成について説明する図である。
雑音抑圧装置3700は、プロセッサ4210、ROM(Read Only Memory)4220、RAM(Random Access Memory)4240、ストレージ4250、入出力インタフェース4260、操作部4261、入力部4262、および出力部4263を備えている。雑音抑圧装置3700は、カメラ4264を備えていてもよい。プロセッサ4210は中央処理部であって、様々なプログラムを実行することにより雑音抑圧装置3700全体を制御する。
ROM4220は、プロセッサ4210が最初に実行すべきブートプログラムの他、各種パラメータ等を記憶している。RAM4240は、不図示のプログラムロード領域の他に、入力信号310、位相成分信号320、振幅成分信号330、強調信号360を記憶する領域を有している。さらに、RAM4240は、振幅最大値タイミング4010、遅延時間4020、位相信号4030および位相の傾き4040、4050等を記憶する領域を有している。
また、ストレージ4250は、雑音抑圧プログラム4251を格納している。雑音抑圧プログラム4251は、変換モジュール、位相制御モジュール、振幅制御モジュール、逆変換モジュール、雑音抑圧モジュール、位相傾き算出モジュール、および急変判定モジュールを含んでいる。雑音抑圧プログラム4251に含まれる各モジュールをプロセッサ4210が実行することにより、図3Aの変換部301、位相制御部302、振幅制御部303、逆変換部304、雑音抑圧部305、算出部381、382、急変判定部309の各機能を実現できる。なお、ストレージ4250はノイズデータベースを格納してもよい。
プロセッサ4210が実行した雑音抑圧プログラム4251に関する出力である強調信号は、入出力インタフェース4260を介して出力部4263から出力される。これにより、例えば、入力部4262から入力した操作部4261の操作音などを抑圧することができる。また、入力部4262から入力した入力信号に信号急変が含まれたことを検出してカメラ4264による撮影を開始するなどといった適用法も可能である。
図43Aは、上記雑音抑圧プログラム4251による信号急変判定処理の流れを説明するためのフローチャートである。ステップS4301では、相関除去部312、および算出部382において、低相関信号の急増部に対応した位相の傾き算出処理を開始させる。ステップS4303では、算出部381において、周波数領域での位相の傾き算出処理を開始させる。
次にステップS4305において、ステップS4301とステップS4303の両方で傾きを算出するまで待機し、両方のやり方で傾きが算出できれば、ステップS4307に進み、算出した傾きを周波数ごとに比較する。ステップS4309において、傾きの差分絶対値が所定の閾値N以下か否かを判定し、N以下であれば、ステップS4311に進み、その周波数kについて、フラグを立てる(I(k)=1とする)。一方、N以下でない場合、ステップS4313においてI(k)=0とする。ステップS4315ではk=F(Fはフレーム全体の周波数成分数)を判定し、k=Fでなければ、ステップS4317に進み、k=k+1としてステップS4307に戻り、フレーム全体にわたって周波数ごとに傾き比較を行なう。最終的には、ステップS4319において、I(k)=1となったkの周波数で信号の急変ありと判定し、判定結果を、雑音抑圧部3705および位相制御部302に供給する。なお、ステップS4319に変えて、フレーム内でI(k)を積算し、I(k)の積算値が所定の閾値を超えた場合に、急変判定部3709は信号の急変を含むフレームと判定してもよい。また、この際、急変判定結果を次の周波数帯域にハングオーバして積算してもよい。
また、ハングオーバーの作用として、続くフレームにおける閾値Nを大きく、設定することができる。このように続くフレームの閾値を設定することによって、信号急変(衝撃音)の検出を容易にし、検出漏れを低減することができる。
図43Bは、相関除去部3712、および算出部3782が行なう傾き算出処理の流れを説明するためのフローチャートである。まず、ステップS4321で信号を入力すると、ステップS4322に進んで、相関除去部3712が、入力信号310に含まれている時間相関のある成分を予測してこれを取り除き、低相関信号を生成した後にフレーム分割を行なう。ステップS4325では、急増部検出部4001が、低相関信号の急増部を検出する。ステップS4327では、遅延時間算出部4002が急増部のフレーム内相対位置(フレーム開始から急増部の存在するタイミングまでの時間)をn0として出力する。
次に、ステップS4329において位相変換部4003は、遅延時間n04020を周波数領域の位相に変換する。ステップS4331において、傾き算出部4004は、導き出した位相を微分して、周波数領域での位相の傾きを導き出し、ステップS4333でバッファリングする。
図43Cは、算出部3781が行なう傾き算出処理の流れを説明するためのフローチャートである。ステップS4351で信号を入力するとステップS4353に進み、フレーム分割、窓処理を経てフーリエ変換により、周波数領域での位相成分信号を抽出する。次にステップS4355で、周波数のステップkを1に設定すると、ステップS4357では、位相P(k)を微分して傾きΔP(k)を算出し、ステップS4359において、その傾きをバッファリングする。ステップS4361では、k=F(Fはフレーム全体の周波数成分数)を判定し、k=Fでなければ、ステップS4363に進み、k=k+1としてステップS4357に戻り、フレーム全体にわたって周波数ごとに傾き算出を行なう。
以上の処理により、相関を除去した低相関信号を用いて信号急変部での位相の傾きを推定して比較するので、入力信号に時間相関のある成分が含まれている状況において、信号の急変の検出精度を大幅に向上させることができる。例えば、音楽が大音量で鳴っている状況で、信号の急変がある場合、本実施形態の方法によれば、その検出精度を大幅に向上させることができる。結果的に、信号の急変をより正確に検出することができ、適宜、その信号急変を適切に抑圧することが可能となる。なお、本実施形態では位相の傾きを微分値で求めたが、単位ベクトルの回転量など別の指標を求めて、判定に用いてもよい。
[第14実施形態]
次に本発明の第14実施形態に係る雑音抑圧装置について、図44を用いて説明する。図44は、本実施形態に係る雑音抑圧装置4400の機能構成を説明するための図である。本実施形態に係る雑音抑圧装置4400は、上記第13実施形態と比べると、相関除去部3712と算出部3782との間に窓かけ部4486を設けた点が異なる。その他の構成および動作は、第13実施形態と同様であるため、同じ構成および動作については同じ符号を付してその詳しい説明を省略する。
以上説明したとおり本実施形態によれば、窓がけ後の時間領域信号、すなわちフーリエ変換に用いる信号と同じ信号から求めた傾きを用いて平行度を求めることができる。これにより、周波数領域信号を用いて求めた位相の傾きとの整合性が高くなり、より正確な信号の急変判定を行うことができる。
[第15実施形態]
次に本発明の第15実施形態に係る雑音抑圧装置4500について、図45を用いて説明する。図45は、本実施形態に係る雑音抑圧装置4500の機能構成を説明するための図である。本実施形態に係る雑音抑圧装置4500は、上記第13実施形態と比べると、振幅平坦度算出部4501を追加的に備えている点で異なる。その他の構成および動作は、第13実施形態と同様であるため、同じ構成および動作については同じ符号を付してその詳しい説明を省略する。
振幅平坦度算出部4501は、周波数軸に沿った振幅変化を算出して、急変判定部4509に供給する。隣接する周波数間で振幅の変化が小さい周波数が信号急変を表す。振幅変化は、帯域ごと、あるいは全周波数のいずれかに対して、一つの平坦度を求めてもよい。具体的には、以下の式のように、平坦度を表わすFM(Flatness Measure)を求める。x(n)は周波数nにおける振幅またはパワースペクトル、Nは平坦度算出区間に含まれる周波数成分の数である。
Figure 0006528679

FMは0.0から1.0の値をとる。完全に平坦な場合、FMは1.0である。平坦度については、非特許文献3に開示がある。
平坦度はまた、別の指標を用いて表すこともできる。例えば、帯域ごと、あるいは全周波数のいずれかに対してx(n)の平均を求め、各周波数成分nにおけるx(n)とその平均値との差分二乗値総和を帯域ごと、あるいは全周波数の平坦度とすることができる。全周波数の代わりに、単一あるいは複数の周波数帯域において前記差分二乗値総和を一つ求め、これを平坦度とすることもできる。このようにして求めた平坦度は、完全に平坦な場合に0.0、平坦度が低下するに従って大きな値をとる。
別の平坦度の指標として、滑らかさを用いてもよい。滑らかさは、周波数軸に沿った隣接サンプル間の差分絶対値総和で表現することができる。凹凸の多い(滑らかでない)波形で滑らかさは大きな値を、少ない(滑らかな)波形で小さな値をとる。この指標は、全変動量(TV: Total Variation)として知られている。
これまで、平坦度として周波数軸に沿った平坦度を用いてきたが、時間軸に沿った平坦度を利用することもできる。信号急変部では急激に振幅およびパワーが増加するので、この性質を用いると、時間軸に沿った平坦度が低いときに、信号急変が存在すると判定することができる。具体的には、現フレームと直前フレームの振幅またはパワーの差が一定値以上となるときに、平坦度が低い、すなわち信号急変が存在すると判定する。また、数フレーム過去のフレームから現在のフレームまでの複数フレームに対して隣接フレーム間の振幅またはパワーの差を求め、これらを線形または非線形結合した結果を平坦度として定義することもできる。過去のフレームの情報を用いることで、低域成分を含むなまった信号急変部を検出しやすくなり、その抑圧性能が向上する。なお、隣接フレームの振幅またはパワー差を計算する際には、これを周波数成分ごと、帯域ごと、あるいは全周波数のいずれかに対して計算してもよい。さらに、単一または複数の帯域に対して前記振幅またはパワー差を計算することもできる。例えば、単一の帯域、特に高周波域で前記振幅またはパワー差を計算することによって、音声やその他の信号の影響を低減することができ、より正確に信号急変部を検出することが可能となる。
これまで説明した2つの平坦度、すなわち周波数軸に沿った平坦度と時間軸に沿った平坦度は、それぞれを単独で用いることもできるし、両方を組み合わせて用いることもできる。組合せの例としては、2つの平坦度の線形または非線形結合に基づく信号急変部の検出や、それぞれの平坦度に基づいた検出結果の組合せなどがある。周波数方向の平坦度は大きいときに、時間方向の平坦度は小さいときに信号急変の検出と判定するので、組合せの際にどちらかを逆数にしてから組み合わせるなどの工夫が必要となる。
急変判定部4509は、傾きの類似度(平行度)と振幅平坦度の2つの指標を用いて、信号の急変を判定する。振幅が周波数軸に沿って平坦である(バラツキが小さい)とき、信号急変部である可能性が高いと考えられるからである。これは、信号急変がパルス性(短時間に振幅が増加して、減少する)であることと、インパルスのフーリエ変換が白色信号(全周波数で振幅およびパワーが等しい)となることから自明である。判定の方法としては例えば以下のいずれかを選択することができる。
(1)平行度と振幅平坦度が共にそれぞれの条件を満たす場合(例えば傾きの差分値がN=0.1以下で、振幅平坦度FMがМ=0.8以上の場合)、信号の急変があると判定。
(2)平行度と振幅平坦度を単独で用いたときの判定結果の論理和。信号急変の存在可能性を算出するときは、平行度による存在可能性と振幅平坦度による存在可能性のうち、大きい方(または小さい方)に基づく判定。
(3)平行度と振幅平坦度の両方の平均が条件を満たす場合(例えば傾きの差分値PXと、振幅平坦度FMと1.0との差分値QX=(1.0−FM)との平均AV1=(PX+QX)/2が0.1以下)に、信号の急変があると判定。
(4)傾きの差分値と振幅平坦度とに対して重み付けを行ないつつ両方を合わせた複合的な条件を満たす場合(例えば傾きの差分値PXと、振幅平坦度FMと1.0との差分値QX=(1.0−FM)との重み付け平均AV2=(0.8×PX+0.2×QX)が0.1以下)に、信号の急変があると判定。
(5)傾きの差分値と振幅平坦度とを、線形または非線形関数を用いて組み合わせ、組み合わせた結果が一定値より大きいときに信号の急変があると判定。時間方向の振幅平坦度が含まれるときには、その逆数を代わりに用いる。
(6)傾きの差分値と振幅平坦度との中でいずれか理想値により近い方(差分値は小さい方、平坦度は大きい方)のみを用いて、その理想値により近い方が条件を満たす場合に信号の急変があると判定。時間方向の振幅平坦度が含まれるときには、その逆数を代わりに用いる。
(7)事前に検出しようとする急変信号の振幅またはパワースペクトルに関する情報が得られて、振幅またはパワースペクトルが平坦であれば、傾きの差分値の重みを小さくする。
(8)事前に検出しようとする急変信号の振幅またはパワースペクトルに関する情報が得られて、振幅またはパワースペクトルの最小値よりも入力された劣化信号の振幅またはパワースペクトルが小さいときは、信号急変を検出するための閾値を一時的に大きく変更して、検出されにくくする。
特定の信号を処理する場合、例えばノイズが小さくてインパルスに近い衝撃音を検出・抑圧する場合、振幅またはパワーに関する情報の方が位相情報よりも信頼できるときがある。例えば、静かな環境でピストルの発砲音を検出する際には、振幅のみを用いて検出してもよい。一方、ノイズの振幅またはパワーが大きく変化する場合、例えば、空港の警備での発砲音の検出の場合、静かな(ノイズが小さい)状況と、ノイズが大きい状況とで、振幅と位相の重み付けを変えることが効果的である。この場合、振幅と位相の重み付けを、ノイズの有無や時間帯に応じて変化させてもよい。例えば、管制塔からフライトスケジュールの最新情報を入手することができれば、飛行機の離着陸時刻が分かるため、飛行機が来るタイミング(ノイズが多いタイミング)では位相の重み付けを大きくして発砲音の検出に用いることができる。発砲音(検出対象の衝撃音)以外の信号が混在するときには、位相情報を用いた衝撃音の検出が振幅を用いた検出よりも効果的だからである。一方、ノイズが小さい状況では、入力された劣化信号の周波数領域ベクトルの絶対値、つまり振幅値を重視して判定する方が効果的に衝撃音を検出できる。もちろんここでも振幅スペクトルの代わりにパワースペクトルの値を用いてもよい。また、信号の種類によって、衝撃音の振幅が平坦でない場合がある。その場合は、位相平坦度の重みを大きくして検出を行なうことにより高精度で信号の急変を検出できる。さらに、衝撃音の振幅またはパワースペクトルに関する情報が事前に得られるときには、得られた情報を用いて振幅が平坦なときと同じ結果が得られるように、振幅平坦度の計算結果を補正することもできる。具体的には、振幅スペクトル3730を衝撃音の振幅またはパワースペクトル形状の逆数を各周波数成分で乗じた後に、振幅平坦度を算出する。
以上説明したとおり本実施形態によれば、振幅平坦度を併せて用いて信号急変部を検出することができる。これにより、信号急変(衝撃音)をより正確に検出することができ、適宜、その信号急変(衝撃音)を適切に抑圧することが可能となる。
[第16実施形態]
本発明の第16実施形態としての信号処理装置4600について、図46を用いて説明する。信号処理装置4600は、入力信号急変を検出するための装置である。
図46に示すように、信号処理装置4600は、変換部4601と直線性計算部4602と信号急変判定部4604とを含む。変換部4601は、入力信号4610を、周波数領域における位相成分信号4620および振幅成分信号4630に変換する。直線性計算部4602は、位相成分信号4620の直線性4640を計算する。また、信号急変判定部4604は、直線性計算部4602によって計算された直線性4640に基づいて入力信号急変の存在可能性(推定された存在確率)を計算する。
以上の構成により、周波数領域における位相成分信号がどの程度直線的であるかに応じて、入力信号の急変を精度良く検出することができる。
[第17実施形態]
《全体構成》
本発明の第17実施形態としての雑音抑圧装置について図47乃至図54を用いて説明する。本実施形態の雑音抑圧装置は、例えばデジタルカメラ、ノートパソコン、携帯電話、キーボード、ゲーム機のコントローラ、携帯電話の押しボタンなどの雑音抑圧に適用できる。すなわち、音声、音楽、環境音などの目的とする信号(所望信号)を、これらに重畳された信号(ノイズまたは妨害信号)に対して強調することができる。ただし、本発明はこれに限定されるものではなく、入力信号からの信号急変判定を要求されるあらゆる信号処理装置に適用可能である。なお、本実施形態では、信号の急変の一例として、衝撃音を検出して抑圧する雑音抑圧装置について説明する。本実施形態としての雑音抑圧装置は、例えば、マイクの近くでボタン押下などの操作がなされるような形態において、かかるボタン操作により発生する衝撃音を適切に抑圧する。簡単に説明すると、衝撃音を含む時間領域信号を周波数領域信号に変換し、周波数空間に対する位相成分の直線性を計算する。そして、直線性の高さ(傾きのバラツキ)に応じて、衝撃音の存在可能性(推定された存在確率)を計算する。
図47は、雑音抑圧装置4700の全体構成を示すブロック図である。入力端子4706には、劣化信号(所望信号と雑音の混在する信号)が、サンプル値系列として供給される。入力端子4706に供給された劣化信号は、変換部4701においてフーリエ変換などの変換を施されて複数の周波数成分に分割される。複数の周波数成分は周波数ごとに独立して処理される。ここでは、特定の周波数成分に注目して説明を続ける。周波数成分のうち振幅スペクトル(振幅成分)4730は雑音抑圧部4705へ供給され、位相スペクトル(位相成分)4720は位相制御部4702および直線性計算部4708に供給される。なお、ここでは変換部4701が雑音抑圧部4705に劣化信号振幅スペクトル4730を供給しているが、本発明はこれに限定されるものではなく、その二乗に相当するパワースペクトルを雑音抑圧部4705に供給してもよい。
雑音抑圧部4705は、変換部4701から供給される劣化信号振幅スペクトル4730を用いて、雑音を推定し、推定雑音スペクトルを生成する。また、雑音抑圧部4705は、変換部4701から供給された劣化信号振幅スペクトル4730と、生成した推定雑音スペクトルとを用いて雑音を抑圧し、雑音抑圧結果としての強調信号振幅スペクトルを振幅制御部4703に伝達する。さらに雑音抑圧部4705は、急変判定部4709から判定結果を入力し、信号の急変の有無またはその程度に応じて、異なった強度で雑音を抑圧する。雑音抑圧部4705は、所望信号の検出を行って所望信号成分を周波数ごとに保護する一方、信号急変が存在し、所望信号成分が検出されないときには、振幅を推定背景音に置換してもよい。
位相制御部4702は、変換部4701から供給された劣化信号位相スペクトル4720を回転(シフト)させ、強調信号位相スペクトル4740として逆変換部4704へ供給する。また、位相の回転量(シフト量)を、振幅制御部4703へ伝達する。振幅制御部4703は、位相制御部4702から位相の回転量(シフト量)を受け取って振幅補正量を算出し、その振幅補正量を用いて、強調信号振幅スペクトルを各周波数で補正し、補正振幅スペクトル4750を逆変換部4704へ供給する。逆変換部4704は、位相制御部4702から供給された強調信号位相スペクトル4740と、振幅制御部4703から供給された補正振幅スペクトルとを合成して逆変換を行い、強調信号として、出力端子4707に供給する。
直線性計算部4708は、変換部4701から供給された位相スペクトル4720を用いて、その周波数領域での直線性を計算する。急変判定部4709は、直線性計算部4708が計算した直線性に基づいて、信号急変の存在可能性(推定された存在確率)を計算する。
衝撃音(信号の急変)が存在するときに、位相の直線を用いてその存在可能性を推定できる理由は次の通りである。変換部4701のフレーム内に孤立パルスが存在すると仮定する。孤立パルスをフーリエ変換したときの周波数方向の位相の傾きは、孤立パルスの位置に対応して一意に求まることが知られている。例えば、変換部におけるフレーム長がLサンプルで孤立パルス位置がn0(0≦n0≦L―1)であるとき、位相の傾きは−2πn0/Lとなる。これは、振幅aの孤立パルスに関して、フーリエ変換によって得られるk番目の周波数成分D(k)が、次式で与えられるためである。
D(k)=a・exp(jθ(k))θ(k)=−2π・k・n0/L
位相θ(k)は、明らかにk、すなわち周波数に比例しており、右下がりの直線となっている。
《変換部の構成》
図48は、変換部4701の構成を示すブロック図である。図48に示すように、変換部4701はフレーム分割部4801、窓がけ処理部(windowing unit)4802、およびフーリエ変換部4803を含む。劣化信号サンプルは、フレーム分割部4801に供給され、K/2サンプルごとのフレームに分割される。ここで、Kは偶数とする。フレームに分割された劣化信号サンプルは、窓がけ処理部4802に供給され、窓関数(window function)であるw(t)との乗算が行なわれる。第nフレームの入力信号yn(t) (t=0, 1, ..., K/2-1) に対するw(t)で窓がけ(windowing)された信号は、次式で与えられる。
Figure 0006528679

また、連続する2フレームの一部を重ね合わせ(オーバラップ)して窓がけしてもよい。オーバラップ長としてフレーム長の50%を仮定すれば、t=0, 1, ..., K/2-1 に対して、以下の式で得られる左辺が、窓がけ処理部4802の出力となる。
Figure 0006528679

実数信号に対しては、左右対称窓関数が用いられる。また、窓関数は、変換部4701の出力を逆変換部4704に直接供給したときの入力信号と出力信号が計算誤差を除いて一致するように設計される。これは、w2(t)+w2(t+K/2)=1 となることを意味する。
以後、連続する2フレームの50%をオーバラップして窓がけする場合を例として説明を続ける。w(t)としては、例えば、次式に示すハニング窓を用いることができる。
Figure 0006528679

このほかにも、ハミング窓、三角窓など、様々な窓関数が知られている。窓がけされた出力はフーリエ変換部4803に供給され、劣化信号スペクトルYn(k)に変換される。劣化信号スペクトルYn(k)は位相と振幅に分離され、劣化信号位相スペクトル arg Yn(k)は、位相制御部4702と直線性計算部4708に、劣化信号振幅スペクトル|Yn(k)|は、雑音抑圧部4705に供給される。既に説明したように、振幅スペクトルの代わりにパワースペクトルを利用することもできる。
《逆変換部の構成》
図49は、逆変換部4704の構成を示すブロック図である。図49に示すように、逆変換部4704は逆フーリエ変換部4901、窓がけ処理部4902およびフレーム合成部4903を含む。逆フーリエ変換部4901は、振幅制御部4703から供給された強調信号振幅スペクトル4750と位相制御部4702から供給された強調信号位相スペクトル4740 arg Xn(k)とを乗算して、強調信号(以下の式の左辺)を求める。
Figure 0006528679

得られた強調信号に逆フーリエ変換を施し、1フレームがKサンプルを含む時間領域サンプル値系列xn(t) (t=0, 1, ..., K-1)として、窓がけ処理部4902に供給され、窓関数w(t)との乗算が行なわれる。第nフレームの入力信号xn(t) (t=0, 1, ..., K/2-1)に対してw(t)で窓がけされた信号は、次式の左辺で与えられる。
Figure 0006528679
また、連続する2フレームの一部を重ね合わせ(オーバラップ)して窓がけしてもよい。フレーム長の50%をオーバラップ長として仮定すれば、t=0, 1, ..., K/2-1 に対して、以下の式の左辺が、窓がけ処理部4902の出力となり、フレーム合成部4903に伝達される。
Figure 0006528679
フレーム合成部4903は、窓がけ処理部4902からの隣接する2フレームの出力を、K/2サンプルずつ取り出して重ね合わせ、以下の式によって、t=0, 1, ..., K-1における出力信号(式の左辺)を得る。得られた強調音声信号4760は、フレーム合成部4903から出力端子4707に伝達される。
Figure 0006528679

なお、図48と図49において変換部と逆変換部における変換をフーリエ変換として説明したが、フーリエ変換に代えて、アダマール変換、ハール変換、ウェーブレット変換など、他の変換を用いることもできる。ハール変換は、乗算が不要となり、LSI化したときの面積を小さくすることができる。ウェーブレット変換は、周波数によって時間解像度を異なったものに変更できるために、雑音抑圧効果の向上が期待できる。
また、変換部4701において得られる周波数成分を複数統合してから、雑音抑圧部4705で実際の抑圧を行うこともできる。統合後の周波数成分の数は、統合前の周波数成分の数よりも小さくなる。具体的には、周波数成分の統合によって得られる統合周波数成分に対して共通の抑圧度を求め、その抑圧度を同一統合周波数成分に属する個別の周波数成分に対して共通に用いる。その際、聴覚特性の弁別能力が高い低周波領域から、能力が低い高周波領域に向かって、よりたくさんの周波数成分を統合することによって、高い音質を達成することができる。このように、複数の周波数成分を統合してから雑音抑圧を実行すると、雑音抑圧を適用する周波数成分の数が少なくなり、全体の演算量を削減することができる。
《雑音抑圧部の構成》
雑音抑圧部4705は、変換部4701から供給される劣化信号振幅スペクトルを用いて雑音を推定し、推定雑音スペクトルを生成する。そして、変換部4701からの劣化信号振幅スペクトルと生成した推定雑音スペクトルとを用いて抑圧係数を求め、劣化信号振幅スペクトルに乗じ、強調信号振幅スペクトルとして、振幅制御部4703へ供給する。また、急変判定部4709から信号急変の存在可能性(信号の急変がどの程度存在するかの情報)を受けて、存在可能性に応じて、劣化信号振幅スペクトルと推定雑音スペクトルを混合したものを、強調信号振幅スペクトルとして、振幅制御部4703へ供給する。このとき、雑音抑圧部4705は、所望信号の検出を行って所望信号成分を周波数ごとに保護してもよい。
雑音の推定には、非特許文献1や非特許文献2に記載の方法など、様々な推定方法が利用できる。
例えば、非特許文献1には、推定雑音スペクトルを、所望信号が発生していないフレームの劣化信号振幅スペクトルの平均値とする方法が開示されている。この方法では所望信号の存在を検出する必要がある。所望信号の存在する区間は、強調信号のパワーで判断することができる。
理想的な動作状態として、強調信号は雑音以外の所望信号となっている。また、所望信号や雑音のレベルは、隣接フレーム間で大きく変化しない。これらのことから、1フレーム過去の強調信号レベルを雑音区間判定の指標とする。1フレーム過去の強調信号パワーが一定値以下の時には、現フレームを雑音区間と判定する。雑音スペクトルは、雑音区間と判定されたフレームの劣化信号振幅スペクトルを平均化することで推定できる。
また、非特許文献1には、推定雑音スペクトルを、劣化信号振幅スペクトルが供給され始めた推定初期の平均値とする方法も開示されている。この場合、推定が開始された直後には所望信号が含まれないという条件を満たす必要がある。条件が満たされる場合、推定初期の劣化信号振幅スペクトルを推定雑音スペクトルとすることができる。
さらに、非特許文献2には、推定雑音スペクトルを、統計的な劣化信号振幅スペクトルの最小値から求める方法が開示されている。この方法では、統計的に一定時間における劣化信号振幅スペクトルの最小値を保持し、その最小値から雑音スペクトルを推定する。劣化信号振幅スペクトルの最小値は、雑音スペクトルのスペクトル形状と似ているため、雑音スペクトル形状の推定値として用いることができる。しかし、最小値では、本来の雑音レベルより小さくなる。そのため、最小値を適切に増幅させたものを推定雑音スペクトルとして用いる。
雑音抑圧部4705においては、様々な抑圧を行うことが可能であるが、代表的なものとして、SS(Spectrum Subtraction:スペクトル減算)法とMMSE STSA(Minimum Mean-Square Error Short-Time Spectral Amplitude Estimator:最小二乗平均誤差短時間振幅スペクトル推定)法とが挙げられる。SS法の場合は、変換部4701から供給された劣化信号振幅スペクトルから推定雑音スペクトルを減算する。MMSE STSA法の場合は、変換部4701から供給された劣化信号振幅スペクトルと生成した推定雑音スペクトルとを用いて、抑圧係数を計算し、この抑圧係数を劣化信号振幅スペクトルに乗算する。この抑圧係数は、強調信号の平均二乗パワーを最小化するように決定される。
また、雑音抑圧部4705は、急変判定部4709から受けた急変の存在可能性(信号の急変がどの程度存在するかの情報)に応じて、雑音抑圧の程度を変更する。例えば、存在可能性に応じて、劣化信号振幅スペクトルと推定雑音スペクトルを混合したものを、強調信号振幅スペクトルとして、振幅制御部4703へ供給してもよい。具体的には、信号急変の存在可能性の高い周波数成分、周波数帯域、あるいはフレーム単位で、その急変を抑圧すべく、より推定雑音スペクトルの混合割合を高く(強力な抑圧を適用)する。抑圧程度の設定は、存在可能性に応じて無段階に制御してもよいし、抑圧度0、抑圧度1、抑圧度2というように多段で(離散的な段階で)抑圧を行なってもよい。
さらに、この置き換えに先立って、重要な劣化信号振幅スペクトル成分を検出して、検出された重要な劣化信号振幅スペクトル成分を推定雑音スペクトルによる置き換えの対象から除外したり、劣化信号振幅スペクトルの混合割合を高くしたりすることもできる。重要な劣化信号振幅スペクトル成分を検出する際の重要度の指標としては、劣化信号振幅スペクトルの大きさを用いることができる。振幅が大きな成分は目的とする信号の成分である確率が高く、これを保持することは目的とする信号の音質劣化を防止することにつながる。
また、重要度の指標として、劣化信号振幅スペクトルのピーク性を用いることもできる。ピーク、すなわち周波数軸に沿って周辺よりも大きな値を有する劣化信号振幅は、目的とする信号の成分である確率が高く、これを保持することは目的とする信号の音質劣化を防止することにつながる。特に、顕著なピーク、すなわち周辺の振幅値よりも著しく大きな振幅値はその重要度が高いので、確実に保護することで目的とする信号の音質をさらに高めることができる。
ピークの検出は、例えば、非特許文献3の純音成分検出方法や、非特許文献5に、その方法が開示されている。さらに、検出されたピークを所定の条件に従って評価し、条件を満たさないピークは除外してもよい。例えば、前記推定雑音よりも小さな値をとるピークは、目的とする信号である可能性は低い。すなわち、推定雑音を基準として、それよりも十分に大きいものだけをピークとして残し、それ以外を除外することができる。十分に大きいかどうかは推定雑音の定数倍と比較することで、判定できる。このように、検出されたピークが所定の条件を満たすかどうかを評価してから最終的なピーク成分を選択することによって、誤ったピークの検出を低減し、信号急変部の抑圧効果を高くすることができる。
《位相制御部および振幅制御部の構成》
図50は位相制御部4702および振幅制御部4703の構成を示すブロック図である。図50に示すように、位相制御部4702は位相回転部5001と回転量生成部5002とを含み、振幅制御部4703は、補正量算出部5003と振幅補正部5004とを含む。
回転量生成部5002は、急変判定部4709から「信号の急変が存在する」と判定された周波数成分について、劣化信号位相スペクトルの回転量を生成し、位相回転部5001と補正量算出部5003に供給する。位相回転部5001では、回転量生成部5002から回転量が供給されると、変換部4701から供給された劣化信号位相スペクトル4720を、供給された回転量だけ回転(シフト)させ、強調信号位相スペクトル4740として逆変換部4704へ供給する。
補正量算出部5003では、回転量生成部5002から供給される回転量に基づいて、振幅の補正係数を決定し、振幅補正部5004に供給する。
回転量生成部5002は、例えば乱数によって回転量を生成する。乱数により、劣化信号位相スペクトルを各周波数で回転させると、劣化信号位相スペクトル4720の形状が変化する。この形状の変化により、衝撃音などの信号急変部の特徴を弱めることができる。
乱数には、その発生確率が一様な一様乱数や、発生確率が正規分布を示す正規乱数などがあるが、まず、一様乱数による回転量の生成法を説明する。一様乱数は線形合同法などで発生させることができる。例えば、線形合同法で発生させた一様乱数は、0〜(2^M)−1の範囲に一様に分布する。ここで、Mは任意の整数であり、^はべき乗を表している。位相の回転量φは、0〜2πの範囲に分布させる必要がある。そこで、発生させた一様乱数を変換する。変換は、以下の式で行う。ここで、Rは一様乱数であり、Rmaxはその一様乱数が発生しうる最大の値である。前述した線形合同法で発生させる場合には、Rmax=(2^M)-1となる。
Figure 0006528679
計算の簡単化のために、Rの値をそのまま回転量とすることもできる。回転量であるので2πはちょうど一回転を表す。位相を2π回転させた場合は回転させていない場合と同一である。よって、2π+αという回転量は、回転量がαの場合と同じになる。ここでは、線形合同法により一様乱数を発生させた場合を説明したが、それ以外の方法で一様乱数を発生させた場合でも、上式により回転量φを求めればよい。急変判定部4709の判定結果に応じて、いつどのくらい乱数化を行なうのかを決定してもよい。
位相回転部5001は、回転量生成部5002から回転量を受け取り、劣化信号位相スペクトルを回転させる。もし、劣化信号位相スペクトルが角度で表現されている場合には、その角度に回転量φの値を加算することで回転させることができる。劣化信号位相スペクトルが複素数の正規ベクトルで表現されている場合には、回転量φの正規ベクトルを求め、劣化信号位相スペクトルに乗算することで回転させることができる。
回転量φの正規ベクトルは、以下の式で求められる。ここで、Φは回転ベクトルであり、jはsqrt(-1)を示す。なお、sqrtは二乗根を表している。
Figure 0006528679

補正量算出部5003による補正係数算出方法は、図5の補正量算出部503について説明した方法と同様であるため、ここでは説明を省略する。
《直線性計算部および急変判定部の構成》
図51は、直線性計算部4708および急変判定部4709の内部構成について説明するための図である。図51に示すように、直線性計算部4708は、周波数方向に位相の変化量を算出する変化量算出部5101と、位相の変化量の平坦度を算出する平坦度算出部5102を含んでいる。変化量算出部5101は、位相成分信号4720(p(k)、kは周波数)を入力して、隣接する周波数の位相差Δp(k)=p(k)-p(k-1)を位相の変化量5110(位相の傾き)として求める。
平坦度算出部5102は、変化量算出部5101で得られた位相変化量Δp(k)=p(k)-p(k-1)の、周波数軸に沿った平坦度(バラツキ)を調べる。隣接する周波数の位相変化量の差Δ2p(k)=Δp(k)-Δp(k-1)を平坦度5120とする。位相変化量が平坦であれば差分は0になる。周波数成分ごと、帯域ごと、全周波数のいずれかに対して、一つの平坦度5120を求めてもよい。また、単一あるいは複数の帯域における平坦度を統合して、全周波数における平坦度の代わりに用いてもよい。
ここで、周波数ごとではなく周波数帯域(サブバンド)またはフレームごとに平坦度を求めると、より大局的な判定によって、信号急変成分以外の位相成分による平坦度の誤差を低減することができる。例えば、フレームごとの平坦度として、各周波数における平坦度の周波数方向総和を求めてもよい。この修正によって、各周波数における平坦度の信頼性を高めることができる。さらに、周波数帯域ごとまたはフレームごとの平坦度を用いて、周波数ごとの平坦度を修正してもよい。例えば、ある周波数帯域の平坦度が「信号急変が存在する」ことを表すときに、その周波数帯域内の全周波数の平坦度を強制的に「信号急変が存在する」を表すように修正することで、他の信号成分の妨害による平坦度の誤差を低減することができる。その反対に、ある周波数帯域の平坦度が「信号急変が存在しない」を表すときに、その周波数帯域内の全周波数の平坦度を強制的に「信号急変が存在しない」を表すように修正することで、他の信号成分の妨害による平坦度の誤差を低減することもできる。あるいは、前記帯域内の各周波数で、平坦度を「存在」と判定しやすい方向へ一律に修正して、各周波数独自の平坦度を求めるという構成自体は維持してもよい。周波数ごとまたは周波数帯域ごとに平坦度を求めると、周波数ごとまたは周波数帯域ごとに急変の抑圧程度を変更することができ、より精度の高い抑圧を行なうことが可能となる。
さらに、位相の微分値を位相変化量としてさらにその微分値を平坦度1220としてもよい。その場合、位相の二次微分値が0に近ければ(所定値以下であれば)平坦度が高いことになる。
ここでは変化量算出部5101は、隣接周波数間の位相の差分を用いて変化量を算出したが、本発明はこれに限定されるものではない。位相の周波数による微分で直線性(位相変化の平坦度)を判定してもよい。複数の周波数における複数の微分結果のバラツキが小さいほど直線性が高い。局所的な直線性は、局所的な微分結果を用いて評価することができる。特に、隣接する2周波数成分間の微分は差分で近似できるので、その場合は複数の差分のバラツキが小さいほど直線性が高いと判断する。バラツキの指標として、平坦度(Flatness Measure)を用いることができる。
急変判定部4709は、算出された平坦度を信号の急変が存在する可能性とする。さらに、平坦度を所定の線形関数、非線形関数、多項式などを用いて変換した結果を、信号の急変が存在する可能性5130として出力してもよい。信号の急変をその「存在可能性」として検出することによって、「存在そのもの」よりも高品質な抑圧を達成できる。これは、「存在そのもの」の判定、すなわち2値判定で判定誤りを生じた場合、抑圧に与える影響が致命的になるためである。「抑圧する」、または「抑圧しない」の2つだけの選択肢なので、抑圧するべきでないときに判定誤りによって抑圧を適用することで、致命的な歪を目的とする信号に与えることになり、これが知覚されることになる。反対に、抑圧するべきときに抑圧を適用しないと、信号の急変がそのまま残り、知覚される。反対に、「存在可能性」、すなわち連続的な値を用いて判定を行い、その判定結果に応じた程度の抑圧を行うことによって、どちらの判定誤りの影響をも小さくすることができる。
図52は、位相およびその変化量をグラフに示したものである。周波数領域において、周波数軸に沿って、グラフ5201のように位相が変化する場合、その位相変化量は、周波数領域において、周波数軸に沿って、グラフ5202に示すように変化する。この変化の平坦度5203を導き出すことにより、位相の直線性を判別する。
信号の急変部では位相が直線的に変化することが分かっているため、このように位相の直線性、すなわち位相変化の平坦度を算出することにより、信号の急変の存在可能性を評価することが可能となる。そして、衝撃音など信号の急変が存在するフレームにおいて、位相スペクトルを回転操作することにより、その急変を抑圧したり、その影響を低減することができるため、高品質な強調信号を得ることができる。
図53は、本実施形態にかかる雑音抑圧装置4700をソフトウェアを用いて実現する場合のハードウェア構成について説明する図である。
雑音抑圧装置4700は、プロセッサ5310、ROM(Read Only Memory)5320、RAM(Random Access Memory)5340、ストレージ5350、入出力インタフェース5360、操作部5361、入力部5362、および出力部5363を備えている。雑音抑圧装置4700は、カメラ5364を備えていてもよい。プロセッサ5310は中央処理部であって、様々なプログラムを実行することにより雑音抑圧装置4700全体を制御する。
ROM5320は、プロセッサ5310が最初に実行すべきブートプログラムの他、各種パラメータ等を記憶している。RAM5340は、不図示のプログラムロード領域の他に、入力信号4710、位相成分信号4720、振幅成分信号4730、強調信号4760、位相変化量5110、平坦度5120および急変判定結果5130等を記憶する領域を有している。
また、ストレージ5350は、雑音抑圧プログラム5351を格納している。雑音抑圧プログラム5351は、変換モジュール、位相制御モジュール、振幅制御モジュール、逆変換モジュール、雑音抑圧モジュール、直線性計算モジュール、急変判定モジュールを含んでいる。雑音抑圧プログラム5351に含まれる各モジュールをプロセッサ5310が実行することにより、図47の変換部4701、位相制御部4702、振幅制御部4703、逆変換部4704、雑音抑圧部4705、直線性計算部4708、急変判定部4709の各機能を実現できる。なお、ストレージ5350はノイズデータベースを格納してもよい。
プロセッサ5310が実行した雑音抑圧プログラム5351の出力である強調信号は、入出力インタフェース5360を介して出力部5363から出力される。これにより、例えば、入力部5362から入力した操作部5361の操作音などを抑圧することができる。また、入力部5362から入力した入力信号に衝撃音が含まれたことを検出してカメラ5364による撮影を開始するなどといった適用法も可能である。
図54は、上記雑音抑圧プログラム5351による処理の流れを説明するためのフローチャートである。まず、ステップS5401において、入力部5362から信号を入力すると、ステップS5403に進む。ステップS5403では、変換部4701が入力信号を周波数領域に変換して、振幅・位相に分割する。次に、ステップS5405では、離散周波数kを1に、カウント値Iを0に設定して、順次周波数空間での処理を開始する。ステップS5407に進むと、設定された周波数での位相の変化を算出する。さらにステップS5409では、位相変化の変化を算出する。位相変化の変化の大きさに応じて、位相の直線性を判断する。具体的には位相変化の変化がどれだけ0に近いかに基づいて、周波数kにおける直線性の高さの指標とする。さらにフレーム単位で信号急変の存在可能性を算出するために、位相変化の変化が所定の閾値N未満のとき、ステップS5413においてIをインクリメントする。
一方、位相変化の変化が所定の閾値N以上の場合、位相変化が平坦ではない、すなわち位相の直線性が低いと判断して、IをインクリメントせずにステップS5415に進む。以上のステップS5407〜S5413を、k=F(Fはフレーム全体の周波数成分数)になるまで繰り返す。最終的には、ステップS5417において、I(直線性の高い周波数)を所定の閾値Мと比較する。IがM以上の場合に衝撃音(信号急変)ありのフレームと判定し(S5421)、それ以外を衝撃音(信号急変)なしと判定する(S5423)。周波数ごとの信号急変存在可能性を、雑音抑圧部4705および位相制御部4702に供給する(S5425)。合わせて、フレームごとの信号急変存在の有無である判定結果を雑音抑圧部4705および位相制御部4702に供給してもよい。
以上の処理により、衝撃音に代表される信号の急変をより正確に検出することができ、適宜、その衝撃音(信号の急変)を適切に抑圧することが可能となる。
[第18実施形態]
次に本発明の第18実施形態に係る雑音抑圧装置について、図55を用いて説明する。図55は、本実施形態に係る雑音抑圧装置5500の機能構成を説明するための図である。本実施形態に係る雑音抑圧装置5500は、上記第17実施形態と比べると、変換部5501が複素信号5550を生成し、直線性検出部5508および急変判定部5509がその複素信号5550に基づいて検出および判定を行なう点で異なる。その他の構成および動作は、第17実施形態と同様であるため、同じ構成および動作については同じ符号を付してその詳しい説明を省略する。
図56は、直線性検出部5508および急変判定部4709の内部構成について説明するための図である。図56に示すように、直線性検出部5508は、周波数方向に位相の変化量を算出する変化量算出部5601と、位相の変化量の平坦度を算出する平坦度算出部5102を含んでいる。変化量算出部5601は、複素信号5550(q(k)(kは周波数))を入力して、隣接する周波数の位相差Δp(k)=p(k)-p(k-1)を、位相の変化量5110(位相の傾き)として求める。
平坦度算出部5102は、変化量算出部5101で得られた位相変化量Δp(k)=p(k)-p(k-1)の、周波数軸に沿った平坦度(バラツキ)を調べる。隣接する周波数の位相変化量の差Δ2p(k)=Δp(k)-Δp(k-1)を平坦度5120とする。位相変化量が平坦であれば差分は0になる。周波数毎、帯域毎(周波数を任意の幅に区切った帯域)、全周波数のいずれかに対して、一つの平坦度5120を求めてもよい。また、位相の微分値を位相変化量としてさらにその微分値を平坦度5120としてもよい。その場合、位相の二次微分値が0に近ければ(所定値以下であれば)平坦と判定できる。帯域ごとに判定すると、よりきめ細かな処理を行なうことができる。つまり、衝撃音を帯域ごとに分けて消すこともでき、より精度のよい衝撃音抑圧を行なうことが可能となる。
急変判定部4709は、例えば、算出された平坦度の絶対値が一定以下の場合、その平坦度に対応する周波数(一つの周波数成分、周波数帯域、または、全帯域(つまり一つのフレーム))は衝撃音を含むと判定する。判定結果5130としては、平坦度の絶対値と対応させた、0と1の間の値を判定結果5130として出力する。これにより、衝撃音が含まれている尤もらしさを得ることが可能となる。
以上説明したとおり本実施形態では、位相成分信号の代わりに複素信号を用いて位相の直線性を検出することができる。
[第19実施形態]
次に本発明の第19実施形態に係る雑音抑圧装置について、図57を用いて説明する。図57は、本実施形態に係る雑音抑圧装置に含まれる直線性検出部5708の機能構成を説明するための図である。本実施形態に係る直線性検出部5708は、上記第18実施形態と比べると、単位ベクトル生成部5781と回転ベクトル変換部5782と回転ベクトル変換部5783とを備えている点で異なる。また、急変判定部5709が、回転ベクトルから、信号の急変の有無またはその程度を判定する点でも異なる。その他の構成および動作は、第18実施形態と同様であるため、同じ構成および動作については同じ符号を付してその詳しい説明を省略する。
単位ベクトル生成部5781は、複素信号5550を用いて、入力スペクトル(複素ベクトル)を周波数ごとに単位ベクトル化する。具体的には、複素信号5550の実数部と虚数部をそれぞれ振幅値で除算する。
回転ベクトル変換部5782は、単位ベクトル5710を、隣接周波数間の回転ベクトル(第1回転ベクトル5720)に変換する。ここでの回転ベクトルの回転量は位相変化量と同義となる。基準ベクトルの共役A*と回転後のベクトルBとの内積をとる乗算を行ない、以下のように回転ベクトルRotVecを求める。RotVec = A*・B
具体的には、基準ベクトルの実部同士を積算して、虚部同士を積算して、それらを足して、虚部は一方を引き算する。そうすると回転ベクトル5720が算出できる。
さらに、回転ベクトル変換部5783は、回転ベクトル変換部5782により得られる第1回転ベクトル5720の、周波数軸に沿った平坦度(バラツキ)を調べる。周波数方向の位相変化量が一定であると回転ベクトルのバラツキが小さくなる。そのため第1回転ベクトル5720の変化量を周波数軸に沿って求める。具体的には、第1回転ベクトル5720について、隣接周波数間の回転ベクトル(第2回転ベクトル5730)を求める。これは第1回転ベクトルを微分したのと同義である。
そこで、急変判定部5709は、第2回転ベクトル5730の実部を平坦度として認識する。
第2回転ベクトル5730も単位ベクトルなので、その実部は−1から1の値をとる。位相が直線的に変化するほど、第1回転ベクトルの角度変化量が小さい(回転ベクトルのバラツキが小さい)。そして、第1回転ベクトルの変化量が小さい(回転ベクトルのバラツキが小さい)ほど、第2回転ベクトルの実部が大きくなる。すなわち、第2回転ベクトルの角度が小さくなる。ここでも、周波数毎、帯域毎(周波数を任意の幅に区切った帯域)、全周波数のいずれかについて、一つの平坦度を求めてもよい。
急変判定部5709は、第2回転ベクトル5730の実部を急変の存在可能性とみなして、+1に近い閾値(例えば0.7や0.8)を越えているか否かによって急変の存在またはその程度を判定する。判定結果5740として、衝撃音の存在可能性(1〜0)を出力する。このように、衝撃音が含まれている尤もらしさを得ることが可能となる。
図58は、本実施形態にかかる雑音抑圧プログラムによる処理の流れを説明するためのフローチャートである。まず、ステップS5401において、音声入力部5362から音声信号を入力すると、ステップS5803に進む。ステップS5803では、変換部5501が周波数領域で入力信号から複素信号を生成する。次に、ステップS5405では、離散周波数kを1に設定して、順次周波数空間での処理を開始する。ステップS5807に進むと、設定された周波数で複素信号を単位ベクトル化する。次に、ステップS5808では、隣接する周波数成分の単位ベクトルから第1回転ベクトルに変換する。さらにステップS5809では隣接する周波数成分の第1回転ベクトルから第2回転ベクトルに変換する。ステップS5811では、第2回転ベクトルの実部を、信号急変の存在可能性と見なして、閾値Nと比較する。実部が所定の閾値Nを越えた場合、位相は平坦に変化すると判断され、直線性が高いと判断して、ステップS5413においてI(k)=1とする。一方、実部が所定の閾値N以下の場合、位相変化は平坦ではない判断され、直線性が低いと判断して、ステップS5414においてI(k)=0とする。以上のステップS5407〜S5414を、k=F(Fはフレーム全体の周波数ステップ数)になるまで繰り返す。最終的には、ステップS5417において、I(k)=1となったkの周波数で信号急変ありと判定し、判定結果を、雑音抑圧部4705および位相制御部4702に供給する。
以上説明したとおり本実施形態では、複素信号を用いて位相の回転ベクトルの回転ベクトルから直線性を検出できる。なおここで、平坦度の判定で、回転ベクトルの実部を使うためには単位ベクトル化したが、本発明はこれに限定されるものではない。また、第2回転ベクトルの実部に代えて第2回転ベクトルの角度の大きさを閾値と比較し、角度の大きさが閾値より大きい場合に信号急変ありと判定してもよい。
[第20実施形態]
なお、上記第12乃至19実施形態では、信号急変部を抑圧することを目的とした雑音抑圧装置に信号急変検出方法を適用した場合について説明したが、本発明はこれに限定されるものではない。衝撃音の検出を目的とした様々な装置、システムおよび状況で利用することができる。さらに検出対象は衝撃音(急激に立ち上がってすぐにたち下がる音声信号)に限定されない。信号が急激に立ち上がって(またはたち下がって)そのままとなる場合であっても、急変部として検出できる。
例えば、現在のオーディオ符号化方式(例えばMPEG AACの符号化部)において、いわゆるアタックと呼ばれる信号急変部では、通常とは異なった情報圧縮方式が採用されているが、その際の信号急変部の検出にも適用することができる。信号急変部では、分析窓長を変更して、プリエコーと呼ばれる先行雑音の抑圧を行うので、検出が必要となる。振幅やエントロピーの変化などを用いて検出する方法に比べて精度良く急変を検出し、効果的に情報圧縮を行なうことができる。
また、図59に示すように、車両5900にマイク2001と直線性計算部4708と急変判定部4709と映像記録部5902とを搭載する適用例も考えられる。映像記録部5902が衝撃音の検出をトリガーにしてカメラによる撮影画像の上書き保存禁止を行なえば、事故状況の記録を残すことができる。その際に、衝撃音検出から一定時間の遅延の後に、上書き保存禁止を行ってもよい。衝撃そのものをトリガーにした場合と異なり、衝撃が小さい場合や、他の車両が事故にあった場合にも事故状況の自動記録を行なえるという利点がある。
また、図60に示すように、心電計6000に計算部4708と急変判定部4709とアラーム部6001とを接続する適用例も考える。心電図の異常心拍の検出をより正確かつ効果的に行なうことができる。特に雑音の多い場合に有効である。同様に、胎児のエコーのモニターにも適用できる。雑音による妨害で正しく心音がとれない場合があるが、そのようなときに本技術は有効である。すなわち、生体信号の急変検出に広く適用できる。
[第21実施形態]
同様に図61に示すように、上記実施形態では、ハードディスクドライブ6100の異常検知のために本発明の衝撃音検出を利用してもよいし、図62に示すように、例えば空港など騒音が大きい状況での発砲音や爆発音の検出に、本願発明を利用してもよい。
[他の実施形態]
以上、実施形態を参照して本発明を説明したが、本発明は上記実施形態に限定されるものではない。本発明の構成や詳細には、本発明のスコープ内で当業者が理解し得る様々な変更をすることができる。また、それぞれの実施形態に含まれる別々の特徴を如何様に組み合わせたシステムまたは装置も、本発明の範疇に含まれる。
また、本発明は、複数の機器から構成されるシステムに適用されてもよいし、単体の装置に適用されてもよい。さらに、本発明は、実施形態の機能を実現する情報処理プログラムが、システムあるいは装置に直接あるいは遠隔から供給される場合にも適用可能である。したがって、本発明の機能をコンピュータで実現するために、コンピュータにインストールされるプログラム、あるいはそのプログラムを格納した媒体、そのプログラムをダウンロードさせるWWW(World Wide Web)サーバも、本発明の範疇に含まれる。特に、少なくとも、非一時的コンピュータ可読媒体(non-transitory computer readable medium)
は本発明の範疇に含まれる。
なお、上記の各実施形態においては、以下に示すような信号処理装置、信号処理方法および信号処理プログラムの特徴的構成が示されている(以下のように限定されるわけではない)。
(付記1)
入力信号を、周波数領域における位相成分信号および振幅成分信号に変換する変換手段と、
前記位相成分信号および前記振幅成分信号の特徴量を計算する計算手段と、
前記計算手段によって計算された前記特徴量に基づいて前記入力信号の急変に関する存在可能性を判定する判定手段と、
を備えたことを特徴とする信号処理装置。
(付記2)
前記計算手段は、前記位相成分信号の変化の平坦度を前記特徴量として算出することを特徴とする付記1に記載の信号処理装置。
(付記3)
前記計算手段は、前記振幅成分信号の平坦度を前記特徴量として算出することを特徴とする付記1または2に記載の信号処理装置。
(付記4)
前記判定手段は、前記位相成分信号の変化と前記振幅成分信号の変化とをそれぞれ重み付け加算して得た値に基づいて前記信号の急変に関する存在可能性の判定を行なうことを特徴とする付記1、2または3に記載の信号処理装置。
(付記5)
前記判定手段は、前記位相成分信号の変化と前記振幅成分信号の変化とを平均して得た値に基づいて前記信号の急変に関する存在可能性の判定を行なうことを特徴とする付記1、2または3に記載の信号処理装置。
(付記6)
前記判定手段は、前記位相成分信号の変化と前記振幅成分信号の変化とを非線形結合して得た値に基づいて前記信号の急変に関する存在可能性の判定を行なうことを特徴とする付記1、2または3に記載の信号処理装置。
(付記7)
前記計算手段は、周波数領域における前記位相成分信号の微分値の平坦度を計算し、
前記判定手段は、前記微分値の前記平坦度が高く、かつ、前記振幅成分信号の平坦度が高ければ、前記入力信号の急変に関する存在可能性が高いと判定することを特徴とする付記1乃至5のいずれか1項に記載の信号処理装置。
(付記8)
前記計算手段は、前記位相成分信号から、各周波数の位相変化(φn=θn−θn-1)を求め、該位相変化の差(φn−φn-1)を回転角とする回転ベクトルcos(φn−φn-1)+jsin(φn−φn-1)の大きさを前記特徴量として求めることを特徴とする付記1乃至7のいずれか1項に記載の信号処理装置。
(付記9)
前記変換手段は、位相成分信号および振幅成分信号を含む複素信号を出力し、
前記計算手段は、
各周波数における前記複素信号を単位ベクトルに正規化する正規化手段と、
隣接周波数における前記単位ベクトルの比から第1回転ベクトルを算出する第1算出手段と、
隣接周波数における前記第1回転ベクトルの比から第2回転ベクトルを算出する第2算出手段と、
を備え、
前記判定手段は、
前記第2回転ベクトルの実部の大きさに基づいて、前記入力信号の急変に関する存在可能性を判定することを特徴とする付記1乃至8のいずれか1項に記載の信号処理装置。
(付記10)
前記変換手段は、位相成分信号および振幅成分信号を含む複素信号を出力し、
前記計算手段は、
各周波数における前記複素信号を単位ベクトルに正規化する正規化手段と、
隣接周波数における前記単位ベクトルの比から第1回転ベクトルを算出する第1算出手段と、
隣接周波数における前記第1回転ベクトルの比から第2回転ベクトルを算出する第2算出手段と、
を備え、
前記判定手段は、
前記第2回転ベクトルの角度の大きさに基づいて、前記入力信号の急変を検出することを特徴とする付記1乃至8のいずれか1項に記載の信号処理装置。
(付記11)
前記判定手段で求めた前記急変に関する存在可能性に対応した程度で、振幅の抑圧を行なう振幅制御手段をさらに備えたことを特徴とする付記1乃至10のいずれか1項に記載の信号処理装置。
(付記12)
前記判定手段で前記急変を含むと判定されたフレームについて、前記入力信号の位相を変化させる位相制御手段をさらに備えたことを特徴とする付記1乃至11のいずれか1項に記載の信号処理装置。
(付記13)
入力信号を、周波数領域における位相成分信号に変換する変換手段と、
前記入力信号の急増部の位置に基づいて、第1位相傾きを算出する第1算出手段と、
周波数領域における前記位相成分信号の第2位相傾きを算出する第2算出手段と、
前記第1位相傾きと前記第2位相傾きに基づいて前記入力信号の急変に関する存在可能性を判定する判定手段と、
を備えたことを特徴とする信号処理装置。
(付記14)
前記判定手段は、
前記第1位相傾きと前記第2位相傾きとの類似度に基づいて、前記入力信号の急変に関する存在可能性を判定することを特徴とする付記13に記載の信号処理装置。
(付記15)
前記第1算出手段は、
フレーム内の信号絶対値が急増する位置を検出する急増部検出手段と、
フレーム開始から前記急増部の存在する位置までの遅延時間を算出する遅延時間算出手段と、
前記遅延時間を、周波数領域の位相に変換する位相変換手段と、
を含むことを特徴とする付記13または14に記載の信号処理装置。
(付記16)
前記変換手段はさらに前記入力信号の周波数領域における振幅成分信号を算出し、前記振幅成分信号の平坦度を算出する算出手段をさらに備え、
前記判定手段は、さらに前記振幅成分信号の平坦度を考慮して前記入力信号の急変の存在可能性を判定することを特徴とする付記13に記載の信号処理装置。
(付記17)
前記判定手段は、前記第1位相傾きと前記第2位相傾きとの類似度、および前記振幅成分信号の平坦度を、それぞれ重み付けして得た値に基づいて前記信号の急変の存在可能性の判定を行なうことを特徴とする付記13乃至16のいずれか1項に記載の信号処理装置。
(付記18)
前記判定手段で求めた前記急変の存在可能性に対応した程度で、振幅の抑圧を行なう振幅制御手段をさらに備えたことを特徴とする付記13乃至17のいずれか1項に記載の信号処理装置。
(付記19)
前記判定手段で前記急変を含むと判定されたフレームについて、前記入力信号の位相を変化させる位相制御手段をさらに備えたことを特徴とする付記13乃至18のいずれか1項に記載の信号処理装置。
(付記20)
入力信号を、周波数領域における位相成分信号に変換する変換手段と、
前記入力信号に含まれる時間相関のある成分を前記入力信号から除いて低相関信号を生成する生成手段と、
前記低相関信号と前記位相成分信号とに基づいて、前記入力信号に含まれる急変の存在可能性を判定する判定手段と、
を備えたことを特徴とする信号処理装置。
(付記21)
前記低相関信号の急増部の位置に基づいて、信号急変部における第1相傾きを算出する第1算出手段と、
周波数領域における前記位相成分信号の第2位相傾きを算出する第2算出手段と、
をさらに有し、
前記判定手段は、
前記第1位相傾きと前記第2位相傾きとに基づいて前記入力信号の急変の存在可能性を判定することを特徴とする付記20に記載の信号処理装置。
(付記22)
前記判定手段は、
前記第1位相傾きと前記第2位相傾きとの類似度に基づいて、前記入力信号の急変の存在可能性を判定することを特徴とする付記21に記載の信号処理装置。
(付記23)
前記第1算出手段は、
フレーム内の信号絶対値が急増する位置を検出する急増部検出手段と、
フレーム開始から前記急増部の存在する位置までの遅延時間を算出する遅延時間算出手段と、
前記遅延時間を、周波数領域の位相に変換する位相変換手段と、
を含むことを特徴とする付記21または22に記載の信号処理装置。
(付記24)
前記変換手段はさらに前記入力信号の周波数領域における振幅成分信号を算出し、前記振幅成分信号の平坦度を算出する算出手段をさらに備え、
前記判定手段は、さらに前記振幅成分信号の平坦度を考慮して前記入力信号の急変の存在可能性を判定することを特徴とする付記20に記載の信号処理装置。
(付記25)
前記判定手段で求めた前記急変の存在可能性に対応した程度で、振幅の抑圧を行なう振幅制御手段をさらに備えたことを特徴とする付記20乃至24のいずれか1項に記載の信号処理装置。
(付記26)
前記判定手段で前記急変を含むと判定されたフレームについて、前記入力信号の位相を変化させる位相制御手段をさらに備えたことを特徴とする付記20乃至25のいずれか1項に記載の信号処理装置。
(付記27)
入力信号を、周波数領域における位相成分信号に変換する変換手段と、
周波数領域における前記位相成分信号の直線性を計算する直線性計算手段と、
前記直線性計算手段によって計算された前記直線性に基づいて前記入力信号の急変の存在可能性を計算する判定手段と、
を備えたことを特徴とする信号処理装置。
(付記28)
前記直線性計算手段は、周波数領域における前記位相成分信号の変化に基づいて、前記直線性を計算することを特徴とする付記27に記載の信号処理装置。
(付記29)
前記直線性計算手段は、周波数領域における前記位相成分信号の微分値の平坦度を計算し、
前記判定手段は、前記微分値の平坦度が高ければ、前記入力信号の急変の存在可能性が高いと判定することを特徴とする付記27または28に記載の信号処理装置。
(付記30)
前記直線性計算手段は、
周波数ごとに位相成分と隣接周波数における位相成分の差として位相成分差を算出し、
前記位相成分差の隣接周波数における差に基づいて、前記直線性を計算することを特徴とする付記27、28または29記載の信号処理装置。
(付記31)
前記直線性計算手段は、
前記位相成分差の隣接周波数における差をフレームごとに加算した総和を前記フレームの直線性として計算し、
前記判定手段は、
前記総和が閾値以上なら、前記位相成分差の隣接周波数における差が大きくなるように修正することを特徴とする付記30に記載の信号処理装置。
(付記32)
入力信号を、周波数領域における位相成分信号および振幅成分信号に変換し、
前記位相成分信号および前記振幅成分信号の特徴量を計算し
計算された前記特徴量に基づいて前記入力信号の急変に関する存在可能性を判定する、
各ステップを含むことを特徴とする信号処理方法。
(付記33)
入力信号を、周波数領域における位相成分信号に変換し、
前記入力信号の急増部の位置に基づいて、第1位相傾きを算出し、
周波数領域における前記位相成分信号の第2位相傾きを算出し、
前記第1位相傾きと前記第2位相傾きとに基づいて前記入力信号の急変の存在可能性を判定する、
各ステップを含むことを特徴とする信号処理方法。
(付記34)
入力信号を、周波数領域における位相成分信号に変換し、
前記入力信号に含まれる時間相関のある成分を前記入力信号から除いて低相関信号を生成し、
前記低相関信号と前記位相成分信号とに基づいて、前記入力信号に含まれる急変の存在可能性を判定する、
各ステップを含むことを特徴とする信号処理方法。
(付記35)
入力信号を、周波数領域における位相成分信号に変換し、
周波数領域における前記位相成分信号の直線性を計算し、
計算された前記直線性に基づいて前記入力信号の急変の存在可能性を計算する、
各ステップを含むことを特徴とする信号処理方法。
(付記36)
入力信号を、周波数領域における位相成分信号および振幅成分信号に変換し、
前記位相成分信号および前記振幅成分信号の特徴量を計算し
計算された前記特徴量に基づいて前記入力信号の急変に関する存在可能性を判定する、
各ステップをコンピュータに実行させることを特徴とする信号処理プログラム。
(付記37)
入力信号を、周波数領域における位相成分信号に変換し、
前記入力信号の急増部の位置に基づいて、第1位相傾きを算出し、
周波数領域における前記位相成分信号の第2位相傾きを算出し、
前記第1位相傾きと前記第2位相傾きとに基づいて前記入力信号の急変の存在可能性を判定する、
各ステップをコンピュータに実行させることを特徴とする信号処理プログラム。
(付記38)
入力信号を、周波数領域における位相成分信号に変換し、
前記入力信号に含まれる時間相関のある成分を前記入力信号から除いて低相関信号を生成し、
前記低相関信号と前記位相成分信号とに基づいて、前記入力信号に含まれる急変の存在可能性を判定する、
各ステップをコンピュータに実行させることを特徴とする信号処理プログラム。
(付記39)
入力信号を、周波数領域における位相成分信号に変換し、
周波数領域における前記位相成分信号の直線性を計算し、
計算された前記直線性に基づいて前記入力信号の急変の存在可能性を計算する、
各ステップをコンピュータに実行させることを特徴とする信号処理プログラム。
この出願は、2013年3月5日に出願された日本国特許出願 特願2013−042448号、特願2013−042449号、特願2013−042450号、特願2013−042451号、を基礎とする優先権を主張し、その開示の全てをここに取り込む。

Claims (23)

  1. 入力信号を、周波数領域における位相成分信号および振幅成分信号に変換する変換手段と、
    前記位相成分信号および前記振幅成分信号の特徴量を計算する計算手段と、
    前記計算手段によって計算された前記特徴量に基づいて前記入力信号の急変に関する存在可能性を判定する判定手段と、
    を備え、
    前記計算手段は、前記位相成分信号から、各周波数の位相変化(φn=θn−θn-1)を求め、該位相変化の差(φn−φn-1)を回転角とする回転ベクトルcos(φn−φn-1)+jsin(φn−φn-1)の大きさを前記特徴量として求める信号処理装置。
  2. 前記変換手段は、位相成分信号および振幅成分信号を含む複素信号を出力し、
    前記計算手段は、
    各周波数における前記複素信号を単位ベクトルに正規化する正規化手段と、
    隣接周波数における前記単位ベクトルの比から第1回転ベクトルを算出する第1算出手段と、
    隣接周波数における前記第1回転ベクトルの比から第2回転ベクトルを算出する第2算出手段と、
    を備え、
    前記判定手段は、前記第2回転ベクトルの実部の大きさに基づいて、前記入力信号の急変に関する存在可能性を判定することを特徴とする請求項1に記載の信号処理装置。
  3. 前記変換手段は、位相成分信号および振幅成分信号を含む複素信号を出力し、
    前記計算手段は、
    各周波数における前記複素信号を単位ベクトルに正規化する正規化手段と、
    隣接周波数における前記単位ベクトルの比から第1回転ベクトルを算出する第1算出手段と、
    隣接周波数における前記第1回転ベクトルの比から第2回転ベクトルを算出する第2算出手段と、
    を備え、
    前記判定手段は、前記第2回転ベクトルの角度の大きさに基づいて、前記入力信号の急変を検出することを特徴とする請求項1に記載の信号処理装置。
  4. 前記判定手段で求めた前記急変に関する存在可能性に対応した程度で、振幅の抑圧を行なう振幅制御手段をさらに備えたことを特徴とする請求項1乃至3のいずれか1項に記載の信号処理装置。
  5. 前記判定手段で前記急変を含むと判定されたフレームについて、前記入力信号の位相を変化させる位相制御手段をさらに備えたことを特徴とする請求項1乃至4のいずれか1項に記載の信号処理装置。
  6. 入力信号を、周波数領域における位相成分信号および振幅成分信号にフレーム毎に変換する変換手段と、
    前記入力信号の急増部の位置に基づいて、第1位相傾きを算出する第1算出手段と、
    周波数領域における前記位相成分信号の第2位相傾きを算出する第2算出手段と、
    前記第1位相傾きと前記第2位相傾きとに基づいて前記入力信号の急変に関する存在可能性を判定する判定手段と、
    を備えたことを特徴とする信号処理装置。
  7. 前記判定手段は、前記第1位相傾きと前記第2位相傾きとの類似度に基づいて、前記入力信号の急変に関する存在可能性を判定することを特徴とする請求項6に記載の信号処理装置。
  8. 前記第1算出手段は、フレーム内の信号絶対値が急増する位置を検出する急増部検出手段と、フレーム開始から前記急増部の存在する位置までの遅延時間を算出する遅延時間算出手段と、前記遅延時間を、周波数領域の位相に変換する位相変換手段と、を含むことを特徴とする請求項6または7に記載の信号処理装置。
  9. 前記変換手段はさらに前記入力信号の周波数領域における振幅成分信号を算出し、前記振幅成分信号の平坦度を算出する算出手段をさらに備え、
    前記判定手段は、さらに前記振幅成分信号の平坦度を考慮して前記入力信号の急変の存在可能性を判定することを特徴とする請求項8に記載の信号処理装置。
  10. 前記判定手段は、前記第1位相傾きと前記第2位相傾きとの類似度、および前記振幅成分信号の平坦度を、それぞれ重み付けして得た値に基づいて前記信号の急変の存在可能性の判定を行なうことを特徴とする請求項6乃至9のいずれか1項に記載の信号処理装置。
  11. 前記判定手段で求めた前記急変の存在可能性に対応した程度で、振幅の抑圧を行なう振幅制御手段をさらに備えたことを特徴とする請求項6乃至10のいずれか1項に記載の信号処理装置。
  12. 前記判定手段で前記急変を含むと判定されたフレームについて、前記入力信号の位相を変化させる位相制御手段をさらに備えたことを特徴とする請求項6乃至11のいずれか1項に記載の信号処理装置。
  13. 入力信号を、周波数領域における位相成分信号および振幅成分信号にフレーム毎に変換する変換手段と、
    前記入力信号に含まれる時間相関のある成分を前記入力信号から除いて低相関信号を生成する生成手段と、
    前記低相関信号と前記位相成分信号とに基づいて、前記入力信号に含まれる急変の存在可能性を判定する判定手段と、
    を備えたことを特徴とする信号処理装置。
  14. 前記低相関信号の急増部の位置に基づいて、信号急変部における第1相傾きを算出する第1算出手段と、
    周波数領域における前記位相成分信号の第2位相傾きを算出する第2算出手段と、
    をさらに有し、
    前記判定手段は、前記第1位相傾きと前記第2位相傾きとに基づいて前記入力信号の急変の存在可能性を判定することを特徴とする請求項13に記載の信号処理装置。
  15. 前記判定手段は、前記第1位相傾きと前記第2位相傾きとの類似度に基づいて、前記入力信号の急変の存在可能性を判定することを特徴とする請求項14に記載の信号処理装置。
  16. 前記第1算出手段は、フレーム内の信号絶対値が急増する位置を検出する急増部検出手段と、
    フレーム開始から前記急増部の存在する位置までの遅延時間を算出する遅延時間算出手段と、
    前記遅延時間を、周波数領域の位相に変換する位相変換手段と、
    を含むことを特徴とする請求項14または15に記載の信号処理装置。
  17. 前記変換手段はさらに前記入力信号の周波数領域における振幅成分信号を算出し、前記振幅成分信号の平坦度を算出する算出手段をさらに備え、
    前記判定手段は、さらに前記振幅成分信号の平坦度を考慮して前記入力信号の急変の存在可能性を判定することを特徴とする請求項13に記載の信号処理装置。
  18. 前記判定手段で求めた前記急変の存在可能性に対応した程度で、振幅の抑圧を行なう振幅制御手段をさらに備えたことを特徴とする請求項13乃至17のいずれか1項に記載の信号処理装置。
  19. 前記判定手段で前記急変を含むと判定されたフレームについて、前記入力信号の位相を変化させる位相制御手段をさらに備えたことを特徴とする請求項13乃至18のいずれか1項に記載の信号処理装置。
  20. 入力信号を、周波数領域における位相成分信号に変換し、
    前記入力信号の急増部の位置に基づいて、第1位相傾きを算出し、
    周波数領域における前記位相成分信号の第2位相傾きを算出し、
    前記第1位相傾きと前記第2位相傾きとに基づいて前記入力信号の急変の存在可能性を判定する、
    各ステップを含むことを特徴とする信号処理方法。
  21. 入力信号を、周波数領域における位相成分信号に変換し、前記入力信号に含まれる時間相関のある成分を前記入力信号から除いて低相関信号を生成し、前記低相関信号と前記位相成分信号とに基づいて、前記入力信号に含まれる急変の存在可能性を判定する、各ステップを含むことを特徴とする信号処理方法。
  22. 入力信号を、周波数領域における位相成分信号に変換し、前記入力信号の急増部の位置に基づいて、第1位相傾きを算出し、周波数領域における前記位相成分信号の第2位相傾きを算出し、前記第1位相傾きと前記第2位相傾きとに基づいて前記入力信号の急変の存在可能性を判定する、各ステップをコンピュータに実行させることを特徴とする信号処理プログラム。
  23. 入力信号を、周波数領域における位相成分信号に変換し、前記入力信号に含まれる時間相関のある成分を前記入力信号から除いて低相関信号を生成し、前記低相関信号と前記位相成分信号とに基づいて、前記入力信号に含まれる急変の存在可能性を判定する、各ステップをコンピュータに実行させることを特徴とする信号処理プログラム。
JP2015504258A 2013-03-05 2014-02-26 信号処理装置、信号処理方法および信号処理プログラム Active JP6528679B2 (ja)

Applications Claiming Priority (9)

Application Number Priority Date Filing Date Title
JP2013042449 2013-03-05
JP2013042451 2013-03-05
JP2013042450 2013-03-05
JP2013042448 2013-03-05
JP2013042449 2013-03-05
JP2013042450 2013-03-05
JP2013042451 2013-03-05
JP2013042448 2013-03-05
PCT/JP2014/054634 WO2014136629A1 (ja) 2013-03-05 2014-02-26 信号処理装置、信号処理方法および信号処理プログラム

Publications (2)

Publication Number Publication Date
JPWO2014136629A1 JPWO2014136629A1 (ja) 2017-02-09
JP6528679B2 true JP6528679B2 (ja) 2019-06-12

Family

ID=51491149

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2015504258A Active JP6528679B2 (ja) 2013-03-05 2014-02-26 信号処理装置、信号処理方法および信号処理プログラム

Country Status (4)

Country Link
US (1) US9715885B2 (ja)
JP (1) JP6528679B2 (ja)
TW (3) TWI581256B (ja)
WO (1) WO2014136629A1 (ja)

Families Citing this family (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2014123011A (ja) * 2012-12-21 2014-07-03 Sony Corp 雑音検出装置および方法、並びに、プログラム
JP6528679B2 (ja) * 2013-03-05 2019-06-12 日本電気株式会社 信号処理装置、信号処理方法および信号処理プログラム
CN106157967A (zh) 2015-04-28 2016-11-23 杜比实验室特许公司 脉冲噪声抑制
JP6785446B2 (ja) * 2016-04-14 2020-11-18 パナソニックIpマネジメント株式会社 生体信号計測システム
AU2017372454B2 (en) * 2016-12-06 2020-07-16 Nippon Telegraph And Telephone Corporation Signal feature extraction apparatus, signal feature extraction method, and program
AU2017201760B2 (en) * 2017-03-15 2023-03-09 Canon Kabushiki Kaisha Method, apparatus and system for encoding and decoding video data
CN111031902B (zh) * 2017-08-31 2022-10-11 加利福尼亚大学董事会 多传感器心搏出量监测系统和分析法
EP3675717B1 (en) 2017-08-31 2023-12-06 The Regents of the University of California Multisensor cardiac function monitoring and analytics systems
JP7152112B2 (ja) * 2018-08-24 2022-10-12 日本電気株式会社 信号処理装置、信号処理方法および信号処理プログラム
US11284856B2 (en) * 2019-12-31 2022-03-29 Industrial Technology Research Institute Method for detecting vascular obstruction and system using the same
JP7355972B2 (ja) * 2021-06-24 2023-10-04 学校法人東京工芸大学 検査装置、方法、及びプログラム

Family Cites Families (29)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2558876B2 (ja) * 1989-06-02 1996-11-27 松下電器産業株式会社 音声符号化装置
EP0810599B1 (en) * 1991-05-29 2003-11-26 Pacific Microsonics, Inc. Improvements in signal encode/decode systems
JP3285178B2 (ja) * 1994-08-10 2002-05-27 日本電信電話株式会社 音信号立ち上がり検出方法
CN1192358C (zh) 1997-12-08 2005-03-09 三菱电机株式会社 声音信号加工方法和声音信号加工装置
US6420989B1 (en) * 2001-01-22 2002-07-16 Credence Systems Corporation Programmable non-uniform clock signal generator
DE10224161B4 (de) * 2002-05-31 2012-07-12 Globalfoundries Inc. Restphasenfehlerkorrektur
US7949522B2 (en) * 2003-02-21 2011-05-24 Qnx Software Systems Co. System for suppressing rain noise
KR100580643B1 (ko) * 2004-02-10 2006-05-16 삼성전자주식회사 충격음 감지 장치, 방법 그리고 이를 이용한 충격음 식별장치 및 방법
JP2006042025A (ja) * 2004-07-28 2006-02-09 Casio Comput Co Ltd Ofdm信号復調回路及びofdm信号復調方法
AU2006232361B2 (en) 2005-04-01 2010-12-23 Qualcomm Incorporated Methods and apparatus for encoding and decoding an highband portion of a speech signal
PL1875463T3 (pl) 2005-04-22 2019-03-29 Qualcomm Incorporated Układy, sposoby i urządzenie do wygładzania współczynnika wzmocnienia
JP2007251908A (ja) 2006-02-15 2007-09-27 Sanyo Electric Co Ltd ノイズ検出回路及びそれを用いたam受信機
CN101548486A (zh) * 2006-10-02 2009-09-30 三井松岛产业株式会社 用于主平巷的无线通信系统
US9047874B2 (en) 2007-03-06 2015-06-02 Nec Corporation Noise suppression method, device, and program
KR101230479B1 (ko) 2008-03-10 2013-02-06 프라운호퍼 게젤샤프트 쭈르 푀르데룽 데어 안겐반텐 포르슝 에. 베. 트랜지언트 이벤트를 갖는 오디오 신호를 조작하기 위한 장치 및 방법
JP2011254122A (ja) 2009-03-23 2011-12-15 Nec Corp 回路、制御システム、制御方法及びプログラム
JP5310494B2 (ja) * 2009-11-09 2013-10-09 日本電気株式会社 信号処理方法、情報処理装置、及び信号処理プログラム
KR20110090232A (ko) * 2010-02-03 2011-08-10 엘에스산전 주식회사 위상변위기를 이용한 벡터 모듈레이터
JP2011199808A (ja) 2010-03-24 2011-10-06 Hitachi Kokusai Electric Inc 受信装置の等化部
CN102918592A (zh) * 2010-05-25 2013-02-06 日本电气株式会社 信号处理方法、信息处理设备和信号处理程序
US9030240B2 (en) * 2010-11-24 2015-05-12 Nec Corporation Signal processing device, signal processing method and computer readable medium
JP6070953B2 (ja) * 2011-02-26 2017-02-01 日本電気株式会社 信号処理装置、信号処理方法、及び記憶媒体
US8791854B2 (en) * 2011-10-10 2014-07-29 Infineon Technologies Ag Automotive radar transmitter architecture
US9858946B2 (en) * 2013-03-05 2018-01-02 Nec Corporation Signal processing apparatus, signal processing method, and signal processing program
JP6528679B2 (ja) * 2013-03-05 2019-06-12 日本電気株式会社 信号処理装置、信号処理方法および信号処理プログラム
WO2015029546A1 (ja) * 2013-08-30 2015-03-05 日本電気株式会社 信号処理装置、信号処理方法および信号処理プログラム
WO2015029545A1 (ja) * 2013-08-30 2015-03-05 日本電気株式会社 信号処理装置、信号処理方法および信号処理プログラム
US9905247B2 (en) * 2013-10-04 2018-02-27 Nec Corporation Signal processing apparatus, medium apparatus, signal processing method, and signal processing program
US9667219B2 (en) * 2015-04-22 2017-05-30 The Regents Of The University Of California Phase noise measurement and filtering circuit

Also Published As

Publication number Publication date
TW201642252A (zh) 2016-12-01
TW201642253A (zh) 2016-12-01
JPWO2014136629A1 (ja) 2017-02-09
TW201503115A (zh) 2015-01-16
TWI587293B (zh) 2017-06-11
US20160019914A1 (en) 2016-01-21
TWI581256B (zh) 2017-05-01
US9715885B2 (en) 2017-07-25
TWI585753B (zh) 2017-06-01
WO2014136629A1 (ja) 2014-09-12

Similar Documents

Publication Publication Date Title
JP6528679B2 (ja) 信号処理装置、信号処理方法および信号処理プログラム
JP6406258B2 (ja) 信号処理装置、信号処理方法および信号処理プログラム
JP5791092B2 (ja) 雑音抑圧の方法、装置、及びプログラム
JP6406257B2 (ja) 信号処理装置、信号処理方法および信号処理プログラム
JP5310494B2 (ja) 信号処理方法、情報処理装置、及び信号処理プログラム
WO2014136628A1 (ja) 信号処理装置、信号処理方法および信号処理プログラム
JP6064600B2 (ja) 信号処理装置、信号処理方法、及び信号処理プログラム
JPH0667691A (ja) 雑音除去装置
WO2012070670A1 (ja) 信号処理装置、信号処理方法、及び信号処理プログラム
JP5413575B2 (ja) 雑音抑圧の方法、装置、及びプログラム
JP6011536B2 (ja) 信号処理装置、信号処理方法、およびコンピュータ・プログラム
JP7152112B2 (ja) 信号処理装置、信号処理方法および信号処理プログラム
JP6119604B2 (ja) 信号処理装置、信号処理方法、および信号処理プログラム
CN116504264B (zh) 音频处理方法、装置、设备及存储介质

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20170112

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20180315

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20180514

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20181025

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20181128

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20190416

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20190429

R150 Certificate of patent or registration of utility model

Ref document number: 6528679

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150