JP6570577B2 - 音声処理装置、音声処理方法、およびプログラム - Google Patents

音声処理装置、音声処理方法、およびプログラム Download PDF

Info

Publication number
JP6570577B2
JP6570577B2 JP2017099659A JP2017099659A JP6570577B2 JP 6570577 B2 JP6570577 B2 JP 6570577B2 JP 2017099659 A JP2017099659 A JP 2017099659A JP 2017099659 A JP2017099659 A JP 2017099659A JP 6570577 B2 JP6570577 B2 JP 6570577B2
Authority
JP
Japan
Prior art keywords
level
gain
unit
noise
recovery mode
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2017099659A
Other languages
English (en)
Other versions
JP2018196041A (ja
Inventor
博幸 森
博幸 森
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Inc
Original Assignee
Canon Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Inc filed Critical Canon Inc
Priority to JP2017099659A priority Critical patent/JP6570577B2/ja
Priority to US15/978,719 priority patent/US10306390B2/en
Publication of JP2018196041A publication Critical patent/JP2018196041A/ja
Application granted granted Critical
Publication of JP6570577B2 publication Critical patent/JP6570577B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R29/00Monitoring arrangements; Testing arrangements
    • H04R29/004Monitoring arrangements; Testing arrangements for microphones
    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03GCONTROL OF AMPLIFICATION
    • H03G3/00Gain control in amplifiers or frequency changers
    • H03G3/20Automatic control
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N5/00Details of television systems
    • H04N5/76Television signal recording
    • H04N5/765Interface circuits between an apparatus for recording and another apparatus
    • H04N5/77Interface circuits between an apparatus for recording and another apparatus between a recording apparatus and a television camera
    • H04N5/772Interface circuits between an apparatus for recording and another apparatus between a recording apparatus and a television camera the recording apparatus and the television camera being placed in the same enclosure
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N9/00Details of colour television systems
    • H04N9/79Processing of colour television signals in connection with recording
    • H04N9/80Transformation of the television signal for recording, e.g. modulation, frequency changing; Inverse transformation for playback
    • H04N9/802Transformation of the television signal for recording, e.g. modulation, frequency changing; Inverse transformation for playback involving processing of the sound signal
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R3/00Circuits for transducers, loudspeakers or microphones
    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03GCONTROL OF AMPLIFICATION
    • H03G3/00Gain control in amplifiers or frequency changers
    • H03G3/20Automatic control
    • H03G3/30Automatic control in amplifiers having semiconductor devices
    • H03G3/3005Automatic control in amplifiers having semiconductor devices in amplifiers suitable for low-frequencies, e.g. audio amplifiers
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N5/00Details of television systems
    • H04N5/44Receiver circuitry for the reception of television signals according to analogue transmission standards
    • H04N5/60Receiver circuitry for the reception of television signals according to analogue transmission standards for the sound signals
    • H04N5/602Receiver circuitry for the reception of television signals according to analogue transmission standards for the sound signals for digital sound signals
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R2430/00Signal processing covered by H04R, not provided for in its groups
    • H04R2430/01Aspects of volume control, not necessarily automatic, in sound systems

Landscapes

  • Engineering & Computer Science (AREA)
  • Signal Processing (AREA)
  • Multimedia (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Health & Medical Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Otolaryngology (AREA)
  • Circuit For Audible Band Transducer (AREA)
  • Control Of Amplification And Gain Control (AREA)

Description

本発明は、音声を処理する音声処理装置、音声処理方法、およびプログラムに関する。
従来、音声処理装置としてビデオカメラが知られている。ビデオカメラでは、入力音声のレベルが閾値を超えないようにゲインを制御(リミット動作)し、その後、入力音声のレベルが低くなった場合にゲインを大きくして(リカバリ動作)適切なレベルの音声を記録する機能を持つ。また、入力音声レベルが閾値を超えている期間が短い場合には、リカバリ動作においてゲインを素早く大きくすることにより、音声の揺らぎを低減することも行われる。なお、リカバリ動作に類似した技術として、特許文献1には、デジタル放送波の受信強度低下に応じてレベルが増加するノイズを音声信号に印加することで、突然の音声出力停止に対する聴取の違和感を軽減する技術が開示されている。
特開平9−148950号公報
ところで、コンサート会場など比較的静かな環境下において、ビデオカメラの近くで拍手音などが発生した場合、前述のリミット動作とリカバリ動作が比較的短い期間で繰り返されることになる。一方、入力音声には、マイクロフォンなどの集音装置の性能で決まるノイズが含まれている。そのため、前述のリミット動作とリカバリ動作が比較的短い期間で繰り返された場合、このノイズのレベルも同様に変動してしまう。特に、静かな環境で記録された音声の場合、そのノイズのレベル変動がユーザにとって非常にわかりやすくなり、違和感のあるものになってしまう。
そこで、本発明は、入力音声のレベルが短い期間で変化する場合でも、ノイズの変動を抑えて違和感が少ない音声を得られるようにすることを目的とする。
本発明の音声処理装置は、入力された音声信号のレベルを検出する検出手段と、ゲインに応じて、前記音声信号のレベルを制御するレベル制御手段と、前記検出されたレベルが閾値レベルを超えている場合には前記レベル制御手段から出力される音声信号のレベルが前記閾値レベル以下となるように前記ゲインを小さくするリミット動作を行い、前記リミット動作が行われている状態で前記レベルが前記閾値レベルを超えている状態でなくなった場合には前記ゲインを大きくするリカバリ動作を行うゲイン制御手段と、ノイズ信号を出力するノイズ生成手段と、前記レベル制御手段から出力された音声信号と前記ノイズ生成手段から出力されたノイズ信号とを合成する合成手段と、を有し、前記ゲイン制御手段は、前記リカバリ動作として、第1のリカバリモードと第2のリカバリモードとを有し、前記リミット動作の継続時間が閾値時間以上でない場合には前記第1のリカバリモードに設定し、直前の前記リミット動作の継続時間が閾値時間以上の場合には前記第2のリカバリモードに設定し、前記第2のリカバリモードでは前記第1のリカバリモードよりも長い時間をかけて前記ゲインを大きくし、前記第1のリカバリモードでは所定のレベルの前記ノイズ信号を出力させ、前記第2のリカバリモードでは前記レベル制御手段のゲインに応じたレベルの前記ノイズ信号を出力させるように、前記ノイズ生成手段を制御することを特徴とする。
本発明によれば、入力音声のレベルが短い期間で変化する場合でも、ノイズの変動を抑えて違和感が少ない音声を得ることができる。
実施形態の撮像装置の全体構成を示すブロック図である。 第1の実施形態の音声処理部と音声入力部の構成を示すブロック図である。 第1の実施形態における音声処理のフローチャートである。 第2の実施形態の音声処理部と音声入力部の構成を示すブロック図である。 第2の実施形態における音声処理のフローチャートである。
以下、図面を参照して本発明の好適な実施形態について説明する。
図1は、本実施形態の音声処理装置の一適用例としての撮像装置100の全体構成を示すブロック図である。本実施形態の撮像装置100は、動画や静止画を撮影および記録可能であるとともに、撮影時の音声の取得および記録も可能なビデオカメラであるとする。
撮像部101は、撮影レンズや撮像素子を有し、例えば動画撮影時において被写体等の光学像を光電変換してアナログ画像信号を取得し、さらにアナログデジタル変換によりデジタル画像信号に変換して画像処理部102に出力する。画像処理部102は、撮像部101から出力された画像信号に対して、公知の現像処理やホワイトバランス調整などの各種の処理を行ってバス113に出力する。
音声入力部103は、撮像装置100に内蔵された後述する図2のマイクロフォン(以下、マイク201とする。)を有し、例えば動画撮影時には撮像装置100の周辺の音声を取得して音声処理部104に出力する。また、音声入力部103は、外部音声入力端子を有し、外部音声入力端子を介して接続された外部マイク等から供給された音声信号を取得して、音声処理部104に出力することも可能となされている。音声処理部104は、音声入力部103から供給されたアナログ音声信号をデジタル音声信号に変換し、更に、指向性に関する処理やレベルの適正化処理、特定周波数の低減処理等の音声に関する処理を行ってバス113に出力する。
メモリ105は、画像処理部102から出力された画像信号、音声処理部104から出力された音声信号、或いは後述する符号化により生成された圧縮画像信号や圧縮音声信号などを一時的に記憶する。バス113は、画像信号、音声信号、圧縮画像信号、圧縮音声信号などの各種信号、制御信号などを、各部の間で転送する。このように本実施形態の場合、信号等の転送はバス113を介して行われるが、以下の説明ではその記載を省略することとする。
符号化復号化部106は、動画撮影時においてメモリ105に一時的に記憶された画像信号を読み出して符号化することで圧縮画像信号を生成し、同じく、メモリ105から音声信号を読み出して符号化することで圧縮音声信号を生成する。これら圧縮画像信号と圧縮音声信号は、記録再生部107に送られる。
記録再生部107は、動画撮像時において符号化復号化部106により生成された圧縮画像信号、圧縮音声信号、その他必要なデータを、記録媒体108に記録する。記録媒体108は、メモリカードなどのランダムアクセス可能な記録媒体である。なお、記録媒体108は、磁気ディスク、光学式ディスク、半導体メモリなどのあらゆる方式の記録媒体でもよく、単数だけでなく複数の記録媒体であってもよい。
また、記録再生部107は、動画再生時においては記録媒体108に記録されている圧縮画像信号、圧縮音声信号を読み出して、符号化復号化部106に送る。動画再生時の符号化復号化部106は、それら圧縮画像信号、圧縮音声信号を復号化する。そして、復号化された画像信号は表示制御部109に送られ、復号化された音声信号は音声処理部104に送られる。
表示制御部109は、動画撮影時において撮像部101にて撮像されて画像処理部102で処理された動画や、撮像装置100の操作のために必要な各種の情報を、表示部110に表示する。表示部110は、液晶ディスプレイ、有機ELディスプレイ、電子ペーパー等の表示デバイスを含む。また、表示制御部109は、動画再生時においては記録媒体108から再生されて復号化された動画などを表示部110に表示する。
また動画再生時において記録媒体108から再生されて復号化された音声信号は、音声処理部104に送られる。動画再生時の音声処理部104は、記録媒体108から再生されて復号化された音声信号を音声出力部114に出力する。音声出力部114は、音声処理部104から供給されたデジタル音声信号を、必要に応じてアナログ音声信号に変換し、外部の音声モニタなどに出力する。
操作部112は、ユーザからの操作に応じた指示信号を制御部111に送る。操作部112は、例えば、電源ボタン、記録開始/終了ボタン、再生ボタン、メニュー表示ボタン、決定ボタン、カーソルキー、モード切り替えスイッチ、ダイヤル、表示部110の任意の点を指定するためのポインティングデバイス、タッチパネル等を含む。
制御部111は、操作部112から送られてきた指示信号に基づいて、撮像装置100の各部を制御する。制御部111は、各種処理を実行するための例えばCPU(MPU)、メモリ(DRAM、SRAM、ROM)などからなる。制御部111のROMには、CPUが実行する本実施形態に係る各種制御や処理のプログラム、各種の初期設定値等が記憶されている。
次に、撮像装置100における通常の動作について説明する。
ユーザが操作部112の電源ボタンに対して電源オンの操作をすると、操作部112から制御部111に起動の指示が出される。この指示を受けて、制御部111は、不図示の電源供給部を制御して、撮像装置100の各部に対して電源を供給させる。そして、電源が供給されると、制御部111は、ユーザが操作部112のモード切り替えスイッチを操作して例えば撮影モード、再生モード等の何れのモードに切り替えたかを、操作部112からの指示信号により確認する。例えば撮影モードに切り替えられた場合、制御部111は、撮像装置100を撮影待機状態とし、ユーザにより操作部112の記録開始ボタンが操作されると、各部を制御して撮影および記録動作を開始させる。撮影モードで撮影が実行されている間は、撮影画像信号から生成された圧縮画像信号と撮影時の入力音声信号から生成された圧縮音声信号とが、記録媒体108に記録される。そして、ユーザにより操作部112の記録終了ボタンが操作されると、制御部111は、各部を制御して撮影および記録動作を終了させて、撮影待機状態に戻す。また、再生モードになされた場合、制御部111は、記録再生部107を介して記録媒体108から圧縮画像信号と圧縮音声信号を読み出させ、それら信号が符号化復号化部106に送られる。符号化復号化部106は、それら圧縮画像信号と圧縮音声信号を復号化する。そして、復号化された動画は表示制御部109を介して表示部110に表示され、復号化された音声は音声処理部104を介して音声出力部114から出力される。
以下、撮影モードの際の撮像装置100の動作について詳細に説明する。
撮影モードになると、制御部111は、前述のように、先ず撮像装置100を撮影待機状態に設定する。そして、撮影待機状態において、ユーザにより操作部112の記録開始ボタンが操作されて撮影および記録開始の指示信号が入力されると、制御部111は、記録開始の制御信号を撮像装置100の各部に送り、以下の撮影動作を行わせるように各部を制御する。
撮像部101は、画像処理部102を介して制御部111から記録開始の制御信号を受け取ると、撮影レンズにより取り込まれた被写体等の光学像を撮像素子にてアナログ画像信号に変換する。さらに、撮像部101は、アナログ画像信号をアナログデジタル変換によりデジタル画像信号に変換して、画像処理部102に出力する。このときの画像処理部102は、撮像部101から出力された画像信号に対して画質調整処理を実行する。具体的には、画像処理部102は、例えばホワイトバランス調整や色調整、明るさ調整などの各設定値が制御部111により制御され、それらの設定値に基づく画質調整処理を行う。画像処理部102による処理後の画像信号は、表示制御部109に送られる。表示制御部109は、画像処理部102から受け取った画像信号に基づく映像を表示部110に表示させる。また、画像処理部102による処理後の画像信号は、メモリ105にも送られて一時的に記憶される。
音声入力部103は、音声処理部104を介して制御部111から記録開始の制御信号を受け取ると、内蔵されたマイクまたは外部音声入力端子を介して接続された外部マイク等からアナログ音声信号を取得する。さらに、音声入力部103は、そのアナログ音声信号をアナログデジタル変換によりデジタル音声信号に変換して、音声処理部104に送る。音声処理部104は、内蔵マイクまたは外部音声入力端子を介して取得された音声信号を必要に応じて選択し、音声レベルの適正化処理、特定周波数の低減処理等を行う。音声処理部104による処理後の音声信号は、メモリ105に送られて一時的に記憶される。
また、撮影モードの場合、符号化復号化部106は、制御部111から記録開始の制御信号を受け取ると、メモリ105に一時的に記憶された画像信号や音声信号を読み出して所定の符号化を行い、圧縮画像信号、圧縮音声信号等を生成する。そして、制御部111は、これらの圧縮画像信号と圧縮音声信号を含むデータストリームを形成し、記録再生部107に出力する。記録再生部107は、制御部111から記録開始の制御信号を受け取ると、UDF(ユニバーサルディスクフォーマット)やFAT(ファイルアロケーションテーブル)等のファイルシステム管理の下、そのデータストリームを一つの動画ファイルとする。そして、記録再生部107は、その動画ファイルを記録媒体108に記録する。
制御部111は、撮影モードにおいて撮影が行われている間は、以上の動作を継続するように各部を制御する。
その後、ユーザにより操作部112の記録開始/終了ボタンが操作されて撮影および記録停止の指示信号を受け取ると、制御部111は、処理終了の制御信号を撮像装置100の各部に送り、以下の撮影終了動作を行わせるよう各部を制御する。
制御部111から処理終了の制御信号を受け取ると、画像処理部102は、前述した処理後の画像信号をメモリ105へ送るのを停止し、同様に、音声処理部104は、前述した処理後の音声信号をメモリ105へ送るのを停止する。
また、符号化復号化部106は、制御部111から処理終了の制御信号を受け取ると、符号化の動作を停止する。ただし、処理終了の制御信号を受け取った時点で、符号化が未処理となっている画像信号と音声信号がメモリ105に残っている場合、符号化復号化部106は、その残りの画像信号と音声信号を読み出して所定の符号化を行う。そして、符号化復号化部106は、その残りの画像信号と音声信号の符号化が完了すると、メモリ105からの読み出しおよび符号化の動作を停止する。
このときの制御部111は、符号化復号化部106で符号化が完了した圧縮画像信号、圧縮音声信号を含むデータストリームを形成する。記録再生部107は、そのデータストリームを記録媒体108に記録し、制御部111からデータストリームの供給が停止した時に動画ファイルを完成させて、記録動作を停止させる。そして、制御部111は、記録再生部107による記録動作が停止すると、撮像装置100を撮影待機状態に移行させる制御信号を各部に送る。これにより、撮像装置100は撮影待機状態となる。
また、撮影待機状態になっている場合、制御部111は、撮像装置100の各部を以下のように動作させる制御を行う。
撮影待機状態において撮像部101により撮像され、画像処理部102による処理がなされた後の画像信号は、表示制御部109に送られる。表示制御部109は、撮影待機状態の際に画像処理部102から供給された画像信号にかかる映像と撮像装置100の操作のために必要な情報を、表示部110に表示させる。これにより、撮像装置100を操作しているユーザは、表示部110に表示された画面を見ながら撮影の準備等を行うことができる。
次に、再生モードの際の撮像装置100の動作について詳細に説明する。
再生モードにおいて、ユーザにより操作部112の再生ボタンが操作されて再生開始の指示信号が入力されると、制御部111は、再生開始の制御信号を撮像装置100の各部に送り、以下の再生動作を行わせるように各部を制御する。なお、再生開始に先立ち、記録媒体108に記録されている動画ファイルの中から、ユーザにより、再生すべきファイルの指定がなされているとする。
記録再生部107は、制御部111から再生開始の制御信号を受け取ると、記録媒体108から、ユーザにより再生の指示がなされている動画ファイルの圧縮画像信号と圧縮音声信号を読み出し、それら信号を一時的にメモリ105に記憶させる。符号化復号化部106は、そのメモリ105に一時的に記憶された圧縮画像信号と圧縮音声信号を読み出し、所定の復号化を行い、その復号化した画像信号を表示制御部109に送り、また復号化した音声信号を音声処理部104に送る。
表示制御部109は、符号化復号化部106から供給された画像信号にかかる映像を表示部110に表示させる。また、音声処理部104は、符号化復号化部106から供給されたデジタル音声信号をデジタルアナログ変換して、音声出力部114から出力させる。再生モードの場合、撮像装置100では、このようにして記録媒体108から読み出された動画ファイルの映像の表示と音声の出力が行われる。
<第1の実施形態>
以下、第1の実施形態における音声処理部104の構成および処理の詳細について説明する。
図2は、第1の実施形態の構成例として、図1の音声入力部103が備える構成と、音声処理部104が備える構成のうち音声入力部103からの入力音声信号を処理する部分の構成例とを示したブロック図である。
図2において、音声入力部103は、マイク201とAD(アナログデジタル)変換器202とを有して構成されている。マイク201により取得されたアナログ音声信号は、AD変換器202にてデジタル音声信号に変換されて、音声処理部104に送られる。
音声処理部104は、レベル制御部203、レベル検出部204、ゲイン制御部205、ノイズ生成部206、フィルタ207、減衰部208、合成部209を有して構成されている。音声入力部103から送られてきた入力音声信号は、レベル制御部203とレベル検出部204とに入力する。
レベル検出部204は、入力音声信号から音声レベルを検出し、その検出した音声レベルのデータをゲイン制御部205に出力する。ゲイン制御部205は、レベル検出部204にて検出された音声レベルに応じたゲイン値を決定し、その決定したゲイン値をレベル制御部203に送る。レベル制御部203は、ゲイン制御部205から供給されたゲイン値を用いて、入力音声のレベルを制御し、合成部209に出力する。また、ゲイン制御部205は、入力音声レベルに基づいてリミット動作およびリカバリ動作を制御し、さらに、リミット動作およびリカバリ動作の状態に応じて、後述する減衰部208でノイズレベルを減衰させる際の減衰量についても制御する。リミット動作とは、入力音声のレベルが所定の閾値レベルを超えないようにゲインを調整(制限)する動作である。また、リカバリ動作は、リミット動作が行われたことで入力音声のレベルが低くなった場合にゲインを大きくするように戻す(リカバリする)動作である。
ノイズ生成部206は、ランダムノイズ信号を生成してフィルタ207に出力する。本実施形態の場合、ノイズ生成部206は、低周波数領域から高周波数領域まで一定のレベルのノイズを含んだランダムノイズ信号を生成する。フィルタ207は、ノイズ生成部206からのノイズ信号の波形を成形して減衰部208に出力する。ここで、マイク201により取得された音声信号に含まれるフロアノイズの成分が例えば−60dBfs(dBフルスケール)程度であるとする。この場合、フィルタ207は、マイク201により取得された音声信号に含まれるフロアノイズと同様の周波数成分を持つように、ノイズ生成部206で生成されたノイズ信号に対してフィルタ処理を施して出力する。
減衰部208は、ゲイン制御部205からの減衰量に基づいて、フィルタ207から出力されたノイズ信号のレベルを調整し、合成部209に出力する。合成部209は、レベル制御部203から出力された音声信号に対して、減衰部208から出力されたノイズ信号を合成する。この合成部209の出力が、音声処理部104による処理後の音声信号となされる。
以下、音声処理部104における処理の詳細を説明する。
図3は、概ね図2に示した音声処理部104における処理の流れを示したフローチャートである。但し、S411の処理は制御部111により行われる。図3のフローチャートの処理は、ハードウェア構成により実行されてもよいし、一部がソフトウェア構成で残りがハードウェア構成により実現されてもよい。ソフトウェア構成により処理が実行される場合、図3のフローチャートの処理は、本実施形態にかかる音声処理のプログラムをCPU等が実行することにより実現される。本実施形態にかかる音声処理のプログラムは、不図示のROM等に予め用意されていてもよく、また不図示の着脱可能な半導体メモリから読み出されても、或いは不図示のインターネット等のネットワークからダウンロードされてもよい。また以下の説明では、図3の各処理のステップS401〜ステップS420をS401〜S420と略記する。これらのことは後述する他のフローチャートにおいても同様とする。
図3に示すフローチャートの処理は、操作部112を介してユーザから動画の撮影および記録開始の指示が入力され、制御部111から音声処理部104に記録開始の制御信号が入力されたことによりスタートする。また、S402からS411までの処理は例えば予め決められた所定の1サイクルの期間ごとに行われ、この1サイクルごとの処理は、操作部112を介してユーザから動画の記録停止の指示が入力されるまでの間、繰り返し実行される。
ユーザから動画の記録開始の指示が入力されて図3のフローチャートの処理がスタートすると、先ず、S401において、ゲイン制御部205は、リミット動作の継続時間tをゼロ(0)に初期化する。
次にS402において、ゲイン制御部205は、直前のサイクルにおけるリミット動作の継続時間tがリカバリモードの判定のための閾値時間Tよりも短いか否かを判別する。ここで、本実施形態の場合、ゲイン制御部205は、リカバリモードとして、ファストリカバリモードと、スローリカバリモードとを設定可能となされている。ファストリカバリモードは、リミット動作後に、短時間にゲインを素早く大きしてリカバリするモードである。スローリカバリモードは、リミット動作後に、ファストリカバリモードよりも長い時間をかけてゆっくりとゲインを徐々に大きくしてリカバリするモードである。そして、ゲイン制御部205は、S402で継続時間が閾値時間よりも短い(t<T)と判定(Yes)した場合には、S403の処理として、リカバリモードをファストリカバリモードに設定する。一方、ゲイン制御部205は、S402で継続時間が閾値時間以上(t≧T)と判定(No)場合には、S404の処理として、リカバリモードをスローリカバリモードに設定する。なお、本実施形態の場合、ファストリカバリモードに設定された場合にはフラグFASTに1を立て、スローリカバリモードに設定された場合にはフラグFASTを0にする。S403、S404の後、音声処理部104の処理は、レベル検出部204にて行われるS405に進む。
次のS405において、レベル検出部204は、入力音声レベルを検出し、その音声レベルのデータをゲイン制御部205に出力する。そして、S405の後、音声処理部104の処理は、ゲイン制御部205にて行われるS406に進む。
S406において、ゲイン制御部205は、レベル検出部204にて検出された入力音声レベルが、リミット動作を実行するか否かを判断するための閾値レベルを超えているか否かを判定する。ゲイン制御部205は、S406において入力音声レベルが閾値レベル以下(閾値レベルを超えていない)と判定(No)した場合には、S412に処理を進める。一方、ゲイン制御部205は、S406において入力音声レベルが閾値レベルを超えていると判定(Yes)した場合には、リミット動作を実行すると判断して、S407以降に処理を進める。
S407の処理に進むと、ゲイン制御部205は、リミット動作時にレベル制御部203が音声信号のゲインを抑制する際のゲイン抑制量LIM_LEVELを算出する。ここで、ゲイン制御部205は、例えば、レベル検出部204により検出された入力音声レベルLEVELから、リミット動作の閾値レベルThreshを減算した値を、ゲイン抑制量LIM_LEVELとして算出する。S407の後、ゲイン制御部205は、S408に処理を進める。
S408に進むと、ゲイン制御部205は、リミット動作時にレベル制御部203に与えるゲイン値NOW_GAINを算出し、その算出したゲイン値NOW_GAINをレベル制御部203に対して設定する。例えば、ゲイン制御部205は、リミット動作を行っていないときのゲイン設定量GAINから、ゲイン抑制量LIM_LEVELを減算することにより、リミット動作時のゲイン値NOW_GAINを算出する。S408の後、ゲイン制御部205は、S409に処理を進める。
S409に進むと、ゲイン制御部205は、減衰部208によるノイズ信号の減衰量NoiseATTをゼロ(0)に設定する。これにより、合成部209では、フィルタ207からのノイズ信号のレベルが減衰されずにレベル制御部203からの音声信号に合成されるようになる。そして、ゲイン制御部205は、S410の処理として、リミット動作の継続時間tに所定の時間(例えば1サイクル期間の時間)を加算する。S410の後のS411の処理は、制御部111において行われる。
S411に進むと、制御部111は、ユーザから操作部112を介して記録停止の指示がなされたか否かを判定し、記録停止の指示がなされていないと判定(No)した場合には処理をS402に戻し、次のサイクルにおける処理を継続する。このように、S402からS411までの処理は1サイクル期間ごとに行われ、S402にて閾値時間Tと比較される継続時間tは、S410において1サイクル期間ごとに継続時間tに所定の時間が加算されることにより求められている。一方、S411において記録停止の指示がなされたと判定(Yes)した場合、制御部111は、音声処理部104に対して音声信号の処理を停止する制御信号を送る。これにより図3のフローチャートの処理が終了される。
S406において入力音声レベルが閾値レベル以下と判定されてS412に進むと、ゲイン制御部205は、リミット動作後のリカバリ動作の実行中であるか否かを判別する。ここで、本実施形態の場合、閾値レベルを超えるレベルの音声が入力されてリミット動作が行われた後、その入力音声レベルが閾値レベル以下になった場合に、レベル制御部203に与えるゲインを大きくして音声レベルの変動を抑えるリカバリ動作が行われる。したがって、S412において、ゲイン制御部205は、リミット動作の後のリカバリ動作が実行中であるか否かを判定する。具体的には、ゲイン制御部205は、S412において、ゲイン抑制量LIM_LEVELがゼロ(0)より大きい(LIM_LEVEL>0)場合にリカバリ動作中であると判定(Yes)して、S413に処理を進める。一方、ゲイン抑制量LIM_LEVELがゼロ(LIM_LEVEL=0)の場合、ゲイン制御部205は、リカバリ動作中ではないと判定(No)してS420に処理を進める。
S412でリカバリ動作中であると判定されてS413に進むと、ゲイン制御部205は、現在のリカバリモードがファストリカバリモードであるか否かを判別する。ゲイン制御部205は、リカバリモードがファストリカバリモードであると判定(Yes)した場合には、S414に処理を進める。一方、ゲイン制御部205は、リカバリモードがファストリカバリモードでない(つまりスローリカバリモードである)と判定(No)した場合にはS416に処理を進める。
S413でファストリカバリモードであると判定されてS414に進んだ場合、ゲイン制御部205は、リカバリ動作時におけるゲインのリカバリ量RECOV_STEPとして、FAST_RECOV_STEPを設定する。ここで、リカバリ量FAST_RECOV_STEPは、ファストリカバリモードの1サイクル期間においてゲインを増加させる第1のゲインである。その後、ゲイン制御部205は、S415の処理として、減衰部208によるノイズ信号の減衰量NoiseATTをゼロ(0)に設定する。これにより、合成部209では、フィルタ207からのノイズ信号のレベルが減衰されずに、レベル制御部203からの音声信号に合成されることになる。S415の後、ゲイン制御部205は、S418に処理を進める。
一方、S413でスローリカバリモードであると判定されてS416に進んだ場合、ゲイン制御部205は、リカバリ動作時におけるゲインのリカバリ量RECOV_STEPとして、SLOW_RECOV_STEPを設定する。ここで、リカバリ量SLOW_RECOV_STEPは、スローリカバリモードの1サイクル期間においてゲインを増加させる第2のゲインであり、SLOW_RECOV_STEP<FAST_RECOV_STEPである。その後、ゲイン制御部205は、S417の処理として、減衰部208によるノイズ信号の減衰量NoiseATTをゲイン抑制量LIM_LEVELに設定する。これにより、合成部209では、フィルタ207からのノイズ信号のレベルがゲイン抑制量LIM_LEVELに応じて減衰されて、レベル制御部203からの音声信号に合成されることになる。S417の後、ゲイン制御部205は、S418に処理を進める。
S418に進むと、ゲイン制御部205は、現在のゲイン抑制量LIM_LEVELから、S414又はS416で設定されたリカバリ量RECOV_STEPを減算し、それをゲイン抑制量LIM_LEVELとしてレベル制御部203に再設定する。そして、S419の処理として、ゲイン制御部205は、リミット動作の継続時間tをそのまま保持する。S419の後は、制御部111にて行われる前述のS411の処理に進む。
また、S412でリカバリ動作中でないと判定されてS420に進んだ場合、ゲイン制御部205は、リミット動作の継続時間tをゼロ(0)に初期化する。S402の後は、制御部111にて行われる前述のS411の処理に進む。
以上説明したように、本実施形態の音声処理部104は、音声入力部103にて取得された入力音声信号が、例えば単発音のようにリミット動作の継続時間が短い音の信号である場合、ゲインを素早く大きくするファストリカバリモードでの音声処理を実行する。ファストリカバリモードの場合、マイク201にて取得された音声に含まれるフロアノイズと同様のノイズ信号を減衰させずに、合成部209においてレベル制御部203からの音声信号と合成する。これにより、合成された後の音声に含まれるノイズ信号の大きさは、レベル制御部203によるゲイン処理によらず一定のレベルとなる。そのため、例えば静かな環境で拍手が連続するような状況でファストリカバリ動作を実行した場合でも、音声信号に含まれるフロアノイズの成分の大きさを一定に保つことができる。したがって、本実施形態によれば、入力音声のレベルが短い期間で変化した場合でも、ノイズの変動を抑えて違和感が少ない音を得ることができる。
また、本実施形態の音声処理部104は、音声入力部103にて取得された入力音声信号が、例えば単発音ではなくリミット動作の継続時間が長くなる音の信号である場合、ゲインをゆっくりと徐々に大きくするスローリカバリモードを実行する。スローリカバリモードの場合、マイク201で取得された音声に含まれるフロアノイズと同様のノイズ信号を、リカバリ動作中のゲインに基づいてゆっくりと増加させ、合成部209においてレベル制御部203からの音声信号と合成する。したがって、本実施形態よれば、スローリカバリモードにおいてゆっくりとゲインが大きくなる状況において、ノイズ成分だけが急に大きくなってしまうことはなく、違和感が少ない音声を得ることができる。
<第2の実施形態>
次に、第2の実施形態における音声処理部104の構成および処理について説明する。
図4は、第2の実施形態の構成例として、図1の音声入力部103が備える構成と、音声処理部104が備える構成のうち音声入力部103からの入力音声信号を処理する部分の構成例と、を示したブロック図である。なお、図4において、前述した図2と同様の構成要素については図2の例と同一の参照番号を付して、それらの詳細な説明は省略する。
図4に示すように第2の実施形態の場合、音声入力部103は、前述したマイク201とAD変換器202に加えて、外部入力部301とスイッチ302を有している。外部入力部301は、外部マイクが接続された場合に、その外部マイクからの音声信号を取得する。スイッチ302は、マイク201からの音声信号と、外部入力部301からの音声信号の一方を選択して出力する。第2の実施形態の場合、制御部111は、操作部112を介してユーザから音声入力選択の指示がなされた場合、その選択指示に応じてスイッチ302を切り替え制御する。このように、第2の実施形態の撮像装置100の場合、ユーザは、マイク201からの音声信号と、外部入力部301からの音声信号の何れかを選択して記録させることができる。スイッチ302にて選択された音声信号は、AD変換器202に送られる。
第2の実施形態の音声処理部104は、前述したレベル検出部204、レベル制御部203、ゲイン制御部205、ノイズ生成部206、フィルタ207に加え、第1合成部304、切り替え部303、第2合成部305を有している。第2の実施形態の場合、図2の減衰部208は備えられていない。音声入力部103から出力された入力音声信号は、音声処理部104のレベル検出部204と第1合成部304に入力する。
第2の実施形態の音声処理部104の場合、フィルタ207から出力されたノイズ信号は切り替え部303に入力される。また、第2の実施形態の場合、ゲイン制御部205は、レベル検出部204により検出された音声レベルを基に、切り替え部303に対して切り替えの指示を送る。
切り替え部303は、ゲイン制御部205からの指示に応じて、フィルタ207からのノイズ信号を、第1合成部304と第2合成部305の何れか一方に出力する。切り替え部303から出力されたノイズ信号が第1合成部304に送られた場合、第1合成部304は、そのノイズ信号をAD変換器202からの音声信号に合成して、レベル制御部203に出力する。第1合成部304においてAD変換器202からの音声信号にノイズ信号を合成する処理が行われた場合、第2合成部305では、レベル制御部203の出力を、そのまま音声処理部104による処理後の音声信号として出力する。また、切り替え部303から出力されたノイズ信号が第2合成部305に送られた場合、第2合成部30は、そのノイズ信号をレベル制御部203からの音声信号に合成して出力する。第2合成部305においてレベル制御部203からの音声信号にノイズ信号を合成する処理が行われた場合、第1合成部304では、AD変換器202の出力を、そのままレベル制御部203に出力する。そしてこの場合、第2合成部305においてレベル制御部203からの音声信号にノイズ信号を合成した信号が、音声処理部104による処理後の音声信号として出力される。
以下、第2の実施形態の音声処理部104における処理の詳細を説明する。
図5は、概ね図4に示した第2の実施形態の音声処理部104にて行われる処理の流れを示したフローチャートである。なお、図5のフローチャートの場合、S501とS411は制御部111により行われる処理であり、S502とS503は制御部111による制御の下でノイズ生成部206により行われる処理である。また、図5のフローチャートにおいて、前述した図3のフローチャートと同様の処理については図3の例と同一の参照番号を付与する。図5のフローチャートの場合、S401〜S408、S410〜S414、S416、S418〜S420の各処理はそれぞれ、図3における対応した処理と同様であるのでそれらの説明は省略する。以下、図3とは異なる処理についてのみ説明する。
図5に示した第2の実施形態におけるフローチャートの処理は、第1の実施形態の場合と同様、操作部112から動画の撮影および記録開始の指示が入力され、制御部111から音声処理部104に記録開始の制御信号が入力されたことによりスタートする。また、S402からS411までの1サイクルの処理は、操作部112から動画の記録停止の指示が入力されるまでの間、繰り返し実行される。
図5のフローチャートの処理が開始されると、制御部111は、S501の処理として、操作部112を介した選択指示によりユーザがマイク201からの音声信号を選択しているか否かを判別する。制御部111は、マイク201からの音声信号が選択されていると判定(Yes)した場合、スイッチ302をマイク201側の音声信号を出力するように切り替え、ノイズ生成部206にて行われるS502に処理を進める。一方、制御部111は、マイク201の音声信号が選択されていないと判定(No)、スイッチ302を外部入力部301側の音声信号を出力するように切り替え、ノイズ生成部206にて行われるS503に処理を進める。
S502の処理に進んだ場合、制御部111は、ノイズ生成部206に対し、ノイズ信号を生成するように制御する。一方、S503の処理に進んだ場合、制御部111は、ノイズ生成部206に対し、ノイズ信号を生成しないように制御する。ここで、マイク201は内蔵マイクであるため、このマイク201の音声信号に含まれるフロアノイズの周波数特性は予め知ることができる。このため、マイク201が選択された時には、ノイズ生成部206にて生成したノイズ信号をフィルタ207に通すことで、予め求められているマイク201の周波数特性に応じたノイズ信号を生成する。これに対し、外部入力部301に接続される外部マイクの音声信号に含まれるフロアノイズの周波数特性は予め知ることができない。そのため、本実施形態では、外部入力部301が選択された時には、ノイズ生成部206にノイズ信号を生成させないようにする。S502、S503の後は、前述したS401の処理に進む。
また、第2の実施形態の場合、S406でリミット動作を行うと判定(Yes)されて、さらにS407とS408の処理を行った後、ゲイン制御部205は、S504の処理に進む。S504において、ゲイン制御部205は、ノイズ生成部206にて生成してフィルタ207の処理がなされた後のノイズ信号を第2合成部305に出力するように、切り替え部303を制御する。これにより、マイク201が選択されていて、リミット動作が実行されている間、第2合成部305では、レベル制御部203からの音声信号に対してノイズ信号が合成されることになる。S504の処理後、ゲイン制御部205は、S410の処理に進む。
また、S412でリカバリ動作中であると判定(Yes)され、次のS413でファストリカバリモードと判定(Yes)され、さらにS414の処理を行った後、ゲイン制御部205は、S505の処理に進む。S505において、ゲイン制御部205は、ノイズ生成部206にて生成してフィルタ207の処理がなされた後のノイズ信号を第2合成部305に出力するように、切り替え部303を制御する。これにより、マイク201が選択されていて、ファストリカバリモードでのリカバリ動作が実行されている間、第2合成部305では、レベル制御部203からの音声信号に対してノイズ信号が合成されることになる。S505の後、ゲイン制御部205は、S418の処理に進む。
また、S413でスローリカバリモードによるリカバリ動作中であると判定(No)され、さらにS416の処理を行った後、ゲイン制御部205は、S506の処理に進む。S506において、ゲイン制御部205は、ノイズ生成部206にて生成してフィルタ207の処理がなされた後のノイズ信号を第1合成部304に出力するように、切り替え部303を制御する。これにより、マイク201が選択されていて、スローリカバリモードでのリカバリ動作が実行されている間、第1合成部304では、AD変換器202からの音声信号に対してノイズ信号が合成されることになる。S506の後、ゲイン制御部205は、S418の処理に進む。
以上説明したように、第2の実施形態の音声処理部104は、音声入力部103にて取得された入力音声信号が、例えば単発音のようにリミット動作の継続時間が短い音の信号の場合、ゲインを素早く大きくするファストリカバリモードでの音声処理を実行する。その際、音声処理部104は、マイク201にて取得された音声に含まれるフロアノイズと同様のノイズ信号を、第2合成部305においてレベル制御部203から出力された音声信号に合成する。これにより、合成された後の音声に含まれるノイズ信号の大きさは、レベル制御部203によるゲイン処理によらず一定のレベルとなる。そのため、例えば静かな環境で拍手が連続するような状況でファストリカバリ動作を実行した場合でも、音声信号に含まれるフロアノイズの成分の大きさを一定に保つことができる。したがって、第2の実施形態によれば、入力音声のレベルが短い期間で変化した場合でも、ノイズの変動を抑えて違和感が少ない音を得ることができる。
また、第2の実施形態の音声処理部104は、音声入力部103にて取得された入力音声信号がリミット期間が長い音の信号である場合、ゲインをゆっくりと大きくするスローリカバリモードを実行する。その際、音声処理部104は、マイク201で取得された音声に含まれるフロアノイズと同様のノイズ信号を、第1合成部304においてAD変換器202から出力された音声信号に合成した後に、レベル制御部203に入力する。したがって、本実施形態によれば、スローリカバリモードにおいてゆっくりとゲインが大きくなる状況において、ノイズ成分だけが急に大きくなってしまうことはなく、違和感が少ない音声を得ることができる。
また、第2の実施形態では、外部入力部301に外部マイクが接続され、その外部マイクの音声信号に含まれるノイズ信号の周波数成分を取得できない場合、ノイズ生成部206によるノイズ信号の生成を行わないようにしている。このため、外部マイクの音声信号に含まれるノイズ信号とは異なる周波数成分のノイズ信号が音声信号に合成されてしまうことを防ぐことができる。なお、外部入力部301に接続された外部マイクの音声信号に含まれるノイズ信号の周波数成分を取得できる場合には、ノイズ生成部206にてノイズ信号を生成してフィルタ207に出力してもよい。この場合、フィルタ207は、ノイズ生成部206にて生成されたノイズ信号に対し、外部マイクの音声信号に含まれるノイズ信号の周波数成分に合わせるようなフィルタ処理を行い、そのフィルタ処理後のノイズ信号を出力する。
<他の実施形態>
前述した各実施形態では、本発明の音声処理装置を撮像装置100に適用した例を挙げて説明したが、本発明はこれ以外にも、音声信号を処理する様々な装置に対しても同様に適用することが可能である。例えば、ボイスレコーダーや携帯電話、スマートフォン、パーソナルコンピュータ等の各種機器に対しても同様に本発明は適用可能である。
本発明は、上述の実施形態の1以上の機能を実現するプログラムを、ネットワーク又は記憶媒体を介してシステム又は装置に供給し、そのシステム又は装置のコンピュータにおける1つ以上のプロセッサがプログラムを読出し実行する処理でも実現可能である。また、1以上の機能を実現する回路(例えば、ASIC)によっても実現可能である。
上述の実施形態は、何れも本発明を実施するにあたっての具体化の例を示したものに過ぎず、これらによって本発明の技術的範囲が限定的に解釈されてはならないものである。即ち、本発明は、その技術思想、又はその主要な特徴から逸脱することなく、様々な形で実施することができる。
100:撮像装置、103:音声入力部、104:音声処理部、114:音声出力部、201:マイク、203:レベル制御部、204:レベル検出部、205:ゲイン制御部、206:ノイズ生成部、207:フィルタ、208、減衰部、209:合成部、303:切り替え部、304:第1合成部、305:第2合成部

Claims (9)

  1. 入力された音声信号のレベルを検出する検出手段と、
    ゲインに応じて、前記音声信号のレベルを制御するレベル制御手段と、
    前記検出されたレベルが閾値レベルを超えている場合には前記レベル制御手段から出力される音声信号のレベルが前記閾値レベル以下となるように前記ゲインを小さくするリミット動作を行い、前記リミット動作が行われている状態で前記レベルが前記閾値レベルを超えている状態でなくなった場合には前記ゲインを大きくするリカバリ動作を行うゲイン制御手段と、
    ノイズ信号を出力するノイズ生成手段と、
    前記レベル制御手段から出力された音声信号と前記ノイズ生成手段から出力されたノイズ信号とを合成する合成手段と、を有し、
    前記ゲイン制御手段は、
    前記リカバリ動作として、第1のリカバリモードと第2のリカバリモードとを有し、
    前記リミット動作の継続時間が閾値時間以上でない場合には前記第1のリカバリモードに設定し、
    直前の前記リミット動作の継続時間が閾値時間以上の場合には前記第2のリカバリモードに設定し、
    前記第2のリカバリモードでは前記第1のリカバリモードよりも長い時間をかけて前記ゲインを大きくし、
    前記第1のリカバリモードでは所定のレベルの前記ノイズ信号を出力させ、前記第2のリカバリモードでは前記レベル制御手段のゲインに応じたレベルの前記ノイズ信号を出力させるように、前記ノイズ生成手段を制御する
    ことを特徴とする音声処理装置。
  2. 前記ゲイン制御手段は、前記リミット動作の実行中には前記所定のレベルの前記ノイズ信号を出力するように、前記ノイズ生成手段を制御することを特徴とする請求項1に記載の音声処理装置。
  3. 前記ノイズ生成手段は、前記ノイズ信号を生成する生成手段と、前記生成手段により生成されたノイズ信号を前記入力された音声信号に含まれるノイズの周波数特性になるように処理するフィルタ手段と、前記フィルタ手段からのノイズ信号を減衰させて前記出力する減衰手段とを有し、
    前記ゲイン制御手段は、前記第1のリカバリモードでは前記ノイズ信号を減衰させずに出力し、前記第2のリカバリモードでは前記レベル制御手段のゲインに応じて前記ノイズ信号を減衰させて出力するように、前記減衰手段を制御することを特徴とする請求項1又は2に記載の音声処理装置。
  4. 前記ゲイン制御手段は、所定の1サイクル期間ごとに、前記検出されたレベルが前記閾値レベルを超えているか否かを判定して、前記検出されたレベルが前記閾値レベルを超えている状態が継続している場合に、所定の時間を加算して前記継続時間を求めることを特徴とする請求項に記載の音声処理装置。
  5. 前記ゲイン制御手段は、
    前記第1のリカバリモードに設定した場合には、前記リカバリ動作において所定の1サイクル期間ごとに大きくするゲインを第1のゲインに設定し、
    前記第2のリカバリモードに設定した場合には、前記リカバリ動作において前記所定の1サイクル期間ごとに大きくするゲインを前記第1のゲインより小さい第2のゲインに設定することを特徴とする請求項に記載の音声処理装置。
  6. 前記ゲイン制御手段は、前記リミット動作が行われている状態で前記レベルが前記閾値レベル以下になった後、前記検出されたレベルから前記閾値レベルを減算したレベルがゼロより大きい場合に、リカバリ動作中であると判断することを特徴とする請求項に記載の音声処理装置。
  7. 前記ゲイン制御手段は、前記リカバリ動作が行われている状態で、前記検出されたレベルから前記閾値レベルを減算したレベルがゼロになったときに、前記リカバリ動作が終了したと判定することを特徴とする請求項に記載の音声処理装置。
  8. 入力された音声信号のレベルを検出する検出工程と、
    ゲインに応じて、前記音声信号のレベルを制御するレベル制御工程と、
    前記検出工程により検出されたレベルが閾値レベルを超えている場合には前記レベル制御工程にて出力される音声信号のレベルが前記閾値レベル以下となるように前記ゲインを小さくするリミット動作を行い、前記リミット動作が行われている状態で前記レベルが前記閾値レベルを超えている状態でなくなった場合には前記ゲインを大きくするリカバリ動作を行うゲイン制御工程と、
    ノイズ信号を出力するノイズ生成工程と、
    前記レベル制御工程により出力された音声信号と前記ノイズ生成工程により出力されたノイズ信号とを合成する合成工程と、を有し、
    前記ゲイン制御工程は、
    前記リカバリ動作として、第1のリカバリモードと第2のリカバリモードとを含み、
    前記リミット動作の継続時間が閾値時間以上でない場合には前記第1のリカバリモードに設定し、
    直前の前記リミット動作の継続時間が閾値時間以上の場合には前記第2のリカバリモードに設定し、
    前記第2のリカバリモードでは前記第1のリカバリモードよりも長い時間をかけて前記ゲインを大きくし、
    前記第1のリカバリモードでは所定のレベルの前記ノイズ信号を出力させ、前記第2のリカバリモードでは前記レベル制御工程のゲインに応じたレベルの前記ノイズ信号を出力させるように、前記ノイズ生成工程を制御する
    ことを特徴とする音声処理装置の音声処理方法。
  9. コンピュータを、請求項1からの何れか1項に記載の音声処理装置の各手段として機能させるためのプログラム。
JP2017099659A 2017-05-19 2017-05-19 音声処理装置、音声処理方法、およびプログラム Active JP6570577B2 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2017099659A JP6570577B2 (ja) 2017-05-19 2017-05-19 音声処理装置、音声処理方法、およびプログラム
US15/978,719 US10306390B2 (en) 2017-05-19 2018-05-14 Audio processing apparatus for processing audio and audio processing method

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2017099659A JP6570577B2 (ja) 2017-05-19 2017-05-19 音声処理装置、音声処理方法、およびプログラム

Publications (2)

Publication Number Publication Date
JP2018196041A JP2018196041A (ja) 2018-12-06
JP6570577B2 true JP6570577B2 (ja) 2019-09-04

Family

ID=64269675

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2017099659A Active JP6570577B2 (ja) 2017-05-19 2017-05-19 音声処理装置、音声処理方法、およびプログラム

Country Status (2)

Country Link
US (1) US10306390B2 (ja)
JP (1) JP6570577B2 (ja)

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3237491B2 (ja) 1995-11-27 2001-12-10 松下電器産業株式会社 デジタル放送受信装置
JP4403429B2 (ja) 2007-03-08 2010-01-27 ソニー株式会社 信号処理装置、信号処理方法、プログラム
NO328622B1 (no) * 2008-06-30 2010-04-06 Tandberg Telecom As Anordning og fremgangsmate for reduksjon av tastaturstoy i konferanseutstyr
JP6105929B2 (ja) * 2012-12-27 2017-03-29 キヤノン株式会社 音声処理装置及びその制御方法

Also Published As

Publication number Publication date
JP2018196041A (ja) 2018-12-06
US10306390B2 (en) 2019-05-28
US20180338211A1 (en) 2018-11-22

Similar Documents

Publication Publication Date Title
JP4777180B2 (ja) 撮像装置及びその制御方法
JP2011193424A (ja) 撮像装置及び方法、並びにプログラム
JP2006254129A (ja) ヒストグラム表示装置
US8514300B2 (en) Imaging apparatus for reducing driving noise
JP2011254400A (ja) 画像音声記録装置
JP6570577B2 (ja) 音声処理装置、音声処理方法、およびプログラム
JP2009088878A (ja) 撮像装置、記録装置、再生装置、撮像方法、記録方法、再生方法及びプログラム
JP2011130134A (ja) 撮像装置、撮像システム
JP2000354190A (ja) 映像記録装置
JP2018074220A (ja) 音声処理装置
JP2022112909A (ja) 電子機器、撮像装置およびそれらの制御方法
JP5171369B2 (ja) 集音環境判定装置及びそれを備えた電子機器並びに集音環境判定方法
JP2015122731A (ja) 動画再生装置及び動画再生方法
WO2022195909A1 (ja) 画像処理装置、画像処理方法、プログラム
JP2017076895A (ja) 音声信号処理装置及び方法
US20240040072A1 (en) Image capture apparatus and control method therefor
JP2018201194A (ja) 音声処理装置および音声処理方法
JP5495753B2 (ja) 撮像装置
JP2016009952A (ja) 音声信号処理装置
JP2006217111A (ja) 動画撮影装置、及び動画撮影方法
JP5506471B2 (ja) 撮像装置
JP6079907B2 (ja) 画像編集装置および編集プログラム
JP2015036748A (ja) 撮像装置、撮像装置の制御方法、プログラム
JP2017199987A (ja) 撮像装置
JP5836091B2 (ja) 再生装置及びプログラム

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20180509

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20180509

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20190320

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20190514

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20190626

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20190709

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20190806

R151 Written notification of patent or utility model registration

Ref document number: 6570577

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R151