JP6570577B2 - 音声処理装置、音声処理方法、およびプログラム - Google Patents
音声処理装置、音声処理方法、およびプログラム Download PDFInfo
- Publication number
- JP6570577B2 JP6570577B2 JP2017099659A JP2017099659A JP6570577B2 JP 6570577 B2 JP6570577 B2 JP 6570577B2 JP 2017099659 A JP2017099659 A JP 2017099659A JP 2017099659 A JP2017099659 A JP 2017099659A JP 6570577 B2 JP6570577 B2 JP 6570577B2
- Authority
- JP
- Japan
- Prior art keywords
- level
- gain
- unit
- noise
- recovery mode
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000003672 processing method Methods 0.000 title claims description 3
- 230000005236 sound signal Effects 0.000 claims description 110
- 238000011084 recovery Methods 0.000 claims description 105
- 238000000034 method Methods 0.000 claims description 62
- 230000015572 biosynthetic process Effects 0.000 claims description 29
- 238000003786 synthesis reaction Methods 0.000 claims description 29
- 238000001514 detection method Methods 0.000 claims description 15
- 230000002194 synthesizing effect Effects 0.000 claims description 11
- 238000003384 imaging method Methods 0.000 description 35
- 230000001629 suppression Effects 0.000 description 9
- 238000010586 diagram Methods 0.000 description 6
- 238000006243 chemical reaction Methods 0.000 description 4
- 238000001914 filtration Methods 0.000 description 3
- 230000006870 function Effects 0.000 description 3
- 230000003287 optical effect Effects 0.000 description 3
- 230000002238 attenuated effect Effects 0.000 description 2
- 238000005457 optimization Methods 0.000 description 2
- 230000004044 response Effects 0.000 description 2
- 239000004065 semiconductor Substances 0.000 description 2
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 230000000116 mitigating effect Effects 0.000 description 1
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R29/00—Monitoring arrangements; Testing arrangements
- H04R29/004—Monitoring arrangements; Testing arrangements for microphones
-
- H—ELECTRICITY
- H03—ELECTRONIC CIRCUITRY
- H03G—CONTROL OF AMPLIFICATION
- H03G3/00—Gain control in amplifiers or frequency changers
- H03G3/20—Automatic control
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N5/00—Details of television systems
- H04N5/76—Television signal recording
- H04N5/765—Interface circuits between an apparatus for recording and another apparatus
- H04N5/77—Interface circuits between an apparatus for recording and another apparatus between a recording apparatus and a television camera
- H04N5/772—Interface circuits between an apparatus for recording and another apparatus between a recording apparatus and a television camera the recording apparatus and the television camera being placed in the same enclosure
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N9/00—Details of colour television systems
- H04N9/79—Processing of colour television signals in connection with recording
- H04N9/80—Transformation of the television signal for recording, e.g. modulation, frequency changing; Inverse transformation for playback
- H04N9/802—Transformation of the television signal for recording, e.g. modulation, frequency changing; Inverse transformation for playback involving processing of the sound signal
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R3/00—Circuits for transducers, loudspeakers or microphones
-
- H—ELECTRICITY
- H03—ELECTRONIC CIRCUITRY
- H03G—CONTROL OF AMPLIFICATION
- H03G3/00—Gain control in amplifiers or frequency changers
- H03G3/20—Automatic control
- H03G3/30—Automatic control in amplifiers having semiconductor devices
- H03G3/3005—Automatic control in amplifiers having semiconductor devices in amplifiers suitable for low-frequencies, e.g. audio amplifiers
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N5/00—Details of television systems
- H04N5/44—Receiver circuitry for the reception of television signals according to analogue transmission standards
- H04N5/60—Receiver circuitry for the reception of television signals according to analogue transmission standards for the sound signals
- H04N5/602—Receiver circuitry for the reception of television signals according to analogue transmission standards for the sound signals for digital sound signals
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R2430/00—Signal processing covered by H04R, not provided for in its groups
- H04R2430/01—Aspects of volume control, not necessarily automatic, in sound systems
Landscapes
- Engineering & Computer Science (AREA)
- Signal Processing (AREA)
- Multimedia (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Health & Medical Sciences (AREA)
- General Health & Medical Sciences (AREA)
- Otolaryngology (AREA)
- Circuit For Audible Band Transducer (AREA)
- Control Of Amplification And Gain Control (AREA)
Description
図1は、本実施形態の音声処理装置の一適用例としての撮像装置100の全体構成を示すブロック図である。本実施形態の撮像装置100は、動画や静止画を撮影および記録可能であるとともに、撮影時の音声の取得および記録も可能なビデオカメラであるとする。
ユーザが操作部112の電源ボタンに対して電源オンの操作をすると、操作部112から制御部111に起動の指示が出される。この指示を受けて、制御部111は、不図示の電源供給部を制御して、撮像装置100の各部に対して電源を供給させる。そして、電源が供給されると、制御部111は、ユーザが操作部112のモード切り替えスイッチを操作して例えば撮影モード、再生モード等の何れのモードに切り替えたかを、操作部112からの指示信号により確認する。例えば撮影モードに切り替えられた場合、制御部111は、撮像装置100を撮影待機状態とし、ユーザにより操作部112の記録開始ボタンが操作されると、各部を制御して撮影および記録動作を開始させる。撮影モードで撮影が実行されている間は、撮影画像信号から生成された圧縮画像信号と撮影時の入力音声信号から生成された圧縮音声信号とが、記録媒体108に記録される。そして、ユーザにより操作部112の記録終了ボタンが操作されると、制御部111は、各部を制御して撮影および記録動作を終了させて、撮影待機状態に戻す。また、再生モードになされた場合、制御部111は、記録再生部107を介して記録媒体108から圧縮画像信号と圧縮音声信号を読み出させ、それら信号が符号化復号化部106に送られる。符号化復号化部106は、それら圧縮画像信号と圧縮音声信号を復号化する。そして、復号化された動画は表示制御部109を介して表示部110に表示され、復号化された音声は音声処理部104を介して音声出力部114から出力される。
撮影モードになると、制御部111は、前述のように、先ず撮像装置100を撮影待機状態に設定する。そして、撮影待機状態において、ユーザにより操作部112の記録開始ボタンが操作されて撮影および記録開始の指示信号が入力されると、制御部111は、記録開始の制御信号を撮像装置100の各部に送り、以下の撮影動作を行わせるように各部を制御する。
制御部111は、撮影モードにおいて撮影が行われている間は、以上の動作を継続するように各部を制御する。
制御部111から処理終了の制御信号を受け取ると、画像処理部102は、前述した処理後の画像信号をメモリ105へ送るのを停止し、同様に、音声処理部104は、前述した処理後の音声信号をメモリ105へ送るのを停止する。
撮影待機状態において撮像部101により撮像され、画像処理部102による処理がなされた後の画像信号は、表示制御部109に送られる。表示制御部109は、撮影待機状態の際に画像処理部102から供給された画像信号にかかる映像と撮像装置100の操作のために必要な情報を、表示部110に表示させる。これにより、撮像装置100を操作しているユーザは、表示部110に表示された画面を見ながら撮影の準備等を行うことができる。
再生モードにおいて、ユーザにより操作部112の再生ボタンが操作されて再生開始の指示信号が入力されると、制御部111は、再生開始の制御信号を撮像装置100の各部に送り、以下の再生動作を行わせるように各部を制御する。なお、再生開始に先立ち、記録媒体108に記録されている動画ファイルの中から、ユーザにより、再生すべきファイルの指定がなされているとする。
以下、第1の実施形態における音声処理部104の構成および処理の詳細について説明する。
図2は、第1の実施形態の構成例として、図1の音声入力部103が備える構成と、音声処理部104が備える構成のうち音声入力部103からの入力音声信号を処理する部分の構成例とを示したブロック図である。
音声処理部104は、レベル制御部203、レベル検出部204、ゲイン制御部205、ノイズ生成部206、フィルタ207、減衰部208、合成部209を有して構成されている。音声入力部103から送られてきた入力音声信号は、レベル制御部203とレベル検出部204とに入力する。
図3は、概ね図2に示した音声処理部104における処理の流れを示したフローチャートである。但し、S411の処理は制御部111により行われる。図3のフローチャートの処理は、ハードウェア構成により実行されてもよいし、一部がソフトウェア構成で残りがハードウェア構成により実現されてもよい。ソフトウェア構成により処理が実行される場合、図3のフローチャートの処理は、本実施形態にかかる音声処理のプログラムをCPU等が実行することにより実現される。本実施形態にかかる音声処理のプログラムは、不図示のROM等に予め用意されていてもよく、また不図示の着脱可能な半導体メモリから読み出されても、或いは不図示のインターネット等のネットワークからダウンロードされてもよい。また以下の説明では、図3の各処理のステップS401〜ステップS420をS401〜S420と略記する。これらのことは後述する他のフローチャートにおいても同様とする。
次にS402において、ゲイン制御部205は、直前のサイクルにおけるリミット動作の継続時間tがリカバリモードの判定のための閾値時間Tよりも短いか否かを判別する。ここで、本実施形態の場合、ゲイン制御部205は、リカバリモードとして、ファストリカバリモードと、スローリカバリモードとを設定可能となされている。ファストリカバリモードは、リミット動作後に、短時間にゲインを素早く大きしてリカバリするモードである。スローリカバリモードは、リミット動作後に、ファストリカバリモードよりも長い時間をかけてゆっくりとゲインを徐々に大きくしてリカバリするモードである。そして、ゲイン制御部205は、S402で継続時間が閾値時間よりも短い(t<T)と判定(Yes)した場合には、S403の処理として、リカバリモードをファストリカバリモードに設定する。一方、ゲイン制御部205は、S402で継続時間が閾値時間以上(t≧T)と判定(No)場合には、S404の処理として、リカバリモードをスローリカバリモードに設定する。なお、本実施形態の場合、ファストリカバリモードに設定された場合にはフラグFASTに1を立て、スローリカバリモードに設定された場合にはフラグFASTを0にする。S403、S404の後、音声処理部104の処理は、レベル検出部204にて行われるS405に進む。
次に、第2の実施形態における音声処理部104の構成および処理について説明する。
図4は、第2の実施形態の構成例として、図1の音声入力部103が備える構成と、音声処理部104が備える構成のうち音声入力部103からの入力音声信号を処理する部分の構成例と、を示したブロック図である。なお、図4において、前述した図2と同様の構成要素については図2の例と同一の参照番号を付して、それらの詳細な説明は省略する。
図5は、概ね図4に示した第2の実施形態の音声処理部104にて行われる処理の流れを示したフローチャートである。なお、図5のフローチャートの場合、S501とS411は制御部111により行われる処理であり、S502とS503は制御部111による制御の下でノイズ生成部206により行われる処理である。また、図5のフローチャートにおいて、前述した図3のフローチャートと同様の処理については図3の例と同一の参照番号を付与する。図5のフローチャートの場合、S401〜S408、S410〜S414、S416、S418〜S420の各処理はそれぞれ、図3における対応した処理と同様であるのでそれらの説明は省略する。以下、図3とは異なる処理についてのみ説明する。
前述した各実施形態では、本発明の音声処理装置を撮像装置100に適用した例を挙げて説明したが、本発明はこれ以外にも、音声信号を処理する様々な装置に対しても同様に適用することが可能である。例えば、ボイスレコーダーや携帯電話、スマートフォン、パーソナルコンピュータ等の各種機器に対しても同様に本発明は適用可能である。
Claims (9)
- 入力された音声信号のレベルを検出する検出手段と、
ゲインに応じて、前記音声信号のレベルを制御するレベル制御手段と、
前記検出されたレベルが閾値レベルを超えている場合には前記レベル制御手段から出力される音声信号のレベルが前記閾値レベル以下となるように前記ゲインを小さくするリミット動作を行い、前記リミット動作が行われている状態で前記レベルが前記閾値レベルを超えている状態でなくなった場合には前記ゲインを大きくするリカバリ動作を行うゲイン制御手段と、
ノイズ信号を出力するノイズ生成手段と、
前記レベル制御手段から出力された音声信号と前記ノイズ生成手段から出力されたノイズ信号とを合成する合成手段と、を有し、
前記ゲイン制御手段は、
前記リカバリ動作として、第1のリカバリモードと第2のリカバリモードとを有し、
前記リミット動作の継続時間が閾値時間以上でない場合には前記第1のリカバリモードに設定し、
直前の前記リミット動作の継続時間が閾値時間以上の場合には前記第2のリカバリモードに設定し、
前記第2のリカバリモードでは前記第1のリカバリモードよりも長い時間をかけて前記ゲインを大きくし、
前記第1のリカバリモードでは所定のレベルの前記ノイズ信号を出力させ、前記第2のリカバリモードでは前記レベル制御手段のゲインに応じたレベルの前記ノイズ信号を出力させるように、前記ノイズ生成手段を制御する
ことを特徴とする音声処理装置。 - 前記ゲイン制御手段は、前記リミット動作の実行中には前記所定のレベルの前記ノイズ信号を出力するように、前記ノイズ生成手段を制御することを特徴とする請求項1に記載の音声処理装置。
- 前記ノイズ生成手段は、前記ノイズ信号を生成する生成手段と、前記生成手段により生成されたノイズ信号を前記入力された音声信号に含まれるノイズの周波数特性になるように処理するフィルタ手段と、前記フィルタ手段からのノイズ信号を減衰させて前記出力する減衰手段とを有し、
前記ゲイン制御手段は、前記第1のリカバリモードでは前記ノイズ信号を減衰させずに出力し、前記第2のリカバリモードでは前記レベル制御手段のゲインに応じて前記ノイズ信号を減衰させて出力するように、前記減衰手段を制御することを特徴とする請求項1又は2に記載の音声処理装置。 - 前記ゲイン制御手段は、所定の1サイクル期間ごとに、前記検出されたレベルが前記閾値レベルを超えているか否かを判定して、前記検出されたレベルが前記閾値レベルを超えている状態が継続している場合に、所定の時間を加算して前記継続時間を求めることを特徴とする請求項1に記載の音声処理装置。
- 前記ゲイン制御手段は、
前記第1のリカバリモードに設定した場合には、前記リカバリ動作において所定の1サイクル期間ごとに大きくするゲインを第1のゲインに設定し、
前記第2のリカバリモードに設定した場合には、前記リカバリ動作において前記所定の1サイクル期間ごとに大きくするゲインを前記第1のゲインより小さい第2のゲインに設定することを特徴とする請求項1に記載の音声処理装置。 - 前記ゲイン制御手段は、前記リミット動作が行われている状態で前記レベルが前記閾値レベル以下になった後、前記検出されたレベルから前記閾値レベルを減算したレベルがゼロより大きい場合に、リカバリ動作中であると判断することを特徴とする請求項5に記載の音声処理装置。
- 前記ゲイン制御手段は、前記リカバリ動作が行われている状態で、前記検出されたレベルから前記閾値レベルを減算したレベルがゼロになったときに、前記リカバリ動作が終了したと判定することを特徴とする請求項6に記載の音声処理装置。
- 入力された音声信号のレベルを検出する検出工程と、
ゲインに応じて、前記音声信号のレベルを制御するレベル制御工程と、
前記検出工程により検出されたレベルが閾値レベルを超えている場合には前記レベル制御工程にて出力される音声信号のレベルが前記閾値レベル以下となるように前記ゲインを小さくするリミット動作を行い、前記リミット動作が行われている状態で前記レベルが前記閾値レベルを超えている状態でなくなった場合には前記ゲインを大きくするリカバリ動作を行うゲイン制御工程と、
ノイズ信号を出力するノイズ生成工程と、
前記レベル制御工程により出力された音声信号と前記ノイズ生成工程により出力されたノイズ信号とを合成する合成工程と、を有し、
前記ゲイン制御工程は、
前記リカバリ動作として、第1のリカバリモードと第2のリカバリモードとを含み、
前記リミット動作の継続時間が閾値時間以上でない場合には前記第1のリカバリモードに設定し、
直前の前記リミット動作の継続時間が閾値時間以上の場合には前記第2のリカバリモードに設定し、
前記第2のリカバリモードでは前記第1のリカバリモードよりも長い時間をかけて前記ゲインを大きくし、
前記第1のリカバリモードでは所定のレベルの前記ノイズ信号を出力させ、前記第2のリカバリモードでは前記レベル制御工程のゲインに応じたレベルの前記ノイズ信号を出力させるように、前記ノイズ生成工程を制御する
ことを特徴とする音声処理装置の音声処理方法。 - コンピュータを、請求項1から7の何れか1項に記載の音声処理装置の各手段として機能させるためのプログラム。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2017099659A JP6570577B2 (ja) | 2017-05-19 | 2017-05-19 | 音声処理装置、音声処理方法、およびプログラム |
US15/978,719 US10306390B2 (en) | 2017-05-19 | 2018-05-14 | Audio processing apparatus for processing audio and audio processing method |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2017099659A JP6570577B2 (ja) | 2017-05-19 | 2017-05-19 | 音声処理装置、音声処理方法、およびプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2018196041A JP2018196041A (ja) | 2018-12-06 |
JP6570577B2 true JP6570577B2 (ja) | 2019-09-04 |
Family
ID=64269675
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2017099659A Active JP6570577B2 (ja) | 2017-05-19 | 2017-05-19 | 音声処理装置、音声処理方法、およびプログラム |
Country Status (2)
Country | Link |
---|---|
US (1) | US10306390B2 (ja) |
JP (1) | JP6570577B2 (ja) |
Family Cites Families (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP3237491B2 (ja) | 1995-11-27 | 2001-12-10 | 松下電器産業株式会社 | デジタル放送受信装置 |
JP4403429B2 (ja) | 2007-03-08 | 2010-01-27 | ソニー株式会社 | 信号処理装置、信号処理方法、プログラム |
NO328622B1 (no) * | 2008-06-30 | 2010-04-06 | Tandberg Telecom As | Anordning og fremgangsmate for reduksjon av tastaturstoy i konferanseutstyr |
JP6105929B2 (ja) * | 2012-12-27 | 2017-03-29 | キヤノン株式会社 | 音声処理装置及びその制御方法 |
-
2017
- 2017-05-19 JP JP2017099659A patent/JP6570577B2/ja active Active
-
2018
- 2018-05-14 US US15/978,719 patent/US10306390B2/en active Active
Also Published As
Publication number | Publication date |
---|---|
JP2018196041A (ja) | 2018-12-06 |
US10306390B2 (en) | 2019-05-28 |
US20180338211A1 (en) | 2018-11-22 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP4777180B2 (ja) | 撮像装置及びその制御方法 | |
JP2011193424A (ja) | 撮像装置及び方法、並びにプログラム | |
JP2006254129A (ja) | ヒストグラム表示装置 | |
US8514300B2 (en) | Imaging apparatus for reducing driving noise | |
JP2011254400A (ja) | 画像音声記録装置 | |
JP6570577B2 (ja) | 音声処理装置、音声処理方法、およびプログラム | |
JP2009088878A (ja) | 撮像装置、記録装置、再生装置、撮像方法、記録方法、再生方法及びプログラム | |
JP2011130134A (ja) | 撮像装置、撮像システム | |
JP2000354190A (ja) | 映像記録装置 | |
JP2018074220A (ja) | 音声処理装置 | |
JP2022112909A (ja) | 電子機器、撮像装置およびそれらの制御方法 | |
JP5171369B2 (ja) | 集音環境判定装置及びそれを備えた電子機器並びに集音環境判定方法 | |
JP2015122731A (ja) | 動画再生装置及び動画再生方法 | |
WO2022195909A1 (ja) | 画像処理装置、画像処理方法、プログラム | |
JP2017076895A (ja) | 音声信号処理装置及び方法 | |
US20240040072A1 (en) | Image capture apparatus and control method therefor | |
JP2018201194A (ja) | 音声処理装置および音声処理方法 | |
JP5495753B2 (ja) | 撮像装置 | |
JP2016009952A (ja) | 音声信号処理装置 | |
JP2006217111A (ja) | 動画撮影装置、及び動画撮影方法 | |
JP5506471B2 (ja) | 撮像装置 | |
JP6079907B2 (ja) | 画像編集装置および編集プログラム | |
JP2015036748A (ja) | 撮像装置、撮像装置の制御方法、プログラム | |
JP2017199987A (ja) | 撮像装置 | |
JP5836091B2 (ja) | 再生装置及びプログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20180509 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20180509 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20190320 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20190514 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20190626 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20190709 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20190806 |
|
R151 | Written notification of patent or utility model registration |
Ref document number: 6570577 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R151 |