JP2019161333A - 音声処理装置 - Google Patents

音声処理装置 Download PDF

Info

Publication number
JP2019161333A
JP2019161333A JP2018042481A JP2018042481A JP2019161333A JP 2019161333 A JP2019161333 A JP 2019161333A JP 2018042481 A JP2018042481 A JP 2018042481A JP 2018042481 A JP2018042481 A JP 2018042481A JP 2019161333 A JP2019161333 A JP 2019161333A
Authority
JP
Japan
Prior art keywords
amplification
level
level detection
unit
gain
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2018042481A
Other languages
English (en)
Inventor
友仁 井上
Tomohito Inoue
友仁 井上
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Inc
Original Assignee
Canon Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Inc filed Critical Canon Inc
Priority to JP2018042481A priority Critical patent/JP2019161333A/ja
Publication of JP2019161333A publication Critical patent/JP2019161333A/ja
Pending legal-status Critical Current

Links

Abstract

【課題】過大な音声信号が入力された際の、入力信号の抑揚とは異なる音量の変化を抑制する、音声処理装置を提供する。【解決手段】音声入力手段からの音声信号を遅延させる遅延手段201と、遅延させられた音声信号を増幅する増幅手段204と、音声信号のレベルを検出するレベル検出手段202と、レベル検出手段のレベル検出結果によって、増幅手段の増幅度を制御する増幅制御手段203を備える。増幅制御手段は、レベル検出手段のレベル検出結果に、増幅手段の増幅度をかけたレベルが、第一の閾値を超えた場合、増幅手段の増幅度を下げ、レベル検出手段のレベル検出結果に、増幅手段の増幅度をかけたレベルが第一の閾値よりも低い第二の閾値を下回った場合、増幅手段の増幅度を上げる。増幅制御手段は、レベル検出手段のレベル検出結果に、増幅手段の増幅度をかけたレベルによって、増幅手段の増幅度を上げる時定数を変化させる。【選択図】図2

Description

本発明は、音声処理装置に関する。
従来、音声信号を処理する装置として、画像信号を記録すると共に音声信号を記録する撮像装置が知られている。これら撮像装置では、マイクから入力された音声信号に対して所定のゲインをかけて記録しつつ、過大な音声信号が入力された場合に備え、記録レベルを制限するリミッタを備えるものがある。リミッタは前記所定のゲインを下げて信号振幅を小さくすることで記録レベルを制限し、入力信号が小さくなると、再びゲインを戻して記録レベルを戻す処理を行う(特許文献1)。
特開2009−177232号公報
しかしながら従来のリミッタでは、ゲインを上下させる際に、入力信号の抑揚とは異なる音量の変化が発生し、それが耳についてしまうという課題があった。
そこで、本発明は過大な音声信号が入力された際にも記録レベルを制限しながら、音量の変化を耳につきにくくする音声処理装置を提供することを目的とする。
本発明の音声信号処理装置は、かかる目的を達成するために、音声入力手段と、音声入力手段からの音声信号を遅延させる遅延手段と、遅延手段で遅延させられた音声信号を増幅する増幅手段と、音声入力手段からの音声信号のレベルを検出するレベル検出手段と、前記レベル検出手段のレベル検出結果によって、前記増幅手段の増幅度を制御する増幅制御手段を備え、
前記増幅制御手段は、前記レベル検出手段のレベル検出結果に、前記増幅手段の増幅度をかけたレベルが、第一の閾値を超えた場合、前記増幅手段の増幅度を下げ、前記レベル検出手段のレベル検出結果に、前記増幅手段の増幅度をかけたレベルが前記第一の閾値よりも低い第二の閾値を下回った場合、前記増幅手段の増幅度を上げる。
前記増幅制御手段は、前記レベル検出手段のレベル検出結果に、前記増幅手段の増幅度をかけたレベルによって、前記増幅手段の増幅度を上げる時定数を変化させることを特徴とする。
本発明によれば、過大な音声信号が入力された際にも記録レベルを制限しながら、音量の変化を耳につきにくくすることができる。
実施例1の撮像装置のブロック図である。 実施例1の音声処理部のブロック図である。 本発明を説明するフローチャート 本発明の主力レベルとリカバリウェイト時間の関係を示す説明図 本発明のリカバリウェイト時間を適用した波形の説明図
音声信号を処理、録音することができる撮像装置について説明する。図1は、実施例1の撮像装置100の構成を示すブロック図である。図1において、撮像部101は、撮影レンズにより取り込まれた被写体の光学像を撮像素子により画像信号に変換し、アナログデジタル変換、画像調整処理などを行い、画像データを生成する。音声入力部102は、内蔵または音声端子を介して接続された複数のマイクにより、撮像装置100の周辺の音声を集音し、アナログデジタル変換、音声処理などを行い音声データを生成する。
音声処理部103は、音声入力部102により得られた音声データに対し、音声信号処理を行う。メモリ104は、撮像部101により得られた画像データや、音声処理部104で処理された音声データを一時的に記憶する。表示制御部105は、撮像部101により得られた画像データに係る映像や、撮像装置100の操作画面、メニュー画面等を表示部106や、不図示の映像端子を介して外部のディスプレイに表示させる。符号化処理部107は、メモリ104に一時的に記憶された画像データや音声データを読み出して所定の符号化を行い、圧縮画像データ、圧縮音声データ等を生成する。
記録再生部108は、記録媒体109に対して、符号化処理部107で生成された圧縮画像データ、圧縮音声データ等を記録したり、記録媒体109に記録された圧縮画像データ、圧縮音声データ、各種データ、プログラムを読み出す。ここで、記録媒体109は、圧縮画像データ、圧縮音声データ、等を記録することができれば、磁気ディスク、光学式ディスク、半導体メモリなどのあらゆる方式の記録媒体を含む。
制御部110は、撮像装置100の各ブロックに制御信号を送信することで撮像装置100の各ブロックを制御することができ、各種制御を実行するためのCPUやメモリなどからなる。操作部111は、ボタンやダイヤルなどからなり、ユーザの操作に応じて、指示信号を制御部110に送信する。音声出力部112は、記録再生部108により再生された圧縮音声データや、制御部110により出力される音声データをスピーカ113や音声端子などに出力する。外部出力部114は、記録再生部108により再生された圧縮映像データや圧縮音声データなどを外部機器に出力する。データバス115は、音声データや画像データ等の各種データ、各種制御信号を撮像装置100の各ブロックに供給する。
ここで、本実施例の撮像装置100の通常の動作について説明する。本実施例の撮像装置100は、ユーザが操作部111を操作して電源を投入する指示が出されたことに応じて、付図示の電源供給部から、撮像装置の各ブロックに電源を供給する。
電源が供給されると、制御部110は、例えば、操作部111のモード切り換えスイッチが、例えば、撮影モード、再生モード等のどのモードであるかを操作部111からの指示信号により確認する。動画記録モードでは、撮像部101により得られた画像データと音声入力部102により得られた音声データとを1つのファイルとして保存することができる。再生モードでは、記録媒体109に記録された圧縮画像データを記録再生部108により再生して表示部106に表示させることができる。
動画記録モードでは、まず、制御部110は、撮影待機状態に移行させるように制御信号を撮像装置100の各ブロックに送信し、以下のような動作をさせる。撮像部101は、撮影レンズにより取り込まれた被写体の光学像を撮像素子により画像信号に変換し、アナログデジタル変換、画像調整処理などを行い、画像データを生成する。そして、得られた画像データを表示処理部105に送信し、表示部106に表示させる。ユーザはこの様にして表示された画面を見ながら撮影の準備を行う。
音声入力部102は、複数のマイクにより得られたアナログ音声信号をデジタル変換し、複数のデジタル音声信号を生成する。音声処理部103は得られたデジタル音声信号に対して、任意の信号処理を施し、マルチチャンネルの音声データを生成する。そして、得られた音声データを音声出力部112に送信し、接続されたスピーカ113や不図示のイヤホンから音声として出力させる。ユーザは、この様にして出力された音声を聞きながら記録音量を決定するためのマニュアルボリュームの調整をすることもできる。
次に、ユーザが操作部111の記録ボタンを操作することにより撮影開始の指示信号が制御部110に送信されると、制御部110は、撮像装置100の各ブロックに撮影開始の指示信号を送信し、以下のような動作をさせる。撮像部101は、撮影レンズにより取り込まれた被写体の光学像を撮像素子により画像信号に変換し、アナログデジタル変換、画像調整処理などを行い、画像データを生成する。そして、得られた画像データを表示処理部105に送信し、表示部106に表示させる。また、得られた画像データをメモリ104送信する。
音声入力部102は、複数のマイクにより得られたアナログ音声信号をデジタル変換し、複数のデジタル音声信号を得る。音声処理部103は得られたデジタル音声信号に対して、任意の信号処理を施し、マルチチャンネルの音声データを生成する。そして、得られた音声データをメモリ104に送信する。符号化処理部107は、メモリ104に一時的に記憶された画像データや音声データを読み出して所定の符号化を行い、圧縮画像データ、圧縮音声データ等を生成する。
そして、制御部110は、これらの圧縮画像データ、圧縮音声データを合成し、データストリームを形成し、記録再生部108に出力する。記録再生部108は、UDF、FAT等のファイルシステム管理のもとに、データストリームを一つの動画ファイルとして記録媒体109に書き込んでいく。以上の動作を撮影中は継続する。
そして、ユーザが操作部111の記録ボタンを操作することにより撮影終了の指示信号が制御部110に送信されると、制御部110は、撮像装置100の各ブロックに撮影終了の指示信号を送信し、以下のような動作をさせる。撮像部101、音声入力部102は、それぞれ画像データ、音声データの生成を停止する。符号化処理部107は、メモリに記憶されている残りの画像データと音声データとを読出して所定の符号化を行い、圧縮画像データ、圧縮音声データ等を生成し終えたら動作を停止する。
そして、制御部110は、これらの最後の圧縮画像データ、圧縮音声データを合成し、データストリームを形成し、記録再生部108に出力する。記録再生部108は、UDF、FAT等のファイルシステム管理のもとに、データストリームを一つの動画ファイルとして記録媒体108に書き込んでいく。そして、データストリームの供給が停止したら、動画ファイルを完成させて、記録動作を停止させる。制御部110は、記録動作が停止すると、撮影待機状態に移行させるように制御信号を撮像装置100の各ブロックに送信して、撮影待機状態に戻る。
次に、再生モードでは、制御部110は、再生状態に移行させるように制御信号を撮像装置100の各ブロックに送信し、以下のような動作をさせる。記録媒体109に記録された圧縮画像データと圧縮音声データとからなる動画ファイルを記録再生部108が読出して、読出された圧縮画像データ、圧縮音声データは、符号化処理部107に送る。符号化処理部107は、圧縮画像データ、圧縮音声データを復号してそれぞれ、表示制御部105、音声処理部103に送信する。音声処理部103は得られたデジタル音声信号に対して、任意の信号処理を施し、得られた音声データを音声出力部112に送信する。
表示制御部105は、復号された画像データを表示部106に表示させる。音声出力部112は、復号された音声データを内蔵または、取付けられた外部スピーカから出力させる。
本実施例の撮像装置は以上のように、画像、音声の記録再生を行うことができる。
ところで、本実施例の音声処理部103で行われる信号処理について、図2を用いて説明する。図2は、本実施形態における音声処理部103の構成例を示す図である。遅延部201は、入力信号を遅延させるメモリである。レベル検波部202は、入力信号のレベルをエンベロープ検波する。ゲイン制御部203は、レベル検波部202で検波されたレベルに応じて、増幅部204のゲインを決定する。増幅部204は、遅延部201で遅延させられた音声信号に対して、ゲイン制御部203で決定されたゲインを印加する。
このような音声処理部において、入力信号に対して所定のゲインを印加しながら、過大入力時にはゲインを下げる動作について、図3のフローチャートを用いて説明する。入力信号が遅延部201で遅延させられ、増幅部204において、ゲイン制御部203で1サンプル前に決定されたゲインをかけて出力する(301)。次にレベル検波部202において、入力信号のレベルをエンベロープ検波する(302)。ゲイン制御部203で、レベル検波部202で検波された信号レベルに対して、現在のゲインをかけた出力レベルを算出し(303)、もし前記出力レベルがリミットスレッシュを超えると(304)、ゲインを1ステップ下げる(305)。
リミットスレッシュは、なるべく高い方がダイナミックレンジを有効に活用できるため、0dBFSから−1dBFSの間が、ゲインの1ステップは、ゲイン変更時のノイズが聴き取れないように、0.1dB以下が好適である。またもし前記出力レベルがリミットスレッシュ以下で、リカバリスレッシュ以上であった場合には何もしない(306)。リカバリスレッシュは高くしすぎるとゲインの上げ下げがハンチングを起こし、リミッタの動作が不安定になり、逆に低くしすぎるとゲインがなかなか上がらないことで、出力レベルが低くなってしまうため、−6dBFS程度が好適である。
またもし前記出力レベルがリカバリスレッシュ以下であった場合には、ゲインを上げる動作であるリカバリのウェイト時間とウェイト用タイマーを設定する(307)。ウェイト用タイマーがウェイト時間を超えた場合には(308)、ゲインを上げる(309)。リカバリのウェイト時間は、短ければ音量の変化を感じやすく、長ければ音量の変化を感じにくい。また同じ音量の変化でも、出力レベルが低い領域での変化よりも、出力レベルが高い領域での変化の方が耳に付きやすい。
そのためリカバリのウェイト時間は、前記出力レベルによって決定され、出力レベルが低いほど短く、逆に出力レベルが高いほど長く設定される。音量の変化が耳に付きにくい出力レベルが低い領域ではリカバリ時間を短くし、音量の変化が耳に付きやすい出力レベルが高い領域ではリカバリ時間を長くすることで、音量の変化を耳に付きにくくすることが可能となる。図4に主力レベルとリカバリウェイト時間の関係を示す。
出力レベルが−24dBFS以下の場合は、1dBあたりのリカバリウェイトは60ms、出力レベルが−24dBFS以上−12dBFS以下の場合は、1dBあたりのリカバリウェイトは90ms、出力レベルが−12dBFS以上の場合は、1dBあたりのリカバリウェイトは180msである。これらのリカバリウェイト時間を適用した波形を、図5に示す。上段が入力のエンベロープ波形、中断がゲイン、下段が出力波形であり、左側がリカバリウェイト時間を出力レベルに連動させた場合、右側がリカバリウェイト時間を固定にした場合の波形である。
リカバリウェイト時間を出力レベルに連動させた場合は、入力が大きくなり、出力レベルがリミットスレッシュを超えるt1からリミット動作を開始する。そして入力が小さくなり、出力レベルがリカバリスレッシュを下回るt2からリカバリ動作を開始する。t2からt3までは出力レベルが−24dBFS以下のため、60ms/dBで早くリカバリ動作を行い、t3からt4までは出力レベルが−24dBFS以上−12dBFS以下のため、90ms/dBで、t4以降は出力レベルが−12dBFS以上のため、180ms/dBでゆっくりとリカバリ動作を行う。
このような制御を行うことで、リカバリウェイト時間を固定にした場合に対して、音量の変化が耳に付きやすい、−12dBFS以上の出力レベルが高い領域で、音量の変化を小さくすることが可能となる。
100 撮像装置
101 撮像部
102 音声入力部

Claims (2)

  1. 音声入力手段と、音声入力手段からの音声信号を遅延させる遅延手段と、遅延手段で遅延させられた音声信号を増幅する増幅手段と、音声入力手段からの音声信号のレベルを検出するレベル検出手段と、前記レベル検出手段のレベル検出結果によって、前記増幅手段の増幅度を制御する増幅制御手段を備え、
    前記増幅制御手段は、前記レベル検出手段のレベル検出結果に、前記増幅手段の増幅度をかけたレベルが、第一の閾値を超えた場合、前記増幅手段の増幅度を下げ、前記レベル検出手段のレベル検出結果に、前記増幅手段の増幅度をかけたレベルが前記第一の閾値よりも低い第二の閾値を下回った場合、前記増幅手段の増幅度を上げる。
    前記増幅制御手段は、前記レベル検出手段のレベル検出結果に、前記増幅手段の増幅度をかけたレベルによって、前記増幅手段の増幅度を上げる時定数を変化させることを特徴とする、音声信号処理装置。
  2. 前記増幅制御手段は、前記レベル検出手段のレベル検出結果に、前記増幅手段の増幅度をかけたレベルが大きくなると、前記増幅手段の増幅度を上げる時定数を大きくし、前記レベル検出手段のレベル検出結果に、前記増幅手段の増幅度をかけたレベルが小さくなると、前記増幅手段の増幅度を上げる時定数を小さくさせることを特徴とする、請求項1に記載の音声信号処理装置。
JP2018042481A 2018-03-09 2018-03-09 音声処理装置 Pending JP2019161333A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2018042481A JP2019161333A (ja) 2018-03-09 2018-03-09 音声処理装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2018042481A JP2019161333A (ja) 2018-03-09 2018-03-09 音声処理装置

Publications (1)

Publication Number Publication Date
JP2019161333A true JP2019161333A (ja) 2019-09-19

Family

ID=67994972

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2018042481A Pending JP2019161333A (ja) 2018-03-09 2018-03-09 音声処理装置

Country Status (1)

Country Link
JP (1) JP2019161333A (ja)

Similar Documents

Publication Publication Date Title
JP4241443B2 (ja) 音声信号処理装置、音声信号処理方法
KR20060075134A (ko) 실시간 주파수 특성 보정 방법 및 그를 적용한 사운드재생 장치
US20150365061A1 (en) System and method for modifying an audio signal
JP5645393B2 (ja) 音声信号処理装置
JP2007158873A (ja) 音声補正装置
JP2019161333A (ja) 音声処理装置
JP6887315B2 (ja) 音声処理装置およびその制御方法、プログラム並びに記憶媒体
JP2019161334A (ja) 音声処理装置
JP2018074220A (ja) 音声処理装置
US10425731B2 (en) Audio processing apparatus, audio processing method, and program
JP2019091988A (ja) 音声処理装置および音声処理方法
JP5340127B2 (ja) 音声信号処理装置、音声信号処理装置の制御方法
US10218328B2 (en) Audio processing apparatus for generating audio signals for monitoring from audio signals for recording and method of controlling same
JP5495753B2 (ja) 撮像装置
JP5317936B2 (ja) 音声信号処理装置
JP2019179944A (ja) 音声切替装置
TW201905903A (zh) 音訊控制裝置及其方法
EP1345224A1 (en) Video recording and reproducing apparatus
JP2018074219A (ja) 音声処理装置
WO2020255601A1 (ja) 出力音制御装置、および出力音制御方法、並びにプログラム
JP2018078459A (ja) 撮像装置
JP2016009952A (ja) 音声信号処理装置
JP2017076895A (ja) 音声信号処理装置及び方法
JP2016177070A (ja) 音声処理装置
JP5506471B2 (ja) 撮像装置

Legal Events

Date Code Title Description
RD01 Notification of change of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7421

Effective date: 20191125