JP2016010086A - 音声処理装置 - Google Patents

音声処理装置 Download PDF

Info

Publication number
JP2016010086A
JP2016010086A JP2014130853A JP2014130853A JP2016010086A JP 2016010086 A JP2016010086 A JP 2016010086A JP 2014130853 A JP2014130853 A JP 2014130853A JP 2014130853 A JP2014130853 A JP 2014130853A JP 2016010086 A JP2016010086 A JP 2016010086A
Authority
JP
Japan
Prior art keywords
gain
value
output
sound level
input
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2014130853A
Other languages
English (en)
Inventor
芝 秀規
Hideki Shiba
秀規 芝
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Inc
Original Assignee
Canon Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Inc filed Critical Canon Inc
Priority to JP2014130853A priority Critical patent/JP2016010086A/ja
Publication of JP2016010086A publication Critical patent/JP2016010086A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Circuit For Audible Band Transducer (AREA)
  • Control Of Amplification And Gain Control (AREA)

Abstract

【課題】過大入力音が続いた後の音声が途切れることを防止する。【解決手段】入力された音声信号を遅延させる遅延手段と、前記遅延手段で遅延させられた音声信号を、ゲイン応じて増幅する増幅手段と、入力された音声レベルによって予め定められたゲイン値を出力する第一のゲイン出力手段と、前記増幅手段のゲイン値と前記第一のゲイン出力手段の出力値を比較して、前記増幅手段のゲインを決定する第二のゲイン出力手段を有し、前記第二のゲイン出力手段は、前記増幅手段のゲイン値と前記第一のゲイン出力手段の出力値との差が大きければゲインの変化を大きくし、差が小さければゲインの変化を小さくする。【選択図】 図1

Description

本発明は、音声処理装置に関する。
従来、録音装置は、録音可能なレベルを超える過大な音声が入力された際に、録音された音声が歪んでしまい音声の品質が著しく低下するのを抑制するために音声増幅回路のゲインを下げる処理をする。入力音声が録音可能なレベルまで小さくなった際には、元のゲインに戻す処理であるリカバリ処理をする。
一般的に、リカバリ動作で元のゲイン値まで戻る時間であるリカバリタイムをゆっくりにして、ゲイン変化が頻繁に起こらないようにしている。リカバリタイムを早くすると、ゲインを下げる必要のある過大入力音とゲインを下げる必要のないぎりぎりの入力音が頻繁に入力されると、実際の音声では大差がないのに、録音された音ではゲイン変化が頻繁に起こってしまう。ゲイン変化が頻繁に起こっている音声は違和感のあるものになってしまう。
しかし、リカバリタイムがゆっくりであると、入力レベルの低い常音の中で手をたたいたような一瞬だけ過大入力になるようなインパルス性の入力があった場合に、過大入力後にゲインが直ぐに戻らないために、過大入力後の音声が聞こえなくなってしまう問題があった。
上記問題点の対策として、特許文献1では、図11に示すように、音声入力を遅延させる遅延部1301、遅延部1301で遅延された音声にゲインをかけるゲイン1302、基準レベルと音声入力を比較する比較部1303、比較部から出力される値を平滑する平滑部1304、平滑部1304の値と比較部1303の出力を積分する積分器1305を備えており、積分器1305の値によってゲイン1302を制御する機器が開示されている。
これにより、一瞬だけの過大な音声が入力された場合には、積分器1305の値が小さいのでリカバリタイムを短くし、過大な音声がある程度入力され続けると積分器1305の値が大きくなり、リカバリタイムが長くなるという構成が開示されている。これにより、一瞬だけの過大な音声が入力された場合にリカバリタイムを短くし、ゲインを下げる必要のある過大入力音とゲインを下げる必要のないぎりぎりの入力音が頻繁に入力された場合には、リカバリタイムが長くなる構成となっている。
特開2004−104692号公報
しかしながら、上述の特許文献1に開示された従来技術では、過大な入力が長い期間続いた後に、過小な入力があった場合に、リカバリタイムが長くなってしまい、録音された音声の過小入力部が聞こえなくなってしまい違和感のある音声となってしまう。
本発明は、過大入力音が続いた後の音声が途切れることを防止することを目的とする。
本発明に係る音声処理装置の構成は、入力された音声信号を遅延させる遅延手段と、前記遅延手段で遅延させられた音声信号を、ゲイン応じて増幅する増幅手段と、入力された音声レベルによって予め定められたゲイン値を出力する第一のゲイン出力手段と、前記増幅手段のゲイン値と前記第一のゲイン出力手段の出力値を比較して、前記増幅手段のゲインを決定する第二のゲイン出力手段を有し、前記第二のゲイン出力手段は、前記増幅手段のゲイン値と前記第一のゲイン出力手段の出力値との差が大きければゲインの変化を大きくし、差が小さければゲインの変化を小さくすることを特徴とする。
本発明によれば、過大入力音が続いた後の音声が途切れることを防止することができる。
音声処理装置の構成を示すブロック図である。 音声レベルとゲインの図である。 音声のレベル制御の処理を示すフローチャートである。 ゲインを説明するための図である。 ゲインと音声レベルを示す図である。 ゲインと音声レベルを示す図である。 ゲインと音声レベルを示す図である。 音声処理装置の構成を示すブロック図である。 音声のレベル制御の処理を示すフローチャートである。 ゲインの制御の様子を示す図である。 従来例を説明する図である。
以下に、本発明の好ましい実施の形態を、添付の図面に基づいて詳細に説明する。図1は、本発明の実施形態にかかわる録音装置の録音部の構成である。
[実施例1]
以下、図1を用いて、本発明の本発明の第1の実施例の構成の説明を行う。101は音声を電気信号として取り込むためのマイクである。102はマイク101で出力される微少の電気信号を増幅するためのマイクアンプである。103はマイクアンプ102から出力される増幅された音声信号をアナログ―デジタル変換するA/D変換部である。104はA/D変換部103から出力されたデータを所定の遅延をもたせるための遅延部である。
113は遅延部104から出力されたデータに対してゲインをかける値を制御するゲイン制御部である。105は遅延部104から出力されたデータに対してゲイン制御部113で決定したゲイン値をかける増幅部である。増幅部はゲインを減衰させることも含む。106はA/D変換部103から出力されたデータの振幅値のピークを検出するピーク検出部である。107はピーク検出部から出力される値に対してゲイン値を記憶しているゲインテーブルである。108はピーク検出部106から出力された値によって目標とするゲインをゲインテーブル107から読みだしてゲイン決定するターゲットゲイン決定部である。
109はターゲットゲイン決定部108から出力された値と現在のゲイン値とを比較して、現在の値よりもターゲットゲイン決定部108から出力された値が小さい場合に、ゲインを即座に下げるアッタク動作を行うかを決定するアタックコントロール部である。110はアッタク動作によってゲインを下げた後、ゲイン値を元に戻す動作であるリカバリ動作時にゲイン値を戻すゲイン値をコントロールするリカバリーコントロール部である。111はアタックコントロール部109とリカバリーコントロール部110の出力信号によって、増幅部105のゲインを決定するゲインコントロール部である。112は、アタック動作した際に、リカバリ動作を開始するまで一定期間ゲイン値を保持するホールド時間をカウントするタイマーである。
次に、図2を用いて、ゲインテーブル107の一例を説明する。入力音レベルが大きくて録音した際に、音声が歪んでしまう入力音レベルを401とする。入力音レベル401よりも大きなレベルの場合に目標とする出力音レベルを402とする。入力音レベルと出力音レベルの関係としては、図2の(a)に示したように、入力音レベル401までは出力音がリニアに変化し、入力音レベル401よりも大きなレベルは一定の出力レベル402になる。
また、入力音レベルとゲインの関係は、図2(b)に示したように、入力音レベル401までは出力音がリニアに変化するようにゲインは一定であり、入力音レベル401よりも大きなレベルは一定の出力レベル402になるようにゲインを下げる関係となっている。ゲインテーブル107は、図2(b)に示した関係の値を記憶しているテーブルである。
次に図2と図3を用いて、本発明の動作フローの説明をする。本実施形態であるデジタルカメラで録画を開始する(S501)。音声がマイク101によって電圧に変換され、マイクアンプ102において電圧が増幅される。増幅された音声がA/D変換部103でデジタル値に変換される。デジタル値に変換されたデータがピーク検出部106と遅延部104に出力される。ピーク検出部106で入力音のピーク値を検出する(S502)。
ピーク検出部502でピーク値を検出した場合、ターゲットゲイン決定部によって検出したピーク値に対応するゲイン値をゲインテーブル107から読みだしターゲットゲイン値(Gt)とする(S503)。アッタクコントロール部109において、現在のゲイン値(Gn)を増幅部105から読みだす(S504)。アッタクコントロール部109で、読みだした現在のゲイン値(Gn)とターゲットゲイン値(Gt)を比較する(S505)。S505で比較した結果、ターゲットゲイン値(Gt)が現在のゲイン値(Gn)よりも小さい場合(Gt<Gn)、ゲイン値を下げる動作であるアタック動作を行う。
アタック動作を開始すると、増幅部105のゲイン値をターゲットゲイン値(Gt)に変更するように、アッタクコントロール部109はゲインコントロール部111に指示する。ゲインコントロール部111は、アッタクコントロール部109からの指示によって増幅部105をターゲットゲイン値(Gt)に変更する(S506)。遅延部104は、ピーク検出した際のデータがS506で変更されたゲイン値がかけられる遅延を行う。アタック動作後、入力音レベルが小さくなりゲイン値を上げていく動作であるリカバリ動作に入るまで一定期間ゲインを保っておくホールドタイムがある。
ホールドタイム中、リカバリ動作中に関わらず、アタック動作時よりも大きな入力レベルの音声が入ると、再度、ピーク検出を行い、アタック動作を行う(S502〜S506)。アタック動作をした後、ホールドタイムをカウントするためのタイマー112をリセットしてカウント開始する(S507)。S505で比較した結果、ターゲットゲイン値(Gt)が現在のゲイン値(Gn)よりも大きい場合(Gt>Gn)、アタック動作によって下げられたゲインをターゲットゲイン値(Gt)に増加させるリカバリ動作又は、ホールド動作を行う。
リカバリ動作かホールド動作のどちらの動作を行うかを判定するために、タイマー112がホールドタイムに達しているかを確認する(S507)。S507において、タイマー112の値がホールドタイムよりも小さい場合(タイマ112<ホールドタイム)、ホールドタイム中となりゲイン値を現状の値を保持する。S507において、タイマー112の値がホールドタイムよりも大きい場合(タイマ112>ホールドタイム)、リカバリ動作を開始する(S508)。
次に図4、図5、図6、図7を用いて、本発明のリカバリ動作例の説明を行う。リカバリ動作時のゲインの増加量は、図4(a)のように、リカバリ動作開始時のゲイン値(Gs)とターゲットゲイン値(Gt)の差が大きければ大きいほどゲインの時間当たりの変化量が大きく、ゲイン差が小さければ小さいほどゲインの時間当たりの変化量が小さい特性となっている。一例として、リカバリ演算が下記の式の場合の動作例を説明する。
G=Gt+αexp(1/βt)
Gt:ターゲットゲイン値
Gs:リカバリ動作開始のゲイン値
α:Gs−Gt
β:αの値によって決まる係数
βとαの係数の関係が図4(b)のような関係となっている。
図5を用いて、一瞬だけ大きな入力音レベルが入力された場合の動作説明を行う。図5(a)のグラフのように、時間701までは一定の入力音レベルAで、時間701から時間702の一瞬だけアッタク動作をするような過大入力音レベルBが入力されたとする。入力音レベルAに対するターゲットゲインをGt、過大入力音レベルBに対するターゲットゲインをGsとすると、ゲインの変化は、図5(b)のようになる。出力音声レベルは、A’=Gt×A、B’=Gt×B、となり、出力音レベル変化としては、図5(c)のようになる。
このように、一瞬だけ大きな入力音レベルが入力された場合、従来のリカバリ動作を遅くしている場合と異なり、リカバリ動作開始時のゲイン変化が大きくすることが可能となる。よって、音声が一瞬だけ大きい音の後でも、音声レベルが小さくなって聞こえなくなってしまうことを防止することが可能となる。
図6を用いて、大きな入力音レベルが続いた後、小さな入力音レベルに変化した場合の動作説明を行う。図6(a)のグラフのように、時間801まではアッタク動作をするような過大入力音レベルBが入力された後、小さな入力音レベルAに変化したとする。入力音レベルAに対するターゲットゲインをGt、過大入力音レベルBに対するターゲットゲインをGsとすると、ゲインの変化は、図6(b)のようになる。出力音声レベルは、A’=Gt×A、B’=Gt×B、となり、出力音レベル変化としては、図6(c)のようになる。
このように、大きな入力音レベルが続いた後入力音レベルが小さくなった場合でも、従来のリカバリ動作を遅くしている場合と異なり、リカバリ動作開始時のゲイン変化が大きくすることが可能となる。よって、大きな入力音レベルが続いた後でも、音声レベルが小さくなって聞こえなくなってしまうことを防止することが可能となる。
図7を用いて、ゲインを下げる必要がある大きな入力音レベルが続いた後、短い期間の多少入力音レベルが小さく変化し、再度、大きな入力音レベルになった場合の動作説明を行う。
図7(a)のグラフのように、時間901まではアッタク動作をするような過大入力音レベルBが入力された後、時間901から時間902の期間入力レベルが下がり、時間902以降は、レベルBに戻ったとする。入力音レベルAに対するターゲットゲインをGt、過大入力音レベルBに対するターゲットゲインをGsとすると、ゲインの変化は、図7(b)のようになる。出力音声レベルは、A’=Gt×A、B’=Gt×B、となり、出力音レベル変化としては、図7(c)のようになる。
このように、大きな入力音レベルが続いた後、短い期間の多少入力音レベルが小さく変化し、再度、大きな入力音レベルになった場合、リカバリを早くした場合と異なり、リカバリ動作時の変化量をごくわずかにすることが可能となる。よって、大きな入力音レベルが続いた後、短い期間の多少入力音レベルが小さく変化し、再度、大きな入力音レベルになった場合には、ほぼ一定のゲインを保てるので、聴感上違和感のない録音が可能となる。
[実施例2]
本発明を適用した実施例2は、実施例1のリカバリーコントロール部110のゲイン動作に係るものである。前記リカバリ動作以外の構成要素は実施例1と同じものであり、ここでは、説明を省略する。図8を用いて、リカバリーコントロール部110の構成を説明する。
1001は、増幅部105のゲイン値とターゲットゲイン決定部108から出力されるゲイン値との差をとる差分回路である。1002は、差分回路1001の値に対して、リカバリ動作時にゲインを増加させる割合値を保持しているリカバリーゲインテーブルである。1003は、差分回路1001の出力値によって、ゲインテーブル1002からゲイン値を読みだしてゲインコントロール部111にゲインを指示するリカバリーゲイン決定部である。
図8、図9を用いて、動作フローを説明する。リカバリ動作を開始(S1101)すると、リカバリーコントロール部110はターゲットゲイン決定部108からターゲットゲイン値(Gt)を取得する(S1002)。
リカバリーコントロール部110は増幅部105から現在のゲイン値(Gn)を取得する(S1003)。差分回路1001は、ターゲットゲイン値(Gt)と現在のゲイン値(Gn)の差分を算出する(S1004)。リカバリーゲイン決定部1003は、リカバリーゲインテーブル1002から(Gt−Gn)に対応するゲインを増加させる割合値(Gr)を読みだす(S1105)。リカバリーゲイン決定部1003は、現在のゲイン値(Gn)とゲインを増加させる割合値(Gr)の和(Gsum=Gn+Gr)を算出する(S1106)。
S1106で算出した和(Gsum)とターゲットゲイン(Gt)を比較して(S1107)、S1106で算出した和(Gsum)が小さければ、ゲインコントロール部111は増幅部105のゲイン値をS1106で算出した和(Gsum)に変更する(S1108)。S1108でゲインを変更したらS1103に戻る。S1106で算出した和(Gsum)とターゲットゲイン(Gt)を比較して(S1107)、S1106で算出した和(Gsum)が大きければ、ゲインコントロール部111は増幅部105のゲイン値をターゲットゲイン(Gt)に変更する(S1109)。S1109で増幅部105のゲイン値をターゲットゲイン(Gt)に変更したらリカバリ動作を終了する(S1110)。
次に、図10を用いて、ゲイン変化が2点の折れ線近似になる場合の、リカバリーゲインテーブル1002の実施例を説明する。
リカバリーゲインテーブル1002の値が、ターゲットゲイン値(Gt)と現在のゲイン値(Gn)の差分値と、ゲインの増加量の関係が図10(a)のようになっている。
ターゲットゲイン値(Gt)と現在のゲイン値(Gn)の差分の値がX0以下の時、ゲインの増加量がY0、差分の値がX0以上、X1以下の時、ゲインの増加量がY1、差分の値がX1以上の時、ゲインの増加量がY2となっている。
図10(b)を用いて、時間とゲインの関係を説明する。リカバリ動作に入り、ターゲットゲイン値(Gt)と現在のゲイン値(Gn)の差分がX1以上ある場合は、ゲインの増加量は図10(a)のグラフにあるように、Y2となるので、差分がX1になる1201の点まで、ゲインがY2で増加していく。
ターゲットゲイン値(Gt)と現在のゲイン値(Gn)の差分がX0以上、X1以下の場合、ゲインの増加量は図10(a)のグラフにあるように、Y1となるので、差分がX0になる1202の点まで、ゲインがY1で増加していく。
ターゲットゲイン値(Gt)と現在のゲイン値(Gn)の差分がX0以下の場合、ゲインの増加量は図10(a)のグラフにあるように、Y0となるので、差分が0であるターゲットゲインGtになる1202の点まで、ゲインがY0で増加していく。
リカバリーゲインテーブルを図10(a)のようにすると、時間に対するゲインの変化が図10(b)のグラフにあるゲイン変化となり、実施例1と同様の効果が得ることが可能である。
101 マイク、102 マイクアンプ、103 A/D変換部

Claims (4)

  1. 入力された音声信号を遅延させる遅延手段と、
    前記遅延手段で遅延させられた音声信号を、ゲイン応じて増幅する増幅手段と、
    入力された音声レベルによって予め定められたゲイン値を出力する第一のゲイン出力手段と、
    前記増幅手段のゲイン値と前記第一のゲイン出力手段の出力値を比較して、前記増幅手段のゲインを決定する第二のゲイン出力手段を有し、
    前記第二のゲイン出力手段は、前記増幅手段のゲイン値と前記第一のゲイン出力手段の出力値との差が大きければゲインの変化を大きくし、差が小さければゲインの変化を小さくすることを特徴とする音声処理装置。
  2. 前記第二のゲイン出力手段のゲインの変化が時間の指数関数で規定されることを特徴とする請求項1に記載の音声処理装置。
  3. 前記第二のゲイン出力手段のゲインの変化を時間で規定する構成が、2点以上の折れ線近似となる構成であることを特徴とする請求項1に記載の音声処理装置。
  4. 前記第二のゲイン出力手段のゲイン変化を時間で規定する構成が、前記前記第一のゲイン出力手段の出力値と前記増幅手段のゲイン値との差分から規定される構成であることを特徴とする請求項3に記載の音声処理装置。
JP2014130853A 2014-06-26 2014-06-26 音声処理装置 Pending JP2016010086A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2014130853A JP2016010086A (ja) 2014-06-26 2014-06-26 音声処理装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2014130853A JP2016010086A (ja) 2014-06-26 2014-06-26 音声処理装置

Publications (1)

Publication Number Publication Date
JP2016010086A true JP2016010086A (ja) 2016-01-18

Family

ID=55227355

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2014130853A Pending JP2016010086A (ja) 2014-06-26 2014-06-26 音声処理装置

Country Status (1)

Country Link
JP (1) JP2016010086A (ja)

Similar Documents

Publication Publication Date Title
US10341767B2 (en) Speaker protection excursion oversight
CN104918181B (zh) 电平调整装置和方法
CN101406072A (zh) 助听器和估算助听器动态增益限度的方法
CN107968980B (zh) 数字麦克风以及其控制方法
JP4538494B2 (ja) 音響効果回路及び処理方法
JP4862820B2 (ja) 音響信号増幅装置
JP2009118391A (ja) 音処理装置およびプログラム
KR19980039128A (ko) 디지탈 오디오 프로세서의 노이즈 게이트 장치
US20150043753A1 (en) Systems and Methods for Noise Reduction
JP2016010086A (ja) 音声処理装置
JP6887315B2 (ja) 音声処理装置およびその制御方法、プログラム並びに記憶媒体
US7847176B2 (en) Digital signal processor and a method for producing harmonic sound
JP5724869B2 (ja) 信号処理装置、信号処理方法及びプログラム
JP2009171057A (ja) 増幅回路
US9843872B2 (en) Sound collection equipment and method for detecting the operation status of sound collection equipment
JPWO2017042875A1 (ja) 電子聴診装置、制御方法、コンピュータプログラム及び記録媒体
US10218328B2 (en) Audio processing apparatus for generating audio signals for monitoring from audio signals for recording and method of controlling same
JP2007109328A (ja) 再生装置
GB2559012A (en) Speaker protection excursion oversight
JP2002299975A (ja) デジタルagc装置
TWI399918B (zh) 訊號自動增益調整方法與應用該方法之裝置
JP3237350B2 (ja) 自動利得制御装置
JP6674338B2 (ja) 音処理装置、その制御方法、およびプログラム
CN116318001A (zh) 用于自动调节增益系数平滑时间的方法和装置及电子设备
JP2010178224A (ja) 補聴装置