JP5223595B2 - 音声処理回路及び音声処理方法 - Google Patents

音声処理回路及び音声処理方法 Download PDF

Info

Publication number
JP5223595B2
JP5223595B2 JP2008278923A JP2008278923A JP5223595B2 JP 5223595 B2 JP5223595 B2 JP 5223595B2 JP 2008278923 A JP2008278923 A JP 2008278923A JP 2008278923 A JP2008278923 A JP 2008278923A JP 5223595 B2 JP5223595 B2 JP 5223595B2
Authority
JP
Japan
Prior art keywords
level
gain
audio
signal
input
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2008278923A
Other languages
English (en)
Other versions
JP2010109624A (ja
Inventor
直樹 仁田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Yamaha Corp
Original Assignee
Yamaha Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Yamaha Corp filed Critical Yamaha Corp
Priority to JP2008278923A priority Critical patent/JP5223595B2/ja
Priority to KR1020090101583A priority patent/KR101093280B1/ko
Priority to CN200910209920A priority patent/CN101727907A/zh
Publication of JP2010109624A publication Critical patent/JP2010109624A/ja
Application granted granted Critical
Publication of JP5223595B2 publication Critical patent/JP5223595B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • G10L21/0216Noise filtering characterised by the method used for estimating noise
    • G10L21/0232Processing in the frequency domain
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0272Voice signal separating
    • G10L21/028Voice signal separating using properties of sound source

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Quality & Reliability (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Tone Control, Compression And Expansion, Limiting Amplitude (AREA)
  • Circuit For Audible Band Transducer (AREA)

Description

本発明は、聴きやすい音声を出力する音声処理技術に関する。
上記の音声処理に関連する技術としては、特許文献1に記載のものが挙げられる。特許文献1には、複数のパートからなる着信メロディをバランスよく再生するために、スピーカ(レシーバ)の周波数特性を平坦化するように、イコライザによって楽音信号の周波数特性を調整する携帯電話機が記載されている。
特許第3775156号公報
ところで、上記の平坦化の方法としては、スピーカの周波数特性のグラフにおける凹部の周波数帯域のゲインを上げるのが一般的である。したがって、イコライザへの入力信号のレベルを下げない場合には、イコライザや後段の回路には十分に高いレベルの信号を扱うことが要求される。つまり、高い性能の回路が必要となる。一方、イコライザへの入力信号のレベルを下げる場合には、S/N比が悪化してしまう。このように、特許文献1に記載の技術を上記の音声処理に適用するのは困難である。
本発明は、上述した事情に鑑みてなされたものであり、高い性能の回路を用いることなく、聴き易い音声を出力することができる音声処理技術を提供することを課題とする。
本発明に係る音声処理回路は、上述した課題を解決するため、入力信号を複数の周波数帯域に分割して複数の第1音声信号を生成する周波数分割回路と、前記複数の第1音声信号が各々供給され、非線形処理を施して第2音声信号を各々生成する複数の非線形処理回路と、前記複数の非線形処理回路から各々出力される前記第2音声信号を加算して出力信号を生成する加算回路とを備え、前記複数の非線形処理回路の各々は、前記第1音声信号のレベルを検出するレベル検出部と、前記レベル検出部で検出されたレベルに外部から指定可能な係数を乗算して出力する係数部と、入力レベルが所定値以下である場合には前記入力レベルが上がるほど小さいゲインを出力する入出力特性に従って、前記係数部が出力するレベルを前記入力レベルとして用いてゲインを決定するゲイン決定部と、前記ゲイン決定部で決定されたゲインを前記第1音声信号に乗算して前記第2音声信号を生成する乗算部と、を備え、前記係数は、前記出力信号を入力して音に変換して出力するスピーカの周波数特性に応じて定められる、ことを特徴とする。
この音声処理回路によれば、低いレベルに対するゲインを高くし、高いレベルに対するゲインを低くする非線形処理を採用可能であり、出力信号を音声に変換する手段の周波数特性を補正するための係数を指定することが可能であるから、聴きやすい音声を出力することが可能となる。また、この音声処理回路によれば、加算されて出力信号となる複数の第2音声信号の各々が、第1音声信号のレベルと外部から指定可能な係数とに基づいて決定されるゲインを第1音声信号に乗算して生成されるから、非線形処理後の音声信号に対して周波数特性を補正するためのゲインを乗算する形態(図4)に比較して、出力信号のS/N比を劣化させることなく歪を抑制できる。
また、上記の入出力特性は、前記入力レベルが前記所定値以上の場合には出力レベルを一定とする特性であってもよく、上記の非線形処理回路は、前記係数を書き換え可能に記憶する記憶部を備えてもよい。
また、本発明に係る音声処理方法は、入力信号を複数の周波数帯域に分割して複数の第1音声信号を生成する工程と、前記複数の第1音声信号の各々に非線形処理を施して複数の第2音声信号を生成する工程と、前記複数の第2音声信号を加算して出力信号を生成する工程とを備え、前記非線形処理では、前記出力信号を入力して音に変換して出力するスピーカの周波数特性に応じて定められる係数を前記第1音声信号のレベルに乗算し、入力レベルが所定値以下である場合には前記入力レベルが上がるほど小さいゲインを出力する入出力特性に従って、前記乗算して得られたレベルを前記入力レベルとして用いてゲインを決定し、前記決定したゲインを前記第1音声信号に乗算して前記第2音声信号を生成する、ことを特徴とする
以下では、本発明に係る実施の形態について図面を参照して説明する。
図1は、本発明の実施の形態に係る音声処理装置100の構成を示すブロック図である。この図に示すように、音声処理装置100は音声処理回路1とスピーカ2とを備える。音声処理回路1は、音声信号である入力信号INに音声処理を施して出力信号OUTを生成する。スピーカ2は出力信号OUTを音に変換する。音声処理装置100は携帯電話機であり、入力信号INは例えば遠端話者の音声信号である。また、音声処理回路1が行う音声処理は、スピーカ2から聴きやすい音声を出力するための信号処理である。
音声処理回路1は、周波数分割回路10と圧縮回路群20と加算回路30とを備える。周波数分割回路10は、入力信号INを複数の周波数帯域に分割して複数の第1音声信号を生成する。圧縮回路群20は、これら複数の第1音声信号の各々にダイナミックレンジを圧縮するダイナミックレンジ圧縮(DRC)等の処理を施して複数の第2音声信号を生成する。加算回路30は、これら複数の第2音声信号を加算して出力信号OUTを生成する。
周波数分割回路10はBPF(帯域通過フィルタ)1〜BPF6を備える。本実施形態では、周波数分割回路が備えるBPFの数を6個としているが、これに限らず、任意の複数としてもよい。各BPFには入力信号INが供給され、各BPFは、設定された中心周波数を含む周波数帯域の信号を通過させて第1音声信号を生成する。各BPFの通過帯域は入力信号INの周波数帯域よりも狭い。複数のBPFの中心周波数は、互いに異なり、スピーカ2から聴きやすい音声を出力させる観点から、対数的に等間隔で設定されることが好ましい。本実施の形態では、BPF1に125Hz、BPF2に250Hz、BPF3に500Hz、BPF4に1kHz、BPF5に2kHz、BPF6に4kHzが設定されている。
圧縮回路群20は第1圧縮回路U1〜第6圧縮回路U6を備える。第1圧縮回路U1〜第6圧縮回路U6はそれぞれBPF1〜BPF6と一対一で対応している。本実施形態では、圧縮回路群が備える圧縮回路の数を6個としているが、これは周波数分割回路10が6個のBPFを備えるためであり、これに限らず、周波数分割回路が備えるBPFの数と同様に任意の複数としてもよい。各圧縮回路は、第1音声信号に対して、後述の非線形処理および補正処理を施して第2音声信号を生成する。
ところで、スピーカの周波数特性には個体差がある。そこで、本実施の形態では、スピーカ2から聴きやすい音声を出力させるために、スピーカ2の周波数特性を考慮して出力信号OUTに周波数特性を付与している。このため、各圧縮回路は、音声処理回路1外から供給される制御信号CTLを用いて補正処理を行う。制御信号CTLは、出力信号OUTに付与すべき周波数特性に応じて適宜決定される。この例の制御信号CTLは、スピーカ2の周波数特性に相当する係数を指定する。この係数によってゲイン算出部52に供給される信号レベルが調整される。ゲイン算出部52は供給される信号レベルに応じたゲインを算出するので、係数に応じた周波数特性が出力信号OUTに付与されることになる。すなわち、本実施形態では、出力信号OUTをスピーカ2に供給することによって、スピーカ2の周波数特性を補正するように係数が設定されている。なお、制御信号CTLは、音声処理回路1外から供給されるから、補正処理で用いられる係数は音声処理回路1外から指定される。くわえて、制御信号CTLの供給元は音声処理装置100の外部であっても内部であってもよい。
次に、各圧縮回路の構成について説明する。ただし、各圧縮回路の構成は対応するBPFを除いて共通であるから、ここでは第1圧縮回路U1の構成を説明することにより、各圧縮回路の構成の説明に代える。
図2に示すように、第1圧縮回路U1は、レベル検出部50と係数部51とゲイン算出部(ゲイン決定部)52と乗算部53とを備える。レベル検出部50は、BPF1で生成された第1音声信号のレベルを検出する。係数部51は、レベル検出部50に検出されたレベルに制御信号CTLで指定された係数を乗算して出力する。この乗算は、スピーカ2の周波数特性を補正するように行われる。なお、係数部51は、係数を書き換え可能に記憶する記憶部を備えていてもよいし、備えていなくてもよい。後者の場合、制御信号CTLの供給元が係数を書き換え可能に記憶する記憶部を備えることになる。ゲイン算出部52は、信号に応じたゲインを求めるためのゲインテーブルを有し、係数部51の出力信号とゲインテーブルとに基づいてゲインを算出する。乗算部53は、BPF1で生成された第1音声信号にゲイン算出部52で算出されたゲインを乗算して第2音声信号を生成する。このゲインは、スピーカ2の周波数特性を補正するように算出されたものであるから、補正処理は乗算部53による乗算によって完了する。つまり、第1圧縮回路U1は、補正処理を行う補正処理回路でもある。
各圧縮回路の入出力レベル特性は図3中に実線で示す通りである。前述のゲインテーブルは、この特性が得られるように設計されている。この図において、横軸は入力レベル(dB)を示し、縦軸は出力レベル(dB)を示す。図中のUCLは不快レベルに相当する。不快レベルは、人に不快感を与えない音圧範囲の上限値である。UCLの値は任意であるが、統計的な手法によって定めることが好ましい。図中の実線から明らかなように、各圧縮回路は、入力レベルがUCL以上の場合には出力レベルをUCL一定とする出力レベル制限を行う。したがって、第2音声信号は人に不快感を与えない音圧の信号となる。
また、図中のHTLは聴覚閾値に相当する。聴覚閾値は、人が聴き取ることのできる音圧範囲の下限値である。HTLの値は任意であるが、統計的な手法によって定めることが好ましい。また、HTL´はHTLよりも予め定められた差分(dB)だけ高いレベルであり、HTL´<UCLである。図中の実線と破線(入力レベルおよび出力レベルが共にUCLである点と原点とを結ぶ直線)とを比較すれば明らかなように、各圧縮回路の入出力特性は非線形である。
この入出力特性によれば、HTLからUCLまでの第1音声信号のレベルが、HTL´からUCLまでの第2音声信号のレベルに圧縮されるから、聴覚閾値がHTL´の聴取者にも、HTL以上かつHTL´未満のレベルの第1音声信号の音が聴こえるようになる。
ところで、補正処理においてはスピーカ2の周波数特性を補正するためにスピーカ2の周波数特性のグラフにおける凹部のゲインを上げる必要または凸部のゲインを下げる必要がある。このゲインを決定するのは係数部51の後段のゲイン算出部52である。ゲイン算出部52では入力レベルが低いほどゲインが大きくなる圧縮増幅が行われるから、係数部51は、レベル検出部50に検出されたレベルと係数の乗算により、レベル検出部50に検出されたレベルからスピーカ2における増減分だけ上下させたレベルを算出する。つまり、係数部51の乗算は、スピーカ2において減衰する場合にはゲイン算出部52の入力レベルが図3中の左方へずれ、逆の場合にはゲイン算出部52の入力レベルが図3中の右方へずれるように行われる。
この圧縮回路の入出力特性は非線形であるが、非線形処理と補正処理が一挙に行われる点に特徴がある。これにより、加算回路30におけるオーバーフローを防止すると共に出力信号OUTのS/N比を向上させることができる。以下、非線形処理の後に補正処理を行う音声処理装置200を比較例として図4に示し、上述した特徴の利点を説明する。
図4に示すように、音声処理装置200は、音声処理回路3とスピーカ2とを備える。音声処理回路3は、周波数分割回路10と、圧縮回路群40と、ゲイン乗算部G1〜G6と、加算回路30とを備える。圧縮回路群40は、第11圧縮回路U11〜第16圧縮回路U16を備える。第11圧縮回路U11〜第16圧縮回路U16は、それぞれ周波数分割回路10のBPF1〜BPF6と一対一で対応している。第11圧縮回路U11〜第16圧縮回路U16の各々は、図2に示す構成から係数部51を除いた構成を有し、対応するBPFで生成された第1音声信号に対して非線形処理を施して第3音声信号を生成する。
ゲイン乗算部G1〜G6は、例えばイコライザであり、それぞれ第11圧縮回路U11〜第16圧縮回路U16と一対一で対応している。各ゲイン乗算部には、前述の制御信号CTLが供給され、各ゲイン乗算部は、対応する圧縮回路で生成された第3音声信号に制御信号CTLで指定された係数を乗算して第2音声信号を生成する。この乗算は、スピーカ2の周波数特性を補正するように行われるものであり、具体的には、スピーカ2における増減分を打ち消すように行われる。このように、音声処理装置200では、各ゲイン乗算部によって補正処理が行われる。加算回路30は、ゲイン乗算部G1〜G6で生成された複数の第2音声信号を加算して出力信号OUTを生成する。
ゲイン乗算部による補正処理では、例えば、スピーカ2の周波数特性が図5に示す通りである場合、ゲイン乗算部G1は+10dB、ゲイン乗算部G2は+5dB、ゲイン乗算部G3は0dB、ゲイン乗算部G4は+5dB、ゲイン乗算部G5は+7dB、ゲイン乗算部G6は+10dBだけ第3音声信号を増幅する。このように、音声処理回路3では、各周波数帯域の音声信号がスピーカ2で減衰する分だけ予め増幅される。したがって、スピーカ2から放出される音におけるスピーカ2の周波数特性の影響が抑制(除去)される。
しかしながら、音声処理装置200では、スピーカ2の周波数特性によっては、ゲイン乗算部の出力レベルが高くなり過ぎる虞がある。加算回路30のダイナミックレンジには一定の限界がある。加算回路30がアナログ回路で構成される場合には、ゲイン乗算部の出力レベルが高くなり過ぎると出力信号OUTがクリップする。また、加算回路30がデジタル回路で構成される場合には、オーバーフローしてしまうので、同様に出力信号OUTがクリップしてしまう。この結果、出力信号OUTに歪が発生し音声の品質が劣化する。さらに、加算回路30のダイナミックレンジ内であっても、後段のスピーカ2の入出力特性によっては、スピーカ2自体で歪が発生することもあり得る。
このような不都合を回避するために、各ゲイン乗算部へ入力される第3音声信号のレベルを下げることも考えられる。しかしながら、レベルを下げると出力信号OUTのS/N比が悪化してしまう。特に、入力信号INが小振幅の場合に問題となる。この点は、圧縮回路をアナログ回路で構成してもデジタル回路で構成も同様である。アナログ回路で構成する場合には、トランジスタの熱雑音や電源から回り込む雑音のレベルと信号レベルとが問題となり、デジタル回路で構成される場合には、ビットの丸め誤差が問題となる。
これに対して、上述した音声処理装置100では、圧縮回路で非線形処理と補正処理とを実行している。具体的には、レベル検出部50で検出した第1音声信号のレベルを係数部51で補正し、補正されたレベルに基づいて、第1音声信号に付与するゲインをゲイン算出部52で算出し、乗算部53で算出されたゲインを第1音声信号に乗算して第2音声信号を生成する。ゲイン算出部52は、例えば、図3に示される入出力特性に従ってゲインを決定する。すなわち、第1音声信号のレベルが大きい部分では、ゲインが小さくなるようにしてダイナミックレンジを圧縮している。このため、圧縮回路で補正処理を行っても加算回路30でオーバーフローが発生することを抑制できる。特に、図3に示される入出力特性では、第2音声信号のレベルがUCLを超えないようになっているから、第1乃至第6圧縮回路U1〜U6から各々出力される第2音声信号の最大レベルが確定している。このため、最大レベルを考慮して加算回路30のダイナミックレンジを設定すれば、出力信号OUTがクリップして歪が発生することを確実に防止できる。その一方で、入力信号INが小振幅であっても、そのレベルをさらに絞る必要がないので、S/N比が低下することもない。
次に、音声処理装置100と音声処理装置200との作用効果の差異について、BPF6に対応する信号経路に注目して説明する。この説明では、第6圧縮回路U6の非線形処理に係る入出力特性、第16圧縮回路U16の入出力特性、およびゲイン算出部52の入力レベル−ゲイン特性は、図6に示す通りであるものとする。図6では、単位「dBSPL」を用いて音圧レベルがデシベルで表記されており、HTLとHTL´との差分は40dBであり、HTLは−5dBであり、UCLは100dBである。
まず、レベル検出部50で検出されたレベルが60dBSPLの場合について説明する。
この場合、音声処理装置200の音声処理回路3では、第16圧縮回路U16のゲイン算出部52で算出されるゲインが15.2dBとなる。したがって、音声処理回路3から出力される音圧は、スピーカ2の周波数特性が平坦であれば、60+15.2=75.2dBSPLとなり、図5に示す通りであれば、ゲイン乗算部G6がスピーカ2における4kHzの減衰分(10dB)だけゲインを持ち上げるから、75.2+10−10=75.2dBSPLとなる。このことは、音声処理回路3がスピーカ2の周波数特性を高い精度で補正可能であることを示している。
これに対して、音声処理装置100の音声処理回路1から出力される音圧は、スピーカ2の周波数特性が平坦であれば、第6圧縮回路U6のゲイン算出部52の入力レベルが60dBSPLとなり、このゲイン算出部52で算出されるゲインが15.2dBとなるから、60+15.2=75.2dBSPLとなり、図5に示す通りであれば、係数部51がレベル検出部50で検出されたレベルをスピーカ2における4kHzの減衰分(10dB)だけ小さくするから、その後段のゲイン算出部52の入力レベルが60−10=50dBSPLとなり、このゲイン算出部52で算出されるゲインが19dBとなるから、60+19−10=69dBSPLとなる。このことは、音声処理回路1がスピーカ2の周波数特性を音声処理回路3よりも低いある程度の精度で補正可能であることを示している。
次に、レベル検出部50で検出されたレベルが100dBSPLの場合について説明する。この場合、音声処理装置200の音声処理回路3では、第16圧縮回路U16のゲイン算出部52で算出されるゲインが0dBとなる。したがって、音声処理回路3から出力される音圧は、スピーカ2の周波数特性が平坦であれば、100+0=100dBSPLとなり、図5に示す通りであれば、ゲイン乗算部G6がスピーカ2における4kHzの減衰分(10dB)だけゲインを持ち上げるから、100+10−10=100dBSPLとなる。このことは、音声処理回路3がスピーカ2の周波数特性を高い精度で補正可能であることを示す一方、各ゲイン乗算部、加算回路30およびスピーカ2として110dBSPLに相当するレベルの信号を扱うことができるものを用いる必要があることを示している。
これに対して、音声処理装置100の音声処理回路1から出力される音圧は、スピーカ2の周波数特性が平坦であれば、第6圧縮回路U6のゲイン算出部52の入力レベルが100dBSPLとなり、このゲイン算出部52で算出されるゲインが0dBとなるから、100+0=100dBSPLとなり、図5に示す通りであれば、係数部51がレベル検出部50で検出されたレベルをスピーカ2における4kHzの減衰分(10dB)だけ小さくするから、その後段のゲイン算出部52の入力レベルは100−10=90dBSPLとなり、このゲイン算出部52で算出されるゲインが3.8dBとなるから、100+3.8−10=93.8dBSPLとなる。このことは、音声処理回路1がスピーカ2の周波数特性を音声処理回路3よりも低いある程度の精度で補正可能であることを示す一方、乗算部53、およびスピーカ2として103.8dBSPLに相当するレベルの信号を扱うことができるものを用いることができることを示している。
なお、上述した実施の形態では、各圧縮回路が行う非線形処理としてレベル制限、圧縮増幅および線形増幅を含む処理を例示したが、これに限るものではない。また、上述した実施の形態では、出力信号を音声に変換する手段としてスピーカを例示したが、これに限るものではない。また、本発明は上述した実施の形態に限定されるものではなく、本願の特許請求の範囲に記載された発明特定事項から本発明の解決課題に基づいて把握される任意の形態を含む。例えば、以下に述べる変形例を含む。
図7は、本発明の実施の形態の変形例に係る音声処理回路4の構成を示すブロック図である。音声処理回路4は、前述の音声処理回路1と同様に、入力信号INに音声処理を施して出力信号OUTを生成する。ただし、音声処理回路1が時間領域で音声処理を行うのに対し、音声処理回路4は周波数領域で音声処理を行う。
音声処理回路4は、フーリエ変換部60と、帯域選択部1〜帯域選択部6と、レベル検出部61〜66と、係数部71〜76と、ゲイン算出部81〜86と、ゲイン補間部70と、乗算部80と、逆フーリエ変換部90とを有する。帯域選択部1、レベル検出部61、係数部71及びゲイン算出部81は互いに対応し、帯域選択部2、レベル検出部62、係数部72及びゲイン算出部82は互いに対応し、…、帯域選択部6、レベル検出部66、係数部76及びゲイン算出部86は互いに対応している。
フーリエ変換部60は、入力信号INをフーリエ変換(例えば高速フーリエ変換)によって時間領域の信号から周波数領域の信号へ変換する。各帯域選択部は、変換後の信号のうち、対応する周波数帯域の信号を選択し、選択した信号をまとめて出力する。換言すれば、各帯域選択部は、対応する周波数帯域の入力スペクトルを算出する。つまり、フーリエ変換部60および帯域選択部1〜帯域選択部6は、図1の周波数分割回路10に相当する。
レベル検出部61〜66の各々は、図2のレベル検出部50に相当し、対応する帯域選択回路から出力された信号の平均レベルを検出(算出)する。係数部71〜76にはそれぞれ制御信号CTL1〜CTL6が供給され、係数部71〜76の各々は、対応するレベル検出部に検出されたレベルに制御信号で指定された係数を乗算して出力する。この乗算は、スピーカ2の周波数特性を補正するように行われる。つまり、係数部71〜76の各々は、図2の係数部5に相当する。
ゲイン算出部81〜86の各々は、図2のゲイン算出部52に相当し、対応する係数部の出力信号とゲインテーブルとに基づいてゲインを算出する。ゲインテーブルは、ゲイン算出部81〜86間で共通であっても相違していてもよいが、本変形例では、ゲインテーブルをゲイン算出部81〜86間で相違させて精度の向上を図っている。
ゲイン補間部70は、ゲイン算出部81〜86に算出されたゲインを補間して全周波数領域の信号(すなわち周波数領域の入力信号IN)に対するゲインを求める。ここで、「補間」について説明する。各ゲイン算出部で算出されるゲインは特定の周波数に対するゲインである。つまり、ゲイン算出部81〜86に算出されるのは、全周波数領域のうち、特定の6個の周波数の信号に対するゲインに過ぎない。しかし、入力信号INには、これら6個の周波数以外の周波数の信号が含まれている。そこで、本変形例では、周波数領域において、これら6個の周波数の信号に対するゲインを線形補間して全周波数領域の信号に対するゲインを求めている。これが「補間」である。
乗算部80は、図2の乗算部53に相当し、周波数領域の入力信号INにゲイン補間部70で求められたゲインを乗算して信号を出力する。逆フーリエ変換部90は、乗算部53の出力信号を逆フーリエ変換によって周波数領域の信号から時間領域の信号(すなわち出力信号OUT)へ変換する。
つまり、レベル検出部61〜66、係数部71〜76、ゲイン算出部81〜86、ゲイン補間部70、乗算部80及び逆フーリエ変換部90は、図1の圧縮回路群20に相当する。なお、この変形例の音声処理回路4を備えた音声処理装置では、加算回路30は不要となる。
本発明の実施の形態に係る音声処理装置100の構成を示すブロック図である。 音声処理装置100の第1圧縮回路U1の構成を示すブロック図である。 音声処理装置100の各圧縮回路の入出力レベル特性を示す図である。 音声処理装置100と対比される音声処理装置200の構成を示すブロック図である。 音声処理装置100および音声処理装置200のスピーカ2の周波数特性を示す図である。 音声処理装置100と音声処理装置200との作用効果の差異を説明するための図である。 本発明の実施の形態の変形例に係る音声処理回路4の構成を示すブロック図である。
符号の説明
1,3,4……音声処理回路、2……スピーカ、10……BPF、20,40……圧縮回路群、30……加算回路、50,61〜66……レベル検出部、51,71〜76……係数部、52,81〜86……ゲイン算出部、53,80……乗算部、60……フーリエ変換部、70……ゲイン補間部、90……逆フーリエ変換部、100,200……音声処理装置、G1〜G6……ゲイン乗算部。

Claims (4)

  1. 入力信号を複数の周波数帯域に分割して複数の第1音声信号を生成する周波数分割回路と、
    前記複数の第1音声信号が各々供給され、非線形処理を施して第2音声信号を各々生成する複数の非線形処理回路と、
    前記複数の非線形処理回路から各々出力される前記第2音声信号を加算して出力信号を生成する加算回路とを備え、
    前記複数の非線形処理回路の各々は、
    前記第1音声信号のレベルを検出するレベル検出部と、
    前記レベル検出部で検出されたレベルに外部から指定可能な係数を乗算して出力する係数部と、
    入力レベルが所定値以下である場合には前記入力レベルが上がるほど小さいゲインを出力する入出力特性に従って、前記係数部が出力するレベルを前記入力レベルとして用いてゲインを決定するゲイン決定部と、
    前記ゲイン決定部で決定されたゲインを前記第1音声信号に乗算して前記第2音声信号を生成する乗算部と、を備え、
    前記係数は、前記出力信号を入力して音に変換して出力するスピーカの周波数特性に応じて定められる
    ことを特徴とする音声処理回路。
  2. 前記入出力特性は、前記入力レベルが前記所定値以上の場合には出力レベルを一定とする特性であることを特徴とする請求項1に記載の音声処理回路。
  3. 前記非線形処理回路は、前記係数を書き換え可能に記憶する記憶部を備えることを特徴とする請求項1または2に記載の音声処理回路。
  4. 入力信号を複数の周波数帯域に分割して複数の第1音声信号を生成する工程と、
    前記複数の第1音声信号の各々に非線形処理を施して複数の第2音声信号を生成する工程と、
    前記複数の第2音声信号を加算して出力信号を生成する工程とを備え、
    前記非線形処理では
    前記出力信号を入力して音に変換して出力するスピーカの周波数特性に応じて定められる係数を前記第1音声信号のレベルに乗算し、
    入力レベルが所定値以下である場合には前記入力レベルが上がるほど小さいゲインを出力する入出力特性に従って、前記乗算して得られたレベルを前記入力レベルとして用いてゲインを決定し、
    前記決定したゲインを前記第1音声信号に乗算して前記第2音声信号を生成する
    ことを特徴とする音声処理方法。
JP2008278923A 2008-10-29 2008-10-29 音声処理回路及び音声処理方法 Expired - Fee Related JP5223595B2 (ja)

Priority Applications (3)

Application Number Priority Date Filing Date Title
JP2008278923A JP5223595B2 (ja) 2008-10-29 2008-10-29 音声処理回路及び音声処理方法
KR1020090101583A KR101093280B1 (ko) 2008-10-29 2009-10-26 음성 처리 회로, 음성 처리 장치 및 음성 처리 방법
CN200910209920A CN101727907A (zh) 2008-10-29 2009-10-29 音频处理电路、音频处理装置和音频处理方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2008278923A JP5223595B2 (ja) 2008-10-29 2008-10-29 音声処理回路及び音声処理方法

Publications (2)

Publication Number Publication Date
JP2010109624A JP2010109624A (ja) 2010-05-13
JP5223595B2 true JP5223595B2 (ja) 2013-06-26

Family

ID=42274725

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2008278923A Expired - Fee Related JP5223595B2 (ja) 2008-10-29 2008-10-29 音声処理回路及び音声処理方法

Country Status (3)

Country Link
JP (1) JP5223595B2 (ja)
KR (1) KR101093280B1 (ja)
CN (1) CN101727907A (ja)

Families Citing this family (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5531988B2 (ja) * 2011-03-03 2014-06-25 株式会社Jvcケンウッド 音量制御装置、音量制御方法、および音量制御プログラム
CN103618983B (zh) * 2013-10-31 2016-09-07 惠州超声音响有限公司 一种音响控制电路和控制方法
CN104469621B (zh) * 2014-12-09 2018-09-11 歌尔智能科技有限公司 一种语音遥控器抗干扰电路及方法
TW201720345A (zh) * 2015-12-11 2017-06-16 富奇想股份有限公司 智慧鏡功能組件運作方法、智慧鏡功能組件與智慧鏡系統
CN105609115B (zh) * 2015-12-18 2019-06-04 中国电子科技集团公司第四十一研究所 一种音频分析仪及其内部自校准方法
JP6703867B2 (ja) * 2016-03-08 2020-06-03 ローム株式会社 高温保護回路およびその動作方法、および音声信号出力装置
US11317203B2 (en) * 2020-08-04 2022-04-26 Nuvoton Technology Corporation System for preventing distortion of original input signal

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0574018U (ja) * 1991-02-20 1993-10-08 フオスター電機株式会社 音響用ディジタル信号処理装置
JP3295440B2 (ja) * 1991-09-10 2002-06-24 パイオニア株式会社 オーディオ装置における信号処理回路
JP3925572B2 (ja) * 1997-06-23 2007-06-06 ソニー株式会社 音声信号の処理回路
JP4214607B2 (ja) * 1999-03-23 2009-01-28 ソニー株式会社 マイクロホン装置
JP4256631B2 (ja) * 2002-06-03 2009-04-22 パナソニック株式会社 オートゲインコントロール装置
JP4131255B2 (ja) * 2004-07-05 2008-08-13 ヤマハ株式会社 オーディオ再生装置

Also Published As

Publication number Publication date
KR20100047804A (ko) 2010-05-10
KR101093280B1 (ko) 2011-12-14
JP2010109624A (ja) 2010-05-13
CN101727907A (zh) 2010-06-09

Similar Documents

Publication Publication Date Title
KR102473598B1 (ko) 왜곡 감지, 방지, 및 왜곡-인지 베이스 강화
US9712916B2 (en) Bass enhancement system
JP5223595B2 (ja) 音声処理回路及び音声処理方法
US9294062B2 (en) Sound processing apparatus, method, and program
WO2010005033A1 (ja) 音響処理装置
JP6102179B2 (ja) 音声処理装置および方法、並びにプログラム
JP5151762B2 (ja) 音声強調装置、携帯端末、音声強調方法および音声強調プログラム
US8351619B2 (en) Auditory sense correction device
US10380989B1 (en) Methods and apparatus for processing stereophonic audio content
JP4843691B2 (ja) 信号特性変化装置
JP5682539B2 (ja) 音響再生装置
KR20120102561A (ko) 보청장치 외부 소음 차폐 장치 및 방법
JP2012054863A (ja) 音響再生装置
JP2008148179A (ja) 音声信号処理装置および自動利得制御装置における雑音抑圧処理方法
US20230217166A1 (en) Bass enhancement for loudspeakers
WO2017183405A1 (ja) 音響処理装置および音響処理方法
JP4803193B2 (ja) オーディオ信号の利得制御装置および利得制御方法
JP2012216978A (ja) 信号処理装置及び信号処理方法
JP2008227681A (ja) 音響特性補正システム
JPWO2009008068A1 (ja) 自動音場補正装置
JP4974713B2 (ja) カラオケ装置
JP5032682B1 (ja) 特性補正装置および特性補正方法
JP6226166B2 (ja) 音響再生装置
JP2007093827A (ja) オーディオ再生装置
JP2015173343A (ja) オーディオ信号処理装置

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20110823

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20120726

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20120731

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20120928

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20130212

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20130225

R150 Certificate of patent or registration of utility model

Ref document number: 5223595

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20160322

Year of fee payment: 3

LAPS Cancellation because of no payment of annual fees