JP7348951B2 - 音声信号処理方法及びデバイス - Google Patents

音声信号処理方法及びデバイス Download PDF

Info

Publication number
JP7348951B2
JP7348951B2 JP2021545971A JP2021545971A JP7348951B2 JP 7348951 B2 JP7348951 B2 JP 7348951B2 JP 2021545971 A JP2021545971 A JP 2021545971A JP 2021545971 A JP2021545971 A JP 2021545971A JP 7348951 B2 JP7348951 B2 JP 7348951B2
Authority
JP
Japan
Prior art keywords
audio signal
nonlinearity
human ear
audio
electroacoustic transducer
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2021545971A
Other languages
English (en)
Other versions
JP2022522408A (ja
Inventor
マルコ・ドヴェツコ
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
MozzaikIo d o o
Original Assignee
MozzaikIo d o o
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Priority claimed from HRP20190292AA external-priority patent/HRP20190292A2/hr
Application filed by MozzaikIo d o o filed Critical MozzaikIo d o o
Publication of JP2022522408A publication Critical patent/JP2022522408A/ja
Application granted granted Critical
Publication of JP7348951B2 publication Critical patent/JP7348951B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S7/00Indicating arrangements; Control arrangements, e.g. balance control
    • H04S7/30Control circuits for electronic adaptation of the sound field
    • H04S7/301Automatic calibration of stereophonic sound system, e.g. with test microphone
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S7/00Indicating arrangements; Control arrangements, e.g. balance control
    • H04S7/30Control circuits for electronic adaptation of the sound field
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R3/00Circuits for transducers, loudspeakers or microphones
    • H04R3/002Damping circuit arrangements for transducers, e.g. motional feedback circuits
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R3/00Circuits for transducers, loudspeakers or microphones
    • H04R3/04Circuits for transducers, loudspeakers or microphones for correcting frequency response
    • H04R3/08Circuits for transducers, loudspeakers or microphones for correcting frequency response of electromagnetic transducers
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S1/00Two-channel systems
    • H04S1/002Non-adaptive circuits, e.g. manually adjustable or static, for enhancing the sound image or the spatial distribution
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S2400/00Details of stereophonic systems covered by H04S but not provided for in its groups
    • H04S2400/09Electronic reduction of distortion of stereophonic sound systems

Landscapes

  • Physics & Mathematics (AREA)
  • Engineering & Computer Science (AREA)
  • Acoustics & Sound (AREA)
  • Signal Processing (AREA)
  • Electromagnetism (AREA)
  • Circuit For Audible Band Transducer (AREA)
  • Application Of Or Painting With Fluid Materials (AREA)
  • Stereo-Broadcasting Methods (AREA)
  • Input Circuits Of Receivers And Coupling Of Receivers And Audio Equipment (AREA)

Description

本発明は、音声信号の品質及び/又は他の特性を増強するための、音声信号処理方法を説明する。この方法は、人間の耳の非線形な音響心理学的特性をも考慮して、制御された方法でオーディオチェーンに非線形性を付加することによって、上記オーディオチェーン内の電気音響変換器の非線形性を補正する。本発明は更に、上記方法と、人間の耳の非線形な音響心理学的特性をも考慮して電気音響変換器の非線形性を補正するよう構成されたオーディオチェーンとを実装するためのデバイス/装置に関する。上記オーディオチェーンは、上記音声信号処理方法を実装するための少なくとも1つの装置を内包する。
現在、電気音響変換器の前のオーディオチェーンは、申し分ない特徴を示す。比較的大きな歪みをもったいくつかのオーディオチェーンコンポーネントが歪みの比較的小さなコンポーネントよりも良好な音を生成する理由は、わかっていない。一部のアンプは、より良好な音を得るために真空管を組み込んでいるが、他のアンプは、コンポーネントの非線形性を強化するために小さなフィードバックループを採用する。電気音響変換器の前のオーディオチェーンの歪みは、その音が良いこと又は悪いことを意味しない。それ自体のオーディオチェーンにおいて音が良い2つの異なる電気音響変換器は、場所を交換すると音が悪くなる。その理由の1つは、電気音響変換器の前のオーディオチェーンが非線形性を有し、これにより電気音響変換器の非線形性が低減されることで、その音を他のオーディオチェーンにおいてよりも良くするためである。
本発明が解決する技術的課題は、人間の耳の非線形な音響心理学的特性をも考慮して、オーディオチェーン内で電気音響変換器の非線形性を補正する、オーディオチェーン内の音声信号処理のための方法及び装置である。
電気音響変換器の非線形性は、しばらく前から公知である。非線形な歪みは、録音媒体での録音プロセスから、録音媒体、アンプやラウドスピーカー自身からの音の再生までの電気音響再生チェーン全体を特徴付ける。これらの非線形性を文書にした刊行物が多数存在する。音を変化させるために楽器に非線形性を適用することも、しばらく前から公知である。非特許文献1に記載されているように、音の一部の非線形性とその他の非線形性とが同一の音響エネルギーを有している場合であっても、人間は、前者を知覚せず、後者を知覚する。特許文献1は、音声信号処理のためのプロセス及び装置、より正確には、ある特定の度合いまでの音声信号の歪みを含む様々な音声信号の歪みの度合いを許容する技法を開示している。特許文献2は、電気回路及び音声増強方法、特に信号振幅の増大と共に増大する予測可能かつ制御可能な高調波歪みを導入できる電気回路を開示している。特許文献3は、ラウドスピーカーの周波数応答を拡張し、ラウドスピーカーの非線形な歪みを低減又は排除することによる、デジタル音声信号処理のためのシステム及び方法を開示している。音声信号は、修正されたスピーカーの周波数応答に基づいて線形デジタルフィルタを適用することによって拡張できる。ラウドスピーカーの非線形な歪みは、ラウドスピーカーの逆パラメトリックモデルに基づく非線形デジタルフィルタによって、キャンセル又は低減することができる。
米国特許第5133015号 米国公開特許第2011255701号 米国公開特許第2015249889号
Jean Hiraga,"A Study of Amplifier Harmonic Distortion Spectrum Analysis",Amplifier Musicality
音声信号の品質及び/又は他の特性の増強を目的とした音声信号の処理に関する公知の伝統的なアプローチの大半は、人間の耳の非線形な音響心理学的特性を考慮していない。
本発明は、オーディオチェーンにおける音声信号処理方法及び装置に関し、上記方法及び装置は、人間の耳の非線形な音響心理学的特性をも考慮して、制御された方法で上記オーディオチェーンに非線形性を付加することによって、上記オーディオチェーン内の電気音響変換器の非線形性を補正し、これにより、一定の範囲の2次及び5次の多項式関数の近似を用いて、音を再生する際により良好な音響イメージ及び更なる細部を得る。
本発明によると、方法は:人間の耳の非線形な音響心理学的特性の5次多項式による近似;及び上記オーディオチェーン内の少なくとも1つの電気音響変換器の前への少なくとも1つの非線形要素の付加を含み、上記非線形要素は、上記オーディオチェーンへの非線形性の付加の機能を有し、これは、少なくとも1つの電気音響変換器の非線形性、及び/又はpΔまでの人間の耳による圧力変化に関する近似された人間の耳の音響心理学的特性の非線形性を補正する。
本発明による上記音声信号処理方法の実装のための上記オーディオチェーンは、人間の耳の非線形な音響心理学的特性をも考慮して、上記オーディオチェーン内の電気音響変換器の非線形性を補正するよう構成される。上記オーディオチェーンは、上記音声信号処理方法の実装のための少なくとも1つの装置を内包する。上記装置は、上記オーディオチェーンへの非線形性の付加の機能を有し、これは、少なくとも1つの電気音響変換器の非線形性、及び/又はpΔまでの人間の耳による圧力変化に関する近似された人間の耳の音響心理学的特性の非線形性を補正する。
本発明の方法、装置、及びオーディオチェーンは、人間の耳と共に伴うオーディオチェーン全体の非線形性を最終的に低減する非線形性を付加すること、即ちオーディオチェーンの特性が、圧力の変化
に対して人間の耳の非線形性の多項式近似を低減するように、上記オーディオチェーンに非線形性を付加することによって、電気音響変換器及び人間の耳の制約を低減する。
以下、図面を参照して、本発明を詳細に説明する。
図1aは、漸近線を伴う双曲線関数 の図である。
図1bは、図1aに示されている前記関数の振幅(amplitude)0.57をもった歪んだ正弦波信号の高調波スペクトルを示す。 図2aは、漸近線を伴う双曲線関数 の図である。
図2bは、図2aに示されている関数の振幅0.57をもった歪んだ正弦波信号の高調波スペクトルを示す。 図3aは、近似された人間の耳の音響心理学的特性 の図を示す。
図3bは、図3aに示されている関数の振幅2をもった歪んだ正弦波信号の高調波スペクトルを示す。 図4aは、逆近似された(inverse approximated)人間の耳の音響心理学的特性 の図を示す。
図4bは、図4aに示されている関数の振幅2をもった歪んだ正弦波信号の高調波スペクトルを示す。 図5aは、双曲線関数 による人間の耳の音響心理学的特性の逆近似の図を示す。
図5bは、図5aに示されている関数の振幅2をもった歪んだ正弦波信号の高調波スペクトルを示す。 図6aは、真空ダイオードを採用した、人間の耳の音響心理学的逆特性 ただし、a=5.31423、b=0.0366175
の近似図を示す。
図6bは、図6aに示されている関数の振幅2をもった歪んだ正弦波信号の高調波スペクトルを示す。 図7は、本発明による、音声信号に非線形性を付加する方法を実装するための装置の概略図である。 図8は、関数 の2乗非線形要素(non-linear square element)の導出の概略図である。
図9は、関数 の双曲線非線形要素(non-linear hyperbolic element)の導出の概略図である。
図10は、関数 の双曲線非線形要素の導出の概略図である。
図11は、本発明を実施するための好ましい方法によるオーディオチェーンの概略図である。 図12は、本発明の別の実施方法によるオーディオチェーンの概略図である。 図13は、2次及び双曲線の非線形性を用いた本発明による音声信号処理のための装置の実施形態のうちの1つを示す。 真空ダイオードを採用した非線形要素の実装を示す。
本発明の方法は、電気音響変換器の1つの非線形性と人間の耳の非線形性を考慮する。
本発明によると、人間の耳の非線形な音響心理学的特性をも考慮して、オーディオチェーンの電気音響変換器の非線形性を補正する、上記オーディオチェーンにおける音声信号処理方法は:人間の耳の音響心理学的特性の5次多項式関数による近似;及びオーディオチェーンの少なくとも1つの電気音響変換器の前への、少なくとも1つの非線形要素4の付加を含み、上記非線形要素4は、上記オーディオチェーンへ非線形性を付加する機能を有して、少なくとも1つの電気音響変換器の非線形性、及び/又はpΔまでの人間の耳による圧力変化に関する近似された人間の耳の音響心理学的特性の非線形性を補正する。本発明の方法によると、前記非線形要素4は、
ここで、xは、電気音響変換器の膜に対する相対的な膜エクスカーション(membrane excursion)又は相対的な力であり、a及びbは正の定数である、
の逆関数である2次非線形性(quadratic non-linearity)を適用することによって、電気音響変換器の非線形性を低減する。
本発明の一実施形態によると、前記非線形要素4が、人間の耳の音響心理学的特性の非線形性
ここで、定数
は、各定数に関して±30%の許容誤差内にあるままであり、xは人間の耳による相対圧力である、
を、項x、x、及びxによって導入される前記非線形性を少なくとも2倍低減する関数を適用することによって低減する。
本発明の他の実施形態によると、前記非線形要素4が、双曲線関数
ここで、xは、人間の耳による相対圧力である、
を適用することによって、人間の耳の音響心理学的特性の非線形性を低減する。
本発明の別の実施形態によると、前記非線形要素4が、関数x1.5(ここで、xは、人間の耳による相対圧力である)を適用することによって、人間の耳の音響心理学的特性の非線形性を低減する。
本発明によるオーディオチェーンの実施形態に従って、本発明の方法をさらに詳細に説明する。
電気音響変換器内の非線形性は:
として定義される断熱過程によって定義される。
前記電気音響変換器内の非線形性は、音質に影響を及ぼす。膜を動かすことで音を生成する電気音響変換器の場合、膜によって空気が断熱過程を経て圧力を変化させる。圧縮される空気の体積は不明である。しかし、空気圧の変化は測定可能である。より大きな体積の空気を圧縮するには、同一の圧力に関して膜のより大きなエクスカーションが必要となり、その逆も成り立つ。空気圧が断熱過程によって変化すると、圧力を増大させる方向の膜の同一のエクスカーションが、反対方向のエクスカーションよりも大きな圧力変化を生成する。本発明者らは、2つの理想的なケースを考える。両ケースにおいて、膜の質量は無視できる程度に小さく、また膜は剛性である。第1のケースでは、膜エクスカーションは線形であり、圧縮される空気の体積は、膜エクスカーションと共に線形に変化する。本発明者らは、空気の断熱過程を用いる。初期空気圧は大気圧である。空気の断熱方程式は:
である。
膜が動くと体積は変化し、これによって空気圧が断熱的に変化する:
膜による空気圧は:
ここで、Vは、本発明者らが圧縮する初期体積、VΔは、膜が動くことによって発生する体積変化である。VΔが負の符号を有するのは、膜が前方に動くと体積は減少するためである。初期条件は:
ここで、pは、大気圧、dは、相対的な膜エクスカーションである、
となる。その結果、
のように記述できる。
この関数を、前記相対的なエクスカーションdに従ってテイラー級数へと展開すると、最初の5つの項は:
ここで、pΔは、圧力変化である、
となり:
である。
前記圧力変化
に関して、相対的な膜エクスカーションは:
である。
これをテイラー級数に展開すると、2次項以降の項は無視できる:
標準ラウドネス(normal loudness)での最大の非線形性は、圧力変化
の2次関数である。
第2のケースでは、電気音響変換器の膜に対する力及び、膜エクスカーションと共に線形に変化する空気体積が存在する。計算をより簡単にするために、理想気体に関して定義された等温過程:
を使用する。
膜に対する力は、膜の両側に対する力の合計である。我々は膜の片側のみから音を聞くため、その側に対する圧力を監視することになる。膜表面に関する力は:
ここで、pは、我々の方を向いた膜の側に対する圧力、pは、膜の反対側に対する圧力、Aは膜の表面(これは定数)である。圧力p、pは:
ここで、Vは、本発明者らが圧縮する初期体積、VΔは、膜を動かすことによって発生する体積変化である。初期条件は、
ここで、pは、大気圧、dは、聴取の方向における相対的な膜エクスカーションである。p、pに関して、以下の式:
が得られる。
膜に対する力は:
である。
相対的な力を
であると仮定すると:それは
となり、そして相対的な膜エクスカーションは:
となる。
聴取側に対する圧力は、
であり、従って:
となる。
相対的な力Fについてテイラー級数に展開することにより、膜の、我々の方を向いた側に対する圧力:
が得られ、ここで膜のこの側に対する圧力pは:
として明らかになり、そして聴取側における圧力変化pΔは:
である。
圧力変化が
の場合、相対的な膜エクスカーションは:
である。
このように小さな相対的な力に関しては、テイラー級数の比較的大きな項の影響を無視できる:
標準ラウドネスでの最大の非線形性は、圧力変化
の2次関数である。
いずれのケースにおいても、膜に対する空気圧変化を、2次関数
ここで、xは、第1のケースにおける相対的な膜エクスカーション又は第2のケースにおける膜に対する相対的な圧力である、
によって近似できる。人間の耳による±1Paの標準ラウドネスを考えると、圧力変化は距離と共に小さくなるため、膜に対する圧力はより大きい。電気音響変換器の膜の表面が小さくなるほど、他のパラメータが同一であれば、同一の距離における同一のラウドネスによる上記膜に対する圧力は大きくなる。電気音響変換器から2メートルにおいて、圧力差が±1Paであり、そして電気音響変換器が1.27πcmの表面と音の反射のない全方向に理想的な分散を有すると仮定すると、膜における音響パワー(acoustic power)は、膜から一定の距離にある球面におけるパワーに等しい。2メートルの距離にある球によると、これは4・2πmであり、160000πcmとなる。音のパワーは:
ここで、Pは、パワー、Iは、強度、Aは表面積である、
となる。強度Iが圧力変化の2乗に比例する、即ち
である場合、
と記述でき、これは、聴取の方向における膜に対する圧力が:
であることを意味している。
膜に対する圧力が増大するにつれて、電気音響変換器は、非線形領域で動作し、これは我々に聞こえる音の品質に影響を与える。計算されたラウドネス
に関して、
である。
また、2次成分bxの線形成分axに対する比は:
である。
第1のケースでは、a=1.4、b=1.68、pΔ=314.96Paであり、2次成分は線形成分の0.27%であり、これは無視できない。第2のケースでは、a=1/2、b=1/4、pΔ=314.96Paであり、2次成分は線形成分の0.31%であり、これもまた無視できない。前記チェーン内の電気音響変換器の2次非線形性をその前に低減するために、前記オーディオチェーンの非線形性を補正する非線形要素をその背後に組み込む:
ここで、a及びbは、正の定数である。電気音響変換器の非線形性を補正するための最も簡単な方法は、逆関数
を近似する非線形要素を用いることによるものであり、これは:
である。
テイラー級数へと展開すると、
が得られる。
テイラー級数の最初の2項を取って:
とする。残りの項の影響は、xが極めて小さい場合に無視できるため、残りの項を無視する。非線形要素及びその後のオーディオチェーンの特性を得るために、
において、xを
に置換して
を得る。ここで、xが極めて小さい場合、
である。このようにして、人間の耳による圧力変化が
までである標準ラウドネスにおけるオーディオチェーンの聴取によるケースである低値xによって、歪みを削減した。電気音響変換器の膜の表面が小さいほど、同一のラウドネスに関して、同一の距離にある膜に対して存在することになる圧力が大きくなる。これにより、電気音響変換器の断熱歪みが増大する。音の有意な強化を感じるためには、非線形要素を調整して電気音響変換器の2次非線形性を少なくとも3倍低減することで十分である。
SET(Single Ended Triode:シングルエンド三極真空管)真空管アンプは、定格出力において1%を超える非線形性を有することが知られており、これは人間の耳では聴取できない。Jean Hiragaは、Amplifier Musicality - A Study of Amplifier Harmonic Distortion Spectrum Analysisという、多くの注目と批評とを集めた論説を執筆しており、ここで彼は、様々なアンプの非線形性の高調波構造を記述し、その音を主観的に評価している。SET真空管アンプの非線形性が聞こえないことに加えて、SET真空管アンプの非線形性は、音の細部を上書きしてしまい、我々にはもはや聞こえなくしてしまう。人間の耳が同様の非線形性を有し、我々がそれを聞き取れないとすると、この非線形性がオーディオチェーンの一部に存在したとしても我々はそれを聞き取れないことになる。周波数fの正弦波と、fの2、3、4、5、6倍大きな周波数f、f、f、f、fが加えられた同じ正弦波とは、振幅がfについて0db、fについて-40db、fについて-50db、fについて-60db、fについて-70db、fについて-80dbである場合に、人間の耳には同じに聞こえる(図2b)ことが知られている。双曲線関数
(図1a)は、一定値に関して各成分が1つ前のものよりも小さいという高調波歪み構造(図1b)を有する非線形性を有する。人間の耳の高調波構造が著しく乱されると、我々はそれを音の変化として聞き取る。本発明者らは、人間の耳の音響心理学的特性を5次多項式関数:
によって近似する。ここでa、b、c及びdは正の実数であり、xは人間の耳による相対的な圧力である。a、b、c及びdを決定するために、我々に聞こえる人間の耳の高調波構造の歪みに到達するまで、音声信号に非線形性を付加する。係数aを決定するためには、非線形性
を使用し、これは、項xを除去して人間の耳の高調波構造を乱した場合に、人間の耳の特性の近似によって
をもたらす。係数bを決定するためは、非線形性
を使用し、これは、項xを除去して人間の耳の高調波構造を乱した場合に、人間の耳の特性の近似によって
をもたらす。係数cを決定するためは、非線形性
を使用し、これは、項xを除去して人間の耳の高調波構造を乱した場合に、人間の耳の特性の近似によって
をもたらす。係数dを決定するためは、非線形性
を使用し、これは、項xを除去して人間の耳の高調波構造を乱した場合に、人間の耳の特性の近似によって
をもたらす。聴覚試験によって、各項に関して公差±30%以内で、項
が得られた。人間の耳の音響心理学的特性の近似された関数は:
である。
ラグランジュ・バーマンの式を適用することによって、人間の耳の近似の、以下の逆関数が得られる:
人間の耳の音響心理学的特性の近似された関数のxの項の係数は極めて小さいため無視でき、より大きな項についても同様である。十分な細部を聞き取るためには、近似された人間の耳の音響心理学的特性のx、x、及びxの項によって導入される非線形性を少なくとも2倍低減する必要がある。人間の耳の音響心理学的特性の近似の逆関数は、双曲線
ここで、a=0.00372、b=0.06061、c=0.002484、及びd=0.01313、
を用いて導出できる(図5a)。上記双曲線を用いた人間の耳の音響心理学的特性の近似の逆関数は:
であり、テイラー級数へと展開することで、最初の5つの項:
が得られる。
人間の耳の非線形性がどのように低下するかを確認するために、近似された人間の耳の音響心理学的特性
において、xを
で置換して、最初の5つの項:
を得る。
であるため、近似された人間の耳の音響心理学的特性のx、x、及びxの項によって導入される非線形性は、少なくとも2倍低減された。
本発明によると、本方法の実装のための装置は、オーディオチェーン内に少なくとも1つの非線形要素4を備え、これは、少なくとも1つの電気音響変換器の非線形性、及び/又はpΔまでの人間の耳による圧力変化に関する近似された人間の耳の音響心理学的特性の非線形性を補正する非線形性をオーディオチェーンに付加する機能を有する。
図7は、本発明による、音声信号に非線形性を付加する一般的な方法を実装するための装置19の概略図を示す。入力音声信号1は、前記音声信号1の分離されていない部分と少なくとも1つの分離された音声信号1とにルーティングされ、上記分離された音声信号1は、非線形要素4を用いて少なくとも1つの分離された非線形音声信号7へと処理され、そして加算器8において、音声信号1の分離されていない部分が、少なくとも1つの分離された非線形音声信号7と結合/マージされて処理済み出力音声信号9となる。非線形性を生成する分岐は、非線形要素4の前の任意のフィルタ、非線形要素4の前の任意のアンプ/アッテネータ3、非線形要素4、非線形要素4の後の任意のアンプ/アッテネータ5、及び非線形要素4の後の任意のフィルタ6を含む。非線形要素4は、2次関数-x、又は双曲線関数
を有することになる。
図7に示されている装置19を用いて実行される、オーディオチェーンにおける音声信号処理のための方法であって、人間の耳の非線形な音響心理学的特性をも考慮して、上記オーディオチェーン内の電気音響変換器の非線形性を補正する、方法は、以下のステップ:入力音声信号1を、上記音声信号1の分離されていない部分と、少なくとも1つの分離された音声信号1とに分割するステップ;非線形要素4において、非線形性を付加することによって少なくとも1つの分離された音声信号1を改変するステップ;非線形要素4の前のアンプ/アッテネータ3において、少なくとも1つの分離された音声信号を任意に増幅/減衰させ、非線形要素4の後のアンプ/アッテネータ5において、少なくとも1つの分離された音声信号を任意に増幅/減衰させ、非線形要素4の前のフィルタ2において、少なくとも1つの分離された音声信号を任意にフィルタリングし、非線形要素4の後のフィルタ6において、少なくとも1つの分離された音声信号を任意にフィルタリングして、少なくとも1つの分離された非線形音声信号7を得るステップ;及び音声信号1の分離されていない部分と少なくとも1つの分離された非線形音声信号7とを、加算器8において結合して出力音声信号9とするステップを含む。
図8は、2乗非線形要素4の一実施形態の概略図である。この非線形要素4の前には正の値aを有するアンプ/アッテネータ3が存在し、非線形要素4は2次関数-xを有し、また非線形要素4の後には正の値bを有するアンプ/アッテネータ5が存在する。前記2次非線形要素4は、信号乗算器10から導出され、これはアンプ/アッテネータ3の後の出力信号をそれ自体と乗算し、信号インバータ11においてその符号を変更する。図8の回路全体としての変換関数は、
である。値a及びbを調整することによって、どの程度の2次非線形性を信号の線形部分に付加するかを制御できる。
図9は、双曲線非線形要素4の実施形態の概略図である。この非線形要素4の前のアンプ/アッテネータ3は正の値aを有し、非線形要素4は双曲線関数
を有し、非線形要素4の後のアンプ/アッテネータ5は正の値bを有する。双曲線非線形要素4は、信号インバータ11、定数の値1のソース12、信号加算器13、信号スケーラ14、及び信号乗算器10から導出される。信号加算器13において、出力は1-xであり、この信号は更に信号スケーラ14に入り、これは信号をx÷(1-x)によって分割し、これに信号乗算器10がxを乗算して、
が得られる。図9の回路全体としての変換関数は、
である。
値a及びbを調整することによって、c及びdが任意の正の値であるいずれの関数
を得ることができる。
図10は、双曲線非線形要素4の導出の概略図であり、アンプ/アッテネータ3は非線形要素4の前にあり、正の値aを有し、非線形要素4は双曲線関数
を有し、非線形要素4の後のアンプ/アッテネータ5は正の値bを有する。双曲線非線形要素4は、定数の値1のソース12、信号加算器13、信号スケーラ14、信号乗算器10、及び信号インバータ11から導出される。信号加算器13において、出力は
であり、信号は更に信号スケーラ14に入り、これは信号をx÷(1-x)によって分割し、これに信号乗算器10がxを乗算して、
が得られる。図10の回路全体としての変換関数は、
である。
値a及びbを調整することによって、c及びdが任意の正の値であるいずれの関数
を得ることができる。
図11は、少なくとも1つの装置19を備える好ましいオーディオチェーンの実施形態、及び上記オーディオチェーンにおける音声信号処理のための方法を示す。オーディオチェーンは、双曲線非線形性を用いた音声信号処理のための第1の装置19に接続された入力音声信号15のプリアンプ16、第1の装置19に(第1の装置19の後に)接続された音声クロスオーバー18を備え、この音声クロスオーバー18は、第2の装置19において、処理済みの音声信号を周波数範囲によって2つの信号分岐に分割する。2次非線形性を用いた音声信号処理のための少なくとも2つの第2の装置19が、音声クロスオーバー18に(音声クロスオーバーの後に)接続され、上記2つの第2の装置19それぞれに、パワーアンプ20と、各パワーアンプ20に接続された2つの電気音響変換器21とが接続される。元の入力音声信号15は、ラウドネスを制御するプリアンプ16に入る。プリアンプ16からの信号は、双曲線非線形性を用いた音声信号処理のための第1の装置19へと向かう。第1の装置19からの処理済みの信号は、この信号を周波数範囲によってより多くの分岐へと分割する、音声クロスオーバー18へと向かう。音声クロスオーバー18の後、各分岐からの信号は、2次非線形性を用いた音声信号処理のための、関連する第2の装置19へと向かう。関連する第2の装置19それぞれからの処理済みの信号は、関連するパワーアンプ20へと向かい、このパワーアンプ20は、増幅された信号を、関連する電気音響変換器21へとルーティングする。2次非線形性を用いた信号処理のための第2の装置19はそれぞれ、必要な非線形性の量に影響を及ぼすパワーアンプ20の増幅率を考慮して、電気音響変換器21の2次非線形性を少なくとも3倍低減するように構成される。増幅率が高いほど、関連する第2の装置19において必要な2次非線形性が大きくなる。双曲線非線形性を用いた信号処理のための第1の装置19は、パワーアンプ20の増幅率、電気音響変換器21の効率、及び電気音響変換器からの人間の耳の距離を考慮して、pΔ=±1Paの圧力変化の範囲内における人間の耳の音響心理学的特性の非線形性を、少なくとも2倍低減するように構成される。増幅率が高いほど、及び/又は電気音響変換器の効率が高いほど、及び/又は電気音響変換器からの人間の耳の距離が小さいほど、第1の信号処理装置19において必要な双曲線非線形性も大きくなる。
装置19を用いて実施される、図11に示されているオーディオチェーンにおける音声信号処理方法(この方法は、人間の耳の非線形な音響心理学的特性も考慮して、オーディオチェーン内の電気音響変換器の非線形性を補正する)は、以下のステップ:調整可能なプリアンプ16において、入力信号15を増幅/減衰させるステップ;双曲線非線形性の適用によって、第1の装置19において音声信号処理を行うステップ;音声クロスオーバー18において、音声信号を周波数範囲によって2つの分岐に分割するステップ;2次非線形性の適用によって、第2の装置19において各分岐の分割された音声信号を処理するステップ;パワーアンプ20において、各分岐の分割された音声信号のパワーを増幅するステップ;及び各分岐の音声信号を、関連する電気音響変換器21へとルーティングするステップを含む。
オーディオチェーン内の装置19及び上記方法の他の実施形態が図12に示されている。入力音声信号15は、ラウドネスを制御するプリアンプ16に入る。プリアンプ16からの信号は、2次及び双曲線非線形性を用いた音声信号処理のための第1の装置19へと流れる。第1の装置19からの処理済みの信号はパワーアンプ20へと流れ、このパワーアンプ20は増幅された信号を音声クロスオーバー18に送達し、この音声クロスオーバー18は、この信号を周波数範囲によってより多くの分岐へと分割する。音声クロスオーバー18の後、各分岐からの信号は、対応する電気音響変換器21へと流れる。2次及び双曲線非線形性を用いた信号処理装置19は、必要な2次非線形性の量に影響を及ぼすパワーアンプ20の増幅率を考慮して、電気音響変換器21の2次非線形性を少なくとも3倍低減するように構成される。また、装置19は、パワーアンプ20の増幅率、電気音響変換器21の効率、及び電気音響変換器からの人間の耳の距離を考慮して、pΔ=±1Paの圧力変化の範囲内における人間の耳の音響心理学的特性の非線形性を少なくとも2倍低減するように構成される。増幅率が高いほど、及び/又は電気音響変換器の効率が高いほど、及び/又は電気音響変換器からの人間の耳の距離が小さいほど、装置19において必要な双曲線非線形性も大きくなる。装置19が、異なる2次非線形性を有する、異なる周波数範囲で動作する複数の電気音響変換器に関して、2次非線形性を低減する際、上記装置は、非線形性要素4の前にフィルタ2を、及び/又は非線形性要素4の後にフィルタ6を適用し、これにより上記装置は、異なる複数の周波数範囲に関して2次非線形性を調整する。装置19は、2次及び双曲線非線形性を、これらを加算器8内の入力音声信号1に同時に付加することによって使用するよう設計されるか、又は直列接続で接続された複数の装置19のチェーンとして作製される。
装置19を用いて実施される、図12に示されているオーディオチェーンにおける音声信号処理方法(この方法は、人間の耳の非線形な音響心理学的特性も考慮して、オーディオチェーン内の電気音響変換器の非線形性を補正する)は、以下のステップ:調整可能なプリアンプ16において、入力信号15を増幅/減衰させるステップ;2次及び双曲線非線形性を用いて、第1の装置19において音声信号処理を行うステップ;パワーアンプ20において音声信号を増幅するステップ;音声クロスオーバー18において、音声信号を周波数範囲によって2つの分岐に分割するステップ;並びに各分岐の信号を、関連する電気音響変換器21へとルーティングするステップを含む。
本発明の方法によると、装置19は、近似された人間の耳の音響心理学的特性の非線形性を2倍、及び/又は電気音響変換器の2次非線形性を3倍、及び人間の耳による圧力変化をpΔ=±1Paまで低減する。
本発明の方法によると、更に、音声信号をアナログフォーマット又はデジタルフォーマットで処理できる。
本発明はまた、コンピュータデバイス上で実行された場合に、プロセッサ上で動作して、本発明による方法のステップを実施する、コンピュータプログラムにも関する。
図13は、非線形要素として、2次特性を得るためのアナログ乗算器24、及び双曲線特性を得るためのアナログ乗算器/スケーラ25を用いる、装置19の実施形態を示す。入力音声信号1は、反転入力ステージ23に到達し、その後この信号は、非線形要素4を有する異なる複数の分岐へと流れる。第1の分岐は、調整可能な1次ハイパスRCフィルタとして構成された入力フィルタ2;オペアンプ、抵抗器、及びポテンショメータを用いて構成された、調整可能なアンプ/アッテネータ3;並びにアナログ乗算器24として作製された非線形要素4を有する。第2及び第3の信号処理分岐は、オペアンプ、抵抗器、及びポテンショメータを用いて構成された、調整可能なアンプ/アッテネータ3;並びに特性
を有するアナログ乗算器/スケーラ25を用いて作製される単一の非線形要素4によって実装される。信号7の非線形部分の3つの分岐の出力は、抵抗器ネットワークからなる加算器8に入り、この加算器8は、非線形出力電圧信号7、及び入力ステージ23の後の音声信号を、電流の和へと変換し、これは出力音声信号9を構成し、出力反転ステージ26がこれらの出力音声信号9を出力電圧9aに変換する。
人間の耳の音響心理学的特性の逆関数は、他の関数によっても近似でき、非線形要素4の導出は、ダイオード、トランジスタ及び真空管といった電子素子の非線形性を適用することによって実施できる。図6aは、真空ダイオードの電流/電圧特性
に対応する非線形性x1.5による、人間の耳の逆関数の非線形性の近似
を示す。図6aの近似は、
ただし、a=5.31423、b=0.0366175、
によって特性決定され(実線)、テイラー級数へと展開すると、最初の5つの項:
が得られる。
人間の耳の非線形性がどのように低下するかを観察するために、人間の耳の音響心理学的特性の近似
において、xを
で置換して、最初の5つの項:
を得る。
及び
であるため、近似された人間の耳の音響心理学的特性のx、x、及びxの項によって導入される非線形性が少なくとも2倍低減された。
図14に真空ダイオードの適用による非線形要素4の実装が示されている。入力信号は、定電圧-Vaに接続された抵抗器ネットワークへと流れ、これはDC成分を入力信号に付加し、そしてこの入力信号は、オペアンプによって作製された電圧フォロワへと流れる。電圧フォロワの後、上記信号は、電流/電圧特性
を有する真空ダイオード27へと流れる。反転増幅器28と、反転増幅器28の出力電圧を、真空ダイオード27の電流と合計される電流に変換する抵抗器29とを適用することによって、線形成分を除去した。定電圧+Vb及び抵抗器30を適用することによって、DC成分を除去した。真空ダイオード27、抵抗器29、及び抵抗器30の電流の合計は、反転増幅器31において出力電圧へと変換される。回路全体の伝送特性は、
ここで、a、b、c、及びdは、正の値である。
オーディオチェーンにおける音声信号処理方法及び装置は、電気音響変換器の、及び人間の耳の、望ましくない非線形性を低減するために使用される。上記装置は、様々な電気音響変換器及び人間の耳に対して調整できるため、上記装置はオーディオ産業において幅広く使用される。

Claims (12)

  1. 人間の耳の非線形な音響心理学的特性を考慮して、オーディオチェーン内の電気音響変換器の非線形性を補正する、前記オーディオチェーンにおける音声信号処理方法であって、
    ‐少なくとも1つの非線形要素(4)を、前記オーディオチェーン内の少なくとも1つの前記電気音響変換器の前に付加するステップであって、
    各非線形要素(4)は、前記オーディオチェーンに非線形性を付加して、前記少なくとも1つの前記電気音響変換器の振幅の非線形性を補正し、そしてpΔまでの圧力変化に関する人間の耳の非線形性の多項式近似を予備補償(pre-compensate)し、前記電気音響変換器の非線形性の補正は、
    ここで、xは、前記電気音響変換器の膜に対する相対的な膜エクスカーション又は相対的な力であり、a及びbは正の定数である、
    の逆関数である2次非線形性関数を適用することによって実施される、前記ステップを含む前記方法において、
    前記非線形要素(4)は、5次多項式関数
    ここで、a、b、c、及びdは、各項に関して許容誤差±30%以内での人間の耳の上記特性の近似によって決定される正の実数であり、xは人間の耳による相対圧力である、
    として表現される前記人間の耳の非線形な音響心理学的特性を、項x、x、及びxによって導入される前記非線形性を少なくとも2倍予備補償する前記5次多項式関数に対する逆関数を適用することによって補正することを特徴とする、前記方法。
  2. 前記非線形要素(4)は、前記逆関数を表現するために双曲線関数
    ここで、xは、人間の耳による相対圧力である、
    を用いることによって、前記人間の耳の音響心理学的特性の非線形性を予備補償する、請求項1に記載の方法。
  3. 前記非線形要素(4)は、前記逆関数を表現するために関数x1.5〔ここで、xは、人間の耳による相対圧力である〕を用いることによって、前記人間の耳の音響心理学的特性の非線形性を予備補償する、請求項1に記載の方法。
  4. 前記非線形要素(4)は、前記逆関数を表現するためにラグランジュ・バーマンの式を用いることによって、前記人間の耳の音響心理学的特性の非線形性を予備補償し、ここでxは人間の耳による相対圧力である、請求項1に記載の方法。
  5. 決定される項は
    である、請求項1に記載の方法。
  6. 前記方法は、以下のステップ:
    (a)入力音声信号(1)を、前記入力音声信号(1)の分離されていない部分と、少なくとも1つの分離された音声信号(1)とにルーティングするステップ;
    (b)前記非線形要素(4)において、非線形性を付加することによって、前記少なくとも1つの分離された音声信号(1)を修正するステップ;
    (c)前記非線形要素(4)の前のアンプ/アッテネータ(3)において、前記少なくとも1つの分離された音声信号を増幅/減衰させ、
    前記非線形要素(4)の後のアンプ/アッテネータ(5)において、前記少なくとも1つの分離された音声信号を増幅/減衰させ、
    前記非線形要素(4)の前のフィルタ(2)において、前記少なくとも1つの分離された音声信号をフィルタリングし、
    前記非線形要素(4)の後のフィルタ(6)において、前記少なくとも1つの分離された音声信号をフィルタリングして、少なくとも1つの分離された非線形音声信号(7)を得るステップ;及び
    (d)前記音声信号(1)の前記分離されていない部分と、前記少なくとも1つの分離された非線形音声信号(7)とを、加算器(8)において結合して、出力音声信号(9)とするステップ
    を含む、請求項1~5のいずれか1項に記載の方法。
  7. 前記方法は、以下のステップ:
    (a)調整可能なプリアンプ(16)において、入力信号(15)を増幅/減衰させるステップ;
    (b)第1の装置(19)において、双曲線非線形性を適用することによって、音声信号を処理するステップ;
    (c)音声クロスオーバー(18)において、周波数範囲によって前記音声信号を2つの分岐に分割するステップ;
    (d)少なくとも1つの第2の装置(19)において、2次非線形性を適用することによって、各前記分岐の、分割された前記音声信号を、処理するステップ;
    (e)パワーアンプ(20)において、各前記分岐の、分割された前記音声信号のパワーを増幅するステップ;及び
    (f)各前記分岐の前記音声信号を、関連する電気音響変換器(21)へとルーティングするステップ
    を含む、請求項1~5のいずれか1項に記載の方法。
  8. 前記方法は、以下のステップ:
    (a)前記調整可能なプリアンプ(16)において、前記入力信号(15)を増幅/減衰させるステップ;
    (b)前記第1の装置(19)において、2次及び双曲線非線形性を適用することによって、音声信号を処理するステップ;
    (c)前記パワーアンプ(20)において、前記音声信号のパワーを増幅するステップ;
    (d)前記音声クロスオーバー(18)において、周波数範囲によって前記音声信号を2つの分岐に分割するステップ;並びに
    (e)各前記分岐の前記音声信号を、前記関連する電気音響変換器(21)へとルーティングするステップ
    を含む、請求項1~5のいずれか1項に記載の方法。
  9. 前記装置(19)は、近似された前記人間の耳の音響心理学的特性の非線形性を少なくとも2倍予備補償する、請求項7又は8に記載の方法。
  10. 前記装置(19)は、前記電気音響変換器の2次非線形性を少なくとも3倍予備補償する、請求項7~9のいずれか1項に記載の方法。
  11. 人間の耳による前記圧力変化は、
    までである、請求項1~10のいずれか1項に記載の方法。
  12. コンピュータデバイス上で実行された場合に、プロセッサ上で動作して、請求項1~11のいずれか1項に記載の方法のステップを実施するよう適合されたコンピュータプログラム。
JP2021545971A 2019-02-13 2019-10-22 音声信号処理方法及びデバイス Active JP7348951B2 (ja)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
HRP20190292A 2019-02-13
HRP20190292AA HRP20190292A2 (hr) 2019-02-13 2019-02-13 Metoda i uređaj za obradu audio signala
HRP20191903AA HRPK20191903B3 (hr) 2019-02-13 2019-10-21 Metoda i uređaj za obradu audio signala
HRP20191903A 2019-10-21
PCT/HR2019/000027 WO2020165616A1 (en) 2019-02-13 2019-10-22 Audio signal processing method and device

Publications (2)

Publication Number Publication Date
JP2022522408A JP2022522408A (ja) 2022-04-19
JP7348951B2 true JP7348951B2 (ja) 2023-09-21

Family

ID=69024425

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2021545971A Active JP7348951B2 (ja) 2019-02-13 2019-10-22 音声信号処理方法及びデバイス

Country Status (5)

Country Link
US (1) US11856385B2 (ja)
JP (1) JP7348951B2 (ja)
DK (1) DK3925233T3 (ja)
HR (1) HRP20230332T1 (ja)
WO (1) WO2020165616A1 (ja)

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008504721A (ja) 2004-06-04 2008-02-14 株式会社エヌ・ティ・ティ・ドコモ スピーカをイコライズする方法及び装置

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
IT1287089B1 (it) * 1996-11-07 1998-08-04 Curti Roberto Delle Dispositivo di equalizzazione/filtraggio per la correzione della linearita' di risposta dei sistemi di riproduzione e/o amplificazione
US7826625B2 (en) * 2004-12-21 2010-11-02 Ntt Docomo, Inc. Method and apparatus for frame-based loudspeaker equalization
JP5270006B2 (ja) * 2008-12-24 2013-08-21 ドルビー ラボラトリーズ ライセンシング コーポレイション 周波数領域におけるオーディオ信号ラウドネス決定と修正
CN108989950B (zh) * 2012-05-29 2023-07-25 创新科技有限公司 自适应低音处理系统
WO2015124598A1 (en) * 2014-02-18 2015-08-27 Dolby International Ab Device and method for tuning a frequency-dependent attenuation stage
US11012786B2 (en) * 2016-10-17 2021-05-18 Knowles Electronics, Llc Armature-based acoustic receiver having improved output and method

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008504721A (ja) 2004-06-04 2008-02-14 株式会社エヌ・ティ・ティ・ドコモ スピーカをイコライズする方法及び装置

Also Published As

Publication number Publication date
WO2020165616A1 (en) 2020-08-20
JP2022522408A (ja) 2022-04-19
US20220141610A1 (en) 2022-05-05
US11856385B2 (en) 2023-12-26
HRP20230332T1 (hr) 2023-05-26
DK3925233T3 (da) 2023-05-01

Similar Documents

Publication Publication Date Title
KR100622078B1 (ko) 초지향성 스피커 시스템 및 신호처리 방법
US20150249889A1 (en) Digital signal processor for audio extensions and correction of nonlinear distortions in loudspeakers
CN107231590B (zh) 用于调谐扬声器的失真响应的技术
KR101981575B1 (ko) 초지향성 초음파 스피커 장치의 음질개선 방법 및 이를 구비한 초음파 스피커 장치
US20130148822A1 (en) Correcting Non-Linear Loudspeaker Response
TWI657435B (zh) 音訊處理裝置及方法
EP3603106B1 (en) Dynamically extending loudspeaker capabilities
JP7348951B2 (ja) 音声信号処理方法及びデバイス
US10708690B2 (en) Method of an audio signal correction
JP2005318521A (ja) 増幅装置
JP2007201624A (ja) 超指向性スピーカ用変調器
RU2778274C1 (ru) Способ обработки аудиосигнала
EP3925233B1 (en) Audio signal processing method and device
WO2017183405A1 (ja) 音響処理装置および音響処理方法
Kates A time-domain digital simulation of heating aid response.
KR101882140B1 (ko) 초지향성 및 무지향성 동시 신호출력이 가능한 복합스피커시스템
RU2819779C1 (ru) Усиление низких частот для громкоговорителей
US9264811B1 (en) EQ correction for source device impedance and output device impedance interactions
CN115428475A (zh) 音频信号特性的转换方法及关联装置
KR101128353B1 (ko) 블록단위 신호검출에 기반의 고효율 고지향성 스피커 시스템 및 신호처리 방법
JP2004328236A (ja) 変換器処理装置
MASSARANI Transfer-Function Measurement with Sweeps

Legal Events

Date Code Title Description
A529 Written submission of copy of amendment under article 34 pct

Free format text: JAPANESE INTERMEDIATE CODE: A529

Effective date: 20210927

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20220714

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20230712

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20230904

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20230908

R150 Certificate of patent or registration of utility model

Ref document number: 7348951

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150