JPS63259696A - 音声予処理方法および装置 - Google Patents
音声予処理方法および装置Info
- Publication number
- JPS63259696A JPS63259696A JP63076652A JP7665288A JPS63259696A JP S63259696 A JPS63259696 A JP S63259696A JP 63076652 A JP63076652 A JP 63076652A JP 7665288 A JP7665288 A JP 7665288A JP S63259696 A JPS63259696 A JP S63259696A
- Authority
- JP
- Japan
- Prior art keywords
- phase
- frame
- phase dispersion
- amplitude
- waveform
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims description 25
- 238000007781 pre-processing Methods 0.000 title description 8
- 239000006185 dispersion Substances 0.000 claims description 32
- 238000011156 evaluation Methods 0.000 claims description 21
- 230000005284 excitation Effects 0.000 claims description 16
- 238000012545 processing Methods 0.000 claims description 12
- 230000006835 compression Effects 0.000 claims description 11
- 238000007906 compression Methods 0.000 claims description 11
- 238000004458 analytical method Methods 0.000 claims description 8
- 238000004364 calculation method Methods 0.000 claims description 8
- 238000000605 extraction Methods 0.000 claims description 6
- 238000005070 sampling Methods 0.000 claims description 3
- 230000008859 change Effects 0.000 claims description 2
- 239000002131 composite material Substances 0.000 claims description 2
- 238000003672 processing method Methods 0.000 claims 7
- 238000009499 grossing Methods 0.000 claims 2
- 230000003595 spectral effect Effects 0.000 description 8
- 208000019300 CLIPPERS Diseases 0.000 description 5
- 208000021930 chronic lymphocytic inflammation with pontine perivascular enhancement responsive to steroids Diseases 0.000 description 5
- 230000000875 corresponding effect Effects 0.000 description 5
- 238000010586 diagram Methods 0.000 description 5
- 230000004044 response Effects 0.000 description 5
- 230000003044 adaptive effect Effects 0.000 description 4
- 230000005540 biological transmission Effects 0.000 description 4
- 238000005259 measurement Methods 0.000 description 4
- 230000001755 vocal effect Effects 0.000 description 4
- 238000001514 detection method Methods 0.000 description 3
- 238000001228 spectrum Methods 0.000 description 3
- 230000001629 suppression Effects 0.000 description 3
- 238000005516 engineering process Methods 0.000 description 2
- 238000007493 shaping process Methods 0.000 description 2
- 230000005236 sound signal Effects 0.000 description 2
- 238000012935 Averaging Methods 0.000 description 1
- 238000007792 addition Methods 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 230000008901 benefit Effects 0.000 description 1
- 238000005266 casting Methods 0.000 description 1
- 230000015556 catabolic process Effects 0.000 description 1
- 150000001768 cations Chemical class 0.000 description 1
- 239000003795 chemical substances by application Substances 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 230000002596 correlated effect Effects 0.000 description 1
- 238000006731 degradation reaction Methods 0.000 description 1
- 238000012217 deletion Methods 0.000 description 1
- 230000037430 deletion Effects 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 230000010354 integration Effects 0.000 description 1
- 230000008569 process Effects 0.000 description 1
- 230000035945 sensitivity Effects 0.000 description 1
- 238000001308 synthesis method Methods 0.000 description 1
- 238000003786 synthesis reaction Methods 0.000 description 1
- 239000002966 varnish Substances 0.000 description 1
- 210000001260 vocal cord Anatomy 0.000 description 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
Abstract
(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。
め要約のデータは記録されません。
Description
【発明の詳細な説明】
[産業上の利用分野]
本発明は、スピーチ伝送に関し、特定すると放送または
その他の伝送前に音声信号を予め処理するための方法お
よび装置に関する。
その他の伝送前に音声信号を予め処理するための方法お
よび装置に関する。
[発明が解決しようとする問題点]
自然または人工的に作られた擾乱により生ずるスピーチ
劣化の問題は、AMラジオ放送および地対空通信におい
て共通に生ずる問題である。これらの応用においては、
送信機により、あるいは受信機の感度特性や周囲雑音レ
ベルからのダイナミックレンジ抑制結果により、ピーク
パワに制限が課されることがしばしばある。これらの抑
制の下では、音声信号は了解度を増すために予め処理さ
れる。ダイナミックレンジ圧縮や、プレエンファシスや
、クリッピングのような技術は、スペクトルエンベロー
プの重要な特徴を保存しようとしながら音量を増すため
に波形のピークファクタを減するのに応用されたが、そ
の成功ははかばかしくなかった。この種の技術の詳細な
記述として、べルギー所在のTechnical Ce
nter of the EuropeanBroad
casting Union発行のf Modulat
ion−Process Techniques
Center for 5ound Broad
−casHngJ、 Tech、 3243−E、があ
るのでそれを参照されたい。
劣化の問題は、AMラジオ放送および地対空通信におい
て共通に生ずる問題である。これらの応用においては、
送信機により、あるいは受信機の感度特性や周囲雑音レ
ベルからのダイナミックレンジ抑制結果により、ピーク
パワに制限が課されることがしばしばある。これらの抑
制の下では、音声信号は了解度を増すために予め処理さ
れる。ダイナミックレンジ圧縮や、プレエンファシスや
、クリッピングのような技術は、スペクトルエンベロー
プの重要な特徴を保存しようとしながら音量を増すため
に波形のピークファクタを減するのに応用されたが、そ
の成功ははかばかしくなかった。この種の技術の詳細な
記述として、べルギー所在のTechnical Ce
nter of the EuropeanBroad
casting Union発行のf Modulat
ion−Process Techniques
Center for 5ound Broad
−casHngJ、 Tech、 3243−E、があ
るのでそれを参照されたい。
スピーチ伝送に対しては、特にスペクトルの大きさが特
定され、目的とするところがピークパワ限界を満足させ
る平坦化された時間領域エンベロープを得ることである
場合、良好な予処理技術の必要性が存在する。特に、自
動利得制御や(多帯域)ダイナミックレンジ圧縮やプレ
エンファシスや位相分散を遂行する新しい技術により、
斯界において長きに亙り感じられていた必要性が満足さ
れることが望まれる。
定され、目的とするところがピークパワ限界を満足させ
る平坦化された時間領域エンベロープを得ることである
場合、良好な予処理技術の必要性が存在する。特に、自
動利得制御や(多帯域)ダイナミックレンジ圧縮やプレ
エンファシスや位相分散を遂行する新しい技術により、
斯界において長きに亙り感じられていた必要性が満足さ
れることが望まれる。
米国特許出願第712.866号は、スピーチ分析およ
び合成ならびにコード化および時間尺度変更が、スピー
チ状態と無関係のスピーチ波形の時間−周波数表示を採
用することにより簡単かつ有効に遂行できることを開示
している。詳述すると、スピーチ波形に対する正弦モデ
ルが、新しい分析−合成技術を展開するのに使用される
。
び合成ならびにコード化および時間尺度変更が、スピー
チ状態と無関係のスピーチ波形の時間−周波数表示を採
用することにより簡単かつ有効に遂行できることを開示
している。詳述すると、スピーチ波形に対する正弦モデ
ルが、新しい分析−合成技術を展開するのに使用される
。
米国特許出願第712,866号は、(a)波形からサ
ンプルのフレーム(すなわち約20〜40ミリ秒の窓)
を選択すること、(b)サンプルの各フレームを分析し
て1組の周波数成分を抽出すること、(c)1フレーム
から次のフレームまで該成分を追跡すること、(d)
1フレームから次のフレームまで上記成分の値を補間し
て、波形のパラメータ表示を得ることの諸段階を含む。
ンプルのフレーム(すなわち約20〜40ミリ秒の窓)
を選択すること、(b)サンプルの各フレームを分析し
て1組の周波数成分を抽出すること、(c)1フレーム
から次のフレームまで該成分を追跡すること、(d)
1フレームから次のフレームまで上記成分の値を補間し
て、波形のパラメータ表示を得ることの諸段階を含む。
ついで、パラメータ表示に対応する一連の正弦波を発生
することにより、合成波を構成し得る。この特許出願の
開示を参照されたい。
することにより、合成波を構成し得る。この特許出願の
開示を参照されたい。
米国特許出願第712.866号に詳細に説明される1
つの実施例において、上に要約された基本的方法は、ス
ピーチ状態と無関係に、測定された信号のべりオドグラ
ム内で最大のピークに対応する振幅、周波数および位相
を選ぶように採用される。
つの実施例において、上に要約された基本的方法は、ス
ピーチ状態と無関係に、測定された信号のべりオドグラ
ム内で最大のピークに対応する振幅、周波数および位相
を選ぶように採用される。
スピーチ波形を再構成するため、1フレーム上で評価さ
れた正弦波の振幅、周波数および位相は、整合され、逐
次のフレーム上の対応するパラメータセットに連続的に
展開せしめられる。評価されたピークの数は、一定でな
く緩やかに変化するから、整合過程は簡単でなく直線的
でない、非ボイス化/ボイス化転換のようなスピーチの
迅速変化領域は、ピークの位置および数に大きな変化を
もたらすことがあり得る。スペクトルエネルギのこのよ
うな迅速な動きを説明するため、各フレーム上で評価さ
れた周波数に基づく最隣接整合方法においては、正弦成
分の「生」および「死jの概念が採用される。新しいピ
ークが現われると、「生」が生じたといわれ、新しい追
跡が開始される。
れた正弦波の振幅、周波数および位相は、整合され、逐
次のフレーム上の対応するパラメータセットに連続的に
展開せしめられる。評価されたピークの数は、一定でな
く緩やかに変化するから、整合過程は簡単でなく直線的
でない、非ボイス化/ボイス化転換のようなスピーチの
迅速変化領域は、ピークの位置および数に大きな変化を
もたらすことがあり得る。スペクトルエネルギのこのよ
うな迅速な動きを説明するため、各フレーム上で評価さ
れた周波数に基づく最隣接整合方法においては、正弦成
分の「生」および「死jの概念が採用される。新しいピ
ークが現われると、「生」が生じたといわれ、新しい追
跡が開始される。
古いピークが整合しない場合、r死jが生じたといわれ
、対応するトラックはゼロに崩壊せしめられる。一度逐
次のフレーム上のパラメータが整合されてしまうと、各
正弦成分の位相の連続性が位相を解くことにより保証さ
れる。1つの好ましい実施例において、位相は、フレー
ムの継続時間に亙り最大の円滑性を維持しながらフレー
ムの境界にて測定される位相および周波数抑制を満足す
るように選択されたパラメータ値を有する三次元位相補
間関数を使用して解かれる。最後に、対応する正弦振幅
が、各フレームを横切って直線的態様で簡単に補間され
る。
、対応するトラックはゼロに崩壊せしめられる。一度逐
次のフレーム上のパラメータが整合されてしまうと、各
正弦成分の位相の連続性が位相を解くことにより保証さ
れる。1つの好ましい実施例において、位相は、フレー
ムの継続時間に亙り最大の円滑性を維持しながらフレー
ムの境界にて測定される位相および周波数抑制を満足す
るように選択されたパラメータ値を有する三次元位相補
間関数を使用して解かれる。最後に、対応する正弦振幅
が、各フレームを横切って直線的態様で簡単に補間され
る。
[問題点を解決するための手段]
本発明に従うと、正弦スピーチ表示方式が、スピーチ分
散の問題に適用される。正弦方式は、スピーチ信号の周
波数成分内の自然の位相分散を先ず評価し、ついで除去
する。ついで、パルス圧縮技術に基づく人工的分散が、
スピーチの品質に若干の変化を伴って導入される。新し
い位相分散割当ては、ダイナミックレンジ圧縮およびク
リッピングに先立ち波形を予処理し、原波形上で許容さ
れるよりもかなり深いスレッショルド設定を許容するよ
うに作用する。。
散の問題に適用される。正弦方式は、スピーチ信号の周
波数成分内の自然の位相分散を先ず評価し、ついで除去
する。ついで、パルス圧縮技術に基づく人工的分散が、
スピーチの品質に若干の変化を伴って導入される。新し
い位相分散割当ては、ダイナミックレンジ圧縮およびク
リッピングに先立ち波形を予処理し、原波形上で許容さ
れるよりもかなり深いスレッショルド設定を許容するよ
うに作用する。。
従来の方式は、オールパス分散回路網を使用して位相分
散を遂行するが、正弦方式を使用すると、個々の正弦波
の位相が、ピーク対RMS比の改良を達成するように操
作され得ることが分かる。例えば、スピーチ波形の分散
は、先ず測定される正弦波振幅および位相から誘導され
る声道系位相を除去し、ついでスピーチ声帯励起を構成
する生じた正弦波位相を変更することにより遂行できる
。
散を遂行するが、正弦方式を使用すると、個々の正弦波
の位相が、ピーク対RMS比の改良を達成するように操
作され得ることが分かる。例えば、スピーチ波形の分散
は、先ず測定される正弦波振幅および位相から誘導され
る声道系位相を除去し、ついでスピーチ声帯励起を構成
する生じた正弦波位相を変更することにより遂行できる
。
本発明はまた、(多帯域)ダイナミックレンジ圧縮、プ
レエンファシスおよび適応性処理を可能にする。適当な
アタックおよびリリース時間ダイナミックスをフレーム
エネルギに適用して正弦波振幅を周波数で計測すること
に基づくダイナミックレンジ制御方法が記述される。周
波数に対して均一なスケ−リンフアクタを適用できるか
ら、短時間スペクトル形状が維持される0位相分散法は
また、ダイナミックレンジ圧縮を駆動するパラメータを
決定するのに適用できるから、位相分散の手続きおよび
ダイナミックレンジの手続きは、相互に密接に結合でき
る。加えて、制限方式は、異なる低および高周波特性を
利用して、ダイナミックレンジ制御を別個の周波数帯域
に都合よく適用せしめる。プレエンファシスすなはち任
意の所望の周波数成形は、位相分散を計算する前に正弦
波振幅対周波数を成形することにより簡単に遂行できる
。位相分散技術を考慮に入れて、所与のプレエンファシ
ス手法に対する最適の解法な生ずることができる。
レエンファシスおよび適応性処理を可能にする。適当な
アタックおよびリリース時間ダイナミックスをフレーム
エネルギに適用して正弦波振幅を周波数で計測すること
に基づくダイナミックレンジ制御方法が記述される。周
波数に対して均一なスケ−リンフアクタを適用できるか
ら、短時間スペクトル形状が維持される0位相分散法は
また、ダイナミックレンジ圧縮を駆動するパラメータを
決定するのに適用できるから、位相分散の手続きおよび
ダイナミックレンジの手続きは、相互に密接に結合でき
る。加えて、制限方式は、異なる低および高周波特性を
利用して、ダイナミックレンジ制御を別個の周波数帯域
に都合よく適用せしめる。プレエンファシスすなはち任
意の所望の周波数成形は、位相分散を計算する前に正弦
波振幅対周波数を成形することにより簡単に遂行できる
。位相分散技術を考慮に入れて、所与のプレエンファシ
ス手法に対する最適の解法な生ずることができる。
正弦分析/合成方式はまた、適応処理に特に適当である
。何故ならば、直線性および非直線性適応制御パラメー
タは、スピーチの種々の特徴に関係づけられる正弦パラ
メータから誘導できるからである。例えば、1測定値は
、分析フレーム継続時間に亙る正弦振幅および周波数の
変化に基づいて誘導でき、周波数成分を選択的に強調し
、タイムスケールを拡張するのに使用できる。
。何故ならば、直線性および非直線性適応制御パラメー
タは、スピーチの種々の特徴に関係づけられる正弦パラ
メータから誘導できるからである。例えば、1測定値は
、分析フレーム継続時間に亙る正弦振幅および周波数の
変化に基づいて誘導でき、周波数成分を選択的に強調し
、タイムスケールを拡張するのに使用できる。
以下に本発明を例示の実施例と関連して説明する。しか
しながら、当業者であれば、本発明の技術思想から逸脱
することなく種々の変更や追加や除去をなし得ることは
明らかである。
しながら、当業者であれば、本発明の技術思想から逸脱
することなく種々の変更や追加や除去をなし得ることは
明らかである。
[実施例]
第1図には本発明に従う概略の手法が図示されているが
、本手法に依れば、スピーチの自然の分散は、レンジお
よび/または了解度を改善するため、放送または他の伝
送前にダイナミックレンジ圧縮およびクリッピングに適
当な予処理波形を生ずる所望の分散により置き代えらる
0本発明の目的は、ビークバア限界を満足することがで
きる平坦化された時間領域エンベロープを得、低いピー
ク対RMS比でスピーチ波形を得ることである。
、本手法に依れば、スピーチの自然の分散は、レンジお
よび/または了解度を改善するため、放送または他の伝
送前にダイナミックレンジ圧縮およびクリッピングに適
当な予処理波形を生ずる所望の分散により置き代えらる
0本発明の目的は、ビークバア限界を満足することがで
きる平坦化された時間領域エンベロープを得、低いピー
ク対RMS比でスピーチ波形を得ることである。
第2図には、スペクトル分析装置12、プレエンファサ
イザ14、分散計算装置(コンピュータ)16、エンベ
ロープ評価装置18、ダイナミックレンジ圧縮装置20
および波形クリッパ22より成る本発明の音声予処理装
置10のブロック図が示されている。スペクトル分析装
置12は、スピーチフレームのスペクトルトル的大きさ
および位相を計算する。このフレームの大きさは、所望
に応じてプレエンファサイザ14により予強調できる。
イザ14、分散計算装置(コンピュータ)16、エンベ
ロープ評価装置18、ダイナミックレンジ圧縮装置20
および波形クリッパ22より成る本発明の音声予処理装
置10のブロック図が示されている。スペクトル分析装
置12は、スピーチフレームのスペクトルトル的大きさ
および位相を計算する。このフレームの大きさは、所望
に応じてプレエンファサイザ14により予強調できる。
系(すなりち声道)の貢献度合が、最適の位相分散割当
てを導くめ分散コンピュータ16により使用される。こ
の割当ては、ついで時間領域エンベロープ形状を予測す
るためにエンベロープ評価装置18で使用できる。しか
して、時間領域エンベロープ形状は、圧縮波形を生ずる
ために正弦波振幅に適用され得る利得を導くためにダイ
ナミックレンジ圧縮装置2oにより使用される。
てを導くめ分散コンピュータ16により使用される。こ
の割当ては、ついで時間領域エンベロープ形状を予測す
るためにエンベロープ評価装置18で使用できる。しか
して、時間領域エンベロープ形状は、圧縮波形を生ずる
ために正弦波振幅に適用され得る利得を導くためにダイ
ナミックレンジ圧縮装置2oにより使用される。
圧縮波形は、クリッパ22によりクリップされ、送信機
24によるまたはその他の伝送のための所望の波形を得
ることができる。
24によるまたはその他の伝送のための所望の波形を得
ることができる。
第3図には、スピーチ予処理装置10がより詳細に示さ
れているが、この装置は、迅速フーリエ変換器(FET
)スペクトル分析装置12、系の大きさおよび位相評価
装置34、励起の大きさ評価装置36および励起位相評
価装置38を備える。これらの各要素は、米国特許第7
12.866号に図示説明される同じ要素に設計および
機能において類似とし得る0本質的に、これらの要素は
、系の貢献度(すなわち声道からの)および励起の貢献
度(すなわち声帯からの)より成るものとして定義され
る代表的正弦波を抽出する働きをする。
れているが、この装置は、迅速フーリエ変換器(FET
)スペクトル分析装置12、系の大きさおよび位相評価
装置34、励起の大きさ評価装置36および励起位相評
価装置38を備える。これらの各要素は、米国特許第7
12.866号に図示説明される同じ要素に設計および
機能において類似とし得る0本質的に、これらの要素は
、系の貢献度(すなわち声道からの)および励起の貢献
度(すなわち声帯からの)より成るものとして定義され
る代表的正弦波を抽出する働きをする。
同様に、米国特許出願第712.766号に記載される
線と同じ線に沿って、1フレームから次のフレームまで
個々の周波数成分を追跡し整合するためビ−ク検出装置
40および周波数整合装置42が採用されている。プレ
エンファサイザ14は、これも技術的に周知であるが、
スペクトル分析装置12と系評価装置34との間に挿入
できる。
線と同じ線に沿って、1フレームから次のフレームまで
個々の周波数成分を追跡し整合するためビ−ク検出装置
40および周波数整合装置42が採用されている。プレ
エンファサイザ14は、これも技術的に周知であるが、
スペクトル分析装置12と系評価装置34との間に挿入
できる。
簡単な実施例に置いて、スピーチ波形は、10KHzの
サンブイング速度でディジタル化され、5KHzでロー
パス濾波され、25 m5ecのハンミング窓で10m
5ecのフレーム間隔で分析される。
サンブイング速度でディジタル化され、5KHzでロー
パス濾波され、25 m5ecのハンミング窓で10m
5ecのフレーム間隔で分析される。
本発明に従えば、スピーチ表示はまた、可変継続時間の
分析窓を採用することにより得ることができる。ある種
の応用の場合、分析窓の幅をピッチ適応性にするのが好
ましく、例えば20m5ecの最小幅を有する平均ピッ
チ周期の2.5倍にセットされる。
分析窓を採用することにより得ることができる。ある種
の応用の場合、分析窓の幅をピッチ適応性にするのが好
ましく、例えば20m5ecの最小幅を有する平均ピッ
チ周期の2.5倍にセットされる。
フレーム境界で連続性を達成するため、大きさおよび位
相値は、フレームごとに補間されねばならぬ。系の大き
さおよび位相値ならびに励起の大きさの値は、直線的剤
IVI装置44により補間でき、他方励起位相値は、好
ましくは三次元補間装置46により補間されるのがよい
。この技術は、やはり米国特許出願第712,866号
に記述されている。 例示の装置は、ピッチ抽出装置3
2を採用している。ピッチ測定値は、種々の方法で得る
ことができる。例えば、まず高分解度の大きさの対数の
フーリエ変換を、”ケプストラム”を得るように計算で
きる。ついで、セブストラムから予期されるピッチ周期
範囲内においてピークが選択される。得られたピッチの
決定値は、位相分散コンピュータ16(後述のように)
により使用され、また系の大きさを導出する際系評価装
置34で使用できる。
相値は、フレームごとに補間されねばならぬ。系の大き
さおよび位相値ならびに励起の大きさの値は、直線的剤
IVI装置44により補間でき、他方励起位相値は、好
ましくは三次元補間装置46により補間されるのがよい
。この技術は、やはり米国特許出願第712,866号
に記述されている。 例示の装置は、ピッチ抽出装置3
2を採用している。ピッチ測定値は、種々の方法で得る
ことができる。例えば、まず高分解度の大きさの対数の
フーリエ変換を、”ケプストラム”を得るように計算で
きる。ついで、セブストラムから予期されるピッチ周期
範囲内においてピークが選択される。得られたピッチの
決定値は、位相分散コンピュータ16(後述のように)
により使用され、また系の大きさを導出する際系評価装
置34で使用できる。
系評価装置34においては、ピッチ決定値(ピッチ抽出
装置32からの)に基づきスペクトルの1組のピーク(
ピーク検出装置40から得られる)について直線的に補
間することにより得られる。系評価装置34は、ついで
声道スペクトルエンベロープの評価値を生ずる。詳細な
説明は、米国特許出願第712.866号を参照された
い。
装置32からの)に基づきスペクトルの1組のピーク(
ピーク検出装置40から得られる)について直線的に補
間することにより得られる。系評価装置34は、ついで
声道スペクトルエンベロープの評価値を生ずる。詳細な
説明は、米国特許出願第712.866号を参照された
い。
本発明において、励起位相評価装置38は、励起位相評
価値を生成するのに使用される。1実施例においては、
系の振幅でヒルバート変換を使用して、系の位相の初(
最小)位相評価値が得られる。ついで、最小位相評価値
が測定された位相から減ぜられる。もしも最小位相評価
値が正しければ、結果は直線的励起位相となろう、しか
しながら、一般には、直線的励起位相に関してランダム
に変わる位相残分がある。ついで、最小二乗法を使用し
て最良の直線位相評価値を計算し得る。励起位相評価の
詳細な論述については、Proceed ingof
ICASSP、1986の本発明者等の[r Phas
e Modeling八nd Itへ Appli
cation To 5inusoidal T
ransformCod ingjと題する文献を参照
されたい。
価値を生成するのに使用される。1実施例においては、
系の振幅でヒルバート変換を使用して、系の位相の初(
最小)位相評価値が得られる。ついで、最小位相評価値
が測定された位相から減ぜられる。もしも最小位相評価
値が正しければ、結果は直線的励起位相となろう、しか
しながら、一般には、直線的励起位相に関してランダム
に変わる位相残分がある。ついで、最小二乗法を使用し
て最良の直線位相評価値を計算し得る。励起位相評価の
詳細な論述については、Proceed ingof
ICASSP、1986の本発明者等の[r Phas
e Modeling八nd Itへ Appli
cation To 5inusoidal T
ransformCod ingjと題する文献を参照
されたい。
励起関数を評価するに際して、直線評価値の小さい誤差
は、系の位相を使用して修正できる。系の位相評価値は
、測定された位相から直線位相を減することにより得る
ことができ、ついで、系のインパルスレスポンス評価値
を生成するため系の大きさとともに使用される。このレ
スポンスは、先行のフレームと相互に相関づけられる。
は、系の位相を使用して修正できる。系の位相評価値は
、測定された位相から直線位相を減することにより得る
ことができ、ついで、系のインパルスレスポンス評価値
を生成するため系の大きさとともに使用される。このレ
スポンスは、先行のフレームと相互に相関づけられる。
レスポンス間の測定された遅延は、その直線励起位相評
価値を修正するのに使用される。他の整列手続きは斯界
に精通したものには明らかであろう。
価値を修正するのに使用される。他の整列手続きは斯界
に精通したものには明らかであろう。
本発明において、人工的系の位相は、系の太きさおよび
ピッチから位相分散コンピューター6により計算される
0位相分散コンピューター6の動作は、第4図に詳細に
示されているが、この装置においてケプストラムピッチ
抽出装置32からの生のピッチ評価値は平滑化され(す
なわち−次の再帰フィルタ50による平均により)、そ
して位相評価値が、下記の式により系の大きさから位相
コンピュータ52により得られる。
ピッチから位相分散コンピューター6により計算される
0位相分散コンピューター6の動作は、第4図に詳細に
示されているが、この装置においてケプストラムピッチ
抽出装置32からの生のピッチ評価値は平滑化され(す
なわち−次の再帰フィルタ50による平均により)、そ
して位相評価値が、下記の式により系の大きさから位相
コンピュータ52により得られる。
θ(ω)=Kig(ω′)dω’ (IA)ここで
、 ω′ g (ω’)=iM”(α)dα (IB)ここ
で、θ(ω)は人工的系の位相評価値、Kはスケールフ
ァクタ、M(ω)は系の大きさ評価値である。この計算
は、例えば、FFT分析装置12からのサンプルを使用
し数値積分を遂行することにより実行できる。
、 ω′ g (ω’)=iM”(α)dα (IB)ここ
で、θ(ω)は人工的系の位相評価値、Kはスケールフ
ァクタ、M(ω)は系の大きさ評価値である。この計算
は、例えば、FFT分析装置12からのサンプルを使用
し数値積分を遂行することにより実行できる。
スケールファクタには、スケールファクタコンピュータ
54により下記の式を解くことにより得られる。
54により下記の式を解くことにより得られる。
K=2π(ピッチ周期)7g(π)(2)ここでg(π
)は、πにおける式(IB)の値である。
)は、πにおける式(IB)の値である。
乗算器56は、位相計算値をスケールファクタと乗算し
、位相分散に対する系の位相評価値θ(ω)を生ずる。
、位相分散に対する系の位相評価値θ(ω)を生ずる。
これは、ついで各正弦波の周波数トラックに沿ってさら
に平滑化される(すなはち、やはりかかる周波数トラッ
クに沿って一次再帰フィルタ58を使用して)、系の位
相は、ついで補間のために利用可能である。
に平滑化される(すなはち、やはりかかる周波数トラッ
クに沿って一次再帰フィルタ58を使用して)、系の位
相は、ついで補間のために利用可能である。
第2図をさらに参照すると、系の位相はまた、時間領域
エンベロープ形状を評価するためにエンベロープ評価装
置18により使用できる。例えば、エンベロープは、新
しい位相分散をもつ人工的声道レスポンスの分析的信号
表示を得るためヒルベルト変換を使用することにより計
算できる。
エンベロープ形状を評価するためにエンベロープ評価装
置18により使用できる。例えば、エンベロープは、新
しい位相分散をもつ人工的声道レスポンスの分析的信号
表示を得るためヒルベルト変換を使用することにより計
算できる。
この信号の大きさは所望のエンベロープである。
平均エンベロープ測定値は、ついで適当な利得を決定す
るためダイナミックレンジ圧縮器20で使用される。エ
ンベロープはまた、信号とそのフーリエ変換との関係を
利用することにより系のレスポンスのエネルギおよびピ
ッチ周期から得ることができる。所望の出力エンベロー
プは、ダイナミックレンジ圧縮曲線および適当なアタッ
クおよびリリース時間に従って測定された系のエンベロ
ープから計算される。ついで、利得が所望の出力エンベ
ロープに合うように選択される。利得は、補間前に系の
大きさに適用される。
るためダイナミックレンジ圧縮器20で使用される。エ
ンベロープはまた、信号とそのフーリエ変換との関係を
利用することにより系のレスポンスのエネルギおよびピ
ッチ周期から得ることができる。所望の出力エンベロー
プは、ダイナミックレンジ圧縮曲線および適当なアタッ
クおよびリリース時間に従って測定された系のエンベロ
ープから計算される。ついで、利得が所望の出力エンベ
ロープに合うように選択される。利得は、補間前に系の
大きさに適用される。
代わりに、ダイナミックレンジ圧縮器20は、検出され
たピークの平方の総和からエネルギ測定値を計算するこ
とにより検出されたピークから利得を決定できる。やは
り、所望の出力エネルギが、ダイナミックレンジ圧縮曲
線および適当なアタックおよびリリース時間に従って測
定された正弦波エネルギから計算できる。ついで、利得
が所望の出力エネルギに合うように選択される。利得は
、補間前に正弦波の大きさに適用される。
たピークの平方の総和からエネルギ測定値を計算するこ
とにより検出されたピークから利得を決定できる。やは
り、所望の出力エネルギが、ダイナミックレンジ圧縮曲
線および適当なアタックおよびリリース時間に従って測
定された正弦波エネルギから計算できる。ついで、利得
が所望の出力エネルギに合うように選択される。利得は
、補間前に正弦波の大きさに適用される。
補間後、正弦波発生器6oが、正弦成分から変更された
スピーチ波形を発生する。これらの成分は、ついで加算
され、クリッパ22によりクリップされる。生じた分散
波形内のスペクトル情報は、波形形状でなく主として変
更された波形のゼロ交差点内に埋没される。したがって
、この技術は、波形クリップのための予処理装置として
働くことができ、原波形について許容されるよりもかな
り深いスレッショルド(例えば波形の最大値の40%)
を可能にする。
スピーチ波形を発生する。これらの成分は、ついで加算
され、クリッパ22によりクリップされる。生じた分散
波形内のスペクトル情報は、波形形状でなく主として変
更された波形のゼロ交差点内に埋没される。したがって
、この技術は、波形クリップのための予処理装置として
働くことができ、原波形について許容されるよりもかな
り深いスレッショルド(例えば波形の最大値の40%)
を可能にする。
4、 の tI3
第1図は本発明に従い人工的位相分散を導入する方法の
流れ図、第2図は本発明に従う音声予処理装置の総括的
ブロック図、第3図は第2図の装置の詳細なブロック図
、第4図は第3図の位相分散コンピュータの詳細図であ
る。
流れ図、第2図は本発明に従う音声予処理装置の総括的
ブロック図、第3図は第2図の装置の詳細なブロック図
、第4図は第3図の位相分散コンピュータの詳細図であ
る。
10;予処理装置
12ニスベクトル分析装置
14:プレエンファサイザ
16:位相分散コンピュータ
18:エンベロープ評価装置
2o:ダイナミックレンジ圧縮装置
22:クリッパ
24;送信機
32:ピッチ抽出装置
34:系評価装置
36:励起の大きさ評価装置
3日:励起位相評価装置
40:ピーク検出装置
42:周波数整合装置
44:直線的補間装置
46:三次補間装置
60:正弦波発生装置
Claims (20)
- (1)波形をサンプルして一連の離散的サンプルを得、
該サンプルから各々複数のサンプルを跨ぐ一連のフレー
ムを構成し、各サンプルフレームを分析して、個々の振
幅および位相を有する1組の周波数成分を抽出し、前記
周波数成分から自然の位相分散を除去し、所望の位相分
散で置換し、1フレームから次のフレームまで前記成分
を追跡し、前記1フレームから前記次のフレームまで成
分の値を補間して波形のパラメータ表示を得る諸段階を
含み、平坦化された時間領域エンベロープが、パラメー
タ表示の補間値に対応する1組の正弦波を発生すること
により構成され得ることを特徴とする、音響波形処理方
法。 - (2)前記の各フレームを分析して個々の振幅を有する
1組の周波数成分を抽出する段階がさらに、前記振幅に
プレエンファシスを適用することを含む特許請求の範囲
第1項記載の処理方法。 - (3)プレエンファシスが、前記振幅の系の貢献度に適
用されるが、前記振幅の励起の貢献度には適用されない
特許請求の範囲第2項記載の処理方法。 - (4)自然の位相分散を除去する段階がさらに、前記周
波数の数成分の系の貢献度の位相分散を分析し、ピッチ
評価値および前記系の貢献度の振幅から導出される人工
的位相分散で置換することを含む特許請求の範囲第1項
記載の処理方法。 - (5)ピッチ評価値がセプストラムピッチ抽出装置から
得られる特許請求の範囲第4項記載の処理方法。 - (6)ケプストラム抽出装置から得られるピッチ評価値
が、再帰フィルタによりさらに平滑化される特許請求の
範囲第5項記載の処理方法 - (7)人工的位相分散の位相成分が、再帰フィルタによ
りさらに平滑化される特許請求の範囲第4項記載の処理
方法。 - (8)各フレームを分析して個々の振幅を有する1組の
周波数成分を抽出する段階がさらに、前記振幅にダイナ
ミックレンジ圧縮利得ファクタを適用する特許請求の範
囲第1項記載の処理方法。 - (9)利得ファクタが、周波数成分の振幅のピーク決定
値から導出される特許請求の範囲第8項記載の処理方法
。 - (10)利得ファクタが、所望の位相分散に基づくエン
ベロープ予定値から導出される特許請求の範囲第8項記
載の処理方法。 - (11)波形をサンプルして一連の離散的サンプルを得
、該サンプルから各々複数のサンプルを跨ぐ一連のフレ
ームを構成するサンプリング手段と、各サンプルフレー
ムを分析して、個々の振幅および位相を有する1組の周
波数成分を抽出する分析手段と、1フレームから次のフ
レームまで前記成分を追跡する追跡手段と、前記1フレ
ームから前記次のフレームまで成分の値を補間して波形
のパラメータ表示を得る補間手段とを備え、合成波形が
、パラメータ表示の補間値に対応する1組の正弦波を発
生することにより構成され得ることを特徴とする音響波
処理方法。 - (12)前記分析手段が、前記振幅にプレエンファシス
を適用するプレエンファサイザを備える特許請求の範囲
第11項記載の処理装置。 - (13)前記プレエンファサイザが、前記振幅の系の貢
献度を変更するが、前記振幅の励起の貢献度を変更しな
い特許請求の範囲第12項記載処理装置。 - (14)位相分散計算手段がさらに、ピッチ評価値およ
び前記系の貢献度の振幅から最適の最適の位相分散を決
定する手段を備える特許請求の範囲第11項記載の処理
装置。 - (15)前記位相分散計算手段がさらに、ケプストラム
ピッチ抽出装置を備える特許請求の範囲第14項記載の
処理装置。 - (16)前記位相分散計算手段がさらに、前記ケプスト
ラム抽出装置からのピッチ評価値を平滑するための再帰
ピッチフィルタ手段を備える特許請求の範囲第15項記
載の処理装置。 - (17)前記位相分散計算手段がさらに、位相分散計算
値を平滑するための再帰位相フィルタを備える特許請求
の範囲第14項記載の処理装置。 - (18)前記分析手段がさらに、前記振幅に利得ファク
タを適用するためのダイナミックレンジ圧縮装置を備え
る特許請求の範囲第11項記載の処理装置。 - (19)前記ダイナミックレンジ圧縮装置がさらに、前
記人工的位相分散に基づいて時間領域エンベロープ形状
を予測するためのエンベロープ予測手段を備える特許請
求の範囲第18項記載の処理装置。 - (20)前記追跡装置がさらに、ピーク検出器と、1フ
レームからの周波数成分を類似の値を有する次のフレー
ムの成分と整合するための整合手段を備え、前記ピーク
検出器がまた、前記振幅へ適用するための利得ファクタ
を導出するためピーク決定値をダイナミックレンジ圧縮
器に供給する特許請求の範囲第11項記載の処理装置。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US07/034,204 US4856068A (en) | 1985-03-18 | 1987-04-02 | Audio pre-processing methods and apparatus |
US034204 | 1987-04-02 |
Publications (1)
Publication Number | Publication Date |
---|---|
JPS63259696A true JPS63259696A (ja) | 1988-10-26 |
Family
ID=21874950
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP63076652A Pending JPS63259696A (ja) | 1987-04-02 | 1988-03-31 | 音声予処理方法および装置 |
Country Status (5)
Country | Link |
---|---|
US (1) | US4856068A (ja) |
EP (1) | EP0285275A3 (ja) |
JP (1) | JPS63259696A (ja) |
AU (1) | AU1314788A (ja) |
CA (1) | CA1331222C (ja) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2002058053A1 (en) * | 2001-01-22 | 2002-07-25 | Kanars Data Corporation | Encoding method and decoding method for digital voice data |
JP2014508973A (ja) * | 2011-03-21 | 2014-04-10 | テレフオンアクチーボラゲット エル エム エリクソン(パブル) | オーディオ信号において卓越周波数を減衰させるための方法および装置 |
Families Citing this family (82)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CA1332982C (en) * | 1987-04-02 | 1994-11-08 | Robert J. Mcauley | Coding of acoustic waveforms |
DE59008047D1 (de) * | 1989-03-06 | 1995-02-02 | Bosch Gmbh Robert | Verfahren zur Datenreduktion bei digitalen Tonsignalen und zur genäherten Rückgewinnung der digitalen Tonsignale. |
US5081681B1 (en) * | 1989-11-30 | 1995-08-15 | Digital Voice Systems Inc | Method and apparatus for phase synthesis for speech processing |
US5226108A (en) * | 1990-09-20 | 1993-07-06 | Digital Voice Systems, Inc. | Processing a speech signal with estimated pitch |
US5216747A (en) * | 1990-09-20 | 1993-06-01 | Digital Voice Systems, Inc. | Voiced/unvoiced estimation of an acoustic signal |
US5664051A (en) * | 1990-09-24 | 1997-09-02 | Digital Voice Systems, Inc. | Method and apparatus for phase synthesis for speech processing |
US5226084A (en) * | 1990-12-05 | 1993-07-06 | Digital Voice Systems, Inc. | Methods for speech quantization and error correction |
US5630011A (en) * | 1990-12-05 | 1997-05-13 | Digital Voice Systems, Inc. | Quantization of harmonic amplitudes representing speech |
JP3432822B2 (ja) * | 1991-06-11 | 2003-08-04 | クゥアルコム・インコーポレイテッド | 可変速度ボコーダ |
US5504833A (en) * | 1991-08-22 | 1996-04-02 | George; E. Bryan | Speech approximation using successive sinusoidal overlap-add models and pitch-scale modifications |
US5327518A (en) * | 1991-08-22 | 1994-07-05 | Georgia Tech Research Corporation | Audio analysis/synthesis system |
US5272698A (en) * | 1991-09-12 | 1993-12-21 | The United States Of America As Represented By The Secretary Of The Air Force | Multi-speaker conferencing over narrowband channels |
US5317567A (en) * | 1991-09-12 | 1994-05-31 | The United States Of America As Represented By The Secretary Of The Air Force | Multi-speaker conferencing over narrowband channels |
CA2090052C (en) * | 1992-03-02 | 1998-11-24 | Anibal Joao De Sousa Ferreira | Method and apparatus for the perceptual coding of audio signals |
WO1993018505A1 (en) * | 1992-03-02 | 1993-09-16 | The Walt Disney Company | Voice transformation system |
US5457685A (en) * | 1993-11-05 | 1995-10-10 | The United States Of America As Represented By The Secretary Of The Air Force | Multi-speaker conferencing over narrowband channels |
US5787387A (en) * | 1994-07-11 | 1998-07-28 | Voxware, Inc. | Harmonic adaptive speech coding method and system |
TW271524B (ja) | 1994-08-05 | 1996-03-01 | Qualcomm Inc | |
US5742734A (en) * | 1994-08-10 | 1998-04-21 | Qualcomm Incorporated | Encoding rate selection in a variable rate vocoder |
US5706392A (en) * | 1995-06-01 | 1998-01-06 | Rutgers, The State University Of New Jersey | Perceptual speech coder and method |
US5806034A (en) * | 1995-08-02 | 1998-09-08 | Itt Corporation | Speaker independent speech recognition method utilizing multiple training iterations |
US5774837A (en) * | 1995-09-13 | 1998-06-30 | Voxware, Inc. | Speech coding system and method using voicing probability determination |
KR970017456A (ko) * | 1995-09-30 | 1997-04-30 | 김광호 | 음성신호의 무음 및 무성음 판별방법 및 그 장치 |
US5686683A (en) * | 1995-10-23 | 1997-11-11 | The Regents Of The University Of California | Inverse transform narrow band/broad band sound synthesis |
WO1997027578A1 (en) * | 1996-01-26 | 1997-07-31 | Motorola Inc. | Very low bit rate time domain speech analyzer for voice messaging |
US5749064A (en) * | 1996-03-01 | 1998-05-05 | Texas Instruments Incorporated | Method and system for time scale modification utilizing feature vectors about zero crossing points |
US5751901A (en) * | 1996-07-31 | 1998-05-12 | Qualcomm Incorporated | Method for searching an excitation codebook in a code excited linear prediction (CELP) coder |
US6112169A (en) * | 1996-11-07 | 2000-08-29 | Creative Technology, Ltd. | System for fourier transform-based modification of audio |
US5870704A (en) * | 1996-11-07 | 1999-02-09 | Creative Technology Ltd. | Frequency-domain spectral envelope estimation for monophonic and polyphonic signals |
US6256395B1 (en) * | 1998-01-30 | 2001-07-03 | Gn Resound As | Hearing aid output clipping apparatus |
US6182042B1 (en) | 1998-07-07 | 2001-01-30 | Creative Technology Ltd. | Sound modification employing spectral warping techniques |
US6691084B2 (en) | 1998-12-21 | 2004-02-10 | Qualcomm Incorporated | Multiple mode variable rate speech coding |
US6725108B1 (en) | 1999-01-28 | 2004-04-20 | International Business Machines Corporation | System and method for interpretation and visualization of acoustic spectra, particularly to discover the pitch and timbre of musical sounds |
US6298322B1 (en) | 1999-05-06 | 2001-10-02 | Eric Lindemann | Encoding and synthesis of tonal audio signals using dominant sinusoids and a vector-quantized residual tonal signal |
AU2002367490A1 (en) * | 2002-01-24 | 2003-09-02 | Koninklijke Philips Electronics N.V. | A method for decreasing the dynamic range of a signal and electronic circuit |
US6751564B2 (en) | 2002-05-28 | 2004-06-15 | David I. Dunthorn | Waveform analysis |
US6907632B2 (en) * | 2002-05-28 | 2005-06-21 | Ferno-Washington, Inc. | Tactical stretcher |
KR100841096B1 (ko) * | 2002-10-14 | 2008-06-25 | 리얼네트웍스아시아퍼시픽 주식회사 | 음성 코덱에 대한 디지털 오디오 신호의 전처리 방법 |
KR100754439B1 (ko) * | 2003-01-09 | 2007-08-31 | 와이더댄 주식회사 | 이동 전화상의 체감 음질을 향상시키기 위한 디지털오디오 신호의 전처리 방법 |
US7672838B1 (en) * | 2003-12-01 | 2010-03-02 | The Trustees Of Columbia University In The City Of New York | Systems and methods for speech recognition using frequency domain linear prediction polynomials to form temporal and spectral envelopes from frequency domain representations of signals |
US7254243B2 (en) * | 2004-08-10 | 2007-08-07 | Anthony Bongiovi | Processing of an audio signal for presentation in a high noise environment |
US8565449B2 (en) * | 2006-02-07 | 2013-10-22 | Bongiovi Acoustics Llc. | System and method for digital signal processing |
US9281794B1 (en) | 2004-08-10 | 2016-03-08 | Bongiovi Acoustics Llc. | System and method for digital signal processing |
US8462963B2 (en) * | 2004-08-10 | 2013-06-11 | Bongiovi Acoustics, LLCC | System and method for processing audio signal |
US10158337B2 (en) | 2004-08-10 | 2018-12-18 | Bongiovi Acoustics Llc | System and method for digital signal processing |
US11431312B2 (en) | 2004-08-10 | 2022-08-30 | Bongiovi Acoustics Llc | System and method for digital signal processing |
US10848118B2 (en) | 2004-08-10 | 2020-11-24 | Bongiovi Acoustics Llc | System and method for digital signal processing |
US9413321B2 (en) | 2004-08-10 | 2016-08-09 | Bongiovi Acoustics Llc | System and method for digital signal processing |
US8284955B2 (en) | 2006-02-07 | 2012-10-09 | Bongiovi Acoustics Llc | System and method for digital signal processing |
US8310441B2 (en) * | 2004-09-27 | 2012-11-13 | Qualcomm Mems Technologies, Inc. | Method and system for writing data to MEMS display elements |
US10701505B2 (en) | 2006-02-07 | 2020-06-30 | Bongiovi Acoustics Llc. | System, method, and apparatus for generating and digitally processing a head related audio transfer function |
US8705765B2 (en) * | 2006-02-07 | 2014-04-22 | Bongiovi Acoustics Llc. | Ringtone enhancement systems and methods |
US10848867B2 (en) | 2006-02-07 | 2020-11-24 | Bongiovi Acoustics Llc | System and method for digital signal processing |
US20090296959A1 (en) * | 2006-02-07 | 2009-12-03 | Bongiovi Acoustics, Llc | Mismatched speaker systems and methods |
US9195433B2 (en) | 2006-02-07 | 2015-11-24 | Bongiovi Acoustics Llc | In-line signal processor |
US10069471B2 (en) | 2006-02-07 | 2018-09-04 | Bongiovi Acoustics Llc | System and method for digital signal processing |
US9615189B2 (en) | 2014-08-08 | 2017-04-04 | Bongiovi Acoustics Llc | Artificial ear apparatus and associated methods for generating a head related audio transfer function |
US11202161B2 (en) | 2006-02-07 | 2021-12-14 | Bongiovi Acoustics Llc | System, method, and apparatus for generating and digitally processing a head related audio transfer function |
US9348904B2 (en) | 2006-02-07 | 2016-05-24 | Bongiovi Acoustics Llc. | System and method for digital signal processing |
KR101080421B1 (ko) * | 2007-03-16 | 2011-11-04 | 삼성전자주식회사 | 정현파 오디오 코딩 방법 및 장치 |
KR101380170B1 (ko) * | 2007-08-31 | 2014-04-02 | 삼성전자주식회사 | 미디어 신호 인코딩/디코딩 방법 및 장치 |
WO2009155057A1 (en) * | 2008-05-30 | 2009-12-23 | Anthony Bongiovi | Mismatched speaker systems and methods |
US9497540B2 (en) | 2009-12-23 | 2016-11-15 | Conexant Systems, Inc. | System and method for reducing rub and buzz distortion |
US8494199B2 (en) | 2010-04-08 | 2013-07-23 | Gn Resound A/S | Stability improvements in hearing aids |
US9060217B2 (en) | 2010-07-15 | 2015-06-16 | Conexant Systems, Inc. | Audio driver system and method |
DK2579252T3 (da) | 2011-10-08 | 2020-06-02 | Gn Hearing As | Forbedringer af stabilitet og talehørbarhed for høreapparater |
WO2013050605A1 (en) | 2011-10-08 | 2013-04-11 | Gn Resound A/S | Stability and speech audibility improvements in hearing devices |
US9344828B2 (en) | 2012-12-21 | 2016-05-17 | Bongiovi Acoustics Llc. | System and method for digital signal processing |
US9883318B2 (en) | 2013-06-12 | 2018-01-30 | Bongiovi Acoustics Llc | System and method for stereo field enhancement in two-channel audio systems |
US9264004B2 (en) | 2013-06-12 | 2016-02-16 | Bongiovi Acoustics Llc | System and method for narrow bandwidth digital signal processing |
US9398394B2 (en) | 2013-06-12 | 2016-07-19 | Bongiovi Acoustics Llc | System and method for stereo field enhancement in two-channel audio systems |
US9906858B2 (en) | 2013-10-22 | 2018-02-27 | Bongiovi Acoustics Llc | System and method for digital signal processing |
US9397629B2 (en) | 2013-10-22 | 2016-07-19 | Bongiovi Acoustics Llc | System and method for digital signal processing |
US10820883B2 (en) | 2014-04-16 | 2020-11-03 | Bongiovi Acoustics Llc | Noise reduction assembly for auscultation of a body |
US10639000B2 (en) | 2014-04-16 | 2020-05-05 | Bongiovi Acoustics Llc | Device for wide-band auscultation |
US9615813B2 (en) | 2014-04-16 | 2017-04-11 | Bongiovi Acoustics Llc. | Device for wide-band auscultation |
US9564146B2 (en) | 2014-08-01 | 2017-02-07 | Bongiovi Acoustics Llc | System and method for digital signal processing in deep diving environment |
US9638672B2 (en) | 2015-03-06 | 2017-05-02 | Bongiovi Acoustics Llc | System and method for acquiring acoustic information from a resonating body |
US9906867B2 (en) | 2015-11-16 | 2018-02-27 | Bongiovi Acoustics Llc | Surface acoustic transducer |
US9621994B1 (en) | 2015-11-16 | 2017-04-11 | Bongiovi Acoustics Llc | Surface acoustic transducer |
CA3096877A1 (en) | 2018-04-11 | 2019-10-17 | Bongiovi Acoustics Llc | Audio enhanced hearing protection system |
WO2020028833A1 (en) | 2018-08-02 | 2020-02-06 | Bongiovi Acoustics Llc | System, method, and apparatus for generating and digitally processing a head related audio transfer function |
Family Cites Families (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US3360610A (en) * | 1964-05-07 | 1967-12-26 | Bell Telephone Labor Inc | Bandwidth compression utilizing magnitude and phase coded signals representative of the input signal |
US4058676A (en) * | 1975-07-07 | 1977-11-15 | International Communication Sciences | Speech analysis and synthesis system |
US4076958A (en) * | 1976-09-13 | 1978-02-28 | E-Systems, Inc. | Signal synthesizer spectrum contour scaler |
US4214125A (en) * | 1977-01-21 | 1980-07-22 | Forrest S. Mozer | Method and apparatus for speech synthesizing |
EP0215915A4 (en) * | 1985-03-18 | 1987-11-25 | Massachusetts Inst Technology | TREATMENT OF ACOUSTIC WAVE SHAPES. |
-
1987
- 1987-04-02 US US07/034,204 patent/US4856068A/en not_active Expired - Lifetime
-
1988
- 1988-03-01 CA CA000560231A patent/CA1331222C/en not_active Expired - Fee Related
- 1988-03-10 EP EP88302062A patent/EP0285275A3/en not_active Withdrawn
- 1988-03-16 AU AU13147/88A patent/AU1314788A/en not_active Abandoned
- 1988-03-31 JP JP63076652A patent/JPS63259696A/ja active Pending
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2002058053A1 (en) * | 2001-01-22 | 2002-07-25 | Kanars Data Corporation | Encoding method and decoding method for digital voice data |
JP2014508973A (ja) * | 2011-03-21 | 2014-04-10 | テレフオンアクチーボラゲット エル エム エリクソン(パブル) | オーディオ信号において卓越周波数を減衰させるための方法および装置 |
Also Published As
Publication number | Publication date |
---|---|
US4856068A (en) | 1989-08-08 |
EP0285275A3 (en) | 1989-11-23 |
EP0285275A2 (en) | 1988-10-05 |
AU1314788A (en) | 1988-10-06 |
CA1331222C (en) | 1994-08-02 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JPS63259696A (ja) | 音声予処理方法および装置 | |
Serra et al. | Spectral modeling synthesis: A sound analysis/synthesis system based on a deterministic plus stochastic decomposition | |
US8160732B2 (en) | Noise suppressing method and noise suppressing apparatus | |
CN1838239B (zh) | 一种用于增强信源解码器的设备及方法 | |
RU2447415C2 (ru) | Способ и устройство для расширения ширины полосы аудиосигнала | |
EP1422693B1 (en) | Pitch waveform signal generation apparatus; pitch waveform signal generation method; and program | |
EP0853309B1 (en) | Method and apparatus for signal analysis | |
Caetano et al. | Improved estimation of the amplitude envelope of time-domain signals using true envelope cepstral smoothing | |
CN111128213B (zh) | 一种分频段进行处理的噪声抑制方法及其系统 | |
WO2022012195A1 (zh) | 音频信号处理方法和相关装置 | |
JPH0844394A (ja) | 励起パラメータの評価 | |
JP3191926B2 (ja) | 音響波形のコード化方式 | |
JPH0754440B2 (ja) | 音声分析合成装置 | |
AU2021289742B2 (en) | Methods, apparatus, and systems for detection and extraction of spatially-identifiable subband audio sources | |
US7305339B2 (en) | Restoration of high-order Mel Frequency Cepstral Coefficients | |
WO2001004873A1 (fr) | Procede d'extraction d'information de source sonore | |
CN111755025B (zh) | 一种基于音频特征的状态检测方法、装置及设备 | |
JPH08305396A (ja) | 音声帯域拡大装置および音声帯域拡大方法 | |
Srivastava | Fundamentals of linear prediction | |
Lajmi | An improved packet loss recovery of audio signals based on frequency tracking | |
Nasr et al. | Efficient implementation of adaptive wiener filter for pitch detection from noisy speech signals | |
JP3019603B2 (ja) | 音声の基本周波数の抽出装置 | |
Belhomme et al. | Amplitude and phase dereverberation of harmonic signals | |
Bartkowiak et al. | Hybrid sinusoidal modeling of music with near transparent audio quality | |
Bahatti et al. | Short-term sinusoidal modeling of an oriental music signal by using CQT transform |