JP7160790B2 - ハーモニックフィルタツールのハーモニック依存制御 - Google Patents
ハーモニックフィルタツールのハーモニック依存制御 Download PDFInfo
- Publication number
- JP7160790B2 JP7160790B2 JP2019220392A JP2019220392A JP7160790B2 JP 7160790 B2 JP7160790 B2 JP 7160790B2 JP 2019220392 A JP2019220392 A JP 2019220392A JP 2019220392 A JP2019220392 A JP 2019220392A JP 7160790 B2 JP7160790 B2 JP 7160790B2
- Authority
- JP
- Japan
- Prior art keywords
- pitch
- measure
- temporal structure
- harmonicity
- temporal
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 230000001419 dependent effect Effects 0.000 title claims description 24
- 230000002123 temporal effect Effects 0.000 claims description 108
- 230000005236 sound signal Effects 0.000 claims description 43
- 238000000034 method Methods 0.000 claims description 39
- 230000001052 transient effect Effects 0.000 claims description 37
- 230000003595 spectral effect Effects 0.000 claims description 27
- 238000011045 prefiltration Methods 0.000 claims description 20
- 238000005070 sampling Methods 0.000 claims description 17
- 230000008859 change Effects 0.000 claims description 16
- 238000001228 spectrum Methods 0.000 claims description 16
- 238000013459 approach Methods 0.000 claims description 13
- 230000005284 excitation Effects 0.000 claims description 12
- 238000013139 quantization Methods 0.000 claims description 12
- 238000004590 computer program Methods 0.000 claims description 10
- 230000004044 response Effects 0.000 claims description 8
- 238000007670 refining Methods 0.000 claims description 2
- 230000011664 signaling Effects 0.000 claims description 2
- 230000003247 decreasing effect Effects 0.000 claims 1
- 239000011295 pitch Substances 0.000 description 81
- 238000005259 measurement Methods 0.000 description 33
- 230000006870 function Effects 0.000 description 19
- 238000001914 filtration Methods 0.000 description 18
- 238000001514 detection method Methods 0.000 description 14
- 238000010586 diagram Methods 0.000 description 13
- 230000007774 longterm Effects 0.000 description 12
- 230000008901 benefit Effects 0.000 description 9
- 238000012546 transfer Methods 0.000 description 8
- 230000005540 biological transmission Effects 0.000 description 6
- 238000011144 upstream manufacturing Methods 0.000 description 5
- 230000003213 activating effect Effects 0.000 description 4
- 230000006978 adaptation Effects 0.000 description 4
- 238000004458 analytical method Methods 0.000 description 4
- 230000000694 effects Effects 0.000 description 4
- 230000007246 mechanism Effects 0.000 description 4
- 230000004913 activation Effects 0.000 description 3
- 230000009286 beneficial effect Effects 0.000 description 3
- 230000006872 improvement Effects 0.000 description 3
- 239000000203 mixture Substances 0.000 description 3
- 238000012545 processing Methods 0.000 description 3
- 238000004422 calculation algorithm Methods 0.000 description 2
- 238000004364 calculation method Methods 0.000 description 2
- 230000007423 decrease Effects 0.000 description 2
- 230000001934 delay Effects 0.000 description 2
- 230000000873 masking effect Effects 0.000 description 2
- 230000003044 adaptive effect Effects 0.000 description 1
- 238000003491 array Methods 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 230000006835 compression Effects 0.000 description 1
- 238000007906 compression Methods 0.000 description 1
- 238000000354 decomposition reaction Methods 0.000 description 1
- 238000009795 derivation Methods 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 230000001066 destructive effect Effects 0.000 description 1
- 238000009499 grossing Methods 0.000 description 1
- 239000000463 material Substances 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000008450 motivation Effects 0.000 description 1
- 230000008447 perception Effects 0.000 description 1
- 238000009527 percussion Methods 0.000 description 1
- 230000008569 process Effects 0.000 description 1
- 230000000750 progressive effect Effects 0.000 description 1
- 238000007493 shaping process Methods 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
- 230000001755 vocal effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/26—Pre-filtering or post-filtering
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/26—Pre-filtering or post-filtering
- G10L19/265—Pre-filtering, e.g. high frequency emphasis prior to encoding
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/022—Blocking, i.e. grouping of samples in time; Choice of analysis windows; Overlap factoring
- G10L19/025—Detection of transients or attacks for time/frequency resolution switching
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/028—Noise substitution, i.e. substituting non-tonal spectral components by noisy source
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/08—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
- G10L19/12—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being a code excitation, e.g. in code excited linear prediction [CELP] vocoders
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/08—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
- G10L19/12—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being a code excitation, e.g. in code excited linear prediction [CELP] vocoders
- G10L19/125—Pitch excitation, e.g. pitch synchronous innovation CELP [PSI-CELP]
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/16—Vocoder architecture
- G10L19/18—Vocoders using multiple modes
- G10L19/22—Mode decision, i.e. based on audio signal content versus external parameters
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/03—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
- G10L25/21—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters the extracted parameters being power information
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/90—Pitch determination of speech signals
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Health & Medical Sciences (AREA)
- Signal Processing (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Computational Linguistics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Electrophonic Musical Instruments (AREA)
- Auxiliary Devices For Music (AREA)
- Filters That Use Time-Delay Elements (AREA)
- Measurement Of Mechanical Vibrations Or Ultrasonic Waves (AREA)
Description
プレおよびポストフィルタリングの両方を適用する時間領域アプローチの例は、以下の非特許文献4,5,6,7,8に示される通りである:
ポストフィルタリングのみが適用される時間領域アプローチの例は、以下の非特許文献9,10,11,12に示される通りである。
過渡現象検出器の例は、以下の非特許文献13に示される通りである。
音響心理学上の関連文献は、以下の非特許文献14,15である。
するのではなく、以前のフレームからのハーモニシティ尺度および現在の、および任意に
は、以前のフレームからの時間的構造尺度に依存する。
-客観的または主観的な利点は、フィルタを活性化することによって得られ、
-有意なアーチファクトは、前記フィルタの活性化によって導入されない。
変換長決定に使用される時間測定は、LTPの決定に使用される時間測定とは完全に異なってもよく、または、それらは、重畳しまたは正確に同じであるが異なる領域に計算されてもよい。
2. 1つの時間的構造尺度<第3の閾値および(現行または先行フレームのためのハーモニシティ)>第4の閾値;
3. (1つの時間的構造尺度、<第5の閾値またはすべての時間尺度<閾値)および現行フレームのためのハーモニシティ>第6の閾値。
しかしながら、場合によっては、時間測定の使用は、不利であり得る。図18におけるスペクトログラムおよび図19における波形は、Fatboy Slimによる「Kalifornia」の始めから、約35ミリ秒の抜粋を示す。それがエネルギーの大きな時間的変動を検出するにつれて、時間平坦性尺度に、および、最大エネルギー変化に依存するLTP決定は、この種の信号のためのLTPを無効にする。
配置の修正および変更および本願明細書において記載されている詳細は、他の当業者にとって明らかであるものと理解される。従って、未決の特許請求の範囲だけによって、そして、本願明細書において実施例の説明および説明として示される具体的な詳細だけでないことによって制限されることが、意図される。
Claims (26)
- 音声コーデックのハーモニックフィルタツールのハーモニシティに依存する制御を実行するための装置(10)であって、
前記音声コーデックによって処理されるべき音声信号(12)のピッチ(18)を決定するように構成されるピッチ推定器(16)と、
前記ピッチ(18)を使用して前記音声信号(12)のハーモニシティの尺度(22)を決定するように構成されるハーモニシティ測定器(20)と、
前記音声信号(12)の時間的構造の特性を測定する、少なくとも1つの時間的構造尺度(26)を前記ピッチ(18)に依存して決定するように構成される時間的構造解析器(24)と、
前記時間的構造尺度(26)および前記ハーモニシティの尺度(22)に依存して、前記ハーモニックフィルタツール(30)を制御するように構成されるコントローラ(28)と、
を備え、
前記ピッチ推定器(16)と前記ハーモニシティ測定器(20)と前記時間的構造解析器(24)とは、元の音声信号と、いくつかの前記元の音声信号のプレ修正バージョンを含めた、前記音声信号(12)の異なるバージョンに基づいて、その決定を実行する、装置。 - 前記ハーモニシティ測定器(20)は、前記ピッチ(18)のピッチ遅延またはその周辺における前記音声信号(12)の正規化された相関あるいはそのプレ修正バージョンを計算することにより、前記ハーモニシティの尺度(22)を決定するように構成される、請求項1に記載の装置。
- 前記ピッチ推定器(16)は、第1のステージおよび第2のステージを含むステージにおいて、前記ピッチ(18)を決定するように構成される、請求項1または請求項2に記載の装置。
- 前記ピッチ推定器(16)は、前記第1のステージにおいて、第1のサンプリングレートのダウンサンプリングされた領域で前記ピッチの予備推定を決定するとともに、前記第2のステージにおいて、前記第1のサンプリングレートより高い第2のサンプリングレートで、前記ピッチの予備推定を精密化する、請求項3に記載の装置。
- 前記ピッチ推定器(16)は、自己相関を使用して前記ピッチ(18)を決定するように構成される、請求項1ないし4のいずれかに記載の装置。
- 前記時間的構造解析器(24)は、前記少なくとも1つの時間的構造尺度(26)を、前記ピッチ(18)に応じて時間的に配置された時間領域の中で決定するように構成される、請求項1ないし5のいずれかに記載の装置。
- 前記時間的構造解析器(24)は、前記ピッチ(18)に依存して、前記時間領域の時間的に過去の先端(38)または前記時間的構造尺度(26)の前記決定に対しての影響がより高い領域の時間的に過去の先端(38)を配置するように構成される、請求項6に記載の装置。
- 前記時間的構造解析器(24)は、前記時間領域の前記時間的に過去の先端(38)または前記時間的構造尺度の前記決定に対しての影響がより高い領域の前記時間的に過去の先端(38)が、前記ピッチ(18)の減少に伴って単調増加する時間的分量分、過去の方向に変位されるように、前記時間領域の前記時間的に過去の先端(38)または前記時間的構造尺度の前記決定に対しての影響がより高い領域の前記時間的に過去の先端(38)を配置するように構成される、請求項6または請求項7に記載の装置。
- 前記時間的構造解析器(24)は、前記時間領域(36)の時間的に未来の先端(40)または前記時間的構造尺度(26)の前記決定に対しての影響がより高い領域の時間的に未来の先端(40)を、前記時間領域の前記時間的に過去の先端(38)または前記時間的構造尺度の前記決定に対する影響がより高い領域の前記時間的に過去の先端(38)から現在のフレーム(34a)の時間的に未来の先端(44)まで拡がる時間的候補領域内における前記音声信号(12)の前記時間的構造に依存して配置するように構成される、請求項7または請求項8に記載の装置。
- 前記時間的構造解析器(24)は、前記時間領域(36)の前記時間的に未来の先端(40)、または前記時間的構造尺度(26)の前記決定に対する影響がより高い領域の前記時間的に未来の先端(40)を配置するために、前記時間的候補領域内の最大エネルギーサンプルと最小エネルギーサンプルとの間の振幅または比率を使用するように構成される、請求項9に記載の装置。
- 前記コントローラ(28)は、
前記少なくとも1つの時間的構造尺度(26)および前記ハーモニシティの尺度(22)が既定の条件を満たしているかをチェックして、チェック結果を得るように構成されるロジック(120)と、
前記チェック結果に依存して、前記ハーモニックフィルタツール(30)をイネーブルとディセーブルの間で切り替えるように構成されるスイッチ(124)と、
を含む、請求項6ないし10のいずれかに記載の装置。 - 前記少なくとも1つの時間的構造尺度(26)は、前記時間領域内における前記音声信号の平均エネルギー変動または最大エネルギー変動を測定し、前記ロジックは、
前記少なくとも1つの時間的構造尺度(26)が既定の第1の閾値より小さく、かつ、前記ハーモニシティの尺度(22)が、現在のフレームおよび/または先行フレームについて、第2の閾値を越える場合、
前記既定の条件を満たすように構成される、請求項11に記載の装置。 - 前記ロジック(120)は、
前記ハーモニシティの尺度(22)が、現在のフレームについて、第3の閾値を越え、かつ、前記ハーモニシティの尺度が、現在のフレームおよび/または先行フレームについて、前記ピッチ(18)のピッチ遅延の増加に伴って減少する第4の閾値を越える場合にも前記既定の条件が満たされるように構成される、請求項12に記載の装置。 - 前記コントローラ(28)は、
制御信号を音声コーデックのデータストリームを介して復号側に明確にシグナリングすること、または、
前記復号側でポストフィルタを制御し、かつ前記復号側での前記ポストフィルタの制御に即してエンコーダ側でプレフィルタを制御するための制御信号を、音声コーデックのデータストリームを介して復号側に明確に送ること
によって、前記ハーモニックフィルタツール(30)を制御するように構成される、請求項1ないし13のいずれかに記載の装置。 - 前記時間的構造解析器(24)は、前記少なくとも1つの時間的構造尺度(26)をスペクトル的に識別して決定して、複数のスペクトル帯域のスペクトル帯域ごとに前記少なくとも1つの時間的構造尺度(26)の1つの値を得るように構成される、請求項1ないし14のいずれかに記載の装置。
- 前記コントローラ(28)は、フレーム単位で前記ハーモニックフィルタツール(30)を制御するように構成され、また前記時間的構造解析器(24)は、前記音声信号(12)のエネルギーを前記フレームのフレームレートより高いサンプルレートでサンプリングして前記音声信号のエネルギーサンプルを得て、前記エネルギーサンプルに基づいて前記少なくとも1つの時間的構造尺度(26)を決定するように構成される、請求項1ないし15のいずれかに記載の装置。
- 前記時間的構造解析器(24)は、前記ピッチ(18)に応じて時間的に配置される時間領域内の前記少なくとも1つの時間的構造尺度(26)を決定するように構成され、また前記時間的構造解析器(24)は、前記時間領域内で直接連続するエネルギーサンプルのペアの間での変化を測定するエネルギー変化値のセットを計算し、前記エネルギー変化値のセットを、各々が前記エネルギー変化値のセットのうちの厳密に1つに依存する最大値演算子または加数の総和を含むスカラー関数にかけることによって、前記エネルギーサンプルに基づいて前記少なくとも1つの時間的構造尺度(26)を決定するように構成される、請求項16に記載の装置。
- 前記時間的構造解析器(24)は、前記音声信号(12)の前記エネルギーの前記サンプリングをハイパスフィルタ処理された領域内で実行するように構成される、請求項16または請求項17のいずれかに記載の装置。
- 前記コントローラ(28)は、前記ハーモニックフィルタツール(30)を制御する際に、前記時間的構造尺度(26)および前記ハーモニシティの尺度(22)に依存して、
前記ハーモニックフィルタツール(30)のプレフィルタおよび/またはポストフィルタのイネーブルおよびディセーブルを切り替える、または
前記ハーモニックフィルタツール(30)のプレフィルタおよび/またはポストフィルタのフィルタ強度を徐々に適合させる
ように構成され、
前記ハーモニックフィルタツール(30)は、プレフィルタおよびポストフィルタのアプローチからなり、前記ハーモニックフィルタツール(30)の前記プレフィルタは、前記音声信号の前記ピッチのハーモニックの範囲内で量子化ノイズを増加させるように構成され、かつ、前記ハーモニックフィルタツール(30)の前記ポストフィルタは、送信されたスペクトルを増加された量子化ノイズに従って再成形するように構成される、または、前記ハーモニックフィルタツール(30)は、ポストフィルタのみのアプローチからなり、前記ハーモニックフィルタツール(30)の前記ポストフィルタは、前記音声信号の前記ピッチの前記ハーモニックス間に発生している量子化ノイズをフィルタ処理するように構成される、
請求項1ないし18のいずれかに記載の装置。 - ハーモニックフィルタツール(30)と、前記ハーモニックフィルタツールのハーモニシティ依存制御を実行するための請求項1ないし19のいずれかに記載の装置と、を含む音声エンコーダまたは音声デコーダ。
- 請求項16ないし18のいずれかに記載のハーモニックフィルタツールのハーモニシティ依存制御を実行するための装置(10)と、
前記エネルギーサンプルに基づいて、前記音声コーデックが処理する音声信号における過渡現象を検出するように構成された過渡現象検出器と、
を含むシステム。 - 請求項21に記載のシステムを備え、検出された前記過渡現象に応じて変換ブロックおよび/または重畳長を切換えるように構成される、変換ベースエンコーダ。
- 請求項21に記載のシステムを備え、検出された前記過渡現象に応じて変換符号化励起モードと符号励起線型予測モードとの間での切換えをサポートするように構成される、音声エンコーダ。
- 前記検出された過渡現象に応じて前記変換符号化励起モードにおける変換ブロックおよび/または重畳長を切換えるように構成される、請求項23に記載の音声エンコーダ。
- 音声コーデックのハーモニックフィルタツールのハーモニシティ依存制御を実行するための方法(10)であって、
前記音声コーデックが処理する音声信号(12)のピッチ(18)を決定するステップと、
前記ピッチ(18)を使用して、前記音声信号(12)のハーモニシティの尺度(22)を決定するステップと、
前記ピッチ(18)に依存して、前記音声信号の時間的構造の特性を測定する、少なくとも1つの時間的構造尺度(26)を決定するステップと、
前記時間的構造尺度(26)および前記ハーモニシティの尺度(22)に依存して、前記ハーモニックフィルタツール(30)を制御するステップと、
を含み、
前記ピッチ(18)の決定と、前記ハーモニシティの尺度(22)の決定と、前記少なくとも1つの時間的構造尺度(26)の決定は、元の音声信号と、いくつかの前記元の音声信号のプレ修正バージョンを含めた、前記音声信号(12)の異なるバージョンに基づいて実行される、
方法。 - コンピュータ上で動作するときに、請求項25に記載の方法を実行するためのプログラムコードを有する、コンピュータプログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2022164445A JP2023015055A (ja) | 2014-07-28 | 2022-10-13 | ハーモニックフィルタツールのハーモニック依存制御 |
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
EP14178810.9 | 2014-07-28 | ||
EP14178810.9A EP2980798A1 (en) | 2014-07-28 | 2014-07-28 | Harmonicity-dependent controlling of a harmonic filter tool |
Related Parent Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2017504673A Division JP6629834B2 (ja) | 2014-07-28 | 2015-07-27 | ハーモニックフィルタツールのハーモニック依存制御 |
Related Child Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2022164445A Division JP2023015055A (ja) | 2014-07-28 | 2022-10-13 | ハーモニックフィルタツールのハーモニック依存制御 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2020052414A JP2020052414A (ja) | 2020-04-02 |
JP7160790B2 true JP7160790B2 (ja) | 2022-10-25 |
Family
ID=51224873
Family Applications (3)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2017504673A Active JP6629834B2 (ja) | 2014-07-28 | 2015-07-27 | ハーモニックフィルタツールのハーモニック依存制御 |
JP2019220392A Active JP7160790B2 (ja) | 2014-07-28 | 2019-12-05 | ハーモニックフィルタツールのハーモニック依存制御 |
JP2022164445A Pending JP2023015055A (ja) | 2014-07-28 | 2022-10-13 | ハーモニックフィルタツールのハーモニック依存制御 |
Family Applications Before (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2017504673A Active JP6629834B2 (ja) | 2014-07-28 | 2015-07-27 | ハーモニックフィルタツールのハーモニック依存制御 |
Family Applications After (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2022164445A Pending JP2023015055A (ja) | 2014-07-28 | 2022-10-13 | ハーモニックフィルタツールのハーモニック依存制御 |
Country Status (18)
Country | Link |
---|---|
US (3) | US10083706B2 (ja) |
EP (4) | EP2980798A1 (ja) |
JP (3) | JP6629834B2 (ja) |
KR (1) | KR102009195B1 (ja) |
CN (2) | CN113450810B (ja) |
AR (1) | AR101341A1 (ja) |
AU (1) | AU2015295519B2 (ja) |
BR (1) | BR112017000348B1 (ja) |
CA (1) | CA2955127C (ja) |
ES (2) | ES2836898T3 (ja) |
MX (1) | MX366278B (ja) |
MY (1) | MY182051A (ja) |
PL (2) | PL3396669T3 (ja) |
PT (2) | PT3175455T (ja) |
RU (1) | RU2691243C2 (ja) |
SG (1) | SG11201700640XA (ja) |
TW (1) | TWI591623B (ja) |
WO (1) | WO2016016190A1 (ja) |
Families Citing this family (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP2980799A1 (en) | 2014-07-28 | 2016-02-03 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus and method for processing an audio signal using a harmonic post-filter |
EP3382701A1 (en) | 2017-03-31 | 2018-10-03 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus and method for post-processing an audio signal using prediction based shaping |
EP3396670B1 (en) * | 2017-04-28 | 2020-11-25 | Nxp B.V. | Speech signal processing |
WO2019091573A1 (en) | 2017-11-10 | 2019-05-16 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus and method for encoding and decoding an audio signal using downsampling or interpolation of scale parameters |
EP3483883A1 (en) * | 2017-11-10 | 2019-05-15 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio coding and decoding with selective postfiltering |
WO2019091576A1 (en) | 2017-11-10 | 2019-05-16 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio encoders, audio decoders, methods and computer programs adapting an encoding and decoding of least significant bits |
EP3483878A1 (en) | 2017-11-10 | 2019-05-15 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio decoder supporting a set of different loss concealment tools |
EP3483879A1 (en) | 2017-11-10 | 2019-05-15 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Analysis/synthesis windowing function for modulated lapped transformation |
EP3483884A1 (en) * | 2017-11-10 | 2019-05-15 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Signal filtering |
EP3483886A1 (en) | 2017-11-10 | 2019-05-15 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Selecting pitch lag |
EP3483880A1 (en) | 2017-11-10 | 2019-05-15 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Temporal noise shaping |
EP3483882A1 (en) | 2017-11-10 | 2019-05-15 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Controlling bandwidth in encoders and/or decoders |
JP6962268B2 (ja) * | 2018-05-10 | 2021-11-05 | 日本電信電話株式会社 | ピッチ強調装置、その方法、およびプログラム |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2004302257A (ja) | 2003-03-31 | 2004-10-28 | Matsushita Electric Ind Co Ltd | 長期ポストフィルタ |
JP2013533983A (ja) | 2010-07-02 | 2013-08-29 | ドルビー・インターナショナル・アーベー | 選択的バスポストフィルタ |
Family Cites Families (52)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US4969192A (en) * | 1987-04-06 | 1990-11-06 | Voicecraft, Inc. | Vector adaptive predictive coder for speech and audio |
US5012517A (en) | 1989-04-18 | 1991-04-30 | Pacific Communication Science, Inc. | Adaptive transform coder having long term predictor |
US5469087A (en) * | 1992-06-25 | 1995-11-21 | Noise Cancellation Technologies, Inc. | Control system using harmonic filters |
JP3122540B2 (ja) * | 1992-08-25 | 2001-01-09 | シャープ株式会社 | ピッチ検出装置 |
DE69614799T2 (de) | 1995-05-10 | 2002-06-13 | Koninkl Philips Electronics Nv | Übertragungssystem und -verfahren für die sprachkodierung mit verbesserter detektion der grundfrequenz |
DE69628103T2 (de) * | 1995-09-14 | 2004-04-01 | Kabushiki Kaisha Toshiba, Kawasaki | Verfahren und Filter zur Hervorbebung von Formanten |
JP3483998B2 (ja) * | 1995-09-14 | 2004-01-06 | 株式会社東芝 | ピッチ強調方法および装置 |
JP2940464B2 (ja) * | 1996-03-27 | 1999-08-25 | 日本電気株式会社 | 音声復号化装置 |
JPH09281995A (ja) * | 1996-04-12 | 1997-10-31 | Nec Corp | 信号符号化装置及び方法 |
CN1180677A (zh) | 1996-10-25 | 1998-05-06 | 中国科学院固体物理研究所 | 纳米添加氧化铝陶瓷的改性方法 |
SE9700772D0 (sv) * | 1997-03-03 | 1997-03-03 | Ericsson Telefon Ab L M | A high resolution post processing method for a speech decoder |
DE19736669C1 (de) | 1997-08-22 | 1998-10-22 | Fraunhofer Ges Forschung | Verfahren und Vorrichtung zum Erfassen eines Anschlags in einem zeitdiskreten Audiosignal sowie Vorrichtung und Verfahren zum Codieren eines Audiosignals |
JP2000206999A (ja) * | 1999-01-19 | 2000-07-28 | Nec Corp | 音声符号伝送装置 |
US6691092B1 (en) * | 1999-04-05 | 2004-02-10 | Hughes Electronics Corporation | Voicing measure as an estimate of signal periodicity for a frequency domain interpolative speech codec system |
CA2388352A1 (en) | 2002-05-31 | 2003-11-30 | Voiceage Corporation | A method and device for frequency-selective pitch enhancement of synthesized speed |
TW594674B (en) * | 2003-03-14 | 2004-06-21 | Mediatek Inc | Encoder and a encoding method capable of detecting audio signal transient |
US20050143979A1 (en) * | 2003-12-26 | 2005-06-30 | Lee Mi S. | Variable-frame speech coding/decoding apparatus and method |
CN1989548B (zh) * | 2004-07-20 | 2010-12-08 | 松下电器产业株式会社 | 语音解码装置及补偿帧生成方法 |
EP1789956B1 (fr) * | 2004-09-16 | 2010-08-04 | France Telecom | Procede de traitement d'un signal sonore bruite et dispositif pour la mise en oeuvre du procede |
CN101185127B (zh) * | 2005-04-01 | 2014-04-23 | 高通股份有限公司 | 用于编码和解码语音信号的高频带部分的方法和设备 |
DE602006012637D1 (de) | 2005-04-01 | 2010-04-15 | Qualcomm Inc | Vorrichtung und Verfahren für die Teilband-Sprachkodierung |
US7548853B2 (en) * | 2005-06-17 | 2009-06-16 | Shmunk Dmitry V | Scalable compressed audio bit stream and codec using a hierarchical filterbank and multichannel joint coding |
US7546240B2 (en) * | 2005-07-15 | 2009-06-09 | Microsoft Corporation | Coding with improved time resolution for selected segments via adaptive block transformation of a group of samples from a subband decomposition |
JPWO2007088853A1 (ja) * | 2006-01-31 | 2009-06-25 | パナソニック株式会社 | 音声符号化装置、音声復号装置、音声符号化システム、音声符号化方法及び音声復号方法 |
CN101496095B (zh) * | 2006-07-31 | 2012-11-21 | 高通股份有限公司 | 用于信号变化检测的系统、方法及设备 |
EP2080194B1 (fr) * | 2006-10-20 | 2011-12-07 | France Telecom | Attenuation du survoisement, notamment pour la generation d'une excitation aupres d'un decodeur, en absence d'information |
US8036899B2 (en) * | 2006-10-20 | 2011-10-11 | Tal Sobol-Shikler | Speech affect editing systems |
US20100010810A1 (en) * | 2006-12-13 | 2010-01-14 | Panasonic Corporation | Post filter and filtering method |
JP5084360B2 (ja) * | 2007-06-13 | 2012-11-28 | 三菱電機株式会社 | 音声符号化装置及び音声復号装置 |
EP2015293A1 (en) * | 2007-06-14 | 2009-01-14 | Deutsche Thomson OHG | Method and apparatus for encoding and decoding an audio signal using adaptively switched temporal resolution in the spectral domain |
EP2210427B1 (en) * | 2007-09-26 | 2015-05-06 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus, method and computer program for extracting an ambient signal |
ATE500588T1 (de) * | 2008-01-04 | 2011-03-15 | Dolby Sweden Ab | Audiokodierer und -dekodierer |
US9142221B2 (en) * | 2008-04-07 | 2015-09-22 | Cambridge Silicon Radio Limited | Noise reduction |
US20090319263A1 (en) * | 2008-06-20 | 2009-12-24 | Qualcomm Incorporated | Coding of transitional speech frames for low-bit-rate applications |
ES2758799T3 (es) * | 2008-07-11 | 2020-05-06 | Fraunhofer Ges Forschung | Método y aparato para codificar y decodificar una señal de audio y programas informáticos |
WO2010031049A1 (en) * | 2008-09-15 | 2010-03-18 | GH Innovation, Inc. | Improving celp post-processing for music signals |
EP3598446B1 (en) * | 2009-01-16 | 2021-12-22 | Dolby International AB | Cross product enhanced harmonic transposition |
EP2226794B1 (en) | 2009-03-06 | 2017-11-08 | Harman Becker Automotive Systems GmbH | Background noise estimation |
CN102169694B (zh) * | 2010-02-26 | 2012-10-17 | 华为技术有限公司 | 生成心理声学模型的方法及装置 |
EP2569767B1 (en) * | 2010-05-11 | 2014-06-11 | Telefonaktiebolaget LM Ericsson (publ) | Method and arrangement for processing of audio signals |
US8738385B2 (en) | 2010-10-20 | 2014-05-27 | Broadcom Corporation | Pitch-based pre-filtering and post-filtering for compression of audio signals |
CA2929800C (en) * | 2010-12-29 | 2017-12-19 | Samsung Electronics Co., Ltd. | Apparatus and method for encoding/decoding for high-frequency bandwidth extension |
CA2827277C (en) * | 2011-02-14 | 2016-08-30 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Linear prediction based coding scheme using spectral domain noise shaping |
CN102195288B (zh) * | 2011-05-20 | 2013-10-23 | 西安理工大学 | 一种有源调谐型混合滤波器及进行有源调谐的控制方法 |
US8731911B2 (en) | 2011-12-09 | 2014-05-20 | Microsoft Corporation | Harmonicity-based single-channel speech quality estimation |
CN103325384A (zh) | 2012-03-23 | 2013-09-25 | 杜比实验室特许公司 | 谐度估计、音频分类、音调确定及噪声估计 |
WO2013142726A1 (en) * | 2012-03-23 | 2013-09-26 | Dolby Laboratories Licensing Corporation | Determining a harmonicity measure for voice processing |
CN104718572B (zh) * | 2012-06-04 | 2018-07-31 | 三星电子株式会社 | 音频编码方法和装置、音频解码方法和装置及采用该方法和装置的多媒体装置 |
DE102014113392B4 (de) | 2014-05-07 | 2022-08-25 | Gizmo Packaging Limited | Verschlussvorrichtung für einen Behälter |
EP3000110B1 (en) * | 2014-07-28 | 2016-12-07 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Selection of one of a first encoding algorithm and a second encoding algorithm using harmonics reduction |
JP2017122908A (ja) * | 2016-01-06 | 2017-07-13 | ヤマハ株式会社 | 信号処理装置および信号処理方法 |
EP3483883A1 (en) * | 2017-11-10 | 2019-05-15 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio coding and decoding with selective postfiltering |
-
2014
- 2014-07-28 EP EP14178810.9A patent/EP2980798A1/en not_active Withdrawn
-
2015
- 2015-07-21 TW TW104123539A patent/TWI591623B/zh active
- 2015-07-27 SG SG11201700640XA patent/SG11201700640XA/en unknown
- 2015-07-27 RU RU2017105808A patent/RU2691243C2/ru active
- 2015-07-27 PL PL18177372T patent/PL3396669T3/pl unknown
- 2015-07-27 MX MX2017001240A patent/MX366278B/es active IP Right Grant
- 2015-07-27 ES ES18177372T patent/ES2836898T3/es active Active
- 2015-07-27 JP JP2017504673A patent/JP6629834B2/ja active Active
- 2015-07-27 EP EP20200501.3A patent/EP3779983A1/en active Pending
- 2015-07-27 MY MYPI2017000031A patent/MY182051A/en unknown
- 2015-07-27 CA CA2955127A patent/CA2955127C/en active Active
- 2015-07-27 ES ES15744175.9T patent/ES2685574T3/es active Active
- 2015-07-27 PT PT15744175T patent/PT3175455T/pt unknown
- 2015-07-27 WO PCT/EP2015/067160 patent/WO2016016190A1/en active Application Filing
- 2015-07-27 EP EP15744175.9A patent/EP3175455B1/en active Active
- 2015-07-27 BR BR112017000348-1A patent/BR112017000348B1/pt active IP Right Grant
- 2015-07-27 AU AU2015295519A patent/AU2015295519B2/en active Active
- 2015-07-27 PT PT181773722T patent/PT3396669T/pt unknown
- 2015-07-27 KR KR1020177005451A patent/KR102009195B1/ko active IP Right Grant
- 2015-07-27 PL PL15744175T patent/PL3175455T3/pl unknown
- 2015-07-27 EP EP18177372.2A patent/EP3396669B1/en active Active
- 2015-07-27 CN CN202110519799.5A patent/CN113450810B/zh active Active
- 2015-07-27 CN CN201580042675.5A patent/CN106575509B/zh active Active
- 2015-07-28 AR ARP150102395A patent/AR101341A1/es active IP Right Grant
-
2017
- 2017-01-20 US US15/411,662 patent/US10083706B2/en active Active
-
2018
- 2018-08-30 US US16/118,316 patent/US10679638B2/en active Active
-
2019
- 2019-12-05 JP JP2019220392A patent/JP7160790B2/ja active Active
-
2020
- 2020-05-27 US US16/885,109 patent/US11581003B2/en active Active
-
2022
- 2022-10-13 JP JP2022164445A patent/JP2023015055A/ja active Pending
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2004302257A (ja) | 2003-03-31 | 2004-10-28 | Matsushita Electric Ind Co Ltd | 長期ポストフィルタ |
JP2013533983A (ja) | 2010-07-02 | 2013-08-29 | ドルビー・インターナショナル・アーベー | 選択的バスポストフィルタ |
Also Published As
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP7160790B2 (ja) | ハーモニックフィルタツールのハーモニック依存制御 | |
KR101698905B1 (ko) | 정렬된 예견 부를 사용하여 오디오 신호를 인코딩하고 디코딩하기 위한 장치 및 방법 | |
JP6086999B2 (ja) | ハーモニクス低減を使用して第1符号化アルゴリズムと第2符号化アルゴリズムの一方を選択する装置及び方法 | |
US20190198031A1 (en) | Noise filling without side information for celp-like coders | |
KR102426050B1 (ko) | 피치 지연 선택 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20191219 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20201118 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20210105 |
|
A601 | Written request for extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A601 Effective date: 20210326 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20210705 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20211207 |
|
A601 | Written request for extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A601 Effective date: 20220302 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20220601 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20220913 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20221013 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 7160790 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |