JP2023015055A - ハーモニックフィルタツールのハーモニック依存制御 - Google Patents
ハーモニックフィルタツールのハーモニック依存制御 Download PDFInfo
- Publication number
- JP2023015055A JP2023015055A JP2022164445A JP2022164445A JP2023015055A JP 2023015055 A JP2023015055 A JP 2023015055A JP 2022164445 A JP2022164445 A JP 2022164445A JP 2022164445 A JP2022164445 A JP 2022164445A JP 2023015055 A JP2023015055 A JP 2023015055A
- Authority
- JP
- Japan
- Prior art keywords
- pitch
- temporal structure
- measurement
- filter
- harmonicity
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000005259 measurement Methods 0.000 claims abstract description 56
- 230000001419 dependent effect Effects 0.000 claims abstract description 24
- 230000002123 temporal effect Effects 0.000 claims description 112
- 238000000034 method Methods 0.000 claims description 39
- 230000005236 sound signal Effects 0.000 claims description 34
- 230000001052 transient effect Effects 0.000 claims description 33
- 230000003595 spectral effect Effects 0.000 claims description 28
- 230000006870 function Effects 0.000 claims description 21
- 238000011045 prefiltration Methods 0.000 claims description 20
- 238000001914 filtration Methods 0.000 claims description 19
- 230000008859 change Effects 0.000 claims description 18
- 238000005070 sampling Methods 0.000 claims description 17
- 238000001228 spectrum Methods 0.000 claims description 17
- 238000013459 approach Methods 0.000 claims description 13
- 238000004590 computer program Methods 0.000 claims description 11
- 230000005284 excitation Effects 0.000 claims description 11
- 238000013139 quantization Methods 0.000 claims description 11
- 230000004044 response Effects 0.000 claims description 8
- 238000004458 analytical method Methods 0.000 claims description 5
- 230000004913 activation Effects 0.000 claims description 4
- 230000007423 decrease Effects 0.000 claims description 4
- 230000011664 signaling Effects 0.000 claims description 2
- 230000009849 deactivation Effects 0.000 claims 1
- 230000007704 transition Effects 0.000 claims 1
- 239000011295 pitch Substances 0.000 description 82
- 238000001514 detection method Methods 0.000 description 14
- 238000010586 diagram Methods 0.000 description 14
- 230000007774 longterm Effects 0.000 description 12
- 230000008901 benefit Effects 0.000 description 9
- 238000012546 transfer Methods 0.000 description 8
- 230000005540 biological transmission Effects 0.000 description 6
- 238000011144 upstream manufacturing Methods 0.000 description 5
- 230000003213 activating effect Effects 0.000 description 4
- 230000000694 effects Effects 0.000 description 4
- 230000007246 mechanism Effects 0.000 description 4
- 230000006978 adaptation Effects 0.000 description 3
- 230000009286 beneficial effect Effects 0.000 description 3
- 239000000203 mixture Substances 0.000 description 3
- 238000012545 processing Methods 0.000 description 3
- 238000004422 calculation algorithm Methods 0.000 description 2
- 238000004364 calculation method Methods 0.000 description 2
- 230000006872 improvement Effects 0.000 description 2
- 230000000873 masking effect Effects 0.000 description 2
- 101100521334 Mus musculus Prom1 gene Proteins 0.000 description 1
- 230000003044 adaptive effect Effects 0.000 description 1
- 238000003491 array Methods 0.000 description 1
- 238000005311 autocorrelation function Methods 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 230000006835 compression Effects 0.000 description 1
- 238000007906 compression Methods 0.000 description 1
- 238000000354 decomposition reaction Methods 0.000 description 1
- 238000009795 derivation Methods 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 230000001066 destructive effect Effects 0.000 description 1
- 238000009499 grossing Methods 0.000 description 1
- 239000000463 material Substances 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000008450 motivation Effects 0.000 description 1
- 230000008447 perception Effects 0.000 description 1
- 238000009527 percussion Methods 0.000 description 1
- 230000008569 process Effects 0.000 description 1
- 230000000750 progressive effect Effects 0.000 description 1
- 238000007670 refining Methods 0.000 description 1
- 238000007493 shaping process Methods 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
- 230000036962 time dependent Effects 0.000 description 1
- 230000001755 vocal effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/90—Pitch determination of speech signals
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/26—Pre-filtering or post-filtering
- G10L19/265—Pre-filtering, e.g. high frequency emphasis prior to encoding
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/022—Blocking, i.e. grouping of samples in time; Choice of analysis windows; Overlap factoring
- G10L19/025—Detection of transients or attacks for time/frequency resolution switching
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/028—Noise substitution, i.e. substituting non-tonal spectral components by noisy source
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/08—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
- G10L19/12—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being a code excitation, e.g. in code excited linear prediction [CELP] vocoders
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/08—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
- G10L19/12—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being a code excitation, e.g. in code excited linear prediction [CELP] vocoders
- G10L19/125—Pitch excitation, e.g. pitch synchronous innovation CELP [PSI-CELP]
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/16—Vocoder architecture
- G10L19/18—Vocoders using multiple modes
- G10L19/22—Mode decision, i.e. based on audio signal content versus external parameters
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/26—Pre-filtering or post-filtering
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/03—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
- G10L25/21—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters the extracted parameters being power information
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Health & Medical Sciences (AREA)
- Signal Processing (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Computational Linguistics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Electrophonic Musical Instruments (AREA)
- Measurement Of Mechanical Vibrations Or Ultrasonic Waves (AREA)
- Filters That Use Time-Delay Elements (AREA)
- Auxiliary Devices For Music (AREA)
Abstract
【解決手段】ハーモニックフィルタツールの制御に依存したハーモニシティ(及び時間測定)依存性の制御を行うための装置10において、音声信号12のピッチ18を決定するピッチ推定器16と、ピッチ18を使用している音声信号12のハーモニシティの測定22を決定するハーモニシティ測定器20と、ピッチ18に応じて音声信号12の時間的構造の特徴を測定している少なくとも一つの時間的構造測定26を決定する時間的構造解析器24と、時間的構造測定26およびハーモニシティの測定22に応じてハーモニックフィルタツール30を制御する制御信号14を出力するコントローラ28と、を備える。
【選択図】図4
Description
プレおよびポストフィルタリングの両方を適用する時間領域アプローチの例は、以下の非特許文献4,5,6,7,8に示される通りである:
ポストフィルタリングのみが適用される時間領域アプローチの例は、以下の非特許文献9,10,11,12に示される通りである。
トランジェント検出器の例は、以下の非特許文献13に示される通りである。
音響心理学上の関連文献は、以下の非特許文献14,15である。
-客観的または主観的な利点は、フィルタを活性化することによって得られ、
-有意なアーチファクトは、前記フィルタの活性化によって導入されない。
もしくは
max(norm_corr(curr),norm_corr(prev))>0.5の場合
現在のフレームは、いくつかのハーモニックコンテンツを含む(bit=1)
変換長決定に使用される時間測定は、LTPの決定に使用される時間測定とは完全に異なってもよく、または、それらは、オーバーラップしまたは厳密にに同じであるが異なる領域に計算されてもよい。
2.
1つの時間的構造の大きさ<第3の閾値および(現行または先行フレームのためのハーモニシティ)>第4の閾値;
3.
(1つの時間的構造の大きさ、<第5の閾値またはすべての時間の大きさ<閾値)および現行フレームのためのハーモニシティ>第6の閾値。
しかしながら、場合によっては、時間の大きさの使用は、不利であり得る。図18におけるスペクトログラムおよび図19における波形は、Fatboy Slimによる「Kalifornia」の始めから、約35ミリ秒の抜粋を示す。それがエネルギーの大きな時間的変動を検出するにつれて、時間平坦性の大きさに、および、最大エネルギー変化に依存するLTP決定は、この種の信号のためのLTPをディセーブルにする。
配置の修正および変更および本願明細書において記載されている詳細は、他の当業者にとって明らかであるものと理解される。従って、未決の特許請求の範囲だけによって、そして、本願明細書において実施例の記述および説明として示される具体的な詳細のみでないことによって制限されることが、意図される。
Claims (27)
- 音声コーデックのハーモニックフィルタツールのハーモニシティに依存する制御を実行するための装置(10)であって、
音声コーデックによって処理されるべき音声信号(12)のピッチ(18)を決定するように構成されるピッチ推定器(16)と;
ピッチ(18)を使用している音声信号(12)のハーモニシティの測定(22)を決定するように構成されるハーモニシティ測定器(20)と;
ピッチ(18)に応じて、音声信号(12)の時間的構造の特徴を測定している少なくとも一つの時間的構造測定(26)を決定するように構成される時間的構造解析器(24)と;
時間的構造測定(26)およびハーモニシティの測定(22)に応じてハーモニックフィルタツール(30)を制御するように構成されたコントローラ(28)とを備えた、装置。 - 前記ハーモニシティ測定器(20)は、音声信号(12)の正規化された相関あるいは前記ピッチ(18)のピッチ-遅延において、または、その周辺で、そのプレ修正バージョンを計算することによりハーモニシティの測定(22)を決定するように構成される、請求項1に記載の装置。
- 前記ピッチ推定器(16)は、第1のステージおよび第2のステージから成るステージにおける前記ピッチ(18)を決定するように構成されている、請求項1または2に記載の装置。
- 前記ピッチ推定器(16)は、前記第1のステージの中で、第1のサンプルレートのダウンサンプリングされた領域で前記ピッチの予備推定を決定するとともに、前記第2のステージの中で、前記第1のサンプリングレートより高い第2のサンプリングレートで、前記ピッチの予備推定を精製する、請求項3に記載の装置。
- 前記ピッチ推定器(16)は、自己相関を使用して前記ピッチ(18)を決定するように構成される、請求項1ないし4のいずれかに記載の装置。
- 前記時間的構造解析器(24)が前記ピッチ(18)に応じて時間的に配置された時間領域の中で少なくとも一つの時間的構造測定(26)を決定するように構成される、請求項1ないし5のいずれかに記載の装置。
- 前記時間的構造解析器(24)は、前記ピッチ(18)に依存して、前記時間領域の、または前記時間的構造測定(26)の前記決定へのより高い影響の領域の時間的に過去の先端(38)を配置するように構成される、請求項6に記載の装置。
- 前記時間的構造アナライザ(24)は、時間領域の、または時間的構造測定の前記決定へのより高い影響の領域の時間的に過去の先端(38)が、前記ピッチ(18)の減少を伴う時間量の単調増加により過去の方向に遷移するように、時間領域の、または時間的構造測定の前記決定へのより高い影響の領域の時間的に過去の先端(38)を配置するように構成されている、請求項6または7に記載の装置。
- 時間的構造解析器(24)は、時間領域の、または時間的構造測定の前記決定へのより高い影響の領域の時間的に過去の先端(38)から現在のフレーム(34a)の時間的に未来の先端(44)まで延びる時間候補領域内で前記音声信号(12)の時間的構造に依存する、時間的構造測定(26)の決定へのより大きな影響の、時間的に未来の先端(40)を配置するように構成された、請求項7または8に記載の装置。
- 時間的構造解析器(24)は、時間領域(36)の、あるいは時間的構造測定(26)の前記決定へのより高い影響の領域の時間的に未来の見出し端を配置するための時間候補領域内で振幅または最大および最小のエネルギーサンプル間の比率を使用するように構成されている、請求項9に記載の装置。
- 前記コントローラ(28)は、
チェック結果を得るために、予め定められた条件が、少なくとも一つの時間的構造測定(26)およびハーモニシティの測定(22)によって適合されるかどうか調べるように構成されるロジック(120);
および、
前記チェック結果に依存して前記ハーモニックフィルタツール(30)を有効および無効の間で切り替わるように構成されたスイッチ(124)を含む、請求項1ないし10のいずれかに記載の装置。 - 少なくとも一つの時間的構造測定(26)は、時間領域の中で音声信号の平均または最大エネルギー変化を測定し、ロジックは、
少なくとも一つの時間的構造測定(26)が、予め定められた第1の閾値より小さく、かつ、ハーモニシティの測定(22)は、現行フレームおよび/または先行フレームのために、第2の閾値を越える場合、の両方を満たす場合、予め定められた条件を満たすように、設定される、請求項11に記載の装置。 - 前記ロジック(120)は、予め定められた条件が、ハーモニシティの測定(22)は、現行フレームのために、第3の閾値を越え、かつ、ハーモニシティの測定は、現行フレームおよび/または先行フレームのために、ピッチ(18)のピッチ遅延の増加によって減少する第4の閾値を越える場合にも満たされるように、構成されている、請求項12に記載の装置。
- 前記コントローラ(28)が、デコード側に音声コーデックのデータストリームにより明確に制御信号を送ることにより、または、
デコード側でポストフィルタを制御するためにデコード側に音声コーデッのデータストリームにより明確に制御信号の信号を送ることにより、かつデコード側でポストフィルタの制御に沿って、エンコーダ側でプレフィルタを制御することにより、ハーモニックフィルタツール(30)を制御するように構成されている、請求項1ないし13のいずれかに記載の装置。 - 時間的構造解析器(24)が、複数のスペクトル帯域のスペクトル帯域につき少なくとも一つの時間的構造測定(26)の1値を得るために、スペクトル識別方法の少なくとも1つの時間的構造測定(26)を決定するように構成される、請求項1ないし14のいずれかに記載の装置。
- 前記コントローラ(28)は、フレームの単位で前記ハーモニックフィルタツール(30)を制御するように構成され、かつ前記時間的構造解析器(24)は、音声信号のエネルギーサンプルを得るためにフレームのフレーム率より高いサンプルレートで音声信号(12)のエネルギーをサンプリングし、エネルギーサンプルに基いて少なくとも一つの時間的構造計測(26)を決定するように構成される請求項1ないし15のいずれかに記載の装置。
- 時間的構造解析器(24)は、ピッチ(18)に応じて時間的に配置される時間領域内で少なくとも一つの時間的構造測定(26)を決定するように構成され、かつ、時間的構造解析器(24)は、時間領域内でエネルギーサンプルの直ちに連続的なエネルギーサンプルの対の間で変化を測定するエネルギー変化値のセットを計算することによりエネルギーサンプルに基づいて少なくとも1つの時間的構造測定(26)を決定するように構成され、エネルギー変化値のセットを、各々エネルギー変化値のセットの正確に1つに依存する最大値演算子または加数の総和を含むスカラー関数に掛けさせる、請求項16に記載の装置。
- 前記時間スペクトル解析器(24)は、ハイパスフィルタリング領域内で音声信号(12)のエネルギーのサンプリングを実行するように構成される、請求項16または17のいずれかに記載の装置。
- ピッチ推定器(16)、ハーモニシティ測定器(20)および時間的構造解析器(24)は、元の音声信号およびその若干のプレ修正バージョンを含む音声信号(12)の異なるバージョンに基づいて、その決定を実行する、請求項1ないし18のいずれかに記載の装置。
- コントローラ(28)は、時間的構造測定(26)およびハーモニシティの測定(22)に依存して、ハーモニックフィルタツール(30)を制御する際に、
ハーモニックフィルタツール(30)のプレフィルタおよび/またはポストフィルタの有効化および無効化を切り替え、または
ハーモニックフィルタツール(30)のプレフィルタおよび/またはポストフィルタのフィルタ強度を徐々に適応し、
ハーモニックフィルタツール(30)は、プレフィルタさらにポストフィルタアプローチからなり、かつ、ハーモニックフィルタツール(30)のプレフィルタは、音声信号のピッチのハーモニックの範囲内で量子化ノイズを増加させるように構成され、かつ、ハーモニックフィルタツール(30)のポストフィルタは、したがって、送信されたスペクトルを再成形するように構成される、または、ハーモニックフィルタツール(30)は、ポストフィルタのみのアプローチからなり、かつ、ハーモニックフィルタツール(30)のポストフィルタは、音声信号のピッチのハーモニックス間に発生している量子化ノイズをフィルタリングするように構成される、請求項1ないし19のいずれかに記載の装置。 - ハーモニックフィルタツール(30)および請求項1ないし20のいずれかに記載のハーモニックフィルタツールのハーモニシティ依存制御を実行するための装置を含む音声エンコーダまたは音声デコーダ。
- 請求項16ないし18のいずれかに記載のハーモニックフィルタツールのハーモニシティ依存制御を実行するための装置(10)と、
エネルギーサンプルに基づく音声コーデックによって処理されるべき音声信号の過渡現象を検出するように構成された過渡現象検出器とを含むシステム。 - 請求項22に記載のシステムを含み、変換ブロックおよび/または検出された過渡現象に応じた重畳長を切換えるように構成された、変換ベースエンコーダ。
- 検出された過渡現象に応じて変換符号化励起モードおよび符号励起線型予測モードを切り替えることをサポートするように構成された、請求項22に記載の音声エンコーダ。
- 検出された過渡現象に応じて変換ブロックおよび/または変換符号化励起モードにおける重畳長を切換えるように構成される、請求項24に記載の音声エンコーダ。
- 音声コーデックのハーモニックフィルタツールのハーモニシティ依存制御を実行するための方法(10)であって、
音声コーデックによって処理されるべき音声信号(12)のピッチ(18)を決定する工程と;
ピッチ(18)を使用している音声信号(12)のハーモニシティの測定(22)を決定する工程と;
ピッチ(18)に応じて、音声信号の時間的構造の特性を測定している少なくとも一つの時間的構造測定(26)を決定する工程と;
時間的構造測定(26)およびハーモニシティの測定(22)に応じてハーモニックフィルタツール(30)を制御する工程とを含む、方法。 - コンピュータ上で動作するときに、請求項26による方法を実行するためのプログラムコードを有する、コンピュータプログラム。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
EP14178810.9 | 2014-07-28 | ||
EP14178810.9A EP2980798A1 (en) | 2014-07-28 | 2014-07-28 | Harmonicity-dependent controlling of a harmonic filter tool |
JP2019220392A JP7160790B2 (ja) | 2014-07-28 | 2019-12-05 | ハーモニックフィルタツールのハーモニック依存制御 |
Related Parent Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2019220392A Division JP7160790B2 (ja) | 2014-07-28 | 2019-12-05 | ハーモニックフィルタツールのハーモニック依存制御 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2023015055A true JP2023015055A (ja) | 2023-01-31 |
JP7568695B2 JP7568695B2 (ja) | 2024-10-16 |
Family
ID=51224873
Family Applications (3)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2017504673A Active JP6629834B2 (ja) | 2014-07-28 | 2015-07-27 | ハーモニックフィルタツールのハーモニック依存制御 |
JP2019220392A Active JP7160790B2 (ja) | 2014-07-28 | 2019-12-05 | ハーモニックフィルタツールのハーモニック依存制御 |
JP2022164445A Active JP7568695B2 (ja) | 2014-07-28 | 2022-10-13 | ハーモニックフィルタツールのハーモニック依存制御 |
Family Applications Before (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2017504673A Active JP6629834B2 (ja) | 2014-07-28 | 2015-07-27 | ハーモニックフィルタツールのハーモニック依存制御 |
JP2019220392A Active JP7160790B2 (ja) | 2014-07-28 | 2019-12-05 | ハーモニックフィルタツールのハーモニック依存制御 |
Country Status (18)
Country | Link |
---|---|
US (3) | US10083706B2 (ja) |
EP (4) | EP2980798A1 (ja) |
JP (3) | JP6629834B2 (ja) |
KR (1) | KR102009195B1 (ja) |
CN (2) | CN106575509B (ja) |
AR (1) | AR101341A1 (ja) |
AU (1) | AU2015295519B2 (ja) |
BR (1) | BR112017000348B1 (ja) |
CA (1) | CA2955127C (ja) |
ES (2) | ES2685574T3 (ja) |
MX (1) | MX366278B (ja) |
MY (1) | MY182051A (ja) |
PL (2) | PL3396669T3 (ja) |
PT (2) | PT3396669T (ja) |
RU (1) | RU2691243C2 (ja) |
SG (1) | SG11201700640XA (ja) |
TW (1) | TWI591623B (ja) |
WO (1) | WO2016016190A1 (ja) |
Families Citing this family (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP2980799A1 (en) | 2014-07-28 | 2016-02-03 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus and method for processing an audio signal using a harmonic post-filter |
EP3382701A1 (en) * | 2017-03-31 | 2018-10-03 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus and method for post-processing an audio signal using prediction based shaping |
EP3396670B1 (en) * | 2017-04-28 | 2020-11-25 | Nxp B.V. | Speech signal processing |
EP3483879A1 (en) | 2017-11-10 | 2019-05-15 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Analysis/synthesis windowing function for modulated lapped transformation |
WO2019091573A1 (en) | 2017-11-10 | 2019-05-16 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus and method for encoding and decoding an audio signal using downsampling or interpolation of scale parameters |
EP3483880A1 (en) | 2017-11-10 | 2019-05-15 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Temporal noise shaping |
EP3483886A1 (en) | 2017-11-10 | 2019-05-15 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Selecting pitch lag |
WO2019091576A1 (en) | 2017-11-10 | 2019-05-16 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio encoders, audio decoders, methods and computer programs adapting an encoding and decoding of least significant bits |
EP3483884A1 (en) * | 2017-11-10 | 2019-05-15 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Signal filtering |
EP3483883A1 (en) * | 2017-11-10 | 2019-05-15 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio coding and decoding with selective postfiltering |
EP3483882A1 (en) | 2017-11-10 | 2019-05-15 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Controlling bandwidth in encoders and/or decoders |
EP3483878A1 (en) | 2017-11-10 | 2019-05-15 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio decoder supporting a set of different loss concealment tools |
JP6962268B2 (ja) * | 2018-05-10 | 2021-11-05 | 日本電信電話株式会社 | ピッチ強調装置、その方法、およびプログラム |
Family Cites Families (55)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US4969192A (en) * | 1987-04-06 | 1990-11-06 | Voicecraft, Inc. | Vector adaptive predictive coder for speech and audio |
US5012517A (en) | 1989-04-18 | 1991-04-30 | Pacific Communication Science, Inc. | Adaptive transform coder having long term predictor |
US5469087A (en) * | 1992-06-25 | 1995-11-21 | Noise Cancellation Technologies, Inc. | Control system using harmonic filters |
JP3122540B2 (ja) * | 1992-08-25 | 2001-01-09 | シャープ株式会社 | ピッチ検出装置 |
CN1155942C (zh) * | 1995-05-10 | 2004-06-30 | 皇家菲利浦电子有限公司 | 具有改进的音调检测的编码语音传输系统和方法 |
EP0763818B1 (en) * | 1995-09-14 | 2003-05-14 | Kabushiki Kaisha Toshiba | Formant emphasis method and formant emphasis filter device |
JP3483998B2 (ja) * | 1995-09-14 | 2004-01-06 | 株式会社東芝 | ピッチ強調方法および装置 |
JP2940464B2 (ja) * | 1996-03-27 | 1999-08-25 | 日本電気株式会社 | 音声復号化装置 |
JPH09281995A (ja) * | 1996-04-12 | 1997-10-31 | Nec Corp | 信号符号化装置及び方法 |
CN1180677A (zh) | 1996-10-25 | 1998-05-06 | 中国科学院固体物理研究所 | 纳米添加氧化铝陶瓷的改性方法 |
SE9700772D0 (sv) * | 1997-03-03 | 1997-03-03 | Ericsson Telefon Ab L M | A high resolution post processing method for a speech decoder |
DE19736669C1 (de) | 1997-08-22 | 1998-10-22 | Fraunhofer Ges Forschung | Verfahren und Vorrichtung zum Erfassen eines Anschlags in einem zeitdiskreten Audiosignal sowie Vorrichtung und Verfahren zum Codieren eines Audiosignals |
JP2000206999A (ja) * | 1999-01-19 | 2000-07-28 | Nec Corp | 音声符号伝送装置 |
US6691092B1 (en) * | 1999-04-05 | 2004-02-10 | Hughes Electronics Corporation | Voicing measure as an estimate of signal periodicity for a frequency domain interpolative speech codec system |
CA2388352A1 (en) | 2002-05-31 | 2003-11-30 | Voiceage Corporation | A method and device for frequency-selective pitch enhancement of synthesized speed |
TW594674B (en) * | 2003-03-14 | 2004-06-21 | Mediatek Inc | Encoder and a encoding method capable of detecting audio signal transient |
JP2004302257A (ja) * | 2003-03-31 | 2004-10-28 | Matsushita Electric Ind Co Ltd | 長期ポストフィルタ |
US20050143979A1 (en) * | 2003-12-26 | 2005-06-30 | Lee Mi S. | Variable-frame speech coding/decoding apparatus and method |
CN1989548B (zh) * | 2004-07-20 | 2010-12-08 | 松下电器产业株式会社 | 语音解码装置及补偿帧生成方法 |
WO2006032760A1 (fr) * | 2004-09-16 | 2006-03-30 | France Telecom | Procede de traitement d'un signal sonore bruite et dispositif pour la mise en œuvre du procede |
JP5129117B2 (ja) * | 2005-04-01 | 2013-01-23 | クゥアルコム・インコーポレイテッド | 音声信号の高帯域部分を符号化及び復号する方法及び装置 |
CN101180676B (zh) * | 2005-04-01 | 2011-12-14 | 高通股份有限公司 | 用于谱包络表示的向量量化的方法和设备 |
US7548853B2 (en) * | 2005-06-17 | 2009-06-16 | Shmunk Dmitry V | Scalable compressed audio bit stream and codec using a hierarchical filterbank and multichannel joint coding |
US7546240B2 (en) * | 2005-07-15 | 2009-06-09 | Microsoft Corporation | Coding with improved time resolution for selected segments via adaptive block transformation of a group of samples from a subband decomposition |
JPWO2007088853A1 (ja) * | 2006-01-31 | 2009-06-25 | パナソニック株式会社 | 音声符号化装置、音声復号装置、音声符号化システム、音声符号化方法及び音声復号方法 |
TWI467979B (zh) * | 2006-07-31 | 2015-01-01 | Qualcomm Inc | 用於信號改變偵測之系統、方法及裝置 |
US8036899B2 (en) * | 2006-10-20 | 2011-10-11 | Tal Sobol-Shikler | Speech affect editing systems |
JP5289319B2 (ja) * | 2006-10-20 | 2013-09-11 | フランス・テレコム | 隠蔽フレーム(パケット)を生成するための方法、プログラムおよび装置 |
WO2008072701A1 (ja) * | 2006-12-13 | 2008-06-19 | Panasonic Corporation | ポストフィルタおよびフィルタリング方法 |
JP5084360B2 (ja) * | 2007-06-13 | 2012-11-28 | 三菱電機株式会社 | 音声符号化装置及び音声復号装置 |
EP2015293A1 (en) * | 2007-06-14 | 2009-01-14 | Deutsche Thomson OHG | Method and apparatus for encoding and decoding an audio signal using adaptively switched temporal resolution in the spectral domain |
WO2009039897A1 (en) * | 2007-09-26 | 2009-04-02 | Fraunhofer - Gesellschaft Zur Förderung Der Angewandten Forschung E.V. | Apparatus and method for extracting an ambient signal in an apparatus and method for obtaining weighting coefficients for extracting an ambient signal and computer program |
EP2077550B8 (en) * | 2008-01-04 | 2012-03-14 | Dolby International AB | Audio encoder and decoder |
US9142221B2 (en) * | 2008-04-07 | 2015-09-22 | Cambridge Silicon Radio Limited | Noise reduction |
US20090319263A1 (en) * | 2008-06-20 | 2009-12-24 | Qualcomm Incorporated | Coding of transitional speech frames for low-bit-rate applications |
CA2836871C (en) * | 2008-07-11 | 2017-07-18 | Stefan Bayer | Time warp activation signal provider, audio signal encoder, method for providing a time warp activation signal, method for encoding an audio signal and computer programs |
US8577673B2 (en) * | 2008-09-15 | 2013-11-05 | Huawei Technologies Co., Ltd. | CELP post-processing for music signals |
UA99878C2 (ru) * | 2009-01-16 | 2012-10-10 | Долби Интернешнл Аб | Гармоническое преобразование, усовершенствованное перекрестным произведением |
EP2226794B1 (en) | 2009-03-06 | 2017-11-08 | Harman Becker Automotive Systems GmbH | Background noise estimation |
CN102169694B (zh) * | 2010-02-26 | 2012-10-17 | 华为技术有限公司 | 生成心理声学模型的方法及装置 |
WO2011142709A2 (en) * | 2010-05-11 | 2011-11-17 | Telefonaktiebolaget Lm Ericsson (Publ) | Method and arrangement for processing of audio signals |
WO2012000882A1 (en) * | 2010-07-02 | 2012-01-05 | Dolby International Ab | Selective bass post filter |
US8738385B2 (en) | 2010-10-20 | 2014-05-27 | Broadcom Corporation | Pitch-based pre-filtering and post-filtering for compression of audio signals |
SG191771A1 (en) * | 2010-12-29 | 2013-08-30 | Samsung Electronics Co Ltd | Apparatus and method for encoding/decoding for high-frequency bandwidth extension |
KR101525185B1 (ko) | 2011-02-14 | 2015-06-02 | 프라운호퍼 게젤샤프트 쭈르 푀르데룽 데어 안겐반텐 포르슝 에. 베. | 트랜지언트 검출 및 품질 결과를 사용하여 일부분의 오디오 신호를 코딩하기 위한 장치 및 방법 |
CN103477387B (zh) * | 2011-02-14 | 2015-11-25 | 弗兰霍菲尔运输应用研究公司 | 使用频谱域噪声整形的基于线性预测的编码方案 |
CN102195288B (zh) * | 2011-05-20 | 2013-10-23 | 西安理工大学 | 一种有源调谐型混合滤波器及进行有源调谐的控制方法 |
US8731911B2 (en) * | 2011-12-09 | 2014-05-20 | Microsoft Corporation | Harmonicity-based single-channel speech quality estimation |
US9520144B2 (en) * | 2012-03-23 | 2016-12-13 | Dolby Laboratories Licensing Corporation | Determining a harmonicity measure for voice processing |
CN103325384A (zh) * | 2012-03-23 | 2013-09-25 | 杜比实验室特许公司 | 谐度估计、音频分类、音调确定及噪声估计 |
US20140046670A1 (en) * | 2012-06-04 | 2014-02-13 | Samsung Electronics Co., Ltd. | Audio encoding method and apparatus, audio decoding method and apparatus, and multimedia device employing the same |
DE102014113392B4 (de) | 2014-05-07 | 2022-08-25 | Gizmo Packaging Limited | Verschlussvorrichtung für einen Behälter |
CN110444219B (zh) * | 2014-07-28 | 2023-06-13 | 弗劳恩霍夫应用研究促进协会 | 选择第一编码演算法或第二编码演算法的装置与方法 |
JP2017122908A (ja) * | 2016-01-06 | 2017-07-13 | ヤマハ株式会社 | 信号処理装置および信号処理方法 |
EP3483883A1 (en) * | 2017-11-10 | 2019-05-15 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio coding and decoding with selective postfiltering |
-
2014
- 2014-07-28 EP EP14178810.9A patent/EP2980798A1/en not_active Withdrawn
-
2015
- 2015-07-21 TW TW104123539A patent/TWI591623B/zh active
- 2015-07-27 CN CN201580042675.5A patent/CN106575509B/zh active Active
- 2015-07-27 RU RU2017105808A patent/RU2691243C2/ru active
- 2015-07-27 EP EP20200501.3A patent/EP3779983B1/en active Active
- 2015-07-27 ES ES15744175.9T patent/ES2685574T3/es active Active
- 2015-07-27 CN CN202110519799.5A patent/CN113450810B/zh active Active
- 2015-07-27 MX MX2017001240A patent/MX366278B/es active IP Right Grant
- 2015-07-27 WO PCT/EP2015/067160 patent/WO2016016190A1/en active Application Filing
- 2015-07-27 PL PL18177372T patent/PL3396669T3/pl unknown
- 2015-07-27 ES ES18177372T patent/ES2836898T3/es active Active
- 2015-07-27 PT PT181773722T patent/PT3396669T/pt unknown
- 2015-07-27 KR KR1020177005451A patent/KR102009195B1/ko active IP Right Grant
- 2015-07-27 PT PT15744175T patent/PT3175455T/pt unknown
- 2015-07-27 BR BR112017000348-1A patent/BR112017000348B1/pt active IP Right Grant
- 2015-07-27 EP EP18177372.2A patent/EP3396669B1/en active Active
- 2015-07-27 PL PL15744175T patent/PL3175455T3/pl unknown
- 2015-07-27 JP JP2017504673A patent/JP6629834B2/ja active Active
- 2015-07-27 EP EP15744175.9A patent/EP3175455B1/en active Active
- 2015-07-27 SG SG11201700640XA patent/SG11201700640XA/en unknown
- 2015-07-27 MY MYPI2017000031A patent/MY182051A/en unknown
- 2015-07-27 AU AU2015295519A patent/AU2015295519B2/en active Active
- 2015-07-27 CA CA2955127A patent/CA2955127C/en active Active
- 2015-07-28 AR ARP150102395A patent/AR101341A1/es active IP Right Grant
-
2017
- 2017-01-20 US US15/411,662 patent/US10083706B2/en active Active
-
2018
- 2018-08-30 US US16/118,316 patent/US10679638B2/en active Active
-
2019
- 2019-12-05 JP JP2019220392A patent/JP7160790B2/ja active Active
-
2020
- 2020-05-27 US US16/885,109 patent/US11581003B2/en active Active
-
2022
- 2022-10-13 JP JP2022164445A patent/JP7568695B2/ja active Active
Also Published As
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP7160790B2 (ja) | ハーモニックフィルタツールのハーモニック依存制御 | |
JP6643285B2 (ja) | オーディオ符号器及びオーディオ符号化方法 | |
KR101698905B1 (ko) | 정렬된 예견 부를 사용하여 오디오 신호를 인코딩하고 디코딩하기 위한 장치 및 방법 | |
US10984810B2 (en) | Noise filling without side information for CELP-like coders | |
EP3000110A1 (en) | Apparatus and method for selecting one of a first encoding algorithm and a second encoding algorithm using harmonics reduction | |
KR102426050B1 (ko) | 피치 지연 선택 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20221114 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20221114 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20231108 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20240109 |
|
A601 | Written request for extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A601 Effective date: 20240403 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20240709 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20240724 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20240903 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20241003 |