JP6789915B2 - スペクトルパターンを利用することによってシヌソイドおよびスイープを効率的に合成するための装置および方法 - Google Patents
スペクトルパターンを利用することによってシヌソイドおよびスイープを効率的に合成するための装置および方法 Download PDFInfo
- Publication number
- JP6789915B2 JP6789915B2 JP2017217969A JP2017217969A JP6789915B2 JP 6789915 B2 JP6789915 B2 JP 6789915B2 JP 2017217969 A JP2017217969 A JP 2017217969A JP 2017217969 A JP2017217969 A JP 2017217969A JP 6789915 B2 JP6789915 B2 JP 6789915B2
- Authority
- JP
- Japan
- Prior art keywords
- spectral
- pattern
- coefficient
- coefficients
- spectrum
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 230000003595 spectral effect Effects 0.000 title claims description 614
- 238000000034 method Methods 0.000 title claims description 50
- 230000002194 synthesizing effect Effects 0.000 title description 2
- 238000001228 spectrum Methods 0.000 claims description 319
- 230000005236 sound signal Effects 0.000 claims description 174
- 238000003860 storage Methods 0.000 claims description 61
- 238000012545 processing Methods 0.000 claims description 42
- 238000006467 substitution reaction Methods 0.000 claims description 40
- 238000004590 computer program Methods 0.000 claims description 11
- 238000012937 correction Methods 0.000 claims description 9
- 230000004044 response Effects 0.000 claims description 2
- 238000006243 chemical reaction Methods 0.000 description 49
- 230000000052 comparative effect Effects 0.000 description 17
- 238000012805 post-processing Methods 0.000 description 13
- 238000011049 filling Methods 0.000 description 12
- 238000013139 quantization Methods 0.000 description 10
- 230000015572 biosynthetic process Effects 0.000 description 9
- 230000006870 function Effects 0.000 description 9
- 238000003786 synthesis reaction Methods 0.000 description 9
- 230000002123 temporal effect Effects 0.000 description 8
- 230000005484 gravity Effects 0.000 description 7
- 238000005516 engineering process Methods 0.000 description 6
- 230000009466 transformation Effects 0.000 description 6
- 230000000694 effects Effects 0.000 description 5
- 230000008901 benefit Effects 0.000 description 4
- 238000004134 energy conservation Methods 0.000 description 4
- 230000008569 process Effects 0.000 description 4
- 238000005070 sampling Methods 0.000 description 4
- 238000003491 array Methods 0.000 description 3
- 230000005540 biological transmission Effects 0.000 description 3
- 230000008859 change Effects 0.000 description 3
- 238000002156 mixing Methods 0.000 description 3
- 230000009467 reduction Effects 0.000 description 3
- 239000002253 acid Substances 0.000 description 2
- 238000004458 analytical method Methods 0.000 description 2
- 238000005284 basis set Methods 0.000 description 2
- 238000004364 calculation method Methods 0.000 description 2
- 238000011161 development Methods 0.000 description 2
- 238000000605 extraction Methods 0.000 description 2
- 230000010354 integration Effects 0.000 description 2
- 230000000873 masking effect Effects 0.000 description 2
- 238000005259 measurement Methods 0.000 description 2
- 230000007704 transition Effects 0.000 description 2
- 229910001369 Brass Inorganic materials 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000007175 bidirectional communication Effects 0.000 description 1
- 239000010951 brass Substances 0.000 description 1
- 239000000969 carrier Substances 0.000 description 1
- 230000006854 communication Effects 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 230000000295 complement effect Effects 0.000 description 1
- 239000002131 composite material Substances 0.000 description 1
- 238000007906 compression Methods 0.000 description 1
- 230000006835 compression Effects 0.000 description 1
- 230000001010 compromised effect Effects 0.000 description 1
- 238000013144 data compression Methods 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 230000008034 disappearance Effects 0.000 description 1
- 238000009826 distribution Methods 0.000 description 1
- 230000002708 enhancing effect Effects 0.000 description 1
- 230000005284 excitation Effects 0.000 description 1
- 238000013213 extrapolation Methods 0.000 description 1
- 238000009499 grossing Methods 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 238000012804 iterative process Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 238000010606 normalization Methods 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 239000002245 particle Substances 0.000 description 1
- 238000000059 patterning Methods 0.000 description 1
- 230000008447 perception Effects 0.000 description 1
- 230000000737 periodic effect Effects 0.000 description 1
- 230000002085 persistent effect Effects 0.000 description 1
- 238000002360 preparation method Methods 0.000 description 1
- 238000004321 preservation Methods 0.000 description 1
- 230000035807 sensation Effects 0.000 description 1
- 238000007493 shaping process Methods 0.000 description 1
- 230000011664 signaling Effects 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
- 230000004083 survival effect Effects 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
- 230000001131 transforming effect Effects 0.000 description 1
- 230000001052 transient effect Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/032—Quantisation or dequantisation of spectral components
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Processing of the speech or voice signal to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Processing of the speech or voice signal to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/038—Speech enhancement, e.g. noise reduction or echo cancellation using band spreading techniques
-
- G—PHYSICS
- G11—INFORMATION STORAGE
- G11B—INFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
- G11B20/00—Signal processing not specific to the method of recording or reproducing; Circuits therefor
- G11B20/10—Digital recording or reproducing
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04B—TRANSMISSION
- H04B1/00—Details of transmission systems, not covered by a single one of groups H04B3/00 - H04B13/00; Details of transmission systems not characterised by the medium used for transmission
- H04B1/66—Details of transmission systems, not covered by a single one of groups H04B3/00 - H04B13/00; Details of transmission systems not characterised by the medium used for transmission for reducing bandwidth of signals; for improving efficiency of transmission
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/0212—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using orthogonal transformation
Description
x(t) = cos (2πφ(t))
および
式中、tおよびτは時間を示し、φ(t)はtにおける瞬時位相であり、f(τ)はτにおける瞬時周波数であり、それらの複数の信号の各信号は第1の時点におけるその信号の瞬時周波数である開始周波数(f0)、および、異なる第2の時点におけるその信号の瞬時周波数である目標周波数(f1)を有する。信号生成器は、それらの複数の信号のうちの第1の信号を、第1の信号の目標周波数が開始周波数と等しくなるように生成するように構成されている。さらに、信号生成器は、それらの複数の信号のうちの異なる第2の信号を、第1の信号の目標周波数が開始周波数とは異なるように生成するように構成されている。
複数のスペクトル係数を含む復号オーディオ信号スペクトルを得るために符号化オーディオ信号スペクトルを処理するステップであって、それらのスペクトル係数の各々は符号化オーディオ信号スペクトル内のスペクトル位置およびスペクトル値を有し、それらのスペクトル係数がスペクトル係数のシーケンスを形成するように、それらのスペクトル係数は符号化オーディオ信号スペクトル内でのそれらのスペクトル位置に従って連続して順序付けられている、処理するステップと、
復号オーディオ信号スペクトルの1つ以上の疑似係数を決定するステップであって、それらの疑似係数の各々はそれらのスペクトル係数のうちの1つである、決定するステップと、
修正オーディオ信号スペクトルを得るために少なくとも1つまたは複数の疑似係数を決定されたスペクトルパターンで置換するステップであって、決定されたスペクトルパターンは少なくとも2つのパターン係数を含み、それらの少なくとも2つのパターン係数の各々はスペクトル値を有する、置換するステップと、
オーディオ出力信号を得るために修正オーディオ信号スペクトルを時間領域に変換するステップと、
を含む。
第1の領域において複数の信号を生成するステップと、
複数のスペクトルパターンを得るために、それらの複数の信号の各信号を第1の領域から第2の領域へと変換するステップであって、それらの複数の変換されたスペクトルパターンの各パターンは複数の係数を含んでいる、変換するステップと、
複数の処理されたパターンを得るために、それらの変換されたスペクトルパターンの係数のうちの1つ以上を除去することによって、それらの変換されたスペクトルパターンを切り詰めるステップと、
それらの複数の処理されたパターンの各処理されたパターンをデータベースまたはメモリに記憶するステップと、
を含む。
x(t) = cos (2πφ(t))
および
に基づいて行われる。式中、tおよびτは時間を示し、φ(t)はtにおける瞬時位相であり、f(τ)はτにおける瞬時周波数であり、それらの複数の信号の各信号は、第1の時点におけるその信号の瞬時周波数である開始周波数(f0)と異なる第2の時点におけるその信号の瞬時周波数である目標周波数(f1)を有する。
スペクトル修正器420は、極値係数を前記の所定の値に設定しないか、または
スペクトル修正器420は極値係数のうちの少なくとも1つを疑似係数に置換するが、その疑似係数のスペクトル値は前記の所定の値とは異なる。これは、極値係数のうちの少なくとも1つの極値係数のスペクトル値が所定の値に設定され、スペクトル係数のうちの別の1つのスペクトル係数のスペクトル値がその所定の値とは異なる値に設定されることを意味する。そのような値は、たとえば、その極値係数のスペクトル値、その極値係数の先行係数のうちの1つの先行係数のスペクトル値、もしくはその極値係数の後続係数のうちの1つの後続係数のスペクトル値から導出することができる。または、そのような値は、たとえば、その極値係数の比較値、その極値係数の先行係数のうちの1つの先行係数の比較値、もしくはその極値係数の後続係数のうちの1つの後続係数の比較値から導出することができる。
1)サブシーケンスの各スペクトル係数について比較値およびスペクトル位置の積を求める。
2)第1の合計を得るために、1)において求められた積を合計する。
3)第2の合計を得るために、サブシーケンスのすべてのスペクトル係数の比較値を合計する。
4)中間結果を生成するために、第1の合計を第2の合計で除算する。
5)重心を得るために、中間結果に最近への丸め(round-to-nearest rounding)を適用する(最近への丸め:8.49は8に丸められ、8.5は9に丸められる)。
(0.04×282+0.10×283+0.20×284+0.93×285+0.92×286+0.90×287+0.05×288)/(0.04+0.10+0.20+0.93+0.92+0.90+0.05)
=897.25/3.14
=285.75
=286。
または、決定されたスペクトルパターンは、たとえば、取得されたスペクトルパターンを修正することによって、取得されたスペクトルパターンから導出することができる。
x(t) = cos (2πφ(t))
および
に基づいて複数の信号の各信号を生成するように構成されている。式中、tおよびτは時間を示し、φ(t)はtにおける瞬時位相であり、f(τ)はτにおける瞬時周波数である。複数の信号の各信号は、第1の時点におけるその信号の瞬時周波数である開始周波数(f0)と、異なる第2の時点におけるその信号の瞬時周波数である目標周波数(f1)を有する。
について、以下のように定義される。
(m+1/2)の中の+1/2は周波数シフトを表す。(n+1/2+M/2)は時間シフトを表す。
x(t) = cos (2πφ(t)) (5)
ここで、瞬時位相は以下のようになる。
これによって、瞬時位相は以下のようになる。
および
を選択することによって生成することができ、周波数オフセットmは変換ビンインデックスにおいて測定される。奇数インデックスは「ビン上」周波数に対応し、偶数インデックスは「ビン間」周波数を与える。連続するフレーム間の位相進行は以下のように計算することができる。
であり、ビン間パターンについては
である。実際の整数の選択はビン数の偶奇性(偶数/奇数)に応じて決まる。φ0は任意の位相オフセット値を示す。したがって、純粋な定常音パターンについて、それらのパターンを、MDCTスペクトルのシーケンスのt/f格子内のそれらの意図される位置に適合させるために、4つの選択的な回転による後処理が必要とされる。φ0+nπ/2,
の選択によって、これらの回転はわずかなものになる。
によれば、半ビン掃引距離を含むパターンは、φ0+nπ/4だけの後処理回転を必要とする。
の選択の結果として、パターンの実数部と虚数部の合計/差およびその後の
によるスケーリングによって、回転がやや計算しやすくもなる。または、すべてのパターンは、π/4事前回転バージョンで付加的に記憶することができ、nπ/2,n=1,2,3だけのわずかな後処理回転とともに適用することができる(表5参照)。
・ビン上およびビン間
・開始位相0および開始位相π/4(パターンの連結に関連して上述したように事前回転されている)
・半ビンスイープ、全ビンスイープおよび1.5ビンスイープ
・上り掃引方向および下り掃引方向
n0:1/4×b_length+0.5、および
n1:3/4×b_length+0.5
実数部、虚数部及び符号を転置することによるN×π/2回転
π/4事前回転パターンによって実施されるN×π/4回転
整数ビンまたは分数ビン、
φ=0またはφ=π/4(半ビンスイープを取り扱うのに必要とされる事前回転)
半ビンスイープ、全ビンスイープまたは1.5ビンスイープ、および
上りまたは下り
Claims (15)
- 符号化オーディオ信号スペクトルに基づいてオーディオ出力信号を生成するための装置であって、
複数のスペクトル係数を含む復号オーディオ信号スペクトルを得るために前記符号化オーディオ信号スペクトルを処理するための処理ユニット(115)であって、前記スペクトル係数の各々は前記符号化オーディオ信号スペクトル内でのスペクトル位置およびスペクトル値を有し、前記スペクトル係数は前記スペクトル係数がスペクトル係数のシーケンスを形成するように前記符号化オーディオ信号スペクトル内でのそれらのスペクトル位置に従って連続して順序付けられている、処理ユニット(115)と、
前記復号オーディオ信号スペクトルの1つ以上の決定された係数を決定するための疑似係数決定器(125)であって、前記決定された係数の各々はスペクトル値を有する前記複数のスペクトル係数のうちの1つであり、前記疑似係数決定機(125)は、前記複数のスペクトル係数のうちの少なくとも1つのスペクトル係数を決定することによって前記1つ以上の決定された係数を決定するように構成されており、前記スペクトル係数は、所定の値と異なるスペクトル値を有し、スペクトル値が前記所定の値に等しい直近の先行係数を有し、かつスペクトル値が前記所定の値に等しい直近の後続係数を有する、疑似係数決定器(125)と、
修正オーディオ信号スペクトルを得るために、前記1つ以上の決定された係数のうちの少なくとも1つを、決定されたスペクトルパターンで置換するための置換ユニット(135)であって、前記決定されたスペクトルパターンは少なくとも3つのパターン係数を含み、前記少なくとも3つのパターン係数の各々はスペクトル値を有する置換ユニット(135)と、
を備えた装置。 - 該装置は、複数の記憶されているスペクトルパターンを記憶しているデータベースまたはメモリを含むストレージユニット(155)をさらに備え、前記複数の記憶されているスペクトルパターンの各々はスペクトル特性をもち、
前記置換ユニット(135)は、前記ストレージユニット(155)に、要求されたスペクトルパターンとして、前記記憶されているスペクトルパターンのうちの1つを要求するように構成され、
前記ストレージユニット(155)は、前記要求されたスペクトルパターンを提供するように構成され、
前記置換ユニット(135)は、前記要求されたスペクトルパターンに基づいて前記1つ以上の決定された係数のうちの少なくとも1つを前記決定されたスペクトルパターンで置換するように構成されている請求項1に記載の装置。 - 前記置換ユニット(135)は、前記疑似係数決定器(125)によって決定された前記1つ以上の決定された係数のうちの少なくとも1つの第1の導出スペクトル位置に応じて、前記ストレージユニット(155)に、前記記憶されているスペクトルパターンのうちの前記1つを要求するように構成されており、前記第1の導出スペクトル位置は複数の時間的に連続するスペクトル位置のうちの1つのスペクトル位置である請求項2に記載の装置。
- 前記1つ以上の決定された係数は各々が符号成分を含む符号付きの値であり、
前記置換ユニット(135)は、前記1つ以上の決定された係数のうちの1つの決定された係数のスペクトル位置とその決定された係数の符号成分に基づいて、その符号成分が第1の符号値を有するときは前記第1の導出スペクトル位置がその決定された係数のスペクトル位置に等しくなるように、その符号成分が異なる第2の値を有するときは前記第1の導出スペクトル位置がその決定された係数のスペクトル位置を所定の値だけシフトすることによってもたらされる修正位置に等しくなるように、前記第1の導出スペクトル位置を決定するように構成されている請求項3に記載の装置。 - 前記ストレージユニット(155)の前記データベースまたは前記メモリ内に記憶されている前記複数の記憶されているスペクトルパターンは定常音パターンまたは周波数掃引パターンのいずれかであり、
前記疑似係数決定器(125)は前記復号オーディオ信号スペクトルの2つ以上の時間的に連続する決定された係数を決定するように構成され、
前記置換ユニット(135)は、前記2つ以上の時間的に連続する決定された係数のうちの第1の決定された係数と第2の決定された係数を、前記第1の決定された係数から導出される前記第1の導出スペクトル位置と前記第2の決定された係数から導出される第2の導出スペクトル位置との間の絶対差が閾値よりも小さいか否かに応じてトラックに割り当てるように構成され、
前記置換ユニット(135)は、前記トラックの前記第1の決定された係数から導出される前記第1の導出スペクトル位置が前記トラックの前記第2の決定された係数から導出される前記第2の導出スペクトル位置に等しいときは前記ストレージユニット(155)に前記定常音パターンの1つを要求するように構成され、前記トラックの前記第1の決定された係数から導出される前記第1の導出スペクトル位置が前記トラックの前記第2の決定された係数から導出される前記第2の導出スペクトル位置とは異なるときは前記ストレージユニット(155)に前記周波数掃引パターンの1つを要求するように構成されている請求項3又は4に記載の装置。 - 前記置換ユニット(135)は、前記トラックの前記第2の決定された係数から導出される前記第2の導出スペクトル位置と前記トラックの前記第1の決定された係数から導出される前記第1の導出スペクトル位置との間の周波数差が定義された値の半分に等しいとき、前記ストレージユニット(155)に前記周波数掃引パターンのうちの第1の周波数掃引パターンを要求するように構成され、
前記置換ユニット(135)は、前記トラックの前記第2の決定された係数から導出される前記第2の導出スペクトル位置と前記トラックの前記第1の決定された係数から導出される前記第1の導出スペクトル位置との間の前記周波数差が前記定義された値に等しいとき、前記ストレージユニット(155)に前記周波数掃引パターンのうちの前記第1の周波数掃引パターンとは異なる第2の周波数掃引パターンを要求するように構成され、
前記置換ユニット(135)は、前記トラックの前記第2の決定された係数から導出される前記第2の導出スペクトル位置と前記トラックの前記第1の決定された係数から導出される前記第1の導出スペクトル位置との間の前記周波数差が前記定義された値の1.5倍に等しいとき、前記ストレージユニット(155)に、前記周波数掃引パターンのうちの、前記第1の周波数掃引パターンとも前記第2の周波数掃引パターンとも異なる第3の周波数掃引パターンを要求するように構成されている請求項5に記載の装置。 - 前記置換ユニット(135)は、前記決定されたスペクトルパターンを得るために、前記ストレージユニット(155)から提供される、前記要求されたスペクトルパターンを修正するように構成されているパターン適合ユニット(138)を備えている請求項2から6のいずれか一項に記載の装置。
- 前記パターン適合ユニット(138)は、前記要求されたスペクトルパターンの前記パターン係数の前記スペクトル値を前記1つ以上の決定された係数のうちの1つの決定された係数の前記スペクトル値に応じて再スケーリングすることによって、前記ストレージユニット(155)によって提供される前記要求されたスペクトルパターンを修正するように構成されている請求項7に記載の装置。
- 前記パターン適合ユニット(138)は、開始位相値に応じて、前記ストレージユニット(155)によって提供される前記要求されたスペクトルパターンを修正するように構成されている請求項7または8に記載の装置。
- 前記要求されたスペクトルパターンの前記パターン係数の各々の前記スペクトル値は実数部と虚数部とを含む複素係数であり、
前記パターン適合ユニット(138)は、前記ストレージユニット(155)によって提供される前記要求されたスペクトルパターンの前記パターン係数の各々の前記実数部および前記虚数部を複素回転係数ej・φ(φは角度値)を適用することによって修正することによって、前記要求されたスペクトルパターンを修正するように構成されている請求項7から9のいずれか一項に記載の装置。 - 前記要求されたスペクトルパターンの前記パターン係数の各々の前記スペクトル値は実数部と虚数部とを含む複素係数である請求項7から9のいずれか一項に記載の装置。
- 前記パターン適合ユニット(138)は、前記要求されたスペクトルパターンの複素共役を計算することによって前記ストレージユニット(155)によって提供される前記要求されたスペクトルパターンを修正するように構成されている請求項7から11のいずれか一項に記載の装置。
- 前記復号オーディオ信号スペクトルはMDCT領域において表され、
前記パターン適合ユニット(138)は、修正スペクトルパターンを得るために、前記要求されたスペクトルパターンの前記パターン係数の前記スペクトル値を修正することによって、前記ストレージユニット(155)によって提供される前記要求されたスペクトルパターンを修正するように構成され、前記スペクトル値は奇積層離散フーリエ変換領域において表され、
前記パターン適合ユニット(138)は、前記決定されたスペクトルパターンを得るために、前記修正スペクトルパターンの前記パターン係数の前記スペクトル値を、前記奇積層離散フーリエ変換領域から前記MDCT領域へと変換するように構成され、
前記置換ユニット(135)は、前記MDCT領域において表される前記修正オーディオ信号スペクトルを得るために、前記少なくとも1つまたは複数の決定された係数を、前記MDCT領域において表される前記決定されたスペクトルパターンで置換するように構成されている請求項7から12のいずれか一項に記載の装置。 - 符号化オーディオ信号スペクトルに基づいてオーディオ出力信号を生成するための方法であって、
複数のスペクトル係数を含む復号オーディオ信号スペクトルを得るために前記符号化オーディオ信号スペクトルを処理するステップであって、前記スペクトル係数の各々は前記符号化オーディオ信号スペクトル内でのスペクトル位置およびスペクトル値を有し、前記スペクトル係数がスペクトル係数のシーケンスを形成するように、前記スペクトル係数は前記符号化オーディオ信号スペクトル内でのそれらのスペクトル位置に従って連続して順序付けられている、処理するステップと、
前記復号オーディオ信号スペクトルの1つ以上の決定された係数を決定するステップであって、前記決定された係数の各々は前記複数のスペクトル係数のうちの1つであり、前記1つ以上の決定された係数を決定するステップは、前記複数のスペクトル係数のうちの少なくとも1つのスペクトル係数を決定することによって行なわれ、前記スペクトル係数は、所定の値と異なるスペクトル値を有し、スペクトル値が前記所定の値に等しい直近の先行係数を有し、かつスペクトル値が前記所定の値に等しい直近の後続係数を有する、決定するステップと、
修正オーディオ信号スペクトルを得るために、前記1つ以上の決定された係数のうちの少なくとも1つを決定されたスペクトルパターンで置換するステップであって、前記決定されたスペクトルパターンは少なくとも3つのパターン係数を含み、前記少なくとも3つのパターン係数はスペクトル値を有する、置換するステップと、
を含む方法。 - コンピュータまたは信号プロセッサ上で実行されるとき、請求項14に記載の方法を実施するためのコンピュータプログラム。
Applications Claiming Priority (4)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US201261712013P | 2012-10-10 | 2012-10-10 | |
US61/712,013 | 2012-10-10 | ||
EP12199266.3A EP2720222A1 (en) | 2012-10-10 | 2012-12-21 | Apparatus and method for efficient synthesis of sinusoids and sweeps by employing spectral patterns |
EP12199266.3 | 2012-12-21 |
Related Parent Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2015536045A Division JP6563338B2 (ja) | 2012-10-10 | 2013-09-20 | スペクトルパターンを利用することによってシヌソイドおよびスイープを効率的に合成するための装置および方法 |
Related Child Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2019148934A Division JP7005564B2 (ja) | 2012-10-10 | 2019-08-14 | スペクトルパターンを利用することによってシヌソイドおよびスイープを効率的に合成するための装置および方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2018036668A JP2018036668A (ja) | 2018-03-08 |
JP6789915B2 true JP6789915B2 (ja) | 2020-11-25 |
Family
ID=47715790
Family Applications (3)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2015536045A Active JP6563338B2 (ja) | 2012-10-10 | 2013-09-20 | スペクトルパターンを利用することによってシヌソイドおよびスイープを効率的に合成するための装置および方法 |
JP2017217969A Active JP6789915B2 (ja) | 2012-10-10 | 2017-11-13 | スペクトルパターンを利用することによってシヌソイドおよびスイープを効率的に合成するための装置および方法 |
JP2019148934A Active JP7005564B2 (ja) | 2012-10-10 | 2019-08-14 | スペクトルパターンを利用することによってシヌソイドおよびスイープを効率的に合成するための装置および方法 |
Family Applications Before (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2015536045A Active JP6563338B2 (ja) | 2012-10-10 | 2013-09-20 | スペクトルパターンを利用することによってシヌソイドおよびスイープを効率的に合成するための装置および方法 |
Family Applications After (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2019148934A Active JP7005564B2 (ja) | 2012-10-10 | 2019-08-14 | スペクトルパターンを利用することによってシヌソイドおよびスイープを効率的に合成するための装置および方法 |
Country Status (18)
Country | Link |
---|---|
US (1) | US9570085B2 (ja) |
EP (3) | EP2720222A1 (ja) |
JP (3) | JP6563338B2 (ja) |
KR (1) | KR101777485B1 (ja) |
CN (1) | CN104903956B (ja) |
AR (1) | AR092958A1 (ja) |
AU (3) | AU2013329734B2 (ja) |
BR (1) | BR112015008114B1 (ja) |
CA (2) | CA2887188C (ja) |
ES (1) | ES2896016T3 (ja) |
HK (1) | HK1213688A1 (ja) |
MX (1) | MX344955B (ja) |
MY (1) | MY193732A (ja) |
RU (1) | RU2633136C2 (ja) |
SG (2) | SG10201702285QA (ja) |
TW (1) | TWI543152B (ja) |
WO (1) | WO2014056705A1 (ja) |
ZA (1) | ZA201503152B (ja) |
Families Citing this family (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP2963648A1 (en) | 2014-07-01 | 2016-01-06 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio processor and method for processing an audio signal using vertical phase correction |
EP2980791A1 (en) | 2014-07-28 | 2016-02-03 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Processor, method and computer program for processing an audio signal using truncated analysis or synthesis window overlap portions |
CN107004417B (zh) | 2014-12-09 | 2021-05-07 | 杜比国际公司 | Mdct域错误掩盖 |
EP3107096A1 (en) | 2015-06-16 | 2016-12-21 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Downscaled decoding |
US10146500B2 (en) | 2016-08-31 | 2018-12-04 | Dts, Inc. | Transform-based audio codec and method with subband energy smoothing |
US10362423B2 (en) | 2016-10-13 | 2019-07-23 | Qualcomm Incorporated | Parametric audio decoding |
CN108074588B (zh) * | 2016-11-15 | 2020-12-01 | 北京唱吧科技股份有限公司 | 一种音高计算方法及装置 |
CN110062945B (zh) * | 2016-12-02 | 2023-05-23 | 迪拉克研究公司 | 音频输入信号的处理 |
CN116631415A (zh) * | 2017-01-10 | 2023-08-22 | 弗劳恩霍夫应用研究促进协会 | 音频解码器、提供解码的音频信号的方法、和计算机程序 |
CN106847294B (zh) * | 2017-01-17 | 2018-11-30 | 百度在线网络技术(北京)有限公司 | 基于人工智能的音频处理方法和装置 |
US10210874B2 (en) * | 2017-02-03 | 2019-02-19 | Qualcomm Incorporated | Multi channel coding |
CN110867194B (zh) * | 2019-11-05 | 2022-05-17 | 腾讯音乐娱乐科技(深圳)有限公司 | 音频的评分方法、装置、设备及存储介质 |
Family Cites Families (30)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1099777C (zh) * | 1993-06-30 | 2003-01-22 | 索尼公司 | 数字信号的编码装置、解码装置和编码方法 |
CA2163371C (en) * | 1994-04-01 | 2005-09-20 | Kyoya Tsutsui | Information encoding method and apparatus, information decoding method and apparatus, information transmission method, and information recording medium |
TW384434B (en) * | 1997-03-31 | 2000-03-11 | Sony Corp | Encoding method, device therefor, decoding method, device therefor and recording medium |
EP1047047B1 (en) * | 1999-03-23 | 2005-02-02 | Nippon Telegraph and Telephone Corporation | Audio signal coding and decoding methods and apparatus and recording media with programs therefor |
AU2547201A (en) * | 2000-01-11 | 2001-07-24 | Matsushita Electric Industrial Co., Ltd. | Multi-mode voice encoding device and decoding device |
EP1335496B1 (en) * | 2000-12-14 | 2009-06-10 | Sony Corporation | Coding and decoding |
JP4534382B2 (ja) * | 2001-02-09 | 2010-09-01 | ソニー株式会社 | 符号列生成装置及び方法、信号再生装置及び方法、並びにコンテンツ供給システム |
JP2002311996A (ja) * | 2001-02-09 | 2002-10-25 | Sony Corp | コンテンツ供給システム |
JP2003029797A (ja) * | 2001-05-11 | 2003-01-31 | Matsushita Electric Ind Co Ltd | 符号化装置、復号化装置および放送システム |
JP4012506B2 (ja) * | 2001-08-24 | 2007-11-21 | 株式会社ケンウッド | 信号の周波数成分を適応的に補間するための装置および方法 |
KR100981699B1 (ko) * | 2002-07-12 | 2010-09-13 | 코닌클리케 필립스 일렉트로닉스 엔.브이. | 오디오 코딩 |
DE60231844D1 (de) * | 2002-12-20 | 2009-05-14 | Nokia Corp | Utzerseitiger information mit meta-information |
US7318035B2 (en) * | 2003-05-08 | 2008-01-08 | Dolby Laboratories Licensing Corporation | Audio coding systems and methods using spectral component coupling and spectral component regeneration |
DE602004024703D1 (de) * | 2003-10-13 | 2010-01-28 | Koninkl Philips Electronics Nv | Audiocodierung |
US7693709B2 (en) * | 2005-07-15 | 2010-04-06 | Microsoft Corporation | Reordering coefficients for waveform coding or decoding |
US8219392B2 (en) * | 2005-12-05 | 2012-07-10 | Qualcomm Incorporated | Systems, methods, and apparatus for detection of tonal components employing a coding operation with monotone function |
KR101346358B1 (ko) * | 2006-09-18 | 2013-12-31 | 삼성전자주식회사 | 대역폭 확장 기법을 이용한 오디오 신호의 부호화/복호화방법 및 장치 |
US8041578B2 (en) * | 2006-10-18 | 2011-10-18 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Encoding an information signal |
JP2008268384A (ja) * | 2007-04-17 | 2008-11-06 | Nec Lcd Technologies Ltd | 液晶表示装置 |
US8527265B2 (en) * | 2007-10-22 | 2013-09-03 | Qualcomm Incorporated | Low-complexity encoding/decoding of quantized MDCT spectrum in scalable speech and audio codecs |
US20100324708A1 (en) * | 2007-11-27 | 2010-12-23 | Nokia Corporation | encoder |
EP2107556A1 (en) * | 2008-04-04 | 2009-10-07 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio transform coding using pitch correction |
EP2320416B1 (en) * | 2008-08-08 | 2014-03-05 | Panasonic Corporation | Spectral smoothing device, encoding device, decoding device, communication terminal device, base station device, and spectral smoothing method |
KR101390433B1 (ko) | 2009-03-31 | 2014-04-29 | 후아웨이 테크놀러지 컴퍼니 리미티드 | 신호 잡음 제거 방법, 신호 잡음 제거 장치, 및 오디오 디코딩 시스템 |
EP2237266A1 (en) * | 2009-04-03 | 2010-10-06 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus and method for determining a plurality of local center of gravity frequencies of a spectrum of an audio signal |
ES2400661T3 (es) * | 2009-06-29 | 2013-04-11 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Codificación y decodificación de extensión de ancho de banda |
AU2010305383B2 (en) * | 2009-10-08 | 2013-10-03 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Multi-mode audio signal decoder, multi-mode audio signal encoder, methods and computer program using a linear-prediction-coding based noise shaping |
CA2827249C (en) * | 2011-02-14 | 2016-08-23 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Apparatus and method for processing a decoded audio signal in a spectral domain |
JP6185457B2 (ja) * | 2011-04-28 | 2017-08-23 | ドルビー・インターナショナル・アーベー | 効率的なコンテンツ分類及びラウドネス推定 |
FR2996047B1 (fr) * | 2012-09-27 | 2014-09-05 | Renault Sa | Dispositif inductif limitant les oscillations acoustiques |
-
2012
- 2012-12-21 EP EP12199266.3A patent/EP2720222A1/en not_active Withdrawn
-
2013
- 2013-09-20 EP EP13766036.1A patent/EP2907132B1/en active Active
- 2013-09-20 MY MYPI2015000889A patent/MY193732A/en unknown
- 2013-09-20 KR KR1020157011967A patent/KR101777485B1/ko active IP Right Grant
- 2013-09-20 EP EP16193357.7A patent/EP3133598A1/en not_active Withdrawn
- 2013-09-20 CN CN201380064128.8A patent/CN104903956B/zh active Active
- 2013-09-20 BR BR112015008114-2A patent/BR112015008114B1/pt active IP Right Grant
- 2013-09-20 CA CA2887188A patent/CA2887188C/en active Active
- 2013-09-20 CA CA2944927A patent/CA2944927C/en active Active
- 2013-09-20 ES ES13766036T patent/ES2896016T3/es active Active
- 2013-09-20 SG SG10201702285QA patent/SG10201702285QA/en unknown
- 2013-09-20 MX MX2015004506A patent/MX344955B/es active IP Right Grant
- 2013-09-20 WO PCT/EP2013/069592 patent/WO2014056705A1/en active Application Filing
- 2013-09-20 SG SG11201502744YA patent/SG11201502744YA/en unknown
- 2013-09-20 AU AU2013329734A patent/AU2013329734B2/en active Active
- 2013-09-20 RU RU2015117432A patent/RU2633136C2/ru active
- 2013-09-20 JP JP2015536045A patent/JP6563338B2/ja active Active
- 2013-10-09 TW TW102136550A patent/TWI543152B/zh active
- 2013-10-09 AR ARP130103664A patent/AR092958A1/es active IP Right Grant
-
2015
- 2015-04-08 US US14/682,015 patent/US9570085B2/en active Active
- 2015-05-08 ZA ZA2015/03152A patent/ZA201503152B/en unknown
-
2016
- 2016-02-14 HK HK16101589.7A patent/HK1213688A1/zh unknown
- 2016-12-21 AU AU2016277636A patent/AU2016277636A1/en not_active Abandoned
-
2017
- 2017-11-13 JP JP2017217969A patent/JP6789915B2/ja active Active
-
2018
- 2018-10-19 AU AU2018250490A patent/AU2018250490B2/en active Active
-
2019
- 2019-08-14 JP JP2019148934A patent/JP7005564B2/ja active Active
Also Published As
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP7005564B2 (ja) | スペクトルパターンを利用することによってシヌソイドおよびスイープを効率的に合成するための装置および方法 | |
RU2562383C2 (ru) | Устройство и способ для кодирования и декодирования аудио, применяющие синусоидальную замену | |
CN105518777B (zh) | 用频谱域智能间隙填充编码或解码音频信号的设备及方法 | |
JP5350393B2 (ja) | オーディオコーディングシステム、オーディオデコーダ、オーディオエンコーディング方法及びオーディオデコーディング方法 | |
WO2014115225A1 (ja) | 帯域幅拡張パラメータ生成装置、符号化装置、復号装置、帯域幅拡張パラメータ生成方法、符号化方法、および、復号方法 | |
CN117940994A (zh) | 基于长期预测和/或谐波后置滤波生成预测频谱的处理器 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20171207 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A132 Effective date: 20190226 |
|
A601 | Written request for extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A601 Effective date: 20190520 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20190820 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20200128 |
|
A601 | Written request for extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A601 Effective date: 20200422 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20200727 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20201006 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20201104 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6789915 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |