JP2017151454A - 低複雑度の調性適応音声信号量子化 - Google Patents
低複雑度の調性適応音声信号量子化 Download PDFInfo
- Publication number
- JP2017151454A JP2017151454A JP2017076101A JP2017076101A JP2017151454A JP 2017151454 A JP2017151454 A JP 2017151454A JP 2017076101 A JP2017076101 A JP 2017076101A JP 2017076101 A JP2017076101 A JP 2017076101A JP 2017151454 A JP2017151454 A JP 2017151454A
- Authority
- JP
- Japan
- Prior art keywords
- spectral line
- signal
- frame
- tonality
- speech encoder
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 230000005236 sound signal Effects 0.000 title claims abstract description 63
- 238000013139 quantization Methods 0.000 title claims abstract description 51
- 230000003595 spectral effect Effects 0.000 claims abstract description 152
- 238000001228 spectrum Methods 0.000 claims abstract description 86
- 238000009432 framing Methods 0.000 claims abstract description 6
- 238000004364 calculation method Methods 0.000 claims description 44
- 238000000034 method Methods 0.000 claims description 40
- 230000008859 change Effects 0.000 claims description 22
- 238000004590 computer program Methods 0.000 claims description 13
- 230000002093 peripheral effect Effects 0.000 claims description 6
- 238000013507 mapping Methods 0.000 claims description 5
- 238000010606 normalization Methods 0.000 claims description 4
- 230000003044 adaptive effect Effects 0.000 abstract description 11
- 230000006870 function Effects 0.000 description 14
- 238000012545 processing Methods 0.000 description 6
- 230000009466 transformation Effects 0.000 description 6
- 238000006243 chemical reaction Methods 0.000 description 4
- 230000006978 adaptation Effects 0.000 description 3
- 238000004422 calculation algorithm Methods 0.000 description 3
- 230000004044 response Effects 0.000 description 3
- 108010076504 Protein Sorting Signals Proteins 0.000 description 2
- 239000000969 carrier Substances 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 230000005284 excitation Effects 0.000 description 2
- 238000007620 mathematical function Methods 0.000 description 2
- 230000000737 periodic effect Effects 0.000 description 2
- 230000008569 process Effects 0.000 description 2
- 230000003321 amplification Effects 0.000 description 1
- 230000008901 benefit Effects 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 238000003780 insertion Methods 0.000 description 1
- 230000037431 insertion Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000003199 nucleic acid amplification method Methods 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/032—Quantisation or dequantisation of spectral components
- G10L19/035—Scalar quantisation
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10H—ELECTROPHONIC MUSICAL INSTRUMENTS; INSTRUMENTS IN WHICH THE TONES ARE GENERATED BY ELECTROMECHANICAL MEANS OR ELECTRONIC GENERATORS, OR IN WHICH THE TONES ARE SYNTHESISED FROM A DATA STORE
- G10H1/00—Details of electrophonic musical instruments
- G10H1/02—Means for controlling the tone frequencies, e.g. attack or decay; Means for producing special musical effects, e.g. vibratos or glissandos
- G10H1/06—Circuits for establishing the harmonic content of tones, or other arrangements for changing the tone colour
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/0212—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using orthogonal transformation
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/03—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
- G10L25/18—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters the extracted parameters being spectral information of each sub-band
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/03—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
- G10L25/21—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters the extracted parameters being power information
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/45—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of analysis window
-
- H—ELECTRICITY
- H03—ELECTRONIC CIRCUITRY
- H03M—CODING; DECODING; CODE CONVERSION IN GENERAL
- H03M7/00—Conversion of a code where information is represented by a given sequence or number of digits to a code where the same, similar or subset of information is represented by a different sequence or number of digits
- H03M7/30—Compression; Expansion; Suppression of unnecessary data, e.g. redundancy reduction
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10H—ELECTROPHONIC MUSICAL INSTRUMENTS; INSTRUMENTS IN WHICH THE TONES ARE GENERATED BY ELECTROMECHANICAL MEANS OR ELECTRONIC GENERATORS, OR IN WHICH THE TONES ARE SYNTHESISED FROM A DATA STORE
- G10H2210/00—Aspects or methods of musical processing having intrinsic musical character, i.e. involving musical theory or musical parameters or relying on musical knowledge, as applied in electrophonic musical tools or instruments
- G10H2210/555—Tonality processing, involving the key in which a musical piece or melody is played
- G10H2210/561—Changing the tonality within a musical piece
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/03—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Computational Linguistics (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Theoretical Computer Science (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Abstract
【解決手段】符号化ESを生成する音声エンコーダ1は、音声信号ASからフレームFを抽出するように構成されたフレーム化装置2と、音声信号ASのフレームFから導出したスペクトル信号のスペクトル線を量子化インデックスにマッピングするように構成された量子化器3と、を備える。量子化器3は、入力スペクトル線が量子化インデックス・ゼロに対してマッピングされた不感帯を有する。音声エンコーダは更に、不感帯DZを変更するように構成された制御装置4を備える。制御装置4は、少なくとも1つのスペクトル線又は少なくとも1つのスペクトル線群についての少なくとも1つの調性表示値を算出するように構成された調性算出装置5を含む。
【選択図】図1
Description
前記音声信号からフレームを抽出するように構成されたフレーム化装置と、
前記音声信号のフレームから導出したスペクトル信号のスペクトル線を量子化インデックスにマッピングするように構成された量子化器と、を備え、前記量子化器は、前記スペクトル線が量子化インデックス・ゼロに対してマッピングされた不感帯を有し、前記音声エンコーダは更に、
前記不感帯を変更するように構成された制御装置、を備え、
前記制御装置は、少なくとも1つのスペクトル線又は少なくとも1つのスペクトル線群についての少なくとも1つの調性表示値を算出するように構成された調性算出装置を含み、
前記制御装置は、それぞれの前記調性表示値に応じて、前記少なくとも1つのスペクトル線又は前記少なくとも1つのスペクトル線群についての不感帯を変更するように構成される、音声エンコーダを提供する。
・補足的な情報を必要としないため、既存のメディアコーデックにおいて使用可能であり、
・ビン又は帯域ごとにどの不感帯を用いるべきかを量子化に先立ち決定することで複雑度を減らし、
・帯域周波数及び/又は信号調性に基づいてビン又は帯域ごとの不感帯を決定することができるものを開示する。
のスペクトル線を示すインデックスであり、Pk,iは、i番目のフレームのk番目のスペ
クトル線のパワー値であり、又は、前記調性表示値は、以下の式によって計算され、
のスペクトル線群を示すインデックスであり、Pm,iは、i番目のフレームのm番目のス
ペクトル線群のパワー値である。式から分かるように、調性表示値は、現在フレームであるi番目のフレームのパワー値、及び、先行フレームであるi−1番目のフレームから算
出される。この式は、i−1番目のフレームに対する依存性を削除することで変更するこ
とができる。ここで、k番目のパワー値の左7つ及び右7つの隣接するパワー値の合計を算出し、それぞれのパワー値によって除算する。この式を用いると、低い調性表示値は、高い調性を示す。
DCTk,i)2+(MDSTk,i)2の式によって前記パワー値を算出するように構成さ
れ、ここで、iは、前記音声信号の特定のフレームを示すインデックスであり、kは、特
定のスペクトル線を示すインデックスであり、MDCTk,iは、i番目のフレームのk番
目のスペクトル線における変更後離散余弦変換の値であり、MDSTk,iは、i番目のフ
レームのk番目のスペクトル線における変更後離散正弦変換の値であり、Pk,iは、i番
目のフレームのk番目のスペクトル線のパワー値である。上記の式によって、パワー値を容易に算出することができる。
前記音声信号からフレームを抽出するステップと、
前記音声信号のフレームから導出したスペクトル信号のスペクトル線を量子化インデックスにマッピングするステップと、を備え、前記入力スペクトル線がゼロに対してマッピングされた不感帯が用いられ、前記方法は更に、
前記不感帯を変更するステップ、を備え、
少なくとも1つのスペクトル線又は少なくとも1つのスペクトル線群についての少なくとも1つの調性表示値が算出され、
それぞれの前記調性表示値に応じて、前記少なくとも1つのスペクトル線又は前記少なくとも1つのスペクトル線群についての不感帯が変更される、方法を提供する。
音声信号ASからフレームFを抽出するように構成されたフレーム化装置2と、
音声信号ASのフレームFから導出したスペクトル信号SPSのスペクトル線SL1-32(図2を参照)を量子化インデックスI0,I1にマッピングするように構成された量子化器3と、を備え、量子化器3は、スペクトル線SL1-32が量子化インデックス・ゼロI0に対してマッピングされた不感帯DZ(図2を参照)を有し、当該音声エンコーダは更に、
不感帯DZを変更するように構成された制御装置4、を備え、
制御装置4は、少なくとも1つのスペクトル線SL1-32又は少なくとも1つのスペクトル線SL1-32群についての少なくとも1つの調性表示値TI5-32を算出するように構成された調性算出装置5を含み、
制御装置4は、それぞれの調性表示値TI5-32に応じて、少なくとも1つのスペクトル線SL1-32又は少なくとも1つのスペクトル線SL1-32群についての不感帯DZを変更するように構成される。
・補足的な情報を必要としないため、既存のメディアコーデックにおいて使用可能であり、
・ビン又は帯域ごとにどの不感帯DZを用いるべきかを量子化に先立ち決定することで複雑度を減らし、
・帯域周波数及び/又は信号調性に基づいてビン又は帯域ごとの不感帯DZを決定することができるものを開示する。
定のスペクトル線SL1-32を示すインデックスであり、Pk,iは、i番目のフレームのk
番目のスペクトル線SL1-32のパワー値PS5-32であり、又は、調性表示値TI5-32は、以下の式によって計算され、
定のスペクトル線SL1-32群を示すインデックスであり、Pm,iは、i番目のフレームの
m番目のスペクトル線SL1-32群のパワー値PS5-32である。式から分かるように、調性表示値TI5-32は、現在フレームFであるi番目のフレームのパワー値PS5-32、及び、
先行フレームFであるi−1番目のフレームFから算出される。この式は、i−1番目の
フレームFに対する依存性を削除することで変更することができる。ここで、特定のスペクトル線SL1-32のk番目のパワー値PS5-32又はスペクトル線SL1-32群のm番目のパワー値の左7つ及び右7つの隣接するパワー値PS5-32の合計を算出し、それぞれのパワー値PS5-32によって除算する。この式を用いると、低い調性表示値TI5-32は、高い調性を示す。
CTk,i)2+(MDSTk,i)2の式によってパワー値を算出するように構成され、こ
こで、iは、音声信号の特定のフレームFを示すインデックスであり、kは、特定のスペ
クトル線SL1-32を示すインデックスであり、MDCTk,iは、i番目のフレームのk番
目のスペクトル線における変更後離散余弦変換CTの値であり、MDSTk,iは、i番目
のフレームのk番目のスペクトル線における変更後離散正弦変換STの値であり、Pk,i
は、i番目のフレームのk番目のスペクトル線のパワー値PS5-32である。上記の式によ
って、パワー値PS5-32を容易に算出することができる。
1 音声エンコーダ
2 フレーム化装置
3 量子化器
4 制御装置
5 調性算出装置
6 パワースペクトル算出装置
7 開始周波数算出装置
8 変更後離散余弦変換算出装置
9 変更後離散正弦変換算出装置
10 スペクトル信号算出装置
11 振幅設定装置
12 正規化装置
AS 音声信号
ES 符号化信号
F フレーム
SL1-32 スペクトル線
SPS スペクトル信号
I インデックス
DZ 不感帯
TI5-32 調性表示値
PS パワースペクトル
PS5-32 パワー値
SF 開始周波数
CT 変更後離散余弦変換
ST 変更後離散正弦変換
Claims (17)
- 音声信号(AS)を符号化して符号化信号(ES)を生成するための音声エンコーダであって、前記音声エンコーダ(1)は、
前記音声信号(AS)からフレーム(F)を抽出するように構成されたフレーム化装置(2)と、
前記音声信号(AS)のフレーム(F)から導出したスペクトル信号(SPS)のスペクトル線(SL1-32)を量子化インデックス(I0,I1)にマッピングするように構成された量子化器(3)と、を備え、前記量子化器(3)は、前記スペクトル線(SL1-32)が量子化インデックス・ゼロ(I0)に対してマッピングされた不感帯(DZ)を有し、前記音声エンコーダ(1)は更に、
前記不感帯(DZ)を変更するように構成された制御装置(4)、を備え、
前記制御装置(4)は、少なくとも1つのスペクトル線(SL1-32)又は少なくとも1つのスペクトル線(SL1-32)群についての少なくとも1つの調性表示値(TI5-32)を算出するように構成された調性算出装置(5)を含み、
前記制御装置(4)は、それぞれの前記調性表示値(TI5-32)に応じて、前記少なくとも1つのスペクトル線(SL1-32)又は前記少なくとも1つのスペクトル線(SL1-32)群についての不感帯(DZ)を変更するように構成される、音声エンコーダ。 - 先行する請求項に記載の音声エンコーダであって、前記制御装置(4)は、前記スペクトル線(SL1-32)の1つにおける不感帯(DZ)が、より大きな調性を有するスペクトル線(SL1-32)の1つにおける不感帯(DZ)よりも大きくなるように、又は、前記スペクトル線(SL1-32)群の1つにおける前記不感帯(DZ)が、より大きな調性を有するスペクトル線(SL1-32)群の1つにおける不感帯(DZ)よりも大きくなるように、前記不感帯(DZ)を変更するように構成される、音声エンコーダ。
- 先行する請求項のいずれかに記載の音声エンコーダであって、前記制御装置(4)は、前記音声信号(AS)のフレーム(F)のパワースペクトル(PS)を算出するように構成されたパワースペクトル算出装置(6)を含み、前記パワースペクトル(PS)は、スペクトル線(SL1-32)又はスペクトル線(SL1-32)群についてのパワー値(PS5-32)を含み、前記調性算出装置(4)は、前記パワースペクトル(PS)に応じて前記少なくとも1つの調性表示値(TI5-32)を算出するように構成される、音声エンコーダ。
- 先行する請求項に記載の音声エンコーダであって、前記スペクトル線(SL1-32)の1つについての調性表示値(TI5-32)は、それぞれの前記スペクトル線(SL1-32)についての前記パワー値(PS5-32)と、前記パワースペクトル(PS)における、予め規定された数の周辺パワー値(PS5-32)の合計との比較に基づいており、又は、前記スペクトル線(SL1-32)群の1つについての調性表示値(TI5-32)は、それぞれの前記スペクトル線(SL1-32)群についての前記パワー値(PS5-32)と、前記パワースペクトル(PS)における、予め規定された数の周辺パワー値(PS5-32)の合計との比較に基づいている、音声エンコーダ。
- 先行する請求項のいずれかに記載の音声エンコーダであって、前記スペクトル線(SL1-32)の1つについての調性表示値(TI5-32)は、前記音声信号(AS)の先行フレーム(F)のスペクトル線の調性表示値(TI5-32)に基づき、又は、前記スペクトル線(SL1-32)群の1つについての調性表示値(TI5-32)は、前記音声信号(AS)の先行フレーム(F)についてのスペクトル線(SL1-32)群の調性表示値(TI5-32)に基づく、音声エンコーダ。
- 請求項3から請求項5のいずれかに記載の音声エンコーダであって、前記調性表示値(TI5-32)は、以下の式によって計算され、
り、kは、特定のスペクトル線を示すインデックスであり、Tk,iは、i番目のフレーム
(F)のk番目のスペクトル線の調性表示値(TI5-32)であり、Pk,iは、i番目のフ
レーム(F)のk番目のスペクトル線のパワー値(PS5-32)であり、又は、前記調性表示値(TI5-32)は、以下の式によって計算され、
り、mは、特定のスペクトル線(SL1-32)群を示すインデックスであり、Pm,iは、i
番目のフレームのm番目のスペクトル線(SL1-32)群のパワー値である、音声エンコーダ。 - 先行する請求項のいずれかに記載の音声エンコーダであって、前記音声エンコーダ(1)は、前記不感帯(DZ)を変更するための開始周波数(SF)を算出するように構成された開始周波数算出装置(7)を含み、前記不感帯(DZ)は、前記開始周波数(SF)以上の周波数を表すスペクトル線(SL)についてのみ変更される、音声エンコーダ。
- 先行する請求項に記載の音声エンコーダであって、前記開始周波数算出装置(7)は、前記音声信号(AS)のサンプルレートに基づき、且つ/又は、前記符号化信号(ES)から生成されたビットストリームについて予想される最大ビットレートに基づき、前記開始周波数(SF)を算出するように構成される、音声エンコーダ。
- 請求項3から請求項8のいずれかに記載の音声エンコーダであって、前記音声エンコーダ(1)は、前記音声信号(AS)のフレーム(F)から変更後離散余弦変換(CT)を算出するように構成された変更後離散余弦変換算出装置(8)と、前記音声信号(AS)のフレーム(F)から変更後離散正弦変換(ST)を算出するように構成された変更後離散正弦変換算出装置(9)と、を含み、前記パワースペクトル算出装置(6)は、前記変更後離散余弦変換(CT)及び前記変更後離散正弦変換(ST)に基づき前記パワースペクトル(PS)を算出するように構成される、音声エンコーダ。
- 請求項3から請求項9のいずれかに記載の音声エンコーダであって、前記パワースペクトル算出装置(6)は、Pk,i=(MDCTk,i)2+(MDSTk,i)2の式によって
前記パワー値(PS5-32)を算出するように構成され、ここで、iは、前記音声信号の特
定のフレームを示すインデックスであり、kは、特定のスペクトル線を示すインデックスであり、MDCTk,iは、i番目のフレームのk番目のスペクトル線における変更後離散
余弦変換(CT)の値であり、MDSTk,iは、i番目のフレームのk番目のスペクトル
線における変更後離散正弦変換(ST)の値であり、Pk,iは、i番目のフレームのk番
目のスペクトル線のパワー値(PS5-32)である、音声エンコーダ。 - 先行する請求項のいずれかに記載の音声エンコーダであって、前記音声エンコーダ(1)は、前記スペクトル信号(SPS)を生成するように構成されたスペクトル信号算出装置(10)を含み、前記スペクトル信号算出装置(10)は、前記不感帯(DZ)の変更によるエネルギーの損失を補償するように前記スペクトル信号(SPS)のスペクトル線(SL1-32)の振幅を設定するように構成された振幅設定装置(11)を含む、音声エンコーダ。
- 先行する請求項に記載の音声エンコーダであって、前記振幅設定装置(11)は、それぞれの前記スペクトル線における不感帯(DZ)の変更に応じて前記スペクトル信号(SPS)の振幅を設定するように構成される、音声エンコーダ。
- 請求項11又は請求項12に記載の音声エンコーダであって、前記スペクトル信号算出装置(10)は、正規化装置(12)を含む、音声エンコーダ。
- 請求項11から請求項13のいずれかに記載の音声エンコーダであって、前記変更後離散余弦変換算出装置(8)によって算出された前記音声信号(AS)のフレーム(F)からの変換後離散余弦変換(CT)は、前記スペクトル信号算出装置(10)に入力される、音声エンコーダ。
- エンコーダ(1)と、デコーダと、を備えるシステムであって、前記エンコーダ(1)は、請求項1から請求項14のいずれかに従って設計される、システム。
- 音声信号(AS)を符号化して符号化信号(ES)を生成するための方法であって、前記方法は、
前記音声信号(AS)からフレーム(F)を抽出するステップと、
前記音声信号(AS)のフレーム(F)から導出したスペクトル信号(SPS)のスペクトル線(SL1-32)を量子化インデックス(I0,I1)にマッピングするステップと、を備え、前記入力スペクトル線(SL1-32)が量子化インデックス・ゼロ(I0)に対してマッピングされた不感帯(DZ)が用いられ、前記方法は更に、
前記不感帯(DZ)を変更するステップ、を備え、
少なくとも1つのスペクトル線又は少なくとも1つのスペクトル線(SL1-32)群についての少なくとも1つの調性表示値(TI5-32)が算出され、
それぞれの前記調性表示値(TI5-32)に応じて、前記少なくとも1つのスペクトル線又は前記少なくとも1つのスペクトル線(SL1-32)群についての不感帯(DZ)が変更される、方法。 - コンピュータ又はプロセッサにおいて実行された際に請求項16に記載の方法を実行するためのコンピュータプログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2019087245A JP6979048B2 (ja) | 2013-01-29 | 2019-05-07 | 低複雑度の調性適応音声信号量子化 |
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US201361758191P | 2013-01-29 | 2013-01-29 | |
US61/758,191 | 2013-01-29 |
Related Parent Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2015554196A Division JP6334564B2 (ja) | 2013-01-29 | 2014-01-28 | 低複雑度の調性適応音声信号量子化 |
Related Child Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2019087245A Division JP6979048B2 (ja) | 2013-01-29 | 2019-05-07 | 低複雑度の調性適応音声信号量子化 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2017151454A true JP2017151454A (ja) | 2017-08-31 |
JP6526091B2 JP6526091B2 (ja) | 2019-06-05 |
Family
ID=50023575
Family Applications (3)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2015554196A Active JP6334564B2 (ja) | 2013-01-29 | 2014-01-28 | 低複雑度の調性適応音声信号量子化 |
JP2017076101A Active JP6526091B2 (ja) | 2013-01-29 | 2017-04-06 | 低複雑度の調性適応音声信号量子化 |
JP2019087245A Active JP6979048B2 (ja) | 2013-01-29 | 2019-05-07 | 低複雑度の調性適応音声信号量子化 |
Family Applications Before (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2015554196A Active JP6334564B2 (ja) | 2013-01-29 | 2014-01-28 | 低複雑度の調性適応音声信号量子化 |
Family Applications After (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2019087245A Active JP6979048B2 (ja) | 2013-01-29 | 2019-05-07 | 低複雑度の調性適応音声信号量子化 |
Country Status (20)
Country | Link |
---|---|
US (3) | US10468043B2 (ja) |
EP (1) | EP2939235B1 (ja) |
JP (3) | JP6334564B2 (ja) |
KR (1) | KR101757341B1 (ja) |
CN (2) | CN110047499B (ja) |
AR (1) | AR095087A1 (ja) |
AU (1) | AU2014211539B2 (ja) |
BR (1) | BR112015018050B1 (ja) |
CA (1) | CA2898789C (ja) |
ES (1) | ES2613651T3 (ja) |
HK (1) | HK1216263A1 (ja) |
MX (1) | MX346732B (ja) |
MY (1) | MY172848A (ja) |
PL (1) | PL2939235T3 (ja) |
PT (1) | PT2939235T (ja) |
RU (1) | RU2621003C2 (ja) |
SG (1) | SG11201505922XA (ja) |
TW (1) | TWI524331B (ja) |
WO (1) | WO2014118171A1 (ja) |
ZA (1) | ZA201506319B (ja) |
Families Citing this family (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR101757341B1 (ko) | 2013-01-29 | 2017-07-14 | 프라운호퍼 게젤샤프트 쭈르 푀르데룽 데어 안겐반텐 포르슝 에.베. | 저-복잡도 음조-적응 오디오 신호 양자화 |
EP3396670B1 (en) * | 2017-04-28 | 2020-11-25 | Nxp B.V. | Speech signal processing |
CN113539281A (zh) * | 2020-04-21 | 2021-10-22 | 华为技术有限公司 | 音频信号编码方法和装置 |
US11348594B2 (en) * | 2020-06-11 | 2022-05-31 | Qualcomm Incorporated | Stream conformant bit error resilience |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO1995012920A1 (fr) * | 1993-11-04 | 1995-05-11 | Sony Corporation | Codeur de signaux, decodeur de signaux, support d'enregistrement et procede de codage de signaux |
JP2004101720A (ja) * | 2002-09-06 | 2004-04-02 | Matsushita Electric Ind Co Ltd | 音響符号化装置及び音響符号化方法 |
JP2005530205A (ja) * | 2002-06-17 | 2005-10-06 | ドルビー・ラボラトリーズ・ライセンシング・コーポレーション | スペクトルホール充填を用いるオーディオコーディングシステム |
JP2005338637A (ja) * | 2004-05-28 | 2005-12-08 | Sony Corp | オーディオ信号符号化装置及び方法 |
JP2009198612A (ja) * | 2008-02-19 | 2009-09-03 | Fujitsu Ltd | 符号化装置、符号化方法および符号化プログラム |
JP6334564B2 (ja) * | 2013-01-29 | 2018-05-30 | フラウンホーファーゲゼルシャフト ツール フォルデルング デル アンゲヴァンテン フォルシユング エー.フアー. | 低複雑度の調性適応音声信号量子化 |
Family Cites Families (34)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2841765B2 (ja) * | 1990-07-13 | 1998-12-24 | 日本電気株式会社 | 適応ビット割当て方法及び装置 |
TW224553B (en) * | 1993-03-01 | 1994-06-01 | Sony Co Ltd | Method and apparatus for inverse discrete consine transform and coding/decoding of moving picture |
US6167093A (en) * | 1994-08-16 | 2000-12-26 | Sony Corporation | Method and apparatus for encoding the information, method and apparatus for decoding the information and method for information transmission |
DE19505435C1 (de) | 1995-02-17 | 1995-12-07 | Fraunhofer Ges Forschung | Verfahren und Vorrichtung zum Bestimmen der Tonalität eines Audiosignals |
JP3308764B2 (ja) * | 1995-05-31 | 2002-07-29 | 日本電気株式会社 | 音声符号化装置 |
DE19614108C1 (de) * | 1996-04-10 | 1997-10-23 | Fraunhofer Ges Forschung | Anordnung zur Vermessung der Koordinaten eines an einem Objekt angebrachten Retroreflektors |
US5924064A (en) * | 1996-10-07 | 1999-07-13 | Picturetel Corporation | Variable length coding using a plurality of region bit allocation patterns |
US6301304B1 (en) * | 1998-06-17 | 2001-10-09 | Lsi Logic Corporation | Architecture and method for inverse quantization of discrete cosine transform coefficients in MPEG decoders |
US6704705B1 (en) * | 1998-09-04 | 2004-03-09 | Nortel Networks Limited | Perceptual audio coding |
DE10134471C2 (de) * | 2001-02-28 | 2003-05-22 | Fraunhofer Ges Forschung | Verfahren und Vorrichtung zum Charakterisieren eines Signals und Verfahren und Vorrichtung zum Erzeugen eines indexierten Signals |
US7280700B2 (en) | 2002-07-05 | 2007-10-09 | Microsoft Corporation | Optimization techniques for data compression |
US8090577B2 (en) * | 2002-08-08 | 2012-01-03 | Qualcomm Incorported | Bandwidth-adaptive quantization |
US7502743B2 (en) | 2002-09-04 | 2009-03-10 | Microsoft Corporation | Multi-channel audio encoding and decoding with multi-channel transform selection |
US7318027B2 (en) * | 2003-02-06 | 2008-01-08 | Dolby Laboratories Licensing Corporation | Conversion of synthesized spectral components for encoding and low-complexity transcoding |
US7333930B2 (en) | 2003-03-14 | 2008-02-19 | Agere Systems Inc. | Tonal analysis for perceptual audio coding using a compressed spectral representation |
US7738554B2 (en) * | 2003-07-18 | 2010-06-15 | Microsoft Corporation | DC coefficient signaling at small quantization step sizes |
FR2882458A1 (fr) * | 2005-02-18 | 2006-08-25 | France Telecom | Procede de mesure de la gene due au bruit dans un signal audio |
US7983922B2 (en) * | 2005-04-15 | 2011-07-19 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Apparatus and method for generating multi-channel synthesizer control signal and apparatus and method for multi-channel synthesizing |
US7995649B2 (en) * | 2006-04-07 | 2011-08-09 | Microsoft Corporation | Quantization adjustment based on texture level |
US8059721B2 (en) * | 2006-04-07 | 2011-11-15 | Microsoft Corporation | Estimating sample-domain distortion in the transform domain with rounding compensation |
US20080049950A1 (en) * | 2006-08-22 | 2008-02-28 | Poletti Mark A | Nonlinear Processor for Audio Signals |
WO2008046492A1 (en) | 2006-10-20 | 2008-04-24 | Dolby Sweden Ab | Apparatus and method for encoding an information signal |
JP5065687B2 (ja) * | 2007-01-09 | 2012-11-07 | 株式会社東芝 | オーディオデータ処理装置及び端末装置 |
US8498335B2 (en) * | 2007-03-26 | 2013-07-30 | Microsoft Corporation | Adaptive deadzone size adjustment in quantization |
EP2077550B8 (en) * | 2008-01-04 | 2012-03-14 | Dolby International AB | Audio encoder and decoder |
WO2010001020A2 (fr) * | 2008-06-06 | 2010-01-07 | France Telecom | Codage/decodage par plans de bits, perfectionne |
ES2642906T3 (es) | 2008-07-11 | 2017-11-20 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Codificador de audio, procedimientos para proporcionar un flujo de audio y programa de ordenador |
JP4932917B2 (ja) | 2009-04-03 | 2012-05-16 | 株式会社エヌ・ティ・ティ・ドコモ | 音声復号装置、音声復号方法、及び音声復号プログラム |
CN102428702B (zh) * | 2009-05-16 | 2016-02-17 | 汤姆逊许可证公司 | 用于针对视频编码和解码的改进量化舍入偏移调节的方法和设备 |
ES2935911T3 (es) * | 2010-04-09 | 2023-03-13 | Dolby Int Ab | Descodificación estéreo de predicción compleja basada en MDCT |
AU2012246799B2 (en) | 2011-04-21 | 2016-03-03 | Samsung Electronics Co., Ltd. | Method of quantizing linear predictive coding coefficients, sound encoding method, method of de-quantizing linear predictive coding coefficients, sound decoding method, and recording medium |
TWI473078B (zh) * | 2011-08-26 | 2015-02-11 | Univ Nat Central | 音訊處理方法以及裝置 |
US8885706B2 (en) * | 2011-09-16 | 2014-11-11 | Google Inc. | Apparatus and methodology for a video codec system with noise reduction capability |
EP3483879A1 (en) * | 2017-11-10 | 2019-05-15 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Analysis/synthesis windowing function for modulated lapped transformation |
-
2014
- 2014-01-28 KR KR1020157022139A patent/KR101757341B1/ko active IP Right Grant
- 2014-01-28 CN CN201910203346.4A patent/CN110047499B/zh active Active
- 2014-01-28 MX MX2015009753A patent/MX346732B/es active IP Right Grant
- 2014-01-28 RU RU2015136242A patent/RU2621003C2/ru active
- 2014-01-28 AU AU2014211539A patent/AU2014211539B2/en active Active
- 2014-01-28 JP JP2015554196A patent/JP6334564B2/ja active Active
- 2014-01-28 BR BR112015018050-7A patent/BR112015018050B1/pt active IP Right Grant
- 2014-01-28 PL PL14701558T patent/PL2939235T3/pl unknown
- 2014-01-28 SG SG11201505922XA patent/SG11201505922XA/en unknown
- 2014-01-28 MY MYPI2015001904A patent/MY172848A/en unknown
- 2014-01-28 EP EP14701558.0A patent/EP2939235B1/en active Active
- 2014-01-28 CN CN201480006396.9A patent/CN105103226B/zh active Active
- 2014-01-28 WO PCT/EP2014/051624 patent/WO2014118171A1/en active Application Filing
- 2014-01-28 ES ES14701558.0T patent/ES2613651T3/es active Active
- 2014-01-28 PT PT147015580T patent/PT2939235T/pt unknown
- 2014-01-28 CA CA2898789A patent/CA2898789C/en active Active
- 2014-01-29 TW TW103103513A patent/TWI524331B/zh active
- 2014-01-29 AR ARP140100300A patent/AR095087A1/es active IP Right Grant
-
2015
- 2015-07-29 US US14/812,465 patent/US10468043B2/en active Active
- 2015-08-28 ZA ZA2015/06319A patent/ZA201506319B/en unknown
-
2016
- 2016-04-14 HK HK16104252.7A patent/HK1216263A1/zh unknown
-
2017
- 2017-04-06 JP JP2017076101A patent/JP6526091B2/ja active Active
-
2019
- 2019-05-07 JP JP2019087245A patent/JP6979048B2/ja active Active
- 2019-09-25 US US16/583,119 patent/US11094332B2/en active Active
-
2021
- 2021-08-06 US US17/396,526 patent/US11694701B2/en active Active
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO1995012920A1 (fr) * | 1993-11-04 | 1995-05-11 | Sony Corporation | Codeur de signaux, decodeur de signaux, support d'enregistrement et procede de codage de signaux |
JP2005530205A (ja) * | 2002-06-17 | 2005-10-06 | ドルビー・ラボラトリーズ・ライセンシング・コーポレーション | スペクトルホール充填を用いるオーディオコーディングシステム |
JP2004101720A (ja) * | 2002-09-06 | 2004-04-02 | Matsushita Electric Ind Co Ltd | 音響符号化装置及び音響符号化方法 |
JP2005338637A (ja) * | 2004-05-28 | 2005-12-08 | Sony Corp | オーディオ信号符号化装置及び方法 |
JP2009198612A (ja) * | 2008-02-19 | 2009-09-03 | Fujitsu Ltd | 符号化装置、符号化方法および符号化プログラム |
JP6334564B2 (ja) * | 2013-01-29 | 2018-05-30 | フラウンホーファーゲゼルシャフト ツール フォルデルング デル アンゲヴァンテン フォルシユング エー.フアー. | 低複雑度の調性適応音声信号量子化 |
Also Published As
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6979048B2 (ja) | 低複雑度の調性適応音声信号量子化 | |
TWI578308B (zh) | 音訊信號頻譜之頻譜係數的編碼技術 | |
US20200327896A1 (en) | Low-frequency emphasis for lpc-based coding in frequency domain | |
AU2016231220B2 (en) | Audio encoder, audio decoder, method for encoding an audio signal and method for decoding an encoded audio signal |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A132 Effective date: 20180619 |
|
A601 | Written request for extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A601 Effective date: 20180913 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20181206 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20190409 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20190507 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6526091 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |