JP5587501B2 - 複数段階の形状ベクトル量子化のためのシステム、方法、装置、およびコンピュータ可読媒体 - Google Patents
複数段階の形状ベクトル量子化のためのシステム、方法、装置、およびコンピュータ可読媒体 Download PDFInfo
- Publication number
- JP5587501B2 JP5587501B2 JP2013523223A JP2013523223A JP5587501B2 JP 5587501 B2 JP5587501 B2 JP 5587501B2 JP 2013523223 A JP2013523223 A JP 2013523223A JP 2013523223 A JP2013523223 A JP 2013523223A JP 5587501 B2 JP5587501 B2 JP 5587501B2
- Authority
- JP
- Japan
- Prior art keywords
- vector
- codebook
- rotation matrix
- vectors
- input
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 239000013598 vector Substances 0.000 title claims description 520
- 238000000034 method Methods 0.000 title claims description 85
- 238000013139 quantization Methods 0.000 title claims description 79
- 239000011159 matrix material Substances 0.000 claims description 129
- 230000005236 sound signal Effects 0.000 claims description 21
- 238000010586 diagram Methods 0.000 description 31
- 238000004891 communication Methods 0.000 description 27
- 238000003491 array Methods 0.000 description 11
- 238000012545 processing Methods 0.000 description 11
- 238000012937 correction Methods 0.000 description 10
- 230000008901 benefit Effects 0.000 description 8
- 230000005540 biological transmission Effects 0.000 description 7
- 230000003287 optical effect Effects 0.000 description 7
- 230000014509 gene expression Effects 0.000 description 5
- 238000004519 manufacturing process Methods 0.000 description 5
- 230000004044 response Effects 0.000 description 5
- 238000013459 approach Methods 0.000 description 4
- 230000000694 effects Effects 0.000 description 4
- 230000006870 function Effects 0.000 description 4
- 230000007246 mechanism Effects 0.000 description 4
- 230000008569 process Effects 0.000 description 4
- 230000009466 transformation Effects 0.000 description 4
- 101000822695 Clostridium perfringens (strain 13 / Type A) Small, acid-soluble spore protein C1 Proteins 0.000 description 3
- 101000655262 Clostridium perfringens (strain 13 / Type A) Small, acid-soluble spore protein C2 Proteins 0.000 description 3
- 101000655256 Paraclostridium bifermentans Small, acid-soluble spore protein alpha Proteins 0.000 description 3
- 101000655264 Paraclostridium bifermentans Small, acid-soluble spore protein beta Proteins 0.000 description 3
- 230000003044 adaptive effect Effects 0.000 description 3
- 238000004364 calculation method Methods 0.000 description 3
- 230000001419 dependent effect Effects 0.000 description 3
- 238000005516 engineering process Methods 0.000 description 3
- 239000000835 fiber Substances 0.000 description 3
- 239000004065 semiconductor Substances 0.000 description 3
- 101100484947 Arabidopsis thaliana VQ10 gene Proteins 0.000 description 2
- 101100136062 Mycobacterium tuberculosis (strain ATCC 25618 / H37Rv) PE10 gene Proteins 0.000 description 2
- 238000004590 computer program Methods 0.000 description 2
- 238000013500 data storage Methods 0.000 description 2
- 230000007423 decrease Effects 0.000 description 2
- 238000009795 derivation Methods 0.000 description 2
- 238000013461 design Methods 0.000 description 2
- 238000005070 sampling Methods 0.000 description 2
- 238000000638 solvent extraction Methods 0.000 description 2
- 238000012546 transfer Methods 0.000 description 2
- 230000017105 transposition Effects 0.000 description 2
- 102000003729 Neprilysin Human genes 0.000 description 1
- 108090000028 Neprilysin Proteins 0.000 description 1
- 238000012952 Resampling Methods 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 239000012141 concentrate Substances 0.000 description 1
- 230000001934 delay Effects 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 230000008034 disappearance Effects 0.000 description 1
- 230000002708 enhancing effect Effects 0.000 description 1
- 238000009499 grossing Methods 0.000 description 1
- 238000010348 incorporation Methods 0.000 description 1
- 239000006249 magnetic particle Substances 0.000 description 1
- 238000013507 mapping Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 239000013307 optical fiber Substances 0.000 description 1
- 230000008447 perception Effects 0.000 description 1
- 229920000642 polymer Polymers 0.000 description 1
- 238000000926 separation method Methods 0.000 description 1
- 238000001228 spectrum Methods 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
- 230000002459 sustained effect Effects 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
- 230000001131 transforming effect Effects 0.000 description 1
- 238000011144 upstream manufacturing Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/90—Pitch determination of speech signals
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/032—Quantisation or dequantisation of spectral components
- G10L19/038—Vector quantisation, e.g. TwinVQ audio
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/08—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
- G10L19/093—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters using sinusoidal excitation models
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Computational Linguistics (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Compression Or Coding Systems Of Tv Signals (AREA)
Description
本特許出願は、2010年7月30日に出願された、「SYSTEMS,METHODS,APPARATUS,AND COMPUTER−READABLE MEDIA FOR EFFICIENT TRANSFORM−DOMAIN CODING OF AUDIO SIGNALS」という表題の仮出願第61/369,662号の優先権を主張する。本特許出願は、2010年7月31日に出願された、「SYSTEMS,METHODS,APPARATUS,AND COMPUTER−READABLE MEDIA FOR DYNAMIC BIT ALLOCATION」という表題の仮出願第61/369,705号の優先権を主張する。本特許出願は、2010年8月1日に出願された、「SYSTEMS,METHODS,APPARATUS,AND COMPUTER−READABLE MEDIA FOR MULTI−STAGE SHAPE VECTOR QUANTIZATION」という表題の仮出願第61/369,751号の優先権を主張する。本特許出願は、2010年8月17日に出願された、「SYSTEMS,METHODS,APPARATUS,AND COMPUTER−READABLE MEDIA FOR GENERALIZED AUDIO CODING」という表題の仮出願第61/374,565号の優先権を主張する。本特許出願は、2010年9月17日に出願された、「SYSTEMS,METHODS,APPARATUS,AND COMPUTER−READABLE MEDIA FOR GENERALIZED AUDIO CODING」という表題の仮出願第61/384,237号の優先権を主張する。本特許出願は、2011年3月31日に出願された、「SYSTEMS,METHODS,APPARATUS,AND COMPUTER−READABLE MEDIA FOR DYNAMIC BIT ALLOCATION」という表題の仮出願第61/470,438号の優先権を主張する。
本開示は、音声信号処理の分野に関する。
通常、修正離散コサイン変換(MDCT)に基づく符号化方式が、発話コンテンツおよび/または音楽のような非発話コンテンツを含み得る、汎用音声信号を符号化するために使われる。MDCT符号化を使う既存の音声コーデックの例には、MPEG−1 Audio Layer 3(MP3)、Dolby Digital(英国、ロンドンのDolby Labsによる、AC−3とも呼ばれATSC A/52として標準化されている)、Vorbis(マサチューセッツ州サマービルのXiph.Org Foundationによる)、Windows(登録商標) Media Audio(WMA、ワシントン州レドモンドのMicrosoft Corpによる)、Adaptive Transform Acoustic Coding(ATRAC、東京のSony Corpによる)、およびAdvanced Audio Coding(AAC、ISO/IEC 14496−3:2009において最近標準化された)がある。MDCT符号化はまた、Enhanced Variable Rate Codec(EVRC、2010年1月25日に第3世代パートナーシッププロジェクト2(3GPP2)の文書C.S0014−D v2.0で標準化された)のような、いくつかの通信規格の構成要素でもある。G.718コーデック(スイス、ジュネーブの電気通信標準化部門(ITU−T)による、2008年6月制定、2008年11月および2009年8月修正、2009年3月および2010年3月改正の、「Frame error robust narrowband and wideband embedded variable bit−rate coding of speech and audio from 8−32kbit/s」)は、MDCT符号化を使うマルチレイヤコーデックの一例である。
gain−shapeベクトル量子化方式では、(たとえば、複雑さと記憶域を減らすために)複数の段階で形状ベクトル(shape vector)の符号化を実行するのが望ましいことがある。本明細書で説明されるような、複数段階の形状ベクトル量子化器の構成は、広範囲のビットレートの効果的なgain−shapeベクトル量子化を支援するような場合に、使うことができる。
この手法では、第1の形状量子化器SQ110によって実行される各々の第1段階の量子化の誤差を符号化することは、(A)入力ベクトルを表すものとして選択された第1段階のコードブックベクトルSkと(B)参照方向とに基づいて、回転行列Rkによって対応する入力ベクトルの方向を回転させることを含む。その参照方向は、デコーダに知られており、一定であり得る。その参照方向はまた、入力ベクトルV10aと独立であり得る。
以下に、本願出願の当初の特許請求の範囲に記載された発明を付記する。
[1]
第1の方向を有する第1の入力ベクトルを受け取り、第1のコードブックの複数の第1のコードブックベクトルのうちから対応する1つを選択するように構成される、第1のベクトル量子化器と、
前記選択された第1のコードブックベクトルに基づく回転行列を生成するように構成される、回転行列生成器と、
(A)前記第1の方向を有するベクトルと(B)前記回転行列との積を計算して、前記第1の方向とは異なる第2の方向を有する回転されたベクトルを生成するように構成される、乗算器と、
前記第2の方向を有する第2の入力ベクトルを受け取り、第2のコードブックの複数の第2のコードブックベクトルのうちから対応する1つを選択するように構成される、第2のベクトル量子化器とを備える、ベクトル量子化のための装置。
[2]
前記複数の第1のコードブックベクトルと前記複数の第2のコードブックベクトルの各々が、単位ノルムベクトルである、上記[1]に記載の装置。
[3]
前記第1のベクトル量子化器が、前記第1の入力ベクトルの利得値に基づいて、複数のコードブックのうちから前記第1のコードブックを選択するように構成される、上記[1]および上記[2]のいずれか一項に記載の装置。
[4]
前記複数の第1のコードブックベクトルの各々に対して、前記第1の入力ベクトルと前記コードブックベクトルの内積が、前記第1の入力ベクトルと前記選択された第1のコードブックベクトルの内積よりも大きくない、上記[1]から上記[3]のいずれか一項に記載の装置。
[5]
前記第1の入力ベクトルが、音声信号のフレームの複数のサブバンドベクトルのうちの1つである、上記[1]から上記[4]のいずれか一項に記載の装置であって、
前記音声信号の前のフレームの平均利得値に基づいて、前記複数のサブバンドベクトルの平均利得値を符号化するように構成される、利得量子化器を含む、装置。
[6]
前記回転行列の少なくとも1つの行の要素の各々が、前記選択された第1のコードブックベクトルの対応する要素に基づく、上記[1]から上記[5]のいずれか一項に記載の装置。
[7]
前記回転行列の少なくとも1つの列の要素の各々が、前記選択された第1のコードブックベクトルの対応する要素に基づく、上記[1]から上記[6]のいずれか一項に記載の装置。
[8]
前記回転行列が、前記第1の入力ベクトルとは独立の参照ベクトルに基づく、上記[1]から上記[7]のいずれか一項に記載の装置。
[9]
前記参照ベクトルが、0ではない要素を1つしか有さない、上記[8]に記載の装置。
[10]
前記回転行列が、前記選択された第1のコードブックベクトルと前記参照ベクトルとを含む平面内での、前記選択された第1のコードブックベクトルの前記参照ベクトルの方向への回転を定義する、上記[8]および上記[9]のいずれか一項に記載の装置。
[11]
前記乗算器が、前記回転行列と前記第1の入力ベクトルとの積を計算することによって、前記第1の方向を有するベクトルと前記回転行列との前記積を計算するように構成される、上記[1]から上記[10]のいずれか一項に記載の装置。
[12]
前記選択された第1のコードブックベクトルが、単位パルスのパターンに基づく、上記[1]から上記[11]のいずれか一項に記載の装置。
[13]
第1のコードブックの複数の第1のコードブックベクトルのうちから対応する1つを選択することによって、第1の方向を有する第1の入力ベクトルを量子化することと、
前記選択された第1のコードブックベクトルに基づく回転行列を生成することと、
(A)前記第1の方向を有するベクトルと(B)前記回転行列との積を計算して、前記第1の方向とは異なる第2の方向を有する回転されたベクトルを生成することと、
第2のコードブックの複数の第2のコードブックベクトルのうちから対応する1つを選択することによって、前記第2の方向を有する第2の入力ベクトルを量子化することとを備える、ベクトル量子化の方法。
[14]
前記複数の第1のコードブックベクトルと前記複数の第2のコードブックベクトルの各々が、単位ノルムベクトルである、上記[13]に記載の方法。
[15]
第1の入力ベクトルを前記量子化することが、前記第1の入力ベクトルの利得値に基づいて、複数のコードブックのうちから前記第1のコードブックを選択することを含む、上記[13]および上記[14]のいずれか一項に記載の方法。
[16]
前記複数の第1のコードブックベクトルの各々に対して、前記第1の入力ベクトルと前記コードブックベクトルの内積が、前記第1の入力ベクトルと前記選択された第1のコードブックベクトルの内積よりも大きくない、上記[13]から上記[15]のいずれか一項に記載の方法。
[17]
前記第1の入力ベクトルが、音声信号のフレームの複数のサブバンドベクトルのうちの1つである、上記[13]から上記[16]のいずれか一項に記載の方法であって、
前記音声信号の前のフレームの平均利得値に基づいて、前記複数のサブバンドベクトルの平均利得値を符号化することを含む、方法。
[18]
前記回転行列の少なくとも1つの行の要素の各々が、前記選択された第1のコードブックベクトルの対応する要素に基づく、上記[13]から上記[17]のいずれか一項に記載の方法。
[19]
前記回転行列の少なくとも1つの列の要素の各々が、前記選択された第1のコードブックベクトルの対応する要素に基づく、上記[13]から上記[18]のいずれか一項に記載の方法。
[20]
前記回転行列が、前記第1の入力ベクトルとは独立の参照ベクトルに基づく、上記[13]から上記[19]のいずれか一項に記載の方法。
[21]
前記参照ベクトルが、0ではない要素を1つしか有さない、上記[20]に記載の方法。
[22]
前記回転行列が、前記選択された第1のコードブックベクトルと前記参照ベクトルとを含む平面内での、前記選択された第1のコードブックベクトルの前記参照ベクトルの方向への回転を定義する、上記[20]および上記[21]のいずれか一項に記載の方法。
[23]
前記回転行列と前記第1の入力ベクトルとの積を計算することによって、前記第1の方向を有する前記ベクトルと前記回転行列との前記積を前記計算することが実行される、上記[13]から上記[22]のいずれか一項に記載の方法。
[24]
前記選択された第1のコードブックベクトルが、単位パルスのパターンに基づく、上記[13]から上記[23]のいずれか一項に記載の方法。
[25]
第1のコードブックの複数の第1のコードブックベクトルのうちから対応する1つを選択することによって、第1の方向を有する第1の入力ベクトルを量子化するための手段と、
前記選択された第1のコードブックベクトルに基づく回転行列を生成するための手段と、
(A)前記第1の方向を有するベクトルと(B)前記回転行列との積を計算して、前記第1の方向とは異なる第2の方向を有する回転されたベクトルを生成するための手段と、
第2のコードブックの複数の第2のコードブックベクトルのうちから対応する1つを選択することによって、前記第2の方向を有する第2の入力ベクトルを量子化するための手段とを備える、ベクトル量子化のための装置。
[26]
前記複数の第1のコードブックベクトルと前記複数の第2のコードブックベクトルの各々が、単位ノルムベクトルである、上記[25]に記載の装置。
[27]
第1の入力ベクトルを量子化するための前記手段が、前記第1の入力ベクトルの利得値に基づいて、複数のコードブックのうちから前記第1のコードブックを選択するように構成される、上記[25]および上記[26]のいずれか一項に記載の装置。
[28]
前記複数の第1のコードブックベクトルの各々に対して、前記第1の入力ベクトルと前記コードブックベクトルの内積が、前記第1の入力ベクトルと前記選択された第1のコードブックベクトルの内積よりも大きくない、上記[25]から上記[27]のいずれか一項に記載の装置。
[29]
前記第1の入力ベクトルが、音声信号のフレームの複数のサブバンドベクトルのうちの1つである、上記[25]から上記[28]のいずれか一項に記載の装置であって、
前記音声信号の前のフレームの平均利得値に基づいて、前記複数のサブバンドベクトルの平均利得値を符号化するための手段を含む、装置。
[30]
前記回転行列の少なくとも1つの行の要素の各々が、前記選択された第1のコードブックベクトルの対応する要素に基づく、上記[25]から上記[29]のいずれか一項に記載の装置。
[31]
前記回転行列の少なくとも1つの列の要素の各々が、前記選択された第1のコードブックベクトルの対応する要素に基づく、上記[25]から上記[30]のいずれか一項に記載の装置。
[32]
前記回転行列が、前記第1の入力ベクトルとは独立の参照ベクトルに基づく、上記[25]から上記[31]のいずれか一項に記載の装置。
[33]
前記参照ベクトルが、0ではない要素を1つしか有さない、上記[32]に記載の装置。
[34]
前記回転行列が、前記選択された第1のコードブックベクトルと前記参照ベクトルとを含む平面内での、前記選択された第1のコードブックベクトルの前記参照ベクトルの方向への回転を定義する、上記[32]および上記[33]のいずれか一項に記載の装置。
[35]
積を計算するための前記手段が、前記回転行列と前記第1の入力ベクトルとの積を計算することによって、前記第1の方向を有するベクトルと前記回転行列との前記積を計算するように構成される、上記[25]から上記[34]のいずれか一項に記載の装置。
[36]
前記選択された第1のコードブックベクトルが、単位パルスのパターンに基づく、上記[25]から上記[35]のいずれか一項に記載の装置。
[37]
第1のコードブックインデックスと第2のコードブックインデックスとを含む、量子化されたベクトルを逆量子化するための装置であって、
前記第1のコードブックインデックスを受け取り、第1のコードブックから対応する第1のコードブックベクトルを生成するように構成される、第1のベクトル逆量子化器と、
前記第1のコードブックベクトルに基づく回転行列を生成するように構成される、回転行列生成器と、
第2のコードブックインデックスを受け取り、第1の方向を有する対応する第2のコードブックベクトルを第2のコードブックから生成するように構成される、第2のベクトル逆量子化器と、
(A)前記第1の方向を有するベクトルと(B)前記回転行列との積を計算して、前記第1の方向とは異なる第2の方向を有する回転されたベクトルを生成するように構成される、乗算器とを備える、装置。
[38]
第1のコードブックインデックスと第2のコードブックインデックスとを含む、量子化されたベクトルを逆量子化する方法であって、
第1のコードブックの複数の第1のコードブックベクトルのうちから、前記第1のコードブックインデックスによって示される第1のコードブックベクトルを選択することと、
前記選択された第1のコードブックベクトルに基づく回転行列を生成することと、
第2のコードブックの複数の第2のコードブックベクトルのうちから、前記第2のコードブックインデックスによって示され第1の方向を有する第2のコードブックベクトルを選択することと、
(A)前記第1の方向を有するベクトルと(B)前記回転行列との積を計算して、前記第1の方向とは異なる第2の方向を有する回転されたベクトルを生成することとを備える、方法。
[39]
第1のコードブックインデックスと第2のコードブックインデックスとを含む、量子化されたベクトルを逆量子化するための装置であって、
第1のコードブックの複数の第1のコードブックベクトルのうちから、前記第1のコードブックインデックスによって示される第1のコードブックベクトルを選択するための手段と、
前記選択された第1のコードブックベクトルに基づく回転行列を生成するための手段と、
第2のコードブックの複数の第2のコードブックベクトルのうちから、前記第2のコードブックインデックスによって示され第1の方向を有する第2のコードブックベクトルを選択するための手段と、
(A)前記第1の方向を有するベクトルと(B)前記回転行列との積を計算して、前記第1の方向とは異なる第2の方向を有する回転されたベクトルを生成するための手段とを備える、装置。
[40]
有形な機構を有し、前記有形な機構が、機械に前記機構を読み取らせて、上記[13]から上記[24]および上記[38]のいずれか一項に記載の方法を実行させる、コンピュータ可読記憶媒体。
Claims (40)
- 第1の方向を有する第1の入力ベクトルを受け取り、第1のコードブックの複数の第1のコードブックベクトルのうちから対応する1つを選択するように構成される、第1のベクトル量子化器と、
前記選択された第1のコードブックベクトルに基づく回転行列を生成するように構成される、回転行列生成器と、
(A)前記第1の方向を有するベクトルと(B)前記回転行列との積を計算して、前記第1の方向とは異なる第2の方向を有する回転されたベクトルを生成するように構成される、乗算器と、
前記第2の方向を有する第2の入力ベクトルを受け取り、第2のコードブックの複数の第2のコードブックベクトルのうちから対応する1つを選択するように構成される、第2のベクトル量子化器とを備える、ベクトル量子化のための装置。 - 前記複数の第1のコードブックベクトルと前記複数の第2のコードブックベクトルの各々が、単位ノルムベクトルである、請求項1に記載の装置。
- 前記第1のベクトル量子化器が、前記第1の入力ベクトルの利得値に基づいて、複数のコードブックのうちから前記第1のコードブックを選択するように構成される、請求項1および2のいずれか一項に記載の装置。
- 前記複数の第1のコードブックベクトルの各々に対して、前記第1の入力ベクトルと前記複数の第1のコードブックベクトルの各々の内積が、前記第1の入力ベクトルと前記選択された第1のコードブックベクトルの内積よりも大きくない、請求項1から3のいずれか一項に記載の装置。
- 前記第1の入力ベクトルが、音声信号のフレームの複数のサブバンドベクトルのうちの1つである、請求項1から4のいずれか一項に記載の装置であって、
前記音声信号の前のフレームの平均利得値に基づいて、前記複数のサブバンドベクトルの平均利得値を符号化するように構成される、利得量子化器を含む、装置。 - 前記回転行列の少なくとも1つの行の要素の各々が、前記選択された第1のコードブックベクトルの対応する要素に基づく、請求項1から5のいずれか一項に記載の装置。
- 前記回転行列の少なくとも1つの列の要素の各々が、前記選択された第1のコードブックベクトルの対応する要素に基づく、請求項1から6のいずれか一項に記載の装置。
- 前記回転行列が、前記第1の入力ベクトルとは独立の参照ベクトルに基づく、請求項1から7のいずれか一項に記載の装置。
- 前記参照ベクトルが、0ではない要素を1つしか有さない、請求項8に記載の装置。
- 前記回転行列が、前記選択された第1のコードブックベクトルと前記参照ベクトルとを含む平面内での、前記選択された第1のコードブックベクトルの前記参照ベクトルの方向への回転を定義する、請求項8および9のいずれか一項に記載の装置。
- 前記乗算器が、前記回転行列と前記第1の入力ベクトルとの積を計算することによって、前記第1の方向を有するベクトルと前記回転行列との前記積を計算するように構成される、請求項1から10のいずれか一項に記載の装置。
- 前記選択された第1のコードブックベクトルが、単位パルスのパターンに基づく、請求項1から11のいずれか一項に記載の装置。
- 第1のコードブックの複数の第1のコードブックベクトルのうちから対応する1つを選択することによって、第1の方向を有する第1の入力ベクトルを量子化することと、
前記選択された第1のコードブックベクトルに基づく回転行列を生成することと、
(A)前記第1の方向を有するベクトルと(B)前記回転行列との積を計算して、前記第1の方向とは異なる第2の方向を有する回転されたベクトルを生成することと、
第2のコードブックの複数の第2のコードブックベクトルのうちから対応する1つを選択することによって、前記第2の方向を有する第2の入力ベクトルを量子化することとを備える、ベクトル量子化の方法。 - 前記複数の第1のコードブックベクトルと前記複数の第2のコードブックベクトルの各々が、単位ノルムベクトルである、請求項13に記載の方法。
- 第1の入力ベクトルを前記量子化することが、前記第1の入力ベクトルの利得値に基づいて、複数のコードブックのうちから前記第1のコードブックを選択することを含む、請求項13および14のいずれか一項に記載の方法。
- 前記複数の第1のコードブックベクトルの各々に対して、前記第1の入力ベクトルと前記複数の第1のコードブックベクトルの各々の内積が、前記第1の入力ベクトルと前記選択された第1のコードブックベクトルの内積よりも大きくない、請求項13から15のいずれか一項に記載の方法。
- 前記第1の入力ベクトルが、音声信号のフレームの複数のサブバンドベクトルのうちの1つである、請求項13から16のいずれか一項に記載の方法であって、
前記音声信号の前のフレームの平均利得値に基づいて、前記複数のサブバンドベクトルの平均利得値を符号化することを含む、方法。 - 前記回転行列の少なくとも1つの行の要素の各々が、前記選択された第1のコードブックベクトルの対応する要素に基づく、請求項13から17のいずれか一項に記載の方法。
- 前記回転行列の少なくとも1つの列の要素の各々が、前記選択された第1のコードブックベクトルの対応する要素に基づく、請求項13から18のいずれか一項に記載の方法。
- 前記回転行列が、前記第1の入力ベクトルとは独立の参照ベクトルに基づく、請求項13から19のいずれか一項に記載の方法。
- 前記参照ベクトルが、0ではない要素を1つしか有さない、請求項20に記載の方法。
- 前記回転行列が、前記選択された第1のコードブックベクトルと前記参照ベクトルとを含む平面内での、前記選択された第1のコードブックベクトルの前記参照ベクトルの方向への回転を定義する、請求項20および21のいずれか一項に記載の方法。
- 前記回転行列と前記第1の入力ベクトルとの積を計算することによって、前記第1の方向を有する前記ベクトルと前記回転行列との前記積を前記計算することが実行される、請求項13から22のいずれか一項に記載の方法。
- 前記選択された第1のコードブックベクトルが、単位パルスのパターンに基づく、請求項13から23のいずれか一項に記載の方法。
- 第1のコードブックの複数の第1のコードブックベクトルのうちから対応する1つを選択することによって、第1の方向を有する第1の入力ベクトルを量子化するための手段と、
前記選択された第1のコードブックベクトルに基づく回転行列を生成するための手段と、
(A)前記第1の方向を有するベクトルと(B)前記回転行列との積を計算して、前記第1の方向とは異なる第2の方向を有する回転されたベクトルを生成するための手段と、
第2のコードブックの複数の第2のコードブックベクトルのうちから対応する1つを選択することによって、前記第2の方向を有する第2の入力ベクトルを量子化するための手段とを備える、ベクトル量子化のための装置。 - 前記複数の第1のコードブックベクトルと前記複数の第2のコードブックベクトルの各々が、単位ノルムベクトルである、請求項25に記載の装置。
- 第1の入力ベクトルを量子化するための前記手段が、前記第1の入力ベクトルの利得値に基づいて、複数のコードブックのうちから前記第1のコードブックを選択するように構成される、請求項25および26のいずれか一項に記載の装置。
- 前記複数の第1のコードブックベクトルの各々に対して、前記第1の入力ベクトルと前記複数の第1のコードブックベクトルの各々の内積が、前記第1の入力ベクトルと前記選択された第1のコードブックベクトルの内積よりも大きくない、請求項25から27のいずれか一項に記載の装置。
- 前記第1の入力ベクトルが、音声信号のフレームの複数のサブバンドベクトルのうちの1つである、請求項25から28のいずれか一項に記載の装置であって、
前記音声信号の前のフレームの平均利得値に基づいて、前記複数のサブバンドベクトルの平均利得値を符号化するための手段を含む、装置。 - 前記回転行列の少なくとも1つの行の要素の各々が、前記選択された第1のコードブックベクトルの対応する要素に基づく、請求項25から29のいずれか一項に記載の装置。
- 前記回転行列の少なくとも1つの列の要素の各々が、前記選択された第1のコードブックベクトルの対応する要素に基づく、請求項25から30のいずれか一項に記載の装置。
- 前記回転行列が、前記第1の入力ベクトルとは独立の参照ベクトルに基づく、請求項25から31のいずれか一項に記載の装置。
- 前記参照ベクトルが、0ではない要素を1つしか有さない、請求項32に記載の装置。
- 前記回転行列が、前記選択された第1のコードブックベクトルと前記参照ベクトルとを含む平面内での、前記選択された第1のコードブックベクトルの前記参照ベクトルの方向への回転を定義する、請求項32および33のいずれか一項に記載の装置。
- 積を計算するための前記手段が、前記回転行列と前記第1の入力ベクトルとの積を計算することによって、前記第1の方向を有するベクトルと前記回転行列との前記積を計算するように構成される、請求項25から34のいずれか一項に記載の装置。
- 前記選択された第1のコードブックベクトルが、単位パルスのパターンに基づく、請求項25から35のいずれか一項に記載の装置。
- 第1のコードブックインデックスと第2のコードブックインデックスとを含む、量子化されたベクトルを逆量子化するための装置であって、
前記第1のコードブックインデックスを受け取り、第1のコードブックから対応する第1のコードブックベクトルを生成するように構成される、第1のベクトル逆量子化器と、
前記第1のコードブックベクトルに基づく回転行列を生成するように構成される、回転行列生成器と、
第2のコードブックインデックスを受け取り、第1の方向を有する対応する第2のコードブックベクトルを第2のコードブックから生成するように構成される、第2のベクトル逆量子化器と、
(A)前記第1の方向を有するベクトルと(B)前記回転行列との積を計算して、前記第1の方向とは異なる第2の方向を有する回転されたベクトルを生成するように構成される、乗算器とを備える、装置。 - 第1のコードブックインデックスと第2のコードブックインデックスとを含む、量子化されたベクトルを逆量子化する方法であって、
第1のコードブックの複数の第1のコードブックベクトルのうちから、前記第1のコードブックインデックスによって示される第1のコードブックベクトルを選択することと、
前記選択された第1のコードブックベクトルに基づく回転行列を生成することと、
第2のコードブックの複数の第2のコードブックベクトルのうちから、前記第2のコードブックインデックスによって示され第1の方向を有する第2のコードブックベクトルを選択することと、
(A)前記第1の方向を有するベクトルと(B)前記回転行列との積を計算して、前記第1の方向とは異なる第2の方向を有する回転されたベクトルを生成することとを備える、方法。 - 第1のコードブックインデックスと第2のコードブックインデックスとを含む、量子化されたベクトルを逆量子化するための装置であって、
第1のコードブックの複数の第1のコードブックベクトルのうちから、前記第1のコードブックインデックスによって示される第1のコードブックベクトルを選択するための手段と、
前記選択された第1のコードブックベクトルに基づく回転行列を生成するための手段と、
第2のコードブックの複数の第2のコードブックベクトルのうちから、前記第2のコードブックインデックスによって示され第1の方向を有する第2のコードブックベクトルを選択するための手段と、
(A)前記第1の方向を有するベクトルと(B)前記回転行列との積を計算して、前記第1の方向とは異なる第2の方向を有する回転されたベクトルを生成するための手段とを備える、装置。 - コンピュータに、請求項13から24および38のいずれか一項に記載の方法を実行させるためのプログラムを記憶するコンピュータ可読記憶媒体。
Applications Claiming Priority (15)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US36966210P | 2010-07-30 | 2010-07-30 | |
US61/369,662 | 2010-07-30 | ||
US36970510P | 2010-07-31 | 2010-07-31 | |
US61/369,705 | 2010-07-31 | ||
US36975110P | 2010-08-01 | 2010-08-01 | |
US61/369,751 | 2010-08-01 | ||
US37456510P | 2010-08-17 | 2010-08-17 | |
US61/374,565 | 2010-08-17 | ||
US38423710P | 2010-09-17 | 2010-09-17 | |
US61/384,237 | 2010-09-17 | ||
US201161470438P | 2011-03-31 | 2011-03-31 | |
US61/470,438 | 2011-03-31 | ||
US13/193,476 US8831933B2 (en) | 2010-07-30 | 2011-07-28 | Systems, methods, apparatus, and computer-readable media for multi-stage shape vector quantization |
US13/193,476 | 2011-07-28 | ||
PCT/US2011/045858 WO2012016122A2 (en) | 2010-07-30 | 2011-07-29 | Systems, methods, apparatus, and computer-readable media for multi-stage shape vector quantization |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2013539548A JP2013539548A (ja) | 2013-10-24 |
JP5587501B2 true JP5587501B2 (ja) | 2014-09-10 |
Family
ID=45527629
Family Applications (4)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2013523225A Active JP5694532B2 (ja) | 2010-07-30 | 2011-07-29 | ダイナミックなビット割り当てのためのシステム、方法、装置およびコンピュータ読取り可能媒体 |
JP2013523227A Ceased JP2013537647A (ja) | 2010-07-30 | 2011-07-29 | オーディオ信号の従属モードコーディングのためのシステム、方法、装置、およびコンピュータ可読媒体 |
JP2013523223A Active JP5587501B2 (ja) | 2010-07-30 | 2011-07-29 | 複数段階の形状ベクトル量子化のためのシステム、方法、装置、およびコンピュータ可読媒体 |
JP2013523220A Active JP5694531B2 (ja) | 2010-07-30 | 2011-07-29 | 高調波信号のコーディングのためのシステム、方法、装置、およびコンピュータ可読媒体 |
Family Applications Before (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2013523225A Active JP5694532B2 (ja) | 2010-07-30 | 2011-07-29 | ダイナミックなビット割り当てのためのシステム、方法、装置およびコンピュータ読取り可能媒体 |
JP2013523227A Ceased JP2013537647A (ja) | 2010-07-30 | 2011-07-29 | オーディオ信号の従属モードコーディングのためのシステム、方法、装置、およびコンピュータ可読媒体 |
Family Applications After (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2013523220A Active JP5694531B2 (ja) | 2010-07-30 | 2011-07-29 | 高調波信号のコーディングのためのシステム、方法、装置、およびコンピュータ可読媒体 |
Country Status (10)
Country | Link |
---|---|
US (4) | US20120029926A1 (ja) |
EP (5) | EP3021322B1 (ja) |
JP (4) | JP5694532B2 (ja) |
KR (4) | KR101445510B1 (ja) |
CN (4) | CN103038821B (ja) |
BR (1) | BR112013002166B1 (ja) |
ES (1) | ES2611664T3 (ja) |
HU (1) | HUE032264T2 (ja) |
TW (1) | TW201214416A (ja) |
WO (4) | WO2012016110A2 (ja) |
Families Citing this family (59)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
ATE490454T1 (de) * | 2005-07-22 | 2010-12-15 | France Telecom | Verfahren zum umschalten der raten- und bandbreitenskalierbaren audiodecodierungsrate |
CA2803272A1 (en) * | 2010-07-05 | 2012-01-12 | Nippon Telegraph And Telephone Corporation | Encoding method, decoding method, device, program, and recording medium |
US20120029926A1 (en) | 2010-07-30 | 2012-02-02 | Qualcomm Incorporated | Systems, methods, apparatus, and computer-readable media for dependent-mode coding of audio signals |
US9208792B2 (en) | 2010-08-17 | 2015-12-08 | Qualcomm Incorporated | Systems, methods, apparatus, and computer-readable media for noise injection |
US9008811B2 (en) | 2010-09-17 | 2015-04-14 | Xiph.org Foundation | Methods and systems for adaptive time-frequency resolution in digital data coding |
RU2554554C2 (ru) * | 2011-01-25 | 2015-06-27 | Ниппон Телеграф Энд Телефон Корпорейшн | Способ кодирования, кодер, способ определения величины периодического признака, устройство определения величины периодического признака, программа и носитель записи |
WO2012122297A1 (en) | 2011-03-07 | 2012-09-13 | Xiph. Org. | Methods and systems for avoiding partial collapse in multi-block audio coding |
US8838442B2 (en) | 2011-03-07 | 2014-09-16 | Xiph.org Foundation | Method and system for two-step spreading for tonal artifact avoidance in audio coding |
US9009036B2 (en) * | 2011-03-07 | 2015-04-14 | Xiph.org Foundation | Methods and systems for bit allocation and partitioning in gain-shape vector quantization for audio coding |
US9336787B2 (en) | 2011-10-28 | 2016-05-10 | Panasonic Intellectual Property Corporation Of America | Encoding apparatus and encoding method |
RU2505921C2 (ru) * | 2012-02-02 | 2014-01-27 | Корпорация "САМСУНГ ЭЛЕКТРОНИКС Ко., Лтд." | Способ и устройство кодирования и декодирования аудиосигналов (варианты) |
HUE033069T2 (hu) * | 2012-03-29 | 2017-11-28 | ERICSSON TELEFON AB L M (publ) | Harmonikus hangjelek átalakítási kódolása/dekódolása |
DE202013005408U1 (de) * | 2012-06-25 | 2013-10-11 | Lg Electronics Inc. | Mikrophonbefestigungsanordnung eines mobilen Endgerätes |
CN103516440B (zh) * | 2012-06-29 | 2015-07-08 | 华为技术有限公司 | 语音频信号处理方法和编码装置 |
PL3193332T3 (pl) | 2012-07-12 | 2020-12-14 | Nokia Technologies Oy | Kwantyzacja wektorowa |
EP2685448B1 (en) * | 2012-07-12 | 2018-09-05 | Harman Becker Automotive Systems GmbH | Engine sound synthesis |
US8885752B2 (en) * | 2012-07-27 | 2014-11-11 | Intel Corporation | Method and apparatus for feedback in 3D MIMO wireless systems |
US9129600B2 (en) * | 2012-09-26 | 2015-09-08 | Google Technology Holdings LLC | Method and apparatus for encoding an audio signal |
CN104737227B (zh) | 2012-11-05 | 2017-11-10 | 松下电器(美国)知识产权公司 | 语音音响编码装置、语音音响解码装置、语音音响编码方法和语音音响解码方法 |
CN105976824B (zh) * | 2012-12-06 | 2021-06-08 | 华为技术有限公司 | 信号解码的方法和设备 |
KR102200643B1 (ko) * | 2012-12-13 | 2021-01-08 | 프라운호퍼-게젤샤프트 추르 푀르데룽 데어 안제반텐 포르슝 에 파우 | 음성 음향 부호화 장치, 음성 음향 복호 장치, 음성 음향 부호화 방법 및 음성 음향 복호 방법 |
US9577618B2 (en) * | 2012-12-20 | 2017-02-21 | Advanced Micro Devices, Inc. | Reducing power needed to send signals over wires |
CA3076775C (en) | 2013-01-08 | 2020-10-27 | Dolby International Ab | Model based prediction in a critically sampled filterbank |
KR101757347B1 (ko) | 2013-01-29 | 2017-07-26 | 프라운호퍼 게젤샤프트 쭈르 푀르데룽 데어 안겐반텐 포르슝 에.베. | 지각적 변환 오디오 코딩에서의 노이즈 채움 |
RU2658892C2 (ru) | 2013-06-11 | 2018-06-25 | Фраунхофер-Гезелльшафт Цур Фердерунг Дер Ангевандтен Форшунг Е.Ф. | Устройство и способ для расширения диапазона частот для акустических сигналов |
CN104282308B (zh) | 2013-07-04 | 2017-07-14 | 华为技术有限公司 | 频域包络的矢量量化方法和装置 |
EP2830061A1 (en) | 2013-07-22 | 2015-01-28 | Fraunhofer Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus and method for encoding and decoding an encoded audio signal using temporal noise/patch shaping |
CN104347082B (zh) * | 2013-07-24 | 2017-10-24 | 富士通株式会社 | 弦波帧检测方法和设备以及音频编码方法和设备 |
US9224402B2 (en) | 2013-09-30 | 2015-12-29 | International Business Machines Corporation | Wideband speech parameterization for high quality synthesis, transformation and quantization |
US8879858B1 (en) | 2013-10-01 | 2014-11-04 | Gopro, Inc. | Multi-channel bit packing engine |
WO2015049820A1 (ja) * | 2013-10-04 | 2015-04-09 | パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカ | 音響信号符号化装置、音響信号復号装置、端末装置、基地局装置、音響信号符号化方法及び復号方法 |
ES2716756T3 (es) * | 2013-10-18 | 2019-06-14 | Ericsson Telefon Ab L M | Codificación de las posiciones de los picos espectrales |
CN105659320B (zh) | 2013-10-21 | 2019-07-12 | 杜比国际公司 | 音频编码器和解码器 |
EP3624347B1 (en) * | 2013-11-12 | 2021-07-21 | Telefonaktiebolaget LM Ericsson (publ) | Split gain shape vector coding |
US20150149157A1 (en) * | 2013-11-22 | 2015-05-28 | Qualcomm Incorporated | Frequency domain gain shape estimation |
BR112016020988B1 (pt) * | 2014-03-14 | 2022-08-30 | Telefonaktiebolaget Lm Ericsson (Publ) | Método e codificador para codificação de um sinal de áudio, e, dispositivo de comunicação |
CN104934032B (zh) * | 2014-03-17 | 2019-04-05 | 华为技术有限公司 | 根据频域能量对语音信号进行处理的方法和装置 |
US9542955B2 (en) * | 2014-03-31 | 2017-01-10 | Qualcomm Incorporated | High-band signal coding using multiple sub-bands |
EP3413307B1 (en) | 2014-07-25 | 2020-07-15 | FRAUNHOFER-GESELLSCHAFT zur Förderung der angewandten Forschung e.V. | Audio signal coding apparatus, audio signal decoding device, and methods thereof |
US9620136B2 (en) | 2014-08-15 | 2017-04-11 | Google Technology Holdings LLC | Method for coding pulse vectors using statistical properties |
US9336788B2 (en) | 2014-08-15 | 2016-05-10 | Google Technology Holdings LLC | Method for coding pulse vectors using statistical properties |
US9672838B2 (en) * | 2014-08-15 | 2017-06-06 | Google Technology Holdings LLC | Method for coding pulse vectors using statistical properties |
CA2964906A1 (en) | 2014-10-20 | 2016-04-28 | Audimax, Llc | Systems, methods, and devices for intelligent speech recognition and processing |
US20160232741A1 (en) * | 2015-02-05 | 2016-08-11 | Igt Global Solutions Corporation | Lottery Ticket Vending Device, System and Method |
WO2016142002A1 (en) * | 2015-03-09 | 2016-09-15 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Audio encoder, audio decoder, method for encoding an audio signal and method for decoding an encoded audio signal |
TWI758146B (zh) | 2015-03-13 | 2022-03-11 | 瑞典商杜比國際公司 | 解碼具有增強頻譜帶複製元資料在至少一填充元素中的音訊位元流 |
DE102015104864A1 (de) | 2015-03-30 | 2016-10-06 | Thyssenkrupp Ag | Lagerelement für einen Stabilisator eines Fahrzeugs |
CA2991341A1 (en) * | 2015-07-06 | 2017-01-12 | Nokia Technologies Oy | Bit error detector for an audio signal decoder |
EP3171362B1 (en) * | 2015-11-19 | 2019-08-28 | Harman Becker Automotive Systems GmbH | Bass enhancement and separation of an audio signal into a harmonic and transient signal component |
US10210874B2 (en) * | 2017-02-03 | 2019-02-19 | Qualcomm Incorporated | Multi channel coding |
US10825467B2 (en) * | 2017-04-21 | 2020-11-03 | Qualcomm Incorporated | Non-harmonic speech detection and bandwidth extension in a multi-source environment |
WO2019040136A1 (en) * | 2017-08-23 | 2019-02-28 | Google Llc | MULTI-SCALE QUANTIFICATION FOR QUICK SIMILARITY SEARCH |
RU2744362C1 (ru) * | 2017-09-20 | 2021-03-05 | Войсэйдж Корпорейшн | Способ и устройство для эффективного распределения битового бюджета в celp-кодеке |
CN108153189B (zh) * | 2017-12-20 | 2020-07-10 | 中国航空工业集团公司洛阳电光设备研究所 | 一种民机显示控制器的电源控制电路及方法 |
US11367452B2 (en) | 2018-03-02 | 2022-06-21 | Intel Corporation | Adaptive bitrate coding for spatial audio streaming |
CN112154502B (zh) | 2018-04-05 | 2024-03-01 | 瑞典爱立信有限公司 | 支持生成舒适噪声 |
CN110704024B (zh) * | 2019-09-28 | 2022-03-08 | 中昊芯英(杭州)科技有限公司 | 一种矩阵处理装置、方法及处理设备 |
US12073317B2 (en) * | 2020-01-07 | 2024-08-27 | Alibaba Group Holding Limited | Method and system for processing a neural network |
CN111681639B (zh) * | 2020-05-28 | 2023-05-30 | 上海墨百意信息科技有限公司 | 一种多说话人语音合成方法、装置及计算设备 |
Family Cites Families (115)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US3978287A (en) | 1974-12-11 | 1976-08-31 | Nasa | Real time analysis of voiced sounds |
US4516258A (en) | 1982-06-30 | 1985-05-07 | At&T Bell Laboratories | Bit allocation generator for adaptive transform coder |
JPS6333935A (ja) | 1986-07-29 | 1988-02-13 | Sharp Corp | ゲイン/シエイプ・ベクトル量子化器 |
US4899384A (en) | 1986-08-25 | 1990-02-06 | Ibm Corporation | Table controlled dynamic bit allocation in a variable rate sub-band speech coder |
JPH01205200A (ja) | 1988-02-12 | 1989-08-17 | Nippon Telegr & Teleph Corp <Ntt> | 音声符号化方式 |
US4964166A (en) | 1988-05-26 | 1990-10-16 | Pacific Communication Science, Inc. | Adaptive transform coder having minimal bit allocation processing |
US5388181A (en) * | 1990-05-29 | 1995-02-07 | Anderson; David J. | Digital audio compression system |
US5630011A (en) | 1990-12-05 | 1997-05-13 | Digital Voice Systems, Inc. | Quantization of harmonic amplitudes representing speech |
US5222146A (en) | 1991-10-23 | 1993-06-22 | International Business Machines Corporation | Speech recognition apparatus having a speech coder outputting acoustic prototype ranks |
EP0551705A3 (en) | 1992-01-15 | 1993-08-18 | Ericsson Ge Mobile Communications Inc. | Method for subbandcoding using synthetic filler signals for non transmitted subbands |
CA2088082C (en) | 1992-02-07 | 1999-01-19 | John Hartung | Dynamic bit allocation for three-dimensional subband video coding |
IT1257065B (it) | 1992-07-31 | 1996-01-05 | Sip | Codificatore a basso ritardo per segnali audio, utilizzante tecniche di analisi per sintesi. |
KR100188912B1 (ko) | 1992-09-21 | 1999-06-01 | 윤종용 | 서브밴드코딩의 비트재할당 방법 |
US5664057A (en) | 1993-07-07 | 1997-09-02 | Picturetel Corporation | Fixed bit rate speech encoder/decoder |
JP3228389B2 (ja) | 1994-04-01 | 2001-11-12 | 株式会社東芝 | 利得形状ベクトル量子化装置 |
TW271524B (ja) * | 1994-08-05 | 1996-03-01 | Qualcomm Inc | |
US5751905A (en) | 1995-03-15 | 1998-05-12 | International Business Machines Corporation | Statistical acoustic processing method and apparatus for speech recognition using a toned phoneme system |
SE506379C3 (sv) | 1995-03-22 | 1998-01-19 | Ericsson Telefon Ab L M | Lpc-talkodare med kombinerad excitation |
US5692102A (en) | 1995-10-26 | 1997-11-25 | Motorola, Inc. | Method device and system for an efficient noise injection process for low bitrate audio compression |
US5692949A (en) | 1995-11-17 | 1997-12-02 | Minnesota Mining And Manufacturing Company | Back-up pad for use with abrasive articles |
US5956674A (en) | 1995-12-01 | 1999-09-21 | Digital Theater Systems, Inc. | Multi-channel predictive subband audio coder using psychoacoustic adaptive bit allocation in frequency, time and over the multiple channels |
US5781888A (en) | 1996-01-16 | 1998-07-14 | Lucent Technologies Inc. | Perceptual noise shaping in the time domain via LPC prediction in the frequency domain |
JP3240908B2 (ja) | 1996-03-05 | 2001-12-25 | 日本電信電話株式会社 | 声質変換方法 |
JPH09288498A (ja) | 1996-04-19 | 1997-11-04 | Matsushita Electric Ind Co Ltd | 音声符号化装置 |
JP3707153B2 (ja) | 1996-09-24 | 2005-10-19 | ソニー株式会社 | ベクトル量子化方法、音声符号化方法及び装置 |
DE69712537T2 (de) | 1996-11-07 | 2002-08-29 | Matsushita Electric Industrial Co., Ltd. | Verfahren zur Erzeugung eines Vektorquantisierungs-Codebuchs |
FR2761512A1 (fr) | 1997-03-25 | 1998-10-02 | Philips Electronics Nv | Dispositif de generation de bruit de confort et codeur de parole incluant un tel dispositif |
US6064954A (en) | 1997-04-03 | 2000-05-16 | International Business Machines Corp. | Digital audio signal coding |
JP2001500284A (ja) | 1997-07-11 | 2001-01-09 | コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ | 改良した調波音声符号器を備えた送信機 |
DE19730130C2 (de) | 1997-07-14 | 2002-02-28 | Fraunhofer Ges Forschung | Verfahren zum Codieren eines Audiosignals |
WO1999010719A1 (en) | 1997-08-29 | 1999-03-04 | The Regents Of The University Of California | Method and apparatus for hybrid coding of speech at 4kbps |
US5999897A (en) | 1997-11-14 | 1999-12-07 | Comsat Corporation | Method and apparatus for pitch estimation using perception based analysis by synthesis |
JPH11224099A (ja) | 1998-02-06 | 1999-08-17 | Sony Corp | 位相量子化装置及び方法 |
JP3802219B2 (ja) | 1998-02-18 | 2006-07-26 | 富士通株式会社 | 音声符号化装置 |
US6301556B1 (en) | 1998-03-04 | 2001-10-09 | Telefonaktiebolaget L M. Ericsson (Publ) | Reducing sparseness in coded speech signals |
US6115689A (en) * | 1998-05-27 | 2000-09-05 | Microsoft Corporation | Scalable audio coder and decoder |
JP3515903B2 (ja) | 1998-06-16 | 2004-04-05 | 松下電器産業株式会社 | オーディオ符号化のための動的ビット割り当て方法及び装置 |
US6094629A (en) | 1998-07-13 | 2000-07-25 | Lockheed Martin Corp. | Speech coding system and method including spectral quantizer |
US7272556B1 (en) | 1998-09-23 | 2007-09-18 | Lucent Technologies Inc. | Scalable and embedded codec for speech and audio signals |
US6766288B1 (en) * | 1998-10-29 | 2004-07-20 | Paul Reed Smith Guitars | Fast find fundamental method |
US6363338B1 (en) * | 1999-04-12 | 2002-03-26 | Dolby Laboratories Licensing Corporation | Quantization in perceptual audio coders with compensation for synthesis filter noise spreading |
US6246345B1 (en) * | 1999-04-16 | 2001-06-12 | Dolby Laboratories Licensing Corporation | Using gain-adaptive quantization and non-uniform symbol lengths for improved audio coding |
CN1158646C (zh) | 1999-04-16 | 2004-07-21 | 多尔拜实验特许公司 | 在音频编码中应用增益自适应量化和变长码 |
JP4242516B2 (ja) | 1999-07-26 | 2009-03-25 | パナソニック株式会社 | サブバンド符号化方式 |
US6236960B1 (en) | 1999-08-06 | 2001-05-22 | Motorola, Inc. | Factorial packing method and apparatus for information coding |
US6782360B1 (en) | 1999-09-22 | 2004-08-24 | Mindspeed Technologies, Inc. | Gain quantization for a CELP speech coder |
US6952671B1 (en) | 1999-10-04 | 2005-10-04 | Xvd Corporation | Vector quantization with a non-structured codebook for audio compression |
JP2001242896A (ja) | 2000-02-29 | 2001-09-07 | Matsushita Electric Ind Co Ltd | 音声符号化/復号装置およびその方法 |
JP3404350B2 (ja) | 2000-03-06 | 2003-05-06 | パナソニック モバイルコミュニケーションズ株式会社 | 音声符号化パラメータ取得方法、音声復号方法及び装置 |
CA2359260C (en) | 2000-10-20 | 2004-07-20 | Samsung Electronics Co., Ltd. | Coding apparatus and method for orientation interpolator node |
GB2375028B (en) | 2001-04-24 | 2003-05-28 | Motorola Inc | Processing speech signals |
JP3636094B2 (ja) | 2001-05-07 | 2005-04-06 | ソニー株式会社 | 信号符号化装置及び方法、並びに信号復号装置及び方法 |
DE60209888T2 (de) | 2001-05-08 | 2006-11-23 | Koninklijke Philips Electronics N.V. | Kodieren eines audiosignals |
JP3601473B2 (ja) | 2001-05-11 | 2004-12-15 | ヤマハ株式会社 | ディジタルオーディオ圧縮回路および伸長回路 |
KR100347188B1 (en) | 2001-08-08 | 2002-08-03 | Amusetec | Method and apparatus for judging pitch according to frequency analysis |
US7240001B2 (en) | 2001-12-14 | 2007-07-03 | Microsoft Corporation | Quality improvement techniques in an audio encoder |
US7027982B2 (en) | 2001-12-14 | 2006-04-11 | Microsoft Corporation | Quality and rate control strategy for digital audio |
US7310598B1 (en) | 2002-04-12 | 2007-12-18 | University Of Central Florida Research Foundation, Inc. | Energy based split vector quantizer employing signal representation in multiple transform domains |
DE10217297A1 (de) | 2002-04-18 | 2003-11-06 | Fraunhofer Ges Forschung | Vorrichtung und Verfahren zum Codieren eines zeitdiskreten Audiosignals und Vorrichtung und Verfahren zum Decodieren von codierten Audiodaten |
JP4296752B2 (ja) | 2002-05-07 | 2009-07-15 | ソニー株式会社 | 符号化方法及び装置、復号方法及び装置、並びにプログラム |
US7447631B2 (en) | 2002-06-17 | 2008-11-04 | Dolby Laboratories Licensing Corporation | Audio coding system using spectral hole filling |
TWI288915B (en) | 2002-06-17 | 2007-10-21 | Dolby Lab Licensing Corp | Improved audio coding system using characteristics of a decoded signal to adapt synthesized spectral components |
ES2259158T3 (es) | 2002-09-19 | 2006-09-16 | Matsushita Electric Industrial Co., Ltd. | Metodo y aparato decodificador audio. |
JP4657570B2 (ja) | 2002-11-13 | 2011-03-23 | ソニー株式会社 | 音楽情報符号化装置及び方法、音楽情報復号装置及び方法、並びにプログラム及び記録媒体 |
FR2849727B1 (fr) | 2003-01-08 | 2005-03-18 | France Telecom | Procede de codage et de decodage audio a debit variable |
JP4191503B2 (ja) | 2003-02-13 | 2008-12-03 | 日本電信電話株式会社 | 音声楽音信号符号化方法、復号化方法、符号化装置、復号化装置、符号化プログラム、および復号化プログラム |
US7996234B2 (en) | 2003-08-26 | 2011-08-09 | Akikaze Technologies, Llc | Method and apparatus for adaptive variable bit rate audio encoding |
US7613607B2 (en) | 2003-12-18 | 2009-11-03 | Nokia Corporation | Audio enhancement in coded domain |
CA2457988A1 (en) | 2004-02-18 | 2005-08-18 | Voiceage Corporation | Methods and devices for audio compression based on acelp/tcx coding and multi-rate lattice vector quantization |
US20070299658A1 (en) | 2004-07-13 | 2007-12-27 | Matsushita Electric Industrial Co., Ltd. | Pitch Frequency Estimation Device, and Pich Frequency Estimation Method |
US20060015329A1 (en) | 2004-07-19 | 2006-01-19 | Chu Wai C | Apparatus and method for audio coding |
ES2476992T3 (es) | 2004-11-05 | 2014-07-15 | Panasonic Corporation | Codificador, descodificador, método de codificación y método de descodificaci�n |
JP4599558B2 (ja) | 2005-04-22 | 2010-12-15 | 国立大学法人九州工業大学 | ピッチ周期等化装置及びピッチ周期等化方法、並びに音声符号化装置、音声復号装置及び音声符号化方法 |
US7630882B2 (en) * | 2005-07-15 | 2009-12-08 | Microsoft Corporation | Frequency segmentation to obtain bands for efficient coding of digital media |
WO2007052088A1 (en) | 2005-11-04 | 2007-05-10 | Nokia Corporation | Audio compression |
CN101030378A (zh) | 2006-03-03 | 2007-09-05 | 北京工业大学 | 一种建立增益码书的方法 |
KR100770839B1 (ko) | 2006-04-04 | 2007-10-26 | 삼성전자주식회사 | 음성 신호의 하모닉 정보 및 스펙트럼 포락선 정보,유성음화 비율 추정 방법 및 장치 |
US8712766B2 (en) | 2006-05-16 | 2014-04-29 | Motorola Mobility Llc | Method and system for coding an information signal using closed loop adaptive bit allocation |
US7987089B2 (en) | 2006-07-31 | 2011-07-26 | Qualcomm Incorporated | Systems and methods for modifying a zero pad region of a windowed frame of an audio signal |
US8374857B2 (en) * | 2006-08-08 | 2013-02-12 | Stmicroelectronics Asia Pacific Pte, Ltd. | Estimating rate controlling parameters in perceptual audio encoders |
US20080059201A1 (en) | 2006-09-03 | 2008-03-06 | Chih-Hsiang Hsiao | Method and Related Device for Improving the Processing of MP3 Decoding and Encoding |
JP4396683B2 (ja) | 2006-10-02 | 2010-01-13 | カシオ計算機株式会社 | 音声符号化装置、音声符号化方法、及び、プログラム |
WO2008045846A1 (en) | 2006-10-10 | 2008-04-17 | Qualcomm Incorporated | Method and apparatus for encoding and decoding audio signals |
US20080097757A1 (en) * | 2006-10-24 | 2008-04-24 | Nokia Corporation | Audio coding |
KR100862662B1 (ko) | 2006-11-28 | 2008-10-10 | 삼성전자주식회사 | 프레임 오류 은닉 방법 및 장치, 이를 이용한 오디오 신호복호화 방법 및 장치 |
BRPI0721079A2 (pt) | 2006-12-13 | 2014-07-01 | Panasonic Corp | Dispositivo de codificação, dispositivo de decodificação e método dos mesmos |
CN101548318B (zh) | 2006-12-15 | 2012-07-18 | 松下电器产业株式会社 | 编码装置、解码装置以及其方法 |
KR101299155B1 (ko) * | 2006-12-29 | 2013-08-22 | 삼성전자주식회사 | 오디오 부호화 및 복호화 장치와 그 방법 |
FR2912249A1 (fr) * | 2007-02-02 | 2008-08-08 | France Telecom | Codage/decodage perfectionnes de signaux audionumeriques. |
EP1973101B1 (en) | 2007-03-23 | 2010-02-24 | Honda Research Institute Europe GmbH | Pitch extraction with inhibition of harmonics and sub-harmonics of the fundamental frequency |
US9653088B2 (en) | 2007-06-13 | 2017-05-16 | Qualcomm Incorporated | Systems, methods, and apparatus for signal encoding using pitch-regularizing and non-pitch-regularizing coding |
US8005023B2 (en) | 2007-06-14 | 2011-08-23 | Microsoft Corporation | Client-side echo cancellation for multi-party audio conferencing |
US7761290B2 (en) | 2007-06-15 | 2010-07-20 | Microsoft Corporation | Flexible frequency and time partitioning in perceptual transform coding of audio |
US7774205B2 (en) | 2007-06-15 | 2010-08-10 | Microsoft Corporation | Coding of sparse digital media spectral data |
US8111176B2 (en) | 2007-06-21 | 2012-02-07 | Koninklijke Philips Electronics N.V. | Method for encoding vectors |
US7885819B2 (en) | 2007-06-29 | 2011-02-08 | Microsoft Corporation | Bitstream syntax for multi-process audio decoding |
PT2186089T (pt) | 2007-08-27 | 2019-01-10 | Ericsson Telefon Ab L M | Método e dispositivo para descodificação espetral percetual de um sinal áudio que inclui preenchimento de buracos espetrais |
JP5264913B2 (ja) | 2007-09-11 | 2013-08-14 | ヴォイスエイジ・コーポレーション | 話声およびオーディオの符号化における、代数符号帳の高速検索のための方法および装置 |
WO2009048239A2 (en) * | 2007-10-12 | 2009-04-16 | Electronics And Telecommunications Research Institute | Encoding and decoding method using variable subband analysis and apparatus thereof |
US8527265B2 (en) * | 2007-10-22 | 2013-09-03 | Qualcomm Incorporated | Low-complexity encoding/decoding of quantized MDCT spectrum in scalable speech and audio codecs |
US8139777B2 (en) | 2007-10-31 | 2012-03-20 | Qnx Software Systems Co. | System for comfort noise injection |
CN101465122A (zh) * | 2007-12-20 | 2009-06-24 | 株式会社东芝 | 语音的频谱波峰的检测以及语音识别方法和系统 |
US20090319261A1 (en) | 2008-06-20 | 2009-12-24 | Qualcomm Incorporated | Coding of transitional speech frames for low-bit-rate applications |
CN103000178B (zh) | 2008-07-11 | 2015-04-08 | 弗劳恩霍夫应用研究促进协会 | 提供时间扭曲激活信号以及使用该时间扭曲激活信号对音频信号编码 |
EP2304719B1 (en) | 2008-07-11 | 2017-07-26 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio encoder, methods for providing an audio stream and computer program |
CN102123779B (zh) | 2008-08-26 | 2013-06-05 | 华为技术有限公司 | 用于无线通信的系统和方法 |
US8364471B2 (en) | 2008-11-04 | 2013-01-29 | Lg Electronics Inc. | Apparatus and method for processing a time domain audio signal with a noise filling flag |
EP2380172B1 (en) | 2009-01-16 | 2013-07-24 | Dolby International AB | Cross product enhanced harmonic transposition |
RU2519027C2 (ru) | 2009-02-13 | 2014-06-10 | Панасоник Корпорэйшн | Устройство векторного квантования, устройство векторного обратного квантования и способы для этого |
FR2947945A1 (fr) * | 2009-07-07 | 2011-01-14 | France Telecom | Allocation de bits dans un codage/decodage d'amelioration d'un codage/decodage hierarchique de signaux audionumeriques |
US9117458B2 (en) | 2009-11-12 | 2015-08-25 | Lg Electronics Inc. | Apparatus for processing an audio signal and method thereof |
KR101445296B1 (ko) | 2010-03-10 | 2014-09-29 | 프라운호퍼 게젤샤프트 쭈르 푀르데룽 데어 안겐반텐 포르슝 에. 베. | 샘플링 레이트 의존 시간 왜곡 윤곽 인코딩을 이용하는 오디오 신호 디코더, 오디오 신호 인코더, 방법, 및 컴퓨터 프로그램 |
WO2011141772A1 (en) | 2010-05-12 | 2011-11-17 | Nokia Corporation | Method and apparatus for processing an audio signal based on an estimated loudness |
US20120029926A1 (en) | 2010-07-30 | 2012-02-02 | Qualcomm Incorporated | Systems, methods, apparatus, and computer-readable media for dependent-mode coding of audio signals |
US9208792B2 (en) | 2010-08-17 | 2015-12-08 | Qualcomm Incorporated | Systems, methods, apparatus, and computer-readable media for noise injection |
-
2011
- 2011-07-28 US US13/193,542 patent/US20120029926A1/en not_active Abandoned
- 2011-07-28 US US13/192,956 patent/US8924222B2/en active Active
- 2011-07-28 US US13/193,529 patent/US9236063B2/en active Active
- 2011-07-28 US US13/193,476 patent/US8831933B2/en active Active
- 2011-07-29 CN CN201180037426.9A patent/CN103038821B/zh active Active
- 2011-07-29 BR BR112013002166-7A patent/BR112013002166B1/pt active IP Right Grant
- 2011-07-29 KR KR1020137005161A patent/KR101445510B1/ko active IP Right Grant
- 2011-07-29 EP EP15201425.4A patent/EP3021322B1/en active Active
- 2011-07-29 WO PCT/US2011/045837 patent/WO2012016110A2/en active Application Filing
- 2011-07-29 WO PCT/US2011/045862 patent/WO2012016126A2/en active Application Filing
- 2011-07-29 CN CN201180037521.9A patent/CN103052984B/zh active Active
- 2011-07-29 EP EP11755462.6A patent/EP2599080B1/en active Active
- 2011-07-29 JP JP2013523225A patent/JP5694532B2/ja active Active
- 2011-07-29 EP EP11745634.3A patent/EP2599082B1/en active Active
- 2011-07-29 CN CN201180037495.XA patent/CN103038822B/zh active Active
- 2011-07-29 JP JP2013523227A patent/JP2013537647A/ja not_active Ceased
- 2011-07-29 EP EP11744159.2A patent/EP2599081B1/en active Active
- 2011-07-29 JP JP2013523223A patent/JP5587501B2/ja active Active
- 2011-07-29 JP JP2013523220A patent/JP5694531B2/ja active Active
- 2011-07-29 KR KR1020137005131A patent/KR101442997B1/ko active IP Right Grant
- 2011-07-29 CN CN2011800371913A patent/CN103038820A/zh active Pending
- 2011-07-29 WO PCT/US2011/045865 patent/WO2012016128A2/en active Application Filing
- 2011-07-29 KR KR1020137005405A patent/KR20130069756A/ko active IP Right Grant
- 2011-07-29 KR KR1020137005152A patent/KR101445509B1/ko active IP Right Grant
- 2011-07-29 WO PCT/US2011/045858 patent/WO2012016122A2/en active Application Filing
- 2011-07-29 TW TW100127114A patent/TW201214416A/zh unknown
- 2011-07-29 ES ES11755462.6T patent/ES2611664T3/es active Active
- 2011-07-29 EP EP20216563.5A patent/EP3852104B1/en active Active
- 2011-07-29 HU HUE11755462A patent/HUE032264T2/en unknown
Also Published As
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5587501B2 (ja) | 複数段階の形状ベクトル量子化のためのシステム、方法、装置、およびコンピュータ可読媒体 | |
JP5680755B2 (ja) | ノイズ注入のためのシステム、方法、装置、および、コンピュータ読取可能媒体 | |
CN108831501B (zh) | 用于带宽扩展的高频编码/高频解码方法和设备 | |
CN110176241B (zh) | 信号编码方法和设备以及信号解码方法和设备 | |
JP2017528751A (ja) | 信号符号化方法及びその装置、並びに信号復号方法及びその装置 | |
WO2014130083A1 (en) | Systems and methods for determining pitch pulse period signal boundaries | |
JP2013537325A (ja) | ピッチサイクルエネルギーを判断し、励起信号をスケーリングすること | |
WO2018073486A1 (en) | Low-delay audio coding |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20140304 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20140530 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20140624 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20140723 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5587501 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |