JP5596189B2 - 非アクティブフレームの広帯域符号化および復号化を行うためのシステム、方法、および装置 - Google Patents
非アクティブフレームの広帯域符号化および復号化を行うためのシステム、方法、および装置 Download PDFInfo
- Publication number
- JP5596189B2 JP5596189B2 JP2013022112A JP2013022112A JP5596189B2 JP 5596189 B2 JP5596189 B2 JP 5596189B2 JP 2013022112 A JP2013022112 A JP 2013022112A JP 2013022112 A JP2013022112 A JP 2013022112A JP 5596189 B2 JP5596189 B2 JP 5596189B2
- Authority
- JP
- Japan
- Prior art keywords
- frame
- description
- encoded
- frequency band
- frames
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims description 266
- 230000003595 spectral effect Effects 0.000 claims description 384
- 230000005236 sound signal Effects 0.000 claims description 147
- 238000012545 processing Methods 0.000 claims description 42
- 230000000875 corresponding effect Effects 0.000 description 63
- 230000007704 transition Effects 0.000 description 58
- 230000005284 excitation Effects 0.000 description 57
- 239000013598 vector Substances 0.000 description 54
- 238000010586 diagram Methods 0.000 description 51
- 238000001228 spectrum Methods 0.000 description 38
- 239000000872 buffer Substances 0.000 description 30
- 230000002123 temporal effect Effects 0.000 description 29
- 230000000694 effects Effects 0.000 description 26
- 230000004044 response Effects 0.000 description 25
- 238000003860 storage Methods 0.000 description 22
- 206010019133 Hangover Diseases 0.000 description 20
- 238000004590 computer program Methods 0.000 description 19
- 238000004891 communication Methods 0.000 description 18
- 238000004458 analytical method Methods 0.000 description 15
- 238000013459 approach Methods 0.000 description 13
- 230000006870 function Effects 0.000 description 11
- 238000003491 array Methods 0.000 description 10
- 230000005540 biological transmission Effects 0.000 description 10
- 230000008569 process Effects 0.000 description 9
- 238000013139 quantization Methods 0.000 description 9
- 238000005070 sampling Methods 0.000 description 8
- 230000015572 biosynthetic process Effects 0.000 description 7
- 230000008859 change Effects 0.000 description 7
- 230000003287 optical effect Effects 0.000 description 7
- 238000003786 synthesis reaction Methods 0.000 description 7
- 230000001413 cellular effect Effects 0.000 description 6
- 238000012935 Averaging Methods 0.000 description 4
- 230000003044 adaptive effect Effects 0.000 description 4
- 238000004364 calculation method Methods 0.000 description 4
- 238000012937 correction Methods 0.000 description 4
- 238000013500 data storage Methods 0.000 description 4
- 238000009826 distribution Methods 0.000 description 4
- 239000004065 semiconductor Substances 0.000 description 4
- 238000012546 transfer Methods 0.000 description 4
- 238000004422 calculation algorithm Methods 0.000 description 3
- 238000005516 engineering process Methods 0.000 description 3
- 239000000047 product Substances 0.000 description 3
- 230000001629 suppression Effects 0.000 description 3
- 230000008901 benefit Effects 0.000 description 2
- 238000003066 decision tree Methods 0.000 description 2
- 238000013213 extrapolation Methods 0.000 description 2
- 238000001914 filtration Methods 0.000 description 2
- 238000003780 insertion Methods 0.000 description 2
- 230000037431 insertion Effects 0.000 description 2
- 230000001788 irregular Effects 0.000 description 2
- 230000007774 longterm Effects 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000010606 normalization Methods 0.000 description 2
- 230000000737 periodic effect Effects 0.000 description 2
- 238000007493 shaping process Methods 0.000 description 2
- 238000012360 testing method Methods 0.000 description 2
- 230000001052 transient effect Effects 0.000 description 2
- 230000015556 catabolic process Effects 0.000 description 1
- 230000002596 correlated effect Effects 0.000 description 1
- 238000006731 degradation reaction Methods 0.000 description 1
- 230000000593 degrading effect Effects 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 239000000284 extract Substances 0.000 description 1
- 238000009499 grossing Methods 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 230000002045 lasting effect Effects 0.000 description 1
- 239000006249 magnetic particle Substances 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 239000002245 particle Substances 0.000 description 1
- 229920000642 polymer Polymers 0.000 description 1
- 238000007781 pre-processing Methods 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 230000000717 retained effect Effects 0.000 description 1
- 230000000630 rising effect Effects 0.000 description 1
- 238000010183 spectrum analysis Methods 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
- 239000013589 supplement Substances 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
- 238000013519 translation Methods 0.000 description 1
- 230000002087 whitening effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/16—Vocoder architecture
- G10L19/18—Vocoders using multiple modes
- G10L19/24—Variable rate codecs, e.g. for generating different qualities using a scalable representation such as hierarchical encoding or layered encoding
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/038—Speech enhancement, e.g. noise reduction or echo cancellation using band spreading techniques
Landscapes
- Engineering & Computer Science (AREA)
- Quality & Reliability (AREA)
- Computational Linguistics (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Description
なお、以下の記載は出願当初の特許請求の範囲の記載に実質的に一致するものである。
[1]
音声信号のフレームを符号化する方法であって、
前記音声信号の第1のフレームに基づく、pをゼロでない正の整数とするpビットの長さを有する、第1の符号化フレームを生成することと、
前記音声信号の第2のフレームに基づく、qをpと異なるゼロでない正の整数とするqビットの長さを有する、第2の符号化フレームを生成することと、
前記音声信号の第3のフレームに基づく、rをqよりも小さいゼロでない正の整数とするrビットの長さを有する、第3の符号化フレームを生成することとを備え、
前記第2のフレームは、前記第1のフレームの後に出現する非アクティブフレームであり、前記第3のフレームは、前記第2のフレームの後に出現する非アクティブフレームであり、前記第1のフレームと前記第3のフレームとの間の前記音声信号の前記フレームはすべて、非アクティブである方法。
[2]
qは、pよりも小さい[1]に記載の方法。
[3]
前記音声信号中で、少なくとも1つのフレームは、前記第1のフレームと前記第2のフレームとの間に出現する[1]に記載の方法。
[4]
前記第2の符号化フレームは、(A)前記第2のフレームを含む前記音声信号の一部の、第1の周波数帯域上のスペクトル包絡線の記述および(B)前記第2のフレームを含む前記音声信号の一部の、前記第1の周波数帯域と異なる第2の周波数帯域上のスペクトル包絡線の記述を含む[1]に記載の方法。
[5]
前記第2の周波数帯域の少なくとも一部は、前記第1の周波数帯域よりも高い[4]に記載の方法。
[6]
前記第1および第2の周波数帯域は、少なくとも200ヘルツオーバーラップする[5]に記載の方法。
[7]
第1の周波数帯域上のスペクトル包絡線の記述と第2の周波数帯域上のスペクトル包絡線の記述のうちの少なくとも1つは、それぞれが前記音声信号の非アクティブフレームを含む前記音声信号の対応する部分のスペクトル包絡線の少なくとも2つの記述の平均に基づく[4]に記載の方法。
[8]
前記第2の符号化フレームは、前記音声信号の少なくとも2つの非アクティブフレームから得られた情報に基づく[1]に記載の方法。
[9]
前記第2の符号化フレームは、前記第2のフレームを含む前記音声信号の一部の、第1の周波数帯域上のスペクトル包絡線の記述を含み、
前記第2の符号化フレームは、前記第2のフレームを含む前記音声信号の一部の、前記第1の周波数帯域と異なる第2の周波数帯域上のスペクトル包絡線の、長さがゼロでない正の整数のuビットである記述を含み、
前記第1の符号化フレームは、前記第1のフレームを含む前記音声信号の一部の、前記第2の周波数帯域上のスペクトル包絡線の、長さがu以下のゼロでない正の整数のvビットである記述を含む[1]に記載の方法。
[10]
vは、uよりも小さい[9]に記載の方法。
[11]
前記第3の符号化フレームは、前記第3のフレームを含む前記音声信号の一部のスペクトル包絡線の記述を含む[1]に記載の方法。
[12]
前記第2の符号化フレームは、(A)前記第2のフレームを含む前記音声信号の一部の、第1の周波数帯域上のスペクトル包絡線の記述および(B)前記第2のフレームを含む前記音声信号の一部の、前記第1の周波数帯域と異なる第2の周波数帯域上のスペクトル包絡線の記述を含み、
前記第3の符号化フレームは、(A)前記第3のフレームを含む前記音声信号の一部の、前記第1の周波数帯域上のスペクトル包絡線の記述を含み、(B)前記第2の周波数帯域上のスペクトル包絡線の記述を含まない[1]に記載の方法。
[13]
前記第2の符号化フレームは、前記第2のフレームを含む前記音声信号の一部の時間包絡線の記述を含み、
前記第3の符号化フレームは、前記第3のフレームを含む前記音声信号の一部の時間包絡線の記述を含む[1]に記載の方法。
[14]
前記第2の符号化フレームは、(A)前記第2のフレームを含む前記音声信号の一部の、第1の周波数帯域に対する時間包絡線の記述および(B)前記第2のフレームを含む前記音声信号の一部の、前記第1の周波数帯域と異なる第2の周波数帯域に対する時間包絡線の記述を含み、
前記第3の符号化フレームは、前記第2の周波数帯域に対する時間包絡線の記述を含まない[1]に記載の方法。
[15]
前記第2のフレームに関する連続するアクティブフレームの一番最近のシーケンスの長さは、少なくとも所定の閾値に等しい[1]に記載の方法。
[16]
qは、pよりも小さく、
前記第1のフレームと前記第2のフレームとの間の前記音声信号の少なくとも1つの非アクティブフレームのそれぞれについて、pビットの長さを有する対応する符号化フレームを生成することを備える[1]に記載の方法。
[17]
音声信号のフレームを符号化する方法であって、
前記音声信号の第1のフレームに基づく、qをゼロでない正の整数とするqビットの長さを有する、第1の符号化フレームを生成することと、
前記音声信号の第2のフレームに基づく、rをqよりも小さいゼロでない正の整数とするrビットの長さを有する、第2の符号化フレームを生成することとを備え、
前記第1の符号化フレームは、(A)前記第1のフレームを含む前記音声信号の一部の、第1の周波数帯域上のスペクトル包絡線の記述および(B)前記第1のフレームを含む前記音声信号の一部の、前記第1の周波数帯域と異なる第2の周波数帯域上のスペクトル包絡線の記述を含み、
前記第2の符号化フレームは、(A)前記第2のフレームを含む前記音声信号の一部の、前記第1の周波数帯域上のスペクトル包絡線の記述を含み、(B)前記第2の周波数帯域上のスペクトル包絡線の記述を含まない方法。
[18]
前記第2のフレームは、前記音声信号中の前記第1のフレームの直後に続く[17]に記載の方法。
[19]
前記第1のフレームと前記第2のフレームとの間の前記音声信号の前記フレームはすべて、非アクティブである[17]に記載の方法。
[20]
前記第2の周波数帯域の少なくとも一部は、前記第1の周波数帯域よりも高い[17]に記載の方法。
[21]
前記第1および第2の周波数帯域は、少なくとも200ヘルツだけオーバーラップする[20]に記載の方法。
[22]
音声信号のフレームを符号化するための装置であって、
前記音声信号の第1のフレームに基づき、pをゼロでない正の整数とするpビットの長さを有する、第1の符号化フレームを生成するための手段と、
前記音声信号の第2のフレームに基づき、qをpと異なるゼロでない正の整数とするqビットの長さを有する、第2の符号化フレームを生成するための手段と、
前記音声信号の第3のフレームに基づき、rをqよりも小さいゼロでない正の整数とするrビットの長さを有する、第3の符号化フレームを生成するための手段とを備え、
前記第2のフレームは、前記第1のフレームの後に出現する非アクティブフレームであり、前記第3のフレームは、前記第2のフレームの後に出現する非アクティブフレームであり、前記第1のフレームと前記第3のフレームとの間の前記音声信号の前記フレームはすべて、非アクティブである装置。
[23]
前記第1および第3のフレーム、および前記第1のフレームと前記第3のフレームとの間のフレームのそれぞれについて、前記フレームがアクティブであるか、または非アクティブであるかを指示するための手段と、
前記第1のフレームについて指示するための手段の指示に応答して、第1の符号化方式を選択するための手段と、
前記第2のフレームについて、前記第2のフレームが非アクティブがあること、および前記第1のフレームと前記第2のフレームとの間の任意の複数のフレームがアクティブであることを指示するための手段の指示に応答して、第2の符号化方式を選択するための手段と、
前記第3のフレームについて、前記第3のフレームが前記第1のフレームの後に出現する非アクティブフレームの連続する系列の1つであることを指示するための手段の指示に応答して、第2の符号化方式を選択するための手段とを備え、
第1の符号化フレームを生成するための前記手段は、前記第1の符号化方式に従って前記第1の符号化フレームを生成するように構成され、
第2の符号化フレームを生成するための前記手段は、前記第2の符号化方式に従って前記第2の符号化フレームを生成するように構成され、
第3の符号化フレームを生成するための前記手段は、前記第3の符号化方式に従って前記第3の符号化フレームを生成するように構成されている[22]に記載の装置。
[24]
前記音声信号中で、少なくとも1つのフレームは、前記第1のフレームと前記第2のフレームとの間に出現する[22]に記載の装置。
[25]
第2の符号化フレームを生成するための前記手段は、(A)前記第2のフレームを含む前記音声信号の一部の、第1の周波数帯域上のスペクトル包絡線の記述および(B)前記第2のフレームを含む前記音声信号の一部の、前記第1の周波数帯域と異なる第2の周波数帯域上のスペクトル包絡線の記述を含む前記第2の符号化フレームを生成するように構成されている[22]に記載の装置。
[26]
第3の符号化フレームを生成するための前記手段は、(A)前記第1の周波数帯域上のスペクトル包絡線の記述を含み、(B)前記第2の周波数帯域上のスペクトル包絡線の記述を含まない前記第3の符号化フレームを生成するように構成されている[25]に記載の装置。
[27]
第3の符号化フレームを生成するための前記手段は、前記第3のフレームを含む前記音声信号の一部のスペクトル包絡線の記述を含む前記第3の符号化フレームを生成するように構成されている[22]に記載の装置。
[28]
コンピュータ可読媒体を備えるコンピュータプログラム製品であって、前記媒体は、
前記音声信号の第1のフレームに基づく、pをゼロでない正の整数とするpビットの長さを有する、第1の符号化フレームを少なくとも1つのコンピュータに生成させるためのコードと、
前記音声信号の第2のフレームに基づく、qをpと異なるゼロでない正の整数とするqビットの長さを有する、第2の符号化フレームを少なくとも1つのコンピュータに生成させるためのコードと、
前記音声信号の第3のフレームに基づく、rをqよりも小さいゼロでない正の整数とするrビットの長さを有する、第3の符号化フレームを少なくとも1つのコンピュータに生成させるためのコードとを備え、
前記第2のフレームは、前記第1のフレームの後に出現する非アクティブフレームであり、前記第3のフレームは、前記第2のフレームの後に出現する非アクティブフレームであり、前記第1のフレームと前記第3のフレームとの間の前記音声信号の前記フレームはすべて、非アクティブであるコンピュータプログラム製品。
[29]
前記音声信号中で、少なくとも1つのフレームは、前記第1のフレームと前記第2のフレームとの間に出現する[28]に記載のコンピュータプログラム製品。
[30]
第2の符号化フレームを少なくとも1つのコンピュータに生成させるための前記コードは、(A)前記第2のフレームを含む前記音声信号の一部の、第1の周波数帯域上のスペクトル包絡線の記述および(B)前記第2のフレームを含む前記音声信号の一部の、前記第1の周波数帯域と異なる第2の周波数帯域上のスペクトル包絡線の記述を含む前記第2の符号化フレームを前記少なくとも1つのコンピュータに生成させるように構成されている[28]に記載のコンピュータプログラム製品。
[31]
第3の符号化フレームを少なくとも1つのコンピュータに生成させるための前記コードは、(A)前記第1の周波数帯域上のスペクトル包絡線の記述を含み、(B)前記第2の周波数帯域上のスペクトル包絡線の記述を含まない前記第3の符号化フレームを前記少なくとも1つのコンピュータに生成させるように構成されている[30]に記載のコンピュータプログラム製品。
[32]
第3の符号化フレームを少なくとも1つのコンピュータに生成させるための前記コードは、前記第3のフレームを含む前記音声信号の一部のスペクトル包絡線の記述を含む前記第3の符号化フレームを前記少なくとも1つのコンピュータに生成させるように構成されている[28]に記載のコンピュータプログラム製品。
[33]
音声信号のフレームを符号化するための装置であって、
前記音声信号の複数のフレームのそれぞれについて、前記フレームがアクティブであるか、または非アクティブであるかを指示するように構成された音声活動検出器と、
(A)前記音声信号の第1のフレームに対する前記音声活動検出器の指示に応答して、第1の符号化方式を、
(B)前記第1のフレームの後に出現する非アクティブフレームの連続する系列の1つである第2のフレームについて、また前記第2のフレームが非アクティブであることを指示する前記音声活動検出器の指示に応答して、第2の符号化方式を、そして
(C)前記音声信号内の前記第2のフレームの後に続く、前記第1のフレームの後に出現する非アクティブフレームの連続する系列の他の1つである第3のフレームについて、また前記第3のフレームが非アクティブであることを指示する前記音声活動検出器の指示に応答して、第3の符号化方式を
選択するように構成された符号化方式選択器と、
(D)前記第1の符号化方式に従って、前記第1のフレームに基づく、pをゼロでない正の整数とするpビットの長さを有する、第1の符号化フレームを、
(E)前記第2の符号化方式に従って、前記第2のフレームに基づく、qをpと異なるゼロでない正の整数とするqビットの長さを有する、第2の符号化フレームを、そして
(F)前記第3の符号化方式に従って、前記第3のフレームに基づく、rをqよりも小さいゼロでない正の整数とするrビットの長さを有する、第3の符号化フレームを
生成するように構成された音声符号器とを備える装置。
[34]
前記音声信号中で、少なくとも1つのフレームは、前記第1のフレームと前記第2のフレームとの間に出現する[33]に記載の装置。
[35]
前記音声符号器は、(A)前記第2のフレームを含む前記音声信号の一部の、第1の周波数帯域上のスペクトル包絡線の記述および(B)前記第2のフレームを含む前記音声信号の一部の、前記第1の周波数帯域と異なる第2の周波数帯域上のスペクトル包絡線の記述を含む前記第2の符号化フレームを生成するように構成されている[33]に記載の装置。
[36]
前記音声符号器は、(A)前記第1の周波数帯域上のスペクトル包絡線の記述を含み、(B)前記第2の周波数帯域上のスペクトル包絡線の記述を含まない前記第3の符号化フレームを生成するように構成されている[35]に記載の装置。
[37]
前記音声符号器は、前記第3のフレームを含む前記音声信号の一部のスペクトル包絡線の記述を含む前記第3の符号化フレームを生成するように構成されている[33]に記載の装置。
[38]
符号化音声信号を処理する方法であって、
前記符号化音声信号の第1の符号化フレームから得られる情報に基づき、(A)第1の周波数帯域および(B)前記第1の周波数帯域と異なる第2の周波数帯域上で音声信号の第1のフレームのスペクトル包絡線の記述を取得することと、
前記符号化音声信号の第2の符号化フレームから得られる情報に基づき、前記第1の周波数帯域上の前記音声信号の第2のフレームのスペクトル包絡線の記述を取得することと、
前記第1の符号化フレームから得られる情報に基づき、前記第2の周波数帯域上の前記第2のフレームのスペクトル包絡線の記述を取得することとを備える方法。
[39]
前記第1の周波数帯域上の前記音声信号の第2のフレームのスペクトル包絡線の記述を前記取得することは、前記第2の符号化フレームから得られる情報に少なくとも主に基づく[38]に記載の符号化音声信号を処理する方法。
[40]
前記第2の周波数帯域上の前記第2のフレームのスペクトル包絡線の記述を前記取得することは、前記第1の符号化フレームから得られる情報に少なくとも主に基づく[38]に記載の符号化音声信号を処理する方法。
[41]
第1のフレームのスペクトル包絡線の前記記述は、前記第1の周波数帯域上の前記第1のフレームのスペクトル包絡線の記述および前記第2の周波数帯域上の前記第1のフレームのスペクトル包絡線の記述を含む[38]に記載の符号化音声信号を処理する方法。
[42]
前記第2の周波数帯域上の前記第2のフレームのスペクトル包絡線の記述を前記取得する際に基づく前記情報は、前記第2の周波数帯域上の前記第1のフレームのスペクトル包絡線の前記記述を含む[35]に記載の符号化音声信号を処理する方法。
[43]
前記第1の符号化フレームは、広帯域符号化方式に従って符号化され、前記第2の符号化フレームは、狭帯域符号化方式に従って符号化される[38]に記載の符号化音声信号を処理する方法。
[44]
前記第1の符号化フレームのビット単位の長さは、前記第2の符号化フレームのビット単位の長さの少なくとも2倍である[38]に記載の符号化音声信号を処理する方法。
[45]
前記第1の周波数帯域上の前記第2のフレームのスペクトル包絡線の前記記述、前記第2の周波数帯域上の前記第2のフレームのスペクトル包絡線の前記記述、および少なくとも主に不規則雑音信号に基づく励振信号に基づき、前記第2のフレームを計算することを備える[38]に記載の符号化音声信号を処理する方法。
[46]
前記第2の周波数帯域上の前記第2のフレームのスペクトル包絡線の記述を前記取得することは、前記符号化音声信号の第3の符号化フレームから得られる情報に基づいており、前記第1および第3の符号化フレームは両方とも、前記第2の符号化フレームの前の前記符号化音声信号中に出現する[38]に記載の符号化音声信号を処理する方法。
[47]
第3の符号化フレームから得られる情報は、前記第2の周波数帯域上の前記音声信号の第3のフレームのスペクトル包絡線の記述を含む[46]に記載の符号化音声信号を処理する方法。
[48]
前記第2の周波数帯域上の前記第1のフレームのスペクトル包絡線の前記記述は、スペクトルパラメータ値のベクトルを含み、
前記第2の周波数帯域上の前記第3のフレームのスペクトル包絡線の前記記述は、スペクトルパラメータ値のベクトルを含み、
前記第2の周波数帯域上の前記第2のフレームのスペクトル包絡線の記述を前記取得することは、前記第1のフレームのスペクトルパラメータ値の前記ベクトルおよび前記第3のフレームのスペクトルパラメータ値の前記ベクトルの関数として前記第2のフレームのスペクトルパラメータ値のベクトルを計算することを含む[46]に記載の符号化音声信号を処理する方法。
[49]
前記第1の符号化フレームの符号化インデックスが少なくとも1つの所定の条件を満たしていることを検出したことに応答して、前記第1の符号化フレームから得られた前記情報を格納し、その後前記第2の周波数帯域上の前記第2のフレームのスペクトル包絡線の記述を前記取得することと、
前記第3の符号化フレームの符号化インデックスが少なくとも1つの所定の条件を満たしていることを検出したことに応答して、前記第3の符号化フレームから得られた前記情報を格納し、その後前記第2の周波数帯域上の前記第2のフレームのスペクトル包絡線の記述を前記取得することと、
前記第2の符号化フレームの符号化インデックスが少なくとも1つの所定の条件を満たしていることを検出したことに応答して、前記第1の符号化フレームからの前記格納されている情報と前記第3の符号化フレームからの前記格納されている情報とを取り出すこととを備える[46]に記載の符号化音声信号を処理する方法。
[50]
前記第2のフレームに続く前記音声信号の複数のフレームのそれぞれについて、前記第2の周波数帯域上の前記フレームのスペクトル包絡線の、前記第1の符号化フレームから得られた情報に基づく記述を取得することを備える[38]に記載の符号化音声信号を処理する方法。
[51]
前記第2のフレームに続く前記音声信号の複数のフレームのそれぞれについて、(C)前記第2の周波数帯域上の前記フレームのスペクトル包絡線の、前記第1の符号化フレームから得られた情報に基づく記述を取得することと、(D)前記第1の周波数帯域上の前記フレームのスペクトル包絡線の、前記第2の符号化フレームから得られた情報に基づく記述を取得することとを備える[38]に記載の符号化音声信号を処理する方法。
[52]
前記第1の周波数帯域上の前記第2のフレームの励振信号に基づき、前記第2の周波数帯域上の前記第2のフレームの励振信号を取得することを備える[38]に記載の符号化音声信号を処理する方法。
[53]
前記第1の符号化フレームから得られた情報に基づき、前記第2の周波数帯域に対する前記第2のフレームの時間情報の記述を取得することを備える[38]に記載の符号化音声信号を処理する方法。
[54]
前記第2のフレームの時間情報の前記記述は、前記第2の周波数帯域に対する前記第2のフレームの時間包絡線の記述を含む[38]に記載の符号化音声信号を処理する方法。
[55]
符号化音声信号を処理するための装置であって、
前記符号化音声信号の第1の符号化フレームから得られた情報に基づき、(A)第1の周波数帯域および(B)前記第1の周波数帯域と異なる第2の周波数帯域上の音声信号の第1のフレームのスペクトル包絡線の記述を取得するための手段と、
前記符号化音声信号の第2の符号化フレームから得られた情報に基づき、前記第1の周波数帯域上の前記音声信号の第2のフレームのスペクトル包絡線の記述を取得するための手段と、
前記第1の符号化フレームから得られた情報に基づき、前記第2の周波数帯域上の前記第2のフレームのスペクトル包絡線の記述を取得するための手段とを備える装置。
[56]
第1のフレームのスペクトル包絡線の前記記述は、前記第1の周波数帯域上の前記第1のフレームのスペクトル包絡線の記述および前記第2の周波数帯域上の前記第1のフレームのスペクトル包絡線の記述を含み、
前記第2の周波数帯域上の前記第2のフレームのスペクトル包絡線の記述を取得するための前記手段が前記記述を取得するように構成される際に基づく前記情報は、前記第2の周波数帯域上の前記第1のフレームのスペクトル包絡線の前記記述を含む[55]に記載の符号化音声信号を処理するための装置。
[57]
前記第2の周波数帯域上の前記第2のフレームのスペクトル包絡線の記述を取得するための前記手段は、前記符号化音声信号の第3の符号化フレームから得られた情報に基づき前記記述を取得するように構成され、前記第1および第3の符号化フレームは両方とも、前記第2の符号化フレームの前の前記符号化音声信号中に出現し、
第3の符号化フレームから得られた前記情報は、前記第2の周波数帯域上の前記音声信号の第3のフレームのスペクトル包絡線の記述を含む[55]に記載の符号化音声信号を処理するための装置。
[58]
前記第2のフレームに続く前記音声信号の複数のフレームのそれぞれについて、前記第2の周波数帯域上の前記フレームのスペクトル包絡線の、前記第1の符号化フレームから得られた情報に基づく記述を取得するための手段を備える[55]に記載の符号化音声信号を処理するための装置。
[59]
前記第2のフレームに続く前記音声信号の複数のフレームのそれぞれについて、前記第2の周波数帯域上の前記フレームのスペクトル包絡線の、前記第1の符号化フレームから得られた情報に基づく記述を取得するための手段と、
前記複数のフレームのそれぞれについて、前記第1の周波数帯域上の前記フレームのスペクトル包絡線の、前記第2の符号化フレームから得られた情報に基づく記述を取得するための手段とを備える[55]に記載の符号化音声信号を処理するための装置。
[60]
前記第1の周波数帯域上の前記第2のフレームの励振信号に基づき、前記第2の周波数帯域上の前記第2のフレームの励振信号を取得するための手段を備える[55]に記載の符号化音声信号を処理するための装置。
[61]
前記第1の符号化フレームから得られた情報に基づき、前記第2の周波数帯域に対する前記第2のフレームの時間情報の記述を取得するための手段を備え、
前記第2のフレームの時間情報の前記記述は、前記第2の周波数帯域に対する前記第2のフレームの時間包絡線の記述を含む[55]に記載の符号化音声信号を処理するための装置。
[62]
コンピュータ可読媒体を備えるコンピュータプログラム製品であって、前記媒体は、
前記符号化音声信号の第1の符号化フレームから得られる情報に基づき、(A)第1の周波数帯域および(B)前記第1の周波数帯域と異なる第2の周波数帯域上で音声信号の第1のフレームのスペクトル包絡線の記述を少なくとも1つのコンピュータに取得させるためのコードと、
前記符号化音声信号の第2の符号化フレームから得られる情報に基づき、前記第1の周波数帯域上の前記音声信号の第2のフレームのスペクトル包絡線の記述を少なくとも1つのコンピュータに取得させるためのコードと、
前記第1の符号化フレームから得られる情報に基づき、前記第2の周波数帯域上の前記第2のフレームのスペクトル包絡線の記述を少なくとも1つのコンピュータに取得させるためのコードとを備えるコンピュータプログラム製品。
[63]
第1のフレームのスペクトル包絡線の前記記述は、前記第1の周波数帯域上の前記第1のフレームのスペクトル包絡線の記述および前記第2の周波数帯域上の前記第1のフレームのスペクトル包絡線の記述を含み、
前記第2の周波数帯域上の前記第2のフレームのスペクトル包絡線の記述を少なくとも1つのコンピュータに取得させるための前記コードが前記記述を取得するように構成される際に基づく前記情報は、前記第2の周波数帯域上の前記第1のフレームのスペクトル包絡線の前記記述を含む[62]に記載のコンピュータプログラム製品。
[64]
前記第2の周波数帯域上の前記第2のフレームのスペクトル包絡線の記述を少なくとも1つのコンピュータに取得させるための前記コードは、前記符号化音声信号の第3の符号化フレームから得られた情報に基づき前記記述を取得するように構成され、前記第1および第3の符号化フレームは両方とも、前記第2の符号化フレームの前の前記符号化音声信号中に出現し、
第3の符号化フレームから得られた前記情報は、前記第2の周波数帯域上の前記音声信号の第3のフレームのスペクトル包絡線の記述を含む[62]に記載のコンピュータプログラム製品。
[65]
前記装置は、前記第2のフレームに続く前記音声信号の複数のフレームのそれぞれについて、前記第2の周波数帯域上の前記フレームのスペクトル包絡線の、前記第1の符号化フレームから得られた情報に基づく記述を少なくとも1つのコンピュータに取得させるためのコードを備える[62]に記載のコンピュータプログラム製品。
[66]
前記装置は、
前記第2のフレームに続く前記音声信号の複数のフレームのそれぞれについて、前記第2の周波数帯域上の前記フレームのスペクトル包絡線の、前記第1の符号化フレームから得られた情報に基づく記述を少なくとも1つのコンピュータに取得させるためのコードと、
前記複数のフレームのそれぞれについて、前記第1の周波数帯域上の前記フレームのスペクトル包絡線の、前記第2の符号化フレームから得られた情報に基づく記述を少なくとも1つのコンピュータに取得させるためのコードとを備える[62]に記載のコンピュータプログラム製品。
[67]
前記装置は、前記第1の周波数帯域上の前記第2のフレームの励振信号に基づき、前記第2の周波数帯域上の前記第2のフレームの励振信号を少なくとも1つのコンピュータに取得させるためのコードを備える[62]に記載のコンピュータプログラム製品。
[68]
前記装置は、前記第1の符号化フレームから得られた情報に基づき、前記第2の周波数帯域に対する前記第2のフレームの時間情報の記述を少なくとも1つのコンピュータに取得させるためのコードを備え、
前記第2のフレームの時間情報の前記記述は、前記第2の周波数帯域に対する前記第2のフレームの時間包絡線の記述を含む[62]に記載のコンピュータプログラム製品。
[69]
符号化音声信号を処理するための装置であって、
前記符号化音声信号の符号化フレームの符号化インデックスに基づく値のシーケンスを備える、前記シーケンスのそれぞれの値が前記符号化音声信号の符号化フレームに対応する制御信号を生成するように構成された制御ロジックと、
(A)第1の状態を有する前記制御信号の値に応じて、前記第1および第2の周波数帯域上のスペクトル包絡線の、前記対応する符号化フレームから得られた情報に基づく記述に基づき復号化フレームを計算し、(B)前記第1の状態と異なる第2の状態を有する前記制御信号の値に応じて、(1)前記第1の周波数帯域上のスペクトル包絡線の、前記対応する符号化フレームから得られた情報に基づく記述、および(2)前記第2の周波数帯域上のスペクトル包絡線の、前記対応する符号化フレームの前に前記符号化音声信号中に出現する少なくとも1つの符号化フレームから得られた情報に基づく記述に基づき復号化フレームを計算するように構成されている音声復号器とを備える装置。
[70]
前記音声復号器が前記第2の状態を有する前記制御信号の値に応じて復号化フレームを計算するように構成される際に基づく、前記第2の周波数帯域上のスペクトル包絡線の前記記述は、前記対応する符号化フレームの前の前記符号化音声信号中に出現する少なくとも2つの符号化フレームのそれぞれから得られる情報に基づく[69]に記載の符号化音声信号を処理するための装置。
[71]
前記制御ロジックは、対応するフレーム周期に符号化フレームを受信することに失敗したことに応答して、前記第1および第2の状態と異なる、第3の状態を有する前記制御信号の値を生成するように構成され、
前記音声復号器は、(C)前記第3の状態を有する前記制御信号の値に応じて、(1)前記第1の周波数帯域上の前記フレームのスペクトル包絡線の、前記一番最近に受信された符号化フレームから得られた情報に基づく記述、および(2)前記第2の周波数帯域上の前記フレームのスペクトル包絡線の、前記一番最近に受信された符号化フレームの前に前記符号化音声信号中に出現する符号化フレームから得られた情報に基づく記述に基づき復号化フレームを計算するように構成されている[69]に記載の符号化音声信号を処理するための装置。
[72]
前記音声復号器は、前記第2の状態を有する前記制御信号の値に応じて、また前記第1の周波数帯域上の前記復号化フレームの励振信号に基づき、前記第2の周波数帯域上の前記復号化フレームの励振信号を計算するように構成されている[69]に記載の符号化音声信号を処理するための装置。
[73]
前記音声復号器は、前記第2の状態を有する前記制御信号の値に応じて、前記第2の周波数帯域に対する時間包絡線の、前記対応する符号化フレームの前に前記符号化音声信号中に出現する少なくとも1つの符号化フレームから得られた情報に基づく記述に基づき前記復号化フレームを計算するように構成されている[69]に記載の符号化音声信号を処理するための装置。
[74]
前記音声復号器は、前記第2の状態を有する前記制御信号の値に応じて、少なくとも主に不規則雑音信号に基づく励振信号に基づき前記復号化フレームを計算するように構成されている[69]に記載の符号化音声信号を処理するための装置。
Claims (3)
- 符号化音声信号を処理する方法であって、
前記符号化音声信号の第1の符号化フレームから得られる情報に基づき、(A)第1の周波数帯域および(B)前記第1の周波数帯域と異なる第2の周波数帯域上で音声信号の第1のフレームのスペクトル包絡線の記述を取得することと、
前記符号化音声信号の第2の符号化フレームから得られる情報に基づき、前記第1の周波数帯域上の前記音声信号の第2のフレームのスペクトル包絡線の記述を取得することと、
前記第1の符号化フレームから得られる情報に基づき、前記第2の周波数帯域上の前記第2のフレームのスペクトル包絡線の記述を取得することとを備え、
前記第1の符号化フレームは、前記第1の周波数帯域及び前記第2の周波数帯域のための広帯域符号化方式に従って符号化され、前記第2の符号化フレームは、前記第1の周波数帯域のための狭帯域符号化方式に従って符号化される方法。 - 符号化音声信号を処理するための装置であって、
前記符号化音声信号の第1の符号化フレームから得られた情報に基づき、(A)第1の周波数帯域および(B)前記第1の周波数帯域と異なる第2の周波数帯域上の音声信号の第1のフレームのスペクトル包絡線の記述を取得するための手段と、
前記符号化音声信号の第2の符号化フレームから得られた情報に基づき、前記第1の周波数帯域上の前記音声信号の第2のフレームのスペクトル包絡線の記述を取得するための手段と、
前記第1の符号化フレームから得られた情報に基づき、前記第2の周波数帯域上の前記第2のフレームのスペクトル包絡線の記述を取得するための手段とを備え、
前記第1の符号化フレームは、前記第1の周波数帯域及び前記第2の周波数帯域のための広帯域符号化方式に従って符号化され、前記第2の符号化フレームは、前記第1の周波数帯域のための狭帯域符号化方式に従って符号化される装置。 - 符号化音声信号を処理するための装置であって、
前記符号化音声信号の第1の符号化フレームから得られた情報に基づき、(A)第1の周波数帯域および(B)前記第1の周波数帯域と異なる第2の周波数帯域上の音声信号の第1のフレームのスペクトル包絡線の記述を取得する第1のユニットと、
前記符号化音声信号の第2の符号化フレームから得られた情報に基づき、前記第1の周波数帯域上の前記音声信号の第2のフレームのスペクトル包絡線の記述を取得する第2のユニットと、
前記第1の符号化フレームから得られた情報に基づき、前記第2の周波数帯域上の前記第2のフレームのスペクトル包絡線の記述を取得する第3のユニットとを備え、
前記第1の符号化フレームは、前記第1の周波数帯域及び前記第2の周波数帯域のための広帯域符号化方式に従って符号化され、前記第2の符号化フレームは、前記第1の周波数帯域のための狭帯域符号化方式に従って符号化される装置。
Applications Claiming Priority (4)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US83468806P | 2006-07-31 | 2006-07-31 | |
US60/834,688 | 2006-07-31 | ||
US11/830,812 US8260609B2 (en) | 2006-07-31 | 2007-07-30 | Systems, methods, and apparatus for wideband encoding and decoding of inactive frames |
US11/830,812 | 2007-07-30 |
Related Parent Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2011254083A Division JP5237428B2 (ja) | 2006-07-31 | 2011-11-21 | 非アクティブフレームの広帯域符号化および復号化を行うためのシステム、方法、および装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2013137557A JP2013137557A (ja) | 2013-07-11 |
JP5596189B2 true JP5596189B2 (ja) | 2014-09-24 |
Family
ID=38692069
Family Applications (3)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2009523021A Withdrawn JP2009545778A (ja) | 2006-07-31 | 2007-07-31 | 非アクティブフレームの広帯域符号化および復号化を行うためのシステム、方法、および装置 |
JP2011254083A Active JP5237428B2 (ja) | 2006-07-31 | 2011-11-21 | 非アクティブフレームの広帯域符号化および復号化を行うためのシステム、方法、および装置 |
JP2013022112A Active JP5596189B2 (ja) | 2006-07-31 | 2013-02-07 | 非アクティブフレームの広帯域符号化および復号化を行うためのシステム、方法、および装置 |
Family Applications Before (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2009523021A Withdrawn JP2009545778A (ja) | 2006-07-31 | 2007-07-31 | 非アクティブフレームの広帯域符号化および復号化を行うためのシステム、方法、および装置 |
JP2011254083A Active JP5237428B2 (ja) | 2006-07-31 | 2011-11-21 | 非アクティブフレームの広帯域符号化および復号化を行うためのシステム、方法、および装置 |
Country Status (11)
Country | Link |
---|---|
US (2) | US8260609B2 (ja) |
EP (1) | EP2047465B1 (ja) |
JP (3) | JP2009545778A (ja) |
KR (1) | KR101034453B1 (ja) |
CN (2) | CN101496100B (ja) |
BR (1) | BRPI0715064B1 (ja) |
CA (2) | CA2778790C (ja) |
ES (1) | ES2406681T3 (ja) |
HK (1) | HK1184589A1 (ja) |
RU (1) | RU2428747C2 (ja) |
WO (1) | WO2008016935A2 (ja) |
Families Citing this family (76)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8260609B2 (en) * | 2006-07-31 | 2012-09-04 | Qualcomm Incorporated | Systems, methods, and apparatus for wideband encoding and decoding of inactive frames |
KR101565919B1 (ko) * | 2006-11-17 | 2015-11-05 | 삼성전자주식회사 | 고주파수 신호 부호화 및 복호화 방법 및 장치 |
US8639500B2 (en) * | 2006-11-17 | 2014-01-28 | Samsung Electronics Co., Ltd. | Method, medium, and apparatus with bandwidth extension encoding and/or decoding |
KR20080059881A (ko) * | 2006-12-26 | 2008-07-01 | 삼성전자주식회사 | 음성 신호의 전처리 장치 및 방법 |
KR101379263B1 (ko) * | 2007-01-12 | 2014-03-28 | 삼성전자주식회사 | 대역폭 확장 복호화 방법 및 장치 |
US8392198B1 (en) * | 2007-04-03 | 2013-03-05 | Arizona Board Of Regents For And On Behalf Of Arizona State University | Split-band speech compression based on loudness estimation |
US8064390B2 (en) | 2007-04-27 | 2011-11-22 | Research In Motion Limited | Uplink scheduling and resource allocation with fast indication |
PT2186090T (pt) * | 2007-08-27 | 2017-03-07 | ERICSSON TELEFON AB L M (publ) | Detetor de transitórios e método para suportar codificação de um sinal de áudio |
CN100524462C (zh) | 2007-09-15 | 2009-08-05 | 华为技术有限公司 | 对高带信号进行帧错误隐藏的方法及装置 |
CN100555414C (zh) * | 2007-11-02 | 2009-10-28 | 华为技术有限公司 | 一种dtx判决方法和装置 |
WO2009066960A1 (en) | 2007-11-21 | 2009-05-28 | Lg Electronics Inc. | A method and an apparatus for processing a signal |
US8688441B2 (en) * | 2007-11-29 | 2014-04-01 | Motorola Mobility Llc | Method and apparatus to facilitate provision and use of an energy value to determine a spectral envelope shape for out-of-signal bandwidth content |
US20090168673A1 (en) * | 2007-12-31 | 2009-07-02 | Lampros Kalampoukas | Method and apparatus for detecting and suppressing echo in packet networks |
US8433582B2 (en) * | 2008-02-01 | 2013-04-30 | Motorola Mobility Llc | Method and apparatus for estimating high-band energy in a bandwidth extension system |
US20090201983A1 (en) * | 2008-02-07 | 2009-08-13 | Motorola, Inc. | Method and apparatus for estimating high-band energy in a bandwidth extension system |
DE102008009719A1 (de) | 2008-02-19 | 2009-08-20 | Siemens Enterprise Communications Gmbh & Co. Kg | Verfahren und Mittel zur Enkodierung von Hintergrundrauschinformationen |
DE102008009718A1 (de) * | 2008-02-19 | 2009-08-20 | Siemens Enterprise Communications Gmbh & Co. Kg | Verfahren und Mittel zur Enkodierung von Hintergrundrauschinformationen |
DE102008009720A1 (de) * | 2008-02-19 | 2009-08-20 | Siemens Enterprise Communications Gmbh & Co. Kg | Verfahren und Mittel zur Dekodierung von Hintergrundrauschinformationen |
CN101335000B (zh) * | 2008-03-26 | 2010-04-21 | 华为技术有限公司 | 编码的方法及装置 |
TWI395976B (zh) * | 2008-06-13 | 2013-05-11 | Teco Image Sys Co Ltd | 掃描模組之光源投射裝置及其光源排列方法 |
US8768690B2 (en) * | 2008-06-20 | 2014-07-01 | Qualcomm Incorporated | Coding scheme selection for low-bit-rate applications |
US20090319263A1 (en) * | 2008-06-20 | 2009-12-24 | Qualcomm Incorporated | Coding of transitional speech frames for low-bit-rate applications |
WO2010003543A1 (en) * | 2008-07-11 | 2010-01-14 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus and method for calculating bandwidth extension data using a spectral tilt controlling framing |
US8463412B2 (en) * | 2008-08-21 | 2013-06-11 | Motorola Mobility Llc | Method and apparatus to facilitate determining signal bounding frequencies |
CN101751926B (zh) | 2008-12-10 | 2012-07-04 | 华为技术有限公司 | 信号编码、解码方法及装置、编解码系统 |
KR101622950B1 (ko) * | 2009-01-28 | 2016-05-23 | 삼성전자주식회사 | 오디오 신호의 부호화 및 복호화 방법 및 그 장치 |
US8463599B2 (en) * | 2009-02-04 | 2013-06-11 | Motorola Mobility Llc | Bandwidth extension method and apparatus for a modified discrete cosine transform audio coder |
JP5754899B2 (ja) | 2009-10-07 | 2015-07-29 | ソニー株式会社 | 復号装置および方法、並びにプログラム |
KR101137652B1 (ko) * | 2009-10-14 | 2012-04-23 | 광운대학교 산학협력단 | 천이 구간에 기초하여 윈도우의 오버랩 영역을 조절하는 통합 음성/오디오 부호화/복호화 장치 및 방법 |
US8428209B2 (en) * | 2010-03-02 | 2013-04-23 | Vt Idirect, Inc. | System, apparatus, and method of frequency offset estimation and correction for mobile remotes in a communication network |
ES2722224T3 (es) * | 2010-04-13 | 2019-08-08 | Fraunhofer Ges Forschung | Procedimiento y codificador y decodificador para la reproducción sin espacios de una señal de audio |
JP5609737B2 (ja) | 2010-04-13 | 2014-10-22 | ソニー株式会社 | 信号処理装置および方法、符号化装置および方法、復号装置および方法、並びにプログラム |
JP5850216B2 (ja) | 2010-04-13 | 2016-02-03 | ソニー株式会社 | 信号処理装置および方法、符号化装置および方法、復号装置および方法、並びにプログラム |
US9165567B2 (en) | 2010-04-22 | 2015-10-20 | Qualcomm Incorporated | Systems, methods, and apparatus for speech feature detection |
US8600737B2 (en) | 2010-06-01 | 2013-12-03 | Qualcomm Incorporated | Systems, methods, apparatus, and computer program products for wideband speech coding |
JP6075743B2 (ja) * | 2010-08-03 | 2017-02-08 | ソニー株式会社 | 信号処理装置および方法、並びにプログラム |
US8990094B2 (en) * | 2010-09-13 | 2015-03-24 | Qualcomm Incorporated | Coding and decoding a transient frame |
KR101826331B1 (ko) * | 2010-09-15 | 2018-03-22 | 삼성전자주식회사 | 고주파수 대역폭 확장을 위한 부호화/복호화 장치 및 방법 |
JP5707842B2 (ja) | 2010-10-15 | 2015-04-30 | ソニー株式会社 | 符号化装置および方法、復号装置および方法、並びにプログラム |
US8898058B2 (en) * | 2010-10-25 | 2014-11-25 | Qualcomm Incorporated | Systems, methods, and apparatus for voice activity detection |
ES2665944T3 (es) * | 2010-12-24 | 2018-04-30 | Huawei Technologies Co., Ltd. | Aparato para realizar una detección de actividad de voz |
US8751223B2 (en) | 2011-05-24 | 2014-06-10 | Alcatel Lucent | Encoded packet selection from a first voice stream to create a second voice stream |
CN102800317B (zh) * | 2011-05-25 | 2014-09-17 | 华为技术有限公司 | 信号分类方法及设备、编解码方法及设备 |
WO2013085538A1 (en) * | 2011-12-09 | 2013-06-13 | Intel Corporation | Control of video processing algorithms based on measured perceptual quality characteristics |
CN103187065B (zh) | 2011-12-30 | 2015-12-16 | 华为技术有限公司 | 音频数据的处理方法、装置和系统 |
US9208798B2 (en) | 2012-04-09 | 2015-12-08 | Board Of Regents, The University Of Texas System | Dynamic control of voice codec data rate |
JP6200034B2 (ja) * | 2012-04-27 | 2017-09-20 | 株式会社Nttドコモ | 音声復号装置 |
JP5997592B2 (ja) * | 2012-04-27 | 2016-09-28 | 株式会社Nttドコモ | 音声復号装置 |
CN102723968B (zh) * | 2012-05-30 | 2017-01-18 | 中兴通讯股份有限公司 | 一种提升空口容量的方法及装置 |
WO2014118160A1 (en) * | 2013-01-29 | 2014-08-07 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus and method for generating a frequency enhanced signal using temporal smoothing of subbands |
KR101771828B1 (ko) * | 2013-01-29 | 2017-08-25 | 프라운호퍼 게젤샤프트 쭈르 푀르데룽 데어 안겐반텐 포르슝 에. 베. | 오디오 인코더, 오디오 디코더, 인코딩된 오디오 정보를 제공하기 위한 방법, 디코딩된 오디오 정보를 제공하기 위한 방법, 컴퓨터 프로그램 및 신호 적응적 대역폭 확장을 이용한 인코딩된 표현 |
US9336789B2 (en) * | 2013-02-21 | 2016-05-10 | Qualcomm Incorporated | Systems and methods for determining an interpolation factor set for synthesizing a speech signal |
EP3550562B1 (en) * | 2013-02-22 | 2020-10-28 | Telefonaktiebolaget LM Ericsson (publ) | Methods and apparatuses for dtx hangover in audio coding |
FR3008533A1 (fr) | 2013-07-12 | 2015-01-16 | Orange | Facteur d'echelle optimise pour l'extension de bande de frequence dans un decodeur de signaux audiofrequences |
EP2830061A1 (en) | 2013-07-22 | 2015-01-28 | Fraunhofer Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus and method for encoding and decoding an encoded audio signal using temporal noise/patch shaping |
EP2830055A1 (en) | 2013-07-22 | 2015-01-28 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Context-based entropy coding of sample values of a spectral envelope |
GB201316575D0 (en) * | 2013-09-18 | 2013-10-30 | Hellosoft Inc | Voice data transmission with adaptive redundancy |
JP6531649B2 (ja) | 2013-09-19 | 2019-06-19 | ソニー株式会社 | 符号化装置および方法、復号化装置および方法、並びにプログラム |
JP5981408B2 (ja) * | 2013-10-29 | 2016-08-31 | 株式会社Nttドコモ | 音声信号処理装置、音声信号処理方法、及び音声信号処理プログラム |
US20150149157A1 (en) * | 2013-11-22 | 2015-05-28 | Qualcomm Incorporated | Frequency domain gain shape estimation |
BR112016014476B1 (pt) | 2013-12-27 | 2021-11-23 | Sony Corporation | Aparelho e método de decodificação, e, meio de armazenamento legível por computador |
JP6035270B2 (ja) * | 2014-03-24 | 2016-11-30 | 株式会社Nttドコモ | 音声復号装置、音声符号化装置、音声復号方法、音声符号化方法、音声復号プログラム、および音声符号化プログラム |
US9697843B2 (en) | 2014-04-30 | 2017-07-04 | Qualcomm Incorporated | High band excitation signal generation |
EP2950474B1 (en) | 2014-05-30 | 2018-01-31 | Alcatel Lucent | Method and devices for controlling signal transmission during a change of data rate |
CN106409304B (zh) * | 2014-06-12 | 2020-08-25 | 华为技术有限公司 | 一种音频信号的时域包络处理方法及装置、编码器 |
EP2980797A1 (en) | 2014-07-28 | 2016-02-03 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio decoder, method and computer program using a zero-input-response to obtain a smooth transition |
US10304472B2 (en) * | 2014-07-28 | 2019-05-28 | Nippon Telegraph And Telephone Corporation | Method, device and recording medium for coding based on a selected coding processing |
US9837089B2 (en) * | 2015-06-18 | 2017-12-05 | Qualcomm Incorporated | High-band signal generation |
US10847170B2 (en) | 2015-06-18 | 2020-11-24 | Qualcomm Incorporated | Device and method for generating a high-band signal from non-linearly processed sub-ranges |
JP2017150146A (ja) | 2016-02-22 | 2017-08-31 | 積水化学工業株式会社 | 対象物を補強または補修する方法 |
CN106067847B (zh) * | 2016-05-25 | 2019-10-22 | 腾讯科技(深圳)有限公司 | 一种语音数据传输方法及装置 |
US10573326B2 (en) * | 2017-04-05 | 2020-02-25 | Qualcomm Incorporated | Inter-channel bandwidth extension |
EP3662469A4 (en) * | 2018-04-25 | 2020-08-19 | Dolby International AB | INTEGRATION OF HIGH FREQUENCY RECONSTRUCTION TECHNIQUES WITH REDUCED POST-PROCESSING DELAY |
KR20210005164A (ko) | 2018-04-25 | 2021-01-13 | 돌비 인터네셔널 에이비 | 고주파 오디오 재구성 기술의 통합 |
TWI740655B (zh) * | 2020-09-21 | 2021-09-21 | 友達光電股份有限公司 | 顯示裝置的驅動方法 |
CN118230703A (zh) * | 2022-12-21 | 2024-06-21 | 北京字跳网络技术有限公司 | 一种语音处理方法、装置和电子设备 |
Family Cites Families (40)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5511073A (en) | 1990-06-25 | 1996-04-23 | Qualcomm Incorporated | Method and apparatus for the formatting of data for transmission |
BR9206143A (pt) | 1991-06-11 | 1995-01-03 | Qualcomm Inc | Processos de compressão de final vocal e para codificação de taxa variável de quadros de entrada, aparelho para comprimir im sinal acústico em dados de taxa variável, codificador de prognóstico exitado por córdigo de taxa variável (CELP) e descodificador para descodificar quadros codificados |
JP2779886B2 (ja) | 1992-10-05 | 1998-07-23 | 日本電信電話株式会社 | 広帯域音声信号復元方法 |
GB2294614B (en) * | 1994-10-28 | 1999-07-14 | Int Maritime Satellite Organiz | Communication method and apparatus |
US5704003A (en) | 1995-09-19 | 1997-12-30 | Lucent Technologies Inc. | RCELP coder |
US6049537A (en) | 1997-09-05 | 2000-04-11 | Motorola, Inc. | Method and system for controlling speech encoding in a communication system |
JP3352406B2 (ja) * | 1998-09-17 | 2002-12-03 | 松下電器産業株式会社 | オーディオ信号の符号化及び復号方法及び装置 |
AU1524300A (en) | 1998-11-13 | 2000-06-05 | Qualcomm Incorporated | Closed-loop variable-rate multimode predictive speech coder |
US6691084B2 (en) | 1998-12-21 | 2004-02-10 | Qualcomm Incorporated | Multiple mode variable rate speech coding |
US6456964B2 (en) * | 1998-12-21 | 2002-09-24 | Qualcomm, Incorporated | Encoding of periodic speech using prototype waveforms |
US6973140B2 (en) | 1999-03-05 | 2005-12-06 | Ipr Licensing, Inc. | Maximizing data rate by adjusting codes and code rates in CDMA system |
KR100297875B1 (ko) | 1999-03-08 | 2001-09-26 | 윤종용 | 가변 속도 보코더를 사용하는 코드 분할 다중 접속 시스템의 음질 향상을 위한 방법 |
JP4438127B2 (ja) | 1999-06-18 | 2010-03-24 | ソニー株式会社 | 音声符号化装置及び方法、音声復号装置及び方法、並びに記録媒体 |
US6330532B1 (en) | 1999-07-19 | 2001-12-11 | Qualcomm Incorporated | Method and apparatus for maintaining a target bit rate in a speech coder |
FI115329B (fi) | 2000-05-08 | 2005-04-15 | Nokia Corp | Menetelmä ja järjestely lähdesignaalin kaistanleveyden vaihtamiseksi tietoliikenneyhteydessä, jossa on valmiudet useisiin kaistanleveyksiin |
EP1290681A1 (en) | 2000-05-26 | 2003-03-12 | Cellon France SAS | Transmitter for transmitting a signal encoded in a narrow band, and receiver for extending the band of the encoded signal at the receiving end, and corresponding transmission and receiving methods, and system |
US6807525B1 (en) * | 2000-10-31 | 2004-10-19 | Telogy Networks, Inc. | SID frame detection with human auditory perception compensation |
US6879955B2 (en) | 2001-06-29 | 2005-04-12 | Microsoft Corporation | Signal modification based on continuous time warping for low bit rate CELP coding |
CN1282156C (zh) * | 2001-11-23 | 2006-10-25 | 皇家飞利浦电子股份有限公司 | 音频信号带宽扩展 |
CA2365203A1 (en) * | 2001-12-14 | 2003-06-14 | Voiceage Corporation | A signal modification method for efficient coding of speech signals |
JP4272897B2 (ja) | 2002-01-30 | 2009-06-03 | パナソニック株式会社 | 符号化装置、復号化装置およびその方法 |
DE60323331D1 (de) | 2002-01-30 | 2008-10-16 | Matsushita Electric Ind Co Ltd | Verfahren und vorrichtung zur audio-kodierung und -dekodierung |
CA2392640A1 (en) | 2002-07-05 | 2004-01-05 | Voiceage Corporation | A method and device for efficient in-based dim-and-burst signaling and half-rate max operation in variable bit-rate wideband speech coding for cdma wireless systems |
WO2004034379A2 (en) | 2002-10-11 | 2004-04-22 | Nokia Corporation | Methods and devices for source controlled variable bit-rate wideband speech coding |
US20040098255A1 (en) | 2002-11-14 | 2004-05-20 | France Telecom | Generalized analysis-by-synthesis speech coding method, and coder implementing such method |
KR100524065B1 (ko) | 2002-12-23 | 2005-10-26 | 삼성전자주식회사 | 시간-주파수 상관성을 이용한 개선된 오디오 부호화및/또는 복호화 방법과 그 장치 |
US20050091044A1 (en) | 2003-10-23 | 2005-04-28 | Nokia Corporation | Method and system for pitch contour quantization in audio coding |
KR100587953B1 (ko) * | 2003-12-26 | 2006-06-08 | 한국전자통신연구원 | 대역-분할 광대역 음성 코덱에서의 고대역 오류 은닉 장치 및 그를 이용한 비트스트림 복호화 시스템 |
FI119533B (fi) | 2004-04-15 | 2008-12-15 | Nokia Corp | Audiosignaalien koodaus |
TWI246256B (en) | 2004-07-02 | 2005-12-21 | Univ Nat Central | Apparatus for audio compression using mixed wavelet packets and discrete cosine transformation |
CN101010730B (zh) | 2004-09-06 | 2011-07-27 | 松下电器产业株式会社 | 可扩展解码装置以及信号丢失补偿方法 |
CN101048649A (zh) | 2004-11-05 | 2007-10-03 | 松下电器产业株式会社 | 可扩展解码装置及可扩展编码装置 |
KR20070085982A (ko) * | 2004-12-10 | 2007-08-27 | 마츠시타 덴끼 산교 가부시키가이샤 | 광대역 부호화 장치, 광대역 lsp 예측 장치, 대역스케일러블 부호화 장치 및 광대역 부호화 방법 |
US8102872B2 (en) | 2005-02-01 | 2012-01-24 | Qualcomm Incorporated | Method for discontinuous transmission and accurate reproduction of background noise information |
NZ562182A (en) | 2005-04-01 | 2010-03-26 | Qualcomm Inc | Method and apparatus for anti-sparseness filtering of a bandwidth extended speech prediction excitation signal |
TWI324336B (en) | 2005-04-22 | 2010-05-01 | Qualcomm Inc | Method of signal processing and apparatus for gain factor smoothing |
US8032369B2 (en) | 2006-01-20 | 2011-10-04 | Qualcomm Incorporated | Arbitrary average data rates for variable rate coders |
JP4649351B2 (ja) | 2006-03-09 | 2011-03-09 | シャープ株式会社 | デジタルデータ復号化装置 |
US8260609B2 (en) * | 2006-07-31 | 2012-09-04 | Qualcomm Incorporated | Systems, methods, and apparatus for wideband encoding and decoding of inactive frames |
US8532984B2 (en) * | 2006-07-31 | 2013-09-10 | Qualcomm Incorporated | Systems, methods, and apparatus for wideband encoding and decoding of active frames |
-
2007
- 2007-07-30 US US11/830,812 patent/US8260609B2/en active Active
- 2007-07-31 CA CA2778790A patent/CA2778790C/en active Active
- 2007-07-31 CA CA2657412A patent/CA2657412C/en active Active
- 2007-07-31 ES ES07840618T patent/ES2406681T3/es active Active
- 2007-07-31 EP EP07840618.8A patent/EP2047465B1/en active Active
- 2007-07-31 CN CN2007800278068A patent/CN101496100B/zh active Active
- 2007-07-31 BR BRPI0715064-4 patent/BRPI0715064B1/pt active IP Right Grant
- 2007-07-31 CN CN201210270314.4A patent/CN103151048B/zh active Active
- 2007-07-31 WO PCT/US2007/074886 patent/WO2008016935A2/en active Application Filing
- 2007-07-31 KR KR1020097004008A patent/KR101034453B1/ko active IP Right Grant
- 2007-07-31 JP JP2009523021A patent/JP2009545778A/ja not_active Withdrawn
- 2007-07-31 RU RU2009107043/09A patent/RU2428747C2/ru active
-
2011
- 2011-11-21 JP JP2011254083A patent/JP5237428B2/ja active Active
-
2012
- 2012-08-02 US US13/565,074 patent/US9324333B2/en active Active
-
2013
- 2013-02-07 JP JP2013022112A patent/JP5596189B2/ja active Active
- 2013-10-22 HK HK13111834.2A patent/HK1184589A1/zh unknown
Also Published As
Publication number | Publication date |
---|---|
CN103151048B (zh) | 2016-02-24 |
WO2008016935A2 (en) | 2008-02-07 |
EP2047465A2 (en) | 2009-04-15 |
CA2657412A1 (en) | 2008-02-07 |
ES2406681T3 (es) | 2013-06-07 |
JP2012098735A (ja) | 2012-05-24 |
CN101496100A (zh) | 2009-07-29 |
US8260609B2 (en) | 2012-09-04 |
BRPI0715064B1 (pt) | 2019-12-10 |
WO2008016935A3 (en) | 2008-06-12 |
JP2013137557A (ja) | 2013-07-11 |
CA2778790C (en) | 2015-12-15 |
BRPI0715064A2 (pt) | 2013-05-28 |
CA2657412C (en) | 2014-06-10 |
CN103151048A (zh) | 2013-06-12 |
HK1184589A1 (zh) | 2014-01-24 |
JP2009545778A (ja) | 2009-12-24 |
US20080027717A1 (en) | 2008-01-31 |
KR101034453B1 (ko) | 2011-05-17 |
CN101496100B (zh) | 2013-09-04 |
RU2428747C2 (ru) | 2011-09-10 |
KR20090035719A (ko) | 2009-04-10 |
JP5237428B2 (ja) | 2013-07-17 |
US9324333B2 (en) | 2016-04-26 |
EP2047465B1 (en) | 2013-04-10 |
US20120296641A1 (en) | 2012-11-22 |
RU2009107043A (ru) | 2010-09-10 |
CA2778790A1 (en) | 2008-02-07 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5596189B2 (ja) | 非アクティブフレームの広帯域符号化および復号化を行うためのシステム、方法、および装置 | |
US8532984B2 (en) | Systems, methods, and apparatus for wideband encoding and decoding of active frames | |
US9653088B2 (en) | Systems, methods, and apparatus for signal encoding using pitch-regularizing and non-pitch-regularizing coding | |
JP5129118B2 (ja) | 帯域幅拡張音声予測励振信号の反疎性フィルタリングのための方法及び装置 | |
KR101436715B1 (ko) | 광대역 스피치 코딩을 위한 시스템들, 방법들, 장치, 및 컴퓨터 프로그램 제품들 | |
KR101058760B1 (ko) | 스피치 신호와 연관된 패킷에 식별자를 포함시키는 시스템 및 방법 | |
US10141001B2 (en) | Systems, methods, apparatus, and computer-readable media for adaptive formant sharpening in linear prediction coding |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20140221 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20140304 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20140529 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20140708 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20140806 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5596189 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |