JP5532304B2 - 符号化方法、符号化器、および、コンピュータ読み取り可能な媒体 - Google Patents
符号化方法、符号化器、および、コンピュータ読み取り可能な媒体 Download PDFInfo
- Publication number
- JP5532304B2 JP5532304B2 JP2009539594A JP2009539594A JP5532304B2 JP 5532304 B2 JP5532304 B2 JP 5532304B2 JP 2009539594 A JP2009539594 A JP 2009539594A JP 2009539594 A JP2009539594 A JP 2009539594A JP 5532304 B2 JP5532304 B2 JP 5532304B2
- Authority
- JP
- Japan
- Prior art keywords
- search
- codebook
- pulses
- pulse
- input signal
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/16—Vocoder architecture
- G10L19/18—Vocoders using multiple modes
- G10L19/24—Variable rate codecs, e.g. for generating different qualities using a scalable representation such as hierarchical encoding or layered encoding
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L2019/0001—Codebooks
- G10L2019/0013—Codebook search algorithms
Landscapes
- Engineering & Computer Science (AREA)
- Quality & Reliability (AREA)
- Computational Linguistics (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Control Of Stepping Motors (AREA)
- Error Detection And Correction (AREA)
Description
音声サブフレームの長さは64、探索されるパルス数はNとし、Nは符号化率とともに変動すると仮定する。他の制約なしで、64個の位置においてN個のパルスを探索する計算は非常に量が多い。従って、代数符号帳におけるパルス位置は制限され、64個の位置はM個のトラックに区分される。トラックを区分する典型的な方法を表1に示す。
2) T1−T2およびT3−T0上で第2レベルの探索が実行され、これは第1レベルの探索と同様である。
3) 同様に、T2−T3およびT0−T1上で第3レベルの探索が実行され、T3−T0およびT1−T2上で第4レベルの探索が実行される。
4) 最後に、最適な代数符号帳として第4レベルの探索から最適な結果が選択される。合計の探索回数は4×(4×16+8×16)=768である。
説明を簡単にするために、前のアルゴリズムと同じ構成の符号帳が使用され、4個のトラックの各々について1個のパルスが探索され、T0からT3上で探索されるパルスは、それぞれP0からP3であると仮定する。詳細な処理は次のステップを含む。
この実施形態において、符号化する入力信号は、他の同様な音声または楽音の信号だけでなく、ベクトル量子化符号化に適用可能なCELPモデルに基づく適応フィルタリング後の残差信号とすることが可能である。ここで、特性パラメータは、ある形態において入力信号の特性を記述するデータである。特性パラメータはフレームにおいて解析および抽出され、フレームサイズは実際の要求条件および信号特性に従って選択することが可能である。
特性パラメータは、限定しないが、線形予測係数(LPC)、線形予測ケプストラム係数(LPCC)、ピッチ周期係数、フレームエネルギー、平均零交差率を含む。
入力信号のタイプが判定されるとき、特性パラメータは様々なタイプが存在し、これは、ぞれぞれ、ある形態において入力信号の特性を反映するので、入力信号は、異なる判定方法に基づいて、例えば、異なる特性パラメータまたは特性パラメータの組み合わせに基づいて、または、特性パラメータについて異なる閾値を設定することによって、分類され、これは、この実施形態において限定されず、実際の要求条件に従って設定することが可能である。
このブロックは従来技術と同じ方法で実行することができる。さらに、ブロック3は、順序に関してブロック2と論理的に関係なく、ブロック2の前に、または、ブロック2の後に、または、ブロック2と一緒に実行することができる。
例えば、ブロック2に基づく信号分類方法は次の機能を有する。
無声フレーム信号を処理するために、計算量の多い、かつ、性能の良い符号帳探索アルゴリズム、例えば、背景技術の欄で説明したランダム符号帳探索アルゴリズムまたは深さ優先ツリー探索アルゴリズムが適用される。
一般フレームを処理するために、計算量の多い、かつ、性能の良い符号帳探索アルゴリズム、例えば、背景技術の欄で説明した深さ優先ツリー探索アルゴリズムが適用される。
有声フレームおよび/または過渡フレーム信号を処理するために、計算量の少ない符号帳探索アルゴリズム、例えば、背景技術の欄で説明したパルス位置置換に基づく符号帳探索アルゴリズム、特に、大域的パルス置換アルゴリズムが適用される。もちろん、有声フレームおよび過渡フレームが2つの異なる信号タイプにさらに分類されるならば、これら2つのフレームは異なる符号帳探索アルゴリズムを用いて処理することができる。
信号タイプ判定部102は、特性パラメータ取得部101によって与えられる特性パラメータに従って、入力信号のタイプを判定する。
ベクトル生成部103は、特性パラメータ取得部101によって与えられる特性パラメータに従って、量子化されるベクトルを生成する。
2) 対応するトラック上の各パルスの位置は各トラック上で既知の基準信号のいくつかの極値に従って決定される。
3) 各パルスの初期位置はある計算の形態によって(すなわち、基本符号帳を使用することによって)取得される。
なお、任意選択の基準信号は“パルス位置最大尤度関数”(パルス振幅選択信号とも呼ばれる)である。この関数は
1) 値nおよび探索パルスの組み合わせはランダムに選択される。
NS集合は全部で3個のパルス、すなわち、P0,P1,P2を有し、可能な組み合わせは、n=1で探索パルスとしてP1をとる、n=2で探索パルスとしてP0およびP2をとる、n=2で探索パルスとしてP1およびP2をとる、等を含むと仮定する。
2) 値nが決定され(n=2)、探索パルスの組み合わせはランダムに選択される。
NS集合は全部で4個のパルス、すなわち、P0,P1,P2,P3を有し、n=3と仮定し、可能な組み合わせは、P0,P1,P2;P0,P2,P3;P0,P1,P3;P1,P2,P3を含み、それぞれ探索パルスとしての役割を果たす。
探索符号帳および基本符号帳の比較および評価の処理は、ブロックA2における探索処理と同時に実行することができる。例えば、“好ましい符号帳”が設定され、基本符号帳に初期化される。その後、探索符号帳が取得され、評価のために現在の好ましい符号帳と比較される。探索符号帳が好ましい符号帳より優れていると判定されると、現在の好ましい符号帳は探索符号帳によって置換される。上記処理は、全てのK回の探索が完了するまで繰り返され、最後に取得された好ましい符号帳はこのラウンドの最適符号帳である。各探索処理は基本符号帳に基づき、好ましい符号帳のみが比較および評価されることに留意すべきである。
ブロックB1において、基本符号帳が取得される。基本符号帳はM個のトラック上のN個のパルスについての位置情報を含み、N,Mは正の整数である。
このブロックは、符号帳探索アルゴリズムの第1実施形態におけるブロックA1に従って実行することができる。
ブロックB2において、NS個のパルスからn=n0個の探索パルスが選択され、NSの定義は符号帳探索アルゴリズムの第1実施形態と同じであり、n0は2以上であり、現在のラウンドの探索において不変に維持され、n0個の探索パルスは、重複のない全体で
NS集合は全部で4個のパルス、すなわち、P0,P1,P2,P3を有し、それぞれM=4個のトラック、すなわち、T0,T1,T2,T3上に存在し、各トラック上で1個のパルスが探索されると仮定する。n=n0=2と決定され、NS集合から2個の探索パルスが選択されるならば、P0,P1;P0,P2;P0,P3;P1,P2;P1,P3;P2,P3を含む、全体で
ブロックB3において、ブロックB2における探索処理が1ラウンドにおいてK回実行され、
値nは固定であり、毎回選択される探索パルスの組み合わせは繰り返されないので、最大で
ブロックB4において、設定された評価基準に従って基本符号帳および探索符号帳からこのラウンドの最適符号帳が選択される。
このブロックは、符号帳探索アルゴリズムの第1実施形態におけるブロックA4に従って実行することができる。
ブロックC1において、基本符号帳が取得される。基本符号帳はM個のトラック上のN個のパルスについての位置情報を含み、N,Mは正の整数である。
このブロックは、符号帳探索アルゴリズムの第1実施形態におけるブロックA1に従って実行することができる。
ブロックC2において、NS=Nであり、このラウンドの最適符号帳を取得するために1ラウンドにおいてK回の探索処理が実行される。
このブロックは、符号帳探索アルゴリズムの第1実施形態におけるブロックA2からA4、または、符号帳探索アルゴリズムの第2実施形態におけるブロックB2からB4に従って実行することができる。NS=Nであるので、基本符号帳の全てのパルスから探索パルスが選択される。符号帳探索アルゴリズムの第2実施形態における方法について、異なるラウンドにおいて決定される値nは同一または異なりうる。
ブロックC3において、探索のラウンド番号Gが、設定された上限値Gに到達したか否か判定し、はい、ならばブロックC5が実行され、そうでなければブロックC4が実行される。
ブロックC4において、最適符号帳は新たな基本符号帳としての役割を果たすために元の基本符号帳を置換し、処理はブロックC2に戻り、新たなラウンドの最適符号帳の探索を継続する。
ブロックC5において、最終的な最適符号帳としての役割を果たすために、このラウンドの最適符号帳が取得される。
ブロックD1において、基本符号帳が取得される。基本符号帳はM個のトラック上のN個のパルスについての位置情報を含み、N,Mは正の整数である。
このブロックは、符号帳探索アルゴリズムの第1実施形態におけるブロックA1に従って実行することができる。
ブロックD2において、このラウンドの最適符号帳を取得するために1ラウンドにおいてK回の探索処理が実行される。
このブロックは、符号帳探索アルゴリズムの第1実施形態におけるブロックA2からA4、または、符号帳探索アルゴリズムの第2実施形態におけるブロックB2からB4に従って実行することができる。最初のラウンドにおいて、NS=Nと設定される。
ブロックD3において、探索のラウンド番号Gが、設定された上限値Gに到達したか否か、または、次のラウンドにおけるNS集合が空であるか否か判定し、はい、ならばブロックD5が実行され、そうでなければブロックD4が実行される。
ブロックD4において、新たな基本符号帳としての役割を果たすために、最適符号帳は元の基本符号帳を置換し、新たなNS個のパルスとしての役割を果たすために、最適符号帳において固定された位置のパルスであって元のNS個のパルスに属すパルスを取得する。その後、処理はブロックD2に戻り、新たなラウンドの最適符号帳の探索を継続する。
ブロックD5において、最終的な最適符号帳としての役割を果たすために、このラウンドの最適符号帳が取得される。
すなわち、ビットレートのような関連情報に従って、探索されるパルスの総数Nおよび各トラック上に配分されるパルス数が決定される。
ブロックE2において、各トラック上の既知の基準信号のいつかの極値に従って、各トラックの集中探索範囲が決定され、集中探索範囲はトラック上の少なくとも1つの位置を含む。
基準信号はパルス位置最大尤度関数b(i)を採用し、全てのパルス位置においてb(i)の異なる値を計算し、それぞれ、各トラックの集中探索範囲として各トラック上のb(i)の最大値を有するいくつかの位置を選択する。各トラックの集中探索範囲に含まれる位置の数は同一または異なりうる。
{T0,T1,T2,T3}=
{
{0, 36, 32, 4, 40, 28, 16, 8, 20, 52, 44, 48, 12, 56, 24, 60},
{1, 33, 37, 5, 29, 41, 17, 9, 49, 21, 53, 25, 13, 45, 57, 61},
{34, 2, 38, 30, 6, 18, 42, 50, 26, 14, 10, 22, 54, 46, 58, 62},
{35, 3, 31, 39, 7, 19, 27, 51, 15, 43, 55, 47, 23, 11, 59, 63}
}
そのため、トラックの集中探索範囲として各トラック上のb(i)の最大の絶対値を有する4個の位置が選択されるならば、基本符号帳の集中探索位置は次の通りである。
{
{0, 36, 32, 4},
{1, 33, 37, 5},
{34, 2, 38, 30},
{35, 3, 31, 39}
}
集中探索範囲は一般にたいへん小さいので、最適な基本符号帳を取得するために全ての探索を実行することができる。例えば、基本符号帳が全部でN=4個のパルス、すなわち、P0,P1,P2,P3を有し、それぞれ、M=4個のトラック、すなわち、T0,T1,T2,T3上に存在し、各トラック上で1個のパルスが選択されると仮定する。ブロックE2において与えられる探索範囲に関して、全部で4×4×4×4=256回の探索の後、基本符号帳を取得することができる。
このブロックは、符号帳探索アルゴリズムの第1実施形態におけるブロックA2からA4、または、符号帳探索アルゴリズムの第2実施形態におけるブロックB2からB4に従って実行することができる。
例えば、それぞれM=4個のトラック、すなわち、T0,T1,T2,T3上に配置された全部でN=4個のパルス、すなわち、P0,P1,P2,P3が与えられ、各トラック上で1個のパルスが探索される。表1に表わされているように、各トラック上の位置が区分され、探索処理は次のブロックを含む。
2) 本発明の実施形態における符号化方法のアルゴリズムの計算量はMOPS(million operations per second)によって測定され、これは元の符号化器における方法より、平均で約0.3185MOPS小さい。
3) 本発明の実施形態における符号化方法のPESQ(perceptual evaluation of speech quality)は、元の符号化器における方法より約0.03%、すなわち、0.00127MOS(mean opinion score)小さく、これはほとんど無視されうる。
102 ・・・ 信号タイプ判定部
103 ・・・ ベクトル生成部
104 ・・・ 符号帳探索部
105 ・・・ 決定部
Claims (12)
- 入力信号の特性パラメータを取得する過程と、
前記特性パラメータに従って、前記入力信号のタイプを判定する過程と、を有し、前記入力信号のタイプは周期的特性および白色雑音特性を含み、
前記特性パラメータに従って、量子化されるベクトルを取得する過程と、
前記入力信号のタイプが周期的特性であるとき第1類符号帳探索アルゴリズムを用いて、前記量子化されるベクトルについて符号帳探索を実行し、前記入力信号のタイプが白色雑音特性であるとき第2類符号帳探索アルゴリズムを用いて、前記量子化されるベクトルについて符号帳探索を実行する過程と、をさらに有し、前記第1類符号帳探索アルゴリズムの計算量は前記第2類符号帳探索アルゴリズムの計算量より少ない符号化方法。 - 前記白色雑音特性のタイプを有する入力信号は、一般フレームおよび無声フレームのうち少なくとも1つを含み、
前記一般フレームまたは前記無声フレームによって使用される符号帳探索アルゴリズムは、深さ優先ツリー探索アルゴリズムである請求項1に記載の符号化方法。 - 前記周期的特性のタイプを有する入力信号は、有声フレームおよび過渡フレームのうち少なくとも1つを含み、
前記有声フレームまたは前記過渡フレームによって使用される符号帳探索アルゴリズムは、パルス位置置換に基づく符号帳探索アルゴリズムである請求項1または2に記載の符号化方法。 - 前記パルス位置置換に基づく符号帳探索アルゴリズムは、
M個のトラック上のN個のパルスの位置情報を含む基本符号帳を取得する過程を有し、NおよびMは正の整数であり、
探索パルスとしてn個のパルスを選択し、探索符号帳を取得するために、前記n個の探索パルスの位置情報を、それぞれ前記トラック上の他の位置情報と置換する過程をさらに有し、前記n個のパルスは前記N個のパルスの一部であり、nはNより小さい正の整数であり、
K回の探索処理を実行する過程をさらに有し、Kは2以上の正の整数であり、K回の探索処理のうち1つにおいて少なくとも2個以上の探索パルスが選択され、前記K回の探索処理の各々において選択される探索パルスは異なり、
予め設定された基準に従って前記基本符号帳および前記探索符号帳から最適符号帳を取得する過程をさらに有する請求項3に記載の符号化方法。 - 前記探索パルスとしてn個のパルスを選択する過程は、
前記探索パルスとしてNS個のパルスからn個のパルスを選択する過程を有し、前記NS個のパルスは前記N個のパルスの全部または一部であり、NSはN以下の正の整数であり、nはNSより小さい正の整数であり、
前記基本符号帳において前記n個の探索パルス以外のパルスの位置を固定する過程をさらに有する請求項4に記載の符号化方法。 - 新たな基本符号帳として元の基本符号帳を前記最適符号帳と置換し、新たなNS個のパルスとしての役割を果たすために、前記最適符号帳において固定された位置のパルスであって元のNS個のパルスに属すパルスを取得し、次のラウンドの最適符号帳の探索を継続する過程と、
探索のラウンド番号Gが上限に到達するまで、前記元の基本符号帳を前記最適符号帳と置換する処理を繰り返す過程と、
をさらに有する請求項5に記載の符号化方法。 - 前記基本符号帳を取得する過程は、
M個のトラックの各々に配分されるパルス数を取得する過程を有し、前記M個のトラック上にN個のパルスが存在し、
各トラック上の既知の基準信号のうちいくつかの極値に従って各トラックの集中探索範囲を決定する過程をさらに有し、前記集中探索範囲は前記トラック上の少なくとも1つの位置を含み、
前記M個のトラックの各々に配分されるパルス数に従ってM個の集中探索範囲において全ての探索を実行し、前記設定された評価基準に従って全ての位置の組み合わせから前記基本符号帳を選択する過程をさらに有する請求項5に記載の符号化方法。 - 入力信号の特性パラメータを取得する特性パラメータ取得部と、
前記特性パラメータに従って、前記入力信号のタイプを判定する信号タイプ判定部と、を備え、前記入力信号のタイプは周期的特性および白色雑音特性を含み、
前記特性パラメータに従って、量子化されるベクトルを生成するベクトル生成部と、
第1類符号帳探索部および第2類符号帳探索部と、をさらに備え、各符号帳探索部は異なる符号帳探索アルゴリズムを提供し、前記第1類符号帳探索部によって提供される符号帳探索アルゴリズムの計算量は前記第2類符号帳探索部によって提供される符号帳探索アルゴリズムの計算量より少なく、
前記信号タイプ判定部によって判定された入力信号のタイプに対応する符号帳探索アルゴリズムを用いて、前記量子化されるベクトルについて符号帳探索を実行する決定部をさらに備え、前記決定部は前記周期的特性を有するタイプによって第1類符号帳探索部を選択し、前記白色雑音特性を有するタイプによって第2類符号帳探索部を選択する符号化器。 - 前記信号タイプ判定部によって判定された前記白色雑音特性のタイプを有する入力信号は、一般フレームおよび無声フレームのうち少なくとも1つを含み、
前記第2類符号帳探索部は深さ優先ツリー探索アルゴリズムを提供する深さ優先探索部を備え、
前記決定部は前記白色雑音特性を有するタイプによって前記第2類符号帳探索部を選択し、前記一般フレームまたは前記無声フレームによって前記深さ優先探索部を選択する請求項9に記載の符号化器。 - 前記信号タイプ判定部によって判定された前記周期的特性のタイプを有する入力信号は、有声フレームおよび過渡フレームのうち少なくとも1つを含み、
前記第1類符号帳探索部はパルス位置置換に基づく符号帳探索アルゴリズムを提供するパルス置換探索部を備え、
前記決定部は前記周期的特性を有するタイプによって前記第1類符号帳探索部を選択し、前記有声フレームまたは前記過渡フレームによって前記パルス置換探索部を選択する請求項9または10に記載の符号化器。 - コンピュータのプロセッサによって実行されるとき、請求項1に記載の方法を前記コンピュータのプロセッサに実行させるコンピュータプログラムコードを含むコンピュータ読み取り可能な記憶媒体。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN200710165784A CN100578619C (zh) | 2007-11-05 | 2007-11-05 | 编码方法和编码器 |
CN200710165784.3 | 2007-11-05 | ||
PCT/CN2008/072371 WO2009059513A1 (fr) | 2007-11-05 | 2008-09-16 | Procédé de codage, codeur et support lisible par ordinateur |
Related Child Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2013019667A Division JP2013122612A (ja) | 2007-11-05 | 2013-02-04 | 符号化方法、符号化器、および、コンピュータ読み取り可能な媒体 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2010511901A JP2010511901A (ja) | 2010-04-15 |
JP5532304B2 true JP5532304B2 (ja) | 2014-06-25 |
Family
ID=40113736
Family Applications (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2009539594A Active JP5532304B2 (ja) | 2007-11-05 | 2008-09-16 | 符号化方法、符号化器、および、コンピュータ読み取り可能な媒体 |
JP2013019667A Pending JP2013122612A (ja) | 2007-11-05 | 2013-02-04 | 符号化方法、符号化器、および、コンピュータ読み取り可能な媒体 |
Family Applications After (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2013019667A Pending JP2013122612A (ja) | 2007-11-05 | 2013-02-04 | 符号化方法、符号化器、および、コンピュータ読み取り可能な媒体 |
Country Status (7)
Country | Link |
---|---|
US (1) | US8600739B2 (ja) |
EP (1) | EP2110808B1 (ja) |
JP (2) | JP5532304B2 (ja) |
KR (1) | KR101211922B1 (ja) |
CN (1) | CN100578619C (ja) |
AT (1) | ATE533147T1 (ja) |
WO (1) | WO2009059513A1 (ja) |
Families Citing this family (16)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20070136054A1 (en) * | 2005-12-08 | 2007-06-14 | Hyun Woo Kim | Apparatus and method of searching for fixed codebook in speech codecs based on CELP |
DK2827327T3 (da) | 2007-04-29 | 2020-10-12 | Huawei Tech Co Ltd | Fremgangsmåde til excitationsimpulskodning |
CN100578619C (zh) | 2007-11-05 | 2010-01-06 | 华为技术有限公司 | 编码方法和编码器 |
CN101577551A (zh) | 2009-05-27 | 2009-11-11 | 华为技术有限公司 | 一种生成格型矢量量化码书的方法及装置 |
CN102243876B (zh) * | 2010-05-12 | 2013-08-07 | 华为技术有限公司 | 预测残差信号的量化编码方法及装置 |
CN102299760B (zh) | 2010-06-24 | 2014-03-12 | 华为技术有限公司 | 脉冲编解码方法及脉冲编解码器 |
CN104254886B (zh) * | 2011-12-21 | 2018-08-14 | 华为技术有限公司 | 自适应编码浊音语音的基音周期 |
CN103377653B (zh) * | 2012-04-20 | 2016-03-16 | 展讯通信(上海)有限公司 | 语音编码中代数码表的搜索方法及装置,语音编码方法 |
RU2638734C2 (ru) | 2013-10-18 | 2017-12-15 | Фраунхофер-Гезелльшафт Цур Фердерунг Дер Ангевандтен Форшунг Е.Ф. | Кодирование спектральных коэффициентов спектра аудиосигнала |
FR3013496A1 (fr) * | 2013-11-15 | 2015-05-22 | Orange | Transition d'un codage/decodage par transformee vers un codage/decodage predictif |
FR3024581A1 (fr) * | 2014-07-29 | 2016-02-05 | Orange | Determination d'un budget de codage d'une trame de transition lpd/fd |
CN105355194A (zh) * | 2015-10-22 | 2016-02-24 | 百度在线网络技术(北京)有限公司 | 语音合成方法和装置 |
US10878831B2 (en) | 2017-01-12 | 2020-12-29 | Qualcomm Incorporated | Characteristic-based speech codebook selection |
CN108417206A (zh) * | 2018-02-27 | 2018-08-17 | 四川云淞源科技有限公司 | 基于大数据的信息高速处理方法 |
CN117882095A (zh) * | 2021-06-29 | 2024-04-12 | 西门子股份公司 | 方案推荐方法、设备、系统和存储介质 |
CN117789740B (zh) * | 2024-02-23 | 2024-04-19 | 腾讯科技(深圳)有限公司 | 音频数据处理方法、装置、介质、设备及程序产品 |
Family Cites Families (38)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5202953A (en) | 1987-04-08 | 1993-04-13 | Nec Corporation | Multi-pulse type coding system with correlation calculation by backward-filtering operation for multi-pulse searching |
CA2010830C (en) | 1990-02-23 | 1996-06-25 | Jean-Pierre Adoul | Dynamic codebook for efficient speech coding based on algebraic codes |
US5754976A (en) | 1990-02-23 | 1998-05-19 | Universite De Sherbrooke | Algebraic codebook with signal-selected pulse amplitude/position combinations for fast coding of speech |
US5701392A (en) | 1990-02-23 | 1997-12-23 | Universite De Sherbrooke | Depth-first algebraic-codebook search for fast coding of speech |
EP0755047B1 (en) * | 1990-11-02 | 2002-04-10 | Nec Corporation | Speech parameter encoding method capable of transmitting a spectrum parameter at a reduced number of bits |
US5187745A (en) | 1991-06-27 | 1993-02-16 | Motorola, Inc. | Efficient codebook search for CELP vocoders |
CA2141181A1 (en) | 1994-09-21 | 1996-03-22 | Kimberly-Clark Worldwide, Inc. | Wet-resilient webs |
JPH08179796A (ja) | 1994-12-21 | 1996-07-12 | Sony Corp | 音声符号化方法 |
US5822724A (en) | 1995-06-14 | 1998-10-13 | Nahumi; Dror | Optimized pulse location in codebook searching techniques for speech processing |
US6393391B1 (en) | 1998-04-15 | 2002-05-21 | Nec Corporation | Speech coder for high quality at low bit rates |
JP3144284B2 (ja) * | 1995-11-27 | 2001-03-12 | 日本電気株式会社 | 音声符号化装置 |
JP3299099B2 (ja) * | 1995-12-26 | 2002-07-08 | 日本電気株式会社 | 音声符号化装置 |
JP3531342B2 (ja) * | 1996-03-29 | 2004-05-31 | ソニー株式会社 | 音声処理装置および音声処理方法 |
US6480822B2 (en) | 1998-08-24 | 2002-11-12 | Conexant Systems, Inc. | Low complexity random codebook structure |
JP3180786B2 (ja) | 1998-11-27 | 2001-06-25 | 日本電気株式会社 | 音声符号化方法及び音声符号化装置 |
JP4173940B2 (ja) * | 1999-03-05 | 2008-10-29 | 松下電器産業株式会社 | 音声符号化装置及び音声符号化方法 |
EP1221694B1 (en) | 1999-09-14 | 2006-07-19 | Fujitsu Limited | Voice encoder/decoder |
US6510407B1 (en) | 1999-10-19 | 2003-01-21 | Atmel Corporation | Method and apparatus for variable rate coding of speech |
CA2327041A1 (en) | 2000-11-22 | 2002-05-22 | Voiceage Corporation | A method for indexing pulse positions and signs in algebraic codebooks for efficient coding of wideband signals |
US7065338B2 (en) * | 2000-11-27 | 2006-06-20 | Nippon Telegraph And Telephone Corporation | Method, device and program for coding and decoding acoustic parameter, and method, device and program for coding and decoding sound |
KR100464369B1 (ko) * | 2001-05-23 | 2005-01-03 | 삼성전자주식회사 | 음성 부호화 시스템의 여기 코드북 탐색 방법 |
JP2002349429A (ja) | 2001-05-28 | 2002-12-04 | Toyota Industries Corp | 可変容量型圧縮機及びその製造方法 |
DE10140507A1 (de) | 2001-08-17 | 2003-02-27 | Philips Corp Intellectual Pty | Verfahren für die algebraische Codebook-Suche eines Sprachsignalkodierers |
KR100446630B1 (ko) * | 2002-05-08 | 2004-09-04 | 삼성전자주식회사 | 음성신호에 대한 벡터 양자화 및 역 벡터 양자화 장치와그 방법 |
US7363218B2 (en) | 2002-10-25 | 2008-04-22 | Dilithium Networks Pty. Ltd. | Method and apparatus for fast CELP parameter mapping |
KR100463559B1 (ko) | 2002-11-11 | 2004-12-29 | 한국전자통신연구원 | 대수 코드북을 이용하는 켈프 보코더의 코드북 검색방법 |
KR100463418B1 (ko) * | 2002-11-11 | 2004-12-23 | 한국전자통신연구원 | Celp 음성 부호화기에서 사용되는 가변적인 고정코드북 검색방법 및 장치 |
KR100463419B1 (ko) | 2002-11-11 | 2004-12-23 | 한국전자통신연구원 | 적은 복잡도를 가진 고정 코드북 검색방법 및 장치 |
US7249014B2 (en) | 2003-03-13 | 2007-07-24 | Intel Corporation | Apparatus, methods and articles incorporating a fast algebraic codebook search technique |
KR100556831B1 (ko) | 2003-03-25 | 2006-03-10 | 한국전자통신연구원 | 전역 펄스 교체를 통한 고정 코드북 검색 방법 |
CN1240050C (zh) | 2003-12-03 | 2006-02-01 | 北京首信股份有限公司 | 一种用于语音编码的固定码本快速搜索方法 |
CN1760905A (zh) | 2004-10-16 | 2006-04-19 | 鸿富锦精密工业(深圳)有限公司 | 电子竞标系统及方法 |
CN100416652C (zh) | 2005-10-31 | 2008-09-03 | 连展科技(天津)有限公司 | 增强的amr编码器快速固定码本搜索方法 |
CN100498934C (zh) * | 2005-10-31 | 2009-06-10 | 连展科技(天津)有限公司 | 一种新型的快速固定码本搜索方法 |
KR100795727B1 (ko) | 2005-12-08 | 2008-01-21 | 한국전자통신연구원 | Celp기반의 음성 코더에서 고정 코드북 검색 장치 및방법 |
US20070136054A1 (en) * | 2005-12-08 | 2007-06-14 | Hyun Woo Kim | Apparatus and method of searching for fixed codebook in speech codecs based on CELP |
CN100578619C (zh) | 2007-11-05 | 2010-01-06 | 华为技术有限公司 | 编码方法和编码器 |
JP5242231B2 (ja) | 2008-04-24 | 2013-07-24 | 三菱電機株式会社 | 電位生成回路および液晶表示装置 |
-
2007
- 2007-11-05 CN CN200710165784A patent/CN100578619C/zh active Active
-
2008
- 2008-09-16 WO PCT/CN2008/072371 patent/WO2009059513A1/zh active Application Filing
- 2008-09-16 KR KR1020097012209A patent/KR101211922B1/ko active IP Right Grant
- 2008-09-16 AT AT08800868T patent/ATE533147T1/de active
- 2008-09-16 EP EP08800868A patent/EP2110808B1/en active Active
- 2008-09-16 JP JP2009539594A patent/JP5532304B2/ja active Active
-
2009
- 2009-06-09 US US12/481,060 patent/US8600739B2/en active Active
-
2013
- 2013-02-04 JP JP2013019667A patent/JP2013122612A/ja active Pending
Also Published As
Publication number | Publication date |
---|---|
ATE533147T1 (de) | 2011-11-15 |
KR20090086102A (ko) | 2009-08-10 |
US8600739B2 (en) | 2013-12-03 |
JP2013122612A (ja) | 2013-06-20 |
EP2110808B1 (en) | 2011-11-09 |
US20090248406A1 (en) | 2009-10-01 |
KR101211922B1 (ko) | 2012-12-13 |
CN101303857A (zh) | 2008-11-12 |
EP2110808A1 (en) | 2009-10-21 |
CN100578619C (zh) | 2010-01-06 |
JP2010511901A (ja) | 2010-04-15 |
WO2009059513A1 (fr) | 2009-05-14 |
EP2110808A4 (en) | 2010-01-13 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5532304B2 (ja) | 符号化方法、符号化器、および、コンピュータ読み取り可能な媒体 | |
KR101406113B1 (ko) | 스피치 신호에서 천이 프레임을 코딩하기 위한 방법 및 장치 | |
KR100795727B1 (ko) | Celp기반의 음성 코더에서 고정 코드북 검색 장치 및방법 | |
AU2015258241B2 (en) | Apparatus and method for selecting one of a first encoding algorithm and a second encoding algorithm using harmonics reduction | |
CN106463134B (zh) | 用于对线性预测系数进行量化的方法和装置及用于反量化的方法和装置 | |
JP6170172B2 (ja) | 符号化モード決定方法及び該装置、オーディオ符号化方法及び該装置、並びにオーディオ復号化方法及び該装置 | |
KR100556831B1 (ko) | 전역 펄스 교체를 통한 고정 코드북 검색 방법 | |
KR20100006492A (ko) | 부호화 방식 결정 방법 및 장치 | |
Ebner et al. | Audio inpainting with generative adversarial network | |
CN107077857B (zh) | 对线性预测系数量化的方法和装置及解量化的方法和装置 | |
JP4063911B2 (ja) | 音声符号化装置 | |
CN1271925A (zh) | 用于码激励线性预测语音编码的整形的固定码簿搜索 | |
US7908136B2 (en) | Fixed codebook search method and searcher | |
JP3471889B2 (ja) | 音声符号化方法及び装置 | |
KR101728047B1 (ko) | 부호화 방식 결정 방법 및 장치 | |
JP2004309686A (ja) | 広帯域音声符号化方法及び広帯域音声符号化装置 | |
JPH09134196A (ja) | 音声符号化装置 | |
US8050913B2 (en) | Method and apparatus for implementing fixed codebooks of speech codecs as common module | |
Andrews et al. | Algorithm compatible improvements for FS-1016 CELP | |
CN113826161A (zh) | 用于检测待编解码的声音信号中的起音以及对检测到的起音进行编解码的方法和设备 | |
KR20170044623A (ko) | 부호화 방식 결정 방법 및 장치 | |
JPH06209262A (ja) | 駆動音源コードブックの設計法 | |
Farsi | A Pre-processing Method to Modify Irregular Pitch Variations for Quality Enhancement of Synthesised Speech | |
KR20150053891A (ko) | 부호화 방식 결정 방법 및 장치 | |
KR20110113123A (ko) | 오디오 신호 처리 방법 및 장치 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20111024 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20111108 |
|
A601 | Written request for extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A601 Effective date: 20120208 |
|
A602 | Written permission of extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A602 Effective date: 20120215 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20120302 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20121002 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20130204 |
|
A911 | Transfer to examiner for re-examination before appeal (zenchi) |
Free format text: JAPANESE INTERMEDIATE CODE: A911 Effective date: 20130213 |
|
A912 | Re-examination (zenchi) completed and case transferred to appeal board |
Free format text: JAPANESE INTERMEDIATE CODE: A912 Effective date: 20130502 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20140409 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5532304 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |