JP5532304B2 - 符号化方法、符号化器、および、コンピュータ読み取り可能な媒体 - Google Patents

符号化方法、符号化器、および、コンピュータ読み取り可能な媒体 Download PDF

Info

Publication number
JP5532304B2
JP5532304B2 JP2009539594A JP2009539594A JP5532304B2 JP 5532304 B2 JP5532304 B2 JP 5532304B2 JP 2009539594 A JP2009539594 A JP 2009539594A JP 2009539594 A JP2009539594 A JP 2009539594A JP 5532304 B2 JP5532304 B2 JP 5532304B2
Authority
JP
Japan
Prior art keywords
search
codebook
pulses
pulse
input signal
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2009539594A
Other languages
English (en)
Other versions
JP2010511901A (ja
Inventor
徳▲ジュン▼ ▲張▼
亮 ▲張▼
▲ユエ▼ 郎
庭紅 王
立雄 李
文海 ▲ウ▼
▲ウェイ▼ 肖
付▲ウェイ▼ ▲マ▼
▲ゼ▼新 ▲リウ▼
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Huawei Technologies Co Ltd
Original Assignee
Huawei Technologies Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Huawei Technologies Co Ltd filed Critical Huawei Technologies Co Ltd
Publication of JP2010511901A publication Critical patent/JP2010511901A/ja
Application granted granted Critical
Publication of JP5532304B2 publication Critical patent/JP5532304B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/18Vocoders using multiple modes
    • G10L19/24Variable rate codecs, e.g. for generating different qualities using a scalable representation such as hierarchical encoding or layered encoding
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L2019/0001Codebooks
    • G10L2019/0013Codebook search algorithms

Landscapes

  • Engineering & Computer Science (AREA)
  • Quality & Reliability (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Control Of Stepping Motors (AREA)
  • Error Detection And Correction (AREA)

Description

本発明は、ベクトル符号化技術に関し、より詳しくは、符号化方法、符号化器、および、コンピュータ読み取り可能な媒体に関する。
本願は、発明の名称を「符号化方法および符号化器」とする2007年11月5日に出願された中国特許出願第200710165784.3号明細書の優先権を主張し、その全体を引用してここに組み込む。
符号励振線形予測(CELP)モデルに基づく符号化技術において、適応フィルタリングの後に残差信号について量子化符号化を実行することはたいへん重要な処理である。現在、残差信号の量子化符号化は、多くの場合、固定符号帳探索によって実行される。一般的に使用される固定符号帳は代数符号帳である。代数符号帳は、ターゲット信号のパルス位置に焦点を合わせ、デフォルトでパルス振幅を1に設定するので、パルスのシンボルおよび位置のみが数量化される必要がある。もちろん、同じ位置に複数のパルスが重畳され、それぞれ異なる振幅を示すことが可能である。量子化符号化のために代数符号帳が使用されるとき、ターゲット信号に対応する最適な代数符号帳においてパルス位置を探索することが重要である。一般に、最適なパルス位置の探索の間の全ての探索(すなわち、全ての可能な位置の組み合わせを移動すること)の計算量はたいへん多いので、準最適な探索アルゴリズムが必要とされる。探索結果の品質の保証に基づいて、どのように探索回数を減少させ、どのように計算量を低下させるかが、符号化技術において研究および解決されるべき主要な課題である。
代数符号帳においてパルス位置を探索するための2つの既存の準最適な探索方法は次の通りである。
<1.深さ優先ツリー探索手順>
音声サブフレームの長さは64、探索されるパルス数はNとし、Nは符号化率とともに変動すると仮定する。他の制約なしで、64個の位置においてN個のパルスを探索する計算は非常に量が多い。従って、代数符号帳におけるパルス位置は制限され、64個の位置はM個のトラックに区分される。トラックを区分する典型的な方法を表1に示す。
Figure 0005532304
表1において、“T0”から“T3”は4個のトラックであり、“位置”は各トラックにおける位置の番号である。表1から、64個の位置は4個のトラックに区分され、各トラックは16個の位置を有し、4個のトラックにおけるパルス位置はずらされ、パルス位置の様々な組み合わせを最大に保証することが分かる。
探索されるN個のパルスは、ある数量配分に基づいてM=4個のトラックに制限される。例えば、N=4であり、各トラック上で1個のパルスが探索される。他の状況は同様に推定することができる。
T0からT3において探索されるパルスは、それぞれP0からP3であると仮定する。探索の間に、2つの隣接するトラック、例えば、T0−T1、T1−T2、T2−T3、T3−T0上の2つのパルスが同時に探索され、4レベルの探索によって最終的な最適符号帳が得られる。詳細な処理は図1に表わされ、これは次のステップを含む。
1) T0−T1およびT2−T3について第1レベルの探索が実行される。まず、T0−T1についてP0およびP1の位置が探索され、トラックT0上で16個の位置の中の4個の位置からP0が探索され、4個の位置はトラック上の既知の基準信号の極値によって決定され、トラックT1上で16個の位置からP1が探索される。P0およびP1の最適な位置は、設定された評価基準(例えば、コスト関数Qk)に従って、探索される4×16個の位置の組み合わせから決定される。その後、T2−T3上でP2およびP3の位置が探索され、トラックT2上の16個の位置の中の8個の位置からP2が探索され、8個の位置はトラック上の既知の基準信号の極値によって決定され、トラックT3上で16個の位置からP3が探索され、P2およびP3の最適な位置が決定される。従って、このレベルにおける探索処理が完了する。
2) T1−T2およびT3−T0上で第2レベルの探索が実行され、これは第1レベルの探索と同様である。
3) 同様に、T2−T3およびT0−T1上で第3レベルの探索が実行され、T3−T0およびT1−T2上で第4レベルの探索が実行される。
4) 最後に、最適な代数符号帳として第4レベルの探索から最適な結果が選択される。合計の探索回数は4×(4×16+8×16)=768である。
<2.大域的パルス置換(global pulse replacement)手順>
説明を簡単にするために、前のアルゴリズムと同じ構成の符号帳が使用され、4個のトラックの各々について1個のパルスが探索され、T0からT3上で探索されるパルスは、それぞれP0からP3であると仮定する。詳細な処理は次のステップを含む。
1) 初期符号帳が決定され、これは{P0,P1,P2,P3}={20,33,42,7}であると仮定する。P1,P2,P3は不変に維持され、P0の初期値20はトラックT0上の他の位置によって順次置換され、新たな符号帳{0,33,42,7},{4,33,42,7},・・・,{60,33,42,7}を得る。設定された評価基準に従って、新たな最適符号帳が選択され、例えば、コスト関数Qkの最大値を有する新たな符号帳が選択される。Qkの最大値および対応する新たな符号帳が記録され、例えば{4,33,42,7}である。
2) 初期符号帳におけるP0,P2,P3は不変に維持され(ここでの初期符号帳はまだ元の初期符号帳、すなわち、{20,33,42,7}であることに留意すべきである。)、P1の初期値33はトラックT1上で他の位置によって順次置換され、これは1)における処理と同様であり、置換によってQkの最大値および対応する新たな符号帳、例えば{20,21,42,7}を得る。
3) P2およびP3において1)および2)と同様の処理が実行され、それぞれ、Qkの最大値および対応する新たな符号帳を得る。
4) 得られた4つのQkの最大値から大域的な最適値として最大値が選択され、対応する符号帳、例えば{20,21,42,7}は、このラウンドの探索についての最適符号帳としての役割を果たす。
5) 新たなラウンドのための初期符号帳として最適符号帳{20,21,42,7}が得られ、1)から4)の処理が繰り返され、このサイクルは一般に4回実行され、最終的な最適符号帳を得る。従って、合計の探索回数は4×(4×16)=256である。
様々な既存の符号化技術において使用される符号帳探索アルゴリズムは、計算量および性能の要求条件を満たすことが難しい。例えば、深さ優先ツリー探索アルゴリズムは様々な符号化率の下で所望の音声品質を得るが、探索回数が多く、計算量が多い。また、大域的パルス置換アルゴリズムは計算量が少ないが、局所的な最大値が生じうるので性能が不安定であり、すなわち、このアルゴリズムはある信号条件の下で良い品質を達成しうるが、他の信号条件の下で所望の品質を達成できない。
従って、本発明の様々な実施形態は、計算量を少なくし、システム性能を向上させることが可能な符号化方法、符号化器、および、コンピュータ読取可能な媒体を提供する。
符号化方法は、入力信号の特性パラメータを取得する過程と、前記特性パラメータに従って、前記入力信号のタイプを判定する過程と、前記特性パラメータに従って、量子化されるベクトルを取得する過程と、前記入力信号のタイプに対応する符号帳探索アルゴリズムを用いて、前記量子化されるベクトルについて符号帳探索を実行する過程と、を含む。
符号化器は、入力信号の特性パラメータを取得する特性パラメータ取得部と、前記特性パラメータに従って、前記入力信号のタイプを判定する信号タイプ判定部と、前記特性パラメータに従って、量子化されるベクトルを生成するベクトル生成部と、前記信号タイプ判定部によって判定された入力信号のタイプに対応する符号帳探索アルゴリズムを用いて、前記量子化されるベクトルについて符号帳探索を実行する決定部と、を含む。
コンピュータ読み取り可能な記憶媒体はコンピュータプログラムコードを含む。このコンピュータプログラムコードはコンピュータによって実行され、このコンピュータは、入力信号の特性パラメータを取得し、前記特性パラメータに従って、前記入力信号のタイプを判定し、前記特性パラメータに従って、量子化されるベクトルを取得し、前記入力信号のタイプに対応する符号帳探索アルゴリズムを用いて、前記量子化されるベクトルについて符号帳探索を実行する。
符号化方法または装置は異なるタイプの入力信号に従って異なる符号帳探索アルゴリズムを採用する。入力信号の特性に従って適切な探索アルゴリズムが選択されるので、簡単な計算によって十分な結果が得られる、あるタイプの信号が、これらの信号タイプに適した計算量の少ない探索アルゴリズムと合致し、より少ないシステム資源を用いてより良い性能を達成する。一方、多量の計算を必要とする他のタイプの信号は、より洗練された探索アルゴリズムによって処理され、それによって符号化の品質を保証することが可能である。
従来技術における深さ優先ツリー探索手順の図である。 本発明の実施形態による符号化方法のフローチャートである。 本発明の実施形態による符号化器の論理構成図である。 本発明の第1実施形態による符号帳探索アルゴリズムのフローチャートである。 本発明の第2実施形態による符号帳探索アルゴリズムのフローチャートである。 本発明の第3実施形態による符号帳探索アルゴリズムのフローチャートである。 本発明の第4実施形態による符号帳探索アルゴリズムのフローチャートである。 本発明の第5実施形態による符号帳探索アルゴリズムのフローチャートである。
本発明の実施形態において符号化方法が提供され、これは異なるタイプの入力信号に従って異なる符号帳探索アルゴリズムを選択することができる。また、本発明の実施形態において、この符号化方法を使用する符号化器が提供される。本発明の実施形態の方法および装置は、それぞれ以下で詳細に説明される。
図2を参照すると、本発明の実施形態における符号化方法は次のブロックを含む。
ブロック1において入力信号の特性パラメータが取得される。
この実施形態において、符号化する入力信号は、他の同様な音声または楽音の信号だけでなく、ベクトル量子化符号化に適用可能なCELPモデルに基づく適応フィルタリング後の残差信号とすることが可能である。ここで、特性パラメータは、ある形態において入力信号の特性を記述するデータである。特性パラメータはフレームにおいて解析および抽出され、フレームサイズは実際の要求条件および信号特性に従って選択することが可能である。
特性パラメータは、限定しないが、線形予測係数(LPC)、線形予測ケプストラム係数(LPCC)、ピッチ周期係数、フレームエネルギー、平均零交差率を含む。
ブロック2において、入力信号の特性パラメータに従って、入力信号のタイプが判定される。
入力信号のタイプが判定されるとき、特性パラメータは様々なタイプが存在し、これは、ぞれぞれ、ある形態において入力信号の特性を反映するので、入力信号は、異なる判定方法に基づいて、例えば、異なる特性パラメータまたは特性パラメータの組み合わせに基づいて、または、特性パラメータについて異なる閾値を設定することによって、分類され、これは、この実施形態において限定されず、実際の要求条件に従って設定することが可能である。
信号タイプの分類は探索アルゴリズムの続く選択に密接に関係するので、適用可能な分類の形態は、候補の探索アルゴリズムの特性に従って、分類のための基準および分類の規範として具体的な特性パラメータを決定する。
例えば、計算量の少ないアルゴリズムは周期的特性を有する入力信号を処理するために適している。このタイプの信号についての最適なパルス位置を決定することは比較的容易なので、システム性能に大きく影響を与えることなく効果的に計算量を少なくするからである。また、計算量の多いアルゴリズムは白色雑音特性を有する入力信号を処理するために適している。このタイプの信号について最適なパルス位置を決定することは難しいので、符号化の品質を保証するために高い品質のアルゴリズムが使用されるからである。従って、入力信号の周期的特性を表わす特性パラメータは分類のための基準とすることができ、入力信号のタイプは周期的特性を有するタイプと白色雑音特性を有するタイプに分類される。こうして、周期的特性を有する信号は計算量の少ない探索アルゴリズムによって処理され、白色雑音特性を有する信号は計算量の多い探索アルゴリズムによって処理される。
もちろん、分類のための付加的な基準として、または、分類をさらに下位分類するために、入力信号の他の特性を表わす特性パラメータを採用することができる。説明のための例として、分類および判定の方法を以下で述べる。
入力信号は4つの異なるフレームタイプ、すなわち、無声(unvoiced)フレーム、有声(voiced)フレーム、一般(general)フレーム、過渡(transition)フレームに分類することができる。有声フレームおよび過渡フレームは1つのタイプに統合することができる。無声フレームおよび一般フレームは白色雑音特性を有するタイプに属し、有声フレームおよび過渡フレームは周期的特性を有するタイプに属す。
ピッチ周期係数、例えば、平均振幅差関数(AMDF)を使用して入力信号の周期的特性を評価し、周期的特性を有するタイプを白色雑音特性を有するタイプと予備的に識別することができる。もちろん、平均零交差率を独立に、または、判定のための補助として使用することができ、一般に、周期的信号の平均零交差率は白色雑音信号のそれより小さい。
白色雑音特性を有するタイプにおいて、フレームエネルギーを使用して無声フレームおよび一般フレームを判定することができる。一般に、無声フレームのフレームエネルギーは一般フレームのそれより小さく、判定のために閾値を設定することができる。
周期的特性を有するタイプにおいて、AMDFをさらに解析して有声フレームおよび過渡フレームを識別し、または、識別するために下位分類された平均零交差率の値の範囲を使用することができる。もちろん、有声フレームおよび過渡フレームが1つのタイプに統合されるならば、下位分類は不要である。
上記の分類および判定の方法は単なる例であり、実際の要求条件および信号特性に従って適切な特性パラメータおよび判定順序を選択することができる。例えば、まず、フレームエネルギーに従って分類が行われ、そして、構造的な特性パラメータを用いて下位分類が実行される。
ブロック3において、入力信号の特性パラメータに従って、量子化されるベクトルが生成される。
このブロックは従来技術と同じ方法で実行することができる。さらに、ブロック3は、順序に関してブロック2と論理的に関係なく、ブロック2の前に、または、ブロック2の後に、または、ブロック2と一緒に実行することができる。
ブロック4において、入力信号の判定されたタイプに従って、対応する符号帳探索アルゴリズムを用いて、量子化されるベクトルについて符号帳探索が実行される。
符号帳探索アルゴリズムは、入力信号のタイプの分類に従って、信号の特性を満たすように構成される。
例えば、ブロック2に基づく信号分類方法は次の機能を有する。
無声フレーム信号を処理するために、計算量の多い、かつ、性能の良い符号帳探索アルゴリズム、例えば、背景技術の欄で説明したランダム符号帳探索アルゴリズムまたは深さ優先ツリー探索アルゴリズムが適用される。
一般フレームを処理するために、計算量の多い、かつ、性能の良い符号帳探索アルゴリズム、例えば、背景技術の欄で説明した深さ優先ツリー探索アルゴリズムが適用される。
有声フレームおよび/または過渡フレーム信号を処理するために、計算量の少ない符号帳探索アルゴリズム、例えば、背景技術の欄で説明したパルス位置置換に基づく符号帳探索アルゴリズム、特に、大域的パルス置換アルゴリズムが適用される。もちろん、有声フレームおよび過渡フレームが2つの異なる信号タイプにさらに分類されるならば、これら2つのフレームは異なる符号帳探索アルゴリズムを用いて処理することができる。
符号帳探索アルゴリズムが選択された後、決定された符号帳探索アルゴリズムを用いて、量子化されるベクトルについて符号帳探索が実行される。
本発明の実施形態において上記符号化方法を実現する符号化器を以下で説明する。図3を参照すると、符号化器は、特性パラメータ取得部101、信号タイプ判定部102、ベクトル生成部103、少なくとも2つの符号帳探索部104、決定部105を含む。
特性パラメータ取得部101は、入力信号の特性パラメータを取得する。
信号タイプ判定部102は、特性パラメータ取得部101によって与えられる特性パラメータに従って、入力信号のタイプを判定する。
ベクトル生成部103は、特性パラメータ取得部101によって与えられる特性パラメータに従って、量子化されるベクトルを生成する。
少なくとも2つの符号帳探索部(例えば、本実施形態において符号帳探索部1からnが設けられ、これらは図3において一律に符号104によって示されている)は、異なる符号帳探索アルゴリズムを提供する(例えば、符号帳探索部1は深さ優先ツリー探索アルゴリズムを提供し、符号帳探索部2はパルス位置置換に基づく符号帳探索アルゴリズムを提供する)。
決定部105は、対応する符号帳探索アルゴリズムを選択し(例えば、本実施形態において符号帳探索部104が選択される)、信号タイプ判定部102によって判定された入力信号のタイプに従って、選択された符号帳探索アルゴリズムを用いて、ベクトル生成部103によって生成された量子化されるベクトルについて符号帳探索を実行する。例えば、決定部105が入力信号のタイプが周期的特性を有するタイプであると判定すると、符号帳探索を実行するために符号帳探索部2が選択され、決定部105が入力信号のタイプが白色雑音特性を有するタイプであると判定すると、符号帳探索を実行するために符号帳探索部1が選択される。
本実施形態における2つの符号帳探索部は任意選択であり、この場合、決定部は対応する符号帳探索アルゴリズムを選択し、信号タイプ判定部によって判定された入力信号のタイプに従って、選択されたアルゴリズムを用いて、量子化されるベクトルについて符号帳探索を実行することに留意すべきである。
方法の実施形態において説明した信号の分類の上記の例に基づいて、信号タイプ判定部102によって判定された入力信号のタイプは、周期的特性を有するタイプおよび白色雑音特性を有するタイプを含む。
符号帳探索部104は第1類符号帳探索部および第2類符号帳探索部を含み、第1類符号帳探索部によって提供される符号帳探索アルゴリズムの計算量は、第2類符号帳探索部によって提供される符号帳探索アルゴリズムの計算量より少ない。決定部105は、周期的特性を有するタイプによって第1類符号帳探索部を選択し、白色雑音特性を有するタイプによって第2類符号帳探索部を選択する。
さらに、方法の実施形態において説明した信号の分類の上記の例に基づいて、信号タイプ判定部102によって判定された白色雑音特性を有するタイプは、無声フレームおよび一般フレームを含み、信号タイプ判定部102によって判定された周期的特性を有するタイプは、有声フレームおよび/または過渡フレームを含む。
符号帳探索部104における第2類符号帳探索部は、ランダム符号帳探索部および深さ優先探索部を含む。ランダム符号帳探索部はランダム符号帳探索アルゴリズムを提供し、深さ優先探索部は深さ優先ツリー探索アルゴリズムを提供する。符号帳探索部104における第1類符号帳探索部は、パルス位置置換に基づく符号帳探索アルゴリズムを提供するパルス置換探索部を含む。
決定部105は一般フレームおよび/または無声フレームによって深さ優先探索部を選択し、有声フレームおよび/または過渡フレームによってパルス置換探索部を選択する。
本発明の実施形態における上記の符号化方法または装置は、異なるタイプの入力信号に従って異なる符号帳探索アルゴリズムを採用する。入力信号の全ての可能な構成の特徴に従って適切な探索アルゴリズムを選択することができるので、簡単な計算によって十分な結果を得ることができる、あるタイプの信号は、これらの信号タイプのために適した計算量の少ない探索アルゴリズムと合致し、より少ないシステム資源を用いてより良い性能を達成することができる。一方、多量の計算を必要とする他のタイプの信号は、より洗練された探索アルゴリズムによって処理され、符号化の品質を保証することができる。
より良い符号化の性能を提供するために、パルス位置置換に基づく符号帳探索アルゴリズムを以下で説明する。このアルゴリズムは、計算量は少ないが性能が良く、本発明の符号化技術に適用可能である。
図4は本発明の第1実施形態による符号帳探索アルゴリズムを表わし、次のブロックを含む。
ブロックA1において、基本符号帳が取得される。基本符号帳はM個のトラック上のN個のパルスについての位置情報を含み、N,Mは正の整数である。
ここで、基本符号帳は、1ラウンドの探索のための出発点として機能する初期符号帳である。一般に、代数符号帳においてパルス位置を探索する前に、ビットレートのような情報に従って、各トラック上で探索されるパルスの数量配分が決定される。音声量子化符号化においてパルス探索を使用するとき、例えば、表1に表わされているように、64個の位置がM=4個のトラック、すなわち、T0,T1,T2,T3に区分されると仮定し、異なるビットレートに基づくパルスの数量配分は、N=4であり、各トラック上で1個のパルスが探索され、N=8であり、各トラック上で2つのパルスが探索され、または、N=5であり、T0,T1,T2上でそれぞれ1個のパルス、T3上で2個のパルスが探索されることが可能である。
M個のトラック上のN個のパルスの数量配分が決定された後、基本符号帳が取得され、すなわち、各トラック上の各パルスの初期位置が取得される。各パルスの初期位置は様々な方法で決定することができ、本実施形態の符号帳探索アルゴリズムにおいて限定されない。例えば、次のようにいくつかの方法を説明する。
1) トラック上のパルスの位置はパルスの初期位置としてランダムに選択される。
2) 対応するトラック上の各パルスの位置は各トラック上で既知の基準信号のいくつかの極値に従って決定される。
3) 各パルスの初期位置はある計算の形態によって(すなわち、基本符号帳を使用することによって)取得される。
なお、任意選択の基準信号は“パルス位置最大尤度関数”(パルス振幅選択信号とも呼ばれる)である。この関数は
Figure 0005532304
によって示される。ここで、d(i)は、量子化されるターゲット信号によって決定されるベクトル信号dの各次元における成分であり、典型的に、ターゲット信号と前置フィルタリングされ重み付けされた合成フィルタのパルス応答の畳み込みである。rLTP(i)は残差信号rの各次元における長期予測成分である。Eは信号dのエネルギーである。Eは信号rのエネルギーである。aは比例係数であり、基準信号d(i)の依存度を制御し、異なるビットレートとともに値が変動する。64個の位置におけるb(i)のそれぞれの値が計算され、パルスの初期位置としてT0からT3においてb(i)の最大値を有する位置が選択される。
ブロックA2において、探索パルスとしてn個のパルスが選択される。n個のパルスはN個のパルスの一部であり、nはNより小さい正の整数である。具体的な実現は、探索パルスとしてN個のパルスからn個のパルスを選択し、N個のパルスはN個のパルスの全部または一部であり、NはN以下の正の整数であり、nはNより小さい正の整数であり、基本符号帳においてn個の探索パルス以外のパルス位置を固定し、n個の探索パルスの位置をそれぞれトラック上の他の位置と置換して探索符号帳を取得する。
探索パルスとして選択されるパルスはN個のパルスの全てまたは単に一部であり、“探索パルスとして選択されるパルス”は“N集合”を形成する。ある意味で、N個のパルスがN集合に属さないパルスを含むならば、これらのパルス位置は既に最適であり、それ以上探索する必要がない。
様々な方法でN個のパルスからn個の探索パルスを選択することができ、本実施形態の符号帳探索アルゴリズムにおいて限定されない。例えば、次のようにいくつかの方法を説明する。
1) 値nおよび探索パルスの組み合わせはランダムに選択される。
集合は全部で3個のパルス、すなわち、P0,P1,P2を有し、可能な組み合わせは、n=1で探索パルスとしてP1をとる、n=2で探索パルスとしてP0およびP2をとる、n=2で探索パルスとしてP1およびP2をとる、等を含むと仮定する。
2) 値nが決定され(n=2)、探索パルスの組み合わせはランダムに選択される。
集合は全部で4個のパルス、すなわち、P0,P1,P2,P3を有し、n=3と仮定し、可能な組み合わせは、P0,P1,P2;P0,P2,P3;P0,P1,P3;P1,P2,P3を含み、それぞれ探索パルスとしての役割を果たす。
探索パルスの組み合わせが選択された後、探索符号帳を取得するために、基本符号帳においてn個の探索パルスの対応する位置が、探索パルスが配置されているトラック上の他の位置によって置換される。
基本符号帳は全部でN=4個のパルス、すなわち、P0,P1,P2,P3を有し、それぞれM=4個のトラック、すなわち、T0,T1,T2,T3上に配置され、各トラック上で1個のパルスが探索されると仮定する。探索処理において選択された探索パルスがP2,P3であるならば、基本符号帳においてP0,P1の位置は固定され、P2の位置はそれぞれT2上の他の位置(例えば、全部でt2個の位置)によって置換され、P3の位置はそれぞれT3上の他の位置(例えば、全部でt3個の位置)によって置換され、従って、全部で(t2+1)×(t3+1)−1=t2×t3+t2+t3個の探索符号帳が得られる。探索されるトラック上の置換のために使用される位置はトラック上の全ての位置とし、または、設定された範囲から選択することができ、例えば、既知の基準信号の値に従って、探索されるトラックから置換のために一部の位置が選択されることに留意すべきである。
ブロックA3において、ブロックA2における探索処理が1ラウンドにおいてK回実行され、Kは2以上の正の整数である。少なくとも1つの探索処理において2個以上の探索パルスが選択され、各探索処理において選択される探索パルスは同一ではない。
ブロックA2において、繰り返し回数Kは具体的に設定される上限とすることができ、探索処理がK回実行されると1ラウンドの探索が完了する。
さらに、本発明の実施形態は値Kを限定する必要はない。すなわち、値Kは決定されず、1ラウンドの探索が完了したか否かは、ある探索終了条件に従って決定される。例えば、選択された探索パルスがN集合を移動したとき、1ラウンドの探索が完了したと判定される。もちろん、上記2つの方法は組み合わせることができ、すなわち、1ラウンドの探索が完了したか否かは、探索回数は設定された上限Kを超えないが、探索終了条件が満たされたか否かによって判定される。値Kが上限に到達すると、探索終了条件が満たされなくても1ラウンドの探索が完了したとみなされる。実際の要求条件に従って具体的な規則を設定することができ、本実施形態の符号帳探索アルゴリズムにおいて限定されない。
探索結果におけるパルス間の関連を反映するために、本実施形態の符号帳探索アルゴリズムはK回の探索処理のうち少なくとも1つが2個以上のパルスについて実行され、選択された探索パルスは同一または異なるトラック上に配分されうる。
ブロックA4において、設定された評価基準に従って基本符号帳および探索符号帳からこのラウンドの最適符号帳が選択される。
探索符号帳および基本符号帳の比較および評価の処理は、ブロックA2における探索処理と同時に実行することができる。例えば、“好ましい符号帳”が設定され、基本符号帳に初期化される。その後、探索符号帳が取得され、評価のために現在の好ましい符号帳と比較される。探索符号帳が好ましい符号帳より優れていると判定されると、現在の好ましい符号帳は探索符号帳によって置換される。上記処理は、全てのK回の探索が完了するまで繰り返され、最後に取得された好ましい符号帳はこのラウンドの最適符号帳である。各探索処理は基本符号帳に基づき、好ましい符号帳のみが比較および評価されることに留意すべきである。
また、K回の探索処理の結果は集合的に評価することができる。例えば、各探索処理の後に取得された好ましい符号帳は保存され、このラウンドの最適符号帳を選択するために、K個の好ましい符号帳が比較される。
探索符号帳および基本符号帳についての比較および評価の基準は実際の要求条件に従って決定され、本実施形態における符号帳探索アルゴリズムにおいて限定されない。例えば、代数符号帳の品質を測定するために一般に適用されるコスト関数(Qk)は、比較のために使用することができる。一般に、Qkの値が大きくなるほど、符号帳の品質が良くなり、より大きなQkの値を有する符号帳が好ましい符号帳として選択される。
図5は、第1実施形態に基づく本発明の第2実施形態による符号帳探索アルゴリズムを表わし、次のブロックを含む。
ブロックB1において、基本符号帳が取得される。基本符号帳はM個のトラック上のN個のパルスについての位置情報を含み、N,Mは正の整数である。
このブロックは、符号帳探索アルゴリズムの第1実施形態におけるブロックA1に従って実行することができる。
ブロックB2において、N個のパルスからn=n0個の探索パルスが選択され、Nの定義は符号帳探索アルゴリズムの第1実施形態と同じであり、n0は2以上であり、現在のラウンドの探索において不変に維持され、n0個の探索パルスは、重複のない全体で
Figure 0005532304
個の可能な組み合わせから選択された唯一の組み合わせである。
集合は全部で4個のパルス、すなわち、P0,P1,P2,P3を有し、それぞれM=4個のトラック、すなわち、T0,T1,T2,T3上に存在し、各トラック上で1個のパルスが探索されると仮定する。n=n0=2と決定され、N集合から2個の探索パルスが選択されるならば、P0,P1;P0,P2;P0,P3;P1,P2;P1,P3;P2,P3を含む、全体で
Figure 0005532304
個の組み合わせが存在する。6個の組み合わせから探索パルスがランダムに、または、順次選択される。選択を毎回繰り返さないために、組み合わせの変更規則に従って探索パルスが順次選択され、または、全ての組み合わせが順に保存または番号付与され、選択された組み合わせ(または番号)が削除される。
ブロックB3において、ブロックB2における探索処理が1ラウンドにおいてK回実行され、
Figure 0005532304
である。探索処理の少なくとも1つにおいて2個以上の探索パルスが選択され、各探索処理において選択される探索パルスは同一ではない。
値nは固定であり、毎回選択される探索パルスの組み合わせは繰り返されないので、最大で
Figure 0005532304
回の探索の後、N集合における全ての可能な組み合わせを移動することができる。もちろん、上限値Kは
Figure 0005532304
より小さく制限することができ、この場合、全ての可能な組み合わせを移動するとは限らないが、選択された探索パルスはまだN集合を移動することができる。
ブロックB4において、設定された評価基準に従って基本符号帳および探索符号帳からこのラウンドの最適符号帳が選択される。
このブロックは、符号帳探索アルゴリズムの第1実施形態におけるブロックA4に従って実行することができる。
図6は、本発明の第3実施形態による符号帳探索アルゴリズムを表わし、符号帳探索アルゴリズムの第1および第2実施形態に基づいて複数のラウンドにおいて繰り返し実行することが可能な方法を提供する。この方法は次のブロックを含む。
ブロックC1において、基本符号帳が取得される。基本符号帳はM個のトラック上のN個のパルスについての位置情報を含み、N,Mは正の整数である。
このブロックは、符号帳探索アルゴリズムの第1実施形態におけるブロックA1に従って実行することができる。
ブロックC2において、N=Nであり、このラウンドの最適符号帳を取得するために1ラウンドにおいてK回の探索処理が実行される。
このブロックは、符号帳探索アルゴリズムの第1実施形態におけるブロックA2からA4、または、符号帳探索アルゴリズムの第2実施形態におけるブロックB2からB4に従って実行することができる。N=Nであるので、基本符号帳の全てのパルスから探索パルスが選択される。符号帳探索アルゴリズムの第2実施形態における方法について、異なるラウンドにおいて決定される値nは同一または異なりうる。
ブロックC3において、探索のラウンド番号Gが、設定された上限値Gに到達したか否か判定し、はい、ならばブロックC5が実行され、そうでなければブロックC4が実行される。
ブロックC4において、最適符号帳は新たな基本符号帳としての役割を果たすために元の基本符号帳を置換し、処理はブロックC2に戻り、新たなラウンドの最適符号帳の探索を継続する。
ブロックC5において、最終的な最適符号帳としての役割を果たすために、このラウンドの最適符号帳が取得される。
図7は、本発明の第4実施形態による符号帳探索アルゴリズムを表わし、符号帳探索アルゴリズムの第1および第2実施形態に基づいて複数のラウンドにおいて繰り返し実行することが可能なもう1つの方法を提供する。この方法は次のブロックを含む。
ブロックD1において、基本符号帳が取得される。基本符号帳はM個のトラック上のN個のパルスについての位置情報を含み、N,Mは正の整数である。
このブロックは、符号帳探索アルゴリズムの第1実施形態におけるブロックA1に従って実行することができる。
ブロックD2において、このラウンドの最適符号帳を取得するために1ラウンドにおいてK回の探索処理が実行される。
このブロックは、符号帳探索アルゴリズムの第1実施形態におけるブロックA2からA4、または、符号帳探索アルゴリズムの第2実施形態におけるブロックB2からB4に従って実行することができる。最初のラウンドにおいて、N=Nと設定される。
ブロックD3において、探索のラウンド番号Gが、設定された上限値Gに到達したか否か、または、次のラウンドにおけるN集合が空であるか否か判定し、はい、ならばブロックD5が実行され、そうでなければブロックD4が実行される。
符号帳探索アルゴリズムのこの実施形態において、前のラウンドの探索結果に従って各ラウンドのN集合が決定され、具体的な実現はブロックD4に表わされている。N集合が空ならば、探索は完了したとみなされる。また、探索が完了したか否かは、N集合が空でないとき、設定された上限値Gに従って決定される。
ブロックD4において、新たな基本符号帳としての役割を果たすために、最適符号帳は元の基本符号帳を置換し、新たなN個のパルスとしての役割を果たすために、最適符号帳において固定された位置のパルスであって元のN個のパルスに属すパルスを取得する。その後、処理はブロックD2に戻り、新たなラウンドの最適符号帳の探索を継続する。
探索の最初のラウンドにおいてN=N=4であり、N集合は全部で4個のパルス、すなわち、P0,P1,P2,P3を有し、それぞれM=4個のトラック、すなわち、T0,T1,T2,T3上に存在し、各トラック上で1個のパルスが探索されると仮定する。最初のラウンドにおいてn=n0=2と決定されたならば、符号帳探索アルゴリズムの第2実施形態におけるように探索パルスの全ての組み合わせを移動することによってK=6回の探索が実行される。組み合わせは、P0,P1;P0,P2;P0,P3;P1,P2;P1,P3;P2,P3である。P0,P3の組み合わせを用いて探索することによって最初のラウンドの最適符号帳が取得されると仮定し、従って、固定された位置のパルスであって最初のラウンドのN集合に属すパルスはP1,P2であるので、2番目のラウンドのN集合はP1,P2である。2番目のラウンドにおいてn=n0=2と決定されたならば、K=1回の探索が実行される。明らかに、P1,P2の組み合わせを用いて探索することによって2番目のラウンドの最適符号帳が取得され、この探索における固定されたパルスはP0,P3である。しかし、明らかに2つのパルスは2番目のラウンドのN集合に属さないので、3番目のラウンドにおけるN集合は空であることが判定され、探索は完了する。
ブロックD5において、最終的な最適符号帳としての役割を果たすために、このラウンドの最適符号帳が取得される。
図8は、本発明の第5実施形態による符号帳探索アルゴリズムを表わし、符号帳探索アルゴリズムの上記実施形態に基づく初期基本符号帳を取得するための具体的な方法を提供する。この方法は次のブロックを含む。
ブロックE1において、M個のトラック上のN個のパルスの数量配分が取得される。
すなわち、ビットレートのような関連情報に従って、探索されるパルスの総数Nおよび各トラック上に配分されるパルス数が決定される。
ブロックE2において、各トラック上の既知の基準信号のいつかの極値に従って、各トラックの集中探索範囲が決定され、集中探索範囲はトラック上の少なくとも1つの位置を含む。
基準信号はパルス位置最大尤度関数b(i)を採用し、全てのパルス位置においてb(i)の異なる値を計算し、それぞれ、各トラックの集中探索範囲として各トラック上のb(i)の最大値を有するいくつかの位置を選択する。各トラックの集中探索範囲に含まれる位置の数は同一または異なりうる。
例えば、全部でM=4個のトラック、すなわち、T0,T1,T2,T3が与えられ、表1に表わされているように各トラック上の位置が区分され、b(i)の絶対値に従って各トラック上のパルス位置が降順に再配置される。再配置されたトラック位置は、
{T0,T1,T2,T3}=

{0, 36, 32, 4, 40, 28, 16, 8, 20, 52, 44, 48, 12, 56, 24, 60},
{1, 33, 37, 5, 29, 41, 17, 9, 49, 21, 53, 25, 13, 45, 57, 61},
{34, 2, 38, 30, 6, 18, 42, 50, 26, 14, 10, 22, 54, 46, 58, 62},
{35, 3, 31, 39, 7, 19, 27, 51, 15, 43, 55, 47, 23, 11, 59, 63}
と仮定する。
そのため、トラックの集中探索範囲として各トラック上のb(i)の最大の絶対値を有する4個の位置が選択されるならば、基本符号帳の集中探索位置は次の通りである。

{0, 36, 32, 4},
{1, 33, 37, 5},
{34, 2, 38, 30},
{35, 3, 31, 39}
ブロックE3において、N個のパルスの数量配分に従って、M個の集中探索範囲において全ての探索が実行され、設定された評価基準に従って全ての可能な位置の組み合わせから基本符号帳が選択される。
集中探索範囲は一般にたいへん小さいので、最適な基本符号帳を取得するために全ての探索を実行することができる。例えば、基本符号帳が全部でN=4個のパルス、すなわち、P0,P1,P2,P3を有し、それぞれ、M=4個のトラック、すなわち、T0,T1,T2,T3上に存在し、各トラック上で1個のパルスが選択されると仮定する。ブロックE2において与えられる探索範囲に関して、全部で4×4×4×4=256回の探索の後、基本符号帳を取得することができる。
ブロックE4において、このラウンドの最適符号帳を取得するために基本符号帳に基づいて最初のラウンドにおいてK回の探索処理が実行される。
このブロックは、符号帳探索アルゴリズムの第1実施形態におけるブロックA2からA4、または、符号帳探索アルゴリズムの第2実施形態におけるブロックB2からB4に従って実行することができる。
符号帳探索アルゴリズムの上記実施形態をより良く理解するために、以下で計算例を説明する。
例えば、それぞれM=4個のトラック、すなわち、T0,T1,T2,T3上に配置された全部でN=4個のパルス、すなわち、P0,P1,P2,P3が与えられ、各トラック上で1個のパルスが探索される。表1に表わされているように、各トラック上の位置が区分され、探索処理は次のブロックを含む。
1) 符号帳探索アルゴリズムの第5実施形態に従って初期基本符号帳を計算するための方法において、各トラック上に4個の位置、例えば、{32, 33, 2, 35}を含む集中探索範囲から初期基本符号帳を取得するために全ての探索が実行され、必要な探索回数は4×4×4×4=256である。
2) 最初のラウンドの探索が実行される。n=n0=2と決定され、符号帳探索アルゴリズムの第2実施形態におけるように探索パルスの全ての組み合わせを移動することによってK=6回の探索が実行される。1個のトラック上の4個の位置およびその他の12個の位置の中で各探索が実行される(このカウントされた位置の数は基本符号帳におけるパルス位置を既に含み、基本符号帳の集中探索範囲の決定と同じように、トラック上で探索される位置が選択される)。最初のラウンドの探索において取得された最適符号帳が{32, 33, 6, 35}であり、これは固定されたパルスがP0,P1であるとき取得されたと仮定する。必要な探索回数は6×(4×12)=288である。
3) 2番目のラウンドの探索が実行される。n=n0=2と決定され、P2,P3の位置{6, 35}は固定され、P0,P1の組み合わせについてK=1回の探索が実行される。探索は、それぞれ、T0,T1上の4個の位置の中で実行される。2番目のラウンドの探索において取得された最適符号帳が{32, 33, 6, 35}であると仮定され、必要な探索回数は4×4=16である。
4) 探索パルスのN集合が空である、すなわち、基本符号帳においてパルスの全ての位置が探索されたと判定される。最終的な最適符号帳は{32, 33, 6, 35}である。必要な探索回数は全部で256+288+16=560である。
上記計算例において与えられた方法は、24人の男性のシーケンスおよび24人の女性のシーケンスによって構成されるテストシーケンスについて音声符号化を実行するために適用された。符号化の結果は、目標の音声品質に関して既存の深さ優先ツリー探索手順の符号化の結果と比較され、2つの方法によって得られた音声品質は等価であった。しかし、上記方法において必要な探索回数は560であり、これは深さ優先ツリー探索手順において必要な探索回数768よりずっと小さい。
本発明の符号帳探索アルゴリズムの実施形態において、最適符号帳を選択するために異なるパルスの組み合わせについて置換および探索の方法が実行され、複数のパルスについて少なくとも1つの探索が実行されることが、符号帳探索アルゴリズムの上記実施形態から分かる。異なるパルスの組み合わせから置換によって最適符号帳が選択されるので、探索の大域的な感度を最大に保証して探索回数が減少する。さらに、複数のパルスについて少なくとも1つの探索が実行されるので、探索結果についてのパルス間の関連の影響が考慮され、従って、さらに探索結果の品質を保証する。値nが固定され、1ラウンドの探索において探索パルスの異なる組み合わせが順次選択される方法が採用されるならば、探索パルスの選択は最適化され、探索処理はより効果的になる。さらに、探索パルスの全ての可能な組み合わせを移動するならば、探索結果の大域的な感度は高められ、探索結果の品質は向上する。最終的な最適符号帳を取得するために複数のラウンドの探索方法が採用されるならば、探索結果の品質は向上する。もちろん、符号帳探索アルゴリズムの第1または第2実施形態において提供される探索方法は1ラウンドの探索にのみ適用され、前または後のラウンドにおいて他の探索方法が使用される。最終的な最適符号帳を取得するために複数のラウンドの探索方法が採用されるとき、前のラウンドの探索結果に従ってN集合の範囲が減少し、計算量を効果的に減少させる。最初の基本符号帳を取得するために集中探索方法が採用されるならば、高い品質の基本符号帳が取得され、探索結果の品質はさらに高められる。
本発明の実施形態において提供される符号化方法および符号化器の適用の効果を評価するために、分類された符号化器について実験が行われた。符号化器は信号を無声、一般、有声、過渡のタイプに分類するが、入力信号の全てのタイプは探索のために単一の固定された符号帳探索アルゴリズムを採用する。実験において、本発明の方法は、無声フレームを処理するためにランダム符号帳探索アルゴリズムを採用し、一般フレームを処理するために深さ優先探索アルゴリズムを採用し、有声フレーム/過渡フレームを処理するために本発明の符号帳探索アルゴリズムの計算において提供される方法を採用する。実験は、異なるサンプリングレートの下で異なる音声サンプルの処理結果を比較することによって次のように結論した。
1) 本発明の実施形態の符号化方法における重み付けされセグメントから構成された信号対雑音比パラメータは、元の符号化器における方法より、平均で約0.0245高い。
2) 本発明の実施形態における符号化方法のアルゴリズムの計算量はMOPS(million operations per second)によって測定され、これは元の符号化器における方法より、平均で約0.3185MOPS小さい。
3) 本発明の実施形態における符号化方法のPESQ(perceptual evaluation of speech quality)は、元の符号化器における方法より約0.03%、すなわち、0.00127MOS(mean opinion score)小さく、これはほとんど無視されうる。
上記によれば、元の符号化器における方法と比較すると、本発明の実施形態の符号化方法は、より少ない計算量およびより良いシステム性能を有する点で効果的である。
この技術分野の当業者は、本発明の実施形態による方法の全てまたは一部のブロックがプログラム命令の下でハードウェアによって実現されうることを理解すべきである。次のブロック、入力信号の特性パラメータを取得する過程、特性パラメータに従って、入力信号のタイプを判定する過程、特性パラメータに従って、量子化されるベクトルを取得する過程、入力信号の判定されたタイプに対応する符号帳探索アルゴリズムを用いて、量子化されるベクトルについて符号帳探索を実行する過程、においてプログラムが実行される。プログラムは、ROM、RAM、磁気ディスク、光ディスクのようなコンピュータ読み取り可能な記憶媒体に記憶されうる。
上記によれば、本発明の符号化方法および符号化器が詳細に説明された。本発明の原理および実現が具体的な実施形態を用いて説明され、これらの実施形態は単に本発明の方法および思想を説明することを意図する。この技術分野の当業者は本発明の範囲から逸脱することなく本発明の実現および適用範囲に修正および変更を行うことができる。
101 ・・・ 特性パラメータ取得部
102 ・・・ 信号タイプ判定部
103 ・・・ ベクトル生成部
104 ・・・ 符号帳探索部
105 ・・・ 決定部

Claims (12)

  1. 入力信号の特性パラメータを取得する過程と、
    前記特性パラメータに従って、前記入力信号のタイプを判定する過程と、を有し、前記入力信号のタイプは周期的特性および白色雑音特性を含み、
    前記特性パラメータに従って、量子化されるベクトルを取得する過程と、
    前記入力信号のタイプが周期的特性であるとき第1類符号帳探索アルゴリズムを用いて、前記量子化されるベクトルについて符号帳探索を実行し、前記入力信号のタイプが白色雑音特性であるとき第2類符号帳探索アルゴリズムを用いて、前記量子化されるベクトルについて符号帳探索を実行する過程と、をさらに有し、前記第1類符号帳探索アルゴリズムの計算量は前記第2類符号帳探索アルゴリズムの計算量より少ない符号化方法。
  2. 前記白色雑音特性のタイプを有する入力信号は、一般フレームおよび無声フレームのうち少なくとも1つを含み、
    前記一般フレームまたは前記無声フレームによって使用される符号帳探索アルゴリズムは、深さ優先ツリー探索アルゴリズムである請求項1に記載の符号化方法。
  3. 前記周期的特性のタイプを有する入力信号は、有声フレームおよび過渡フレームのうち少なくとも1つを含み、
    前記有声フレームまたは前記過渡フレームによって使用される符号帳探索アルゴリズムは、パルス位置置換に基づく符号帳探索アルゴリズムである請求項1または2に記載の符号化方法。
  4. 前記パルス位置置換に基づく符号帳探索アルゴリズムは、
    M個のトラック上のN個のパルスの位置情報を含む基本符号帳を取得する過程を有し、NおよびMは正の整数であり、
    探索パルスとしてn個のパルスを選択し、探索符号帳を取得するために、前記n個の探索パルスの位置情報を、それぞれ前記トラック上の他の位置情報と置換する過程をさらに有し、前記n個のパルスは前記N個のパルスの一部であり、nはNより小さい正の整数であり、
    K回の探索処理を実行する過程をさらに有し、Kは2以上の正の整数であり、K回の探索処理のうち1つにおいて少なくとも2個以上の探索パルスが選択され、前記K回の探索処理の各々において選択される探索パルスは異なり、
    予め設定された基準に従って前記基本符号帳および前記探索符号帳から最適符号帳を取得する過程をさらに有する請求項3に記載の符号化方法。
  5. 前記探索パルスとしてn個のパルスを選択する過程は、
    前記探索パルスとしてN個のパルスからn個のパルスを選択する過程を有し、前記N個のパルスは前記N個のパルスの全部または一部であり、NはN以下の正の整数であり、nはNより小さい正の整数であり、
    前記基本符号帳において前記n個の探索パルス以外のパルスの位置を固定する過程をさらに有する請求項4に記載の符号化方法。
  6. 前記探索パルスとしてN個のパルスからn個のパルスを選択する過程は、
    2以上である値nを決定し、各探索処理において順次またはランダムに、重複のない全ての
    Figure 0005532304
    個の可能な組み合わせのうち1つを選択する過程を有し、
    Figure 0005532304
    である請求項5に記載の符号化方法。
  7. 新たな基本符号帳として元の基本符号帳を前記最適符号帳と置換し、新たなN個のパルスとしての役割を果たすために、前記最適符号帳において固定された位置のパルスであって元のN個のパルスに属すパルスを取得し、次のラウンドの最適符号帳の探索を継続する過程と、
    探索のラウンド番号Gが上限に到達するまで、前記元の基本符号帳を前記最適符号帳と置換する処理を繰り返す過程と、
    をさらに有する請求項5に記載の符号化方法。
  8. 前記基本符号帳を取得する過程は、
    M個のトラックの各々に配分されるパルス数を取得する過程を有し、前記M個のトラック上にN個のパルスが存在し、
    各トラック上の既知の基準信号のうちいくつかの極値に従って各トラックの集中探索範囲を決定する過程をさらに有し、前記集中探索範囲は前記トラック上の少なくとも1つの位置を含み、
    前記M個のトラックの各々に配分されるパルス数に従ってM個の集中探索範囲において全ての探索を実行し、前記設定された評価基準に従って全ての位置の組み合わせから前記基本符号帳を選択する過程をさらに有する請求項5に記載の符号化方法。
  9. 入力信号の特性パラメータを取得する特性パラメータ取得部と、
    前記特性パラメータに従って、前記入力信号のタイプを判定する信号タイプ判定部と、を備え、前記入力信号のタイプは周期的特性および白色雑音特性を含み、
    前記特性パラメータに従って、量子化されるベクトルを生成するベクトル生成部と、
    第1類符号帳探索部および第2類符号帳探索部と、をさらに備え、各符号帳探索部は異なる符号帳探索アルゴリズムを提供し、前記第1類符号帳探索部によって提供される符号帳探索アルゴリズムの計算量は前記第2類符号帳探索部によって提供される符号帳探索アルゴリズムの計算量より少なく、
    前記信号タイプ判定部によって判定された入力信号のタイプに対応する符号帳探索アルゴリズムを用いて、前記量子化されるベクトルについて符号帳探索を実行する決定部をさらに備え、前記決定部は前記周期的特性を有するタイプによって第1類符号帳探索部を選択し、前記白色雑音特性を有するタイプによって第2類符号帳探索部を選択する符号化器。
  10. 前記信号タイプ判定部によって判定された前記白色雑音特性のタイプを有する入力信号は、一般フレームおよび無声フレームのうち少なくとも1つを含み、
    前記第2類符号帳探索部は深さ優先ツリー探索アルゴリズムを提供する深さ優先探索部を備え、
    前記決定部は前記白色雑音特性を有するタイプによって前記第2類符号帳探索部を選択し、前記一般フレームまたは前記無声フレームによって前記深さ優先探索部を選択する請求項9に記載の符号化器。
  11. 前記信号タイプ判定部によって判定された前記周期的特性のタイプを有する入力信号は、有声フレームおよび過渡フレームのうち少なくとも1つを含み、
    前記第1類符号帳探索部はパルス位置置換に基づく符号帳探索アルゴリズムを提供するパルス置換探索部を備え、
    前記決定部は前記周期的特性を有するタイプによって前記第1類符号帳探索部を選択し、前記有声フレームまたは前記過渡フレームによって前記パルス置換探索部を選択する請求項9または10に記載の符号化器。
  12. コンピュータのプロセッサによって実行されるとき、請求項1に記載の方法を前記コンピュータのプロセッサに実行させコンピュータプログラムコードを含むコンピュータ読み取り可能な記憶媒体。
JP2009539594A 2007-11-05 2008-09-16 符号化方法、符号化器、および、コンピュータ読み取り可能な媒体 Active JP5532304B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
CN200710165784A CN100578619C (zh) 2007-11-05 2007-11-05 编码方法和编码器
CN200710165784.3 2007-11-05
PCT/CN2008/072371 WO2009059513A1 (fr) 2007-11-05 2008-09-16 Procédé de codage, codeur et support lisible par ordinateur

Related Child Applications (1)

Application Number Title Priority Date Filing Date
JP2013019667A Division JP2013122612A (ja) 2007-11-05 2013-02-04 符号化方法、符号化器、および、コンピュータ読み取り可能な媒体

Publications (2)

Publication Number Publication Date
JP2010511901A JP2010511901A (ja) 2010-04-15
JP5532304B2 true JP5532304B2 (ja) 2014-06-25

Family

ID=40113736

Family Applications (2)

Application Number Title Priority Date Filing Date
JP2009539594A Active JP5532304B2 (ja) 2007-11-05 2008-09-16 符号化方法、符号化器、および、コンピュータ読み取り可能な媒体
JP2013019667A Pending JP2013122612A (ja) 2007-11-05 2013-02-04 符号化方法、符号化器、および、コンピュータ読み取り可能な媒体

Family Applications After (1)

Application Number Title Priority Date Filing Date
JP2013019667A Pending JP2013122612A (ja) 2007-11-05 2013-02-04 符号化方法、符号化器、および、コンピュータ読み取り可能な媒体

Country Status (7)

Country Link
US (1) US8600739B2 (ja)
EP (1) EP2110808B1 (ja)
JP (2) JP5532304B2 (ja)
KR (1) KR101211922B1 (ja)
CN (1) CN100578619C (ja)
AT (1) ATE533147T1 (ja)
WO (1) WO2009059513A1 (ja)

Families Citing this family (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20070136054A1 (en) * 2005-12-08 2007-06-14 Hyun Woo Kim Apparatus and method of searching for fixed codebook in speech codecs based on CELP
DK2827327T3 (da) 2007-04-29 2020-10-12 Huawei Tech Co Ltd Fremgangsmåde til excitationsimpulskodning
CN100578619C (zh) 2007-11-05 2010-01-06 华为技术有限公司 编码方法和编码器
CN101577551A (zh) 2009-05-27 2009-11-11 华为技术有限公司 一种生成格型矢量量化码书的方法及装置
CN102243876B (zh) * 2010-05-12 2013-08-07 华为技术有限公司 预测残差信号的量化编码方法及装置
CN102299760B (zh) 2010-06-24 2014-03-12 华为技术有限公司 脉冲编解码方法及脉冲编解码器
CN104254886B (zh) * 2011-12-21 2018-08-14 华为技术有限公司 自适应编码浊音语音的基音周期
CN103377653B (zh) * 2012-04-20 2016-03-16 展讯通信(上海)有限公司 语音编码中代数码表的搜索方法及装置,语音编码方法
RU2638734C2 (ru) 2013-10-18 2017-12-15 Фраунхофер-Гезелльшафт Цур Фердерунг Дер Ангевандтен Форшунг Е.Ф. Кодирование спектральных коэффициентов спектра аудиосигнала
FR3013496A1 (fr) * 2013-11-15 2015-05-22 Orange Transition d'un codage/decodage par transformee vers un codage/decodage predictif
FR3024581A1 (fr) * 2014-07-29 2016-02-05 Orange Determination d'un budget de codage d'une trame de transition lpd/fd
CN105355194A (zh) * 2015-10-22 2016-02-24 百度在线网络技术(北京)有限公司 语音合成方法和装置
US10878831B2 (en) 2017-01-12 2020-12-29 Qualcomm Incorporated Characteristic-based speech codebook selection
CN108417206A (zh) * 2018-02-27 2018-08-17 四川云淞源科技有限公司 基于大数据的信息高速处理方法
CN117882095A (zh) * 2021-06-29 2024-04-12 西门子股份公司 方案推荐方法、设备、系统和存储介质
CN117789740B (zh) * 2024-02-23 2024-04-19 腾讯科技(深圳)有限公司 音频数据处理方法、装置、介质、设备及程序产品

Family Cites Families (38)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5202953A (en) 1987-04-08 1993-04-13 Nec Corporation Multi-pulse type coding system with correlation calculation by backward-filtering operation for multi-pulse searching
CA2010830C (en) 1990-02-23 1996-06-25 Jean-Pierre Adoul Dynamic codebook for efficient speech coding based on algebraic codes
US5754976A (en) 1990-02-23 1998-05-19 Universite De Sherbrooke Algebraic codebook with signal-selected pulse amplitude/position combinations for fast coding of speech
US5701392A (en) 1990-02-23 1997-12-23 Universite De Sherbrooke Depth-first algebraic-codebook search for fast coding of speech
EP0755047B1 (en) * 1990-11-02 2002-04-10 Nec Corporation Speech parameter encoding method capable of transmitting a spectrum parameter at a reduced number of bits
US5187745A (en) 1991-06-27 1993-02-16 Motorola, Inc. Efficient codebook search for CELP vocoders
CA2141181A1 (en) 1994-09-21 1996-03-22 Kimberly-Clark Worldwide, Inc. Wet-resilient webs
JPH08179796A (ja) 1994-12-21 1996-07-12 Sony Corp 音声符号化方法
US5822724A (en) 1995-06-14 1998-10-13 Nahumi; Dror Optimized pulse location in codebook searching techniques for speech processing
US6393391B1 (en) 1998-04-15 2002-05-21 Nec Corporation Speech coder for high quality at low bit rates
JP3144284B2 (ja) * 1995-11-27 2001-03-12 日本電気株式会社 音声符号化装置
JP3299099B2 (ja) * 1995-12-26 2002-07-08 日本電気株式会社 音声符号化装置
JP3531342B2 (ja) * 1996-03-29 2004-05-31 ソニー株式会社 音声処理装置および音声処理方法
US6480822B2 (en) 1998-08-24 2002-11-12 Conexant Systems, Inc. Low complexity random codebook structure
JP3180786B2 (ja) 1998-11-27 2001-06-25 日本電気株式会社 音声符号化方法及び音声符号化装置
JP4173940B2 (ja) * 1999-03-05 2008-10-29 松下電器産業株式会社 音声符号化装置及び音声符号化方法
EP1221694B1 (en) 1999-09-14 2006-07-19 Fujitsu Limited Voice encoder/decoder
US6510407B1 (en) 1999-10-19 2003-01-21 Atmel Corporation Method and apparatus for variable rate coding of speech
CA2327041A1 (en) 2000-11-22 2002-05-22 Voiceage Corporation A method for indexing pulse positions and signs in algebraic codebooks for efficient coding of wideband signals
US7065338B2 (en) * 2000-11-27 2006-06-20 Nippon Telegraph And Telephone Corporation Method, device and program for coding and decoding acoustic parameter, and method, device and program for coding and decoding sound
KR100464369B1 (ko) * 2001-05-23 2005-01-03 삼성전자주식회사 음성 부호화 시스템의 여기 코드북 탐색 방법
JP2002349429A (ja) 2001-05-28 2002-12-04 Toyota Industries Corp 可変容量型圧縮機及びその製造方法
DE10140507A1 (de) 2001-08-17 2003-02-27 Philips Corp Intellectual Pty Verfahren für die algebraische Codebook-Suche eines Sprachsignalkodierers
KR100446630B1 (ko) * 2002-05-08 2004-09-04 삼성전자주식회사 음성신호에 대한 벡터 양자화 및 역 벡터 양자화 장치와그 방법
US7363218B2 (en) 2002-10-25 2008-04-22 Dilithium Networks Pty. Ltd. Method and apparatus for fast CELP parameter mapping
KR100463559B1 (ko) 2002-11-11 2004-12-29 한국전자통신연구원 대수 코드북을 이용하는 켈프 보코더의 코드북 검색방법
KR100463418B1 (ko) * 2002-11-11 2004-12-23 한국전자통신연구원 Celp 음성 부호화기에서 사용되는 가변적인 고정코드북 검색방법 및 장치
KR100463419B1 (ko) 2002-11-11 2004-12-23 한국전자통신연구원 적은 복잡도를 가진 고정 코드북 검색방법 및 장치
US7249014B2 (en) 2003-03-13 2007-07-24 Intel Corporation Apparatus, methods and articles incorporating a fast algebraic codebook search technique
KR100556831B1 (ko) 2003-03-25 2006-03-10 한국전자통신연구원 전역 펄스 교체를 통한 고정 코드북 검색 방법
CN1240050C (zh) 2003-12-03 2006-02-01 北京首信股份有限公司 一种用于语音编码的固定码本快速搜索方法
CN1760905A (zh) 2004-10-16 2006-04-19 鸿富锦精密工业(深圳)有限公司 电子竞标系统及方法
CN100416652C (zh) 2005-10-31 2008-09-03 连展科技(天津)有限公司 增强的amr编码器快速固定码本搜索方法
CN100498934C (zh) * 2005-10-31 2009-06-10 连展科技(天津)有限公司 一种新型的快速固定码本搜索方法
KR100795727B1 (ko) 2005-12-08 2008-01-21 한국전자통신연구원 Celp기반의 음성 코더에서 고정 코드북 검색 장치 및방법
US20070136054A1 (en) * 2005-12-08 2007-06-14 Hyun Woo Kim Apparatus and method of searching for fixed codebook in speech codecs based on CELP
CN100578619C (zh) 2007-11-05 2010-01-06 华为技术有限公司 编码方法和编码器
JP5242231B2 (ja) 2008-04-24 2013-07-24 三菱電機株式会社 電位生成回路および液晶表示装置

Also Published As

Publication number Publication date
ATE533147T1 (de) 2011-11-15
KR20090086102A (ko) 2009-08-10
US8600739B2 (en) 2013-12-03
JP2013122612A (ja) 2013-06-20
EP2110808B1 (en) 2011-11-09
US20090248406A1 (en) 2009-10-01
KR101211922B1 (ko) 2012-12-13
CN101303857A (zh) 2008-11-12
EP2110808A1 (en) 2009-10-21
CN100578619C (zh) 2010-01-06
JP2010511901A (ja) 2010-04-15
WO2009059513A1 (fr) 2009-05-14
EP2110808A4 (en) 2010-01-13

Similar Documents

Publication Publication Date Title
JP5532304B2 (ja) 符号化方法、符号化器、および、コンピュータ読み取り可能な媒体
KR101406113B1 (ko) 스피치 신호에서 천이 프레임을 코딩하기 위한 방법 및 장치
KR100795727B1 (ko) Celp기반의 음성 코더에서 고정 코드북 검색 장치 및방법
AU2015258241B2 (en) Apparatus and method for selecting one of a first encoding algorithm and a second encoding algorithm using harmonics reduction
CN106463134B (zh) 用于对线性预测系数进行量化的方法和装置及用于反量化的方法和装置
JP6170172B2 (ja) 符号化モード決定方法及び該装置、オーディオ符号化方法及び該装置、並びにオーディオ復号化方法及び該装置
KR100556831B1 (ko) 전역 펄스 교체를 통한 고정 코드북 검색 방법
KR20100006492A (ko) 부호화 방식 결정 방법 및 장치
Ebner et al. Audio inpainting with generative adversarial network
CN107077857B (zh) 对线性预测系数量化的方法和装置及解量化的方法和装置
JP4063911B2 (ja) 音声符号化装置
CN1271925A (zh) 用于码激励线性预测语音编码的整形的固定码簿搜索
US7908136B2 (en) Fixed codebook search method and searcher
JP3471889B2 (ja) 音声符号化方法及び装置
KR101728047B1 (ko) 부호화 방식 결정 방법 및 장치
JP2004309686A (ja) 広帯域音声符号化方法及び広帯域音声符号化装置
JPH09134196A (ja) 音声符号化装置
US8050913B2 (en) Method and apparatus for implementing fixed codebooks of speech codecs as common module
Andrews et al. Algorithm compatible improvements for FS-1016 CELP
CN113826161A (zh) 用于检测待编解码的声音信号中的起音以及对检测到的起音进行编解码的方法和设备
KR20170044623A (ko) 부호화 방식 결정 방법 및 장치
JPH06209262A (ja) 駆動音源コードブックの設計法
Farsi A Pre-processing Method to Modify Irregular Pitch Variations for Quality Enhancement of Synthesised Speech
KR20150053891A (ko) 부호화 방식 결정 방법 및 장치
KR20110113123A (ko) 오디오 신호 처리 방법 및 장치

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20111024

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20111108

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20120208

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20120215

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20120302

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20121002

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20130204

A911 Transfer to examiner for re-examination before appeal (zenchi)

Free format text: JAPANESE INTERMEDIATE CODE: A911

Effective date: 20130213

A912 Re-examination (zenchi) completed and case transferred to appeal board

Free format text: JAPANESE INTERMEDIATE CODE: A912

Effective date: 20130502

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20140409

R150 Certificate of patent or registration of utility model

Ref document number: 5532304

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250