JPH0830300A - 音声符号化装置 - Google Patents

音声符号化装置

Info

Publication number
JPH0830300A
JPH0830300A JP6261279A JP26127994A JPH0830300A JP H0830300 A JPH0830300 A JP H0830300A JP 6261279 A JP6261279 A JP 6261279A JP 26127994 A JP26127994 A JP 26127994A JP H0830300 A JPH0830300 A JP H0830300A
Authority
JP
Japan
Prior art keywords
pitch
pitch period
candidates
subset
cycle
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP6261279A
Other languages
English (en)
Inventor
Kimio Miseki
公生 三関
Takehiko Kagoshima
岳彦 籠嶋
Ko Amada
皇 天田
Masahiro Oshikiri
正浩 押切
Masami Akamine
政巳 赤嶺
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Toshiba Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp filed Critical Toshiba Corp
Priority to JP6261279A priority Critical patent/JPH0830300A/ja
Publication of JPH0830300A publication Critical patent/JPH0830300A/ja
Pending legal-status Critical Current

Links

Abstract

(57)【要約】 【目的】ピッチ周期の選択に要する計算量を効率的に削
減できる音声符号化装置を提供する。 【構成】N個のピッチ周期候補の集合から選択された長
ピッチ周期のM個のピッチ周期候補(M<N)で構成さ
れる第1の部分集合を基にピッチ周期の評価を行い、そ
の評価結果に基づいて該第1の部分の集合から長ピッチ
周期のL個のピッチ周期候補(1≦L<<M)で構成さ
れる第2の部分集合を得る長ピッチ選択部10と、第2
の部分集合の中のピッチ周期候補を1/n(nは2以上
の自然数)倍した値に基づいて指定された短ピッチ周期
のピッチ周期候補を第3の部分集合として構成する短ピ
ッチ周期指定部20と、第2および第3の部分集合から
符号化パラメータとなるピッチ周期を選択するピッチ周
期選択部30を有する。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は音声を少ない情報量で高
能率に符号化する低ビットレート音声符号化装置に関す
る。
【0002】
【従来の技術】低ビットレートで音声を高能率に符号化
することが出来る方法として、CELP(Code Excited
Linear Prediction)方式が知られている。CELP方
式の詳細は、例えば「M.R.Schroeder and Atal,"Code-E
xcited Linear Prediction (CELP):high quality speec
h at very low bit rates",in Proc. ICASSP'85, pp.93
7-939,1985」に示されている。
【0003】CELP方式に代表される音声符号化で
は、ピッチ予測(または適応コードブック)と雑音コー
ドブックを用いたベクトル量子化により、駆動信号のピ
ッチ成分の形状と雑音成分の形状をそれぞれ表現し、こ
れにより得られた駆動信号を合成フィルタに通過させる
ことによって合成音声を生成する。また、合成音声を高
品質なものにするために、駆動信号の符号化では合成音
声の歪を最小化することを指標に、ピッチ予測(または
適応コードブック)に用いるピッチ周期の選択・符号化
および雑音コードブックからの雑音コードの選択を行う
方法を採用している。このため、従来のCELP方式は
低ビットレートでも高品質の合成音声を提供できるが、
ピッチ周期と雑音コードの探索に多くの計算量を要する
ため、安価で実時間動作する音声符号化装置を実現する
ためには、計算量の削減が必須となっている。
【0004】従来のCELP方式では、上で述べた最適
なピッチ周期と雑音コードの選択処理が合成音声の品質
を決定づけるポイントであることはよく知られている。
また、音声符号化装置全体の中でピッチ周期の選択処理
に要する計算量の比重が非常に大きいことも、当該技術
者の間で周知である。
【0005】ピッチ周期の選択処理に関しては、入力さ
れる音声の区間や種類によっては次にどのような長さの
ピッチ周期が来るかある程度予測できる音声もあるが、
電話などで入力される実音声では通常どの程度の長さの
ピッチ周期が来るか予測できない場合が多いため、従来
法では設定する全ての範囲のピッチ周期をカバーするよ
うなピッチ周期候補に対してピッチ周期の探索が行われ
る。通常、8kHzサンプリングで入力した音声データ
に対しては、最も短いピッチ周期の値は16程度、最も
長いピッチ周期の値は140程度である。もし、16か
ら140までの整数ピッチ周期候補だけを全探索すると
仮定しても、140−16+1=125個のピッチ周期
候補に対して何らかの評価値を計算する必要がある。通
常、この評価値の計算には、自己相関値や相互相関値、
またはブロック毎にピッチ周期の符号化を行う場合はブ
ロック長の次元を持つベクトルの内積値などの比較的計
算量の多い処理を伴う。
【0006】
【発明が解決しようとする課題】上述したように、従来
法では長短を含めた全ピッチ周期の範囲をカバーするよ
うなピッチ周期候補に対してピッチ周期の評価を行って
いたため、ピッチ周期の選択に要する計算量を効率的に
削減することが難しく、結果的に、安価で実時間動作す
る音声符号化装置の実現を困難なものとしているという
問題があった。
【0007】本発明は、ピッチ周期の選択処理に要する
計算量を効率的に削減できる音声符号化装置を提供する
ことを目的とする。
【0008】
【課題を解決するための手段】上述した目的を達成する
ため、本発明は長ピッチ周期のピッチ周期候補を少数に
絞って選択した後、選択した長ピッチ周期のピッチ周期
候補を1/n倍した値を基に短ピッチ周期のピッチ周期
候補を指定し、これら長ピッチ周期および短ピッチ周期
のピッチ周期候補から、音声の符号化パラメータとなる
ピッチ周期を選択することを骨子とする。
【0009】すなわち、本発明はN個のピッチ周期候補
の集合から選択されたピッチ周期を符号化パラメータと
して音声を符号化する音声符号化装置において、(a) N
個のピッチ周期候補の集合から選択された長ピッチ周期
のM個のピッチ周期候補(M<N)で構成される第1の
部分集合を基にピッチ周期の評価を行い、その評価結果
に基づいて第1の部分集合から長ピッチ周期のL個のピ
ッチ周期候補(1≦L<<M)で構成される第2の部分
集合を得る第1の手段と、(b) 第2の部分集合の中のピ
ッチ周期候補を1/n倍した値(nは2以上の自然数)
に基づいて指定される短ピッチ周期のピッチ周期候補を
第3の部分集合として構成する第2の手段と、(c) 第2
および第3の部分集合から符号化パラメータとなるピッ
チ周期を選択する第3の手段とを備えることを特徴とす
る。
【0010】N個のピッチ周期候補の集合は、予め定め
られた方法で設定される。また、第1の部分集合に基づ
くピッチ周期の評価は、例えば自己相関のピーク探索
法、適応コードブック探索法、または公知の予備選択法
を用いて行うことができる。
【0011】また、本発明はこのような構成の音声符号
化装置において、第1の部分集合を構成するM個のピッ
チ周期候補のピッチ周期の最大値がTmaxのとき、該
M個のピッチ周期候補のピッチ周期の最小値がほぼTm
ax/2となるように第1の部分集合を構成することを
特徴とする。
【0012】さらに、本発明はN個のピッチ周期候補の
集合から選択されたピッチ周期を符号化パラメータとし
て音声を符号化する音声符号化装置において、(a) N個
のピッチ終期候補の集合から間引いて選択された長ピッ
チ周期のM個のピッチ周期候補(M<N)で構成される
第1の部分集合を基にピッチ周期の評価を行い、その評
価結果に基づいて該第1の部分集合からL個のピッチ周
期候補(1≦L<<M)で構成される第2の部分集合を
得る第1の手段と、(b) 第2の部分集合の中のピッチ周
期候補および該ピッチ周期候補を1/m倍した値(mは
自然数)とこれらの近傍のピッチ周期候補を第3の部分
集合として構成する第2の手段と、(c) 第3の部分集合
から符号化パラメータとなるピッチ周期を選択する第3
の手段とを備えることを特徴とする。
【0013】
【作用】このように本発明では、N個のピッチ周期候補
のうち第1の部分集合を構成する長ピッチ周期のM個の
ピッチ周期候補を第1の部分集合についてのピッチ周期
の評価結果に基づいてL個に絞り、これを第2の部分集
合とする。
【0014】次に、第2の部分集合を構成する長ピッチ
周期のピッチ周期候補を1/n倍した値を基に、短ピッ
チ周期のピッチ周期候補を指定して第3の部分集合を構
成する。具体的には、例えば第2の部分集合の中のピッ
チ周期候補を1/n倍した値に近いピッチ周期候補を短
ピッチ周期のピッチ周期候補としてN個のピッチ周期候
補から選択して第3の部分集合を構成する。第2の部分
集合として選択された長ピッチ周期のピッチ周期候補が
短ピッチ周期のピッチ周期候補のピッチ周期のn倍であ
る可能性が高いため、このような方法で短ピッチ周期の
ピッチ周期候補を簡単に指定することができる。
【0015】ここで、L<<Mであるから、第2の部分
集合と第3の部分集合に含まれるピッチ周期候補の総数
はNより遥かに少ない。そこで、これら第2の部分集合
および第3の部分集合から、音声の符号化パラメータと
なるピッチ周期を選択することにより、少ない計算量に
もかかわらず高品質の音声を合成することが可能な音声
符号化を行うことができる。
【0016】また、第1の部分集合を構成するM個のピ
ッチ周期候補のピッチ周期の最大値がTmaxのとき、
該M個のピッチ周期候補のピッチ周期の最小値をTma
x/2程度の値となるようにすれば、Tmax/2以下
の全てのピッチ周期のn倍のピッチ周期を第2の部分集
合として選択することができる。これにより、ピッチ周
期を選択する際の探索対象のピッチ周期候補の個数を減
少させたことによるピッチ周期の探索漏れが最小限に抑
えられる。
【0017】さらに、長ピッチ周期のピッチ周期候補の
全てを第1の部分集合とするのではなく、長ピッチ周期
のピッチ周期候補を例えば一つおきに間引いて第1の部
分集合の要素とすれば、第1の部分集合の要素数Mがよ
り小さくなり、計算量はさらに減少する。この場合、第
3の部分集合として第2の部分集合の中のピッチ周期候
補およびこれを1/m倍(mは自然数)した値とこれら
の近傍のピッチ周期候補を用いることによって、第1の
部分集合を選択する際に間引かれた長ピッチ周期のピッ
チ周期候補も第3の部分集合の要素として選ばれ得るた
め、ピッチ周期の探索漏れは抑えられる。
【0018】
【実施例】以下、図面を参照して本発明の実施例を説明
する。
【0019】図1は、本発明による音声符号化装置にお
けるピッチ周期探索手順を説明するための図である。同
図に示されるように、まず所定の方法で定められたN個
のピッチ周期候補の集合から、ピッチ周期の長い方のピ
ッチ周期(長ピッチ周期)のM個のピッチ周期候補で構
成される第1の部分集合を選択して長ピッチ周期選択部
10に入力する。この長ピッチ周期選択部10では、第
1の部分集合の中のピッチ周期候補を基にピッチ周期の
評価を行い、その評価結果に基づいて第1の部分集合か
らさらにL個の長ピッチ周期のピッチ周期候補を絞り込
んで選択し、これを第2の部分集合とする。
【0020】次に、長ピッチ周期選択部10で選択され
たピッチ周期候補を短ピッチ周期指定部20に入力す
る。この短ピッチ周期指定部20では、第2の部分集合
を構成する長ピッチ周期のL個のピッチ周期候補を1/
n倍した値を基に、比較的短いピッチ周期(短ピッチ周
期)のピッチ周期候補を指定し、これを第3の部分集合
として構成する。このようにして、短ピッチ周期指定部
20で簡単に短ピッチ周期のピッチ周期候補を指定でき
るのは、長ピッチ周期選択部10で選択されたL個の長
ピッチ周期のピッチ周期候補(例えばピッチ周期が10
0の候補)が、短ピッチ周期のピッチ周期候補(例え
ば、ピッチ周期が50または33.3または25または
20の候補)のn倍のピッチ周期(nは2以上の自然
数)を持つ可能性を有するからである。
【0021】そして、長ピッチ周期選択部10と短ピッ
チ周期指定部20により得られる少ないピッチ周期のピ
ッチ周期候補をピッチ周期選択部30に入力し、符号化
パラメータとして用いるピッチ周期を選択する。このよ
うにすることにより、少数のピッチ周期候補からピッチ
周期を選択することで計算量が大幅に削減されるにもか
かわらず、高品質な合成音声を生成することのできるピ
ッチ周期を選択することが可能となる。
【0022】次に、上述したピッチ周期探索法を用いた
音声符号化装置の実施例について説明する。
【0023】図2は、本発明の第1の実施例に係る音声
符号化装置のブロック図である。本実施例は、入力音声
から、合成フィルタ情報、ピッチ周期情報、雑音コード
情報およびゲイン情報の4種類の情報を抽出/符号化す
る構成で、かつ、合成音声の歪が小さくなるようにピッ
チ周期情報、雑音コード情報およびゲイン情報の符号化
を行うCELP方式に代表される音声符号化法による音
声符号化装置に本発明を適用した例を示している。
【0024】この音声符号化装置は、入力音声から少数
の長ピッチ周期のピッチ周期候補を求める長ピッチ周期
選択部110と、長ピッチ周期選択部110で選択され
たピッチ周期候補を入力として短ピッチ周期のピッチ周
期候補を指定する短ピッチ周期指定部120、指定され
た短ピッチ周期を評価して、短ピッチ周期のピッチ周期
候補数を減少させる短ピッチ周期評価部125、雑音コ
ードに対応したコードベクトルを格納した雑音コードブ
ック200、過去の駆動信号を格納し、指定されたピッ
チ周期からコードベクトルを生成する適応コードブック
190、これらのコードブック200,190から得ら
れるコードベクトルを線形結合して駆動信号を生成する
ゲイン回路220、230および加算器240、駆動信
号を入力として合成音声を得る合成フィルタ160、入
力音声から合成フィルタ160のフィルタ情報を分析す
る合成フィルタ情報分析部140、入力音声と合成フィ
ルタ情報から目標ベクトルを生成する目標ベクトル作成
部150、目標ベクトルと合成フィルタ情報を用いて、
合成フィルタ160で得られた合成音声の歪を評価する
歪評価部170、および符号選択部180からなる。な
お、合成フィルタ情報分析部140は、入力音声を分析
して音声のスペクトラムの外形を表す合成フィルタの情
報を抽出・符号化し、これを合成フィルタ情報として出
力するとともに、合成フィルタのパラメータを合成フィ
ルタ160に与える。合成フィルタ情報の分析法として
は、例えばLPC(Linear Prediction Coding)法を用い
ることができる。
【0025】次に、本実施例におけるピッチ周期の選択
手順について述べる。
【0026】入力音声のピッチ周期は、時間軸を分割し
たブロック単位に求める。ピッチ周期を求めるために、
長ピッチ周期選択部110、短ピッチ周期指定部12
0、短ピッチ周期評価部125、適応コードブック19
0を用いた探索ループ270を使用する。
【0027】図3に、ピッチ周期の選択過程を示す。同
図において、集合200は選択前のピッチ周期の全ピッ
チ周期候補の集合を表す。この図では、N個のピッチ周
期候補が周期の長い順に左から右に並べられている。長
ピッチ周期選択部110は、集合200の中から長い方
のM個のピッチ周期候補(第1の部分集合105)につ
いて後で述べるピッチ周期の評価を行い、L個(図3で
は2個)の長ピッチ周期のピッチ周期候補(第2の部分
集合115)を選択する。
【0028】次に、このL個のピッチ周期候補を短ピッ
チ周期指定部120に入力し、少数(図3では4個)の
短ピッチ周期のピッチ周期候補(第3の集合122)を
求める。ここでの短ピッチ周期の指定方法は、例えば、
入力される長ピッチ周期のピッチ周期候補を1/n倍し
た値に近い短ピッチ周期のピッチ周期候補を元のピッチ
周期の集合200から選ぶことにより実現できる。具体
的なnの範囲は、設定されるピッチ周期の範囲に依存し
て決めることができるが、通常nは2〜4程度の値をと
る。
【0029】短ピッチ周期のピッチ周期候補としては、
長ピッチ周期を1/n倍した値に最も近い予め設定され
るピッチ周期の量子化値を用いるか、必要なときはさら
にその近傍の量子化値も用いることが出来る。1個の長
ピッチ周期のピッチ周期候補に対し、その1/n倍の値
に近い近傍の短ピッチ周期のピッチ周期候補を何個まで
指定するかは、予め用意される短ピッチ周期のピッチ周
期候補と長ピッチ周期のピッチ周期候補の解像度を考慮
して決めることが出来る。短ピッチ周期の方が長ピッチ
周期よりも高い解像度を持つように設定されている場合
は、1/n倍に近いピッチ周期候補を複数個指定するこ
とで短ピッチ周期のピッチ周期候補の探索漏れを防ぐこ
とができるという効果がある。
【0030】こうして指定された短ピッチ周期のピッチ
周期候補は、必要に応じてさらに短ピッチ周期選択部1
25で行われるピッチ周期の評価により候補数が絞られ
る。図3では、4個から2個に絞られている。短ピッチ
周期のピッチ周期候補の指定個数を十分少なくできる構
成の場合は、短ピッチ周期選択部125を用いる必要は
ない。
【0031】最後に、以上の選択処理で残った少数個
(図3では4個)のピッチ周期候補に対し、ピッチ周期
選択部132で詳細なピッチ周期の評価を行い、最終的
に符号化パラメータとして用いるピッチ周期(図3では
ピッチ周期候補134)を選択する。
【0032】図2に戻って、ピッチ周期の選択方法につ
いて説明する。長ピッチ周期選択部110は、例えば入
力音声を基に求めた自己相関関数を評価関数として、長
ピッチ周期のピッチ周期候補を選択する。短ピッチ周期
指定部120は、上述した方法で短ピッチ周期のピッチ
周期候補を指定する。指定された短ピッチ周期のピッチ
周期候補は、短ピッチ周期選択部125で行われるピッ
チ周期の評価により候補数を絞られる。ここでの評価
は、例えば入力音声から求められる自己相関関数を基に
行うことができる。
【0033】長ピッチ周期選択部110において、ピッ
チ周期候補の最大値がTmaxのとき、入力となるピッ
チ周期候補の最小値をTmax/2程度の値になるよう
にすることにより、Tmax/2以下の短ピッチ周期の
ピッチ周期候補のn倍ピッチ周期を長ピッチ周期選択部
だけで探索することが出来るようになるため、ピッチ周
期候補を減少させたことによるピッチ周期の探索漏れを
最小限に抑えることができるようになる。
【0034】図2では、上述したピッチ周期選択部13
2の機能を適応コードブック探索によって実現する構成
を示している。適応コードブック探索では、過去の駆動
信号を格納する適応コードブック190を用い、探索ル
ープ270に従って、長ピッチ周期と短ピッチ周期のそ
れぞれのピッチ周期候補の中から、符号化パラメータと
して用いる最終的なピッチ周期を選択する。
【0035】すなわち、適応コードブック190にピッ
チ周期候補を与えて得られるコードベクトルを合成フィ
ルタ160で合成して得られる合成ベクトル候補と、目
標ベクトル作成部150で生成される目標ベクトルとの
歪が小さくなることを評価の基準として、符号選択部1
80で最適なピッチ周期を選択する。具体的な方法とし
ては、実際に合成ベクトル候補と目標ベクトルとの距離
歪を計算する方法もあるが、歪計算の数式の変形により
合成ベクトルと目標ベクトルを用いた内積値やパワー値
を組み合わせることにより、どのようなピッチ周期候補
に対しても固定値となるような値を重複して計算するこ
とを回避して、より少ない計算量で歪の大小を判定する
方法を用いることによって、最適なピッチ周期を選択で
きる。
【0036】適応コードブック190の探索には、ゲイ
ン回路220のゲインを例えば通常のCELP方式で用
いられるような最適ゲインに設定するのと等価なコード
ブック探索法を用いることが出来る。また、このとき雑
音コードブック200からの駆動信号の影響は零である
として、ピッチ周期の探索が行われる。もし、雑音コー
ドの候補数が非常に少ない数に限定できるときは、雑音
コードブック200からの駆動信号の影響を考慮してピ
ッチ周期探索を行うと、さらに歪の少ない合成音声を生
成可能なピッチ周期と雑音コードを探索することが出来
るという効果も期待できる。
【0037】次に、雑音コード探索の方法について説明
する。
【0038】雑音コード探索は、雑音コードブック20
0を含む探索ループ260に関して行われる。まず、符
号選択部180から探索ループ260を用いて雑音コー
ドブック200に雑音コードの候補を与え、雑音コード
に対応するコードベクトルを取り出す。次に、このコー
ドベクトルを合成フィルタ160で合成して得られる合
成ベクトル候補と、目標ベクトル作成部150で生成さ
れる目標ベクトルとの歪が小さくなることを指標とし
て、雑音コードブック200から雑音コードを探索す
る。具体的な方法としては、実際にベクトルの距離歪を
計算する方法もあるが、歪計算の数式の変形により合成
ベクトルと目標ベクトルを用いた内積値やパワー値を組
み合わせることにより、どのような雑音コード候補に対
しても固定値となるような値を重複して計算することを
回避して、より少ない計算量で歪の大小を判定する方法
を用いることによって、最適な雑音コードを選択でき
る。
【0039】雑音コード探索は、ゲイン回路230のゲ
インを例えば公知のCELP方式で用いられるような最
適ゲインに設定するのと等価なコードブック探索法を用
いることが出来る。雑音コードの探索に当たっては、適
応コードブック探索で選択されたコードベクトルと組み
合わせた駆動信号で合成音声を生成することを考慮し
て、トータル的に歪の少ない雑音コードを探索するよう
にする。もし、適応コードブック190から選択された
コードベクトルが雑音コード探索に与える影響が無視で
きるような構成で探索が行えるような歪尺度またはコー
ドブックまたはベクトルの直交化等の方法を用いる場合
は、雑音コードの探索をピッチ周期の探索と独立に行う
ことができる。
【0040】ゲイン情報の符号化は、この実施例ではゲ
イン情報によって特定のゲインを指定することのできる
ゲインコードブック210と、探索ループ250を用い
て行う。ゲイン情報の探索に当たっては、合成音声と入
力音声との歪が少なくなるように探索を行うようにす
る。
【0041】次に、上述した音声符号化装置によって生
成された符号情報から、符号化音声を生成する音声復号
化装置の一実施例について説明する。図4は、音声復号
化装置の一実施例を示すブロック図である。同図では、
図2に示した音声符号化装置で符号化されたパラメータ
であるところの合成フィルタ情報、ピッチ周期情報、雑
音コード情報およびゲイン情報を入力し、これらの情報
から合成音声を生成する構成を示している。
【0042】まず、駆動信号の再生方法について説明す
る。適応コードブック300において、音声符号化装置
から伝送されたピッチ周期情報を基に、過去の駆動信号
から適応コードベクトル305を得る。この適応コード
ベクトル305に対して、音声符号化装置から伝送され
たゲイン情報を基にゲインコードブック320から得ら
れる適応コードベクトル用のゲインを用い、ゲイン回路
340で適切なゲインを乗じて第1のベクトルを作成す
る。
【0043】一方、音声符号化装置から伝送された雑音
コードを基に雑音コードブック310から雑音コードベ
クトル315を取り出し、これにゲインコードブック3
20から得られる雑音コードベクトル用のゲインを用
い、ゲイン回路350で適切なゲインを乗じて第2のベ
クトルを生成する。
【0044】そして、加算器360で第1のベクトルと
第2のベクトルを加算したものを駆動信号として再生す
る。最後に、この駆動信号を音声符号化装置から伝送さ
れた合成フィルタ情報を基に構成される合成フィルタ3
30に入力して音声合成を行い、得られた合成音声を出
力端子390より得る。
【0045】次に、本発明の第2の実施例を説明する。
【0046】図5は、本発明の第2の実施例に係る音声
符号化装置のブロック図である。本実施例は、ピッチ周
期の選択に入力音声から求めた自己相関関数を用いず
に、適応コードブック探索を簡略化した方法で長ピッチ
周期と短ピッチ周期の評価を行う点が第1の実施例と異
なっている。それ以外の部分は、第1の実施例と同様の
構成で実現できるため、ここでは第1の実施例と共通部
分の説明は省略する。
【0047】図5において、長ピッチ周期選択部111
0は適応コードブックからの過去の駆動信号を用いて、
探索する長ピッチ周期に対応する適応コードベクトルと
合成フィルタ情報を基に生成される合成ベクトルと、目
標ベクトル作成部1150からの目標ベクトルに対する
歪量を指標に、長ピッチ周期のピッチ周期候補を選択す
る。歪量の具体的な評価方法としては、合成ベクトルと
目標ベクトルとの内積値に相当する値の大きさを用いる
方法や、この内積値に適応コードベクトル毎のパワーの
逆数を指標に指定される重みを乗じて得られる重み付き
内積値に相当する値の大きさを用いる方法等を使用する
ことができる。特に後者の方法は、計算量的な負担が前
者とあまり変わらない程度で、動的にパワーが変化する
過去の駆動信号を用いて構成される適応コードベクトル
の予備的な選択を効率よく行えるという利点がある。
【0048】短ピッチ周期指定部1120は、第1の実
施例で述べた方法と同様の方法で長ピッチ周期のピッチ
周期候補から短ピッチ周期のピッチ周期候補を指定す
る。指定された短ピッチ周期のピッチ周期候補は、さら
に短ピッチ周期選択部1125で行われるピッチ周期の
評価により候補数を絞られる。ここでのピッチ周期の評
価も重み付き内積値の計算等の方法を用いることができ
る。
【0049】第2の実施例に関しても、長ピッチ周期選
択部1110において、ピッチ周期候補の最大値がTm
axのとき、入力となるピッチ周期候補の最小値をTm
ax/2程度の値になるようにすることにより、Tma
x/2以下の短ピッチ周期のピッチ周期候補のn倍ピッ
チ周期を長ピッチ周期選択部だけで探索することが出来
るようになるため、ピッチ周期候補を減少させたことに
よるピッチ周期の探索漏れを最小限に抑えることができ
るようになる。
【0050】適応コードブック探索は、過去の駆動信号
を格納する適応コードブック1190を用い、探索ルー
プ1270に従って、上述の方法で求めた長ピッチ周期
と短ピッチ周期のそれぞれのピッチ周期候補の中から符
号化に用いる最終的なピッチ周期を選択する。
【0051】次に、本発明による音声符号化装置におけ
る他のピッチ周期探索手順を図6を参照して説明する。
このピッチ周期探索手順は、長ピッチ周期のピッチ周期
候補の全てを第1の部分集合とするのではなく、例えば
長ピッチ周期のピッチ周期候補を一つおきに間引いて第
1の部分集合の要素とし、第3の部分集合としては第2
の部分集合の中のピッチ周期候補およびこれを1/m倍
(mは自然数)した値とこれらの近傍の候補を用いる点
が図1で説明した手順と異なる。
【0052】すなわち、本実施例ではまず所定の方法で
定められたN個のピッチ周期候補の集合から、ピッチ周
期の長い方から一つおきに間引いて得られたM個のピッ
チ周期候補で構成される第1の部分集合を選択して長ピ
ッチ周期選択部610に入力する。この長ピッチ周期選
択部610では、第1の部分集合の中のピッチ周期候補
を基にピッチ周期の評価を行い、その評価結果に基づい
て第1の部分集合からさらにL個の長ピッチ周期のピッ
チ周期候補を絞り込んで選択し、これを第2の部分集合
とする。
【0053】次に、長ピッチ周期選択部610で選択さ
れたピッチ周期候補をピッチ周期指定部620に入力す
る。このピッチ周期指定部620では、第2の部分集合
を構成する長ピッチ周期のL個のピッチ周期候補および
これを1/m倍した値とこれらの近傍のピッチ周期候補
を指定し、これらを第3の部分集合として構成する。こ
の場合、第2の部分集合の要素は必ず第3の部分集合に
含まれる。ここで、m=1の場合は、ピッチ周期指定部
620で第2の部分集合を構成するピッチ周期候補の近
傍のピッチ周期候補が指定され、第1の部分集合を構成
する際に間引かれた長ピッチ周期のピッチ周期候補も第
3の部分集合の要素として選択され得るため、ピッチ周
期の探索漏れは抑えられる。
【0054】そして、ピッチ周期指定部620により得
られる少ないピッチ周期のピッチ周期候補をピッチ周期
選択部630に入力し、符号化パラメータとして用いる
ピッチ周期を選択する。このようにすることにより、第
1の部分集合の要素数Mが減少して、計算量がさらに削
減される。
【0055】図7は、図6のピッチ周期探索法を用いた
本発明の第3の実施例に係る音声符号化装置のブロック
図であり、図2に示した第1の実施例に係る音声符号化
装置とは長ピッチ周期選択部2110、ピッチ周期指定
部2120およびピッチ周期評価部2125の構成が異
なる。これらは図6の長ピッチ周期選択部610、ピッ
チ周期指定部620およびピッチ周期評価部630と同
様の処理を行う。その他の点は、第1の実施例と同様で
あるため、図2と同一部分に同一符号を付して説明を省
略する。
【0056】以上、本発明を音声符号化装置に適用した
実施例について述べたが、本発明によるピッチ周期の選
択方法は、音声合成等で用いられる音声波形の素片編集
に適用することも可能である。音声波形の素片として入
力音声からピッチ周期分の音声信号波形または上述の駆
動信号に相当する予測残差波形を切り出すために、ピッ
チ周期の抽出は必要不可欠な技術である。
【0057】本発明によるピッチ周期の選択方法を用い
ると、このピッチ周期抽出に要する計算量を従来の半分
程度にすることができる。例えば、入力音声を基に自己
相関を計算し、そのピーク値を探索してピーク値を有す
る時間ラグからピッチ周期を抽出する方法においても、
本発明を用いると短ピッチ周期に対応する自己相関値の
計算は、非常に少ない候補数の短ピッチ周期に関してだ
け行えばよいので、全てのピッチ周期候補に対して自己
相関値を計算する従来法に比べ、大幅に計算量を少なく
できるという効果がある。
【0058】また、本発明を用いた自己相関のピーク値
探索法で探索されたピッチ周期に対応する時間遅れの正
規化自己相関値の大きさでピッチ周期性の強弱を判定す
ることが可能であるため、本発明はピッチ周期性の強弱
を判定して音声波形の分類を行うために適用することも
可能である。
【0059】
【発明の効果】以上説明したように、本発明によれば少
ない計算量にもかかわらず高品質な合成音声を生成可能
なピッチ周期を選択でき、結果として安価な構成で実時
間動作が可能な音声符号化装置を提供することができ
る。
【図面の簡単な説明】
【図1】 本発明におけるピッチ周期探索手順を示す模
式図
【図2】 本発明の第1の実施例に係る音声符号化装置
のブロック図
【図3】 同実施例におけるピッチ周期選択過程を示す
模式図
【図4】 本発明の第1の実施例に係る音声復号化装置
のブロック図
【図5】 本発明の第2の実施例に係る音声符号化装置
のブロック図
【図6】 本発明における他のピッチ周期探索手順を示
す模式図
【図7】 本発明の第3の実施例に係る音声符号化装置
のブロック図
【符号の説明】
10…長ピッチ周期選択部 20…短ピッチ周期指定部 30…ピッチ周期選択部 610…長ピッチ周期選択部 620…ピッチ周期指定部 630…ピッチ周期選択部
───────────────────────────────────────────────────── フロントページの続き (72)発明者 押切 正浩 神奈川県川崎市幸区小向東芝町1番地 株 式会社東芝研究開発センター内 (72)発明者 赤嶺 政巳 神奈川県川崎市幸区小向東芝町1番地 株 式会社東芝研究開発センター内

Claims (4)

    【特許請求の範囲】
  1. 【請求項1】N個のピッチ周期候補の集合から選択され
    たピッチ周期を符号化パラメータとして音声を符号化す
    る音声符号化装置において、 前記N個のピッチ周期候補の集合から選択された長ピッ
    チ周期のM個のピッチ周期候補(M<N)で構成される
    第1の部分集合を基にピッチ周期の評価を行い、その評
    価結果に基づいて該第1の部分集合から長ピッチ周期の
    L個のピッチ周期候補(1≦L<<M)で構成される第
    2の部分集合を得る第1の手段と、 前記第2の部分集合の中のピッチ周期候補を1/n倍し
    た値(nは2以上の自然数)に基づいて指定される短ピ
    ッチ周期のピッチ周期候補を第3の部分集合として構成
    する第2の手段と、 前記第2および第3の部分集合から前記符号化パラメー
    タとなるピッチ周期を選択する第3の手段とを備えるこ
    とを特徴とする音声符号化装置。
  2. 【請求項2】前記第1の部分集合は、該第1の部分集合
    を構成する前記M個のピッチ周期候補のピッチ周期の最
    大値がTmaxのとき、該M個のピッチ周期候補のピッ
    チ周期の最小値がほぼTmax/2となるように構成さ
    れることを特徴とする請求項1記載の音声符号化装置。
  3. 【請求項3】前記第2の手段は、前記第2の部分集合の
    中のピッチ周期候補を1/n倍した値に近いピッチ周期
    候補を前記短ピッチ周期のピッチ周期候補として前記N
    個のピッチ周期候補から選択して前記第3の部分集合を
    構成することを特徴とする請求項1に記載の音声符号化
    装置。
  4. 【請求項4】N個のピッチ周期候補の集合から選択され
    たピッチ周期を符号化パラメータとして音声を符号化す
    る音声符号化装置において、 前記N個のピッチ終期候補の集合から間引いて選択され
    た長ピッチ周期のM個のピッチ周期候補(M<N)で構
    成される第1の部分集合を基にピッチ周期の評価を行
    い、その評価結果に基づいて該第1の部分集合からL個
    のピッチ周期候補(1≦L<<M)で構成される第2の
    部分集合を得る第1の手段と、 前記第2の部分集合の中のピッチ周期候補および該ピッ
    チ周期候補を1/m倍した値(mは自然数)とこれらの
    近傍のピッチ周期候補を第3の部分集合として構成する
    第2の手段と、 前記第3の部分集合から前記符号化パラメータとなるピ
    ッチ周期を選択する第3の手段とを備えることを特徴と
    する音声符号化装置。
JP6261279A 1994-05-13 1994-09-30 音声符号化装置 Pending JPH0830300A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP6261279A JPH0830300A (ja) 1994-05-13 1994-09-30 音声符号化装置

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
JP10008994 1994-05-13
JP6-100089 1994-05-13
JP6261279A JPH0830300A (ja) 1994-05-13 1994-09-30 音声符号化装置

Publications (1)

Publication Number Publication Date
JPH0830300A true JPH0830300A (ja) 1996-02-02

Family

ID=26441180

Family Applications (1)

Application Number Title Priority Date Filing Date
JP6261279A Pending JPH0830300A (ja) 1994-05-13 1994-09-30 音声符号化装置

Country Status (1)

Country Link
JP (1) JPH0830300A (ja)

Similar Documents

Publication Publication Date Title
JP3346765B2 (ja) 音声復号化方法及び音声復号化装置
JP3180762B2 (ja) 音声符号化装置及び音声復号化装置
KR20080110757A (ko) Celp 기술에서의 디지털 오디오 신호의 개선된 코딩/디코딩
JP3137176B2 (ja) 音声符号化装置
US6768978B2 (en) Speech coding/decoding method and apparatus
JP2002268686A (ja) 音声符号化装置及び音声復号化装置
JP3275247B2 (ja) 音声符号化・復号化方法
JP2002140099A (ja) 音声復号化装置
KR100465316B1 (ko) 음성 부호화기 및 이를 이용한 음성 부호화 방법
JP3095133B2 (ja) 音響信号符号化方法
JP3174742B2 (ja) Celp型音声復号化装置及びcelp型音声復号化方法
JP2538450B2 (ja) 音声の励振信号符号化・復号化方法
JP2613503B2 (ja) 音声の励振信号符号化・復号化方法
JPH0830300A (ja) 音声符号化装置
JP3319396B2 (ja) 音声符号化装置ならびに音声符号化復号化装置
JP3144284B2 (ja) 音声符号化装置
JPH06131000A (ja) 基本周期符号化装置
JP3471889B2 (ja) 音声符号化方法及び装置
JP3489748B2 (ja) 音声符号化装置及び音声復号化装置
JP3292227B2 (ja) 符号励振線形予測音声符号化方法及びその復号化方法
JP3192051B2 (ja) 音声符号化装置
JP3410931B2 (ja) 音声符号化方法及び装置
JP2001134298A (ja) 音声符号化装置と音声復号化装置、及び音声符号化復号化システム
JP3236852B2 (ja) Celp型音声復号化装置及び音声復号化方法
JP3236851B2 (ja) 音源ベクトル生成装置及び音源ベクトル生成方法