JP2001188550A - 音声情報圧縮符号化方法 - Google Patents

音声情報圧縮符号化方法

Info

Publication number
JP2001188550A
JP2001188550A JP37443599A JP37443599A JP2001188550A JP 2001188550 A JP2001188550 A JP 2001188550A JP 37443599 A JP37443599 A JP 37443599A JP 37443599 A JP37443599 A JP 37443599A JP 2001188550 A JP2001188550 A JP 2001188550A
Authority
JP
Japan
Prior art keywords
pitch
frame
period
audio
power sum
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP37443599A
Other languages
English (en)
Inventor
Yasushi Kudo
康 工藤
Hisashi Yoda
久志 依田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nakayo Telecommunications Inc
Original Assignee
Nakayo Telecommunications Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nakayo Telecommunications Inc filed Critical Nakayo Telecommunications Inc
Priority to JP37443599A priority Critical patent/JP2001188550A/ja
Publication of JP2001188550A publication Critical patent/JP2001188550A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Transmission Systems Not Characterized By The Medium Used For Transmission (AREA)

Abstract

(57)【要約】 【課題】原音声に含まれない周波数成分が混入しないよ
うに、高能率に音声情報を圧縮符号化する。 【解決手段】ピッチ検出部502はピッチ周期PDを検出
し、フレーム分解部504はピッチ周期の整数倍時間長で
あって、最も所定時間に近い時間長の長さのフレームを
設定し、FFT部505はフレームを離散フーリエ変換し、ス
ペクトルβ(p)と電力和を求め、線形フィルタ507は複数
フレームの電力和の平均Sを求める。符号ブロック509
は、PDとSとβ(p)を音声を表す符号ブロックとする。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は音声情報を圧縮符号
化する技術に関するものである。
【0002】
【従来の技術】従来の音声情報の圧縮符号化方式として
は、たとえば、" Code Excited Linear Prediction (CE
LP) : High-Quality Speech at Very Low Bit Rates"
(Proc.IEEE Int. Conf. Acoust. Speech, Signal Proce
ssing, pp. 937-940, (1985) )や、「ピッチ同期雑音励
振源をもつCELP符号化(PSI-CELP)」(信学論、A Vol. J77
-A No.3 PP. 314-324 (1994年3月))などに記載されてい
るコード駆動線形予測方式(CELP)が知られている。
【0003】CELPでは、入力音声のスペクトル包絡に対
応する線形フィルタを線形予測分析法により構成し、そ
れを符号帳に蓄えた駆動信号符号ベクトルで駆動するこ
とにより音声を再生する。駆動信号符号ベクトルはA-b-
S ( Analysis by Synthesis:合成による分析)法による
閉ループ探索により、再生音声波形が原音声波形近似す
るように、すなわち両者の差が最小になるように決定す
る。
【0004】
【発明が解決しようとする課題】前記CELPによれば、符
号帳のために大容量の記憶資源が必要となるという問題
がある。
【0005】また、前記CELPによれば、再生音声波形の
近似誤差のために、再生音声に原音声に含まれない不特
定多数の高調波成分が含まれてしまう。そして、人間の
聴覚上の感度は、S/N比が数十dBであっても原音声に含
まれない周波数成分の混入を感知してしまう特性をもつ
ことにより、このような不特定多数の高調波成分の混入
は、耳障りな雑音として、再生音声品質の無視できない
劣化をもたらすことがある。
【0006】そこで、本発明は、大容量の記憶資源を必
要とすることなしに、高能率に音声情報を圧縮符号化す
ることを課題とする。また、本発明は、原音声に含まれ
ない周波数成分が混入しないように、高能率に音声情報
を圧縮符号化することを課題とする。
【0007】
【課題を解決するための手段】前記課題達成のために、
本発明は、たとえば、音声情報を圧縮符号化する音声情
報圧縮符号化方法であって、音声信号のピッチ周期を求
めるステップと、求めたピッチ周期の整数倍の区間をフ
レーム区間とするフレームを設定するステップと、フレ
ームの音声信号をフーリエ変換するステップと、フーリ
エ変換により得られたスペクトル電力和と、フーリエ変
換によって得られたピッチ周波数成分およびピッチ周波
数の高調波周波数成分各々の前記スペクトル電力和に対
する割合と、前記ピッチ周期とを表す情報を、当該フレ
ームの音声信号の表す情報として符号化することを特徴
とする音声情報圧縮符号化方法を提供する。
【0008】このような音声情報圧縮符号化方法によれ
ば、符号帳などの予め用意しておくべき多量の情報を必
要としないので、大容量の記憶資源を必要せずに、高能
率に音声情報を圧縮符号化することができる。また、原
音声信号に含まれる周波数成分のみによって音声信号を
表現しているので、原音声に含まれない周波数成分を混
入させることなく、高能率に音声情報を圧縮符号化する
ことができる。
【0009】
【発明の実施の形態】以下、本発明の実施形態について
説明する。
【0010】まず、本実施形態に係る音声情報の圧縮符
号化の方式の概要について説明する。
【0011】さて、音声信号の大部分はピッチ周期と呼
ばれる一定周期の繰り返し波形から成っており、局所的
に適当な時間長の信号区間に着目すれば、定常的な周期
波形とみなすことができる。
【0012】したがって、離散フーリエ変換により少な
いパラメータで音声波形を忠実に表現することができ
る。
【0013】有限時間長の時間の信号区間の離散信号X
(n)波形は、一般に離散フーリエ分析により、スペクト
ルX(k)を用いて、式1のように表現することができる。
【0014】
【数1】
【0015】式1中、Sはスペクトル電力和、α(k)はス
ペクトルX(k)の振幅成分のSに対する割合、θ(k)はスペ
クトルX(k)の位相成分を表す。したがって、離散信号X
(n)の波形は、S、α(k)、θ(k)のパラメータにより忠実
に表現できる。
【0016】ここで、人間の聴覚は音声の位相成分を感
知しないので、音声信号に関しては、式1は、位相成分
を除いて式2としてもよい。
【0017】
【数2】
【0018】ここで、信号区間を無作為に選んだ場合、
一般的には、電力は多数のスペクトルに分散する。一
方、信号区間長を適当に、局所的には信号区間外でも信
号区間内の波形が繰り返されるとみなし得るように選べ
ば、電力は、信号区間内の信号の基本周波数のスペクト
ルとその高調波のスペクトルに集中する。
【0019】そこで、本実施形態として、式3に示すよ
うに、ピッチ周期の整数倍の時間長を信号区間長として
用いる。
【0020】
【数3】
【0021】ここで、TDは信号区間長、PDはピッチ周
期、Qは信号区間に含まれるピッチ波形の数を表してい
る。
【0022】このように信号区間を選ぶことにより、電
力はピッチ周波数とその高調波に集中する。
【0023】そこで、本実施形態では、音声信号の波形
を、式4に示すように、基本周波数となるピッチ周波数
のスペクトルのα(0)=β(0)とその高調波のスペクトル
のα(p×Q)=β(p)によって表現することとする。
【0024】
【数4】
【0025】そして、このような音声信号波形の表現に
従って、次のように圧縮符号化を行う。
【0026】すなわち、入力する音声信号に対して、ピ
ッチ周期PDを求め、この整数倍Qの時間のうち予め定め
た時間Tに最も近い時間T以上の時間をフレーム時間長と
する。
【0027】次に、フレーム中の音声信号を離散フーリ
エ変換し、当該フレームのスペクトル電力和Sとα(k)を
求め、α(k)とQよりβ(p)を求める。
【0028】そして、各フレームについて求めたPDとβ
(p)とSを音声情報を表す符号とする。
【0029】一方、復号の際には、β(p)とSより式4に
従って求まる波形を、PDと時間Tとより求まるフレーム
の信号波形とすることにより、音声を復元する。
【0030】ただし、スペクトル電力和は一つの有音区
間では一定の値をとるものとしても支障がないので、複
数のフレーム、たとえば一つの有声区間の複数フレーム
について求めたスペクトル電力和の平均を、当該複数の
フレームについて共通のSとして符号に含め、当該区間
のフレームについては、この共通のSを用いて復号する
ようにすることにより、さらに、情報量を圧縮するよう
にしてもよい。
【0031】また、PDは一人の話者に限ればその時間変
動は極めて緩やかであるので、PDが近似する連続した複
数のフレームについては一つのPDのみを符号に含め、当
該複数のフレームについてはこの同じPDを用いて復号す
るようにすることにより、さらに、情報量を圧縮するよ
うにしてよい。
【0032】また、音声の電力は比較的低域に集中する
ので、電力の和がスペクトル電力和の所定パーセント以
上となるように低周波のものより選択したβ(p)のみ、
符号に含めるようにすることにより、さらに情報量を圧
縮するようにしてよい。
【0033】また、このようにして選択したβ(p)の数
に応じて、数が少ないときには細かくβ(p)を量子化(多
いビット数で表現)し、数が多いときには大まかにβ(p)
を量子化(少ないビット数で表現)し、情報量と再生音声
品質の最適化を図るようにしてもよい。
【0034】以下、本実施形態に係る音声符号化装置、
音声復号装置の詳細を通信装置への適用を例にとり説明
する。
【0035】図1に音声符号化装置の構成を示す。
【0036】本音声符号化装置は、入力する音声信号を
上述した圧縮符号化方式に従って符号化し送信するもの
である。
【0037】さて、端子501より入力した音声信号はピ
ッチ検出部502に入力する。ピッチ検出部502は、入力し
た音声信号のピッチ周期を次のようにして検出する。
【0038】すなわち、適当な時間間隔、たとえば、10
ms毎や前回のフレームの終わりから10ms経過毎に、図2
(a)に示すように、その時点を探索開始時点Wとし
て、時点Wより時間的に前方向に音声信号のゼロクロス
点を探し、AnをA1の2msからA64の20msまで、64通り(2.0
ms、2.1ms、.....、19.3ms、20ms)に等比級数的に変化
させながら、検出したゼロクロス点の時間RからAn ms前
までの音声信号を部分信号(図2(a)のP1〜P3)として
切り出し、切り出した部分信号を時間Rから時間的に前
方向に整数個G(図2では2個)順次並べた信号Bと、これ
に対応する時間区間(R-G×An〜R)の音声信号との相関値
を求める処理を、繰り返す。相関値としては、たとえ
ば、図2(b)に示した両者の自乗誤差の逆数などを用
いる。
【0039】ここで、Anを変化させる幅を2msから20ms
までとしたのは、人間の音声のピッチ周期は一般に2ms
(ピッチ周波数500Hz)から20ms(ピッチ周波数50Hz)の間
に分布しているためである。また、Anが取り得る時間
を、2msから20msの間から等比級数的に選択した64通り
としたのは、この64通りの時間でピッチ周期を表現すれ
ば、自然度を損なうことなく音声を再生するに充分であ
ることと、6ビットでピッチ周期を表現可能となること
によるものである。
【0040】さて、このようにして、64通りのAnについ
て相関値を求めたならば、最も高い相関値が得られたAx
を第1ピッチ周期候補とする。
【0041】または、以上の処理の代わりに、AnをA1
2msからA64の20msまで64通り(2.0ms、2.1ms、.....、1
9.3ms、20ms)に変化させながら、適当な長さ、たとえば
10ms分の探索開始時点Wから時間的に前の音声信号をAn
ms時間的にずらした信号と、ずらす前の前回のフレーム
の終わりから10ms分の音声信号との相関値を求め、最も
高い相関値が得られたAxを第1ピッチ周期候補とするよ
うにしてもよい。
【0042】さて、このようにして第1ピッチ周期候補
が求まったならば、ピッチ検出部は、この第1ピッチ周
期候補Axが求まった相関値と、第1ピッチ周期候補Axの
時間の前後のA(x-1)、A(x+1)の時間に対して求まっ
た相関値を、有声/無声判定部503に通知すると共に、第
1ピッチ周期候補をフレーム分割部504に通知する。
【0043】有声/無声判定部503は、第1ピッチ周期候
補Axが求まった相関値が、A(x-1)、A(x+1)の時間に
対して求まった相関値としきい値以上の値を示すとき現
フレームは有声フレームとすべきことを判定し、そうで
ない場合は現フレームは無声フレームとすべきことを判
定し、判定結果をフレーム分割部504と、スペクトル選
択部520と線形フィルタ507に通知する。
【0044】フレーム分割部504は、現フレームは無声
フレームとすべきことを通知されたならば、現フレーム
を前回のフレームの終わりより10msの期間とする。一
方、有声フレームとすべきことを通知されたならば、図
3に示すように、第1ピッチ周期候補Axの整数Q倍の時間
であって10msに最も近い10ms以上の時間をフレーム長と
して求め、現フレームを前回のフレームの終わりより求
めたフレーム長分の期間とし整数Qをスペクトル選択部5
20に通知する。
【0045】次に、フレーム分割部504は、現フレーム
の音声信号を、FFT(高速フーリエ変換)部505に送る。
【0046】FFT部505は、受け取った現フレームの音声
信号を、図4に示すように、等時間間隔の64のサンプル
データに変換し、離散フーリエ変換を施し、得られた現
フレームの式2のα(k)をスペクトル選択部520に、現フ
レームの電力和を線形フィルタ507に送る。
【0047】ここで、以上の処理において求めた第1ピ
ッチ周期候補が、真のピッチ波形をh(>1)個含む誤った
ものであった場合、h次およびその整数倍のα(n×h)に
電力が集中し、他の次数のα(k)はほとんど0になる。
【0048】そこで、スペクトル選択部520は、受け取
ったα(k)の、h次およびその整数倍のα(n×h)に電力が
集中し、他の次数のα(k)はほとんど0になった場合は、
ピッチ検出部502にhを通知する。この通知を受けた、ピ
ッチ検出部502は、それまでの第1ピッチ周期候補の1/h
の周期を第1ピッチ周期候補として算出し直し、有声/無
声判定部503、フレーム分割部504、FFT部505は、この新
たな第1ピッチ周期候補についての以上の処理を行う。
【0049】一方、受け取ったα(k)の、h次およびその
整数倍のα(n×h)に電力が集中し、他の次数のα(k)は
ほとんど0と成らなかった場合、第1ピッチ周期候補を最
終ピッチ周期候補とすべきことを、有声/無声判定部50
3、フレーム分割部504、線形フィルタ507に通知する。
第1ピッチ周期候補を最終ピッチ周期候補とすべきこと
を通知された、有声/無声判定部503は、現フレームを有
声フレームとすべきか無声フレームとすべきかの判定結
果を、符号ブロック組立部509に通知する。また、第1ピ
ッチ周期候補を最終ピッチ周期とすべきことを通知され
た、フレーム分割部504は、第1ピッチ周期候補を、最終
ピッチ周期候補としてPDレジスタA506に格納する。
【0050】また、第1ピッチ周期候補を最終ピッチ周
期と判定できた場合、スペクトル選択部520は、現フレ
ームは無声フレームとすべきことを通知されていれば、
α(0)〜α(20)をβ(0)〜β(20)として、βレジスタ514
に格納する。一方、現フレームは有声フレームとすべき
ことを通知されていれば、通知された整数Qを用いて、
式3に従って、β(1)〜β(21)を求め、さらに、β(0)〜
β(20)から、全体の電力に対する比が99パーセント以上
のなる最小の数、低周波のものよりk+1個選択し、これ
を、β(0)〜β(k)として、βレジスタ514に格納する。
【0051】ここで、以上のように、使用するβ(p)の
数を低周波のものより最大で21個とするのは、次の理由
によるものである。
【0052】すなわち、β(p)はpが大きくなるにつれて
値が小さくなり、図5(a)、(b)に標準的な音声に
ついて示したように、90パーセント以上のフレームにお
いて、低周波のものより選択した高々10個のβ(p)の電
力和で、全体の電力の99パーセント以上となる。そこ
で、本実施形態では、使用するβ(p)の数を、実用上の
見地から問題が生じることのない数、すなわち、β(0)
〜β(20)の21個としている。
【0053】さて、線形フィルタ507は、たとえば、式5
【0054】
【数5】
【0055】に示す伝達関数をもつフィルタであり、順
次受け取るフレームの電力和のうちの、有声フレームと
すべきことを通知され、かつ、第1ピッチ周期候補を最
終ピッチ周期とすべきことを通知されたフレームの電力
和より、複数フレームの平均スペクトル電力和、すなわ
ち、式4のSを求め、Sレジスタ511に格納する。
【0056】次に、比較部513は、PDレジスタA506に格
納された最終ピッチ周期候補は、PDレジスタB512に格納
されているピッチ周期PDとを比較し、両者が異なってい
れば、もしくは、両者の差が所定のしきい値より大きけ
れば、PDレジスタA506に格納された最終ピッチ周期候補
をピッチ周期PDとして、PDレジスタB512に格納し、符号
ブロック組立部509にピッチ周期PDの更新の旨とピッチ
周期PDを通知する。
【0057】次に、符号ブロック組立部509は、以上
の、現フレームを有声フレームとするべきか無声フレー
ムとするべきかの通知と、通知されたピッチ周期PDの更
新の旨と、通知されたPDと、βレジスタ514に格納され
たβ(p)と、Sレジスタ511に格納されたSの値に応じて、
各フレームの符号ブロックを作成し、これを送信する。
【0058】以下、符号ブロックの作成法について説明
する。
【0059】まず、β(p)の符号化について説明する。
【0060】β(p)は、Sレジスタ511に格納されたSの大
きさを0dBとして図6に示すように、βレジスタ514に格
納されているβ(p)の数に応じて、異なる値に符号化す
る。すなわち、βレジスタ514に格納されているβ(p)の
数が1〜7の場合には、各β(p)の値を8段階に量子化した
値を表す3ビットの符号を、各β(p)の符号とする。ま
た、β(p)の数が8〜14の場合には、β(0)〜β(7)につい
ては、その値を4段階に量子化した値を表す2ビットの符
号を、各β(p)の符号とし、β(8)〜β(13)については、
その値を2段階に量子化した値を表す1ビットの符号を、
各β(p)の符号とする。β(p)の数が15〜21の場合には、
各β(p)の値を2段階に量子化した値を表す2ビットの符
号を、各β(p)の符号とする。この結果、いずれの場合
も、βレジスタ514に格納されているβ(p)は、最大21ビ
ットで表現されることになる。次に、各フレームの符号
ブロックについて説明する。
【0061】図7に示すように、各フレーム符号ブロッ
クには、現フレームが、無声フレーム、β(p)の数が1〜
7の有声フレーム、β(p)の数が8〜14の有声フレーム、
β(p)の数が15〜21の有声フレームのいずれであるかを
示す2ビットのデータ識別ヘッダ2を付加する。
【0062】また、無声フレームaの符号ブロックに
は、Sレジスタ511に格納されたSの大きさを6ビットで表
した値4と、βレジスタ514に格納されているβ(0)から
β(20)の21個のβ(p)をそれぞれ1ビットに符号化した符
号9を含める。
【0063】また、各有声フレームb、c、dには、ピッ
チ周期PDの更新の旨が通知された後初めて送信される有
声フレームである場合には、通知されたPD大きさを6ビ
ットで表した値5を含める。ピッチ周期PDの更新の旨が
通知された後初めて送信される有声フレームでない有声
フレームにはPDの値5は含めない。
【0064】また、各有声フレームb、c、dには、βレ
ジスタ514に格納されているβ(p)を前述のように符号化
した値6、7、8、9をpの順番に含める。
【0065】以上のような符号ブロックによれば、その
符号ブロック長は29ビットとなり、仮に全フレームのフ
レーム長が10msであるとしても、2900bpsの伝送レート
が確保できれば、これを伝送することができる。
【0066】もし、2900bpsの伝送レートより低い伝送
レートで、たとえば1600bps送信する必要がある場合に
は、図8に示すように、図7の符号化ブロックを2つの
符号ブロックに分割し、後半のブロックは格納するβ
(p)の符号が存在しない場合には、送信しないようにす
る。また、各符号ブロックには、その符号ブロックに後
続する同じフレームについての符号ブロックが存在する
のかしないのかを表す後続ブロック有無ビットを1ビッ
ト含めるようにする。
【0067】以上、音声符号化装置について説明した。
【0068】以下、音声復号装置について説明する。
【0069】図9に音声復号装置の構成を示す。
【0070】符号ブロック分解部602は、音声符号化装
置から送信された符号ブロックを受信、解析し、符号ブ
ロックに含まれるS、PD、β(p)の値を取り出す。そし
て、パラメータレジスタA603に格納されているS、PD、
β(p)の値をパラメータレジスタB604に格納すると共
に、取り出したS、PD、β(p)の値を、パラメータレジス
タA603に格納する。ただし、符号ブロックにSまたはPD
の値が含まれていない場合には、パラメータレジスタA6
03のSまたはPDの値を、そのままパラメータレジスタA60
3に残すようにする。
【0071】比較部605は、パラメータレジスタA603と
パラメータレジスタB604の内容を比較し、現フレームの
最適なS、PD、β(p)を、たとえば、S、PD、β(p)のフレ
ーム毎に変化が急激にならないように決定し、S、β(p)
を、逆FFT部606に、PDをフレーム長算出部607に渡す。
ただし、パラメータレジスタA603のS、PD、β(p)を、そ
のまま、現フレームの最適なS、PD、β(p)とするように
してもよい。
【0072】フレーム長算出部607は、渡されたPDの整
数倍の時間であって、10ms以上の最小の時間をフレーム
長として算出する。
【0073】逆FFT部606は、渡されたS、β(p)を用いて
式4に従って、逆フーリエ変換を行い、音声波形を表す6
4サンプルデータをサンプルレート調整部608に送る。サ
ンプルレート調整部608は、フレーム長算出部607が算出
したフレーム長に応じて、64サンプルデータに補間を施
すことにより、一定レートのサンプルデータよりなる音
声データを生成する。
【0074】繰り返し再生部609は、時間の経過と、各
フレームののサンプルデータが表す音声の時間経過のず
れを吸収するため、すなわち、時間の経過通りに音声が
再生されるように設けたものである。繰り返し再生部60
9は、適宜、必要な場合には、同じ部分を繰り返しなが
ら、サンプルデータを出力する。
【0075】以上、本発明の実施形態について説明し
た。
【0076】なお、以上の音声符号化、復号の方式/方
法や、音声符号化装置、音声復号装置は、記録再生装置
など、音声情報の圧縮復号を行う各種装置に同様に適用
することができる。
【0077】
【発明の効果】以上のように、本発明によれば、大容量
の記憶資源を必要とすることなしに、高能率に音声情報
を圧縮符号化することができる。また、本発明は、原音
声に含まれない周波数成分が混入しないように、高能率
に音声情報を圧縮符号化することができる。
【図面の簡単な説明】
【図1】本発明の実施形態に係る音声符号化装置の構成
を示すブロック図である。
【図2】本発明の実施形態に係るピッチ周期の求め方を
示す図である。
【図3】本発明の実施形態に係るフレームの求め方を示
す図である。
【図4】本発明の実施形態に係るフレームのサンプルデ
ータを示す図である。
【図5】スペクトル数とエネルギーカバー率の関係を示
す図である。
【図6】本発明の実施形態において行うスペクトルへの
符号割り当てを示す図である。
【図7】本発明の実施形態に係る符号ブロックを示す図
である。
【図8】本発明の実施形態に係る符号ブロックを示す図
である。
【図9】本発明の実施形態に係る音声復号装置の構成を
示すブロック図である。
【符号の説明】
501…入力音声 502…ピッチ検出部 503…有声/無声判定部 504…フレーム分解部 505…FFT部 506…PDレジスタA 507…線形フィルタ部 509…符号ブロック組立部 510…符号出力 511…Sレジスタ 512…PDレジスタA 513…比較部 514…βレジスタ 520…スペクトル選択部 601…符号入力 602…符号ブロック分解部 603…パラメータレジスタA 604…パラメータレジスタB 605…比較部 606…逆FFT部 607…フレーム長算出部 608…サンプルレート調整部 609…繰り返し再生部 610…音声出力
───────────────────────────────────────────────────── フロントページの続き Fターム(参考) 5J064 AA04 BA16 BC04 BC11 BD01 5K041 AA04 CC01 EE19 EE23 EE36 HH10 HH27 HH37 9A001 BB06 CZ02 DZ15 EE04 HH15 JJ12 JZ19 KZ31 KZ56

Claims (10)

    【特許請求の範囲】
  1. 【請求項1】音声情報を圧縮符号化する音声情報圧縮符
    号化方法であって、 音声信号のピッチ周期を求めるステップと、 求めたピッチ周期の整数倍の期間をフレーム期間とする
    フレームを設定するステップと、 フレームの音声信号をフーリエ変換するステップと、 フーリエ変換により得られたスペクトル電力和と、フー
    リエ変換によって得られたピッチ周波数成分およびピッ
    チ周波数の高調波周波数成分各々の前記スペクトル電力
    和に対する割合と、前記ピッチ周期とを表す情報とを、
    当該フレームの音声信号の表す情報として符号化するこ
    とを特徴とする音声情報圧縮符号化方法。
  2. 【請求項2】請求項1記載の音声情報圧縮符号化方法で
    あって、 複数のフレームについてフーリエ変換により得られたス
    ペクトル電力和を平均した複数フレーム平均スペクトル
    電力和で、当該複数のフレーム近傍の複数のフレーム各
    々の前記スペクトル電力和を近似し、特定の複数フレー
    ム平均スペクトル電力和で前記スペクトル電力和が近似
    される複数のフレームの前記スペクトル電力和を表す情
    報として、当該特定の複数フレーム平均スペクトル電力
    和を各符号化することを特徴とする音声情報圧縮符号化
    方法。
  3. 【請求項3】請求項2記載の音声情報圧縮符号化方法で
    あって、 無音区間で区切られる1有音区間の全フレームの前記ス
    ペクトル電力和を表す情報として、一つの前記複数フレ
    ーム平均スペクトル電力和を符号化することを特徴とす
    る音声情報圧縮符号化方法。
  4. 【請求項4】請求項1、2、または3記載の音声情報圧
    縮符号化方法であって、 各フレームのピッチ周期を、当該フレーム以前の当該フ
    レームのピッチ周期と所定レベル以上近いピッチ周期で
    近似し、特定のピッチ周期で前記ピッチ周期が近似され
    る複数のフレームの前記ピッチ周期を表す情報として、
    当該特定のピッチ周期を各符号化することを特徴とする
    音声情報圧縮符号化方法。
  5. 【請求項5】請求項1、2または3記載の音声情報圧縮
    符号化方法であって、 前記各フレームの、ピッチ周波数とピッチ周波数の高調
    波周波数成分各々の前記スペクトル電力和に対する割合
    を表す情報として、ピッチ周波数成分とピッチ周波数の
    高調波周波数成分のうち、その電力和が前記スペクトル
    電力和の所定割合以上となる最小数の低域側成分のみ
    の、前記スペクトル電力和に対する割合を表す情報を符
    号化することを特徴とする音声情報圧縮符号化方法。
  6. 【請求項6】請求項5記載の音声情報圧縮符号化方法で
    あって、 前記最小数に応じて、異なるビット長の符号に、前記最
    小数の低域側成分のみの、前記スペクトル電力和に対す
    る割合を表す情報を符号化し、 かつ、少なくとも一組のn、m(n>m)に対して、最小
    数がnである場合よりも最小数がm(n>m)である場合
    の方が符号のビット長が短くなることが成立することを
    特徴とする音声情報圧縮符号化方法。
  7. 【請求項7】請求項1、2、3、4、5または6記載の
    音声情報圧縮符号化方法であって、 期間Tを変化させながら、期間T分の音声信号を部分信号
    として切り出して切り出した部分信号を整数個時間的に
    並べた参照信号と、音声信号との相関を求め、求まった
    相関が最も大きい期間Tを前記ピッチ周期とすることを
    特徴とする音声情報圧縮符号化方法。
  8. 【請求項8】請求項1、2、3、4、5または6記載の
    音声情報圧縮符号化方法であって、 期間Tを変化させながら、音声信号を期間T時間的にずら
    した参照信号と、音声信号との相関を求め、求まった相
    関が最も大きい期間Tを前記ピッチ周期とすることを特
    徴とする音声情報圧縮符号化方法。
  9. 【請求項9】音声情報を圧縮符号化する音声情報圧縮符
    号化装置であって、 音声信号のピッチ周期を求める手段と、 求めたピッチ周期の整数倍の期間をフレーム期間とする
    フレームを設定する手段と、 フレームの音声信号をフーリエ変換する手段と、 フーリエ変換により得られたスペクトル電力和と、フー
    リエ変換によって得られたピッチ周波数成分およびピッ
    チ周波数の高調波周波数成分各々の前記スペクトル電力
    和に対する割合と、前記ピッチ周期とを表す情報を、当
    該フレームの音声信号の表す情報として符号化する手段
    と、を有することを特徴とする音声情報圧縮符号化装
    置。
  10. 【請求項10】各フレームについて、スペクトル電力和
    と、ピッチ周波数成分およびピッチ周波数の高調波周波
    数成分各々の前記スペクトル電力和に対する割合と、前
    記ピッチ周期とを表す情報に圧縮符号化された音声情報
    を復号する音声情報圧縮復号装置であって、 逆フーリエ変換によって、スペクトル電力和と、ピッチ
    周波数成分およびピッチ周波数の高調波周波数成分各々
    の前記スペクトル電力和に対する割合とから、音声信号
    を復元する手段と、 復元された音声信号を、ピッチ周期より所定の規則によ
    る定まるフレーム期間の音声信号とする手段と、を有す
    ることを特徴とする音声情報圧縮復号装置
JP37443599A 1999-12-28 1999-12-28 音声情報圧縮符号化方法 Pending JP2001188550A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP37443599A JP2001188550A (ja) 1999-12-28 1999-12-28 音声情報圧縮符号化方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP37443599A JP2001188550A (ja) 1999-12-28 1999-12-28 音声情報圧縮符号化方法

Publications (1)

Publication Number Publication Date
JP2001188550A true JP2001188550A (ja) 2001-07-10

Family

ID=18503849

Family Applications (1)

Application Number Title Priority Date Filing Date
JP37443599A Pending JP2001188550A (ja) 1999-12-28 1999-12-28 音声情報圧縮符号化方法

Country Status (1)

Country Link
JP (1) JP2001188550A (ja)

Similar Documents

Publication Publication Date Title
KR100427753B1 (ko) 음성신호재생방법및장치,음성복호화방법및장치,음성합성방법및장치와휴대용무선단말장치
US7426465B2 (en) Speech signal decoding method and apparatus using decoded information smoothed to produce reconstructed speech signal to enhanced quality
WO2001020595A1 (en) Voice encoder/decoder
KR20070029754A (ko) 음성 부호화 장치 및 그 방법과, 음성 복호화 장치 및 그방법
JPH0713600A (ja) 駆動同期時間符号化ボコーダおよび方法
JP4445328B2 (ja) 音声・楽音復号化装置および音声・楽音復号化方法
JP3478209B2 (ja) 音声信号復号方法及び装置と音声信号符号化復号方法及び装置と記録媒体
US7542898B2 (en) Pitch cycle search range setting apparatus and pitch cycle search apparatus
JP4464484B2 (ja) 雑音信号符号化装置および音声信号符号化装置
EP1204968B1 (en) Method and apparatus for subsampling phase spectrum information
JP2000267699A (ja) 音響信号符号化方法および装置、そのプログラム記録媒体、および音響信号復号装置
JP4550176B2 (ja) 音声符号化方法
JP3444131B2 (ja) 音声符号化及び復号装置
KR100796836B1 (ko) 코드 변환 방법, 장치 및 이 방법을 실행하는 컴퓨터용 프로그램이 기록된 기록 매체
WO2002021091A1 (fr) Analyseur de signal de bruit, synthetiseur de signal de bruit, procede d'analyse de signal de bruit et procede de synthese de signal de bruit
CN104584123A (zh) 解码方法、解码装置、程序、及其记录介质
JP3417362B2 (ja) 音声信号復号方法及び音声信号符号化復号方法
JP3496618B2 (ja) 複数レートで動作する無音声符号化を含む音声符号化・復号装置及び方法
JP2001188550A (ja) 音声情報圧縮符号化方法
JP3916934B2 (ja) 音響パラメータ符号化、復号化方法、装置及びプログラム、音響信号符号化、復号化方法、装置及びプログラム、音響信号送信装置、音響信号受信装置
JP3515216B2 (ja) 音声符号化装置
JP2002073097A (ja) Celp型音声符号化装置とcelp型音声復号化装置及び音声符号化方法と音声復号化方法
JPH10124097A (ja) 音声記録再生装置
JP3205161B2 (ja) 音声符号化装置
JPH06102900A (ja) 音声符号化方式および音声復号化方式