JPH11242498A - 音声のピッチ符号化方法及び音声のピッチ符号化装置並びに音声のピッチ符号化プログラムが記録された記録媒体 - Google Patents

音声のピッチ符号化方法及び音声のピッチ符号化装置並びに音声のピッチ符号化プログラムが記録された記録媒体

Info

Publication number
JPH11242498A
JPH11242498A JP10045933A JP4593398A JPH11242498A JP H11242498 A JPH11242498 A JP H11242498A JP 10045933 A JP10045933 A JP 10045933A JP 4593398 A JP4593398 A JP 4593398A JP H11242498 A JPH11242498 A JP H11242498A
Authority
JP
Japan
Prior art keywords
subframe
pitch
encoding
frame
sub
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP10045933A
Other languages
English (en)
Other versions
JP3618217B2 (ja
Inventor
Kenki Ihara
健喜 井原
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Pioneer Corp
Original Assignee
Pioneer Electronic Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Pioneer Electronic Corp filed Critical Pioneer Electronic Corp
Priority to JP04593398A priority Critical patent/JP3618217B2/ja
Priority to US09/257,382 priority patent/US6219636B1/en
Publication of JPH11242498A publication Critical patent/JPH11242498A/ja
Application granted granted Critical
Publication of JP3618217B2 publication Critical patent/JP3618217B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/90Pitch determination of speech signals
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/93Discriminating between voiced and unvoiced parts of speech signals
    • G10L2025/932Decision in previous or following frames

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

(57)【要約】 【課題】 音声のピッチ情報を良好な音質を保ち。かつ
効率的に符号化することが可能な符号化方法を提供す
る。 【解決手段】 1フレーム内で、全サブフレームが無声
音であれば(ステップS10;YES)、無声音として
符号化し(ステップS11)、有声音となるサブフレー
ムが含まれていれば(ステップS10;NO)、最初に
有声音となるs番目のサブフレームに達するまでは、ピ
ッチ情報の符号化を保留する(ステップS13からステ
ップS15)。一方、s番目のサブフレームに達すると
(ステップS13;YES)、基準値の選択と符号化を
行い(ステップS16)、ピッチ情報を符号化し(ステ
ップS17)、最後のサブフレームに対する処理を終え
るまで(ステップS18からステップS20)、同様の
処理を続ける。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、音声符号化の技術
分野に属し、より詳しくは、音声のピッチ情報の符号化
方法、ピッチ符号化装置、及びピッチ符号化プログラム
が記録された記録媒体の技術分野に属する。
【0002】
【従来の技術】従来、音声信号を高能率に符号化するた
め、人間の声帯振動の周期性に起因する音声信号の長期
相関に基づくピッチを抽出し符号化することが一般的に
行われている。即ち、音声信号においては、このピッチ
で定まる周期ごとに同様の波形が繰り返されるため、ピ
ッチを符号化する際、近接相関に基づく短期予測と組み
合わせれば、高能率に音声信号を符号化することが可能
となる。また、代表的な音声符号化方式であるCELP
(Code Excited Linear Prediction)においては、適応
コードブックの内容を過去の合成フィルタの駆動源と
し、いったん再生して入力信号との聴感重み付け誤差電
力を最小化するように、ピッチを決定する構成をとるの
で、ピッチ抽出が不可欠な要素となっている。
【0003】ところで、一般にCELPなどの音声符号
化方式においては、入力音声をフレームを単位に区切り
フレームごとに符号化を行うとともに、フレームをさら
に複数のサブフレーム単位に分割し、ベクトル量子化等
の処理の基本単位としている。そして、上述したピッチ
抽出は、各サブフレームに対してそれぞれ1つのピッチ
を算出した上で、この算出ピッチを1又は複数のフレー
ムの範囲内で符号化処理することにより行われる。ここ
で、算出ピッチの符号化に際しては、1フレーム内の各
サブフレームに対し、算出ピッチの値そのものを符号化
することによっても可能であるが、符号化データ量削減
のために1フレーム内の先頭のサブフレームに対して
は、算出ピッチの値そのものを符号化し、後続の各サブ
フレームに対しては、算出ピッチと前のサブフレームと
の差分を符号化することが有効である。
【0004】
【発明が解決しようとする課題】しかしながら、音声信
号は時間軸において、声帯の振動を伴う入力音声が存在
する有声音、声帯の振動を伴わない入力音声のみ存在す
る無声音、入力音声が存在しない無音とに区別できる。
音声のピッチは、有声音の部分に対して意味を持つの
で、これらのいずれかの状態にあるかを判断した上で、
処理の最小単位であるサブフレームが、有声音ではない
無声音又は無音と判定された場合には、ピッチ符号化を
行わないようにすることが一般的である。そのため、1
フレーム内の先頭部分のサブフレームが有声音と判定さ
れない場合は、その後のサブフレームで求めるべき差分
の基準とすべき値が定まらないので、1フレーム全体に
ついてピッチ符号化を行わないこととせざるを得ない。
この場合、CELP等における適応コードブックからは
再生信号が出力されないこととなる。
【0005】従って、従来の音声符号化方式において、
符号化データ量を削減しつつ、きめが細かく入力音声に
忠実なピッチ符号化を実現することは困難である。特
に、1フレームが長くなる場合や、1フレーム中のサブ
フレーム数が多い場合などは、1フレーム内に有声音と
判定されないサブフレームが含まれる可能性が増大する
ので、音声符号化の品質劣化を招くおそれがある。
【0006】そこで、本発明は、上記の問題点に鑑みな
されたものであり、その課題は、符号化データ量を増大
させることなく、1フレーム内に有声音と判定されない
サブフレームが含まれている場合でも、入力音声のピッ
チを忠実に符号化することができる符号化方法、符号化
装置、及び符号化プログラムが記録された記録媒体を提
供することにある。
【0007】
【課題を解決するための手段】前記課題を達成するた
め、請求項1に記載のピッチ符号化方法は、フレーム単
位に区切られ入力音声に対し、フレームをさらに複数に
分割したサブフレーム単位のピッチを算出し符号化する
ピッチ符号化方法であって、一又は複数のフレームに含
まれる複数のサブフレームのピッチを各サブフレームご
とに算出する算出工程と、前記複数のサブフレームに含
まれる入力音声が声帯の振動を伴う有声音であるか否か
を各サブフレームごとに判定する判定工程と、前記複数
のサブフレーム中、最初の入力音声を含むサブフレーム
である先頭サブフレームが有声音と判定された場合は、
前記算出した当該先頭サブフレームのピッチを符号化す
るとともに、当該先頭サブフレームが有声音でないと判
定され、かつ前記複数のサブフレーム中、当該先頭サブ
フレームに後続する他のサブフレームである後続サブフ
レームに有声音と判定されたサブフレームが存在する場
合は、前記先頭サブフレームに、予め定められた複数の
ピッチの基準値の中から一の基準値を選択して符号化す
る第1符号化工程と、有声音と判定された前記後続サブ
フレームについて、前記複数のサブフレーム中、当該後
続サブフレームに先行するサブフレームに有声音と判定
されたサブフレームが存在する場合は、当該先行するサ
ブフレームの前記算出したピッチと当該後続サブフレー
ムの前記算出したピッチとの差分を算出して符号化する
とともに、先行するサブフレームに有声音と判定された
サブフレームが存在しない場合は、前記選択した基準値
と当該後続サブフレームの前記算出したピッチとの差分
を算出して符号化する第2符号化工程とを備えることを
特徴とする。
【0008】請求項1に記載のピッチ符号化方法によれ
ば、算出工程において、一又は複数のフレームに含まれ
るサブフレームを単位に入力音声のピッチが各サブフレ
ームごとに算出されるとともに、判定工程において、こ
の入力音声が有声音であるか否かがサブフレームごとに
判定される。
【0009】そして、第1符号化工程においては先頭サ
ブフレームに対する符号化が行われる。即ち、有声音と
判定された先頭サブフレームの算出ピッチを符号化する
一方、有声音でないと判定された先頭サブフレームであ
って、有声音と判定される後続サブフレームが存在する
場合には、複数のピッチの基準値から1つを選択するこ
とにより符号化が行われる。
【0010】また、第2符号化工程においては、後続サ
ブフレームに対する符号化が行われる。即ち、有声音と
判定された後続サブフレームについて、先行するサブフ
レームに有声音と判定されるものが存在する場合には、
後続サブフレームと当該先行するサブフレームとの算出
ピッチどうしの差分を算出して符号化する一方、先行す
るサブフレームに有声音と判定されるものが存在しない
場合には、後続サブフレームの算出ピッチと選択した基
準値との差分を算出して符号化を行う。
【0011】よって、ピッチ符号化の処理を行うべき複
数のサブフレーム内で、有声音であるか否かの判定結果
が1フレーム内で変動するような場合であっても、差分
を利用してピッチを忠実に符号化することができ、品質
を確保しつつ、データ量が増大しないピッチ情報の符号
化が可能となる。
【0012】請求項2に記載のピッチ符号化方法は、請
求項1に記載のピッチ符号化方法において、有声音と判
定されたサブフレームに対しての前記ピッチ又は前記差
分の符号化は、所定期間内の過去の入力信号を更新しつ
つ保持する適応コードブックの再生信号と前記入力信号
との聴感重み付け誤差電力が最小となる当該再生時の遅
延により求めることを特徴とする。
【0013】請求項2に記載のピッチ符号化方法によれ
ば、第1符号化工程と第2符号化工程において、符号化
の対象となるサブフレームが有声音である場合、適応コ
ードブックの再生信号と入力信号との聴感重み付け誤差
電力が最小となる当該再生時の遅延から、ピッチ又は差
分を求めて符号化を行う。
【0014】よって、量子化雑音低減に適切な符号化を
行うことができ、良好な音質を保ちつつ、データ量が増
大しないピッチ情報の符号化が可能となる。
【0015】請求項3に記載のピッチ符号化装置は、フ
レーム単位に区切られた入力音声に対し、フレームをさ
らに複数に分割したサブフレーム単位のピッチを算出し
符号化するピッチ符号化装置であって、一又は複数のフ
レームに含まれる複数のサブフレームのピッチを各サブ
フレームごとに算出する算出手段と、前記複数のサブフ
レームに含まれる入力音声が声帯の振動を伴う有声音で
あるか否かを各サブフレームごとに判定する判定手段
と、前記複数のサブフレーム中、最初の入力音声を含む
サブフレームである先頭サブフレームが有声音と判定さ
れた場合は、前記算出した当該先頭サブフレームのピッ
チを符号化するとともに、当該先頭サブフレームが有声
音でないと判定され、かつ前記複数のサブフレーム中、
当該先頭サブフレームに後続する他のサブフレームであ
る後続サブフレームに有声音と判定されたサブフレーム
が存在する場合は、前記先頭サブフレームに、予め定め
られた複数のピッチの基準値の中から一の基準値を選択
して符号化する第1符号化手段と、有声音と判定された
前記後続サブフレームについて、前記複数のサブフレー
ム中、当該後続サブフレームに先行するサブフレームに
有声音と判定されたサブフレームが存在する場合は、当
該先行するサブフレームの前記算出したピッチと当該後
続サブフレームの前記算出したピッチとの差分を算出し
て符号化するとともに、先行するサブフレームに有声音
と判定されたサブフレームが存在しない場合は、前記選
択した基準値と当該後続サブフレームの前記算出したピ
ッチとの差分を算出して符号化する第2符号化手段とを
備えることを特徴とする。
【0016】請求項3に記載のピッチ符号化装置によれ
ば、算出手段により、一又は複数のフレームに含まれる
サブフレームを単位に入力音声のピッチが各サブフレー
ムごとに算出されるとともに、判定手段により、この入
力音声が有声音であるか否かがサブフレームごとに判定
される。
【0017】そして、第1符号化手段により、先頭サブ
フレームに対する符号化が行われる。即ち、有声音と判
定された先頭サブフレームの算出ピッチを符号化する一
方、有声音でないと判定された先頭サブフレームであっ
て、有声音と判定される後続サブフレームが存在する場
合には、複数のピッチの基準値から1つを選択すること
により符号化が行われる。
【0018】また、第2符号化手段により、後続サブフ
レームに対する符号化が行われる。即ち、有声音と判定
された後続サブフレームについて、先行するサブフレー
ムに有声音と判定されるものが存在する場合には、後続
サブフレームと当該先行するサブフレームとの算出ピッ
チどうしの差分を算出して符号化する一方、先行するサ
ブフレームに有声音と判定されるものが存在しない場合
には、後続サブフレームの算出ピッチと選択した基準値
との差分を算出して符号化を行う。
【0019】よって、ピッチ符号化の処理を行うべき複
数のサブフレーム内で、有声音であるか否かの判定結果
が1フレーム内で変動するような場合であっても、差分
を利用してピッチを忠実に符号化することができ、品質
を確保しつつ、データ量が増大しないピッチ情報の符号
化が可能となる。
【0020】請求項4に記載のピッチ符号化装置は、請
求項3に記載のピッチ符号化装置において、有声音と判
定されたサブフレームに対しての前記ピッチ又は前記差
分の符号化は、所定期間内の過去の入力信号を更新しつ
つ保持する適応コードブックの再生信号と前記入力信号
との聴感重み付け誤差電力が最小となる当該再生時の遅
延により求めることを特徴とする。
【0021】請求項4に記載のピッチ符号化装置によれ
ば、第1符号化手段と第2符号化手段において、符号化
の対象となるサブフレームが有声音である場合、適応コ
ードブックの再生信号と入力信号との聴感重み付け誤差
電力が最小となる当該再生時の遅延から、ピッチ又は差
分を求めて符号化を行う。
【0022】よって、量子化雑音低減に適切な符号化を
行うことができ、良好な音質を保ちつつ、データ量が増
大しないピッチ情報の符号化が可能となる。
【0023】請求項5に記載のピッチ符号化方法を実行
させるためのプログラムを記録した記録媒体は、コンピ
ュータに、フレーム単位に区切られた入力音声に対し、
フレームをさらに複数に分割したサブフレーム単位のピ
ッチを算出し符号化するピッチ符号化方法を実行させる
ためのプログラムを記録した記録媒体であって、一又は
複数のフレームに含まれる複数のサブフレームのピッチ
を各サブフレームごとに算出する算出工程と、前記複数
のサブフレームに含まれる入力音声が声帯の振動を伴う
有声音であるか否かを各サブフレームごとに判定する判
定工程と、前記複数のサブフレーム中、最初の入力音声
を含むサブフレームである先頭サブフレームが有声音と
判定された場合は、前記算出した当該先頭サブフレーム
のピッチを符号化するとともに、当該先頭サブフレーム
が有声音でないと判定され、かつ前記複数のサブフレー
ム中、当該先頭サブフレームに後続する他のサブフレー
ムである後続サブフレームに有声音と判定されたサブフ
レームが存在する場合は、前記先頭サブフレームに、予
め定められた複数のピッチの基準値の中から一の基準値
を選択して符号化する第1符号化工程と、有声音と判定
された前記後続サブフレームについて、前記複数のサブ
フレーム中、当該後続サブフレームに先行するサブフレ
ームに有声音と判定されたサブフレームが存在する場合
は、当該先行するサブフレームの前記算出したピッチと
当該後続サブフレームの前記算出したピッチとの差分を
算出して符号化するとともに、先行するサブフレームに
有声音と判定されたサブフレームが存在しない場合は、
前記選択した基準値と当該後続サブフレームの前記算出
したピッチとの差分を算出して符号化する第2符号化工
程とを備えることを特徴とする。
【0024】請求項5に記載のピッチ符号化方法を実行
させるためのプログラムを記録した読み取り実行するコ
ンピュータによれば、算出工程において、一又は複数の
フレームに含まれるサブフレームを単位に入力音声のピ
ッチが各サブフレームごとに算出されるとともに、判定
工程において、この入力音声が有声音であるか否かがサ
ブフレームごとに判定される。
【0025】そして、第1符号化工程においては先頭サ
ブフレームに対する符号化が行われる。即ち、有声音と
判定された先頭サブフレームの算出ピッチを符号化する
一方、有声音でないと判定された先頭サブフレームであ
って、有声音と判定される後続サブフレームが存在する
場合には、複数のピッチの基準値から1つを選択するこ
とにより符号化が行われる。
【0026】また、第2符号化工程においては、後続サ
ブフレームに対する符号化が行われる。即ち、有声音と
判定された後続サブフレームについて、先行するサブフ
レームに有声音と判定されるものが存在する場合には、
後続サブフレームと当該先行するサブフレームとの算出
ピッチどうしの差分を算出して符号化する一方、先行す
るサブフレームに有声音と判定されるものが存在しない
場合には、後続サブフレームの算出ピッチと選択した基
準値との差分を算出して符号化を行う。
【0027】よって、ピッチ符号化の処理を行うべき複
数のサブフレーム内で、有声音であるか否かの判定結果
が1フレーム内で変動するような場合であっても、差分
を利用してピッチを忠実に符号化することができ、品質
を確保しつつ、データ量が増大しないピッチ情報の符号
化が可能となる。
【0028】請求項6に記載のピッチ符号化方法を実行
させるためのプログラムを記録した記録媒体は、請求項
5に記載のピッチ符号化方法を実行させるためのプログ
ラムを記録した記録媒体において、有声音と判定された
サブフレームに対しての前記ピッチ又は前記差分の符号
化は、所定期間内の過去の入力信号を更新しつつ保持す
る適応コードブックの再生信号と前記入力信号との聴感
重み付け誤差電力が最小となる当該再生時の遅延により
求めることを特徴とする。
【0029】請求項6に記載のピッチ符号化方法を実行
させるためのプログラムを記録した記録媒体を読み取り
実行するコンピュータによれば、第1符号化工程と第2
符号化工程において、符号化の対象となるサブフレーム
が有声音である場合、適応コードブックの再生信号と入
力信号との聴感重み付け誤差電力が最小となる当該再生
時の遅延から、ピッチ又は差分を求めて符号化を行う。
【0030】よって、量子化雑音低減に適切な符号化を
行うことができ、良好な音質を保ちつつ、データ量が増
大しないピッチ情報の符号化が可能となる。
【0031】
【発明の実施の形態】以下、本発明の好適な実施形態に
ついて、図面に基づいて説明する。
【0032】図1は、本発明に係るピッチ符号化方法を
CELP符号化方式に適用する場合の全体構成を示すブ
ロック図である。
【0033】図1に示すCELP符号化方式は、ピッチ
分析部1と、ピッチパス決定部2と、符号化部3と、線
形予測分析部4と、適応コードブック5と、雑音コード
ブック6と、利得コードブック7と、聴覚重み付けフィ
ルタ8と、合成フィルタ9とから構成されている。
【0034】図1の構成において、入力音声はフレーム
単位に区切られ、さらにフレームを複数のサブフレーム
に分割し、サブフレームごと、又は、フレームごとに各
種パラメータを抽出し符号化がなされる。まず、入力音
声は、サブフレームごとに線形予測分析部4に入力さ
れ、サンプル値間の近接相関を利用して予測値を求める
処理が行われる。
【0035】CELP符号化方式における線形予測残差
の符号化は、3種のコードブックを使ったベクトル量子
化を用いて行われ、最適な量子化ベクトル(各コードブ
ックのインデクス)をサブフレームごとに決定し、その
際の各コードブックのインデクスを伝送すべき符号化デ
ータとする。適応コードブック5は、合成フィルタ9へ
入力する過去の駆動源を用いていったん信号を再生し、
入力信号との聴感重み付け誤差電力を最小化するように
ピッチ予測を行う。雑音コードブック6は、ガウス性の
確率密度をもつ雑音信号を音源として、ピッチ予測残差
信号を近似するものである。利得コードブック7は、適
応コードブック5及び雑音コードブック6において最適
なインデクスを決定した上で、その条件において最適な
利得を与えるように別途決定するものである。
【0036】また、入力音声は、サブフレームごとにピ
ッチ分析部1にも入力され、ピッチパス決定部2を経
て、オープンループ探索法によりピッチパス情報を得た
後、符号化部3において前述の適応コードブックのイン
デクスを決定し、クローズドループ探索法により音声信
号の長期相関に基づくピッチの符号化処理が行われる。
これらピッチ符号化処理の詳細については後述する。
【0037】合成フィルタ9は、線形予測分析部7にお
ける予測結果に基づき、フィルタの係数を決定した上
で、各コードブックの求めたインデクスによる信号を入
力し、再生音声として出力を行う。そして、合成フィル
タ9から出力される再生信号は、入力音声との誤差電力
を求めた上で、聴覚のマスキング現象を利用して量子化
雑音を低減するための聴覚重み付けフィルタ8を通した
後、符号化部3において当該誤差電力を最小化するよう
に符号化が行われる。
【0038】次に、図2に、クローズドループ探索法に
よるピッチ符号化処理のフローチャートを示す。図2に
示すピッチ符号化処理においては、ピッチ分析部1とピ
ッチパス決定部2で行われるオープンループ探索法によ
り得られたピッチパス情報を入力した後、クローズドル
ープ探索法に基づき各サブフレームのピッチが決定され
る。
【0039】ここで、オープンループ探索法によるピッ
チパス情報の生成の概略を説明する。なお、本実施形態
では、1フレームが4サブフレームから構成され、各処
理は1フレームの範囲内で行われる場合を考える。
【0040】まず、1フレーム内の各サブフレームに対
するピッチ候補をM個求める。より具体的には、各サブ
フレームに線形予測分析( Linear Predictive Codin
g:LPC)を行い、その予測残差にハミング窓を乗じ
た後、対応するサンプリング数あるいはその補間を考慮
した上でピッチとしてとり得る所定の範囲内において、
自己相関関数が大きくなる順にM個のピッチ候補を決定
する。
【0041】そして、各サブフレーム中、自己相関関数
が最大となるサブフレームをピッチパスの起点とし、M
個のピッチ候補について、それぞれ符号化する際の差分
で表せる範囲内の遅延を入力音声に与えた場合に、自己
相関を最大化するピッチを決定する。このピッチの決定
を順方向及び逆方向の各サブフレームについて繰り返
す。
【0042】その結果、先頭のサブフレームから最後の
サブフレームに至るまでの上述の方法で決定された4つ
のピッチの列、即ちピッチパスがM通り生成される。こ
のM個のピッチパスから、例えば4つのサブフレームに
対する歪みの和を最小化するものなど、1フレーム全体
として最適なピッチパスを1つ選び、符号化部3に入力
すべきピッチ情報とする。
【0043】上述のように得られたピッチパス情報は、
クローズドループ探索法に基づくピッチ符号化を行うた
めに、1フレーム分が取り込まれる(ステップS1)。
そして、各サブフレームごとに順次ピッチが決定される
(ステップS2)。具体的には、前記ピッチパス情報の
各サブフレームについてのピッチの値を中心に、複数の
ピッチ候補を選定した上で、その中から、自己相関が最
大となるものを選択する。この際、いったん前記複数の
ピッチ候補から簡易な計算により数個のピッチ候補を予
備選択し、その後、その中から1個のピッチを本選択す
る構成としてもよい。
【0044】次いで、後述する処理に従い、ピッチ情報
の符号化が行われる(ステップS3)。
【0045】なお、ピッチ符号化処理は、入力音声が有
声音か否かを各サブフレームごとに判定する判定結果に
基づいて行なわれる。具体的には、入力音声のピッチ
は、声帯振動の基本周期であるから、音声が声帯振動を
伴わない無声音であるような場合には、本来ピッチは抽
出できない。そのため、有声音でないと判定されたサブ
フレームについては、ピッチの符号化は行わないことと
する。
【0046】最後に、処理すべき入力信号の有無を判断
し(ステップS4)、新たな入力信号がなく、全ての入
力信号に対する処理を終了した場合(ステップS4;Y
ES)、符号化処理を終了し、まだ処理すべき入力信号
がある場合(ステップS4;NO)、再びステップS1に
戻る。
【0047】次に、図3に、図2のステップS3に対応
する前述したピッチ情報の符号化処理の詳細についての
フローチャートを示す。
【0048】まず、ピッチ分析に際し、前記有声音か否
かの判定処理を行った上で、1フレーム内で、全てのサ
ブフレームの判定結果に応じて処理を分岐する(ステッ
プS10)。1フレーム内で全てのサブフレームが有声
音ではなく無声音と判定された場合(ステップS10;
YES)、全てのサブフレームについて、無声音として
定めたパターンにより符号化を行い(ステップS1
1)、処理を終える。
【0049】一方、有声音と判定されるサブフレームが
存在する場合(ステップS10;NO)、サブフレーム
の処理用カウンタcntをゼロクリアする(ステップS
12)。このカウンタcntは、1フレーム内で最初に
有声音と判定されるサブフレームに達したか否かを判別
するためのものであり、この値をsとして予め設定した
上で、cntとsの比較を行う(ステップS13)。
【0050】そして、cntがsに達していない場合は
(ステップS13;NO)、そのサブフレームに対する
ピッチを符号化せず、ピッチ情報の符号化をいったん保
留する(ステップS14)。その後、カウンタcntを
インクリメントした後(ステップS15)、次のサブフ
レームに対する処理に移る(ステップS13)。
【0051】一方、cntがsに達すると(ステップS
13;YES)、先頭のサブフレームに対しては、予め
定められた複数のピッチの基準値の中から、s番目のサ
ブフレームのピッチに最も近い基準値(適応コードブッ
ク5の出力はなしであるが、ピッチ情報を有する基準
値)を1つを選び、ピッチ情報として符号化する(ステ
ップS16)。
【0052】ここで、このピッチの基準値について説明
する。通常、1フレーム内の複数のサブフレームのピッ
チ情報を符号化するに際しては、図2のステップS2で
決定済みのピッチの値そのものに基づき符号化する方法
も考えられるが、1フレーム内のサブフレーム数が多い
場合などは、ピッチ情報として割り当てるデータ量が大
幅に増大するため、高能率の音声符号化を行うには適さ
ない。よって、先頭のサブフレームをピッチの値に基づ
き符号化する一方、後続のサブフレームは1つ先行する
サブフレームのピッチとの差分を求め、符号化すること
がデータ量削減に有効である。
【0053】しかし、処理すべきサブフレームが常にピ
ッチ抽出可能な有声音であれば問題ないが、無声音とな
るサブフレームについては、ピッチを符号化せず、無声
音であることを示すパターンをピッチ情報とする。よっ
て、最初の有声音となるs番目のサブフレームについて
は、s−1番目のサブフレームのピッチを抽出できない
ので、前述の差分を求めることはできない。
【0054】従って、先頭のサブフレームが無声音なら
“基準値”を持たせ、2番目〜s−1番目のサブフレー
ムを“差分0で出力なし”として符号化を行う(ステッ
プS17)。
【0055】その後、次のサブフレームに処理を進める
ため、カウンタcntをインクリメントし(ステップS
18)、cntが4に達したか否かを判断する(ステッ
プS19)。cnt=4であれば(ステップS19;Y
ES)、1フレーム内の4つの各サブフレームについて
のピッチ符号化が終了したので、処理を終える。
【0056】一方、cnt=4でなければ(ステップS
19;NO)、対象となるサブフレームが有声音である
場合は、前述の差分を求め符号化し、無声音である場合
は、“差分0で出力なし”として符号化する(ステップ
S20)。そして、cntが示す次のサブフレームに対
する処理に移る(ステップS18)。
【0057】以上の処理を行うことにより、有声音のサ
ブフレームと無声音のサブフレームをともに含んでいる
一又は複数のフレームに対しても、入力音声のピッチ情
報を適切に符号化することができる。特に、先頭部分に
おいて無声音となるサブフレームが連続した後、s番目
のサブフレームで初めて有声音と判定されるようなケー
スであっても、それ以降のサブフレームにおけるピッチ
の所定の基準値との差分を用いることで符号化が可能と
なる。
【0058】なお、上述した本発明に係る音声のピッチ
符号化方法は、コンピュータに読み取り可能なCD−R
OM、フロッピーディスク等の記録媒体に記録させるこ
とが可能である。そして、当該CD−ROM等を用いて
コンピュータにおいて音声のピッチ符号化プログラムを
インストールし、実行することにより、本発明に係るピ
ッチ符号化が実現される。
【0059】
【発明の効果】以上説明したように、請求項1に記載の
発明によれば、複数のサブフレームに対するピッチを符
号化するに際し、有声音であるか否かの判定結果に応じ
て、算出ピッチそのものに加え、所定の基準値を利用し
てピッチ又はピッチの差分値を符号化するようにしたの
で、有声音であるか否かの判定結果が1フレーム内で変
動するような場合でも、適切な符号化を行うことがで
き、データ量を増大させることなく高品質なピッチ符号
化の方法を実現することができる。
【0060】請求項2に記載の発明によれば、ピッチ又
は差分の符号化を、適応コードブックを用いて聴感重み
付け誤差電力を最小化するように求めるようにしたの
で、量子化雑音を低減するのに適した符号化ができ、デ
ータ量を増大させることなく良好な音質の得られるピッ
チ符号化を実現することができる。
【0061】請求項3に記載の発明によれば、複数のサ
ブフレームに対するピッチを符号化するに際し、有声音
であるか否かの判定結果に応じて、算出ピッチそのもの
に加え、所定の基準値を利用してピッチ又はピッチの差
分値を符号化するようにしたので、有声音であるか否か
の判定結果が1フレーム内で変動するような場合でも、
適切な符号化を行うことができ、データ量を増大させる
ことなく高品質なピッチ符号化を行うピッチ符号化装置
を提供することができる。
【0062】請求項4に記載の発明によれば、ピッチ又
は差分の符号化を、適応コードブックを用いて聴感重み
付け誤差電力を最小化するように求めるようにしたの
で、量子化雑音を低減するのに適した符号化ができ、デ
ータ量を増大させることなく良好な音質の得られるピッ
チ符号化を行うピッチ符号化装置を提供することができ
る。
【0063】請求項5に記載の発明によれば、複数のサ
ブフレームに対するピッチを符号化するに際し、有声音
であるか否かの判定結果に応じて、算出ピッチそのもの
に加え、所定の基準値を利用してピッチ又はピッチの差
分値を符号化するようにしたので、有声音であるか否か
の判定結果が1フレーム内で変動するような場合でも、
適切な符号化を行うことができ、データ量を増大させる
ことなく高品質なピッチ符号化のためのソフトウェアを
提供することができる。
【0064】請求項6に記載の発明によれば、ピッチ又
は差分の符号化を、適応コードブックを用いて聴感重み
付け誤差電力を最小化するように求めるようにしたの
で、量子化雑音を低減するのに適した符号化ができ、デ
ータ量を増大させることなく良好な音質の得られるピッ
チ符号化のためのソフトウェアを提供することができ
る。
【図面の簡単な説明】
【図1】本発明の実施形態におけるCELP符号化方式
の全体構成を示すブロック図である。
【図2】本発明の実施形態におけるクローズドループ探
索法によるピッチ符号化処理を示すフローチャートであ
る。
【図3】本発明の実施形態におけるピッチ情報の符号化
処理の詳細を示すフローチャートである。
【符号の説明】
1…ピッチ分析部 2…ピッチパス決定部 3…符号化部 4…線形予測分析部 5…適応コードブック 6…雑音コードブック 7…利得コードブック 8…重み付けフィルタ 9…合成フィルタ

Claims (6)

    【特許請求の範囲】
  1. 【請求項1】 フレーム単位に区切られた入力音声に対
    し、フレームをさらに複数に分割したサブフレーム単位
    のピッチを算出し符号化するピッチ符号化方法であっ
    て、 一又は複数のフレームに含まれる複数のサブフレームの
    ピッチを各サブフレームごとに算出する算出工程と、 前記複数のサブフレームに含まれる入力音声が声帯の振
    動を伴う有声音であるか否かを各サブフレームごとに判
    定する判定工程と、 前記複数のサブフレーム中、最初の入力音声を含むサブ
    フレームである先頭サブフレームが有声音と判定された
    場合は、前記算出した当該先頭サブフレームのピッチを
    符号化するとともに、当該先頭サブフレームが有声音で
    ないと判定され、かつ前記複数のサブフレーム中、当該
    先頭サブフレームに後続する他のサブフレームである後
    続サブフレームに有声音と判定されたサブフレームが存
    在する場合は、前記先頭サブフレームに、予め定められ
    た複数のピッチの基準値の中から一の基準値を選択して
    符号化する第1符号化工程と、 有声音と判定された前記後続サブフレームについて、前
    記複数のサブフレーム中、当該後続サブフレームに先行
    するサブフレームに有声音と判定されたサブフレームが
    存在する場合は、当該先行するサブフレームの前記算出
    したピッチと当該後続サブフレームの前記算出したピッ
    チとの差分を算出して符号化するとともに、先行するサ
    ブフレームに有声音と判定されたサブフレームが存在し
    ない場合は、前記選択した基準値と当該後続サブフレー
    ムの前記算出したピッチとの差分を算出して符号化する
    第2符号化工程と、 を備えることを特徴とするピッチ符号化方法。
  2. 【請求項2】 有声音と判定されたサブフレームに対し
    ての前記ピッチ又は前記差分の符号化は、所定期間内の
    過去の入力信号を更新しつつ保持する適応コードブック
    の再生信号と前記入力信号との聴感重み付け誤差電力が
    最小となる当該再生時の遅延により求めることを特徴と
    する請求項1に記載のピッチ符号化方法。
  3. 【請求項3】 フレーム単位に区切られた入力音声に対
    し、フレームをさらに複数に分割したサブフレーム単位
    のピッチを算出し符号化するピッチ符号化装置であっ
    て、 一又は複数のフレームに含まれる複数のサブフレームの
    ピッチを各サブフレームごとに算出する算出手段と、 前記複数のサブフレームに含まれる入力音声が声帯の振
    動を伴う有声音であるか否かを各サブフレームごとに判
    定する判定手段と、 前記複数のサブフレーム中、最初の入力音声を含むサブ
    フレームである先頭サブフレームが有声音と判定された
    場合は、前記算出した当該先頭サブフレームのピッチを
    符号化するとともに、当該先頭サブフレームが有声音で
    ないと判定され、かつ前記複数のサブフレーム中、当該
    先頭サブフレームに後続する他のサブフレームである後
    続サブフレームに有声音と判定されたサブフレームが存
    在する場合は、前記先頭サブフレームに、予め定められ
    た複数のピッチの基準値の中から一の基準値を選択して
    符号化する第1符号化手段と、 有声音と判定された前記後続サブフレームについて、前
    記複数のサブフレーム中、当該後続サブフレームに先行
    するサブフレームに有声音と判定されたサブフレームが
    存在する場合は、当該先行するサブフレームの前記算出
    したピッチと当該後続サブフレームの前記算出したピッ
    チとの差分を算出して符号化するとともに、先行するサ
    ブフレームに有声音と判定されたサブフレームが存在し
    ない場合は、前記選択した基準値と当該後続サブフレー
    ムの前記算出したピッチとの差分を算出して符号化する
    第2符号化手段と、 を備えることを特徴とするピッチ符号化装置。
  4. 【請求項4】 有声音と判定されたサブフレームに対し
    ての前記ピッチ又は前記差分の符号化は、所定期間内の
    過去の入力信号を更新しつつ保持する適応コードブック
    の再生信号と前記入力信号との聴感重み付け誤差電力が
    最小となる当該再生時の遅延により求めることを特徴と
    する請求項3に記載のピッチ符号化装置。
  5. 【請求項5】 コンピュータに、フレーム単位に区切ら
    れた入力音声に対し、フレームをさらに複数に分割した
    サブフレーム単位のピッチを算出し符号化するピッチ符
    号化方法を実行させるためのプログラムを記録した記録
    媒体であって、 一又は複数のフレームに含まれる複数のサブフレームの
    ピッチを各サブフレームごとに算出する算出工程と、 前記複数のサブフレームに含まれる入力音声が声帯の振
    動を伴う有声音であるか否かを各サブフレームごとに判
    定する判定工程と、 前記複数のサブフレーム中、最初の入力音声を含むサブ
    フレームである先頭サブフレームが有声音と判定された
    場合は、前記算出した当該先頭サブフレームのピッチを
    符号化するとともに、当該先頭サブフレームが有声音で
    ないと判定され、かつ前記複数のサブフレーム中、当該
    先頭サブフレームに後続する他のサブフレームである後
    続サブフレームに有声音と判定されたサブフレームが存
    在する場合は、前記先頭サブフレームに、予め定められ
    た複数のピッチの基準値の中から一の基準値を選択して
    符号化する第1符号化工程と、 有声音と判定された前記後続サブフレームについて、前
    記複数のサブフレーム中、当該後続サブフレームに先行
    するサブフレームに有声音と判定されたサブフレームが
    存在する場合は、当該先行するサブフレームの前記算出
    したピッチと当該後続サブフレームの前記算出したピッ
    チとの差分を算出して符号化するとともに、先行するサ
    ブフレームに有声音と判定されたサブフレームが存在し
    ない場合は、前記選択した基準値と当該後続サブフレー
    ムの前記算出したピッチとの差分を算出して符号化する
    第2符号化工程と、 を備えることを特徴とするピッチ符号化方法を実行させ
    るためのプログラムを記録した記録媒体。
  6. 【請求項6】 有声音と判定されたサブフレームに対し
    ての前記ピッチ又は前記差分の符号化は、所定期間内の
    過去の入力信号を更新しつつ保持する適応コードブック
    の再生信号と前記入力信号との聴感重み付け誤差電力が
    最小となる当該再生時の遅延により求めることを特徴と
    する請求項5に記載のピッチ符号化方法を実行させるた
    めのプログラムを記録した記録媒体。
JP04593398A 1998-02-26 1998-02-26 音声のピッチ符号化方法及び音声のピッチ符号化装置並びに音声のピッチ符号化プログラムが記録された記録媒体 Expired - Fee Related JP3618217B2 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP04593398A JP3618217B2 (ja) 1998-02-26 1998-02-26 音声のピッチ符号化方法及び音声のピッチ符号化装置並びに音声のピッチ符号化プログラムが記録された記録媒体
US09/257,382 US6219636B1 (en) 1998-02-26 1999-02-25 Audio pitch coding method, apparatus, and program storage device calculating voicing and pitch of subframes of a frame

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP04593398A JP3618217B2 (ja) 1998-02-26 1998-02-26 音声のピッチ符号化方法及び音声のピッチ符号化装置並びに音声のピッチ符号化プログラムが記録された記録媒体

Publications (2)

Publication Number Publication Date
JPH11242498A true JPH11242498A (ja) 1999-09-07
JP3618217B2 JP3618217B2 (ja) 2005-02-09

Family

ID=12733076

Family Applications (1)

Application Number Title Priority Date Filing Date
JP04593398A Expired - Fee Related JP3618217B2 (ja) 1998-02-26 1998-02-26 音声のピッチ符号化方法及び音声のピッチ符号化装置並びに音声のピッチ符号化プログラムが記録された記録媒体

Country Status (2)

Country Link
US (1) US6219636B1 (ja)
JP (1) JP3618217B2 (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005292640A (ja) * 2004-04-02 2005-10-20 Casio Comput Co Ltd 音声符号化装置、方法及びプログラム、並びに音声復号装置、方法及びプログラム
WO2008155919A1 (ja) * 2007-06-21 2008-12-24 Panasonic Corporation 適応音源ベクトル量子化装置および適応音源ベクトル量子化方法
US7603271B2 (en) 2004-12-14 2009-10-13 Lg Electronics Inc. Speech coding apparatus with perceptual weighting and method therefor

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6418407B1 (en) * 1999-09-30 2002-07-09 Motorola, Inc. Method and apparatus for pitch determination of a low bit rate digital voice message
GB2357683A (en) * 1999-12-24 2001-06-27 Nokia Mobile Phones Ltd Voiced/unvoiced determination for speech coding
WO2003019527A1 (fr) * 2001-08-31 2003-03-06 Kabushiki Kaisha Kenwood Procede et appareil de generation d'un signal affecte d'un pas et procede et appareil de compression/decompression et de synthese d'un signal vocal l'utilisant
WO2010131604A1 (ja) 2009-05-15 2010-11-18 株式会社日本触媒 (メタ)アクリル酸の製造方法
US8670990B2 (en) * 2009-08-03 2014-03-11 Broadcom Corporation Dynamic time scale modification for reduced bit rate audio coding

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4989250A (en) * 1988-02-19 1991-01-29 Sanyo Electric Co., Ltd. Speech synthesizing apparatus and method
DE68923771T2 (de) * 1988-12-23 1995-12-14 Nippon Electric Co Sprachübertragungssystem unter Anwendung von Mehrimpulsanregung.
US5657418A (en) * 1991-09-05 1997-08-12 Motorola, Inc. Provision of speech coder gain information using multiple coding modes
US5495555A (en) * 1992-06-01 1996-02-27 Hughes Aircraft Company High quality low bit rate celp-based speech codec
US5732389A (en) * 1995-06-07 1998-03-24 Lucent Technologies Inc. Voiced/unvoiced classification of speech for excitation codebook selection in celp speech decoding during frame erasures

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005292640A (ja) * 2004-04-02 2005-10-20 Casio Comput Co Ltd 音声符号化装置、方法及びプログラム、並びに音声復号装置、方法及びプログラム
US7603271B2 (en) 2004-12-14 2009-10-13 Lg Electronics Inc. Speech coding apparatus with perceptual weighting and method therefor
WO2008155919A1 (ja) * 2007-06-21 2008-12-24 Panasonic Corporation 適応音源ベクトル量子化装置および適応音源ベクトル量子化方法

Also Published As

Publication number Publication date
JP3618217B2 (ja) 2005-02-09
US6219636B1 (en) 2001-04-17

Similar Documents

Publication Publication Date Title
US8185385B2 (en) Method for searching fixed codebook based upon global pulse replacement
US5060269A (en) Hybrid switched multi-pulse/stochastic speech coding technique
KR101406113B1 (ko) 스피치 신호에서 천이 프레임을 코딩하기 위한 방법 및 장치
JP2004163959A (ja) 汎用AbS音声符号化方法及びそのような方法を用いた符号化装置
JP3357795B2 (ja) 音声符号化方法および装置
JP3618217B2 (ja) 音声のピッチ符号化方法及び音声のピッチ符号化装置並びに音声のピッチ符号化プログラムが記録された記録媒体
JP2000112498A (ja) 音声符号化方法
JP3531780B2 (ja) 音声符号化方法および復号化方法
JP2002207499A (ja) 非常に低いビット・レートで作動する音声符号器のための韻律を符号化する方法
JPH04344699A (ja) 音声符号化・復号化方法
JPH0782360B2 (ja) 音声分析合成方法
JP2931059B2 (ja) 音声合成方式およびこれに用いる装置
JP3559485B2 (ja) 音声信号の後処理方法および装置並びにプログラムを記録した記録媒体
JP3583945B2 (ja) 音声符号化方法
JP3916934B2 (ja) 音響パラメータ符号化、復号化方法、装置及びプログラム、音響信号符号化、復号化方法、装置及びプログラム、音響信号送信装置、音響信号受信装置
JP3088204B2 (ja) コード励振線形予測符号化装置及び復号化装置
JP2000235400A (ja) 音響信号符号化装置、復号化装置、これらの方法、及びプログラム記録媒体
JP3552201B2 (ja) 音声符号化方法および装置
JP3296411B2 (ja) 音声符号化方法および復号化方法
JPH1195799A (ja) 音声符号化装置及び音声符号化におけるピッチ予測方法
JP3515216B2 (ja) 音声符号化装置
JPH08211895A (ja) ピッチラグを評価するためのシステムおよび方法、ならびに音声符号化装置および方法
JP2947788B1 (ja) 音声および音響信号の高速な符号化方法および装置および記録媒体
JPH11296195A (ja) 音響信号の符号化方法、復号方法、そのプログラム記録媒体、およびこれに用いる符号帳
JP3229784B2 (ja) 音声符号化復号化装置及び音声復号化装置

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20040702

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20040713

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20040913

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20041109

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20041109

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

LAPS Cancellation because of no payment of annual fees