JPH0922300A

JPH0922300A - 音声符号化方法

Info

Publication number: JPH0922300A
Application number: JP7170720A
Authority: JP
Inventors: Kunihiko Owa; 邦彦尾和; Makoto Shosakai; 誠庄境
Original assignee: Asahi Chemical Industry Co Ltd
Current assignee: Asahi Chemical Industry Co Ltd
Priority date: 1995-07-06
Filing date: 1995-07-06
Publication date: 1997-01-21

Abstract

(57)【要約】【課題】フレーム周期を越えて音声符号化を行っても
音質の劣化を生じさせないようにする。【解決手段】フレーム周期を越えて音声符号化が符号
検索部１０９で行われている場合、サンプルデータ除去
１０４は、次回に符号化の処理対象となるデジタル音声
データの一部をデジタル音声データバッファ１０２にお
いて除去する。

Description

【発明の詳細な説明】

【０００１】

【発明の属する技術分野】本発明は、デジタル音声を情
報圧縮して符号化するための音声符号化方法に関する。

【０００２】

【従来の技術】音声符号化方法はデジタル自動車電話の
デジタル音声の伝送や、留守番電話機のメッセージ録音
に使用されている。音声の符号化処理として入力音声信
号の固定長のフレームに分割し、所定周期でフレーム毎
にデジタル音声信号を符号化する方法（ＥＴＳＩ／ＧＳ
ＭＧＳＭ０６．１０ＦｕｌｌＲａｔｅＳｐｅｅ
ｃｈＴｒａｎｃｏｄｉｎｇ等）が広く用いられてい
る。

【０００３】この符号化方法では図１に示すようにタイ
ミング（１）で音声符号化装置に収集された入力音声信
号の第１番目のフレームは、次のタイミング（２）で２
番目のフレームが収集されている間に、すなわち、時間
Ｔの間に、符号化処理される。以下、順次に収集された
フレームは１フレーム後の収集タイミングに同期して符
号化処理される。たとえば、８ｋＨｚでサンプリングさ
れている音声信号をＴ＝２０ｍｓの周期で符号化する場
合、１フレームで１６０ポイントの音声データが収集さ
れる。この１６０ポイントの音声データを次回の収集時
間で音声データを、例えばＦＦＴ等を用いて圧縮符号化
する。

【０００４】

【発明が解決しようとする課題】収集した１フレームの
データを圧縮符号化する際、収集されたデータによって
符号化処理時間がばらつくことが知られている。従っ
て、符号化処理を行うＤＳＰ等の処理速度は、通常想定
される最大の処理時間が１フレームの収集時間内に収ま
るように設計されている。

【０００５】しかし、高速のＤＳＰを用いると、ハード
ウェア（回路規格）が増大し、電流消費を大きくし、コ
ストを増やすという問題がある。しかも、最大処理時間
を必要とするような音声データは滅多に現れないもので
ある。

【０００６】一方、ＤＳＰの処理速度を低くすると音声
データの符号化処理、例えばＦＦＴが間にあわなくなる
場合がある。この場合、エラー扱いとせざるを得ず、そ
のフレームが雑音となって、音質の低下を招くことがあ
った。

【０００７】また、低速のＤＳＰを用い、かつ、符号化
処理を行うためには、データ収集のフレームを長くすれ
ば良いが、そうすると音声の安定化を損い音声が劣化す
るという問題があった。

【０００８】そこで、本発明の目的は、上述の点に鑑み
て、符号化処理の一部が１フレーム内未処理となるよう
なフレーム周期を短く設定したときに、未処理分を次タ
イミングで処理可能とすることが可能な音声符号化方法
を提供することにある。

【０００９】

【課題を解決するための手段】このような目的を達成す
るために、請求項１の発明は、所定のフレーム毎に順次
に新たなデジタル音声データを収集し、収集された所定
数のデジタル音声データを次のフレームタイミングで符
号化する音声符号化方法において、前記符号化の処理時
間が前記フレームタイミングよりも長くなることを許容
し、前記符号化の処理時間が前記フレームよりも長くな
った場合には、次のフレームタイミングで収集されるデ
ジタル音声データの一部が除去され、続けてデジタル音
声データを収集することを特徴とする。

【００１０】さらに請求項２の発明は、前記デジタル音
声データのピッチ周期を検出し、前記フーレム内のデジ
タル音声データのうち１ピッチの整数倍分のデジタル音
声データを除去することを特徴とする。

【００１１】請求項１の発明では、あるフレームについ
ての符号化処理時間がフレーム時間を超えると、そのフ
レームで収集されているデジタル音声データの一部が除
去され、更にデジタル音声データを収集し続ける。その
結果、次回行われる符号化処理開始時間が短くなるの
で、今回の符号化処理時間の遅れも符号化できる。

【００１２】請求項２の発明では、１ピッチ周期分のデ
ータを除去するので、音声信号の連続性が保たれ、音質
の劣化を生じることもない。

【００１３】

【発明の実施の形態】以下、図面を参照して本発明の実
施例を詳細に説明する。

【００１４】本発明に関わる音声符号化方法を図２およ
び図３を用いて説明する。本実施例も通常は従来と同様
フレーム周期Ｔでデータ収集を行う。

【００１５】ただし、本実施例では、音声符号化処理時
間がフレーム周期Ｔを越えるような場合、すなわち、図
２における音声符号化処理（１）のような場合、タイミ
ング（２）で収集したデータのうちＤに相当する部分を
除去し、新たに（２）”を収集する。

【００１６】従って、次のタイミングで音声符号化処理
するデータは（２）のうちの（２）’と（２）”が加わ
ったものとなる。また、音声符号化処理の開始は削除さ
れたＤの時間だけ遅れ、その間に（１）の音声符号化処
理を終了することができる。

【００１７】このとき、データ収集された（２）のう
ち、Ｄの部分を除去する場合には、音声信号のピッチを
調べ、図３に示すように１ピッチ分のデータを除去す
る。このような処理を行うと音声信号の連続性が保た
れ、音質の低下を阻止することができる。同じ音声の波
形が連続している場合には、複数ピッチ除去すれば、さ
らに音声符号化処理時間に余裕を持たせることができ
る。

【００１８】このような音声符号化方法を適用した留守
番電話機のシステム構成を図４に示す。図４において、
マイクロホン１から入力された音声メッセージは、変・
復調器（ＣＯＤＥＣ）２により変調、デジタル信号化さ
れる。このデジタル信号が音声符号化装置３に入力さ
れ、音声符号化される。符号化された音声データがメモ
リ４に保存される。

【００１９】音声符号化装置３のブロック構成を図５に
示す。

【００２０】なお、図５の音声符号化装置は、例えば、
１フレームを３００サンプルとして音声符号化するもの
とし、フレームシフトは１６０サンプル毎とする。従っ
て、例えば８ｋＨｚのサンプリングレートで音声収集さ
れると、フレームはＴ＝２０ｍｓでシフトされる。すな
わち、２０ｍｓ毎に新たに１６０ポイントが収集され、
すでに収集された１４０ポイントと合わせて、１フレー
ムが形成される。次の１フレームは古い１６０ポイント
が捨てられ、最新の１４０ポイントと新たに収集された
１６０ポイントとで３００サンプルとなる。

【００２１】図５において、符号化対象のデジタル音声
データは、デジタル音声データ収集部１０１で収集さ
れ、フレームサンプルカウント部１１０でカウントされ
た後、フレームデータバッファ１０２に順次蓄積され
る。

【００２２】１フレーム分のデータが蓄積された時点で
フレームサンプルカウント部１１０からフレームデータ
収集完了通知がフレーム同期検出部１０８に出力され
る。

【００２３】フレーム同期検出部１０８は、符号化処理
を行う符号検索部１０９から出力される符号化終了通知
とフレームデータ収集完了通知とを比較し、フレームデ
ータ収集完了通知が符号化終了通知より後に入力されれ
ば、正常に動作していると判断し、次のフレームの符号
化を開始するように指示する（図示せず）。

【００２４】これにより、フレームデータバッファ１０
２に蓄積されたデジタル音声データのうち３００サンプ
ルがワークメモリ１０５に出力されると共に、ピッチ抽
出部１０３および音響解析部１０６に出力され、それぞ
れピッチと音響パラメータが抽出され、これらを基に符
号テーブル１０７の符号情報を参照して符号検索部１０
９で符号化がなされる。このピッチ同期の検出には従来
知られている手法を用いることもできる。

【００２５】一方、フレーム同期検出部１０８にフレー
ムデータ収集完了通知が符号化終了通知より前に入力さ
れれば、このとき符号化が終了していないため、サンプ
ルデータ除去部１０４に対して除去指示が出力される。
このピッチ周期の検出には従来知られている手法を用い
ることもできる。

【００２６】サンプルデータ除去部１０４は、除去指示
を受け取ると、フレームデータバッファ１０２からデジ
タル音声データを読込むと共に、ピッチ抽出部１０３か
ら１フレーム前のピッチ周期を読み込み、そのピッチ周
期で１ピッチ分のデジタル音声データを削除する。さら
に、除去したサンプル数を除去カウント数としてフレー
ムサンプルカウント部１１０に出力する。

【００２７】除去されたフレーム音声データは、フレー
ムサンプルデータ接合部１１１に入力され、除去部分を
接合され、接合されたサンプルデータは再びフレームデ
ータバッファ１０２に入力される。フレームデータバッ
ファ１０２の最後尾のデータのみを除去する場合には、
データを接合する必要がないので、このフレームサンプ
ルデータ接合部１１１を省略することができる。

【００２８】フレームサンプルカウント部１１０では、
除去カウント数を入力されると、サンプルカウント１１
０を減数し、再び収集されるデジタル音声データをカウ
ントする。従って、フレームデータ収集完了通知を遅延
させ、フレームデータバッファ１０２には、除去された
数をデジタル音声データを続けて蓄積することができ
る。

【００２９】以上、システム構成の本発明に関わる処理
手順を図６に示した。

【００３０】すなわち、１フレーム分の音声信号デジタ
ルデータの収集が完了し（ステップＳ１０のＹＥＳ判
定）、前フレームの音声符号化処理が完了していない場
合（ステップＳ２０のＮＯ判定）、１ピッチ分の音声サ
ンプルが入力デジタル音声サンプル（デジタル音声デー
タバッファに現在、蓄積中のデータ）の中から除去され
る。また、この処理は、ステップＳ２０〜Ｓ４０の繰り
返し周期で前フレームの音声符号化処理が完了するまで
繰り返される。

【００３１】本実施例の他に次の例を実施できる。

【００３２】１）本実施例で述べた符号化処理の方法
それ自体は従来から用いられている各種方法を用いるこ
とができる。本実施例では１フレーム３００サンプルを
符号化する場合について説明したが、１フレームのサン
プル数を不定にしてもよい。

【００３３】２）本実施例では、１ピッチ周期分のデ
ータを除去したが、数ピッチ周期分のデータを連続に除
去してもよいし、１ピッチ周期分のデータを複数個間欠
的に除去してもよい。

【００３４】３）図５に示す回路をデジタル回路で実
現してもよいし、ＣＰＵが実行するソフトウェア処理で
実現してもよい。

【００３５】

【発明の効果】以上、説明したように、請求項１の発明
では、あるフレームについての符号化処理時間がフレー
ム時間を超えると、そのフレームで収集されているデジ
タル音声データのデータ量が減らされる。その結果、次
回行われる符号化処理開始時間が遅くなるので、音声符
号化を完了することができる。

【００３６】請求項２の発明では、１ピッチ周期の整数
倍分のデータを間欠的に除去するので、音声信号の連続
性が保たれ、音質の劣化を生じることもない。

【図面の簡単な説明】

【図１】従来の符号化処理タイミングを示す説明図であ
る。

【図２】本発明の符号化処理タイミングを示す説明図で
ある。

【図３】データ除去部分の信号波形を示す波形図であ
る。

【図４】本発明を適用した留守番電話機のシステム構成
を示すフローチャートである。

【図５】音声符号化装置３の回路構成を示すブロック図
である。

【図６】本発明実施例の処理手順を示すフローチャート
である。

【符号の説明】

１マイクロホン２変・復調器３音声符号化装置４メモリ

Claims

【特許請求の範囲】

【請求項１】所定のフレーム毎に順次に新たなデジタ
ル音声データを収集し、収集された所定数のデジタル音
声データを次のフレームタイミングで符号化する音声符
号化方法において、前記符号化の処理時間が前記フレームタイミングよりも
長くなることを許容し、前記符号化の処理時間が前記フレームよりも長くなった
場合には、次のフレームタイミングで収集されるデジタ
ル音声データの一部が除去され、続けてデジタル音声デ
ータを収集することを特徴とする音声符号化方法。
【請求項２】前記デジタル音声データのピッチ周期を
検出し、前記フレーム内のデジタル音声データのうち１
ピッチの整数倍分のデジタル音声データを除去すること
を特徴とする請求項１に記載の音声符号化方法。