JPH0922300A - 音声符号化方法 - Google Patents

音声符号化方法

Info

Publication number
JPH0922300A
JPH0922300A JP7170720A JP17072095A JPH0922300A JP H0922300 A JPH0922300 A JP H0922300A JP 7170720 A JP7170720 A JP 7170720A JP 17072095 A JP17072095 A JP 17072095A JP H0922300 A JPH0922300 A JP H0922300A
Authority
JP
Japan
Prior art keywords
frame
data
encoding
pitch
voice data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
JP7170720A
Other languages
English (en)
Inventor
Kunihiko Owa
邦彦 尾和
Makoto Shosakai
誠 庄境
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Asahi Chemical Industry Co Ltd
Original Assignee
Asahi Chemical Industry Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Asahi Chemical Industry Co Ltd filed Critical Asahi Chemical Industry Co Ltd
Priority to JP7170720A priority Critical patent/JPH0922300A/ja
Publication of JPH0922300A publication Critical patent/JPH0922300A/ja
Withdrawn legal-status Critical Current

Links

Landscapes

  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

(57)【要約】 【課題】 フレーム周期を越えて音声符号化を行っても
音質の劣化を生じさせないようにする。 【解決手段】 フレーム周期を越えて音声符号化が符号
検索部109で行われている場合、サンプルデータ除去
104は、次回に符号化の処理対象となるデジタル音声
データの一部をデジタル音声データバッファ102にお
いて除去する。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、デジタル音声を情
報圧縮して符号化するための音声符号化方法に関する。
【0002】
【従来の技術】音声符号化方法はデジタル自動車電話の
デジタル音声の伝送や、留守番電話機のメッセージ録音
に使用されている。音声の符号化処理として入力音声信
号の固定長のフレームに分割し、所定周期でフレーム毎
にデジタル音声信号を符号化する方法(ETSI/GS
M GSM06.10 Full Rate Spee
ch Trancoding等)が広く用いられてい
る。
【0003】この符号化方法では図1に示すようにタイ
ミング(1)で音声符号化装置に収集された入力音声信
号の第1番目のフレームは、次のタイミング(2)で2
番目のフレームが収集されている間に、すなわち、時間
Tの間に、符号化処理される。以下、順次に収集された
フレームは1フレーム後の収集タイミングに同期して符
号化処理される。たとえば、8kHzでサンプリングさ
れている音声信号をT=20msの周期で符号化する場
合、1フレームで160ポイントの音声データが収集さ
れる。この160ポイントの音声データを次回の収集時
間で音声データを、例えばFFT等を用いて圧縮符号化
する。
【0004】
【発明が解決しようとする課題】収集した1フレームの
データを圧縮符号化する際、収集されたデータによって
符号化処理時間がばらつくことが知られている。従っ
て、符号化処理を行うDSP等の処理速度は、通常想定
される最大の処理時間が1フレームの収集時間内に収ま
るように設計されている。
【0005】しかし、高速のDSPを用いると、ハード
ウェア(回路規格)が増大し、電流消費を大きくし、コ
ストを増やすという問題がある。しかも、最大処理時間
を必要とするような音声データは滅多に現れないもので
ある。
【0006】一方、DSPの処理速度を低くすると音声
データの符号化処理、例えばFFTが間にあわなくなる
場合がある。この場合、エラー扱いとせざるを得ず、そ
のフレームが雑音となって、音質の低下を招くことがあ
った。
【0007】また、低速のDSPを用い、かつ、符号化
処理を行うためには、データ収集のフレームを長くすれ
ば良いが、そうすると音声の安定化を損い音声が劣化す
るという問題があった。
【0008】そこで、本発明の目的は、上述の点に鑑み
て、符号化処理の一部が1フレーム内未処理となるよう
なフレーム周期を短く設定したときに、未処理分を次タ
イミングで処理可能とすることが可能な音声符号化方法
を提供することにある。
【0009】
【課題を解決するための手段】このような目的を達成す
るために、請求項1の発明は、所定のフレーム毎に順次
に新たなデジタル音声データを収集し、収集された所定
数のデジタル音声データを次のフレームタイミングで符
号化する音声符号化方法において、前記符号化の処理時
間が前記フレームタイミングよりも長くなることを許容
し、前記符号化の処理時間が前記フレームよりも長くな
った場合には、次のフレームタイミングで収集されるデ
ジタル音声データの一部が除去され、続けてデジタル音
声データを収集することを特徴とする。
【0010】さらに請求項2の発明は、前記デジタル音
声データのピッチ周期を検出し、前記フーレム内のデジ
タル音声データのうち1ピッチの整数倍分のデジタル音
声データを除去することを特徴とする。
【0011】請求項1の発明では、あるフレームについ
ての符号化処理時間がフレーム時間を超えると、そのフ
レームで収集されているデジタル音声データの一部が除
去され、更にデジタル音声データを収集し続ける。その
結果、次回行われる符号化処理開始時間が短くなるの
で、今回の符号化処理時間の遅れも符号化できる。
【0012】請求項2の発明では、1ピッチ周期分のデ
ータを除去するので、音声信号の連続性が保たれ、音質
の劣化を生じることもない。
【0013】
【発明の実施の形態】以下、図面を参照して本発明の実
施例を詳細に説明する。
【0014】本発明に関わる音声符号化方法を図2およ
び図3を用いて説明する。本実施例も通常は従来と同様
フレーム周期Tでデータ収集を行う。
【0015】ただし、本実施例では、音声符号化処理時
間がフレーム周期Tを越えるような場合、すなわち、図
2における音声符号化処理(1)のような場合、タイミ
ング(2)で収集したデータのうちDに相当する部分を
除去し、新たに(2)”を収集する。
【0016】従って、次のタイミングで音声符号化処理
するデータは(2)のうちの(2)’と(2)”が加わ
ったものとなる。また、音声符号化処理の開始は削除さ
れたDの時間だけ遅れ、その間に(1)の音声符号化処
理を終了することができる。
【0017】このとき、データ収集された(2)のう
ち、Dの部分を除去する場合には、音声信号のピッチを
調べ、図3に示すように1ピッチ分のデータを除去す
る。このような処理を行うと音声信号の連続性が保た
れ、音質の低下を阻止することができる。同じ音声の波
形が連続している場合には、複数ピッチ除去すれば、さ
らに音声符号化処理時間に余裕を持たせることができ
る。
【0018】このような音声符号化方法を適用した留守
番電話機のシステム構成を図4に示す。図4において、
マイクロホン1から入力された音声メッセージは、変・
復調器(CODEC)2により変調、デジタル信号化さ
れる。このデジタル信号が音声符号化装置3に入力さ
れ、音声符号化される。符号化された音声データがメモ
リ4に保存される。
【0019】音声符号化装置3のブロック構成を図5に
示す。
【0020】なお、図5の音声符号化装置は、例えば、
1フレームを300サンプルとして音声符号化するもの
とし、フレームシフトは160サンプル毎とする。従っ
て、例えば8kHzのサンプリングレートで音声収集さ
れると、フレームはT=20msでシフトされる。すな
わち、20ms毎に新たに160ポイントが収集され、
すでに収集された140ポイントと合わせて、1フレー
ムが形成される。次の1フレームは古い160ポイント
が捨てられ、最新の140ポイントと新たに収集された
160ポイントとで300サンプルとなる。
【0021】図5において、符号化対象のデジタル音声
データは、デジタル音声データ収集部101で収集さ
れ、フレームサンプルカウント部110でカウントされ
た後、フレームデータバッファ102に順次蓄積され
る。
【0022】1フレーム分のデータが蓄積された時点で
フレームサンプルカウント部110からフレームデータ
収集完了通知がフレーム同期検出部108に出力され
る。
【0023】フレーム同期検出部108は、符号化処理
を行う符号検索部109から出力される符号化終了通知
とフレームデータ収集完了通知とを比較し、フレームデ
ータ収集完了通知が符号化終了通知より後に入力されれ
ば、正常に動作していると判断し、次のフレームの符号
化を開始するように指示する(図示せず)。
【0024】これにより、フレームデータバッファ10
2に蓄積されたデジタル音声データのうち300サンプ
ルがワークメモリ105に出力されると共に、ピッチ抽
出部103および音響解析部106に出力され、それぞ
れピッチと音響パラメータが抽出され、これらを基に符
号テーブル107の符号情報を参照して符号検索部10
9で符号化がなされる。このピッチ同期の検出には従来
知られている手法を用いることもできる。
【0025】一方、フレーム同期検出部108にフレー
ムデータ収集完了通知が符号化終了通知より前に入力さ
れれば、このとき符号化が終了していないため、サンプ
ルデータ除去部104に対して除去指示が出力される。
このピッチ周期の検出には従来知られている手法を用い
ることもできる。
【0026】サンプルデータ除去部104は、除去指示
を受け取ると、フレームデータバッファ102からデジ
タル音声データを読込むと共に、ピッチ抽出部103か
ら1フレーム前のピッチ周期を読み込み、そのピッチ周
期で1ピッチ分のデジタル音声データを削除する。さら
に、除去したサンプル数を除去カウント数としてフレー
ムサンプルカウント部110に出力する。
【0027】除去されたフレーム音声データは、フレー
ムサンプルデータ接合部111に入力され、除去部分を
接合され、接合されたサンプルデータは再びフレームデ
ータバッファ102に入力される。フレームデータバッ
ファ102の最後尾のデータのみを除去する場合には、
データを接合する必要がないので、このフレームサンプ
ルデータ接合部111を省略することができる。
【0028】フレームサンプルカウント部110では、
除去カウント数を入力されると、サンプルカウント11
0を減数し、再び収集されるデジタル音声データをカウ
ントする。従って、フレームデータ収集完了通知を遅延
させ、フレームデータバッファ102には、除去された
数をデジタル音声データを続けて蓄積することができ
る。
【0029】以上、システム構成の本発明に関わる処理
手順を図6に示した。
【0030】すなわち、1フレーム分の音声信号デジタ
ルデータの収集が完了し(ステップS10のYES判
定)、前フレームの音声符号化処理が完了していない場
合(ステップS20のNO判定)、1ピッチ分の音声サ
ンプルが入力デジタル音声サンプル(デジタル音声デー
タバッファに現在、蓄積中のデータ)の中から除去され
る。また、この処理は、ステップS20〜S40の繰り
返し周期で前フレームの音声符号化処理が完了するまで
繰り返される。
【0031】本実施例の他に次の例を実施できる。
【0032】1) 本実施例で述べた符号化処理の方法
それ自体は従来から用いられている各種方法を用いるこ
とができる。本実施例では1フレーム300サンプルを
符号化する場合について説明したが、1フレームのサン
プル数を不定にしてもよい。
【0033】2) 本実施例では、1ピッチ周期分のデ
ータを除去したが、数ピッチ周期分のデータを連続に除
去してもよいし、1ピッチ周期分のデータを複数個間欠
的に除去してもよい。
【0034】3) 図5に示す回路をデジタル回路で実
現してもよいし、CPUが実行するソフトウェア処理で
実現してもよい。
【0035】
【発明の効果】以上、説明したように、請求項1の発明
では、あるフレームについての符号化処理時間がフレー
ム時間を超えると、そのフレームで収集されているデジ
タル音声データのデータ量が減らされる。その結果、次
回行われる符号化処理開始時間が遅くなるので、音声符
号化を完了することができる。
【0036】請求項2の発明では、1ピッチ周期の整数
倍分のデータを間欠的に除去するので、音声信号の連続
性が保たれ、音質の劣化を生じることもない。
【図面の簡単な説明】
【図1】従来の符号化処理タイミングを示す説明図であ
る。
【図2】本発明の符号化処理タイミングを示す説明図で
ある。
【図3】データ除去部分の信号波形を示す波形図であ
る。
【図4】本発明を適用した留守番電話機のシステム構成
を示すフローチャートである。
【図5】音声符号化装置3の回路構成を示すブロック図
である。
【図6】本発明実施例の処理手順を示すフローチャート
である。
【符号の説明】
1 マイクロホン 2 変・復調器 3 音声符号化装置 4 メモリ

Claims (2)

    【特許請求の範囲】
  1. 【請求項1】 所定のフレーム毎に順次に新たなデジタ
    ル音声データを収集し、収集された所定数のデジタル音
    声データを次のフレームタイミングで符号化する音声符
    号化方法において、 前記符号化の処理時間が前記フレームタイミングよりも
    長くなることを許容し、 前記符号化の処理時間が前記フレームよりも長くなった
    場合には、次のフレームタイミングで収集されるデジタ
    ル音声データの一部が除去され、続けてデジタル音声デ
    ータを収集することを特徴とする音声符号化方法。
  2. 【請求項2】 前記デジタル音声データのピッチ周期を
    検出し、前記フレーム内のデジタル音声データのうち1
    ピッチの整数倍分のデジタル音声データを除去すること
    を特徴とする請求項1に記載の音声符号化方法。
JP7170720A 1995-07-06 1995-07-06 音声符号化方法 Withdrawn JPH0922300A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP7170720A JPH0922300A (ja) 1995-07-06 1995-07-06 音声符号化方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP7170720A JPH0922300A (ja) 1995-07-06 1995-07-06 音声符号化方法

Publications (1)

Publication Number Publication Date
JPH0922300A true JPH0922300A (ja) 1997-01-21

Family

ID=15910152

Family Applications (1)

Application Number Title Priority Date Filing Date
JP7170720A Withdrawn JPH0922300A (ja) 1995-07-06 1995-07-06 音声符号化方法

Country Status (1)

Country Link
JP (1) JPH0922300A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2009150894A1 (ja) * 2008-06-10 2009-12-17 日本電気株式会社 音声認識システム、音声認識方法および音声認識用プログラムが格納された記憶媒体

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2009150894A1 (ja) * 2008-06-10 2009-12-17 日本電気株式会社 音声認識システム、音声認識方法および音声認識用プログラムが格納された記憶媒体
US8886527B2 (en) 2008-06-10 2014-11-11 Nec Corporation Speech recognition system to evaluate speech signals, method thereof, and storage medium storing the program for speech recognition to evaluate speech signals

Similar Documents

Publication Publication Date Title
US6785644B2 (en) Alternate window compression/decompression method, apparatus, and system
JP3402748B2 (ja) 音声信号のピッチ周期抽出装置
JPH0922300A (ja) 音声符号化方法
US4845753A (en) Pitch detecting device
JP3418005B2 (ja) 音声ピッチ検出装置
US5621851A (en) Method of expanding differential PCM data of speech signals
JP3422716B2 (ja) 話速変換方法および装置および話速変換プログラムを格納した記録媒体
JPS63281199A (ja) 音声セグメンテ−ション装置
JPS6029800A (ja) 音声分析方式
JP2006279809A (ja) 音声再生装置および音声再生方法
JP2002297200A (ja) 話速変換装置
CN1064159C (zh) 语音检测装置
JP3919359B2 (ja) 楽音信号のアタック位置検出装置
JPH02310600A (ja) マルチパルス音声符号化方法
JPS60101598A (ja) 音声区間検出装置
JPH0766272B2 (ja) 音声セグメンテ−ション装置
JPS59102296A (ja) ピツチ抽出方法
JPH04251299A (ja) 音声区間検出方法
JPH0736491A (ja) ピッチ抽出装置
JP2001265368A (ja) 音声認識装置および認識対象検出方法
JPH09198077A (ja) 音声認識システム
JPH04301696A (ja) 音声信号処理装置
JPH02114300A (ja) ピッチ抽出用フィルタおよびピッチ抽出装置
JP2004178705A (ja) 圧縮データ記録装置及び圧縮データ記録方法
JPS63169525A (ja) ピツチ抽出装置

Legal Events

Date Code Title Description
A300 Application deemed to be withdrawn because no request for examination was validly filed

Free format text: JAPANESE INTERMEDIATE CODE: A300

Effective date: 20021001