JP2000022545A - 音声符号化方式 - Google Patents

音声符号化方式

Info

Publication number
JP2000022545A
JP2000022545A JP10182092A JP18209298A JP2000022545A JP 2000022545 A JP2000022545 A JP 2000022545A JP 10182092 A JP10182092 A JP 10182092A JP 18209298 A JP18209298 A JP 18209298A JP 2000022545 A JP2000022545 A JP 2000022545A
Authority
JP
Japan
Prior art keywords
pitch
encoding
decoding
section
adaptive
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP10182092A
Other languages
English (en)
Inventor
Koichi Shibagaki
鋼一 柴垣
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Priority to JP10182092A priority Critical patent/JP2000022545A/ja
Publication of JP2000022545A publication Critical patent/JP2000022545A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

(57)【要約】 【課題】 適応予測符号化に於いて、音質劣化を最小限
に押さえて、情報量を低減する。 【解決手段】 符号化器入力端子10に加えられた音声
信号は、適応予測符号化器1とピッチ抽出器3に供給さ
れる。ピッチ抽出器3は、音声信号より、ピッチの有
無、ピッチ周期、ピッチゲイン、ピッチ区間数、非ピッ
チ区間長から成るピッチ情報を抽出して符号化実施判定
器2とエンコーダ4に供給する。符号化実施判定器2
は、ピッチ抽出器3から供給されるピッチの有無、ピッ
チ周期、ピッチ区間数、非ピッチ区間長の情報を受け
て、適応予測符号化を行うか否かの判定を行い、判定結
果を適応予測符号化器1に供給する。適応予測符号化器
1は、符号化実施判定器2の判定結果に従い、符号化実
施を指示された区間の入力音声信号のみ適応予測符号化
を行い、その他の区間の入力音声信号については適応予
測符号化を行わずに無信号状態としてエンコーダ4に出
力する。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、ADPCM(Adap
tive Differential Pulse Code Modulation;適応差分
PCM)等の適応予測符号化を用いた音声符号化方式に
関する。
【0002】
【従来の技術】従来、高能率な音声符号化方式として、
適応予測符号化に属すADPCMが知られている。な
お、ADPCMについては、小澤一範監修”ディジタル
移動通信のための高能率音声符号化技術(株式会社トリ
ケップス出版)”のP58〜P61に説明されている。
【0003】このADPCMは、音声波形のサンプル値
の差分を量子化するもので、音声と音楽のいずれに対し
ても少ない音質劣化で圧縮できる符号化方式であり、3
2kbpsのADPCMは、国際電気通信連合(IT
U)で標準化されている。しかしながら、更にビットレ
ートを下げて、例えば、16kbps以下にビットレー
トを低減すると、サンプル当たりのビット数が低下し、
それに伴って音質が劣化する。
【0004】このため、16kbps以下のビットレー
トでは、ADPCMは、CELP(Code-excited Linea
r Prediction;コード駆動線形予測)符号化に比べ、音
質が劣る。一方、CELP符号化は、予め用意された音
源モデル(コードブック)に基づく音声符号化であるた
め、16kbps以下のビットレートで品質の高い音声
を伝送することができるが、音楽を符号化した場合に
は、音質の劣化が著しい。
【0005】
【発明が解決しようとする課題】本発明の目的は、上記
の問題点に鑑み、ADPCM等の適応予測符号化を用い
た音声符号化方式に於いて、CELP符号化並みにビッ
トレートが低減しても、音声と音楽のいずれに対しても
少ない音質劣化で符号化を実現できる符号化方式を提供
することにある。
【0006】
【課題を解決するための手段】本発明の音声符号化方式
は、ADPCM等の適応予測符号化に於いて、以下の処
理を行うことを特徴とする。すなわち、原音声信号にピ
ッチのある区間では、その一部のピッチ周期に対して適
応予測符号化/復号化を行い、その他のピッチ周期で
は、適応予測符号化/復号化を行わないことにより、実
質的に適応予測符号化/復号化される原音声信号の情報
量を減らして、ビットレートの低減化を可能にすること
を特徴としている。
【0007】例えば、原音声信号にピッチのある区間で
は、1番目、3番目、…のピッチ区間に於いては、適応
予測符号化を行って、符号化音声信号を生成し、その間
の2番目、4番目、…のピッチ区間に於いては、適応予
測符号化を行わず、その区間では符号化音声信号は生成
されない。このようにして、原音声信号の情報量を減ら
す。
【0008】そして、復号化の際には、2番目、4番
目、…のピッチ区間における音声信号は、1番目、3番
目、…のピッチ区間における復号化音声信号を元に、ピ
ッチの有無、ピッチ周期、ピッチゲイン、ピッチ区間数
から成るピッチ情報に従って、ピッチ周期性を再現し、
復号化音声信号を生成する。
【0009】一方、原音声信号にピッチのない区間で
は、非ピッチ区間長だけ、適応予測符号化/復号化を行
う。こうすることによって、ADPCM等の適応予測符
号化の情報量を低減することが可能となるので、CEL
P符号化並みにビットレートが低減しても、音声と音楽
のいずれに対しても音質劣化を生ずることのない符号化
を実現できる。
【0010】
【発明の実施の形態】図1は、本発明による音声/音楽
符号化方式の符号化器の実施の形態を示すブロック図で
ある。図1において、符号化器入力端子10に加えられ
た音声信号は、適応予測符号化器1とピッチ抽出器3に
供給される。ピッチ抽出器3は、音声信号より、ピッチ
の有無、ピッチ周期、ピッチゲイン、ピッチ区間数、非
ピッチ区間長から成るピッチ情報を抽出し、これを符号
化実施判定器2とエンコーダ4に供給する。なお、音声
信号のピッチの抽出は、時間波形の周期性、自己相関関
数等種々の方法を用いて実施することができる。
【0011】符号化実施判定器2は、ピッチ抽出器3か
ら供給されるピッチの有無、ピッチ周期、ピッチ区間
数、非ピッチ区間長の情報を受けて、適応予測符号化を
行うか否かの判定を行い、判定結果を適応予測符号化器
1に供給する。
【0012】適応予測符号化器1は、符号化実施判定器
2から供給される判定結果に従って、符号化実施を指示
された区間の入力音声信号のみ適応予測符号化を行い、
その他の区間の入力音声信号については適応予測符号化
を行わずに無信号状態のままエンコーダ4に出力する。
【0013】エンコーダ4は、ピッチ抽出器2から供給
されるピッチの有無、ピッチ周期、ピッチゲイン、ピッ
チ区間数、非ピッチ区間長から成るピッチ情報と、適応
予測符号化器1から供給される適応予測符号化信号をエ
ンコードし、符号化器出力端子11に供給する。
【0014】図2は、本発明による音声/音楽符号化方
式の復号化器の実施の形態を示すブロック図である。符
号化器出力端子11から伝送された信号は、復号化器入
力端子30に入力され、デコーダ21により、適応予測
符号化信号と、ピッチの有無、ピッチ周期、ピッチゲイ
ン、ピッチ区間数、及び非ピッチ区間長から成るピッチ
情報とに分離される。
【0015】デコーダ21でデコードされた適応予測符
号化信号は、適応予測復号化器22に供給され、また、
デコーダ21でデコードされた、ピッチの有無、ピッチ
周期、ピッチゲイン、ピッチ区間数、及び非ピッチ区間
長から成るピッチ情報は、復号化実施判定器23に供給
される。
【0016】復号化実施判定器23では、デコーダ21
から供給されるピッチの有無、ピッチ周期、ピッチ区間
数、非ピッチ区間長から、適応予測復号化を行うか否か
の判定を行い、判定結果を適応予測復号化器22に供給
するとともに、ピッチ周期、ピッチゲイン、ピッチ区間
数の情報をピッチ再生フィルタ24に供給する。
【0017】適応予測復号化器22では、復号化実施判
定器23から供給される判定結果に従って、符号化実施
区間のみ適応予測復号化を行い、復号化した音声信号を
多重化器25に供給する。
【0018】ピッチ再生フィルタ24では、適応予測復
号化器22から供給される復号化音声信号と、ピッチ周
期、ピッチゲイン、ピッチ区間数に従って、ピッチを再
生し、復号化した音声信号を多重化器25に供給する。
【0019】多重化器25では、適応予測復号化器22
から供給される復号化音声信号と、ピッチ再生フィルタ
24から供給される復号化音声信号を多重し、復号化音
声信号を生成し、復号化器出力端子40に供給する。
【0020】次に、本発明の音声符号化方式の具体的な
動作例について、図3の音声信号波形図を参照して説明
する。
【0021】符号化器入力端子10に、所定区間の原音
声信号X(n)が入力されると、ピッチ抽出器3では、その
区間内で同一波形が一定周期(ピッチ周期)で繰り返し
ている波形を抽出し、そのピッチ周期、ピッチゲイン、
ピッチ区間数を判別するとともに、周期性のない非ピッ
チ区間長を抽出して符号化実施判定器2及びエンコーダ
4に供給する。
【0022】符号化実施判定器2は、ピッチ抽出器3か
らのピッチ情報により、適応予測符号化器1に対して、
ピッチのある区間では、その一部のピッチ区間に対して
のみ適応予測符号化を行い、その他のピッチ区間では、
適応予測符号化を行わないように制御する。
【0023】例えば、1番目、3番目、…のピッチ区間
に於いては、適応予測符号化を行い、2番目、4番目、
…のピッチ区間に於いては、適応予測符号化を行わない
ように制御する。こうすることによって、適応予測符号
化の情報量を低減する。また、ピッチのない区間では、
通常に適応予測符号化を行う。
【0024】一方、復号化器側では、適応予測復号化器
22において、復号化実施判定器23から供給される判
定結果に従って、ピッチのある区間では、符号化実施区
間のみ適応予測復号化を行い、また、ピッチのない区間
はそのまま復号化することにより、音声信号X'(n)を多
重化器25に供給する。
【0025】ピッチ再生フィルタ24では、適応予測復
号化器22から供給される復号化音声信号X'(n)と、ピ
ッチ周期、ピッチゲイン、及びピッチ区間数に従ってピ
ッチを再生し、復号化した音声信号X''(n)を多重化器2
5に供給する。
【0026】多重化器25では、適応予測復号化器22
から供給される復号化音声信号X'(n)と、ピッチ再生フ
ィルタ24から供給される復号化音声信号X''(n)を多重
し、復号化音声信号X'''(n)を生成し、復号化器出力端
子40に供給する。
【0027】なお、図3の動作説明においては、実施例
として、1番目、3番目、…のピッチ区間に於いては、
適応予測符号化/復号化を行い、2番目、4番目、…の
ピッチ区間に於いては、適応予測符号化/復号化を行わ
ない例について説明したが、例えば、ピッチのある区間
では、1番目のピッチ区間のみ適応予測符号化を行い、
復号化の際には、ピッチ再生フィルタからピッチ区間数
だけ繰り返し出力するように構成することもできる。
【0028】
【発明の効果】本発明は、原音声信号にピッチのある区
間では、その一部のピッチ周期に対して適応予測符号化
/復号化を行い、その他のピッチ周期では、適応予測符
号化/復号化を行わないことにより、実質的に適応予測
符号化/復号化される原音声信号の情報量を減らして、
ビットレートの低減化を図っているので、ADPCM等
の適応予測符号化に於いて、音声と音楽のいずれに対し
ても少ない音質劣化で、情報量を16kbps以下に低
減することが可能となる。
【図面の簡単な説明】
【図1】本発明による音声/音楽符号化方式の符号化器
の実施の形態を示すブロック図である。
【図2】本発明による音声/音楽符号化方式の復号化器
の実施の形態を示すブロック図である。
【図3】本発明の動作を説明するための音声信号波形図
である。
【符号の説明】
1 適応予測符号化器 2 符号化実施判定器 3 ピッチ抽出器 4 エンコーダ 10 符号化器入力端子 11 符号化既出力端子 21 デコーダ 22 適応予測復号化器 23 復号化実施判定器 24 ピッチ再生フィルタ 25 多重化器 30 復号化器入力端子 40 復号化器出力端子

Claims (5)

    【特許請求の範囲】
  1. 【請求項1】 適応予測符号化/復号化を行うための音
    声符号化方式において、 入力音声信号からピッチのある区間とピッチのない区間
    を抽出し、ピッチのある区間では、最初のピッチ区間の
    音声信号に対してのみ適応予測符号化を行うとともにそ
    の余のピッチ区間は適応予測符号化を行わない無信号区
    間とし、ピッチのない区間では、非ピッチ区間長にわた
    る音声信号に対して適応予測符号化を行うことによりビ
    ットレートを低減することを特徴とする音声符号化方
    式。
  2. 【請求項2】 適応予測符号化/復号化を行うための音
    声符号化方式において、 入力音声信号からピッチのある区間とピッチのない区間
    を抽出し、ピッチのある区間では、所定周期のピッチ区
    間毎の音声信号に対してのみ適応予測符号化を行うとと
    もにその余のピッチ区間は適応予測符号化を行わない無
    信号区間とし、ピッチのない区間では、非ピッチ区間長
    にわたる音声信号に対して適応予測符号化を行うことに
    よりビットレートを低減することを特徴とする音声符号
    化方式。
  3. 【請求項3】 入力音声信号から、ピッチの有無、ピッ
    チ周期、ピッチゲイン、ピッチ区間数、及び非ピッチ区
    間長からなるピッチ情報を抽出するピッチ抽出手段と、
    前記ピッチ抽出手段から供給される前記ピッチ情報によ
    り適応予測符号化を行うか否かの判定を行う符号化実施
    判定手段と、前記符号化実施判定手段から供給される判
    定結果に従って、前記入力音声信号の適用予測符号化を
    実施する適応予測符号化手段と、前記ピッチ抽出手段か
    ら供給されるピッチ情報と、前記適用予測符号化手段か
    ら供給される適用予測符号をエンコードして出力するエ
    ンコーダを備えていることを特徴とする音声符号化装
    置。
  4. 【請求項4】 前記符号化実施判定手段は、前記ピッチ
    抽出手段からピッチ有りの情報を受けたときには、前記
    適応予測符号化手段に対して、所定のピッチ区間の音声
    信号に対してのみ適応予測符号化/復号化を行い、その
    余のピッチ区間の音声信号に対しては適応予測符号化/
    復号化を行わないで空白区間として出力するように指示
    することを特徴とする請求項3記載の音声符号化装置。
  5. 【請求項5】 エンコードされた適用予測符号とピッチ
    情報を分離抽出するするデコーダと、前記デコーダで抽
    出された前記ピッチ情報から、適用予測復号化を行うか
    否かの判定を行う復号化実施判定手段と、前記復号化実
    施判定手段から供給される判定結果に従って、前記デコ
    ーダで抽出された前記適用予測符号を復号する適用予測
    復号化手段と、前記ピッチ情報に基づいて、前記適用予
    測復号化手段から供給される復号音声信号をピッチ区間
    数分再生するピッチ再生フィルタと、前記適用予測復号
    化手段から供給される復号化音声信号と前記ピッチ再生
    フィルタから供給される復号化音声信号とを多重する多
    重化手段を備えていることを特徴とする音声復号化装
    置。
JP10182092A 1998-06-29 1998-06-29 音声符号化方式 Pending JP2000022545A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP10182092A JP2000022545A (ja) 1998-06-29 1998-06-29 音声符号化方式

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP10182092A JP2000022545A (ja) 1998-06-29 1998-06-29 音声符号化方式

Publications (1)

Publication Number Publication Date
JP2000022545A true JP2000022545A (ja) 2000-01-21

Family

ID=16112222

Family Applications (1)

Application Number Title Priority Date Filing Date
JP10182092A Pending JP2000022545A (ja) 1998-06-29 1998-06-29 音声符号化方式

Country Status (1)

Country Link
JP (1) JP2000022545A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2006075605A1 (ja) * 2005-01-12 2006-07-20 Nippon Telegraph And Telephone Corporation 長期予測符号化方法、長期予測復号化方法、これら装置、そのプログラム及び記録媒体

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2006075605A1 (ja) * 2005-01-12 2006-07-20 Nippon Telegraph And Telephone Corporation 長期予測符号化方法、長期予測復号化方法、これら装置、そのプログラム及び記録媒体
US8160870B2 (en) 2005-01-12 2012-04-17 Nippon Telegraph And Telephone Corporation Method, apparatus, program, and recording medium for long-term prediction coding and long-term prediction decoding

Similar Documents

Publication Publication Date Title
EP0731348B1 (en) Voice storage and retrieval system
US5488704A (en) Speech codec
JP3416331B2 (ja) 音声復号化装置
JP2000209663A (ja) 音声チャネル上で非音声情報を送信する方法
JP3537008B2 (ja) 音声符号化通信方式とその送受信装置
KR100796836B1 (ko) 코드 변환 방법, 장치 및 이 방법을 실행하는 컴퓨터용 프로그램이 기록된 기록 매체
JP2003249957A (ja) パケット構成方法及び装置、パケット構成プログラム、並びにパケット分解方法及び装置、パケット分解プログラム
JPH09185397A (ja) 音声情報記録装置
JP4508599B2 (ja) データ圧縮方法
JP3050978B2 (ja) 音声符号化方法
JP2000022545A (ja) 音声符号化方式
Ding Wideband audio over narrowband low-resolution media
KR100542435B1 (ko) 패킷 망에서의 프레임 손실 은닉 방법 및 장치
JP3496618B2 (ja) 複数レートで動作する無音声符号化を含む音声符号化・復号装置及び方法
US6134519A (en) Voice encoder for generating natural background noise
JPH0588697A (ja) 欠落音声補間方式
EP1614103B1 (en) Updating of a buried data channel
JPH028900A (ja) 音声符号化復号化方法並びに音声符号化装置及び音声復合化装置
JP3798433B2 (ja) ピッチサイクル波形を平滑化する方法及び装置
KR20050066477A (ko) VoIP 시스템을 위한 프레임 손실 은닉 방법 및 장치
JP3515216B2 (ja) 音声符号化装置
US20040019480A1 (en) Speech encoding device having TFO function and method
JP2935213B2 (ja) 音声情報伝送方式
JP3166797B2 (ja) 音声符号化法及び音声復号化法並びに音声符復号化装置
JPH0411040B2 (ja)