JPS60224341A - 音声符号化方法 - Google Patents

音声符号化方法

Info

Publication number
JPS60224341A
JPS60224341A JP8085584A JP8085584A JPS60224341A JP S60224341 A JPS60224341 A JP S60224341A JP 8085584 A JP8085584 A JP 8085584A JP 8085584 A JP8085584 A JP 8085584A JP S60224341 A JPS60224341 A JP S60224341A
Authority
JP
Japan
Prior art keywords
time series
segment
segments
spectrum
spectral
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP8085584A
Other languages
English (en)
Other versions
JPH0414813B2 (ja
Inventor
Yoshinao Shiraki
白木 善尚
Masaaki Yoda
雅彰 誉田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP8085584A priority Critical patent/JPS60224341A/ja
Publication of JPS60224341A publication Critical patent/JPS60224341A/ja
Publication of JPH0414813B2 publication Critical patent/JPH0414813B2/ja
Granted legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Analogue/Digital Conversion (AREA)
  • Transmission Systems Not Characterized By The Medium Used For Transmission (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 「産業上の利用分野」 この発明は、入力音声のスペクトルパラメータを抽出し
て低ビツトレートで符号化する音声符号化方法に関する
ものである。
「従来技術」 従来、音声の符号化方式として1000 bps以下の
低ビツトレートで符号化する方式は、ベクトル量子化と
可変フレームレート符号化との2つの方式がある。ベク
トル量子化方式は、フレーム単位(音声分析単位)は一
定のまま、フレーム当りのスペクトルパラメータ情報を
8ヒツト程度で量子化するもので、パラメータを1つの
ベクトルとして扱う点に特徴がある。しかし、この方式
は空間的、すなわち周波数の冗長性のみを取除くもので
、500 bps以下になると、フレーム単位が一定の
ため、急激な品質劣化を生じる。
一方、可変フレームレート符号化方式は、スペクトルの
時間的変化に適応してフレーム単位(フレーム長)を変
化させるもので、時間的に冗長性を除去しているが平均
伝送速度が1/3程度に減少しても品質の劣化は少ない
。しかし、この方式は本質的にパラメータの(直線)補
間特性に依存しているため、伝送速度が毎秒25フレー
ム(全体で600 bps )以下になると急激な品質
劣化を生じる。
この発明の目的は600 bps以下の低いビットレー
トでも良好な文章了解性をもつ音声として再生可能な音
声符号化方法を提供することにある。
「発明の構成」 この発明は音声スペクトルの空間的(周波数)の冗長性
のみならず、時間的冗長性も除去する。
このためこの発明では入力音声のスペクトルパラメータ
をフレーム単位で抽出し、このスペクトルパラメータの
時系列を、そのスペクトルの変化率に基づいて複数フレ
ームからなるセグメントに分割し、その分割された各セ
グメントごとに、そのスペクトルパラメータ時系列の標
本点の数が同一になるように再標本化する。つまり音声
中において、時間的に好ましくは空間的(周波数)にも
繰返し現われるスペクトルパラメータの系列パターンが
得られるように、例えば音韻や音節境界で音声のスペク
トルパラメータ時系列を区切って、セグメントに分割す
る。その各セグメントごとに、そのパラメータ時系列の
標本点の数が同一数になるように再標本化して、各セグ
メントの時間長を正規化して、時間的冗長性を除去する
。このように再標本化されたパラメータ時系列を、セグ
メントごとに標準パターンとのマツチングをとって符号
化する。
「実施例」 第1図はこの発明の音声符号化方法の実施例を示す。入
力端子11からの音声入力は低域通過フィルタ12で帯
域制限を受けてAD変換器13に入力され、周期的に標
本化されてディジタル信号に変換される。このAD変換
器13の出力はLPC分析部14でフレーム単位で入力
音声のスペクトルパラメータが抽出される。LPC分析
して算出されたパラメータ時系列は、セクメンテーショ
ン部15でそのスペクトルパラメータ時系列のスペクト
ルの変化率に基づいてセグメントに分割される。入力音
声から抽出されるスペクトルパラメータとしてはLPC
係数の他にLAR、PARCOR係数、 LPCケプス
トラム係数、 LSPなどいずれでも良いが、この実施
例では、LPCケプストラム係数の重みつき最小二乗近
似係数を使って、毎秒平均12コにセグメントされた。
このセグメント分割の詳細は、例えば嵯峨山、板倉:音
声の動的尺度に含まれる個人性情報。
日本音響学合溝論集3−2−7 (1979)を参照さ
れたい。
この分割されたセグメントは長いものも短かいものもあ
るが、各セグメントにおけるパラメータ時系列の標本点
数が一定(同一数)となるように、各セグメントごとに
時間的に等間隔で予め決めた数だけ再標本化部16で再
標本化する。1セグメントにおける再標本化数が多い程
、元に戻した際のスペクトル歪は小さく、第2図に示す
ように各セグメントの再標本化数が10以上になると、
スペクトル歪を1dB2以下に押さえられる。第2図は
横軸に1セグメント当りの再標本化数、縦軸は復元した
時のスペクトル歪みをとってあり、スペクトルパラメー
タはLAPである。この発明における実施例では、再標
本化部16ではパラメータをLSP 1再標本化数は1
0としている。
第3図に再標本化部16の一具体例を示す。端子17か
らのセグメント分割されたスペクトル時系列は信号分離
部18によりスペクトル時系列とセグメントの長さく継
続長)とに分離される。その継続長は比例定数部19に
入力され、予め決められた再標本化数(実施例では10
)と入力した継続長とから所望の比例定数を計算し、つ
まり再標本化数で継続長を割算して再標本化周期をめ、
これを線形補間部21に送る。線形補間部21では信号
分離部18からのセグメント分割されたスペクトル時系
列を予め決められた数だけ前記再標本化周期で再標本化
する。その際に再標本時点は再標本化前のスペクトル時
系列の標本時点と一致しないためスペクトル時系列を線
形補間して再標本値を得る。
第1図の説明に戻り、マl−IJクス量子化部22にお
いて再標本化されたセグメントを単位として、メモリ2
3よりの予め作られた標準パターンとのマツチングを行
ない、最も類似した標準パターンの番号を出力する。標
準パターンの生成とマツチング、いずれの場合も同じ尺
度(距離)計算が行なわれる。すなわち、セグメントを
マトリクス(パラメニタ時系列を並べたもの)としてと
らえ、マトリクス間の距離を重みつきユークリッド距離
で定義する。この例では、12次のLSP (L、 、
 L2・・・・・L1□)と音声パワ(対数)P、のパ
ラメータを横に10コ並べたものを13X10次の(セ
グメント)マトリクスとしている。
標準パターンの作り方は、例えばA−Buzoの池”5
peech Coding based upon V
ector Quantization”IEEE 、
 A35P−28,VOl 5. pp562−1)p
574 (1980)を参照されたい。
第4図に、1セグメント当りの情報量を横軸にとり、縦
軸にCD (ケプストラム距離)をとり、曲線24はパ
ワーとスペクトルとを別々に量子化した場合、曲線25
は前述のパワーとスペクトルとを1つのベクトルとみな
したものである。この第4図からパワーを込みにした曲
線25は、パワーを分離した曲線24よりも3ビツト/
セグメント以上情報圧縮がされていることがわかる。
スペクトル時系列はマトリクス量子化部22で前述のよ
うに符号化され、これと入力音声のピッチ情報及び各セ
グメントの継続長情報がマルチプレクサ26で合成され
て出力される。この実施例では、ピッチ情報はスムージ
ングした後、セグメント当り1点に点ピッチ化し、量子
化部27で3ビツトのADPCMで量子化される。第5
図にLPC分析部14を示すように、端子28からの音
声のテイジタル信号列はLPG分析子ユゾト29、でL
PC分析され、LPCパラメータ、有声、無声判定系列
、音声パワー多重化部31へ出力され、ピッチはピッチ
スムージング部32へ供給され、滑らかにされた後、多
重化部31へ供給される。
また、セグメントの継続長は頻度を考慮して25ビツト
に量子化部27で量子化される。以上説明した具体例で
は、1秒当り平均で12セクメント、標準パターは10
ビツト、ピッチは3ビツト、継続長は2.5ビツトで量
子化している。以上のようにして得られた3000サン
プル(4分間の音声)をマトリクス量子化し、生成され
た標準パターンとのマツチングをした結果を第6図の曲
線33に示す。第6図で横軸はLSPのビット/秒、縦
軸はスペクトル歪であり、曲線34は従来のベクトル量
子化法による場合である。この第6図よりスペクトル歪
を同程度におさえるためにはこの発明ではベクトル量子
化法の4分の1の情報量で済むことが解り、従って従来
のスカラー量子化法の10分の1の情報量で済む。上記
具体例では、毎秒12X(10+3+2.5)−186
bpsであり、文章の了解性は良好であった。
なおマルチプレクサ26よりの音声符号化出力は伝送、
或いは記憶され復号化はLPC合成部36でマトリクス
量子化符号から、辞書を参照して標準パターンを得、こ
れをセグメント継続長情報、ピッチ情報から元LPC分
析出力と対応したものを復元し、これをDA変換器37
でアナログ変換し、低域通過フィルタ38を通じて出力
端子39にアナログ音声信号を出力する。
「発明の効果」 以上説明したように、この発明によれば約200bps
のように著しく低速度としても良好な文章了解性が得ら
れるため、伝送路の有効利用、秘話性の高い通信路の構
成などに使用できるという利点かある。
ピッチ情報、セグメント継続情報の送出は前記量子化に
限らず、他の量子化を適用してもよく、量子化しなくて
もよい。
【図面の簡単な説明】
第1図はこの発明の一例を示すブロック図、第2図は再
標本化数とスペクトルひずみの関係を示す図、第3図は
パラメータの再標本化部16の具体例を示すフロック図
、第4図はセグメント当りのビット数とスペクトル歪の
関係を示す図、第5図はLPC分析部14の一例を示す
フロック図、第6図はビット/秒とスペクトル歪との関
係を示す図である。 14・・・LPC分析部、15・セグメンテーション部
、16・・・再標本化部、22・・・マl−IJクス量
子化部、23・・・標準パターンメモリ。 特許出願人 日本電信電話公社 代理人 草野 卓 73 図 16 井 4 図 ピ゛ット毫又/lグメント 75肥 4 〃 6 図 ビ゛ント/紗

Claims (1)

    【特許請求の範囲】
  1. (1)入力音声のスペクトルパラメータをフレーム単位
    で抽出する手段と、その抽出されたスペクトルパラメー
    タの時系列を、スペクトルの変化率に基づいて、複数フ
    レームから成るセグメントに分割する手段と、その分割
    された各セグメントごとに、そのセグメント内でのパラ
    メータ時系列の標本点数が予め定めた同一数となるよう
    にパラメータ時系列を再標本化する手段と、その再標本
    化されたパラメータ時系列を、セグメントを単位として
    スペクトルパラメータ時系列の標準パターンを用いて符
    号化する手段とを有する音声符号化方法。
JP8085584A 1984-04-20 1984-04-20 音声符号化方法 Granted JPS60224341A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP8085584A JPS60224341A (ja) 1984-04-20 1984-04-20 音声符号化方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP8085584A JPS60224341A (ja) 1984-04-20 1984-04-20 音声符号化方法

Publications (2)

Publication Number Publication Date
JPS60224341A true JPS60224341A (ja) 1985-11-08
JPH0414813B2 JPH0414813B2 (ja) 1992-03-16

Family

ID=13729955

Family Applications (1)

Application Number Title Priority Date Filing Date
JP8085584A Granted JPS60224341A (ja) 1984-04-20 1984-04-20 音声符号化方法

Country Status (1)

Country Link
JP (1) JPS60224341A (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0527798A (ja) * 1991-07-22 1993-02-05 Nippon Telegr & Teleph Corp <Ntt> 音声の線形予測パラメータ符号化方法
JPH08500471A (ja) * 1992-04-30 1996-01-16 セリディアン コーポレイション 放送セグメントを認識するための方法とシステム
CN113724719A (zh) * 2014-08-18 2021-11-30 弗劳恩霍夫应用研究促进协会 音频解码器装置及音频编码器装置

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS5872194A (ja) * 1981-10-23 1983-04-30 松下電器産業株式会社 音声分析符号化方式

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS5872194A (ja) * 1981-10-23 1983-04-30 松下電器産業株式会社 音声分析符号化方式

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0527798A (ja) * 1991-07-22 1993-02-05 Nippon Telegr & Teleph Corp <Ntt> 音声の線形予測パラメータ符号化方法
JPH08500471A (ja) * 1992-04-30 1996-01-16 セリディアン コーポレイション 放送セグメントを認識するための方法とシステム
CN113724719A (zh) * 2014-08-18 2021-11-30 弗劳恩霍夫应用研究促进协会 音频解码器装置及音频编码器装置
CN113724719B (zh) * 2014-08-18 2023-08-08 弗劳恩霍夫应用研究促进协会 音频解码器装置及音频编码器装置
US11830511B2 (en) 2014-08-18 2023-11-28 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Concept for switching of sampling rates at audio processing devices

Also Published As

Publication number Publication date
JPH0414813B2 (ja) 1992-03-16

Similar Documents

Publication Publication Date Title
JP3747492B2 (ja) 音声信号の再生方法及び再生装置
JP4132109B2 (ja) 音声信号の再生方法及び装置、並びに音声復号化方法及び装置、並びに音声合成方法及び装置
JP3707116B2 (ja) 音声復号化方法及び装置
JP4005154B2 (ja) 音声復号化方法及び装置
JP3354138B2 (ja) 音声符号化
JPH1091194A (ja) 音声復号化方法及び装置
JPH09127990A (ja) 音声符号化方法及び装置
KR20010093210A (ko) 가변 속도 음성 코딩
KR20010093208A (ko) 주기적 음성 코딩
JPH10307599A (ja) スプラインを使用する波形補間音声コーディング
JPH05197400A (ja) 低ビット・レート・ボコーダ手段および方法
JPH0869299A (ja) 音声符号化方法、音声復号化方法及び音声符号化復号化方法
JPH10124092A (ja) 音声符号化方法及び装置、並びに可聴信号符号化方法及び装置
JP2006171751A (ja) 音声符号化装置及び方法
JP4359949B2 (ja) 信号符号化装置及び方法、並びに信号復号装置及び方法
JPS60224341A (ja) 音声符号化方法
JP2796408B2 (ja) 音声情報圧縮装置
JP2736157B2 (ja) 符号化装置
JP3010655B2 (ja) 圧縮符号化装置及び方法、並びに復号装置及び方法
JP3350340B2 (ja) 音声符号化方法および音声復号化方法
JP3063087B2 (ja) 音声符号化復号化装置及び音声符号化装置ならびに音声復号化装置
JPH0786952A (ja) 音声の予測符号化方法
JPH0736484A (ja) 音響信号符号化装置
JPH01233499A (ja) 音声信号符号化復号化方法及びその装置
JPS6272000A (ja) 音声符号化方法