JPS6019520B2 - 音声処理装置 - Google Patents

音声処理装置

Info

Publication number
JPS6019520B2
JPS6019520B2 JP53037496A JP3749678A JPS6019520B2 JP S6019520 B2 JPS6019520 B2 JP S6019520B2 JP 53037496 A JP53037496 A JP 53037496A JP 3749678 A JP3749678 A JP 3749678A JP S6019520 B2 JPS6019520 B2 JP S6019520B2
Authority
JP
Japan
Prior art keywords
voiced
parameter
voice
silence
unvoiced
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired
Application number
JP53037496A
Other languages
English (en)
Other versions
JPS54133004A (en
Inventor
哲 田口
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
Nippon Electric Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Electric Co Ltd filed Critical Nippon Electric Co Ltd
Priority to JP53037496A priority Critical patent/JPS6019520B2/ja
Priority to CA324,405A priority patent/CA1123955A/en
Publication of JPS54133004A publication Critical patent/JPS54133004A/ja
Priority to US06/236,428 priority patent/US4360708A/en
Publication of JPS6019520B2 publication Critical patent/JPS6019520B2/ja
Expired legal-status Critical Current

Links

Description

【発明の詳細な説明】 本発明は狭帯城音声伝送を可能とした、又は合成音声の
音質を向上した音声の分析又は合成を行なう音声処理装
置に関する。
云わゆるボコーダ装置として知られている音声分析合成
装置、例えばチャネルボコーダ、ホルマントボコーダ、
相関ボコーダ、パターンマッチングボコーダ、位相ボコ
ーダ(以上5種類のボコーダは、例えば、加藤康雄、落
合和雄、「スペクトルに着目した処理伝送」、電子通信
学会誌、VOL.51.NO.11.ページ1420〜
1426、昭和43年11月)、線形予測ボコーダ(例
えば、JohnRHaskew、J.M.Kelly、
Ro戊でtM.Kelly、JR.andThomas
日.Mckinney、“ReS山ts of a
Studyof the Linear Predi
ction Vocoder’’、lEEETrans
actions on Communications
、VOL.COM−21、No.9、Septem戊r
l973pp.1008〜1015)、線スペクトルボ
コーダ(例えば、板倉文忠、東倉洋一、「擬ホルマント
ボコーダ」、電子通信学会技術研究報告、EA−76−
21、197母手7月21日)等の音声分析合成装置は
、種々の音声の特徴を表現するパラメータを、分析側に
おいて被分析音声信号を分析して抽出し、前記パラメー
タを直接、又は他のパラメータに変換して(例えば線形
予測ボコーダにおいては、反射係数と直接的に又は間接
的に関係のある線形予測係数をLOG AREARAT
IOに変換する手段等、(例えば、JohnNねkh。
ul、‘‘Linear Prediction:A
TutorialReviev ’’、 Proce
e Din鱗 of 仇e lEEE 、VOL.63
、NO.4Aprill97ふ第576ページ、V.C
.項)量子化し合成側へ伝送する。合成側では前記直接
的な又は変換された形の量子化パラメータを用いて音声
を合成する。前記の分析され、直接的に又は変換後に伝
送されるパラメータの多くは、その頻度分布が有声音と
無声音とで異なることが知られている。
例えば音源情報においては短時間平均電力(例えば、B
iShnu S.At,a1・Law汀enCe R.
Rabiner、‘‘APat企てn ReCogni
tion Approach の Voiced −U
nvoiced − Silence Clas
sification15withApplicati
ons to Speech Recognition
’’、lEEETra船actions on Aco
ustics、Speech、 andSi部aI P
rocessing、VOL.ASSP−24.No.
幻皿el970第203ページ、Fig一3)、スベク
トラム情報においては第1ホルマントの周波数帯城幅等
、多くのパラメータが有声と無声とではその分布を異と
している。特に線形予測ボコーダに用いられるパラメー
タの多くは、例えば前記短時間平均電力、予測残差電力
、線形方程式の直接的な解として求まる予測係数、前記
予測係数の変形である部分自己相関係数、正規化予測残
差電力等その分布は有声と無声とでは大きく異なる。
なお前記LOG AREARATIOは前記部分自己相
関係数から直接的に求まり、前記部分自己相関係数同様
、有声と無声とでは分布を異にする。本発明は有声と無
声とで分布を異にする分析パラメータを、有声/無声判
別結果に基いて、有声の場合には有声における各パラメ
ータの分布に適する軍子化を行ない、無声の場合には無
声における各パラメータの分布に適する量子化を行なう
ことにより、より精密な分析パラメータの量子化を実施
し得る音声分析合成装置を提供するものである。
本発明によれば、有声/無声の判別を行なって音声を分
析又は合成する音声処理装置において、前記有声/無声
の判別結果により、分析パラメータを有声、無声に対応
して量子化する手段と量子化された分析パラメータを有
声、無声に対応して復号する手段の少なくとも一方を具
備して成ることを特徴とする音声処理装置が得られる。
次に図面を参照して本発明を詳細に説明する。図は本発
明の一実施例を説明するためのブロック図である。図に
於いて、101は本発明の構成範囲を示す。102は分
析側を、103は合成側を、104は量子化パラメータ
伝送路を示す。
波形入力端子111を介して音声波形入力信号が有声/
無声判別回路105と分析器106とへ供給される。有
声/無声判別器105は周知の手段(例えば、谷戸文魔
、樽松明、「音声分析合成系における有声無声判定の検
討ハ昭和52王度電子通信学会情報部門全国大会、論文
集、205ページ)により有声/無声判別を行ない、判
別結果を符号化器107へ出力する。分析器106は例
えば短時間平均電力、ピッチ周期、複数の線形予測係数
等の音声の特徴を表現するパラメータを前記音声波形入
力信号を分析することにより抽出し、抽出した各パラメ
ータを符号化器107へ出力する。符号化器107は有
声/無声判別器105より供給される有声/無声判別信
号に基づいて、分析器106より供給される各パラメー
タを、分布特性に基づいて最適に量子化する。例えば1
次の線形予測係数に対応する1次のKパラメータ(部分
自己相関係数)K,値は有声音の場合十0.6〜十1.
0に集中し、無声音の場合には略−0.7〜十0.7に
わたって分布している。従って有声時のK,は十0.6
〜十1.0の範囲にのみ量子化ビットを割り当て、この
値を一定の量子化ステップで量子化し、無声時には−0
.7〜十0.7の領域にわたって量子化ビットを割り当
てて量子化を行なう。更に符号化器107は前記量子化
された各パラメータと有声/無声判別信号とを量子化パ
ラメータ伝送路104へ出力する。復号化器108は量
子化パラメータ伝送路104を介して供給される前記量
子化された各パラメータを同様に量子化パラメータ伝送
路104を介して供給される有声/無声判別信号に基づ
いて復号する。更に復号化器108は前記復号された各
パラメータと有声/無線判別信号とを合成器109へ出
力する。合成器109は前記復号された各パラメータと
無声/無声判別信号とから音声を合成し、波形出力端子
110を介して前記合成された音声を出力する。本発明
により、例えば同一の伝送容量においてはより精密な分
析パラメータの量子化効果により、合成側における合成
音の音質を向−上することができる。
また同一の音質を保障するのに必要な量子化BIT数を
削減し得ることから、伝送容量を減少し得るのは明らか
である。言い換えるならば、例えば、いわゆるK,と呼
ばれる1次の部分自己相関係数の量子イ船IT数を有毒
と無声とで異なる数にする等の手段で、有声と無声とで
量子化BIT数を異なる値に設定し、ある時間ブロック
単位で、もしくは長時間平均的に伝送容量を減少し得る
ことも明らかである。
また有声と無声とでパラメータの量子化BIT数を変え
る場合には、例えば有声の場合により少ないBIT数で
量子化されるならば有声と無声との量子化BIT数の差
のBIT数を有声を分析した結果か得られる他の新らし
いパラメータに与えることも可能である。更に、有声/
無声判別信号に基づいて適切なパラメータを選択するこ
とも可能である。以上述べた音声分析合成装置は、分析
側、合成側それぞれ単独で用いることが可能である。例
えば音声分析合成装置の分析側のみを用いたことに対応
する音声分析装置は、音声信号の圧縮等の用途に用いら
れる。ま音声分析合成装置の合成側のみを用いたことに
対応する音声合成装置は音声応答等の用途に用いられる
。以上の説明から明らかのように、本発明は有声と無声
とで分布を異にする分析パラメータを、有声/無声判別
結果に基づいて、有声の場合には、有声における各パラ
メータの分布に適する量子化を行ない、無声の場合には
無声における各パラメータの分布に適する量子化を行な
うことにより、より高度な音声信号の圧縮が可能となる
という効果を持つ。
【図面の簡単な説明】
図は本発明の一実施例を説明するためのブロック図であ
る。 101・…・・本発明の構成範囲、102・・・・・・
分析側、103・・・・・・合成側、104・・・・・
・量子化パラメータ伝送路、105・・・・・・有声/
無声判別器、106・・・・・・分析器、107・・・
・・・符号化器、108・・・・・・復号化器、109
・・・・・・合成器、110・・…・波形出力端子、1
11・・・・・・波形入力端子。

Claims (1)

    【特許請求の範囲】
  1. 1 分析側では予め定めた時間間隔毎に入力音声信号の
    周波数スペクトラムと音源情報等を示すパラメータおよ
    び有声/無声判別情報を求めた後量子化し、合成側では
    前記パラメータにより諸係数および励振音源情報が定ま
    る合成フイルタによつて入力音声信号を合声する音声成
    理装置において、分析側では前記パラメータのうち、有
    声と無声とでその頻度分布が異なる特定のパラメータを
    前記有声/無声判別情報に基づいて予め定めた量子化態
    様で量子化し、合成側では前記有声/無声判別情報に基
    づいて前記予め定めた量子化態様に対応して前記特定の
    パラメータを復号することを特徴とする音声処理装置。
JP53037496A 1978-03-30 1978-03-30 音声処理装置 Expired JPS6019520B2 (ja)

Priority Applications (3)

Application Number Priority Date Filing Date Title
JP53037496A JPS6019520B2 (ja) 1978-03-30 1978-03-30 音声処理装置
CA324,405A CA1123955A (en) 1978-03-30 1979-03-29 Speech analysis and synthesis apparatus
US06/236,428 US4360708A (en) 1978-03-30 1981-02-20 Speech processor having speech analyzer and synthesizer

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP53037496A JPS6019520B2 (ja) 1978-03-30 1978-03-30 音声処理装置

Publications (2)

Publication Number Publication Date
JPS54133004A JPS54133004A (en) 1979-10-16
JPS6019520B2 true JPS6019520B2 (ja) 1985-05-16

Family

ID=12499125

Family Applications (1)

Application Number Title Priority Date Filing Date
JP53037496A Expired JPS6019520B2 (ja) 1978-03-30 1978-03-30 音声処理装置

Country Status (1)

Country Link
JP (1) JPS6019520B2 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0315676Y2 (ja) * 1985-09-20 1991-04-04

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0315676Y2 (ja) * 1985-09-20 1991-04-04

Also Published As

Publication number Publication date
JPS54133004A (en) 1979-10-16

Similar Documents

Publication Publication Date Title
US5778335A (en) Method and apparatus for efficient multiband celp wideband speech and music coding and decoding
US7065338B2 (en) Method, device and program for coding and decoding acoustic parameter, and method, device and program for coding and decoding sound
CA1333425C (en) Communication system capable of improving a speech quality by classifying speech signals
US8396706B2 (en) Speech coding
EP0833305A2 (en) Low bit-rate pitch lag coder
US6678655B2 (en) Method and system for low bit rate speech coding with speech recognition features and pitch providing reconstruction of the spectral envelope
JP2004517348A (ja) 非音声のスピーチの高性能の低ビット速度コード化方法および装置
KR100614496B1 (ko) 가변 비트율의 광대역 음성 및 오디오 부호화 장치 및방법
US5526464A (en) Reducing search complexity for code-excited linear prediction (CELP) coding
JP3144009B2 (ja) 音声符号復号化装置
JPH09258795A (ja) ディジタルフィルタおよび音響符号化/復号化装置
WO2002021091A1 (fr) Analyseur de signal de bruit, synthetiseur de signal de bruit, procede d'analyse de signal de bruit et procede de synthese de signal de bruit
Lin et al. Mixed excitation linear prediction coding of wideband speech at 8 kbps
KR20050006883A (ko) 광대역 음성 부호화기 및 그 방법과 광대역 음성 복호화기및 그 방법
Hagen Spectral quantization of cepstral coefficients
JP2797348B2 (ja) 音声符号化・復号化装置
JPH07225599A (ja) 音声の符号化方法
JP3916934B2 (ja) 音響パラメータ符号化、復号化方法、装置及びプログラム、音響信号符号化、復号化方法、装置及びプログラム、音響信号送信装置、音響信号受信装置
JPS6019520B2 (ja) 音声処理装置
Iao Mixed wideband speech and music coding using a speech/music discriminator
Bouzid et al. Switched split vector quantizer applied for encoding the LPC parameters of the 2.4 Kbits/s MELP speech coder
JP2581050B2 (ja) 音声分析合成装置
Ojala et al. Variable model order LPC quantization
Gournay et al. A 1200 bits/s HSX speech coder for very-low-bit-rate communications
JP3010655B2 (ja) 圧縮符号化装置及び方法、並びに復号装置及び方法