JPS6019520B2 - 音声処理装置 - Google Patents
音声処理装置Info
- Publication number
- JPS6019520B2 JPS6019520B2 JP53037496A JP3749678A JPS6019520B2 JP S6019520 B2 JPS6019520 B2 JP S6019520B2 JP 53037496 A JP53037496 A JP 53037496A JP 3749678 A JP3749678 A JP 3749678A JP S6019520 B2 JPS6019520 B2 JP S6019520B2
- Authority
- JP
- Japan
- Prior art keywords
- voiced
- parameter
- voice
- silence
- unvoiced
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired
Links
Description
【発明の詳細な説明】
本発明は狭帯城音声伝送を可能とした、又は合成音声の
音質を向上した音声の分析又は合成を行なう音声処理装
置に関する。
音質を向上した音声の分析又は合成を行なう音声処理装
置に関する。
云わゆるボコーダ装置として知られている音声分析合成
装置、例えばチャネルボコーダ、ホルマントボコーダ、
相関ボコーダ、パターンマッチングボコーダ、位相ボコ
ーダ(以上5種類のボコーダは、例えば、加藤康雄、落
合和雄、「スペクトルに着目した処理伝送」、電子通信
学会誌、VOL.51.NO.11.ページ1420〜
1426、昭和43年11月)、線形予測ボコーダ(例
えば、JohnRHaskew、J.M.Kelly、
Ro戊でtM.Kelly、JR.andThomas
日.Mckinney、“ReS山ts of a
Studyof the Linear Predi
ction Vocoder’’、lEEETrans
actions on Communications
、VOL.COM−21、No.9、Septem戊r
l973pp.1008〜1015)、線スペクトルボ
コーダ(例えば、板倉文忠、東倉洋一、「擬ホルマント
ボコーダ」、電子通信学会技術研究報告、EA−76−
21、197母手7月21日)等の音声分析合成装置は
、種々の音声の特徴を表現するパラメータを、分析側に
おいて被分析音声信号を分析して抽出し、前記パラメー
タを直接、又は他のパラメータに変換して(例えば線形
予測ボコーダにおいては、反射係数と直接的に又は間接
的に関係のある線形予測係数をLOG AREARAT
IOに変換する手段等、(例えば、JohnNねkh。
装置、例えばチャネルボコーダ、ホルマントボコーダ、
相関ボコーダ、パターンマッチングボコーダ、位相ボコ
ーダ(以上5種類のボコーダは、例えば、加藤康雄、落
合和雄、「スペクトルに着目した処理伝送」、電子通信
学会誌、VOL.51.NO.11.ページ1420〜
1426、昭和43年11月)、線形予測ボコーダ(例
えば、JohnRHaskew、J.M.Kelly、
Ro戊でtM.Kelly、JR.andThomas
日.Mckinney、“ReS山ts of a
Studyof the Linear Predi
ction Vocoder’’、lEEETrans
actions on Communications
、VOL.COM−21、No.9、Septem戊r
l973pp.1008〜1015)、線スペクトルボ
コーダ(例えば、板倉文忠、東倉洋一、「擬ホルマント
ボコーダ」、電子通信学会技術研究報告、EA−76−
21、197母手7月21日)等の音声分析合成装置は
、種々の音声の特徴を表現するパラメータを、分析側に
おいて被分析音声信号を分析して抽出し、前記パラメー
タを直接、又は他のパラメータに変換して(例えば線形
予測ボコーダにおいては、反射係数と直接的に又は間接
的に関係のある線形予測係数をLOG AREARAT
IOに変換する手段等、(例えば、JohnNねkh。
ul、‘‘Linear Prediction:A
TutorialReviev ’’、 Proce
e Din鱗 of 仇e lEEE 、VOL.63
、NO.4Aprill97ふ第576ページ、V.C
.項)量子化し合成側へ伝送する。合成側では前記直接
的な又は変換された形の量子化パラメータを用いて音声
を合成する。前記の分析され、直接的に又は変換後に伝
送されるパラメータの多くは、その頻度分布が有声音と
無声音とで異なることが知られている。
TutorialReviev ’’、 Proce
e Din鱗 of 仇e lEEE 、VOL.63
、NO.4Aprill97ふ第576ページ、V.C
.項)量子化し合成側へ伝送する。合成側では前記直接
的な又は変換された形の量子化パラメータを用いて音声
を合成する。前記の分析され、直接的に又は変換後に伝
送されるパラメータの多くは、その頻度分布が有声音と
無声音とで異なることが知られている。
例えば音源情報においては短時間平均電力(例えば、B
iShnu S.At,a1・Law汀enCe R.
Rabiner、‘‘APat企てn ReCogni
tion Approach の Voiced −U
nvoiced − Silence Clas
sification15withApplicati
ons to Speech Recognition
’’、lEEETra船actions on Aco
ustics、Speech、 andSi部aI P
rocessing、VOL.ASSP−24.No.
幻皿el970第203ページ、Fig一3)、スベク
トラム情報においては第1ホルマントの周波数帯城幅等
、多くのパラメータが有声と無声とではその分布を異と
している。特に線形予測ボコーダに用いられるパラメー
タの多くは、例えば前記短時間平均電力、予測残差電力
、線形方程式の直接的な解として求まる予測係数、前記
予測係数の変形である部分自己相関係数、正規化予測残
差電力等その分布は有声と無声とでは大きく異なる。
iShnu S.At,a1・Law汀enCe R.
Rabiner、‘‘APat企てn ReCogni
tion Approach の Voiced −U
nvoiced − Silence Clas
sification15withApplicati
ons to Speech Recognition
’’、lEEETra船actions on Aco
ustics、Speech、 andSi部aI P
rocessing、VOL.ASSP−24.No.
幻皿el970第203ページ、Fig一3)、スベク
トラム情報においては第1ホルマントの周波数帯城幅等
、多くのパラメータが有声と無声とではその分布を異と
している。特に線形予測ボコーダに用いられるパラメー
タの多くは、例えば前記短時間平均電力、予測残差電力
、線形方程式の直接的な解として求まる予測係数、前記
予測係数の変形である部分自己相関係数、正規化予測残
差電力等その分布は有声と無声とでは大きく異なる。
なお前記LOG AREARATIOは前記部分自己相
関係数から直接的に求まり、前記部分自己相関係数同様
、有声と無声とでは分布を異にする。本発明は有声と無
声とで分布を異にする分析パラメータを、有声/無声判
別結果に基いて、有声の場合には有声における各パラメ
ータの分布に適する軍子化を行ない、無声の場合には無
声における各パラメータの分布に適する量子化を行なう
ことにより、より精密な分析パラメータの量子化を実施
し得る音声分析合成装置を提供するものである。
関係数から直接的に求まり、前記部分自己相関係数同様
、有声と無声とでは分布を異にする。本発明は有声と無
声とで分布を異にする分析パラメータを、有声/無声判
別結果に基いて、有声の場合には有声における各パラメ
ータの分布に適する軍子化を行ない、無声の場合には無
声における各パラメータの分布に適する量子化を行なう
ことにより、より精密な分析パラメータの量子化を実施
し得る音声分析合成装置を提供するものである。
本発明によれば、有声/無声の判別を行なって音声を分
析又は合成する音声処理装置において、前記有声/無声
の判別結果により、分析パラメータを有声、無声に対応
して量子化する手段と量子化された分析パラメータを有
声、無声に対応して復号する手段の少なくとも一方を具
備して成ることを特徴とする音声処理装置が得られる。
析又は合成する音声処理装置において、前記有声/無声
の判別結果により、分析パラメータを有声、無声に対応
して量子化する手段と量子化された分析パラメータを有
声、無声に対応して復号する手段の少なくとも一方を具
備して成ることを特徴とする音声処理装置が得られる。
次に図面を参照して本発明を詳細に説明する。図は本発
明の一実施例を説明するためのブロック図である。図に
於いて、101は本発明の構成範囲を示す。102は分
析側を、103は合成側を、104は量子化パラメータ
伝送路を示す。
明の一実施例を説明するためのブロック図である。図に
於いて、101は本発明の構成範囲を示す。102は分
析側を、103は合成側を、104は量子化パラメータ
伝送路を示す。
波形入力端子111を介して音声波形入力信号が有声/
無声判別回路105と分析器106とへ供給される。有
声/無声判別器105は周知の手段(例えば、谷戸文魔
、樽松明、「音声分析合成系における有声無声判定の検
討ハ昭和52王度電子通信学会情報部門全国大会、論文
集、205ページ)により有声/無声判別を行ない、判
別結果を符号化器107へ出力する。分析器106は例
えば短時間平均電力、ピッチ周期、複数の線形予測係数
等の音声の特徴を表現するパラメータを前記音声波形入
力信号を分析することにより抽出し、抽出した各パラメ
ータを符号化器107へ出力する。符号化器107は有
声/無声判別器105より供給される有声/無声判別信
号に基づいて、分析器106より供給される各パラメー
タを、分布特性に基づいて最適に量子化する。例えば1
次の線形予測係数に対応する1次のKパラメータ(部分
自己相関係数)K,値は有声音の場合十0.6〜十1.
0に集中し、無声音の場合には略−0.7〜十0.7に
わたって分布している。従って有声時のK,は十0.6
〜十1.0の範囲にのみ量子化ビットを割り当て、この
値を一定の量子化ステップで量子化し、無声時には−0
.7〜十0.7の領域にわたって量子化ビットを割り当
てて量子化を行なう。更に符号化器107は前記量子化
された各パラメータと有声/無声判別信号とを量子化パ
ラメータ伝送路104へ出力する。復号化器108は量
子化パラメータ伝送路104を介して供給される前記量
子化された各パラメータを同様に量子化パラメータ伝送
路104を介して供給される有声/無声判別信号に基づ
いて復号する。更に復号化器108は前記復号された各
パラメータと有声/無線判別信号とを合成器109へ出
力する。合成器109は前記復号された各パラメータと
無声/無声判別信号とから音声を合成し、波形出力端子
110を介して前記合成された音声を出力する。本発明
により、例えば同一の伝送容量においてはより精密な分
析パラメータの量子化効果により、合成側における合成
音の音質を向−上することができる。
無声判別回路105と分析器106とへ供給される。有
声/無声判別器105は周知の手段(例えば、谷戸文魔
、樽松明、「音声分析合成系における有声無声判定の検
討ハ昭和52王度電子通信学会情報部門全国大会、論文
集、205ページ)により有声/無声判別を行ない、判
別結果を符号化器107へ出力する。分析器106は例
えば短時間平均電力、ピッチ周期、複数の線形予測係数
等の音声の特徴を表現するパラメータを前記音声波形入
力信号を分析することにより抽出し、抽出した各パラメ
ータを符号化器107へ出力する。符号化器107は有
声/無声判別器105より供給される有声/無声判別信
号に基づいて、分析器106より供給される各パラメー
タを、分布特性に基づいて最適に量子化する。例えば1
次の線形予測係数に対応する1次のKパラメータ(部分
自己相関係数)K,値は有声音の場合十0.6〜十1.
0に集中し、無声音の場合には略−0.7〜十0.7に
わたって分布している。従って有声時のK,は十0.6
〜十1.0の範囲にのみ量子化ビットを割り当て、この
値を一定の量子化ステップで量子化し、無声時には−0
.7〜十0.7の領域にわたって量子化ビットを割り当
てて量子化を行なう。更に符号化器107は前記量子化
された各パラメータと有声/無声判別信号とを量子化パ
ラメータ伝送路104へ出力する。復号化器108は量
子化パラメータ伝送路104を介して供給される前記量
子化された各パラメータを同様に量子化パラメータ伝送
路104を介して供給される有声/無声判別信号に基づ
いて復号する。更に復号化器108は前記復号された各
パラメータと有声/無線判別信号とを合成器109へ出
力する。合成器109は前記復号された各パラメータと
無声/無声判別信号とから音声を合成し、波形出力端子
110を介して前記合成された音声を出力する。本発明
により、例えば同一の伝送容量においてはより精密な分
析パラメータの量子化効果により、合成側における合成
音の音質を向−上することができる。
また同一の音質を保障するのに必要な量子化BIT数を
削減し得ることから、伝送容量を減少し得るのは明らか
である。言い換えるならば、例えば、いわゆるK,と呼
ばれる1次の部分自己相関係数の量子イ船IT数を有毒
と無声とで異なる数にする等の手段で、有声と無声とで
量子化BIT数を異なる値に設定し、ある時間ブロック
単位で、もしくは長時間平均的に伝送容量を減少し得る
ことも明らかである。
削減し得ることから、伝送容量を減少し得るのは明らか
である。言い換えるならば、例えば、いわゆるK,と呼
ばれる1次の部分自己相関係数の量子イ船IT数を有毒
と無声とで異なる数にする等の手段で、有声と無声とで
量子化BIT数を異なる値に設定し、ある時間ブロック
単位で、もしくは長時間平均的に伝送容量を減少し得る
ことも明らかである。
また有声と無声とでパラメータの量子化BIT数を変え
る場合には、例えば有声の場合により少ないBIT数で
量子化されるならば有声と無声との量子化BIT数の差
のBIT数を有声を分析した結果か得られる他の新らし
いパラメータに与えることも可能である。更に、有声/
無声判別信号に基づいて適切なパラメータを選択するこ
とも可能である。以上述べた音声分析合成装置は、分析
側、合成側それぞれ単独で用いることが可能である。例
えば音声分析合成装置の分析側のみを用いたことに対応
する音声分析装置は、音声信号の圧縮等の用途に用いら
れる。ま音声分析合成装置の合成側のみを用いたことに
対応する音声合成装置は音声応答等の用途に用いられる
。以上の説明から明らかのように、本発明は有声と無声
とで分布を異にする分析パラメータを、有声/無声判別
結果に基づいて、有声の場合には、有声における各パラ
メータの分布に適する量子化を行ない、無声の場合には
無声における各パラメータの分布に適する量子化を行な
うことにより、より高度な音声信号の圧縮が可能となる
という効果を持つ。
る場合には、例えば有声の場合により少ないBIT数で
量子化されるならば有声と無声との量子化BIT数の差
のBIT数を有声を分析した結果か得られる他の新らし
いパラメータに与えることも可能である。更に、有声/
無声判別信号に基づいて適切なパラメータを選択するこ
とも可能である。以上述べた音声分析合成装置は、分析
側、合成側それぞれ単独で用いることが可能である。例
えば音声分析合成装置の分析側のみを用いたことに対応
する音声分析装置は、音声信号の圧縮等の用途に用いら
れる。ま音声分析合成装置の合成側のみを用いたことに
対応する音声合成装置は音声応答等の用途に用いられる
。以上の説明から明らかのように、本発明は有声と無声
とで分布を異にする分析パラメータを、有声/無声判別
結果に基づいて、有声の場合には、有声における各パラ
メータの分布に適する量子化を行ない、無声の場合には
無声における各パラメータの分布に適する量子化を行な
うことにより、より高度な音声信号の圧縮が可能となる
という効果を持つ。
図は本発明の一実施例を説明するためのブロック図であ
る。 101・…・・本発明の構成範囲、102・・・・・・
分析側、103・・・・・・合成側、104・・・・・
・量子化パラメータ伝送路、105・・・・・・有声/
無声判別器、106・・・・・・分析器、107・・・
・・・符号化器、108・・・・・・復号化器、109
・・・・・・合成器、110・・…・波形出力端子、1
11・・・・・・波形入力端子。
る。 101・…・・本発明の構成範囲、102・・・・・・
分析側、103・・・・・・合成側、104・・・・・
・量子化パラメータ伝送路、105・・・・・・有声/
無声判別器、106・・・・・・分析器、107・・・
・・・符号化器、108・・・・・・復号化器、109
・・・・・・合成器、110・・…・波形出力端子、1
11・・・・・・波形入力端子。
Claims (1)
- 1 分析側では予め定めた時間間隔毎に入力音声信号の
周波数スペクトラムと音源情報等を示すパラメータおよ
び有声/無声判別情報を求めた後量子化し、合成側では
前記パラメータにより諸係数および励振音源情報が定ま
る合成フイルタによつて入力音声信号を合声する音声成
理装置において、分析側では前記パラメータのうち、有
声と無声とでその頻度分布が異なる特定のパラメータを
前記有声/無声判別情報に基づいて予め定めた量子化態
様で量子化し、合成側では前記有声/無声判別情報に基
づいて前記予め定めた量子化態様に対応して前記特定の
パラメータを復号することを特徴とする音声処理装置。
Priority Applications (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP53037496A JPS6019520B2 (ja) | 1978-03-30 | 1978-03-30 | 音声処理装置 |
CA324,405A CA1123955A (en) | 1978-03-30 | 1979-03-29 | Speech analysis and synthesis apparatus |
US06/236,428 US4360708A (en) | 1978-03-30 | 1981-02-20 | Speech processor having speech analyzer and synthesizer |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP53037496A JPS6019520B2 (ja) | 1978-03-30 | 1978-03-30 | 音声処理装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
JPS54133004A JPS54133004A (en) | 1979-10-16 |
JPS6019520B2 true JPS6019520B2 (ja) | 1985-05-16 |
Family
ID=12499125
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP53037496A Expired JPS6019520B2 (ja) | 1978-03-30 | 1978-03-30 | 音声処理装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JPS6019520B2 (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH0315676Y2 (ja) * | 1985-09-20 | 1991-04-04 |
-
1978
- 1978-03-30 JP JP53037496A patent/JPS6019520B2/ja not_active Expired
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH0315676Y2 (ja) * | 1985-09-20 | 1991-04-04 |
Also Published As
Publication number | Publication date |
---|---|
JPS54133004A (en) | 1979-10-16 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US5778335A (en) | Method and apparatus for efficient multiband celp wideband speech and music coding and decoding | |
EP1353323B1 (en) | Method, device and program for coding and decoding acoustic parameter, and method, device and program for coding and decoding sound | |
CA1333425C (en) | Communication system capable of improving a speech quality by classifying speech signals | |
US8396706B2 (en) | Speech coding | |
EP0833305A2 (en) | Low bit-rate pitch lag coder | |
US6678655B2 (en) | Method and system for low bit rate speech coding with speech recognition features and pitch providing reconstruction of the spectral envelope | |
JP2004517348A (ja) | 非音声のスピーチの高性能の低ビット速度コード化方法および装置 | |
KR100614496B1 (ko) | 가변 비트율의 광대역 음성 및 오디오 부호화 장치 및방법 | |
US5526464A (en) | Reducing search complexity for code-excited linear prediction (CELP) coding | |
JP3144009B2 (ja) | 音声符号復号化装置 | |
JPH09258795A (ja) | ディジタルフィルタおよび音響符号化/復号化装置 | |
WO2002021091A1 (fr) | Analyseur de signal de bruit, synthetiseur de signal de bruit, procede d'analyse de signal de bruit et procede de synthese de signal de bruit | |
Lin et al. | Mixed excitation linear prediction coding of wideband speech at 8 kbps | |
KR20050006883A (ko) | 광대역 음성 부호화기 및 그 방법과 광대역 음성 복호화기및 그 방법 | |
Hagen | Spectral quantization of cepstral coefficients | |
JP2797348B2 (ja) | 音声符号化・復号化装置 | |
JPH07225599A (ja) | 音声の符号化方法 | |
JPS6019520B2 (ja) | 音声処理装置 | |
Iao | Mixed wideband speech and music coding using a speech/music discriminator | |
Bouzid et al. | Switched split vector quantizer applied for encoding the LPC parameters of the 2.4 Kbits/s MELP speech coder | |
JP2581050B2 (ja) | 音声分析合成装置 | |
Ojala et al. | Variable model order LPC quantization | |
Gournay et al. | A 1200 bits/s HSX speech coder for very-low-bit-rate communications | |
JP3010655B2 (ja) | 圧縮符号化装置及び方法、並びに復号装置及び方法 | |
Noll | Speech coding for communications. |