JPS6117200A - 音声分析合成方法および装置 - Google Patents
音声分析合成方法および装置Info
- Publication number
- JPS6117200A JPS6117200A JP59138704A JP13870484A JPS6117200A JP S6117200 A JPS6117200 A JP S6117200A JP 59138704 A JP59138704 A JP 59138704A JP 13870484 A JP13870484 A JP 13870484A JP S6117200 A JPS6117200 A JP S6117200A
- Authority
- JP
- Japan
- Prior art keywords
- parameters
- parameter
- quantization
- synthesis
- speech
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Abstract
(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。
め要約のデータは記録されません。
Description
【発明の詳細な説明】
〔発明の技術分野〕
本発明は音声を分析して特徴パラメータを抽出し、この
特徴パラメータに基づいて音声を合成する音声分析方法
および@置に関する。
特徴パラメータに基づいて音声を合成する音声分析方法
および@置に関する。
LPGSPARCOR,LSP、フォルマント方式等に
よる分析合成方式の音声分析合成装置では、音声を分析
して特徴パラメータを抽出することにより、音声情報を
圧縮して記憶している。そしてこの特徴パラメータから
原音声を合成している。さらに情報量を圧縮するため抽
出された特徴パラメータを量子化し、この量子化パラメ
ータを記憶するようにしている。
よる分析合成方式の音声分析合成装置では、音声を分析
して特徴パラメータを抽出することにより、音声情報を
圧縮して記憶している。そしてこの特徴パラメータから
原音声を合成している。さらに情報量を圧縮するため抽
出された特徴パラメータを量子化し、この量子化パラメ
ータを記憶するようにしている。
この量子化の際には、特徴パラメータと量子化パラメー
タとが線形の関係にある線形変換をおこなうことが多い
。量子化パラメータにNビットを割当てれば、量子化パ
ラメータの値は正の数で表現してO〜2N−1の範囲を
とる。ところが特徴パラメータの分布の統計的性質から
、0付近および2N−1付近の値をとる頻度が非常に少
ない場合がある。このとき量子化パラメータのビット数
Nを小さくすると、新しいビット数Nに対する2N−1
を超える範囲にも特徴パラメータが分布してしまうため
、単にビット数Nを小さくすることができず、どうして
も無駄な範囲を生じ、特徴パラメータの記憶および伝送
に余分な情報量を必要としていた。
タとが線形の関係にある線形変換をおこなうことが多い
。量子化パラメータにNビットを割当てれば、量子化パ
ラメータの値は正の数で表現してO〜2N−1の範囲を
とる。ところが特徴パラメータの分布の統計的性質から
、0付近および2N−1付近の値をとる頻度が非常に少
ない場合がある。このとき量子化パラメータのビット数
Nを小さくすると、新しいビット数Nに対する2N−1
を超える範囲にも特徴パラメータが分布してしまうため
、単にビット数Nを小さくすることができず、どうして
も無駄な範囲を生じ、特徴パラメータの記憶および伝送
に余分な情報量を必要としていた。
このことを考慮して特徴パラメータの一部又は全部を非
線形に変換した後量子化して、必要最小限のビット数の
量子化パラメータで特徴パラメータをあられすごとがお
こなわれている。しかしながらこのように非線形に量子
化した場合には、量子化パラメータから特徴パラメータ
に復元するどきに、複雑な非線形変換の逆変換をする必
要があった。通常、LSI化された音声分析合成装置で
は、この複雑な逆変換をROMにより実現しており、回
路規模が大きくなるという問題があった。
線形に変換した後量子化して、必要最小限のビット数の
量子化パラメータで特徴パラメータをあられすごとがお
こなわれている。しかしながらこのように非線形に量子
化した場合には、量子化パラメータから特徴パラメータ
に復元するどきに、複雑な非線形変換の逆変換をする必
要があった。通常、LSI化された音声分析合成装置で
は、この複雑な逆変換をROMにより実現しており、回
路規模が大きくなるという問題があった。
本発明は上記事情を考慮してなされたもので、少ない情
報mで歪の少ない量子化をすることができ、回路規模の
増加を招くことなく、高品位の合成音を得ることができ
る音声分析合成方法および装置を提供することを目的と
する。
報mで歪の少ない量子化をすることができ、回路規模の
増加を招くことなく、高品位の合成音を得ることができ
る音声分析合成方法および装置を提供することを目的と
する。
〔発明の11
上記目的を達成するために本発明による音声分析方法は
、音声の特徴パラメータの量子化パラメータ中の一部の
パラメータのパターンに応じて、この一部のパラメータ
を変換し、この変換されたパラメータを量子化パラメー
タに付加して音声合成用のパラメータとすることを特徴
としている。
、音声の特徴パラメータの量子化パラメータ中の一部の
パラメータのパターンに応じて、この一部のパラメータ
を変換し、この変換されたパラメータを量子化パラメー
タに付加して音声合成用のパラメータとすることを特徴
としている。
また本発明による音声分析装置は、音声の特徴パラメー
タの量子化パラメータ中の一部のパラメータのパターン
に応じて、この一部のパラメータを変換する変換手段と
、量子化パラメータにこの変換されたパラメータを付加
した合成パラメータより音声を合成する合成手段とを備
えたことを特徴とする。
タの量子化パラメータ中の一部のパラメータのパターン
に応じて、この一部のパラメータを変換する変換手段と
、量子化パラメータにこの変換されたパラメータを付加
した合成パラメータより音声を合成する合成手段とを備
えたことを特徴とする。
以下本発明を図示の実施例に基づいて説明する。
第1図に本発明の一実施例による音声分析合成装置を示
す。分析回路10に入力された音声信号は、LPC,P
ARCOR,LSP、フォルマント方式等の分析がおこ
なわれ、特徴パラメータ11が出力される。この特徴パ
ラメータ11は、Mビットであり量子化回路12と比較
回路13に入力される。量子化回路12は入力したMビ
ットの特徴パラメータ11を量子化してNビットの量子
化パラメータ15を出力する。比較回路13は、特徴パ
ラメータ11の値による制御信号14を量子化回路12
へ出力し、量子化回路12を切換えるようにしている。
す。分析回路10に入力された音声信号は、LPC,P
ARCOR,LSP、フォルマント方式等の分析がおこ
なわれ、特徴パラメータ11が出力される。この特徴パ
ラメータ11は、Mビットであり量子化回路12と比較
回路13に入力される。量子化回路12は入力したMビ
ットの特徴パラメータ11を量子化してNビットの量子
化パラメータ15を出力する。比較回路13は、特徴パ
ラメータ11の値による制御信号14を量子化回路12
へ出力し、量子化回路12を切換えるようにしている。
このように特徴パラメータ11をさらに情報圧縮して得
られた量子化パラメータ15G、tメモリ2oに記憶さ
れる。
られた量子化パラメータ15G、tメモリ2oに記憶さ
れる。
メモリ20に記憶された量子化パラメータからの音声の
合成は次のようにする。メモリ2oがらの量子化パラメ
ータ21は合成回路26に入力されるが、同時にト位N
′ビットが変換ROM25に入力される。変換ROM
25は量子化パラメータ21の上位N′ビットのパター
ンに応じてM−Nビットの付加パラメータ23を出力す
るものでる。この付加パラメータ23は量子化パラメー
タ21に付加され、Nビットの合成パラメータ24とし
て合成回路26に入力する。この合成回路26は合成パ
ラメータ24に基づいて音声を合成する。
合成は次のようにする。メモリ2oがらの量子化パラメ
ータ21は合成回路26に入力されるが、同時にト位N
′ビットが変換ROM25に入力される。変換ROM
25は量子化パラメータ21の上位N′ビットのパター
ンに応じてM−Nビットの付加パラメータ23を出力す
るものでる。この付加パラメータ23は量子化パラメー
タ21に付加され、Nビットの合成パラメータ24とし
て合成回路26に入力する。この合成回路26は合成パ
ラメータ24に基づいて音声を合成する。
次にM2図に示′rJ具体例により更に詳細に説明する
。ここでは−2〜5のV!囲の値をとる4ビツトの特徴
パラメータ(第2図(a))を3ビツトの量子化パラメ
ータ(第2図(b))に情報圧縮している。この量子化
は量子化回路12によりなされる。第2図(a)、(b
)かられかるように、この具体例ではこの量子化は4ビ
ツトの特徴パラメータの最上位ビットを削除するだけで
よい。この具体例では比較回路13の制御信号14によ
り量子化回路12の量子化を切換える必要はない。
。ここでは−2〜5のV!囲の値をとる4ビツトの特徴
パラメータ(第2図(a))を3ビツトの量子化パラメ
ータ(第2図(b))に情報圧縮している。この量子化
は量子化回路12によりなされる。第2図(a)、(b
)かられかるように、この具体例ではこの量子化は4ビ
ツトの特徴パラメータの最上位ビットを削除するだけで
よい。この具体例では比較回路13の制御信号14によ
り量子化回路12の量子化を切換える必要はない。
音声合成の場合は3ビツトの量子化パラメータ21のう
ち上位2ピツトを変換ROM25により1ビツトの付加
パラメータ23に変換する。変換ROM25は第2図(
C)に示すように入力パラメータが「11」のときのみ
「1」、他の場合は「0」を出力するよう構成されてい
る。したがってこの変換ROM25から出力される付加
ビット23を量子化ビット21に付加するだけで4ビツ
トの合成パラメータ24(第2図(a))を得ることが
できる。
ち上位2ピツトを変換ROM25により1ビツトの付加
パラメータ23に変換する。変換ROM25は第2図(
C)に示すように入力パラメータが「11」のときのみ
「1」、他の場合は「0」を出力するよう構成されてい
る。したがってこの変換ROM25から出力される付加
ビット23を量子化ビット21に付加するだけで4ビツ
トの合成パラメータ24(第2図(a))を得ることが
できる。
このように本実施例によれば、合成パラメータを生成す
るために、一部のビットに対する小規模の変換ROMを
設けるだけで、非線形の変換が可能である。
るために、一部のビットに対する小規模の変換ROMを
設けるだけで、非線形の変換が可能である。
本発明の他の実施例にJ、る音声分析合成装置を第3図
に示す。メモリ20に記憶された量子化パラメータから
音声を合成する部分が先の実施例と相違する。本実施例
では変換ROM25のかわりに、パターン検出回路27
どビット操作回路28を設けている。Nビットの量子化
パラメータの上位N′ビットのパラメータがパターン検
出回路27に入力される。パターン検出回路は、このN
−ビットのパラメータが特定のパターンに合致するか否
かを検出するものであり、その検出結果に基づいて制御
信号29をピッ1ル操作回路28へ出力する。ビット操
作回路28は、この制御信号29に応じて異なるIVI
−Nビットの付加パラメータ23を出力する。このM−
Nビットの付加パラメータ23は量子化パラメータ21
に付加され、Nビットの合成パラメータ24として合成
回路26に入力される。この合成回路26は合成パラメ
ータ24に基づいて音声を合成づる。
に示す。メモリ20に記憶された量子化パラメータから
音声を合成する部分が先の実施例と相違する。本実施例
では変換ROM25のかわりに、パターン検出回路27
どビット操作回路28を設けている。Nビットの量子化
パラメータの上位N′ビットのパラメータがパターン検
出回路27に入力される。パターン検出回路は、このN
−ビットのパラメータが特定のパターンに合致するか否
かを検出するものであり、その検出結果に基づいて制御
信号29をピッ1ル操作回路28へ出力する。ビット操
作回路28は、この制御信号29に応じて異なるIVI
−Nビットの付加パラメータ23を出力する。このM−
Nビットの付加パラメータ23は量子化パラメータ21
に付加され、Nビットの合成パラメータ24として合成
回路26に入力される。この合成回路26は合成パラメ
ータ24に基づいて音声を合成づる。
次に第4図に示す具体例により本実施例を更に詳細に説
明する。4ビツトの特徴パラメータを3ビツトの量子化
パラメータに情報圧縮している。
明する。4ビツトの特徴パラメータを3ビツトの量子化
パラメータに情報圧縮している。
なおこの具体例では各パラメータを符号なし整数として
扱う。従って第4図(a)に示す特徴パラメータは2〜
9の値をとる。特徴パラメータから量子化パラメータの
量子化は量子化回路12によりなされる。この具体例で
は量子化は4ビツトの特徴パラメータの最上位ビットを
削除することによりおこなわれる(第4図(b))。音
声合成にあたっては、メモリ20に記憶された量子化パ
ラメータ21の上位2ビツトをパターン検出回路27に
入力する。パターン検出回路27はこの上2ビットが「
OO」なるパターンであるか否かを検出し、その検出結
果に基づき異なる検出信号2つをビット操作回路28へ
出力する。ビット操作回路28は、パターン検出回路2
7から「00」なるパターンが検出された旨の検出信号
29を入力した場合は「1」を出力し、他の場合はrO
Jを出力する。この1ビツトの付加パラメータ23は3
ビツトの量子化パラメータ21に付加され、4ビツトの
合成パラメータ24(第4図(a))を得る。これによ
り、0〜7の団子化パラメータから2〜9の合成パラメ
ータを得ることができる。
扱う。従って第4図(a)に示す特徴パラメータは2〜
9の値をとる。特徴パラメータから量子化パラメータの
量子化は量子化回路12によりなされる。この具体例で
は量子化は4ビツトの特徴パラメータの最上位ビットを
削除することによりおこなわれる(第4図(b))。音
声合成にあたっては、メモリ20に記憶された量子化パ
ラメータ21の上位2ビツトをパターン検出回路27に
入力する。パターン検出回路27はこの上2ビットが「
OO」なるパターンであるか否かを検出し、その検出結
果に基づき異なる検出信号2つをビット操作回路28へ
出力する。ビット操作回路28は、パターン検出回路2
7から「00」なるパターンが検出された旨の検出信号
29を入力した場合は「1」を出力し、他の場合はrO
Jを出力する。この1ビツトの付加パラメータ23は3
ビツトの量子化パラメータ21に付加され、4ビツトの
合成パラメータ24(第4図(a))を得る。これによ
り、0〜7の団子化パラメータから2〜9の合成パラメ
ータを得ることができる。
なおビット操作回路28はパターン検出回路27の検出
信号29に応じて量子化パラメータに論理和、論理積等
のビット操作を加えるようにしてもよい。
信号29に応じて量子化パラメータに論理和、論理積等
のビット操作を加えるようにしてもよい。
このように本実施例によれば極めて簡単な回路で、量子
化パラメータから合成パラメータを生成することができ
有効である。
化パラメータから合成パラメータを生成することができ
有効である。
例えばRARCOR方式で音声の分析合成をおこなう場
合、従来はピッチデータを7ヒツトで線形量子化してい
る。この場合O〜127の範囲のピッチデータが量子化
できる。しかし実際に人の声を分析すると15以下のピ
ッチデータが得られることはなく、0〜15の範囲が無
駄となっていた。一方、男性の低目の声はピッチデータ
が130以上ある場合もあり、従来はこれを正しく量子
化することができなかった。しかしながら上記実施例に
よれば同じ7ビツトで量子化する場合でも16〜143
の範囲のピッチデータを団子化することができ、量子化
パラメータの情報量を増やさず、かつ回路規模もほとん
ど増加することなく高品位の合成音を得ることができる
。
合、従来はピッチデータを7ヒツトで線形量子化してい
る。この場合O〜127の範囲のピッチデータが量子化
できる。しかし実際に人の声を分析すると15以下のピ
ッチデータが得られることはなく、0〜15の範囲が無
駄となっていた。一方、男性の低目の声はピッチデータ
が130以上ある場合もあり、従来はこれを正しく量子
化することができなかった。しかしながら上記実施例に
よれば同じ7ビツトで量子化する場合でも16〜143
の範囲のピッチデータを団子化することができ、量子化
パラメータの情報量を増やさず、かつ回路規模もほとん
ど増加することなく高品位の合成音を得ることができる
。
以上の通り本発明によれば回路規模の増加を招くことな
く、少ない情報量で歪の少ない量子化をすることができ
る。
く、少ない情報量で歪の少ない量子化をすることができ
る。
第1図は本発明の一実施例による音声分析合成装置のブ
ロック図、 第2図(a)、(b)、(c)は同音声分析合成装置の
特徴パラメータ、合成パラメータ、量子化パラメータ、
変換ROMの内容を示す図、第3図は本発明の他の実施
例による音声分析合成装置のブロック図、 第4図(a>、(b)は同音声分析合成装置の特徴パラ
メータ、合成パラメータ、団子化パラメータを示す図で
ある。 10・・・分析回路、11・・・特徴パラメータ、12
・・・量子化回路、13・・・比較回路、15・・・量
子化パラメータ、20・・・メモリ、21・・・量子化
パラメータ、24・・・合成パラメータ、25・・・変
換ROM、26・・・合成回路、27・・・パターン検
出回路、28・・・ビット操作回路。 出願人代理人 猪 股 清 第1図 第2図 第3図−
ロック図、 第2図(a)、(b)、(c)は同音声分析合成装置の
特徴パラメータ、合成パラメータ、量子化パラメータ、
変換ROMの内容を示す図、第3図は本発明の他の実施
例による音声分析合成装置のブロック図、 第4図(a>、(b)は同音声分析合成装置の特徴パラ
メータ、合成パラメータ、団子化パラメータを示す図で
ある。 10・・・分析回路、11・・・特徴パラメータ、12
・・・量子化回路、13・・・比較回路、15・・・量
子化パラメータ、20・・・メモリ、21・・・量子化
パラメータ、24・・・合成パラメータ、25・・・変
換ROM、26・・・合成回路、27・・・パターン検
出回路、28・・・ビット操作回路。 出願人代理人 猪 股 清 第1図 第2図 第3図−
Claims (1)
- 【特許請求の範囲】 1、音声を分析した特徴パラメータの値に応じて、一部
のパラメータが特定のパターンとなるように特徴パラメ
ータを量子化し、 この量子化パラメータ中の一部のパラメータのパターン
に応じて、この一部のパラメータを変換し、 この変換されたパラメータを前記量子化パラメータに付
加した合成パラメータにより音声を合成することを特徴
とする音声分析合成方法。 2、音声を分析して特徴パラメータを抽出する分析手段
と、 この分析手段から抽出された特徴パラメータの値に応じ
て、一部のパラメータが特定のパターンとなるように前
記特徴パラメータを量子化し、量子化パラメータを生成
する量子化手段と、 この量子化パラメータ中の一部のパラメータを入力し、
この一部のパラメータのパターンに応じたパラメータに
変換する変換手段と、 前記量子化パラメータに、この変換手段により変換され
たパラメータを付加した合成パラメータより音声を合成
する合成手段と を備えた音声分析装置。 3、特許請求の範囲第2項記載の装置において、 前記変換手段はパラメータ変換ROMであることを特徴
とする音声分析装置。 4、特許請求の範囲第2項記載の装置において、 前記変換手段は、前記一部のパラメータが特定のパター
ンであるか否かを検出するパターン検出手段と、このパ
ターン検出手段の出力に応じて前記量子化パラメータへ
の付加パラメータを出力する付加パラメータ発生手段と
を有することを特徴とする音声分析合成回路。 5、特許請求の範囲第2項から第4項のいずれかに記載
の装置において、 前記量子化パラメータ中の上位側ビットを前記一部のパ
ラメータとすることを特徴とする音声分析合成装置。 6、特許請求の範囲第2項から第5項のいずれかに記載
の装置において、 前記合成パラメータのビット数が前記量子化パラメータ
のビット数より大きいことを特徴とする音声分析合成装
置。
Priority Applications (4)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP59138704A JPH0632026B2 (ja) | 1984-07-04 | 1984-07-04 | 音声分析合成方法および装置 |
EP85108242A EP0170087B1 (en) | 1984-07-04 | 1985-07-03 | Method and apparatus for analyzing and synthesizing human speech |
DE8585108242T DE3586671T2 (de) | 1984-07-04 | 1985-07-03 | Verfahren und einrichtung zur analyse und synthese von menschlicher sprache. |
US07/423,571 US5018199A (en) | 1984-07-04 | 1989-09-01 | Code-conversion method and apparatus for analyzing and synthesizing human speech |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP59138704A JPH0632026B2 (ja) | 1984-07-04 | 1984-07-04 | 音声分析合成方法および装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
JPS6117200A true JPS6117200A (ja) | 1986-01-25 |
JPH0632026B2 JPH0632026B2 (ja) | 1994-04-27 |
Family
ID=15228172
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP59138704A Expired - Lifetime JPH0632026B2 (ja) | 1984-07-04 | 1984-07-04 | 音声分析合成方法および装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JPH0632026B2 (ja) |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS5533117A (en) * | 1978-08-31 | 1980-03-08 | Kokusai Denshin Denwa Co Ltd | Voice transmission system |
JPS59119395A (ja) * | 1982-12-25 | 1984-07-10 | カシオ計算機株式会社 | 音声情報の圧縮方式 |
-
1984
- 1984-07-04 JP JP59138704A patent/JPH0632026B2/ja not_active Expired - Lifetime
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS5533117A (en) * | 1978-08-31 | 1980-03-08 | Kokusai Denshin Denwa Co Ltd | Voice transmission system |
JPS59119395A (ja) * | 1982-12-25 | 1984-07-10 | カシオ計算機株式会社 | 音声情報の圧縮方式 |
Also Published As
Publication number | Publication date |
---|---|
JPH0632026B2 (ja) | 1994-04-27 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US4852179A (en) | Variable frame rate, fixed bit rate vocoding method | |
US4704730A (en) | Multi-state speech encoder and decoder | |
US4382160A (en) | Methods and apparatus for encoding and constructing signals | |
US3803358A (en) | Voice synthesizer with digitally stored data which has a non-linear relationship to the original input data | |
EP0529556A2 (en) | Vector-quatizing device | |
JPS59500988A (ja) | ボイスエンコ−ダおよびシンセサイザ | |
AU716880B2 (en) | Method for compressing an analog signal | |
JPH09106299A (ja) | 音響信号変換符号化方法および復号化方法 | |
JPS62194296A (ja) | 音声符号化方式 | |
JPS6117200A (ja) | 音声分析合成方法および装置 | |
JPS5875341A (ja) | 差分によるデ−タ圧縮装置 | |
JP2796408B2 (ja) | 音声情報圧縮装置 | |
JP2004246038A (ja) | 音声楽音信号符号化方法、復号化方法、符号化装置、復号化装置、符号化プログラム、および復号化プログラム | |
JPS6337400A (ja) | 音声符号化及び復号化方法 | |
JPS6117197A (ja) | 音声分析合成方法および装置 | |
JPS5866440A (ja) | 波形符号化方式 | |
US5018199A (en) | Code-conversion method and apparatus for analyzing and synthesizing human speech | |
JP3236758B2 (ja) | 可変長データのcrc演算装置 | |
US20030040918A1 (en) | Data compression method | |
JPS6032100A (ja) | Lsp型パタンマッチングボコ−ダ | |
JPS6037658B2 (ja) | 時系列波形符号化装置 | |
JPS62183627A (ja) | デジタルデ−タの処理方式 | |
JPS6242621A (ja) | 音声符号化方式 | |
KR0130875B1 (ko) | 펄스 코드 변조(pcm) 파형 오디오 및 엠팩(mpeg) 오디오 신호 재생장치 | |
JPS62159198A (ja) | 音声合成方式 |