JPH0248919B2

JPH0248919B2 -

Info

Publication number: JPH0248919B2
Application number: JP56004265A
Authority: JP
Inventors: Ichiro Fujitaka; Takehiko Hayashi
Original assignee: Nippon Electric Co Ltd
Current assignee: NEC Corp
Priority date: 1981-01-14
Filing date: 1981-01-14
Publication date: 1990-10-26
Also published as: JPS57118300A

Description

【発明の詳細な説明】本発明は、半導体素子を用いた音声合成装置に
関するものである。

音声波形をデイジタル化し、半導体記憶装置を
用いて記憶再生する方式には、PCM（パルス符号
化方式）がよく用いられる。一般に、電話回線と
同等のＳ／Ｎ比（信号対雑音比）を得るには、少
なくとも８ビツトのデイジタル信号を用いて各サ
ンプリング点での音声波形を量子化することが必
要である。しかしながら、この様なPCM方式で
は、音声波形（データ）の記憶のためのメモリ容
量が膨大なものとなり、記憶装置だけでも高価な
ものとなる。そこで、記憶データ量をできる限り
少なくする（以下、圧縮という）ために、PCM
でコード化された音声データ列を適当な時間区間
（一般に、数ms〜数十ms）に分割し、各分割区
間毎にその区間内のPCM量子化データの最大値
を求め、この最大値をフルスケールとする低量子
化ビツト数（３〜５ビツト）のデイジタルデータ
に変換して記憶する方法が知られており、一般に
準瞬時圧伸方式といわれている。

この方式の具体的な方法を第１及び２図を参照
して説明する。

第１図は合成すべき音声波形の一例であり、一
般のPCMでは例えば、この全振巾値を８ビツト
に量子化してデイジタルデータ列に変換してい
る。ここで、図中の縦線は前述の区間分割の境界
線であり、下付番号は分割した各区間（以下フレ
ームという）の番号である。第２図に第10区間の
拡大図を示す。図中縦線はデイジタル化のための
サンプリング点を表わしており、通常のPCMで
は、各サンプリング点における音声波形振幅値を
８ビツト以上の分解能でデイジタル量子化する。
多くの音声記憶装置においては、この量子化デー
タ量を圧縮するために分解能を下げ、例えば第２
図の様に４ビツトでフレーム間を符号化し、図中
点線の様なデータ列を作る。第２図の例では、図
中に示した様な量子化巾Ｄを設定する事によつ
て、音声波形はちようどフルスケールまでのデイ
ジタルデータに変換される。即ち、音声波形の振
幅値はデイジタルデータと量子化幅データＤとを
乗算することによつて求められる。しかしなが
ら、第１図に示す全音声波形を第２図に示した量
子化巾で、デイジタル化した場合、第１図中の第
３フレームでは４ビツトで符号化できるフルスケ
ールより入力が大きくなり、忠実な符号化ができ
なくなる。一方、第13及び14フレームの様に波形
振巾の小さい部分では、量子化巾が大きすぎて
Ｓ／Ｎが極めて悪くなつたり、著しい場合は音の
飛びが生じたりする危険性がある。

準瞬時圧伸方式では、上記問題を除去するた
め、各フレーム毎（第１図）にそのフレーム内の
音声振幅の最大値を求め、この最大値が所望の量
子化レベル（第２図の例では、４ビツト15レベ
ル）のフルスケール内で符号化できる様に、フレ
ーム毎に量子化巾Ｄを独立に持たせている。従つ
て、この方式では、音声波形の振巾値をデイジタ
ル化したデータ列の他に、各フレーム毎の量子化
幅の大きさを指定するデータを用意する必要があ
る。従来、この種の準瞬時圧伸方式の音声記憶装
置ではすべての音声データを一率に符号化して圧
縮しているが、ほとんどの音声信号には子音の発
声や息つぎなどのための無音区間が必ず存在す
る。しかしながら一率に符号化する上記方式で
は、この無音区間内の各サンプリング点で振幅零
の音声データを用意しておかなければならなかつ
た。無音区間は、話者によつて、又文章によつて
も異なるが、全音声区間のうち少なくとも10〜30
％に相当し全体に対して占める割合を無視するこ
とができない。したがつて、この無音区間を示す
データを圧縮すれば準瞬時圧伸方式のデータ圧縮
率をさらに高めることができる。

本発明の目的は上記欠点を除去し、更にデータ
の圧縮率を高めることを可能とする音声合成装置
を提供することにある。

本発明によれば音声データ記憶部の中に無音区
間を指示するデータ（無音データ）を用意し、合
成部において無音データを検出して、その無音デ
ータで指示される期間、音声データ記憶部に対す
るアドレス指定を中断するアドレス中断指示部を
設けることを特徴とする音声合成装置が得られ
る。

この結果、本発明では無音期間のデータを従来
に比べて大幅に圧縮することができ、かつ合成部
での無音処理も非常に簡単なものとなる。

上記無音データとしてはたとえば、量子化幅Ｄ
を示す指数データを３ビツトでコード化した場
合、その内の一つのコードを無音データとして設
定することが考えられる。この場合、無音データ
によつて指示される無音期間は各フレームを単位
とする区間となる。一方、音声データを示す量子
化コードの中に無音データを設定することも考え
られる。この場合にはフレーム内の任意の期間を
無音期間にすることができ、１フレーム長が長い
場合やフレーム内での無音区間が多い場合には特
に有効である。たとえば各サンプリング点での音
声波形の振幅値を４ビツトで符号化した場合、16
段階の割りつけをすることができるが、音声デー
タは音声波形の対象性を考慮すると波形の中心を
しめす零のコードと、正負同じ段階の割りつけを
行うのが自然である。この様な場合15段階の割り
つけを行なえばよいので、残りの１種類の符号は
実質的には使われない。従つて、別にビツト数を
増加させることなく無音期間をセツトすることが
できる。

以下に、第３及び第４図を参照して本発明の一
実施例を詳細に説明する。

第３図は量子化幅データＤの位置に無音データ
SDを設定した例を示すデータ配列図である。フ
レーム長の長さは予め決められており、各フレー
ムごとにその先頭に量子化巾データをおき、フレ
ーム内の各サンプリング点での音声波形の振幅値
をコード化した音声データＳを設定し、最後に音
声データの終りを示す符号データＥを用意するこ
とにより１つの音声単位（単語、文章等）が構成
され記憶される。

このようなデータ列を復写して音声を合成する
装置の主要部のブロツク図を第４図に示す。

第４図において、データROM５は第３図に示
す音声データ及び無音データが所定のアドレスに
用意された読み出し専用メモリで、その読み出し
制御はアドレスカウンタ３の内容によつて行なわ
れる。アドレスカウンタ３の内容設定及び変更は
コントローラ２（マイクロプロセツサ）によつて
制御される。又、準瞬時圧伸方式におけるフレー
ム長はフレーム長カウンタ４によつて制御され、
決められたフレーム期間とその開始が指示され
る。フレーム長カウンタ４からの制御信号で、コ
ントローラ２はROM５から読み出された各フレ
ーム毎の量子化幅データＤを量子化幅レジスタ７
に設定し、その次に読み出される音声データＳと
設定された量子化幅データとを演算回路８で乗算
し、得られた音声信号をＤ／Ａコンバータ９でア
ナログ信号に変換してスピーカ等の音響機器へ音
声出力１０を転送する。尚、比較器１１は量子化
幅データＤが設定される位置に記憶された無音デ
ータを検出するためのもので、比較器１２は音声
データ列内に設定された無音データを検出するた
めのものである。ここで、比較器１１で検出され
る無音データはそのフレーム全体が無音であるこ
とを示すデータである。従つて、フレーム長カウ
ンタ４で決められる期間だけが無音区間となる。
一方、比較器１２で検出される無音データはフレ
ーム内の一部に無音期間があることを示すもので
ある。従つて、当該無音データは無音期間を指定
するデータを伴つており、そのデータは無音部カ
ウンタ１４に設定されたコントローラ２に無音期
間を指示する制御信号を送るために用いられる。

以下に、その詳細な動作の説明を行なう。

今、外部からの例えばキー操作により音声合成
の開始信号１が入力されると、コントローラ２は
アドレスカウンタ３に合成すべき音声データの開
始アドレス１７をセツトする。波形データ（音声
データ）の復号は、以後コントローラ２からのク
ロツク６により順次進められる。まず、クロツク
６によつてアドレスカウンタ３の内容がインクリ
メントされ、データROM５からは第１フレーム
の先頭に用意されている量子化幅データが読出さ
れ、コントローラ２によつて量子化幅レジスタ７
にセツトされる。これと同時にフレーム長カウン
タ４にあらかじめ決めたフレーム期間を示すデー
タ１８がセツトされる。更に順次クロツク６が発
生されるとデータROM５からは波形データが
次々に読み出され、このデータは、演算回路８に
よつて量子化幅レジスタ７にセツトされているデ
ータと乗算され元音声波形に類似のデータが再生
されてＤ／Ａコンバータ９を介してアナログ音声
信号１０に変換され出力される。

さて、フレーム長カウンタ４にセツトされたデ
ータはアドレスカウンタ３をカウントアツプする
クロツク６で同時にカウントダウンされ、ボロー
信号１６が生じるとこれをコントローラ２に送
る。コントローラ２はこのボロー信号１６によつ
て設定されたフレーム時間長の終了を知り、カウ
ンタ４にフレーム時間長データを再セツトして、
次のフレームの復号処理へ進む。

この動作を終了符号をうけとるまで続行する
が、第３図に示すように、量子化幅データのかわ
りに、無音フレーム符号が送られた場合は、符号
比較器１１によつて無音フレーム信号SDが送ら
れてきたことわ検出され、この検出信号１９がコ
ントローラ２におくられ、フレーム長と同じ時間
だけアドレスカウンタ３のインクリメントを中断
する。その後、フレーム長カウンタ４が一フレー
ム長のカウントを行なうと、ボロー信号１６がコ
ントローラ２に出力される。これに伴ない、コン
トローラ２はアドレスカウンタ３に次のフレーム
の先頭アドレスを設定し、アドレスカウンタ３を
カウントアツプし、データROM５から次のフレ
ームの量子化巾データを読み出し、フレーム内の
処理を順次行う。

一方、各波形データの読み出しに際して、たと
えば、4bitのデータの場合、マイナス７から０、
そしてプラス７までの15段階をデータの符号に使
用しているので、4bitの16段階の残りの１符号
（たとえばプラス８）を無音データとして音声デ
ータ列内に割り当て、音声データの読み出し中に
その符号が読み出された場合、符号比較器１２に
よつて検出され、無音部分を表わす信号１３がコ
ントローラ２におくられる。更に次のアドレスで
指定されるROM領域に無音期間を示すデータを
設定しておけば、そのデータをカウンタ１４にセ
ツトすることにより、カウント終了まではアドレ
スカウンタ３をカウントアツプしないように制御
し、カウンタ１４とフレーム長カウンタ４のみを
カウントダウンするように動作する。従つてこの
カウンタ１４がゼロになりボロー信号が生じる
と、コントローラ２に信号１５が送られ無音部分
の終了を示し、フレーム長カウンタからのフレー
ム終了信号１６がない場合には次の波形データを
読み出し処理を続ける。

以上、説明したように本発明の音声合成装置に
よれば音声信号中の無音期間を極めて少ないデー
タ量で制御することができるので、メモリ圧縮効
率を大幅に高めることができる。又、その無音期
間は各フレーム内での任意の期間を設定すること
もできる。この結果圧縮率の高いメモリを用い
て、簡単な操作で音声を合成することが可能とな
る。

尚、以上の説明では、音声波形そのもののデー
タを準瞬時圧伸する方式について説明したが、音
声波形データの近接データとの差分値を用いた
DPCMと呼ばれている音声記憶方式や、デルタ
変調方式、あるいは線形予測符号化方式等他の音
声記憶方式についても適用できることは明らかで
あり、特に比較器１１と１２のうちいづれか一方
を省略してもよい。

【図面の簡単な説明】

第１図は音声波形例とフレーム分割の方法の一
例を示した音声波形図、第２図は１フレーム中の
データ例と準瞬時圧伸方式による量子化の様子を
示すデータ配列図、第３図は本発明で使用する音
声メモリに記憶される音声データ配列図、第４図
は本発明の一実施例を示す合成装置の主要部分の
ブロツク図である。１……制御入力、２……コントローラ、３……
アドレス・カウンタ、４……フレーム長カウン
タ、５……データROM、６……クロツク、７…
…量子化幅レジスタ、８……演算回路、９……
Ｄ／Ａコンバータ、１０……音声出力信号、１１
……データ比較器、１２……データ比較器、１３
……無音区間信号、１４…無音区間カウンタ、１
５……ボロー信号、１６……ボロー信号、１７…
…アドレス信号、１８……フレームデータ、１９
……制御信号。

Claims

【特許請求の範囲】

１音声情報を記憶するメモリであつて量子化幅
データと音声データ列とをそれぞれ対応するアド
レスに記憶しさらに前記音声データ列の途中に無
音状態が始まることを示すデータと無音状態の期
間を示すデータとを連続するアドレスにそれぞれ
記憶するメモリと、前記メモリのアドレスを順々
にアクセスしてデータを読み出す読出し手段と、
読み出された量子化幅データと音声データ列とを
用いて音声を再生する手段と、読み出されたデー
タが前記無音状態が始まることを示すデータであ
ることを検出して検出信号を発生する手段と、前
記無音状態の期間を示すデータを受け該期間経過
後に無音期間終了信号を発生する手段と、前記検
出信号に応答して前記読出し手段が前記無音状態
の期間を示すデータを記憶しているアドレスの次
のアドレスをアクセスすることを禁止し、該禁止
状態を前記無音期間終了信号が発生されるまで保
持し、前記無音期間終了信号の発生に応答して該
禁止状態を解除して前記読出し手段が前記次のア
ドレスをアクセスすることを許可するようにする
手段とを備える音声合成装置。