JPH11352996A - 音声規則合成装置 - Google Patents

音声規則合成装置

Info

Publication number
JPH11352996A
JPH11352996A JP10161230A JP16123098A JPH11352996A JP H11352996 A JPH11352996 A JP H11352996A JP 10161230 A JP10161230 A JP 10161230A JP 16123098 A JP16123098 A JP 16123098A JP H11352996 A JPH11352996 A JP H11352996A
Authority
JP
Japan
Prior art keywords
speech
waveform
linear prediction
unit
phoneme
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP10161230A
Other languages
English (en)
Inventor
Yasuhiro Wake
靖浩 和気
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Priority to JP10161230A priority Critical patent/JPH11352996A/ja
Publication of JPH11352996A publication Critical patent/JPH11352996A/ja
Pending legal-status Critical Current

Links

Abstract

(57)【要約】 【課題】 新規な構成により音韻の接続点で波形不連続
により発生する雑音を抑えること。 【解決手段】 音声素片辞書1には音韻毎に複数種類の
音声素片波形11とこれら音声素片波形11各々に対応
する線形予測係数12が格納されている。音韻波形接続
処理部4にて文字列の並び順に接続された音声素片波形
11は各々に対応する線形予測係数12に従って聴覚重
み付けフィルタ6にて波形整形される。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は音声規則合成装置に
関し、特に音韻毎の音声波形を予め音声素片辞書として
メモリに記憶しておき、入力された文字列を音韻毎に分
解し、この素片辞書から最適な素片波形を検索・選択
し、音韻毎の音声波形を接続することで、入力された文
字列を音声信号に変換し音声出力する音声規則合成装置
に関する。
【0002】
【従来の技術】従来の音声規則合成装置は、予め音声素
片辞書に格納された音韻毎の音声波形の中から入力文字
に対応する音声波形を読出し、入力文字列の順番にこの
音声波形をそのまま接続していた。
【0003】しかし、このような音声規則合成装置で
は、音韻の接続点で波形不連続による雑音が発生すると
いう欠点があった。
【0004】一方、音声波形を接続することにより生じ
る問題を解決する技術の一例が特開平9−146577
号公報(以下、先行文献1という)及び特開昭62−2
45298号公報(以下、先行文献2という)に開示さ
れている。
【0005】先行文献1は、単位音韻記号列に対応する
単位音声波形を選択する際、当該単位音韻記号列に音韻
が一致した単位音韻波形のうち、その開始点のピッチが
当該単位音韻記号列の1つ前の単位音韻記号列に対して
選択された単位音韻波形の終了点のピッチに近いものを
選択するというものであり、これにより単位音声波形の
接続点における歪み発生を防止することができるという
ものである。
【0006】一方、先行文献2は、各音声素片に時間長
の固定部と可変部とを予め設定しておき、この可変部の
最適な伸縮処理により各音韻の継続時間長制御を行うと
いうものであり、これにより人間の発生した音声の時間
構造に近い音韻時間制御が可能となるため、より高品質
な合成音声を得ることができるというものである。
【0007】
【発明が解決しようとする課題】先行技術1は単位音声
波形の接続点における歪み発生を防止するという点で本
発明の目的と類似するが、先行技術1は単位音韻波形の
ピッチを調整することにより目的を達成しようというも
のである。
【0008】これに対し、本発明はピッチではなく線形
予測(linear predictive codi
ng;LPC)係数を用いて音韻の接続点で波形不連続
により発生する雑音を抑えようというものであり、構成
が先行技術と全く異なる。
【0009】一方、先行技術2は目的自体本発明と全く
異なる。
【0010】そこで本発明の目的は、新規な構成により
音韻の接続点で波形不連続により発生する雑音を抑え、
もって合成音声の品質を向上させることが可能な音声規
則合成装置を提供することにある。
【0011】
【課題を解決するための手段】前記課題を解決するため
に本発明は、入力された文字列を音声信号に変換し音声
出力する音声規則合成装置であって、音韻毎の音声素片
波形情報が格納される第1格納手段と、この第1格納手
段に格納される音韻に対応する線形予測係数が格納され
る第2格納手段と、前記文字列を構成する各文字につき
これと対応する前記音声素片波形情報及び線形予測係数
を前記第1及び第2格納手段より読出す読出し手段と、
この読出し手段で読出される音声素片波形情報を前記文
字列の並び順に接続する接続手段と、この接続手段より
出力される音声波形を前記読出し手段により読出される
線形予測係数に基づいて波形整形する波形整形手段とを
含むことを特徴とする。
【0012】本発明によれば、文字列の並び順に接続さ
れる音声素片波形情報は各々の音声素片波形情報に対応
する線形予測係数に従って波形整形される。
【0013】
【発明の実施の形態】以下、本発明の実施の形態につい
て添付図面を参照しながら説明する。図1は本発明に係
る音声規則合成装置の最良の実施の形態の構成図であ
る。
【0014】図1を参照して、本発明は音韻毎に選択さ
れた素片波形を接続し、一連の音声信号とする部分に、
聴覚重み付けフィルタを設け、接続した音声波形に対し
てこの聴覚重み付けフィルタを通したのち出力すること
を特徴としている。
【0015】従来の波形規則合成方式の音声素片辞書に
は音韻毎の音声波形だけが格納されていたが、本発明の
音声素片辞書1には音韻毎の素片波形11と、その音韻
に対応する線形予測係数12とが一対として格納されて
いる。
【0016】次に、動作について説明する。まず、入力
された文字列を音韻毎に分解し、その音韻毎に前述の音
声素片辞書1を検索する。
【0017】入力された文字列の全文字数及び対象とす
る文字の前後関係(前後の文字)、並びに対象とする文
字が文字列の何番目に位置するかの情報に基づいて、対
象文字に対応する音声素片辞書1の中から最適な音声素
片を選択する。
【0018】入力文字列の音韻全てについて最適素片を
選択した後、接続処理が実行される。
【0019】接続された音声波形は、聴覚重み付けフィ
ルタ6に入力される。聴覚重み付けフィルタ6の係数は
前述の音声素片辞書1に予め格納されている線形予測係
数12を使用する。
【0020】選択された素片波形11と対をなす線形予
測係数12は、音声素片辞書1から読出され、前後の音
韻の線形予測係数12と対象音韻の線形予測係数12と
の間で補間された後、聴覚重み付けフィルタ6の係数と
して使用される。
【0021】線形予測係数12に基づく聴覚重み付けフ
ィルタ6は、雑音成分を音声のスペクトルピーク周辺に
集中させる働きがある。
【0022】このように、接続された音声波形を聴覚重
み付けフィルタ6に通すことにより、音韻接続点での波
形不連続による雑音の発生を抑えることができる。
【0023】次に、実施例においてこの音声規則合成装
置の構成及び動作について詳細に説明する。
【0024】
【実施例】まず、第1実施例について説明する。図2は
音声素片辞書の構成図、図3は聴覚重み付けフィルタの
構成図である。なお、第1実施例においても図1の構成
図を用いる。
【0025】図1を参照して、第1実施例は音声素片辞
書1と、音韻単位分割部2と、素片辞書検索部3と、音
韻波形接続処理部4と、フィルタ係数処理部5と、聴覚
重み付けフィルタ6と、文字列入力端子7と、音声出力
端子8とからなる。
【0026】文字列を入力する文字列入力端子7は、音
韻単位分割部2に接続されている。音韻単位分割部2の
出力は素片辞書検索部3及び音韻波形接続処理部4に入
力される。
【0027】音声素片辞書1には音韻毎に複数種類の音
声素片波形11(11−1〜11−n;nは正の整数)
と、その線形予測係数12(12−1〜12−n)が格
納されている。なお、図2では音韻の種類を1〜m(m
は正の整数)個で表示している。
【0028】素片辞書検索部3は、音韻単位分割部2か
ら入力された情報に基づいて音声素片辞書1から最適の
音声素片波形11を選択し、音韻波形接続処理部4に出
力すると同時に、選択された音声素片波形11に対応す
る線形予測係数12をフィルタ係数処理部5に入力す
る。
【0029】そして、音韻波形接続処理部4で接続され
た音声素片波形11は聴覚重み付けフィルタ6に入力さ
れる。
【0030】一方、フィルタ係数処理部5は入力された
線形予測係数12の補間処理を実行し、補間された線形
予測係数12が聴覚重み付けフィルタ6に入力される。
【0031】聴覚重み付けフィルタ6は、入力された接
続音声波形に対して、線形予測係数12をフィルタ係数
とするフィルタ処理を実行し、音声波形として音声出力
端子8より出力される。
【0032】次に、動作の詳細について説明する。ま
ず、音韻単位分割部2では、入力文字列が音韻単位に分
割される。いま、入力文字列が「あおいそら」であった
場合、音韻単位分割部2の出力は「あ」、「お」、
「い」、「そ」、「ら」の5つの単音韻情報である。
【0033】音声素片辞書1は、図2に示すような構成
を持っており、「あ」という音韻の音声素片波形12が
n種類格納されており、夫々の波形に対応する線形予測
係数12が対となって格納されている。
【0034】例えば、「あ」という音韻に対する複数種
類の音声素片波形12は、「あき」と発音した際の
「あ」の部分の波形や、「ぴあの」と発音した際の
「あ」の部分や、「アジア」と発音した際の末尾の
「ア」の部分の波形等、様々な「あ」の波形の集合であ
る。又、線形予測係数12は、夫々の素片波形を線形予
測分析することで得られる。
【0035】ここで、線形予測係数及び線形予測分析に
ついて簡単に説明する。いま、音声波形を一定の時間間
隔で標本化した時間離散的信号をxt(tは整数)とす
る。
【0036】現時点の標本値xtと、これと隣接する過
去のp個の標本値との間に、次のような線形1次結合が
成り立つと仮定する。 xt+α1・x(t−1)+ … +αp・x(t−p)=εt …(1) ここに、εtは平均値0、分散σ2 に無関係な確率変数
である。
【0037】この(1)式によれば、現時点の標本値x
tを過去の標本値から「線形予測」することができる。
これが、線形予測分析であり、このα1〜αpが線形予
測係数である。
【0038】素片辞書検索部3では、入力された文字列
の全文字数、及び対象とする文字の前後関係(前後の文
字)、並びに対象とする文字が文字列の何番目に位置す
るかの情報に基づいて最も近い音声素片波形11を選択
し、次段の音韻波形接続処理部4に出力する。
【0039】又、素片辞書検索部3は、同時に選択され
た音声素片波形11に対応する線形予測係数12を読出
しフィルタ係数処理部5に出力する。
【0040】フィルタ係数処理部5では前後の音韻の線
形予測係数12と補間処理を実行し、聴覚重み付けフィ
ルタ6にこの補間後の線形予測係数12を出力する。
【0041】一方、音韻波形接続処理部4では、入力さ
れた音声素片波形11を入力文字列の順番に並べ、一連
の音声波形として聴覚重み付けフィルタ6に出力する。
【0042】ここで、フィルタ係数処理部5における補
間処理について説明する。一例として、「あおいそら」
の「あ」と「お」の接続部における線形予測係数の補間
について説明する。図3は補間処理の動作を示す線形予
測係数対時間特性図である。
【0043】前述したように、例えば「あ」という音声
波形はα1〜αpというp個の時系列な線形予測係数1
2をもって表現される。
【0044】図3を参照して、補間処理は「あ」と
「お」の接続部、即ち「あ」の最後の線形予測係数12
(これをαLと表示する)と「お」の最初の線形予測係
数12(これをαIと表示する)との間の線形予測係数
αを算出する。
【0045】例えば、αLとαIの中間の線形予測係数
αA(即ち、平均値)を補間線形予測係数としてもよい
し、このαAよりもαLに近いαBもしくはαAよりも
αIに近いαCを補間線形予測係数としてもよい。この
補間処理を各文字の接続部において実行する。
【0046】次に、聴覚重み付けフィルタ6は、この補
間線形予測係数を係数とするフィルタであり、次式
(2)で表示される。 W(z)=(1+α・Z-1)/(1+γ・α・Z-1) …(2) ここに、αは各接続部における補間後の線形予測係数、
-1は遅延要素、γは重み付け係数であり、γは通常
0.5〜1.0の値とする。又、W(z)は聴覚重み付
けフィルタ6のフィルタ特性を示す。
【0047】図4はこの聴覚重み付けフィルタ6の構成
図である。図4を参照して、聴覚重み付けフィルタ6は
遅延素子31,32と、アンプ33,34と、加算器3
5,36と、リミッタ回路37とからなる。
【0048】遅延素子31,32は遅延要素Z-1を生成
し、アンプ33,34はフィルタ係数αに応じた信号を
生成し、加算器35,36はアンプ33,34の出力と
音韻波形接続処理部4からの出力もしくはリミッタ回路
37からの出力を加算する。
【0049】なお、リミッタ回路37については後述す
る。
【0050】この聴覚重み付けフィルタ6において、前
述の(2)式を実行することにより、音声に混入した雑
音成分が音声スペクトルパワーの強い部分に集中する。
【0051】このため、聴覚上雑音成分はマスクされる
ため、雑音の少ない音声が再生される。
【0052】又、(2)式の分子部分(予測フィルタ
部)の出力に対してリミッタ37を設けている。
【0053】この聴覚重み付けフィルタ6に、前段の音
韻波形接続処理部4の出力音声波形を入力し、出力音声
波形を音声出力端子8より出力する。
【0054】波形規制合成方式では、音韻毎の独立した
波形を接続することになるため、特に音声パワーのある
母音と他の音韻との音韻接続点では波形の不連続が発生
する。
【0055】このような接続信号に対して、聴覚重み付
けフィルタ6の予測フィルタ部の出力波形(予測残差波
形)にはパルス状の大きな残差信号が現れるが、聴覚重
み付けフィルタ6内に設けたリミッタ回路37が不連続
部分での雑音パワーを抑えるように動作及び作用する。
【0056】次に、第2実施例について説明する。図5
は第2実施例の構成図である。第2実施例が第1実施例
(図1)と異なる点は、音声素片辞書14には音声素片
波形11−1〜11−nのみを格納し、さらに素片辞書
検索部3と音韻波形接続処理部4との接続点とフィルタ
係数処理部5との間に線形予測分析部15を設けた点で
ある。その他の構成は第1実施例と同様であるためこれ
らについては同一番号を付し説明を省略する。
【0057】次に、動作について説明する。素片辞書検
索部3で選択された音声素片波形11から線形予測分析
部15において線形予測分析を実行し、線形予測係数α
1〜αpを算出する。
【0058】この線形予測係数α1〜αpをフィルタ係
数処理部5に入力することで、重み付けフィルタ6のフ
ィルタ係数の算出が可能となる。
【0059】この第2実施例によれば、第1実施例の音
声素片辞書1の中に格納していた線形予測係数α1〜α
pを省略することが可能となる。
【0060】
【発明の効果】本発明によれば、入力された文字列を音
声信号に変換し音声出力する音声規則合成装置であっ
て、その音声規則合成装置を音韻毎の音声素片波形情報
が格納される第1格納手段と、この第1格納手段に格納
される音韻に対応する線形予測係数が格納される第2格
納手段と、前記文字列を構成する各文字につきこれと対
応する前記音声素片波形情報及び線形予測係数を前記第
1及び第2格納手段より読出す読出し手段と、この読出
し手段で読出される音声素片波形情報を前記文字列の並
び順に接続する接続手段と、この接続手段より出力され
る音声波形を前記読出し手段により読出される線形予測
係数に基づいて波形整形する波形整形手段とを含んで構
成したため、音韻の接続点で波形不連続により発生する
雑音を抑えることができ、もって合成音声の品質を向上
させることが可能となる。
【図面の簡単な説明】
【図1】本発明に係る音声規則合成装置の最良の実施の
形態の構成図である。
【図2】音声素片辞書の構成図である。
【図3】補間処理の動作を示す線形予測係数対時間特性
図である。
【図4】聴覚重み付けフィルタの構成図である。
【図5】第2実施例の構成図である。
【符号の説明】
1,14 音声素片辞書 2 音韻単位分割部 3 素片辞書検索部 4 音韻波形接続処理部 5 フィルタ係数処理部 6 聴覚重み付けフィルタ 11 音声素片波形 12 線形予測係数 37 リミッタ回路

Claims (6)

    【特許請求の範囲】
  1. 【請求項1】 入力された文字列を音声信号に変換し音
    声出力する音声規則合成装置であって、 音韻毎の音声素片波形情報が格納される第1格納手段
    と、この第1格納手段に格納される音韻に対応する線形
    予測係数が格納される第2格納手段と、前記文字列を構
    成する各文字につきこれと対応する前記音声素片波形情
    報及び線形予測係数を前記第1及び第2格納手段より読
    出す読出し手段と、この読出し手段で読出される音声素
    片波形情報を前記文字列の並び順に接続する接続手段
    と、この接続手段より出力される音声波形を前記読出し
    手段により読出される線形予測係数に基づいて波形整形
    する波形整形手段とを含むことを特徴とする音声規則合
    成装置。
  2. 【請求項2】 前記波形整形手段は前記読出し手段によ
    り読出される前記線形予測係数を前記各音声素片波形情
    報の接続点において補間処理する補間処理部と、この補
    間処理部より出力される補間後の線形予測係数を用いて
    前記接続手段より出力される音声波形から所望の波形成
    分を抽出するフィルタ部とからなることを特徴とする請
    求項1記載の音声規則合成装置。
  3. 【請求項3】 入力された文字列を音声信号に変換し音
    声出力する音声規則合成装置であって、 音韻毎の音声素片波形情報が格納される第1格納手段
    と、前記文字列を構成する各文字につきこれと対応する
    前記音声素片波形情報を前記第1格納手段より読出す読
    出し手段と、この読出し手段より読出される音声素片波
    形情報から線形予測分析を行い線形予測係数を算出する
    線形予測分析手段と、前記読出し手段で読出される音声
    素片波形情報を前記文字列の並び順に接続する接続手段
    と、この接続手段より出力される音声波形を前記線形予
    測分析手段により算出される線形予測係数に基づいて波
    形整形する波形整形手段とを含むことを特徴とする音声
    規則合成装置。
  4. 【請求項4】 前記波形整形手段は前記線形予測分析手
    段にて算出される線形予測係数を前記各音声素片波形情
    報の接続点において補間処理する補間処理部と、この補
    間処理部より出力される補間後の線形予測分析結果を用
    いて前記接続手段より出力される音声波形から所望の波
    形成分を抽出するフィルタ部とからなることを特徴とす
    る請求項3記載の音声規則合成装置。
  5. 【請求項5】 前記フィルタ部は音声パワーの大きい音
    韻と他の音韻との接続点における雑音パワーを抑圧する
    リミッタ回路をさらに有することを特徴とする請求項1
    〜4いずれかに記載の音声規則合成装置。
  6. 【請求項6】 前記第1格納手段には各音韻毎に複数個
    の異なる音声素片波形情報が格納されることを特徴とす
    る請求項1〜5いずれかに記載の音声規則合成装置。
JP10161230A 1998-06-10 1998-06-10 音声規則合成装置 Pending JPH11352996A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP10161230A JPH11352996A (ja) 1998-06-10 1998-06-10 音声規則合成装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP10161230A JPH11352996A (ja) 1998-06-10 1998-06-10 音声規則合成装置

Publications (1)

Publication Number Publication Date
JPH11352996A true JPH11352996A (ja) 1999-12-24

Family

ID=15731115

Family Applications (1)

Application Number Title Priority Date Filing Date
JP10161230A Pending JPH11352996A (ja) 1998-06-10 1998-06-10 音声規則合成装置

Country Status (1)

Country Link
JP (1) JPH11352996A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2003005342A1 (fr) * 2001-07-02 2003-01-16 Kabushiki Kaisha Kenwood Procede et appareil de couplage de signaux

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2003005342A1 (fr) * 2001-07-02 2003-01-16 Kabushiki Kaisha Kenwood Procede et appareil de couplage de signaux
US7739112B2 (en) 2001-07-02 2010-06-15 Kabushiki Kaisha Kenwood Signal coupling method and apparatus

Similar Documents

Publication Publication Date Title
JP2782147B2 (ja) 波形編集型音声合成装置
JP3294604B2 (ja) 波形の加算重畳による音声合成のための処理装置
KR100615480B1 (ko) 음성 대역 확장 장치 및 음성 대역 확장 방법
US6205420B1 (en) Method and device for instantly changing the speed of a speech
JP3563772B2 (ja) 音声合成方法及び装置並びに音声合成制御方法及び装置
JPH031200A (ja) 規則型音声合成装置
JPS62231998A (ja) 音声合成方法および装置
KR100327969B1 (ko) 음성재생속도변환장치및음성재생속도변환방법
US7765103B2 (en) Rule based speech synthesis method and apparatus
US5668924A (en) Digital sound recording and reproduction device using a coding technique to compress data for reduction of memory requirements
JP3703394B2 (ja) 声質変換装置および声質変換方法およびプログラム記憶媒体
US5864791A (en) Pitch extracting method for a speech processing unit
JP3379348B2 (ja) ピッチ変換器
JPH11352996A (ja) 音声規則合成装置
JP3059751B2 (ja) 残差駆動型音声合成装置
JP3264998B2 (ja) 音声合成器
JP3068250B2 (ja) 音声合成器
JP2995774B2 (ja) 音声合成方式
JP2535807B2 (ja) 音声合成装置
JP3063088B2 (ja) 音声分析合成装置、音声分析装置及び音声合成装置
JPH09258796A (ja) 音声合成方法
JP2000187491A (ja) 音声分析合成装置
JPH10232698A (ja) 話速変換装置
JPS5974598A (ja) 可変長フレ−ム型lspボコ−ダ
JPH09160595A (ja) 音声合成方法