JPS5948397B2

JPS5948397B2 - 韻律要素の抽出方式

Info

Publication number: JPS5948397B2
Application number: JP52041559A
Authority: JP
Inventors: 芳典匂坂; 大和佐藤
Original assignee: Nippon Telegraph and Telephone Corp
Current assignee: Nippon Telegraph and Telephone Corp
Priority date: 1977-04-13
Filing date: 1977-04-13
Publication date: 1984-11-26
Also published as: JPS53127204A

Description

【発明の詳細な説明】本発明は編集による音声合成方式に必要不可欠な韻律要
素のファイルの自動作成方法に関する。

音声合成の諸方式のうち、編集奢こよる合成方式では種
々の音声単位を蓄えたファイルと韻律情報のファイルを
持ち、入力される音韻系列に従つて必要な音声単位を結
合させ、それに対応した韻律情報により合成音を作成す
る。この韻律情報としては、従来、自然音声から抽出し
たピッチ周波数をそのままファイルに蓄えて用いている
。一方、自然音声から抽出した生のピッチパタンの代わ
りに各母音の中心におけるピッチ周波数を結んで作つた
ピッチパタン（点ピッチパタンと呼ぶ）を用いることに
より、合成に必要な情報量を圧縮できることが知られて
いる。

ここで言う母音の中心とは単に母音の継続区間の中心と
いう意味だけでなく、聴覚的に母音として聞こえる部分
の中心すなわち母音の重心点という意味も含んでいる。
しかし、これまでこの点ピッチの抽出は、与えられた自
然音声を分析し、そのデーコをもとに音声に関する知識
を備えた人間が行わねばならなかつた。

そのため合成語数として数万語以上を対象とする編集
合成方式には、この抽出の自動化が問題として残されて
いた。本発明はこの問題を解決するため、韻律要素、す
なわち各母音の中心におけるピッチ周波数の値（点ピッ
チと呼ぶ）それらの時間間隔、および点ピッチ位置にお
けるパワーの三者を自動的に抽出するものであり、その
目的は多量な抽出作業の自動化にある。

以下図面により本発明を詳細に説明する。第１図は本発
明の一実施例のブロック図である。

１、２は入力端子であり、端子１からは音声信号が入力
され、それに対応した音韻記号系列が端子２から入力さ
れる。

３は音声信号前処理部であり、入力音声は４ＫＨ２の低
域濾波処理を施されて８ＫＨ２でサンプリングされた後
、１１ビットで量子化され、ディジタル音声信号に変換
される。

４は音声分析器であり、ここでピッチパタンパワー、ス
ペクトル情報が得られ、５から９までの韻律要素抽出部
に送られて端子１０から抽出結果が出力される。

５はピッチパタン平滑化処理回路、６はスペクトル安定
率算出回路、７は音韻情報作成器であり、これらで得ら
れたデータにより、音韻境界決定器８、点ピツチ位置決
定器９が動作し、韻律要素の抽出が行われる。

第１図において破線で囲んだ部分が韻律要素抽出部で、
この韻律要素抽出部の、より詳細な実施例を第２図に示
し、その動作にその処理の説明を行う。第２図において
、４１はバツフアメモリであり、．分析器４で得られた
パワー情報が蓄わえられ、以後の処理に用いられる。

韻律情報として最も重要なものにピツチパタンがあるが
、韻律要素抽出には、母音部で安定したピツチパタンが
必要であり、また子音部付近の不連続な変化を除去しな
ければならない。

そのため分析器４で得られたピツチパタンをバツフアメ
モリ５１に格納しておき、次のような（１）〜：Ｖ）の
処理を施す。（ｉ）閾値回路５２により、４５０Ｈｚ以
上に抽出されたピツチは誤抽出として削除する。

（Ｉｉ）ピツチ修正回路５３により、抽出されたピツチ
がそのサンプルの前後３０ｍｓｅｃ内のピツチの半値と
の差を１０Ｈｚ以内にすることがあれば、誤抽出として
２倍して修復する。

（１１１）蝶型フイルタ５４により不連続な孤立点を除
去する。

このフイルタは第３図に示すように、連続性を調べる点
を中心に前後３サンプルにわたる蝶型の窓（羽の傾きは
±３０Ｈｚ／１０ｍｓｅｃ．）＊七をかけ、その中（
図中の斜線部）に、３個未満のピツチしか入らない場合
、不連続点として除去する。●）補間回路５５により（
１）〜（１１１）の処理で生じたピツチの欠落箇所を、
その点の前後のピツチの線形補間により修復する。

このようにして得られたピツチパタンはバツフアメモリ
５６に格納され、以後の処理に用いられるＯ次に抽出に
必要な情報としては、スペクトル変化を示すスペクトル
安定率がある。

これは特に音韻境界決定器８にはなくてはならないもの
で、その算出は次のような手順で行われる。まず分析器
４により得られたスペクトル包絡情報をバツフアメモリ
６１に蓄え、聴覚の特性を反映させるためＭｅｌ変換回
路６２により周波数軸をＭｅｌ変換する。

変換は次式に従う。Ｍｅ（ｆ）＝Ｃ．ＩＯｇ（１０００
＋ｆ）（ｃ：定数、ｆ：周波数）この変換を施した後、
スペクトル包絡差算出回路６３により前後３サンプルの
ものとの差をとり、重み係数器６４で重み係数を掛け、
積分器６５によりそれらを加え合わせる。

このようにして求まつたものはスペク．トノレ変化率を
示すものであり、変換回路６６によりスペクトル安定率
に変換し、バツフアメモリ６７に蓄える。上記の手順を
定式化すると次のようになる。ここで、Ａ（Ｆ，ｔ）は
時刻ｔにおけるスペクトル包絡の周波数成分子の持つパ
ワー（ＤＢ）であり、Ｗ（τ）は重み係数（＝４０−１
τＩ）とする。

音韻境界決定器８に必要なものとしては、この他に音韻
系列情報がある。入力端子２から入力された音韻記号系
列は、内蔵されている音韻情報テーブル７１が参照され
、変換器７２によつて音韻系列情報に変換され、バツフ
アメモリ７３に蓄えられる。この音韻情報テーブル７１
に蓄えられている音韻情報は、音韻間の境界の状態（例
えば子音の有無、子音の性質等）を示すものであり、そ
の系列は境界を決定する際に重要な役割を果す。音韻境
界決定器８においてはバツフアメモリ４１５６，６７，
７３に各々蓄えられたパワー、ピツチパタン、スペクト
ル安定率、音韻情報を用い、連続性判定回路８１により
音韻境界候補点を見出し、バツフアメモリ８２に格納す
る。音韻境界決定回路８３はこの候補点のうちから、音
韻情報系列７３をもとに発見し易い順に境界を求める。
この音韻境界決定処理は表１に示すような順で行われる
が、その結果は各回ごとにバツフアメモリ８４に格納さ
れると共に、決定回路８３にフイードバツクされる。点
ピツチ位置決定器９では前述のようにして得られた音韻
区間情報と共に、バツフアメモリ４１，５６，６７に各
々蓄えられたパワー、ピツチパタン、スペクトル安定率
を用い、点ピツチ候補区間決定回路９１で、まず点ピツ
チ位置の候補区間を定める。

点ピツチ位置は聞えの中心であり、またそこでは調音器
官の動きが安定していると考えられるので、バツフアメ
モリ４１から与えられるパワーａ（ｔ）、バツフアメモ
リ６７から与えられるスベクトル安定率ρ（ｔ）の値が
大きな点であると考えられる。そこでこの決定回路９１
においては、バツフアメモリ８４から与えられる音韻区
間について、積分器９２を用いてａ（ｔ）ρ（ｔ）を積
分し、その重心の前後２０ｍｓｅ皓点ピツチ位置の候補
区間と決定する。次に点ピツチ位置決定回路９３におい
て、この候補区間内の点から点ピツチ位置が決定される
この決定回路９３では点ピツチ候補区間決定回路９１で
得られる候補点に対し、それらの点ピツチ内挿パタンｐ
（ｔ）を作成し、バツフアメモリ５６に蓄えられた原ピ
ツチパタンＰ。（ｔ）との差を求め、次式を最小にする
ｐ（ｔ）を求める。（この算出手法には動的計画法を用
いている。）ｆ（ｐ）＝Ｆａ（ｔ）ρ（ｔ）Ｉｐ（ｔ）
−ＰＯ（ｔ）］Ｄｔ以上のようにして得た点ピツチ位置
の抽出例を第４図に示す。

第４図は６目上の人１と発声したものについて、得られ
た点ピツチを矢印で示してある。このようｌこして求ま
つた点ピツチ位置をまともに、韻律要素出力制御回路９
４では前述した三つの韻律要素を求め出力する。

すなわちバツフアメモリ５６から点ピツチの値を読み出
し、点ピツチ位置の時間間隔を算出し、バツフアメモリ
４１から点ピツチ位置のパワーを読み出して端子１０に
前記実施例において例示した各種の制御定数、第２図に
示した５，６，７の構成の詳細、表１に示す音韻境界決
定器８の決定順序、点ピツチ位置決定器９の点ピツチ位
置決定に用いられる評価函数ｆ（ｐ）は言うまでもなく
、これらのものに限定されるものではなく、要は音韻区
間の分割と母音の中心の決定が正しく行われるものであ
ればよい。以上説明したように本発明の韻律要素の自動
抽出方式は、平滑化前処理を施したピツチパタン、数サ
ンプルの荷重平均をとつたスペクトル安定率といつた比
較的安定したデータを用い、段階的な音韻境界決定方法
、原ピツチパタンを最良近似する点ピツチ位置決定方法
により抽出を行うので、精度良く韻律要素を得ることが
できる。このように自然音声から自動的に韻律要素を抽
出できるので、本発明は編集合成方式に必要な韻律要素
フアイルの作成等を容易にする利点がある。

【図面の簡単な説明】

第１図は本発明の一実施例のプロツク図、第２図は第１
図の韻律要素抽出部の構成図、第３図は蝶型フイルタの
処理の説明図、第４図は本発明の抽出方式による点ピツ
チ位置の抽出例を示す図である。１・・・・・・入力端子、２・・・・・・入力端子、３
・・・・・・音声信号前処理部、４・・・・・・相関型
音声分析器、５・・・・・・ピツチパタン平滑化処理回
路、６・・・・・・スペクトル安定率算出回路、７・・
・・・・音韻情報作成器、８・・・・・・音韻境界決定
器、９・・・・・・点ピツチ位置決定器、１０・・・・
・・出力端子、１１・・・・・・バツフアメモリ、４１
・・・・・・バツフアメモ１八５１・・・・・・バツ
フアメモＩ八５２・・・・・・閾値回路、５３・・・・
・・ピツチ修正回路、５４・・・・・・蝶型フイルタ、
５５・・・・・・補間回路、５６・・・・・・バツフア
メモリ、６１・・・・・・バツフアメモリ、６２・・・
・・・Ｍｅｌ変換回路、６３・・・・・・スペクトル包
絡算出回路、６４・・・・・・重み係数器、６５・・・
・・・積分器、６６・・・・・・変換回路、６７・・・
・・・バツフアメモＩ八７１・・・・・・音韻情報テー
ブル、７２・・・・・・変換器、７３・・・・・・バツ
フアメモリ、８１・・・・・・連続性判定回路、８２・
・・・・・バツフアメモリ、８３・・・・・・音韻境界
決定路、８４・・・・・・バツフアメモリ、９１・・・
・・・点ピツチ候補区間決定回路、９２・・・・・・積
分器、９３・・・・・・点ピツチ位置決定回路、９４・
・・・・・韻律要素出力制御回路。

Claims

【特許請求の範囲】

１編集形音声合成方式の韻律情報ファイルの作成等に
おいて、入力として自然音声とそれに対応する音韻系列
が与えられたとき、この自然音声の有するパワー、ピッ
チ周波数、スペクトル変化情報とその音韻系列との対応
により、自然音声を音韻区間に分割する手段と、この手
段によつて定められた母音区間内に、パワーピッチ周波
数、スペクトル変化情報を用いて聴覚的な母音の重心位
置を決定する手段とにより韻律要素を抽出することを特
徴とする韻律要素の抽出方式。