JPS5948397B2 - 韻律要素の抽出方式 - Google Patents

韻律要素の抽出方式

Info

Publication number
JPS5948397B2
JPS5948397B2 JP52041559A JP4155977A JPS5948397B2 JP S5948397 B2 JPS5948397 B2 JP S5948397B2 JP 52041559 A JP52041559 A JP 52041559A JP 4155977 A JP4155977 A JP 4155977A JP S5948397 B2 JPS5948397 B2 JP S5948397B2
Authority
JP
Japan
Prior art keywords
pitch
prosodic
phoneme
buffer memory
circuit
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired
Application number
JP52041559A
Other languages
English (en)
Other versions
JPS53127204A (en
Inventor
芳典 匂坂
大和 佐藤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP52041559A priority Critical patent/JPS5948397B2/ja
Publication of JPS53127204A publication Critical patent/JPS53127204A/ja
Publication of JPS5948397B2 publication Critical patent/JPS5948397B2/ja
Expired legal-status Critical Current

Links

Landscapes

  • Measurement Of Mechanical Vibrations Or Ultrasonic Waves (AREA)
  • Electrophonic Musical Instruments (AREA)

Description

【発明の詳細な説明】 本発明は編集による音声合成方式に必要不可欠な韻律要
素のファイルの自動作成方法に関する。
音声合成の諸方式のうち、編集奢こよる合成方式では種
々の音声単位を蓄えたファイルと韻律情報のファイルを
持ち、入力される音韻系列に従つて必要な音声単位を結
合させ、それに対応した韻律情報により合成音を作成す
る。この韻律情報としては、従来、自然音声から抽出し
たピッチ周波数をそのままファイルに蓄えて用いている
。一方、自然音声から抽出した生のピッチパタンの代わ
りに各母音の中心におけるピッチ周波数を結んで作つた
ピッチパタン(点ピッチパタンと呼ぶ)を用いることに
より、合成に必要な情報量を圧縮できることが知られて
いる。
ここで言う母音の中心とは単に母音の継続区間の中心と
いう意味だけでなく、聴覚的に母音として聞こえる部分
の中心すなわち母音の重心点という意味も含んでいる。
しかし、これまでこの点ピッチの抽出は、与えられた自
然音声を分析し、そのデーコをもとに音声に関する知識
を備えた人間が行わねばならなかつた。
そのため合成語 数として数万語以上を対象とする編集
合成方式には、この抽出の自動化が問題として残されて
いた。本発明はこの問題を解決するため、韻律要素、す
なわち各母音の中心におけるピッチ周波数の値(点ピッ
チと呼ぶ)それらの時間間隔、および点ピッチ位置にお
けるパワーの三者を自動的に抽出するものであり、その
目的は多量な抽出作業の自動化にある。
以下図面により本発明を詳細に説明する。第1図は本発
明の一実施例のブロック図である。
1、2は入力端子であり、端子1からは音声信号が入力
され、それに対応した音韻記号系列が端子2から入力さ
れる。
3は音声信号前処理部であり、入力音声は4KH2の低
域濾波処理を施されて8KH2でサンプリングされた後
、11ビットで量子化され、ディジタル音声信号に変換
される。
4は音声分析器であり、ここでピッチパタンパワー、ス
ペクトル情報が得られ、5から9までの韻律要素抽出部
に送られて端子10から抽出結果が出力される。
5はピッチパタン平滑化処理回路、6はスペクトル安定
率算出回路、7は音韻情報作成器であり、これらで得ら
れたデータにより、音韻境界決定器8、点ピツチ位置決
定器9が動作し、韻律要素の抽出が行われる。
第1図において破線で囲んだ部分が韻律要素抽出部で、
この韻律要素抽出部の、より詳細な実施例を第2図に示
し、その動作にその処理の説明を行う。第2図において
、41はバツフアメモリであり、.分析器4で得られた
パワー情報が蓄わえられ、以後の処理に用いられる。
韻律情報として最も重要なものにピツチパタンがあるが
、韻律要素抽出には、母音部で安定したピツチパタンが
必要であり、また子音部付近の不連続な変化を除去しな
ければならない。
そのため分析器4で得られたピツチパタンをバツフアメ
モリ51に格納しておき、次のような(1)〜:V)の
処理を施す。(i)閾値回路52により、450Hz以
上に抽出されたピツチは誤抽出として削除する。
(Ii)ピツチ修正回路53により、抽出されたピツチ
がそのサンプルの前後30msec内のピツチの半値と
の差を10Hz以内にすることがあれば、誤抽出として
2倍して修復する。
(111)蝶型フイルタ54により不連続な孤立点を除
去する。
このフイルタは第3図に示すように、連続性を調べる点
を中心に前後3サンプルにわたる蝶型の窓(羽の傾きは
±30Hz/10msec.)*七 をかけ、その中(
図中の斜線部)に、3個未満のピツチしか入らない場合
、不連続点として除去する。●)補間回路55により(
1)〜(111)の処理で生じたピツチの欠落箇所を、
その点の前後のピツチの線形補間により修復する。
このようにして得られたピツチパタンはバツフアメモリ
56に格納され、以後の処理に用いられるO次に抽出に
必要な情報としては、スペクトル変化を示すスペクトル
安定率がある。
これは特に音韻境界決定器8にはなくてはならないもの
で、その算出は次のような手順で行われる。まず分析器
4により得られたスペクトル包絡情報をバツフアメモリ
61に蓄え、聴覚の特性を反映させるためMel変換回
路62により周波数軸をMel変換する。
変換は次式に従う。Me(f)=C.IOg(1000
+f)(c:定数、f:周波数)この変換を施した後、
スペクトル包絡差算出回路63により前後3サンプルの
ものとの差をとり、重み係数器64で重み係数を掛け、
積分器65によりそれらを加え合わせる。
このようにして求まつたものはスペク.トノレ変化率を
示すものであり、変換回路66によりスペクトル安定率
に変換し、バツフアメモリ67に蓄える。上記の手順を
定式化すると次のようになる。ここで、A(F,t)は
時刻tにおけるスペクトル包絡の周波数成分子の持つパ
ワー(DB)であり、W(τ)は重み係数(=40−1
τI)とする。
音韻境界決定器8に必要なものとしては、この他に音韻
系列情報がある。入力端子2から入力された音韻記号系
列は、内蔵されている音韻情報テーブル71が参照され
、変換器72によつて音韻系列情報に変換され、バツフ
アメモリ73に蓄えられる。この音韻情報テーブル71
に蓄えられている音韻情報は、音韻間の境界の状態(例
えば子音の有無、子音の性質等)を示すものであり、そ
の系列は境界を決定する際に重要な役割を果す。音韻境
界決定器8においてはバツフアメモリ4156,67,
73に各々蓄えられたパワー、ピツチパタン、スペクト
ル安定率、音韻情報を用い、連続性判定回路81により
音韻境界候補点を見出し、バツフアメモリ82に格納す
る。音韻境界決定回路83はこの候補点のうちから、音
韻情報系列73をもとに発見し易い順に境界を求める。
この音韻境界決定処理は表1に示すような順で行われる
が、その結果は各回ごとにバツフアメモリ84に格納さ
れると共に、決定回路83にフイードバツクされる。点
ピツチ位置決定器9では前述のようにして得られた音韻
区間情報と共に、バツフアメモリ41,56,67に各
々蓄えられたパワー、ピツチパタン、スペクトル安定率
を用い、点ピツチ候補区間決定回路91で、まず点ピツ
チ位置の候補区間を定める。
点ピツチ位置は聞えの中心であり、またそこでは調音器
官の動きが安定していると考えられるので、バツフアメ
モリ41から与えられるパワーa(t)、バツフアメモ
リ67から与えられるスベクトル安定率ρ(t)の値が
大きな点であると考えられる。そこでこの決定回路91
においては、バツフアメモリ84から与えられる音韻区
間について、積分器92を用いてa(t)ρ(t)を積
分し、その重心の前後20mse皓点ピツチ位置の候補
区間と決定する。次に点ピツチ位置決定回路93におい
て、この候補区間内の点から点ピツチ位置が決定される
この決定回路93では点ピツチ候補区間決定回路91で
得られる候補点に対し、それらの点ピツチ内挿パタンp
(t)を作成し、バツフアメモリ56に蓄えられた原ピ
ツチパタンP。(t)との差を求め、次式を最小にする
p(t)を求める。(この算出手法には動的計画法を用
いている。)f(p)=Fa(t)ρ(t)Ip(t)
−PO(t)]Dt以上のようにして得た点ピツチ位置
の抽出例を第4図に示す。
第4図は6目上の人1と発声したものについて、得られ
た点ピツチを矢印で示してある。このようlこして求ま
つた点ピツチ位置をまともに、韻律要素出力制御回路9
4では前述した三つの韻律要素を求め出力する。
すなわちバツフアメモリ56から点ピツチの値を読み出
し、点ピツチ位置の時間間隔を算出し、バツフアメモリ
41から点ピツチ位置のパワーを読み出して端子10に
前記実施例において例示した各種の制御定数、第2図に
示した5,6,7の構成の詳細、表1に示す音韻境界決
定器8の決定順序、点ピツチ位置決定器9の点ピツチ位
置決定に用いられる評価函数f(p)は言うまでもなく
、これらのものに限定されるものではなく、要は音韻区
間の分割と母音の中心の決定が正しく行われるものであ
ればよい。以上説明したように本発明の韻律要素の自動
抽出方式は、平滑化前処理を施したピツチパタン、数サ
ンプルの荷重平均をとつたスペクトル安定率といつた比
較的安定したデータを用い、段階的な音韻境界決定方法
、原ピツチパタンを最良近似する点ピツチ位置決定方法
により抽出を行うので、精度良く韻律要素を得ることが
できる。このように自然音声から自動的に韻律要素を抽
出できるので、本発明は編集合成方式に必要な韻律要素
フアイルの作成等を容易にする利点がある。
【図面の簡単な説明】
第1図は本発明の一実施例のプロツク図、第2図は第1
図の韻律要素抽出部の構成図、第3図は蝶型フイルタの
処理の説明図、第4図は本発明の抽出方式による点ピツ
チ位置の抽出例を示す図である。 1・・・・・・入力端子、2・・・・・・入力端子、3
・・・・・・音声信号前処理部、4・・・・・・相関型
音声分析器、5・・・・・・ピツチパタン平滑化処理回
路、6・・・・・・スペクトル安定率算出回路、7・・
・・・・音韻情報作成器、8・・・・・・音韻境界決定
器、9・・・・・・点ピツチ位置決定器、10・・・・
・・出力端子、11・・・・・・バツフアメモリ、41
・・・・・・バツフアメモ1八 51・・・・・・バツ
フアメモI八52・・・・・・閾値回路、53・・・・
・・ピツチ修正回路、54・・・・・・蝶型フイルタ、
55・・・・・・補間回路、56・・・・・・バツフア
メモリ、61・・・・・・バツフアメモリ、62・・・
・・・Mel変換回路、63・・・・・・スペクトル包
絡算出回路、64・・・・・・重み係数器、65・・・
・・・積分器、66・・・・・・変換回路、67・・・
・・・バツフアメモI八71・・・・・・音韻情報テー
ブル、72・・・・・・変換器、73・・・・・・バツ
フアメモリ、81・・・・・・連続性判定回路、82・
・・・・・バツフアメモリ、83・・・・・・音韻境界
決定路、84・・・・・・バツフアメモリ、91・・・
・・・点ピツチ候補区間決定回路、92・・・・・・積
分器、93・・・・・・点ピツチ位置決定回路、94・
・・・・・韻律要素出力制御回路。

Claims (1)

    【特許請求の範囲】
  1. 1 編集形音声合成方式の韻律情報ファイルの作成等に
    おいて、入力として自然音声とそれに対応する音韻系列
    が与えられたとき、この自然音声の有するパワー、ピッ
    チ周波数、スペクトル変化情報とその音韻系列との対応
    により、自然音声を音韻区間に分割する手段と、この手
    段によつて定められた母音区間内に、パワーピッチ周波
    数、スペクトル変化情報を用いて聴覚的な母音の重心位
    置を決定する手段とにより韻律要素を抽出することを特
    徴とする韻律要素の抽出方式。
JP52041559A 1977-04-13 1977-04-13 韻律要素の抽出方式 Expired JPS5948397B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP52041559A JPS5948397B2 (ja) 1977-04-13 1977-04-13 韻律要素の抽出方式

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP52041559A JPS5948397B2 (ja) 1977-04-13 1977-04-13 韻律要素の抽出方式

Publications (2)

Publication Number Publication Date
JPS53127204A JPS53127204A (en) 1978-11-07
JPS5948397B2 true JPS5948397B2 (ja) 1984-11-26

Family

ID=12611779

Family Applications (1)

Application Number Title Priority Date Filing Date
JP52041559A Expired JPS5948397B2 (ja) 1977-04-13 1977-04-13 韻律要素の抽出方式

Country Status (1)

Country Link
JP (1) JPS5948397B2 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS6355999U (ja) * 1986-09-30 1988-04-14

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS6355999U (ja) * 1986-09-30 1988-04-14

Also Published As

Publication number Publication date
JPS53127204A (en) 1978-11-07

Similar Documents

Publication Publication Date Title
Zwicker et al. Automatic speech recognition using psychoacoustic models
US4661915A (en) Allophone vocoder
US6349277B1 (en) Method and system for analyzing voices
US4087632A (en) Speech recognition system
US4424415A (en) Formant tracker
JPH031200A (ja) 規則型音声合成装置
JPH08263097A (ja) 音声のワードを認識する方法及び音声のワードを識別するシステム
JP2612868B2 (ja) 音声の発声速度変換方法
US5452398A (en) Speech analysis method and device for suppyling data to synthesize speech with diminished spectral distortion at the time of pitch change
EP0071716A2 (en) Allophone vocoder
JPS5948397B2 (ja) 韻律要素の抽出方式
JPH07191696A (ja) 音声認識装置
EP0114814B1 (en) Apparatus and method for articulatory speech recognition
Strik et al. A dynamic programming algorithm for time-aligning and averaging physiological signals related to speech
JP2005070604A (ja) 音声ラベリングエラー検出装置、音声ラベリングエラー検出方法及びプログラム
Mache et al. Development of text-to-speech synthesizer for Pali language
JP2001083978A (ja) 音声認識装置
JP2956936B2 (ja) 音声合成装置の発声速度制御回路
JPH0122639B2 (ja)
JP2583854B2 (ja) 有声無声判定方法
JPS62102294A (ja) 音声符号化方式
JPH05127697A (ja) ホルマントの線形転移区間の分割による音声の合成方法
JPH0258640B2 (ja)
JPS6265098A (ja) 音楽用ボコ−ダ
JP3532059B2 (ja) 音声合成方法及び音声合成装置