JPH045697A - 単語アクセント登録方法 - Google Patents

単語アクセント登録方法

Info

Publication number
JPH045697A
JPH045697A JP2106870A JP10687090A JPH045697A JP H045697 A JPH045697 A JP H045697A JP 2106870 A JP2106870 A JP 2106870A JP 10687090 A JP10687090 A JP 10687090A JP H045697 A JPH045697 A JP H045697A
Authority
JP
Japan
Prior art keywords
input
word
accent
pitch pattern
pitch
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2106870A
Other languages
English (en)
Inventor
Takashi Miki
三木 敬
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Oki Electric Industry Co Ltd
Original Assignee
Oki Electric Industry Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Oki Electric Industry Co Ltd filed Critical Oki Electric Industry Co Ltd
Priority to JP2106870A priority Critical patent/JPH045697A/ja
Publication of JPH045697A publication Critical patent/JPH045697A/ja
Pending legal-status Critical Current

Links

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 (産業上の利用分野) 本発明は、入力テキスト文字列を解析して音声出力を合
成する規則合成装置において、被登録単語に対する単語
アクセントを単語辞書に登録するための単語アクセント
登録方法に関するものである。
(従来の技術) 従来、この様な分野の技術としては、特開平11770
95号公報に記載されるものがあった。
従来、規則合成装置は、入力テキスト文字列中の単語を
解析し、その単語よりさらに小さい音素(母音、子音、
半母音〉や音節(母音と子音が対になったもので、はぼ
仮名1文字に相当するもの〉を単位とし、適切な規則に
より、滑らかにつなぎ合わせて、任意の音声出力を合成
するものである。
この規則合成装置の一構成例を第2図に示す。
第2図は、前記文献などに記載された従来の規則合成装
置の一構成例を示す機能ブロック図である。
この規則合成装置は、テキスト文字列入力端子1を有し
、その入力端子1にはテキスト解析部2が接続されてい
る。テキスト解析部2には、単語辞書3及び音声合成部
4が接続されている。音声合成部4には、音声パラメー
タ5aを有する音声辞書5と音声出力端子6とが接続さ
れている。また、テキスト解析部2には、キーボードか
らなる入力装置7が接続されている。
以上の構成において、テキスト文字列入力端子1から入
力されたテキスト文字列は、テキスト解析部2に送られ
る。テキスト解析部2では、単語辞書3に格納された単
語と照合し、入力テキスト文字列を句や単語に分割し、
その分割された単語の読みを決定した後、アクセントや
抑揚等の音韻情報を付加し、音声合成部4に出力する。
音声合成部4では、テキスト解析部2から出力される音
韻情報(単語の読み)と韻律情報とに基づき、音声辞書
5に格納されている音声パラメータ5aを組合わせて音
声を合成し、音声出力端子6から外部へ出力する。
この種の規則合成装置を用いて単語辞書3に新しく単語
を登録しようとする場合、次のような手法が採用されて
いる。
新しく登録しようとする被登録単語とその読み仮名が、
例えばテキスト文字列の形でテキスト文字列入力端子1
に入力されると、テキスト解析部2では、その入力され
た読み仮名から想定される平板型や中高型等といったア
クセント型情報を生成する。このアクセント型情報は、
音声合成部4に入力されてその音声合成部4から合成音
の形で音声出力端子6から出力される。そして、被登録
単語の読み仮名から想定される複数のアクセント型情報
の合成音を順に使用者に聞かせ、その中で最も良いと思
われるアクセント型情報を入力装置7を操作して使用者
に選択させ、その選択させたアクセント型情報を単語辞
書3に登録する。
(発明が解決しようとする課題) しかしながら、上記の単語アクセント登録方法では、多
くのアクセント型情報が存在する多モーラ単語(音節が
多い単語)を登録しようとする場合、使用者は何回も合
成音を聞かされることになり、非常に能率が悪かった。
しかも、複合語などの主アクセントと副アクセント等、
複雑なアクセントを持つ単語に対しては、使用者は多数
のアクセント型情報の合成音から正しいと思われるアク
セント型情報を選択しなければならず、熟練者でないと
正しいアクセントの登録が困難であった。
本発明は前記従来技術が持っていた課題として、合成音
を何回も聞かなければならないために能率が悪い点、及
び熟練者でないと正しいアクセントの登録が困難である
という点について解決した単語アクセント登録方法を提
供するものである。
(課題を解決するための手段) 本発明は前記課題を解決するために、入力文字列を解析
し、その入力テキスト文字列中の単語を単語辞書の内容
と照合して音韻情報及び韻律情報を出力するテキスト解
析部と、前記テキスト解析部の出力に基づき前記入力テ
キスト文字列に対応する音声を合成する音声合成部とを
備えた規則合成装置に、被登録単語がその読み表記と共
に与えられたときに、該被登録単語のアクセント型情報
を前記単語辞書に登録する単語アクセント登録方法にお
いて、次のような手段を講じたものである。
即ち、本発明では、使用者か発音した前記被登録単語の
入力音声データを分析して入力ピッチパタンを抽出し、
前記韻律情報から生成される基準ピッチパタンと前記入
力ピッチパタンとを、照合してその両ピッチパタンの類
似度を求め、前記入力ピッチパタンと最も類似した基準
ピッチパクンを生成するアクセント型情報を前記入力音
声データのアクセント型情報として前記単語辞書に登録
するようにしたものである。
(作用) 本発明では、以上のように単語登録方法を構成したので
、使用者が新しく登録しようとする被登録単語を発声し
、その音声データを入力すると、その入力音声データが
分析されて大力ピッチパタンが抽出される。テキスト解
析部では、韻律情報から生成した基準ピッチパタンを出
力するので、その基準ピッチパタンと、入力ピッチパタ
ンとを照合して、その両ピッチパタンの類似度を求める
そして、最も入力ピッチパタンと類似した基準ピッチパ
タンを生成するアクセント型情報を入力音声データのア
クセント型情報と決定し、そのアクセント型情報をテキ
スト解析部によって単語辞書に登録する。
このように、使用者が発声した被登録単語音声データに
基づき、規則合成装置によって最も適合するアクセント
型情報が選択される。そのため、アクセント型設定作業
を極めて短時間で、且つ正確に行える。従って、前記課
題を解決できるのである。
(実施例) 第3図は、本発明の実施例を示すもので、単語アクセン
ト登録方法を説明するための規則合成装置の機能ブロッ
ク図である。
この規則合成装置は、個別回路、あるいはコンピュータ
のプログラム制御等によって構成されるもので、テキス
ト文字列入力端子11を有し、その入力端子11が、テ
キスト解析部12に接続されている。テキスト解析部1
2には、単語辞書13及び音声合成部14が接続され、
その音声合成部14には、音声パラメータ15aを有す
る音声辞書15と音声出力端子16とが接続されている
テキスト解析部12は、入力テキスト文字列を解析して
単語の読みの音韻情報を生成すると共に、アクセントや
抑揚等の韻律情報を生成し、さらに韻律情報から基準ピ
ッチパタンPiを生成する機能を有している。音声合成
部14は、テキスト解析部12から出力される音韻情報
(単語の読み)及び韻律情報に基づき、音声常置15を
参照して音声を合成し、それを音声出力端子16から外
部へ出力する機能を有している。
また、この規則合成装置には、図示しないマイクロホン
等から音声データを入力する音声入力端子20を有し、
その音声入力端子20には、ピッチ抽出部21を介して
ピッチパタン照合部22が接続されている。ピッチ抽出
部21は、入力音声データを分析して入力ピッチパタン
Pinを抽出する機能を有している。ピッチパタン照合
部22は、ピッチ抽出部21からの入力ピッチパタンP
inと、テキスト解析部12からの基準ピッチパタンP
iとを照合し、両パタンの類似度Siを算出し、最も類
似した基準ピッチパタンPiを判定し、その判定結果を
テキスト解析部12へ与える機能を有している。
先ず、以上のような規則合成装置の音声合成動作を、第
4図を参照しつつ説明する。
第4図は、モーラ数(音節数)3の単語の基準ピッチパ
タンPiの例を示す図である。
第3図に示すように、テキスト文字列入力端子11から
入力されたテキスト文字列は、テキスト解析部12へ送
られる。テキスト解析部12では、単語辞書13に格納
されている単語との照合を行い、入力テキスト文字列を
句や単語に分割し、その分割された単語の読みを決定し
て音韻情報を生成し、さらにアクセントや抑揚等の韻律
情報を付加して音声合成部14へ出力する。音声合成部
14では、テキスト解析部14からの音韻情報及び韻律
情報に基づき、音声辞書15に格納されている音声パラ
メータ15aを組合わせて音声を合成し、それを音声出
力端子16から外部へ出力する。
第1図は、第3図の規則合成装置を用いた本発明の実施
例を示す、単語アクセント登録方法のフローチャートで
ある。このフローチャートを参照しつつ、新しく単語を
登録しようとする場合の処理について、以下説明する。
新しく被登録単語(例えば、漢字の「左」〉を登録しよ
うとする場合、その被登録単語「左」とその読み仮名「
ヒダリ」を、テキスト文字列の形でテキスト文字列入力
端子11に入力する(ステップS30,531)。次に
、使用者は被登録単語「左」を図示しないマイクロホン
で発声する(ステップ532)。発声された音声データ
は、音声入力端子20を経てピッチ抽出部21へ入力さ
れる。ピッチ抽出部21では、入力音声データを分析し
、入力ピッチパタンPinを抽出する(ステップ833
)。この抽出された入力ピッチパタンPinに基づき、
ピッチパタン照合部22で、次のようにして照合処理が
行われる。
テキスト解析部12では、被登録単語「左」のモーラ数
から想定される1個のアクセント型1(−1,2,・・
・、I)をOに初期設定した後(ステップ534)、そ
のアクセント型iに対応する基準ピッチパタンPi(但
し、i=1.2.・・・■〉を生成しくステップ535
)、その基準ピッチパタンPiを順にピッチパタン照合
部22へ出力する。
第4図に示すように、被登録単語「左」は、モーラ数が
3で、通常、 モーラ数+1=アクセント型の数■ であるから、アクセント型iが0で、その基準ピッチパ
タンPiが高、低に変化しない平坦なバタンとなってい
る。
次に、ピッチパタン照合部22では、入力ピッチパタン
Pinと基準ピッチパタンPiとの類似度Siを算出す
る(ステップ836)。さらに、ピッチパタン照合部2
2は、アクセント型i=Iとなっているか否かの判断を
行い(ステップ537)、i=Iの時にはアクセント型
iに+1して(ステップS38〉、ステップS35に戻
り、全ての基準ピッチパタンPiとの照合が終了した時
点で、ステップS39に進む。
ステップS39において、ピッチパタン照合部22は、
最も高い類似度Siを与えるアクセント型iを被登録単
語「左」のアクセント型と判定し、その判定結果をテキ
スト解析部12へ返す。すると、テキスト解析部12で
は、最も高い類似度Siに対応するアクセント型iを、
被登録単語「左」のアクセント型0として、被登録単語
「左」及びその読み仮名と共に、単語辞書13に記憶さ
せる。
これにより、被登録単語「左」の登録が完了する。
以上のように本実施例では、使用者が発声した被登録単
語の音声データに基づき、その入力ピッチパタンPin
と基準ピッチパタンPiとの照合を行い、その照合結果
より被登録単語「左」に対するアクセント型の登録を行
うようにしたので、被登録単語に対する最も適合するア
クセント型iが自動的に選択される。そのため、アクセ
ント型設定作業を極めて短時間で、且つ正確に行うこと
ができる。
なお、本発明は図示の実施例に限定されず、種々の変形
が可能である。例えば、上記実施例では、被登録単語と
その読み仮名を、テキスト文字列の形でテキスト文字列
入力端子11から入力するようにしたが、これに代えて
、キーボード等の入力装置を用いて直接、テキスト解析
部12へ入力するようにしてもよい。
(発明の効果) 以上詳細に説明したように、本発明によれば、入力音声
データから入力ピッチパクンを抽出し、その抽出された
入力ピッチパタンと、韻律情報から生成される基準ピッ
チパタンとを照合し、その両ピッチパタンの類似度を求
める。そして、最も類似した基準ピ・ソチパタンを生成
するアクセント型情報を入力音声データのアクセント型
情報と決定し、その決定されたアクセント型情報を単語
辞書に登録するようにした。そのため、使用者が発声し
た被登録単語音声テータに基づき、最も適合するアクセ
ント型情報が規則合成装置によって選択される。これに
より、多モーラ単語や、複雑なアクセントを持つ複合語
等の単語のアクセント登録を行う場合にも、熟練を要す
ることなく、アクセント型設定作業を極めて短時間で、
且つ正確に行うことができる。
【図面の簡単な説明】
第1図は本発明の実施例を示す単語アクセント登録方法
のフローチャート、第2図は従来の規則合成装置の機能
ブロック図、第3図は本発明の実施例における規則合成
装置の機能ブロック図、第4図はモーラ数3の単語の基
準ピッチパタン例を示す図である。 11・・・テキスト文字列入力端子、12・・・テキス
ト解析部、13・・・単語辞書、14・・・音声合成部
、151.・音声辞書、16・・・音声出力端子、20
・・・音声入力端子、21・・・ピッチ抽出部、22・
・・ピ・ソチバタン照合部、i・・・アクセント型、P
i・・・基準ピッチパタン、Pin・・・入力ピッチパ
タン。

Claims (1)

  1. 【特許請求の範囲】  入力テキスト文字列を解析し、その入力テキスト文字
    列中の単語を単語辞書の内容と照合して音韻情報及び韻
    律情報を出力するテキスト解析部と、前記テキスト解析
    部の出力に基づき前記入力テキスト文字列に対応する音
    声を合成する音声合成部とを備えた規則合成装置に、 被登録単語がその読み表記と共に与えられたときに、該
    被登録単語のアクセント型情報を前記単語辞書に登録す
    る単語アクセント登録方法において、 使用者が発音した前記被登録単語の入力音声データを分
    析して入力ピッチパタンを抽出し、前記韻律情報から生
    成される基準ピッチパタンと、前記入力ピッチパタンと
    を、照合してその両ピッチパタンの類似度を求め、 前記入力ピッチパタンと最も類似した基準ピッチパタン
    を生成するアクセント型情報を前記入力音声データのア
    クセント型情報として前記単語辞書に登録することを特
    徴とする単語アクセント登録方法。
JP2106870A 1990-04-23 1990-04-23 単語アクセント登録方法 Pending JPH045697A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2106870A JPH045697A (ja) 1990-04-23 1990-04-23 単語アクセント登録方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2106870A JPH045697A (ja) 1990-04-23 1990-04-23 単語アクセント登録方法

Publications (1)

Publication Number Publication Date
JPH045697A true JPH045697A (ja) 1992-01-09

Family

ID=14444575

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2106870A Pending JPH045697A (ja) 1990-04-23 1990-04-23 単語アクセント登録方法

Country Status (1)

Country Link
JP (1) JPH045697A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH11175082A (ja) * 1997-12-10 1999-07-02 Toshiba Corp 音声対話装置及び音声対話用音声合成方法

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH11175082A (ja) * 1997-12-10 1999-07-02 Toshiba Corp 音声対話装置及び音声対話用音声合成方法

Similar Documents

Publication Publication Date Title
US20030154080A1 (en) Method and apparatus for modification of audio input to a data processing system
JP2002304190A (ja) 発音変化形生成方法及び音声認識方法
Chou et al. A set of corpus-based text-to-speech synthesis technologies for Mandarin Chinese
Paulo et al. DTW-based phonetic alignment using multiple acoustic features.
JP4964695B2 (ja) 音声合成装置及び音声合成方法並びにプログラム
Hoffmann et al. Evaluation of a multilingual TTS system with respect to the prosodic quality
JPH0887297A (ja) 音声合成システム
JPH08335096A (ja) テキスト音声合成装置
JP2006030609A (ja) 音声合成データ生成装置、音声合成装置、音声合成データ生成プログラム及び音声合成プログラム
JP3378547B2 (ja) 音声認識方法及び装置
Ronanki et al. The CSTR entry to the Blizzard Challenge 2017
Pitrelli et al. Expressive speech synthesis using American English ToBI: questions and contrastive emphasis
JPH045697A (ja) 単語アクセント登録方法
JPH09152884A (ja) 音声合成装置
Govender et al. The CSTR entry to the 2018 Blizzard Challenge
EP1589524B1 (en) Method and device for speech synthesis
JPH06318094A (ja) 音声規則合成装置
Romsdorfer et al. A mixed-lingual phonological component which drives the statistical prosody control of a polyglot TTS synthesis system
JP3881155B2 (ja) 音声認識方法及び装置
Kaur et al. Formant Text to Speech Synthesis Using Artificial Neural Networks
JPH037995A (ja) 歌音声合成データの作成装置
JPH05281984A (ja) 音声合成方法および装置
JP3299170B2 (ja) 音声登録認識装置
Dessai et al. Development of Konkani TTS system using concatenative synthesis
JP2703253B2 (ja) 音声合成装置