JP3001210B2 - ポーズ挿入位置決定装置 - Google Patents

ポーズ挿入位置決定装置

Info

Publication number
JP3001210B2
JP3001210B2 JP1173445A JP17344589A JP3001210B2 JP 3001210 B2 JP3001210 B2 JP 3001210B2 JP 1173445 A JP1173445 A JP 1173445A JP 17344589 A JP17344589 A JP 17344589A JP 3001210 B2 JP3001210 B2 JP 3001210B2
Authority
JP
Japan
Prior art keywords
word
pause
speech
boundary
character string
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP1173445A
Other languages
English (en)
Other versions
JPH0337700A (ja
Inventor
和彦 岩田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Priority to JP1173445A priority Critical patent/JP3001210B2/ja
Publication of JPH0337700A publication Critical patent/JPH0337700A/ja
Application granted granted Critical
Publication of JP3001210B2 publication Critical patent/JP3001210B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Description

【発明の詳細な説明】 (産業上の利用分野) 本発明は、文字列を音声に変換する規則音声合成等に
おいて、ポーズを挿入する位置を決定するポーズ挿入位
置決定方式に関する。
(従来の技術) 任意の文章を音声に変換する規則音声合成において
は、文中の適切な位置に適切な長さのポーズを挿入する
ことが必要であり、合成される音声の自然性を向上させ
る上で重要である。すなわち、人間には一息で発声でき
る長さに限界があり、発声者は、意味の上で結びつきの
弱い適当な文節あるいは単語の境界において、息継ぎの
ためや聞き手の意味の切れ目を伝えるためにポーズを置
く。したがって、合成音声を生成する際においても、適
度にポーズが挿入されていないと聞き手は不自然さを感
じる。
従来、ポーズの挿入位置の決定には、隣接する文節と
文節の結びつきの強さが用いられていた。すなわち、前
後の文節間の意味の上での結び付きが弱いほどポーズは
挿入され易いという性質を利用する。
まず、文節と文節の境界における結びつきの強さを、
先行文節から受けの文節に至るまでの文節数で表現し、
この尺度を分離度と呼ぶ。分離度の値が大きいというこ
とは、ある文節がより遠くにある文節と結びついてお
り、隣接する文節との結びつきは弱いということを表し
ている。したがって、分離度の大きい文節境界では、ポ
ーズが挿入される可能性が高いと考える。また、人間に
は一息で発声できる長さに限界があり、発声者は適当な
位置で息継ぎのためにポーズを置く。したがって、文節
境界の前後の文節の総モーラ数が多い場合にポーズが挿
入され易いと考える。以上のことから、ポーズを挿入す
るかどうかの判断をするための評価尺度として、分離度
と総モーラ数との積の値を用い、これが、予め定めるあ
る閾値を越える場合にポーズが挿入されるものとする。
このようなポーズ挿入位置の決定方法については、日
本音響学会音声研究会試料S78−07(1978−4)「文音
声の音調規則の検討」(文献1)に詳述されている。
(発明が解決しようとする問題点) 従来の方法では、文章を構成する文節同士の係り受け
関係を正確に解析する必要があった。しかしながら、こ
の係り受け関係を常に正確に解析することは難しく、こ
のため、選択されたポーズ挿入位置が不自然になること
があるという問題点があった。
これに対して本発明は、このような係り受け関係の解
析を行うことなしに、自然なポーズの挿入位置を決定す
ることが可能なポーズ挿入位置決定方式を提供すること
を目的としている。
(問題を解決するための手段) 第1の本発明は、入力された文字列を音声に変換する
際に、前記入力された文字列で表される文章をそれを構
成する単語に分解し、分解された各単語の境界にポーズ
を挿入するかどうかを判定するポーズ挿入位置決定装置
において、予め単語の直後にどの程度ポーズが挿入され
易いかを表す数値を単語の品詞ごとに記憶する手段と、
入力された文字列で表される文章を構成する各単語の境
界の直前の単語の品詞に応じた前記記憶された単語の直
後のポーズの挿入され易さを表す数値に基づいて当該単
語境界にポーズを挿入するかどうかを判定する手段を備
えることを特徴とする。
第2の本発明は、入力された文字列を音声に変換する
際に、前記入力された文字列で表される文章をそれを構
成する単語に分解し、分解された各単語の境界にポーズ
を挿入するかどうかを判定するポーズ挿入位置決定装置
において、予め単語の直前にどの程度ポーズが挿入され
易いかを表す数値を単語の品詞ごとに記憶する手段と、
入力された文字列で表される文章を構成する各単語の境
界の直後の単語の品詞に応じた前記記憶された単語の直
前のポーズの挿入され易さを表す数値に基づいて当該単
語境界にポーズを挿入するかどうかを判定する手段を備
えることを特徴とする。
第3の本発明は、入力された文字列を音声に変換する
際に、前記入力された文字列で表される文章をそれを構
成する単語に分解し、分解された各単語の境界にポーズ
を挿入するかどうかを判定するポーズ挿入位置決定装置
において、予め単語の直後にどの程度ポーズが挿入され
易いかを表す数値と、単語の直前にどの程度ポーズが挿
入され易いかを表す数値とを、それぞれ単語の品詞ごと
に記憶する手段と、入力された文字列で表される文章を
構成する各単語の境界の直前の単語の品詞に応じた前記
記憶された単語の直後のポーズの挿入され易さを表す数
値と、当該単語境界の直後の単語の品詞に応じた前記記
憶された単語の直前のポーズの挿入され易さを表す数値
とに基づいて当該単語境界にポーズを挿入するかどうか
を判定する手段を備えることを特徴とする。
(作用) ポーズは、文節あるいは単語の境界(以下、単に境界
とあるのは、文節あるいは単語の境界を示すものとす
る)において、その境界の前後にある単語の、意味の上
での結び付きが弱い境界に挿入され易い。従来方式は、
この結び付きの強弱を文章の係り受け構造から算出して
いた。一方で、ポーズが挿入される境界の前後にある単
語の品詞を調べてみると、ポーズが挿入され易い品詞
と、挿入されにくい品詞とがあることがわかる。そこ
で、品詞の持つこのように性質を利用すれば、文章の係
り受け構造を用いなくても、自然なポーズ挿入位置を決
定することが可能であると考えられる。
そこで、予め、いくつかの文章を人間が読み上げた音
声(以下、文章音声データベースと称する)から、ポー
ズが挿入されている境界の直後、あるいは直前にある単
語の品詞を調べ、品詞ごとに、その単語の直前あるいは
直後にどの程度ポーズが挿入され易いかを求める。ポー
ズの挿入され易さとしては、例えば、文章音声データベ
ースにおけるある品詞の全出現に対する、その品詞がポ
ーズを伴っている出現の割合等を用いることが考えられ
る。すなわち、品詞がPSである単語の直前にポーズが挿
入される確率Pp(PS)、直後にポーズが挿入される確率
Pf(PS)をそれぞれ以下のように定義する。
Pp(PS)=(直前にポーズを伴っている品詞PSの出現数) /(品詞PSの全出現数) ……(1) Pf(PS)=(直後にポーズを伴っている品詞PSの出現数) /(品詞PSの全出現数) ……(2) 以下では、単語の直前あるいは直後にどの程度ポーズ
が挿入され易いかを表す数値として、前記ポーズ挿入確
率Pp(PS)、Pf(PS)を用いる場合を例にとって説明を
行うことにする。
これらのポーズ挿入確率Pp(PS)、Pf(PS)、すなわ
ちポーズの挿入され易さを、品詞ごとに求める。品詞の
種類としては、名詞、動詞、副詞といった分類の方法が
ある。また、動詞や形容詞、助動詞などのように活用す
る品詞については、未然形、連用形、連体形などの活用
形ごとに分類することも考えられる。
第1の本発明では、音声に変換する文章においてポー
ズを挿入するべき境界を決定する際の判定の尺度とし
て、(2)式で示される。各境界における当該境界の直
前にある単語の品詞PSpに応じたポーズ挿入確率Pf(P
Sp)を用いる。このような判定尺度を用いて、実際にポ
ーズ挿入位置を決定する方法としては、例えば、(文献
1)て示されるような方法が考えられる。すなわち、前
記判定尺度と境界の前後の文節の長さ(例えば、モーラ
数)とから算出される値を評価尺度とする。この評価尺
度に閾値を設け、各境界における評価尺度が閾値を越え
ているかどうかに応じて、当該境界にポーズを挿入する
かどうかの判断を行う。あるいは、音声に変換すべき文
章の長さから、はじめにポーズをいくつ挿入するかを定
めておき、前記判定尺度の大きい境界から順にポーズを
挿入していくこともできる。
第2の本発明では、前記判定の尺度として、(1)式
で示される、各境界における当該境界の直後にある単語
の品詞PSfに応じたポーズ挿入確率Pp(PSf)を用いる。
また、第3の本発明では、前記判定の尺度として、
(2)式で示される、各境界における当該境界の直前に
ある単語の品詞PSpに応じたポーズ挿入確率Pf(PSp
と、(1)式で示される、当該境界の直後にある単語の
品詞PSfに応じたポーズ挿入確率Pp(PSf)とを用いる。
両者を用いた判定の尺度としては、例えば、Pf(PSp
とPp(PSf)との和などが考えられる。
以上のような手法を用いることにより、音声に変換す
る文章の係り受け構造は用いずに、形態素解析で得られ
る単語の品詞を用いるだけで、自然なポーズ挿入位置を
決定することが可能となる。
(実施例) 第1図は、第1の本発明によるポーズ挿入位置決定方
式を実現するための一実施例を示すブロック図である。
まず、音声に変換すべき文字列を、文字列入力端子11
から入力する。入力された前記文字列は形態素解析部12
に送られ、入力文字列で表される文章を単語列に分割
し、各単語の品詞や読みを決定する。この品詞や読みを
伴った単語列は、単語長算出部13及びポーズ挿入位置決
定部15に送られる。単語長算出部13では、前記単語列が
与えられると、単語の読みを用いて文章を構成している
各単語の長さ(例えばモーラ数)を算出し、ポーズ挿入
位置決定部15に送る。
ポーズ挿入確率記憶部14には、(2)式で表される、
品詞の後ろにポーズが挿入される確率Pf(PS)が、品詞
ごとに予め蓄えられている。
ポーズ挿入位置決定部15は、まず、前記品詞を伴った
単語列によって各境界の直前にある単語の品詞PSpに対
応した、前記ポーズ挿入確率記憶部14に蓄えられている
ポーズ挿入確率Pf(PSp)を読み出す。読み出された前
記ポーズ挿入確率Pf(PSp)と、前記単語長算出部13で
算出された各単語の長さとを用いて、(作用)の項で説
明したような手法によってポーズを挿入する位置を決定
し、結果をポーズ挿入位置位出力端子16から出力する。
第2の本発明を実現するためには、第1図におけるポ
ーズ挿入確率記憶部14に蓄えられているポーズ挿入確率
を、(1)式で表されるPp(PS)とする。そして、ポー
ズ挿入位置決定部15では、各境界の直後にある単語の品
詞PSfに応じて、ポーズ挿入確率記憶部14に蓄えられて
いるポーズ挿入確率Pp(PSf)を読み出し、第1の本発
明と同様にしてポーズを挿入する位置を決定すればよ
い。
また、第3図の本発明を実現するためには、第1図に
おけるポーズ挿入確率記憶部14に、(1)式で表される
Pp(PS)と、(2)式で表されるPf(PS)とを蓄えてお
く。そして、ポーズ挿入位置決定部15では、各境界の直
前にある単語の品詞PSpに応じたポーズ挿入確率Pf(P
Sp)、及び各境界の直後にある単語の品詞PSfに応じた
ポーズ挿入確率Pp(PSf)とを、ポーズ挿入確率記憶部1
4から読み出し、(作用)の項で説明したような手法に
よってポーズを挿入する位置を決定すればよい。
(発明の効果) 以上述べてきたように、本発明は、正しく解析するこ
とが困難な係り受け解析の結果を用いることなしに、ポ
ーズの挿入位置を決定する。このため、従来方式よりも
正しく、自然なポーズの挿入位置を決定することが可能
となる。したがって、本発明は、文字列で与えられた任
意の文章を音声に変換する音声合成装置等におけるポー
ズ挿入位置決定方式として有効である。
【図面の簡単な説明】 第1図は、第1の本発明によるポーズ挿入位置決定方式
を実現するための一実施例を示すブロック図である。 図において、11は文字列入力端子、12は形態素解析部、
13は単語長算出部、14はポーズ挿入確率記憶部、15はポ
ーズ挿入位置決定部、16はポーズ挿入位置出力端子であ
る。

Claims (3)

    (57)【特許請求の範囲】
  1. 【請求項1】入力された文字列を音声に変換する際に、
    前記入力された文字列で表される文章をそれを構成する
    単語に分解し、分解された各単語の境界にポーズを挿入
    するかどうかを判定するポーズ挿入位置決定装置におい
    て、予め単語の直後にどの程度ポーズが挿入され易いか
    を表す数値を単語の品詞ごとに記憶する手段と、入力さ
    れた文字列で表される文章を構成する各単語の境界の直
    前の単語の品詞に応じた前記記憶された単語の直後のポ
    ーズの挿入され易さを表す数値に基づいて当該単語境界
    にポーズを挿入するかどうかを判定する手段を備えるこ
    とを特徴とするポーズ挿入位置決定装置。
  2. 【請求項2】入力された文字列を音声に変換する際に、
    前記入力された文字列で表される文章をそれを構成する
    単語に分解し、分解された各単語の境界にポーズを挿入
    するかどうかを判定するポーズ挿入位置決定装置におい
    て、予め単語の直前にどの程度ポーズが挿入され易いか
    を表す数値を単語の品詞ごとに記憶する手段と、入力さ
    れた文字列で表される文章を構成する各単語の境界の直
    後の単語の品詞に応じた前記記憶された単語の直前のポ
    ーズの挿入され易さを表す数値に基づいて当該単語境界
    にポーズを挿入するかどうかを判定する手段を備えるこ
    とを特徴とするポーズ挿入位置決定装置。
  3. 【請求項3】入力された文字列を音声に変換する際に、
    前記入力された文字列で表される文章をそれを構成する
    単語に分解し、分解された各単語の境界にポーズを挿入
    するかどうかを判定するポーズ挿入位置決定装置におい
    て、予め単語の直後にどの程度ポーズが挿入され易いか
    を表す数値と、単語の直前にどの程度ポーズが挿入され
    易いかを表す数値とを、それぞれ単語の品詞ごとに記憶
    する手段と、入力された文字列で表される文章を構成す
    る各単語の境界の直前の単語の品詞に応じた前記記憶さ
    れた単語の直後のポーズの挿入され易さを表す数値と、
    当該単語境界の直後の単語の品詞に応じた前記記憶され
    た単語の直前のポーズの挿入され易さを表す数値とに基
    づいて当該単語境界にポーズを挿入するかどうかを判定
    する手段を備えることを特徴とするポーズ挿入位置決定
    装置。
JP1173445A 1989-07-04 1989-07-04 ポーズ挿入位置決定装置 Expired - Lifetime JP3001210B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP1173445A JP3001210B2 (ja) 1989-07-04 1989-07-04 ポーズ挿入位置決定装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP1173445A JP3001210B2 (ja) 1989-07-04 1989-07-04 ポーズ挿入位置決定装置

Publications (2)

Publication Number Publication Date
JPH0337700A JPH0337700A (ja) 1991-02-19
JP3001210B2 true JP3001210B2 (ja) 2000-01-24

Family

ID=15960609

Family Applications (1)

Application Number Title Priority Date Filing Date
JP1173445A Expired - Lifetime JP3001210B2 (ja) 1989-07-04 1989-07-04 ポーズ挿入位置決定装置

Country Status (1)

Country Link
JP (1) JP3001210B2 (ja)

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS59123889A (ja) * 1982-12-29 1984-07-17 富士通株式会社 音声編集合成処理方式

Also Published As

Publication number Publication date
JPH0337700A (ja) 1991-02-19

Similar Documents

Publication Publication Date Title
US5475796A (en) Pitch pattern generation apparatus
US6751592B1 (en) Speech synthesizing apparatus, and recording medium that stores text-to-speech conversion program and can be read mechanically
Chu et al. Locating boundaries for prosodic constituents in unrestricted Mandarin texts
JP3854713B2 (ja) 音声合成方法および装置および記憶媒体
JP4559950B2 (ja) 韻律制御規則生成方法、音声合成方法、韻律制御規則生成装置、音声合成装置、韻律制御規則生成プログラム及び音声合成プログラム
US20020095289A1 (en) Method and apparatus for identifying prosodic word boundaries
JPH05165486A (ja) テキスト音声変換装置
JP3001210B2 (ja) ポーズ挿入位置決定装置
JP3706758B2 (ja) 自然言語処理方法,自然言語処理用記録媒体および音声合成装置
KR100720175B1 (ko) 음성합성을 위한 끊어읽기 장치 및 방법
JP3076047B2 (ja) ポーズ挿入位置決定装置
Atterer et al. Integrating linguistic and performance-based constraints for assigning phrase breaks
KR100499116B1 (ko) 음성합성을 위한 끊어읽기 방법 및 그 장치
JPS6318457A (ja) 感情情報抽出装置
JP3006240B2 (ja) 音声合成方法および装置
Defina et al. Scaling processes of clause chains in Pitjantjatjara
JPH0962286A (ja) 音声合成装置および音声合成方法
JP3142160B2 (ja) 発音記号生成装置
JPH11249678A (ja) 音声合成装置およびそのテキスト解析方法
JPH03225400A (ja) ポーズ長決定方式
JP2748445B2 (ja) ポーズ挿入位置決定方式
JP4056647B2 (ja) 波形接続型音声合成装置および方法
KR0180650B1 (ko) 음성합성기의 한국어 문장분석방법
JP3364820B2 (ja) 合成音声出力方法及び装置
JPH08185197A (ja) 日本語解析装置、及び日本語テキスト音声合成装置

Legal Events

Date Code Title Description
FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20071112

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20081112

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20081112

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20091112

Year of fee payment: 10

EXPY Cancellation because of completion of term
FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20091112

Year of fee payment: 10