JPH07160284A - 音声合成装置 - Google Patents

音声合成装置

Info

Publication number
JPH07160284A
JPH07160284A JP5304009A JP30400993A JPH07160284A JP H07160284 A JPH07160284 A JP H07160284A JP 5304009 A JP5304009 A JP 5304009A JP 30400993 A JP30400993 A JP 30400993A JP H07160284 A JPH07160284 A JP H07160284A
Authority
JP
Japan
Prior art keywords
unit
prominence
voice
stand
imparting
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP5304009A
Other languages
English (en)
Other versions
JP3465326B2 (ja
Inventor
Kiyo Hara
紀代 原
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Holdings Corp
Original Assignee
Matsushita Electric Industrial Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Matsushita Electric Industrial Co Ltd filed Critical Matsushita Electric Industrial Co Ltd
Priority to JP30400993A priority Critical patent/JP3465326B2/ja
Publication of JPH07160284A publication Critical patent/JPH07160284A/ja
Application granted granted Critical
Publication of JP3465326B2 publication Critical patent/JP3465326B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Abstract

(57)【要約】 【目的】 本発明は、音声規則合成装置で卓立発声を実
現するもので、発声速度や発声内容を考慮して、卓立の
有無を決定したり、付属語の種類やポーズの有無、後続
文節の属性等に従って、卓立を実現するイントネーショ
ンパタンを選択することにより、自然性の高い合成音声
を提供する事を目的とする。 【構成】 発声速度設定手段6と、卓立を付与する卓立
付与手段1eを有し、発声速度にしたがって、卓立の頻
度を制御する。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、音声合成装置で利用さ
れる言語処理手法、特に卓立の付与に関するものであ
る。また、卓立を実現するイントネーション制御手法に
関する。
【0002】
【従来の技術】従来の音声規則合成装置としては、例え
ば、古井:ディジタル音声処理 p.146(東海大学出版会
1985)に示されている装置が知られている。図6はこ
の従来の音声合成装置の構成を示すブロック図である。
文字列入力端0には漢字かな混じり文が入力される。形
態素解析部1aでは、入力された漢字かな混じり文が辞
書1bを用いて形態素に分割され、各形態素の読み・ア
クセント型・品詞等が付与される。構文解析部1cで
は、形態素処理部1aで得られた各形態素の情報を用い
て文節の決定を行い、文節間の係受け解析を行う。読み
・アクセント処理部1dでは、アクセント句の決定、ア
クセント位置の決定、ポーズやイントネーション立て直
し位置の決定、読みの決定を行う。これら形態素処理部
1a、辞書1b、構文解析部1c、アクセント処理部1
dは、言語処理部1を構成している。音響処理部2で
は、言語処理部1で得られた読みとアクセントの情報に
基づいて合成パラメータを作成する。この合成パラメー
タとは、音声の大きさを決める振幅、声道の状態を決め
る声道記述パラメータ(PARCOR係数やホルマント
周波数など)、声帯の状態を決める有声/無声判定フラ
グ、声の高さを決める基本周波数等がある。合成処理部
3は、音響処理部2で得られた合成パラメータ列を音声
波形に変換し、合成音出力端4に音声波形を得る。
【0003】
【発明が解決しようとする課題】音声規則合成装置は、
WP文章の読み合わせや公共案内放送等いろいろな分野
で利用されつつある。合成された音声の個々の音節が理
解できるという明瞭性の観点からは、かなり実用レベル
に迫ってきている。しかしながら、同じモーラ数、アク
セント型ならば、いつも同じイントネーションが付与さ
れたり自然性という観点からは、非常に単調で機械的で
あるといわざるを得ない。
【0004】例えば、「勉強するようにしなければなら
ない。」という文章を発話した場合、助詞の「ば」が強
調されて発声されることが多い。文章の内容や発話意図
によって、発話者が、文章のある部分を強調して発声す
るという「卓立」とよばれるこの現象は、文章の了解性
や自然性を向上させる等の効果があり、自然な発話で
は、しばしば観察される。
【0005】本発明は、かかる従来技術の課題に鑑みて
なされたもので、発声速度や発話内容に従って、付属語
部分の卓立発声を取り入れる事により、規則合成音の単
調性をなくし、了解性の高い規則合成音を提供すること
を目的としている。
【0006】
【課題を解決するための手段】本発明は、テキストを入
力するテキスト入力手段と、入力されたテキストを形態
素に分割する形態素解析手段と、前記形態素解析手段で
参照する辞書情報を格納した辞書手段と、読みやアクセ
ントを付与する読み・アクセント付与手段と、音声を合
成する音声合成手段とを備えた音声合成装置に於て、合
成音声の発声速度を設定する発声速度設定手段と、卓立
(助詞の強調)の有無を付与する卓立付与手段を有し、
前記発声速度選択手段で選択された発声速度にしたがっ
て前記卓立手段で卓立の有無を決定することを特徴とす
る音声合成装置である。
【0007】
【作用】本発明では、発声速度が設定可能な音声合成装
置において、設定された発声速度にしたがって、発声速
度が遅い場合には、付属語の卓立の出現頻度を高くし、
発声速度が早い場合には、卓立の出現頻度を低くするこ
とにより、自然性の高い高品質な合成音を提供する。
【0008】また、発話の内容を設定可能な音声合成装
置において、発話内容が解説や社説、天気予報などの場
合には付属語卓立の出現頻度を高くし、小説や詩などの
場合には、卓立の出現頻度を低くする事により、了解性
の高い合成音を提供する。
【0009】また、卓立の付与された文節のイントネー
ション・パタンを生成する際には、卓立された付属語の
種類によって卓立の種類を分類し、その種類によってイ
ントネーション・パタンを選択することにより、自然な
卓立表現を実現し、自然性の高い合成音を提供する。
【0010】また、卓立された付属語の種類と、その付
属語に後続するポーズの有無によって卓立の種類を分類
し、その種類によってイントネーション・パタンを選択
することにより、自然な卓立表現を実現し、自然性の高
い合成音を提供する。
【0011】また、卓立された付属語の種類と、その付
属語に後続する文節の種類によって卓立の種類を分類
し、その種類によってイントネーション・パタンを選択
することにより、自然な卓立表現を実現し、自然性の高
い合成音を提供する。
【0012】
【実施例】
(実施例1)図1は、本発明を利用した音声合成装置の
一実施例を利用した音声合成装置の構成を示すブロック
図であって、以下にその構成をその作用とともに説明す
る。文字列入力端0には漢字かな混じり文が入力され
る。形態素解析部1aでは、入力された漢字かな混じり
文は辞書1bを用いて形態素に分割され、各形態素の読
み・アクセント型・品詞等が付与される。構文解析部1
cでは、形態素処理部1aで得られた各形態素の情報を
用いて文節の決定を行い、文節間の係受け解析を行う。
読み・アクセント処理部1dでは、アクセント句の決
定、アクセント位置の決定、ポーズやイントネーション
立て直し位置の決定、読みの決定を行う。卓立付与部1
eは、卓立の有無を設定する手段であって、その作用に
ついては、後に詳述する。形態素処理部1a、辞書1
b、構文解析部1c、アクセント処理部1d,卓立付与
部1eで言語処理部1を構成している。発声速度設定部
6は、合成音の速さを設定する手段であって、5はその
設定情報の入力端子である。その選択情報は、卓立付与
部1eおよび音響処理部2へ入力されている。本実施例
では、非常に速い・速い・普通・遅い・非常に遅いの5
段階の速度設定が可能であるとする。
【0013】音響処理部2では、このような言語処理部
1で得られた読みとアクセントの情報に基づいて合成パ
ラメータを作成する。この合成パラメータは、音声の大
きさを決める振幅、声道の状態を決める声道記述パラメ
ータ(PARCOR係数やホルマント周波数など)、声
帯の状態を決める有声/無声判定フラグ、声の高さを決
める基本周波数等がある。合成処理部3は、音響処理部
2で得られた合成パラメータ列を音声波形に変換し、合
成音出力端4に音声波形を得る。本実施例では音響処理
部、合成処理部の方式については、特に限定しない。
【0014】各処理の詳細について実例を用いて説明す
る。「それは、自業自得です。」という文章が入力され
た場合について考える。形態素解析部1aにより入力文
章は以下のように形態素分割され、アクセントや読みの
情報を得る。また、ここで、「は」「です」に対して与
えられている結合アクセント型Aやbは、NHKアクセ
ント辞典・解説付録(日本放送出版会 1985年)に記載
されているもので、自立語と結合して文節を構成する際
の結合アクセント型を示したものである。また、各単語
のアクセント型は、アクセントのある音節位置を示した
ものである。自立語の結合アクセント型は、複合語のを
構成した場合のアクセント型を示す。卓立発声の可能性
は、この例では、格助詞「は」だけに設定されている。
さらに1c構文解析部により文節境界が決定され、文節
間の係受け(文節間距離)が決定される。本例では、文
節「それは」は、直後の文節にかかるので文節間距離は
1となる。読み・アクセント処理部1dでは、アクセン
ト句およびアクセント位置の決定、読みの決定を行う。
本例では、「それは」の部分は平板型、「自業自得で
す」の部分は、「で」の部分にアクセントのある7型と
なる。 (入力文章) 「それは、自業自得です。」 (形態素分割) それ/は/、/自業自得/です。
【0015】
【0016】 (文節間距離) 1 (アクセント句) それは、/ 自業自得です。
【0017】 (文節アクセント) 0 7 (言語処理部出力1)so re wa poz ji go o ji to ku de1 su (言語処理部出力2)so re wa' poz ji go o ji to ku de1 su ここで、poz はこの位置にポーズが挿入されイントネー
ションの立て直しが行れることを示す。ローマ字の音節
の後の数字[1]は、アクセントのある音節を、「’」
は、その音節が卓立されることを示す。
【0018】本実施例では、発声速度が、非常に速い・
速い・普通に設定されている場合には、卓立付与部1e
で卓立を設定し、言語処理部1は言語処理部出力2を結
果として出力する。発声速度が、遅い・非常に遅いの場
合には、卓立付与部1eで卓立なしと設定し、言語処理
部出力1が出力される。
【0019】このように本実施例によれば、発声速度に
したがって、卓立の有無を設定することが出来、規則合
成音の機械的な単調さを軽減し、自然性の高い合成音を
提供することができる。
【0020】(実施例2)図2は、本発明を利用した音
声合成装置の第2の実施例の構成を示したブロック図で
ある。なお実施例1と共通する要素には、同一番号をつ
けている。発声速度設定端子5、発声速度設定部6に代
えて、発声内容選択端子7および発声内容選択部8を有
している。本実施例では、説明的・叙情的の2つの発声
内容を選択するものとする。発声内容が説明文、天気予
報、社説等の時に「説明的」と設定し、小説や詩の場合
に「叙情的」と設定する。このような文章を読み上げる
場合、「説明的」な文章では、助詞の卓立を利用して了
解性を確保し、「叙情的」な文章では、その他の手法
(単語の強調やイントネーションのダイナミックレンジ
の増加など)を用いて効果的な朗読を実現する。従っ
て、同じ付属語でも、説明的な文章では卓立されやすく
なり、叙情的な文章では卓立が起こりにくくなる。本実
施例では、発声内容をあらかじめ設定し、その設定に従
って卓立の頻度を制御する事により、発声内容にあった
了解性、自然性の高い合成音を提供できる。
【0021】(実施例3)図3は、本発明を利用した音
声合成装置の第3の実施例の構成を示したブロック図で
ある。なお実施例1と共通する要素には、同一番号をつ
けている。発声速度設定端子5、発声速度設定部6を有
せず、言語処理部1内に、卓立分類部1fを有する。卓
立分類部1fでは、卓立付与部1eで卓立の設定された
付属語の種類に従って、卓立の種類を決める。卓立を実
際の合成音声で実現するためには、合成のための音響パ
ラメータ(基本周波数、振幅、ホルマント周波数など)
を制御する必要がある。図4は、音響処理部2の構成を
示したブロック図である。音響処理部2は、基本周波数
や各音韻の時間長、振幅などを制御する韻律制御部2a
と、声帯に関するパラメータであるホルマント周波数等
制御する音韻処理部2bから構成される。本実施例で
は、基本周波数を制御して卓立の実現する。卓立が付与
されている場合には、卓立パタンテーブル2cを参照し
て、基本周波数パタンの加工を行なう。図5に卓立パタ
ンテーブルを示す。タイプ1は、卓立の付与された音節
の開始位置まで下降し、卓立のある音節内で、基本周波
数を上昇させる。タイプ2は、卓立のある音節の開始位
置まで下降し、不連続に上昇した後再度下降する。卓立
の付与される付属語に基本周波数パタンを選択するため
の分類を保持しておき、卓立分類部1fで、その保持さ
れた情報に従って、卓立のタイプを決定する。例えば、
「は」「を」は、分類1となり、「ば」は分類2、「こ
そ」は分類3となる。分類1は基本周波数パタン・タイ
プ1を、分類2、3はタイプ2を採用する。このよう
に、卓立を受ける付属語の種類によって、卓立を実現す
るための基本周波数パタンを選択することにより、自然
な卓立を実現し、高品質の合成音を提供する事が出来
る。
【0022】(実施例4)図3は、本発明を利用した音
声合成装置の第4の実施例の構成を示したブロック図で
もある。卓立分類部1fでは、付属語に付与された卓立
タイプに加えて、卓立を受ける付属語の直後にポーズ
(休止部分)が付与されているかどうかを利用して、卓
立のタイプを決定する。決定手法は以下の通りである。
【0023】 付属語の分類 ポーズあり ポーズなし 1 1 1 2 1 2 3 2 2 すなわち、付属語のタイプが2であっても、直後にポー
ズがない場合は、基本周波数パタンは、タイプ1が利用
される。このように、卓立を受ける助詞の種類とポーズ
の有無によって、卓立を実現するための基本周波数パタ
ンを選択することにより、自然な卓立を実現し、高品質
の合成音を提供する事が出来る。
【0024】(実施例5)図3は、本発明を利用した音
声合成装置の第5の実施例の構成を示したブロック図で
もある。卓立分類部1fでは、付属語に付与された卓立
タイプに加えて、後続する文節の属性に従って卓立のタ
イプを決定する。後続する文節が、新規情報を持つ場合
はタイプ1の卓立表現になるが、新規情報がどうかを判
断するのは困難なので、それに代わる判定法として、後
続文節の属性を利用する。決定手法は以下の通りであ
る。
【0025】 すなわち、付属語のタイプが2であっても、直後が動詞
句でない場合は、基本周波数パタンは、タイプ1が利用
される。このように、卓立を受ける助詞の種類と後続文
節の属性によって、卓立を実現するための基本周波数パ
タンを選択することにより、自然な卓立を実現し、高品
質の合成音を提供する事が出来る。
【0026】なお、本発明の各手段は、コンピュータを
用いてソフトウエア的に実現し、あるいは、それら各機
能を有する専用のハード回路を用いて実現してもかまわ
ない。
【0027】
【発明の効果】以上のように本発明によれば、発声速度
や発声内容といった各種要因に応じて卓立の付与を制御
することにより、卓立表現を効果的に用いることが出来
る。また、卓立を受ける付属語の種類やポーズの有無、
後続文節の属性などから、卓立を表現する基本周波数パ
タンを選択する事により、合成音声で自然な卓立を表現
する。以上のことにより、規則合成音の機械的な単調さ
を軽減し、了解性・自然性の高い効果的な合成音を提供
することが出来る。
【図面の簡単な説明】
【図1】本発明実施例1の音声合成装置の構成を示すブ
ロック図
【図2】本発明実施例2の音声合成装置の構成を示すブ
ロック図
【図3】本発明実施例3の音声合成装置の構成を示すブ
ロック図
【図4】本発明実施例3の音声合成装置の音響処理部の
構成を示すブロック図
【図5】本発明実施例3の音声合成装置の卓立の基本周
波数パタンを示す図
【図6】従来例の音声合成装置の構成を示すブロック図
【符号の説明】
0 テキスト入力端 1 言語処理部 1a 形態素解析部 1b 辞書 1c 構文解析部 1d 読み・アクセント処理部 1e 卓立付与部 1f 卓立分類部 2 音響処理部 2a 韻律制御部 2b 音韻処理部 2c 卓立パタンテーブル 3 合成処理部 4 合成音出力端 5 発声速度入力端 6 発声速度設定部 7 発声内容設定入力端 9 発声内容設定部

Claims (5)

    【特許請求の範囲】
  1. 【請求項1】テキストを入力するテキスト入力手段と、
    入力されたテキストを形態素に分割する形態素解析手段
    と、前記形態素解析手段で参照する辞書情報を格納した
    辞書手段と、読みやアクセントを付与する読み・アクセ
    ント付与手段と、音声を合成する音声合成手段とを備え
    た音声合成装置に於て、合成音声の発声速度を設定する
    発声速度設定手段と、卓立(助詞の強調)の有無を付与
    する卓立付与手段を有し、前記発声速度選択手段で選択
    された発声速度にしたがって前記卓立手段で卓立の有無
    を決定することを特徴とする音声合成装置。
  2. 【請求項2】テキストを入力するテキスト入力手段と、
    入力されたテキストを形態素に分割する形態素解析手段
    と、前記形態素解析手段で参照する辞書情報を格納した
    辞書手段と、読みやアクセントを付与する読み・アクセ
    ント付与手段と、音声を合成する音声合成手段とを備え
    た音声合成装置に於て、発声内容の種類を選択する発声
    内容設定手段と、卓立(助詞の強調)の有無を付与する
    卓立付与手段を有し、前記発声内容設定手段で設定され
    た発話内容にしたがって前記卓立付与手段で卓立の有無
    を決定することを特徴とする音声合成装置。
  3. 【請求項3】テキストを入力するテキスト入力手段と、
    入力されたテキストを形態素に分割する形態素解析手段
    と、前記形態素解析手段で参照する辞書情報を格納した
    辞書手段と、読みやアクセントを付与する読み・アクセ
    ント付与手段と、卓立の有無を付与する卓立付与手段
    と、卓立の種類を設定する卓立分類手段と、音声を合成
    する音声合成手段とを備えた音声合成装置に於て、前記
    音声合成手段は、卓立を実現するための韻律制御手段を
    含み、該韻律制御手段は、卓立の種類に従って複数のイ
    ントネーションパタンを選択することを特徴とする音声
    合成装置。
  4. 【請求項4】テキストを入力するテキスト入力手段と、
    入力されたテキストを形態素に分割する形態素解析手段
    と、前記形態素解析手段で参照する辞書情報を格納した
    辞書手段と、読みやアクセントを付与する読み・アクセ
    ント付与手段と、卓立の有無を付与する卓立付与手段
    と、卓立の種類を設定する卓立分類手段と、音声を合成
    する音声合成手段とを備えた音声合成装置に於て、前記
    音声合成手段は、卓立を実現するための韻律制御手段を
    含み、前記卓立分類手段では付属語の種類と後続するポ
    ーズの有無によって卓立の種類を設定することを特徴と
    する音声合成装置。
  5. 【請求項5】テキストを入力するテキスト入力手段と、
    入力されたテキストを形態素に分割する形態素解析手段
    と、前記形態素解析手段で参照する辞書情報を格納した
    辞書手段と、読みやアクセントを付与する読み・アクセ
    ント付与手段と、卓立の有無を付与する卓立付与手段
    と、卓立の種類を設定する卓立分類手段と、音声を合成
    する音声合成手段とを備えた音声合成装置に於て、前記
    音声合成手段は、卓立を実現するための韻律制御手段を
    含み、前記卓立分類手段では付属語の種類と後続する文
    節の属性によって卓立の種類を設定することを特徴とす
    る音声合成装置。
JP30400993A 1993-12-03 1993-12-03 音声合成装置 Expired - Fee Related JP3465326B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP30400993A JP3465326B2 (ja) 1993-12-03 1993-12-03 音声合成装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP30400993A JP3465326B2 (ja) 1993-12-03 1993-12-03 音声合成装置

Related Child Applications (1)

Application Number Title Priority Date Filing Date
JP2003191954A Division JP3722136B2 (ja) 2003-07-04 2003-07-04 音声合成装置

Publications (2)

Publication Number Publication Date
JPH07160284A true JPH07160284A (ja) 1995-06-23
JP3465326B2 JP3465326B2 (ja) 2003-11-10

Family

ID=17927970

Family Applications (1)

Application Number Title Priority Date Filing Date
JP30400993A Expired - Fee Related JP3465326B2 (ja) 1993-12-03 1993-12-03 音声合成装置

Country Status (1)

Country Link
JP (1) JP3465326B2 (ja)

Also Published As

Publication number Publication date
JP3465326B2 (ja) 2003-11-10

Similar Documents

Publication Publication Date Title
US8219398B2 (en) Computerized speech synthesizer for synthesizing speech from text
Isewon et al. Design and implementation of text to speech conversion for visually impaired people
US6751592B1 (en) Speech synthesizing apparatus, and recording medium that stores text-to-speech conversion program and can be read mechanically
JPH086591A (ja) 音声出力装置
JP3465326B2 (ja) 音声合成装置
Javkin et al. A multilingual text-to-speech system
JP3722136B2 (ja) 音声合成装置
JPH0580791A (ja) 音声規則合成装置および方法
JPH037995A (ja) 歌音声合成データの作成装置
JP3113101B2 (ja) 音声合成装置
JP2703253B2 (ja) 音声合成装置
JP3397406B2 (ja) 音声合成装置及び音声合成方法
JPH096378A (ja) テキスト音声変換装置
JPH01321496A (ja) 音声合成装置
JPH06168265A (ja) 言語処理装置および音声合成装置
JPH06214585A (ja) 音声合成装置
JPH07199981A (ja) アクセント付与装置
JPH06318093A (ja) 音声合成装置及び読み付与装置
JPH05204390A (ja) アクセント付与装置及び音声合成装置
JPH09292897A (ja) 音声合成装置
JPH06118981A (ja) 音声合成装置
JPH07134713A (ja) 音声合成装置
JPH0667684A (ja) 音声合成装置
JPH06161493A (ja) 音声合成装置の長音処理方式
JP2002297174A (ja) テキスト音声合成装置

Legal Events

Date Code Title Description
LAPS Cancellation because of no payment of annual fees