JPH05298364A - 発音記号生成方式 - Google Patents
発音記号生成方式Info
- Publication number
- JPH05298364A JPH05298364A JP4096191A JP9619192A JPH05298364A JP H05298364 A JPH05298364 A JP H05298364A JP 4096191 A JP4096191 A JP 4096191A JP 9619192 A JP9619192 A JP 9619192A JP H05298364 A JPH05298364 A JP H05298364A
- Authority
- JP
- Japan
- Prior art keywords
- language
- character string
- phonetic symbol
- phonetic
- unit
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Withdrawn
Links
Landscapes
- Machine Translation (AREA)
- Document Processing Apparatus (AREA)
Abstract
(57)【要約】
【目的】入力した文章を音声に変換して出力する文−音
声変換装置における発音記号生成方式に関し、入力文章
中に含まれるさまざまな言語の文字列を、正しい読みに
変換し、出力する手段を提供することを目的とする。 【構成】入力文に含まれる外国語文字列が、いずれの外
国語に属するものであるかを判定する言語判定手段と、
この言語判定手段によって定まる言語毎に設ける、ある
外国語文字列を、その外国語での発音を示す記号に変換
する手段と、外国語での発音を示す記号を、自国語での
発音を示す記号に変換する手段とを具備することにより
構成する。
声変換装置における発音記号生成方式に関し、入力文章
中に含まれるさまざまな言語の文字列を、正しい読みに
変換し、出力する手段を提供することを目的とする。 【構成】入力文に含まれる外国語文字列が、いずれの外
国語に属するものであるかを判定する言語判定手段と、
この言語判定手段によって定まる言語毎に設ける、ある
外国語文字列を、その外国語での発音を示す記号に変換
する手段と、外国語での発音を示す記号を、自国語での
発音を示す記号に変換する手段とを具備することにより
構成する。
Description
【0001】
【産業上の利用分野】本発明は、入力した文章を音声に
変換して出力する文−音声変換装置に係り、特に、文−
音声変換装置中、入力した文章中に含まれる外国語文字
列の読みを、正しく音声出力するために必要な発音記号
生成方式に関する。
変換して出力する文−音声変換装置に係り、特に、文−
音声変換装置中、入力した文章中に含まれる外国語文字
列の読みを、正しく音声出力するために必要な発音記号
生成方式に関する。
【0002】
【従来の技術】図3に、文−音声変換装置が行なう一般
的な処理の流れを示す。図3に示す文−音声変換装置
は、前処理部40と、言語処理部41と、発音記号生成
部42と、韻律記号生成部43と、f0パタン生成部4
4と、音響パラメータ部45と、波形生成部46と、音
声出力部47とを有して構成されている。
的な処理の流れを示す。図3に示す文−音声変換装置
は、前処理部40と、言語処理部41と、発音記号生成
部42と、韻律記号生成部43と、f0パタン生成部4
4と、音響パラメータ部45と、波形生成部46と、音
声出力部47とを有して構成されている。
【0003】図3において、前処理部40は、入力文章
中の数字、略語、記号等の読みを決定する。言語処理部
41は、イントネーション制御に必要な品詞および文法
(意味)構造を入力文章から抽出する。発音記号生成部
42は、入力した文字列を、その文字列の発音を示す発
音記号に変換する。
中の数字、略語、記号等の読みを決定する。言語処理部
41は、イントネーション制御に必要な品詞および文法
(意味)構造を入力文章から抽出する。発音記号生成部
42は、入力した文字列を、その文字列の発音を示す発
音記号に変換する。
【0004】韻律記号生成部43は、これまでの処理で
得られた情報に基づいて、イントネーションやアクセン
トを制御するための記号を生成する。f0パタン生成部
44は、韻律記号に基づいて、基本周波数パターンを生
成する。音響パラメータ生成部45は、各発音記号に対
応する物理的なパラメータ時系列(たとえば、PARC
OR,LSP,フォルマント)を生成する。
得られた情報に基づいて、イントネーションやアクセン
トを制御するための記号を生成する。f0パタン生成部
44は、韻律記号に基づいて、基本周波数パターンを生
成する。音響パラメータ生成部45は、各発音記号に対
応する物理的なパラメータ時系列(たとえば、PARC
OR,LSP,フォルマント)を生成する。
【0005】音声波形生成部46は、音響パラメータ時
系列に基づいて、音声波形を生成する。音声出力部47
は、音響波形生成部46が生成した音声波形を音声出力
する。本発明は、上述した発音記号生成部42における
処理方式に関するものであり、特に、入力文章中に含ま
れる外国語文字列の取り扱いに係る。
系列に基づいて、音声波形を生成する。音声出力部47
は、音響波形生成部46が生成した音声波形を音声出力
する。本発明は、上述した発音記号生成部42における
処理方式に関するものであり、特に、入力文章中に含ま
れる外国語文字列の取り扱いに係る。
【0006】図4に、従来の発音記号生成方式を示す。
図中、形態素解析部60と、単語辞書61と、辞書検索
結果判断部62と、アルファベット判定部63と、アル
ファベット読み決定部64と、アルファベット読みテー
ブル65と、デフォルト処理部66と、発音記号生成部
67とが示されている。
図中、形態素解析部60と、単語辞書61と、辞書検索
結果判断部62と、アルファベット判定部63と、アル
ファベット読み決定部64と、アルファベット読みテー
ブル65と、デフォルト処理部66と、発音記号生成部
67とが示されている。
【0007】図4において、形態素解析部60は、入力
文字列を単語辞書61に基づいて、意味のある最小単位
である形態素に分解する。辞書検索結果判断部62は、
この形態素への分解が成功したかどうかを判断する。成
功した場合には、発音記号生成部67が、単語辞書を参
照することにより、各形態素に、その読みを示す発音記
号を割り付ける。
文字列を単語辞書61に基づいて、意味のある最小単位
である形態素に分解する。辞書検索結果判断部62は、
この形態素への分解が成功したかどうかを判断する。成
功した場合には、発音記号生成部67が、単語辞書を参
照することにより、各形態素に、その読みを示す発音記
号を割り付ける。
【0008】単語辞書61は、各形態素の読みやアクセ
ントなどの音韻に関する情報及び品詞や、他の形態素と
の接続の強さなどを表わす文法に関する情報を格納して
いる。形態素解析部60による形態素解析の際、単語辞
書61に登録されていない単語が見つかった場合、入力
文字列から形態素への分解は失敗となる。
ントなどの音韻に関する情報及び品詞や、他の形態素と
の接続の強さなどを表わす文法に関する情報を格納して
いる。形態素解析部60による形態素解析の際、単語辞
書61に登録されていない単語が見つかった場合、入力
文字列から形態素への分解は失敗となる。
【0009】この場合、アルファベット判定部63は、
その文字列がアルファベットの文字列であるか否かを判
定する。そして、その文字列がアルファベットの文字列
であれば、アルファベット読み決定部64が、アルファ
ベット読みテーブル65を参照することによって、その
アルファベットの文字列の読みを決定する。
その文字列がアルファベットの文字列であるか否かを判
定する。そして、その文字列がアルファベットの文字列
であれば、アルファベット読み決定部64が、アルファ
ベット読みテーブル65を参照することによって、その
アルファベットの文字列の読みを決定する。
【0010】たとえば、入力文字列に”ON”という単
語が含まれていた場合において、単語辞書61に、”O
N”とその読みとが登録されていれば、”ON”は「オ
ン」という読みに変換される。一方、もし”ON”が単
語辞書61に登録されていなければ、アルファベット読
みテーブル65に基づいて、「オーエヌ」という読みが
得られる。
語が含まれていた場合において、単語辞書61に、”O
N”とその読みとが登録されていれば、”ON”は「オ
ン」という読みに変換される。一方、もし”ON”が単
語辞書61に登録されていなければ、アルファベット読
みテーブル65に基づいて、「オーエヌ」という読みが
得られる。
【0011】入力文字列が単語辞書61に登録されてい
ない場合であって、かつ、その文字列がアルファベット
の文字列でもない場合には、デフォルト処理部66が、
その文字列を無視する処理や、その文字列になんらかの
読みを割り付ける処理を行なう。
ない場合であって、かつ、その文字列がアルファベット
の文字列でもない場合には、デフォルト処理部66が、
その文字列を無視する処理や、その文字列になんらかの
読みを割り付ける処理を行なう。
【0012】
【発明が解決しようとする課題】このように、従来は、
単語辞書に登録されていない入力文字列を、場合によ
り、一文字ずつの読みとして音声出力するなどしてい
た。たとえば、上述した通り”ON”は、「オーエヌ」
という読みとして音声出力したりした。しかし、この
「オーエヌ」という音声出力は、それまで再生してきた
合成音声の文脈を壊してしまうので、合成音声理解の妨
げになるという問題点がある。
単語辞書に登録されていない入力文字列を、場合によ
り、一文字ずつの読みとして音声出力するなどしてい
た。たとえば、上述した通り”ON”は、「オーエヌ」
という読みとして音声出力したりした。しかし、この
「オーエヌ」という音声出力は、それまで再生してきた
合成音声の文脈を壊してしまうので、合成音声理解の妨
げになるという問題点がある。
【0013】もちろん、単語辞書に使用頻度の高い外国
語文字列を登録しておけば、登録してある文字列の読み
を正しく決定することは可能である。しかし、外国語の
文字列は事実上無限にあり、その全てを登録することは
不可能である。また、単語辞書の登録数を増やすと、単
語の参照に時間がかかるという問題点もある。
語文字列を登録しておけば、登録してある文字列の読み
を正しく決定することは可能である。しかし、外国語の
文字列は事実上無限にあり、その全てを登録することは
不可能である。また、単語辞書の登録数を増やすと、単
語の参照に時間がかかるという問題点もある。
【0014】本発明は、このような従来の問題点に鑑み
て為されたものであり、入力文章中に含まれるさまざま
な言語の文字列を、意味を捉えることができない一文字
ごとの読みではなく、意味のある文字列を単位とした読
みに正しく変換し、出力する文−音声変換装置を提供す
ることを目的とする。
て為されたものであり、入力文章中に含まれるさまざま
な言語の文字列を、意味を捉えることができない一文字
ごとの読みではなく、意味のある文字列を単位とした読
みに正しく変換し、出力する文−音声変換装置を提供す
ることを目的とする。
【0015】
【課題を解決するための手段】本発明によれば、上述の
目的は、前記特許請求の範囲に記載した手段にて達成さ
れる。
目的は、前記特許請求の範囲に記載した手段にて達成さ
れる。
【0016】すなわち、本発明は、文章を入力し、音声
を出力する文−音声変換装置において、入力文に含まれ
る外国語文字列が、いずれの外国語に属するものである
かを判定する言語判定手段と、この言語判定手段によっ
て定まる言語毎に設ける、ある外国語文字列を、その外
国語での発音を示す記号に変換する手段と、外国語での
発音を示す記号を、自国語での発音を示す記号に変換す
る手段とを具備する音声記号生成方式である。
を出力する文−音声変換装置において、入力文に含まれ
る外国語文字列が、いずれの外国語に属するものである
かを判定する言語判定手段と、この言語判定手段によっ
て定まる言語毎に設ける、ある外国語文字列を、その外
国語での発音を示す記号に変換する手段と、外国語での
発音を示す記号を、自国語での発音を示す記号に変換す
る手段とを具備する音声記号生成方式である。
【0017】図1は、本発明の原理説明図である。図1
に示す入力文字列を発音記号に変換する装置は、言語判
断部1と、規則選択部2と、各言語毎に設けてある発音
記号生成規則5〜7と、発音記号変換部3と、発音記号
マッピング部4と、発音記号マッピング規則8と、発音
記号生成部9と、発音記号生成規則10とを設けて構成
してある。
に示す入力文字列を発音記号に変換する装置は、言語判
断部1と、規則選択部2と、各言語毎に設けてある発音
記号生成規則5〜7と、発音記号変換部3と、発音記号
マッピング部4と、発音記号マッピング規則8と、発音
記号生成部9と、発音記号生成規則10とを設けて構成
してある。
【0018】
【作用】図1において、言語判断部1は、入力文字列の
言語判断を行なう。ここでの言語判断の結果、入力文字
列が自国語の文字列であれば、言語判断部1は、その文
字列をそのまま発音記号生成部9に送る。発音記号生成
部9は、この文字列を発音記号生成規則10に従って変
換し、発音記号を出力する。
言語判断を行なう。ここでの言語判断の結果、入力文字
列が自国語の文字列であれば、言語判断部1は、その文
字列をそのまま発音記号生成部9に送る。発音記号生成
部9は、この文字列を発音記号生成規則10に従って変
換し、発音記号を出力する。
【0019】一方、言語判断の結果、入力文字列が外国
語の文字列であれば、言語判断部1は、その文字列を規
則選択部2の方に送る。規則選択部2は、言語毎に設け
てある発音記号生成規則5〜7の中から、送られてきた
文字列の言語に対応した発音記号生成規則を選択する。
文字列−発音記号変換部3は、この規則選択部2が選択
した発音記号生成規則に従って、言語Xの文字列をその
言語での発音記号に変換する。
語の文字列であれば、言語判断部1は、その文字列を規
則選択部2の方に送る。規則選択部2は、言語毎に設け
てある発音記号生成規則5〜7の中から、送られてきた
文字列の言語に対応した発音記号生成規則を選択する。
文字列−発音記号変換部3は、この規則選択部2が選択
した発音記号生成規則に従って、言語Xの文字列をその
言語での発音記号に変換する。
【0020】続いて、発音記号マッピング部4は、発音
記号マッピング規則8に従って、文字列−発音記号変換
部3から受け取る外国語での発音記号を、自国語で使用
する発音記号にマッピングする。ところで、各発音記号
生成規則5〜7,10は、既存のものをそのまま用いる
ことができるので、特別な規則を新たに開発する必要は
ない。
記号マッピング規則8に従って、文字列−発音記号変換
部3から受け取る外国語での発音記号を、自国語で使用
する発音記号にマッピングする。ところで、各発音記号
生成規則5〜7,10は、既存のものをそのまま用いる
ことができるので、特別な規則を新たに開発する必要は
ない。
【0021】
【実施例】図2に、本発明の一実施例を示す。図2に示
す入力文字列を発音記号に変換する装置は、形態素解析
部20と、発音記号生成部21と、日本語単語辞書27
と、辞書検索結果判断部22と、言語判断部23と、規
則選択部24と、ハングル−発音記号変換規則28と、
アルファベット−発音記号変換規則29と、文字列−発
音記号変換部25と、発音記号マッピング部26と、発
音記号マッピング規則30とを有している。
す入力文字列を発音記号に変換する装置は、形態素解析
部20と、発音記号生成部21と、日本語単語辞書27
と、辞書検索結果判断部22と、言語判断部23と、規
則選択部24と、ハングル−発音記号変換規則28と、
アルファベット−発音記号変換規則29と、文字列−発
音記号変換部25と、発音記号マッピング部26と、発
音記号マッピング規則30とを有している。
【0022】図2において、形態素解析部20は、日本
語単語辞書27に基づいて、入力文字列を、意味のある
最小単位である形態素に分解する。日本語単語辞書27
には、各形態素の読みやアクセントなどの音韻に関する
情報及び品詞や、他の形態素との接続の強さなどを表わ
す文法に関する情報を格納している。
語単語辞書27に基づいて、入力文字列を、意味のある
最小単位である形態素に分解する。日本語単語辞書27
には、各形態素の読みやアクセントなどの音韻に関する
情報及び品詞や、他の形態素との接続の強さなどを表わ
す文法に関する情報を格納している。
【0023】発音記号生成部21は、この形態素解析結
果に基づき、日本語単語辞書27が格納している読みを
各形態素に割り付け、アクセント記号を含む発音記号を
生成する。辞書検索結果判断部22は、ここでの発音記
号の生成が成功したか否かを判断する。そして、単語が
辞書に登録されていて、発音記号の生成が成功していた
場合には、その発音記号を出力して処理を終了する。
果に基づき、日本語単語辞書27が格納している読みを
各形態素に割り付け、アクセント記号を含む発音記号を
生成する。辞書検索結果判断部22は、ここでの発音記
号の生成が成功したか否かを判断する。そして、単語が
辞書に登録されていて、発音記号の生成が成功していた
場合には、その発音記号を出力して処理を終了する。
【0024】一方、日本語単語辞書にはない入力文字列
があった場合には、言語判断部23が、その文字列が属
する言語の種類を推定する。規則選択部24は、この言
語判断部23が得た言語情報に基づいて、文字列−発音
記号変換規則の選択を行なう。図2の例では、ハングル
−発音記号変換規則28又はアルファベット−発音記号
変換規則29のいずれかを選択することになる。
があった場合には、言語判断部23が、その文字列が属
する言語の種類を推定する。規則選択部24は、この言
語判断部23が得た言語情報に基づいて、文字列−発音
記号変換規則の選択を行なう。図2の例では、ハングル
−発音記号変換規則28又はアルファベット−発音記号
変換規則29のいずれかを選択することになる。
【0025】なお、アルファベット−発音記号変換規則
の内容は、例えば、次に掲げる表のようになっている。
なお、この表の文字環境の欄において、”_”は、変換
対象文字の位置を示している。また、”C”は子音
を、”^”は単語の先頭を、”$”は単語末を、”
{A,B}”は ”A”または”B”を示している。
の内容は、例えば、次に掲げる表のようになっている。
なお、この表の文字環境の欄において、”_”は、変換
対象文字の位置を示している。また、”C”は子音
を、”^”は単語の先頭を、”$”は単語末を、”
{A,B}”は ”A”または”B”を示している。
【0026】
【0027】続いて、文字列−発音記号変換部25は、
規則選択部24が選択した発音記号変換規則に従って、
入力文字列をその言語での発音記号に変換する。発音記
号マッピング部26は、ここで得られた外国語での発音
記号を、発音記号マッピング規則30に従って自国語の
発音記号に変換する。以下、発音記号マッピング規則の
内容の一例を示す。
規則選択部24が選択した発音記号変換規則に従って、
入力文字列をその言語での発音記号に変換する。発音記
号マッピング部26は、ここで得られた外国語での発音
記号を、発音記号マッピング規則30に従って自国語の
発音記号に変換する。以下、発音記号マッピング規則の
内容の一例を示す。
【0028】
【0029】なお、上掲した発音記号マッピング規則を
用いた場合、最終的に出力される発音記号は、ローマ字
となる。
用いた場合、最終的に出力される発音記号は、ローマ字
となる。
【0030】
【発明の効果】以上説明したように、本発明によれば、
既存の外国語の発音規則をそのまま使用することによっ
て、入力する日本語文に多様な外国語の文字列が数多く
混在する場合であっても、その外国語の文字列からその
外国語での発音に近い日本語的な発音を得ることができ
るので、聴取者による合成音声の理解を妨げることのな
い音声出力を行なうことができるという利点がある。
既存の外国語の発音規則をそのまま使用することによっ
て、入力する日本語文に多様な外国語の文字列が数多く
混在する場合であっても、その外国語の文字列からその
外国語での発音に近い日本語的な発音を得ることができ
るので、聴取者による合成音声の理解を妨げることのな
い音声出力を行なうことができるという利点がある。
【図1】本発明の原理説明図である。
【図2】本発明の一実施例を示す図である。
【図3】文−音声変換処理を説明する図である。
【図4】従来の技術を示す図である。
1,23 言語判断部 2,24 規則選択部 3,25 文字列−発音記号変換部 4,26 発音記号マッピング部 5〜7,10 発音記号生成規則 8,30 発音記号マッピング規則 9,21,42,67 発音記号生成部 20,60 形態素解析部 22,62 辞書検索結果判断部 27 日本語単語辞書 28 ハングル−発音記号変換規則 29 アルファベット−発音記号変換規則 40 前処理部 41 言語処理部 43 韻律記号生成部 44 f0パタン生成部 45 音響パラメータ生成部 46 波形生成部 47 音声出力部 61 単語辞書 63 アルファベット判定部 64 アルファベット読み決定部 65 アルファベット読みテーブル 66 デフォルト処理部
Claims (1)
- 【請求項1】文章を入力し、音声を出力する文−音声変
換装置において、 入力文に含まれる外国語文字列が、いずれの外国語に属
するものであるかを判定する言語判定手段と、 この言語判定手段によって定まる言語毎に設ける、ある
外国語文字列を、その外国語での発音を示す記号に変換
する手段と、 外国語での発音を示す記号を、自国語での発音を示す記
号に変換する手段とを具備することを特徴とする発音記
号生成方式。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP4096191A JPH05298364A (ja) | 1992-04-16 | 1992-04-16 | 発音記号生成方式 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP4096191A JPH05298364A (ja) | 1992-04-16 | 1992-04-16 | 発音記号生成方式 |
Publications (1)
Publication Number | Publication Date |
---|---|
JPH05298364A true JPH05298364A (ja) | 1993-11-12 |
Family
ID=14158417
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP4096191A Withdrawn JPH05298364A (ja) | 1992-04-16 | 1992-04-16 | 発音記号生成方式 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JPH05298364A (ja) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2002023782A (ja) * | 2000-07-13 | 2002-01-25 | Sharp Corp | 音声合成装置および方法、情報処理装置、並びに、プログラム記録媒体 |
JP2017062475A (ja) * | 2012-03-02 | 2017-03-30 | アップル インコーポレイテッド | 名前発音システム及び方法 |
-
1992
- 1992-04-16 JP JP4096191A patent/JPH05298364A/ja not_active Withdrawn
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2002023782A (ja) * | 2000-07-13 | 2002-01-25 | Sharp Corp | 音声合成装置および方法、情報処理装置、並びに、プログラム記録媒体 |
JP2017062475A (ja) * | 2012-03-02 | 2017-03-30 | アップル インコーポレイテッド | 名前発音システム及び方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US6029132A (en) | Method for letter-to-sound in text-to-speech synthesis | |
US6076060A (en) | Computer method and apparatus for translating text to sound | |
EP1668628A1 (en) | Method for synthesizing speech | |
JP5198046B2 (ja) | 音声処理装置及びそのプログラム | |
JPH05298364A (ja) | 発音記号生成方式 | |
JPH11338498A (ja) | 音声合成装置 | |
Akinwonmi | Development of a prosodic read speech syllabic corpus of the Yoruba language | |
KR0173340B1 (ko) | 텍스트/음성변환기에서 억양패턴 정규화와 신경망 학습을 이용한 억양 생성 방법 | |
JPH096378A (ja) | テキスト音声変換装置 | |
JP2002123281A (ja) | 音声合成装置 | |
JPH04350699A (ja) | テキスト音声合成装置 | |
Kaur et al. | BUILDING AText-TO-SPEECH SYSTEM FOR PUNJABI LANGUAGE | |
JPH03245192A (ja) | 外国語単語の発音決定方法 | |
JPH04127199A (ja) | 外国語単語の日本語発音決定方法 | |
KR0136423B1 (ko) | 발음 제어 기호의 유효성 판정을 이용한 음운 변동 처리 방법 | |
JP2728440B2 (ja) | 音声出力装置 | |
JPH0760378B2 (ja) | 文章読み上げ装置 | |
JPH04199421A (ja) | 文書読上げ装置 | |
JP2888847B2 (ja) | 文章読み上げ装置とその方法及び言語処理装置とその方法 | |
JPH06176023A (ja) | 音声合成システム | |
JP2009098292A (ja) | 音声記号列生成方法、音声合成方法及び音声合成装置 | |
Granström et al. | A danish text-to-speech system using a text normalizer based on morph analysis. | |
JPH02234198A (ja) | テキスト音声合成システム | |
JPH07160685A (ja) | 文章読み上げ装置 | |
JPH07140999A (ja) | 音声合成装置及び音声合成方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A300 | Withdrawal of application because of no request for examination |
Free format text: JAPANESE INTERMEDIATE CODE: A300 Effective date: 19990706 |