JP3635230B2

JP3635230B2 - 音声合成装置および方法、情報処理装置、並びに、プログラム記録媒体

Info

Publication number: JP3635230B2
Application number: JP2000212826A
Authority: JP
Inventors: 慶子吹田; 浩幸勘座
Original assignee: Sharp Corp
Current assignee: Sharp Corp
Priority date: 2000-07-13
Filing date: 2000-07-13
Publication date: 2005-04-06
Anticipated expiration: 2020-07-13
Also published as: JP2002023782A

Description

【０００１】
【発明の属する技術分野】
この発明は、ある言語によるテキスト文中に出現する他の言語の文字列に自然な読みを付与できる音声合成装置およびその方法、上記音声合成装置を搭載した情報処理装置、並びに、音声合成処理プログラムを記録したプログラム記録媒体に関する。
【０００２】
【従来の技術】
従来より、日本語文章中に出現する英文字列を英単語と非英単語とに区別する技術として、特開平８‐２９２８７３号公報に開示された技術がある。この特開平８‐２９２８７３号公報に開示された技術においては、英文字列が大文字で終るならば英語略語とし、小文字で終るならば英単語とする。さらに、上記大文字で終る文字列の長さが所定の長さ以上である場合には英単語であるとし、所定の長さ未満である場合には非英単語であるとする。
【０００３】
そして、上記英単語であると判定された英文字列には、英語綴りの発音ルールに従って英単語読みが付与される。一方、非英語であると判定された英文字列には、英語略としての読みが付与される。つまり、１文字毎にアルファベット読みが付与されるのである。
【０００４】
【発明が解決しようとする課題】
しかしながら、上記従来の特開平８‐２９２８７３号公報に開示された日本語文章中の英文字列を英単語と非英単語とに区別する技術には、以下のような問題がある。すなわち、英文字列が大文字で終るか小文字で終るか、そして上記英文字列で終る場合の文字列の長さが所定の長さ以上である否かによって、英単語であるか非英単語であるかを判定するのであるが、英単語であるか非英単語の判別を、大文字で終るか小文字で終るかと文字列の長さとでは判別しきれるものではない。すなわち、長い英大文字列でも英語読みを行わない英文字列があり、英子文字列でも英語読みを行わない場合もある。
【０００５】
例えば、英語読みを行う英大文字列の長さを４文字以上と仮定した場合、ＡＢＣＤＥ(えーびーしーでぃーいー)やＡＤＰＣＤ(えーでぃーぴーしーえむ)のような５文字以上の非英単語や英語略語に、正しい読みを付与することができない。逆に、ＡＮＫ(あんく)のような４文字未満の英単語読みを行う英文字列の例もある。また、ｉｃｈｉｋａｗａ(いちかわ)のように、ローマ字読みを行う英文字列に対応することもできない。
【０００６】
そこで、この発明の目的は、ある言語によるテキスト文中の他の言語による対象文字列に対する単語と非単語との正しい判別を文字形状や文字長によらずに行って自然な読みを付与できる音声合成装置およびその方法、上記音声合成装置を搭載した情報処理装置、並びに、音声合成処理プログラムを記録したプログラム記録媒体を提供することにある。
【０００７】
【課題を解決するための手段】
上記目的を達成するため、第１の発明は、任意の言語によるテキスト文を形態素解析して読みを付与すると共に,音声合成制御パラメータを生成するテキスト解析手段と,上記音声合成制御パラメータに基づいて音声を合成する音声合成手段を有する音声合成装置において、単語の綴りを表す文字列における所定位置以降の所定文字数の連続した文字列から成る部分文字列が登録された文字列辞書と、上記テキスト解析手段によって上記テキスト文中から読み出された上記テキスト文の言語とは異なる言語による対象文字列における上記所定位置以降の上記所定文字数の連続した部分文字列の並びが , 上記文字列辞書に存在する場合には当該対象文字列は単語であると判定し , 上記文字列辞書に存在しない場合には当該対象文字列は非単語であると判定する単語判定手段と、上記単語判定手段によって単語であると判定された対象文字列に対して,発音規則に従って単語読みを付与する単語読み付与手段と、上記単語判定手段によって非単語であると判定された対象文字列に対して,一文字ずつアルファベット読みを付与するアルファベット読み付与手段を備えたことを特徴としている。
【０００８】
上記構成によれば、単語判定手段によって、テキスト解析手段によってテキスト文中から読み出された異なる言語による対象文字列の並び方に基づいて、単語であるか非単語であるかが判定される。こうして、文字の並び方が単語としての並び方である対象文字列のみが単語として判定され、従来のごとく、大文字であるか小文字であるか、大文字である場合は文字数が所定値以上か否か等によって判定する場合に比して、単語/非単語が正しく判定される。したがって、上記対象文字列に対して、単語/非単語の正しい判定結果に応じて、単語である場合には単語読みが付与される一方、非単語である場合にはアルファベット読みが付与されて、自然な読みが付与される。
【０００９】
さらに、上記対象文字列における所定位置以降の所定文字数の部分文字列を用いて辞書を引くことによって、上記対象文字列の文字の並び方に基づく単語 / 非単語の判定が簡単に短時間に行われる。
【００１０】
また、上記第１の発明の音声合成装置は、上記単語読み付与手段を、単語の綴りと読みとが対応付けられて成る上記発音規則の上記綴りに上記対象文字列あるいはその分割文字列が該当するか否かを調べ、上記対象文字列そのものが該当する場合には該当する綴りに対応付けられている読みを、また、上記分割文字列が該当する場合には該当する綴りに対応付けられている読みを繋ぎ合わせて、上記単語読みとして付与するようになすことが望ましい。
【００１１】
上記構成によれば、単語の綴りと読みとを対応付けた発音規則に上記対象文字列あるいはその分割文字列が該当するか否かを調べるだけで、簡単に単語読みが付与される。また、上記対象文字列が長い場合でも、上記対象文字列を分割文字列に分けて得られた読みを繋ぎ合わせることによって、簡単に単語読みが付与される。
【００１２】
また、上記第１の発明の音声合成装置は、上記テキスト解析手段によって上記テキスト文中から読み出された上記テキスト文の言語とは異なる言語による対象文字列が単語辞書に在るか否かを上記単語辞書を引いて判定し,在る場合には上記単語辞書に記載された辞書読みを付与する辞書引き手段と、上記辞書引き手段による処理の結果上記辞書読みが付与されなかった対象文字列を判別する辞書読み未付与対象文字列判別手段と、上記辞書読み未付与対象文字列判別手段の判別結果に応じて,上記単語判定手段に,上記辞書読みが付与されなかった対象文字列に対する上記単語と非単語との判定を行わせる単語判定指令手段を備えることが望ましい。
【００１３】
上記構成によれば、上記単語判定手段による対象文字列の単語/非単語の判定に先立って、辞書引き手段によって単語辞書が引かれて、単語辞書に登録されている単語にはより正確な辞書読みが付与される。
【００１４】
また、上記第１の発明の音声合成装置は、上記テキスト文の言語を日本語であるとし、上記単語判定手段による単語と非単語との判定に先だって , あるいは , 上記単語判定手段による非単語の判定の後に ,上記対象文字列が,ローマ字読みが可能であるか否かを判定するローマ字読み判定手段と、上記ローマ字読みが可能である判定された対象文字列に対してローマ字読みを付与するローマ字読み付与手段を備え、ローマ字読みが付与されない対象文字列に対して、上記単語判定手段による単語と非単語との判定、あるいは、上記アルファベット読み付与手段によるアルファベット読みの付与を行うことが望ましい。
【００１５】
日本語による上記テキスト文がメール文である場合には、そのヘッダにおけるアドレス行にはローマ字表記による差出人名が記載されている。上記構成によれば、ローマ字読み判定手段によって、ローマ字読みが可能であるか否かが判定される。そして、上記ローマ字読みが可能である場合には、ローマ字読み付与手段によってローマ字読みが付与される。したがって、ローマ字表記の人名が記載されたメール文等に対しても対処可能となる。
【００１６】
また、上記第１の発明の音声合成装置は、上記単語判定手段による単語と非単語との判定に先だって ,上記対象文字列の文字数を測定する文字列長測定手段を備えると共に、上記単語判定手段を,上記文字列長測定手段による測定結果を受けて ,上記対象文字列の文字数が所定値以上である場合にのみ上記単語と非単語との判定を行う一方,上記所定値に満たない場合には非単語であると判定して判定結果を上記アルファベット読み付与手段に送出するようになすことが望ましい。
【００１７】
上記構成によれば、文字列長測定手段によって測定された対象文字列の文字数が所定値に満たない場合には、上記単語判定手段によって、当該対象文字列は非単語であり且つ略語であると自動的に判定される。こうして、上記アルファベット表記文字列の判定が上記文字列辞書や単語辞書等の辞書引きを省略して行われて、処理の簡略化と時間の短縮とが図られる。
【００１８】
また、上記第１の発明の音声合成装置は、上記対象文字列中の特定記号及びその特定記号の配列に基づいて上記対象文字列中における特定文字領域を抽出し、抽出結果を上記ローマ字読み判定手段あるいはアルファベット読み付与手段に送出する特定文字領域抽出手段を備えることが望ましい。
【００１９】
電子メールの送信元アドレスが記述されているFrom行には、特定記号「From：」,「＜」,「＠」,「＞」がこの順で出現する。そして、特定記号「From：」,「＜」間と特定記号「＜」,「＠」間とには、送信者名を日本においてはローマ字で記載するようになっている。上記構成によれば、特定文字領域抽出手段によって、上記対象文字列中における特定記号「From：」,「＜」間と特定記号「＜」,「＠」間とが特定文字領域として抽出されて、上記ローマ字読み判定手段に送出される。
【００２０】
したがって、上記電子メールの送信元アドレスにローマ字で記述された送信者名が、上記文字列辞書や単語辞書等の辞書引きを行うことなくローマ字表記であると判定されて、処理の簡略化と迅速化とが図られる。これは、特定記号の間にアルファベット表示の文字列を配置する場合も同様である。
【００２１】
また、第２の発明は、任意の言語によるテキスト文を形態素解析して読みを付与すると共に,音声合成制御パラメータを生成し,上記音声合成制御パラメータに基づいて音声を合成する音声合成方法において、単語の綴りを表す文字列における所定位置以降の所定文字数の連続した文字列から成る部分文字列が登録された文字列辞書を参照して ,上記テキスト文中から読み出された上記テキスト文の言語とは異なる言語による対象文字列における上記所定位置以降の上記所定文字数の連続した部分文字列の並びが , 上記文字列辞書に存在する場合には当該対象文字列は単語であると判定し , 上記文字列辞書に存在しない場合には当該対象文字列は非単語であると判定するステップと、上記単語であると判定された対象文字列に対して,発音規則に従って単語読みを付与するステップと、上記非単語であると判定された対象文字列に対して,一文字ずつアルファベット読みを付与するステップを備えたことを特徴としている。
【００２２】
上記構成によれば、テキスト文中から読み出された異なる言語による対象文字列の並び方に基づいて、当該対象文字列が単語であるか非単語であるかが判定される。こうして、従来のごとく、大文字であるか小文字であるか、大文字である場合は文字数が所定値以上か否か等によって判定する場合に比して、単語/非単語とが正しく判定されて、上記対象文字列に自然な読みが付与される。
【００２３】
さらに、上記対象文字列における所定位置以降の所定文字数の部分文字列を用いて辞書を引くことによって、上記対象文字列の文字の並び方に基づく単語 / 非単語の判定が簡単に短時間に行われる。
【００２４】
また、第３の発明の情報処理装置は、上記第１の発明の音声合成装置が搭載されていることを特徴としている。
【００２５】
上記構成によれば、文字表示領域が狭い携帯端末型の情報処理装置において電子メールやインターネット情報の内容を合成音声出力によって知る場合に、電子メールやインターネット情報の内容によく出現するアルファベット表記の英単語や英語略語あるいはローマ字表記を含むアドレス等が、単語であるか非単語であるか、非単語である場合にはアルファベット表記であるかローマ字表記であるかが正しく判定される。その結果、上記正しい判定結果に従って、上記対象文字列に対して自然な読みが付与される。
【００２６】
また、第４の発明のプログラム記録媒体は、コンピュータを、上記第１の発明におけるテキスト解析手段,音声合成手段,単語判定手段,単語読み付与手段およびアルファベット読み付与手段として機能させる音声合成処理プログラムが記録されていることを特徴としている。
【００２７】
上記構成によれば、上記第１の発明の場合と同様に、テキスト文中から読み出された異なる言語による対象文字列の並び方に基づいて、当該対象文字列が単語であるか非単語であるかが正しく判定される。こうして、上記対象文字列に自然な読みが付与される。
【００２８】
【発明の実施の形態】
以下、この発明を図示の実施の形態により詳細に説明する。
＜第１実施の形態＞
図１は、本実施の形態の音声合成装置における概略ブロック図である。図１において、テキスト解析部１は、入力された日本語によるテキスト文を形態素解析して英文字列を読み出す。さらに、上記形態素解析の結果得られた個々の形態素の辞書引き等を行う。そして、上記形態素解析の結果に基づいて、テキスト文を構成する文字列に読みを付与し、韻律情報等の音声合成に必要な情報(音声合成制御パラメータ)を生成する。音声合成部２は、上記音声合成制御パラメータに基づいて音声合成処理を行い、スピーカー等で構成される出力部３から合成音声として出力する。
【００２９】
単語判定部４は、上記テキスト解析部１で読み出された英文字列に対して文字列辞書７を引き、後に詳述するような単語判定を行う。さらに、単語判定部４は単語読み付与部６を有し、単語発音規則表８を引いて、後に詳述するような発音ルールに従って英単語読みを付与する。アルファベット読み付与部５は、単語判定部４の判定結果に基づいて、アルファベット読み表９を引いて、単語ではない英文字列に対して１文字ずつのアルファベットの読みを付与する。
【００３０】
尚、本実施の形態においては、上記テキスト文の言語は日本語であり、テキスト文中に出現する対象文字列の言語は英語であり、上記対象文字列の文字はアルファベットであるとして説明する。しかしながら、この発明における上記対象文字列の言語および文字は上述の英語およびアルファベットに限定されるものではなく、テキスト解析部１用の辞書(図示せず)や単語判定部４用の文字列辞書７として該当する言語用の辞書を用意するだけで、他の言語の文字列にも容易に対処することができる。
【００３１】
図２は、図１に示す音声合成装置による音声合成処理動作のフローチャートである。以下、図２に従って、音声合成処理動作について詳細に説明する。説明を分りやすくするために、日本語テキスト文中に、対象英文字列「ＡＣＴＩＯＮ」が存在する場合を例に説明する。尚、この発明は、上述したように、テキスト文中に出現する対象文字列の単語と非単語との判別を行うものであるから、以下の説明においては、テキスト解析部１による通常の形態素解析処理や音声合成制御パラメータの生成処理、音声合成部２による音声合成処理については省略する。
【００３２】
ステップＳ1で、上記テキスト解析部１に日本語によるテキスト文が入力される。ステップＳ2で、テキスト解析部１によって、上記形態素解析が行われて英文字列「ＡＣＴＩＯＮ」が読み出され、単語判定部４に送出される。ステップＳ3で、単語判定部４によって、文字列辞書７が参照される。ここで、上記文字列辞書７には、英単語を形成する綴りの部分文字列が格納されている。本実施の形態においては、図３に示すように、英単語を構成する最初の４文字列、例えば「ＡＢＡＣ」,「ＡＣＡＤ」,「ＡＣＴＩ」等の部分文字列が格納されているものとする。そして、単語判定部４は、対象英文字列における最初の４文字が文字列辞書７に存在するか否かを調べるのである。
【００３３】
ステップＳ4で、上記単語判定部４によって、上記辞書引きの結果、対象英文字列「ＡＣＴＩＯＮ」が単語であるか否か、つまり英文字列「ＡＣＴＩＯＮ」の最初の４文字列「ＡＣＴＩ」が文字列辞書７に存在するか否かが判別される。そして、文字列辞書７にあれば英文字列「ＡＣＴＩＯＮ」は英単語であるとしてステップＳ5に進み、なければ判別結果「非単語」がテキスト解析部１に返された後ステップＳ6に進む。本例の場合は、図３に示すように、文字列辞書７には部分文字列「ＡＣＴＩ」が存在するので、対象英文字列「ＡＣＴＩＯＮ」は英単語であると判断されて、上記ステップＳ5に進むことになる。
【００３４】
ステップＳ5で、上記単語判定部４の単語読み付与部６によって、図４に示すような英単語の発音規則に基づいて英単語読みが付与される。そして、付与結果がテキスト解析部１に返された後、ステップＳ7に進む。図４は、綴りと読みとを対応付けて表にした単語発音規則表８であり、この単語発音規則表８を用いてローマ字表記の読みを繋ぎ合わせて読みが付与されるのである。例えば、上記対象英文字列「ＡＣＴＩＯＮ」の場合には、綴りを「ＡＣ」＋「ＴＩＯＮ」に分割し、単語発音規則表８から読み「ＡＫＵ」と「ＳＨＯＮ」とが得られる。そして、読み「ＡＫＵ」と読み「ＳＨＯＮ」とを繋ぎ合わせてローマ字表記「ＡＫＵＳＨＯＮ」が得られ、仮名表記に変換されて読みとして付与されるのである。そして、付与結果がテキスト解析部１に返される。
【００３５】
ステップＳ6で、上記アルファベット読み付与部５によって、図５に示すようなアルファベット読み表９に基づいて１文字ずつアルファベットの読みが付与される。そして、付与結果がテキスト解析部１に返される。ステップＳ7で、テキスト解析部１によって、上記読み等に基づいて音声合成制御パラメータが生成される。ステップＳ8で、音声合成部２によって、上記音声合成制御パラメータに基づいて音声合成処理が行われる。ステップＳ9で、出力部３によって上記音声合成処理の結果が、合成音声として出力される。そうした後、音声合成処理動作を終了するのである。
【００３６】
尚、上記音声合成処理動作において、日本語テキスト文中に、対象英文字列として英語略語「ＡＤＰＣＭ」が存在する場合には、次のように処理されることになる。すなわち、上記ステップＳ3における文字列辞書７の参照においては、部分文字列「ＡＤＰＣ」は存在しないので英文字列「ＡＤＰＣＭ」は非単語であると判別される。そして、上記ステップＳ6において、上記アルファベット読み表９を用いて、一字ずつのアルファベット読みを繋げて、「えーでぃーぴーしーえむ」という読みが付与されるのである。
【００３７】
上述したように、本実施の形態においては、テキスト解析部１で日本語テキスト文から読み出された対象英文字列が単語であるか非単語であるかを判定する単語判定部４を設けている。また、非単語であると判定された英文字列に対して１文字ずつアルファベットの読みを付与するアルファベット読み付与部５を設けている。さらに、英単語を形成する綴りの語頭から所定文字数でなる部分文字列が格納された文字列辞書７、綴りと読み(ローマ字表記)とを対応付けて表にした単語発音規則表８、および、アルファベット文字と読み(仮名表記)とを対応付けて表にしたアルファベット読み表９を設けている。
【００３８】
そして、上記単語判定部４は、文字列辞書７を引いて対象英文字列が単語であるか非単語であるかを判定する。さらに、単語読み付与部６を有して、単語であると判定した英文字列に、図４に示す単語発音規則表８を用いて、ローマ字表記で表された読みを繋ぎ合わせて英単語読みを付与するようにしている。また、アルファベット読み付与部５は、非単語であると判定された英文字列に対して、図５に示すアルファベット読み表９を用いて、１文字ずつアルファベットの読みを付与するようにしている。
【００３９】
したがって、本実施の形態によれば、日本語テキスト文中の対象英文字列の文字形状や文字長によらずに、上記対象英文字列の並びの特徴を用いて単語判定を行なうことができる。したがって、上記対象英文字列が単語であるか非単語であるかを正しく判定することができるのである。また、その際における文字列辞書７との照合は、対象英文字列の全部ではなく、語頭から４文字分の部分文字列としている。したがって、文字列辞書７を用いた単語/非単語の判定を迅速に行なうことができる。
【００４０】
上記実施の形態においては、上記文字列辞書７には、英単語を形成する綴りの語頭から４文字の部分文字列を登録しているが、上記文字数は４文字に限るものではない。文字数が多いほど単語/非単語の判定の精度は向上するが文字列辞書７の容量は増加する。両者の兼合いで文字数を最適に決定すればよい。また、上記部分文字列は英単語を形成する綴りの語頭から連続する文字列に限定するものではなく、綴りを構成する任意の部分の部分文字列であってもよい。
【００４１】
日本語のテキスト文の中に、他言語の文字列として英文字列が含まれている場合、それが英単語であれば英単語読みを付与すればよいが、単語ではなく略語のような非単語である場合には、普通は１文字ずつをアルファベット読みが付与される。したがって、出現した英文字列が単語であるか非単語であるかを判別することは重要である。
【００４２】
その場合、上記単語/非単語の判定を、大文字か小文字かの文字形状や文字列長によって行なうよりも、英文字列の並びの特徴から判別する方が、より厳密な判定を行なうことが可能である。例えば、任意の長さ以上の文字列を単語であると判定する判定方法では、例えば「ＡＤＰＣＭ」のような長い英略語が単語と誤判定されたり、「ＶＩＰ」のような短い英単語が非単語と誤判定される場合が多い。また、小文字の文字列を単語であると判定する判定方法でも、小文字列表記の非単語や大文字表記の単語がある場合には、単語/非単語の判定結果に応じて自然な読みを付与することができないことになる。これに対して、本実施の形態によれば、文字列の並びの特徴を用いて単語/非単語の判定を行なうので、上述のような場合であっても、自然な読みを付与することができるのである。
【００４３】
＜第２実施の形態＞
図６は、本実施の形態の音声合成装置における概略ブロック図である。図６において、テキスト解析部１１,音声合成部１２,出力部１３,単語判定部１４,アルファベット読み付与部１５,単語読み付与部１６及び文字列辞書１７は、図１におけるテキスト解析部１,音声合成部２,出力部３,単語判定部４,アルファベット読み付与部５,単語読み付与部６および文字列辞書７と同じ構成を有している。尚、図６では省略しているが、第１実施の形態の場合と同様に、単語発音規則表およびアルファベット読み表を有している。
【００４４】
本実施の形態においては、辞書引き部１８を有している。この辞書引き部１８は、テキスト解析部１１で読み出された英文字列に対して英単語と読みとが対応付けられた単語辞書２０を引き、単語辞書２０に存在する対象英文字列は単語であると判定する。そして、英単語には、辞書読み付与部１９によって、単語辞書２０に登録されている辞書読みを付与するようにしている。したがって、単語判定部１４は、辞書引き部１８によって単語辞書２０に登録されていないと判定された対象英文字列に対して、文字列辞書１７を引くのである。
【００４５】
図７は、図６に示す音声合成装置による音声合成処理動作のフローチャートである。以下、図７に従って、本実施の形態における音声合成処理動作について詳細に説明する。
【００４６】
ステップＳ11およびステップＳ12で、図２におけるステップＳ1およびステップＳ2と同様に、テキスト解析部１１に日本語テキスト文が入力され、上記形態素解析が行われて英文字列が読み出される。ステップＳ13で、辞書引き部１８によって単語辞書２０が参照される。ステップＳ14で、辞書引き部１８によって、辞書引きの結果、対象英文字列が単語辞書２０に存在したか否かが判別される。その結果、あればステップＳ15に進み、なければ判別結果をテキスト解析部１１に返してステップＳ16に進む。
【００４７】
ステップＳ15で、上記辞書引き部１８の辞書読み付与部１９によって、単語辞書２０に登録されている読み(辞書読み)が付与される。そして、付与結果がテキスト解析部１１に返された後、ステップＳ20に進む。ステップＳ16で、単語判定部１４によって、単語辞書２０に登録されていない対象英文字列に対して文字列辞書１７が参照される。
【００４８】
ステップＳ17〜ステップＳ22で、図２におけるステップＳ4〜ステップＳ9と同様に、単語判定部１４による対象英文字列の単語/非単語の判定、単語読み付与部１６による英単語読みの付与、アルファベット読み付与部１５によるアルファベットの読みの付与、テキスト解析部１１による上記音声合成制御パラメータの生成、音声合成部１２による音声合成処理、および、出力部１３による合成音声の出力が行われる。そうした後、音声合成処理動作を終了するのである。
【００４９】
本実施の形態においては、上記第１実施の形態の構成に加えて、テキスト解析部１１で読み出された英文字列に対して単語辞書２０を引く辞書引き部１８を有している。そして、単語辞書２０に存在する英文字列は単語であると判定して、辞書読み付与部１９によって、単語辞書２０に登録されている辞書読みを付与するようにしている。
【００５０】
したがって、本実施の形態によれば、上記第１実施の形態の場合に比較して、日本語テキスト文中に出現する英文字列に読みを付与する際に、先に単語辞書２０を参照することによって、綴りの全文字の配列に基づいて確実な読みを付与することができるのである。その際に、単語辞書２０に登録されておらず且つ英語発音を行う会社名や商品名等の英文字列の判定は、文字列辞書１７にその英文字列の部分文字列が登録されていれば英単語と判定されて、英単語読みが付与される。
【００５１】
＜第３実施の形態＞
図８は、本実施の形態の音声合成装置における概略ブロック図である。図８において、テキスト解析部２１,音声合成部２２,出力部２３,単語判定部２４,アルファベット読み付与部２５,単語読み付与部２６および文字列辞書２７は、図１におけるテキスト解析部１,音声合成部２,出力部３,単語判定部４,アルファベット読み付与部５,単語読み付与部６及び文字列辞書７と同じ構成を有している。尚、図８では省略しているが、第１実施の形態の場合と同様に、単語発音規則表およびアルファベット読み表を有している。また、辞書引き部２８,辞書読み付与部２９および単語辞書３０は、図６における辞書引き部１８,辞書読み付与部１９および単語辞書２０と同じ構成を有している。
【００５２】
本実施の形態においては、ローマ字読み判定部３１を有している。ローマ字読み判定部３１は、ローマ字表３３を参照して、対象となる英文字列がローマ字読みが可能であるか否かを判断する。例えば、英文字列「ｉｃｈｉｋａｗａ」のようにローマ字読みが可能な文字列である場合には、内蔵するローマ字読み付与部３２によって、ローマ字読み「いちかわ」を付与するのである。
【００５３】
図９は、図８に示す音声合成装置による音声合成処理動作のフローチャートである。以下、図９に従って、本実施の形態における音声合成処理動作について詳細に説明する。
【００５４】
ステップＳ31〜ステップＳ38で、図７におけるステップＳ11〜ステップＳ18と同様に、テキスト解析部２１による対象英文字列の読み出し、辞書引き部２８による単語辞書３０の参照、辞書読み付与部２９による辞書読み付与、単語判定部２４による文字列辞書２７の参照と単語/非単語の判定、単語読み付与部２６による英単語読みの付与が行われる。そうした後、ステップＳ43に進む。
【００５５】
ステップＳ39で、上記ローマ字読み判定部３１によって、ローマ字表３３が参照される。ステップＳ40で、ローマ字読み判定部３１によって、対象英文字列はローマ字読みが可能か否かが判別される。その結果、ローマ字読みが可能であればステップＳ41に進み、そうでなければ判定結果をテキスト解析部２１に返してステップＳ42に進む。ステップＳ41で、ローマ字読み付与部３２によって、対象英文字列にローマ字読みが付与される。そして、付与結果がテキスト解析結果２１に返された後、ステップＳ43に進む。
【００５６】
ステップＳ42〜ステップＳ45で、図７におけるステップＳ19〜ステップＳ22と同様に、アルファベット読み付与部２５によるアルファベット読みの付与、テキスト解析部２１による音声合成制御パラメータの生成、音声合成部２２による音声合成処理、及び、出力部２３による合成音声の出力が行われる。そうした後、音声合成処理動作を終了するのである。
【００５７】
図１０は、図９に示す音声合成処理動作のフローチャートにおける上記ステップＳ39及びステップＳ40において実行されるローマ字読み可能か否かの判定処理のさらに詳細なフローチャートである。以下、図１０に従って、ローマ字読み可能か否かの判定処理について具体的に説明する。図９に示すフローチャートのステップＳ37において非単語であると判別されると、図１０におけるステップＳ51に進む。尚、ここでは、対象英文字列は「ｉｃｈｉｋａｗａ」であるとする。
【００５８】
ステップＳ51で、上記テキスト解析結果２１から受け取ってバッファ等に格納された対象英文字列「ｉｃｈｉｋａｗａ」の先頭文字「ｉ」が読み出される。ステップＳ52で、先頭文字「ｉ」がローマ字表３３の何れかの英文字列とマッチングするか否かが判別される。その結果、マッチングすればステップＳ53に進む。一方、マッチングしなければ、ローマ字読みが不可能である旨の判定結果をテキスト解析部２１に返した後、図９に示すフローチャートにおけるステップＳ42に進む。尚、ローマ字表３３は、図１１に示すように、５０音のローマ字綴り(文字列)と読み(仮名表記)とを対応付けた表である。本例の場合は、先頭文字「ｉ」はローマ字表３３とマッチングするため、ステップＳ53に進むことになる。
【００５９】
ステップＳ53で、上記バッファ等に格納されている対象英文字列「ｉｃｈｉｋａｗａ」から、マッチングした先頭文字「ｉ」が除去される。ステップＳ54で、上記バッファ等が空になったか否か、つまり対象英文字列「ｃｈｉｋａｗａ」は終端であるか否かが判別される。その結果、終端であれば、図９に示すフローチャートにおけるステップＳ41に進む。一方、終端でなければ上記ステップＳ51にリターンして、元の対象英文字列における２文字目以降の処理に移行する。以下、ステップＳ52〜ステップＳ51を繰り返し、上記ステップＳ54において終端であると判別されると、ローマ字読み可能か否かの判定処理を終了する。そうした後、図９に示すフローチャートにおけるステップＳ41に進むのである。
【００６０】
本実施の形態においては、上記第２実施の形態の構成に加えて、ローマ字読み判定部３１を有している。そして、ローマ字表３３に存在する英文字列はローマ字読みであると判定して、ローマ字読み付与部３２によってローマ字読みを付与するようにしている。
【００６１】
電子メールのアドレス等に記載されているように名前をローマ字で表現した英文字列の場合は、英語読みを付与したのでは正しい読みは付与されない。ところが、本実施の形態によれば、ローマ字読み可能な英文字列に対してはローマ字読みを付与することができ、電子メールのアドレス等に対しても十分に対応することができるのである。
【００６２】
図１２は、図９に示す音声合成処理動作におけるローマ字読みが可能か否かの判別処理およびローマ字読み付与処理を、単語判定部２４による単語/非単語の判定の前に行うようにした変形例である。具体的には、図１２に示すフローチャートにおけるステップＳ61〜ステップＳ65は、図９に示すフローチャートにおけるステップＳ31〜ステップＳ35と同じである。また、図１２に示すフローチャートにおけるステップＳ66〜ステップＳ68は、図９に示すフローチャートにおけるステップＳ39〜ステップＳ41と同じである。また、図１２に示すフローチャートにおけるステップＳ69〜ステップＳ71は、図９に示すフローチャートにおけるステップＳ36〜ステップＳ38と同じである。また、図１２に示すフローチャートにおけるステップＳ72〜ステップＳ75は、図９に示すフローチャートにおけるステップＳ42〜ステップＳ45と同じである。
【００６３】
こうして、図１２に示す音声合成処理動作においては、図９に示す音声合成処理動作と比較して、単語辞書３０に存在しない英文字列がローマ字読みが可能な英文字列である場合には、優先してローマ字読みを付与することができるのである。
【００６４】
尚、本実施の形態においては、上記ローマ字読み判定部３１を上記第２実施の形態における音声合成装置に付加した構成を有しているが、上記第１実施の形態における音声合成装置に付加した構成を有していても一向に構わない。
【００６５】
＜第４実施の形態＞
図１３は、本実施の形態の音声合成装置における概略ブロック図である。図１３において、テキスト解析部４１,音声合成部４２,出力部４３,アルファベット読み付与部４５,単語読み付与部４６および文字列辞書４７は、図１におけるテキスト解析部１,音声合成部２,出力部３,アルファベット読み付与部５,単語読み付与部６および文字列辞書７と同じ構成を有している。尚、図１３では省略しているが、第１実施の形態の場合と同様に、単語発音規則表およびアルファベット読み表を有している。また、辞書引き部４８,辞書読み付与部４９および単語辞書５０は、図６における辞書引き部１８,辞書読み付与部１９および単語辞書２０と同じ構成を有している。また、ローマ字読み判定部５１およびローマ字読み付与部５２は、図８におけるとローマ字読み判定部３１およびローマ字読み付与部３２同じ構成を有している。尚、図１３では省略しているが、第３実施の形態の場合と同様にローマ字表を有している。
【００６６】
本実施の形態においては、文字列長測定部５３を有している。この文字列長測定部５３は、テキスト解析手段４１によって読み出された対象英文字列の長さを測定する。そして、単語判定部４４は、文字列長測定部３１で測定された対象英文字列の長さをも用いて単語/非単語の判定を行なうのである。
【００６７】
図１４は、図１３に示す音声合成装置による音声合成処理動作のフローチャートである。以下、図１４に従って、本実施の形態における音声合成処理動作について詳細に説明する。
【００６８】
ステップＳ81〜ステップＳ85で、図９におけるステップＳ31〜ステップＳ35と同様に、テキスト解析部４１による対象英文字列の読み出し、辞書引き部４８による単語辞書５０の参照、辞書読み付与部４９による辞書読み付与が行われる。そうした後、ステップＳ95に進む。
【００６９】
ステップＳ86で、上記文字列長測定部５３によって、対象英文字列の文字列長(文字数)が測定される。そして、測定値がテキスト解析部４１に返される。ステップＳ87で、単語判定部４４によって、上記測定された文字列長が所定文字数よりも小さいか否かが判別される。その結果、小さければ、対象英文字列は非単語であると見なされる。そして、判別結果がテキスト解析部４１に返された後、ステップＳ94に進んでアルファベット読みが付与される。
【００７０】
ステップＳ88〜ステップＳ97で、図９におけるステップＳ36〜ステップＳ45と同様に、単語判定部４４による文字列辞書４７の参照と単語/非単語の判定、単語読み付与部４６による英単語読みの付与、ローマ字読み判定部５１によるローマ字表の参照とローマ字読み可否の判定、ローマ字読み付与部５２によるローマ字読み付与、アルファベット読み付与部４５によるアルファベット読みの付与、テキスト解析部４１による音声合成制御パラメータの生成、音声合成部４２による音声合成処理、および、出力部４３による合成音声の出力が行われる。そうした後に、音声合成処理動作を終了するのである。
【００７１】
本実施の形態においては、上記第３実施の形態の構成に加えて、文字列長測定部５３を有している。そして、単語判定部４４は、単語辞書５０に登録されていない対象英文字列に対して、文字列長測定部５３によって測定された文字列長が所定文字数未満である場合には非単語であると見なし、所定文字数以上の対象英文字列に対してのみ、文字列辞書４７を参照する単語/非単語の判定を行うようにしている。
【００７２】
したがって、上記第３実施の形態の場合に比較して、短い英文字列についてはアルファベット読みが優先されることになる。単語辞書５０になく且つ短い英文字列は、英語略語である可能性が高い。そこで、本実施の形態においては、そのような英文字列には優先的にアルファベット読みを付与することによって、音声合成処理動作を速やかに行なうのである。
【００７３】
＜第５実施の形態＞
本実施の形態は、上記対象英文字列が、電子メールのアドレス等の特殊な記号を含む場合に適用されるものである。図１５は、本実施の形態における音声合成装置の部分ブロック図である。本音声合成装置は、例えば、上記第３実施の形態(図８)あるいは第４実施の形態(図１３)における音声合成装置のローマ字読み判定部３１,５１の前段に特定文字領域抽出部を配置した構成を有している。
【００７４】
図１５において、テキスト解析部６１,ローマ字読み判定部６２およびローマ字読み付与部６３は、上記第３実施の形態(図８)および第４実施の形態(図１３)におけるテキスト解析部２１・４１,ローマ字読み判定部３１・５１およびローマ字読み付与部３２・５２と同じ構成を有している。尚、図１５においては省略しているが、上記第３,第４実施の形態の場合と同様に、音声合成部,出力部,単語判定部,アルファベット読み付与部,辞書引き部,文字列辞書および単語辞書を有している。
【００７５】
特定文字領域抽出部６４は、上記辞書引き部および単語判定部によって英単語ではないと判定された対象英文字列を、テキスト解析部６１から受け取る。そして、領域判定規則６５を参照して、後に詳述する特定記号の間の文字列を特定文字領域として抽出し、抽出結果をローマ字読み判定部６２に送出する。
【００７６】
電子メールのアドレス行には、通常、規約に従って、特定の記号あるいは特定の記号列(以後、特定記号と言う)「From：」,「＠」,「＜」,「＞」等が含まれている。そこで、特定文字領域抽出部６４は、対象英文字列中の特定記号の存在およびその配列を調べる。そして、特定記号が、予め定められた並びの順に存在する場合には、予め定められた規則によって特定記号間の文字列を抽出するのである。そして、ローマ字読み判定部６２では、この抽出された文字列に対してローマ字読みの可能性を判定し、ローマ字読みが可能であればローマ字読み付与部６３でローマ字読みを付与するのである。
【００７７】
以下、上記特定文字領域抽出部６４による特定記号間の文字列抽出について、例を上げて説明する。ここで、電子メールのヘッダの内容が、図１６に示すごとくであったとする。電子メールのFrom行には、日本では送信者名をローマ字表記する場合が多く、その場合の名前を表す英文字列にはローマ字読みを付与するべきである。そこで、先ず、送信元アドレスが記述されているFrom行の「From：」を特定記号と識別する。次に、「＜」,「＠」,「＞」の順で特定記号が抽出される。そして、領域判定規則６５を参照して、特定記号「From：」から特定記号「＜」までの間の英文字列「ＴＡＮＡＫＡＴＡＲＯＵ」や、特定記号「＜」から特定記号「＠」までの間の英文字列「ｔａｎａｋａ」を、ローマ字読みを優先すべき上記特定文字領域として抽出するのである。
【００７８】
その結果、上記ローマ字読み判定部６２によって、英文字列「ＴＡＮＡＫＡＴＡＲＯＵ」および英文字列「ｔａｎａｋａ」がローマ字読みが可能であると判別されると、英文字列「ＴＡＮＡＫＡＴＡＲＯＵ」にはローマ字読み「たなかたろう」が付与され、英文字列「ｔａｎａｋａ」にはローマ字読み「たなか」が付与されるのである。尚、後に、テキスト解析部６１でFrom行に関する音声合成制御パラメータを生成する場合に、特定記号「＜」,「＠」間の英文字列のローマ字読み「たなか」に基づいて、「たなか」＋「さんからのメールです」のごとく言葉を付け加えて音声合成制御パラメータを生成することも可能である。
【００７９】
上述の例の場合には、上記特定記号として「From：」,「＜」,「＠」,「＞」等を用いると共に、特定記号「From：」,「＜」間および特定記号「＜」,「＠」間を上記特定文字領域として抽出している。しかしながら、何れの記号を特定記号とするか、何れの特定記号間を上記特定文字領域として抽出するかは、これに限定されるものではなく、予め定義して領域判定規則６５に格納しておけばよい。例えば、特定記号を「“」，「”」,「(」および「)」とし、特定記号「“」，「”」間や特定記号「(」，「)」間を上記特定文字領域とすることも可能である。
【００８０】
また、上記特定文字領域抽出部６４は、取り込んだ対象英文字列には特定記号「From：」がなく、電子メールアドレスの文字列ではないと判定した場合には、当該対象英文字列には何も行わずにそのままローマ字読み判定部６２に送出し、ローマ字読み判定部６２によってローマ字読みが可能であればローマ字読みを付与するようにしてもよい。
【００８１】
本実施の形態においては、電子メールのアドレス行を例に上げて説明したが、対象文字列は、フォーマットに従っており、且つ、特定記号を含むものであればこれに限るものではない。
【００８２】
さらに、本実施の形態においては、上記ローマ字読み判定部６２の前段に特定文字領域抽出部６４を配置しているが、上記第１〜第４実施の形態におけるアルファベット読み付与部５,１５,２５,４５の前段に特定文字領域抽出部を配置してもよい。その場合には、当該特定文字領域抽出部によって抽出された特定文字領域に対してアルファベット読みを優先させることができる。こうすることによって、ホームページのアドレス等の特定フォーマットを含む英文字列の読み上げに際して、自然な読みを付与することが可能になるのである。
【００８３】
尚、上記各実施の形態においては、上記単語読み付与部６,１６,２６,４６は単語判定部４,１４,２４,４４に、辞書読み付与部１９,２９,４９は辞書引き部１８,２８,４８に、ローマ字読み付与部３２,５２,６３はローマ字読み判定部３１,５１,６２に、夫々搭載されている。しかしながら、この発明においては、上記単語読み付与部,辞書読み付与部,ローマ字読み付与部を、上記単語判定部,辞書引き部,ローマ字読み判定部とは独立して設けても差し支えない。
【００８４】
上記各実施の形態における音声合成装置は、携帯電話や電子手帳等の比較的に文字表示領域が狭い携帯型の情報処理装置に搭載することが有効である。すなわち、このような文字表示領域が狭い携帯型情報処理装置において電子メールやインターネット情報等の内容を知る場合には、合成音声によって聞き取ることが便利である。ところが、このような電子メールやインターネット情報の内容には、アルファベット表記の英単語や英語略語あるいはローマ字表記を含むアドレス等が頻繁に出現する。
【００８５】
上記各実施の形態における音声合成装置によれば、出現した英文字列を的確に英単語や英語略語やローマ字表記の名前等に識別し、英単語には英単語読み、英語略語にはアルファベット読み、ローマ字表記の名前にはローマ字読みを付与して、自然な発生での読み上げを行うことができる。したがって、携帯型の情報処理装置用の音声合成装置として非常に有効なのである。
【００８６】
ところで、上記各実施の形態におけるテキスト解析部１・１１・２１・４１,音声合成部２・１２・２２・４２,単語判定部４・１４・２４・４４,アルファベット付与部５・１５・２５・４５,単語読み付与部６・１６・２６・４６,辞書引き部１８・２８・４８,ローマ字読み判定部３１・５１・６２,ローマ字読み付与部３２・５２・６３,文字列長測定部５３および特定文字領域抽出部６４による上記テキスト解析手段,音声合成,単語判定手段,アルファベット付与手段,単語読み付与手段,辞書引き手段,ローマ字読み判定手段,ローマ字読み付与手段,文字列長測定手段および特定文字領域抽出手段としての機能は、プログラム記録媒体に記録された音声合成処理プログラムによって実現される。上記各実施の形態における上記プログラム記録媒体は、ＲＯＭ(リード・オンリ・メモリ)でなるプログラムメディアである。あるいは、外部補助記憶装置に装着されて読み出されるプログラムメディアであってもよい。尚、何れの場合においても、上記プログラムメディアから音声合成処理プログラムを読み出すプログラム読み出し手段は、上記プログラムメディアに直接アクセスして読み出す構成を有していてもよいし、ＲＡＭ(ランダム・アクセス・メモリ)に設けられたプログラム記憶エリア(図示せず)にダウンロードし、上記プログラム記憶エリアにアクセスして読み出す構成を有していてもよい。尚、上記プログラムメディアから上記ＲＡＭのプログラム記憶エリアにダウンロードするためのダウンロードプログラムは、予め本体装置に格納されているものとする。
【００８７】
ここで、上記プログラムメディアとは、本体側と分離可能に構成され、磁気テープやカセットテープ等のテープ系、フロッピーディスク,ハードディスク等の磁気ディスクやＣＤ(コンパクトディスク)‐ＲＯＭ,ＭＯ(光磁気)ディスク,ＭＤ(ミニディスク),ＤＶＤ(ディジタルビデオディスク)等の光ディスクのディスク系、ＩＣ(集積回路)カードや光カード等のカード系、マスクＲＯＭ,ＥＰＲＯＭ（紫外線消去型ＲＯＭ),ＥＥＰＲＯＭ(電気的消去型ＲＯＭ),フラッシュＲＯＭ等の半導体メモリ系を含めた、固定的にプログラムを坦持する媒体である。
【００８８】
また、上記各実施の形態における音声合成装置は、モデムを備えてインターネットを含む通信ネットワークと接続可能な構成を有するように成せば、上記プログラムメディアは、通信ネットワークからのダウンロード等によって流動的にプログラムを坦持する媒体であっても差し支えない。尚、その場合における上記通信ネットワークからダウンロードするためのダウンロードプログラムは、予め本体装置に格納されているものとする。あるいは、別の記録媒体からインストールされるものとする。
【００８９】
尚、上記記録媒体に記録されるものはプログラムのみに限定されるものではなく、データも記録することが可能である。
【００９０】
【発明の効果】
以上より明らかなように、第１の発明の音声合成装置は、単語の綴りを表す文字列における所定位置以降の所定文字数の連続した文字列から成る部分文字列が登録された文字列辞書を備えて、単語判定手段によって、テキスト文中から読み出された他の言語による対象文字列の単語/非単語の判定を、上記対象文字列における上記所定位置以降の上記所定文字数の連続した部分文字列の並びが上記文字列辞書に存在するか否かによって行うので、文字の並び方が単語としての並び方である対象文字列のみを単語として判定することができる。したがって、この発明によれば、従来のごとく、大文字であるか小文字であるか、大文字である場合は文字数が所定値以上か否か等によって判定する場合に比して、単語/非単語を正しく判定することができる。
【００９１】
さらに、上記対象文字列における上記部分文字列を用いて上記文字列辞書を引くことによって、上記対象文字列の文字の並び方に基づく単語 / 非単語の判定を簡単に短時間に行うことができる。
【００９２】
さらに、上記対象文字列に対して、単語/非単語の正しい判定結果に応じて、単語である対象文字列には単語読み付与手段によって発音規則に従って単語読みを付与し、非単語である対象文字列にはアルファベット読み付与手段によって一文字ずつアルファベット読みを付与するので、自然な読みを付与することができるのである。
【００９３】
また、上記第１の発明の音声合成装置は、上記単語読み付与手段を、単語の綴りと読みとが対応付けられて成る上記発音規則の上記綴りに上記対象文字列あるいはその分割文字列が該当するか否かを調べ、上記対象文字列そのものが該当する場合には該当する綴りに対応付けられている読みを、また、上記分割文字列が該当する場合には該当する綴りに対応付けられている読みを繋ぎ合わせて、上記単語読みとして付与するようにすれば、上記発音規則に上記対象文字列あるいはその分割文字列が該当するか否かを調べるだけで、簡単に単語読みを付与することができる。また、上記対象文字列が長い場合でも、上記対象文字列を分割文字列に分けて得られた読みを繋ぎ合わせることによって、簡単に単語読みを付与できる。
【００９４】
また、上記第１の発明の音声合成装置は、上記対象文字列が単語辞書に在るか否かを上記単語辞書を引いて判定し、在る場合には上記単語辞書に記載された辞書読みを付与する辞書引き手段を備えて、未付与対象文字列判別手段によって上記辞書引き手段による処理の結果上記辞書読みが付与されなかったと判別された対象文字列に対して、単語判定指令手段によって上記単語判定手段に上記単語と非単語との判定を行わせるようになせば、上記単語判定手段による対象文字列の単語/非単語の判定に先立って、上記単語辞書に登録されている単語に対してより正確な辞書読みを付与することができる。
【００９５】
また、上記第１の発明の音声合成装置は、上記単語判定手段による単語と非単語との判定に先だって、あるいは、上記単語判定手段による非単語の判定の後に、上記対象文字列をローマ字読みすることが可能か否かを判定するローマ字読み判定手段と、上記ローマ字読みが可能な対象文字列にローマ字読みを付与するローマ字読み付与手段を備えて、ローマ字読みが付与されない対象文字列に対して、上記単語判定手段による単語・非単語の判定、あるいは、上記アルファベット読み付与手段によるアルファベット読みの付与を行うようにすれば、日本語による上記テキスト文がメール文である場合に、ローマ字表記による差出人名にはローマ字読みを付与することができる。すなわち、ローマ字表記の人名等が記載されたテキスト文に対しても対処することができるのである。
【００９６】
また、上記第１の発明の音声合成装置は、上記単語判定手段による単語と非単語との判定に先だって上記対象文字列の文字数を測定する文字列長測定手段を備えると共に、上記単語判定手段を、上記文字列長測定手段による測定結果を受けて、上記対象文字列の文字数が所定値以上である場合には上記単語と非単語との判定を行う一方、上記所定値に満たない場合には非単語であると判定して判定結果を上記アルファベット読み付与手段に送出するようになせば、文字数が所定値に満たない対象文字列を非単語であり且つ略語であると自動的に判定することができる。したがって、上記アルファベット表記文字列を上記文字列辞書や単語辞書等を行うことなく判定することができ、処理の簡略化と時間の短縮とを図ることができる。
【００９７】
また、上記第１の発明の音声合成装置は、上記対象文字列中の特定記号及びその特定記号の配列に基づいて上記対象文字列中における特定文字領域を抽出し、抽出結果を上記ローマ字読み判定手段あるいはアルファベット読み付与手段に送出する特定文字領域抽出手段を備えれば、例えば、電子メールのFrom行における特定記号「From：」,「＜」間と特定記号「＜」,「＠」間とに存在するローマ字表記の差出人名を上記特定文字領域として抽出して、上記ローマ字読み判定手段に送出することができる。
【００９８】
すなわち、この発明によれば、上記対象文字列中において特定記号の間に配置されたローマ字表記あるいはアルファベット表記の文字列を、上記文字列辞書や単語辞書等の辞書引きを行うことなくローマ字表記あるいはアルファベット表記であると判定することができ、処理の簡略化と迅速化とを図ることができる。
【００９９】
また、第２の発明の音声合成方法は、単語の綴りを表す文字列における所定位置以降の所定文字数の連続した文字列から成る部分文字列が登録された文字列辞書を参照して、テキスト文から読み出された他の言語による対象文字列の単語/非単語を判定するので、文字の並び方が単語としての並び方である対象文字列のみを単語として判定することができる。したがって、この発明によれば、従来のごとく、大文字であるか小文字であるか、大文字である場合は文字数が所定値以上か否か等によって判定する場合に比して、単語/非単語を正しく判定することができる。
【０１００】
さらに、上記対象文字列における上記部分文字列を用いて上記文字列辞書を引くことによって、上記対象文字列の文字の並び方に基づく単語 / 非単語の判定を簡単に短時間に行うことができる。
【０１０１】
さらに、上記対象文字列に対して、単語/非単語の正しい判定結果に応じて、上記単語と判定された対象文字列に対して発音規則に従って単語読みを付与し、非単語と判定された対象文字列に対して一文字ずつアルファベット読みを付与するので、自然な読みを付与することができるのである。
【０１０２】
また、第３の発明の情報処理装置は、上記第１の発明の音声合成装置が搭載されているので、文字表示領域が狭い携帯端末型の情報処理装置において電子メールやインターネット情報の内容を合成音声出力によって知る場合に、電子メールやインターネット情報の内容に出現するアルファベット表記の英単語や英語略語あるいはローマ字表記を含むアドレス等が、単語であるか非単語であるか、非単語である場合にはアルファベット表記であるかローマ字表記であるかを正しく判定できる。その結果、上記正しい判定結果に従って、上記対象文字列に対して自然な読みを付与できる。
【０１０３】
また、第４の発明のプログラム記録媒体は、コンピュータを、上記第１の発明におけるテキスト解析手段,音声合成手段,単語判定手段,単語読み付与手段およびアルファベット読み付与手段として機能させる音声合成処理プログラムが記録されているので、上記第１の発明の場合と同様に、テキスト文中から読み出された異なる言語による対象文字列の並び方に基づいて、当該対象文字列が単語であるか非単語であるかを正しく判定できる。したがって、上記対象文字列に単語/非単語の正しい判定結果に基づいて自然な読みを付与することができる。
【図面の簡単な説明】
【図１】この発明の音声合成装置における概略ブロック図である。
【図２】図１に示す音声合成装置による音声合成処理動作のフローチャートである。
【図３】図１における文字列辞書の内容の一例を示す概念図である。
【図４】図１における単語発音規則表の内容の一例を示す概念図である。
【図５】図１におけるアルファベット読み表の内容の一例を示す概念図である。
【図６】図１とは異なる音声合成装置における概略ブロック図である。
【図７】図６に示す音声合成装置による音声合成処理動作のフローチャートである。
【図８】図１および図６とは異なる音声合成装置における概略ブロック図である。
【図９】図８に示す音声合成装置による音声合成処理動作のフローチャートである。
【図１０】図９に示す音声合成処理動作で実行されるローマ字読み可能か否かの判定処理の詳細なフローチャートである。
【図１１】図８におけるローマ字表の内容の一例を示す概念図である。
【図１２】図９に示す音声合成処理動作の変形例のフローチャート図である。
【図１３】図１,図６および図８とは異なる音声合成装置における概略ブロック図である。
【図１４】図１３に示す音声合成装置による音声合成処理動作のフローチャートである。
【図１５】図１,図６,図８および図１３とは異なる音声合成装置の部分ブロック図である。
【図１６】電子メールのヘッダの一例を示す図である。
【符号の説明】
１,１１,２１,４１,６１…テキスト解析部、
２,１２,２２,４２…音声合成部、
３,１３,２３,４３…出力部、
４,１４,２４,４４…単語判定部、
５,１５,２５,４５…アルファベット読み付与部、
６,１６,２６,４６…単語読み付与部、
７,１７,２７,４７…文字列辞書、
８…単語発音規則表、
９…アルファベット読み表、
１８,２８,４８…辞書引き部、
１９,２９,４９…辞書読み付与部、
２０,３０,５０…単語辞書、
３１,５１,６２…ローマ字読み判定部、
３２,５２,６３…ローマ字読み付与部、
３３…ローマ字表、
５３…文字列長測定部、
６４…特定文字領域抽出部、
６５…領域判定規則。

Claims

任意の言語によるテキスト文を形態素解析して読みを付与すると共に、音声合成制御パラメータを生成するテキスト解析手段と、上記音声合成制御パラメータに基づいて音声を合成する音声合成手段を有する音声合成装置において、
単語の綴りを表す文字列における所定位置以降の所定文字数の連続した文字列から成る部分文字列が登録された文字列辞書と、
上記テキスト解析手段によって上記テキスト文中から読み出された上記テキスト文の言語とは異なる言語による対象文字列における上記所定位置以降の上記所定文字数の連続した部分文字列の並びが、上記文字列辞書に存在する場合には当該対象文字列は単語であると判定し、上記文字列辞書に存在しない場合には当該対象文字列は非単語であると判定する単語判定手段と、
上記単語判定手段によって単語であると判定された対象文字列に対して、発音規則に従って単語読みを付与する単語読み付与手段と、
上記単語判定手段によって非単語であると判定された対象文字列に対して、一文字ずつアルファベット読みを付与するアルファベット読み付与手段を備えたことを特徴とする音声合成装置。
請求項１に記載の音声合成装置において、
上記単語読み付与手段は、
単語の綴りと読みとが対応付けられて成る上記発音規則の上記綴りに上記対象文字列あるいはその分割文字列が該当するか否かを調べ、上記対象文字列そのものが該当する場合には該当する綴りに対応付けられている読みを、また、上記分割文字列が該当する場合には該当する綴りに対応付けられている読みを繋ぎ合わせて、上記単語読みとして付与するようになっていることを特徴とする音声合成装置。
請求項１あるいは請求項２に記載の音声合成装置において、
上記テキスト解析手段によって上記テキスト文中から読み出された上記テキスト文の言語とは異なる言語による対象文字列が単語辞書に在るか否かを上記単語辞書を引いて判定し、在る場合には上記単語辞書に記載された辞書読みを付与する辞書引き手段と、
上記辞書引き手段による処理の結果上記辞書読みが付与されなかった対象文字列を判別する辞書読み未付与対象文字列判別手段と、
上記辞書読み未付与対象文字列判別手段の判別結果に応じて、上記単語判定手段に、上記辞書読みが付与されなかった対象文字列に対する上記単語と非単語との判定を行わせる単語判定指令手段を備えたことを特徴とする音声合成装置。
請求項１乃至請求項３の何れか一つに記載の音声合成装置において、
上記テキスト文の言語は日本語であり、
上記単語判定手段による単語と非単語との判定に先だって、あるいは、上記単語判定手段による非単語の判定の後に、上記対象文字列が、ローマ字読みが可能であるか否かを判定するローマ字読み判定手段と、
上記ローマ字読みが可能であると判定された対象文字列に対してローマ字読みを付与するローマ字読み付与手段を備え、
ローマ字読みが付与されない対象文字列に対して、上記単語判定手段による単語と非単語との判定、あるいは、上記アルファベット読み付与手段によるアルファベット読みの付与が行われることを特徴とする音声合成装置。
請求項１乃至請求項４の何れか一つに記載の音声合成装置において、
上記単語判定手段による単語と非単語との判定に先だって、上記対象文字列の文字数を測定する文字列長測定手段を備えると共に、
上記単語判定手段は、上記文字列長測定手段による測定結果を受けて、上記対象文字列の文字数が所定値以上である場合にのみ上記単語と非単語との判定を行う一方、上記所定値に満たない場合には非単語であると判定して判定結果を上記アルファベット読み付与手段に送出することを特徴とする音声合成装置。
請求項１乃至請求項５の何れか一つに記載の音声合成装置において、
上記対象文字列中の特定記号およびその特定記号の配列に基づいて上記対象文字列中における特定文字領域を抽出し、抽出結果を上記ローマ字読み判定手段あるいはアルファベット読み付与手段に送出する特定文字領域抽出手段を備えたことを特徴とする音声合成装置。
任意の言語によるテキスト文を形態素解析して読みを付与すると共に、音声合成制御パラメータを生成し、上記音声合成制御パラメータに基づいて音声を合成する音声合成方法において、
単語の綴りを表す文字列における所定位置以降の所定文字数の連続した文字列から成る部分文字列が登録された文字列辞書を参照して、上記テキスト文中から読み出された上記テキスト文の言語とは異なる言語による対象文字列における上記所定位置以降の上記所定文字数の連続した部分文字列の並びが、上記文字列辞書に存在する場合には当該対象文字列は単語であると判定し、上記文字列辞書に存在しない場合には当該対象文字列は非単語であると判定するステップと、
上記単語であると判定された対象文字列に対して、発音規則に従って単語読みを付与するステップと、
上記非単語であると判定された対象文字列に対して、一文字ずつアルファベット読みを付与するステップを備えたことを特徴とする音声合成方法。
請求項１乃至請求項６の何れか一つに記載の音声合成装置が搭載されていることを特徴とする情報処理装置。
コンピュータを、請求項１におけるテキスト解析手段,音声合成手段,単語判定手段,単語読み付与手段およびアルファベット読み付与手段として機能させる音声合成処理プログラムが記録されていることを特徴とするコンピュータ読み出し可能なプログラム記録媒体。