JP3635230B2 - 音声合成装置および方法、情報処理装置、並びに、プログラム記録媒体 - Google Patents

音声合成装置および方法、情報処理装置、並びに、プログラム記録媒体 Download PDF

Info

Publication number
JP3635230B2
JP3635230B2 JP2000212826A JP2000212826A JP3635230B2 JP 3635230 B2 JP3635230 B2 JP 3635230B2 JP 2000212826 A JP2000212826 A JP 2000212826A JP 2000212826 A JP2000212826 A JP 2000212826A JP 3635230 B2 JP3635230 B2 JP 3635230B2
Authority
JP
Japan
Prior art keywords
word
character string
reading
dictionary
unit
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2000212826A
Other languages
English (en)
Other versions
JP2002023782A (ja
Inventor
慶子 吹田
浩幸 勘座
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sharp Corp
Original Assignee
Sharp Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sharp Corp filed Critical Sharp Corp
Priority to JP2000212826A priority Critical patent/JP3635230B2/ja
Publication of JP2002023782A publication Critical patent/JP2002023782A/ja
Application granted granted Critical
Publication of JP3635230B2 publication Critical patent/JP3635230B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Landscapes

  • Machine Translation (AREA)

Description

【0001】
【発明の属する技術分野】
この発明は、ある言語によるテキスト文中に出現する他の言語の文字列に自然な読みを付与できる音声合成装置およびその方法、上記音声合成装置を搭載した情報処理装置、並びに、音声合成処理プログラムを記録したプログラム記録媒体に関する。
【0002】
【従来の技術】
従来より、日本語文章中に出現する英文字列を英単語と非英単語とに区別する技術として、特開平8‐292873号公報に開示された技術がある。この特開平8‐292873号公報に開示された技術においては、英文字列が大文字で終るならば英語略語とし、小文字で終るならば英単語とする。さらに、上記大文字で終る文字列の長さが所定の長さ以上である場合には英単語であるとし、所定の長さ未満である場合には非英単語であるとする。
【0003】
そして、上記英単語であると判定された英文字列には、英語綴りの発音ルールに従って英単語読みが付与される。一方、非英語であると判定された英文字列には、英語略としての読みが付与される。つまり、1文字毎にアルファベット読みが付与されるのである。
【0004】
【発明が解決しようとする課題】
しかしながら、上記従来の特開平8‐292873号公報に開示された日本語文章中の英文字列を英単語と非英単語とに区別する技術には、以下のような問題がある。すなわち、英文字列が大文字で終るか小文字で終るか、そして上記英文字列で終る場合の文字列の長さが所定の長さ以上である否かによって、英単語であるか非英単語であるかを判定するのであるが、英単語であるか非英単語の判別を、大文字で終るか小文字で終るかと文字列の長さとでは判別しきれるものではない。すなわち、長い英大文字列でも英語読みを行わない英文字列があり、英子文字列でも英語読みを行わない場合もある。
【0005】
例えば、英語読みを行う英大文字列の長さを4文字以上と仮定した場合、ABCDE(えーびーしーでぃーいー)やADPCD(えーでぃーぴーしーえむ)のような5文字以上の非英単語や英語略語に、正しい読みを付与することができない。逆に、ANK(あんく)のような4文字未満の英単語読みを行う英文字列の例もある。また、ichikawa(いちかわ)のように、ローマ字読みを行う英文字列に対応することもできない。
【0006】
そこで、この発明の目的は、ある言語によるテキスト文中の他の言語による対象文字列に対する単語と非単語との正しい判別を文字形状や文字長によらずに行って自然な読みを付与できる音声合成装置およびその方法、上記音声合成装置を搭載した情報処理装置、並びに、音声合成処理プログラムを記録したプログラム記録媒体を提供することにある。
【0007】
【課題を解決するための手段】
上記目的を達成するため、第1の発明は、任意の言語によるテキスト文を形態素解析して読みを付与すると共に,音声合成制御パラメータを生成するテキスト解析手段と,上記音声合成制御パラメータに基づいて音声を合成する音声合成手段を有する音声合成装置において、単語の綴りを表す文字列における所定位置以降の所定文字数の連続した文字列から成る部分文字列が登録された文字列辞書と、上記テキスト解析手段によって上記テキスト文中から読み出された上記テキスト文の言語とは異なる言語による対象文字列における上記所定位置以降の上記所定文字数の連続した部分文字列の並びが , 上記文字列辞書に存在する場合には当該対象文字列は単語であると判定し , 上記文字列辞書に存在しない場合には当該対象文字列は非単語であると判定する単語判定手段と、上記単語判定手段によって単語であると判定された対象文字列に対して,発音規則に従って単語読みを付与する単語読み付与手段と、上記単語判定手段によって非単語であると判定された対象文字列に対して,一文字ずつアルファベット読みを付与するアルファベット読み付与手段を備えたことを特徴としている。
【0008】
上記構成によれば、単語判定手段によって、テキスト解析手段によってテキスト文中から読み出された異なる言語による対象文字列の並び方に基づいて、単語であるか非単語であるかが判定される。こうして、文字の並び方が単語としての並び方である対象文字列のみが単語として判定され、従来のごとく、大文字であるか小文字であるか、大文字である場合は文字数が所定値以上か否か等によって判定する場合に比して、単語/非単語が正しく判定される。したがって、上記対象文字列に対して、単語/非単語の正しい判定結果に応じて、単語である場合には単語読みが付与される一方、非単語である場合にはアルファベット読みが付与されて、自然な読みが付与される。
【0009】
さらに、上記対象文字列における所定位置以降の所定文字数の部分文字列を用いて辞書を引くことによって、上記対象文字列の文字の並び方に基づく単語 / 非単語の判定が簡単に短時間に行われる。
【0010】
また、上記第1の発明の音声合成装置は、上記単語読み付与手段を、単語の綴りと読みとが対応付けられて成る上記発音規則の上記綴りに上記対象文字列あるいはその分割文字列が該当するか否かを調べ、上記対象文字列そのものが該当する場合には該当する綴りに対応付けられている読みを、また、上記分割文字列が該当する場合には該当する綴りに対応付けられている読みを繋ぎ合わせて、上記単語読みとして付与するようになすことが望ましい。
【0011】
上記構成によれば、単語の綴りと読みとを対応付けた発音規則に上記対象文字列あるいはその分割文字列が該当するか否かを調べるだけで、簡単に単語読みが付与される。また、上記対象文字列が長い場合でも、上記対象文字列を分割文字列に分けて得られた読みを繋ぎ合わせることによって、簡単に単語読みが付与される。
【0012】
また、上記第1の発明の音声合成装置は、上記テキスト解析手段によって上記テキスト文中から読み出された上記テキスト文の言語とは異なる言語による対象文字列が単語辞書に在るかかを上記単語辞書を引いて判定し,る場合には上記単語辞書に記載された辞書読みを付与する辞書引き手段と、上記辞書引き手段による処理の結果上記辞書読みが付与されなかった対象文字列を判別する辞書読み未付与対象文字列判別手段と、上記辞書読み未付与対象文字列判別手段の判別結果に応じて,上記単語判定手段に,上記辞書読みが付与されなかった対象文字列に対する上記単語と非単語との判定を行わせる単語判定指令手段を備えることが望ましい。
【0013】
上記構成によれば、上記単語判定手段による対象文字列の単語/非単語の判定に先立って、辞書引き手段によって単語辞書が引かれて、単語辞書に登録されている単語にはより正確な辞書読みが付与される。
【0014】
また、上記第1の発明の音声合成装置は、上記テキスト文の言語を日本語であるとし、上記単語判定手段による単語と非単語との判定に先だって , あるいは , 上記単語判定手段による非単語の判定の後に ,上記対象文字列が,ローマ字読みが可能であるか否かを判定するローマ字読み判定手段と、上記ローマ字読みが可能である判定された対象文字列に対してローマ字読みを付与するローマ字読み付与手段を備え、ローマ字読みが付与されない対象文字列に対して、上記単語判定手段による単語と非単語との判定、あるいは、上記アルファベット読み付与手段によるアルファベット読みの付与を行うことが望ましい。
【0015】
日本語による上記テキスト文がメール文である場合には、そのヘッダにおけるアドレス行にはローマ字表記による差出人名が記載されている。上記構成によれば、ローマ字読み判定手段によって、ローマ字読みが可能であるか否かが判定される。そして、上記ローマ字読みが可能である場合には、ローマ字読み付与手段によってローマ字読みが付与される。したがって、ローマ字表記の人名が記載されたメール文等に対しても対処可能となる。
【0016】
また、上記第1の発明の音声合成装置は、上記単語判定手段による単語と非単語との判定に先だって ,上記対象文字列の文字数を測定する文字列長測定手段を備えると共に、上記単語判定手段を,上記文字列長測定手段による測定結果を受けて ,上記対象文字列の文字数が所定値以上である場合にのみ上記単語と非単語との判定を行う一方,上記所定値に満たない場合には非単語であると判定して判定結果を上記アルファベット読み付与手段に送出するようになすことが望ましい。
【0017】
上記構成によれば、文字列長測定手段によって測定された対象文字列の文字数が所定値に満たない場合には、上記単語判定手段によって、当該対象文字列は非単語であり且つ略語であると自動的に判定される。こうして、上記アルファベット表記文字列の判定が上記文字列辞書や単語辞書等の辞書引きを省略して行われて、処理の簡略化と時間の短縮とが図られる。
【0018】
また、上記第1の発明の音声合成装置は、上記対象文字列中の特定記号及びその特定記号の配列に基づいて上記対象文字列中における特定文字領域を抽出し、抽出結果を上記ローマ字読み判定手段あるいはアルファベット読み付与手段に送出する特定文字領域抽出手段を備えることが望ましい。
【0019】
電子メールの送信元アドレスが記述されているFrom行には、特定記号「From:」,「<」,「@」,「>」がこの順で出現する。そして、特定記号「From:」,「<」間と特定記号「<」,「@」間とには、送信者名を日本においてはローマ字で記載するようになっている。上記構成によれば、特定文字領域抽出手段によって、上記対象文字列中における特定記号「From:」,「<」間と特定記号「<」,「@」間とが特定文字領域として抽出されて、上記ローマ字読み判定手段に送出される。
【0020】
したがって、上記電子メールの送信元アドレスにローマ字で記述された送信者名が、上記文字列辞書や単語辞書等の辞書引きを行うことなくローマ字表記であると判定されて、処理の簡略化と迅速化とが図られる。これは、特定記号の間にアルファベット表示の文字列を配置する場合も同様である。
【0021】
また、第2の発明は、任意の言語によるテキスト文を形態素解析して読みを付与すると共に,音声合成制御パラメータを生成し,上記音声合成制御パラメータに基づいて音声を合成する音声合成方法において、単語の綴りを表す文字列における所定位置以降の所定文字数の連続した文字列から成る部分文字列が登録された文字列辞書を参照して ,上記テキスト文中から読み出された上記テキスト文の言語とは異なる言語による対象文字列における上記所定位置以降の上記所定文字数の連続した部分文字列の並びが , 上記文字列辞書に存在する場合には当該対象文字列は単語であると判定し , 上記文字列辞書に存在しない場合には当該対象文字列は非単語であると判定するステップと、上記単語であると判定された対象文字列に対して,発音規則に従って単語読みを付与するステップと、上記非単語であると判定された対象文字列に対して,一文字ずつアルファベット読みを付与するステップを備えたことを特徴としている。
【0022】
上記構成によれば、テキスト文中から読み出された異なる言語による対象文字列の並び方に基づいて、当該対象文字列が単語であるか非単語であるかが判定される。こうして、従来のごとく、大文字であるか小文字であるか、大文字である場合は文字数が所定値以上か否か等によって判定する場合に比して、単語/非単語とが正しく判定されて、上記対象文字列に自然な読みが付与される。
【0023】
さらに、上記対象文字列における所定位置以降の所定文字数の部分文字列を用いて辞書を引くことによって、上記対象文字列の文字の並び方に基づく単語 / 非単語の判定が簡単に短時間に行われる。
【0024】
また、第3の発明の情報処理装置は、上記第1の発明の音声合成装置が搭載されていることを特徴としている。
【0025】
上記構成によれば、文字表示領域が狭い携帯端末型の情報処理装置において電子メールやインターネット情報の内容を合成音声出力によって知る場合に、電子メールやインターネット情報の内容によく出現するアルファベット表記の英単語や英語略語あるいはローマ字表記を含むアドレス等が、単語であるか非単語であるか、非単語である場合にはアルファベット表記であるかローマ字表記であるかが正しく判定される。その結果、上記正しい判定結果に従って、上記対象文字列に対して自然な読みが付与される。
【0026】
また、第4の発明のプログラム記録媒体は、コンピュータを、上記第1の発明におけるテキスト解析手段,音声合成手段,単語判定手段,単語読み付与手段およびアルファベット読み付与手段として機能させる音声合成処理プログラムが記録されていることを特徴としている。
【0027】
上記構成によれば、上記第1の発明の場合と同様に、テキスト文中から読み出された異なる言語による対象文字列の並び方に基づいて、当該対象文字列が単語であるか非単語であるかが正しく判定される。こうして、上記対象文字列に自然な読みが付与される。
【0028】
【発明の実施の形態】
以下、この発明を図示の実施の形態により詳細に説明する。
<第1実施の形態>
図1は、本実施の形態の音声合成装置における概略ブロック図である。図1において、テキスト解析部1は、入力された日本語によるテキスト文を形態素解析して英文字列を読み出す。さらに、上記形態素解析の結果得られた個々の形態素の辞書引き等を行う。そして、上記形態素解析の結果に基づいて、テキスト文を構成する文字列に読みを付与し、韻律情報等の音声合成に必要な情報(音声合成制御パラメータ)を生成する。音声合成部2は、上記音声合成制御パラメータに基づいて音声合成処理を行い、スピーカー等で構成される出力部3から合成音声として出力する。
【0029】
単語判定部4は、上記テキスト解析部1で読み出された英文字列に対して文字列辞書7を引き、後に詳述するような単語判定を行う。さらに、単語判定部4は単語読み付与部6を有し、単語発音規則表8を引いて、後に詳述するような発音ルールに従って英単語読みを付与する。アルファベット読み付与部5は、単語判定部4の判定結果に基づいて、アルファベット読み表9を引いて、単語ではない英文字列に対して1文字ずつのアルファベットの読みを付与する。
【0030】
尚、本実施の形態においては、上記テキスト文の言語は日本語であり、テキスト文中に出現する対象文字列の言語は英語であり、上記対象文字列の文字はアルファベットであるとして説明する。しかしながら、この発明における上記対象文字列の言語および文字は上述の英語およびアルファベットに限定されるものではなく、テキスト解析部1用の辞書(図示せず)や単語判定部4用の文字列辞書7として該当する言語用の辞書を用意するだけで、他の言語の文字列にも容易に対処することができる。
【0031】
図2は、図1に示す音声合成装置による音声合成処理動作のフローチャートである。以下、図2に従って、音声合成処理動作について詳細に説明する。説明を分りやすくするために、日本語テキスト文中に、対象英文字列「ACTION」が存在する場合を例に説明する。尚、この発明は、上述したように、テキスト文中に出現する対象文字列の単語と非単語との判別を行うものであるから、以下の説明においては、テキスト解析部1による通常の形態素解析処理や音声合成制御パラメータの生成処理、音声合成部2による音声合成処理については省略する。
【0032】
ステップS1で、上記テキスト解析部1に日本語によるテキスト文が入力される。ステップS2で、テキスト解析部1によって、上記形態素解析が行われて英文字列「ACTION」が読み出され、単語判定部4に送出される。ステップS3で、単語判定部4によって、文字列辞書7が参照される。ここで、上記文字列辞書7には、英単語を形成する綴りの部分文字列が格納されている。本実施の形態においては、図3に示すように、英単語を構成する最初の4文字列、例えば「ABAC」,「ACAD」,「ACTI」等の部分文字列が格納されているものとする。そして、単語判定部4は、対象英文字列における最初の4文字が文字列辞書7に存在するか否かを調べるのである。
【0033】
ステップS4で、上記単語判定部4によって、上記辞書引きの結果、対象英文字列「ACTION」が単語であるか否か、つまり英文字列「ACTION」の最初の4文字列「ACTI」が文字列辞書7に存在するか否かが判別される。そして、文字列辞書7にあれば英文字列「ACTION」は英単語であるとしてステップS5に進み、なければ判別結果「非単語」がテキスト解析部1に返された後ステップS6に進む。本例の場合は、図3に示すように、文字列辞書7には部分文字列「ACTI」が存在するので、対象英文字列「ACTION」は英単語であると判断されて、上記ステップS5に進むことになる。
【0034】
ステップS5で、上記単語判定部4の単語読み付与部6によって、図4に示すような英単語の発音規則に基づいて英単語読みが付与される。そして、付与結果がテキスト解析部1に返された後、ステップS7に進む。図4は、綴りと読みとを対応付けて表にした単語発音規則表8であり、この単語発音規則表8を用いてローマ字表記の読みを繋ぎ合わせて読みが付与されるのである。例えば、上記対象英文字列「ACTION」の場合には、綴りを「AC」+「TION」に分割し、単語発音規則表8から読み「AKU」と「SHON」とが得られる。そして、読み「AKU」と読み「SHON」とを繋ぎ合わせてローマ字表記「AKUSHON」が得られ、仮名表記に変換されて読みとして付与されるのである。そして、付与結果がテキスト解析部1に返される。
【0035】
ステップS6で、上記アルファベット読み付与部5によって、図5に示すようなアルファベット読み表9に基づいて1文字ずつアルファベットの読みが付与される。そして、付与結果がテキスト解析部1に返される。ステップS7で、テキスト解析部1によって、上記読み等に基づいて音声合成制御パラメータが生成される。ステップS8で、音声合成部2によって、上記音声合成制御パラメータに基づいて音声合成処理が行われる。ステップS9で、出力部3によって上記音声合成処理の結果が、合成音声として出力される。そうした後、音声合成処理動作を終了するのである。
【0036】
尚、上記音声合成処理動作において、日本語テキスト文中に、対象英文字列として英語略語「ADPCM」が存在する場合には、次のように処理されることになる。すなわち、上記ステップS3における文字列辞書7の参照においては、部分文字列「ADPC」は存在しないので英文字列「ADPCM」は非単語であると判別される。そして、上記ステップS6において、上記アルファベット読み表9を用いて、一字ずつのアルファベット読みを繋げて、「えーでぃーぴーしーえむ」という読みが付与されるのである。
【0037】
上述したように、本実施の形態においては、テキスト解析部1で日本語テキスト文から読み出された対象英文字列が単語であるか非単語であるかを判定する単語判定部4を設けている。また、非単語であると判定された英文字列に対して1文字ずつアルファベットの読みを付与するアルファベット読み付与部5を設けている。さらに、英単語を形成する綴りの語頭から所定文字数でなる部分文字列が格納された文字列辞書7、綴りと読み(ローマ字表記)とを対応付けて表にした単語発音規則表8、および、アルファベット文字と読み(仮名表記)とを対応付けて表にしたアルファベット読み表9を設けている。
【0038】
そして、上記単語判定部4は、文字列辞書7を引いて対象英文字列が単語であるか非単語であるかを判定する。さらに、単語読み付与部6を有して、単語であると判定した英文字列に、図4に示す単語発音規則表8を用いて、ローマ字表記で表された読みを繋ぎ合わせて英単語読みを付与するようにしている。また、アルファベット読み付与部5は、非単語であると判定された英文字列に対して、図5に示すアルファベット読み表9を用いて、1文字ずつアルファベットの読みを付与するようにしている。
【0039】
したがって、本実施の形態によれば、日本語テキスト文中の対象英文字列の文字形状や文字長によらずに、上記対象英文字列の並びの特徴を用いて単語判定を行なうことができる。したがって、上記対象英文字列が単語であるか非単語であるかを正しく判定することができるのである。また、その際における文字列辞書7との照合は、対象英文字列の全部ではなく、語頭から4文字分の部分文字列としている。したがって、文字列辞書7を用いた単語/非単語の判定を迅速に行なうことができる。
【0040】
上記実施の形態においては、上記文字列辞書7には、英単語を形成する綴りの語頭から4文字の部分文字列を登録しているが、上記文字数は4文字に限るものではない。文字数が多いほど単語/非単語の判定の精度は向上するが文字列辞書7の容量は増加する。両者の兼合いで文字数を最適に決定すればよい。また、上記部分文字列は英単語を形成する綴りの語頭から連続する文字列に限定するものではなく、綴りを構成する任意の部分の部分文字列であってもよい。
【0041】
日本語のテキスト文の中に、他言語の文字列として英文字列が含まれている場合、それが英単語であれば英単語読みを付与すればよいが、単語ではなく略語のような非単語である場合には、普通は1文字ずつをアルファベット読みが付与される。したがって、出現した英文字列が単語であるか非単語であるかを判別することは重要である。
【0042】
その場合、上記単語/非単語の判定を、大文字か小文字かの文字形状や文字列長によって行なうよりも、英文字列の並びの特徴から判別する方が、より厳密な判定を行なうことが可能である。例えば、任意の長さ以上の文字列を単語であると判定する判定方法では、例えば「ADPCM」のような長い英略語が単語と誤判定されたり、「VIP」のような短い英単語が非単語と誤判定される場合が多い。また、小文字の文字列を単語であると判定する判定方法でも、小文字列表記の非単語や大文字表記の単語がある場合には、単語/非単語の判定結果に応じて自然な読みを付与することができないことになる。これに対して、本実施の形態によれば、文字列の並びの特徴を用いて単語/非単語の判定を行なうので、上述のような場合であっても、自然な読みを付与することができるのである。
【0043】
<第2実施の形態>
図6は、本実施の形態の音声合成装置における概略ブロック図である。図6において、テキスト解析部11,音声合成部12,出力部13,単語判定部14,アルファベット読み付与部15,単語読み付与部16及び文字列辞書17は、図1におけるテキスト解析部1,音声合成部2,出力部3,単語判定部4,アルファベット読み付与部5,単語読み付与部6および文字列辞書7と同じ構成を有している。尚、図6では省略しているが、第1実施の形態の場合と同様に、単語発音規則表およびアルファベット読み表を有している。
【0044】
本実施の形態においては、辞書引き部18を有している。この辞書引き部18は、テキスト解析部11で読み出された英文字列に対して英単語と読みとが対応付けられた単語辞書20を引き、単語辞書20に存在する対象英文字列は単語であると判定する。そして、英単語には、辞書読み付与部19によって、単語辞書20に登録されている辞書読みを付与するようにしている。したがって、単語判定部14は、辞書引き部18によって単語辞書20に登録されていないと判定された対象英文字列に対して、文字列辞書17を引くのである。
【0045】
図7は、図6に示す音声合成装置による音声合成処理動作のフローチャートである。以下、図7に従って、本実施の形態における音声合成処理動作について詳細に説明する。
【0046】
ステップS11およびステップS12で、図2におけるステップS1およびステップS2と同様に、テキスト解析部11に日本語テキスト文が入力され、上記形態素解析が行われて英文字列が読み出される。ステップS13で、辞書引き部18によって単語辞書20が参照される。ステップS14で、辞書引き部18によって、辞書引きの結果、対象英文字列が単語辞書20に存在したか否かが判別される。その結果、あればステップS15に進み、なければ判別結果をテキスト解析部11に返してステップS16に進む。
【0047】
ステップS15で、上記辞書引き部18の辞書読み付与部19によって、単語辞書20に登録されている読み(辞書読み)が付与される。そして、付与結果がテキスト解析部11に返された後、ステップS20に進む。ステップS16で、単語判定部14によって、単語辞書20に登録されていない対象英文字列に対して文字列辞書17が参照される。
【0048】
ステップS17〜ステップS22で、図2におけるステップS4〜ステップS9と同様に、単語判定部14による対象英文字列の単語/非単語の判定、単語読み付与部16による英単語読みの付与、アルファベット読み付与部15によるアルファベットの読みの付与、テキスト解析部11による上記音声合成制御パラメータの生成、音声合成部12による音声合成処理、および、出力部13による合成音声の出力が行われる。そうした後、音声合成処理動作を終了するのである。
【0049】
本実施の形態においては、上記第1実施の形態の構成に加えて、テキスト解析部11で読み出された英文字列に対して単語辞書20を引く辞書引き部18を有している。そして、単語辞書20に存在する英文字列は単語であると判定して、辞書読み付与部19によって、単語辞書20に登録されている辞書読みを付与するようにしている。
【0050】
したがって、本実施の形態によれば、上記第1実施の形態の場合に比較して、日本語テキスト文中に出現する英文字列に読みを付与する際に、先に単語辞書20を参照することによって、綴りの全文字の配列に基づいて確実な読みを付与することができるのである。その際に、単語辞書20に登録されておらず且つ英語発音を行う会社名や商品名等の英文字列の判定は、文字列辞書17にその英文字列の部分文字列が登録されていれば英単語と判定されて、英単語読みが付与される。
【0051】
<第3実施の形態>
図8は、本実施の形態の音声合成装置における概略ブロック図である。図8において、テキスト解析部21,音声合成部22,出力部23,単語判定部24,アルファベット読み付与部25,単語読み付与部26および文字列辞書27は、図1におけるテキスト解析部1,音声合成部2,出力部3,単語判定部4,アルファベット読み付与部5,単語読み付与部6及び文字列辞書7と同じ構成を有している。尚、図8では省略しているが、第1実施の形態の場合と同様に、単語発音規則表およびアルファベット読み表を有している。また、辞書引き部28,辞書読み付与部29および単語辞書30は、図6における辞書引き部18,辞書読み付与部19および単語辞書20と同じ構成を有している。
【0052】
本実施の形態においては、ローマ字読み判定部31を有している。ローマ字読み判定部31は、ローマ字表33を参照して、対象となる英文字列がローマ字読みが可能であるか否かを判断する。例えば、英文字列「ichikawa」のようにローマ字読みが可能な文字列である場合には、内蔵するローマ字読み付与部32によって、ローマ字読み「いちかわ」を付与するのである。
【0053】
図9は、図8に示す音声合成装置による音声合成処理動作のフローチャートである。以下、図9に従って、本実施の形態における音声合成処理動作について詳細に説明する。
【0054】
ステップS31〜ステップS38で、図7におけるステップS11〜ステップS18と同様に、テキスト解析部21による対象英文字列の読み出し、辞書引き部28による単語辞書30の参照、辞書読み付与部29による辞書読み付与、単語判定部24による文字列辞書27の参照と単語/非単語の判定、単語読み付与部26による英単語読みの付与が行われる。そうした後、ステップS43に進む。
【0055】
ステップS39で、上記ローマ字読み判定部31によって、ローマ字表33が参照される。ステップS40で、ローマ字読み判定部31によって、対象英文字列はローマ字読みが可能か否かが判別される。その結果、ローマ字読みが可能であればステップS41に進み、そうでなければ判定結果をテキスト解析部21に返してステップS42に進む。ステップS41で、ローマ字読み付与部32によって、対象英文字列にローマ字読みが付与される。そして、付与結果がテキスト解析結果21に返された後、ステップS43に進む。
【0056】
ステップS42〜ステップS45で、図7におけるステップS19〜ステップS22と同様に、アルファベット読み付与部25によるアルファベット読みの付与、テキスト解析部21による音声合成制御パラメータの生成、音声合成部22による音声合成処理、及び、出力部23による合成音声の出力が行われる。そうした後、音声合成処理動作を終了するのである。
【0057】
図10は、図9に示す音声合成処理動作のフローチャートにおける上記ステップS39及びステップS40において実行されるローマ字読み可能か否かの判定処理のさらに詳細なフローチャートである。以下、図10に従って、ローマ字読み可能か否かの判定処理について具体的に説明する。図9に示すフローチャートのステップS37において非単語であると判別されると、図10におけるステップS51に進む。尚、ここでは、対象英文字列は「ichikawa」であるとする。
【0058】
ステップS51で、上記テキスト解析結果21から受け取ってバッファ等に格納された対象英文字列「ichikawa」の先頭文字「i」が読み出される。ステップS52で、先頭文字「i」がローマ字表33の何れかの英文字列とマッチングするか否かが判別される。その結果、マッチングすればステップS53に進む。一方、マッチングしなければ、ローマ字読みが不可能である旨の判定結果をテキスト解析部21に返した後、図9に示すフローチャートにおけるステップS42に進む。尚、ローマ字表33は、図11に示すように、50音のローマ字綴り(文字列)と読み(仮名表記)とを対応付けた表である。本例の場合は、先頭文字「i」はローマ字表33とマッチングするため、ステップS53に進むことになる。
【0059】
ステップS53で、上記バッファ等に格納されている対象英文字列「ichikawa」から、マッチングした先頭文字「i」が除去される。ステップS54で、上記バッファ等が空になったか否か、つまり対象英文字列「chikawa」は終端であるか否かが判別される。その結果、終端であれば、図9に示すフローチャートにおけるステップS41に進む。一方、終端でなければ上記ステップS51にリターンして、元の対象英文字列における2文字目以降の処理に移行する。以下、ステップS52〜ステップS51を繰り返し、上記ステップS54において終端であると判別されると、ローマ字読み可能か否かの判定処理を終了する。そうした後、図9に示すフローチャートにおけるステップS41に進むのである。
【0060】
本実施の形態においては、上記第2実施の形態の構成に加えて、ローマ字読み判定部31を有している。そして、ローマ字表33に存在する英文字列はローマ字読みであると判定して、ローマ字読み付与部32によってローマ字読みを付与するようにしている。
【0061】
電子メールのアドレス等に記載されているように名前をローマ字で表現した英文字列の場合は、英語読みを付与したのでは正しい読みは付与されない。ところが、本実施の形態によれば、ローマ字読み可能な英文字列に対してはローマ字読みを付与することができ、電子メールのアドレス等に対しても十分に対応することができるのである。
【0062】
図12は、図9に示す音声合成処理動作におけるローマ字読みが可能か否かの判別処理およびローマ字読み付与処理を、単語判定部24による単語/非単語の判定の前に行うようにした変形例である。具体的には、図12に示すフローチャートにおけるステップS61〜ステップS65は、図9に示すフローチャートにおけるステップS31〜ステップS35と同じである。また、図12に示すフローチャートにおけるステップS66〜ステップS68は、図9に示すフローチャートにおけるステップS39〜ステップS41と同じである。また、図12に示すフローチャートにおけるステップS69〜ステップS71は、図9に示すフローチャートにおけるステップS36〜ステップS38と同じである。また、図12に示すフローチャートにおけるステップS72〜ステップS75は、図9に示すフローチャートにおけるステップS42〜ステップS45と同じである。
【0063】
こうして、図12に示す音声合成処理動作においては、図9に示す音声合成処理動作と比較して、単語辞書30に存在しない英文字列がローマ字読みが可能な英文字列である場合には、優先してローマ字読みを付与することができるのである。
【0064】
尚、本実施の形態においては、上記ローマ字読み判定部31を上記第2実施の形態における音声合成装置に付加した構成を有しているが、上記第1実施の形態における音声合成装置に付加した構成を有していても一向に構わない。
【0065】
<第4実施の形態>
図13は、本実施の形態の音声合成装置における概略ブロック図である。図13において、テキスト解析部41,音声合成部42,出力部43,アルファベット読み付与部45,単語読み付与部46および文字列辞書47は、図1におけるテキスト解析部1,音声合成部2,出力部3,アルファベット読み付与部5,単語読み付与部6および文字列辞書7と同じ構成を有している。尚、図13では省略しているが、第1実施の形態の場合と同様に、単語発音規則表およびアルファベット読み表を有している。また、辞書引き部48,辞書読み付与部49および単語辞書50は、図6における辞書引き部18,辞書読み付与部19および単語辞書20と同じ構成を有している。また、ローマ字読み判定部51およびローマ字読み付与部52は、図8におけるとローマ字読み判定部31およびローマ字読み付与部32同じ構成を有している。尚、図13では省略しているが、第3実施の形態の場合と同様にローマ字表を有している。
【0066】
本実施の形態においては、文字列長測定部53を有している。この文字列長測定部53は、テキスト解析手段41によって読み出された対象英文字列の長さを測定する。そして、単語判定部44は、文字列長測定部31で測定された対象英文字列の長さをも用いて単語/非単語の判定を行なうのである。
【0067】
図14は、図13に示す音声合成装置による音声合成処理動作のフローチャートである。以下、図14に従って、本実施の形態における音声合成処理動作について詳細に説明する。
【0068】
ステップS81〜ステップS85で、図9におけるステップS31〜ステップS35と同様に、テキスト解析部41による対象英文字列の読み出し、辞書引き部48による単語辞書50の参照、辞書読み付与部49による辞書読み付与が行われる。そうした後、ステップS95に進む。
【0069】
ステップS86で、上記文字列長測定部53によって、対象英文字列の文字列長(文字数)が測定される。そして、測定値がテキスト解析部41に返される。ステップS87で、単語判定部44によって、上記測定された文字列長が所定文字数よりも小さいか否かが判別される。その結果、小さければ、対象英文字列は非単語であると見なされる。そして、判別結果がテキスト解析部41に返された後、ステップS94に進んでアルファベット読みが付与される。
【0070】
ステップS88〜ステップS97で、図9におけるステップS36〜ステップS45と同様に、単語判定部44による文字列辞書47の参照と単語/非単語の判定、単語読み付与部46による英単語読みの付与、ローマ字読み判定部51によるローマ字表の参照とローマ字読み可否の判定、ローマ字読み付与部52によるローマ字読み付与、アルファベット読み付与部45によるアルファベット読みの付与、テキスト解析部41による音声合成制御パラメータの生成、音声合成部42による音声合成処理、および、出力部43による合成音声の出力が行われる。そうした後に、音声合成処理動作を終了するのである。
【0071】
本実施の形態においては、上記第3実施の形態の構成に加えて、文字列長測定部53を有している。そして、単語判定部44は、単語辞書50に登録されていない対象英文字列に対して、文字列長測定部53によって測定された文字列長が所定文字数未満である場合には非単語であると見なし、所定文字数以上の対象英文字列に対してのみ、文字列辞書47を参照する単語/非単語の判定を行うようにしている。
【0072】
したがって、上記第3実施の形態の場合に比較して、短い英文字列についてはアルファベット読みが優先されることになる。単語辞書50になく且つ短い英文字列は、英語略語である可能性が高い。そこで、本実施の形態においては、そのような英文字列には優先的にアルファベット読みを付与することによって、音声合成処理動作を速やかに行なうのである。
【0073】
<第5実施の形態>
本実施の形態は、上記対象英文字列が、電子メールのアドレス等の特殊な記号を含む場合に適用されるものである。図15は、本実施の形態における音声合成装置の部分ブロック図である。本音声合成装置は、例えば、上記第3実施の形態(図8)あるいは第4実施の形態(図13)における音声合成装置のローマ字読み判定部31,51の前段に特定文字領域抽出部を配置した構成を有している。
【0074】
図15において、テキスト解析部61,ローマ字読み判定部62およびローマ字読み付与部63は、上記第3実施の形態(図8)および第4実施の形態(図13)におけるテキスト解析部21・41,ローマ字読み判定部31・51およびローマ字読み付与部32・52と同じ構成を有している。尚、図15においては省略しているが、上記第3,第4実施の形態の場合と同様に、音声合成部,出力部,単語判定部,アルファベット読み付与部,辞書引き部,文字列辞書および単語辞書を有している。
【0075】
特定文字領域抽出部64は、上記辞書引き部および単語判定部によって英単語ではないと判定された対象英文字列を、テキスト解析部61から受け取る。そして、領域判定規則65を参照して、後に詳述する特定記号の間の文字列を特定文字領域として抽出し、抽出結果をローマ字読み判定部62に送出する。
【0076】
電子メールのアドレス行には、通常、規約に従って、特定の記号あるいは特定の記号列(以後、特定記号と言う)「From:」,「@」,「<」,「>」等が含まれている。そこで、特定文字領域抽出部64は、対象英文字列中の特定記号の存在およびその配列を調べる。そして、特定記号が、予め定められた並びの順に存在する場合には、予め定められた規則によって特定記号間の文字列を抽出するのである。そして、ローマ字読み判定部62では、この抽出された文字列に対してローマ字読みの可能性を判定し、ローマ字読みが可能であればローマ字読み付与部63でローマ字読みを付与するのである。
【0077】
以下、上記特定文字領域抽出部64による特定記号間の文字列抽出について、例を上げて説明する。ここで、電子メールのヘッダの内容が、図16に示すごとくであったとする。電子メールのFrom行には、日本では送信者名をローマ字表記する場合が多く、その場合の名前を表す英文字列にはローマ字読みを付与するべきである。そこで、先ず、送信元アドレスが記述されているFrom行の「From:」を特定記号と識別する。次に、「<」,「@」,「>」の順で特定記号が抽出される。そして、領域判定規則65を参照して、特定記号「From:」から特定記号「<」までの間の英文字列「TANAKATAROU」や、特定記号「<」から特定記号「@」までの間の英文字列「tanaka」を、ローマ字読みを優先すべき上記特定文字領域として抽出するのである。
【0078】
その結果、上記ローマ字読み判定部62によって、英文字列「TANAKATAROU」および英文字列「tanaka」がローマ字読みが可能であると判別されると、英文字列「TANAKATAROU」にはローマ字読み「たなかたろう」が付与され、英文字列「tanaka」にはローマ字読み「たなか」が付与されるのである。尚、後に、テキスト解析部61でFrom行に関する音声合成制御パラメータを生成する場合に、特定記号「<」,「@」間の英文字列のローマ字読み「たなか」に基づいて、「たなか」+「さんからのメールです」のごとく言葉を付け加えて音声合成制御パラメータを生成することも可能である。
【0079】
上述の例の場合には、上記特定記号として「From:」,「<」,「@」,「>」等を用いると共に、特定記号「From:」,「<」間および特定記号「<」,「@」間を上記特定文字領域として抽出している。しかしながら、何れの記号を特定記号とするか、何れの特定記号間を上記特定文字領域として抽出するかは、これに限定されるものではなく、予め定義して領域判定規則65に格納しておけばよい。例えば、特定記号を「“」,「”」,「(」および「)」とし、特定記号「“」,「”」間や特定記号「(」,「)」間を上記特定文字領域とすることも可能である。
【0080】
また、上記特定文字領域抽出部64は、取り込んだ対象英文字列には特定記号「From:」がなく、電子メールアドレスの文字列ではないと判定した場合には、当該対象英文字列には何も行わずにそのままローマ字読み判定部62に送出し、ローマ字読み判定部62によってローマ字読みが可能であればローマ字読みを付与するようにしてもよい。
【0081】
本実施の形態においては、電子メールのアドレス行を例に上げて説明したが、対象文字列は、フォーマットに従っており、且つ、特定記号を含むものであればこれに限るものではない。
【0082】
さらに、本実施の形態においては、上記ローマ字読み判定部62の前段に特定文字領域抽出部64を配置しているが、上記第1〜第4実施の形態におけるアルファベット読み付与部5,15,25,45の前段に特定文字領域抽出部を配置してもよい。その場合には、当該特定文字領域抽出部によって抽出された特定文字領域に対してアルファベット読みを優先させることができる。こうすることによって、ホームページのアドレス等の特定フォーマットを含む英文字列の読み上げに際して、自然な読みを付与することが可能になるのである。
【0083】
尚、上記各実施の形態においては、上記単語読み付与部6,16,26,46は単語判定部4,14,24,44に、辞書読み付与部19,29,49は辞書引き部18,28,48に、ローマ字読み付与部32,52,63はローマ字読み判定部31,51,62に、夫々搭載されている。しかしながら、この発明においては、上記単語読み付与部,辞書読み付与部,ローマ字読み付与部を、上記単語判定部,辞書引き部,ローマ字読み判定部とは独立して設けても差し支えない。
【0084】
上記各実施の形態における音声合成装置は、携帯電話や電子手帳等の比較的に文字表示領域が狭い携帯型の情報処理装置に搭載することが有効である。すなわち、このような文字表示領域が狭い携帯型情報処理装置において電子メールやインターネット情報等の内容を知る場合には、合成音声によって聞き取ることが便利である。ところが、このような電子メールやインターネット情報の内容には、アルファベット表記の英単語や英語略語あるいはローマ字表記を含むアドレス等が頻繁に出現する。
【0085】
上記各実施の形態における音声合成装置によれば、出現した英文字列を的確に英単語や英語略語やローマ字表記の名前等に識別し、英単語には英単語読み、英語略語にはアルファベット読み、ローマ字表記の名前にはローマ字読みを付与して、自然な発生での読み上げを行うことができる。したがって、携帯型の情報処理装置用の音声合成装置として非常に有効なのである。
【0086】
ところで、上記各実施の形態におけるテキスト解析部1・11・21・41,音声合成部2・12・22・42,単語判定部4・14・24・44,アルファベット付与部5・15・25・45,単語読み付与部6・16・26・46,辞書引き部18・28・48,ローマ字読み判定部31・51・62,ローマ字読み付与部32・52・63,文字列長測定部53および特定文字領域抽出部64による上記テキスト解析手段,音声合成,単語判定手段,アルファベット付与手段,単語読み付与手段,辞書引き手段,ローマ字読み判定手段,ローマ字読み付与手段,文字列長測定手段および特定文字領域抽出手段としての機能は、プログラム記録媒体に記録された音声合成処理プログラムによって実現される。上記各実施の形態における上記プログラム記録媒体は、ROM(リード・オンリ・メモリ)でなるプログラムメディアである。あるいは、外部補助記憶装置に装着されて読み出されるプログラムメディアであってもよい。尚、何れの場合においても、上記プログラムメディアから音声合成処理プログラムを読み出すプログラム読み出し手段は、上記プログラムメディアに直接アクセスして読み出す構成を有していてもよいし、RAM(ランダム・アクセス・メモリ)に設けられたプログラム記憶エリア(図示せず)にダウンロードし、上記プログラム記憶エリアにアクセスして読み出す構成を有していてもよい。尚、上記プログラムメディアから上記RAMのプログラム記憶エリアにダウンロードするためのダウンロードプログラムは、予め本体装置に格納されているものとする。
【0087】
ここで、上記プログラムメディアとは、本体側と分離可能に構成され、磁気テープやカセットテープ等のテープ系、フロッピーディスク,ハードディスク等の磁気ディスクやCD(コンパクトディスク)‐ROM,MO(光磁気)ディスク,MD(ミニディスク),DVD(ディジタルビデオディスク)等の光ディスクのディスク系、IC(集積回路)カードや光カード等のカード系、マスクROM,EPROM(紫外線消去型ROM),EEPROM(電気的消去型ROM),フラッシュROM等の半導体メモリ系を含めた、固定的にプログラムを坦持する媒体である。
【0088】
また、上記各実施の形態における音声合成装置は、モデムを備えてインターネットを含む通信ネットワークと接続可能な構成を有するように成せば、上記プログラムメディアは、通信ネットワークからのダウンロード等によって流動的にプログラムを坦持する媒体であっても差し支えない。尚、その場合における上記通信ネットワークからダウンロードするためのダウンロードプログラムは、予め本体装置に格納されているものとする。あるいは、別の記録媒体からインストールされるものとする。
【0089】
尚、上記記録媒体に記録されるものはプログラムのみに限定されるものではなく、データも記録することが可能である。
【0090】
【発明の効果】
以上より明らかなように、第1の発明の音声合成装置は、単語の綴りを表す文字列における所定位置以降の所定文字数の連続した文字列から成る部分文字列が登録された文字列辞書を備えて、単語判定手段によって、テキスト文中から読み出された他の言語による対象文字列の単語/非単語の判定を、上記対象文字列における上記所定位置以降の上記所定文字数の連続した部分文字列の並びが上記文字列辞書に存在するか否かによって行うので、文字の並び方が単語としての並び方である対象文字列のみを単語として判定することができる。したがって、この発明によれば、従来のごとく、大文字であるか小文字であるか、大文字である場合は文字数が所定値以上か否か等によって判定する場合に比して、単語/非単語を正しく判定することができる。
【0091】
さらに、上記対象文字列における上記部分文字列を用いて上記文字列辞書を引くことによって、上記対象文字列の文字の並び方に基づく単語 / 非単語の判定を簡単に短時間に行うことができる。
【0092】
さらに、上記対象文字列に対して、単語/非単語の正しい判定結果に応じて、単語である対象文字列には単語読み付与手段によって発音規則に従って単語読みを付与し、非単語である対象文字列にはアルファベット読み付与手段によって一文字ずつアルファベット読みを付与するので、自然な読みを付与することができるのである。
【0093】
また、上記第1の発明の音声合成装置は、上記単語読み付与手段を、単語の綴りと読みとが対応付けられて成る上記発音規則の上記綴りに上記対象文字列あるいはその分割文字列が該当するか否かを調べ、上記対象文字列そのものが該当する場合には該当する綴りに対応付けられている読みを、また、上記分割文字列が該当する場合には該当する綴りに対応付けられている読みを繋ぎ合わせて、上記単語読みとして付与するようにすれば、上記発音規則に上記対象文字列あるいはその分割文字列が該当するか否かを調べるだけで、簡単に単語読みを付与することができる。また、上記対象文字列が長い場合でも、上記対象文字列を分割文字列に分けて得られた読みを繋ぎ合わせることによって、簡単に単語読みを付与できる。
【0094】
また、上記第1の発明の音声合成装置は、上記対象文字列が単語辞書に在るかかを上記単語辞書を引いて判定し、る場合には上記単語辞書に記載された辞書読みを付与する辞書引き手段を備えて、未付与対象文字列判別手段によって上記辞書引き手段による処理の結果上記辞書読みが付与されなかったと判別された対象文字列に対して、単語判定指令手段によって上記単語判定手段に上記単語と非単語との判定を行わせるようになせば、上記単語判定手段による対象文字列の単語/非単語の判定に先立って、上記単語辞書に登録されている単語に対してより正確な辞書読みを付与することができる。
【0095】
また、上記第1の発明の音声合成装置は、上記単語判定手段による単語と非単語との判定に先だって、あるいは、上記単語判定手段による非単語の判定の後に、上記対象文字列をローマ字読みすることが可能か否かを判定するローマ字読み判定手段と、上記ローマ字読みが可能な対象文字列にローマ字読みを付与するローマ字読み付与手段を備えて、ローマ字読みが付与されない対象文字列に対して、上記単語判定手段による単語・非単語の判定、あるいは、上記アルファベット読み付与手段によるアルファベット読みの付与を行うようにすれば、日本語による上記テキスト文がメール文である場合に、ローマ字表記による差出人名にはローマ字読みを付与することができる。すなわち、ローマ字表記の人名等が記載されたテキスト文に対しても対処することができるのである。
【0096】
また、上記第1の発明の音声合成装置は、上記単語判定手段による単語と非単語との判定に先だって上記対象文字列の文字数を測定する文字列長測定手段を備えると共に、上記単語判定手段を、上記文字列長測定手段による測定結果を受けて、上記対象文字列の文字数が所定値以上である場合には上記単語と非単語との判定を行う一方、上記所定値に満たない場合には非単語であると判定して判定結果を上記アルファベット読み付与手段に送出するようになせば、文字数が所定値に満たない対象文字列を非単語であり且つ略語であると自動的に判定することができる。したがって、上記アルファベット表記文字列を上記文字列辞書や単語辞書等を行うことなく判定することができ、処理の簡略化と時間の短縮とを図ることができる。
【0097】
また、上記第1の発明の音声合成装置は、上記対象文字列中の特定記号及びその特定記号の配列に基づいて上記対象文字列中における特定文字領域を抽出し、抽出結果を上記ローマ字読み判定手段あるいはアルファベット読み付与手段に送出する特定文字領域抽出手段を備えれば、例えば、電子メールのFrom行における特定記号「From:」,「<」間と特定記号「<」,「@」間とに存在するローマ字表記の差出人名を上記特定文字領域として抽出して、上記ローマ字読み判定手段に送出することができる。
【0098】
すなわち、この発明によれば、上記対象文字列中において特定記号の間に配置されたローマ字表記あるいはアルファベット表記の文字列を、上記文字列辞書や単語辞書等の辞書引きを行うことなくローマ字表記あるいはアルファベット表記であると判定することができ、処理の簡略化と迅速化とを図ることができる。
【0099】
また、第2の発明の音声合成方法は、単語の綴りを表す文字列における所定位置以降の所定文字数の連続した文字列から成る部分文字列が登録された文字列辞書を参照して、テキスト文から読み出された他の言語による対象文字列の単語/非単語を判定するので、文字の並び方が単語としての並び方である対象文字列のみを単語として判定することができる。したがって、この発明によれば、従来のごとく、大文字であるか小文字であるか、大文字である場合は文字数が所定値以上か否か等によって判定する場合に比して、単語/非単語を正しく判定することができる。
【0100】
さらに、上記対象文字列における上記部分文字列を用いて上記文字列辞書を引くことによって、上記対象文字列の文字の並び方に基づく単語 / 非単語の判定を簡単に短時間に行うことができる。
【0101】
さらに、上記対象文字列に対して、単語/非単語の正しい判定結果に応じて、上記単語と判定された対象文字列に対して発音規則に従って単語読みを付与し、非単語と判定された対象文字列に対して一文字ずつアルファベット読みを付与するので、自然な読みを付与することができるのである。
【0102】
また、第3の発明の情報処理装置は、上記第1の発明の音声合成装置が搭載されているので、文字表示領域が狭い携帯端末型の情報処理装置において電子メールやインターネット情報の内容を合成音声出力によって知る場合に、電子メールやインターネット情報の内容に出現するアルファベット表記の英単語や英語略語あるいはローマ字表記を含むアドレス等が、単語であるか非単語であるか、非単語である場合にはアルファベット表記であるかローマ字表記であるかを正しく判定できる。その結果、上記正しい判定結果に従って、上記対象文字列に対して自然な読みを付与できる。
【0103】
また、第4の発明のプログラム記録媒体は、コンピュータを、上記第1の発明におけるテキスト解析手段,音声合成手段,単語判定手段,単語読み付与手段およびアルファベット読み付与手段として機能させる音声合成処理プログラムが記録されているので、上記第1の発明の場合と同様に、テキスト文中から読み出された異なる言語による対象文字列の並び方に基づいて、当該対象文字列が単語であるか非単語であるかを正しく判定できる。したがって、上記対象文字列に単語/非単語の正しい判定結果に基づいて自然な読みを付与することができる。
【図面の簡単な説明】
【図1】 この発明の音声合成装置における概略ブロック図である。
【図2】 図1に示す音声合成装置による音声合成処理動作のフローチャートである。
【図3】 図1における文字列辞書の内容の一例を示す概念図である。
【図4】 図1における単語発音規則表の内容の一例を示す概念図である。
【図5】 図1におけるアルファベット読み表の内容の一例を示す概念図である。
【図6】 図1とは異なる音声合成装置における概略ブロック図である。
【図7】 図6に示す音声合成装置による音声合成処理動作のフローチャートである。
【図8】 図1および図6とは異なる音声合成装置における概略ブロック図である。
【図9】 図8に示す音声合成装置による音声合成処理動作のフローチャートである。
【図10】 図9に示す音声合成処理動作で実行されるローマ字読み可能か否かの判定処理の詳細なフローチャートである。
【図11】 図8におけるローマ字表の内容の一例を示す概念図である。
【図12】 図9に示す音声合成処理動作の変形例のフローチャート図である。
【図13】 図1,図6および図8とは異なる音声合成装置における概略ブロック図である。
【図14】 図13に示す音声合成装置による音声合成処理動作のフローチャートである。
【図15】 図1,図6,図8および図13とは異なる音声合成装置の部分ブロック図である。
【図16】 電子メールのヘッダの一例を示す図である。
【符号の説明】
1,11,21,41,61…テキスト解析部、
2,12,22,42…音声合成部、
3,13,23,43…出力部、
4,14,24,44…単語判定部、
5,15,25,45…アルファベット読み付与部、
6,16,26,46…単語読み付与部、
7,17,27,47…文字列辞書、
8…単語発音規則表、
9…アルファベット読み表、
18,28,48…辞書引き部、
19,29,49…辞書読み付与部、
20,30,50…単語辞書、
31,51,62…ローマ字読み判定部、
32,52,63…ローマ字読み付与部、
33…ローマ字表、
53…文字列長測定部、
64…特定文字領域抽出部、
65…領域判定規則。

Claims (9)

  1. 任意の言語によるテキスト文を形態素解析して読みを付与すると共に、音声合成制御パラメータを生成するテキスト解析手段と、上記音声合成制御パラメータに基づいて音声を合成する音声合成手段を有する音声合成装置において、
    単語の綴りを表す文字列における所定位置以降の所定文字数の連続した文字列から成る部分文字列が登録された文字列辞書と、
    上記テキスト解析手段によって上記テキスト文中から読み出された上記テキスト文の言語とは異なる言語による対象文字列における上記所定位置以降の上記所定文字数の連続した部分文字列の並びが、上記文字列辞書に存在する場合には当該対象文字列は単語であると判定し、上記文字列辞書に存在しない場合には当該対象文字列は非単語であると判定する単語判定手段と、
    上記単語判定手段によって単語であると判定された対象文字列に対して、発音規則に従って単語読みを付与する単語読み付与手段と、
    上記単語判定手段によって非単語であると判定された対象文字列に対して、一文字ずつアルファベット読みを付与するアルファベット読み付与手段を備えたことを特徴とする音声合成装置。
  2. 請求項1に記載の音声合成装置において、
    上記単語読み付与手段は、
    単語の綴りと読みとが対応付けられて成る上記発音規則の上記綴りに上記対象文字列あるいはその分割文字列が該当するか否かを調べ、上記対象文字列そのものが該当する場合には該当する綴りに対応付けられている読みを、また、上記分割文字列が該当する場合には該当する綴りに対応付けられている読みを繋ぎ合わせて、上記単語読みとして付与するようになっていることを特徴とする音声合成装置。
  3. 請求項1あるいは請求項2に記載の音声合成装置において、
    上記テキスト解析手段によって上記テキスト文中から読み出された上記テキスト文の言語とは異なる言語による対象文字列が単語辞書に在るかかを上記単語辞書を引いて判定し、る場合には上記単語辞書に記載された辞書読みを付与する辞書引き手段と、
    上記辞書引き手段による処理の結果上記辞書読みが付与されなかった対象文字列を判別する辞書読み未付与対象文字列判別手段と、
    上記辞書読み未付与対象文字列判別手段の判別結果に応じて、上記単語判定手段に、上記辞書読みが付与されなかった対象文字列に対する上記単語と非単語との判定を行わせる単語判定指令手段を備えたことを特徴とする音声合成装置。
  4. 請求項1乃至請求項3の何れか一つに記載の音声合成装置において、
    上記テキスト文の言語は日本語であり、
    上記単語判定手段による単語と非単語との判定に先だって、あるいは、上記単語判定手段による非単語の判定の後に、上記対象文字列が、ローマ字読みが可能であるか否かを判定するローマ字読み判定手段と、
    上記ローマ字読みが可能であると判定された対象文字列に対してローマ字読みを付与するローマ字読み付与手段を備え
    ローマ字読みが付与されない対象文字列に対して、上記単語判定手段による単語と非単語との判定、あるいは、上記アルファベット読み付与手段によるアルファベット読みの付与が行われることを特徴とする音声合成装置。
  5. 請求項1乃至請求項4の何れか一つに記載の音声合成装置において、
    上記単語判定手段による単語と非単語との判定に先だって、上記対象文字列の文字数を測定する文字列長測定手段を備えると共に、
    上記単語判定手段は、上記文字列長測定手段による測定結果を受けて、上記対象文字列の文字数が所定値以上である場合にのみ上記単語と非単語との判定を行う一方、上記所定値に満たない場合には非単語であると判定して判定結果を上記アルファベット読み付与手段に送出することを特徴とする音声合成装置。
  6. 請求項1乃至請求項5の何れか一つに記載の音声合成装置において、
    上記対象文字列中の特定記号およびその特定記号の配列に基づいて上記対象文字列中における特定文字領域を抽出し、抽出結果を上記ローマ字読み判定手段あるいはアルファベット読み付与手段に送出する特定文字領域抽出手段を備えたことを特徴とする音声合成装置。
  7. 任意の言語によるテキスト文を形態素解析して読みを付与すると共に、音声合成制御パラメータを生成し、上記音声合成制御パラメータに基づいて音声を合成する音声合成方法において、
    単語の綴りを表す文字列における所定位置以降の所定文字数の連続した文字列から成る部分文字列が登録された文字列辞書を参照して、上記テキスト文中から読み出された上記テキスト文の言語とは異なる言語による対象文字列における上記所定位置以降の上記所定文字数の連続した部分文字列の並びが、上記文字列辞書に存在する場合には当該対象文字列は単語であると判定し、上記文字列辞書に存在しない場合には当該対象文字列は非単語であると判定するステップと、
    上記単語であると判定された対象文字列に対して、発音規則に従って単語読みを付与するステップと、
    上記非単語であると判定された対象文字列に対して、一文字ずつアルファベット読みを付与するステップを備えたことを特徴とする音声合成方法。
  8. 請求項1乃至請求項6の何れか一つに記載の音声合成装置が搭載されていることを特徴とする情報処理装置。
  9. コンピュータを、請求項1におけるテキスト解析手段,音声合成手段,単語判定手段,単語読み付与手段およびアルファベット読み付与手段として機能させる音声合成処理プログラムが記録されていることを特徴とするコンピュータ読み出し可能なプログラム記録媒体。
JP2000212826A 2000-07-13 2000-07-13 音声合成装置および方法、情報処理装置、並びに、プログラム記録媒体 Expired - Fee Related JP3635230B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2000212826A JP3635230B2 (ja) 2000-07-13 2000-07-13 音声合成装置および方法、情報処理装置、並びに、プログラム記録媒体

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2000212826A JP3635230B2 (ja) 2000-07-13 2000-07-13 音声合成装置および方法、情報処理装置、並びに、プログラム記録媒体

Publications (2)

Publication Number Publication Date
JP2002023782A JP2002023782A (ja) 2002-01-25
JP3635230B2 true JP3635230B2 (ja) 2005-04-06

Family

ID=18708679

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2000212826A Expired - Fee Related JP3635230B2 (ja) 2000-07-13 2000-07-13 音声合成装置および方法、情報処理装置、並びに、プログラム記録媒体

Country Status (1)

Country Link
JP (1) JP3635230B2 (ja)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE602004024172D1 (de) * 2004-05-21 2009-12-31 Harman Becker Automotive Sys Automatische Erzeugung einer Wortaussprache für die Spracherkennung
JP2009265279A (ja) 2008-04-23 2009-11-12 Sony Ericsson Mobilecommunications Japan Inc 音声合成装置、音声合成方法、音声合成プログラム、携帯情報端末、および音声合成システム
CN110134935B (zh) * 2018-02-08 2023-08-11 株式会社理光 一种提取字形特征的方法、装置及设备
CN112397050B (zh) * 2020-11-25 2023-07-07 北京百度网讯科技有限公司 韵律预测方法、训练方法、装置、电子设备和介质

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3071804B2 (ja) * 1990-05-16 2000-07-31 株式会社リコー 音声合成装置
JPH05298364A (ja) * 1992-04-16 1993-11-12 Fujitsu Ltd 発音記号生成方式
JPH08292873A (ja) * 1995-04-21 1996-11-05 Ricoh Co Ltd 音声合成装置
JP4462658B2 (ja) * 1998-06-08 2010-05-12 ブラザー工業株式会社 音声合成装置および記憶媒体
JP3284976B2 (ja) * 1998-06-19 2002-05-27 日本電気株式会社 音声合成装置及びコンピュータ可読記録媒体

Also Published As

Publication number Publication date
JP2002023782A (ja) 2002-01-25

Similar Documents

Publication Publication Date Title
KR100330801B1 (ko) 언어식별장치및언어식별방법
US8538743B2 (en) Disambiguating text that is to be converted to speech using configurable lexeme based rules
BRPI0719257A2 (pt) Verificação de erro de combinação de palavras com base na internet.
JP3992348B2 (ja) 形態素解析方法および装置、並びに日本語形態素解析方法および装置
JP3372532B2 (ja) 感情情報抽出方法および感情情報抽出プログラムの計算機読み取り可能な記録媒体
JP5323652B2 (ja) 類似語決定方法およびシステム
CN111143708A (zh) 搜索装置、搜索方法、搜索程序以及记录介质
JP3635230B2 (ja) 音声合成装置および方法、情報処理装置、並びに、プログラム記録媒体
KR101086550B1 (ko) 로마자 변환을 이용한 일본어 자동 추천 시스템 및 방법
CN111046627A (zh) 一种中文文字显示方法及系统
US6081773A (en) Translation apparatus and storage medium therefor
CN109992749A (zh) 一种文字显示方法、装置、电子设备及可读存储介质
JP3896341B2 (ja) 翻訳システム、翻訳方法、及び、これらを実現するプログラムと記録媒体
JP3176588B2 (ja) 手書き文字入力変換装置及び文書作成装置とコンピュータ読み取り可能な記録媒体
JPH05113964A (ja) 電子辞書
JPS646499B2 (ja)
JP2004206468A (ja) 文書管理システム及び文書管理プログラム
JP2011118861A (ja) 文書チェック装置、文書チェックプログラムおよび文書チェック方法
JP2000339342A (ja) 文書検索方法および文書検索装置
JP3949874B2 (ja) 翻訳訳語学習方法、翻訳訳語学習装置、記憶媒体及び翻訳システム
JPH09305716A (ja) 入力文字列推測認識装置
JPH11259477A (ja) 文書処理システムおよび記録媒体
JP2000276479A (ja) 電子辞書装置及び電子辞書プログラムを記録した記録媒体
JP3425329B2 (ja) 離散表現辞書装置
JP3347482B2 (ja) かな漢字変換装置

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20040416

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20040427

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20040623

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20040720

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20040915

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20041026

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20041125

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20041221

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20041228

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080107

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090107

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100107

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110107

Year of fee payment: 6

LAPS Cancellation because of no payment of annual fees