JP2006094126A - 音声合成装置 - Google Patents

音声合成装置 Download PDF

Info

Publication number
JP2006094126A
JP2006094126A JP2004276921A JP2004276921A JP2006094126A JP 2006094126 A JP2006094126 A JP 2006094126A JP 2004276921 A JP2004276921 A JP 2004276921A JP 2004276921 A JP2004276921 A JP 2004276921A JP 2006094126 A JP2006094126 A JP 2006094126A
Authority
JP
Japan
Prior art keywords
reading
comparison
procedure
phonetic data
language analysis
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2004276921A
Other languages
English (en)
Inventor
Naoya Watanabe
直哉 渡邉
Masaaki Yamada
雅章 山田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Inc
Original Assignee
Canon Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Inc filed Critical Canon Inc
Priority to JP2004276921A priority Critical patent/JP2006094126A/ja
Publication of JP2006094126A publication Critical patent/JP2006094126A/ja
Pending legal-status Critical Current

Links

Images

Landscapes

  • Telephone Function (AREA)

Abstract


【課題】 回線から到来した発信者番号情報の電話番号を、電話帳内の電話番号と比較し、一致した電話番号に対応する電話帳に記憶されている相手の名前を読み上げる場合、名前の読み間違えを起こすことがなく、ユーザの意図する読み方に、より近い読み上げをすることができる音声合成装置を提供することを目的とする。

【解決手段】 与えられた入力文章を表音データとして、読みとアクセント情報とを生成し、相手の電話番号、名前、ヨミガナ、メールアドレスを電話帳記憶部に記憶し、上記読みと、上記電話帳記憶部に記憶されているヨミガナを比較し、この比較結果が一致すると、上記表音データに基づいて、読み上げし、一方、上記比較結果が一致しなければ、上記電話帳記憶部に記憶しているヨミガナに基づいて、読み上げする音声合成装置である。

【選択図】 図1

Description

本発明は、通信回線に接続され、音声データや画像データ、メール等、マルチメディア通信に対応した情報通信装置における音声合成装置に関する。
近年、音声合成機能を持ち、たとえば発信を行う際にキー操作によるダイヤル操作や電話帳検索操作をする場合に、ダイヤルされた番号を読み上げたり、電話帳に登録されている名前を読み上げる等、使用者が装置の表示を見なくても、自分の選択した電話番号や相手先の名前を音声で確認しながら操作できる留守番電話やファクシミリ装置等の情報通信装置が知られている。
また、これら、情報通信装置の中には、通信回線から到来する発信者識別情報を取得し、発信者の電話番号や名前を音声合成機能によって読み上げることで、使用者が装置から離れた場所に存在していても、音声によって発信者を認識することができるという便利な情報通信装置も知られている。
このように音声合成機能を用いたアプリケーションで様々な読み上げを行う場合、漢字仮名混じり文や記号の入った自然文テキストを、ユーザが意図した通りに読むためには、与えられた単語をどのように読むか、どのようなアクセント、ポーズを付加して読むか、を、言語解析することが必要である。この言語解析では,「単語」と「読み」と「アクセント」とが対応付けられて登録されているテーブル(以下、「読み上げ辞書」という)を参照して解析処理に必要な情報を得ている。
また、メールアドレスをいくつかにグルーピングし、このグルーピングされたグループ毎に、ユーザ辞書を切り替える装置が知られている(たとえば、特許文献1参照)
特許第3464435号公報
ところで、たとえば回線から到来する発信者情報を参照して、電話帳に登録されている発信者の名前を読み上げる着信読み上げを行う場合、読み上げる内容は人名であったり、「ABC(株)」等、“(株)”と書いた略称で表記されたものであったりするので、様々な読み方やアクセント等が存在し、読み間違いを起こしやすく、ユーザの意図した読み方にならないケースも多い。
また、読み間違いを避けるために、電話帳に登録されている「ヨミガナ」を読み上げた場合、読み間違いはないものの、音声合成で読み上げると、抑揚のないフラットな音声アクセントの誤った音声で読み上げるので、極めて機械的な発音になり、したがって、使用者にとって好ましいものではない。
上記読み上げ辞書に登録する情報が多ければ多い程、これらの読み間違えやアクセント間違いが減少する。
しかし、読み上げ辞書に登録する単語を増せば、これにつれてデータサイズが大きくなる。つまり、必要なメモリ量が増大し、結果的に製品コストを押し上げることになる。また、辞書データをいくら増やしても、人名等の場合は、読み間違いは必ず起きる。たとえば、「剛」という漢字を、「ツヨシ」と読むべきか「タケシ」と読むべきかについて、どちらかに限定すると、人それぞれの読み方があり、ユーザの意図しない読み方になるという問題がある。
本発明は、回線から到来した発信者番号情報の電話番号を、電話帳内の電話番号と比較し、一致した電話番号に対応する電話帳に記憶されている相手の名前を読み上げる場合、名前の読み間違えを起こすことがなく、ユーザの意図する読み方に、より近い読み上げをすることができ、したがって、ユーザに利便性の高い音声合成アプリケーションを提供することができる音声合成装置を提供することを目的とするものである。
本発明は、与えられた入力文章を表音データとして、読みとアクセント情報とを生成し、相手の電話番号、名前、ヨミガナ、メールアドレスを電話帳記憶部に記憶し、上記読みと、上記電話帳記憶部に記憶されているヨミガナを比較し、この比較結果が一致すると、上記表音データに基づいて、読み上げし、一方、上記比較結果が一致しなければ、上記電話帳記憶部に記憶しているヨミガナに基づいて、読み上げする音声合成装置である。
本発明によれば、回線から到来した発信者番号情報の電話番号を、電話帳内の電話番号と比較し、一致した電話番号に対応する電話帳に記憶されている相手の名前を読み上げる場合、名前の読み間違えを起こすことがなく、ユーザの意図する読み方に、より近い読み上げをすることができ、したがって、ユーザに利便性の高い音声合成アプリケーションを提供できるという効果を奏する。
発明を実施するための最良の形態は、次の実施例である。
図1は、本発明の実施例1であるコードレス電話付きファクシミリ装置FS1を示すブロック図である。
コードレス電話付きファクシミリ装置FS1は、親機1と、子機15とを有する。
親機1は、読取部2と、記録部3と、表示部4と、メモリ5と、音声合成処理部6と、通信部7と、制御部8と、操作部9と、音声メモリ10と、D/A変換部11と、ハンドセット12と、スピーカ13と、音声経路制御部14と、無線I/F部23とを有する。
読取部2は、原稿を読み取り、ライン単位に走査を行う着脱式のスキャナ等を有する。記録部3は、画信号や装置定数等、各種レポートを印字出力する。表示部4は、登録等の操作の際におけるガイダンスや、各種警告、時刻等、装置の状態を表示し、また、着信時に回線から到来する発信者情報に基づいて、相手の電話番号や名前を表示する。
メモリ5は、各種データを保持する領域であり、ユーザが登録した電話帳や各種装置設定、FAX受信データや留守録の音声データ等を格納している。メモリ5に記憶されている電話帳には、相手先の「名前」(漢字かな混じり文)、「ヨミガナ」、「電話番号」、「メールアドレス」や「URL」が対応付けられて記憶されている。
音声合成処理部6は、入力された文章を言語解析し、表音データに変換し、その後に、デジタル信号に変換して出力する。
なお、上記「表音データ」は、カタカナの読み仮名(以下、「ヨミガナ」と記載する)に、アクセント記号(「’」等)を付加したデータである。たとえば、「雨」のヨミガナ(カタカナの読み仮名)は「アメ」であり、この表音データは、「ア’メ」である。カタカナのみのデータを音声合成で読み上げると、抑揚の無い読み方をするが、表音データを読上げさせると、抑揚のある読み方をする。
メモリ5に格納されている電話帳に相手先を登録する場合、漢字混じりの相手先名称と、上記「ヨミガナ」と、電話番号とを、セットで(対応付けて)登録する。
通信部7は、モデム、NCU(網制御装置)等を有し、通信網に接続され、通信データの授受を行う。
制御部8は、マイクロプロセッサ素子等を有し、図示しないROMに格納されているプログラムに従って、ファクシミリ装置FS1の全体を制御する。
オペレータは、操作部9を介して、電話帳の登録や装置の設定を行い、その内容が、メモリ5に記憶され、保持される。
音声メモリ10は、留守番電話などの応答に使われる応答メッセージ等の音声データが格納される。
D/A変換部11は、音声合成処理部6から出力されたデジタル信号を、一定の周期でアナログ信号に変換し、音声として出力する。
ハンドセット12は、通話に使用される。
スピーカ13は、外線や内線のモニタ音や、着信メロディ、音声合成による読み上げ音声等を出力する。
音声経路制御部14は、親機ハンドセット12の音声入出力端子と、回線入出力端子とを接続したり、親機ハンドセット12の音声入出力端子と、子機15の音声入出力端子とを接続したり、図示しないが、親機1のメロディ音源の出力端子をスピーカ13と接続したり、D/A変換部11とスピーカ13とを接続し、D/A変換部11と回線とを接続する等、各種音声デバイスを相互に接続する。
子機15は、無線I/F部16と、メモリ17と、マイク18と、制御部19と、スピーカ20と、操作部21と、表示部22とを有する。
無線I/F部16は、親機1との間で無線通信を行う際のインタフェース部であり、音声とともに親機1と子機15との間で、コマンド、データを授受する。
メモリ17は、無線I/F部16を介して、親機1から受信したデータを格納し、子機15の着信メロディを、ユーザが選択できる各種設定値等を格納している。
マイク18は、通話を行う際に使用され、音声入力、音声認識する際にも使用される。
制御部19は、マイクロプロセッサ素子を有し、図示しないROMに格納されているプログラムに従って、子機15の全体を制御する。スピーカ20は、通話を行う際に使用される。
操作部21は、オペレータが、子機15の受話音量や着信音等、詳細な設定、または子機15の専用の電話帳登録を行うことができる。
表示部22は、子機15でのダイヤル表示や、ナンバーディスプレイ機能による相手の電話番号表示を行うとともに、親機1から受信した音声認識結果等を、オペレータに表示する。
無線I/F部23は、子機15との間で無線通信を行う際のインタフェース部であり、音声とともに、親機1と子機15との間で、コマンド、データを授受する。
つまり、制御部8は、言語解析部が得た読みと、電話帳記憶部に記憶されているヨミガナとを比較する読み比較手段の例である。この比較手段は、後述する図3のS307、S308の記載に対応する。
また、音声合成処理部6は、音声合成処理手段の例である。
さらに、制御部8は、上記読み比較手段による比較結果が一致すると、上記言語解析部が得た表音データに基づいて、音声合成処理手段に読み上げさせるように制御し、一方、上記読み比較手段による比較結果が一致しなければ、上記電話帳記憶部に記憶しているヨミガナに基づいて、上記音声合成処理手段に読み上げをさせるように制御する制御手段の例である。
そして、メモリ5は、音声合成対象の表記データを保持する表記保持部の例であり、表記に対応するヨミガナを保持するヨミガナ保持部の例である。
次に、実施例1における音声合成処理部6の基本的な処理について説明する。
図2は、実施例1における音声合成処理部6の基本的な処理を示すフローチャートである。
音声合成処理部6は、言語解析部202と、音響処理部205とを有する。
言語解析部202は、読み上げ対象となる入力文章201を入力すると、読み上げ辞書データ203を参照し、入力文章をアクセント句単位に分割し、これに読みやアクセントやポーズ等の情報を付与した情報を、テキストやフレームによって表すことによって、表音データ204に変換する。
上記変換された表音データを、音響処理部205に入力すると、実施例1では、解像度8bitで表現された合成音声に変換し、デジタル信号206を得ることができる。
表音データを予め用意できるのであれば、言語解析部202で処理する必要はない。たとえば、ファクシミリ装置FS1で、ユーザがファクシミリ送信を行おうとし、「送信を開始します」というガイダンスを流す場合、{送信を開始します}のような漢字かな混じり文を、言語解析部202に与える必要はなく、アクセントやポーズ等の情報を付与した表音データの形式で{ソーシンオ/カイシシ/マ’ス.}という文章を音響処理部205に与えることによって、所望のデジタル信号を得ることができる。
なお、実施例1において、{ }は、読み上げる内容を示す記号であり、{ }で囲まれたテキストを読み上げる。
つまり、ガイダンスのように、読み上げる内容が決まっている文章を音声合成処理する場合、ファクシミリ装置FS1の内部のROM(メモリ5)に、複数パターンの表音データを記憶しさえすれば、言語解析処理をスキップすることができ、読み間違えがなく、正しい読み方で読み上げることができる。
ところで、ファクシミリ装置FS1は、回線から到来する発信者情報(NTT(登録商標)のナンバー・ディスプレイサービス、ネーム・ディスプレイサービス等)を利用し、着信時に相手の電話番号や名前を音声合成で読み上げる着信読み上げ機能を持つ。この着信読み上げ機能は、発信者の電話番号を読み上げる機能であり、上記電話番号が電話帳に記憶されている電話番号と一致した場合、番号と対応付けられている電話帳の名前を読み上げる機能である。
次に、実施例1における着信読み上げ時の処理について説明する。
図3は、実施例1における着信読み上げ時の処理を示すフローチャートである。
まず、着信時に、S301では、発信者情報を取得し、たとえば上記ナンバー・ディスプレイのサービスをユーザが享受する場合、電話番号情報を取得することができる。
ここで、情報を取得できず、ユーザがナンバー・ディスプレイサービス契約をしていなければ、S302では、「電話ですよ」等の着信を示す読み上げを行う。
上記発信者情報取得に成功すると、S303では、該当する相手が、電話帳に記憶されているかどうかを調べる。S304では、電話帳内のデータと一致したか否かを判断する。S304で、一致しないと判断されると、S305で、取得した上記電話番号情報をそのまま読み上げる。S304で、一致したと判断されると、上記電話番号情報と対応付けられて記憶されている「名前」を、S306で、言語解析部202が言語解析処理する。
言語解析部202が、入力された漢字かな混じりの「名前」を解析し、アクセント、ポーズが付与されている表音データを出力する。S307では、言語解析処理によって得られた読みを示すテキストデータと、上記電話番号情報とが対応付けられて電話帳に記憶されている「ヨミガナ」とを比較する。
S308では、テキストデータと上記「ヨミガナ」とが互いに一致すると、S310では、言語解析結果で得られた表音データを、音響処理部205に与え、読み上げる。S308で、一致しないと判断すると、S309では、電話帳の「ヨミガナ」を音響処理部205に与えて読み上げる。
図7は、制御部8から電話帳内の漢字混じりの「名前」が音声合成処理部6に出力され、音声合成処理部6の言語解析部202で作成された表音データが制御部8に出力され、制御部8で電話帳内のヨミガナと比較され、表音データまたは「ヨミガナ」が音声合成処理部6に出力され、音響処理部205でデジタル信号206が作成される様子を示す図である。
図4は、実施例1において、電話帳の内容と読み上げる内容との関係を具体的に示す図である。
図4(1)は、電話帳の記憶内容を示す図である。電話帳01には「名前」として「渡邉商店」、「ヨミガナ」として「ワタナベショウテン」、「電話番号」として「1111」が記憶され、電話帳02には「名前」として「山田剛」、「ヨミガナ」として「ヤマダタケシ」、「電話番号」として「2222」が記憶されている。
発信者番号が1111である場合、図4(2)に示すように、電話帳01とヒットし、言語解析処理に「渡邉商店」が与えられる。言語解析処理では、読み上げ辞書を参照し、{ワタナベ/ショ’ウテン}という表音データが得られる。この表音データ中のアクセント記号等を取り除いたテキストと、電話帳01の「ヨミガナ」に記憶されている「ワタナベショウテン」とが一致するので、言語解析処理で得られた表音データを、読み上げ文として読み上げる。
一方、発信者番号が2222である場合、図4(3)に示すように、電話帳02とヒットし、言語解析部202に、「山田剛」が与えられる。言語解析部202では、読み上げ辞書データ203を参照し、{ヤマダ/ツ’ヨシ}という表音データを得る。この表音データ中のアクセント記号等を取り除いたテキストと、電話帳02の「ヨミガナ」に記憶された「ヤマダタケシ」とは一致しない。したがって、読み上げ文としては、電話帳の「ヨミガナ」に記憶されているデータに基づいて、読み上げ文として、{ヤマダタケシ}というアクセント記号が付与されていない表音データを読み上げる。
次に、実施例1において、着信読み上げ時に、言語解析部202が複数の表音データを出力する動作について説明する。
図5は、実施例1において、着信読み上げ時に、言語解析部202が複数の表音データを出力する動作を示すフローチャートである。
着信時に、S501では、発信者情報を取得し、たとえば上記ナンバー・ディスプレイのサービスを、ユーザが享受する場合、電話番号情報を取得できる。ここで情報を取得できない場合や、ユーザがナンバー・ディスプレイサービスの契約をしていない場合、S502では、「電話ですよ」等の着信を示す読み上げを行う。上記発信者情報取得に成功すれば、S503で、電話帳に該当する相手が記憶されているかどうかを調べる。
S504で、電話帳内のデータと一致しているかどうかを判断する。S504で、一致しないと判断されると、S505で、取得した上記電話番号情報をそのまま読み上げる。S504で、一致したと判断されると、上記電話番号情報と対応付けられて記憶されている「名前」を、S506で、言語解析部202が言語解析する。言語解析部202において、入力された漢字かな混じりである「名前」を解析し、アクセント、ポーズが付与されている表音データを出力する。
ここで、言語解析部202に入力される文によっては、言語解析部202は、複数個の表音データを出力することがある。たとえば「剛」という漢字について、「ツヨシ」、「タケシ」、「ゴウ」等、複数の表音データの読み情報を出力する。フローチャート上では、N個の表音データの候補を出力する。S507では、何番目の候補であるかを示す変数iを、1に初期化し、S508で、i番目の表音データの読みを示すテキストデータと上記電話番号情報とが対応付けられて電話帳に記憶されている「ヨミガナ」を比較する。S509で、双方が互いに一致すれば、S510で、言語解析結果で得られた表音データを、音響処理部205に与え、読み上げる。
S509で、一致しないと判断されると、S511で、変数iを加算し、次の表音データと比較するために、S508に進む。これらの動作を順次繰り返し、iがNに達するまでに、表音データと、上記電話番号情報と対応付けられて電話帳に記憶されている「ヨミガナ」とが互いに一致しなければ、S512で、電話帳の「ヨミガナ」を、音響処理部205に与え、読み上げる。
ここでも、データの流れは図7のようになる。
図6は、実施例1において、電話帳の内容と読み上げる内容との関係を具体的に示す図である。
図6(1)は、電話帳の記憶内容を示す図である。電話帳01には、「名前」として「渡邉商店」、「ヨミガナ」として「ワタナベショウテン」、「電話番号」として「1111」が記憶され、電話帳02には、「名前」として「山田剛」、「ヨミガナ」として「ヤマダタケシ」、「電話番号」として「2222」が記憶されている。
発信者番号が1111である場合、電話帳01とヒットし言語解析部202に「渡邉商店」が与えられる。言語解析部202では、読み上げ辞書データ203を参照し、図6(2)に示すように、{ワタナベ/ショ’ウテン}という1個の表音データが得られる。この表音データ中のアクセント記号等を取り除いたテキストと、電話帳01の「ヨミガナ」に記憶された「ワタナベショウテン」とが一致するので、言語解析部202で得られた表音データを、読み上げ文として読み上げる。
一方、発信者番号が2222である場合、電話帳02とヒットし言語解析部202に「山田剛」が与えられる。言語解析部202では、読み上げ辞書データ203を参照し、図6(3)に示すように、{ヤマダ/ツ’ヨシ}、{ヤマダ/タ’ケシ}、{ヤマダ/ゴ’ウ}という3個の表音データが得られる。この表音データ中のアクセント記号等を取り除いたテキストと、電話帳02の「ヨミガナ」に記憶されている「ヤマダタケシ」とを順次比較すると、2番目の{ヤマダ/タ’ケシ}が一致する。したがって、言語解析部202で得られた2番目の表音データを、読み上げ文として読み上げる。
本発明の実施例2は、相手のメールアドレスと「名前」と「ヨミガナ」を記憶できる電話帳(アドレス帳)を持ち、受信したメールを音声で読み上げるときに、送信元を、メールアドレスで読まずに、電話帳(アドレス帳)に記憶されている名前で読む場合、電話帳の「名前」を言語解析した結果と、電話帳の「ヨミガナ」とが、互いに一致すれば、言語解析結果を読み上げ、互いに一致しなければ、「ヨミガナ」で読み上げる実施例である。
実施例1で使用した電話帳は、電話機やファクシミリ装置の電話帳であるが、さらに、これらの電話機やファクシミリ装置にメール機能を持たせたものがあり、実施例2では、それらで使用する電話帳として、実施例1の電話帳に、各相手先のメールアドレスを記憶できる領域を設けたものである。
また、実施例2では,「名前」、「ヨミガナ」を、それぞれ言語解析して比較するが、「名前」と「ヨミガナ」との前後に、文字を付加した文字列を、言語解析するようにしてもよい。たとえば、「山田剛さんから電話です」を言語解析部202で言語解析して得られた表音データに含まれている読み「ヤマダツヨシサンカラデンワデス」と、「ヤマダタケシさんから電話です」とを、言語解析し、この結果得られた表音データに含まれている読み「ヤマダタケシサンカラデンワデス」とを比較するようにしてもよい。
さらに、「ヨミガナ」の前後に文字を付加する場合、文字列の結合による悪影響を避けるために、「ヨミガナ」の前後に適当な文字列を付与するようにしてもよい。たとえば、引用符を付与し、「“ヤマダタケシ”さんから電話です」とするようにしてもよい。
なお、上記実施例を、通信回線に接続され、音声データや画像データ、メール等、マルチメディア通信に対応した情報通信装置に適用するようにしてもよい。
また、本実施例2において、コンピュータ上で動作するソフトウェアとして本願を実施することも出来、その場合、メールソフトのアドレス帳を使用して本願を実施してもよい。メールソフトのアドレス帳には、相手のメールアドレスと相手の漢字混じりの「名前」と「ヨミガナ」が登録できればよく、電話番号は無くても良い。
なお、上記実施例をプログラムの発明として把握することができる。つまり、上記実施例は、文章を読み上げる音声合成装置を制御するプログラムにおいて、与えられた入力文章を表音データとして、読みとアクセント情報とを生成する言語解析手順と、相手の電話番号、名前、ヨミガナをメモリに記憶する電話帳記憶手順と、上記言語解析手順で得た上記読みと、上記メモリに記憶したヨミガナとを比較する読み比較手順と、上記読み比較手順における比較結果が一致すると、上記言語解析手順で得た表音データに基づいて、音声合成処理手順で読み上げさせるように制御し、一方、上記読み比較手順における比較結果が一致しなければ、上記メモリに記憶したヨミガナに基づいて、上記音声合成処理手順で読み上げをさせるように制御する制御手順とをコンピュータに実行させるプログラムの例である。
また、上記実施例は、文章を読み上げる音声合成装置を制御するプログラムにおいて、与えられた入力文章を表音データとして、読みとアクセント情報とを生成する言語解析手順と、相手の名前、ヨミガナをメモリに記憶する電話帳記憶手順と、上記言語解析手順で得た上記読みと、上記メモリに記憶したヨミガナとを比較する読み比較手順と、上記読み比較手順における比較結果が一致すると、上記言語解析手順で得た表音データに基づいて、音声合成処理手順で読み上げさせるように制御し、一方、上記読み比較手順における比較結果が一致しなければ、上記メモリに記憶したヨミガナに基づいて、上記音声合成処理手順で読み上げをさせるように制御する制御手順とをコンピュータに実行させるプログラムの例である。
さらに、上記実施例は、文章を読み上げる音声合成装置を制御するプログラムにおいて、与えられた入力文章に応じて、表音データとして、読みとアクセント情報とを複数生成する言語解析手順と、相手の名前、ヨミガナをメモリに記憶する電話帳記憶手順と、上記言語解析手順で得た複数の表音データの上記読み情報と、上記メモリに記憶したヨミガナとを、順次比較する読み順次比較手順と、上記読み順次比較手順によって順次比較し、上記複数の表音データの読み情報のうちでどれか1つでも、上記メモリに記憶したヨミガナと一致する表音データの読み情報が存在すれば、上記言語解析手順で得た音響情報に基づいて、音声合成処理手順で読み上げをさせるように制御し、一方、上記読み比較手順による比較の結果、どの読み情報とも一致しなければ、上記メモリに記憶したヨミガナに基づいて、上記音声合成処理手順に読み上げするように制御する制御手順とをコンピュータに実行させるプログラムの例である。
そして、上記実施例は、文章を読み上げる音声合成装置を制御するプログラムにおいて、与えられた入力文章に応じて、表音データとして、読みとアクセント情報とを複数生成する言語解析手順と、相手の名前、ヨミガナをメモリに記憶するアドレス記憶手順と、上記言語解析手順で得た複数の表音データの上記読み情報と、上記メモリに記憶したヨミガナとを、順次比較する読み順次比較手順と、上記読み順次比較手順によって順次比較し、上記複数の表音データの読み情報のうちでどれか1つでも、上記メモリに記憶したヨミガナと一致する表音データの読み情報が存在すれば、上記言語解析手順で得た音響情報に基づいて、音声合成処理手順で読み上げをさせるように制御し、一方、上記読み比較手順による比較の結果、どの読み情報とも一致しなければ、上記メモリに記憶したヨミガナに基づいて、上記音声合成処理手順に読み上げするように制御する制御手順とをコンピュータに実行させるプログラムの例である。
上記の場合、上記電話帳記憶手順は、メールアドレスを記憶する記憶手順である。
また、上記実施例は、音声合成対象の表記データを保持する表記保持手順と、上記表記に対応するヨミガナをメモリに保持するヨミガナ保持手順と、単語と読みとアクセントとを対応付けて登録されている読み上げ辞書を用い、上記メモリに保持した表記を、読みやアクセントで構成される表音データに変換する言語解析手順と、上記言語解析手順で得た表音データ中の読みと、上記メモリに保持したヨミガナとを比較する読み比較手順と、上記読み比較手順における比較結果が一致すれば、上記言語解析手順によって得られた表音データに基づいて、音声合成処理手順で読み上げを行わせるように制御し、一方、上記読み比較手順における比較結果が一致しなければ、上記メモリに保持したヨミガナに基づいて、上記音声合成処理手順で読み上げを行うように制御する制御手順とをコンピュータに実行させるプログラムの例である。
そして、上記実施例は、音声合成対象の表記を保持する表記保持手順と、上記表記に対応するヨミガナをメモリに保持するヨミガナ保持手順と、上記表記の前後またはその一方に、文字列を付与することによって、第1の文字列を得る手順と、上記ヨミガナの前後またはその一方に、文字列を付与することによって、第2の文字列を得る手順と、読み上げ辞書を用いて、入力文字列を、読みやアクセントの情報で構成される表音データに変換する言語解析手順と、上記第1の文字列を言語解析処理することによって、第1の表音データを得る手順と、上記第2の文字列を言語解析処理することによって、第2の表音データを得る手順と、上記第1の表音データ中の読みと、上記第2の表音データ中の読みとを比較する読み比較手順と、上記読み比較手順における比較結果が一致すれば、上記第1の表音データに基づいて、上記音声合成処理手順で読み上げをさせるように制御し、一方、上記読み比較手順における比較結果が一致しなければ、上記第2の表音データに基づいて、上記音声合成処理手順で読み上げを行うように制御する制御手順とをコンピュータに実行させるプログラムの例である。
本発明の実施例1であるコードレス電話付きファクシミリ装置FS1を示すブロック図である。 実施例1における音声合成処理部6の基本的な処理を示すフローチャートである。 実施例1における着信読み上げ時の処理を示すフローチャートである。 実施例1において、電話帳の内容と読み上げる内容との関係を具体的に示す図である。 実施例1において、着信読み上げ時に、言語解析部202が複数の表音データを出力する動作を示すフローチャートである。 実施例1において、電話帳の内容と読み上げる内容との関係を具体的に示す図である。 制御部8から電話帳内の漢字混じりの「名前」が音声合成処理部6に出力され、音声合成処理部6の言語解析部202で作成された表音データが制御部8に出力され、制御部8で電話帳内のヨミガナと比較され、表音データまたは「ヨミガナ」が音声合成処理部6に出力され、音響処理部205でデジタル信号206が作成される様子を示す図である。
符号の説明
FS1…コードレス電話付きファクシミリ装置、
1…親機、
5…メモリ、
6…音声合成処理部、
8…制御部、
9…操作部、
10…音声メモリ、
12…ハンドセット、
15…子機、
17…メモリ、
19…制御部、
22…表示部。

Claims (21)

  1. 文章を読み上げる音声合成装置において、
    与えられた入力文章を表音データとして、読みとアクセント情報とを生成する言語解析部と;
    相手の電話番号、名前、ヨミガナを記憶する電話帳記憶部と;
    上記言語解析部が得た上記読みと、上記電話帳記憶部に記憶されているヨミガナとを比較する読み比較手段と;
    上記読み比較手段による比較結果が一致すると、上記言語解析部が得た表音データに基づいて、音声合成処理手段に読み上げさせるように制御し、一方、上記読み比較手段による比較結果が一致しなければ、上記電話帳記憶部に記憶しているヨミガナに基づいて、上記音声合成処理手段に読み上げをさせるように制御する制御手段と;
    を有することを特徴とする音声合成装置。
  2. 文章を読み上げる音声合成装置において、
    与えられた入力文章を表音データとして、読みとアクセント情報とを生成する言語解析部と;
    相手の名前、ヨミガナを記憶する電話帳記憶部と;
    上記言語解析部が得た上記読みと、上記電話帳記憶部に記憶されているヨミガナとを比較する読み比較手段と;
    上記読み比較手段による比較結果が一致すると、上記言語解析部が得た表音データに基づいて、音声合成処理手段に読み上げさせるように制御し、一方、上記読み比較手段による比較結果が一致しなければ、上記電話帳記憶部に記憶しているヨミガナに基づいて、上記音声合成処理手段に読み上げをさせるように制御する制御手段と;
    を有することを特徴とする音声合成装置。
  3. 文章を読み上げる音声合成装置において、
    与えられた入力文章に応じて、表音データとして、読みとアクセント情報とを複数生成する言語解析部と;
    相手の名前、ヨミガナを記憶する電話帳記憶部と;
    上記言語解析部が得た複数の表音データの上記読み情報と、上記電話帳記憶部に記憶されているヨミガナとを、順次比較する読み順次比較手段と;
    上記読み順次比較手段によって順次比較し、上記複数の表音データの読み情報のうちでどれか1つでも、上記電話帳に記憶されたヨミガナと一致する表音データの読み情報が存在すれば、上記言語解析部が得た音響情報に基づいて、音声合成処理手段に読み上げをさせるように制御し、一方、上記読み比較手段による比較の結果、どの読み情報とも一致しなければ、上記電話帳記憶部に記憶されているヨミガナに基づいて、上記音声合成処理手段に読み上げするように制御する制御手段と;
    を有することを特徴とする音声合成装置。
  4. 文章を読み上げる音声合成装置において、
    与えられた入力文章に応じて、表音データとして、読みとアクセント情報とを複数生成する言語解析部と;
    相手の名前、ヨミガナを記憶するアドレス記憶部と;
    上記言語解析部が得た複数の表音データの上記読み情報と、上記アドレス記憶部に記憶されているヨミガナとを、順次比較する読み順次比較手段と;
    上記読み順次比較手段によって順次比較し、上記複数の表音データの読み情報のうちでどれか1つでも、上記アドレス記憶部に記憶されたヨミガナと一致する表音データの読み情報が存在すれば、上記言語解析部が得た音響情報に基づいて、音声合成処理手段に読み上げをさせるように制御し、一方、上記読み比較手段による比較の結果、どの読み情報とも一致しなければ、上記アドレス記憶部に記憶されているヨミガナに基づいて、上記音声合成処理手段に読み上げするように制御する制御手段と;
    を有することを特徴とする音声合成装置。
  5. 請求項1〜請求項4のいずれか1項において、
    上記電話帳記憶部は、メールアドレスを記憶する記憶部であることを特徴とする音声合成装置。
  6. 音声合成対象の表記データを保持する表記保持部と;
    上記表記に対応するヨミガナを保持するヨミガナ保持部と;
    単語と読みとアクセントとを対応付けて登録されている読み上げ辞書を用い、上記表記保持部に保持されている表記を、読みやアクセントで構成される表音データに変換する言語解析部と;
    上記言語解析部が得た表音データ中の読みと、上記ヨミガナ保持部に保持されているヨミガナとを比較する読み比較手段と;
    上記読み比較手段による比較結果が一致すれば、上記言語解析部によって得られた表音データに基づいて、音声合成処理手段に読み上げを行わせるように制御し、一方、上記読み比較手段による比較結果が一致しなければ、上記表記保持部に記憶されているヨミガナに基づいて、上記音声合成処理手段に読み上げを行うように制御する制御手段と;
    を有することを特徴とする音声合成処理装置。
  7. 音声合成対象の表記を保持する表記保持部と;
    上記表記に対応するヨミガナを保持するヨミガナ保持部と;
    上記表記の前後またはその一方に、文字列を付与することによって、第1の文字列を得る手段と;
    上記ヨミガナの前後またはその一方に、文字列を付与することによって、第2の文字列を得る手段と;
    読み上げ辞書を用いて、入力文字列を、読みやアクセントの情報で構成される表音データに変換する言語解析部と;
    上記第1の文字列を言語解析処理することによって、第1の表音データを得る手段と;
    上記第2の文字列を言語解析処理することによって、第2の表音データを得る手段と;
    上記第1の表音データ中の読みと、上記第2の表音データ中の読みとを比較する読み比較手段と;
    上記読み比較手段による比較結果が一致すれば、上記第1の表音データに基づいて、上記音声合成処理手段に読み上げをさせるように制御し、一方、上記読み比較手段による比較結果が一致しなければ、上記第2の表音データに基づいて、上記音声合成処理手段に読み上げを行うように制御する制御手段と;
    を有することを特徴とする音声合成処理装置。
  8. 文章を読み上げる音声合成装置の制御方法において、
    与えられた入力文章を表音データとして、読みとアクセント情報とを生成する言語解析工程と;
    相手の電話番号、名前、ヨミガナをメモリに記憶する電話帳記憶工程と;
    上記言語解析工程で得た上記読みと、上記メモリに記憶したヨミガナとを比較する読み比較工程と;
    上記読み比較工程における比較結果が一致すると、上記言語解析工程で得た表音データに基づいて、音声合成処理工程で読み上げさせるように制御し、一方、上記読み比較工程における比較結果が一致しなければ、上記メモリに記憶したヨミガナに基づいて、上記音声合成処理工程で読み上げをさせるように制御する制御工程と;
    を有することを特徴とする音声合成装置の制御方法。
  9. 文章を読み上げる音声合成装置の制御方法において、
    与えられた入力文章を表音データとして、読みとアクセント情報とを生成する言語解析工程と;
    相手の名前、ヨミガナをメモリに記憶する電話帳記憶工程と;
    上記言語解析工程で得た上記読みと、上記メモリに記憶したヨミガナとを比較する読み比較工程と;
    上記読み比較工程における比較結果が一致すると、上記言語解析工程で得た表音データに基づいて、音声合成処理工程で読み上げさせるように制御し、一方、上記読み比較工程における比較結果が一致しなければ、上記メモリに記憶したヨミガナに基づいて、上記音声合成処理工程で読み上げをさせるように制御する制御工程と;
    を有することを特徴とする音声合成装置の制御方法。
  10. 文章を読み上げる音声合成装置の制御方法において、
    与えられた入力文章に応じて、表音データとして、読みとアクセント情報とを複数生成する言語解析工程と;
    相手の名前、ヨミガナをメモリに記憶する電話帳記憶工程と;
    上記言語解析工程で得た複数の表音データの上記読み情報と、上記メモリに記憶したヨミガナとを、順次比較する読み順次比較工程と;
    上記読み順次比較工程によって順次比較し、上記複数の表音データの読み情報のうちでどれか1つでも、上記メモリに記憶したヨミガナと一致する表音データの読み情報が存在すれば、上記言語解析工程で得た音響情報に基づいて、音声合成処理工程で読み上げをさせるように制御し、一方、上記読み比較工程による比較の結果、どの読み情報とも一致しなければ、上記メモリに記憶したヨミガナに基づいて、上記音声合成処理工程に読み上げするように制御する制御工程と;
    を有することを特徴とする音声合成装置の制御方法。
  11. 文章を読み上げる音声合成装置の制御方法において、
    与えられた入力文章に応じて、表音データとして、読みとアクセント情報とを複数生成する言語解析工程と;
    相手の名前、ヨミガナをメモリに記憶するアドレス記憶工程と;
    上記言語解析工程で得た複数の表音データの上記読み情報と、上記メモリに記憶したヨミガナとを、順次比較する読み順次比較工程と;
    上記読み順次比較工程によって順次比較し、上記複数の表音データの読み情報のうちでどれか1つでも、上記メモリに記憶したヨミガナと一致する表音データの読み情報が存在すれば、上記言語解析工程で得た音響情報に基づいて、音声合成処理工程で読み上げをさせるように制御し、一方、上記読み比較工程による比較の結果、どの読み情報とも一致しなければ、上記メモリに記憶したヨミガナに基づいて、上記音声合成処理工程に読み上げするように制御する制御工程と;
    を有することを特徴とする音声合成装置の制御方法。
  12. 請求項8〜請求項11のいずれか1項において、
    上記電話帳記憶工程は、メールアドレスを記憶する記憶工程であることを特徴とする音声合成装置の制御方法。
  13. 音声合成対象の表記データを保持する表記保持工程と;
    上記表記に対応するヨミガナをメモリに保持するヨミガナ保持工程と;
    単語と読みとアクセントとを対応付けて登録されている読み上げ辞書を用い、上記メモリに保持した表記を、読みやアクセントで構成される表音データに変換する言語解析工程と;
    上記言語解析工程で得た表音データ中の読みと、上記メモリに保持したヨミガナとを比較する読み比較工程と;
    上記読み比較工程における比較結果が一致すれば、上記言語解析工程によって得られた表音データに基づいて、音声合成処理工程で読み上げを行わせるように制御し、一方、上記読み比較工程における比較結果が一致しなければ、上記メモリに保持したヨミガナに基づいて、上記音声合成処理工程で読み上げを行うように制御する制御工程と;
    を有することを特徴とする音声合成処理装置の制御方法。
  14. 音声合成対象の表記を保持する表記保持工程と;
    上記表記に対応するヨミガナをメモリに保持するヨミガナ保持工程と;
    上記表記の前後またはその一方に、文字列を付与することによって、第1の文字列を得る工程と;
    上記ヨミガナの前後またはその一方に、文字列を付与することによって、第2の文字列を得る工程と;
    読み上げ辞書を用いて、入力文字列を、読みやアクセントの情報で構成される表音データに変換する言語解析工程と;
    上記第1の文字列を言語解析処理することによって、第1の表音データを得る工程と;
    上記第2の文字列を言語解析処理することによって、第2の表音データを得る工程と;
    上記第1の表音データ中の読みと、上記第2の表音データ中の読みとを比較する読み比較工程と;
    上記読み比較工程における比較結果が一致すれば、上記第1の表音データに基づいて、上記音声合成処理工程で読み上げをさせるように制御し、一方、上記読み比較工程における比較結果が一致しなければ、上記第2の表音データに基づいて、上記音声合成処理工程で読み上げを行うように制御する制御工程と;
    を有することを特徴とする音声合成処理装置の制御方法。
  15. 文章を読み上げる音声合成装置を制御するプログラムにおいて、
    与えられた入力文章を表音データとして、読みとアクセント情報とを生成する言語解析手順と;
    相手の電話番号、名前、ヨミガナをメモリに記憶する電話帳記憶手順と;
    上記言語解析手順で得た上記読みと、上記メモリに記憶したヨミガナとを比較する読み比較手順と;
    上記読み比較手順における比較結果が一致すると、上記言語解析手順で得た表音データに基づいて、音声合成処理手順で読み上げさせるように制御し、一方、上記読み比較手順における比較結果が一致しなければ、上記メモリに記憶したヨミガナに基づいて、上記音声合成処理手順で読み上げをさせるように制御する制御手順と;
    をコンピュータに実行させるプログラム。
  16. 文章を読み上げる音声合成装置を制御するプログラムにおいて、
    与えられた入力文章を表音データとして、読みとアクセント情報とを生成する言語解析手順と;
    相手の名前、ヨミガナをメモリに記憶する電話帳記憶手順と;
    上記言語解析手順で得た上記読みと、上記メモリに記憶したヨミガナとを比較する読み比較手順と;
    上記読み比較手順における比較結果が一致すると、上記言語解析手順で得た表音データに基づいて、音声合成処理手順で読み上げさせるように制御し、一方、上記読み比較手順における比較結果が一致しなければ、上記メモリに記憶したヨミガナに基づいて、上記音声合成処理手順で読み上げをさせるように制御する制御手順と;
    をコンピュータに実行させるプログラム。
  17. 文章を読み上げる音声合成装置を制御するプログラムにおいて、
    与えられた入力文章に応じて、表音データとして、読みとアクセント情報とを複数生成する言語解析手順と;
    相手の名前、ヨミガナをメモリに記憶する電話帳記憶手順と;
    上記言語解析手順で得た複数の表音データの上記読み情報と、上記メモリに記憶したヨミガナとを、順次比較する読み順次比較手順と;
    上記読み順次比較手順によって順次比較し、上記複数の表音データの読み情報のうちでどれか1つでも、上記メモリに記憶したヨミガナと一致する表音データの読み情報が存在すれば、上記言語解析手順で得た音響情報に基づいて、音声合成処理手順で読み上げをさせるように制御し、一方、上記読み比較手順による比較の結果、どの読み情報とも一致しなければ、上記メモリに記憶したヨミガナに基づいて、上記音声合成処理手順に読み上げするように制御する制御手順と;
    をコンピュータに実行させるプログラム。
  18. 文章を読み上げる音声合成装置を制御するプログラムにおいて、
    与えられた入力文章に応じて、表音データとして、読みとアクセント情報とを複数生成する言語解析手順と;
    相手の名前、ヨミガナをメモリに記憶するアドレス記憶手順と;
    上記言語解析手順で得た複数の表音データの上記読み情報と、上記メモリに記憶したヨミガナとを、順次比較する読み順次比較手順と;
    上記読み順次比較手順によって順次比較し、上記複数の表音データの読み情報のうちでどれか1つでも、上記メモリに記憶したヨミガナと一致する表音データの読み情報が存在すれば、上記言語解析手順で得た音響情報に基づいて、音声合成処理手順で読み上げをさせるように制御し、一方、上記読み比較手順による比較の結果、どの読み情報とも一致しなければ、上記メモリに記憶したヨミガナに基づいて、上記音声合成処理手順に読み上げするように制御する制御手順と;
    をコンピュータに実行させるプログラム。
  19. 請求項15〜請求項18のいずれか1項において、
    上記電話帳記憶手順は、メールアドレスを記憶する記憶手順であることを特徴とするプログラム。
  20. 音声合成対象の表記データを保持する表記保持手順と;
    上記表記に対応するヨミガナをメモリに保持するヨミガナ保持手順と;
    単語と読みとアクセントとを対応付けて登録されている読み上げ辞書を用い、上記メモリに保持した表記を、読みやアクセントで構成される表音データに変換する言語解析手順と;
    上記言語解析手順で得た表音データ中の読みと、上記メモリに保持したヨミガナとを比較する読み比較手順と;
    上記読み比較手順における比較結果が一致すれば、上記言語解析手順によって得られた表音データに基づいて、音声合成処理手順で読み上げを行わせるように制御し、一方、上記読み比較手順における比較結果が一致しなければ、上記メモリに保持したヨミガナに基づいて、上記音声合成処理手順で読み上げを行うように制御する制御手順と;
    をコンピュータに実行させるプログラム。
  21. 音声合成対象の表記を保持する表記保持手順と;
    上記表記に対応するヨミガナをメモリに保持するヨミガナ保持手順と;
    上記表記の前後またはその一方に、文字列を付与することによって、第1の文字列を得る手順と;
    上記ヨミガナの前後またはその一方に、文字列を付与することによって、第2の文字列を得る手順と;
    読み上げ辞書を用いて、入力文字列を、読みやアクセントの情報で構成される表音データに変換する言語解析手順と;
    上記第1の文字列を言語解析処理することによって、第1の表音データを得る手順と;
    上記第2の文字列を言語解析処理することによって、第2の表音データを得る手順と;
    上記第1の表音データ中の読みと、上記第2の表音データ中の読みとを比較する読み比較手順と;
    上記読み比較手順における比較結果が一致すれば、上記第1の表音データに基づいて、上記音声合成処理手順で読み上げをさせるように制御し、一方、上記読み比較手順における比較結果が一致しなければ、上記第2の表音データに基づいて、上記音声合成処理手順で読み上げを行うように制御する制御手順と;
    をコンピュータに実行させるプログラム。
JP2004276921A 2004-09-24 2004-09-24 音声合成装置 Pending JP2006094126A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2004276921A JP2006094126A (ja) 2004-09-24 2004-09-24 音声合成装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2004276921A JP2006094126A (ja) 2004-09-24 2004-09-24 音声合成装置

Publications (1)

Publication Number Publication Date
JP2006094126A true JP2006094126A (ja) 2006-04-06

Family

ID=36234670

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2004276921A Pending JP2006094126A (ja) 2004-09-24 2004-09-24 音声合成装置

Country Status (1)

Country Link
JP (1) JP2006094126A (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009258293A (ja) * 2008-04-15 2009-11-05 Mitsubishi Electric Corp 音声認識語彙辞書作成装置
JP2010039277A (ja) * 2008-08-06 2010-02-18 Mitsubishi Electric Corp 音声合成装置

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009258293A (ja) * 2008-04-15 2009-11-05 Mitsubishi Electric Corp 音声認識語彙辞書作成装置
JP2010039277A (ja) * 2008-08-06 2010-02-18 Mitsubishi Electric Corp 音声合成装置

Similar Documents

Publication Publication Date Title
JP3884851B2 (ja) 通信システムおよびこれに用いられる無線通信端末装置
JP2005318467A (ja) 通信端末装置および通信端末処理プログラム
JP2005346252A (ja) 情報伝達システムおよび情報伝達方法
JPH1079785A (ja) 電話端末装置
KR100759728B1 (ko) 텍스트 메시지를 제공하는 방법 및 장치
JP3452250B2 (ja) 無線携帯端末通信システム
JP2006094126A (ja) 音声合成装置
JP4525376B2 (ja) 音声−数字変換装置および音声−数字変換プログラム
JP2007264466A (ja) 音声合成装置
JP4070963B2 (ja) 移動体通信機器
JP4721399B2 (ja) 音声出力装置、音声出力方法、およびプログラム
JP3873747B2 (ja) 通信装置
JP3694698B2 (ja) 音楽データ生成システム、音楽データ生成サーバ装置
JP7327939B2 (ja) 情報処理システム、情報処理装置、制御方法、プログラム
JP2003333203A (ja) 音声合成システム、サーバ装置および情報処理方法ならびに記録媒体、プログラム
JP2010276869A (ja) 自動翻訳対応電話機および自動翻訳対応電話システム
JP5007209B2 (ja) ユーザデータ管理システム、情報提供システム、およびユーザデータ管理方法
TWI258685B (en) Character input device
JP2002218016A (ja) 携帯電話機及び携帯電話機を用いた翻訳方法
JP2009069979A (ja) 予測候補辞書の登録方法、予測候補登録機能付き電子機器、及び予測候補登録プログラム
KR100571079B1 (ko) 휴대 단말 장치
JP2011070028A (ja) 文字変換装置及び文字変換方法
JP4042580B2 (ja) 発音記述言語による音声合成をする端末装置
KR100620001B1 (ko) 이동 통신 단말기에서 주소록 관리 장치 및 방법
KR100501896B1 (ko) 점자 입/출력 기능을 가진 무선통신 단말기 및 점자입/출력 방법