JP3848181B2 - 音声合成装置及びその方法、プログラム - Google Patents
音声合成装置及びその方法、プログラム Download PDFInfo
- Publication number
- JP3848181B2 JP3848181B2 JP2002062298A JP2002062298A JP3848181B2 JP 3848181 B2 JP3848181 B2 JP 3848181B2 JP 2002062298 A JP2002062298 A JP 2002062298A JP 2002062298 A JP2002062298 A JP 2002062298A JP 3848181 B2 JP3848181 B2 JP 3848181B2
- Authority
- JP
- Japan
- Prior art keywords
- output
- word
- voice
- meaning
- document data
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
- 238000000034 method Methods 0.000 title claims description 34
- 230000015572 biosynthetic process Effects 0.000 title claims description 10
- 238000003786 synthesis reaction Methods 0.000 title claims description 10
- 238000001308 synthesis method Methods 0.000 claims description 8
- 230000002194 synthesizing effect Effects 0.000 claims description 5
- 230000007717 exclusion Effects 0.000 claims description 4
- 230000006870 function Effects 0.000 description 18
- 238000010586 diagram Methods 0.000 description 5
- 239000002245 particle Substances 0.000 description 5
- 238000004590 computer program Methods 0.000 description 2
- 230000000694 effects Effects 0.000 description 1
- 239000000284 extract Substances 0.000 description 1
- 239000012634 fragment Substances 0.000 description 1
- 238000009434 installation Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000003825 pressing Methods 0.000 description 1
- 230000000717 retained effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L13/00—Speech synthesis; Text to speech systems
Landscapes
- Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Document Processing Apparatus (AREA)
- Machine Translation (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Description
【発明の属する技術分野】
本発明は、文書データを音声出力する音声合成装置及びその方法、プログラムに関するものである。
【0002】
【従来の技術】
従来、コンピュータで管理される文書データ中の単語の参照機能としては、表示上の文字列をカット&ペーストするなどして使用できるオンライン辞書がある。また、ハイパーテキストなどのリンク機能を使用する単語の参照機能などもある。また、これらの参照機能には、文字コードや、2次元の画像として表示される文字情報の表示位置に対して参照要求を出すものある。
【0003】
また、特開平10-171485号の「音声合成装置」や特開平5-22487号の「日本文読み上げ単語編集処理方式」では、ユーザが理解しにくいと想定した単語や、多義による誤解の生じる可能性のある単語を、あらかじめ他の単語や語義に置換してから読み上げることを行っている。
【0004】
また、特開平10-134068号の「情報獲得支援方法および装置」では、文書を表示しながら音声出力し、その表示文書中の単語を音声認識の認識語彙として登録しておき、ユーザが発声した単語についてその単語の意味や用例を提示する。
【0005】
【発明が解決しようとする課題】
上記のオンライン辞書やハイパーテキストの例では、文書データの表示が前提となり、ユーザは文書データ中の文字コードや位置情報で調べたい単語を指定するものである。そのため、参照対象の単語を含む文書データの表示を前提とせず、ユーザが音声のみで情報獲得を行う場合の利用を前提とした場合の単語の指定には使用できない。
【0006】
また、特開平10-171485号や特開平5-22487号のように、ユーザが理解しにくいと想定した単語や、多義による誤解の生じる可能性のある単語を、あらかじめ他の単語や語義に置換してから読み上げる方法では、もとの文書データを最初から加工してしまうので、文学作品などのオリジナリティを尊重しなくてはならない文書データには適さない。また、語学学習のためなどに文書データを聞いているときには、最初から平易な単語に置き換えては、本来の学習の用途に適さない。
【0007】
更に、特開平10-134068号のように、ユーザが発声した単語を音声認識してその単語の意味や用例を提示する方法では、音がうまく聞き取れなかった場合にユーザがその単語を指定する方法がなくなってしまう。
【0008】
加えて、携帯型オーディオ装置のように、ヘッドフォーンを装着したまま移動しながら、その音を聞くような利用を考慮した場合、表示を常時注目しなくても、気がついた時点でその箇所を指摘できるような機能が必要とされている。
【0009】
本発明は上記の課題を解決するためになされたものであり、容易にかつ効率的に出力文中の語の語義を提供することができる音声合成装置及びその方法、プログラムを提供することを目的とする。
【0010】
【課題を解決するための手段】
上記の目的を達成するための本発明による音声合成装置は以下の構成を備える。即ち、
文書データを音声出力する音声合成装置であって、
音声出力される文書データ中の語に対する語義説明要求が入力された場合、その語義説明要求入力までに音声出力された既出力文書データを文解析する解析手段と、
前記解析手段の解析結果に基づいて得られる、前記語義説明要求の直前に音声出力された語義説明要求対象語に対応する語義文を出力する出力手段とを備え、
前記語義説明要求が入力された場合、前記出力手段は、前記既出力文書データを、前回の出力速度より遅い出力速度で再出力し、
前記解析手段は、前記再出力される既出力文書データに対して入力される語義説明要求に基づいて、該既出力文書データを解析する。
【0011】
上記の目的を達成するための本発明による音声合成装置は以下の構成を備える。即ち、
文書データを音声合成して音声出力する音声出力手段と、
前記音声出力手段による音声出力中に、音声出力される文書データ中の語に対する語義説明要求が入力された場合、前記文書データを前回の出力速度よりも遅い速度でかつ、読み上げ文の各語を区切りながら読み上げる第2音声出力手段と、
前記第2音声出力手段による音声出力中に、音声出力される文書データ中の語に対する語義説明要求が入力された場合、その語義説明要求入力までに音声出力された既出力文書データを文解析する解析手段と、
前記解析手段の解析結果に基づいて得られる、前記語義説明要求の直前に音声出力された語義説明要求対象語に対応する語義文を出力する出力手段と
を備える。
【0012】
上記の目的を達成するための本発明による音声合成方法は以下の構成を備える。即ち、
文書データを音声出力する音声合成方法であって、
音声出力される文書データ中の語に対する語義説明要求が入力された場合、その語義説明要求入力までに音声出力された既出力文書データを文解析する解析工程と、
前記解析工程の解析結果に基づいて得られる、前記語義説明要求の直前に音声出力された語義説明要求対象語に対応する語義文を出力する出力工程とを備え、
前記語義説明要求が入力された場合、前記出力工程は、前記既出力文書データを、前回の出力速度より遅い出力速度で再出力し、
前記解析工程は、前記再出力される既出力文書データに対して入力される語義説明要求に基づいて、該既出力文書データを解析する。
【0013】
上記の目的を達成するための本発明による音声合成方法は以下の構成を備える。
文書データを音声合成して音声出力する音声出力工程と、
前記音声出力工程による音声出力中に、音声出力される文書データ中の語に対する語義 説明要求が入力された場合、前記文書データを前回の出力速度よりも遅い速度でかつ、読み上げ文の各語を区切りながら読み上げる第2音声出力工程と、
前記第2音声出力工程による音声出力中に、音声出力される文書データ中の語に対する語義説明要求が入力された場合、その語義説明要求入力までに音声出力された既出力文書 データを文解析する解析工程と、
前記解析工程の解析結果に基づいて得られる、前記語義説明要求の直前に音声出力された語義説明要求対象語に対応する語義文を出力する出力工程と
を備える。
【0014】
上記の目的を達成するための本発明によるプログラムは以下の構成を備える。即ち、
文書データを音声出力する音声合成をコンピュータに機能させるためのプログラムであって、
音声出力される文書データ中の語に対する語義説明要求が入力された場合、その語義説明要求入力までに音声出力された既出力文書データを文解析する解析工程と、
前記解析工程の解析結果に基づいて得られる、前記語義説明要求の直前に音声出力された語義説明要求対象語に対応する語義文を出力する出力工程とをコンピュータに実行させることを特徴とし、
前記語義説明要求が入力された場合、前記出力工程は、前記既出力文書データを、前回の出力速度より遅い出力速度で再出力し、
前記解析工程は、前記再出力される既出力文書データに対して入力される語義説明要求に基づいて、該既出力文書データを解析する。
【0015】
上記の目的を達成するための本発明によるプログラムは以下の構成を備える。即ち、
文書データを音声出力する音声合成をコンピュータに機能させるためのプログラムであって、
文書データを音声合成して音声出力する音声出力工程と、
前記音声出力工程による音声出力中に、音声出力される文書データ中の語に対する語義説明要求が入力された場合、前記文書データを前回の出力速度よりも遅い速度でかつ、読み上げ文の各語を区切りながら読み上げる第2音声出力工程と、
前記第2音声出力工程による音声出力中に、音声出力される文書データ中の語に対する語義説明要求が入力された場合、その語義説明要求入力までに音声出力された既出力文書データを文解析する解析工程と、
前記解析工程の解析結果に基づいて得られる、前記語義説明要求の直前に音声出力された語義説明要求対象語に対応する語義文を出力する出力工程と
をコンピュータに実行させる。
【0020】
【発明の実施の形態】
以下、図面を参照して本発明の一実施形態を詳細に説明する。
【0021】
図1は本発明の実施形態の音声合成装置の機能構成を示すブロック図である。
【0022】
101は語義検索部であり、語の語義を検索する。102は語義辞書であり、各種語の見出しと語義を蓄積する。103はユーザ指示入力部であり、読み上げ文書データ109に対する読み上げ開始・読み上げ停止や語義説明要求等の各種要求のユーザからの指示を入力する。
【0023】
尚、このユーザ指示入力部103は、例えば、端末上に配置されたボタンや、音声入力によって実現される。
【0024】
104は同期管理部であり、ユーザの指示や、読み上げ音声の出力終了などのメッセージを監視し、その同期を管理する。105は文解析部であり、読み上げ文書データ109や語義を受け取り、その言語解析を行う。
【0025】
106は波形データ作成部であり、文解析部105の解析結果に基づいて音声波形データを作成する。107は音声出力部であり、波形データを音として出力する。
【0026】
108は文入力部であり、読み上げ文書データ109から、読み上げ対象単位(例えば、1文)ずつ切り出して文解析部105へ送信する。この読み上げ対象単位は、文単位に限定されず、段落単位や行単位であっても良い。
【0027】
109は読み上げ文書データである。この読み上げ文書データ109は、予め記憶されていてもよいし、DVD−ROM/RAM、CD−ROM/R/RW等の記憶媒体に記憶されたものを外部記憶装置を介して登録しても良い。また、インターネットや電話回線等のネットワークを介して登録しても良い。
【0028】
110は文解析に使用する解析用辞書である。111は波形データ作成部106で使用する音素群からなる素片辞書である。
【0029】
尚、音声合成装置は、汎用コンピュータに搭載される標準的な構成要素(例えば、CPU、RAM、ROM、ハードディスク、外部記憶装置、マイク、スピーカ、ネットワークインタフェース、ディスプレイ、キーボード、マウス等)を有している。
【0030】
また、音声合成装置の各種機能は、音声合成装置内部のROMや外部記憶装置に記憶されるプログラムがCPUによって実行されることによって実現されても良いし、専用のハードウエアで実現されても良い。
【0031】
次に、本実施形態の音声合成装置で実行される処理について、図2を用いて説明する。
【0032】
図2は本発明の実施形態の音声合成装置で実行される処理を示すフローチャートである。
【0033】
尚、図2のフローチャートでは、スタートとエンドを設けており、本実施形態では、読み上げ開始要求でスタートし読み上げ停止要求でエンドとすることとする。
【0034】
まず、ステップS201で、ユーザ指示入力部103からのメッセージ待ちに入る。これは図1の同期管理部104で行い、常にユーザ指示の入力や音声出力の終了等のメッセージの終了を管理する。ここで検知したメッセージによって、それ以後の処理の振り分けが行われる。
【0035】
ステップS202で、同期管理部104は、そのメッセージが読み上げ開始要求であるか否かを判定する。読み上げ開始要求である場合(ステップS202でyes)、ステップS203に進み、現在、音声出力中であるか否かを判定する。音声出力中である場合(ステップS203でyes)、出力中の音声を消してしまわないために、ステップS201に戻り、メッセージ待ちを行う。
【0036】
一方、音声出力中でない場合(ステップS203でno)、ステップS204に進み、文入力部108は、読み上げ文書データ109から読み出し文の切り出しを行う。ここでは、文入力部108は、上述のように、読み上げ文書データ109から1つの読み上げ文を切り出す。読み上げ文の解析は、1文ごとに行い、その際には、その読み取った位置を記録しておく。
【0037】
ステップS205で、文解析部105は、読み上げ文の有無を判定する。読み上げ文がない場合(ステップS205でno)、つまり、読み上げ文書データから1文づつ切り出して、最後まで読み上げてしまったら、ここで読み上げ文がないとして、エンドとなる。
【0038】
一方、読み上げ文がある場合(ステップS205でyes)、ステップS206に進み、文解析部106は、その読み上げ文の文解析を行う。文解析が終了すると、ステップS207で、波形データ作成を行う。そして、ステップS208で、音声出力部107は、作成された波形データに基づく音声出力で行う。音声データが最後まで終了した時点で、音声出力終了のメッセージを同期管理部104に送信し、ステップS201に戻る。
【0039】
尚、文解析部105は、読み上げ文の解析結果を保持し、音声出力部107での出力に同期して、読み上げ文中のどの語まで読み上げたかを記録している。
【0040】
また、ステップS206、ステップS207、ステップS208の一連の処理は、別スレッドもしくは別プロセスで行い、処理の終了を待たずに、ステップS206を開始した時点で、ステップS201へ戻る。
【0041】
一方、ステップS202において、メッセージが読み上げ開始要求でない場合(ステップS202でno)、ステップS209に進み、同期管理部104は、メッセージが音声出力終了であるか否かを判定する。音声出力終了である場合(ステップS209でyes)、ステップS204へ進み、読み上げの継続を行う。
【0042】
一方、音声出力終了でない場合(ステップS209でyes)、ステップS210に進み、同期管理部104は、メッセージが語義説明要求であるか否かを判定する。語義説明要求である場合(ステップS210でyes)、ステップS211に進み、文解析部105は、語義説明要求入力直前までに音声出力された既出力文書データを解析し、その既出力文書データから語義説明要求対象語の推定を行う。
【0043】
これは、文解析部105において、現在音声出力中の文について、文解析結果とその語まで出力したかを調べ直前の語を同定する。例えば、図3に示すような読み上げ文に対し、読み上げ途中でユーザから語義説明要求があると、その時点で読み上げられている「の」という語での語義説明要求があったとみなす。
【0044】
語義説明要求対象語を推定した後、ステップS212で、語義検索部101は、その語義説明要求対象語に対応する語義文検索を行う。これは通常の電子辞書のように、見出し語とその語義文のペア語義辞書として保持しておき、見出し語から語義文を取り出す。動詞などの活用語の場合も、文の解析結果を用いて見出し語を同定するので、動詞「ある」の連用形「あっ」を指示した場合でも、見出し語「ある」を同定できる。
【0045】
尚、語義文検索で、語義説明要求対象語が語義辞書に登録されていない場合は、「この語の意味は分かりません」というメッセージ文を語義文の代わりとする。
【0046】
語義文検索の後、ステップS213で、同期管理部104は、音声出力のクリア、つまり、音声出力中の場合にはその出力の取り消しを行う。
【0047】
その後、ステップS205で、語義検索結果の語義文を読み上げ文として、その文があることを確認して、ステップS206、ステップS207、ステップS208の一連の処理を行う。この一連の処理は、上述と同様に、別スレッドもしくは別プロセスに指示して、処理の終了を待たずに、ステップS206を開始した時点で、ステップS201へ戻る。
【0048】
この語義文の音声出力が終了すると、音声出力終了のメッセージを同期管理部104へ送信し、ステップS201へ戻る。そして、ステップS204により、語義説明要求が送信された直後の文からの読み上げを再開する。
【0049】
一方、ステップS210において、語義説明要求でない場合(ステップS210でno)、ステップS214に進み、同期管理部104は、メッセージが読み上げ停止要求であるか否かを判定する。読み上げ停止要求でない場合(ステップS214でno)、処理未定のメッセージとして無視し、ステップS201のメッセージ待ちに戻る。
【0050】
一方、読み上げ停止要求である場合(ステップS214でyes)、ステップS215に進み、同期管理部104は、現在出力中の音声があれば、出力を停止して、処理を終了する。
【0051】
以上説明したように、本実施形態によれば、読み上げ中の文に対して参照したい語がある場合に、その文の表示を見なくてもその参照したい語を、語義説明要求によって指定することができ、かつその参照したい語の意味をその場で確認することができる。
【0052】
尚、上記実施形態では、語義説明要求の直前の音声出力された語を語義説明要求対象語としたが、ユーザが聞き取って分からないと判断しヘルプボタンを押すなどして語義説明要求を発声させるまでには、タイムラグが発生することが想定される。従って、図3の語義説明2のように、語義説明要求があった時点より溯って語義説明要求対象語を推定するようにしてもよい。
【0053】
例えば、抽象度の高い語や重要度や難易度の低い語や、助詞などの機能的に働く語には語義説明対象外フラグを設けておき、文の解析結果である語を一つ一つ溯りながら、語義説明対象外の語を排除して行く。図3の語義説明2では、「の(格助詞)」、「か(準体助詞)」、「どう(副詞)」、「か(準体助詞)」、「た(助動詞)」、「あっ(動詞・ある)」、「が(格助詞)」を排除し、「殺意」まで溯って語義説明要求対象語と推定する。
【0054】
尚、語義説明対象外フラグについては、例えば、解析用辞書110に保持して、解析結果として付与するようにしてもよい。
【0055】
また、語義辞書102の収録語数を予め減らしておき、検索対象の語義辞書102に登録されている語を検索できるまで、語の検索を繰り返すようにしてもよい。
【0056】
また、図3の語義説明3にあるように、一度目の語義説明要求を対象文特定のための要求とみなし、前回の出力速度よりも遅い出力速度で、読み上げ文の各語を区切りながら読み上げ、二度目の語義説明要求があった時点でその直前の語を、語義説明要求対象語とみなすようにしてもよい。
【0057】
上記実施形態では、語義文を音声で読み上げるようにしたが、文字として画面表示するようにしてもよい。図4は、その一例を示すための図である。図4では、特に、読み上げの開始・停止・早送り・早戻し・語義のヘルプなどを指示するユーザ指示のための各種ボタン401〜405と、読み上げ文を表示するテキスト表示部分406を有する携帯端末上での外観を示している。
【0058】
図4(a)では、読み上げ途中で「?(ヘルプ)」ボタン405を押して語義説明要求を出すと、テキストの読み上げを一端中止し、図4(b)のように語義の説明文を表示する。ユーザが語義の説明を読み「?」ボタン405もしくは「開始」ボタン402を再度押すと、画面表示をもとに戻して読み上げを再開する。
【0059】
また、図4(c)のように、読み上げ途中の文書中に語義文を埋め込むなどして、合わせて表示するようにしてもよい。
【0060】
また、語義説明要求のためのボタンは本体のみでなく、即座に押せるような箇所、例えば、リモートボタンと同じ箇所に設けてもよい。
【0061】
上記実施形態では、語義辞書102を内部で個別に保持し利用しているが、別のプロセスとして稼動している市販のオンライン辞書と組み合わせ、見出し語を渡してその語義文を受け取り、その語義文の文字列を読み上げるようにしてもよい。
【0062】
尚、語義説明要求のあった直後の文切り出しでは、一文もとに戻すようにして、語義説明要求がおくられた文から重複して読み上げを再開するようにしてもよい。
【0063】
以上、実施形態例を詳述したが、本発明は、複数の機器から構成されるシステムに適用しても良いし、また、一つの機器からなる装置に適用しても良い。
【0064】
尚、本発明は、前述した実施形態の機能を実現するソフトウェアのプログラム(実施形態では図2に示すフローチャートに対応したプログラム)を、システム或いは装置に直接或いは遠隔から供給し、そのシステム或いは装置のコンピュータが該供給されたプログラムコードを読み出して実行することによっても達成される場合を含む。その場合、プログラムの機能を有していれば、形態は、プログラムである必要はない。
【0065】
従って、本発明の機能処理をコンピュータで実現するために、該コンピュータにインストールされるプログラムコード自体も本発明を実現するものである。つまり、本発明は、本発明の機能処理を実現するためのコンピュータプログラム自体も含まれる。
【0066】
その場合、プログラムの機能を有していれば、オブジェクトコード、インタプリタにより実行されるプログラム、OSに供給するスクリプトデータ等、プログラムの形態を問わない。
【0067】
プログラムを供給するための記録媒体としては、例えば、フロッピー(登録商標)ディスク、ハードディスク、光ディスク、光磁気ディスク、MO、CD−ROM、CD−R、CD−RW、磁気テープ、不揮発性のメモリカード、ROM、DVD(DVD−ROM,DVD−R)などがある。
【0068】
その他、プログラムの供給方法としては、クライアントコンピュータのブラウザを用いてインターネットのホームページに接続し、該ホームページから本発明のコンピュータプログラムそのもの、もしくは圧縮され自動インストール機能を含むファイルをハードディスク等の記録媒体にダウンロードすることによっても供給できる。また、本発明のプログラムを構成するプログラムコードを複数のファイルに分割し、それぞれのファイルを異なるホームページからダウンロードすることによっても実現可能である。つまり、本発明の機能処理をコンピュータで実現するためのプログラムファイルを複数のユーザに対してダウンロードさせるWWWサーバも、本発明に含まれるものである。
【0069】
また、本発明のプログラムを暗号化してCD−ROM等の記憶媒体に格納してユーザに配布し、所定の条件をクリアしたユーザに対し、インターネットを介してホームページから暗号化を解く鍵情報をダウンロードさせ、その鍵情報を使用することにより暗号化されたプログラムを実行してコンピュータにインストールさせて実現することも可能である。
【0070】
また、コンピュータが、読み出したプログラムを実行することによって、前述した実施形態の機能が実現される他、そのプログラムの指示に基づき、コンピュータ上で稼動しているOSなどが、実際の処理の一部または全部を行ない、その処理によっても前述した実施形態の機能が実現され得る。
【0071】
さらに、記録媒体から読み出されたプログラムが、コンピュータに挿入された機能拡張ボードやコンピュータに接続された機能拡張ユニットに備わるメモリに書き込まれた後、そのプログラムの指示に基づき、その機能拡張ボードや機能拡張ユニットに備わるCPUなどが実際の処理の一部または全部を行ない、その処理によっても前述した実施形態の機能が実現される。
【0072】
【発明の効果】
以上説明したように、本発明によれば、容易にかつ効率的に出力文中の語の語義を提供することができる音声合成装置及びその方法、プログラムを提供できる。
【図面の簡単な説明】
【図1】本発明の実施形態の音声合成装置の機能構成を示すブロック図である。
【図2】本発明の実施形態の音声合成装置で実行される処理を示すフローチャートである。
【図3】本発明の実施形態の語義説明要求対象語の文解析部105の動作例を説明するための図である。
【図4】本発明の実施形態の応用例を示す図である。
【符号の説明】
101 語義検索部
102 語義辞書
103 ユーザ指示入力部
104 同期管理部
105 文解析部
106 波形データ作成部
107 音声出力部
108 文入力部
109 読み上げ文書データ
110 解析用辞書
111 素片辞書
Claims (12)
- 文書データを音声出力する音声合成装置であって、
音声出力される文書データ中の語に対する語義説明要求が入力された場合、その語義説明要求入力までに音声出力された既出力文書データを文解析する解析手段と、
前記解析手段の解析結果に基づいて得られる、前記語義説明要求の直前に音声出力された語義説明要求対象語に対応する語義文を出力する出力手段とを備え、
前記語義説明要求が入力された場合、前記出力手段は、前記既出力文書データを、前回の出力速度より遅い出力速度で再出力し、
前記解析手段は、前記再出力される既出力文書データに対して入力される語義説明要求に基づいて、該既出力文書データを解析する
ことを特徴とする音声合成装置。 - 前記解析手段は、前記既出力文書データ中の所定語以外の語群から語義説明要求対象語を推定する
ことを特徴とする請求項1に記載の音声合成装置。 - 前記所定語は、語義説明対象外フラグを有する語である
ことを特徴とする請求項2に記載の音声合成装置。 - 前記所定語は、少なくとも名詞以外の品詞を有する語である
ことを特徴とする請求項2に記載の音声合成装置。 - 文書データを音声合成して音声出力する音声出力手段と、
前記音声出力手段による音声出力中に、音声出力される文書データ中の語に対する語義説明要求が入力された場合、前記文書データを前回の出力速度よりも遅い速度でかつ、読み上げ文の各語を区切りながら読み上げる第2音声出力手段と、
前記第2音声出力手段による音声出力中に、音声出力される文書データ中の語に対する語義説明要求が入力された場合、その語義説明要求入力までに音声出力された既出力文書データを文解析する解析手段と、
前記解析手段の解析結果に基づいて得られる、前記語義説明要求の直前に音声出力された語義説明要求対象語に対応する語義文を出力する出力手段と
を備えることを特徴とする音声合成装置。 - 文書データを音声出力する音声合成方法であって、
音声出力される文書データ中の語に対する語義説明要求が入力された場合、その語義説明要求入力までに音声出力された既出力文書データを文解析する解析工程と、
前記解析工程の解析結果に基づいて得られる、前記語義説明要求の直前に音声出力された語義説明要求対象語に対応する語義文を出力する出力工程とを備え、
前記語義説明要求が入力された場合、前記出力工程は、前記既出力文書データを、前回の出力速度より遅い出力速度で再出力し、
前記解析工程は、前記再出力される既出力文書データに対して入力される語義説明要求に基づいて、該既出力文書データを解析する
ことを特徴とする音声合成方法。 - 前記解析工程は、前記既出力文書データ中の所定語以外の語群から語義説明要求対象語を推定する
ことを特徴とする請求項6に記載の音声合成方法。 - 前記所定語は、語義説明対象外フラグを有する語である
ことを特徴とする請求項7に記載の音声合成方法。 - 前記所定語は、少なくとも名詞以外の品詞を有する語である
ことを特徴とする請求項7に記載の音声合成方法。 - 文書データを音声合成して音声出力する音声出力工程と、
前記音声出力工程による音声出力中に、音声出力される文書データ中の語に対する語義説明要求が入力された場合、前記文書データを前回の出力速度よりも遅い速度でかつ、読み上げ文の各語を区切りながら読み上げる第2音声出力工程と、
前記第2音声出力工程による音声出力中に、音声出力される文書データ中の語に対する語義説明要求が入力された場合、その語義説明要求入力までに音声出力された既出力文書データを文解析する解析工程と、
前記解析工程の解析結果に基づいて得られる、前記語義説明要求の直前に音声出力された語義説明要求対象語に対応する語義文を出力する出力工程と
を備えることを特徴とする音声合成方法。 - 文書データを音声出力する音声合成をコンピュータに機能させるためのプログラムであって、
音声出力される文書データ中の語に対する語義説明要求が入力された場合、その語義説明要求入力までに音声出力された既出力文書データを文解析する解析工程と、
前記解析工程の解析結果に基づいて得られる、前記語義説明要求の直前に音声出力された語義説明要求対象語に対応する語義文を出力する出力工程とをコンピュータに実行させることを特徴とし、
前記語義説明要求が入力された場合、前記出力工程は、前記既出力文書データを、前回の出力速度より遅い出力速度で再出力し、
前記解析工程は、前記再出力される既出力文書データに対して入力される語義説明要求に基づいて、該既出力文書データを解析する
ことを特徴とするプログラム。 - 文書データを音声出力する音声合成をコンピュータに機能させるためのプログラムであって、
文書データを音声合成して音声出力する音声出力工程と、
前記音声出力工程による音声出力中に、音声出力される文書データ中の語に対する語義説明要求が入力された場合、前記文書データを前回の出力速度よりも遅い速度でかつ、読み上げ文の各語を区切りながら読み上げる第2音声出力工程と、
前記第2音声出力工程による音声出力中に、音声出力される文書データ中の語に対する語義説明要求が入力された場合、その語義説明要求入力までに音声出力された既出力文書データを文解析する解析工程と、
前記解析工程の解析結果に基づいて得られる、前記語義説明要求の直前に音声出力された語義説明要求対象語に対応する語義文を出力する出力工程と
をコンピュータに実行させることを特徴とするプログラム。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2002062298A JP3848181B2 (ja) | 2002-03-07 | 2002-03-07 | 音声合成装置及びその方法、プログラム |
US10/376,205 US7353175B2 (en) | 2002-03-07 | 2003-03-04 | Apparatus, method, and program for speech synthesis with capability of providing word meaning immediately upon request by a user |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2002062298A JP3848181B2 (ja) | 2002-03-07 | 2002-03-07 | 音声合成装置及びその方法、プログラム |
Publications (3)
Publication Number | Publication Date |
---|---|
JP2003263184A JP2003263184A (ja) | 2003-09-19 |
JP2003263184A5 JP2003263184A5 (ja) | 2004-11-18 |
JP3848181B2 true JP3848181B2 (ja) | 2006-11-22 |
Family
ID=29196136
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2002062298A Expired - Fee Related JP3848181B2 (ja) | 2002-03-07 | 2002-03-07 | 音声合成装置及びその方法、プログラム |
Country Status (2)
Country | Link |
---|---|
US (1) | US7353175B2 (ja) |
JP (1) | JP3848181B2 (ja) |
Families Citing this family (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP4743686B2 (ja) * | 2005-01-19 | 2011-08-10 | 京セラ株式会社 | 携帯端末装置、およびその音声読み上げ方法、並びに音声読み上げプログラム |
US20090063152A1 (en) * | 2005-04-12 | 2009-03-05 | Tadahiko Munakata | Audio reproducing method, character code using device, distribution service system, and character code management method |
JP2007086185A (ja) * | 2005-09-20 | 2007-04-05 | Mitsubishi Electric Corp | 音声合成装置 |
WO2009072412A1 (ja) * | 2007-12-03 | 2009-06-11 | Nec Corporation | 読み上げシステム、読み上げ方法、読み上げプログラム、および記録媒体 |
KR102020334B1 (ko) | 2010-01-19 | 2019-09-10 | 돌비 인터네셔널 에이비 | 고조파 전위에 기초하여 개선된 서브밴드 블록 |
CN102314874A (zh) * | 2010-06-29 | 2012-01-11 | 鸿富锦精密工业(深圳)有限公司 | 文本到语音转换系统与方法 |
Family Cites Families (16)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5351189A (en) * | 1985-03-29 | 1994-09-27 | Kabushiki Kaisha Toshiba | Machine translation system including separated side-by-side display of original and corresponding translated sentences |
US4890230A (en) * | 1986-12-19 | 1989-12-26 | Electric Industry Co., Ltd. | Electronic dictionary |
JPS63231396A (ja) * | 1987-03-20 | 1988-09-27 | 株式会社日立製作所 | 情報出力方式 |
DE3840433A1 (de) * | 1988-12-01 | 1990-06-07 | Philips Patentverwaltung | Echokompensator |
GB9103768D0 (en) * | 1991-02-22 | 1991-04-10 | King Reginald A | Educational apparatus |
JPH0522487A (ja) | 1991-07-16 | 1993-01-29 | Canon Inc | 画像通信装置 |
US5541838A (en) * | 1992-10-26 | 1996-07-30 | Sharp Kabushiki Kaisha | Translation machine having capability of registering idioms |
US5623609A (en) * | 1993-06-14 | 1997-04-22 | Hal Trust, L.L.C. | Computer system and computer-implemented process for phonology-based automatic speech recognition |
US5577164A (en) * | 1994-01-28 | 1996-11-19 | Canon Kabushiki Kaisha | Incorrect voice command recognition prevention and recovery processing method and apparatus |
JP3322140B2 (ja) * | 1996-10-03 | 2002-09-09 | トヨタ自動車株式会社 | 車両用音声案内装置 |
JPH10134068A (ja) | 1996-10-29 | 1998-05-22 | Nippon Telegr & Teleph Corp <Ntt> | 情報獲得支援方法及び装置 |
JPH10171485A (ja) | 1996-12-12 | 1998-06-26 | Matsushita Electric Ind Co Ltd | 音声合成装置 |
EP0972254A1 (en) * | 1997-04-01 | 2000-01-19 | Yeong Kuang Oon | Didactic and content oriented word processing method with incrementally changed belief system |
JP2000267687A (ja) * | 1999-03-19 | 2000-09-29 | Mitsubishi Electric Corp | 音声応答装置 |
US6704699B2 (en) * | 2000-09-05 | 2004-03-09 | Einat H. Nir | Language acquisition aide |
JP2002259373A (ja) * | 2001-02-27 | 2002-09-13 | Sony Corp | 辞書装置 |
-
2002
- 2002-03-07 JP JP2002062298A patent/JP3848181B2/ja not_active Expired - Fee Related
-
2003
- 2003-03-04 US US10/376,205 patent/US7353175B2/en not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
US7353175B2 (en) | 2008-04-01 |
JP2003263184A (ja) | 2003-09-19 |
US20030212560A1 (en) | 2003-11-13 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP3610083B2 (ja) | マルチメディアプレゼンテーション装置および方法 | |
US6181351B1 (en) | Synchronizing the moveable mouths of animated characters with recorded speech | |
US7257534B2 (en) | Speech synthesis system for naturally reading incomplete sentences | |
US8027837B2 (en) | Using non-speech sounds during text-to-speech synthesis | |
JP5257330B2 (ja) | 発言記録装置、発言記録方法、プログラム及び記録媒体 | |
US6490553B2 (en) | Apparatus and method for controlling rate of playback of audio data | |
US20030046071A1 (en) | Voice recognition apparatus and method | |
JP2004005530A (ja) | 音声対話インターフェースを利用した情報提供装置及びその方法 | |
JP2000081892A (ja) | 効果音付加装置および効果音付加方法 | |
JP2012181358A (ja) | テキスト表示時間決定装置、テキスト表示システム、方法およびプログラム | |
EP3573051A1 (en) | Information processing device, information processing method, and program | |
JP2009042968A (ja) | 情報選別システム、情報選別方法及び情報選別用プログラム | |
EP0899737A2 (en) | Script recognition using speech recognition | |
JP4314201B2 (ja) | 歌詞と音楽との同期データ作成方法、装置、プログラムおよびプログラムを記録する記録媒体 | |
JPH11175517A (ja) | 情報処理装置およびその方法 | |
JP3848181B2 (ja) | 音声合成装置及びその方法、プログラム | |
CN109065019B (zh) | 一种面向智能机器人的故事数据处理方法及系统 | |
US20050144015A1 (en) | Automatic identification of optimal audio segments for speech applications | |
WO2020121638A1 (ja) | 情報処理装置、情報処理システム、および情報処理方法、並びにプログラム | |
JP2001272990A (ja) | 対話記録編集装置 | |
JP2002157112A (ja) | 音声情報変換装置 | |
JP6347939B2 (ja) | 発話内重要語抽出装置とその装置を用いた発話内重要語抽出システムと、それらの方法とプログラム | |
JP2009146043A (ja) | 音声翻訳装置、音声翻訳方法、及びプログラム | |
JP2001325250A (ja) | 議事録作成装置および議事録作成方法および記録媒体 | |
JP2004020739A (ja) | 議事録作成装置、議事録作成方法、議事録作成プログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20051114 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20051121 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20060118 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20060210 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20060406 |
|
A911 | Transfer to examiner for re-examination before appeal (zenchi) |
Free format text: JAPANESE INTERMEDIATE CODE: A911 Effective date: 20060510 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20060529 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20060704 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20060804 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20060824 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20090901 Year of fee payment: 3 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20100901 Year of fee payment: 4 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20110901 Year of fee payment: 5 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20110901 Year of fee payment: 5 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120901 Year of fee payment: 6 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120901 Year of fee payment: 6 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130901 Year of fee payment: 7 |
|
LAPS | Cancellation because of no payment of annual fees |