JP3962733B2 - 音声合成方法および装置 - Google Patents

音声合成方法および装置 Download PDF

Info

Publication number
JP3962733B2
JP3962733B2 JP2004246813A JP2004246813A JP3962733B2 JP 3962733 B2 JP3962733 B2 JP 3962733B2 JP 2004246813 A JP2004246813 A JP 2004246813A JP 2004246813 A JP2004246813 A JP 2004246813A JP 3962733 B2 JP3962733 B2 JP 3962733B2
Authority
JP
Japan
Prior art keywords
utterance
utterance content
content
speech
interrupted
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2004246813A
Other languages
English (en)
Other versions
JP2006064959A (ja
Inventor
雅章 山田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Inc
Original Assignee
Canon Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Inc filed Critical Canon Inc
Priority to JP2004246813A priority Critical patent/JP3962733B2/ja
Priority to US11/210,629 priority patent/US7610201B2/en
Publication of JP2006064959A publication Critical patent/JP2006064959A/ja
Application granted granted Critical
Publication of JP3962733B2 publication Critical patent/JP3962733B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L13/00Speech synthesis; Text to speech systems
    • G10L13/02Methods for producing synthetic speech; Speech synthesisers
    • G10L13/04Details of speech synthesis systems, e.g. synthesiser structure or memory management

Description

本発明は、音声を合成しユーザに提示する音声合成方法および装置に関わるものである。
従来より、各種機器において、音声を合成してユーザに提示する音声合成の機能が実装されている。音声合成には、あらかじめ録音された音声を再生する録音再生音声合成や、発声内容をテキストデータとして表現し、規則によって音声を合成する音声規則合成がある。
ところで、上述のような音声合成を搭載した機器において、複数の内容を同時に発声する必要が生ずることがある。例えば、FAXおよびコピー機能を搭載した複合機でFAX送信とコピーを同時に行なうケースを考えると、送信終了と紙詰りが同時に起こり得る。この場合、「送信が終了しました」と「紙詰りが起こりました」という音声出力を同時に行なう必要が生ずる場合がある。
上記のような複数の音声を同時に合成・出力すると、発声内容の了解性が損なわれ、ユーザの使用感を損ねる。そこで従来、特許文献1に開示されているように優先度に基づいた音声合成が行なわれている。これは、発声内容に対して優先度を付与し、優先度の高いものを優先して音声合成、出力するものである。具体的には、「優先度の高い内容を先に音声合成する」といったことが行なわれる。
特開平5−300106号公報
上記従来技術において、より優先度の高い発声を緊急に実行するべく、現在出力中の優先度の低い発声を中断して、優先度の高い内容を割り込ませて発声するというような制御を実現して、ユーザの細かいニーズに応えるように構成することが考えられる。一般に音声合成による発声は一時停止することが可能であることから、優先度の低い発声を一時停止して、優先度の高い発生を実行し、その後優先度の低い発生を再開することにより、上記構成を実現することが考えられる。しかしながら、このような構成では、発声内容によっては、中断した個所から再生することによってかえってユーザに混乱をきたす可能性もある。よって、割り込まれた発声(=他の発声内容によって中断させられた発声)の復帰についてもより細かい制御を可能にすることが望まれる。
本発明は上記の課題に鑑みてなされたものであり、発声内容と共に割り込まれた際の復帰方法を指定することを可能とし、割り込まれた発声の復帰方法を適切に制御可能にすることを目的とする。
上記の目的を達成するための本発明による音声合成方法は、発声内容を取得する取得工程と、前記取得工程で取得した発声内容に従って音声を合成し出力している際に、発声内容の音声出力が中断された場合に、発声内容毎に音声出力の再開時における復帰方法を表す復帰情報を対応付けて登録している登録情報から、該中断された発声内容に対応付けて登録されている復帰情報を取得し、取得した復帰情報に従って、前記中断された発声内容の音声出力を再開する再開工程とを備える。
また、上記の目的を達成するための本発明による音声合成装置は以下の構成を備える。すなわち、発声内容を取得する取得手段と、前記取得手段で取得した発声内容に従って音声を合成し出力している際に、発声内容の音声出力が中断された場合に、発声内容毎に音声出力の再開時における復帰方法を表す復帰情報を対応付けて登録している登録情報から、該中断された発声内容に対応付けて登録されている復帰情報を取得し、取得した復帰情報に従って、前記中断された発声内容の音声出力を再開する再開手段とを備える。
本発明によれば、発声内容と共に割り込まれた際の復帰方法を指定することができ、割り込まれた発声の復帰方法を適切に制御することが可能になる。
以下、添付の図面を参照しながら本発明の好適な実施形態を説明する。
<第1実施形態>
図1は第1実施形態による情報処理装置のハードウェア構成例を示すブロック図である。図1において、中央処理装置1は、数値演算・制御等の処理を行なう。特に、本実施形態の手順に従って各種制御を実現する。音声出力装置2は、ユーザに対して音声を提示する。出力装置3は、ユーザに対して情報を提示する。出力装置3の典型例としては、液晶ディスプレイのような画像出力装置が考えられるが、音声出力装置2と兼用するような形態であっても良い。さらに、ランプの点滅だけといった簡便なものであっても良い。入力装置4はタッチパネルやキーボード、マウス、ボタン等を具備し、ユーザが本情報処理装置に対して動作の指示を与えるのに用いられる。器機制御装置5は、スキャナやプリンタ等の本情報処理装置に付随する機器を制御する。
外部記憶装置6は、ディスク装置や不揮発メモリ等で構成されて、音声合成に使用される言語解析辞書601や音声データ602等を保持する。さらに、外部記憶装置6には、RAM8に保持される各種情報のうち、恒久的に使用されるべき情報も保持される。また、外部記憶装置6は、CD−ROMやメモリカードといった可搬性のある記憶装置であっても良く、これによって利便性を高めることもできる。
ROM7は読み取り専用のメモリであり、本実施形態による音声合成処理等を実現するためのプログラムコード701や、図示しない固定的データ等が格納される。なお、外部記憶装置6とROM7の使用には任意性がある。例えば、プログラムコード701は、ROM7ではなく外部記憶装置6にインストールされるものであっても良い。RAM8は一時的に情報を保持するメモリであり、発声内容キュー801や現発声内容バッファ802およびその他の一時的なデータや各種フラグ等が保持される。以上の各構成はバスで接続されている。
また、本実施形態では、図2に示すように複数の機能をマルチタスクで実現する例について説明する。例えば、プリントアウトはプリントタスク901によって、スキャンはスキャンタスク902によって実現される。各タスクはタスク間通信(メッセージ)によって協調動作し、例えば、コピーのような複合的な機能は、コピータスク903、プリントタスク901、スキャンタスク902の連携によって実現される。
図2において、音声合成タスク906は、他のタスクから音声合成出力の要求メッセージを受け取り、音声合成出力する役割を担う。音声合成には、あらかじめ録音された内容を再生する録音再生方式と、任意の内容を出力できる規則合成方式がある。本実施形態の情報処理装置にはこれらのいずれも適用可能であるが、本実施形態では規則合成方式を例に説明する。また、規則合成方式の場合、自然言語で記述されたテキストを入力する場合と、音声合成用の記述言語で記述されたテキストを入力とする場合がある。本実施形態にはこれらのいずれも適用可能である。
音声合成タスク906では、出力すべき発声内容を発声内容キュー801によって管理する。発声内容キュー801には、発声内容およびその他の情報が発声順に順位づけされて管理されている。発声内容キュー801の例を図3に示す。図3において、優先度は、発声内容の優先度を示し、優先度の高い発声内容ほど発声内容キュー801の上位に位置する。復帰方法は、発声が他の発声によって中断された場合の復帰方法を示している。発声開始位置は、発声内容中のどこから発声を開始するかを示す情報である。通常は、発声内容の先頭、すなわち0に設定されているが、発声が他の発声によって中断された場合には他の値が設定される場合がある。例えば、復帰方法が「中断個所から」に設定されている場合、その発声が他の発声によって中断された場合には、「発声開始位置」に当該中断した位置が設定される。
さらに、音声合成タスク906では、発声中の内容を現発声内容バッファ802によって管理する。現発声内容バッファ802の内容は、発声内容キュー801の1エントリとほぼ同等の内容である。現発声内容バッファ802の例を図4に示す。図4において、発声終了位置は、音声出力装置2に出力されたデータの終端を示す情報である。
以下、本実施形態の情報処理装置による音声合成タスク906の処理を図6のフローチャートを参照して説明する。
まず、ステップS1において、他のタスクからのメッセージを取得する。音声合成タスク906に送られるメッセージとしては、音声合成を要求する音声合成要求メッセージと、音声出力装置2が所定の分量の音声データを出力し終えた際に送られる音声出力終了メッセージとがある。音声合成要求メッセージには、発声内容等、音声合成タスク906が音声合成を行なうのに必要な情報が含まれている。音声合成要求メッセージに含まれている情報の例を図5に示す。
図5において、優先度および復帰方法は、発声内容キュー801のエントリと対応した内容である。割り込みは、割り込み発声をするかどうかを示す情報である。割り込みをするに設定されていた場合は、当該メッセージの受信時に他のメッセージを発声中であれば、他のメッセージの発声を中断して当該メッセージ要求による発声内容を発声することになる。タイムアウトは当該メッセージが指定された期間内に発声されなかった場合に、発声をキャンセルするための情報である。優先度の高い発声が大量に要求された場合、優先度の低い発声は発声内容キュー801に登録されたまま長時間経過してしまい、情報としての価値が無くなってしまう場合がある。このため、タイムアウトが有用になる。なお、図5ではタイムアウト時刻を記述しているが、タイムアウトまでの時間(例えば、10分後等)を記述するようにしてもよい。フィードバック方法は、発声終了後に、発声要求元にフィードバックする方法を示す情報である。フィードバック方法としては、メッセージ・共有変数・なし(フィードバックしない)等が考えられる。
ステップS2では、ステップS1で取得されたメッセージのメッセージタイプ(音声合成要求メッセージか音声出力終了メッセージか)を判定する。音声合成要求メッセージであればステップS3に処理を移し、音声出力終了メッセージであればステップS13に処理を移す。
ステップS3では、ステップS1で取得したメッセージに含まれた情報に基づいて、当該音声合成要求による発声内容の発声内容キュー801への挿入位置を決定する。例えば、割り込み発声を行なわない場合、発声内容の挿入位置は、同一優先度を持つ発声内容の最後尾となる。また、例えば、優先度が現在発声中の発声内容と同等以上で、割り込み発声を行なう場合、発声内容の挿入位置は発声内容キュー801の最上部となる。ステップS4では、ステップS3で決定された発声内容キュー801の挿入位置に、当該発声内容およびそれに付随する情報(復帰方法等)を挿入する。そして、ステップS5において、発声開始位置を発声内容の先頭に初期化する。発声開始位置は、発声内容のうち、どの部分から音声合成するかを指示する情報であり、後述するステップ18等における合成音声の取得処理に用いられる。
次に、ステップS6において、現在、他の発声内容を発声中であるか判定する。他の発声内容を発声中の場合は発声の割り込みを行うか否かを判定するためにステップS7に進み、他の発声内容を発声中でない場合は発声内容キューに従って発声処理を進めるべくステップS16に進む。
ステップS7では、ステップS1で取得したメッセージに含まれた情報に基づいて、当該音声合成要求が割り込み発声を行なうか否かを判定する。優先度が現在発声中の発声内容と同等以上で、割り込み発声を行なうと設定されている場合には割り込み発声を実行すると判定する。割り込み発声を行なう場合には、現在発声中の音声出力を中断するべくステップS8に処理を進める。一方、割り込み発声を行わない設定になっておれば、ステップS1に処理を戻し、キューの管理下で音声合成が実行されることになる。
ステップS7で割り込み発声を実行すると判定された場合、まず、ステップS8において現在発声中の音声の出力を中断する。そして、ステップS9において、ステップS8で中断された発声の復帰方法を発声内容キュー801より読み込む。ステップS10において、ステップS9で読み込まれた内容が再発声を行なうものであるか判定する。なお、再発声をしない場合、図5の復帰方法において「しない」と記述されるものとし、ステップS9の判断はこの記述を参照してなされるものとする。再発声を行なう場合はステップS11に進み再発生のためのキューへの登録処理を行うことになる。再発声を行なわない場合はそのままステップS16以降へ進み割り込み発声を行うことにより、現在発声していた音声内容が破棄される(そのまま発声中止となる)。
ステップS11では、現発声内容バッファ802の内容を発声内容キュー801に挿入する。挿入位置は、割り込み発声を行なう発声内容の直後になる。そして、ステップS12において、ステップS11で挿入された再発声内容の発声開始位置を設定する。ステップS9において読み込まれた復帰方法が「先頭から」であれば、発声開始位置は発声内容の先頭となる。よって、現発声内容の発声開始位置には「0」がセットされる。一方、ステップS9において読み込まれた復帰方法が「中断箇所から」であれは、発声開始位置は現発声内容バッファ中に示されている発声開始位置がそのまま発声開始位置となる。以上のようにして割り込まれた(中断された)発声の再発声のための設定を終えると、処理はステップS16に進み、割り込み発声を行なう発声内容の音声合成出力を行なうことになる。ステップS16以降の処理については後述する。
次に、ステップS2においてメッセージタイプが音声出力終了であり、ステップS13に処理が進んだ場合について説明する。
ステップS13では、現発声内容バッファ802に含まれる発声内容を全て発声し終わったか判定する。現発声内容バッファ802に含まれる発声内容を全て発声し終わった場合はステップS14に処理を移し、現発声内容バッファ802に含まれる発声内容を全て発声し終わっていない場合はステップS18に処理を移す。
ステップS14では、現発声内容バッファ802の内容を消去する。次に、ステップS15において、発声内容キュー801が空であるか判定する。発声内容キュー801が空でなければステップS16に処理を移し、発声内容キュー801が空であればステップS1に処理を戻す。
ステップS16では、発声内容キュー801から先頭にあるエントリを取り出し、現発声内容バッファ802に設定する。なお、取り出されたエントリにタイムアウト時刻(図5)が設定されており、現時刻がタイムアウト時刻を過ぎている場合は、当該エントリをそのまま破棄し、次のエントリを取得する(次のエントリがなければ、すなわち発声内容キューが空になった場合はステップS1へ戻る)ことになる。次に、ステップS17において、現発声内容バッファ802の発声開始点を発声終了点で更新する。但し、発声内容キュー801から取り出した最初の1回目では、発生終了点が存在しないのでステップS17による発声位置の更新は実行しない。すなわち、発声内容キュー801に登録された開始位置がそのまま用いられることになる。次に、ステップS18において、現発声内容バッファ802の発声開始点から始まる合成音声を所定の分量だけ取得し、ステップS19において、ステップS18で取得した合成音声を音声出力装置2に出力する。ステップS18における合成音声取得処理の詳細は図7のフローチャートにより後述する。出力された音声の終端の位置は、現発声内容バッファ802の発声終了点に記録される。よって、次からステップS17の処理を実行した場合、発声位置の更新が行われ、出力された合成音声の続きの合成音声が取得されることになる。ステップS19の処理の後、処理はステップS1に戻る。
ここで、音声規則合成の処理について説明する。図7は、本実施形態による音声規則合成処理の一例を示すフローチャートである。まず、ステップS101において、発声内容が言語解析される。言語解析には、形態素解析・構文解析などの処理が含まれる。次に、ステップS102において、上記発声内容に読みが付与(読み付け)される。読みの付与には、ステップS101の結果が用いられる。次に、ステップS103において、発声内容にアクセントが付与される。アクセント付与には、ステップS101による言語解析の結果が用いられる。次に、ステップS104において、上記ステップS102、S103で付与された読み・アクセントをもとに合成音声の韻律情報が生成される。次に、ステップS105において、上記各ステップの情報をもとに音声波形が生成される。以上の処理により、音声規則合成が実現される。
ところで、図6の説明で述べたように、ステップS18による合成音声の取得、ステップS19による合成音声の出力は、発声内容の全てを一気に合成・出力するわけではない。すなわち、図7に示した処理は、実際には細分化されて実行される。この細分化をどのように行なうかに関しては任意性がある。
例えば、ステップS101からステップS103までを最初に行なっておき、ステップS104、ステップS105を逐次行なうことも可能である。あるいは、全ての波形(音声データ)を一気に作成し、作成された音声データと適宜切り分けることも可能である。
<第2実施形態>
上記第1実施形態において、復帰方法が「先頭から」、「中断箇所から」という例を示したが、「直前の単語境界から」、「直前の句境界から」という復帰方法も考えられる。これは、図7の説明で述べたように、規則合成の際に言語解析が行なわれ、単語境界・句境界といった情報を取得することができるためである。
また、上記のように復帰方法を単語境界・句境界とした場合、アクセント付けをやり直すことにより、復帰後の音声のアクセントを、修正することも可能である。
また、図5により上述したタイムアウトの情報を利用して、「設定時刻を経過していたら復帰しない」という実装も可能である。
さらに、復帰方法として、「指示無し」という指定をすることも可能である。この場合、任意のタイミングで、ユーザの指示やその他の方法によって復帰方法を選択することになる。
以上、実施形態例を詳述したが、本発明は、例えば、システム、装置、方法、プログラムもしくは記憶媒体等としての実施態様をとることが可能であり、具体的には、複数の機器から構成されるシステムに適用しても良いし、また、一つの機器からなる装置に適用しても良い。
尚、本発明は、前述した実施形態の機能を実現するソフトウェアのプログラム(実施形態では図に示すフローチャートに対応したプログラム)を、システムあるいは装置に直接あるいは遠隔から供給し、そのシステムあるいは装置のコンピュータが該供給されたプログラムコードを読み出して実行することによっても達成される場合を含む。
従って、本発明の機能処理をコンピュータで実現するために、該コンピュータにインストールされるプログラムコード自体も本発明を実現するものである。つまり、本発明は、本発明の機能処理を実現するためのコンピュータプログラム自体も含まれる。
その場合、プログラムの機能を有していれば、オブジェクトコード、インタプリタにより実行されるプログラム、OSに供給するスクリプトデータ等の形態であっても良い。
プログラムを供給するための記録媒体としては、例えば、フロッピー(登録商標)ディスク、ハードディスク、光ディスク、光磁気ディスク、MO、CD−ROM、CD−R、CD−RW、磁気テープ、不揮発性のメモリカード、ROM、DVD(DVD−ROM,DVD−R)などがある。
その他、プログラムの供給方法としては、クライアントコンピュータのブラウザを用いてインターネットのホームページに接続し、該ホームページから本発明のコンピュータプログラムそのもの、もしくは圧縮され自動インストール機能を含むファイルをハードディスク等の記録媒体にダウンロードすることによっても供給できる。また、本発明のプログラムを構成するプログラムコードを複数のファイルに分割し、それぞれのファイルを異なるホームページからダウンロードすることによっても実現可能である。つまり、本発明の機能処理をコンピュータで実現するためのプログラムファイルを複数のユーザに対してダウンロードさせるWWWサーバも、本発明に含まれるものである。
また、本発明のプログラムを暗号化してCD−ROM等の記憶媒体に格納してユーザに配布し、所定の条件をクリアしたユーザに対し、インターネットを介してホームページから暗号化を解く鍵情報をダウンロードさせ、その鍵情報を使用することにより暗号化されたプログラムを実行してコンピュータにインストールさせて実現することも可能である。 また、コンピュータが、読み出したプログラムを実行することによって、前述した実施形態の機能が実現される他、そのプログラムの指示に基づき、コンピュータ上で稼動しているOSなどが、実際の処理の一部または全部を行ない、その処理によっても前述した実施形態の機能が実現され得る。
さらに、記録媒体から読み出されたプログラムが、コンピュータに挿入された機能拡張ボードやコンピュータに接続された機能拡張ユニットに備わるメモリに書き込まれた後、そのプログラムの指示に基づき、その機能拡張ボードや機能拡張ユニットに備わるCPUなどが実際の処理の一部または全部を行ない、その処理によっても前述した実施形態の機能が実現される。
第1実施形態における情報処理装置のハードウェア構成例を示したブロック図である。 第1実施形態におけるタスク構成を示したブロック図である。 第1実施形態における発声内容キューのデータ構成例を示した図である。 第1実施形態における現発声内容バッファのデータ構成例を示した図である。 第1実施形態1における音声合成要求メッセージに含まれる情報の例を示した図である。 実施形態による音声合成タスクの処理を示すフローチャートである。 実施形態による音声規則合成処理の例を示すフローチャートである。

Claims (12)

  1. 発声内容を取得する取得工程と、
    前記取得工程で取得した発声内容に従って音声を合成し出力している際に、発声内容の音声出力が中断された場合に、発声内容毎に音声出力の再開時における復帰方法を表す復帰情報を対応付けて登録している登録情報から、該中断された発声内容に対応付けて登録されている復帰情報を取得し、取得した復帰情報に従って、前記中断された発声内容の音声出力を再開する再開工程とを備えることを特徴とする音声合成方法。
  2. 前記再開工程は、前記取得工程で取得された発声内容に従って音声を合成し出力している際に、発声内容の音声出力が他の発声内容の音声出力によって中断された場合に、該中断された発声内容に対応する該発声内容に対応する復帰情報を前記登録情報より取得し、取得した復帰情報に従って、前記中断された発声内容の音声出力を再開することを特徴とする請求項1記載の音声合成方法。
  3. 前記発声内容と前記復帰情報を対応付けて、前記登録情報として前記メモリに登録する登録工程を更に備えことを特徴とする請求項1記載の音声合成方法。
  4. 前記復帰情報は、発声内容の音声出力の再開時における発声の開始位置の種別を指定するものであり、
    前記再開工程は、前記復帰情報に従って前記中断された発声内容の発声開始位置の種別を指定して該発声内容の音声出力を再開することを特徴とする請求項1記載の音声合成方法。
  5. 前記復帰情報によって示される発声開始位置の種別は、発声内容の先頭、発声内容の中断位置、発声内容の中断位置の直前の単語境界、発声内容の中断位置の直前の句境界のいずれかであることを特徴とする請求項1記載の音声合成方法。
  6. 発声内容を取得する取得手段と、
    前記取得手段で取得した発声内容に従って音声を合成し出力している際に、発声内容の音声出力が中断された場合に、発声内容毎に音声出力の再開時における復帰方法を表す復帰情報を対応付けて登録している登録情報から、該中断された発声内容に対応付けて登録されている復帰情報を取得し、取得した復帰情報に従って、前記中断された発声内容の音声出力を再開する再開手段とを備えることを特徴とする音声合成装置。
  7. 前記再開手段は、前記取得工程で取得された発声内容に従って音声を合成し出力している際に、発声内容の音声出力が他の発声内容の音声出力によって中断された場合に、該中断された発声内容に対応する該発声内容に対応する復帰情報を前記登録情報より取得し、取得した復帰情報に従って、前記中断された発声内容の音声出力を再開することを特徴とする請求項6記載の音声合成装置。
  8. 前記発声内容と前記復帰情報を対応付けて、前記登録情報として前記メモリに登録する登録手段を更に備えことを特徴とする請求項6記載の音声合成装置。
  9. 前記復帰情報は、発声内容の音声出力の再開時における発声の開始位置の種別を指定するものであり、
    前記再開手段は、前記復帰情報に従って前記中断された発声内容の発声開始位置の種別を指定して該発声内容の音声出力を再開することを特徴とする請求項6記載の音声合成装置。
  10. 前記復帰情報によって示される発声開始位置の種別は、発声内容の先頭、発声内容の中断位置、発声内容の中断位置の直前の単語境界、発声内容の中断位置の直前の句境界のいずれかであることを特徴とする請求項6記載の音声合成装置。
  11. 請求項1乃至5の何れかに記載の音声合成方法をコンピュータに実行させるための制御プログラム。
  12. 請求項11に記載の制御プログラムを記憶したコンピュータ読み取り可能な記憶媒体。
JP2004246813A 2004-08-26 2004-08-26 音声合成方法および装置 Expired - Fee Related JP3962733B2 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2004246813A JP3962733B2 (ja) 2004-08-26 2004-08-26 音声合成方法および装置
US11/210,629 US7610201B2 (en) 2004-08-26 2005-08-24 Method and apparatus for synthesizing speech

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2004246813A JP3962733B2 (ja) 2004-08-26 2004-08-26 音声合成方法および装置

Publications (2)

Publication Number Publication Date
JP2006064959A JP2006064959A (ja) 2006-03-09
JP3962733B2 true JP3962733B2 (ja) 2007-08-22

Family

ID=35944522

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2004246813A Expired - Fee Related JP3962733B2 (ja) 2004-08-26 2004-08-26 音声合成方法および装置

Country Status (2)

Country Link
US (1) US7610201B2 (ja)
JP (1) JP3962733B2 (ja)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8751237B2 (en) * 2010-03-11 2014-06-10 Panasonic Corporation Text-to-speech device and text-to-speech method
US10425373B2 (en) 2017-07-19 2019-09-24 Citrix Systems, Inc. Systems and methods for prioritizing messages for conversion from text to speech based on predictive user behavior
JP6952637B2 (ja) * 2018-03-28 2021-10-20 シャープ株式会社 画像形成装置

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3155057B2 (ja) 1992-04-17 2001-04-09 日立マクセル株式会社 音声案内システム
JPH08123458A (ja) 1994-10-21 1996-05-17 Oki Electric Ind Co Ltd テキスト音声変換システムの中断位置検索装置
JP2000083082A (ja) 1998-09-07 2000-03-21 Sharp Corp 音生成出力装置、音生成出力方法、並びに音生成出力プログラムを記録した記録媒体
JP4687936B2 (ja) * 2001-03-22 2011-05-25 ソニー株式会社 音声出力装置および音声出力方法、並びにプログラムおよび記録媒体

Also Published As

Publication number Publication date
US7610201B2 (en) 2009-10-27
JP2006064959A (ja) 2006-03-09
US20060047514A1 (en) 2006-03-02

Similar Documents

Publication Publication Date Title
JP4463861B2 (ja) 認識音声に対する同期再生中の文字編集
US20040266337A1 (en) Method and apparatus for synchronizing lyrics
JP3884856B2 (ja) 音声合成用データ作成装置、音声合成装置及びそれらの方法、コンピュータ可読メモリ
JP2014021136A (ja) 音声合成システム
US7099828B2 (en) Method and apparatus for word pronunciation composition
US20030029304A1 (en) Electronic music apparatus and program
US8027835B2 (en) Speech processing apparatus having a speech synthesis unit that performs speech synthesis while selectively changing recorded-speech-playback and text-to-speech and method
JP7200533B2 (ja) 情報処理装置およびプログラム
JP3962733B2 (ja) 音声合成方法および装置
US20050144015A1 (en) Automatic identification of optimal audio segments for speech applications
US20040194152A1 (en) Data processing method and data processing apparatus
JP2003316565A (ja) 読み上げ装置およびその制御方法ならびにプログラム
US7353175B2 (en) Apparatus, method, and program for speech synthesis with capability of providing word meaning immediately upon request by a user
JP4249665B2 (ja) 音声対話方法及び装置
JP2006330484A (ja) 音声案内装置及び音声案内プログラム
JPH11161298A (ja) 音声合成方法及び装置
JP2003044074A (ja) 印刷処理装置、印刷処理方法、コンピュータ読み取り可能な記憶媒体及びコンピュータプログラム
JP2010048959A (ja) 音声出力システム及び車載装置
JP2000089789A (ja) 音声認識装置及び記録媒体
JP3841011B2 (ja) 文章読み上げ装置、文章読み上げ方法、及びプログラム
Heeman et al. Dialogue transcription tools
JP2006337403A (ja) 音声案内装置及び音声案内プログラム
JP3507613B2 (ja) 情報処理機器及び同機器における情報出力制御方法
JP2004170887A (ja) データ処理システム及びデータ格納方法
JP5184234B2 (ja) データ生成装置及びデータ生成プログラム、並びに、再生装置

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20060802

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20060814

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20061013

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20070507

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20070521

R150 Certificate of patent or registration of utility model

Ref document number: 3962733

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100525

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110525

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120525

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120525

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130525

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140525

Year of fee payment: 7

LAPS Cancellation because of no payment of annual fees