JP2003263184A - 音声合成装置及びその方法、プログラム - Google Patents

音声合成装置及びその方法、プログラム

Info

Publication number
JP2003263184A
JP2003263184A JP2002062298A JP2002062298A JP2003263184A JP 2003263184 A JP2003263184 A JP 2003263184A JP 2002062298 A JP2002062298 A JP 2002062298A JP 2002062298 A JP2002062298 A JP 2002062298A JP 2003263184 A JP2003263184 A JP 2003263184A
Authority
JP
Japan
Prior art keywords
word
output
meaning
voice
document data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2002062298A
Other languages
English (en)
Other versions
JP2003263184A5 (ja
JP3848181B2 (ja
Inventor
Kazue Kaneko
和恵 金子
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Inc
Original Assignee
Canon Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Inc filed Critical Canon Inc
Priority to JP2002062298A priority Critical patent/JP3848181B2/ja
Priority to US10/376,205 priority patent/US7353175B2/en
Publication of JP2003263184A publication Critical patent/JP2003263184A/ja
Publication of JP2003263184A5 publication Critical patent/JP2003263184A5/ja
Application granted granted Critical
Publication of JP3848181B2 publication Critical patent/JP3848181B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L13/00Speech synthesis; Text to speech systems

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Document Processing Apparatus (AREA)
  • Machine Translation (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

(57)【要約】 【課題】 容易にかつ効率的に出力文中の語の語義を提
供することができる音声合成装置及びその方法、プログ
ラムを提供する。 【解決手段】 音声出力される文書データ中の語に対す
る語義説明要求をユーザ指示入力部103より入力す
る。語義説明要求が入力された場合、その語義説明要求
入力直前までに音声出力された既出力文書データを文解
析部105で解析する。その解析結果に基づいて得られ
る語義説明要求対象語に対応する語義文を語義検索部1
01で検索する。そして、その語義文を出力する。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、文書データを音声
出力する音声合成装置及びその方法、プログラムに関す
るものである。
【0002】
【従来の技術】従来、コンピュータで管理される文書デ
ータ中の単語の参照機能としては、表示上の文字列をカ
ット&ペーストするなどして使用できるオンライン辞書
がある。また、ハイパーテキストなどのリンク機能を使
用する単語の参照機能などもある。また、これらの参照
機能には、文字コードや、2次元の画像として表示され
る文字情報の表示位置に対して参照要求を出すものあ
る。
【0003】また、特開平10-171485号の「音
声合成装置」や特開平5-22487号の「日本文読み
上げ単語編集処理方式」では、ユーザが理解しにくいと
想定した単語や、多義による誤解の生じる可能性のある
単語を、あらかじめ他の単語や語義に置換してから読み
上げることを行っている。
【0004】また、特開平10-134068号の「情
報獲得支援方法および装置」では、文書を表示しながら
音声出力し、その表示文書中の単語を音声認識の認識語
彙として登録しておき、ユーザが発声した単語について
その単語の意味や用例を提示する。
【0005】
【発明が解決しようとする課題】上記のオンライン辞書
やハイパーテキストの例では、文書データの表示が前提
となり、ユーザは文書データ中の文字コードや位置情報
で調べたい単語を指定するものである。そのため、参照
対象の単語を含む文書データの表示を前提とせず、ユー
ザが音声のみで情報獲得を行う場合の利用を前提とした
場合の単語の指定には使用できない。
【0006】また、特開平10-171485号や特開
平5-22487号のように、ユーザが理解しにくいと
想定した単語や、多義による誤解の生じる可能性のある
単語を、あらかじめ他の単語や語義に置換してから読み
上げる方法では、もとの文書データを最初から加工して
しまうので、文学作品などのオリジナリティを尊重しな
くてはならない文書データには適さない。また、語学学
習のためなどに文書データを聞いているときには、最初
から平易な単語に置き換えては、本来の学習の用途に適
さない。
【0007】更に、特開平10-134068号のよう
に、ユーザが発声した単語を音声認識してその単語の意
味や用例を提示する方法では、音がうまく聞き取れなか
った場合にユーザがその単語を指定する方法がなくなっ
てしまう。
【0008】加えて、携帯型オーディオ装置のように、
ヘッドフォーンを装着したまま移動しながら、その音を
聞くような利用を考慮した場合、表示を常時注目しなく
ても、気がついた時点でその箇所を指摘できるような機
能が必要とされている。
【0009】本発明は上記の課題を解決するためになさ
れたものであり、容易にかつ効率的に出力文中の語の語
義を提供することができる音声合成装置及びその方法、
プログラムを提供することを目的とする。
【0010】
【課題を解決するための手段】上記の目的を達成するた
めの本発明による音声合成装置は以下の構成を備える。
即ち、文書データを音声出力する音声合成装置であっ
て、音声出力される文書データ中の語に対する語義説明
要求を入力する入力手段と、前記語義説明要求が入力さ
れた場合、その語義説明要求入力直前までに音声出力さ
れた既出力文書データを解析する解析手段と、前記解析
手段の解析結果に基づいて得られる語義説明要求対象語
に対応する語義文を検索する検索手段と、前記語義文を
出力する出力手段とを備える。
【0011】また、好ましくは、前記解析手段は、前記
既出力文書データにおいて、語義説明要求の直前に音声
出力された語を前記語義説明要求対象語とする。
【0012】また、好ましくは、前記解析手段は、前記
既出力文書データ中の所定語以外の語語群から語義説明
要求対象語を推定する。
【0013】また、好ましくは、前記所定語は、語義説
明対象外フラグを有する語である。
【0014】また、好ましくは、前記所定語は、少なく
とも名詞以外の品詞を有する語である。
【0015】また、好ましくは、前記語義説明要求が入
力された場合、前記出力手段は、前記既出力文書データ
を、前回の出力速度より遅い出力速度で再出力し、前記
解析手段は、前記再出力される既出力文書データに対し
て入力される語義説明要求に基づいて、該既出力文書デ
ータを解析する。
【0016】また、好ましくは、前記出力手段は、前記
語義文を音声出力する。
【0017】また、好ましくは、前記出力手段は、前記
語義文を文字表示する。
【0018】上記の目的を達成するための本発明による
音声出力方法は以下の構成を備える。即ち、文書データ
を音声出力する音声合成方法であって、音声出力される
文書データ中の語に対する語義説明要求を入力する入力
工程と、前記語義説明要求が入力された場合、その語義
説明要求入力直前までに音声出力された既出力文書デー
タを解析する解析工程と、前記解析工程の解析結果に基
づいて得られる語義説明要求対象語に対応する語義文を
検索する検索工程と、前記語義文を出力する出力工程と
を備える。
【0019】上記の目的を達成するための本発明による
プログラムは以下の構成を備える。即ち、文書データを
音声出力する音声合成をコンピュータに機能させるため
のプログラムであって、音声出力される文書データ中の
語に対する語義説明要求を入力する入力工程のプログラ
ムコードと、前記語義説明要求が入力された場合、その
語義説明要求入力直前までに音声出力された既出力文書
データを解析する解析工程のプログラムコードと、前記
解析工程の解析結果に基づいて得られる語義説明要求対
象語に対応する語義文を検索する検索工程のプログラム
コードと、前記語義文を出力する出力工程のプログラム
コードとを備える。
【0020】
【発明の実施の形態】以下、図面を参照して本発明の一
実施形態を詳細に説明する。
【0021】図1は本発明の実施形態の音声合成装置の
機能構成を示すブロック図である。
【0022】101は語義検索部であり、語の語義を検
索する。102は語義辞書であり、各種語の見出しと語
義を蓄積する。103はユーザ指示入力部であり、読み
上げ文書データ109に対する読み上げ開始・読み上げ
停止や語義説明要求等の各種要求のユーザからの指示を
入力する。
【0023】尚、このユーザ指示入力部103は、例え
ば、端末上に配置されたボタンや、音声入力によって実
現される。
【0024】104は同期管理部であり、ユーザの指示
や、読み上げ音声の出力終了などのメッセージを監視
し、その同期を管理する。105は文解析部であり、読
み上げ文書データ109や語義を受け取り、その言語解
析を行う。
【0025】106は波形データ作成部であり、文解析
部105の解析結果に基づいて音声波形データを作成す
る。107は音声出力部であり、波形データを音として
出力する。
【0026】108は文入力部であり、読み上げ文書デ
ータ109から、読み上げ対象単位(例えば、1文)ず
つ切り出して文解析部105へ送信する。この読み上げ
対象単位は、文単位に限定されず、段落単位や行単位で
あっても良い。
【0027】109は読み上げ文書データである。この
読み上げ文書データ109は、予め記憶されていてもよ
いし、DVD−ROM/RAM、CD−ROM/R/R
W等の記憶媒体に記憶されたものを外部記憶装置を介し
て登録しても良い。また、インターネットや電話回線等
のネットワークを介して登録しても良い。
【0028】110は文解析に使用する解析用辞書であ
る。111は波形データ作成部106で使用する音素群
からなる素片辞書である。
【0029】尚、音声合成装置は、汎用コンピュータに
搭載される標準的な構成要素(例えば、CPU、RA
M、ROM、ハードディスク、外部記憶装置、マイク、
スピーカ、ネットワークインタフェース、ディスプレ
イ、キーボード、マウス等)を有している。
【0030】また、音声合成装置の各種機能は、音声合
成装置内部のROMや外部記憶装置に記憶されるプログ
ラムがCPUによって実行されることによって実現され
ても良いし、専用のハードウエアで実現されても良い。
【0031】次に、本実施形態の音声合成装置で実行さ
れる処理について、図2を用いて説明する。
【0032】図2は本発明の実施形態の音声合成装置で
実行される処理を示すフローチャートである。
【0033】尚、図2のフローチャートでは、スタート
とエンドを設けており、本実施形態では、読み上げ開始
要求でスタートし読み上げ停止要求でエンドとすること
とする。
【0034】まず、ステップS201で、ユーザ指示入
力部103からのメッセージ待ちに入る。これは図1の
同期管理部104で行い、常にユーザ指示の入力や音声
出力の終了等のメッセージの終了を管理する。ここで検
知したメッセージによって、それ以後の処理の振り分け
が行われる。
【0035】ステップS202で、同期管理部104
は、そのメッセージが読み上げ開始要求であるか否かを
判定する。読み上げ開始要求である場合(ステップS2
02でyes)、ステップS203に進み、現在、音声
出力中であるか否かを判定する。音声出力中である場合
(ステップS203でyes)、出力中の音声を消して
しまわないために、ステップS201に戻り、メッセー
ジ待ちを行う。
【0036】一方、音声出力中でない場合(ステップS
203でno)、ステップS204に進み、文入力部1
08は、読み上げ文書データ109から読み出し文の切
り出しを行う。ここでは、文入力部108は、上述のよ
うに、読み上げ文書データ109から1つの読み上げ文
を切り出す。読み上げ文の解析は、1文ごとに行い、そ
の際には、その読み取った位置を記録しておく。
【0037】ステップS205で、文解析部105は、
読み上げ文の有無を判定する。読み上げ文がない場合
(ステップS205でno)、つまり、読み上げ文書デ
ータから1文づつ切り出して、最後まで読み上げてしま
ったら、ここで読み上げ文がないとして、エンドとな
る。
【0038】一方、読み上げ文がある場合(ステップS
205でyes)、ステップS206に進み、文解析部
106は、その読み上げ文の文解析を行う。文解析が終
了すると、ステップS207で、波形データ作成を行
う。そして、ステップS208で、音声出力部107
は、作成された波形データに基づく音声出力で行う。音
声データが最後まで終了した時点で、音声出力終了のメ
ッセージを同期管理部104に送信し、ステップS20
1に戻る。
【0039】尚、文解析部105は、読み上げ文の解析
結果を保持し、音声出力部107での出力に同期して、
読み上げ文中のどの語まで読み上げたかを記録してい
る。
【0040】また、ステップS206、ステップS20
7、ステップS208の一連の処理は、別スレッドもし
くは別プロセスで行い、処理の終了を待たずに、ステッ
プS206を開始した時点で、ステップS201へ戻
る。
【0041】一方、ステップS202において、メッセ
ージが読み上げ開始要求でない場合(ステップS202
でno)、ステップS209に進み、同期管理部104
は、メッセージが音声出力終了であるか否かを判定す
る。音声出力終了である場合(ステップS209でye
s)、ステップS204へ進み、読み上げの継続を行
う。
【0042】一方、音声出力終了でない場合(ステップ
S209でyes)、ステップS210に進み、同期管
理部104は、メッセージが語義説明要求であるか否か
を判定する。語義説明要求である場合(ステップS21
0でyes)、ステップS211に進み、文解析部10
5は、語義説明要求入力直前までに音声出力された既出
力文書データを解析し、その既出力文書データから語義
説明要求対象語の推定を行う。
【0043】これは、文解析部105において、現在音
声出力中の文について、文解析結果とその語まで出力し
たかを調べ直前の語を同定する。例えば、図3に示すよ
うな読み上げ文に対し、読み上げ途中でユーザから語義
説明要求があると、その時点で読み上げられている
「の」という語での語義説明要求があったとみなす。
【0044】語義説明要求対象語を推定した後、ステッ
プS212で、語義検索部101は、その語義説明要求
対象語に対応する語義文検索を行う。これは通常の電子
辞書のように、見出し語とその語義文のペア語義辞書と
して保持しておき、見出し語から語義文を取り出す。動
詞などの活用語の場合も、文の解析結果を用いて見出し
語を同定するので、動詞「ある」の連用形「あっ」を指
示した場合でも、見出し語「ある」を同定できる。
【0045】尚、語義文検索で、語義説明要求対象語が
語義辞書に登録されていない場合は、「この語の意味は
分かりません」というメッセージ文を語義文の代わりと
する。
【0046】語義文検索の後、ステップS213で、同
期管理部104は、音声出力のクリア、つまり、音声出
力中の場合にはその出力の取り消しを行う。
【0047】その後、ステップS205で、語義検索結
果の語義文を読み上げ文として、その文があることを確
認して、ステップS206、ステップS207、ステッ
プS208の一連の処理を行う。この一連の処理は、上
述と同様に、別スレッドもしくは別プロセスに指示し
て、処理の終了を待たずに、ステップS206を開始し
た時点で、ステップS201へ戻る。
【0048】この語義文の音声出力が終了すると、音声
出力終了のメッセージを同期管理部104へ送信し、ス
テップS201へ戻る。そして、ステップS204によ
り、語義説明要求が送信された直後の文からの読み上げ
を再開する。
【0049】一方、ステップS210において、語義説
明要求でない場合(ステップS210でno)、ステッ
プS214に進み、同期管理部104は、メッセージが
読み上げ停止要求であるか否かを判定する。読み上げ停
止要求でない場合(ステップS214でno)、処理未
定のメッセージとして無視し、ステップS201のメッ
セージ待ちに戻る。
【0050】一方、読み上げ停止要求である場合(ステ
ップS214でyes)、ステップS215に進み、同
期管理部104は、現在出力中の音声があれば、出力を
停止して、処理を終了する。
【0051】以上説明したように、本実施形態によれ
ば、読み上げ中の文に対して参照したい語がある場合
に、その文の表示を見なくてもその参照したい語を、語
義説明要求によって指定することができ、かつその参照
したい語の意味をその場で確認することができる。
【0052】尚、上記実施形態では、語義説明要求の直
前の音声出力された語を語義説明要求対象語としたが、
ユーザが聞き取って分からないと判断しヘルプボタンを
押すなどして語義説明要求を発声させるまでには、タイ
ムラグが発生することが想定される。従って、図3の語
義説明2のように、語義説明要求があった時点より溯っ
て語義説明要求対象語を推定するようにしてもよい。
【0053】例えば、抽象度の高い語や重要度や難易度
の低い語や、助詞などの機能的に働く語には語義説明対
象外フラグを設けておき、文の解析結果である語を一つ
一つ溯りながら、語義説明対象外の語を排除して行く。
図3の語義説明2では、「の(格助詞)」、「か(準体
助詞)」、「どう(副詞)」、「か(準体助詞)」、
「た(助動詞)」、「あっ(動詞・ある)」、「が(格
助詞)」を排除し、「殺意」まで溯って語義説明要求対
象語と推定する。
【0054】尚、語義説明対象外フラグについては、例
えば、解析用辞書110に保持して、解析結果として付
与するようにしてもよい。
【0055】また、語義辞書102の収録語数を予め減
らしておき、検索対象の語義辞書102に登録されてい
る語を検索できるまで、語の検索を繰り返すようにして
もよい。
【0056】また、図3の語義説明3にあるように、一
度目の語義説明要求を対象文特定のための要求とみな
し、前回の出力速度よりも遅い出力速度で、読み上げ文
の各語を区切りながら読み上げ、二度目の語義説明要求
があった時点でその直前の語を、語義説明要求対象語と
みなすようにしてもよい。
【0057】上記実施形態では、語義文を音声で読み上
げるようにしたが、文字として画面表示するようにして
もよい。図4は、その一例を示すための図である。図4
では、特に、読み上げの開始・停止・早送り・早戻し・
語義のヘルプなどを指示するユーザ指示のための各種ボ
タン401〜405と、読み上げ文を表示するテキスト
表示部分406を有する携帯端末上での外観を示してい
る。
【0058】図4(a)では、読み上げ途中で「?(ヘ
ルプ)」ボタン405を押して語義説明要求を出すと、
テキストの読み上げを一端中止し、図4(b)のように
語義の説明文を表示する。ユーザが語義の説明を読み
「?」ボタン405もしくは「開始」ボタン402を再
度押すと、画面表示をもとに戻して読み上げを再開す
る。
【0059】また、図4(c)のように、読み上げ途中
の文書中に語義文を埋め込むなどして、合わせて表示す
るようにしてもよい。
【0060】また、語義説明要求のためのボタンは本体
のみでなく、即座に押せるような箇所、例えば、リモー
トボタンと同じ箇所に設けてもよい。
【0061】上記実施形態では、語義辞書102を内部
で個別に保持し利用しているが、別のプロセスとして稼
動している市販のオンライン辞書と組み合わせ、見出し
語を渡してその語義文を受け取り、その語義文の文字列
を読み上げるようにしてもよい。
【0062】尚、語義説明要求のあった直後の文切り出
しでは、一文もとに戻すようにして、語義説明要求がお
くられた文から重複して読み上げを再開するようにして
もよい。
【0063】以上、実施形態例を詳述したが、本発明
は、複数の機器から構成されるシステムに適用しても良
いし、また、一つの機器からなる装置に適用しても良
い。
【0064】尚、本発明は、前述した実施形態の機能を
実現するソフトウェアのプログラム(実施形態では図2
に示すフローチャートに対応したプログラム)を、シス
テム或いは装置に直接或いは遠隔から供給し、そのシス
テム或いは装置のコンピュータが該供給されたプログラ
ムコードを読み出して実行することによっても達成され
る場合を含む。その場合、プログラムの機能を有してい
れば、形態は、プログラムである必要はない。
【0065】従って、本発明の機能処理をコンピュータ
で実現するために、該コンピュータにインストールされ
るプログラムコード自体も本発明を実現するものであ
る。つまり、本発明は、本発明の機能処理を実現するた
めのコンピュータプログラム自体も含まれる。
【0066】その場合、プログラムの機能を有していれ
ば、オブジェクトコード、インタプリタにより実行され
るプログラム、OSに供給するスクリプトデータ等、プ
ログラムの形態を問わない。
【0067】プログラムを供給するための記録媒体とし
ては、例えば、フロッピー(登録商標)ディスク、ハー
ドディスク、光ディスク、光磁気ディスク、MO、CD
−ROM、CD−R、CD−RW、磁気テープ、不揮発
性のメモリカード、ROM、DVD(DVD−ROM,
DVD−R)などがある。
【0068】その他、プログラムの供給方法としては、
クライアントコンピュータのブラウザを用いてインター
ネットのホームページに接続し、該ホームページから本
発明のコンピュータプログラムそのもの、もしくは圧縮
され自動インストール機能を含むファイルをハードディ
スク等の記録媒体にダウンロードすることによっても供
給できる。また、本発明のプログラムを構成するプログ
ラムコードを複数のファイルに分割し、それぞれのファ
イルを異なるホームページからダウンロードすることに
よっても実現可能である。つまり、本発明の機能処理を
コンピュータで実現するためのプログラムファイルを複
数のユーザに対してダウンロードさせるWWWサーバ
も、本発明に含まれるものである。
【0069】また、本発明のプログラムを暗号化してC
D−ROM等の記憶媒体に格納してユーザに配布し、所
定の条件をクリアしたユーザに対し、インターネットを
介してホームページから暗号化を解く鍵情報をダウンロ
ードさせ、その鍵情報を使用することにより暗号化され
たプログラムを実行してコンピュータにインストールさ
せて実現することも可能である。
【0070】また、コンピュータが、読み出したプログ
ラムを実行することによって、前述した実施形態の機能
が実現される他、そのプログラムの指示に基づき、コン
ピュータ上で稼動しているOSなどが、実際の処理の一
部または全部を行ない、その処理によっても前述した実
施形態の機能が実現され得る。
【0071】さらに、記録媒体から読み出されたプログ
ラムが、コンピュータに挿入された機能拡張ボードやコ
ンピュータに接続された機能拡張ユニットに備わるメモ
リに書き込まれた後、そのプログラムの指示に基づき、
その機能拡張ボードや機能拡張ユニットに備わるCPU
などが実際の処理の一部または全部を行ない、その処理
によっても前述した実施形態の機能が実現される。
【0072】
【発明の効果】以上説明したように、本発明によれば、
容易にかつ効率的に出力文中の語の語義を提供すること
ができる音声合成装置及びその方法、プログラムを提供
できる。
【図面の簡単な説明】
【図1】本発明の実施形態の音声合成装置の機能構成を
示すブロック図である。
【図2】本発明の実施形態の音声合成装置で実行される
処理を示すフローチャートである。
【図3】本発明の実施形態の語義説明要求対象語の文解
析部105の動作例を説明するための図である。
【図4】本発明の実施形態の応用例を示す図である。
【符号の説明】
101 語義検索部 102 語義辞書 103 ユーザ指示入力部 104 同期管理部 105 文解析部 106 波形データ作成部 107 音声出力部 108 文入力部 109 読み上げ文書データ 110 解析用辞書 111 素片辞書
───────────────────────────────────────────────────── フロントページの続き (51)Int.Cl.7 識別記号 FI テーマコート゛(参考) G06F 17/30 170 G06F 17/30 360Z 360 G10L 3/00 E G10L 21/06 S

Claims (17)

    【特許請求の範囲】
  1. 【請求項1】 文書データを音声出力する音声合成装置
    であって、 音声出力される文書データ中の語に対する語義説明要求
    を入力する入力手段と、 前記語義説明要求が入力された場合、その語義説明要求
    入力直前までに音声出力された既出力文書データを解析
    する解析手段と、 前記解析手段の解析結果に基づいて得られる語義説明要
    求対象語に対応する語義文を検索する検索手段と、 前記語義文を出力する出力手段とを備えることを特徴と
    する音声合成装置。
  2. 【請求項2】 前記解析手段は、前記既出力文書データ
    において、語義説明要求の直前に音声出力された語を前
    記語義説明要求対象語とすることを特徴とする請求項1
    に記載の音声合成装置。
  3. 【請求項3】 前記解析手段は、前記既出力文書データ
    中の所定語以外の語語群から語義説明要求対象語を推定
    することを特徴とする請求項1に記載の音声合成装置。
  4. 【請求項4】 前記所定語は、語義説明対象外フラグを
    有する語であることを特徴とする請求項3に記載の音声
    合成装置。
  5. 【請求項5】 前記所定語は、少なくとも名詞以外の品
    詞を有する語であることを特徴とする請求項3に記載の
    音声合成装置。
  6. 【請求項6】 前記語義説明要求が入力された場合、前
    記出力手段は、前記既出力文書データを、前回の出力速
    度より遅い出力速度で再出力し、前記解析手段は、前記
    再出力される既出力文書データに対して入力される語義
    説明要求に基づいて、該既出力文書データを解析するこ
    とを特徴とする請求項1に記載の音声合成装置。
  7. 【請求項7】 前記出力手段は、前記語義文を音声出力
    することを特徴とする請求項1に記載の音声合成装置。
  8. 【請求項8】 前記出力手段は、前記語義文を文字表示
    することを特徴とする請求項1に記載の音声合成装置。
  9. 【請求項9】 文書データを音声出力する音声合成方法
    であって、 音声出力される文書データ中の語に対する語義説明要求
    を入力する入力工程と、 前記語義説明要求が入力された場合、その語義説明要求
    入力直前までに音声出力された既出力文書データを解析
    する解析工程と、 前記解析工程の解析結果に基づいて得られる語義説明要
    求対象語に対応する語義文を検索する検索工程と、 前記語義文を出力する出力工程とを備えることを特徴と
    する音声合成方法。
  10. 【請求項10】 前記解析工程は、前記既出力文書デー
    タにおいて、語義説明要求の直前に音声出力された語を
    前記語義説明要求対象語とすることを特徴とする請求項
    9に記載の音声合成方法。
  11. 【請求項11】 前記解析工程は、前記既出力文書デー
    タ中の所定語以外の語語群から語義説明要求対象語を推
    定することを特徴とする請求項9に記載の音声合成方
    法。
  12. 【請求項12】 前記所定語は、語義説明対象外フラグ
    を有する語であることを特徴とする請求項11に記載の
    音声合成方法。
  13. 【請求項13】 前記所定語は、少なくとも名詞以外の
    品詞を有する語であることを特徴とする請求項11に記
    載の音声合成方法。
  14. 【請求項14】 前記語義説明要求が入力された場合、
    前記出力工程は、前記既出力文書データを、前回の出力
    速度より遅い出力速度で再出力し、 前記解析工程は、前記再出力される既出力文書データに
    対して入力される語義説明要求に基づいて、該既出力文
    書データを解析することを特徴とする請求項9に記載の
    音声合成方法。
  15. 【請求項15】 前記出力工程は、前記語義文を音声出
    力することを特徴とする請求項9に記載の音声合成方
    法。
  16. 【請求項16】 前記出力工程は、前記語義文を文字表
    示することを特徴とする請求項9に記載の音声合成方
    法。
  17. 【請求項17】 文書データを音声出力する音声合成を
    コンピュータに機能させるためのプログラムであって、 音声出力される文書データ中の語に対する語義説明要求
    を入力する入力工程のプログラムコードと、 前記語義説明要求が入力された場合、その語義説明要求
    入力直前までに音声出力された既出力文書データを解析
    する解析工程のプログラムコードと、 前記解析工程の解析結果に基づいて得られる語義説明要
    求対象語に対応する語義文を検索する検索工程のプログ
    ラムコードと、 前記語義文を出力する出力工程のプログラムコードとを
    備えることを特徴とするプログラム。
JP2002062298A 2002-03-07 2002-03-07 音声合成装置及びその方法、プログラム Expired - Fee Related JP3848181B2 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2002062298A JP3848181B2 (ja) 2002-03-07 2002-03-07 音声合成装置及びその方法、プログラム
US10/376,205 US7353175B2 (en) 2002-03-07 2003-03-04 Apparatus, method, and program for speech synthesis with capability of providing word meaning immediately upon request by a user

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2002062298A JP3848181B2 (ja) 2002-03-07 2002-03-07 音声合成装置及びその方法、プログラム

Publications (3)

Publication Number Publication Date
JP2003263184A true JP2003263184A (ja) 2003-09-19
JP2003263184A5 JP2003263184A5 (ja) 2004-11-18
JP3848181B2 JP3848181B2 (ja) 2006-11-22

Family

ID=29196136

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2002062298A Expired - Fee Related JP3848181B2 (ja) 2002-03-07 2002-03-07 音声合成装置及びその方法、プログラム

Country Status (2)

Country Link
US (1) US7353175B2 (ja)
JP (1) JP3848181B2 (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007086185A (ja) * 2005-09-20 2007-04-05 Mitsubishi Electric Corp 音声合成装置
WO2009072412A1 (ja) * 2007-12-03 2009-06-11 Nec Corporation 読み上げシステム、読み上げ方法、読み上げプログラム、および記録媒体

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4743686B2 (ja) * 2005-01-19 2011-08-10 京セラ株式会社 携帯端末装置、およびその音声読み上げ方法、並びに音声読み上げプログラム
EP1876522A1 (en) * 2005-04-12 2008-01-09 Sharp Kabushiki Kaisha Audio reproducing method, character code using device, distribution service system, and character code management method
EP3564954B1 (en) 2010-01-19 2020-11-11 Dolby International AB Improved subband block based harmonic transposition
CN102314874A (zh) * 2010-06-29 2012-01-11 鸿富锦精密工业(深圳)有限公司 文本到语音转换系统与方法

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS63231396A (ja) * 1987-03-20 1988-09-27 株式会社日立製作所 情報出力方式
JPH10105192A (ja) * 1996-10-03 1998-04-24 Toyota Motor Corp 車両用音声案内装置
JP2000267687A (ja) * 1999-03-19 2000-09-29 Mitsubishi Electric Corp 音声応答装置
JP2002259373A (ja) * 2001-02-27 2002-09-13 Sony Corp 辞書装置

Family Cites Families (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5351189A (en) * 1985-03-29 1994-09-27 Kabushiki Kaisha Toshiba Machine translation system including separated side-by-side display of original and corresponding translated sentences
US4890230A (en) * 1986-12-19 1989-12-26 Electric Industry Co., Ltd. Electronic dictionary
DE3840433A1 (de) * 1988-12-01 1990-06-07 Philips Patentverwaltung Echokompensator
GB9103768D0 (en) * 1991-02-22 1991-04-10 King Reginald A Educational apparatus
JPH0522487A (ja) 1991-07-16 1993-01-29 Canon Inc 画像通信装置
US5541838A (en) * 1992-10-26 1996-07-30 Sharp Kabushiki Kaisha Translation machine having capability of registering idioms
US5623609A (en) * 1993-06-14 1997-04-22 Hal Trust, L.L.C. Computer system and computer-implemented process for phonology-based automatic speech recognition
US5577164A (en) 1994-01-28 1996-11-19 Canon Kabushiki Kaisha Incorrect voice command recognition prevention and recovery processing method and apparatus
JPH10134068A (ja) 1996-10-29 1998-05-22 Nippon Telegr & Teleph Corp <Ntt> 情報獲得支援方法及び装置
JPH10171485A (ja) 1996-12-12 1998-06-26 Matsushita Electric Ind Co Ltd 音声合成装置
EP0972254A1 (en) * 1997-04-01 2000-01-19 Yeong Kuang Oon Didactic and content oriented word processing method with incrementally changed belief system
US6704699B2 (en) * 2000-09-05 2004-03-09 Einat H. Nir Language acquisition aide

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS63231396A (ja) * 1987-03-20 1988-09-27 株式会社日立製作所 情報出力方式
JPH10105192A (ja) * 1996-10-03 1998-04-24 Toyota Motor Corp 車両用音声案内装置
JP2000267687A (ja) * 1999-03-19 2000-09-29 Mitsubishi Electric Corp 音声応答装置
JP2002259373A (ja) * 2001-02-27 2002-09-13 Sony Corp 辞書装置

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007086185A (ja) * 2005-09-20 2007-04-05 Mitsubishi Electric Corp 音声合成装置
WO2009072412A1 (ja) * 2007-12-03 2009-06-11 Nec Corporation 読み上げシステム、読み上げ方法、読み上げプログラム、および記録媒体
JP5413199B2 (ja) * 2007-12-03 2014-02-12 日本電気株式会社 読み上げシステム、読み上げ方法、読み上げプログラム、および記録媒体

Also Published As

Publication number Publication date
US20030212560A1 (en) 2003-11-13
JP3848181B2 (ja) 2006-11-22
US7353175B2 (en) 2008-04-01

Similar Documents

Publication Publication Date Title
JP5257330B2 (ja) 発言記録装置、発言記録方法、プログラム及び記録媒体
JP3610083B2 (ja) マルチメディアプレゼンテーション装置および方法
US6181351B1 (en) Synchronizing the moveable mouths of animated characters with recorded speech
JP2000081892A (ja) 効果音付加装置および効果音付加方法
JP2003295882A (ja) 音声合成用テキスト構造、音声合成方法、音声合成装置及びそのコンピュータ・プログラム
CN110781328A (zh) 基于语音识别的视频生成方法、系统、装置和存储介质
JP2009042968A (ja) 情報選別システム、情報選別方法及び情報選別用プログラム
JP4314201B2 (ja) 歌詞と音楽との同期データ作成方法、装置、プログラムおよびプログラムを記録する記録媒体
JPH11175517A (ja) 情報処理装置およびその方法
US11176943B2 (en) Voice recognition device, voice recognition method, and computer program product
JP2003263184A (ja) 音声合成装置及びその方法、プログラム
US20080243510A1 (en) Overlapping screen reading of non-sequential text
JPH10326176A (ja) 音声対話制御方法
JP2001272990A (ja) 対話記録編集装置
JP2019197210A (ja) 音声認識誤り修正支援装置およびそのプログラム
CN116343771A (zh) 一种基于知识图谱的音乐点播语音指令识别方法、装置
JP2005004100A (ja) 聴取システムおよび音声合成装置
JP2004020739A (ja) 議事録作成装置、議事録作成方法、議事録作成プログラム
JP6342792B2 (ja) 音声認識方法、音声認識装置及び音声認識プログラム
JP5382965B2 (ja) 出願文書情報作成装置、出願文書情報作成方法、及びプログラム
JP2021117759A (ja) テキスト情報編集装置及びテキスト情報編集方法
JP7128222B2 (ja) 映像コンテンツに対する合成音のリアルタイム生成を基盤としたコンテンツ編集支援方法およびシステム
JP5383608B2 (ja) 解説放送文作成支援装置及びプログラム
JP2007127994A (ja) 音声合成方法及び音声合成装置並びにプログラム
JP2000214874A (ja) 音声合成装置及びその方法、コンピュ―タ可読メモリ

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20051114

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20051121

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20060118

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20060210

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20060406

A911 Transfer to examiner for re-examination before appeal (zenchi)

Free format text: JAPANESE INTERMEDIATE CODE: A911

Effective date: 20060510

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20060529

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20060704

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20060804

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20060824

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090901

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100901

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110901

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110901

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120901

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120901

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130901

Year of fee payment: 7

LAPS Cancellation because of no payment of annual fees