JPWO2008062529A1 - 文書読上げ装置、文書読上げ装置を制御する制御方法及び文書読上げ装置を制御する制御プログラム - Google Patents
文書読上げ装置、文書読上げ装置を制御する制御方法及び文書読上げ装置を制御する制御プログラム Download PDFInfo
- Publication number
- JPWO2008062529A1 JPWO2008062529A1 JP2008545287A JP2008545287A JPWO2008062529A1 JP WO2008062529 A1 JPWO2008062529 A1 JP WO2008062529A1 JP 2008545287 A JP2008545287 A JP 2008545287A JP 2008545287 A JP2008545287 A JP 2008545287A JP WO2008062529 A1 JPWO2008062529 A1 JP WO2008062529A1
- Authority
- JP
- Japan
- Prior art keywords
- information
- word
- text
- display
- speech
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims description 31
- 230000001502 supplementing effect Effects 0.000 abstract description 7
- 238000010586 diagram Methods 0.000 description 12
- 230000006870 function Effects 0.000 description 10
- 238000012544 monitoring process Methods 0.000 description 6
- 230000000694 effects Effects 0.000 description 3
- 239000000284 extract Substances 0.000 description 2
- 230000002194 synthesizing effect Effects 0.000 description 2
- 238000004891 communication Methods 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 239000000047 product Substances 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 230000033764 rhythmic process Effects 0.000 description 1
- 239000013589 supplement Substances 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L13/00—Speech synthesis; Text to speech systems
- G10L13/02—Methods for producing synthetic speech; Speech synthesisers
- G10L13/04—Details of speech synthesis systems, e.g. synthesiser structure or memory management
Landscapes
- Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Document Processing Apparatus (AREA)
Abstract
Description
単語単位の音声情報を記憶した記憶手段を有する文章読上げ装置において、音声情報が記憶されていないため、不自然な合成音声で発話された単語を補足する機能を有する文章読上げ装置を提供する。
(課題を解決するための手段)
上記の発明が解決しようとする課題を解決するための第一の手段として、単語単位の音声情報を記憶した記憶手段を有する文章読み上げ装置において、記憶手段に記憶されていない未記憶単語が読み上げ対象文書に存在するかどうかを判断する判断手段と、判断手段の判断結果に基づいて未記憶単語の表記情報を強調して表示する表示手段を有する。
(発明の効果)
音声情報が記憶されていないため合成音声で読上げられた単語の意味を完全に理解できる効果がある。
3 CPU
5 記憶部
7 入力部
9 出力部
11 バス
51 文章読上げプログラム
53 単語DB
55 音素DB
57 記号DB
(1)機械操作や移動しているときで、その単語の意味を確認する時間がない場面
(2)その単語が未知のもので、自然な音声で発話されても意味を理解できない場面
(3)その単語を表示するハードウェアが小さく、その単語の文字を確認することが難しい場面
このため、不自然な合成音声で発話された単語を補足する機能を提供する本発明が必要となる。
以下に図面を用いて本発明の実施例1と実施例2について説明する。
(実施例1)
[1.ハードウェア構成のブロック図]
図1は、文章読上げ装置1のハードウェア構成の一例を示すブロック図である。文章読上げ装置1は、CPU(CentralProcessing Unit)3と記憶部5、入力部7、出力部9、バス11で構成されている。CPU3は、各部の制御や各種の演算を行うものである。記憶部5は、文章読上げプログラム51や単語DB53、音素DB55、記号DB57を格納するものである。そして、プログラムの実行やデータの記憶を行うRAM(RandomAccess Memory)、プログラムやデータの記憶を行うROM(Read Only Memory)、プログラムやデータを大量に記憶できる外部記憶装置として動作するものである。文章読上げプログラム51は、入力部7から読上げ対象文書と読上げ要求を与えられると、単語DB53や音素DB55、記号DB57を使って読上げ処理を行うものである。この読上げ処理は、音声情報が記憶されていない単語の合成音声を補足する機能を含むものである。単語DB53は、読上げに使う単語単位の音声情報を記憶したものである。音素DB55は、読上げに使う音素情報を記憶したものである。記号DB57は、上述の合成音声を補足するための記号情報を記憶したものである。入力部7は、読上げ対象文書や文章読上げ処理に対する外部からの要求を文章読上げ装置1に与えるためのものである。具体的には、読上げ対象文書としての電子メールを入力する通信インターフェースや対象文書の読上げや後述する表記情報の表示終了などの要求のボタンとして動作可能なものである。出力部9は、読上げ音声や読上げ音声に関わる表記情報を外部に送り出すものである。具体的には、スピーカーやモニターとして動作するものである。バス11は、CPU3と記憶部5、入力部7、出力部9の間でデータを交換するためのものである。また、ここでいう文章とは、文字を連ねて、思想や感情をひとまとまりにしたものを意味する。
(1)入力部7から読上げ対象文書とそれに対する読上げ要求を与えられる。
(2)CPU3が文章読上げプログラム51をRAMに展開し、文章読上げプログラム51を実行する。そして、文章読上げプログラム51は、(1)で与えられた読上げ対象文書と単語DB53、音素DB55、記号DB57を使い、読上げ対象文書の読上げ音声情報や読上げ音声情報に対応する表記情報を生成する。
(3)出力部9が(2)で生成した読上げ音声情報や読上げ音声情報に対応する表記情報を外部に送り出す。
図2は、単語の音声情報を記憶した単語DB53を示している。単語DB53は、文章読上げ装置1が対象読み上げ文章で使われている単語の音声情報を抽出するために使うものである。単語DB53の情報要素は、単語名531と音声情報533、読上げ時間535である。単語名531は、文章読上げ装置1が対象読み上げ文書で使用されている単語の音声情報を探すときに使う情報である。音声情報533は、音声読上げ装置1が単語の音を出力部9から外部に送り出すときに使うものである。この音声情報は、人が発音した単語の音声を符号化した情報であり、場合によってはそれを更に圧縮処理したものである。読上げ時間535は、音声情報533の読上げに掛かる時間である。この読上げ時間535は、文章読上げ装置1が単語DB53に記憶されていない単語の表記情報を表示する契機を計算するために使用する情報である。
図3は、音素情報を記憶した音素DB55を示している。音素DB55は、文章読上げ装置1が単語DB53に記憶されていない音声を合成するために使うものである。音素DB55の情報要素は、音素名551と、音素情報553、読上げ時間555である。音素名551は、文章読上げ装置1が合成の対象となる音素情報を抽出するために使うものである。音素情報553は、音声読上げ装置1が単語DB53に記憶されていない単語の音声情報を合成するときに使うものである。この音素情報553は、人が発音した単語の音声から抽出した音素の音を符号化した情報であり、場合によってはそれを更に圧縮処理したものである。読上げ時間555は、音素情報553の読上げに掛かる時間である。この読上げ時間555は、文章読上げ装置1が単語DB53に記憶されていない単語の表記情報を表示する契機を計算するために使用する情報である。
図4は、単語DB53に記憶されていない単語の記号を記憶した記号DB57を示している。記号DB57は、文章読上げ装置1が単語DB53に記憶されていないが、対象読み上げ文書で使用されている単語の意味に関連する記号を表示するために使うものである。ここでいう記号とは、文字以外のしるしを意味する。記号DB57の情報要素は、単語名571と記号情報573である。また、ここでいう文字とは、言葉を表すしるしを意味する。単語名571は、文章読上げ装置1が対象読み上げ文書で使用されている単語の記号情報を探すときに使う情報である。記号情報573は、音声読上げ装置1が単語の意味に関連する記号を出力部9から外部に送り出すときに使うものである。ここでは、例として会社のロゴマークを格納している。
図5は、文章読上げ機能の一例を示す機能ブロック図である。文章読上げ装置1が有する文章読上げ機能は、文章読上げプログラム51が実行されることにより機能する。その文章読上げ機能は、入力手段2と判断手段4、記憶手段6、発話手段8、表示手段10で構成される。以下に文章読上げ機能の各手段について説明する。
入力手段2は、読上げ対象文書とそれに対する読上げ要求を文章読上げ装置1に与える。また、後述する表記情報の表示終了要求を表示手段10に与える。
判断手段4は、以下の動作を行う。
(1)入力手段2から与えられた読上げ対象文書と記憶手段6に記憶されている単語単位の音声情報や音素情報を使って読上げ文章に対応する全体音声情報を生成する。また、全体音声情報に合成音声情報が含まれるとき、発話中に監視する合成音声情報を読上げる契機を設定する。ここでいう合成音声情報とは、記憶手段中に音声情報が存在しない未記憶単語の音声情報を上述の音素情報を使って生成したものである。そして全体音声情報を発話手段8に与える。
(2)未記憶単語の合成音声情報を読み上げる契機を監視する。そして、その契機を検知したとき、未記憶単語の文字や記号に相当する表記情報を表示手段10に与える。
記憶手段6は、単語単位の音声情報や音素情報、単語単位の記号情報を記憶する。単語単位の音声情報は、単語DB53に対応するものである。音素情報は、音素DB55に対応するものである。記号情報は、記号DB57に対応するものである。
発話手段8は、判断手段4から与えられた全体音声情報を音として外部に送り出す。
表示手段10は、判断手段4から与えられた表記情報を文字や記号として外部に送り出す。また、入力手段2から与えられた表記情報の表示終了要求により、文字や記号を外部に送り出す処理を終了する。
以下に図6、7を使って、実施例1における文章読上げ処理を説明する。
読上げ対象文章の初めに存在する単語から未記憶単語の前までに存在する単語の個々の読上げ時間535を加算し、それらの音声情報を発話するために必要な時間を計算する。そして、その計算した時間を未記憶単語の表示開始契機として記憶部5に記憶する。そして、未記憶単語の合成音声を生成するときに使った音素情報の読上げ時間555を加算して合成音声を発話するために必要な時間を計算する。そして、その計算した時間と上記表示開始契機を加算した時間を未記憶単語の表示終了契機として記憶部5に記憶する。読上げ対象文章中に未記憶単語が複数存在するときは、上述の処理を繰り返す。
(実施例2)
実施例2では、実施例1とは未記憶単語やその未記憶単語に対応する記号の表示を終了する契機が異なる文章読上げ処理について説明する。
【請求項1】
Claims (9)
- 単語単位の音声情報を記憶した記憶手段を有する文章読み上げ装置において、
該記憶手段に記憶されていない未記憶単語が読み上げ対象文書に存在するかどうかを判断する判断手段と、
該判断手段の判断結果に基づいて未記憶単語の表記情報を強調して表示する表示手段と、
を有することを特徴とする文章読み上げ装置。 - 該表示情報は、該未記憶単語と該未記憶単語の記号情報であることを特徴とする請求項1記載の文章読み上げ装置。
- 該表示手段は、外部からの要求に基づいて該表記情報の表示を終了することを特徴とする請求項1記載の文章読上げ装置。
- 単語単位の音声情報を記憶した記憶手段を有する文章読み上げ装置を制御する制御方法において、
該記憶手段に記憶されていない未記憶単語が読み上げ対象文書に存在するかどうかを判断する判断ステップと、
該判断ステップの判断結果に基づいて未記憶単語の表記情報を強調して表示する表示ステップと、
を有することを特徴とする制御方法。 - 該表示情報は、該未記憶単語と該未記憶単語の記号情報であることを特徴とする請求項4記載の制御方法。
- 該表示ステップは、外部からの要求に基づいて該表記情報の表示を終了することを特徴とする請求項4記載の制御方法。
- 単語単位の音声情報を記憶した記憶手段を有する文章読み上げ装置を制御する制御プログラムにおいて、
該記憶手段に記憶されていない未記憶単語が読み上げ対象文書に存在するかどうかを判断する判断ステップと、
該判断ステップの判断結果に基づいて未記憶単語の表記情報を強調して表示する表示ステップと、
を有することを特徴とする制御プログラム。 - 該表示情報は、該未記憶単語と該未記憶単語の記号情報であることを特徴とする請求項7記載の制御プログラム。
- 該表示ステップは、外部からの要求に基づいて該表記情報の表示を終了することを特徴とする請求項7記載の制御プログラム。
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
PCT/JP2006/323427 WO2008062529A1 (fr) | 2006-11-24 | 2006-11-24 | Dispositif de lecture de phrase, procédé de commande de dispositif de lecture de phrase et programme de commande du dispositif de lecture de phrase |
Publications (2)
Publication Number | Publication Date |
---|---|
JPWO2008062529A1 true JPWO2008062529A1 (ja) | 2010-03-04 |
JP4973664B2 JP4973664B2 (ja) | 2012-07-11 |
Family
ID=39429471
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2008545287A Active JP4973664B2 (ja) | 2006-11-24 | 2006-11-24 | 文書読上げ装置、文書読上げ装置を制御する制御方法及び文書読上げ装置を制御する制御プログラム |
Country Status (3)
Country | Link |
---|---|
US (1) | US8315873B2 (ja) |
JP (1) | JP4973664B2 (ja) |
WO (1) | WO2008062529A1 (ja) |
Families Citing this family (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP6045175B2 (ja) * | 2012-04-05 | 2016-12-14 | 任天堂株式会社 | 情報処理プログラム、情報処理装置、情報処理方法及び情報処理システム |
US9942396B2 (en) * | 2013-11-01 | 2018-04-10 | Adobe Systems Incorporated | Document distribution and interaction |
US9544149B2 (en) | 2013-12-16 | 2017-01-10 | Adobe Systems Incorporated | Automatic E-signatures in response to conditions and/or events |
US9703982B2 (en) | 2014-11-06 | 2017-07-11 | Adobe Systems Incorporated | Document distribution and interaction |
US9531545B2 (en) | 2014-11-24 | 2016-12-27 | Adobe Systems Incorporated | Tracking and notification of fulfillment events |
US9432368B1 (en) | 2015-02-19 | 2016-08-30 | Adobe Systems Incorporated | Document distribution and interaction |
US9935777B2 (en) | 2015-08-31 | 2018-04-03 | Adobe Systems Incorporated | Electronic signature framework with enhanced security |
US9626653B2 (en) | 2015-09-21 | 2017-04-18 | Adobe Systems Incorporated | Document distribution and interaction with delegation of signature authority |
US10347215B2 (en) | 2016-05-27 | 2019-07-09 | Adobe Inc. | Multi-device electronic signature framework |
US10503919B2 (en) | 2017-04-10 | 2019-12-10 | Adobe Inc. | Electronic signature framework with keystroke biometric authentication |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH07140996A (ja) * | 1993-11-16 | 1995-06-02 | Fujitsu Ltd | 音声規則合成装置 |
JPH10228471A (ja) * | 1996-12-10 | 1998-08-25 | Fujitsu Ltd | 音声合成システム,音声用テキスト生成システム及び記録媒体 |
JP2001188777A (ja) * | 1999-10-27 | 2001-07-10 | Microsoft Corp | 音声をテキストに関連付ける方法、音声をテキストに関連付けるコンピュータ、コンピュータで文書を生成し読み上げる方法、文書を生成し読み上げるコンピュータ、コンピュータでテキスト文書の音声再生を行う方法、テキスト文書の音声再生を行うコンピュータ、及び、文書内のテキストを編集し評価する方法 |
JP2005018037A (ja) * | 2003-06-05 | 2005-01-20 | Kenwood Corp | 音声合成装置、音声合成方法及びプログラム |
Family Cites Families (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH0635913A (ja) * | 1992-07-21 | 1994-02-10 | Canon Inc | 文章読み上げ装置 |
JPH0887698A (ja) | 1994-09-16 | 1996-04-02 | Alpine Electron Inc | 車載用ナビゲーション装置 |
JPH10171485A (ja) * | 1996-12-12 | 1998-06-26 | Matsushita Electric Ind Co Ltd | 音声合成装置 |
JP3804188B2 (ja) * | 1997-06-09 | 2006-08-02 | ブラザー工業株式会社 | 文章読み上げ装置 |
GB2357943B (en) * | 1999-12-30 | 2004-12-08 | Nokia Mobile Phones Ltd | User interface for text to speech conversion |
US7451087B2 (en) * | 2000-10-19 | 2008-11-11 | Qwest Communications International Inc. | System and method for converting text-to-voice |
JP2003308085A (ja) * | 2002-04-15 | 2003-10-31 | Canon Inc | 音声処理装置およびその制御方法、ならびにプログラム |
JP2004171174A (ja) * | 2002-11-19 | 2004-06-17 | Brother Ind Ltd | 文章読み上げ装置、読み上げのためのプログラム及び記録媒体 |
US7913176B1 (en) * | 2003-03-03 | 2011-03-22 | Aol Inc. | Applying access controls to communications with avatars |
JP2005265477A (ja) | 2004-03-16 | 2005-09-29 | Matsushita Electric Ind Co Ltd | 車載ナビゲーションシステム |
JP4639932B2 (ja) * | 2005-05-06 | 2011-02-23 | 株式会社日立製作所 | 音声合成装置 |
-
2006
- 2006-11-24 WO PCT/JP2006/323427 patent/WO2008062529A1/ja active Application Filing
- 2006-11-24 JP JP2008545287A patent/JP4973664B2/ja active Active
-
2009
- 2009-05-11 US US12/463,532 patent/US8315873B2/en not_active Expired - Fee Related
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH07140996A (ja) * | 1993-11-16 | 1995-06-02 | Fujitsu Ltd | 音声規則合成装置 |
JPH10228471A (ja) * | 1996-12-10 | 1998-08-25 | Fujitsu Ltd | 音声合成システム,音声用テキスト生成システム及び記録媒体 |
JP2001188777A (ja) * | 1999-10-27 | 2001-07-10 | Microsoft Corp | 音声をテキストに関連付ける方法、音声をテキストに関連付けるコンピュータ、コンピュータで文書を生成し読み上げる方法、文書を生成し読み上げるコンピュータ、コンピュータでテキスト文書の音声再生を行う方法、テキスト文書の音声再生を行うコンピュータ、及び、文書内のテキストを編集し評価する方法 |
JP2005018037A (ja) * | 2003-06-05 | 2005-01-20 | Kenwood Corp | 音声合成装置、音声合成方法及びプログラム |
Also Published As
Publication number | Publication date |
---|---|
US20090222269A1 (en) | 2009-09-03 |
US8315873B2 (en) | 2012-11-20 |
JP4973664B2 (ja) | 2012-07-11 |
WO2008062529A1 (fr) | 2008-05-29 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP4973664B2 (ja) | 文書読上げ装置、文書読上げ装置を制御する制御方法及び文書読上げ装置を制御する制御プログラム | |
EP1768103B1 (en) | Device in which selection is activated by voice and method in which selection is activated by voice | |
JP4867804B2 (ja) | 音声認識装置及び会議システム | |
JP5029167B2 (ja) | 音声読み上げのための装置、プログラム及び方法 | |
JP4973337B2 (ja) | 音声読み上げのための装置、プログラム及び方法 | |
US7792673B2 (en) | Method of generating a prosodic model for adjusting speech style and apparatus and method of synthesizing conversational speech using the same | |
JP5029168B2 (ja) | 音声読み上げのための装置、プログラム及び方法 | |
JP2006517037A (ja) | 韻律的模擬語合成方法および装置 | |
JP2007140200A (ja) | 語学学習装置およびプログラム | |
US7031924B2 (en) | Voice synthesizing apparatus, voice synthesizing system, voice synthesizing method and storage medium | |
CN106471569B (zh) | 语音合成设备、语音合成方法及其存储介质 | |
JP4953767B2 (ja) | 音声生成装置 | |
JP6314879B2 (ja) | 音読評価装置、音読評価方法、及びプログラム | |
JP2007286376A (ja) | 音声案内システム | |
JP6825485B2 (ja) | 説明支援プログラム、説明支援方法及び情報処理端末 | |
JP2006139162A (ja) | 語学学習装置 | |
JP2011180416A (ja) | 音声合成装置、音声合成方法およびカーナビゲーションシステム | |
KR101104822B1 (ko) | 큰소리 발성에 기반을 둔 어학 시스템 및 방법 | |
JP2009053522A (ja) | 音声出力装置 | |
JP6957069B1 (ja) | 学習支援システム | |
JP3838193B2 (ja) | 文章読み上げ装置、同装置のためのプログラム及び記録媒体 | |
JP4543919B2 (ja) | 語学学習装置 | |
JP2001282098A (ja) | 外国語学習装置、外国語学習方法および媒体 | |
JP2578876B2 (ja) | 文章読み上げ装置 | |
JP2002366175A (ja) | 音声コミュニケーション支援装置およびその方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20111122 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20120123 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20120313 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20120326 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20150420 Year of fee payment: 3 |