JP4930584B2 - 音声合成装置、音声合成システム、言語処理装置、音声合成方法及びコンピュータプログラム - Google Patents
音声合成装置、音声合成システム、言語処理装置、音声合成方法及びコンピュータプログラム Download PDFInfo
- Publication number
- JP4930584B2 JP4930584B2 JP2009505052A JP2009505052A JP4930584B2 JP 4930584 B2 JP4930584 B2 JP 4930584B2 JP 2009505052 A JP2009505052 A JP 2009505052A JP 2009505052 A JP2009505052 A JP 2009505052A JP 4930584 B2 JP4930584 B2 JP 4930584B2
- Authority
- JP
- Japan
- Prior art keywords
- expression
- speech
- phonetic
- character
- special
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
- 238000012545 processing Methods 0.000 title claims description 110
- 230000015572 biosynthetic process Effects 0.000 title claims description 76
- 238000003786 synthesis reaction Methods 0.000 title claims description 76
- 238000004590 computer program Methods 0.000 title claims description 8
- 238000001308 synthesis method Methods 0.000 title claims description 7
- 230000014509 gene expression Effects 0.000 claims description 639
- 230000006870 function Effects 0.000 claims description 106
- 238000006243 chemical reaction Methods 0.000 claims description 62
- 230000000694 effects Effects 0.000 claims description 60
- 230000002194 synthesizing effect Effects 0.000 claims description 38
- 238000005034 decoration Methods 0.000 claims description 33
- 238000006467 substitution reaction Methods 0.000 claims description 25
- 238000000605 extraction Methods 0.000 claims description 24
- 239000000284 extract Substances 0.000 claims description 20
- 238000000034 method Methods 0.000 description 69
- 238000010586 diagram Methods 0.000 description 50
- 238000004891 communication Methods 0.000 description 16
- 238000004458 analytical method Methods 0.000 description 10
- 238000013461 design Methods 0.000 description 9
- 238000005516 engineering process Methods 0.000 description 6
- 230000008451 emotion Effects 0.000 description 4
- 238000013518 transcription Methods 0.000 description 4
- 230000035897 transcription Effects 0.000 description 4
- OAICVXFJPJFONN-UHFFFAOYSA-N Phosphorus Chemical compound [P] OAICVXFJPJFONN-UHFFFAOYSA-N 0.000 description 3
- 239000002245 particle Substances 0.000 description 3
- 229910052698 phosphorus Inorganic materials 0.000 description 3
- 239000011574 phosphorus Substances 0.000 description 3
- 241000251468 Actinopterygii Species 0.000 description 2
- 238000001514 detection method Methods 0.000 description 2
- 230000002996 emotional effect Effects 0.000 description 2
- BLFWHYXWBKKRHI-JYBILGDPSA-N plap Chemical compound N([C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(O)=O)C(=O)N1[C@@H](CCC1)C(=O)N1[C@@H](CCC1)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)O)C(=O)N1[C@@H](CCC1)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O)C(=O)[C@@H]1CCCN1C(=O)[C@H](CO)NC(=O)[C@@H](N)CCC(O)=O BLFWHYXWBKKRHI-JYBILGDPSA-N 0.000 description 2
- 230000001755 vocal effect Effects 0.000 description 2
- 241000233805 Phoenix Species 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 230000001413 cellular effect Effects 0.000 description 1
- 230000000763 evoking effect Effects 0.000 description 1
- 230000001771 impaired effect Effects 0.000 description 1
- 239000002023 wood Substances 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L13/00—Speech synthesis; Text to speech systems
- G10L13/08—Text analysis or generation of parameters for speech synthesis out of text, e.g. grapheme to phoneme translation, prosody generation or stress or intonation determination
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y10—TECHNICAL SUBJECTS COVERED BY FORMER USPC
- Y10S—TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y10S715/00—Data processing: presentation processing of document, operator interface processing, and screen saver display processing
- Y10S715/977—Dynamic icon, e.g. animated or live action
Landscapes
- Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Machine Translation (AREA)
Description
前記言語処理装置は、複数の特殊文字と、各特殊文字について該特殊文字の意味に対応する一又は複数の読みの音声表現、及び、擬音、効果音、音楽、又は無音の内のいずれかである他の音声表現を含む複数の音声表現の情報とが、各特殊文字の意味、及び、各特殊文字が文字代替目的で使用されているのか、又は、装飾目的で使用されているかの使用形態で分類されて登録されている辞書データベースと、前記抽出手段が特殊文字を抽出した場合に、抽出された特殊文字の意味を判断する判断手段と、抽出された特殊文字を分類する使用形態を判定する判定手段と、該判定手段が、文字代替目的で使用されていると判定した場合、前記判断手段が判断した意味で分類され、且つ、前記文字代替目的での使用形態で分類される読みである音声表現を前記辞書データベースから選択し、前記判定手段が、装飾目的で使用されていると判定した場合、前記判断手段が判断した意味で分類され、且つ前記目的での使用形態で分類される他の音声表現を前記辞書データベースから選択する選択手段とを備え、前記変換手段は、前記抽出された特殊文字に対応させて前記選択手段が選択した音声表現に従って、前記受付手段が受け付けた特殊文字を含むテキストデータを音声表記に変換するようにしてあることを特徴とする。
かの使用形態で分類されて登録されている辞書データベースと、前記抽出手段が特殊文字を抽出した場合に、抽出された特殊文字の意味を判断する判断手段と、抽出された特殊文字を分類する使用形態を判定する判定手段と、該判定手段が、文字代替目的で使用されていると判定した場合、前記判断手段が判断した意味で分類され、且つ、前記文字代替目的での使用形態で分類される読みである音声表現を前記辞書データベースから選択し、前記判定手段が、装飾目的で使用されていると判定した場合、前記判断手段が判断した意味で分類され、且つ前記目的での使用形態で分類される他の音声表現を前記辞書データベースから選択する選択手段と、該選択手段が選択した音声表現、受け付けたテキストデータの内の前記特殊文字の位置、前記変換手段が変換した音声表記を外部へ送信する手段とを備えることを特徴とする。
る辞書データベースから、抽出された特殊文字の音声表現を選択する手段、及び、選択した音声表現に従って前記変換手段により音声表記に変換する手段として機能させることを特徴とする。
なお本発明では、辞書データベースに複数登録されている特殊文字の音声表現は、その特殊文字の意味、及び、特殊文字が文字代替として使用されているのか、又は装飾目的若しくは特殊文字を視覚的に捉えた他の意味を想起させる目的で使用されているかの使用形態によって分類されている。抽出された特殊文字がどのような形態で使用されているか、が判定され、どのような意味で使用されているかが判断され、判定・判断結果に応じた分類の音声表現が選択されて音声が合成される。
文字の多様な意味に対応させ、複数登録されている音声表現の内から、いずれかの音声表現を選択して音声に合成することができる。これにより、テキストに含まれる特殊文字を文字の「代替」又は「装飾」のいずれか一方のみとしてではなく、いずれか又は他の使用形態に応じた音声表現を適宜選択して読み上げることができるので、冗長な読み上げ、ユーザの意図とは異なる読み上げを抑制することができる。
また、本発明による場合、特殊文字が抽出された場合、その特殊文字が文字の「代替」として使用されているのか又は「装飾」として使用されているのか等の使用形態に応じて、及び/又は、想定される多様な意味の内のいずれの意味で使用されているのかに応じて、いずれかの音声表現を選択して音声合成を行なうことができる。したがって、特殊文字を含むテキストの冗長な読み上げ、ユーザの意図とは異なる読み上げが抑制され、特殊文字を含むテキストデータで表わされる文章の文脈に合った適切な読み上げが行なわれる。
さらに、関連語として、同じ文脈で共に生起する単語群を対応付けている場合、ユーザの意図とは異なる意味での読みが選択されることが防止される。
2 言語処理装置
3 音声出力装置
10,20,30 制御部
101,201 テキスト受付部
102,202 特殊文字抽出部
103,203 音声表現選択部
104,204 変換部
105,301 音声合成部
11,21,31 記憶部
111,211 特殊文字辞書
112,212 言語辞書
113,311 音声辞書(波形辞書)
1P 音声合成ライブラリ
2P 制御プログラム
14,33 音声出力部
図1は、実施の形態1における本発明の音声合成装置の構成を示すブロック図である。音声合成装置1は、以下に説明する各構成部の動作を制御する制御部10と、ハードディスク等である記憶部11と、RAM(Random Access Memory)等のメモリを有する一時記憶領域12と、キーボード等を有するテキスト入力部13と、スピーカ141を有する音声出力部14とを備える。
実施の形態1では、音声合成装置1の記憶部11の特殊文字辞書111に登録されている音声表現は、特殊文字が文字の代替として使用されているか又は文字の代替以外で使用されているかの形態による表現1又は表現2で分類され、さらに特殊文字から想起される意味による候補1又は候補2で分類された。これに対し、実施の形態2では、文字の代替以外として使用されている形態の分類を更に細分化する。実施の形態2では、特殊文字が文字の代替として使用されているか又は文字の代替以外として使用されているか、さらに、文字の代替以外として使用されている場合は文章の装飾として特に読みが意図されて使用されているか、又は文章の装飾として特に文章の雰囲気を表現するために使用されているかで音声表現を分類する。
実施の形態3では、音声合成装置1の記憶部11に記憶されている特殊文字辞書111に、音声表現に夫々対応付けて関連語を登録しておき、制御部10が音声表現選択部103として音声表現を選択する際に使用する。
実施の形態4では、音声合成装置1の記憶部11に記憶されている特殊文字辞書111に、音声表現に夫々対応付けて関連語及び同義語を登録しておき、制御部10が音声表現選択部103として特殊文字に対する音声表現を選択する際に使用する。
実施の形態1乃至4では、音声合成装置1の制御部10が、変換部104及び音声合成部105のいずれとしても機能する構成であった。しかしながら、本発明はこれに限らず、変換部104と音声合成部105とが異なる装置に分けて備えられる構成でもよい。実施の形態5では、音声表現選択部103及び変換部104の機能を備える言語処理装置と、音声表記から音声を合成する機能を備える音声出力装置とで本発明の特殊文字を適切に読み上げる効果を実現する。
Claims (16)
- テキストデータを受け付ける受付手段と、該受付手段が受け付けたテキストデータから絵文字、顔文字又は記号を含む特殊文字を抽出する抽出手段と、特殊文字を含むテキストデータを、音声を合成するための音声表記に変換する変換手段と、該変換手段が変換した音声表記から音声を合成する音声合成手段とを備える音声合成装置において、
複数の特殊文字と、各特殊文字について該特殊文字の意味に対応する一又は複数の読みの音声表現、及び、擬音、効果音、音楽、又は無音の内のいずれかである他の音声表現を含む複数の音声表現の情報とが、各特殊文字の意味、及び、各特殊文字が文字代替目的で使用されているのか、又は、装飾目的で使用されているかの使用形態で分類されて登録されている辞書データベースと、
前記抽出手段が特殊文字を抽出した場合に、抽出された特殊文字の意味を判断する判断手段と、
抽出された特殊文字の使用形態を判定する判定手段と、
該判定手段が、文字代替目的で使用されていると判定した場合、前記判断手段が判断した意味で分類され、且つ、前記文字代替目的での使用形態で分類される読みである音声表現を前記辞書データベースから選択し、前記判定手段が、装飾目的で使用されていると判定した場合、前記判断手段が判断した意味で分類され、且つ前記目的での使用形態で分類される他の音声表現を前記辞書データベースから選択する選択手段と
を備え、
前記変換手段は、前記抽出された特殊文字に対応させて前記選択手段が選択した音声表現に従って、前記受付手段が受け付けた特殊文字を含むテキストデータを音声表現に変換するようにしてあること
を特徴とする音声合成装置。 - 前記辞書データベースには更に、各特殊文字に対応する複数の音声表現夫々に、各音声表現とは異なる他の音声表現に対応する意味の読み表記を少なくとも含む関連語が一又は複数対応付けられて登録されており、
受け付けられたテキストデータの内の前記抽出手段が抽出した特殊文字の近傍から前記関連語を検出したか否かを判断する手段を備え、
前記選択手段は、前記関連語を検出したと判断された場合は、検出された関連語が対応付けられている音声表現を前記辞書データベースから選択するようにしてあること
を特徴とする請求項1に記載の音声合成装置。 - 前記辞書データベースには更に、各特殊文字の音声表現夫々に、各音声表現で表わされる特殊文字の意味と同義である同義語が一又は複数対応付けられて登録されており、
受け付けられたテキストデータの内の前記抽出手段が抽出した特殊文字の近傍から前記同義語を検出したか否かを判断する手段を備え、
前記選択手段は、前記同義語を検出したと判断された場合は、抽出された特殊文字の複数の音声表現の内から、検出された同義語が対応付けられている音声表現とは異なる他の音声表現を選択するようにしてあること
を特徴とする請求項1又は2に記載の音声合成装置。 - 特殊文字の音声表現夫々について同じ文脈で共に生起する単語群が関連付けられて登録してある共起辞書データベースを更に備え、
受け付けられたテキストデータの内の前記抽出手段が抽出した特殊文字の近傍から前記共起辞書データベースに登録されている単語群の内のいずれかを検出したか否かを判断する手段を備え、
前記選択手段は、前記単語群のいずれかを検出したと判断された場合、検出された単語群が関連付けられている音声表現を選択するようにしてあること
を特徴とする請求項1乃至3のいずれかに記載の音声合成装置。 - 特殊文字、該特殊文字の音声表現及び該音声表現の分類を受け付ける手段を備え、
受け付けた特殊文字及び該特殊文字の音声表現を、共に受け付けた分類で区別して登録することにより前記辞書データベースを更新するようにしてあること
を特徴とする請求項1乃至4のいずれかに記載の音声合成装置。 - 受け付けた特殊文字を含むテキストデータと共に、前記受け付けた特殊文字が登録されて更新された辞書データベースを出力する手段を備えること
を特徴とする請求項5に記載の音声合成装置。 - テキストデータを受け付ける際に、前記テキストデータに含まれる特殊文字及び該特殊文字の音声表現を受け付ける手段を備え、
前記変換手段は、受け付けられたテキストデータから前記抽出手段が前記特殊文字を抽出した場合、受け付けられた音声表現に従って、受け付けられた特殊文字を含むテキストデータを音声表記に変換するようにしてあること
を特徴とする請求項1乃至6のいずれかに記載の音声合成装置。 - 前記変換手段は、前記抽出手段が抽出した特殊文字に対応して前記選択手段が選択した音声表現が意味を読み上げる音声表現ではない場合、受け付けたテキストデータの内の前記特殊文字を、前記選択手段が選択した音声表現を示す制御文字列に変換するようにしてあり、
前記音声合成手段は、前記変換手段が変換した音声表記に前記制御文字列が含まれている場合は、前記制御文字列に従って、効果音、擬音、音楽、無音のいずれかを合成するようにしてあること
を特徴とする請求項1乃至7のいずれかに記載の音声合成装置。 - 前記音声合成手段は、前記変換手段が変換した音声表記と前記選択手段が選択した音声表現とに従って、前記音声表記の内の前記特殊文字に対応する文字列を効果音、擬音、音楽のいずれかに合成するようにしてあること
を特徴とする請求項1乃至8のいずれかに記載の音声合成装置。 - テキストデータに対応する別の参照テキストデータを受け付ける手段を備え、
前記選択手段は、受け付けられた参照テキストデータからも前記関連語又は同義語が検出されるか否かを判断するようにしてあること
を特徴とする請求項2乃至9のいずれかに記載の音声合成装置。 - テキストデータを受け付ける受付手段、該受付手段が受け付けたテキストデータから絵文字、顔文字又は記号を含む特殊文字を抽出する抽出手段、及び特殊文字を含むテキストデータを音声を合成するための音声表記に変換する変換手段を備える言語処理装置と、音声表記から音声を合成する音声合成装置とを含み、前記言語処理装置が変換した音声表記を前記音声合成装置へ送信し、前記音声合成装置が受信した音声表記から対応する音声を合成するようにしてある音声合成システムにおいて、
前記言語処理装置は、
複数の特殊文字と、各特殊文字について該特殊文字の意味に対応する一又は複数の読みの音声表現、及び、擬音、効果音、音楽、又は無音の内のいずれかである他の音声表現を含む複数の音声表現の情報とが、各特殊文字の意味、及び、各特殊文字が文字代替目的で使用されているのか、又は、装飾目的で使用されているかの使用形態で分類されて登録されている辞書データベースと、
前記抽出手段が特殊文字を抽出した場合に、抽出された特殊文字の意味を判断する判断手段と、
抽出された特殊文字を分類する使用形態を判定する判定手段と、
該判定手段が、文字代替目的で使用されていると判定した場合、前記判断手段が判断した意味で分類され、且つ、前記文字代替目的での使用形態で分類される読みである音声表現を前記辞書データベースから選択し、前記判定手段が、装飾目的で使用されていると判定した場合、前記判断手段が判断した意味で分類され、且つ前記目的での使用形態で分類される他の音声表現を前記辞書データベースから選択する選択手段と
を備え、
前記変換手段は、前記抽出された特殊文字に対応させて前記選択手段が選択した音声表現に従って、前記受付手段が受け付けた特殊文字を含むテキストデータを音声表記に変換するようにしてあること
を特徴とする音声合成システム。 - テキストデータを受け付ける受付手段と、該受付手段が受け付けたテキストデータから絵文字、顔文字又は記号を含む特殊文字を抽出する抽出手段と、特殊文字を含むテキストデータを、音声を合成するための音声表記に変換する手段とを備える言語処理装置において、
複数の特殊文字と、各特殊文字について該特殊文字の意味に対応する一又は複数の読みの音声表現、及び、擬音、効果音、音楽、又は無音の内のいずれかである他の音声表現を含む複数の音声表現の情報とが、各特殊文字の意味、及び、各特殊文字が文字代替目的で使用されているのか、又は、装飾目的で使用されているかの使用形態で分類されて登録されている辞書データベースと、
前記抽出手段が特殊文字を抽出した場合に、抽出された特殊文字の意味を判断する判断手段と、
抽出された特殊文字を分類する使用形態を判定する判定手段と、
該判定手段が、文字代替目的で使用されていると判定した場合、前記判断手段が判断した意味で分類され、且つ、前記文字代替目的での使用形態で分類される読みである音声表現を前記辞書データベースから選択し、前記判定手段が、装飾目的で使用されていると判定した場合、前記判断手段が判断した意味で分類され、且つ前記目的での使用形態で分類される他の音声表現を前記辞書データベースから選択する選択手段と
を備え、
前記変換手段は、前記抽出された特殊文字に対応させて前記選択手段が選択した音声表現に従って、前記受付手段が受け付けた特殊文字を含むテキストデータを音声表記に変換するようにしてあること
を特徴とする言語処理装置。 - 前記変換手段は、前記抽出手段が抽出した特殊文字に対応させて前記選択手段が選択した音声表現が意味を読み上げる音声表現ではない場合、受け付けたテキストデータの内の前記特殊文字を、前記選択手段が選択した音声表現を示す制御文字列に変換するようにしてあり、
前記制御文字列を含む音声表記を外部へ送信する手段
を備えることを特徴とする請求項12に記載の言語処理装置。 - テキストデータを受け付ける受付手段と、該受付手段が受け付けたテキストデータから絵文字、顔文字又は記号を含む特殊文字を抽出する抽出手段と、特殊文字を含むテキストデータを、音声を合成するための音声表記に変換する手段とを備える言語処理装置において、
複数の特殊文字と、各特殊文字について該特殊文字の意味に対応する一又は複数の読みの音声表現、及び、擬音、効果音、音楽、又は無音の内のいずれかである他の音声表現を含む複数の音声表現の情報とが、各特殊文字の意味、及び、各特殊文字が文字代替目的で使用されているのか、又は、装飾目的で使用されているかの使用形態で分類されて登録されている辞書データベースと、
前記抽出手段が特殊文字を抽出した場合に、抽出された特殊文字の意味を判断する判断手段と、
抽出された特殊文字を分類する使用形態を判定する判定手段と、
該判定手段が、文字代替目的で使用されていると判定した場合、前記判断手段が判断した意味で分類され、且つ、前記文字代替目的での使用形態で分類される読みである音声表現を前記辞書データベースから選択し、前記判定手段が、装飾目的で使用されていると判定した場合、前記判断手段が判断した意味で分類され、且つ前記目的での使用形態で分類される他の音声表現を前記辞書データベースから選択する選択手段と、
該選択手段が選択した音声表現、受け付けたテキストデータの内の前記特殊文字の位置、前記変換手段が変換した音声表記を外部へ送信する手段と
を備えることを特徴とする言語処理装置。 - テキストデータから、絵文字、顔文字又は記号を含む特殊文字を抽出し、前記特殊文字を含むテキストデータを音声を合成するための音声表記に変換し、変換した音声表記から音声を合成する音声合成方法において、
複数の特殊文字と、各特殊文字について該特殊文字の意味に対応する一又は複数の読みの音声表現、及び、擬音、効果音、音楽、又は無音の内のいずれかである他の音声表現を含む複数の音声表現の情報とが、各特殊文字の意味、及び、各特殊文字が文字代替目的で使用されているのか、又は、装飾目的で使用されているかの使用形態で分類されて登録されている辞書データベースを用い、
受け付けたテキストデータから特殊文字を抽出した場合に、抽出された特殊文字の意味を判断し、
抽出された特殊文字を分類する使用形態がいずれであるか判定し、
抽出された特殊文字が文字代替目的で使用されていると判定した場合、前記判断手段が判断した意味で分類され、且つ、前記文字代替目的での使用形態で分類される読みである音声表現を前記辞書データベースから選択し、
抽出された特殊文字が装飾目的で使用されていると判定した場合、前記判断手段が判断した意味で分類され、且つ前記目的での使用形態で分類される他の音声表現を前記辞書データベースから選択し、
選択した音声表現に従って、受け付けた特殊文字を含むテキストデータを音声表記に変換すること
を特徴とする音声合成方法。 - コンピュータを、テキストデータから絵文字、顔文字又は記号を含む特殊文字を抽出する抽出手段、前記特殊文字を含むテキストデータを音声を合成するための音声表記に変換する変換手段、及び該変換手段が変換した音声表記から音声を合成する音声合成手段として機能させ、受け付けたテキストデータに対応する音声データを出力させるコンピュータプログラムにおいて、
コンピュータを、
前記抽出手段が特殊文字を抽出した場合に、抽出された特殊文字の意味を判断する手段、
抽出された特殊文字が、文字代替目的で使用されているのか、又は、装飾目的で使用されているかの使用形態を判定する手段、
判断された意味、及び判定された使用形態に基づき、複数の特殊文字と、各特殊文字について該特殊文字の意味に対応する一又は複数の読みの音声表現、及び、擬音、効果音、音楽、又は無音の内のいずれかである他の音声表現を含む複数の音声表現の情報とが、各特殊文字の意味、及び、各特殊文字が文字代替目的で使用されているのか、又は、装飾目的で使用されているかの使用形態で分類されて登録されている辞書データベースから、抽出された特殊文字の音声表現を選択する手段、及び、
選択した音声表現に従って前記変換手段により音声表記に変換する手段
として機能させることを特徴とするコンピュータプログラム。
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
PCT/JP2007/055766 WO2008114453A1 (ja) | 2007-03-20 | 2007-03-20 | 音声合成装置、音声合成システム、言語処理装置、音声合成方法及びコンピュータプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JPWO2008114453A1 JPWO2008114453A1 (ja) | 2010-07-01 |
JP4930584B2 true JP4930584B2 (ja) | 2012-05-16 |
Family
ID=39765574
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2009505052A Expired - Fee Related JP4930584B2 (ja) | 2007-03-20 | 2007-03-20 | 音声合成装置、音声合成システム、言語処理装置、音声合成方法及びコンピュータプログラム |
Country Status (3)
Country | Link |
---|---|
US (1) | US7987093B2 (ja) |
JP (1) | JP4930584B2 (ja) |
WO (1) | WO2008114453A1 (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US9570067B2 (en) | 2014-03-19 | 2017-02-14 | Kabushiki Kaisha Toshiba | Text-to-speech system, text-to-speech method, and computer program product for synthesis modification based upon peculiar expressions |
Families Citing this family (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP5545711B2 (ja) * | 2009-09-25 | 2014-07-09 | 日本電気株式会社 | 文字変換装置及び文字変換方法 |
JP5320269B2 (ja) * | 2009-11-17 | 2013-10-23 | 日本電信電話株式会社 | 記号変換方法、記号変換装置、記号変換プログラム |
JP5320326B2 (ja) * | 2010-03-01 | 2013-10-23 | 日本電信電話株式会社 | 記号変換装置、記号変換方法、記号変換プログラム |
EP2646932A4 (en) | 2010-12-02 | 2017-04-19 | Accessible Publishing Systems Pty Ltd | Text conversion and representation system |
JP6003263B2 (ja) * | 2012-06-12 | 2016-10-05 | 株式会社リコー | 議事録作成支援装置、議事録作成支援システム、議事録作成支援方法、及びプログラム |
US9436891B2 (en) * | 2013-07-30 | 2016-09-06 | GlobalFoundries, Inc. | Discriminating synonymous expressions using images |
US10007935B2 (en) * | 2014-02-28 | 2018-06-26 | Rakuten, Inc. | Information processing system, information processing method, and information processing program |
CN104657074A (zh) * | 2015-01-27 | 2015-05-27 | 中兴通讯股份有限公司 | 一种实现录音的方法、装置和移动终端 |
JP6998017B2 (ja) * | 2018-01-16 | 2022-01-18 | 株式会社Spectee | 音声合成用データ生成装置、音声合成用データ生成方法及び音声合成システム |
KR102221260B1 (ko) * | 2019-03-25 | 2021-03-02 | 한국과학기술원 | 특징 제어 가능 음성 모사를 위한 전자 장치 및 그의 동작 방법 |
CN118335056A (zh) * | 2024-05-14 | 2024-07-12 | 江苏华明国安技术有限公司 | 基于上下文感知的自适应语音播报方法和系统 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH0756588A (ja) * | 1993-08-11 | 1995-03-03 | Fujitsu Ltd | 音声合成における記号処理装置 |
JPH10133853A (ja) * | 1996-10-29 | 1998-05-22 | Nippon Telegr & Teleph Corp <Ntt> | 電子メール書換え方法及び装置 |
JP2000010579A (ja) * | 1998-06-19 | 2000-01-14 | Nec Corp | 音声合成装置及びコンピュータ可読記録媒体 |
JP2002132282A (ja) * | 2000-10-20 | 2002-05-09 | Oki Electric Ind Co Ltd | 電子テキスト読み上げ装置 |
JP2006184642A (ja) * | 2004-12-28 | 2006-07-13 | Fujitsu Ltd | 音声合成装置 |
Family Cites Families (14)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH04253098A (ja) * | 1991-01-30 | 1992-09-08 | Meidensha Corp | 音声合成に用いる数字及び特殊記号の言語処理方法 |
JPH11305987A (ja) * | 1998-04-27 | 1999-11-05 | Matsushita Electric Ind Co Ltd | テキスト音声変換装置 |
US20030158734A1 (en) * | 1999-12-16 | 2003-08-21 | Brian Cruickshank | Text to speech conversion using word concatenation |
JP2001337688A (ja) | 2000-05-26 | 2001-12-07 | Canon Inc | 音声合成装置及び音声合成方法並びに記憶媒体 |
JP3714159B2 (ja) * | 2000-11-30 | 2005-11-09 | 日本電気株式会社 | ブラウザ搭載装置 |
JP2002268665A (ja) * | 2001-03-13 | 2002-09-20 | Oki Electric Ind Co Ltd | テキスト音声合成装置 |
US20020194006A1 (en) * | 2001-03-29 | 2002-12-19 | Koninklijke Philips Electronics N.V. | Text to visual speech system and method incorporating facial emotions |
GB0113570D0 (en) * | 2001-06-04 | 2001-07-25 | Hewlett Packard Co | Audio-form presentation of text messages |
JP2003150507A (ja) * | 2001-11-19 | 2003-05-23 | Denso Corp | 電子メール機能付端末およびコンピュータプログラム |
US7401020B2 (en) * | 2002-11-29 | 2008-07-15 | International Business Machines Corporation | Application of emotion-based intonation and prosody to speech in text-to-speech systems |
JP2004023225A (ja) * | 2002-06-13 | 2004-01-22 | Oki Electric Ind Co Ltd | 情報通信装置およびその信号生成方法、ならびに情報通信システムおよびそのデータ通信方法 |
JP4036741B2 (ja) * | 2002-12-19 | 2008-01-23 | 富士通株式会社 | テキスト読み上げシステム及び方法 |
JP4523312B2 (ja) * | 2004-03-30 | 2010-08-11 | 富士通株式会社 | テキスト音声出力のための装置、方法、及びプログラム |
JP4482368B2 (ja) * | 2004-04-28 | 2010-06-16 | 日本放送協会 | データ放送コンテンツ受信変換装置およびデータ放送コンテンツ受信変換プログラム |
-
2007
- 2007-03-20 JP JP2009505052A patent/JP4930584B2/ja not_active Expired - Fee Related
- 2007-03-20 WO PCT/JP2007/055766 patent/WO2008114453A1/ja active Application Filing
-
2009
- 2009-08-31 US US12/550,883 patent/US7987093B2/en not_active Expired - Fee Related
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH0756588A (ja) * | 1993-08-11 | 1995-03-03 | Fujitsu Ltd | 音声合成における記号処理装置 |
JPH10133853A (ja) * | 1996-10-29 | 1998-05-22 | Nippon Telegr & Teleph Corp <Ntt> | 電子メール書換え方法及び装置 |
JP2000010579A (ja) * | 1998-06-19 | 2000-01-14 | Nec Corp | 音声合成装置及びコンピュータ可読記録媒体 |
JP2002132282A (ja) * | 2000-10-20 | 2002-05-09 | Oki Electric Ind Co Ltd | 電子テキスト読み上げ装置 |
JP2006184642A (ja) * | 2004-12-28 | 2006-07-13 | Fujitsu Ltd | 音声合成装置 |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US9570067B2 (en) | 2014-03-19 | 2017-02-14 | Kabushiki Kaisha Toshiba | Text-to-speech system, text-to-speech method, and computer program product for synthesis modification based upon peculiar expressions |
Also Published As
Publication number | Publication date |
---|---|
WO2008114453A1 (ja) | 2008-09-25 |
WO2008114453A9 (ja) | 2009-10-15 |
JPWO2008114453A1 (ja) | 2010-07-01 |
US20090319275A1 (en) | 2009-12-24 |
US7987093B2 (en) | 2011-07-26 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP4930584B2 (ja) | 音声合成装置、音声合成システム、言語処理装置、音声合成方法及びコンピュータプログラム | |
Taylor | Text-to-speech synthesis | |
TWI293455B (en) | System and method for disambiguating phonetic input | |
WO2018200267A1 (en) | Automatic song generation | |
CN1742273A (zh) | 多模态语音-语音语言翻译和显示 | |
EP1473707B1 (en) | Text-to-speech conversion system and method having function of providing additional information | |
US10930274B2 (en) | Personalized pronunciation hints based on user speech | |
Cutler | Abstraction-based efficiency in the lexicon | |
US9171234B2 (en) | Method of learning a context of a segment of text, and associated handheld electronic device | |
López-Ludeña et al. | LSESpeak: A spoken language generator for Deaf people | |
Mishra et al. | Intonational phrase break prediction for text-to-speech synthesis using dependency relations | |
US20130073572A1 (en) | Method of learning character segments from received text, and associated handheld electronic device | |
US20240257802A1 (en) | Acoustic-based linguistically-driven automated text formatting | |
JP2010117528A (ja) | 声質変化判定装置、声質変化判定方法、声質変化判定プログラム | |
Brierley | Prosody resources and symbolic prosodic features for automated phrase break prediction | |
JP2001318915A (ja) | フォント変換装置 | |
Campbell | On the structure of spoken language | |
KR101777141B1 (ko) | 한글 입력 키보드를 이용한 훈민정음 기반 중국어 및 외국어 입력 장치 및 방법 | |
JP4523312B2 (ja) | テキスト音声出力のための装置、方法、及びプログラム | |
US8635071B2 (en) | Apparatus, medium, and method for generating record sentence for corpus and apparatus, medium, and method for building corpus using the same | |
JP2006184921A (ja) | 情報処理装置及び方法 | |
Mahar et al. | WordNet based Sindhi text to speech synthesis system | |
Jha et al. | Maithili text-to-speech system | |
RU2113726C1 (ru) | Компьютерное устройство для чтения плоскопечатного текста | |
CA2658586C (en) | Learning character segments from received text |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20110920 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20111121 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20120117 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20120130 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 4930584 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20150224 Year of fee payment: 3 |
|
LAPS | Cancellation because of no payment of annual fees |