JP4741208B2 - 音声合成用読み上げテキストデータ選択プログラムおよび音声合成用読み上げテキストデータ選択装置 - Google Patents
音声合成用読み上げテキストデータ選択プログラムおよび音声合成用読み上げテキストデータ選択装置 Download PDFInfo
- Publication number
- JP4741208B2 JP4741208B2 JP2004213332A JP2004213332A JP4741208B2 JP 4741208 B2 JP4741208 B2 JP 4741208B2 JP 2004213332 A JP2004213332 A JP 2004213332A JP 2004213332 A JP2004213332 A JP 2004213332A JP 4741208 B2 JP4741208 B2 JP 4741208B2
- Authority
- JP
- Japan
- Prior art keywords
- text data
- data
- speech
- text
- reading
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Description
すなわち、「集合被覆問題における貪欲近似アルゴリズム」を用いた方法は、要素(構成要素、この場合、音声データ)xを最も多く含む部分集合S(この場合、読み上げテキストデータ)から順に選択していくというアルゴリズムである。
〈音声合成用読み上げテキストデータ選択装置の構成〉
図1は、音声合成用読み上げテキストデータ選択装置のブロック図である。この図1に示すように、音声合成用読み上げテキストデータ選択装置1は、無作為に収集した読み上げテキストデータを入力すると、音声合成用データベース(図示せず)を作成するのに、最小限のデータ量となる選択読み上げテキストデータ(音声合成用読み上げテキストデータ)を出力するもので、読み上げテキストデータ入力手段3と、読み上げテキストデータ分割手段5と、音声データ単位辞書記憶手段7と、音声データ単位カウント手段9と、読み上げテキストデータ選択手段11と、選択読み上げテキストデータ出力手段13とを備えている。
例えば、「九十九」から「一」までの数字を一つずつ小さくなるように列べたもの(九十九、九十八、九十七、・・・、三、二、一)が、読み上げテキストデータとして、読み上げテキストデータ入力手段3に入力され、且つ、音声データ単位辞書記憶手段7には、「一」、「二」、「三」、「四」、「五」、「六」、「七」、「八」、「九」、「十」、「二十」、「三十」、「四十」、「五十」、「六十」、「七十」、「八十」、「九十」が音声データ単位として登録されている場合について説明する。
次に、図2に示すフローチャートを参照して、音声合成用読み上げテキストデータ選択装置1の動作を説明する(適宜、図1参照)。
まず、音声合成用読み上げテキストデータ選択装置1は、読み上げテキストデータを読み上げテキストデータ入力手段3によって入力し(ステップS1)、音声データ単位辞書記憶手段7に記憶されている音声データ単位辞書を参照して、読み上げテキストデータ分割手段5によって、入力された読み上げテキストデータを音声データ単位に分割する(ステップS2)。
3 読み上げテキストデータ入力手段
5 読み上げテキストデータ分割手段
7 音声データ単位辞書記憶手段
9 音声データ単位カウント手段
11 読み上げテキストデータ選択手段
13 選択読み上げテキストデータ出力手段
Claims (2)
- 音声合成する際に合成単位となる音声データ単位を予め設定した回数含む読み上げテキストデータを選択するために、前記音声データが登録されている音声データ単位辞書を備えたコンピュータを、
前記読み上げテキストデータを入力する読み上げテキストデータ入力手段、
この読み上げテキストデータ入力手段で入力された読み上げテキストデータを、前記音声データ単位辞書に登録されている音声データ単位に分割する読み上げテキストデータ分割手段、
この読み上げテキストデータ分割手段で分割された読み上げテキストデータに含まれている前記音声データ単位を計数する音声データ単位カウント手段、
この音声データ単位カウント手段で計数されたカウント値が、初期処理時においては、カウント値の最大値として予め設定した回数より大きく、それ以降においては、それまでに計数されたカウント値の中で最大値以上であるときは、この音声データ単位カウント手段で計数されたカウント値が計数された読み上げテキストデータを選択し、前記それまでに計数されたカウント値に当該カウント値を置き換える読み上げテキストデータ選択手段、
この読み上げテキストデータ選択手段で選択された読み上げテキストデータを、選択読み上げテキストデータとして出力する選択読み上げテキストデータ出力手段、
として機能させ、
前記音声データ単位カウント手段は、
前記読み上げテキストデータの中に、前記予め設定された回数以上、前記読み上げテキストデータ選択手段で選択された読み上げテキストデータにすでに含まれている前記音声データ単位があるときは、当該音声データ単位を計数しない
ことを特徴とする音声合成用読み上げテキストデータ選択プログラム。 - 音声合成する際に合成単位となる音声データ単位を予め設定した回数含む読み上げテキストデータを選択する音声合成用読み上げテキストデータ選択装置であって、
前記音声データが登録されている音声データ単位辞書と、
前記読み上げテキストデータを入力する読み上げテキストデータ入力手段と、
この読み上げテキストデータ入力手段で入力された読み上げテキストデータを、前記音声データ単位辞書に登録されている音声データ単位に分割する読み上げテキストデータ分割手段と、
この読み上げテキストデータ分割手段で分割された読み上げテキストデータに含まれている前記音声データ単位を計数する音声データ単位カウント手段と、
この音声データ単位カウント手段で計数されたカウント値が、初期処理時においては、カウント値の最大値として予め設定した回数より大きく、それ以降においては、それまでに計数されたカウント値の中で最大値以上であるときは、この音声データ単位カウント手段で計数されたカウント値が計数された読み上げテキストデータを選択し、前記それまでに計数されたカウント値に当該カウント値を置き換える読み上げテキストデータ選択手段と、
この読み上げテキストデータ選択手段で選択された読み上げテキストデータを、選択読み上げテキストデータとして出力する選択読み上げテキストデータ出力手段と、
を備え、
前記音声データ単位カウント手段は、
前記読み上げテキストデータの中に、前記予め設定された回数以上、前記読み上げテキストデータ選択手段で選択された読み上げテキストデータにすでに含まれている前記音声データ単位があるときは、当該音声データ単位を計数しない
ことを特徴とする音声合成用読み上げテキストデータ選択装置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2004213332A JP4741208B2 (ja) | 2004-07-21 | 2004-07-21 | 音声合成用読み上げテキストデータ選択プログラムおよび音声合成用読み上げテキストデータ選択装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2004213332A JP4741208B2 (ja) | 2004-07-21 | 2004-07-21 | 音声合成用読み上げテキストデータ選択プログラムおよび音声合成用読み上げテキストデータ選択装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2006030892A JP2006030892A (ja) | 2006-02-02 |
JP4741208B2 true JP4741208B2 (ja) | 2011-08-03 |
Family
ID=35897269
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2004213332A Active JP4741208B2 (ja) | 2004-07-21 | 2004-07-21 | 音声合成用読み上げテキストデータ選択プログラムおよび音声合成用読み上げテキストデータ選択装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP4741208B2 (ja) |
Families Citing this family (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP5113662B2 (ja) * | 2008-07-30 | 2013-01-09 | 日本放送協会 | 音声合成用読上げ文章生成装置及びそのプログラム |
JP6185712B2 (ja) * | 2012-11-29 | 2017-08-23 | 日本放送協会 | 音声合成用読み上げテキストデータ選択装置およびそのプログラム |
JP6088233B2 (ja) * | 2012-12-12 | 2017-03-01 | 日本放送協会 | 音声合成用読み上げ文生成装置及びそのプログラム |
CN113345408B (zh) * | 2021-06-02 | 2022-12-27 | 云知声智能科技股份有限公司 | 中英文语音混合合成方法、装置、电子设备和存储介质 |
Family Cites Families (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP4306086B2 (ja) * | 2000-04-14 | 2009-07-29 | 富士通株式会社 | 音声合成用辞書作成装置及び方法 |
JP2002259371A (ja) * | 2001-03-02 | 2002-09-13 | Nippon Telegr & Teleph Corp <Ntt> | 文書要約方法および装置と文書要約プログラムおよび該プログラムを記録した記録媒体 |
JP3981619B2 (ja) * | 2002-10-15 | 2007-09-26 | 日本電信電話株式会社 | 収録リスト取得装置と音声素片データベース作成装置、及びそれらの装置プログラム |
JP3960928B2 (ja) * | 2003-02-14 | 2007-08-15 | 日本電信電話株式会社 | テキスト選択方法、装置及びプログラム |
-
2004
- 2004-07-21 JP JP2004213332A patent/JP4741208B2/ja active Active
Also Published As
Publication number | Publication date |
---|---|
JP2006030892A (ja) | 2006-02-02 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US7983919B2 (en) | System and method for performing speech synthesis with a cache of phoneme sequences | |
WO2017190674A1 (zh) | 一种音频数据的处理方法、装置及计算机存储介质 | |
CN109389968B (zh) | 基于双音节混搭的波形拼接方法、装置、设备及存储介质 | |
WO2010018796A1 (ja) | 例外語辞書作成装置、例外語辞書作成方法及びそのプログラム、並びに、音声認識装置及び音声認識方法 | |
US7912716B2 (en) | Generating words and names using N-grams of phonemes | |
US9064489B2 (en) | Hybrid compression of text-to-speech voice data | |
CN101171624B (zh) | 语音合成装置及语音合成方法 | |
JP5274711B2 (ja) | 音声認識装置 | |
JPH10171484A (ja) | 音声合成方法および装置 | |
WO2004109659A1 (ja) | 音声合成装置、音声合成方法及びプログラム | |
JP4741208B2 (ja) | 音声合成用読み上げテキストデータ選択プログラムおよび音声合成用読み上げテキストデータ選択装置 | |
KR100542757B1 (ko) | 음운변이 규칙을 이용한 외래어 음차표기 자동 확장 방법및 그 장치 | |
JP4287785B2 (ja) | 音声合成装置、音声合成方法及びプログラム | |
WO2004109660A1 (ja) | 音声データを選択するための装置、方法およびプログラム | |
JP2002221981A (ja) | 音声合成装置および音声合成方法 | |
US20110196672A1 (en) | Voice recognition device | |
JP2010145873A (ja) | テキスト置換装置、テキスト音声合成装置、テキスト置換方法、及び、テキスト置換プログラム | |
JP4787686B2 (ja) | テキスト選択装置、その方法、そのプログラム、及びその記録媒体 | |
JP2005018036A (ja) | 音声合成装置、音声合成方法及びプログラム | |
JP2004294577A (ja) | 文字情報音声変換方法 | |
JP6185712B2 (ja) | 音声合成用読み上げテキストデータ選択装置およびそのプログラム | |
JP2007334144A (ja) | 音声合成方法、音声合成装置及び音声合成プログラム | |
JP3853923B2 (ja) | 音声合成装置 | |
JP2004251953A (ja) | テキスト選択方法及び装置、プログラム | |
JP6217414B2 (ja) | 読み生成装置、方法、及びプログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20070226 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20091116 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20091201 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20100129 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20100810 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20100928 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20110412 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20110506 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 4741208 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20140513 Year of fee payment: 3 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |