JP4603290B2 - 音声合成装置および音声合成プログラム - Google Patents
音声合成装置および音声合成プログラム Download PDFInfo
- Publication number
- JP4603290B2 JP4603290B2 JP2004150969A JP2004150969A JP4603290B2 JP 4603290 B2 JP4603290 B2 JP 4603290B2 JP 2004150969 A JP2004150969 A JP 2004150969A JP 2004150969 A JP2004150969 A JP 2004150969A JP 4603290 B2 JP4603290 B2 JP 4603290B2
- Authority
- JP
- Japan
- Prior art keywords
- digit
- speech
- numerical value
- data
- numerical
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Lifetime
Links
- 230000015572 biosynthetic process Effects 0.000 title claims abstract description 101
- 238000003786 synthesis reaction Methods 0.000 title claims abstract description 94
- 238000000034 method Methods 0.000 claims description 10
- 230000006866 deterioration Effects 0.000 abstract description 6
- 230000002194 synthesizing effect Effects 0.000 description 6
- 238000001308 synthesis method Methods 0.000 description 3
- 238000010586 diagram Methods 0.000 description 2
- 230000006870 function Effects 0.000 description 2
- 230000002269 spontaneous effect Effects 0.000 description 2
- 238000007796 conventional method Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
Images
Description
また、音声合成装置は、数値分割手段によって、入力された数値を、クラスタリングした桁に分割し、この分割したものを各桁分割候補とする。例えば、653(円)は、数値分割手段によって、「6」(六百(+)五十)、「5」(百(−)五十(+)三)、「3」(十(−)三(+)円)に分割され、それぞれが各桁分割候補となる。
また、請求項1および5記載の発明によれば、入力された数値(数値データ)を、クラスタリングした桁に分割することで、数値を各桁に分割した場合に比べ、音声合成用データベースを小さくすることが可能であり、その結果、処理速度を高速にすることができる。また、音声合成用データベースが小さい(データ量が少ない)ことで当該音声合成用データベースを作成するのにかかる時間および費用を削減することができる。
〈音声合成装置の構成〉
図1は、音声合成装置のブロック図である。この図1に示すように、音声合成装置1は、入力された数値(数値データ)を音声合成して、音声合成音(音声合成データ)として出力するもので、数値データ入力手段3と、数値分割手段5と、音声データ列探索手段9と、音声合成用データベース11と、各桁分割候補連結手段13と、音声合成データ出力手段17とを備えている。
各桁分割候補は、数値を各桁に分割したもの、例えば、10桁の数値であれば10個に、6桁の数値であれば6個に分割したものである。
素片(各桁分割候補)Aと素片(各桁分割候補)Bとの連結スコアSc(A,B)は次に示す数式(1)によって求めることができる。
特定読み音声データは、数値“0”の読み方を「とんで」とするものや、数値“20”の読み方を「ふたじゅう」とするものである。
次に、図2に示すフローチャートを参照して、音声合成装置1の動作について説明する(適宜、図1参照)。
まず、音声合成装置1は、数値データ入力手段3を介して、数値データを入力する(ステップS1)。続いて、音声合成装置1は、数値分割手段5によって、数値データ入力手段3で入力された数値データを、各桁分割候補に分割する(ステップS2)。
3 数値データ入力手段
5 数値分割手段
7 音韻韻律情報推定手段
9 音声データ列探索手段
11 音声合成用データベース
13 各桁分割候補連結手段
15 音韻韻律補正手段
17 音声合成データ出力手段
Claims (5)
- 入力された数値を音声合成する音声合成装置であって、
前記数値の桁区切りの発話時刻に関連付けた前記数値を読み上げた音声データを記憶している音声合成用データベースと、
前記数値をこの数値の各桁に分割し、各桁分割候補とする数値分割手段と、
この数値分割手段で分割され、前後の桁を考慮した各桁分割候補を、前記音声合成用データベースを探索する際の探索単位として、前記音声合成用データベースに記憶されている音声データを連結した連結コストが最小になる前記各桁分割候補に対応する音声データの組み合わせである音声データ列を探索する音声データ列探索手段と、
この音声データ列探索手段で探索された連結コストが最小になる各桁分割候補に対応する音声データを連結し、前記音声データ列とする各桁分割候補連結手段と、
この各桁分割候補連結手段で連結された音声データ列を、前記数値を音声合成した結果である音声合成データとして出力する音声合成データ出力手段と、を備え、
前記音声合成用データベースは、前記数値の単位に関する音声データである単位音声データと、前記数値の各桁の前後の桁を含めてクラスタリングした桁毎の発話時間とを記憶しており、
前記数値分割手段は、前記数値の1桁目を分割する際に前記数値の単位を付加した数値単位候補とし、前記数値の各桁と当該各桁に前後する1桁との合計3桁において、当該各桁に前1桁の場合には「万、千、百、十、一、二、三、四、五、六、七、八、九、〇」でクラスタリングを行い、当該各桁に後1桁の場合には「一、二、三、四、五、六、七、八、九、〇」でクラスタリングを行い、前記入力された数値を分割し、
前記音声データ列探索手段は、前記各桁分割候補および前記数値単位候補を探索単位とすることを特徴とする音声合成装置。 - 前記音声合成用データベースは、前記数値を読み上げる際の特定の読み方に関する音声データである特定読み音声データを記憶していることを特徴とする請求項1に記載の音声合成装置。
- 前記数値分割手段は、前記数値を各桁に分割後、当該各桁の数値を構成する音素毎の基本周波数に関する情報である音韻韻律情報を推定する音韻韻律情報推定手段を備えており、
前記音声データ列探索手段は、前記連結コストおよび前記音韻韻律情報から求められる音韻韻律コストが最小になる前記各桁分割候補に対応する音声データの組み合わせである音声データ列を探索することを特徴とする請求項1または請求項2に記載の音声合成装置。 - 前記各桁分割候補連結手段は、予め予測された予測韻律と異なる部分が、前記音声データ列探索手段で探索された音声データ列に含まれている場合に、当該予測韻律を基準にした一定範囲に補正する音韻韻律補正手段を備えていることを特徴とする請求項3に記載の音声合成装置。
- 入力された数値を音声合成するために、前記数値の桁区切りの発話時刻に関連付けた前記数値を読み上げた音声データを記憶している音声合成用データベースを備えるコンピュータを、
前記数値をこの数値の各桁に分割し、各桁分割候補とする数値分割手段、
この数値分割手段で分割され、前後の桁を考慮した各桁分割候補を、前記音声合成用データベースを探索する際の探索単位として、前記音声合成用データベースに記憶されている音声データを連結した連結コストが最小になる前記各桁分割候補に対応する音声データの組み合わせである音声データ列を探索する音声データ列探索手段、
この音声データ列探索手段で探索された連結コストが最小になる各桁分割候補に対応する音声データを連結し、前記音声データ列とする各桁分割候補連結手段、
この各桁分割候補連結手段で連結された音声データ列を、前記数値を音声合成した結果である音声合成データとして出力する音声合成データ出力手段、として機能させ、
前記音声合成用データベースは、前記数値の単位に関する音声データである単位音声データと、前記数値の各桁の前後の桁を含めてクラスタリングした桁毎の発話時間とを記憶しており、
前記数値分割手段は、前記数値の1桁目を分割する際に前記数値の単位を付加した数値単位候補とし、前記数値の各桁と当該各桁に前後する1桁との合計3桁において、当該各桁に前1桁の場合には「万、千、百、十、一、二、三、四、五、六、七、八、九、〇」でクラスタリングを行い、当該各桁に後1桁の場合には「一、二、三、四、五、六、七、八、九、〇」でクラスタリングを行い、前記入力された数値を分割し、
前記音声データ列探索手段は、前記各桁分割候補および前記数値単位候補を探索単位とすることを特徴とする音声合成プログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2004150969A JP4603290B2 (ja) | 2004-05-20 | 2004-05-20 | 音声合成装置および音声合成プログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2004150969A JP4603290B2 (ja) | 2004-05-20 | 2004-05-20 | 音声合成装置および音声合成プログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2005331775A JP2005331775A (ja) | 2005-12-02 |
JP4603290B2 true JP4603290B2 (ja) | 2010-12-22 |
Family
ID=35486475
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2004150969A Expired - Lifetime JP4603290B2 (ja) | 2004-05-20 | 2004-05-20 | 音声合成装置および音声合成プログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP4603290B2 (ja) |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS6122400A (ja) * | 1984-07-09 | 1986-01-30 | 富士通株式会社 | 音声応答装置 |
JPH0229796A (ja) * | 1988-07-20 | 1990-01-31 | Ricoh Co Ltd | 規則音声合成装置における数詞読み付与装置 |
JPH08248972A (ja) * | 1995-03-10 | 1996-09-27 | Atr Onsei Honyaku Tsushin Kenkyusho:Kk | 規則音声合成装置 |
JPH08286697A (ja) * | 1995-04-11 | 1996-11-01 | Ricoh Co Ltd | 日本語処理装置 |
JPH08314901A (ja) * | 1995-05-15 | 1996-11-29 | Nippon Telegr & Teleph Corp <Ntt> | 合成音声出力方法及び装置 |
JPH1049193A (ja) * | 1996-05-15 | 1998-02-20 | A T R Onsei Honyaku Tsushin Kenkyusho:Kk | 自然発話音声波形信号接続型音声合成装置 |
JP2004139033A (ja) * | 2002-09-25 | 2004-05-13 | Nippon Hoso Kyokai <Nhk> | 音声合成方法、音声合成装置および音声合成プログラム |
-
2004
- 2004-05-20 JP JP2004150969A patent/JP4603290B2/ja not_active Expired - Lifetime
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS6122400A (ja) * | 1984-07-09 | 1986-01-30 | 富士通株式会社 | 音声応答装置 |
JPH0229796A (ja) * | 1988-07-20 | 1990-01-31 | Ricoh Co Ltd | 規則音声合成装置における数詞読み付与装置 |
JPH08248972A (ja) * | 1995-03-10 | 1996-09-27 | Atr Onsei Honyaku Tsushin Kenkyusho:Kk | 規則音声合成装置 |
JPH08286697A (ja) * | 1995-04-11 | 1996-11-01 | Ricoh Co Ltd | 日本語処理装置 |
JPH08314901A (ja) * | 1995-05-15 | 1996-11-29 | Nippon Telegr & Teleph Corp <Ntt> | 合成音声出力方法及び装置 |
JPH1049193A (ja) * | 1996-05-15 | 1998-02-20 | A T R Onsei Honyaku Tsushin Kenkyusho:Kk | 自然発話音声波形信号接続型音声合成装置 |
JP2004139033A (ja) * | 2002-09-25 | 2004-05-13 | Nippon Hoso Kyokai <Nhk> | 音声合成方法、音声合成装置および音声合成プログラム |
Also Published As
Publication number | Publication date |
---|---|
JP2005331775A (ja) | 2005-12-02 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11735162B2 (en) | Text-to-speech (TTS) processing | |
US20200410981A1 (en) | Text-to-speech (tts) processing | |
US6778962B1 (en) | Speech synthesis with prosodic model data and accent type | |
US11763797B2 (en) | Text-to-speech (TTS) processing | |
US20080183473A1 (en) | Technique of Generating High Quality Synthetic Speech | |
US7454343B2 (en) | Speech synthesizer, speech synthesizing method, and program | |
EP2462586B1 (en) | A method of speech synthesis | |
US10699695B1 (en) | Text-to-speech (TTS) processing | |
JP5148026B1 (ja) | 音声合成装置および音声合成方法 | |
JP4225128B2 (ja) | 規則音声合成装置及び規則音声合成方法 | |
JP4532862B2 (ja) | 音声合成方法、音声合成装置および音声合成プログラム | |
JP4247289B1 (ja) | 音声合成装置、音声合成方法およびそのプログラム | |
JP5874639B2 (ja) | 音声合成装置、音声合成方法及び音声合成プログラム | |
JP2004109535A (ja) | 音声合成方法、音声合成装置および音声合成プログラム | |
JP4603290B2 (ja) | 音声合成装置および音声合成プログラム | |
JP5393546B2 (ja) | 韻律作成装置及び韻律作成方法 | |
JP6631186B2 (ja) | 音声作成装置、方法、及びプログラム、音声データベース作成装置 | |
JPH10247097A (ja) | 自然発話音声波形信号接続型音声合成装置 | |
JPH09230893A (ja) | 規則音声合成方法及び音声合成装置 | |
JPH1185193A (ja) | 音声データベースにおける音素片情報最適化方法、及び音素片情報最適化装置 | |
JP2002297175A (ja) | テキスト音声合成装置、テキスト音声合成方法及びプログラム並びにプログラムを記録したコンピュータ読み取り可能な記録媒体 | |
JPH06167989A (ja) | 音声合成装置 | |
JP2005091551A (ja) | 音声合成装置及びそのためのコスト計算装置、並びにコンピュータプログラム | |
JP4839058B2 (ja) | 音声合成装置および音声合成プログラム | |
JP2004347994A (ja) | 音声合成装置、音声合成方法およびこの音声合成方法を実行するプログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20070226 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20090930 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20091020 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20091214 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20100202 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20100311 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20100511 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20100721 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A821 Effective date: 20100723 |
|
A911 | Transfer to examiner for re-examination before appeal (zenchi) |
Free format text: JAPANESE INTERMEDIATE CODE: A911 Effective date: 20100819 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20100907 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20101001 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20131008 Year of fee payment: 3 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 4603290 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20141008 Year of fee payment: 4 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
EXPY | Cancellation because of completion of term |