JP2006243473A - 音声素片生成装置 - Google Patents
音声素片生成装置 Download PDFInfo
- Publication number
- JP2006243473A JP2006243473A JP2005060495A JP2005060495A JP2006243473A JP 2006243473 A JP2006243473 A JP 2006243473A JP 2005060495 A JP2005060495 A JP 2005060495A JP 2005060495 A JP2005060495 A JP 2005060495A JP 2006243473 A JP2006243473 A JP 2006243473A
- Authority
- JP
- Japan
- Prior art keywords
- unit
- phoneme
- speech
- segment
- generated
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Landscapes
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Abstract
【解決手段】 音素片データ選択部1は、入力されたパラメータに適した音素片データを選択する。音素片生成部2は、上記選択された音素片データを展開して時間波形を生成する。音素片非周期化部3は、上記生成された音素片に対して非周期化を行う。音声素片生成部4は、上記非周期化された音素片を接続して音声素片を生成する。こうすることにより、生成される音声素片中に同一音素片の繰り返し部分が発生するような場合でも非周期化される。したがって、人間の聴覚で感知できるレベルの周期音が無くなり、高音質の音声素片が生成される。
【選択図】図1
Description
複数の音素片データが登録されたデータベースと、
入力されたパラメータに基づいて、上記パラメータに適合する音素片データを上記データベースから選択する音素片データ選択部と、
上記選択された音素片データから音素片を生成する音素片生成部と、
上記音素片を接続して音声素片を生成する音声素片生成部と、
上記生成される音声素片が非周期性波形を呈するように、上記音素片生成部によって生成された音素片を変形して上記音声素片生成部に送出する音素片非周期化部と
を備えたことを特徴としている。
上記音素片非周期化部は、
符号反転指令を生成する符号反転指令生成部と、
上記符号反転指令生成部からの上記符号反転指令に従って、上記音素片生成部によって生成された音素片の符号を反転してなる符号反転音素片を生成する音素片符号反転部と
を含んでいる。
上記音素片非周期化部は、
時間反転指令を生成する時間反転指令生成部と、
上記時間反転指令生成部からの上記時間反転指令に従って、上記音素片生成部によって生成された音素片の時間軸に対する配列順序を反転してなる時間反転音素片を生成する音素片時間反転部と
を含んでいる。
上記音素片非周期化部は、
上記音素片生成部から受け取った音素片が先行の音素片と同一の音素片にならないように、上記受け取った音素片に対して符号の反転および時間軸に対する配列順序の反転のうちの少なくとも一方を行わせるための時間・符号反転指令を生成する時間・符号反転指令生成部と、
上記時間・符号反転指令生成部からの上記時間・符号反転指令に従って、上記受け取った音素片に対して符号の反転および時間軸に対する配列順序の反転のうちの少なくとも一方を行って、時間・符号反転音素片を生成する音素片時間・符号反転部と
を含んでいる。
上記各反転指令生成部は、乱数に基づいて上記各反転指令を生成する。
上記音素片非周期化部は、上記生成された音素片を接続する際における接続開始個所を指定する接続個所指定部を含み、
上記音声素片生成部は、上記指定された接続開始個所に従って、上記生成された音素片における上記接続開始個所を先頭として先行の音素片に接続する。
上記音声素片生成部は、上記指定された接続開始個所に従って、上記生成された音素片の時間軸に対する配列順序を上記接続開始個所を先頭とする配列順序に変更して、上記生成された音素片を再生成する音素片再生成部を含んでいる。
上記接続箇所指定部は、乱数に基づいて上記接続開始箇所を指定する。
上記音声素片生成部によって生成された音声素片が周期性を有しているか否かを判定すると共に、周期性を有している場合には当該音声素片を上記音素片非周期化部に戻して当該音声素片を構成する音素片の変形を行わせる一方、周期性を有していない場合には当該音声素片を出力する周期性判定部を備えている。
複数の音素片データが登録されたデータベースと、
入力されたパラメータに基づいて、上記1つのパラメータに適合する複数の音素片データを上記データベースから選択する複数音素片データ選択部と、
上記選択された複数の音素片データから音素片を生成する音素片生成部と、
上記音素片生成部によって生成された複数の音素片のうち、音声素片の生成に利用される利用音素片を選択する利用音素片選択部と、
上記生成された複数の音素片のうち、上記利用音素片選択部によって選択された音素片を接続して上記音声素片を生成する音声素片生成部と
を備えたことを特長としている。
上記利用音素片選択部は、乱数に基づいて上記利用音素片を選択する。
入力されたパラメータに基づいて、上記パラメータに適合する音素片データをデータベースから選択する音素片データ選択ステップと、
上記選択された音素片データから音素片を生成する音素片生成ステップと、
上記音素片を接続してなる音声素片が非周期性波形を呈するように、上記生成された音素片を変形する音素片非周期化ステップと、
上記変形された音素片を接続して音声素片を生成する音声素片生成ステップと、
を備えたことを特長としている。
コンピュータを、
この発明の音声素片生成装置における音素片データ選択部,音素片生成部,音素片非周期化部および音声素片生成部
として機能させることを特徴としている。
この発明の音声素片生成プログラムが記録されたことを特徴としている。
図1は、本実施の形態の音声素片生成装置におけるブロック図である。図中の「パラメータ」は音素片データを指定するものであり、例えば、音素片データデータベース5中の音素片データを直接指定するポインタや、スペクトル情報やこのスペクトル情報をモデル化した場合の係数等、どのようなパラメータを用いても差し支えない。
図5は、上記音素片生成部2によって生成された音素片に対して、音素片時間波形の符号反転波形を用いて非周期化処理を行う音素片非周期化部3の内部構成を示すブロック図である。
図6は、上記音素片生成部2によって生成された音素片に対して、音素片時間波形の時間反転波形を用いて非周期化処理を行う音素片非周期化部3の図5とは異なる内部構成を示すブロック図である。
図7は、上記音素片生成部2によって生成された音素片に対して、音素片時間波形の時間・符号反転波形を用いて非周期化処理を行う音素片非周期化部3の図5および図6とは異なる内部構成を示すブロック図である。
図8は、上記音素片生成部2によって生成された音素片に対して、音声素片生成時における音素片時間波形の接続開始個所をランダムに指定することによって、非周期化処理を行う音素非周期化処理部3の図5〜図7とは異なる内部構成を示すブロック図である。
上記第1実施の形態においては、1つのパラメータから1つ音素片データを選択し、選択された音素片に対して非周期化処理を施して周期性成分が抑制された音声素片を生成している。これに対して、本実施の形態においては、1つのパラメータから2つの音素片データを選択して音声素片の生成に用いることによって、少量のメモリ増加でより非周期性の高い音声素片を生成するのである。
上記第1実施の形態および第2実施の形態における各非周期化方法は、夫々単独で用いた場合には、高速に非周期化された音声素片を生成することができる。しかしながら、処理能力やメモリ容量に余裕がある場合には、各非周期化方法を、単独ではなく組み合わせて用いることが可能になる。
図12は、本実施の形態の音声素片生成装置におけるブロック図である。本実施の形態においては、上記第1実施の形態の場合と基本的構成は同様であり、生成された非周期音声素片に対してその周期性を判定する周期性判定部45を有する点が異なる。音素片データ選択部41,音素片生成部42,音素片非周期化部43,音声素片生成部44および音素片データデータベース46は、上記第1実施の形態における音素片データ選択部1,音素片生成部2,音素片非周期化部3,音声素片生成部4および音素片データデータベース5と同様であり、詳細な説明は省略する。以下においては、周期性判定部45の構成・動作について詳細に述べる。
2,32,42…音素片生成部、
3,43…音素片非周期化部、
4,34,44…音声素片生成部、
5,35,46…音素片データデータベース、
6…パラメータ、
7…音素片データ、
8,30…音素片系列、
9…同一音素片繰り返し部分、
11…符号反転指令生成部、
12…符号反転判断部、
13…音素片符号反転部、
14,24…符号反転指令データ記憶部、
15…時間反転指令生成部、
16…時間反転判断部、
17…音素片時間反転部、
18,25…時間反転指令データ記憶部、
21…時間・符号反転指令生成部、
22…時間・符号反転判断部、
23…音素片時間・符号反転部、
26…接続個所指定部、
27…接続個所指定データ記憶部、
28…接続個所指定、
29…音素片、
31…複数音素片データ選択部、
33…利用音素片選択部、
36…利用音素片指令データ記憶部。
Claims (14)
- 複数の音素片データが登録されたデータベースと、
入力されたパラメータに基づいて、上記パラメータに適合する音素片データを上記データベースから選択する音素片データ選択部と、
上記選択された音素片データから音素片を生成する音素片生成部と、
上記音素片を接続して音声素片を生成する音声素片生成部と、
上記生成される音声素片が非周期性波形を呈するように、上記音素片生成部によって生成された音素片を変形して上記音声素片生成部に送出する音素片非周期化部と
を備えたことを特長とする音声素片生成装置。 - 請求項1に記載の音声素片生成装置において、
上記音素片非周期化部は、
符号反転指令を生成する符号反転指令生成部と、
上記符号反転指令生成部からの上記符号反転指令に従って、上記音素片生成部によって生成された音素片の符号を反転してなる符号反転音素片を生成する音素片符号反転部と
を含んでいることを特長とする音声素片生成装置。 - 請求項1に記載の音声素片生成装置において、
上記音素片非周期化部は、
時間反転指令を生成する時間反転指令生成部と、
上記時間反転指令生成部からの上記時間反転指令に従って、上記音素片生成部によって生成された音素片の時間軸に対する配列順序を反転してなる時間反転音素片を生成する音素片時間反転部と
を含んでいることを特長とする音声素片生成装置。 - 請求項1に記載の音声素片生成装置において、
上記音素片非周期化部は、
上記音素片生成部から受け取った音素片が先行の音素片と同一の音素片にならないように、上記受け取った音素片に対して符号の反転および時間軸に対する配列順序の反転のうちの少なくとも一方を行わせるための時間・符号反転指令を生成する時間・符号反転指令生成部と、
上記時間・符号反転指令生成部からの上記時間・符号反転指令に従って、上記受け取った音素片に対して符号の反転および時間軸に対する配列順序の反転のうちの少なくとも一方を行って、時間・符号反転音素片を生成する音素片時間・符号反転部と
を含んでいることを特長とする音声素片生成装置。 - 請求項2乃至請求項4の何れか一つに記載の音声素片生成装置において、
上記各反転指令生成部は、乱数に基づいて上記各反転指令を生成するようになっていることを特長とする音声素片生成装置。 - 請求項1に記載の音声素片生成装置において、
上記音素片非周期化部は、上記生成された音素片を接続する際における接続開始個所を指定する接続個所指定部を含み、
上記音声素片生成部は、上記指定された接続開始個所に従って、上記生成された音素片における上記接続開始個所を先頭として先行の音素片に接続するようになっている
ことを特長とする音声素片生成装置。 - 請求項6に記載の音声素片生成装置において、
上記音声素片生成部は、上記指定された接続開始個所に従って、上記生成された音素片の時間軸に対する配列順序を上記接続開始個所を先頭とする配列順序に変更して、上記生成された音素片を再生成する音素片再生成部を含んでいる
ことを特長とする音声素片生成装置。 - 請求項6あるいは請求項7に記載の音声素片生成装置において、
上記接続箇所指定部は、乱数に基づいて上記接続開始箇所を指定するようになっていることを特長とする音声素片生成装置。 - 請求項1に記載の音声素片生成装置において、
上記音声素片生成部によって生成された音声素片が周期性を有しているか否かを判定すると共に、周期性を有している場合には当該音声素片を上記音素片非周期化部に戻して当該音声素片を構成する音素片の変形を行わせる一方、周期性を有していない場合には当該音声素片を出力する周期性判定部を備えたことを特長とする音声素片生成装置。 - 複数の音素片データが登録されたデータベースと、
入力されたパラメータに基づいて、上記1つのパラメータに適合する複数の音素片データを上記データベースから選択する複数音素片データ選択部と、
上記選択された複数の音素片データから音素片を生成する音素片生成部と、
上記音素片生成部によって生成された複数の音素片のうち、音声素片の生成に利用される利用音素片を選択する利用音素片選択部と、
上記生成された複数の音素片のうち、上記利用音素片選択部によって選択された音素片を接続して上記音声素片を生成する音声素片生成部と
を備えたことを特長とする音声素片生成装置。 - 請求項10に記載の音声素片生成装置において、
上記利用音素片選択部は、乱数に基づいて上記利用音素片を選択するようになっていることを特長とする音声素片生成装置。 - 入力されたパラメータに基づいて、上記パラメータに適合する音素片データをデータベースから選択する音素片データ選択ステップと、
上記選択された音素片データから音素片を生成する音素片生成ステップと、
上記音素片を接続してなる音声素片が非周期性波形を呈するように、上記生成された音素片を変形する音素片非周期化ステップと、
上記変形された音素片を接続して音声素片を生成する音声素片生成ステップと、
を備えたことを特長とする音声素片生成方法。 - コンピュータを、
請求項1における音素片データ選択部,音素片生成部,音素片非周期化部および音声素片生成部
として機能させることを特徴とする音声素片生成プログラム。 - 請求項13に記載の音声素片生成プログラムが記録されたことを特徴とするコンピュータ読出し可能なプログラム記録媒体。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2005060495A JP4526979B2 (ja) | 2005-03-04 | 2005-03-04 | 音声素片生成装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2005060495A JP4526979B2 (ja) | 2005-03-04 | 2005-03-04 | 音声素片生成装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2006243473A true JP2006243473A (ja) | 2006-09-14 |
JP4526979B2 JP4526979B2 (ja) | 2010-08-18 |
Family
ID=37049935
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2005060495A Expired - Fee Related JP4526979B2 (ja) | 2005-03-04 | 2005-03-04 | 音声素片生成装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP4526979B2 (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2010160406A (ja) * | 2009-01-09 | 2010-07-22 | Yamaha Corp | 音声合成装置、およびプログラム |
Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS5267204A (en) * | 1975-12-01 | 1977-06-03 | Nec Corp | Element piece edit type voice composing unit |
JPH0519779A (ja) * | 1991-07-10 | 1993-01-29 | Nippon Telegr & Teleph Corp <Ntt> | 音声編集装置 |
JPH05108095A (ja) * | 1991-10-19 | 1993-04-30 | Ricoh Co Ltd | 音声合成装置 |
JPH10171484A (ja) * | 1996-12-10 | 1998-06-26 | Matsushita Electric Ind Co Ltd | 音声合成方法および装置 |
JPH11133973A (ja) * | 1997-10-31 | 1999-05-21 | Kawai Musical Instr Mfg Co Ltd | 楽音生成装置及び楽音生成方法 |
JP2000206982A (ja) * | 1999-01-12 | 2000-07-28 | Toshiba Corp | 音声合成装置及び文音声変換プログラムを記録した機械読み取り可能な記録媒体 |
JP2002202790A (ja) * | 2000-12-28 | 2002-07-19 | Yamaha Corp | 歌唱合成装置 |
JP2003271200A (ja) * | 2002-03-18 | 2003-09-25 | Matsushita Electric Ind Co Ltd | 音声合成方法および音声合成装置 |
JP2004077918A (ja) * | 2002-08-20 | 2004-03-11 | Yamaha Corp | 音声合成装置、方法及びプログラム |
-
2005
- 2005-03-04 JP JP2005060495A patent/JP4526979B2/ja not_active Expired - Fee Related
Patent Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS5267204A (en) * | 1975-12-01 | 1977-06-03 | Nec Corp | Element piece edit type voice composing unit |
JPH0519779A (ja) * | 1991-07-10 | 1993-01-29 | Nippon Telegr & Teleph Corp <Ntt> | 音声編集装置 |
JPH05108095A (ja) * | 1991-10-19 | 1993-04-30 | Ricoh Co Ltd | 音声合成装置 |
JPH10171484A (ja) * | 1996-12-10 | 1998-06-26 | Matsushita Electric Ind Co Ltd | 音声合成方法および装置 |
JPH11133973A (ja) * | 1997-10-31 | 1999-05-21 | Kawai Musical Instr Mfg Co Ltd | 楽音生成装置及び楽音生成方法 |
JP2000206982A (ja) * | 1999-01-12 | 2000-07-28 | Toshiba Corp | 音声合成装置及び文音声変換プログラムを記録した機械読み取り可能な記録媒体 |
JP2002202790A (ja) * | 2000-12-28 | 2002-07-19 | Yamaha Corp | 歌唱合成装置 |
JP2003271200A (ja) * | 2002-03-18 | 2003-09-25 | Matsushita Electric Ind Co Ltd | 音声合成方法および音声合成装置 |
JP2004077918A (ja) * | 2002-08-20 | 2004-03-11 | Yamaha Corp | 音声合成装置、方法及びプログラム |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2010160406A (ja) * | 2009-01-09 | 2010-07-22 | Yamaha Corp | 音声合成装置、およびプログラム |
Also Published As
Publication number | Publication date |
---|---|
JP4526979B2 (ja) | 2010-08-18 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP4680429B2 (ja) | テキスト音声変換装置における高速読上げ制御方法 | |
US20040073428A1 (en) | Apparatus, methods, and programming for speech synthesis via bit manipulations of compressed database | |
JP4406440B2 (ja) | 音声合成装置、音声合成方法及びプログラム | |
JP2000075883A (ja) | 基本周波数パタン生成方法、基本周波数パタン生成装置及びプログラム記録媒体 | |
JP4526979B2 (ja) | 音声素片生成装置 | |
JP2003108178A (ja) | 音声合成装置及び音声合成用素片作成装置 | |
JP5268731B2 (ja) | 音声合成装置、方法およびプログラム | |
JPH11119800A (ja) | 音声符号化復号化方法及び音声符号化復号化装置 | |
JP4651168B2 (ja) | 合成音声出力装置およびその方法並びに記録媒体 | |
JP5387410B2 (ja) | 音声合成装置、音声合成方法および音声合成プログラム | |
JP7280605B2 (ja) | 音声処理装置、および音声処理方法 | |
JP6552146B1 (ja) | 音声処理装置、および音声処理方法 | |
JP3394281B2 (ja) | 音声合成方式および規則合成装置 | |
JP5089473B2 (ja) | 音声合成装置及び音声合成方法 | |
JP2002123280A (ja) | 音声合成方法および音声合成装置ならびに音声合成処理プログラムを記録した記録媒体 | |
CN1210686C (zh) | 语音发音速度调整方法 | |
JP2679623B2 (ja) | テキスト音声合成装置 | |
JPH08160991A (ja) | 音声素片作成方法および音声合成方法、装置 | |
JP4630038B2 (ja) | 音声波形データベース構築方法、この方法を実施する装置およびプログラム | |
JP3515268B2 (ja) | 音声合成装置 | |
JP2005121869A (ja) | 音声変換関数抽出装置およびそれを用いた声質変換装置 | |
JP3567477B2 (ja) | 発声変形音声認識装置 | |
JPH04125699A (ja) | 残差駆動型音声合成装置 | |
JPH0594199A (ja) | 残差駆動型音声合成装置 | |
JP2004206144A (ja) | 基本周波数パタン生成方法、及びプログラム記録媒体 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20070302 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20100129 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20100330 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20100514 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20100601 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20100602 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130611 Year of fee payment: 3 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
LAPS | Cancellation because of no payment of annual fees |