JP4630038B2 - Speech waveform database construction method, apparatus and program for implementing this method - Google Patents
Speech waveform database construction method, apparatus and program for implementing this method Download PDFInfo
- Publication number
- JP4630038B2 JP4630038B2 JP2004315614A JP2004315614A JP4630038B2 JP 4630038 B2 JP4630038 B2 JP 4630038B2 JP 2004315614 A JP2004315614 A JP 2004315614A JP 2004315614 A JP2004315614 A JP 2004315614A JP 4630038 B2 JP4630038 B2 JP 4630038B2
- Authority
- JP
- Japan
- Prior art keywords
- waveform
- voice
- speech
- information
- speech waveform
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Description
この発明は、音声波形データベース構築方法、この方法を実施する装置およびプログラムに関し、特に、波形接続型のテキスト音声合成装置において用いられる音声波形データベースを構築する際に用いられ、この音声波形データベースを用いたテキスト音声合成装置において、音声合成に要する実行時間、計算量が小さく、かつ、高品質な音声合成を実施する音声波形データベース構築方法、この方法を実施する装置およびプログラムに関する。 The present invention relates to a speech waveform database construction method, an apparatus and a program for executing the method, and more particularly to construction of a speech waveform database used in a waveform-connected text speech synthesizer. The present invention relates to a speech waveform database construction method for implementing high-quality speech synthesis with a small execution time and calculation amount required for speech synthesis, and an apparatus and program for implementing this method.
近年の音声合成技術分野においては、大容量の記憶装置に数十分から数十時間の大量の肉声データを格納して音声波形データベースを構成し、入力されたテキストに応じて、適切な基準で音声波形データベースから適切な長さの音声波形を切り出し、これらを接続して合成音声を生成する波形接続型音声合成方法が提案されている(特許文献1 参照)。この波形接続型音声合成方法は、音声波形データベース中に適切な音高、長さの音声波形が存在しなかった場合、生成される合成音声のイントネーションが不自然になる場合がある。そこで、合成音声に所望のイントネーションを与えるために、音声波形データベースから切り出した音声波形に信号処理を施して、その音高、長さその他の音声パラメータを変更する方法が提案されている(特許文献1 参照)。
ところが、信号処理によって音声波形の音高、長さを変更すると、その変更量が大きい場合は音質が劣化するという問題があった。また、信号処理を行うと、単純に波形接続を実行した場合と比較して、より計算量が増大する上に、合成音声の生成処理に要する時間も増大するという問題があった。
この発明は、上述の問題に鑑みてなされたものであり、波形接続型テキスト音声合成において、肉声音声波形に音声パラメータを変更した変更済音声波形をも加えて音声波形データベースを構成することにより、音声合成に要する実行時間、計算量が小さく、かつ高品質な合成音声を生成することができる、先の問題を解消した音声波形データベース構築方法、この方法を実施する装置およびプログラムを提供するものである。
However, when the pitch and length of the speech waveform are changed by signal processing, there is a problem that the sound quality deteriorates when the change amount is large. Further, when the signal processing is performed, there is a problem that the amount of calculation is further increased and the time required for the synthetic speech generation processing is increased as compared with the case where the waveform connection is simply performed.
The present invention has been made in view of the above problems, and in waveform-connected text-to-speech synthesis, by adding a modified speech waveform in which a speech parameter is changed to a real voice waveform, a speech waveform database is configured. A speech waveform database construction method capable of generating high-quality synthesized speech with a small execution time and amount of calculation required for speech synthesis, a method for constructing a speech waveform database, an apparatus for implementing this method, and a program are provided. is there.
請求項1:波形接続型テキスト音声合成装置において用いられる音声波形データベースを構築する音声波形データベース構築方法において、予め用意された肉声音声波形に対して、音声波形の音質劣化が生じない範囲内で指定された変更量パラメータに基づいて、音高、或いは長さ、或いはパワー、その他の音声パラメータを信号処理により変更して、新たに韻律変更済音声波形を生成するステップを実行し、肉声音声波形に付与されている、発声内容とその位置を示す音素ラベル情報、或いはパワー情報、或いは音高情報、或いはピッチマーク情報、その他の音声情報を、韻律変更済音声波形を生成するステップにおいてなされた変更量に対応して変更することにより新たな音声情報を生成するステップを実行し、肉声音声波形およびその音声情報に加え、当該肉声音声波形から派生させた1つあるいは複数種類の韻律変更済の音声波形およびその音声情報とを用いて音声波形データベースを生成するステップを実行する、音声波形データベース構築方法を構成した。 Claim 1: In a speech waveform database construction method for constructing a speech waveform database used in a waveform-connected text speech synthesizer, designation is made within a range in which sound quality deterioration of a speech waveform does not occur with respect to a prepared real voice waveform Based on the changed amount parameter, the pitch, length, power, or other speech parameter is changed by signal processing to newly generate a prosody changed speech waveform, The amount of change made in the step of generating the prosody modified speech waveform from the given phoneme label information indicating the content and position of the utterance, power information, pitch information, pitch mark information, and other speech information The step of generating new audio information by executing a change corresponding to the In addition to voice information, performing the step of generating a speech waveform database by using the the real voice one or more types of prosody Changed speech waveform and the voice information is derived from the speech waveform, a speech waveform database building method Configured.
そして、請求項2:波形接続型テキスト音声合成装置において用いられる音声波形データベースを構築する音声波形データベース構築装置において、予め用意された肉声音声波形に対して、音声波形の音質劣化が生じない範囲内で指定された変更量パラメータに基づいて、音高、或いは長さ、或いはパワー、その他の音声パラメータを信号処理により変更して、新たに韻律変更済音声波形を生成する音声波形変更部4と、肉声音声波形に付与されている、発声内容とその位置を示す音素ラベル情報、或いはパワー情報、或いは音高情報、或いはピッチマーク情報、その他の音声情報を、韻律変更済音声波形の生成においてなされた変更量に対応して変更することにより新たな音声情報を生成する音声情報変更部5と、肉声音声波形およびその音声情報に加え、当該肉声音声波形から派生させた1つあるいは複数種類の韻律変更済の音声波形およびその音声情報とを用いて音声波形データベースを生成する音声波形データベース生成部8と、を有する音声波形データベース構築装置を構成した。
Claim 2: In a speech waveform database construction device for constructing a speech waveform database used in a waveform-connected text speech synthesizer, within a range in which sound quality deterioration of the speech waveform does not occur with respect to a prepared real voice speech waveform A voice
また、請求項3:請求項1に記載されるステップをこの順に実行する指令をコンピュータに対してする音声波形データベース構築プログラムを構成した。 A third aspect of the present invention is a speech waveform database construction program for instructing a computer to execute the steps described in the first aspect in this order.
この発明は、波形接続型テキスト音声合成装置において用いられる音声波形データベースを構築する課程において、
音声波形データベースを構築する肉声音声波形と、肉声音声波形に発声内容とその位置を示す音素ラベル情報、或いはパワー情報、或いは音高情報、或いはピッチマーク情報、その他の音声情報が用意されている段階で、
音声波形データベース中の肉声音声波形全てに対して、音声波形変更部により指定された変更量パラメータに基づいて、音高、或いは長さその他の音声パラメータを信号処理により変更して韻律変更済の音声波形を新たに生成し、
音声波形データベース中の肉声発声に付与されている、発声内容とその位置を示すための音素ラベル情報、或いはパワー情報、或いは音高情報その他の音声情報を、音声情報変更部により、音声波形変更部においてなされた変更量に対応して変更することにより新たな音声情報を生成し、
上述した肉声音声波形およびその音声情報と、韻律変更済の音声波形およびその音声情報を用いて、音声波形データベース生成部により音声波形データベースを構築する構成を採用している。これにより、予め信号処理により多様な韻律バリエーションを持つ音声波形が音声波形データベースに含まれることになり、音声波形データベース中に、合成したいテキストに対応した適切な音高或いは長さ或いはパワーその他の音声パラメータの音声波形が存在する可能性が高くなり、自然なイントネーションを持つ高品質な音声合成をすることができる。
In the course of constructing a speech waveform database used in a waveform connected text speech synthesizer,
A stage in which a voice waveform for constructing a voice waveform database, a phonetic label information indicating the utterance content and its position, power information, pitch information, pitch mark information, or other voice information is prepared in the voice waveform. so,
For all real voice waveforms in the voice waveform database, the pitch or length or other voice parameters are changed by signal processing based on the change amount parameter specified by the voice waveform change unit, and the prosody has been changed. Generate a new waveform,
The phonetic label information for indicating the utterance content and its position, the power information, the pitch information or other voice information given to the real voice utterance in the voice waveform database To generate new audio information by changing in accordance with the amount of change made in
A configuration in which a speech waveform database is constructed by a speech waveform database generation unit using the above-described real voice waveform and its speech information, and a speech waveform whose prosody has been changed and its speech information is adopted. As a result, speech waveforms having various prosodic variations by signal processing are included in the speech waveform database in advance, and an appropriate pitch, length, power or other speech corresponding to the text to be synthesized is included in the speech waveform database. There is a high possibility that a parameter speech waveform exists, and high-quality speech synthesis with natural intonation can be performed.
そして、音声波形変更部で行う肉声音声波形に対する信号処理において、韻律の変更は音質劣化が生じない範囲で行われているので、音質劣化のない高品質な音声合成をすることができる。
また、音声波形に対する信号処理をデータベース構築の段階で行うので、音質劣化は少ないが計算量を要する信号処理手法を用いることができるところから、合成音声生成処理に要する時間を増大させずに、音質劣化のない自然なイントネーションを持つ高品質な音声合成をすることができる。
In the signal processing for the real voice waveform performed by the voice waveform changing unit, the prosody change is performed in a range in which the sound quality does not deteriorate, so that high quality speech synthesis without sound quality deterioration can be performed.
In addition, since the signal processing for speech waveforms is performed at the stage of database construction, a signal processing technique that requires little computational complexity but with little deterioration in sound quality can be used, so the sound quality can be increased without increasing the time required for the synthesized speech generation processing. High quality speech synthesis with natural intonation without degradation can be achieved.
発明を実施するための最良の形態を図1の実施例を参照して説明する。
1は音声波形データベース構築装置であり、音声波形変更部4と、音声情報変更部5と、変更済音声波形データ6と、変更済音声情報7と、音声波形データベース生成部8とから構成されている。
音声波形データベース構築装置1は、肉声音声波形データ2と、その音素ラベル情報、或いはパワー情報、或いは音高情報、或いはピッチマーク情報その他の肉声音声情報3を入力として、音声波形データベース9を構築する音声波形データベース構築装置である。音声波形データベース構築装置1は、また、周知のハードウエアから構成されるコンピュータ装置とそのCPUを駆動するソフトウエアであるコンピュータプログラムとからなり、音声波形変更部4と、音声情報変更部5と、音声波形データベース生成部8のそれぞれはハードウエアとソフトウエアの内の何れか一方或いは双方によって構成されている。
The best mode for carrying out the invention will be described with reference to the embodiment of FIG.
Reference numeral 1 denotes an audio waveform database construction device, which is composed of an audio
The speech waveform database construction apparatus 1 constructs a
肉声音声波形データ2は、例えば、ナレーターの発声により単語、文章を読み上げた音声データをAD変換して、ハードディスクの如き記憶媒体の記憶領域に格納したものである。
肉声音声情報3は、肉声音声波形データ2に対応して、発声内容とその時間情報を示す音素ラベル情報、パワー情報、音高情報、ピッチマーク情報、スペクトル情報その他の音声情報を付与したデータであり、これらをハードディスクの如き記憶媒体の記憶領域に格納したものである。
The real
The
音声波形変更部4は、音声波形データベース構築装置1に与えられた変更量パラメータに基づいて、肉声音声波形データ2に格納される全ての肉声音声波形データに対して信号処理を施して対応する音高、長さに変更し、音高、長さに指定の変更量が加えられた変更済音声波形データ6を生成する。ここで用いられる信号処理方法としては、例えば、PSOLA(Pitch Sincronous Ooverlap Add )に代表される信号処理方法がある。変更済音声波形データ6は、ハードディスクの如き記憶媒体の記憶領域に格納される。
音声情報変更部5は、音声波形変更部4で変更された音声波形データの音高、長さに対応して、肉声音声情報3の情報を変更して、変更済音声情報7を生成する。例えば、音声波形データの音高が変わると、それに対応して、その音高情報、ピッチマーク情報、スペクトル情報を変更する。また、音声波形データの長さが変わると、それに対応して音素ラベルの時間情報、ピッチマーク情報を変更する。変更済音声情報7は、ハードディスクの如き記憶媒体の記憶領域に格納される。
The speech
The voice
音声波形データベース生成部8は、肉声音声波形データ2、肉声音声情報3、変更済音声波形データ6と、変更済音声情報7に格納されたデータに基づいて、音声波形データ9と音声情報インデックス10からなる音声波形データベース11を生成する。
音声波形データ9は、肉声音声波形データ2或いは変更済音声波形データ6の内容である音声波形を格納したもので、ハードディスクの如き記憶媒体の記憶領域に格納したものである。
音声情報インデックス10は、肉声音声情報3或いは変更済音声情報7の内容をインデックスとして保持し、所望の音素情報、音高情報を検索キーとして、音声波形データ9から音声合成に必要な音声波形データを読み出せる構成としたものである。
Based on the data stored in the
The
The
ここで、処理動作を図2をも参照して説明する。図2は声波形データベース構築の処理動作を示すフローチャートである。
先ず、(S1)は、音声波形変更部4において、音声波形データベース構築装置1に与えられた変更量パラメータに基づいて、肉声音声波形データ2に格納される全ての肉声音声波形データに対して信号処理を施して音高、長さを変更する。この変更量は、音質劣化が生じない範囲である必要がある。この許容量は信号処理方法にも依存するので、一種類に規定しておくことはできず、信号処理方法に応じて実験値より決定すべきであるが、この実施例は、変更量パラメータは、音高を一律10%上昇するように与えられたものとする。この場合、肉声音声波形データ2に格納された全ての肉声音声波形データに対して、その音高を一律に10%上昇させた音声波形を信号処理により生成する。ここで用いられる信号処理方法としては、例えば、PSOLAに代表される方法がある。PSOLAのような信号処理時にピッチマーク情報が必要となる方式の場合は、肉声音声情報3に格納されたピッチマーク情報を読み出して利用する。変更された音声波形データは変更済音声波形データ6として、一時的に格納される。
Here, the processing operation will be described with reference to FIG. FIG. 2 is a flowchart showing the processing operation of voice waveform database construction.
First, (S1) is a signal for all the real voice waveform data stored in the real
続いて、(S2)は、音声情報変更部5において、音声波形変更部4で変更された音声波形データの音高、長さに対応して、肉声音声情報3の情報を変更する。この実施例の場合は、音高を10%上昇させるために、音高情報を10%上昇させたものに変更する。また、音高が変わるとピッチマーク位置も変わるので、変更後のピッチマーク位置に合わせて変更する。変更後のピッチマーク位置については、音声波形変更部4の信号処理時に用いたピッチマーク位置情報を流用すればよい。変更された音声情報データは変更済音声情報7として、一時的に格納される。
Subsequently, in (S2), in the voice
次に、(S3)は、音声波形データベース生成部8において、肉声音声波形データ2と変更済音声波形データ6と肉声音声情報3と変更済音声情報7とを用いて音声波形データベース11を構築する。肉声音声情報3或いは変更済音声情報7の内容を音声情報インデックス10として保持し、また、対応する音声波形データヘのポインタ情報を登録することにより、音声合成エンジンで音声波形データベース11を使って音声合成を行うに際して、所望の音素情報、音高情報などで音声波形データ9を検索して、合成に必要な音声波形データを読み出せるように構成する。この実施例によれば、最終的に構築される音声波形データベース11は、音声波形データについては、肉声音声波形データ2と、音高を10%上昇させるという変更を加えた変更済音声データ6を含むので、音声波形データベースの規模は2倍となる。
Next, in (S3), the voice waveform
上述した通りであり、この発明によれば、予め変更量パラメータに基づく信号処理を行っておくことにより、音声波形データベースの保持する音声波形のバリエーションが増加するので、音声波形データベース中に、合成したいテキストに対応した適切な音高或いは長さの音声波形が存在する可能性が高くなり、自然なイントネーションを持つ高品質な音声合成をすることができる。
そして、音声波形変更部で行う肉声音声波形に対する信号処理において、韻律の変更は音質劣化が生じない範囲内で行われているので、肉声音声波形に対して信号処理を施した音声波形を用いているにも関わらず、音質劣化のない高品質な音声合成をすることができる。
As described above, according to the present invention, since signal processing based on the change amount parameter is performed in advance, the variation of the speech waveform held in the speech waveform database increases. Therefore, it is desired to synthesize the speech waveform database. There is a high possibility that a speech waveform having an appropriate pitch or length corresponding to the text exists, and high-quality speech synthesis with natural intonation can be performed.
In the signal processing for the real voice waveform performed by the voice waveform changing unit, since the prosody change is performed within a range in which the sound quality does not deteriorate, the voice waveform obtained by performing signal processing on the real voice waveform is used. In spite of this, it is possible to synthesize high-quality speech without deterioration of sound quality.
また、音声波形に対する信号処理をデータベース構築の段階で行うので、音質劣化が少ない半面計算量を要するような信号処理手法を用いることができ、合成音声生成処理に要する時問を増大させずに、音質劣化のない自然なイントネーションを持つ高品質な音声合成が可能となる効果がある。
なお、上述した実施例は、以下の如き態様で実施することができる。
例えば、変更量パラメータにおいて指定される変更量は1種類である必要はなく、例えば、音高変更量を5%上昇、10%上昇、5%下降、10%下降、の4種類指定し、変更済音声波形データ6および変更済音声情報7をそれぞれ変更量パラメータに応じて4種類生成し、これらを元にした音声波形データベース11を構築してもよい。また、音高の変更、長さの変更を組み合わせて指定してもよい。これらの場合、或る音素列に対してより多くの音高バリエーション、音長バリエーションが存在するので、音声素片間の音高の繋がりがより滑らかになり、また、音素の継続時間の自然性が向上する可能性が高まるので、合成音声の品質はより向上する。また、この発明は、先のPSOLA以外の他の信号処理方法を使用しても実施することができる。
In addition, since the signal processing for the speech waveform is performed at the stage of database construction, it is possible to use a signal processing method that requires a small amount of computation with little deterioration in sound quality, and without increasing the time required for the synthesized speech generation process, This has the effect of enabling high-quality speech synthesis with natural intonation without sound quality degradation.
In addition, the Example mentioned above can be implemented with the following aspects.
For example, the change amount specified in the change amount parameter does not need to be one type. For example, the pitch change amount is specified by changing four types of 5% up, 10% up, 5% down, 10% down. Four types of the completed speech waveform data 6 and the modified
1 音声波形データベース構築装置 2 肉声音声波形データ
3 肉声音声情報 4 音声波形変更部
5 音声情報変更部 6 変更済音声波形データ
7 変更済音声情報 8 音声波形データベース生成部
9 音声波形データ 10 音声情報インデックス
11 音声波形データベース
DESCRIPTION OF SYMBOLS 1 Voice waveform
9
Claims (3)
予め用意された肉声音声波形に対して、音声波形の音質劣化が生じない範囲内で指定された変更量パラメータに基づいて、音高、或いは長さ、或いはパワー、その他の音声パラメータを信号処理により変更して、新たに韻律変更済音声波形を生成するステップを実行し、
肉声音声波形に付与されている、発声内容とその位置を示す音素ラベル情報、或いはパワー情報、或いは音高情報、或いはピッチマーク情報、その他の音声情報を、韻律変更済音声波形を生成するステップにおいてなされた変更量に対応して変更することにより新たな音声情報を生成するステップを実行し、
肉声音声波形およびその音声情報に加え、当該肉声音声波形から派生させた1つあるいは複数種類の韻律変更済の音声波形およびその音声情報とを用いて音声波形データベースを生成するステップを実行する、
ことを特徴とする音声波形データベース構築方法。 In a speech waveform database construction method for constructing a speech waveform database used in a waveform connected text speech synthesizer,
Based on the amount of change parameter specified within the range where sound quality deterioration of the voice waveform does not occur with respect to the prepared real voice waveform, the pitch, length, power, and other voice parameters are processed by signal processing. Change and execute the step of generating a new prosody modified speech waveform,
In the step of generating the prosody modified speech waveform, the phoneme label information indicating the utterance content and its position, the power information, the pitch information, the pitch mark information, or other speech information given to the real voice waveform Performing a step of generating new audio information by changing in accordance with the amount of change made,
In addition to the real voice speech waveform and the voice information, performing the step of generating a speech waveform database by using the the real voice one or more types of prosody Changed speech waveform and the voice information is derived from the speech waveform,
A method of constructing a speech waveform database.
予め用意された肉声音声波形に対して、音声波形の音質劣化が生じない範囲内で指定された変更量パラメータに基づいて、音高、或いは長さ、或いはパワー、その他の音声パラメータを信号処理により変更して、新たに韻律変更済音声波形を生成する音声波形変更部と、
肉声音声波形に付与されている、発声内容とその位置を示す音素ラベル情報、或いはパワー情報、或いは音高情報、或いはピッチマーク情報、を、韻律変更済音声波形の生成においてなされた変更量に対応して変更することにより新たな音声情報を生成する音声情報変更部と、
肉声音声波形およびその音声情報に加え、当該肉声音声波形から派生させた1つあるいは複数種類の韻律変更済の音声波形およびその音声情報とを用いて音声波形データベースを生成する音声波形データベース生成部と、
を有することを特徴とする音声波形データベース構築装置。 In a speech waveform database construction device for constructing a speech waveform database used in a waveform connected text speech synthesizer,
Based on the amount of change parameter specified within the range where sound quality deterioration of the voice waveform does not occur with respect to the prepared real voice waveform, the pitch, length, power, and other voice parameters are processed by signal processing. A voice waveform changing unit that changes and generates a new prosody changed voice waveform;
Corresponding to the amount of change made in the generation of the prosody modified speech waveform, the phoneme label information indicating the utterance content and its position, or the power information, pitch information, or pitch mark information given to the real voice waveform A voice information changing unit that generates new voice information by changing
In addition to the real voice speech waveform and its audio information, and the audio waveform database generation unit for generating a speech waveform database by using the the real voice speech waveform and the voice information of one or more types of prosody Modified which was derived from the speech waveform ,
A speech waveform database construction device characterized by comprising:
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2004315614A JP4630038B2 (en) | 2004-10-29 | 2004-10-29 | Speech waveform database construction method, apparatus and program for implementing this method |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2004315614A JP4630038B2 (en) | 2004-10-29 | 2004-10-29 | Speech waveform database construction method, apparatus and program for implementing this method |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2006126556A JP2006126556A (en) | 2006-05-18 |
JP4630038B2 true JP4630038B2 (en) | 2011-02-09 |
Family
ID=36721368
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2004315614A Expired - Fee Related JP4630038B2 (en) | 2004-10-29 | 2004-10-29 | Speech waveform database construction method, apparatus and program for implementing this method |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP4630038B2 (en) |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS63147200A (en) * | 1986-12-11 | 1988-06-20 | 富士通株式会社 | Voice parameter correction system |
JPH10301599A (en) * | 1997-04-30 | 1998-11-13 | Nec Corp | Voice synthesizer |
-
2004
- 2004-10-29 JP JP2004315614A patent/JP4630038B2/en not_active Expired - Fee Related
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS63147200A (en) * | 1986-12-11 | 1988-06-20 | 富士通株式会社 | Voice parameter correction system |
JPH10301599A (en) * | 1997-04-30 | 1998-11-13 | Nec Corp | Voice synthesizer |
Also Published As
Publication number | Publication date |
---|---|
JP2006126556A (en) | 2006-05-18 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5293460B2 (en) | Database generating apparatus for singing synthesis and pitch curve generating apparatus | |
JP5471858B2 (en) | Database generating apparatus for singing synthesis and pitch curve generating apparatus | |
JP4130190B2 (en) | Speech synthesis system | |
JP4241762B2 (en) | Speech synthesizer, method thereof, and program | |
JP4516863B2 (en) | Speech synthesis apparatus, speech synthesis method and program | |
JP2007249212A (en) | Method, computer program and processor for text speech synthesis | |
JP2003295882A (en) | Text structure for speech synthesis, speech synthesizing method, speech synthesizer and computer program therefor | |
US8626510B2 (en) | Speech synthesizing device, computer program product, and method | |
JPS62160495A (en) | Voice synthesization system | |
JP4406440B2 (en) | Speech synthesis apparatus, speech synthesis method and program | |
JP5320363B2 (en) | Speech editing method, apparatus, and speech synthesis method | |
US20090281808A1 (en) | Voice data creation system, program, semiconductor integrated circuit device, and method for producing semiconductor integrated circuit device | |
JP6669081B2 (en) | Audio processing device, audio processing method, and program | |
JP4639932B2 (en) | Speech synthesizer | |
JP4287785B2 (en) | Speech synthesis apparatus, speech synthesis method and program | |
JP2013164609A (en) | Singing synthesizing database generation device, and pitch curve generation device | |
JP5874639B2 (en) | Speech synthesis apparatus, speech synthesis method, and speech synthesis program | |
JP5268731B2 (en) | Speech synthesis apparatus, method and program | |
JP4630038B2 (en) | Speech waveform database construction method, apparatus and program for implementing this method | |
JP5157922B2 (en) | Speech synthesizer and program | |
JP5387410B2 (en) | Speech synthesis apparatus, speech synthesis method, and speech synthesis program | |
JP2005025173A (en) | Speech data selecting apparatus, method thereof and program | |
JP2005018036A (en) | Device and method for speech synthesis and program | |
JP4209811B2 (en) | Voice selection device, voice selection method and program | |
WO2023182291A1 (en) | Speech synthesis device, speech synthesis method, and program |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
RD03 | Notification of appointment of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7423 Effective date: 20061219 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20070126 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20091130 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20091208 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20100205 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20100831 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20100921 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20101102 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20101112 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20131119 Year of fee payment: 3 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
S531 | Written request for registration of change of domicile |
Free format text: JAPANESE INTERMEDIATE CODE: R313531 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
LAPS | Cancellation because of no payment of annual fees |