JPWO2005093713A1 - 音声合成装置 - Google Patents
音声合成装置 Download PDFInfo
- Publication number
- JPWO2005093713A1 JPWO2005093713A1 JP2006511572A JP2006511572A JPWO2005093713A1 JP WO2005093713 A1 JPWO2005093713 A1 JP WO2005093713A1 JP 2006511572 A JP2006511572 A JP 2006511572A JP 2006511572 A JP2006511572 A JP 2006511572A JP WO2005093713 A1 JPWO2005093713 A1 JP WO2005093713A1
- Authority
- JP
- Japan
- Prior art keywords
- speech
- unit
- data
- waveform
- voice
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000006243 chemical reaction Methods 0.000 claims abstract description 63
- 238000000605 extraction Methods 0.000 claims abstract description 47
- 238000000034 method Methods 0.000 claims abstract description 8
- 239000000284 extract Substances 0.000 claims abstract description 7
- 230000008569 process Effects 0.000 claims abstract description 7
- 238000012545 processing Methods 0.000 claims description 42
- 230000002194 synthesizing effect Effects 0.000 claims 1
- 230000015572 biosynthetic process Effects 0.000 abstract description 32
- 238000003786 synthesis reaction Methods 0.000 abstract description 32
- 238000010586 diagram Methods 0.000 description 31
- 230000006870 function Effects 0.000 description 26
- 238000004891 communication Methods 0.000 description 7
- 238000005516 engineering process Methods 0.000 description 7
- 230000005540 biological transmission Effects 0.000 description 6
- 230000000694 effects Effects 0.000 description 4
- 230000008859 change Effects 0.000 description 2
- 238000011156 evaluation Methods 0.000 description 2
- 230000002452 interceptive effect Effects 0.000 description 2
- 230000002265 prevention Effects 0.000 description 2
- 238000001308 synthesis method Methods 0.000 description 2
- 208000032041 Hearing impaired Diseases 0.000 description 1
- 235000016496 Panda oleosa Nutrition 0.000 description 1
- 240000000220 Panda oleosa Species 0.000 description 1
- 239000002131 composite material Substances 0.000 description 1
- 230000006866 deterioration Effects 0.000 description 1
- 239000000203 mixture Substances 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 230000033764 rhythmic process Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L13/00—Speech synthesis; Text to speech systems
- G10L13/08—Text analysis or generation of parameters for speech synthesis out of text, e.g. grapheme to phoneme translation, prosody generation or stress or intonation determination
- G10L13/10—Prosody rules derived from text; Stress or intonation
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L13/00—Speech synthesis; Text to speech systems
- G10L13/06—Elementary speech units used in speech synthesisers; Concatenation rules
- G10L13/07—Concatenation rules
Landscapes
- Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Machine Translation (AREA)
- Document Processing Apparatus (AREA)
Abstract
Description
α2、α3…組込みマイコン
β、β2、β3…パーソナルコンピュータ
γ…音声合成システム
1…音声データベース
2…テキスト解析部
3…韻律予測部
3A…韻律知識ベース
4…音声単位抽出部
5…波形接続部
6…データ入力部
7…音声変換処理部
8…話速変換部
11…CPU
12…ROM
13…RAM
14…メモリカード
15…シリアルインタフェース
16…D/Aコンバータ
21…入力手段
22…スピーカ
まず、図1は、本発明の一形態例に係る音声合成装置の機能構成図である。
Memory)13とを搭載して構成されて、例えば、ROM12にリアルタイムOS(Operating
System)と、テキスト解析部2、韻律予測部3、音声単位抽出部4、波形接続部5の各機能を音声合成装置αのCPU11に実行させるための処理プログラム等が記録されるとよい。
Text Markup Language)形式のデータファイルからHTMLタグを取り除いて抽出されたものでも構わず、インターネット上のホームページや、電子メール、あるいは、キーボードやマウス等の入力手段によってユーザから直接入力されて生成されたテキストデータであっても構わない。
まず、構成例1としては上記形態例にて説明した、図1の機能構成図に示す各機能部1〜7全てをマイコンに組込んだ音声合成装置αを機能構成例1とする。
さらに、構成例1の音声合成装置αに合成音声の読み上げ速度調節機能である話速変換部8を付加し、構成例1と同様に図2に記載される全機能部1〜8を一個のケースに一体装備した音声合成装置α2を機能構成例2とする。
次に図5は、図1に示す音声合成装置αにおける波形接続部5、音声変換処理部7を抽出選択し組込みマイコンα2に搭載し、他の各機能部を別途設置したパーソナルコンピュータに組み込むことにより一連の音声合成処理を実行する音声合成システムγの構成例を示す機能構成図である。
次に、図6は、図5と同様に図1に示す音声合成装置αの機能部1と3〜5、7を一部抽出選択した組込みマイコンα3の機能構成図である。
ト解析部と、アクセントと抑揚について事前に設定された韻律知識ベースに従い、事前に解析された前記テキストデータ中の任意の文章に対応する前記表音記号データのそれぞれに対応する前記アクセントと前記抑揚を示す韻律パラメータを生成する韻律予測部と、当該音声合成装置の用途に応じた所要の前記音声単位のみを有するよう事前に選択収録された所定の前記音声データのみを複数蓄積する前記音声データベースに基づき、当該韻律予測部にて生成した前記韻律パラメータのそれぞれに最も近い前記所定の音声単位部分を有した前記音声データのそれぞれから、該当する当該所定の音声単位部分の前記音声素片波形データの全てを抽出する音声単位抽出部と、当該音声単位抽出部にて抽出した前記音声素片波形データ群を、前記文章順に、当該音声素片波形データ群の示す音声波形が連続となるよう順次波形接続することで合成音声データを生成する波形接続部と、当該合成音声データをアナログ音声に変換出力する音声変換処理部と、を具備し、前記データ入力部が、当該音声合成装置が組込み搭載された他の機器と接続されて、当該機器からシリアルデータを受信してなる、音声合成装置の構成採用にある。
[0018] 本発明装置の第2の特徴は、上記本発明装置の第1の特徴における前記音声データベースが、前記音声合成装置に着脱可能なメモリカード上に構築されて、当該音声合成装置に当該メモリカードが装着されたときに、前記音声単位抽出部から読み取り可能に構成されてなる、音声合成装置の構成採用にある。
[0019] (削除)
[0020] 本発明装置の第3の特徴は、上記本発明装置の第1の特徴における前記音声合成装置が、前記データ入力部により前記任意文章とともに取得した速度パラメータを前記波形接続部より生成された前記合成音声データに反映させ、当該合成音声データの読み上げ速度を調整する話速変換部を前記音声変換処理部に前置してなる、音声合成装置の構成採用にある。
[0021] 本発明装置の第4の特徴は、上記本発明装置の第1の特徴における前記データ入力部と前記テキスト解析部と前記韻律予測部と前記音声データベースと前記音声単位抽出部と前記波形接続部と前記音声変換処理部が、一個のケース内に一体装備
4
されてなる、音声合成装置の構成採用にある。
[0022] (削除)
[0023] (削除)
[0024] 本発明装置の第5の特徴は、上記本発明装置の第1の特徴における前記所定の音声単位が、音素、単語、フレーズ、シラブルのうちの1以上である、音声合成装置の構成採用にある。
[0025] (削除)
5
[0026] (削除)
[0027] (削除)
【発明の効果】
[0028] 本発明によれば、従来、大型化が避けられなかったコーパスベース音声技術を採用した音声合成装置を従来と比較して大幅に小型化することが可能となり、他の機器に組込み可能となることから、例えば、福祉関連機器に組み込まれることで音声伝達を可能とするコミュニケーションツールとして活用することができ、キャラクターの声を出力可能な人形等の玩具や、音声による情報伝達が可能な家電等、さまざまな製品に活用することが可能となる。特に、サーバ、パソコンなどを使わずに音声合成が可能となる。
[0029] また、音声データベースを着脱可能なメモリカード上に構築し用途に応じて交換可能にしたことで、音声合成装置の小型化が可能となると共に、用途に合った音声デ
6
ータを収録することで、音声合成の読み正解率やアクセント正解率の向上させてより自然な音声を出力させることが可能になり、また、出力する声質をユーザの好みのものに切り替えることが可能となる。
[0030] さらに、ネットワークを利用して音声合成を行う場合、従来音声の送信には中高速回線を利用していたが、本発明では、テキストデータを受信側装置で受信して音声に変換すればよいため、低速回線を利用した音声放送が可能となり、また、プッシュ型のサービスに適用された場合、テキストデータのみを配信することで受信側装置にて音声として出力させることができ、省力化や、防災無線等の緊急を要する場合にも迅速なサービスの提供が可能となる。
【図面の簡単な説明】
[0031][図1]本発明の一形態例に係る音声合成装置の機能構成図である。
[図2]同上した音声合成装置に話速変換部を機能追加した音声合成装置の機能構成図である。
[図3]同上した音声合成装置のハードウェア構成例を示す模式図である。
[図4]同上した音声合成装置のデータ構成を説明するための図であり、同図(a)はテキストデータを、同図(b)は表音記号データを、同図(c)は韻律知識ベースを、同図(d)は韻律パラメータを、同図(e)は音声データベースを説明するための図である。
【符号の説明】
[0032] α、α1…音声合成装置
1…音声データベース
2…テキスト解析部
7
3…韻律予測部
3A…韻律知識ベース
4…音声単位抽出部
5…波形接続部
6…データ入力部
7…音声変換処理部
8…話速変換部
11…CPU
12…ROM
13…RAM
14…メモリカード
15…シリアルインタフェース
16…D/Aコンバータ
【発明を実施するための最良の形態】
[0033] 以下、本発明の実施の形態につき、添付図面を参照しつつ、音声合成装置の形態例を説明する。
[0034] (形態例)
まず、図1は、本発明の一形態例に係る音声合成装置の機能構成図である。
[0035】 同図に示すように、本形態例にかかる音声合成装置αは、事前に収録された所定文章の音声データを、例えば、音素や単語、フレーズ、シラブル等の所定の音声単位毎に音声素片波形データとして抽出可能に複数蓄積した音声データベース1を搭載し、任意のテキストデータに対して音声データベース1に基づきコーパスベース音声合成を行うための装置であり、少なくともテキスト解析部2と、韻律予測部3と、音声単位抽出部4と、波形接続部5からなり、必要に応じ他の機器に組込み搭載される組込みマイコンとして構成する。
[0036] (削除)
8
[0037] ここで、音声データベース1は、コーパスベース音声合成を行うためのコーパスであって、音声合成装置αの用途に応じた所定の音声単位のみを有するように事前に選択収録された所定の音声データのみを複数蓄積し、音声合成装置αの用途に応じて細分化されて構築される。
[0038] 一方、テキスト解析部2は、入力されたテキストデータ中の任意の文章を解析し、この文章に対応する表音記号データを生成可能に構成されて、韻律予測部3は内部に、表音記号データのアクセントと抑揚についての認識規則について事前に設定された韻律知識ベース3Aを搭載し、この韻律知識ベース3Aに従い、テキスト解析部2が生成した表音記号データのそれぞれに対応するアクセントと抑揚を示す韻律パラメータを生成するよう構成される。
[0039] 他方、音声単位抽出部4は、韻律予測部3にて生成された韻律パラメータのそれぞれに最も近いアクセントと抑揚を備えた音素を含む音声データを、例えば、人間の聴覚特性に近づけた評価関数等を用いて、音声データベース1から抽出し、ここで抽出した音声データのそれぞれから、この韻律パラメータに該当する音素等の所定の音声単位の音声素片波形データのみを抽出するよう構成される。
[0040] さらに、波形接続部5は、音声単位抽出部4にて抽出した複数の音声素片波形データ群を、文章順に、この音声素片波形データ群の音声波形が滑らかで自然な音声となるよう、連続させて順次波形接続を行うことで、自然な韻律の合成音声データを生成するよう構成される。
[0041] なお、音声合成装置αの組込みマイコン上に、さらに、音声合成装置αが組込み搭載される他の機器と接続されて、この機器中の、例えば、キーボードやマウス等の入力手段や、ネットワークを介して送受信されたデータを記録する記録媒体等からシリアルデータを受信し、このシリアルデータからテキストデータを取得してテキスト解析部2に入力可能に構成されたデータ入力部6を具備するようにしても構わない。
[0042] このデータ入力部6を具備することにより、音声合成装置αは、事前に設定されたテキストデータの音声合成のみならず、例えば、音声合成装置αのユーザにより入
9
る」,「私は」,…等の音声データから、韻律パラメータに合致する「ha」,「shi」,「wo」,「wa」,「ta」,「ru」の音声素片波形データのみを切り取り、抽出するようにすることで、波形接続部5にてこの音声素片波形データを滑らかに接続して、合成音声データを生成することが可能となる。
[0062] なお、ここでは、所定の音声単位の一例として音素を採用した場合について説明したが、入力されたテキストデータ中に事前に音声データベース1中に蓄積された単語やフレーズを含む場合には、所定の音声単位をこの単語やフレーズとすることで、音声単位抽出部4において、音声データベース1中に蓄積された単語やフレーズ等を分割せずにそのまま抽出することが可能であり、この単語あるいはフレーズをそのまま、あるいは、組み合わせて出力することで、より自然な音声を合成することが可能となる。
【実施例】
[0063] 続いて、実施例として図1、2の機能構成図に示す本発明における合成音声装置αの実施構成図を用いて機能構成例を説明する。
[0064](構成例1)
まず、構成例1としては上記形態例にて説明した、図1の機能構成図に示す各機能部1〜7全てをマイコンに組込んだ音声合成装置αを機能構成例1とする。
[0065] この場合、全機能部1〜7は一個のケース内に一体装備され、他の設備、機器等に機能を分散しなくても単体のみで音声の合成が実行可能な音声合成装置αであり、シリアルデータ入力からアナログ出力までの一連の機能部1〜7を一個体のケースで実行させることを可能とする。
[0066] また、上記全機能部がケース単体で実行可能であればその機能構成は限定されず、例えば、同一ケース内に音声変換出力部7、データ入力部6として図示しないスピーカやデータ入力装置等を組込み搭載してもよい。
[0067] (構成例2)
さらに、構成例1の音声合成装置αに合成音声の読み上げ速度調節機能である話速変換部8を付加し、構成例1と同様に図2に記載される全機能部1〜8を一個のケースに一体装備した音声合成装置α2を機能構成例2とする。
13
[0068] ここで話速変換部8は、合成音声データに速度パラメータを反映させることにより合成音声の速度調節を行う。この場合、データ入力部にはシリアルデータとして、テキストデータとともに速度パラメータを入力する。
[0069] 速度パラメータはデータ入力部6から波形接続部5までの機能部を各変換データ及びパラメータに付加された状態で受け渡され、話速変換部8ではじめて認識される。話速変換部8は、波形接続部5から速度パラメータとともに受け取った合成音声データに対し速度パラメータの値をあてはめ、合成音声の読み上げ速度の変更を行う。
[0070] 構成例2は話速変換を行うことにより、利用状況に応じて速度の変更を行い利用者に対し正確に合成音声を伝達することを目的としており、例えば、読み上げ速度を通常よりも遅く設定することにより、聞き取り易くして緊急時など冷静な判断能力が欠如しがちな状態において効果的である。
[0071](削除)
[0072](削除)
[0073](削除)
[0074](削除)
[0075](削除)
14
[0076](削除)
[0077](削除)
[0078](削除)
[0079](削除)
[0080](削除)
[0081](削除)
[0082](削除)
15
[0083](削除)
[0084](削除)
[0085](削除)
[0086] 以上、本発明の実施の形態につき、その音声合成装置αの一形態例及び機能構成例を挙げて説明したが、本発明は、必ずしも上述した手段にのみ限定されるものではなく、前述した効果を有する範囲内において、適宜、変更実施することが可能なものである。
[0087] また、音声合成装置αを、別途構成された他の音声認識装置と接続することにより、自然な発声の対話を可能とする対話型の音声合成装置を構築することも可能である。
16
Claims (11)
- 事前に収録された所定文章の音声データを所定の音声単位毎に音声素片波形データとして抽出可能に複数蓄積した音声データベースを搭載し、任意のテキストデータに対して前記音声データベースに基づきコーパスベース音声合成を行うための音声合成装置であって、
シリアルデータからテキストデータを取得するデータ入力部と、
当該テキストデータ中の前記任意の文章に対応する音を母音と子音で示す表音記号を表音記号データとして生成処理するテキスト解析部と、
アクセントと抑揚について事前に設定された韻律知識ベースに従い、事前に解析された前記テキストデータ中の任意の文章に対応する前記表音記号データのそれぞれに対応する前記アクセントと前記抑揚を示す韻律パラメータを生成する韻律予測部と、
当該音声合成装置の用途に応じた所要の前記音声単位のみを有するよう事前に選択収録された所定の前記音声データのみを複数蓄積する前記音声データベースに基づき、当該韻律予測部にて生成した前記韻律パラメータのそれぞれに最も近い前記所定の音声単位部分を有した前記音声データのそれぞれから、該当する当該所定の音声単位部分の前記音声素片波形データの全てを抽出する音声単位抽出部と、
当該音声単位抽出部にて抽出した前記音声素片波形データ群を、前記文章順に、当該音声素片波形データ群の示す音声波形が連続となるよう順次波形接続することで合成音声データを生成する波形接続部と、
当該合成音声データをアナログ音声に変換出力する音声変換処理部と、を具備する、
ことを特徴とする音声合成装置。 - 前記音声データベースは、
前記音声合成装置に着脱可能なメモリカード上に構築されて、
当該音声合成装置に当該メモリカードが装着されたときに、前記音声単位抽出部から読み取り可能に構成される、
ことを特徴とする請求項1に記載の音声合成装置。 - 前記データ入力部は、
当該音声合成装置が組込み搭載された他の機器と接続されて、当該機器からシリアルデータを受信する、
ことを特徴とする請求項1に記載の音声合成装置。 - 前記音声合成装置は、
前記データ入力部により前記任意文章とともに取得した速度パラメータを前記波形接続部より生成された前記合成音声データに反映させ、当該合成音声データの読み上げ速度を調整する話速変換部を前記音声変換処理部に前置する、
ことを特徴とする請求項1に記載の音声合成装置。 - 前記データ入力部と前記テキスト解析部と前記韻律予測部と前記音声データベースと前記音声単位抽出部と前記波形接続部と前記音声変換処理部は、
一個のケース内に一体装備される、
ことを特徴とする請求項1に記載の音声合成装置。 - 前記波形接続部と前記音声変換処理部は、
他の機器に組込み搭載される組込みマイコンに一体装備し、
前記データ入力部と前記テキスト解析部と前記韻律予測部と前記音声データベースと前記音声単位抽出部は、
センター内パーソナルコンピュータに装備され、
前記組込みマイコンと当該センター内パーソナルコンピュータは、
同一ネットワーク上に別途設置され、
当該センター内パーソナルコンピューター内で前記データ入力部、前記テキスト解析部、前記韻律予測部、前記音声データベースに直結した前記音声単位抽出部を経て前記テキストデータから変換された前記音声素片波形データを、前記ネットワークを介して前記組込みマイコンの前記波形接続部に送信可能とし、当該組込みマイコンの前記音声変換処理部へ当該波形接続部から合成音声を受渡しするシステムに構築される、
ことを特徴とする請求項1に記載の音声合成装置。 - 前記音声合成装置は、
別途配置された任意のパーソナルコンピュータに前記データ入力部が接続されて、前記テキスト解析部にて解析する前記テキストデータを当該パーソナルコンピュータから取得可能に構成される一方、
前記音声変換処理部として別途配置された任意のスピーカに接続されて、前記波形接続部にて生成した前記合成音声データを当該スピーカにて音声出力可能に構成される、
ことを特徴とする請求項1に記載の音声合成装置。 - 前記所定の音声単位は、
音素、単語、フレーズ、シラブルのうちの1以上である、
ことを特徴とする請求項1に記載の音声合成装置。 - 前記データ入力部と前記テキスト解析部は、
初期設定時のみ使用のパーソナルコンピュータに装備してシリアルデータを入力し表音記号データを出力する初期設定機能をそれぞれ有し、
前記韻律予測部と前記音声データベースと前記音声単位抽出部と前記波形接続部と前記音声変換処理部は、
その他の機器に組込み搭載される組込みマイコンに装備し、
前記パーソナルコンピュータを当該組込みマイコンに初期設定時のみ接続して、当該パーソナルコンピュータから出力した前記表音記号データを当該組込みマイコンの前記韻律予測部に入力するとともに、前記音声データベースに予め設定記録しておき、当該組込みマイコンに入力したシリアルデータを当該韻律予測部と当該音声データベースに直結する前記音声単位抽出部と前記波形接続部と前記音声変換処理部を順次経てアナログ出力する機能を有する、
ことを特徴とする請求項1に記載の音声合成装置。 - 前記波形接続部と前記音声変換処理部は、
緊急警報用又は、案内、連絡用出力端末に組込みマイコンとして組込まれるとともに、
前記データ入力部と前記テキスト解析部と前記韻律予測部と前記音声データベースと前記音声単位抽出部は、
これら等を内蔵装備したセンター内パーソナルコンピュータとして、前記組込みマイコンとネットワークを介し一方向送信可能にシステム構築してなる、
ことを特徴とする請求項1に記載の音声合成装置。 - 前記韻律予測部と前記音声データベースと前記音声単位抽出部と前記波形接続部と前記音声変換処理部は、
前記データ入力部及び前記テキスト解析部と初期設定後切り離して玩具やその他の機器に組込みマイコンとして組み込まれてなる、
ことを特徴とする請求項1に記載の音声合成装置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2006511572A JP4884212B2 (ja) | 2004-03-29 | 2005-03-29 | 音声合成装置 |
Applications Claiming Priority (4)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2004094071 | 2004-03-29 | ||
JP2004094071 | 2004-03-29 | ||
JP2006511572A JP4884212B2 (ja) | 2004-03-29 | 2005-03-29 | 音声合成装置 |
PCT/JP2005/005815 WO2005093713A1 (ja) | 2004-03-29 | 2005-03-29 | 音声合成装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
JPWO2005093713A1 true JPWO2005093713A1 (ja) | 2008-07-31 |
JP4884212B2 JP4884212B2 (ja) | 2012-02-29 |
Family
ID=35056415
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2006511572A Expired - Fee Related JP4884212B2 (ja) | 2004-03-29 | 2005-03-29 | 音声合成装置 |
Country Status (3)
Country | Link |
---|---|
US (1) | US20070203703A1 (ja) |
JP (1) | JP4884212B2 (ja) |
WO (1) | WO2005093713A1 (ja) |
Families Citing this family (14)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20070203705A1 (en) * | 2005-12-30 | 2007-08-30 | Inci Ozkaragoz | Database storing syllables and sound units for use in text to speech synthesis system |
JP2007240988A (ja) * | 2006-03-09 | 2007-09-20 | Kenwood Corp | 音声合成装置、データベース、音声合成方法及びプログラム |
JP2007240987A (ja) * | 2006-03-09 | 2007-09-20 | Kenwood Corp | 音声合成装置、音声合成方法及びプログラム |
JP2007240989A (ja) * | 2006-03-09 | 2007-09-20 | Kenwood Corp | 音声合成装置、音声合成方法及びプログラム |
JP2007240990A (ja) * | 2006-03-09 | 2007-09-20 | Kenwood Corp | 音声合成装置、音声合成方法及びプログラム |
US8510113B1 (en) | 2006-08-31 | 2013-08-13 | At&T Intellectual Property Ii, L.P. | Method and system for enhancing a speech database |
EP2188729A1 (en) * | 2007-08-08 | 2010-05-26 | Lessac Technologies, Inc. | System-effected text annotation for expressive prosody in speech synthesis and recognition |
RU2421827C2 (ru) * | 2009-08-07 | 2011-06-20 | Общество с ограниченной ответственностью "Центр речевых технологий" | Способ синтеза речи |
TWI413105B (zh) * | 2010-12-30 | 2013-10-21 | Ind Tech Res Inst | 多語言之文字轉語音合成系統與方法 |
US10469623B2 (en) * | 2012-01-26 | 2019-11-05 | ZOOM International a.s. | Phrase labeling within spoken audio recordings |
JP6214435B2 (ja) * | 2014-03-12 | 2017-10-18 | 東京テレメッセージ株式会社 | 地域に設置された複数の屋外拡声器により音声メッセージを同報するシステムにおける聴き取りやすさの改善 |
US10192541B2 (en) * | 2014-06-05 | 2019-01-29 | Nuance Communications, Inc. | Systems and methods for generating speech of multiple styles from text |
JP6695069B2 (ja) * | 2016-05-31 | 2020-05-20 | パナソニックIpマネジメント株式会社 | 電話装置 |
CN110782871B (zh) | 2019-10-30 | 2020-10-30 | 百度在线网络技术(北京)有限公司 | 一种韵律停顿预测方法、装置以及电子设备 |
Citations (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH11143483A (ja) * | 1997-08-15 | 1999-05-28 | Hiroshi Kurita | 音声発生システム |
JP2000231395A (ja) * | 1999-02-08 | 2000-08-22 | Nippon Telegr & Teleph Corp <Ntt> | 音声合成方法及び装置 |
JP2001296878A (ja) * | 2000-04-14 | 2001-10-26 | Fujitsu Ltd | 音声合成用辞書作成装置及び方法 |
JP2002328694A (ja) * | 2001-03-02 | 2002-11-15 | Matsushita Electric Ind Co Ltd | 携帯端末装置及び読み上げシステム |
JP2003036089A (ja) * | 2001-07-24 | 2003-02-07 | Matsushita Electric Ind Co Ltd | テキスト音声合成方法とテキスト音声合成装置 |
JP2003114692A (ja) * | 2001-10-05 | 2003-04-18 | Toyota Motor Corp | 音源データの提供システム、端末、玩具、提供方法、プログラム、および媒体 |
JP2003186489A (ja) * | 2001-12-14 | 2003-07-04 | Omron Corp | 音声情報データベース作成システム,録音原稿作成装置および方法,録音管理装置および方法,ならびにラベリング装置および方法 |
WO2003065349A2 (en) * | 2002-01-29 | 2003-08-07 | Lessac Technology, Inc. | Text to speech |
JP2003223181A (ja) * | 2002-01-29 | 2003-08-08 | Yamaha Corp | 文字−音声変換装置およびそれを用いた携帯端末装置 |
JP2003271200A (ja) * | 2002-03-18 | 2003-09-25 | Matsushita Electric Ind Co Ltd | 音声合成方法および音声合成装置 |
Family Cites Families (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH1138989A (ja) * | 1997-07-14 | 1999-02-12 | Toshiba Corp | 音声合成装置及び方法 |
JP3450237B2 (ja) * | 1999-10-06 | 2003-09-22 | 株式会社アルカディア | 音声合成装置および方法 |
JP3728172B2 (ja) * | 2000-03-31 | 2005-12-21 | キヤノン株式会社 | 音声合成方法および装置 |
US20020156630A1 (en) * | 2001-03-02 | 2002-10-24 | Kazunori Hayashi | Reading system and information terminal |
-
2005
- 2005-03-29 WO PCT/JP2005/005815 patent/WO2005093713A1/ja active Application Filing
- 2005-03-29 JP JP2006511572A patent/JP4884212B2/ja not_active Expired - Fee Related
- 2005-03-29 US US10/592,071 patent/US20070203703A1/en not_active Abandoned
Patent Citations (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH11143483A (ja) * | 1997-08-15 | 1999-05-28 | Hiroshi Kurita | 音声発生システム |
JP2000231395A (ja) * | 1999-02-08 | 2000-08-22 | Nippon Telegr & Teleph Corp <Ntt> | 音声合成方法及び装置 |
JP2001296878A (ja) * | 2000-04-14 | 2001-10-26 | Fujitsu Ltd | 音声合成用辞書作成装置及び方法 |
JP2002328694A (ja) * | 2001-03-02 | 2002-11-15 | Matsushita Electric Ind Co Ltd | 携帯端末装置及び読み上げシステム |
JP2003036089A (ja) * | 2001-07-24 | 2003-02-07 | Matsushita Electric Ind Co Ltd | テキスト音声合成方法とテキスト音声合成装置 |
JP2003114692A (ja) * | 2001-10-05 | 2003-04-18 | Toyota Motor Corp | 音源データの提供システム、端末、玩具、提供方法、プログラム、および媒体 |
JP2003186489A (ja) * | 2001-12-14 | 2003-07-04 | Omron Corp | 音声情報データベース作成システム,録音原稿作成装置および方法,録音管理装置および方法,ならびにラベリング装置および方法 |
WO2003065349A2 (en) * | 2002-01-29 | 2003-08-07 | Lessac Technology, Inc. | Text to speech |
JP2003223181A (ja) * | 2002-01-29 | 2003-08-08 | Yamaha Corp | 文字−音声変換装置およびそれを用いた携帯端末装置 |
JP2005516262A (ja) * | 2002-01-29 | 2005-06-02 | レサック テクノロジー インコーポレイテッド | 音声合成 |
JP2003271200A (ja) * | 2002-03-18 | 2003-09-25 | Matsushita Electric Ind Co Ltd | 音声合成方法および音声合成装置 |
Also Published As
Publication number | Publication date |
---|---|
JP4884212B2 (ja) | 2012-02-29 |
WO2005093713A1 (ja) | 2005-10-06 |
US20070203703A1 (en) | 2007-08-30 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP4884212B2 (ja) | 音声合成装置 | |
KR102582291B1 (ko) | 감정 정보 기반의 음성 합성 방법 및 장치 | |
CN105788589B (zh) | 一种音频数据的处理方法及装置 | |
US5943648A (en) | Speech signal distribution system providing supplemental parameter associated data | |
Eide et al. | A corpus-based approach to< ahem/> expressive speech synthesis | |
US7596499B2 (en) | Multilingual text-to-speech system with limited resources | |
EP2704092A2 (en) | System for creating musical content using a client terminal | |
Kuligowska et al. | Speech synthesis systems: disadvantages and limitations | |
JP2002366186A (ja) | 音声合成方法及びそれを実施する音声合成装置 | |
CN101156196A (zh) | 混合语音合成器、方法和使用 | |
CN115249480A (zh) | 基于北斗短报文的语音文字的转换方法及相关装置 | |
JPH09171396A (ja) | 音声発生システム | |
JP3595041B2 (ja) | 音声合成システムおよび音声合成方法 | |
KR101097186B1 (ko) | 대화체 앞뒤 문장정보를 이용한 다국어 음성합성 시스템 및 방법 | |
Campbell | Evaluation of speech synthesis: from reading machines to talking machines | |
EP1271469A1 (en) | Method for generating personality patterns and for synthesizing speech | |
JP3706112B2 (ja) | 音声合成装置及びコンピュータプログラム | |
KR100806287B1 (ko) | 문말 억양 예측 방법 및 이를 기반으로 하는 음성합성 방법및 시스템 | |
JP4409279B2 (ja) | 音声合成装置及び音声合成プログラム | |
Damper | Speech technology—implications for biomedical engineering | |
Henton | Challenges and rewards in using parametric or concatenative speech synthesis | |
JP2003029774A (ja) | 音声波形辞書配信システム、音声波形辞書作成装置、及び音声合成端末装置 | |
JPH1152987A (ja) | 話者適応機能を持つ音声合成装置 | |
JP2020204683A (ja) | 電子出版物視聴覚システム、視聴覚用電子出版物作成プログラム、及び利用者端末用プログラム | |
JP3685648B2 (ja) | 音声合成方法及び音声合成装置、並びに音声合成装置を備えた電話機 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A821 Effective date: 20060927 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20061227 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20070302 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20100202 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20100405 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20101221 |
|
AA91 | Notification that invitation to amend document was cancelled |
Free format text: JAPANESE INTERMEDIATE CODE: A971091 Effective date: 20110118 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20110128 |
|
A601 | Written request for extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A601 Effective date: 20110329 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20110502 |
|
A602 | Written permission of extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A602 Effective date: 20110420 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20111130 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20111206 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20141216 Year of fee payment: 3 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
LAPS | Cancellation because of no payment of annual fees |