JP2003150185A - 音声合成システムとその方法及びそれを実現するためのプログラム - Google Patents

音声合成システムとその方法及びそれを実現するためのプログラム

Info

Publication number
JP2003150185A
JP2003150185A JP2001351626A JP2001351626A JP2003150185A JP 2003150185 A JP2003150185 A JP 2003150185A JP 2001351626 A JP2001351626 A JP 2001351626A JP 2001351626 A JP2001351626 A JP 2001351626A JP 2003150185 A JP2003150185 A JP 2003150185A
Authority
JP
Japan
Prior art keywords
voice
voice data
data
label
unit
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
JP2001351626A
Other languages
English (en)
Inventor
Nobuyuki Katae
伸之 片江
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP2001351626A priority Critical patent/JP2003150185A/ja
Publication of JP2003150185A publication Critical patent/JP2003150185A/ja
Withdrawn legal-status Critical Current

Links

Abstract

(57)【要約】 【課題】 既に存在する任意の音声データに基づいて所
望の合成音声を生成できる音声合成システム及び音声合
成方法を提供する。 【解決手段】 任意の音声データを含むデータの中か
ら、音声合成に用いる対象である発声者の音声データを
抽出し、少なくとも発声内容を示すラベル情報を付与
し、検索可能な形態に編集して保存する。音声合成の対
象となるテキストデータを入力し、音声ラベルに基づい
て、保存されている音声データの中から必要な音声デー
タを検索し、テキストデータを解析して、音声合成に必
要な音声データの音声ラベルを決定し、音声ラベルに基
づいて検索された音声データを用いて合成音声を生成す
る。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、特に音声合成シス
テムに用いることを意図しないで蓄積された音声データ
を用いる音声合成システム及び音声合成方法に関する。
【0002】
【従来の技術】昨今のCPU演算速度の急速な向上や、
ハードディスク等の記憶媒体における高密度化、高速化
の実現によって、大容量データの取り扱いが容易にな
り、大容量である音声データを取り扱うアプリケーショ
ンについても、その多くが実用段階に入りつつある。
【0003】かかるアプリケーションの中でも、任意の
テキストを読み上げる音声合成システムは、カーナビゲ
ーションシステム等の車載情報端末や電話自動応答シス
テム、音声ポータル等の多様なサービスにおいて、多く
の実用化が行われている。
【0004】一般に、従来の音声合成システムにおいて
は、音声合成を行う基幹モジュール(以後、「音声合成
エンジン」という。)が、一人の発声者が発声した大量
の音声波形、又はその特徴量が蓄積されているデータ
(以後、「音声データ」という。)から、音素や音節と
いった基準単位で音声データを検索し、希望する音声デ
ータを抽出する。そして、抽出された音声データを変換
したり、複数の音声データの接続を行うことによって、
入力されたテキストに対応した最適な合成音声を作成し
て、出力することになる。
【0005】ここで、合成音声を作成するための大量の
音声データについては、音声合成エンジンの開発者が、
所望する声種・声質のナレータやタレント等と独自に契
約することで、当該ナレータ等の音声を長時間に渡って
録音し、編集することにより作成しているのが現状であ
る。
【0006】
【発明が解決しようとする課題】しかしながら、従来の
音声合成エンジンにおいて、任意の文章を自然な合成音
声とするためには、大量の音声データが必要であり、当
該大量の音声データを用意するにあたって問題となるの
が、ナレータやタレント等を長時間拘束して音声収録を
行うための費用が多額になる点である。
【0007】また近年、聴取者が合成音声の聞き取りだ
けで発声者を特定できるような高度な音声合成技術も開
発されており、不特定多数の聴取者がその音声の発声者
を特定できるような著名人の合成音声があれば、様々な
アプリケーションやサービスへの提供が期待される。し
かしながら、特に著名人の場合には音声収録費用自体が
高額になることから、その声種を出力できる音声合成エ
ンジン、もしくはそのエンジンを使用したサービスを安
価に提供できない要因となっていた。
【0008】本発明は、上記問題点を解決するために、
既に存在する任意の音声データに基づいて所望の合成音
声を生成できる音声合成システム及び音声合成方法を提
供することを目的とする。
【0009】
【課題を解決するための手段】上記目的を達成するため
に本発明にかかる音声合成システムは、任意の音声デー
タを含むデータの中から、音声合成に用いる対象である
発声者の音声データを抽出する音声データ抽出部と、抽
出された音声データに、少なくとも発声内容を示すラベ
ル情報を付与し、検索可能な形態に編集する音声データ
編集部と、音声データ編集部において編集された音声デ
ータを保存する音声データ蓄積部と、音声合成の対象と
なるテキストデータを入力するテキスト入力部と、音声
ラベルに基づいて、音声データ蓄積部に保存されている
音声データの中から必要な音声データを検索する音声デ
ータ検索部と、テキストデータを解析して、音声合成に
必要な音声データの音声ラベルを決定し、音声ラベルに
基づいて音声データ検索部において検索された音声デー
タを用いて合成音声を生成する音声合成部と、生成され
た合成音声を出力する合成音声出力部を含むことを特徴
とする。
【0010】かかる構成により、他目的のために用意し
た録音データや生放送のデータ等から、音声合成のため
に必要とする音声データを抽出することができることか
ら、当初の目的以外に音声データを活用することがで
き、また、必要な音声データを取得するためにナレータ
等を長時間拘束する必要が無くなることから、安価に音
声合成エンジンを提供することが可能となる。
【0011】また、本発明にかかる音声合成システム
は、音声データを検索するための検索条件を入力する検
索条件入力部をさらに含み、音声データ検索部におい
て、音声ラベル及び検索条件に基づいて音声データを検
索することが好ましい。音声ラベル以外にも柔軟な検索
を行うことができるようにするためである。
【0012】また、本発明にかかる音声合成システム
は、検索条件が、音声合成部におけるテキストデータの
解析結果に基づいて生成されることが好ましい。文脈や
テキストデータの内容に応じて、的確な検索条件を定め
ることができるからである。
【0013】また、本発明にかかる音声合成システム
は、音声データ編集部において、ピッチ情報と発声速度
情報のいずれか一方、もしくは両方についてさらに付与
し、検索条件入力部において、音声ラベルが一致する複
数の音声データの中から必要な音声データを検索するた
めの条件としてピッチ情報と発声速度情報のいずれか一
方、もしくは両方を入力し、音声データ検索部におい
て、音声ラベル及び入力されたピッチ情報と発声速度情
報のいずれか一方、もしくは両方に基づいて、音声デー
タ蓄積部に保存されている音声データの中から必要な音
声データを検索することが好ましい。より品質の高い合
成音声を生成することができる音声データを検索するた
めである。
【0014】また、本発明にかかる音声合成システム
は、音声データ蓄積部において、発声者を特定するため
の検索条件の1つとして発声者の特徴を蓄積し、発声者
の特徴に基づいて、検索条件を入力することが好まし
い。より品質の高い合成音声を生成することができる音
声データを検索するためである。
【0015】また、本発明にかかる音声合成システム
は、音声データ編集部において、音声データ抽出部にお
いて抽出された音声データについて、音声認識を行う音
声認識部と、音声データ抽出部において抽出された音声
データについて、音声データの発声内容に応じてラベル
を付与する音声ラベル付与部とを含むことがより好まし
い。
【0016】また、本発明は、上記のような音声合成シ
ステムの機能をコンピュータの処理ステップとして実行
するソフトウェアを特徴とするものであり、具体的に
は、任意の音声データを含むデータの中から、音声合成
に用いる対象である発声者の音声データを抽出する工程
と、抽出された音声データに、少なくとも発声内容を示
すラベル情報を付与し、検索可能な形態に編集する工程
と、編集された音声データを保存する工程と、音声合成
の対象となるテキストデータを入力する工程と、音声ラ
ベルに基づいて、保存されている音声データの中から必
要な音声データを検索する工程と、テキストデータを解
析して、音声合成に必要な音声データの音声ラベルを決
定し、音声ラベルに基づいて検索された音声データを用
いて合成音声を生成する工程と、生成された合成音声を
出力する工程を含む音声合成方法並びにそのような工程
をコンピュータ実行可能な形態に表したプログラムであ
ることを特徴とする。
【0017】かかる構成により、コンピュータ上へ当該
プログラムをロードさせ実行することで、他目的のため
に用意した録音データから、音声合成のために必要とす
る音声データを抽出することができることから、当初の
目的以外に音声データを活用することができ、また、必
要な音声データを取得するためにナレータ等を長時間拘
束する必要が無くなることから、安価に音声合成エンジ
ンを提供することが可能となる。
【0018】
【発明の実施の形態】以下、本発明の実施の形態にかか
る音声合成システムについて、図面を参照しながら説明
する。図1は本発明の実施の形態にかかる音声合成シス
テムの構成図である。
【0019】図1において、11は、音声合成を行うの
に必要な音声データを検索するための検索条件入力部で
あり、検索すべき音声データの発話者あるいは発話者を
特定できる情報や、音声ラベル、発声の速度、あるいは
音声のピッチ等を指定して入力することになる。なお、
検索条件としては、これらに限定されるものではなく、
例えば「女性の声」や「誰々の声」というような発声者
の特徴を直接検索条件として用いることも考えられる。
この場合、これら発声者の特徴は音声データ蓄積部13
において検索条件の一つとして蓄積されている必要があ
る。
【0020】12は、検索条件入力部11で入力された
検索条件に基づいて、音声データが保存されている音声
データ蓄積部13を検索する音声データ検索部であり、
音声データ蓄積部13には、音声データのみならず、音
声データに付随する発声者あるいは発話者を特定できる
情報や、音声ラベル、発声の速度、あるいは音声のピッ
チ等の情報が、各々の音声データに対応して保存されて
いる。
【0021】14は音声データ検索部12で検索された
音声データに基づいて合成音声を生成する音声合成部で
あり、15は生成された合成音声を出力する合成音声出
力部を示している。
【0022】ここで、本実施の形態の特徴は、音声デー
タ蓄積部13に保存されている音声データ、及び当該音
声データに付随した発声者あるいは発話者を特定できる
情報や、音声ラベル、発声の速度、あるいは音声のピッ
チ等の情報を、一般の番組等における録音データや生放
送等の音声データを含んだデータ等の、本システムにお
ける合成音声用の音声データとして特に意識せずに収集
された音声データを含んだデータから生成する点にあ
る。
【0023】例えば、既存の番組等における録音データ
については、録音データ蓄積部16に保存しておき、生
放送等の音声データを含んだデータについては、特に保
存しておく必要性はない。なお、録音データ蓄積部16
に保存されている録音データや生放送等の音声データを
含んだデータには、複数の発声者の音声が含まれていた
り、効果音や音楽等の非音声データも含まれているのが
通常である。
【0024】そこで、音声合成に用いることができる音
声データのみを抽出するために、音声データ抽出部17
においては、録音データ蓄積部16に保存されている録
音データや生放送等の音声データを含んだデータから、
音声合成用データとする発声者の音声データのみを対象
として抽出することになる。抽出された音声データ自体
は、音声データ蓄積部13に保存することになる。
【0025】また、抽出された音声データについて、音
声合成用として検索可能な形態へと編集するために音声
データ編集部18を設けている。図2は、本発明の実施
の形態にかかる音声合成システムにおける音声データ編
集部18の構成例示図である。図2において、181は
音声認識部を、182は認識結果確認部を、183は音
声ラベル付与部を、それぞれ示している。
【0026】まず、音声データ抽出部17において抽出
された音声データは、音声認識部181によって内容が
認識される。具体的には、発声内容をテキストデータに
より表示することになる。
【0027】また、仮に音声認識部181における認識
精度が低い場合には、音声認識部181における認識結
果が正しいか否かを確認する認識結果確認部182を設
けることも考えられる。例えば、認識結果確認部182
においては、出力された音声を聞いて、認識結果と照会
することによって、認識結果が正しいか否かを確認し、
正しければ以降の処理を行い、正しくなければ再度音声
認識処理を行う、あるいは直接テキストデータを修正す
る等の処理を行うことになる。なお、正しいか否かを判
断するのは、音声データの編集者であり、音声合成シス
テムの使用者に限定されるものではない。
【0028】そして、音声認識結果に対して、音声ラベ
ル付与部183において、音声データ各々に対応する音
声ラベルを付与することになる。ここで、ラベルとは、
発声内容記述とその音声データ上での開始点と終了点で
あり、文、フレーズ、単語、音節、音素等、いくつかの
レベルが考えられる。本実施の形態においては、音節と
音素を例にとって説明する。
【0029】例えば、「コンピューターを、」と発声し
た音声データは、「コ」「ン」「ピュー」「ター」
「オ」という音節で構成されているが、音声データ上で
それぞれの音節の開始点と終了点を記述したものが音声
ラベルとなる。
【0030】また、音素をラベルとする場合には、
「k」、「o」、「n」、「py」、「u:」、「t」、
「a:」、「o」のそれぞれの音素の開始点と終了点を記
述することになる。音声データ蓄積部13に格納されて
いる音声データの一例を図3に示す。
【0031】図3(a)に示すような音声データを、図
3(b)では音節に基づいた音声ラベルとしてラベル付
けを行っており、図3(c)では音素に基づいた音声ラ
ベルとしてラベル付けを行っている。そして、各々の音
声ラベルには順序付けも行われており、順序の若い順に
選択されることになる。
【0032】なお、音声ラベルとしては、特にこれらに
限定されるものではなく、合成音声に用いる要素として
選択可能となる形態で有りさえすれば、どのような音声
ラベルを用いても良い。
【0033】次に、合成音声として出力したい音声ラベ
ルを特定するために、テキスト入力部19において、音
声出力の対象となるテキストデータを入力する。かかる
テキストデータについては、音声合成部14において解
析され、音声データとして検索の対象となる音声ラベル
を特定することになる。特定された音声ラベルは検索条
件入力部11から検索条件の1つとして入力されること
になる。
【0034】さらに、このように保存されている音声デ
ータから、合成音声の素材として意図している音声デー
タを検索するために、検索条件入力部11においては、
以下のような条件を入力することになる。例えば、「こ
んにちは」という音声を合成するために「コン」という
音声データが必要だとすれば、発声者を「KT」とし
て、(発声者:KT)、及び(音声ラベル:「コン」)
という検索条件を入力することになる。
【0035】検索条件を受け取った音声データ検索部1
2では、音声データ蓄積部13を検索して、該当する音
声データを合成音声用音声データとして検索実施者に提
供することになる。
【0036】また、検索条件入力部11において、検索
条件として発声者と音声ラベルの他に、発声速度やピッ
チ周波数等を指定することも考えられる。例えば、(発
声者:KT)、(音声ラベル:「コン」)、(発声速
度:8音節/秒)、(声の高さ:ピッチ周波数150H
z)というように検索条件を入力することにより、より
きめ細かな検索を行うことができ、合成音声の品質向上
に寄与するものと考えられる。
【0037】この場合、音声データ蓄積部13において
保存される音声データのデータ項目に、新たな項目とし
て「発声速度」や「音声ピッチ」等の項目を追加してお
く必要があることは言うまでもない。
【0038】また、検索条件として、発声速度やピッチ
周波数等を指定された場合であっても、音声データ蓄積
部13において保存される音声データにおける当該項目
にデータ自体が存在しない場合、すなわち空き項目であ
る場合には、当該検索条件に該当する音声データではな
いものと判断される。
【0039】なお、本実施の形態においては、発声速度
として「音節/秒」という単位を使用し、声の高さとし
て「ピッチ周波数」で単位を「Hz」としているが、特
にこれらに限定されるものではなく、他の適切な指定方
法をとってもよい。
【0040】また、発声者の特徴を音声データ蓄積部1
3に蓄積する方法についても様々な方法が考えられる。
例えば1つの方法として、発声者の音声データ群を1つ
のグループとし、発声者の特徴を付加する方法が考えら
れる。こうすることで、発声者ごとに発声者名や性別等
の発声者の特徴を示す情報と発声者の音声ラベルの付随
した音声データを音声データ蓄積部13に保存すること
ができる。
【0041】また、音声データを発声者ごとにグループ
分けせず、音声データ単位に、音声ラベルと音声ラベル
ごとに付与される発声者の特徴を付加する方法も考えら
れる。ただし、特にこれらの方法に限定されるものでは
ない。
【0042】次に、本発明の実施の形態にかかる音声合
成システムを実現するプログラムの処理の流れについて
説明する。図4に本発明の実施の形態にかかる音声合成
システムを実現するプログラムにおける音声データ蓄積
処理の流れ図を示す。
【0043】図4において、まず一般の録音データから
音声データのみを抽出する(ステップS401)。そし
て、抽出された音声データについて音声認識を行う(ス
テップS402)。
【0044】認識結果の妥当性を判断する場合には、認
識結果が妥当であるものと確認できた場合にのみ(ステ
ップS403:Yes)、音声ラベル及び発話者ID等
を付与し、その後音声データとともに保存することにな
る(ステップS404)。
【0045】次に、図5に本発明の実施の形態にかかる
音声合成システムを実現するプログラムにおける音声合
成処理の流れ図を示す。
【0046】図5において、音声合成を行うべき対象と
なるテキストデータを入力し(ステップS501)、当
該テキストデータを解析することによって検索対象とな
る音声データの音声ラベルを特定する(ステップS50
2)。次に、意図している合成音声に近づけるために、
音声ラベル及びそれ以外の検索条件を入力して(ステッ
プS503)、入力された検索条件に基づいて当該音声
ラベルを有する音声データを検索する(ステップS50
4)。最後に、検索条件に合致した音声データを用いる
ことによって合成音声を生成して(ステップS50
5)、出力することになる(ステップS506)。
【0047】以上のように本実施の形態によれば、他目
的のために用意した録音データや生放送データ等から、
音声合成のために必要とする音声データを抽出すること
ができることから、当初の目的以外に音声データを活用
することができ、また必要な音声データを取得するため
にナレータ等を長時間拘束する必要が無くなり、安価に
音声合成エンジンを提供することが可能となる。
【0048】なお、本発明の実施の形態にかかる音声合
成システムを実現するプログラムは、図6に示すよう
に、CD−ROM62−1やフレキシブルディスク62
−2等の可搬型記録媒体62だけでなく、通信回線の先
に備えられた他の記憶装置61や、コンピュータ63の
ハードディスクやRAM等の記録媒体64のいずれに記
憶されるものであっても良く、プログラム実行時には、
プログラムはローディングされ、主メモリ上で実行され
る。
【0049】また、本発明の実施の形態にかかる音声合
成システムにより生成された検索用音声データ等につい
ても、図6に示すように、CD−ROM62−1やフレ
キシブルディスク62−2等の可搬型記録媒体62だけ
でなく、通信回線の先に備えられた他の記憶装置61
や、コンピュータ63のハードディスクやRAM等の記
録媒体64のいずれでも良く、例えば本発明にかかる音
声合成システムを利用する際にコンピュータ63により
読み取られる。
【0050】
【発明の効果】以上のように本発明にかかる音声合成シ
ステムによれば、他目的のために用意した録音データか
ら、音声合成のために必要とする音声データを抽出する
ことができることから、当初の目的以外に音声データを
活用することができ、また、必要な音声データを取得す
るためにナレータ等を長時間拘束する必要が無くなるこ
とから、安価に音声合成エンジンを提供することが可能
となる。
【図面の簡単な説明】
【図1】 本発明の実施の形態にかかる音声合成システ
ムの構成図
【図2】 本発明の実施の形態にかかる音声合成システ
ムにおける音声データ編集部の構成図
【図3】 本発明の実施の形態にかかる音声合成システ
ムにおける音声データ蓄積部のデータ構成例示図
【図4】 本発明の実施の形態にかかる音声合成システ
ムにおける処理の流れ図
【図5】 本発明の実施の形態にかかる音声合成システ
ムにおける処理の流れ図
【図6】 コンピュータ環境の例示図
【符号の説明】
11 検索条件入力部 12 音声データ検索部 13 音声データ蓄積部 14 音声合成部 15 合成音声出力部 16 録音データ蓄積部 17 音声データ抽出部 18 音声データ編集部 19 テキスト入力部 61 回線先の記憶装置 62 CD−ROMやフレキシブルディスク等の可搬型
記録媒体 62−1 CD−ROM 62−2 フレキシブルディスク 63 コンピュータ 64 コンピュータ上のRAM/ハードディスク等の記
録媒体 181 音声認識部 182 認識結果確認部 183 音声ラベル付与部

Claims (8)

    【特許請求の範囲】
  1. 【請求項1】 任意の音声データを含むデータの中か
    ら、音声合成に用いる対象である発声者の音声データを
    抽出する音声データ抽出部と、 抽出された前記音声データに、少なくとも発声内容を示
    すラベル情報を付与し、検索可能な形態に編集する音声
    データ編集部と、 前記音声データ編集部において編集された前記音声デー
    タを保存する音声データ蓄積部と、 音声合成の対象となるテキストデータを入力するテキス
    ト入力部と、 音声ラベルに基づいて、前記音声データ蓄積部に保存さ
    れている前記音声データの中から必要な前記音声データ
    を検索する音声データ検索部と、 前記テキストデータを解析して、音声合成に必要な前記
    音声データの音声ラベルを決定し、前記音声ラベルに基
    づいて前記音声データ検索部において検索された前記音
    声データを用いて合成音声を生成する音声合成部と、 生成された前記合成音声を出力する合成音声出力部を含
    むことを特徴とする音声合成システム。
  2. 【請求項2】 前記音声データを検索するための検索条
    件を入力する検索条件入力部をさらに含み、 前記音声データ検索部において、前記音声ラベル及び前
    記検索条件に基づいて前記音声データを検索する請求項
    1記載の音声合成システム。
  3. 【請求項3】 前記検索条件が、前記音声合成部におけ
    る前記テキストデータの解析結果に基づいて生成される
    請求項2記載の音声合成システム。
  4. 【請求項4】 前記音声データ編集部において、ピッチ
    情報と発声速度情報のいずれか一方、もしくは両方につ
    いてさらに付与し、 検索条件入力部において、音声ラベルが一致する複数の
    前記音声データの中から必要な前記音声データを検索す
    るための条件として前記ピッチ情報と前記発声速度情報
    のいずれか一方、もしくは両方を入力し、 前記音声データ検索部において、前記音声ラベル及び入
    力された前記ピッチ情報と発声速度情報のいずれか一
    方、もしくは両方に基づいて、前記音声データ蓄積部に
    保存されている前記音声データの中から必要な前記音声
    データを検索する請求項2又は3記載の音声合成システ
    ム。
  5. 【請求項5】 前記音声データ蓄積部において、発声者
    を特定するための前記検索条件の1つとして発声者の特
    徴を蓄積し、前記発声者の特徴に基づいて、前記検索条
    件を入力する請求項2から4のいずれか一項に記載の音
    声合成システム。
  6. 【請求項6】 前記音声データ編集部において、 前記音声データ抽出部において抽出された前記音声デー
    タについて、音声認識を行う音声認識部と、 前記音声データ抽出部において抽出された前記音声デー
    タについて、前記音声データの発声内容に応じてラベル
    を付与する音声ラベル付与部とを含む請求項1記載の音
    声合成システム。
  7. 【請求項7】 任意の音声データを含むデータの中か
    ら、音声合成に用いる対象である発声者の音声データを
    抽出する工程と、 抽出された前記音声データに、少なくとも発声内容を示
    すラベル情報を付与し、検索可能な形態に編集する工程
    と、 編集された前記音声データを保存する工程と、 音声合成の対象となるテキストデータを入力する工程
    と、 音声ラベルに基づいて、保存されている前記音声データ
    の中から必要な前記音声データを検索する工程と、 前記テキストデータを解析して、音声合成に必要な前記
    音声データの音声ラベルを決定し、前記音声ラベルに基
    づいて検索された前記音声データを用いて合成音声を生
    成する工程と、 生成された前記合成音声を出力する工程を含むことを特
    徴とする音声合成方法。
  8. 【請求項8】 任意の音声データを含むデータの中か
    ら、音声合成に用いる対象である発声者の音声データを
    抽出するステップと、 抽出された前記音声データに、少なくとも発声内容を示
    すラベル情報を付与し、検索可能な形態に編集するステ
    ップと、 編集された前記音声データを保存するステップと、 音声合成の対象となるテキストデータを入力するステッ
    プと、 音声ラベルに基づいて、保存されている前記音声データ
    の中から必要な前記音声データを検索するステップと、 前記テキストデータを解析して、音声合成に必要な前記
    音声データの音声ラベルを決定し、前記音声ラベルに基
    づいて検索された前記音声データを用いて合成音声を生
    成するステップと、 生成された前記合成音声を出力するステップを含むこと
    を特徴とする音声合成方法を具現化したコンピュータ実
    行可能なプログラム。
JP2001351626A 2001-11-16 2001-11-16 音声合成システムとその方法及びそれを実現するためのプログラム Withdrawn JP2003150185A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2001351626A JP2003150185A (ja) 2001-11-16 2001-11-16 音声合成システムとその方法及びそれを実現するためのプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2001351626A JP2003150185A (ja) 2001-11-16 2001-11-16 音声合成システムとその方法及びそれを実現するためのプログラム

Publications (1)

Publication Number Publication Date
JP2003150185A true JP2003150185A (ja) 2003-05-23

Family

ID=19163913

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2001351626A Withdrawn JP2003150185A (ja) 2001-11-16 2001-11-16 音声合成システムとその方法及びそれを実現するためのプログラム

Country Status (1)

Country Link
JP (1) JP2003150185A (ja)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007286198A (ja) * 2006-04-13 2007-11-01 Toyota Motor Corp 音声合成出力装置
CN111639484A (zh) * 2020-05-15 2020-09-08 北京青牛技术股份有限公司 坐席通话内容的分析方法
CN112349273A (zh) * 2020-11-05 2021-02-09 携程计算机技术(上海)有限公司 基于说话人的语音合成方法、模型训练方法及相关设备
CN112735377A (zh) * 2020-12-28 2021-04-30 平安科技(深圳)有限公司 语音合成方法、装置、终端设备及存储介质

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007286198A (ja) * 2006-04-13 2007-11-01 Toyota Motor Corp 音声合成出力装置
CN111639484A (zh) * 2020-05-15 2020-09-08 北京青牛技术股份有限公司 坐席通话内容的分析方法
CN112349273A (zh) * 2020-11-05 2021-02-09 携程计算机技术(上海)有限公司 基于说话人的语音合成方法、模型训练方法及相关设备
CN112735377A (zh) * 2020-12-28 2021-04-30 平安科技(深圳)有限公司 语音合成方法、装置、终端设备及存储介质
CN112735377B (zh) * 2020-12-28 2024-01-02 平安科技(深圳)有限公司 语音合成方法、装置、终端设备及存储介质

Similar Documents

Publication Publication Date Title
JP5697860B2 (ja) 情報検索装置,情報検索方法及びナビゲーションシステム
EP1693829B1 (en) Voice-controlled data system
EP2252995B1 (en) Method and apparatus for voice searching for stored content using uniterm discovery
US8719028B2 (en) Information processing apparatus and text-to-speech method
JPH10274997A (ja) 文書読み上げ装置
US8019605B2 (en) Reducing recording time when constructing a concatenative TTS voice using a reduced script and pre-recorded speech assets
CN111445892B (zh) 歌曲生成方法、装置、可读介质及电子设备
US20090254349A1 (en) Speech synthesizer
US7177800B2 (en) Method and device for the processing of speech information
EP1403852A1 (en) Voice activated music playback system
JPH117296A (ja) 電子回路を有する記憶媒体と該記憶媒体を有する音声合成装置
JP4697432B2 (ja) 音楽再生装置、音楽再生方法及び音楽再生用プログラム
JP2003150185A (ja) 音声合成システムとその方法及びそれを実現するためのプログラム
JP2002311986A (ja) ナビゲーション装置
EP1632932B1 (en) Voice response system, voice response method, voice server, voice file processing method, program and recording medium
JP2013061591A (ja) 音声合成装置、音声合成方法およびプログラム
JP5713782B2 (ja) 情報処理装置、情報処理方法及びプログラム
JPH10173769A (ja) 音声メッセージ検索装置
JP2010048959A (ja) 音声出力システム及び車載装置
JP4286583B2 (ja) 波形辞書作成支援システムおよびプログラム
KR102376552B1 (ko) 음성 합성 장치 및 음성 합성 방법
JP2004294577A (ja) 文字情報音声変換方法
JP5246512B2 (ja) 音声読み上げシステム、および音声読み上げ端末
JP2009204872A (ja) 音声認識用辞書生成システム
JP5431817B2 (ja) 楽曲データベース更新装置及び楽曲データベース更新方法

Legal Events

Date Code Title Description
A300 Application deemed to be withdrawn because no request for examination was validly filed

Free format text: JAPANESE INTERMEDIATE CODE: A300

Effective date: 20050201