JP2006126413A - 音声合成装置、音声合成方法及び音声合成プログラム - Google Patents
音声合成装置、音声合成方法及び音声合成プログラム Download PDFInfo
- Publication number
- JP2006126413A JP2006126413A JP2004313621A JP2004313621A JP2006126413A JP 2006126413 A JP2006126413 A JP 2006126413A JP 2004313621 A JP2004313621 A JP 2004313621A JP 2004313621 A JP2004313621 A JP 2004313621A JP 2006126413 A JP2006126413 A JP 2006126413A
- Authority
- JP
- Japan
- Prior art keywords
- speech
- sub
- cost
- text
- prosodic
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Landscapes
- Machine Translation (AREA)
Abstract
【解決手段】 テキスト分類部40が、入力テキストを所定のカテゴリに割り当て、サブコスト重み決定部50が、このカテゴリに対応するサブコスト重みを決定する。また、音韻韻律抽出部60が、入力テキストの読み情報及び韻律情報を抽出し、これらの組をキーとして、音声データベースメモリ20から、これらの組の類似範囲に属する読み情報及び韻律情報の組を選択する。次に、サブコスト算出部80が、入力テキストの読み情報及び韻律情報の組と、選択された読み情報及び韻律情報の組とを用い、サブコスト値を算出し、総合コスト計算部90が、これをサブコスト重みで重み付け統合した総合コスト値を算出する。そして、音声素片選択部100が、総合コスト値を最小値化する音声素片を選択し、音声素片接続部110が、これらを接続して合成音声を生成する。
【選択図】 図1
Description
この方法では、まず、音声デー夕ベースから、合成したい文字列に対応する音韻系列と部分的または完全に一致する音声素片をバイナリーツリー等で構成された音声素片辞書を用いて検索する。次に、音声素片の類似度を評価するための複数のパラメータに基づく評価尺度に従って、検索された多数の音声素片にコスト付けを行う。そして、DP(Dynamic Programming:動的計画法)等の方法によって、これらの音声素片の中から適切な音声素片の組み合わせを選択し、選択された音声素片を順に接続することで音声合成を行う(例えば、非特許文献2参照)。
すなわち、音声データベースを大容量化することで、ある程度の合成音声の品質は向上されてきたものの、時間的・費用的な問題から音声デー夕ベースに収録可能な音声情報の量には限界がある。そのため、事実上、日本語として想定できる全ての音声素片を音声デー夕ベースに収録しておくことは不可能である。
その結果、これにより決定される重み付けは、平均的なテキスト或いは音声データベースに多く収録されているような一般的な分野のテキストの合成に適したものとなる。従って、専門分野や音声デー夕ベースに収録されていないような分野のテキストを合成した場合には、音声デー夕ベースから最適な音声素片を選択することができず、より高品質な合成音声を生成できる可能性がありながら実際に合成された音声の品質は低いという課題が存在した。
<構成>
図1は、本形態における音声合成装置1の概念的な構成図の例示である。
この図に例示するように、音声合成装置1は、入力部5、テキストメモリ10、音声データベースメモリ20、メモリ30、テキスト分類部40、サブコスト重み決定部50、音韻韻律抽出部60、探索部70、サブコスト算出部80、総合コスト計算部90、音声素片選択部100、音声素片接続部110及び制御部120を有している。
なお、本形態の音声合成装置1は、例えば、CPU(Central Processing Unit)、RAM(Random Access Memory)、ハードディスク装置等から構成される公知のコンピュータに所定のプログラム(音声合成プログラム)を実行させることにより構成されるものである。
次に、本形態の音声合成方法における前処理について説明する。
[音声データベース]
まず、音声データベースメモリ20に、音声合成に必要な音声素片等を有する音声データベースを格納する。
図2は、本形態における音声データベース200のデータ構成の例示である。
図2に例示するように、この例の音声データベース200は、音韻列221(「読み情報」に相当)、韻律情報222及び音声素片データ(デジタル信号データであり「音声素片」に相当)が対応付けられて構成される。
韻律情報222は、韻律指標222aと韻律物理パラメータ222bから構成される。ここで、韻律指標222aは、対応する音声素片の韻律の大まかな指標を示すデータであり、この例では、前音韻環境222aa、後音韻環境222ab及びアクセント222acが韻律指標222aに相当する。また、この例の前音韻環境222aaとは、対応する音韻列221に対し時系列的に前の音韻を示すデータであり、この例ではポーズ(無音状態)を示す「#」が設定されている。さらに、この例の後音韻環境222abとは、対応する音韻列221に対し時系列的に後の音韻を示すデータであり、この例ではポーズ(無音状態)を示す「#」や音韻を示す「S」「G」「N」「T」「R」等が設定されている。また、この例のアクセント222acとは、対応する音韻列221にアクセントがあるか、あるとすればどこにアクセントがあるかを示すデータである。この例では、「0」は対応する音韻列221にアクセントがないことを示し、「1」は対応する音韻列221の一音目にアクセントがあり、「2」は2音目にアクセントがあることを示している。
[サブコスト対応表]
本形態では、メモリ30のサブコスト対応表格納領域32にサブコスト対応表を格納しておく。
この例のサブコスト対応表300は、テキストのカテゴリとサブコストとを対応付けた表である。図3の例のサブコスト対応表300は、N個のカテゴリ1〜NのカテゴリとM個のサブコストA〜Mとに対し、サブコスト重みを対応付けた表である。
この例の場合、「カテゴリ1」に対し、「サブコストA」「サブコストB」…「サブコストC」のサブコスト重み「W1A」「W1B」…「W1M」が対応付けられ、「カテゴリ2」に対し、「サブコストA」「サブコストB」…「サブコストC」のサブコスト重み「W2A」「W2B」…「W2M」が対応付けられ、「カテゴリN」に対し、「サブコストA」「サブコストB」…「サブコストC」のサブコスト重み「WNA」「WNB」…「WNM」が対応付けられている。
[サブコスト対応表の生成手法]
サブコスト対応表300のカテゴリは、例えば、テキスト分類部40が実行する手順(後述)によって、所定のテキストを、単一の分類基準或いは複数の分類基準をもとに設定された予備的なカテゴリに割り当て、当該テキストが複数の当該予備的なカテゴリに割り当てられることとなった場合に、当該複数の予備的なカテゴリを1つのカテゴリに統合するという処理により決定する。
すなわち、上述のようにカテゴリを決定した後、大量のテキストコーパスを新たに設定したカテゴリで分類し(後述)、カテゴリ毎に複数のテキスト抽出して、まずは初期値として適当なサブコスト重みでそれらのテキストに対応する合成音声を作成し聴取して品質を確認する。後はカテゴリ毎に適宜サブコスト値を調整しながら合成音の作成、聴取を繰り返すことで適切なサブコストを割り出し、各カテゴリに対応する各サブコストのサブコスト重みを決定する。以上により、サブコスト対応表300が作成される。
合成音声を生成しようとするテキストを入力部5に入力し、この入力されたテキストをテキストメモリ10に格納しておく。
<音声合成処理>
次に、本形態における音声合成処理について説明する。なお、以下の処理は制御部120の制御のもと行われる。
[処理の概要]
まず、テキスト分類部40において(図1)、入力テキストが少なくとも1つ以上のカテゴリに分類される。次に、サブコスト重み決定部50で、分類されたカテゴリに基づいてサブコスト重み係数が決定される。また、音韻韻律抽出部60のテキスト解析部61において、入力テキストから読み情報と韻律指標を取得し、韻律物理パラメータ抽出部62で、この韻律指標から韻律物理パラメータが計算される。次に、探索部70で、読み情報及び韻律指標に対応する音声素片が探索された後、サブコスト算出部80及び総合コスト計算部90で、音韻韻律抽出部60が抽出した読み情報及び韻律物理パラメー夕と、音声素片に対応する読み情報及び韻律物理パラメータとから、サブコスト関数及びサブコスト重み係数を用いて総合コストが計算される。そして最後に音声素片選択部100及び音声素片接続部110で、計算された総合コスト値に基づいて音声素片を選択・接続することで音声が合成される。
図4は、本形態における音声合成処理を説明するための流れ図である。
以下、この図に従って、本形態の音声合成処理の詳細を説明する。
まず、テキスト分類部40が、テキストメモリ10からテキスト(「入力されたテキスト」に相当)を読み出し(ステップS1)、この内容に基づいて、当該テキストを、予め決められたカテゴリのうちの少なくとも1つのカテゴリに割り当てる(ステップS2)。なお、この「予め決められたカテゴリ」は、前述したサブコスト対応表300のカテゴリである。また、このテキストを予め決めておいたカテゴリヘ分類する方法は、これまで様々な方法が提案されてきたが、例えば、Joachims, T. "Text Categorization with Support Vector Machines: Learning with Many Relevant Features", Proc. of 10th European Conference on Machine Learning (ECML-98), pp.137-142(1998)を基本とした特願平11−191064「テキスト分類学習方法及び装置及びテキスト分類学習プログラムを格納した記憶媒体」や、特願2002−204434「テキストの多重トピックス抽出方法および装置、テキストの多量トピックス抽出プログラム、ならびに該プログラムを記録した記録媒体」などの方法により、比較的良好に分類することが可能である。
次に、サブコスト重み決定部50が、カテゴリ情報格納領域31からカテゴリ情報を読み出し、このカテゴリ情報をもとにサブコスト対応表格納領域32のサブコスト対応表300(図3)を参照し、テキストが割り当てられたカテゴリに対応するサブコスト重みを決定する(ステップS3)。
[入力されたテキストが1つのカテゴリのみに割り当てられた場合]
この場合は、割り当てられた1つのカテゴリに対応するサブコスト重みをそのまま利用し、そのサブコスト重みを示すサブコスト重み情報をサブコスト重み情報格納領域33に格納する。例えば、図3における「カテゴリ1」が割り当てられた場合には、サブコスト対応表300において、「カテゴリ1」に対応付けられた「サブコストA」「サブコストB」…「サブコストC」のサブコスト重み「W1A」「W1B」…「W1M」が特定され、これらの情報がサブコスト重み情報格納領域33に格納する。
この場合は、これら複数のカテゴリに対応する予備サブコスト重みをそれぞれ決定し、当該予備サブコスト重みを、入力されたテキストと各カテゴリとの類似度(尤度を含む)をもとに重み付けして合計(サブコスト重みの重み付け和)し、この合計値を、カテゴリに対応するサブコスト重みとして決定する。
[サブコスト関数]
以下にこの例のサブコスト関数を示す。
(1)読み情報に対応するサブコスト関数
C1(n)=1/en
ただし、入力テキストの読み情報としての音韻系列と、音声素片の読み情報しての音韻系列(音声素片データに対応付けられた音韻系列)との間で一致する音韻数をnとする。
C2(Vp,Vs)=|Vp−Vs|2
ただし、入力テキストから抽出した音韻物理パラメータの平均ピッチをVpとし、音声素片の平均ピッチ(音声素片データに対応付けられた平均F0)をVsとする。
(3)ピッチ傾きに対するサブコスト関数
C3(Fp,Fs)=|Fp−Fs|2
ただし、入力テキストから抽出した音韻物理パラメータのピッチ傾きをFpとし、音声素片のピッチ傾き(音声素片データに対応付けられたF0の傾斜)をFsとする。
C4(Tp,Ts)=|Tp−Ts|2
ただし、入力テキストから抽出した音韻物理パラメータの時間長をTpとし、音声素片の時間長(音声素片データに対応付けられた時間長)をTsとする。
(5)振幅に対するサブコスト関数
C5(Ap,As)=|Ap−As|2
ただし、入力テキストから抽出した音韻物理パラメータの振幅をApとし、音声素片の時間長(音声素片データに対応付けられたパワー)をAsとする。
次に、総合コスト計算部90が、メモリ30のサブコスト重み情報格納領域33からステップS3で算出されたサブコスト重み情報を読み出し、サブコスト格納領域36からステップS8で算出された各サブコストを読み出し、これらを用いて、サブコスト値をサブコスト重みで重み付けして統合した総合コスト値を算出し、メモリ30の総合コスト格納領域37に格納する(ステップS9)。
[総合コスト]
(6)Ω=ω2・C2+ω3・C3+ω4・C4+ω5・C5を算出する。
(7) ω1・C1+(1−ω1)・Ωを算出する。
(8)総合コストPnew=(1+G)・Pを算出する。
なお、C1,C2,C3,C4,C5は、ステップS8で、サブコスト関数C1(n),C2(Vp,Vs),C3(Fp,Fs),C4(Tp,Ts),C5(Ap,As)に、それぞれn,Vp,Vs,Fp,Fs,Tp,Ts,Ap,Asを代入して算出されたサブコストを示す。また、ω1,ω2,ω3,ω4,ω5は、サブコストC1,C2,C3,C4,C5のサブコスト重みを示す。さらにGは音響的な定数を示す。
次に、音声素片選択部100が、メモリ30の総合コスト格納領域37から、ステップS9で格納された総合コストを抽出し、その最小値を求める。なお、この最小値の算出は、一般的なDP法を用いることで容易に実現可能である。そして、音声素片選択部100は、求めた最小の総合コストに対応付けられている音声素片データ(「総合コスト値を最小値化する音声素片」に相当)を総合コスト格納領域37から読み出し(「選択」に相当)、それをメモリ30の選択音声素片格納領域38に格納する(ステップS10)。
ステップS12では、音声素片接続部110が、メモリ30の選択音声素片格納領域38から各音声素片データ(「音声素片選択手段が選択した音声素片」に相当)を読み出し、これらを順に接続して合成音声を生成して出力する(ステップS12)。
<本形態の特徴>
以上のように、本形態では、入力されたテキストを、その内容に応じて予め決めておいたテキストカテゴリの少なくともどれか1つに分類し、そのカテゴリに基づいてサブコスト関数に対する重み付けであるサブコスト重みを変更し、結果として音声素片の選択において基本となる総合コストの計算方法を変更することとした。これにより、テキストの内容に応じた最適な合成音声を生成することが可能となる。
図5は、本形態における音声合成装置400をノイマン型のコンピュータで実現する場合のブロック図である。
この図に例示するように、この例の音声合成装置400は、入力部410、出力部420、CPU430、RAM440、ROM450、ハードディスク装置460及びこれらを通信可能に接続するバス470を有している。
入力部410は、例えば、テキストデータ等の入力を受け付けるUSB(Universal Serial Bus)等のインタフェース或いはキーボード、マウス、タッチパネル等の入力デバイスである。また出力部420は、例えば、生成された合成音声データを出力するUSB等のインタフェース或いはスピーカ等の音声出力装置である。
ここで、音声合成プログラム462は、上述した図4の処理を実行するアプリケーションソフトウェアである、また、音声データベース463は、図2の音声データベース200と同様のデータベースであり、サブコスト対応表464は、図3のサブコスト対応表300と同様なデータである。また、テキスト情報465は、入力部410から入力された合成音声が生成されるテキストである。
また、前述の各処理内容を記述した音声合成プログラム462は、コンピュータで読み取り可能な記録媒体に記録しておくことができる。コンピュータで読み取り可能な記録媒体としては、例えば、磁気記録装置、光ディスク、光磁気記録媒体、半導体メモリ等どのようなものでもよいが、具体的には、例えば、磁気記録装置として、ハードディスク装置、フレキシブルディスク、磁気テープ等を、光ディスクとして、DVD(Digital Versatile Disc)、DVD−RAM(Random Access Memory)、CD−ROM(Compact Disc Read Only Memory)、CD−R(Recordable)/RW(ReWritable)等を、光磁気記録媒体として、MO(Magneto-Optical disc)等を、半導体メモリとしてEEP−ROM(Electronically Erasable and Programmable-Read Only Memory)等を用いることができる。
このようなプログラムを実行するコンピュータ(音声合成装置400)は、例えば、まず、可搬型記録媒体に記録されたプログラムもしくはサーバコンピュータから転送されたプログラムをハードディスク装置460に格納し、それに沿った処理を上述のように実行することとなるが、このプログラムの別の実行形態として、コンピュータが可搬型記録媒体から直接プログラムを読み取り、そのプログラムに従った処理を実行することとしてもよく、さらに、このコンピュータにサーバコンピュータからプログラムが転送されるたびに、逐次、受け取ったプログラムに従った処理を実行することとしてもよい。また、サーバコンピュータから、このコンピュータへのプログラムの転送は行わず、その実行指示と結果取得のみによって処理機能を実現する、いわゆるASP(Application Service Provider)型のサービスによって、上述の処理を実行する構成としてもよい。なお、本形態におけるプログラムには、電子計算機による処理の用に供する情報であってプログラムに準ずるもの(コンピュータに対する直接の指令ではないがコンピュータの処理を規定する性質を有するデータ等)を含むものとする。
なお、本発明は上述の実施の形態に限定されるものではない。例えば、本形態では、ステップS7の音声素片データの探索に音韻指標を用い、ステップS8のサブコストの算出に音韻物理パラメータを用いることとしたが、ステップS7の音声素片データの探索に音韻物理パラメータ(「韻律情報」に相当)を用いることとしてもよく、また、ステップS8のサブコストの算出に音韻指標(「韻律情報」に相当)を用いることとしてもよい。
また、上述の各種の処理は、記載に従って時系列に実行されるのみならず、処理を実行する装置の処理能力あるいは必要に応じて並列的にあるいは個別に実行されてもよい。また、処理ループの構成も説明したものに限定されない。
その他、本発明の趣旨を逸脱しない範囲で適宜変更が可能であることはいうまでもない。
20 音声データベースメモリ
40 テキスト分類部
50 サブコスト重み決定部
60 音韻韻律抽出部
61 テキスト解析部
62 音韻物理パラメータ抽出部
70 探索部
80 サブコスト算出部
90 総合コスト計算部
100 音声素片選択部
Claims (7)
- 入力されたテキストに対応して、音声データベースから適切な音声素片を選択し合成する音声合成装置において、
音声素片、その読み情報及び韻律情報を対応付けた音声データベースを格納する音声データベースメモリと、
入力されたテキストの内容に基づいて、当該テキストを、予め決められたカテゴリのうちの少なくとも1つのカテゴリに割り当てるテキスト分類手段と、
前記テキストが割り当てられた前記カテゴリに対応するサブコスト重みを決定するサブコスト重み決定手段と、
前記入力されたテキストの読み情報及び韻律情報を抽出する音韻韻律抽出手段と、
前記入力されたテキストの読み情報及び韻律情報の組をキーとして前記音声データベースを探索し、当該音声データベースから、これらの組の類似範囲に属する読み情報及び韻律情報の組を選択する探索手段と、
前記入力されたテキストの読み情報及び韻律情報の組と、前記探索手段において選択された読み情報及び韻律情報の組とを用い、これらの音韻及び韻律要素ごとの類似度を示すサブコスト値を算出するサブコスト算出手段と、
前記サブコスト値を前記サブコスト重みで重み付けして統合した総合コスト値を算出する総合コスト計算手段と、
前記総合コスト値を最小値化する前記音声素片を選択する音声素片選択手段と、
前記音声素片選択手段が選択した前記音声素片を接続する音声素片接続手段と、
を有することを特徴とする音声合成装置。 - 請求項1記載の音声合成装置であって、
前記音声データベースの韻律情報は、
対応する音声素片の韻律の指標である韻律指標と、韻律の物理量である韻律物理パラメータと、によって構成され、
前記音韻韻律抽出手段が前記入力されたテキストから抽出する韻律情報は、
韻律指標及び韻律物理パラメータであり、
前記探索手段は、
前記入力されたテキストの読み情報及び韻律指標をキーとして前記音声データベースを探索し、当該音声データベースから、これらの組の類似範囲に属する読み情報及び韻律情報の組を選択する手段であり、
前記サブコスト算出手段がサブコスト値の算出に用いる韻律情報は、
韻律物理パラメータである、
ことを特徴とする音声合成装置。 - 請求項1記載の音声合成装置であって、
前記予め決められたカテゴリは、
単一の分類基準をもとに分類されたカテゴリであり、
前記テキスト分類手段は、
前記入力されたテキストを、いずれか1つのカテゴリに割り当てる手段であり、
前記サブコスト重み決定手段は、
前記テキストが割り当てられた1つのカテゴリに対応するサブコスト重みを決定する手段である、
ことを特徴とする音声合成装置。 - 請求項1記載の音声合成装置であって、
前記予め決められたカテゴリは、
複数の分類基準をもとに分類されたカテゴリであり、
前記サブコスト重み決定手段は、
前記入力されたテキストが1つのカテゴリのみに割り当てられた場合、この1つのカテゴリに対応するサブコスト重みを決定し、
前記入力されたテキストが複数のカテゴリに割り当てられた場合、これら複数のカテゴリに対応する予備サブコスト重みをそれぞれ決定し、当該予備サブコスト重みを、前記入力されたテキストと前記各カテゴリとの類似度をもとに重み付けして合計し、この合計値を、前記カテゴリに対応するサブコスト重みとして決定する手段である、
ことを特徴とする音声合成装置。 - 請求項1記載の音声合成装置であって、
前記予め決められたカテゴリは、
前記テキスト分類手段が実行する手順によって所定のテキストを予備的なカテゴリに割り当て、当該テキストが複数の当該予備的なカテゴリに割り当てられることとなった場合に、当該複数の予備的なカテゴリを1つのカテゴリに統合して生成されたカテゴリを有する、
ことを特徴とする音声合成装置。 - 入力されたテキストに対応して、音声データベースから適切な音声素片を選択し合成する音声合成方法において、
音声データベースメモリに、音声素片、その読み情報及び韻律情報を対応付けた音声データベースを格納しておき、
テキスト分類手段が、入力されたテキストの内容に基づいて、当該テキストを、予め決められたカテゴリのうちの少なくとも1つのカテゴリに割り当て、
サブコスト重み決定手段が、前記テキストが割り当てられた前記カテゴリに対応するサブコスト重みを決定し、
音韻韻律抽出手段が、前記入力されたテキストの読み情報及び韻律情報を抽出し、
探索手段が、前記入力されたテキストの読み情報及び韻律情報の組をキーとして前記音声データベースを探索し、当該音声データベースから、これらの組の類似範囲に属する読み情報及び韻律情報の組を選択し、
前記サブコスト算出手段が、前記入力されたテキストの読み情報及び韻律情報の組と、前記探索手段において選択された読み情報及び韻律情報の組とを用い、これらの音韻及び韻律要素ごとの類似度を示すサブコスト値を算出し、
総合コスト計算手段が、前記サブコスト値を前記サブコスト重みで重み付けして統合した総合コスト値を算出し、
音声素片選択手段が、前記総合コスト値を最小値化する前記音声素片を選択し、
音声素片接続手段が、前記音声素片選択手段が選択した前記音声素片を接続する、
ことを特徴とする音声合成方法。 - 請求項1から5の何れかに記載の音声合成装置としてコンピュータを機能させるための音声合成プログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2004313621A JP4441380B2 (ja) | 2004-10-28 | 2004-10-28 | 音声合成装置、音声合成方法及び音声合成プログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2004313621A JP4441380B2 (ja) | 2004-10-28 | 2004-10-28 | 音声合成装置、音声合成方法及び音声合成プログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2006126413A true JP2006126413A (ja) | 2006-05-18 |
JP4441380B2 JP4441380B2 (ja) | 2010-03-31 |
Family
ID=36721245
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2004313621A Expired - Fee Related JP4441380B2 (ja) | 2004-10-28 | 2004-10-28 | 音声合成装置、音声合成方法及び音声合成プログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP4441380B2 (ja) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20200004175A (ko) * | 2018-07-03 | 2020-01-13 | 주식회사 한글과컴퓨터 | 선택적 음성 모델의 적용이 가능한 텍스트 음성 변환 장치 및 그 동작 방법 |
KR20200004176A (ko) * | 2018-07-03 | 2020-01-13 | 주식회사 한글과컴퓨터 | 선택적 음성 모델의 적용에 기초한 번역 기능을 제공하는 텍스트 음성 변환 장치 및 그 동작 방법 |
-
2004
- 2004-10-28 JP JP2004313621A patent/JP4441380B2/ja not_active Expired - Fee Related
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20200004175A (ko) * | 2018-07-03 | 2020-01-13 | 주식회사 한글과컴퓨터 | 선택적 음성 모델의 적용이 가능한 텍스트 음성 변환 장치 및 그 동작 방법 |
KR20200004176A (ko) * | 2018-07-03 | 2020-01-13 | 주식회사 한글과컴퓨터 | 선택적 음성 모델의 적용에 기초한 번역 기능을 제공하는 텍스트 음성 변환 장치 및 그 동작 방법 |
KR102107445B1 (ko) * | 2018-07-03 | 2020-06-02 | 주식회사 한글과컴퓨터 | 선택적 음성 모델의 적용이 가능한 텍스트 음성 변환 장치 및 그 동작 방법 |
KR102107447B1 (ko) * | 2018-07-03 | 2020-06-02 | 주식회사 한글과컴퓨터 | 선택적 음성 모델의 적용에 기초한 번역 기능을 제공하는 텍스트 음성 변환 장치 및 그 동작 방법 |
Also Published As
Publication number | Publication date |
---|---|
JP4441380B2 (ja) | 2010-03-31 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US10991360B2 (en) | System and method for generating customized text-to-speech voices | |
US10453442B2 (en) | Methods employing phase state analysis for use in speech synthesis and recognition | |
JP2007249212A (ja) | テキスト音声合成のための方法、コンピュータプログラム及びプロセッサ | |
US20030154081A1 (en) | Objective measure for estimating mean opinion score of synthesized speech | |
US8626510B2 (en) | Speech synthesizing device, computer program product, and method | |
JP2002530703A (ja) | 音声波形の連結を用いる音声合成 | |
JPH1083277A (ja) | 連結型読み上げシステム及びテキストを音声に変換する方法 | |
US9798653B1 (en) | Methods, apparatus and data structure for cross-language speech adaptation | |
CN1787072B (zh) | 基于韵律模型和参数选音的语音合成方法 | |
Lorenzo-Trueba et al. | Simple4all proposals for the albayzin evaluations in speech synthesis | |
JP4247289B1 (ja) | 音声合成装置、音声合成方法およびそのプログラム | |
JP4441380B2 (ja) | 音声合成装置、音声合成方法及び音声合成プログラム | |
Raghavendra et al. | A multilingual screen reader in Indian languages | |
JP4607660B2 (ja) | 楽曲検索装置および楽曲検索方法 | |
JP2013164609A (ja) | 歌唱合成用データベース生成装置、およびピッチカーブ生成装置 | |
JP5875504B2 (ja) | はなし言葉分析装置とその方法とプログラム | |
JP5020759B2 (ja) | 種々の音声合成装置のための素片データベース生成装置、方法及びプログラム | |
JPH10254471A (ja) | 音声合成装置 | |
JP5020763B2 (ja) | 音声合成のための決定木を生成する装置、方法及びプログラム | |
EP1589524B1 (en) | Method and device for speech synthesis | |
JP4607659B2 (ja) | 楽曲検索装置および楽曲検索方法 | |
JP4787769B2 (ja) | F0値時系列生成装置、その方法、そのプログラム、及びその記録媒体 | |
JP5155836B2 (ja) | 収録テキスト生成装置、その方法、そのプログラム | |
JP3881970B2 (ja) | 知覚試験用音声データセット作成装置、コンピュータプログラム、音声合成用サブコスト関数の最適化装置、及び音声合成装置 | |
JP4787686B2 (ja) | テキスト選択装置、その方法、そのプログラム、及びその記録媒体 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
RD03 | Notification of appointment of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7423 Effective date: 20061219 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20070126 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20091125 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20091222 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20100108 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130115 Year of fee payment: 3 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 4441380 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
S531 | Written request for registration of change of domicile |
Free format text: JAPANESE INTERMEDIATE CODE: R313531 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
LAPS | Cancellation because of no payment of annual fees |