JP4741208B2 - 音声合成用読み上げテキストデータ選択プログラムおよび音声合成用読み上げテキストデータ選択装置 - Google Patents

音声合成用読み上げテキストデータ選択プログラムおよび音声合成用読み上げテキストデータ選択装置 Download PDF

Info

Publication number
JP4741208B2
JP4741208B2 JP2004213332A JP2004213332A JP4741208B2 JP 4741208 B2 JP4741208 B2 JP 4741208B2 JP 2004213332 A JP2004213332 A JP 2004213332A JP 2004213332 A JP2004213332 A JP 2004213332A JP 4741208 B2 JP4741208 B2 JP 4741208B2
Authority
JP
Japan
Prior art keywords
text data
data
speech
text
reading
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2004213332A
Other languages
English (en)
Other versions
JP2006030892A (ja
Inventor
寛之 世木
健 小早川
徹 都木
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Japan Broadcasting Corp
Original Assignee
Japan Broadcasting Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Japan Broadcasting Corp filed Critical Japan Broadcasting Corp
Priority to JP2004213332A priority Critical patent/JP4741208B2/ja
Publication of JP2006030892A publication Critical patent/JP2006030892A/ja
Application granted granted Critical
Publication of JP4741208B2 publication Critical patent/JP4741208B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Description

本発明は、音声合成に用いる音声合成用データベースを作成する際に、必要となる最小限の読み上げテキストデータを、予め用意しておいた読み上げテキストデータの中から選択する音声合成用読み上げテキストデータ選択プログラムおよび音声合成用読み上げテキストデータ選択装置に関する。
従来、音声合成に用いる様々な音(音声データ)を集めた音声合成用データベースを作成する際に、様々な音を読み上げるためのテキストデータ(読み上げテキストデータ)を選択する方法として、例えば、「集合被覆問題における貪欲近似アルゴリズム」(非特許文献1参照)を用いた方法を利用することができる。
この「集合被覆問題における貪欲近似アルゴリズム」を用いた方法において、集合被覆問題(set−covering problem)のある事例(X,F)は、有限集合X(有限個数の要素(構成要素、元)xからなるもの)と、この有限集合Xの部分集合Sの族F(部分集合Sのグループ、部分集合Sが属しているもの)とからなる。また、有限集合Xの各要素xは、族Fにグループ化された(族Fに属している)少なくとも1つの部分集合Sに含まれる。つまり、部分集合S∈F(族Fに属している部分集合S)は、要素xを覆っている(覆う[covers])と言える。そして、この集合被覆問題とは、有限集合Xの全ての要素xを覆う最小のサイズの族C⊆F(族Fに含まれる族C)を見つけることである。
また、貪欲近似アルゴリズム(Greedy−Set−Cover)とは、集合被覆問題のある事例(X,F)において、最小サイズの族Cを見つけていく段階で、まだ、覆われていない要素xを最も多く覆う部分集合Sから先に選択していくことである。
すなわち、「集合被覆問題における貪欲近似アルゴリズム」を用いた方法は、要素(構成要素、この場合、音声データ)xを最も多く含む部分集合S(この場合、読み上げテキストデータ)から順に選択していくというアルゴリズムである。
アルゴリズムイントロダクション第3巻、近代科学社、T.コルメン他著、pp313−317
しかしながら、従来の「集合被覆問題における貪欲近似アルゴリズム」を用いた方法では、構成要素(音声データ)を最も多く含む部分集合(読み上げテキストデータ)を見つけるために、1つの部分集合(読み上げテキストデータ)を選択するたびに、構成要素(音声データ)数の再計算およびソート処理をしなければならず、処理時間がかかるという問題がある。
また、従来の「集合被覆問題における貪欲近似アルゴリズム」を用いた方法では、構成要素(音声データ)数のソート処理を実行するために、各部分集合(読み上げテキストデータ)に含まれる構成要素(音声データ)をメモリー上に展開する必要があるため、部分集合(読み上げテキストデータ)が大きくなると、膨大なメモリーの容量を確保することが困難になるという問題がある。
そこで、本発明では、前記した問題を解決し、部分集合である読み上げテキストデータを選択するたびに、構成要素である音声データ数の再計算やソート処理を実行する必要がなく、処理時間を短縮することができ、音声データを展開するメモリーの容量を抑制することができる音声合成用読み上げテキストデータ選択プログラムおよび音声合成用読み上げテキストデータ選択装置を提供することを目的とする。
前記課題を解決するため、請求項1記載の音声合成用読み上げテキストデータ選択プログラムは、音声合成する際に合成単位となる音声データ単位を予め設定した回数含む読み上げテキストデータを選択するために、前記音声データが登録されている音声データ単位辞書を備えたコンピュータを、読み上げテキストデータ入力手段、読み上げテキストデータ分割手段、音声データ単位カウント手段、読み上げテキストデータ選択手段、選択読み上げテキストデータ出力手段、として機能させる構成とした。
かかる構成によれば、音声合成用読み上げテキストデータ選択プログラムは、読み上げテキストデータ入力手段によって、読み上げテキストデータを入力し、この入力された読み上げテキストデータを、読み上げテキストデータ分割手段によって、音声データ単位辞書に登録されている音声データ単位に分割する。音声データ単位辞書は、集合被覆問題における貪欲近似アルゴリズムにおける部分集合に該当する読み上げテキストデータを、当該アルゴリズムの要素に該当する音声データ単位に分割するために、様々な音(音声データ)について、予め設定した分割単位が多数収められているものである。
続いて、音声合成用読み上げテキストデータ選択プログラムは、音声データ単位カウント手段によって、読み上げテキストデータに含まれている音声データ単位の数を計数し(カウントし)、この音声データ単位カウント手段で計数されたカウント値が、初期処理時においては、カウント値の最大値として予め設定した回数より大きく、それ以降においては、それまでに計数されたカウント値の中で最大値以上であるときは、この音声データ単位カウント手段で計数されたカウント値が計数された読み上げテキストデータを選択し、それまでに計数されたカウント値に当該カウント値を置き換える。ここでは、単純に音声データの数が最も多い読み上げテキストデータを残していく。つまり、音声データ単位の数が読み上げテキストデータ毎にカウントされ、カウントされた音声データ単位の数が現時点で最大値以上であれば、この音声データ単位の数が最大値以上になった読み上げテキストデータが選択されることになる。ただし、音声データ単位カウント手段では、音声データ単位の数が、予め設定された回数以上、すでに含まれている音声データ単位については、カウントしない。つまり、音声データ単位カウント手段は、読み上げテキストデータの中に、予め設定された回数以上、読み上げテキストデータ選択手段で選択された読み上げテキストデータにすでに含まれている音声データ単位があるときは、当該音声データ単位を計数しない。
そして、音声合成用読み上げテキストデータ選択プログラムは、選択読み上げテキストデータ出力手段によって、読み上げテキストデータ選択手段で選択された読み上げテキストデータを、選択読み上げテキストデータ(音声合成用読み上げテキストデータ)として出力する。
請求項2に記載の音声合成用読み上げテキストデータ選択装置は、音声合成する際に合成単位となる音声データ単位を予め設定した回数含む読み上げテキストデータを選択する音声合成用読み上げテキストデータ選択装置であって、音声データ単位辞書と、テキストデータ入力手段と、読み上げテキストデータ分割手段と、音声データ単位カウント手段と、読み上げテキストデータ選択手段と、選択読み上げテキストデータ出力手段と、を備える構成とした。
かかる構成によれば、音声合成用読み上げテキストデータ選択装置は、読み上げテキストデータ入力手段によって、読み上げテキストデータを入力し、この入力された読み上げテキストデータを、読み上げテキストデータ分割手段によって、音声単位辞書に登録されている音声データ単位に分割する。続いて、音声合成用読み上げテキストデータ選択装置は、音声データ単位カウント手段によって、読み上げテキストデータに含まれている音声データ単位の数を計数し(カウントし)、この音声データ単位カウント手段で計数されたカウント値が、初期処理時においては、カウント値の最大値として予め設定した回数より大きく、それ以降においては、それまでに計数されたカウント値の中で最大値以上であるときは、読み上げテキストデータ選択手段によって、この音声データ単位カウント手段で計数されたカウント値が計数された読み上げテキストデータを選択し、それまでに計数されたカウント値に当該カウント値を置き換える。そして、音声合成用読み上げテキストデータ選択装置は、選択読み上げテキストデータ出力手段によって、読み上げテキストデータ選択手段で選択された読み上げテキストデータを、選択読み上げテキストデータ(音声合成用読み上げテキストデータ)として出力する。このとき、音声データ単位カウント手段は、読み上げテキストデータの中に、予め設定された回数以上、読み上げテキストデータ選択手段で選択された読み上げテキストデータにすでに含まれている音声データ単位があるときは、当該音声データ単位を計数しない。
請求項1または2記載の発明によれば、入力された読み上げテキストデータを音声データ単位に分割する際に、1つ1つの読み上げテキストデータをメモリ等に展開したまま保持せずに、音声データ単位の数が最大値の読み上げテキストデータを逐次選択していくことで、読み上げテキストデータを選択するたびに、音声データ数の再計算やソート処理を実行する必要がなく、処理時間を短縮することができ、音声データを展開するメモリーの容量を抑制することができる。
次に、本発明の実施形態について、適宜、図面を参照しながら詳細に説明する。
〈音声合成用読み上げテキストデータ選択装置の構成〉
図1は、音声合成用読み上げテキストデータ選択装置のブロック図である。この図1に示すように、音声合成用読み上げテキストデータ選択装置1は、無作為に収集した読み上げテキストデータを入力すると、音声合成用データベース(図示せず)を作成するのに、最小限のデータ量となる選択読み上げテキストデータ(音声合成用読み上げテキストデータ)を出力するもので、読み上げテキストデータ入力手段3と、読み上げテキストデータ分割手段5と、音声データ単位辞書記憶手段7と、音声データ単位カウント手段9と、読み上げテキストデータ選択手段11と、選択読み上げテキストデータ出力手段13とを備えている。
読み上げテキストデータ入力手段3は、当該装置1の外部から任意数の読み上げテキストデータを入力するものである。この読み上げテキストデータは、音声合成装置(図示せず)に備えられる音声合成用データベース(図示せず)に蓄積させる音声データの「読み」に関するデータである。
例えば、ニュース原稿を読み上げる合成音を、音声合成装置(図示せず)で音声合成する場合には読み上げテキストデータは、ニュース原稿が主体となる。また、主に株価等の数値を読み上げる合成音を、音声合成装置(図示せず)で音声合成する場合には読み上げテキストデータは、数値に関するものが主体となる。
読み上げテキストデータ分割手段5は、読み上げテキストデータ入力手段3で入力された読み上げテキストデータを、音声データ単位辞書記憶手段7に記憶されている音声データ単位辞書を参照して分割するものである。この読み上げテキストデータ分割手段5は、音声データ単位辞書に登録(収録)されている音声データ単位に、読み上げテキストデータを分割し、分割した結果を、音声データ単位カウント手段9に出力するものである。
音声データ単位辞書記憶手段7は、ハードディスク等の記憶媒体によって構成されており、音声データ単位辞書を記憶しているものである。この音声データ単位辞書は、音声データを予め設定した単位で区切った音声データ単位を収録しているものとする。
音声データ単位カウント手段9は、読み上げテキストデータ分割手段5で読み上げテキストデータが音声データ単位に分割された数をカウントするものである。ただし、音声データ単位の数が、予め設定した回数以上、すでに含まれている音声データ単位についてはカウントしない。この音声データ単位カウント手段9でカウントされたカウント値は、読み上げテキストデータ選択手段11に出力される。
読み上げテキストデータ選択手段11は、音声データ単位カウント手段9でカウントされた音声データ単位の数(カウント値)がそれまでに入力されたカウント値の中で、最大値以上であれば、このカウント値がカウントされた読み上げテキストデータを選択するものである。なお、この実施形態では、読み上げテキストデータ選択手段11によって選択される読み上げテキストデータに含まれる音声データ単位の回数(予め設定した回数)を初めは「1」(任意数)としている。音声データ単位カウント手段9でカウントされたカウント値が、予め設定した回数「1」より大きくなった場合は、その設定した回数をカウント値に置き換える。
選択読み上げテキストデータ出力手段13は、読み上げテキストデータ選択手段11で選択された読み上げテキストデータを、選択読み上げテキストデータ(音声合成用読み上げテキストデータ)として出力するものである。
ここで、音声合成用読み上げテキストデータ選択装置1の具体的な処理について、入力される読み上げテキストデータを例示して説明する。
例えば、「九十九」から「一」までの数字を一つずつ小さくなるように列べたもの(九十九、九十八、九十七、・・・、三、二、一)が、読み上げテキストデータとして、読み上げテキストデータ入力手段3に入力され、且つ、音声データ単位辞書記憶手段7には、「一」、「二」、「三」、「四」、「五」、「六」、「七」、「八」、「九」、「十」、「二十」、「三十」、「四十」、「五十」、「六十」、「七十」、「八十」、「九十」が音声データ単位として登録されている場合について説明する。
そして、この音声合成用読み上げテキストデータ選択装置1では、音声データ単位が1回含まれていれば、入力された読み上げテキストデータを、選択読み上げテキストデータとして選択するものとしている。
まず、一番初めに入力される読み上げテキストデータ「九十九」は、読み上げテキストデータ分割手段5で分割されて音声データ単位カウント手段9でカウントされた結果、音声データ単位として「九十」と「九」との2つが含まれていることが判明する。この結果、読み上げテキストデータ選択手段11によって選択される。
次に、二番目に入力される読み上げテキストデータ「九十八」は、読み上げテキストデータ分割手段5で分割されて音声データ単位カウント手段9でカウントされた結果、音声データ単位として「九十」と「八」との2つが含まれていることが判明する。しかし、すでに、「九十」は選択されているので、カウントしたカウント値は「八」の1つだけとされ、「九十九」よりもカウント値が少ないので、読み上げテキストデータ選択手段11によって選択されない。さらに、「九十七」から「八十九」までは、同様の理由で(カウント値が1になってしまうので)、読み上げテキストデータ選択手段11によって選択されない。
そして、読み上げテキストデータ「八十八」は音声データ単位「八十」と「八」との二つが含まれていると判明するので、読み上げテキストデータ選択手段11によって選択される。以降、「七十七」、「六十六」、「五十五」、「四十四」、「三十三」、「二十二」、「十一」が読み上げテキストデータ選択手段11によって選択されることになる。そして、選択読み上げテキストデータとして「十一」が選択読み上げテキストデータ出力手段13から出力された時点で、当該装置1の動作が終了する。つまり、「十一」を選択した時点で音声データ単位辞書記憶手段7に記憶されている音声データ単位辞書に含まれている音声データ単位が選択読み上げテキストデータに全て含まれていることになる。
なお、この例では、音声データ単位辞書記憶手段7には、前後の音素環境を考慮していない「桁」(数値列)を用いているが、前後の音素環境を考慮した音素であるトライフォンや、前後の桁を考慮した桁等の音性データ単位を用いれば、天気予報でよく使用されるフレーズ「くもり」、「はれ」、「になるでしょう。」等を音声合成する際に利用する、音声合成用データベースを作成するための音声合成用読み上げテキストデータを選択することも可能である。
〈音声合成用読み上げテキストデータ選択装置の動作〉
次に、図2に示すフローチャートを参照して、音声合成用読み上げテキストデータ選択装置1の動作を説明する(適宜、図1参照)。
まず、音声合成用読み上げテキストデータ選択装置1は、読み上げテキストデータを読み上げテキストデータ入力手段3によって入力し(ステップS1)、音声データ単位辞書記憶手段7に記憶されている音声データ単位辞書を参照して、読み上げテキストデータ分割手段5によって、入力された読み上げテキストデータを音声データ単位に分割する(ステップS2)。
続いて、音声合成用読み上げテキストデータ選択装置1は、音声データ単位カウント手段9によって、読み上げテキストデータ分割手段5で分割された音声データ単位の数を計数(カウント)し(ステップS3)、読み上げテキストデータ選択手段11によって、音声データ単位の数に基づいて、読み上げテキストデータ(音声データ単位の数であるカウント値が最大値以上のもの)を選択する(ステップS4)。
そして、音声合成用読み上げテキストデータ選択装置1は、選択読み上げテキストデータ出力手段13によって、読み上げテキストデータ選択手段11で選択された読み上げテキストデータを、選択読み上げテキストデータ(音声合成用読み上げテキストデータ)として外部に出力する(ステップS5)。
なお、音声合成用読み上げテキストデータ選択装置1は、選択された読み上げテキストデータに含まれる全ての音声データ単位の個数(数)が予め設定した回数より大きいか否かを判定し(ステップS6)、大きいと判定されなかった場合(ステップS6、No)には1文章に含まれる音声データの単位の最大値を1にして(ステップS7)、ステップS1に戻る。また、大きいと判定された場合(ステップS6、Yes)には動作を終了する。
音声合成用読み上げテキストデータ選択装置1によれば、読み上げテキストデータ入力手段3によって、読み上げテキストデータが入力され、この入力された読み上げテキストデータが、読み上げテキストデータ分割手段5によって、音声データ単位辞書記憶手段7に記憶される音声データ単位辞書に登録されている音声データ単位に分割される。続いて、音声データ単位カウント手段9によって、読み上げテキストデータに含まれている音声データ単位の数がカウントされ、このカウントされた音声データ単位の数に基づいて、読み上げテキストデータ選択手段11によって、読み上げテキストデータ(音声データ単位の数であるカウント値が最大値以上のもの)が選択される。そして、選択読み上げテキストデータ出力手段13によって、読み上げテキストデータ選択手段11で選択された読み上げテキストデータが、選択読み上げテキストデータ(音声合成用読み上げテキストデータ)として出力される。
このため、入力された読み上げテキストデータを音声データ単位に分割する際に、1つ1つの読み上げテキストデータをメモリ等に展開したまま保持せずに、音声データ単位の数が最大値の読み上げテキストデータを逐次選択していくことで、読み上げテキストデータを選択するたびに、音声データ数の再計算やソート処理を実行する必要がなく、処理時間を短縮することができ、音声データを展開するメモリーの容量を抑制することができる。
なお、この音声合成用読み上げテキストデータ選択装置1を使用して、読み上げテキストデータを選択した場合、例えば、数値等を読み上げる読み上げテキストデータの場合、1億個もの読み上げテキストデータを二千個程度の読み上げテキストデータに減少させることができた。
以上、本発明の実施形態について説明したが、本発明は前記実施形態には限定されない。例えば、本実施形態では、音声合成用読み上げテキストデータ選択装置1として説明したが、当該装置1の各構成の処理を汎用的または特殊なコンピュータ言語で記述した音声合成用読み上げテキストデータ選択プログラムとすることも可能である。この場合、当該装置1と同様の効果を得ることができる。
本発明の実施形態に係る音声合成用読み上げテキストデータ選択装置のブロック図である。 図1に示した音声合成用読み上げテキストデータ選択装置の動作を説明したフローチャートである。
符号の説明
1 音声合成用読み上げテキストデータ選択装置
3 読み上げテキストデータ入力手段
5 読み上げテキストデータ分割手段
7 音声データ単位辞書記憶手段
9 音声データ単位カウント手段
11 読み上げテキストデータ選択手段
13 選択読み上げテキストデータ出力手段

Claims (2)

  1. 音声合成する際に合成単位となる音声データ単位を予め設定した回数含む読み上げテキストデータを選択するために、前記音声データが登録されている音声データ単位辞書を備えたコンピュータを、
    前記読み上げテキストデータを入力する読み上げテキストデータ入力手段、
    この読み上げテキストデータ入力手段で入力された読み上げテキストデータを、前記音声データ単位辞書に登録されている音声データ単位に分割する読み上げテキストデータ分割手段、
    この読み上げテキストデータ分割手段で分割された読み上げテキストデータに含まれている前記音声データ単位を計数する音声データ単位カウント手段、
    この音声データ単位カウント手段で計数されたカウント値が、初期処理時においては、カウント値の最大値として予め設定した回数より大きく、それ以降においては、それまでに計数されたカウント値の中で最大値以上であるときは、この音声データ単位カウント手段で計数されたカウント値が計数された読み上げテキストデータを選択し、前記それまでに計数されたカウント値に当該カウント値を置き換える読み上げテキストデータ選択手段、
    この読み上げテキストデータ選択手段で選択された読み上げテキストデータを、選択読み上げテキストデータとして出力する選択読み上げテキストデータ出力手段、
    として機能させ、
    前記音声データ単位カウント手段は、
    前記読み上げテキストデータの中に、前記予め設定された回数以上、前記読み上げテキストデータ選択手段で選択された読み上げテキストデータにすでに含まれている前記音声データ単位があるときは、当該音声データ単位を計数しない
    ことを特徴とする音声合成用読み上げテキストデータ選択プログラム。
  2. 音声合成する際に合成単位となる音声データ単位を予め設定した回数含む読み上げテキストデータを選択する音声合成用読み上げテキストデータ選択装置であって、
    前記音声データが登録されている音声データ単位辞書と、
    前記読み上げテキストデータを入力する読み上げテキストデータ入力手段と、
    この読み上げテキストデータ入力手段で入力された読み上げテキストデータを、前記音声データ単位辞書に登録されている音声データ単位に分割する読み上げテキストデータ分割手段と、
    この読み上げテキストデータ分割手段で分割された読み上げテキストデータに含まれている前記音声データ単位を計数する音声データ単位カウント手段と、
    この音声データ単位カウント手段で計数されたカウント値が、初期処理時においては、カウント値の最大値として予め設定した回数より大きく、それ以降においては、それまでに計数されたカウント値の中で最大値以上であるときは、この音声データ単位カウント手段で計数されたカウント値が計数された読み上げテキストデータを選択し、前記それまでに計数されたカウント値に当該カウント値を置き換える読み上げテキストデータ選択手段と、
    この読み上げテキストデータ選択手段で選択された読み上げテキストデータを、選択読み上げテキストデータとして出力する選択読み上げテキストデータ出力手段と、
    を備え、
    前記音声データ単位カウント手段は、
    前記読み上げテキストデータの中に、前記予め設定された回数以上、前記読み上げテキストデータ選択手段で選択された読み上げテキストデータにすでに含まれている前記音声データ単位があるときは、当該音声データ単位を計数しない
    ことを特徴とする音声合成用読み上げテキストデータ選択装置。
JP2004213332A 2004-07-21 2004-07-21 音声合成用読み上げテキストデータ選択プログラムおよび音声合成用読み上げテキストデータ選択装置 Active JP4741208B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2004213332A JP4741208B2 (ja) 2004-07-21 2004-07-21 音声合成用読み上げテキストデータ選択プログラムおよび音声合成用読み上げテキストデータ選択装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2004213332A JP4741208B2 (ja) 2004-07-21 2004-07-21 音声合成用読み上げテキストデータ選択プログラムおよび音声合成用読み上げテキストデータ選択装置

Publications (2)

Publication Number Publication Date
JP2006030892A JP2006030892A (ja) 2006-02-02
JP4741208B2 true JP4741208B2 (ja) 2011-08-03

Family

ID=35897269

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2004213332A Active JP4741208B2 (ja) 2004-07-21 2004-07-21 音声合成用読み上げテキストデータ選択プログラムおよび音声合成用読み上げテキストデータ選択装置

Country Status (1)

Country Link
JP (1) JP4741208B2 (ja)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5113662B2 (ja) * 2008-07-30 2013-01-09 日本放送協会 音声合成用読上げ文章生成装置及びそのプログラム
JP6185712B2 (ja) * 2012-11-29 2017-08-23 日本放送協会 音声合成用読み上げテキストデータ選択装置およびそのプログラム
JP6088233B2 (ja) * 2012-12-12 2017-03-01 日本放送協会 音声合成用読み上げ文生成装置及びそのプログラム
CN113345408B (zh) * 2021-06-02 2022-12-27 云知声智能科技股份有限公司 中英文语音混合合成方法、装置、电子设备和存储介质

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4306086B2 (ja) * 2000-04-14 2009-07-29 富士通株式会社 音声合成用辞書作成装置及び方法
JP2002259371A (ja) * 2001-03-02 2002-09-13 Nippon Telegr & Teleph Corp <Ntt> 文書要約方法および装置と文書要約プログラムおよび該プログラムを記録した記録媒体
JP3981619B2 (ja) * 2002-10-15 2007-09-26 日本電信電話株式会社 収録リスト取得装置と音声素片データベース作成装置、及びそれらの装置プログラム
JP3960928B2 (ja) * 2003-02-14 2007-08-15 日本電信電話株式会社 テキスト選択方法、装置及びプログラム

Also Published As

Publication number Publication date
JP2006030892A (ja) 2006-02-02

Similar Documents

Publication Publication Date Title
US7983919B2 (en) System and method for performing speech synthesis with a cache of phoneme sequences
WO2017190674A1 (zh) 一种音频数据的处理方法、装置及计算机存储介质
CN109389968B (zh) 基于双音节混搭的波形拼接方法、装置、设备及存储介质
WO2010018796A1 (ja) 例外語辞書作成装置、例外語辞書作成方法及びそのプログラム、並びに、音声認識装置及び音声認識方法
US7912716B2 (en) Generating words and names using N-grams of phonemes
US9064489B2 (en) Hybrid compression of text-to-speech voice data
CN101171624B (zh) 语音合成装置及语音合成方法
JP5274711B2 (ja) 音声認識装置
JPH10171484A (ja) 音声合成方法および装置
WO2004109659A1 (ja) 音声合成装置、音声合成方法及びプログラム
JP4741208B2 (ja) 音声合成用読み上げテキストデータ選択プログラムおよび音声合成用読み上げテキストデータ選択装置
KR100542757B1 (ko) 음운변이 규칙을 이용한 외래어 음차표기 자동 확장 방법및 그 장치
JP4287785B2 (ja) 音声合成装置、音声合成方法及びプログラム
WO2004109660A1 (ja) 音声データを選択するための装置、方法およびプログラム
JP2002221981A (ja) 音声合成装置および音声合成方法
US20110196672A1 (en) Voice recognition device
JP2010145873A (ja) テキスト置換装置、テキスト音声合成装置、テキスト置換方法、及び、テキスト置換プログラム
JP4787686B2 (ja) テキスト選択装置、その方法、そのプログラム、及びその記録媒体
JP2005018036A (ja) 音声合成装置、音声合成方法及びプログラム
JP2004294577A (ja) 文字情報音声変換方法
JP6185712B2 (ja) 音声合成用読み上げテキストデータ選択装置およびそのプログラム
JP2007334144A (ja) 音声合成方法、音声合成装置及び音声合成プログラム
JP3853923B2 (ja) 音声合成装置
JP2004251953A (ja) テキスト選択方法及び装置、プログラム
JP6217414B2 (ja) 読み生成装置、方法、及びプログラム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20070226

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20091116

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20091201

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20100129

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20100810

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20100928

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20110412

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20110506

R150 Certificate of patent or registration of utility model

Ref document number: 4741208

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140513

Year of fee payment: 3

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250