JP2006145690A - 音声合成装置、音声合成方法及びプログラム - Google Patents
音声合成装置、音声合成方法及びプログラム Download PDFInfo
- Publication number
- JP2006145690A JP2006145690A JP2004333427A JP2004333427A JP2006145690A JP 2006145690 A JP2006145690 A JP 2006145690A JP 2004333427 A JP2004333427 A JP 2004333427A JP 2004333427 A JP2004333427 A JP 2004333427A JP 2006145690 A JP2006145690 A JP 2006145690A
- Authority
- JP
- Japan
- Prior art keywords
- sentence
- data
- speech
- representing
- sound piece
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Landscapes
- Machine Translation (AREA)
- Document Processing Apparatus (AREA)
Abstract
【解決手段】 定型メッセージを表すデータが供給されると、音片編集部5は、このデータのうち所定の条件に合致する文言を表す区間を分割する。そして、分割後の定型メッセージ内の音片と読みが合致する音片の音片データを音片データベース7から索出させ、発声スピードを変換させる。一方で音片編集部5は定型メッセージの韻律予測を行い、索出された音片データのうちから定型メッセージ内の各音片に最もよく合致するものを1個ずつ、韻律予測結果に基づいて選択する。選択できなかった音片については音響処理部41に単位音声毎の波形を表す波形データを供給させる。そして、選択した音片データや、音響処理部41に供給させた波形データを互いに結合して、合成音声を表すデータを生成する。
【選択図】 図1
Description
録音編集方式は、単語と、この単語を読み上げる音声を表す音声データとを対応付けておき、音声合成する対象の文章を単語に区切ってから、これらの単語に対応付けられた音声データを取得してつなぎ合わせる、という手法である(例えば、特許文献1参照)。音声合成する対象の文章が表意文字列として記述されている場合は、この表意文字列に形態素解析を施すことにより、この表意文字列を、単語毎に区切られた表音文字列へと変換する処理が行われることが通常である。
このような表意文字列を読み上げる音声を合成するためには、このような表意文字列全体と読みが一致する音声データを適宜補充することも考えられるものの、複数の単語の多様な組み合わせに対応する音声データを逐一記憶するものとすると、音声データを記憶する記憶装置には膨大な記憶容量が必要となり、また、検索に要する時間も膨大なものとなる。
文章を表す文章情報を取得する文章情報取得手段と、
前記文章情報の少なくとも一部に対応する音片を表す音片データを複数記憶する音片記憶手段と、
各前記音片データのうちから、取得した前記文章情報が表す文章を構成する文言と読みが共通する音片データを選択し、又は、取得した前記文章情報が表す文章を構成する文言と読みが共通していて且つ韻律が韻律予測結果に所定の条件下で合致する文言を表す音片データを選択する選択手段と、
前記選択手段が選択した音片データを互いに結合することにより、合成音声を表すデータを生成する合成手段と、より構成されており、
前記選択手段は、取得した前記文章情報のうち、所定の区切り用記号が挿入されることにより分割されて形成される連続した複数の区間を、互いに別個の文言を表すものとして扱う、
ことを特徴とする。
文章を表す文章情報を取得する文章情報取得手段と、
前記文章情報の少なくとも一部に対応する音片を表す音片データを複数記憶する音片記憶手段と、
各前記音片データのうちから、取得した前記文章情報が表す文章を構成する文言と読みが共通する音片データを選択し、又は、取得した前記文章情報が表す文章を構成する文言と読みが共通していて且つ韻律が韻律予測結果に所定の条件下で合致する文言を表す音片データを選択する選択手段と、
前記選択手段が選択した音片データを互いに結合することにより、合成音声を表すデータを生成する合成手段と、より構成されており、
前記選択手段は、取得した前記文章情報のうち、所定の表記法により表記されている区間を、隣接する他の区間とは別個の文言を表すものとして扱う、
ことを特徴とする。
文章を表す文章情報を取得し、当該文章情報のうち、所定の条件に合致する文言を表す区間を、当該条件に合致しない文言を表す複数の部分へと分割する処理を行う文章分割手段と、
前記文章情報の少なくとも一部に対応する音片を表す音片データを複数記憶する音片記憶手段と、
各前記音片データのうちから、前記処理を経た文章情報が表す文章を構成する文言と読みが共通する音片データを選択し、又は、各前記音片データのうちから、前記処理を経た文章情報が表す文章を構成する文言と読みが共通していて且つ韻律が韻律予測結果に所定の条件下で合致する文言を表す音片データを選択する選択手段と、
前記選択手段が選択した音片データを互いに結合することにより、合成音声を表すデータを生成する合成手段と、より構成される、
ことを特徴とする。
文章を表す文章情報を取得し、当該文章情報のうち、所定の条件に合致する文言を表す区間内の所定部分の表記を、所定の表記法による表記へと置換する処理を行う文章置換手段と、
前記文章情報の少なくとも一部に対応する音片を表す音片データを複数記憶する音片記憶手段と、
各前記音片データのうちから、前記処理を経た文章情報が表す文章を構成する文言と読みが共通する音片データを選択し、又は、前記処理を経た文章情報が表す文章を構成する文言と読みが共通していて且つ韻律が韻律予測結果に所定の条件下で合致する文言を表す音片データを選択する選択手段と、
前記選択手段が選択した音片データを互いに結合することにより、合成音声を表すデータを生成する合成手段と、より構成されており、
前記選択手段は、前記処理を経た文章情報のうち、前記表記法により表記されている部分については、隣接する他の部分とは別個の文言を表すものとして扱う、
ことを特徴とする。
前記合成手段は、前記選択手段が選択した音片データ及び前記欠落部分合成手段が合成した音声データを互いに結合することにより、合成音声を表すデータを生成するものであってもよい。
前記選択手段は、各前記音片データのうちから、前記処理を経た文章情報が表す文章を構成する文言と読みが共通しており、且つ、対応付けられている韻律データが表すピッチの時間変化が韻律の予測結果に最も近い音片データを選択するものであってもよい。
文章を表す文章情報を取得する文章情報取得ステップと、
前記文章情報の少なくとも一部に対応する音片を表す音片データを複数記憶する音片記憶ステップと、
各前記音片データのうちから、取得した前記文章情報が表す文章を構成する文言と読みが共通する音片データを選択し、又は、取得した前記文章情報が表す文章を構成する文言と読みが共通していて且つ韻律が韻律予測結果に所定の条件下で合致する文言を表す音片データを選択する選択ステップと、
前記選択ステップで選択した音片データを互いに結合することにより、合成音声を表すデータを生成する合成ステップと、より構成されており、
前記選択ステップでは、取得した前記文章情報のうち、所定の区切り用記号が挿入されることにより分割されて形成される連続した複数の区間を、互いに別個の文言を表すものとして扱う、
ことを特徴とする。
文章を表す文章情報を取得する文章情報取得ステップと、
前記文章情報の少なくとも一部に対応する音片を表す音片データを複数記憶する音片記憶ステップと、
各前記音片データのうちから、取得した前記文章情報が表す文章を構成する文言と読みが共通する音片データを選択し、又は、取得した前記文章情報が表す文章を構成する文言と読みが共通していて且つ韻律が韻律予測結果に所定の条件下で合致する文言を表す音片データを選択する選択ステップと、
前記選択ステップで選択した音片データを互いに結合することにより、合成音声を表すデータを生成する合成ステップと、より構成されており、
前記選択ステップでは、取得した前記文章情報のうち、所定の表記法により表記されている区間を、隣接する他の区間とは別個の文言を表すものとして扱う、
ことを特徴とする。
文章を表す文章情報を取得し、当該文章情報のうち、所定の条件に合致する文言を表す区間を、当該条件に合致しない文言を表す複数の部分へと分割する処理を行う文章分割ステップと、
前記文章情報の少なくとも一部に対応する音片を表す音片データを複数記憶する音片記憶ステップと、
各前記音片データのうちから、前記処理を経た文章情報が表す文章を構成する文言と読みが共通する音片データを選択し、又は、前記処理を経た文章情報が表す文章を構成する文言と読みが共通していて且つ韻律が韻律予測結果に所定の条件下で合致する文言を表す音片データを選択する選択ステップと、
前記選択ステップで選択した音片データを互いに結合することにより、合成音声を表すデータを生成する合成ステップと、より構成される、
ことを特徴とする。
文章を表す文章情報を取得し、当該文章情報のうち、所定の条件に合致する文言を表す区間内の所定部分の表記を、所定の表記法による表記へと置換する処理を行う文章置換ステップと、
前記文章情報の少なくとも一部に対応する音片を表す音片データを複数記憶する音片記憶ステップと、
各前記音片データのうちから、前記処理を経た文章情報が表す文章を構成する文言と読みが共通する音片データを選択し、又は、前記処理を経た文章情報が表す文章を構成する文言と読みが共通していて且つ韻律が韻律予測結果に所定の条件下で合致する文言を表す音片データを選択する選択ステップと、
前記選択ステップで選択した音片データを互いに結合することにより、合成音声を表すデータを生成する合成ステップと、より構成されており、
前記選択ステップでは、前記処理を経た文章情報のうち、前記表記法により表記されている部分については、隣接する他の部分とは別個の文言を表すものとして扱う、
ことを特徴とする。
コンピュータを、
文章を表す文章情報を取得する文章情報取得手段と、
前記文章情報の少なくとも一部に対応する音片を表す音片データを複数記憶する音片記憶手段と、
各前記音片データのうちから、取得した前記文章情報が表す文章を構成する文言と読みが共通する音片データを選択し、又は、取得した前記文章情報が表す文章を構成する文言と読みが共通していて且つ韻律が韻律予測結果に所定の条件下で合致する文言を表す音片データを選択する選択手段と、
前記選択手段が選択した音片データを互いに結合することにより、合成音声を表すデータを生成する合成手段と、して機能させるためのプログラムであって、
前記選択手段は、取得した前記文章情報のうち、所定の区切り用記号が挿入されることにより分割されて形成される連続した複数の区間を、互いに別個の文言を表すものとして扱う、
ことを特徴とする。
コンピュータを、
文章を表す文章情報を取得する文章情報取得手段と、
前記文章情報の少なくとも一部に対応する音片を表す音片データを複数記憶する音片記憶手段と、
各前記音片データのうちから、取得した前記文章情報が表す文章を構成する文言と読みが共通する音片データを選択し、又は、取得した前記文章情報が表す文章を構成する文言と読みが共通していて且つ韻律が韻律予測結果に所定の条件下で合致する文言を表す音片データを選択する選択手段と、
前記選択手段が選択した音片データを互いに結合することにより、合成音声を表すデータを生成する合成手段と、して機能させるためのプログラムであって、
前記選択手段は、取得した前記文章情報のうち、所定の表記法により表記されている区間を、隣接する他の区間とは別個の文言を表すものとして扱う、
ことを特徴とする。
コンピュータを、
文章を表す文章情報を取得し、当該文章情報のうち、所定の条件に合致する文言を表す区間を、当該条件に合致しない文言を表す複数の部分へと分割する処理を行う文章分割手段と、
前記文章情報の少なくとも一部に対応する音片を表す音片データを複数記憶する音片記憶手段と、
各前記音片データのうちから、前記処理を経た文章情報が表す文章を構成する文言と読みが共通する音片データを選択し、又は、前記処理を経た文章情報が表す文章を構成する文言と読みが共通していて且つ韻律が韻律予測結果に所定の条件下で合致する文言を表す音片データを選択する選択手段と、
前記選択手段が選択した音片データを互いに結合することにより、合成音声を表すデータを生成する合成手段と、
して機能させるためのものであることを特徴とする。
コンピュータを、
文章を表す文章情報を取得し、当該文章情報のうち、所定の条件に合致する文言を表す区間内の所定部分の表記を、所定の表記法による表記へと置換する処理を行う文章置換手段と、
前記文章情報の少なくとも一部に対応する音片を表す音片データを複数記憶する音片記憶手段と、
各前記音片データのうちから、前記処理を経た文章情報が表す文章を構成する文言と読みが共通する音片データを選択し、又は、前記処理を経た文章情報が表す文章を構成する文言と読みが共通していて且つ韻律が韻律予測結果に所定の条件下で合致する文言を表す音片データを選択する選択手段と、
前記選択手段が選択した音片データを互いに結合することにより、合成音声を表すデータを生成する合成手段と、して機能させるためのプログラムであって、
前記選択手段は、前記処理を経た文章情報のうち、前記表記法により表記されている部分については、隣接する他の部分とは別個の文言を表すものとして扱う、
ことを特徴とする。
まず、第1の実施の形態に係る音声合成システムを説明する。
図1は、この発明の第1の実施の形態に係る音声合成システムの構成を示す図である。図示するように、この音声合成システムは、本体ユニットM1と、音片登録ユニットRとにより構成されている。
このうち、規則合成処理部4は、音響処理部41と、検索部42と、伸長部43と、波形データベース44とより構成されている。
また、音片編集部5は、形態素解析部51と、一致音片決定部52と、韻律予測部53と、出力合成部54とより構成されている。
ユーザ単語辞書3は、表意文字を含む単語等と、この単語等の読みを表す表音文字とを、ユーザの操作に従って外部より取得し、互いに対応付けて記憶する。ユーザ単語辞書3には、一般単語辞書2に記憶されていない単語等とその読みを表す表音文字とが格納されていれば十分である。
音片データベース7には、例えば、図2に示すデータ構造を有するデータが記憶されている。すなわち、図示するように、音片データベース7に格納されているデータは、ヘッダ部HDR、インデックス部IDX、ディレクトリ部DIR及びデータ部DATの4種に分かれている。
なお、音片とは、音声のうち音素1個以上を含む連続した1区間をいい、通常は単語1個分又は複数個分の区間からなる。音片は接続詞を含む場合もある。
また、エントロピー符号化される前の音片データは、上述の圧縮波形データの生成のためエントロピー符号化される前の波形データと同じ形式のデータ(例えば、PCM化されたデジタル形式のデータ)からなっていればよい。
(A) この圧縮音片データが表す音片の読みを示す表音文字を表すデータ(音片読みデータ)、
(B) この圧縮音片データが格納されている記憶位置の先頭のアドレスを表すデータ、
(C) この圧縮音片データのデータ長を表すデータ、
(D) この圧縮音片データが表す音片の発声スピード(再生した場合の時間長)を表すデータ(スピード初期値データ)、
(E) この音片のピッチ成分の周波数の時間変化を表すデータ(ピッチ成分データ)、
が、互いに対応付けられた形で格納されている。(なお、音片データベース7の記憶領域にはアドレスが付されているものとする。)
また、上述のピッチ成分データは、例えば、図示するように、音片のピッチ成分の周波数を音片の先頭からの経過時間の1次関数で近似した場合における、この1次関数の切片β及び勾配αの値を示すデータからなっていればよい。(勾配αの単位は例えば[ヘルツ/秒]であればよく、切片βの単位は例えば[ヘルツ]であればよい。)
また、ピッチ成分データには更に、圧縮音片データが表す音片が鼻濁音化されているか否か、及び、無声化されているか否かを表す図示しないデータも含まれているものとする。
収録音片データセット記憶部10には、音片の読みを表す表音文字と、この音片を人が実際に発声したものを集音して得た波形を表す音片データとが、この音声合成システムの製造者等によって、あらかじめ互いに対応付けて記憶されている。なお、この音片データは、例えば、PCM化されたデジタル形式のデータからなっていればよい。
まず、音片登録ユニットRの動作を説明する。
音片データベース7に音片を登録する場合、まず、音片データベース作成部11は、収録音片データセット記憶部10より、互いに対応付けられている表音文字及び音片データを読み出し、この音片データが表す音声のピッチ成分の周波数の時間変化と、発声スピードとを特定する。
圧縮部12は、音片データベース作成部11より供給された音片データをエントロピー符号化して圧縮音片データを作成し、音片データベース作成部11に返送する。
また、書き込んだ圧縮音片データの、音片データベース7の記憶領域内での先頭のアドレスを特定し、このアドレスを上述の(B)のデータとして音片データベース7の記憶領域に書き込む。
また、この圧縮音片データのデータ長を特定し、特定したデータ長を、(C)のデータとして音片データベース7の記憶領域に書き込む。
また、この圧縮音片データが表す音片の発声スピード及びピッチ成分の周波数の時間変化を特定した結果を示すデータを生成し、スピード初期値データ及びピッチ成分データとして音片データベース7の記憶領域に書き込む。
次に、本体ユニットM1の動作を説明する。以下では、まず、言語処理部1が、この音声合成システムに音声を合成させる対象としてユーザが用意した、表意文字を含む文章(フリーテキスト)を記述したフリーテキストデータを外部から取得したとして説明する。
プロセッサが実行する当該他の処理としては、例えば、音声を表す音声データを取得し、この音声データに音声認識を施すことにより、この音声が表す語句を特定し、特定した語句に基づいて、この音声の発話者の要求の内容を特定して、特定した要求を満足させるために実行すべき処理を特定して実行するようなエージェント装置の機能をプロセッサに行わせるための処理などが考えられる。
あるいは、検索部42は、音響処理部41の指示の内容に合致する圧縮波形データのうち、韻律予測部53より供給された韻律予測データが示す韻律に合致する強度及びイントネーション等を有する素片を表すもののみを索出するようにしてもよい。
なお、定型メッセージデータは、定型メッセージを表意文字列として表すデータであり、具体的には、例えば本体ユニットM1が、車両に登載されるナビゲーション装置を構成するものであれば、ナビゲーションの目的で当該ナビゲーション装置に発声させるべきメッセージ等を表すデータである。
また、発声スピードデータは、定型メッセージデータが表す定型メッセージの発声スピードの指定値(この定型メッセージを発声する時間長の指定値)を示すデータである。
照合レベルデータは、検索部6が行う後述の検索処理における検索条件を指定するデータであり、以下では「1」、「2」又は「3」のいずれかの値をとるものとし、「3」が最も厳格な検索条件を示すものとする。
具体的には、例えば、「首都高速都心環状線を」という表意文字列に対応する文字列が定形メッセージデータとして形態素解析部51に供給される場合を想定する。この際、定形メッセージの作成者は、当該「首都高速都心環状線を」という表意文字列を「首都高速」「都心環状線」「を」の3個の単語からなるものとして形態素解析部51に確実に認識させたい場合、当該「首都高速都心環状線を」という表意文字列については、定形メッセージデータとして、例えば「首都高速・都心環状線ヲ」という文字列が形態素解析部51に入力されるように予め表意文字列を定義しておく。つまり、「首都高速」という単語と「都心環状線」という単語の間に区切り用記号「・」を挿入し、また、「都心環状線」の後に続く助詞「を」をカタカナ表記で「ヲ」とする。上述の区切り用記号「・」は、これを挟んで前後する文字列(例えば「首都高速」及び「都心環状線」)が互いに異なる単語に属するものであって、両者はまとめて1個の単語(例えば「首都高速都心環状線」)として認識されてはならないものである、ということを意味する。また、カタカナ表記された部分「ヲ」は、カタカナ表記されたこの部分が、これに隣接する他の文字(「線」など)とは区別されて、1個の音片に対応する1個の単語をなすものであることを意味する。形態素解析部51は、入力された定形メッセージデータが「首都高速・都心環状線ヲ」という文字列だった場合、「首都高速」と「都心環状線ヲ」の間に挿入されている区切り用記号「・」を検出して、区切り用記号「・」を挟んで前後する「首都高速」「都心環状線ヲ」を一つの単語として扱わないことを決定する。また、カタカナ表記である部分「ヲ」を、その前にある単語(本例の場合「都心環状線」)から区別して一つの音片に対応する単語として扱うことを決定する。そして、形態素解析部51はこれらの前提の下に形態素解析を行い、その結果、例えば「首都高速」「都心環状線」という各文字列をそれぞれ1個の単語として認識すれば、「シュトコウソク」「トシンカンジョウセン」「ヲ」という各表音文字列を出力する。尚、形態素解析部51は、「、」「,」「…」「−」等の記号を区切り用記号として認識してもよく、この場合定型メッセージの作成者は、これらの記号を区切り用記号として用いて良い。また、形態素解析部51は、カタカナ表記された部分の代わりに例えば「『』」で囲まれた部分を1個の単語として認識してもよく、この場合定型メッセージの作成者は、1個の単語として認識させたい部分を「『』」で囲むようにして定型メッセージを定義すればよい。また、形態素解析部51が、一致音片決定部52に、表音文字列内で各音片に対応する単語がそれぞれどの部分であるか、あるいはどの部分が2個の単語の境界であるかを伝える態様は、一致音片決定部52が識別できる態様であれば任意である。表意文字列と同様に表音文字列を区切り用記号「・」や「/」等で区切って出力するようにしてもよいし、また一つの音片に対応する単語であることを示す識別符号データを別途付加して出力するようにしてもよい。
従来の形態素解析では、「首都高速都心環状線を」という定形メッセージデータが入力されると、「シュトコウソクトシンカンジョウセンヲ」という一続きの表音文字列として出力してしまい、結果として、音片データベース7の検索において表音文字列が「シュトコウソクトシンカンジョウセンヲ」と一致する音片データが存在するかが検索されることになる。従って、「首都高速」「都心環状線」それぞれを音片データとして有する場合であっても、一致する音片なしとして処理されてしまう。
一方、本実施の形態の形態素解析部51では、上述のように「首都高速・都心環状線ヲ」という定形メッセージデータの入力に対応して上述の処理を行うことによって、「シュトコウソク」「トシンカンジョウセン」「ヲ」の3個の単語を表すものとして表音文字列が出力される。したがって、後述する音片データの検索時に、一致する音片を索出する可能性を格段に高めることができる。
(1) 照合レベルデータの値が「1」である場合は、話速変換部9より供給された音片データ(すなわち、定型メッセージ内の音片と読みが合致する音片データ)をすべて、定型メッセージ内の音片の波形に近いものとして選択する。
ただし、一致音片決定部52は、話速変換部9より供給された音片データのうちから、照合レベルデータの値に相当する条件を満たす音片データを選択できない音片があった場合、該当する音片を、検索部6が圧縮音片データを索出できなかった音片(つまり、上述の欠落部分識別データが示す音片)とみなして扱うことを決定するものとする。
従って、複数の単語の多様な組み合わせに対応する音声データを逐一記憶することなく、また、規則合成方式による合成を行う部分を最小限に抑え、簡単な構成で自然な合成音声を高速、確実に得ることができる。
すなわち、人が発声する音声では、先行する音素から後続の音素へと遷移する境界で、これらの音素双方の影響を受けた特殊な波形が現れることが知られており、一方、規則合成に用いられる音素は、採取した段階で既にその端部にこの特殊な波形を含んでいるため、音素を用いて規則合成を行う場合は、音素間の境界の波形の様々なパターンを再現可能とするために膨大な種類の音素を用意するか、あるいは、音素間の境界の波形が自然な音声とは異なった合成音声を合成することで満足する必要がある。しかし、素片を用いて規則合成を行う場合は、音素の端部以外の部分から素片を採取するようにすれば、音素間の境界の特殊な波形の影響をあらかじめ排除することができる。このため、膨大な種類の素片を用意することを要せず、自然な音声を得ることができる。
例えば、素片波形データはPCM形式のデータである必要はなく、データ形式は任意である。また、波形データベース44は素片波形データや音片データを必ずしもデータ圧縮された状態で記憶している必要はない。波形データベース44が素片波形データをデータ圧縮されていない状態で記憶している場合、本体ユニットM1は伸長部43を備えている必要はない。
また、一致音片決定部52は、過去の韻律予測の結果を韻律登録データとして新たに記憶するようにしてもよい。
この場合、音響処理部41は、一致音片決定部52が選択した音片については、この音片の素片の波形を表す圧縮波形データを検索部42に索出させなくてもよい。なお、一致音片決定部52は、音響処理部41が合成しなくてよい音片を音響処理部41に通知し、音響処理部41はこの通知に応答して、この音片を構成する単位音声の素片の波形の検索を中止するようにすればよい。
また、音片登録ユニットRは、必ずしも収録音片データセット記憶部10を備えている必要はない。
次に、この発明の第2の実施の形態に係る音声合成システムを説明する。
図3は、この発明の第2の実施の形態に係る音声合成システムの構成を示す図である。図示するように、この音声合成システムは、本体ユニットM2と、音片登録ユニットRとにより構成されている。
また、第2の実施の形態における音片登録ユニットRは、第1の実施の形態におけるものと実質的に同一の構成を有する。
分割対象音片データは、読みの一致する音片を表す音片データが音片データベース7に登録されているにもかかわらず、一致音片決定部52の行う後述の処理において、音声合成に用いる音片データが選択される可能性が一定程度に達しない見込みである音片の読みを表す表音文字列を含んだリストからなる。なお、分割対象音片データに含められる表音文字列は、製造者等があらかじめ経験的に決定すればよい。また、一致音片決定部52は、分割対象音片データを自ら備えることなく、音片データベース7に記憶されている音片データの一部を分割対象音片データとして取り扱うようにしてもよい。(以下、分割対象音片データは、一致音片決定部52、若しくは音片データベース7が記憶する表音文字列からなるものとして説明する。)
次に、第2の実施の形態の音声合成ユニットの動作を説明する。
まず、第2の実施の形態の音声合成システムの音片登録ユニットRの動作は、第1の実施の形態におけるものと実質的に同一である。
また、本体ユニットM2がフリーテキストデータ又は配信文字列データを取得した場合の動作は、第1の実施の形態における本体ユニットM1の動作と実質的に同一である。
なお、一致音片決定部52が定型メッセージデータや発声スピードデータや照合レベルデータを取得する手法は任意であり、例えば、第1の実施の形態における形態素解析部51あるいは一致音片決定部52が定型メッセージデータ、発声スピードデータあるいは照合レベルデータを取得する手法と同様の手法で定型メッセージデータや発声スピードデータや照合レベルデータを取得すればよい。
こうして得られる各部分を表す適切な音片は、分割前の表音文字列が表す音片に比べて容易に選択されることが期待できる。従って、音片データが有効に活用され、読み及び韻律予測結果の多様な組み合わせに対応する膨大な量の音声データを逐一記憶することなく検索時間も短くなり、また、聴覚上の自然さで劣る規則合成方式による合成を行う部分を最小限に抑え、簡単な構成で自然な合成音声を高速、確実に得ることができる。
例えば、上述の第2の実施例の形態では、第1の実施の形態に示した形態素解析部51を備えないとして説明したが、第2の実施の形態の音声合成システムも、形態素解析部51を備えていてよい。この場合、形態素解析部51は、表意文字列を表す定型メッセージデータを取得し、この定型メッセージデータに形態素解析を施した結果得られた表音文字列内に、区切り用記号を挿入するようにしてもよい。具体的には、例えば形態素解析部51が、表意文字列「首都高速都心環状線を」を表す定形メッセージデータを取得したとして、この表意文字列を表音文字列に変換した後、当該表音文字列内に、分割対象音片データと一致する表音文字列が含まれるかを検索する。一致する表音文字列が存在した場合には、当該表音文字列内に区切り用記号を挿入して、一致音片決定部52に供給する。この結果、上述の「首都高速都心環状線を」という表意文字列は、例えば「シュトコウソク・トシンカンジョウセン・ヲ」という表音文字列へと変換されることになり、一致音片決定部52が検索部6に行わせる音片の検索において、対応する音片が索出される可能性を格段に高めることができる。
また、一致音片決定部52が記憶する分割対象音片データに含まれる表音文字列は任意の基準に従って選ばれていてよい。また、一致音片決定部52が記憶するデータは必ずしもリストの形式をとっている必要はなく、区切り用の記号を挿入される対象の表音文字列が満たすべき条件を指定する任意の形式のデータからなっていてよい。
また、形態素解析部51又は音片データベース7が、分割対象音片データを、この音声合成システムの製造者等の操作により書き換え可能に記憶してもよい。なお、音片データベース7が分割対象音片データを記憶する場合、音片データベース7は、音片読みデータとは別個のものとして分割対象音片データを記憶してもよいし、また、音片読みデータの一部を分割対象音片データとして兼用してもよい。
置換対象音片データは、ある部分の読みが一致する音片の音片データが音片データベース7に登録されているものの、他の部分の読みがいずれの音片データが表す音片とも合致しない等のため、音声合成に用いる音片データを一致音片決定部52が選択する可能性が著しく低い見込みである音片の読みを表す表音文字列と、この表音文字列のうち、この表音文字列の他の部分とは互いに別個の文言として扱われるべき箇所を指定する置換部分指定データとからなる。なお、置換対象音片データにより表される表音文字列も、製造者等があらかじめ経験的に決定すればよい。
なお、音片データベース7が置換対象音片データを記憶する場合、音片データベース7は、音片読みデータとは別個のものとして置換対象音片データを記憶してもよいし、また、音片読みデータの一部を置換対象音片データとして兼用してもよい。
具体的には、「都心環状線を」という表意文字列が形態素解析部51に供給され、形態素解析部51がこれを「としんかんじょうせんを」という表音文字列に変換したとして、一方で、置換対象音片データとして例えば「としんかんじょうせんを」が登録されており、更にこの「としんかんじょうせんを」のうち「を」の箇所を指定する置換部分指定データが登録されている場合、形態素解析部51は、自己に供給された元の表意文字列「都心環状線を」のうち、置換部分指定データが示す助詞「を」をカタカナ表記「ヲ」に変換し、「都心環状線ヲ」を得る。以後、この音声合成システムは、「都心環状線」と「ヲ」を異なる音片に対応する単語とみなして、変換後の表意文字列に、第1の実施の形態におけるものと同様の形態素解析を施すことによって表音文字列を改めて生成し、一致音片決定部52により、この表音文字列に相当する音声を構成する音片を表すものとして用いる音片データが決定されて、この音片データを用いて音声が合成され、出力される。
つまり、検索部6は、一致音片決定部52の指示に応答して音片データベース7を検索する際、定型メッセージデータのうち、上述の所定の表記法によって記されている部分は、他の部分とは互いに別個の文言として扱う。
図4は、音片登録ユニットRの機能を行うパーソナルコンピュータが実行する処理を示すフローチャートである。
また、ピッチ成分の周波数の時間変化は、例えば、この音片データにケプストラム解析を施すことにより特定すればよい。具体的には、例えば、音片データが表す波形を時間軸上で多数の小部分へと区切り、得られたそれぞれの小部分のケプストラムを求め、このケプストラムの極大値を与える周波数のうちの最小値を、この小部分におけるピッチ成分の周波数として特定すればよい。なお、ピッチ成分の周波数の時間変化は、上述したように、例えば特開2003−108172号公報に開示された手法に従って音片データをピッチ波形データへと変換してから、このピッチ波形データに基づいて特定するようにすると良好な結果が期待できる。
また、書き込んだ圧縮音片データの、音片データベース7の記憶領域内での先頭のアドレスを特定し、このアドレスを上述の(B)のデータとして音片データベース7の記憶領域に書き込む。
また、この圧縮音片データのデータ長を特定し、特定したデータ長を、(C)のデータとして音片データベース7の記憶領域に書き込む。
また、この圧縮音片データが表す音片の発声スピード及びピッチ成分の周波数の時間変化を特定した結果を示すデータを生成し、スピード初期値データ及びピッチ成分データとして音片データベース7の記憶領域に書き込む。
図5は、本体ユニットM1の機能を行うパーソナルコンピュータがフリーテキストデータを取得した場合の処理を示すフローチャートである。
図6は、本体ユニットM1の機能を行うパーソナルコンピュータが配信文字列データを取得した場合の処理を示すフローチャートである。
図7は、本体ユニットM1の機能を行うパーソナルコンピュータが定型メッセージデータ及び発声スピードデータを取得した場合の処理を示すフローチャートである。
また、ステップS302でこのパーソナルコンピュータは、定型メッセージデータを構成する表意文字列中、所定の表記法で記述されている部分を、この表意文字列の他の部分とは区別される1個の単語をなすものとして扱う。
なお、照合レベルデータが示す基準に合致する音片データが1個の音片につき複数あった場合は、これら複数の音片データを、設定した条件より厳格な条件に従って1個に絞り込むものとする。また、照合レベルデータの値に相当する条件を満たす音片データを選択できない音片があった場合は、該当する音片を、圧縮音片データを索出できなかった音片として扱うことと決定し、例えば欠落部分識別データを生成するものとする。
ただし、ステップS308でこのパーソナルコンピュータは、ステップS203の処理に相当する処理を行う代わりに、ステップS306における韻律予測の結果を用いて音声波形データを生成するようにしてもよい。
図8は、本体ユニットM2の機能を行うパーソナルコンピュータが定型メッセージデータ及び発声スピードデータを取得した場合の処理を示すフローチャートである。
そして、これらのプログラムを起動し、OSの制御下に、他のアプリケーションプログラムと同様に実行することにより、上述の処理を実行することができる。
1 言語処理部
2 一般単語辞書
3 ユーザ単語辞書
41 音響処理部
42 検索部
43,8 伸長部
44 波形データベース
5 音片編集部
51 形態素解析部
52 一致音片決定部
53 韻律予測部
54 出力合成部
6 検索部
7 音片データベース
9 話速変換部
R 音片登録ユニット
10 収録音片データセット記憶部
11 音片データベース作成部
12 圧縮部
HDR ヘッダ部
IDX インデックス部
DIR ディレクトリ部
DAT データ部
Claims (21)
- 文章を表す文章情報を取得する文章情報取得手段と、
前記文章情報の少なくとも一部に対応する音片を表す音片データを複数記憶する音片記憶手段と、
文章を表す文章情報を取得する文章情報取得手段と、
各前記音片データのうちから、取得した前記文章情報が表す文章を構成する文言と読みが共通する音片データを選択し、又は、取得した前記文章情報が表す文章を構成する文言と読みが共通していて且つ韻律が韻律予測結果に所定の条件下で合致する文言を表す音片データを選択する選択手段と、
前記選択手段が選択した音片データを互いに結合することにより、合成音声を表すデータを生成する合成手段と、より構成されており、
前記選択手段は、取得した前記文章情報のうち、所定の区切り用記号が挿入されることにより分割されて形成される連続した複数の区間を、互いに別個の文言を表すものとして扱う、
ことを特徴とする音声合成装置。 - 文章を表す文章情報を取得する文章情報取得手段と、
前記文章情報の少なくとも一部に対応する音片を表す音片データを複数記憶する音片記憶手段と、
各前記音片データのうちから、取得した前記文章情報が表す文章を構成する文言と読みが共通する音片データを選択し、又は、取得した前記文章情報が表す文章を構成する文言と読みが共通していて且つ韻律が韻律予測結果に所定の条件下で合致する文言を表す音片データを選択する選択手段と、
前記選択手段が選択した音片データを互いに結合することにより、合成音声を表すデータを生成する合成手段と、より構成されており、
前記選択手段は、取得した前記文章情報のうち、所定の表記法により表記されている区間を、隣接する他の区間とは別個の文言を表すものとして扱う、
ことを特徴とする音声合成装置。 - 文章を表す文章情報を取得し、当該文章情報のうち、所定の条件に合致する文言を表す区間を、当該条件に合致しない文言を表す複数の部分へと分割する処理を行う文章分割手段と、
前記文章情報の少なくとも一部に対応する音片を表す音片データを複数記憶する音片記憶手段と、
各前記音片データのうちから、前記処理を経た文章情報が表す文章を構成する文言と読みが共通する音片データを選択し、又は、各前記音片データのうちから、前記処理を経た文章情報が表す文章を構成する文言と読みが共通していて且つ韻律が韻律予測結果に所定の条件下で合致する文言を表す音片データを選択する選択手段と、
前記選択手段が選択した音片データを互いに結合することにより、合成音声を表すデータを生成する合成手段と、より構成される、
ことを特徴とする音声合成装置。 - 前記文章分割手段は、前記選択手段により選択される可能性が一定程度に達しない音片データの読みを表す文言を、前記条件に合致する文言として扱うものである、
ことを特徴とする請求項3に記載の音声合成装置。 - 前記文章分割手段は、前記文章情報取得手段が取得した文章を構成する文言のうち、その一部の読みが前記音片記憶手段に記憶される音片と一致し、且つ、当該所定区間全体では読みが一致する音片が前記音片記憶手段に記憶されていない文言を、前記条件に合致する文言として扱うものである、
ことを特徴とする請求項3に記載の音声合成装置。 - 前記文章分割手段は、前記区間内に区切り用の記号を挿入することにより、前記区間を分割するものである、
ことを特徴とする請求項3、4又は5に記載の音声合成装置。 - 前記文章分割手段は、前記条件を示す条件データを書き換え可能に記憶し、前記文章情報のうち、当該条件データが示す条件に合致する文言を表す区間を分割するものである、
ことを特徴とする請求項3乃至6のいずれか1項に記載の音声合成装置。 - 文章を表す文章情報を取得し、当該文章情報のうち、所定の条件に合致する文言を表す区間内の所定部分の表記を、所定の表記法による表記へと置換する処理を行う文章置換手段と、
前記文章情報の少なくとも一部に対応する音片を表す音片データを複数記憶する音片記憶手段と、
各前記音片データのうちから、前記処理を経た文章情報が表す文章を構成する文言と読みが共通する音片データを選択し、又は、前記処理を経た文章情報が表す文章を構成する文言と読みが共通していて且つ韻律が韻律予測結果に所定の条件下で合致する文言を表す音片データを選択する選択手段と、
前記選択手段が選択した音片データを互いに結合することにより、合成音声を表すデータを生成する合成手段と、より構成されており、
前記選択手段は、前記処理を経た文章情報のうち、前記表記法により表記されている部分については、隣接する他の部分とは別個の文言を表すものとして扱う、
ことを特徴とする音声合成装置。 - 前記文章置換手段は、前記選択手段により選択される可能性が一定程度に達しない音片データの読みを表す文言を、前記条件に合致する文言として扱うものである、
ことを特徴とする請求項8に記載の音声合成装置。 - 前記文章置換手段は、前記文章情報取得手段が取得した文章を構成する文言のうち、その一部の読みが前記音片記憶手段に記憶される音片と一致し、且つ、当該所定区間全体では読みが一致する音片が前記音片記憶手段に記憶されていない文言を、前記条件に合致する文言として扱うものである、
ことを特徴とする請求項8に記載の音声合成装置。 - 前記文章置換手段は、前記条件を示す条件データを書き換え可能に記憶し、前記文章情報のうち、当該条件データが示す条件に合致する文言を表す区間内の所定部分の表記を、前記表記法による表記へと置換するものである、
ことを特徴とする請求項8、9又は10に記載の音声合成装置。 - 取得した前記文章情報が表す文章を構成する文言のうち、前記選択手段が音片データを選択できなかった文言について、当該文言を読み上げる音声の波形を表す音声データを合成する欠落部分合成手段を更に備え、
前記合成手段は、前記選択手段が選択した音片データ及び前記欠落部分合成手段が合成した音声データを互いに結合することにより、合成音声を表すデータを生成する、
ことを特徴とする請求項1乃至11のいずれか1項に記載の音声合成装置。 - 前記音片記憶手段は、音片データが表す音片のピッチの時間変化を表す韻律データを、当該音片データに対応付けて記憶しており、
前記選択手段は、各前記音片データのうちから、前記処理を経た文章情報が表す文章を構成する文言と読みが共通しており、且つ、対応付けられている韻律データが表すピッチの時間変化が韻律の予測結果に最も近い音片データを選択する、
ことを特徴とする請求項1乃至12のいずれか1項に記載の音声合成装置。 - 文章を表す文章情報を取得する文章情報取得ステップと、
前記文章情報の少なくとも一部に対応する音片を表す音片データを複数記憶する音片記憶ステップと、
各前記音片データのうちから、取得した前記文章情報が表す文章を構成する文言と読みが共通する音片データを選択し、又は、取得した前記文章情報が表す文章を構成する文言と読みが共通していて且つ韻律が韻律予測結果に所定の条件下で合致する文言を表す音片データを選択する選択ステップと、
前記選択ステップで選択した音片データを互いに結合することにより、合成音声を表すデータを生成する合成ステップと、より構成されており、
前記選択ステップでは、取得した前記文章情報のうち、所定の区切り用記号が挿入されることにより分割されて形成される連続した複数の区間を、互いに別個の文言を表すものとして扱う、
ことを特徴とする音声合成方法。 - 文章を表す文章情報を取得する文章情報取得ステップと、
前記文章情報の少なくとも一部に対応する音片を表す音片データを複数記憶する音片記憶ステップと、
各前記音片データのうちから、取得した前記文章情報が表す文章を構成する文言と読みが共通する音片データを選択し、又は、取得した前記文章情報が表す文章を構成する文言と読みが共通していて且つ韻律が韻律予測結果に所定の条件下で合致する文言を表す音片データを選択する選択ステップと、
前記選択ステップで選択した音片データを互いに結合することにより、合成音声を表すデータを生成する合成ステップと、より構成されており、
前記選択ステップでは、取得した前記文章情報のうち、所定の表記法により表記されている区間を、隣接する他の区間とは別個の文言を表すものとして扱う、
ことを特徴とする音声合成方法。 - 文章を表す文章情報を取得し、当該文章情報のうち、所定の条件に合致する文言を表す区間を、当該条件に合致しない文言を表す複数の部分へと分割する処理を行う文章分割ステップと、
前記文章情報の少なくとも一部に対応する音片を表す音片データを複数記憶する音片記憶ステップと、
各前記音片データのうちから、前記処理を経た文章情報が表す文章を構成する文言と読みが共通する音片データを選択し、又は、前記処理を経た文章情報が表す文章を構成する文言と読みが共通していて且つ韻律が韻律予測結果に所定の条件下で合致する文言を表す音片データを選択する選択ステップと、
前記選択ステップで選択した音片データを互いに結合することにより、合成音声を表すデータを生成する合成ステップと、より構成される、
ことを特徴とする音声合成方法。 - 文章を表す文章情報を取得し、当該文章情報のうち、所定の条件に合致する文言を表す区間内の所定部分の表記を、所定の表記法による表記へと置換する処理を行う文章置換ステップと、
前記文章情報の少なくとも一部に対応する音片を表す音片データを複数記憶する音片記憶ステップと、
各前記音片データのうちから、前記処理を経た文章情報が表す文章を構成する文言と読みが共通する音片データを選択し、又は、前記処理を経た文章情報が表す文章を構成する文言と読みが共通していて且つ韻律が韻律予測結果に所定の条件下で合致する文言を表す音片データを選択する選択ステップと、
前記選択ステップで選択した音片データを互いに結合することにより、合成音声を表すデータを生成する合成ステップと、より構成されており、
前記選択ステップでは、前記処理を経た文章情報のうち、前記表記法により表記されている部分については、隣接する他の部分とは別個の文言を表すものとして扱う、
ことを特徴とする音声合成方法。 - コンピュータを、
文章を表す文章情報を取得する文章情報取得手段と、
前記文章情報の少なくとも一部に対応する音片を表す音片データを複数記憶する音片記憶手段と、
各前記音片データのうちから、取得した前記文章情報が表す文章を構成する文言と読みが共通する音片データを選択し、又は、取得した前記文章情報が表す文章を構成する文言と読みが共通していて且つ韻律が韻律予測結果に所定の条件下で合致する文言を表す音片データを選択する選択手段と、
前記選択手段が選択した音片データを互いに結合することにより、合成音声を表すデータを生成する合成手段と、して機能させるためのプログラムであって、
前記選択手段は、取得した前記文章情報のうち、所定の区切り用記号が挿入されることにより分割されて形成される連続した複数の区間を、互いに別個の文言を表すものとして扱う、
ことを特徴とするプログラム。 - コンピュータを、
文章を表す文章情報を取得する文章情報取得手段と、
前記文章情報の少なくとも一部に対応する音片を表す音片データを複数記憶する音片記憶手段と、
各前記音片データのうちから、取得した前記文章情報が表す文章を構成する文言と読みが共通する音片データを選択し、又は、取得した前記文章情報が表す文章を構成する文言と読みが共通していて且つ韻律が韻律予測結果に所定の条件下で合致する文言を表す音片データを選択する選択手段と、
前記選択手段が選択した音片データを互いに結合することにより、合成音声を表すデータを生成する合成手段と、して機能させるためのプログラムであって、
前記選択手段は、取得した前記文章情報のうち、所定の表記法により表記されている区間を、隣接する他の区間とは別個の文言を表すものとして扱う、
ことを特徴とするプログラム。 - コンピュータを、
文章を表す文章情報を取得し、当該文章情報のうち、所定の条件に合致する文言を表す区間を、当該条件に合致しない文言を表す複数の部分へと分割する処理を行う文章分割手段と、
前記文章情報の少なくとも一部に対応する音片を表す音片データを複数記憶する音片記憶手段と、
各前記音片データのうちから、前記処理を経た文章情報が表す文章を構成する文言と読みが共通する音片データを選択し、又は、前記処理を経た文章情報が表す文章を構成する文言と読みが共通していて且つ韻律が韻律予測結果に所定の条件下で合致する文言を表す音片データを選択する選択手段と、
前記選択手段が選択した音片データを互いに結合することにより、合成音声を表すデータを生成する合成手段と、
して機能させるためのプログラム。 - コンピュータを、
文章を表す文章情報を取得し、当該文章情報のうち、所定の条件に合致する文言を表す区間内の所定部分の表記を、所定の表記法による表記へと置換する処理を行う文章置換手段と、
前記文章情報の少なくとも一部に対応する音片を表す音片データを複数記憶する音片記憶手段と、
各前記音片データのうちから、前記処理を経た文章情報が表す文章を構成する文言と読みが共通する音片データを選択し、又は、前記処理を経た文章情報が表す文章を構成する文言と読みが共通していて且つ韻律が韻律予測結果に所定の条件下で合致する文言を表す音片データを選択する選択手段と、
前記選択手段が選択した音片データを互いに結合することにより、合成音声を表すデータを生成する合成手段と、して機能させるためのプログラムであって、
前記選択手段は、前記処理を経た文章情報のうち、前記表記法により表記されている部分については、隣接する他の部分とは別個の文言を表すものとして扱う、
ことを特徴とするプログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2004333427A JP2006145690A (ja) | 2004-11-17 | 2004-11-17 | 音声合成装置、音声合成方法及びプログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2004333427A JP2006145690A (ja) | 2004-11-17 | 2004-11-17 | 音声合成装置、音声合成方法及びプログラム |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2006145690A true JP2006145690A (ja) | 2006-06-08 |
Family
ID=36625497
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2004333427A Pending JP2006145690A (ja) | 2004-11-17 | 2004-11-17 | 音声合成装置、音声合成方法及びプログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2006145690A (ja) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102394061A (zh) * | 2011-11-08 | 2012-03-28 | 中国农业大学 | 基于语义检索的文语转换方法及系统 |
CN110622240A (zh) * | 2017-05-24 | 2019-12-27 | 日本放送协会 | 语音向导生成装置、语音向导生成方法及广播系统 |
-
2004
- 2004-11-17 JP JP2004333427A patent/JP2006145690A/ja active Pending
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102394061A (zh) * | 2011-11-08 | 2012-03-28 | 中国农业大学 | 基于语义检索的文语转换方法及系统 |
CN102394061B (zh) * | 2011-11-08 | 2013-01-02 | 中国农业大学 | 基于语义检索的文语转换方法及系统 |
CN110622240A (zh) * | 2017-05-24 | 2019-12-27 | 日本放送协会 | 语音向导生成装置、语音向导生成方法及广播系统 |
CN110622240B (zh) * | 2017-05-24 | 2023-04-14 | 日本放送协会 | 语音向导生成装置、语音向导生成方法及广播系统 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP4516863B2 (ja) | 音声合成装置、音声合成方法及びプログラム | |
KR101076202B1 (ko) | 음성 합성 장치, 음성 합성 방법 및 프로그램이 기록된 기록 매체 | |
JP4620518B2 (ja) | 音声データベース製造装置、音片復元装置、音声データベース製造方法、音片復元方法及びプログラム | |
JP4287785B2 (ja) | 音声合成装置、音声合成方法及びプログラム | |
WO2011004502A1 (ja) | 音声編集合成装置及び音声編集合成方法 | |
JP4264030B2 (ja) | 音声データ選択装置、音声データ選択方法及びプログラム | |
JP2005018036A (ja) | 音声合成装置、音声合成方法及びプログラム | |
JP4411017B2 (ja) | 話速変換装置、話速変換方法及びプログラム | |
JP2006145690A (ja) | 音声合成装置、音声合成方法及びプログラム | |
JP4574333B2 (ja) | 音声合成装置、音声合成方法及びプログラム | |
JPH08335096A (ja) | テキスト音声合成装置 | |
JP4407305B2 (ja) | ピッチ波形信号分割装置、音声信号圧縮装置、音声合成装置、ピッチ波形信号分割方法、音声信号圧縮方法、音声合成方法、記録媒体及びプログラム | |
JP4209811B2 (ja) | 音声選択装置、音声選択方法及びプログラム | |
JP2007108450A (ja) | 音声再生装置、音声配信装置、音声配信システム、音声再生方法、音声配信方法及びプログラム | |
JP4620517B2 (ja) | 音声データベース製造装置、音片復元装置、音声データベース製造方法、音片復元方法及びプログラム | |
JP4184157B2 (ja) | 音声データ管理装置、音声データ管理方法及びプログラム | |
JP2006145848A (ja) | 音声合成装置、音片記憶装置、音片記憶装置製造装置、音声合成方法、音片記憶装置製造方法及びプログラム | |
JP4816067B2 (ja) | 音声データベース製造装置、音声データベース、音片復元装置、音声データベース製造方法、音片復元方法及びプログラム | |
JP2006195207A (ja) | 音声合成装置、音声合成方法及びプログラム | |
JP4780188B2 (ja) | 音声データ選択装置、音声データ選択方法及びプログラム | |
KR20100003574A (ko) | 음성음원정보 생성 장치 및 시스템, 그리고 이를 이용한음성음원정보 생성 방법 | |
JP2007240989A (ja) | 音声合成装置、音声合成方法及びプログラム | |
JP2004361944A (ja) | 音声データ選択装置、音声データ選択方法及びプログラム | |
JP2007240987A (ja) | 音声合成装置、音声合成方法及びプログラム | |
JP2007240990A (ja) | 音声合成装置、音声合成方法及びプログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20070116 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20091029 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20091117 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20100112 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20100302 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20101005 |