JP2006284700A - 音声合成装置および音声合成処理プログラム - Google Patents

音声合成装置および音声合成処理プログラム Download PDF

Info

Publication number
JP2006284700A
JP2006284700A JP2005101739A JP2005101739A JP2006284700A JP 2006284700 A JP2006284700 A JP 2006284700A JP 2005101739 A JP2005101739 A JP 2005101739A JP 2005101739 A JP2005101739 A JP 2005101739A JP 2006284700 A JP2006284700 A JP 2006284700A
Authority
JP
Japan
Prior art keywords
phoneme
accent
accent type
symbol string
combination
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2005101739A
Other languages
English (en)
Inventor
Hiroyuki Hirai
啓之 平井
Seiji Tsuchiya
誠司 土屋
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sanyo Electric Co Ltd
Original Assignee
Sanyo Electric Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sanyo Electric Co Ltd filed Critical Sanyo Electric Co Ltd
Priority to JP2005101739A priority Critical patent/JP2006284700A/ja
Publication of JP2006284700A publication Critical patent/JP2006284700A/ja
Pending legal-status Critical Current

Links

Images

Landscapes

  • Telephone Function (AREA)

Abstract

【課題】 この発明は、読みの情報から少ない辞書を用いて効率的にアクセント型を推定できる音声合成装置を提供することを目的とする。
【解決手段】 名前の読みの情報に対応する音素記号列を決定する第1手段、予め定められた複数の音素位置の組合せに対して、音素位置と音素との組合せ毎に、アクセント型とその発生確率を記憶したアクセント型テーブル、第1手段によって決定された上記音素記号列を構成する各音素とアクセント型テーブルとに基づいて、上記音素記号列に対応する音素位置と音素との組合せに該当する全てのアクセント型とその発生確率をアクセント型テーブルから取得する第2手段、ならびに第2手段によって取得した全てのアクセント型のうち、発生確率の最も高いアクセント型を、上記音素記号列に適したアクセント型として決定する第3手段を備えている。
【選択図】 図2

Description

この発明は、音声合成装置および音声合成処理プログラムに関する。
電話に搭載される音声合成に関するアプリケーションの1つに、名前を読み上げるものがある。つまり、電話受信時の相手の電話番号やメール受信時の相手のメールアドレスを、自機に予め登録した電話番号/名前テーブルまたはメールアドレス/名前テーブルと照合して、相手の名前情報を取得し、取得した名前情報を音声合成により音声出力する。
従来は、上記テーブルには、漢字と読みとしてのひらがな(カタカナ)との両方が登録されている。そして、漢字に基づいて、アクセント型が推定されている。従来のアクセント型の推定方法では、基本的には、語頭および語尾の漢字毎に、アクセント型の傾向の度合いを計算し、最も傾向の高いアクセント型を選択する。語頭および語尾で傾向の高いアクセント型が異なる場合には、発生確率が高い方のアクセントを選択する。
従来技術において、全ての漢字に対するアクセント型を登録することは、メモリ量の増加を意味し、実際には困難である。登録されていない漢字については、異なるルールを別に用意する必要がある。
この発明は、読みの情報から少ない辞書を用いて効率的にアクセント型を推定できる音声合成装置および音声合成処理プログラムを提供することを目的とする。
請求項1に記載の発明は、名前の読みの情報に対応する音素記号列を決定する第1手段、予め定められた複数の音素位置の組合せに対して、音素位置と音素との組合せ毎に、アクセント型とその発生確率を記憶したアクセント型テーブル、第1手段によって決定された上記音素記号列を構成する各音素とアクセント型テーブルとに基づいて、上記音素記号列に対応する音素位置と音素との組合せに該当する全てのアクセント型とその発生確率をアクセント型テーブルから取得する第2手段、ならびに第2手段によって取得した全てのアクセント型のうち、発生確率の最も高いアクセント型を、上記音素記号列に適したアクセント型として決定する第3手段を備えていることを特徴とする。
請求項2に記載の発明は、名前の読みの情報に対応する音素記号列を決定する第1手段、音素を調音動作および調音位置に基づいてグループ分けすることによって作成されかつ音素と音素グループとの対応関係を記憶した音素−音素グループテーブル、第1手段によって決定された音素記号列を構成する各音素に対応する音素グループを、音素−音素グループテーブルに基づいて決定する第2手段、予め定められた複数の音素位置の組合せに対して、音素位置と音素グループとの組合せ毎に、アクセント型とその発生確率を記憶したアクセント型テーブル、第2手段によって決定された上記音素記号列を構成する各音素に対応する音素グループとアクセント型テーブルとに基づいて、上記音素記号列に対応する音素位置と音素グループとの組合せに該当する全てのアクセント型とその発生確率をアクセント型テーブルから取得する第3手段、ならびに第3手段によって取得した全てのアクセント型のうち、発生確率の最も高いアクセント型を、上記音素記号列に適したアクセント型として決定する第4手段を備えていることを特徴とする。
請求項3に記載の発明は、請求項1乃至2に記載の発明において、アクセント型テーブルは予め用意した複数の名前とそのアクセント型に基づいて、作成されていることを特徴とする。
請求項4に記載の発明は、請求項3に記載の発明において、アクセント型テーブルには、アクセント型の発生確率が所定の閾値より大きなもののみが登録されていることを特徴とする。
請求項5に記載の発明は、音声合成処理プログラムであって、名前の読みの情報に対応する音素記号列を決定する第1ステップ、予め定められた複数の音素位置の組合せに対して、音素位置と音素との組合せ毎に、アクセント型とその発生確率を記憶したアクセント型テーブルと、第1ステップによって決定された上記音素記号列を構成する各音素とに基づいて、上記音素記号列に対応する音素位置と音素との組合せに該当する全てのアクセント型とその発生確率をアクセント型テーブルから取得する第2ステップ、ならびに第2ステップによって取得した全てのアクセント型のうち、発生確率の最も高いアクセント型を、上記音素記号列に適したアクセント型として決定する第3ステップをコンピュータに実行させるためのプログラムであることを特徴とする。
請求項6に記載の発明は、音声合成処理プログラムであって、名前の読みの情報に対応する音素記号列を決定する第1ステップ、音素を調音動作および調音位置に基づいてグループ分けすることによって作成されかつ音素と音素グループとの対応関係を記憶した音素−音素グループテーブルに基づいて、第1ステップによって決定された音素記号列を構成する各音素に対応する音素グループを決定する第2ステップ、予め定められた複数の音素位置の組合せに対して、音素位置と音素グループとの組合せ毎に、アクセント型とその発生確率を記憶したアクセント型テーブルと、第2ステップによって決定された上記音素記号列を構成する各音素に対応する音素グループとに基づいて、上記音素記号列に対応する音素位置と音素グループとの組合せに該当する全てのアクセント型とその発生確率をアクセント型テーブルから取得する第3ステップ、ならびに第3ステップによって取得した全てのアクセント型のうち、発生確率の最も高いアクセント型を、上記音素記号列に適したアクセント型として決定する第4ステップをコンピュータに実行させるためのプログラムであることを特徴とする。
請求項7に記載の発明は、請求項5乃至6に記載の発明において、アクセント型テーブルは予め用意した複数の名前とそのアクセント型に基づいて、作成されていることを特徴とする。
請求項8に記載の発明は、請求項7に記載の発明において、アクセント型テーブルには、アクセント型の発生確率が所定の閾値より大きなもののみが登録されていることを特徴とする。
この発明によれば、読みの情報から少ない辞書を用いて効率的にアクセント型を推定できるようになる。
以下、図面を参照して、この発明の実施例について説明する。
〔1〕日本語のアクセント型についての説明
まず、日本語のアクセント型について説明する。以下の説明において、モーラとは、韻律論において、強勢や抑揚などの単位となる音の相対的長さをいう。一般的には、1モーラは、短母音を含む1音節の長さに相当する。日本語のアクセントは、モーラの音程で表される。
東京方言では、音程について、次のようなアクセント規則が成立する。
(1)1単語における第1モーラと第2モーラとは、音程が異なる。
(2)1単語において、音程が下がるのは1箇所である。
(3)音程が下がる位置に応じて、アクセント型が決定する。
例えば、4モーラからなる”マツムラ”を例にとると、図7に(a)〜(e)で示すように、5種類のアクセント型が成立する。
図7(a)は、0型を示している。0型では、第1モーラの音程が低く、第2モーラ以降のモーラの音程が高くなっている。つまり、音程が下がる箇所が0であるので0型と呼ばれる。
図7(b)は、1型を示している。1型では、第1モーラの音程が高く、第2モーラ以降のモーラの音程が低くなっている。つまり、音程は、第1モーラの後に低くなるので1型と呼ばれる。
図7(c)は、2型を示している。2型では、第1モーラの音程が高く、第2モーラの音程が高く、第3モーラ以降のモーラの音程が低くなっている。つまり、音程は、第2モーラの後に低くなるので2型と呼ばれる。
図7(d)は、3型を示している。3型では、第1モーラの音程が高く、第2モーラおよび第3モーラの音程が高く、第4モーラ以降のモーラの音程が低くなっている。つまり、音程は、第3モーラの後に低くなるので3型と呼ばれる。
図7(e)は、4型を示している。4型では、第1モーラの音程が高く、第2モーラ、第3モーラおよび第4モーラの音程が高く、第5モーラ以降のモーラの音程が低くなっている。つまり、音程は、第4モーラの後に低くなるので4型と呼ばれる。
このように、モーラ数がnからなる単語の場合、アクセント型は、0型からn型までの(n+1)種類存在する。
〔2〕電話機に適用した場合の実施例についての説明
以下、この発明をナンバーディスプレイ対応電話機に適用した場合の実施例について説明する。ナンバーディスプレイ対応電話機とは、電話をかけてきた相手方の電話番号を電話機の表示部に表示することが可能な電話機をいう。
図1は、電話をかけてきた相手方の電話番号を電話機の表示部に表示する機能の他、電話をかけてきた相手方の名前を音声合成によって音声出力する機能をも備えたナンバーディスプレイ対応電話機の構成を示している。
受信部1は、公衆電話回線に接続され、受信した電話番号情報および音声情報を取得する。音声情報は、通常の電話機と同様に再生出力される。
送信元番号抽出部2は、受信部1で受信した情報のうち、送信元の電話番号情報を抽出する。送信元番号抽出部2で抽出された電話番号情報は、表示部3に表示される。
登録データ検索部4は、登録データベース5を検索して、送信元番号抽出部2で抽出された電話番号情報に対応する名前情報を取得する。登録データ検索部4は、取得した名前情報を表示部3に送るとともに、文字情報解析部6に送る。表示部3では、登録データ検索部4から送られてきた名前情報が表示される。
登録データベース5には、図3に示すように、予めユーザによって登録された、電話番号情報および名前情報が、登録番号毎に格納されている。図3の例では、名前情報はカタカナの文字情報であるが、平仮名の文字情報であってもよい。
文字情報解析部6は、登録データ検索部4から送られてきた名前情報を解析して、当該名前情報に対応するアンセント型を判別し、当該名前情報に対応する音素列と各音素の音程を示す情報とを音声波形生成部7に送る。
音声波形生成部7は、文字情報解析部6から送られてきた音素列と各音素の音程を示す情報との情報とに基づいて、当該音素列に対応する音声波形であってかつ文字情報解析部6によって判別されたアクセント型に応じた音声波形を生成する。音声波形生成部7によって生成された音声波形はスピーカ8によって音声出力される。
なお、送信元番号抽出部2、登録データ検索部4、文字情報解析部6および音声波形生成部7は、ソフトウエア(音声合成処理プログラム)を搭載したマイクロコンピュータによって実現される。
図2は、文字情報解析部6の構成を示している。
文字情報解析部6は、音素記号列決定部11、母音・子音分解部12、モーラ数算出部13、音素−音素グループ変換部14およびアクセント決定部15からなる。
音素記号列決定部11は、登録データ検索部4から送られてきた名前情報に対応する音素記号列を決定する。例えば、文字情報が”マツムラ”であれば、音素記号列”matsumura”を生成する。
母音・子音分解部12は、音素記号列決定部11によって決定された音素記号列を、母音と子音とに分解する。音素記号列が”matsumura”であれば、子音”m”、母音”a”、子音”ts”、母音”u”、子音”m”、母音”u”、子音”r”、母音”a”というように、音素記号列が子音と母音とに分解される。つまり、音素記号列”matsumura”は、”m/a/ts/u/m/u/r/a”の音素に分割される。
モーラ数算出部13は、母音・子音分解部12によって分解された母音と子音とに基づいて、モーラ数を算出する。原則的には、子音+母音の組合せが1モーラを構成する。ただし、子音を伴わない母音、撥音、促音、長音も、1モーラを構成する。
音素−音素グループ変換部14は、音素−音素グループテーブル21を用いて、母音・子音分解部12によって分解された各音素をグループ分けする。言い換えれば、音素記号列決定部11によって決定された音素記号列の各音素を音素グループに変換する。
図4は、音素−音素グループテーブルの内容例を示している。
音素−音素グループテーブルは、各音素がどの音素グループに属するかを記憶したテーブルである。音素のグループ分けは、音声を発声する場合の調音動作、調音位置に基づいて行われている。
各音素グループと調音動作、調音位置との関係は、次の通りである。
G1:舌の位置が低い母音
G2:舌の位置が高い母音、 G3:N(撥音) 口から音がでない有声音声
G4:子音を伴わない音節
G5:破裂音
G6:摩擦音
G7:鼻音
G8:反母音
G9:有声子音
なお、音素記号列は、奇数番目と偶数番目を合わせて1モーラの音節を表しており、音素グループG1〜G3は、単語(名前)の音素記号列において偶数番目にくる音素であり、音素グループG4以降は単語(名前)の音素記号列において奇数番目にくる音素となる。
例えば、音素記号列を構成する音素が、”m/a/ts/u/m/u/r/a”であれば、各音素位置に対応する音素グループは、図5に示すようになる。
アクセント決定部15は、名前情報に対応する音素記号列に対して音素−音素グループ変換部14によって得られた音素位置毎の音素グループと、モーラ数毎に作成されたアクセント型テーブル22を用いて、当該音素記号列に対するアクセント型を決定し、決定したアクセント型に基づいて当該音素記号列を構成する各音素の音程を決定する。
図6は、モーラ数が4に対応するアクセント型テーブルの一例を示している。
アクセント型テーブルには、音素位置と音素グループとの様々な組合せ毎に、アクセント型とその発生確率とが格納されている。
アクセント型テーブルは、実際の名前とそのアクセント型とを分析することによって作成されている。所定のモーラ数に対するアクセント型テーブルの作成方法について説明する。所定のモーラ数を持つ名前において、予めアクセント型に影響を与えると予想できる音素位置の組合せを決定する。そして、所定のモーラ数を持つ全ての名前とそのアクセント型に基づいて、上記音素の組合せ毎に、その組合せの音素位置と音素グループの組合せに対するアクセント型のデータを作成する。そして、音素位置と音素グループとの各組合わせ毎に、アクセント型の発生確率を計算する。発生確率がある閾値より大きなもののみを、当該モーラ数に対するアクセント型テーブルとして登録する。
アクセント決定部15は、まず、名前情報に対応する音素記号列に対して音素−音素グループ変換部14によって得られた音素位置毎の音素グループと、当該音素記号列のモーラ数に対応するアクセント型テーブル内の各エントリとを比較し、音素位置と音素グループとの組合せが一致するエントリのアクセント型と発生確率とを取得する。
そして、取得した各エントリのアクセント型のうち、発生確率が最も高いアクセント型を、当該音素記号列に対するアクセント型として決定する。そして、決定されたアクセント型に基づいて、当該音素記号列を構成する各音素毎に音程を決定する。つまり、音素記号列を構成する各音素毎に音程が高いか低いかを決定する。
音素記号列が”matsumura”である場合には、図6のアクセント型テーブルのうち、エントリー番号が”2”、”5”および”7”のエントリが、当該音素記号列に対して音素−音素グループ変換部14によって得られた音素位置毎の音素グループと一致する。エントリー番号”2”、”5”、”7”のアクセント型のうち、発生確率が最も高いのは、エントリー番号”2”のアクセント型(2型)であるので、音素記号列”matsumura”に対するアクセント型は2型となる。つまり、第1モーラの音程が高く、第2モーラの音程が高く、第3モーラ以降のモーラの音程が低くなる。したがって、音素記号列”matsumura”のうち、”matsu”を構成する各音素”m/a/ts/u”の音程が高く、”mura”を構成する各音素”m/u/r/a”の音程が低くなる。
上記実施例では、名前情報に対応する音素記号列を構成する各音素を音素グループに一旦変換し、各音素位置に対応する音素グループの情報と、アクセント型テーブルとに基づいて、当該名前情報に対応するアクセント型を決定しているが、名前情報に対応する音素記号列を構成する各音素を音素グループに変換せずに当該名前情報に対応するアクセント型を決定することもできる。
名前情報に対応する音素記号列を構成する各音素を音素グループに変換しない場合には、アクセント型テーブルとして、予め定められた複数の音素位置の組合せに対して、音素位置と音素との組合せ毎に、アクセント型とその発生確率を記憶したものを用い、名前情報に対応する音素記号列を構成する各音素とアクセント型テーブルとに基づいて、この音素記号列に対応する音素位置と音素との組合せに該当する全てのアクセント型とその発生確率をアクセント型テーブルから取得し、取得した全てのアクセント型のうち、発生確率の最も高いアクセント型を、この音素記号列に適したアクセント型として決定すればよい。
なお、この発明は、携帯型電話機等において、電子メールを受信したときに、電子メールの送り元の名前を音声合成によって音声合成する場合にも適用することができる。この場合には、登録データベース5に、予めユーザによって登録された電子メールアドレスおよびそれに対応する名前情報が格納される。
ナンバーディスプレイ対応電話機の構成を示すブロック図である。 文字情報解析部6の構成を示すブロック図である。 登録データベース5の内容の一部を示す模式図である。 音素−音素グループテーブル21の内容の一部を示す模式図である。 音素記号列が”matsumura”である場合、各音素位置に対応する音素グループを示す模式図である。 モーラ数が4に対応するアクセント型テーブルの内容の一部を示す模式図である。 日本語のアクセント型を説明するための模式図である。
符号の説明
6 文字情報解析部
11 音素記号列決定部
12 母音・子音分解部
13 モーラ数算出部
14 音素−音素グループ変換部
15 アクセント決定部
21 音素−音素グループテーブル
22 アクセント型テーブル

Claims (8)

  1. 名前の読みの情報に対応する音素記号列を決定する第1手段、
    予め定められた複数の音素位置の組合せに対して、音素位置と音素との組合せ毎に、アクセント型とその発生確率を記憶したアクセント型テーブル、
    第1手段によって決定された上記音素記号列を構成する各音素とアクセント型テーブルとに基づいて、上記音素記号列に対応する音素位置と音素との組合せに該当する全てのアクセント型とその発生確率をアクセント型テーブルから取得する第2手段、ならびに
    第2手段によって取得した全てのアクセント型のうち、発生確率の最も高いアクセント型を、上記音素記号列に適したアクセント型として決定する第3手段、 を備えていることを特徴とする音声合成装置。
  2. 名前の読みの情報に対応する音素記号列を決定する第1手段、
    音素を調音動作および調音位置に基づいてグループ分けすることによって作成されかつ音素と音素グループとの対応関係を記憶した音素−音素グループテーブル、
    第1手段によって決定された音素記号列を構成する各音素に対応する音素グループを、音素−音素グループテーブルに基づいて決定する第2手段、
    予め定められた複数の音素位置の組合せに対して、音素位置と音素グループとの組合せ毎に、アクセント型とその発生確率を記憶したアクセント型テーブル、
    第2手段によって決定された上記音素記号列を構成する各音素に対応する音素グループとアクセント型テーブルとに基づいて、上記音素記号列に対応する音素位置と音素グループとの組合せに該当する全てのアクセント型とその発生確率をアクセント型テーブルから取得する第3手段、ならびに
    第3手段によって取得した全てのアクセント型のうち、発生確率の最も高いアクセント型を、上記音素記号列に適したアクセント型として決定する第4手段、 を備えていることを特徴とする音声合成装置。
  3. アクセント型テーブルは予め用意した複数の名前とそのアクセント型に基づいて、作成されていることを特徴とする請求項1および2のいずれかに記載の音声合成装置。
  4. アクセント型テーブルには、アクセント型の発生確率が所定の閾値より大きなもののみが登録されていることを特徴とする請求項3に記載の音声合成装置。
  5. 音声合成処理プログラムであって、
    名前の読みの情報に対応する音素記号列を決定する第1ステップ、
    予め定められた複数の音素位置の組合せに対して、音素位置と音素との組合せ毎に、アクセント型とその発生確率を記憶したアクセント型テーブルと、第1ステップによって決定された上記音素記号列を構成する各音素とに基づいて、上記音素記号列に対応する音素位置と音素との組合せに該当する全てのアクセント型とその発生確率をアクセント型テーブルから取得する第2ステップ、ならびに
    第2ステップによって取得した全てのアクセント型のうち、発生確率の最も高いアクセント型を、上記音素記号列に適したアクセント型として決定する第3ステップ、 をコンピュータに実行させるための音声合成処理プログラム。
  6. 音声合成処理プログラムであって、
    名前の読みの情報に対応する音素記号列を決定する第1ステップ、
    音素を調音動作および調音位置に基づいてグループ分けすることによって作成されかつ音素と音素グループとの対応関係を記憶した音素−音素グループテーブルに基づいて、第1ステップによって決定された音素記号列を構成する各音素に対応する音素グループを決定する第2ステップ、
    予め定められた複数の音素位置の組合せに対して、音素位置と音素グループとの組合せ毎に、アクセント型とその発生確率を記憶したアクセント型テーブルと、第2ステップによって決定された上記音素記号列を構成する各音素に対応する音素グループとに基づいて、上記音素記号列に対応する音素位置と音素グループとの組合せに該当する全てのアクセント型とその発生確率をアクセント型テーブルから取得する第3ステップ、ならびに
    第3ステップによって取得した全てのアクセント型のうち、発生確率の最も高いアクセント型を、上記音素記号列に適したアクセント型として決定する第4ステップ、
    をコンピュータに実行させるための音声合成処理プログラム。
  7. アクセント型テーブルは予め用意した複数の名前とそのアクセント型に基づいて、作成されていることを特徴とする請求項5および6のいずれかに記載の音声合成処理プログラム。
  8. アクセント型テーブルには、アクセント型の発生確率が所定の閾値より大きなもののみが登録されていることを特徴とする請求項7に記載の音声合成処理プログラム。
JP2005101739A 2005-03-31 2005-03-31 音声合成装置および音声合成処理プログラム Pending JP2006284700A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2005101739A JP2006284700A (ja) 2005-03-31 2005-03-31 音声合成装置および音声合成処理プログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2005101739A JP2006284700A (ja) 2005-03-31 2005-03-31 音声合成装置および音声合成処理プログラム

Publications (1)

Publication Number Publication Date
JP2006284700A true JP2006284700A (ja) 2006-10-19

Family

ID=37406733

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2005101739A Pending JP2006284700A (ja) 2005-03-31 2005-03-31 音声合成装置および音声合成処理プログラム

Country Status (1)

Country Link
JP (1) JP2006284700A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009237564A (ja) * 2008-03-05 2009-10-15 Panasonic Electric Works Co Ltd 音声合成用データの選択方法

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009237564A (ja) * 2008-03-05 2009-10-15 Panasonic Electric Works Co Ltd 音声合成用データの選択方法

Similar Documents

Publication Publication Date Title
US5949961A (en) Word syllabification in speech synthesis system
EP1168299B1 (en) Method and system for preselection of suitable units for concatenative speech
TWI539441B (zh) 語音辨識方法及電子裝置
EP1071074A2 (en) Speech synthesis employing prosody templates
WO2005034082A1 (en) Method for synthesizing speech
JP2006048056A (ja) 混合言語テキスト音声合成
JP5198046B2 (ja) 音声処理装置及びそのプログラム
KR20150105075A (ko) 자동 통역 장치 및 방법
JP3415585B2 (ja) 統計的言語モデル生成装置、音声認識装置及び情報検索処理装置
JP5152588B2 (ja) 声質変化判定装置、声質変化判定方法、声質変化判定プログラム
RU2320026C2 (ru) Преобразование буквы в звук для синтезированного произношения сегмента текста
Alam et al. Text to speech for Bangla language using festival
JP2006284700A (ja) 音声合成装置および音声合成処理プログラム
JP3685648B2 (ja) 音声合成方法及び音声合成装置、並びに音声合成装置を備えた電話機
JP3366253B2 (ja) 音声合成装置
JP2000056789A (ja) 音声合成装置及び電話機
US20090132237A1 (en) Orthogonal classification of words in multichannel speech recognizers
JP3655808B2 (ja) 音声合成装置および音声合成方法、携帯端末器、並びに、プログラム記録媒体
JP2001092482A (ja) 音声合成システム、および音声合成方法
JPH09237096A (ja) 漢字説明方法及び装置
Khaw et al. Preparation of MaDiTS corpus for Malay dialect translation and speech synthesis system.
JPH11212586A (ja) 音声合成装置
JP2010085581A (ja) 歌詞データ表示装置、歌詞データ表示方法、歌詞データ表示プログラム
JPH11282494A (ja) 音声合成装置および記憶媒体
Bharthi et al. Unit selection based speech synthesis for converting short text message into voice message in mobile phones