JP2006330060A - 音声合成装置、音声処理装置、およびプログラム - Google Patents
音声合成装置、音声処理装置、およびプログラム Download PDFInfo
- Publication number
- JP2006330060A JP2006330060A JP2005149423A JP2005149423A JP2006330060A JP 2006330060 A JP2006330060 A JP 2006330060A JP 2005149423 A JP2005149423 A JP 2005149423A JP 2005149423 A JP2005149423 A JP 2005149423A JP 2006330060 A JP2006330060 A JP 2006330060A
- Authority
- JP
- Japan
- Prior art keywords
- information
- impression
- vocabulary
- prosodic
- voice
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Abstract
【解決手段】語彙情報と、語彙の印象情報を1以上有する印象群情報を含む印象付語彙情報を1以上格納している印象付語彙情報格納部と、印象情報と、語彙の韻律情報の関係を示す情報である印象韻律関係情報を格納している印象韻律関係情報格納部と、1以上の語彙情報を有する出力情報を格納している出力情報格納部と、前記出力情報が有する語彙情報と対になる印象群情報を、前記語彙情報格納部から取得する印象群情報取得部と、前記印象韻律関係情報と前記印象群情報に基づいて、語彙の韻律情報を決定する韻律情報決定部と、前記韻律情報に基づいて、前記出力情報を出力する音声出力部と、を具備する音声合成装置により、場面に適した韻律が付与された音声を出力できる。
【選択図】図1
Description
Riley M.D., Tree-based modeling of segmental durations, Talking Machines edited by G.Bailly et al, North-Holland, ,1992, pp.265-274 Sagisaka Y., On the prediction of global F0 shape for Japanese text-to-speech, Proc. ICASSP, 1990, pp.325-328 Tokuda, K., Masuko, T., Miyazaki, N., and Kobayashi, T., Hidden Markov models based on multispace probability distribution for pitch pattern modeling, Proc. ICASSP, 1999, pp.229-232 Traber C., SVOX: The implementation of a Text-to-Speech System for German, 1992, TIK-Schriftenreihe Nr 7
かかる構成により、場面に適した韻律が付与された音声が出力できる。
かかる構成により、場面に適した韻律が付与された音声が出力できる。
かかる構成により、場面に適した韻律が付与された音声が出力できる。
かかる構成により、場面に適した韻律が付与された音声が出力できる。
かかる構成により、場面に適した韻律が付与された音声が出力できる。
かかる構成により、場面に適した韻律が付与された音声が出力できる。
かかる構成により、場面に適した韻律が付与された音声が出力できる。
かかる構成により、受け付けた音声の語彙から受ける印象に応じた処理ができる。
また、本第九の発明の音声処理装置は、第八の発明に対して、前記処理部は、前記印象群情報が示す印象に対応する情報を視覚的に出力する音声処理装置である。
かかる構成により、受け付けた音声の語彙から受ける印象を示すことができる。
また、本第十の発明の音声処理装置は、第八の発明に対して、前記処理部は、前記印象群情報が示す印象に対応する情報を音出力する音声処理装置である。
かかる構成により、受け付けた音声の語彙から受ける印象を示すことができる。
かかるデータ構造は、音声処理に適したデータ構造である。
(実施の形態1)
本実施の形態において、場面に適した韻律が付与された音声の出力ができる音声合成装置について説明する。
図1は、本実施の形態における音声合成装置のブロック図である。
音声合成装置は、印象付語彙情報格納部11、印象韻律関係情報格納部12、出力情報格納部13、印象群情報取得部14、韻律情報決定部15、音声出力部16を具備する。
次に、音声合成装置の動作について図2のフローチャートを用いて説明する。
(ステップS201)印象群情報取得部14は、出力情報格納部13の出力情報を取得する。
(ステップS203)印象群情報取得部14は、カウンタiに1を代入する。
(ステップS205)印象群情報取得部14は、i番目の語彙情報に対応する印象群情報を、印象付語彙情報格納部11から取得する。
(ステップS207)韻律情報決定部15は、i番目の語彙情報が示す語彙の韻律情報を決定する。韻律情報を決定するアルゴリズムの詳細は、図3のフローチャートを用いて説明する。
(ステップS208)音声出力部16は、ステップS207またはステップS210で決定した韻律情報に基づいて、i番目の語彙情報を音声出力する。
(ステップS209)音声出力部16は、カウンタiを1、インクリメントする。ステップS204に行く。
(ステップS210)韻律情報決定部15は、デフォルトの韻律情報を取得する。デフォルトの韻律情報は、例えば、韻律情報決定部15が予め保持している。
次に、上記のステップS207の韻律情報を決定するアルゴリズムの具体例について、図3のフローチャートを用いて説明する。
(ステップS309)韻律情報決定部15は、時間変化情報(韻律情報の一種)をデフォルト値に設定する。
(ステップS310)韻律情報決定部15は、発話時間情報(韻律情報の一種)をデフォルト値に設定する。上位関数にリターンする。
以下、本実施の形態における音声合成装置の具体的な動作について説明する。
図4は、印象群情報のデータ構造例を説明する図である。図4(a)は印象群情報のデータ構造例であり、図4(b)はデータ構造例が示すデータの意義を説明する図である。
かかる場合、本音声合成装置は、図示しない手段により、出力情報「それは、絶対違う。」の入力を受け付けた、とする。かかる出力情報は、例えば、キーボードにより、入力された情報である。
そして、音声合成装置の出力情報格納部13は、出力情報「それは、絶対違う。」を格納している、とする。
次に、印象群情報取得部14は、出力情報格納部13の出力情報「それは、絶対違う。」を読み出す。
次に、印象群情報取得部14は、出力情報「それは、絶対違う。」を語彙情報に分解し、1以上の語彙情報(「それは」「絶対」「違う」)を得る。
次に、音声出力部16は、読み上げ調で、1番目の語彙情報「それは」を出力する。
次に、音声出力部16は、取得した韻律情報(時間変化情報、発話時間情報、周波数高低情報)に基づいて、2番目の語彙情報「絶対」を出力する。
次に、音声出力部16は、取得した韻律情報(時間変化情報、発話時間情報、周波数高低情報)に基づいて、3番目の語彙情報「違う」を出力する。
以上の処理により、本音声合成装置は、出力情報「それは、絶対違う。」を、場面に適した韻律が付与された音声で出力できた。
以上、本実施の形態によれば、場面に適した韻律が付与された音声を出力する音声合成装置を提供できる。
また、本実施の形態において、音声合成装置は、2以上の語彙に対応する2以上の印象群情報から、文や句などの所定の語彙群の情報の印象群情報を構成し、当該構成した印象群情報に基づいて文や句の韻律情報を決定し、文や句を出力しても良い。つまり、本音声合成装置は、語彙を示す情報である語彙情報と、前記語彙の印象に関する情報である印象情報を1以上有する印象群情報を含む印象付語彙情報を1以上格納している印象付語彙情報格納部と、印象群情報または印象情報と、語彙を出力する際の韻律に関する情報である韻律情報の関係を示す情報である印象韻律関係情報を格納している印象韻律関係情報格納部と、音声出力する対象であり、1以上の語彙情報を有する出力情報を格納している出力情報格納部と、前記出力情報が有する語彙情報と対になる印象群情報を、前記印象付語彙情報格納部から取得する印象群情報取得部と、前記印象韻律関係情報と、前記印象群情報取得部が取得した印象群情報に基づいて、前記1以上の語彙情報が示す1以上の語彙の韻律情報を決定する韻律情報決定部と、前記韻律情報決定部が決定した1以上の語彙の韻律情報に基づいて、前記出力情報を出力する音声出力部と、を具備する音声合成装置、である。ここで、韻律情報決定部の処理である「前記1以上の語彙情報が示す1以上の語彙の韻律情報を決定する」とは、語彙ごとに韻律情報を決定する必要はなく、2以上の語彙からなる文や句の韻律情報を決定することも含む。また、「韻律情報決定部が決定した1以上の語彙の韻律情報に基づいて、前記出力情報を出力する」とは、文や句全体の韻律情報に基づいて、出力情報を出力することも含む。
また、本実施の形態の具体例によれば、印象韻律関係情報は、印象情報(印象群情報)と、時間変化情報等を有するレコード(事例の情報)であったが、印象情報(印象群情報)を適用して韻律情報を生成するためのルールや演算式等でも良い。印象韻律関係情報がルールや演算式等の場合、韻律情報決定部は、取得した印象情報(印象群情報)に、ルールや演算式を適用して韻律情報を得る。
(実施の形態2)
本実施の形態において、受け付けた音声から受ける印象に対応した処理ができる音声処理装置について説明する。
図10は、本実施の形態における音声処理装置のブロック図である。
音声処理装置は、印象付語彙情報格納部11、音声受付部101、音声認識部102、印象群情報取得部14、処理部103を具備する。
音声受付部101は、音声を受け付ける。音声の入力手段は、例えば、マイク215である。音声受付部101は、マイク215等の入力手段のデバイスドライバー等で実現され得る。
次に、音声処理装置の動作について図11のフローチャートを用いて説明する。
(ステップS1101)音声受付部101は、音声を受け付けたか否かを判断する。音声を受け付ければステップS1102に行き、音声を受け付けなければステップS1101に戻る。
(ステップS1102)音声認識部102は、ステップS1101で受け付けた音声を認識し、音声情報を取得する。音声情報は、例えば、文字コードの集合である。
(ステップS1103)印象群情報取得部14は、ステップS1102で取得した音声情報を語彙情報に分解し、1以上の語彙情報を得る。
(ステップS1104)印象群情報取得部14は、カウンタiに1を代入する。
(ステップS1106)印象群情報取得部14は、i番目の語彙情報に対応する印象群情報を、印象付語彙情報格納部11から取得する。
(ステップS1108)処理部103は、ステップS1106で取得した印象群情報に対応する処理を決定する。
(ステップS1109)処理部103は、ステップS1108で決定した処理を実行する。
(ステップS1110)処理部103は、カウンタiを1、インクリメントする。ステップS1105に行く。
なお、図11のフローチャートにおいて、印象群情報が存在しない場合、例えば、処理部103は、デフォルトの処理を行っても良い。
なお、図11のフローチャートにおいて、電源オフや処理終了の割り込みにより処理は終了する。
以下、本実施の形態における音声処理装置の具体的な動作について説明する。
かかる場合、ユーザは、本音声処理装置に対して、「それは、絶対違う。」と音声入力した、とする。
次に、音声受付部101は、音声「それは、絶対違う。」を受け付ける。
次に、音声認識部102は、音声「それは、絶対違う。」を音声認識し、音声情報「それは、絶対違う。」を得る。
次に、印象群情報取得部14は、取得した音声情報「それは、絶対違う。」を語彙情報に分解し、1以上の語彙情報(「それは」「絶対」「違う」)を得る。
なお、本実施の形態の具体例によれば、処理部はイメージを出力したが、音声の印象を色で出力しても良い。
また、本実施の形態の具体例によれば、処理部はイメージを出力したが、語彙が示す印象に対応した韻律で音声出力しても良い。かかる場合、例えば、外国人が発声した音声をより自然に補正できる。
(実施の形態3)
(実験概要)
(F0の平均的高さと時間変化形状に基づく発話印象の分類)
以下、まず、実際の対話場面音声で観察された一語発話「ん」を対象としたF0の平均的高さと時間変化形状に基づく発話印象表現の分類について述べる。
(韻律伝達情報を示す印象基本表現の規定)
ここで、図14に示す分類の妥当性を検証するために行う主観評価実験のための印象表現語についての検討を述べる。
これらのF0の平均的高さと時間変化形状の異なる12種類の異なる音声を用いて評定実験を行った。評定は日本語母語話者の成人5名(男性2名、女性3名)が行った。評定実験では、図14の表の作成時の経験を参考に、次に続く事が予想される句表現、またそれらから想定される発話者の発話態度を、極力、形容詞または副詞で直感的に表現してもらうように指示した。
(印象基本表現による伝達情報ベクトル表示)
(F0の平均的高さ・時間変化形状と韻律伝達情報のMDS分析)
音声刺激の分布については、「疑念」を表す発話態度の方向から、「確信」の方に向かって、上昇,平坦,上昇+下降,下降の順に配置されている。またF0の平均的高さが高くなるにつれて「好印象」を、また低くなるにつれて「悪印象」を表す事が分かる。更に、「否定」を示す方向から、「肯定」に向けて、上昇+下降,上昇,平坦,下降の時間変化形状をもつ刺激が布置されている。
以上の結果を、基本周波数の制御の観点から見直すと、「確信−疑念」、「肯定−否定」といった発話態度はF0の時間変化形状により、「好印象−悪印象」はF0の平均的高さにより制御する事が考えられる。
(対話音声データ)
ここでは、得られた発話態度を示す語彙と、出力された韻律特徴の関係性を探るために行う、対話音声の分析に用いるサンプル収集のための手続きについて述べる。
(韻律特徴と語彙特性)
F0の平均的高さ:図17に示すように、F0の平均的高さは「好印象」な発話態度を示す際に用いられるようであった。今回の対話音声収集では、「悪印象」が知覚された発話を得る事が出来なかった。作られた一時的な状況では、「悪印象」を表出する事が困難であったと考えられる。しかしながら、先の分析結果[8]を考慮すると、「悪印象」は、「好印象」と反対の符号を付与すると想像される。
発話時間長:図18に示すように、疑念/確信、否定/肯定の2次元の発話者態度が、発話時間長に影響を与えているようであった。発話時間長が長いほど、より「疑念」、「否定」な発話態度を示すようで、「確信」、「肯定」は、短い時間長で表現されるようであった。一方、「好印象」を表す発話態度には、あまり影響していないようであった。人々は、長い時間長で躊躇を、短い時間長で寛容を表現すると考えられる。
F0時間変化形状:F0時間変化形状を比較するために、同一発話内容のサンプル内で、発話時間長の短い発話を、長いものに合せた。図19に示すように、F0時間変化形状は、2次元の発話態度(疑念/確信、否定/肯定)と関わっているようである事が分かった。一方、「好印象」では、F0時間変化形状に一貫した変化は認められなかった。「疑念」を示す発話態度に関しては、質問として発話された場合、文末が常に上がっていた(上昇)。その他の「疑念」を示す発話に関しては、読み上げ調発話と比較して、平坦になっているようであった(平坦)。また、「確信」は、下降、もしくは上昇+下降、「否定」は、上昇+下降、そして、「肯定」は、下降へと、それぞれのF0時間変化形状を変化させているようであった。
また、上記プログラムを実行するコンピュータは、単数であってもよく、複数であってもよい。すなわち、集中処理を行ってもよく、あるいは分散処理を行ってもよい。
本発明は、以上の実施の形態に限定されることなく、種々の変更が可能であり、それらも本発明の範囲内に包含されるものであることは言うまでもない。
12 印象韻律関係情報格納部
13 出力情報格納部
14 印象群情報取得部
15 韻律情報決定部
16 音声出力部
101 音声受付部
102 音声認識部
103 処理部
Claims (13)
- 語彙を示す情報である語彙情報と、前記語彙の印象に関する情報である印象情報を1以上有する印象群情報を含む印象付語彙情報を1以上格納している印象付語彙情報格納部と、
印象群情報または印象情報と、語彙を出力する際の韻律に関する情報である韻律情報の関係を示す情報である印象韻律関係情報を格納している印象韻律関係情報格納部と、
音声出力する対象であり、1以上の語彙情報を有する出力情報を格納している出力情報格納部と、
前記出力情報が有する語彙情報と対になる印象群情報を、前記印象付語彙情報格納部から取得する印象群情報取得部と、
前記印象韻律関係情報と、前記印象群情報取得部が取得した印象群情報に基づいて、前記1以上の語彙情報が示す1以上の語彙の韻律情報を決定する韻律情報決定部と、
前記韻律情報決定部が決定した1以上の語彙の韻律情報に基づいて、前記出力情報を出力する音声出力部と、を具備する音声合成装置。 - 印象群情報は、
確信または疑念の度合いを示す情報、否定または肯定の度合いを示す情報、好印象または悪印象の度合いを示す情報のうち1以上の情報である請求項1記載の音声合成装置。 - 前記韻律情報は、
基本周波数の平均的高さに関する情報である周波数高低情報、基本周波数の時間変化形状に関する情報である時間変化情報、発話時間長に関する情報である発話時間情報のうちの1以上の情報である請求項1または請求項2記載の音声合成装置。 - 前記韻律情報決定部は、
印象群情報が確信または疑念の度合いを示す情報である場合に、当該印象群情報と対になる語彙情報が示す語彙の韻律情報の中の時間変化情報、または/および発話時間情報を決定する請求項3記載の音声合成装置。 - 前記韻律情報決定部は、
印象群情報が否定または肯定の度合いを示す情報である場合に、当該印象群情報と対になる語彙情報が示す語彙の韻律情報の中の時間変化情報、または/および発話時間情報を決定する請求項3記載の音声合成装置。 - 前記韻律情報決定部は、
印象群情報が好印象または悪印象の度合いを示す情報である場合に、当該印象群情報と対になる語彙情報が示す語彙の韻律情報の中の周波数高低情報を決定する請求項3記載の音声合成装置。 - 語彙を示す情報である語彙情報と、当該語彙の印象に関する情報である印象情報を1以上有する印象群情報を含む印象付語彙情報を1以上格納しており、前記印象群情報に基づいて決定される語彙の韻律情報を用いて、前記語彙情報を出力する音声合成装置。
- 語彙を示す情報である語彙情報と、当該語彙の印象に関する情報である印象情報を1以上有する印象群情報を含む印象付語彙情報を1以上格納している印象付語彙情報格納部と、
音声を受け付ける音声受付部と、
前記音声受付部が受け付けた音声を認識し、音声情報を取得する音声認識部と、
前記音声情報が有する語彙情報に対応する印象群情報を、前記印象付語彙情報格納部から取得する印象群情報取得部と、
前記印象群情報取得部が取得した印象群情報に基づいて、所定の処理を行う処理部と、を具備する音声処理装置。 - 前記処理部は、
前記印象群情報が示す印象に対応する情報を視覚的に出力する請求項8記載の音声処理装置。 - 前記処理部は、
前記印象群情報が示す印象に対応する情報を音出力する請求項8記載の音声処理装置。 - 音声処理に利用する語彙に関する情報のデータ構造であって、
語彙を示す情報である語彙情報と、当該語彙の印象に関する情報である印象情報を1以上有する印象群情報とが対になる印象付語彙情報のデータ構造。 - コンピュータに、
格納されている出力情報が有する語彙情報と対になる印象群情報を、格納されている印象付語彙情報から取得する印象群情報取得ステップと、
格納されている印象韻律関係情報と、前記印象群情報取得ステップで取得した印象群情報に基づいて、前記1以上の語彙情報が示す1以上の語彙の韻律情報を決定する韻律情報決定ステップと、
前記韻律情報決定ステップで決定した1以上の語彙の韻律情報に基づいて、前記出力情報を出力する音声出力ステップと、を実行するためのプログラム。 - コンピュータに、
音声を受け付ける音声受付ステップと、
前記音声受付ステップで受け付けた音声を認識し、音声情報を取得する音声認識ステップと、
前記音声情報が有する語彙情報に対応する印象群情報を、格納されている印象付語彙情報から取得する印象群情報取得ステップと、
前記印象群情報取得ステップで取得した印象群情報に基づいて、所定の処理を行う処理ステップと、を実行するためのプログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2005149423A JP2006330060A (ja) | 2005-05-23 | 2005-05-23 | 音声合成装置、音声処理装置、およびプログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2005149423A JP2006330060A (ja) | 2005-05-23 | 2005-05-23 | 音声合成装置、音声処理装置、およびプログラム |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2006330060A true JP2006330060A (ja) | 2006-12-07 |
Family
ID=37551846
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2005149423A Pending JP2006330060A (ja) | 2005-05-23 | 2005-05-23 | 音声合成装置、音声処理装置、およびプログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2006330060A (ja) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2016001461A (ja) * | 2014-05-30 | 2016-01-07 | ホンダ リサーチ インスティテュート ヨーロッパ ゲーエムベーハーHonda Research Institute Europe GmbH | ドライバ支援システムの制御方法 |
WO2018122919A1 (ja) * | 2016-12-26 | 2018-07-05 | 三菱電機株式会社 | 感性表現語による検索装置 |
WO2023181404A1 (ja) * | 2022-03-25 | 2023-09-28 | 日本電信電話株式会社 | 印象形成制御装置、方法およびプログラム |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS6318458A (ja) * | 1986-07-10 | 1988-01-26 | Nec Corp | 感情情報抽出装置 |
JPH11231885A (ja) * | 1998-02-19 | 1999-08-27 | Fujitsu Ten Ltd | 音声合成装置 |
JP2003177772A (ja) * | 2001-07-13 | 2003-06-27 | Sony France Sa | 感情合成装置の処理を制御する方法及び装置 |
JP2003219288A (ja) * | 2002-01-18 | 2003-07-31 | Aruze Corp | 放送情報提供システム、放送情報提供方法、放送情報提供装置及び放送情報提供プログラム |
JP2003233388A (ja) * | 2002-02-07 | 2003-08-22 | Sharp Corp | 音声合成装置および音声合成方法、並びに、プログラム記録媒体 |
JP2003337592A (ja) * | 2002-05-21 | 2003-11-28 | Toshiba Corp | 音声合成方法及び音声合成装置及び音声合成プログラム |
JP2004145015A (ja) * | 2002-10-24 | 2004-05-20 | Fujitsu Ltd | テキスト音声合成システム及び方法 |
-
2005
- 2005-05-23 JP JP2005149423A patent/JP2006330060A/ja active Pending
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS6318458A (ja) * | 1986-07-10 | 1988-01-26 | Nec Corp | 感情情報抽出装置 |
JPH11231885A (ja) * | 1998-02-19 | 1999-08-27 | Fujitsu Ten Ltd | 音声合成装置 |
JP2003177772A (ja) * | 2001-07-13 | 2003-06-27 | Sony France Sa | 感情合成装置の処理を制御する方法及び装置 |
JP2003219288A (ja) * | 2002-01-18 | 2003-07-31 | Aruze Corp | 放送情報提供システム、放送情報提供方法、放送情報提供装置及び放送情報提供プログラム |
JP2003233388A (ja) * | 2002-02-07 | 2003-08-22 | Sharp Corp | 音声合成装置および音声合成方法、並びに、プログラム記録媒体 |
JP2003337592A (ja) * | 2002-05-21 | 2003-11-28 | Toshiba Corp | 音声合成方法及び音声合成装置及び音声合成プログラム |
JP2004145015A (ja) * | 2002-10-24 | 2004-05-20 | Fujitsu Ltd | テキスト音声合成システム及び方法 |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2016001461A (ja) * | 2014-05-30 | 2016-01-07 | ホンダ リサーチ インスティテュート ヨーロッパ ゲーエムベーハーHonda Research Institute Europe GmbH | ドライバ支援システムの制御方法 |
WO2018122919A1 (ja) * | 2016-12-26 | 2018-07-05 | 三菱電機株式会社 | 感性表現語による検索装置 |
WO2023181404A1 (ja) * | 2022-03-25 | 2023-09-28 | 日本電信電話株式会社 | 印象形成制御装置、方法およびプログラム |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Thomas | Sociophonetics: an introduction | |
JP4114888B2 (ja) | 声質変化箇所特定装置 | |
Taylor | Text-to-speech synthesis | |
Pietquin | A framework for unsupervised learning of dialogue strategies | |
Lindblom | On the notion of “possible speech sound” | |
US8027837B2 (en) | Using non-speech sounds during text-to-speech synthesis | |
JP4745036B2 (ja) | 音声翻訳装置および音声翻訳方法 | |
US20110238407A1 (en) | Systems and methods for speech-to-speech translation | |
US20100057435A1 (en) | System and method for speech-to-speech translation | |
US20070192105A1 (en) | Multi-unit approach to text-to-speech synthesis | |
CN101156196A (zh) | 混合语音合成器、方法和使用 | |
JP2001215993A (ja) | 対話処理装置および対話処理方法、並びに記録媒体 | |
JP2004037721A (ja) | 音声応答システム、音声応答プログラム及びそのための記憶媒体 | |
JP2023539888A (ja) | 声変換および音声認識モデルを使用した合成データ拡大 | |
JP2009139677A (ja) | 音声処理装置及びそのプログラム | |
JP2019045867A (ja) | 音声制御方法、音声制御装置およびプログラム | |
Vojtech et al. | The effects of modulating fundamental frequency and speech rate on the intelligibility, communication efficiency, and perceived naturalness of synthetic speech | |
CN115249480A (zh) | 基于北斗短报文的语音文字的转换方法及相关装置 | |
JP2016151736A (ja) | 音声加工装置、及びプログラム | |
US20230148275A1 (en) | Speech synthesis device and speech synthesis method | |
HaCohen-Kerner et al. | Language and gender classification of speech files using supervised machine learning methods | |
JP2006330060A (ja) | 音声合成装置、音声処理装置、およびプログラム | |
Ronzhin et al. | Survey of russian speech recognition systems | |
JP3706112B2 (ja) | 音声合成装置及びコンピュータプログラム | |
Charfuelan | MARY TTS HMMbased voices for the Blizzard Challenge 2012 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20080519 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20101027 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20101105 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20101227 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20110202 |