JP2004246129A - 音声合成制御装置 - Google Patents
音声合成制御装置 Download PDFInfo
- Publication number
- JP2004246129A JP2004246129A JP2003036524A JP2003036524A JP2004246129A JP 2004246129 A JP2004246129 A JP 2004246129A JP 2003036524 A JP2003036524 A JP 2003036524A JP 2003036524 A JP2003036524 A JP 2003036524A JP 2004246129 A JP2004246129 A JP 2004246129A
- Authority
- JP
- Japan
- Prior art keywords
- character string
- speech synthesis
- speech
- voice
- parameter
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Abstract
【手段】音声合成部4とは別に、音声合成制御装置4を設ける。音声合成制御装置4は、パラメータを直感的に理解しやすいように画面表示6を行う。操作者は、この画面表示を操作してパラメータを変更して、所望の音声合成データを得ることができる。
【選択図】 図1
Description
【発明の背景】
テキストデータに基づいて音声合成を行う装置において、与えられたテキストデータを形態素解析した後、各単語についてアクセントを付与して音声合成データを得るようにしている(特許文献1)。しかしながら、形態素解析が必ずしも正確に行われるわけでなく、また、各単語のアクセントが常に正確に付与されるとは限らない。
【0002】
この問題は、音声合成エンジンの辞書に多くの単語を登録したり、アクセントの異なる単語を登録したりすることである程度解決できる。しかし、このような方法では、辞書が肥大化するという他の問題を引き起こしてしまうことになる。
【0003】
また、音声合成エンジンに適切なパラメータを与えて、所望の音声合成データを得る作業は、音声に対する専門知識が必要であり、簡単ではなかった。
【0004】
そこで、この発明では、音声合成データの修正を容易化することにより、上記のような問題点を解決しようとするものである。
【0005】
【特許文献1】
特開2003−005776号公報
【発明の概要および効果】
(1)この発明に係る音声合成制御装置は、音声合成部に対するインターフェイスをとるための音声合成制御装置であって、
音声合成指令を受けると、与えられた文字列を音声合成部に与え、音声合成部から、当該文字列に対応する音声合成データおよび音声合成の際に用いたパラメータを取得し、前記パラメータに基づいて文字列を修飾して表示し、操作者によって、前記文字列の修飾が修正され、音声合成指令が与えられると、当該修正された修飾に基づいてパラメータを修正して音声合成部に与え、音声合成部から修正した音声合成データを取得するものである。
【0006】
したがって、音声合成部の作成したパラメータを利用しつつ、操作者がこれを修正して所望の音声合成データを得ることができる。また、パラメータに基づいて文字列が修飾されて表示されており、この修飾を修正することによりパラメータを修正できるので、修正の操作が容易である。
【0007】
(3)この発明に係る音声合成制御装置は、文字列が、漢字まじり文字列またはかな文字列であることを特徴としている。
【0008】
したがって、漢字まじり文字列またはかな文字列に対して、パラメータに基づいた修飾が施されて表示される。
【0009】
(4)この発明に係る音声合成制御装置は、操作者から与えられる文字列は漢字まじりの文字列であり、音声合成部は、与えられた漢字まじり文字列に対応するかな文字列を生成し、音声合成部から受けたかな文字列に対して、前記修飾を施して表示することを特徴としている。
【0010】
したがって、漢字まじり文字列を入力すれば、対応するかな文字列が生成され、修飾が施されたかな文字列が表示される。
【0011】
(5)この発明に係るインターフェイスプログラムは、コンピュータを用いて音声合成部に対するインターフェイスを実現するためのインターフェイスプログラムであって、
音声合成指令を受けると、与えられた漢字まじり文字列を音声合成部に与え、音声合成部から、当該漢字まじり文字列に対応する音声合成データ、当該漢字まじり文字列に対応するかな文字列および音声合成の際に用いたパラメータを取得し、前記パラメータに基づいて前記かな文字列を修飾して表示し、操作者によって、前記かな文字列の修飾が修正され、音声合成指令が与えられると、当該修正された修飾に基づいてパラメータを修正して音声合成部に与え、音声合成部から修正した音声合成データを取得する処理をコンピュータに行わせるものである。
【0012】
したがって、音声合成部の作成したパラメータを利用しつつ、操作者がこれを修正して所望の音声合成データを得ることができる。また、パラメータに基づいて文字列が修飾されて表示されており、この修飾を修正することによりパラメータを修正できるので、修正の操作が容易である。さらに、漢字まじり文字列を入力すれば、対応するかな文字列が生成され、修飾が施されたかな文字列が表示される。
【0013】
(6)この発明に係るインターフェイスプログラムは、操作者によって、表示されたかな文字列が修正され、音声合成指令が与えられると、当該修正されたかな文字列を音声合成部に与え、音声合成部から修正した音声合成データを取得することを特徴としている。
【0014】
したがって、音声合成部によって生成されたかな文字列が誤っている場合、操作者がこれを修正して、音声合成データを得ることができる。
【0015】
(7)この発明に係る音声合成制御装置は、前記パラメータが、文字に対応する音の長さに関するパラメータであることを特徴としている。
【0016】
したがって、音の長さを文字の修飾によって直感的に認識することができ、その修正が容易である。
【0017】
(8)この発明に係る音声合成制御装置は、前記パラメータが、アクセントに関するパラメータであることを特徴としている。
【0018】
したがって、アクセントに関するパラメータを文字の修飾によって直感的に認識することができ、その修正が容易である。
【0019】
(9)この発明に係る音声合成装置は、パラメータがアクセント区切または形態素区切またはその双方であり、文字列の修飾は、前記区切の位置において、表示上の区切が設けられるような修飾であることを特徴としている。
【0020】
したがって、アクセント区切・形態素区切を文字の修飾によって直感的に認識することができる。
【0021】
(10)この発明に係る音声合成装置は、表示上の区切を変更することにより、これに応じてパラメータとしてのアクセント区切・形態素区切が修正されることを特徴としている。
【0022】
したがって、アクセント区切・形態素区切を文字の修飾によって直感的に認識することができ、その修正が容易である。
【0023】
(11)この発明に係る音声合成装置は、パラメータがアクセントの高低であり、文字列の修飾は、アクセントの高低に合わせて、文字列の配列方向に垂直な方向に、各文字の位置を移動したような修飾であることを特徴としている。
【0024】
したがって、アクセントの高低を文字の位置によって直感的に認識することができる。
【0025】
(12)この発明に係る音声合成装置は、文字の位置を変更することにより、これに応じてパラメータとしてのアクセントの高低が修正されることを特徴としている。
【0026】
したがって、アクセントの高低を文字の位置によって直感的に認識することができ、その修正が容易である。
【0027】
(13)この発明に係る音声合成装置は、音声合成部が、各文字について音声合成の候補とした複数の音素片の特性情報を出力し、これに応じて、文字について、複数の音素片候補の特性を表示し、操作者によって、用いる音素片が変更され、音声合成指令が与えられると、当該変更された音素片の特性を音声合成部に与え、音声合成部から変更した音声合成データを取得することを特徴としている。
【0028】
したがって、操作者が適切な音素片を選択して、音声合成データを得ることができる。
【0029】
(14)この発明に係る音声合成装置は、音素片の特性が、音声合成部に記録されている当該音素片を含む一連の音声データにおける、当該音素片およびその前後の音素片の時間長またはアクセントの高低であることを特徴としている。
【0030】
したがって、操作者は、この特性に基づいて、適切な音素片を選択することができる。
【0031】
(15)この発明に係る音声合成装置は、保存指令に応じて、音声合成データを音声ファイルとして保存することを特徴としている。
【0032】
したがって、生成された音声合成データをファイルとして保存することができる。
【0033】
(16)この発明に係る音声合成装置は、保存指令に応じて、文字列およびパラメータを音声特性ファイルとして保存することを特徴としている。
【0034】
したがって、音声合成ために必要なデータを保存することができる。
【0035】
(17)この発明に係る音声合成装置は、文字列の一部に、特定の文字列を決定しない差替部分を設け、当該差替部分については、パラメータを生成するための情報を記録することを特徴としている。
【0036】
したがって、差替部分について、文字列を挿入することにより、適切なパラメータにて音声合成を行うことのできる音声特性ファイルを得ることができる。
【0037】
(18)この発明に係る音声特性ファイルは、音声の発話順に並べられた文字列部分と差替部分を備えており、文字列部分には、文字列および各文字に対応するパラメータが記録されており、差替部分には、文字列が挿入された場合に当該文字列の各文字にどのようなパラメータを与えるかを決定するための情報が記録されていることを特徴としている。
【0038】
したがって、差替部分について、文字列を挿入することにより、適切なパラメータにて音声合成を行うことができる。
【0039】
(19)この発明に係るプログラムは、音声特性ファイルに基づいて音声合成部に音声合成を行わせる処理をコンピュータに行わせるためのプログラムであって、
前記音声ファイルには、音声の発話順に並べられた文字列部分と差替部分が設けられており、文字列部分には、文字列および各文字に対応するパラメータが記録されており、差替部分には、文字列が挿入された場合に当該文字列の各文字にどのようなパラメータを与えるかを決定するための情報が記録されており、与えられた音声特性ファイルに基づいて、文字列部分を文字で表示し、差替部分を入力領域として、発話順に表示し、操作者によって、前記入力領域に文字列が挿入されて、音声合成指令が与えられると、文字列部分に対応するパラメータを音声特性ファイルから読み出し、挿入された文字列に対するパラメータを、前記差替部分に対応して記録されている情報を考慮して生成し、音声合成部に与えて音声合成データを得る処理をコンピュータに行わせるためのプログラムである。
【0040】
したがって、差替部分について、文字列を挿入することにより、適切なパラメータにて音声合成を行うことができる。
【0041】
(20)この発明に係る音声合成装置は、文字列を受けてパラメータを算出し、文字列およびパラメータに基づいて、文字列に対応する音声合成データを生成し、前記パラメータに基づいて文字列を修飾して表示し、操作者によって、前記文字列の修飾が修正され、音声合成指令が与えられると、当該修正された修飾に基づいてパラメータを修正して音声合成データを生成する。
【0042】
したがって、パラメータに基づいて文字列が修飾されて表示されており、この修飾を修正することによりパラメータを修正できるので、修正の操作が容易である。
【0043】
(22)この発明に係る音声合成サーバ装置は、端末装置と通信可能な音声合成サーバ装置であって、
文字列を受けてパラメータを算出し、文字列およびパラメータに基づいて、文字列に対応する音声合成データを生成し、前記パラメータに基づいて文字列を修飾して表示するためのデータを端末装置に送信し、端末装置の操作者によって、前記文字列の修飾が修正され、音声合成指令が送信されてくると、当該修正された修飾に対応するパラメータに基づいて音声合成データを生成して端末装置に送信する。
【0044】
したがって、端末装置において、パラメータに基づいて文字列を修飾して表示することができ、この修飾を修正することによりサーバ装置において修正した音声合成データを生成できるので、修正の操作が容易である。
【0045】
(24)この発明に係るサーバ装置は、端末装置の要求に応じて、音声特性ファイルを端末装置に送信するものであり、
音声特性ファイルは、音声の発話順に並べられた文字列部分と差替部分を備えており、文字列部分には、文字列および各文字に対応するパラメータが記録されており、差替部分には、文字列が挿入された場合に当該文字列の各文字にどのようなパラメータを与えるかを決定するための情報が記録されている。
【0046】
したがって、端末装置に対して、音声特性ファイルを送信することができる。
【0047】
(20)この発明に係る音声合成方法は、文字列を受けてパラメータを算出し、文字列およびパラメータに基づいて、文字列に対応する音声合成データを生成し、前記パラメータに基づいて文字列を修飾して表示し、操作者によって、前記文字列の修飾が修正され、音声合成指令が与えられると、当該修正された修飾に基づいてパラメータを修正して音声合成データを生成する。
【0048】
したがって、パラメータに基づいて文字列が修飾されて表示されており、この修飾を修正することによりパラメータを修正できるので、修正の操作が容易である。
【0049】
この発明において、「文字列の修飾」とは、文字列を構成する文字について、その大きさ、色、配置などの視覚的属性を、他の文字との比較において認識可能なように変更することをいう。
【0050】
「漢字まじり文字列」とは、少なくとも一以上の漢字を含む文字列をいう。
【0051】
「パラメータ」とは、文字列を用いて音声合成を行う際に必要な特性データであって、たとえば、アクセントの高低、アクセントの位置、発話長などである。
【0052】
「プログラム」とは、CPUにより直接実行可能なプログラムだけでなく、ソース形式のプログラム、圧縮処理がされたプログラム、暗号化されたプログラム等を含む概念である。
【0053】
【発明の実施の形態】
1.第1の実施形態
(1)全体構成および概要
図1に、この発明の一実施形態による音声合成制御装置と音声合成部の全体構成を示す。音声合成部4は、文字列を与えることにより、音声合成データを作成するものである。この音声合成部4は、文字列を与えて音声合成のためのパラメータを与えない場合には、自らパラメータを生成して音声合成データを作成する。また、パラメータとともに文字列を与えた場合には、当該パラメータにしたがって音声合成データを作成する。
【0054】
音声合成制御装置2は、この音声合成部4とのインターフェイスをとるための装置である。音声合成制御装置2から文字列を与えると、音声合成部4は、音声合成データとそのパラメータを、音声合成制御装置2に返す。音声合成制御装置2は、文字列をこのパラメータによって修飾して表示する(表示画面6参照)。図1の画面6では、たとえば、かな文字がアクセントの高低に応じて、位置が上下するように表示されている。
【0055】
操作者は、音声合成データに基づく音を聞いて、所望の音でないと感じた場合には、表示された文字列の修飾を変更することによって、パラメータを変更して音声合成をやり直すことができる。このようにして、操作者は、所望の音声合成データを得ることができる。
【0056】
(2)ハードウエア構成
図2に、CPUを用いて実現した場合のハードウエア構成を示す。CPU10には、ディスプレイ12、メモリ14、マウス/キーボード16、ハードディスク(記録装置)18、CD−ROMドライブ20、サウンドカード22が接続されている。
【0057】
ハードディスク18には、WINDOWS(商標)などのオペレーティングシステム(図示せず)の他、音声合成エンジン28(音声合成プログラム)、およびその辞書30、およびインターフェイスプログラム26が格納されている。これらプログラムおよびデータは、CD−ROM32に記録されていたものを、CD−ROM20を介して、ハードディスク18にインストールしたものである。なお、音声合成エンジン28、インターフェイスプログラム26は、オペレーティングシステムと協働してその機能を発揮するものである。なお、音声合成エンジン28の詳細については、たとえば、本出願人による特許3220163号を参照されたし。
【0058】
サウンドカード22は、与えられた音声合成データをアナログ波形に変換してスピーカ24に出力するものである。
【0059】
(3)インターフェイスプログラムの処理
ハードディスク18に記録されたインターフェイスプログラム26のフローチャートを図3に示す。
【0060】
まず、ステップS1において、CPU10は、図8に示す初期画面をディスプレイ12に表示する。操作者は、キーボード16を用いて、テキスト入力領域40に漢字まじり文字列を入力する。図8では、操作者によって、「安楽島町の道」が入力された状態が示されている。
【0061】
次に、操作者が、音声合成指令のボタン42をマウス16によってクリックし、音声合成指令が与えられると(ステップS2)、CPU10は、音声合成エンジン28に、入力された漢字まじり文字列を出力する(ステップS3)。
【0062】
音声合成エンジン28は、これを受けて、音声合成のためのパラメータをCPU10に返す(ステップS3)。CPU10は、このパラメータをメモリ14に一時的に記憶する。ここで、パラメータとは、音声合成のために必要な情報であり、たとえば、文字ごとのアクセントの高低、アクセントの区切、形態素の区切などである。また、与える文字列などもパラメータである。
【0063】
パラメータの一部を図9に示す。与えられた漢字まじり文字列「安楽島町の道」に基づいて、読み「あんらくとーちょーのみち」(かな文字列)が生成されている。また、形態素解析によって、形態素の区切情報46が示されている。また、各形態素について、その品詞情報48が示されている。さらに、アクセントの一塊りを表すアクセント区切情報50も示されている。なお、アクセント区切情報50は、形態素の区切情報46も兼ねている。加えて、各かな文字ごとに、アクセントの高低情報52(HL)が示されている。
【0064】
パラメータを受け取ったCPU10は、このパラメータに基づいて文字列を修飾し、表示を行う(ステップS4)。図10に示すように、この表示は、パラメータ表示欄54に表示される。かな文字列「あんらくとーちょーのみち」は、アクセントの高低情報52に基づいて、その位置が上下して表示されている。つまり、アクセントの高いもの(たとえば「ん」)は上方に表示され、アクセントの低いもの(たとえば「あ」)は下方に表示される。
【0065】
また、漢字まじり文字列「安楽島町の道」は、形態素区切情報46、アクセント区切情報50に基づいて、形態素ごとに、形態素枠56で囲まれて区別可能に表示されている。
【0066】
さらに、アクセント区切情報50に基づいて、かな文字列および漢字まじり文字列の双方が、アクセント枠58によって囲まれて、アクセントの区切りが明確に示されている。
【0067】
次に、CPU10は、ステップS5において、いずれの指令が与えられているかを判断する。ここでは、音声合成指令が与えられているので、ステップS6の音声合成の処理に進む。
【0068】
音声合成処理のフローチャートを図4に示す。CPU10は、現在メモリ14に記憶しているパラメータ(図9参照)を音声合成エンジン28に与える(ステップS61)。音声合成エンジン28は、これを受けて音声合成データを生成し、CPU10に返す。CPU10は、この音声合成データをハードディスク18に一時的に記憶する(ステップS62)。
【0069】
次に、CPU10は、この音声合成データをサウンドカード22に与える(ステップS63)。これによって、スピーカ24から音が出力される。CPU10は、ステップS5に戻って次の指令を待つ。
【0070】
操作者は、スピーカ24からの音を聞いて、これが所望の音でなかった場合には、パラメータの編集を行う。
【0071】
図5に、編集処理のフローチャートを示す。ここでは、まず、読みを変更する場合について説明する。たとえば、音声合成エンジン28が示した「あんらくとーちょーのみち」に対して、「あらしまちょーのみち」が正しい読みであったとする。
【0072】
この場合、操作者は、まず、図10の画面において、読みがなを訂正したい漢字を選択する。ここでは、「安楽」「島」「町」をマウス16によってクリックして選択する。次に、編集メニュー60から、読みがなの編集を選択する。これにより、CPU10は、図11に示すような読みがな編集の画面を表示する(ステップS92)。操作者は、読みがな入力欄62に、正しい読み(かな文字列)を入力する。図では、正しい読みである「あらしまちょー」が入力されている。また、この際に、正しい品詞を品詞選択欄64において選択する。ここでは、「地名」を選択している。
【0073】
音声合成エンジン28は、形態素の品詞によって、その形態素自身のアクセントを適切に選択したり、前後の形態素の品詞との関係により、適切なアクセントを決定することができる。したがって、形態素について正しい品詞を与えることは、所望の合成音を得るために重要なことである。
【0074】
操作者によって編集終了のボタン66がクリックされると、CPU10は、上記編集内容に基づいて、パラメータを修正する(ステップS96)。つまり、メモリ14に記憶しているパラメータを、図12に示すように修正する。なお、この際、読みが変わっているため、元のアクセントの高低情報を用いることができない。したがって、CPU10は、アクセントの高低については、最も一般的である平板型のアクセントを付与する。つまり、「あらしまちょー」について、最初の文字「あ」だけアクセントを低く、2番目以降の文字「らしまちょー」についてはアクセントを高くするようにしている。
【0075】
CPU10は、この編集さらたパラメータに基づいて、図13に示すような、文字列を修飾した表示を行う。図からわかるように、読み、アクセントの高低、形態素の区切が変更されていることを、視覚的に確認することができる。
【0076】
その後、CPU10は、図3のステップS5に戻って次の指令を待つ。図13の画面において、操作者が再生ボタン42をクリックして、音声合成指令が与えられると、CPU10は、ステップS6の音声合成処理を実行する。つまり、メモリ14に記憶している図12のパラメータを、音声合成エンジン28に与える。CPU10は、音声合成エンジン28からの音声合成データを受けてハードディスク18に一次的に記憶する。CPU10は、さらに、この音声合成データをサウンドカード22に与えて音として出力する(図4参照)。その後、CPU10は、図3のステップS5に戻って次の指令を待つ。
【0077】
操作者は、この音を聞いて、所望の音になっているかどうかを判断する。所望の音になっていれば、保存ボタン70をクリックする。CPU10は、これを受けて、図3、ステップS7の音声合成データ保存処理を実行する。
【0078】
音声合成データ保存処理のフローチャートを図6に示す。CPU10は、ハードディスク18に一次的に記憶されている音声合成データを、音声合成データファイルとして記録する(ステップS71)。このようにして、所望の音を、保存することができる。なお、音声合成データファイルは、フレキシブルディスクなどの可搬性記録媒体に記録したり、メールなどに添付して送信することもできる。
【0079】
一方、所望の音になっていない場合には、アクセント区切、形態素区切、アクセントの高低、音素片などの編集を行う(図5参照)。
【0080】
操作者は、次のようにしてアクセント区切の編集を行うことができる(ステップS43)。たとえば、図13の表示画面において、アクセント句「あらしまちょーの」とアクセント句「みち」とを、1つのアクセント句にする場合について説明する。まず、マウス16によって、「あらしまちょーの」のアクセント枠58と、「みち」のアクセント枠58を選択する。この状態で、編集メニュー60の中から、アクセント句結合を選択する。これを受けて、CPU10は、選択されている「あらしまちょーの」と「みち」を結合して、「あらしまちょーのみち」という1つのアクセント句にする。
【0081】
CPU10は、メモリ14に記憶されているパラメータを図14のように修正する。「の」と「みち」との間にあった、アクセント区切が、形態素区切に変更されている。したがって、CPU10は、「あらしまちょーのみち」全体を1つのアクセント枠58で囲って表示する(ステップS96)。なお、アクセントの高低情報52や品詞情報48などは、変更前のものをそのまま用いる。
【0082】
なお、上記では、アクセント句の結合について説明したが、1つのアクセント句を2つのアクセント句に分割するように編集することもできる。この場合、操作者は、分割したいアクセント句をマウス16によって指定した後、編集メニュー60の中から、アクセント句分割を選択する。さらに、マウス16によって、分割したい位置を指定することにより、アクセント句の分割を行うことができる。この場合も、修正後のパラメータがメモリ14に記憶され、表示が修正される(ステップS96)。
【0083】
形態素句の結合や分割についても、上記と同様にして行うことができる。この場合も、修正後のパラメータがメモリ14に記憶され、表示が修正される(ステップS96)。
【0084】
アクセント高低の編集は、以下のようにして行う。操作者は、アクセント高低の編集を行いたいアクセント句をマウス16によって選択する。次に、操作者が、編集メニュー60からアクセント高低編集を選択すると、CPU10は、図15に示すようなアクセント高低の編集画面をディスプレイ12に表示する。図15では、アクセントの高低に対応付けて、各かな文字が上下位置に配置されている。この図では、かな文字「あ」以外のかな文字は、全て高いアクセントが与えられている。
【0085】
ここで、かな文字「ま」についてアクセントを低くしたければ、マウス16を操作して、かな文字枠72を下方向にドラッグする(ステップS94)。これを受けてCPU10は、かな文字「ま」のアクセントを低くするようにメモリ14のパラメータを変更する。また、図16に示すように、かな文字「ま」のかな文字枠72を下方向に移動して表示する(ステップS96)。このようにして、アクセントの高低を編集することができる。
【0086】
なお、音声合成エンジン28は、音声合成の際に、音声辞書30に記録されている多くのサンプル音声から、妥当な音を選択して使用するようにしている。つまり、1つのかな文字に対して、複数の音素片から1つの音素片を選択している。音声合成エンジン28は、選択した音素片の特性情報だけでなく、候補となったが選択されなかった他の音素片の特性情報も、パラメータとしてCPU10に返すようにしている(ステップS3参照)。
【0087】
そこで、この実施形態では、この音素片を変更することが可能なようにしている。音素片の編集は、以下のようにして行う。図16のアクセント高低編集の画面において、操作者は、音素片の編集を行いたいかな文字枠72を、マウス16によってダブルクリックする。たとえば、「し」のかな文字枠72がダブルクリックされると、CPU10は、図17に示すような画面を表示する。
【0088】
図では、かな文字「し」の下に、音素片候補欄90が表示され、5つの音素片の特性が示されている。音素片候補欄90の左端には、音素片を特定するための符号(番号)1〜5が示されている。各音素片の特性は、図18に示すような規則にしたがって示されている。符号「1」のすぐ右隣の「2M」「a」は、辞書30に記録されているサンプル音における当該音素片の直前の音素片を示している。その右隣の「3M」「shi」は、当該音素片を示している。右端の「4M」「b」は、辞書30に記録されているサンプル音における当該音素片の直後の音素片を示している。
【0089】
「2M」「3M」「4M」の先頭の数字「2」「3」「4」は、モーラ位置を示している。また、「M」は、サンプル音におけるアクセントの高さを示している。「H」が高いアクセント、「L」が低いアクセント、「M」が中間のアクセントである。
【0090】
「a」「shi」「b」は、音韻の表記である。つまり、サンプル音における直前の音が「a」であり、直後の音が「b」であることを示している。
【0091】
操作者は、このようにして表記された各音素候補の特性を見て、所望の音素片をマウス16によって選択する(ステップS95)。CPU10は、選択された音素片の符号をメモリ14のパラメータに記憶する。
【0092】
上記のようにして編集を行った後、音声合成ボタン42をクリックすると、CPU10は、編集後のパラメータを音声合成エンジン28に与える。したがって、編集されたパラメータにて生成された音声合成データを得て、その音をスピーカ24から聞くことができる。
【0093】
編集によって所望の音が得られれば、音声合成データ保存ボタン70をクリックして、音声合成データファイルをハードディスク18に記録することができる。
【0094】
また、この実施形態では、音声合成データをそのまま保存するのではなく、テンプレート(音声特性ファイル)として保存することもできる。テンプレートとは、文字列の一部において文字が特定されておらず、音声合成時に文字を指定して使用するものである。迷子の呼び出し放送など、名前の部分だけを変更すれば、他の部分は同じものを繰り返して使用できるような場合に効果的である。
【0095】
図13の画面において、操作者が、テンプレートボタン92をクリックすると、CPU10は、図3のステップS8のテンプレートデータ保存処理を実行する。
【0096】
テンプレートデータ保存処理のフローチャートを図7に示す。まず、CPU10は、図19に示すような、テンプレート編集用の画面をディスプレイ12に表示する。操作者は、文字列を差替えて用いたい部分の形態素を、マウス16によって指定する。ここでは、「安楽島町」の枠56を指定したとする。CPU10は、これを受けて、図20に示すような品詞選択のための表示を行う。操作者は、「安楽島町」の部分に入れられるべき文字列の品詞を選択する(ステップS81)。ここでは、たとえば、地名を選択したものとする。CPU10は、図21に示すような表示を行う。
【0097】
操作者が、保存ボタン94(図19参照)をクリックすると、CPU10は、メモリ14に記憶されているパラメータを読み出す(ステップS82)。CPU10は、このパラメータに基づいて、図22に示すようなテンプレートデータを生成する。
【0098】
「の」「みち」の部分は、具体的文字列が指定された文字列部分である。($地名)の部分は、使用時に差替によって文字列が挿入される差替部分である。差替部分においては、具体的な文字列は指定されず、その品詞が指定されている。品詞を指定しておくことにより、音声合成時に、前後の品詞との関係などによって適切なアクセントの高低などのパラメータを正確に決定することができる。
【0099】
CPU10は、生成した図22のデータを、テンプレートデータとして、ハードディスク8に記録する。なお、テンプレートデータは、フレキシブルディスクなどの可搬性記録媒体に記録したり、メールなどに添付して送信することもできる。
【0100】
上記実施形態では、ステップS1において漢字まじり文字列を与えるようにしているが、かな文字列を与えるようにしてもよい。
【0101】
また、上記実施形態では、一部に差替部分を含むテンプレートを生成する例を示したが、全てが文字列部分であるような音声特性データを生成して記録するようにしてもよい。
【0102】
なお、上記実施形態では、音声合成制御装置2と音声合成部4とが分離したものを示したが、両者が一体となった音声合成装置としてもよい。
【0103】
2.第2の実施形態
次に、上記のテンプレートデータに基づいて、音声合成を行うためのテンプレート処理プログラムについて説明する。ハードウエア構成は、図2と同様である。ただし、ハードディスク18には、インターフェイスプログラムに代えて、テンプレート処理プログラムが格納されている。
【0104】
テンプレート処理プログラムのフローチャートを図23に示す。CPU10は、まず、テンプレートデータを読み込んで、編集画面をディスプレイ12に表示する(ステップS101)。図24に、図22のテンプレートデータを読み込んだ場合の編集画面の表示例を示す。テンプレートデータの差替部分は、文字列入力部120として表示され、文字列部分は、その文字列が表示されている。なお、文字列入力部120の下には、差替部分の品詞が表示されている。これは、操作者に対する入力ガイダンスのためである。
【0105】
操作者は、キーボード16を用いて、文字列入力部120に所望の文字列を入力する。ここでは、「箕面」が入力されたものとする。入力を終えて音声合成指令ボタン(図示せず)をクリックすると、CPU10は、文字列入力部120に入力された文字列について、アクセントの高低や読みなどのパラメータを決定する(ステップS103)。この際、差替部分に与えられている品詞の情報(ここでは地名)を考慮して、これら読みやアクセントなどのパラメータを決定する。
【0106】
次に、CPU10は、音声合成エンジン28に、パラメータを与えて「江坂の道」の音声合成データを得る(ステップS104)。さらに、CPU104は、この音声合成データをサウンドカード22に与え、音声出力を得る(ステップS105)。なお、この音声合成データを保存することもできる。
【0107】
以上のように、テンプレートを用いれば、合成音声の品質を維持しつつ、差替部分における文字列を変更することができる。
【0108】
この実施形態では、パラメータを決定するための情報として品詞情報を用いているが、パラメータを決定するための規則などを用いてもよい。
【0109】
3.第3の実施形態
図25に、上記の音声合成制御装置2と音声合成部4を、サーバ装置204によって運用した実施形態を示す。端末装置200は、インターネット202を介して、サーバ装置204にアクセスすることができる。端末装置200、サーバ装置204のハードウエア構成は、図2と同様である。また、サーバ装置204には、テンプレート処理プログラムも格納されている。
【0110】
端末装置200には、ブラウザプログラムが格納されており、このブラウザプログラムによってサーバ装置204からの情報を表示することができる。操作者は、サーバ装置204にアクセスして、文字列を与えることにより、これに対応する音声合成データを得ることができる。また、パラメータの編集を行うこともできる。
【0111】
図26、図27に、端末装置200の要求に応じて、サーバ装置204が音声合成データを生成してダウンロードする処理のフローチャートを示す。なお、このフローチャートでは、音声合成エンジン28の処理とインターフェイスプログラム26の処理を区別せずに示している。
【0112】
ステップS101において、端末装置200は、サーバ装置204に対して、入力画面を要求する。サーバ装置204は、これに応じて、音声合成のための入力画面を送信する(ステップS201)。端末装置200は、この入力画面を表示する(ステップS102)。
【0113】
端末装置200の操作者は、入力画面において、音声合成を希望する文字列を入力する。文字列が入力された画面を図8に示す。この画面において、端末装置200の操作者が、音声合成指令ボタン42をクリックすると、音声合成指令がサーバ装置204に送信される(ステップS104)。
【0114】
サーバ装置204は、入力された文字列に基づいて、パラメータを生成して音声合成を行う(ステップS202)。サーバ装置204は、音声合成データを端末装置200に送信する。また、サーバ装置204は、生成したパラメータに基づいて、文字列を修飾して表示する画面を端末装置200に送信する(ステップS203)。
【0115】
端末装置200は、音声合成データを音として再生する(ステップS105)。また、サーバ装置204から送られてきた画面を表示する。この画面は、図10に示すように、パラメータによって文字列が修飾されたものとなっている。
【0116】
端末装置20の操作者は、再生した音が所望の音でなければ、読み編集、区切編集、アクセント編集、音素編編集などの編集処理を行う。編集処理による修正指令は、サーバ装置204に送信される(ステップS107)。
【0117】
サーバ装置204は、この修正指令に基づいて文字列の位置などを修正した修正画面を端末装置200に送信する。また、パラメータの修正を行う(ステップS204)。端末装置200は。修正された画面を表示する(ステップS108)。たとえば、図13に示すような画面を表示する。
【0118】
この画面において、操作者が音声合成指令ボタン42をクリックすると、音声合成指令がサーバ装置204に送信される(ステップS109)。サーバ装置204は、これを受けて、修正されたパラメータに基づいて音声合成を行う(ステップS205)。さらに、音声合成データを端末装置200に送信する(ステップS206)。
【0119】
端末装置200は、この音声合成データを音として再生して出力する(ステップS110)。操作者は、所望の音が得られるまで、上記の編集を繰り返す。
【0120】
所望の音が得られれば、操作者は、保存ボタン70をクリックする。これにより、端末装置200は、音声合成データのダウンロード要求を、サーバ装置204に送信する(ステップS111)。
【0121】
サーバ装置204は、これを受けて、音声合成データを端末装置200に記録させる(ステップS207)。これにより、端末装置200は、音声合成データをファイルとして保存することができる。
【0122】
上記では、音声合成データをダウンロードする場合について説明した。所望の音が合成できた後、テンプレートをダウンロードする場合の処理は、図28のようなフローチャートとなる。
【0123】
端末装置200の操作者が、テンプレート作成ボタン92をクリックすると、テンプレート作成画面要求がサーバ装置204に送信される(ステップS121)。これに応じて、サーバ装置204からテンプレート作成画面が送られ(ステップS211)、端末装置200はこの画面を表示する(ステップS122)。この画面は、たとえば、図19のような画面である。
【0124】
端末装置200の操作者は、差替部分の指定や品詞の指定などを入力する(ステップS123)。この入力処理においては、入力されたデータに基づいて、サーバ装置204が変更画面を作成するものであるが、フローチャートでは省略している。データ入力の結果、たとえば、図21のような画面が表示される。
【0125】
端末装置200の操作者が、テンプレート保存ボタン94をクリックすると、テンプレートダウンロード要求がサーバ装置204に送信される(ステップS124)。サーバ装置204は、テンプレートを作成し(ステップS212)、作成したテンプレートデータを端末装置に保存させる(ステップS213)。これにより、端末装置200において、図22に示すような、テンプレートデータを保存することができる(ステップS125)。
【0126】
このようにして得た音声合成データやテンプレートは、インターネット202などを介して、他の人に配布することができる。音声合成データを受けた他人は、サウンドカード22を持っていれば、合成音声を聞くことができる。また、テンプレートを受けた他人は、端末装置206からサーバ装置204にアクセスして、テンプレート処理プログラムを実行し、所望の音声合成データを得ることができる。
【0127】
図29に、テンプレートに基づいて音声合成データを得る場合の処理フローチャートを示す。端末装置206の操作者は、サーバ装置204にアクセスして、テンプレートを送信する(ステップS151)。サーバ装置204は、これに応じて、テンプレート画面を送信する(ステップS251)。たとえば、図24に示すような画面を送信する。端末装置200では、これを表示する。
【0128】
操作者は、このテンプレート画面の差替部分120に、所望の文字列を入力する(ステップS152)。さらに、操作者は、音声合成指令ボタンをクリックし、音声合成指令をサーバ装置204に送信する(ステップS153)。
【0129】
サーバ装置204は、これを受けて、パラメータを生成し(ステップS252)、音声合成を行う(ステップS253)。さらに、生成した音声合成データを、端末装置200に送信する(ステップS254)。端末装置200では、この音声合成データを再生する(ステップS154)。このようにして、音声合成を行うことができる。また、端末装置において、この音声合成データを保存することもできる。
【0130】
上記各実施形態においては、各機能をプログラムによって実現しているが、その一部又は全部を論理回路によって実現してもよい。
【図面の簡単な説明】
【図1】この発明の一実施形態による音声合成制御装置と音声合成部の全体構成を示す図である。
【図2】図1の装置をCPUを用いて実現した場合のハードウエア構成を示す図である。
【図3】インターフェイスプログラムのフローチャートである。
【図4】音声合成処理部分のフローチャートである。
【図5】編集処理部分のフローチャートである。
【図6】音声合成データ保存のフローチャートである。
【図7】テンプレートデータ保存のフローチャートである。
【図8】入力・作業画面の例である。
【図9】生成されたパラメータを示す図である。
【図10】パラメータに基づいて、文字列の形態を修飾して表示した画面の例である。
【図11】読みがなの編集画面を示す図である。
【図12】修正されたパラメータを示す図である。
【図13】修正された入力・作業画面を示す図である。
【図14】修正されたパラメータを示す図である。
【図15】アクセントの編集画面を示す図である。
【図16】アクセントの編集画面を示す図である。
【図17】音素片の編集画面を示す図である。
【図18】音素片の特性の表示例である。
【図19】テンプレート作成画面を示す図である。
【図20】品詞選択のための画面を示す図である。
【図21】テンプレート作成画面を示す図である。
【図22】テンプレートデータを示す図である。
【図23】テンプレート処理プログラムのフローチャートである。
【図24】テンプレートによる音声合成を行う際の画面である。
【図25】端末装置200からサーバ装置204を使って音声合成を行う場合のシステム構成である。
【図26】音声合成処理のフローチャートである。端末装置の側はブラウザプログラムの処理、サーバ装置の側はインターフェイスプログラムおよび音声合成エンジンの処理を示している。
【図27】音声合成処理のフローチャートである。
【図28】テンプレート作成時のフローチャートである。
【図29】テンプレートによる再生処理を示すフローチャートである。
【符号の説明】
2・・・音声合成制御装置
4・・・音声合成部
6・・・インターフェイス画面
Claims (25)
- 音声合成部に対するインターフェイスをとるための音声合成制御装置であって、
音声合成指令を受けると、与えられた文字列を音声合成部に与え、音声合成部から、当該文字列に対応する音声合成データおよび音声合成の際に用いたパラメータを取得し、
前記パラメータに基づいて文字列を修飾して表示し、
操作者によって、前記文字列の修飾が修正され、音声合成指令が与えられると、当該修正された修飾に基づいてパラメータを修正して音声合成部に与え、音声合成部から修正した音声合成データを取得する音声合成制御装置。 - コンピュータを用いて音声合成部に対するインターフェイスを実現するためのインターフェイスプログラムであって、
音声合成指令を受けると、与えられた文字列を音声合成部に与え、音声合成部から、当該文字列に対応する音声合成データおよび音声合成の際に用いたパラメータを取得し、
前記パラメータに基づいて文字列を修飾して表示し、
操作者によって、前記文字列の修飾が修正され、音声合成指令が与えられると、当該修正された修飾に基づいてパラメータを修正して音声合成部に与え、音声合成部から修正した音声合成データを取得する処理をコンピュータに行わせるためのプログラム。 - 請求項1の装置または請求項2のプログラムにおいて、
前記文字列は、漢字まじり文字列またはかな文字列であることを特徴とするもの。 - 請求項1〜3のいずれかの装置またはプログラムにおいて、
操作者から与えられる文字列は漢字まじりの文字列であり、
音声合成部は、与えられた漢字まじり文字列に対応するかな文字列を生成し、
音声合成部から受けたかな文字列に対して、前記修飾を施して表示することを特徴とするもの。 - コンピュータを用いて音声合成部に対するインターフェイスを実現するためのインターフェイスプログラムであって、
音声合成指令を受けると、与えられた漢字まじり文字列を音声合成部に与え、音声合成部から、当該漢字まじり文字列に対応する音声合成データ、当該漢字まじり文字列に対応するかな文字列および音声合成の際に用いたパラメータを取得し、
前記パラメータに基づいて前記かな文字列を修飾して表示し、
操作者によって、前記かな文字列の修飾が修正され、音声合成指令が与えられると、当該修正された修飾に基づいてパラメータを修正して音声合成部に与え、音声合成部から修正した音声合成データを取得する処理をコンピュータに行わせるためのプログラム。 - 請求項5のプログラムにおいて、
操作者によって、表示されたかな文字列が修正され、音声合成指令が与えられると、当該修正されたかな文字列を音声合成部に与え、音声合成部から修正した音声合成データを取得することを特徴とするもの。 - 請求項1〜6のいずれかの装置またはプログラムにおいて、
前記パラメータは、前記文字に対応する音の長さに関するパラメータであることを特徴とするもの。 - 請求項1〜6のいずれかの装置またはプログラムにおいて、
前記パラメータは、アクセントに関するパラメータであることを特徴とするもの。 - 請求項8の装置またはプログラムにおいて、
前記パラメータはアクセント区切または形態素区切またはその双方であり、
前記文字列の修飾は、前記区切の位置において、表示上の区切が設けられるような修飾であることを特徴とするもの。 - 請求項9の装置またはプログラムにおいて、
前記表示上の区切を変更することにより、これに応じてパラメータとしてのアクセント区切が修正されることを特徴とするもの。 - 請求項8の装置またはプログラムにおいて、
前記パラメータはアクセントの高低であり、
前記文字列の修飾は、アクセントの高低に合わせて、文字列の配列方向に垂直な方向に、各文字の位置を移動したような修飾であることを特徴とするもの。 - 請求項11の装置またはプログラムにおいて、
前記文字の位置を変更することにより、これに応じてパラメータとしてのアクセントの高低が修正されることを特徴とするもの。 - 請求項1〜12のいずれかの装置またはプログラムにおいて、
音声合成部は、各文字について音声合成の候補とした複数の音素片の特性情報を出力し、
これに応じて、文字について、複数の音素片候補の特性を表示し、
操作者によって、用いる音素片が変更され、音声合成指令が与えられると、当該変更された音素片の特性を音声合成部に与え、音声合成部から変更した音声合成データを取得することを特徴とするもの。 - 請求項13の装置またはプログラムにおいて、
前記音素片の特性は、音声合成部に記録されている当該音素片を含む一連の音声データにおける、当該音素片およびその前後の音素片の時間長またはアクセントの高低であることを特徴とするもの。 - 請求項1〜14のいずれかの装置またはプログラムにおいて、
保存指令に応じて、音声合成データを音声ファイルとして保存することを特徴とするもの。 - 請求項1〜15のいずれかの装置またはプログラムにおいて、
保存指令に応じて、文字列およびパラメータを音声特性ファイルとして保存することを特徴とするもの。 - 請求項16の装置またはプログラムにおいて、
前記文字列の一部に、特定の文字列を決定しない差替部分を設け、当該差替部分については、パラメータを生成するための情報を記録することを特徴とするもの。 - 音声合成のための音声特性ファイルであって、
音声の発話順に並べられた文字列部分と差替部分を備えており、
文字列部分には、文字列および各文字に対応するパラメータが記録されており、
差替部分には、文字列が挿入された場合に当該文字列の各文字にどのようなパラメータを与えるかを決定するための情報が記録されていることを特徴とする音声特性ファイル。 - 音声特性ファイルに基づいて音声合成部に音声合成を行わせる処理をコンピュータに行わせるためのプログラムであって、
前記音声ファイルには、音声の発話順に並べられた文字列部分と差替部分が設けられており、文字列部分には、文字列および各文字に対応するパラメータが記録されており、差替部分には、文字列が挿入された場合に当該文字列の各文字にどのようなパラメータを与えるかを決定するための情報が記録されており、
与えられた音声特性ファイルに基づいて、文字列部分を文字で表示し、差替部分を入力領域として、発話順に表示し、
操作者によって、前記入力領域に文字列が挿入されて、音声合成指令が与えられると、文字列部分に対応するパラメータを音声特性ファイルから読み出し、挿入された文字列に対するパラメータを、前記差替部分に対応して記録されている情報を考慮して生成し、音声合成部に与えて音声合成データを得る処理をコンピュータに行わせるためのプログラム。 - 文字列を受けてパラメータを算出し、
文字列およびパラメータに基づいて、文字列に対応する音声合成データを生成し、
前記パラメータに基づいて文字列を修飾して表示し、
操作者によって、前記文字列の修飾が修正され、音声合成指令が与えられると、当該修正された修飾に基づいてパラメータを修正して音声合成データを生成する音声合成制御装置。 - コンピュータを用いて音声合成処理を行うためのプログラムであって、
文字列を受けてパラメータを算出し、
文字列およびパラメータに基づいて、文字列に対応する音声合成データを生成し、
前記パラメータに基づいて文字列を修飾して表示し、
操作者によって、前記文字列の修飾が修正され、音声合成指令が与えられると、当該修正された修飾に基づいてパラメータを修正して音声合成データを生成する処理をコンピュータに行わせるための音声合成プログラム。 - 端末装置と通信可能な音声合成サーバ装置であって、
文字列を受けてパラメータを算出し、
文字列およびパラメータに基づいて、文字列に対応する音声合成データを生成し、
前記パラメータに基づいて文字列を修飾して表示するためのデータを端末装置に送信し、
端末装置の操作者によって、前記文字列の修飾が修正され、音声合成指令が送信されてくると、当該修正された修飾に対応するパラメータに基づいて音声合成データを生成して端末装置に送信する音声合成サーバ装置。 - 端末装置と通信可能な音声合成サーバ装置をコンピュータによって実現するためのプログラムであって、
文字列を受けてパラメータを算出し、
文字列およびパラメータに基づいて、文字列に対応する音声合成データを生成し、
前記パラメータに基づいて文字列を修飾して表示するためのデータを端末装置に送信し、
端末装置の操作者によって、前記文字列の修飾が修正され、音声合成指令が送信されてくると、当該修正された修飾に対応するパラメータに基づいて音声合成データを生成して端末装置に送信する処理をコンピュータに行わせるためのプログラム。 - 請求項22または請求項23のサーバ装置またはプログラムにおいて、
前記サーバ装置は、端末装置の要求に応じて、音声特性ファイルを端末装置に送信するものであり、
前記音声特性ファイルは、
音声の発話順に並べられた文字列部分と差替部分を備えており、
文字列部分には、文字列および各文字に対応するパラメータが記録されており、
差替部分には、文字列が挿入された場合に当該文字列の各文字にどのようなパラメータを与えるかを決定するための情報が記録されている。 - 文字列を受けてパラメータを算出し、
文字列およびパラメータに基づいて、文字列に対応する音声合成データを生成し、
前記パラメータに基づいて文字列を修飾して表示し、
操作者によって、前記文字列の修飾が修正され、音声合成指令が与えられると、当該修正された修飾に基づいてパラメータを修正して音声合成データを生成する音声合成方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2003036524A JP4311710B2 (ja) | 2003-02-14 | 2003-02-14 | 音声合成制御装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2003036524A JP4311710B2 (ja) | 2003-02-14 | 2003-02-14 | 音声合成制御装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2004246129A true JP2004246129A (ja) | 2004-09-02 |
JP4311710B2 JP4311710B2 (ja) | 2009-08-12 |
Family
ID=33021587
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2003036524A Expired - Fee Related JP4311710B2 (ja) | 2003-02-14 | 2003-02-14 | 音声合成制御装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP4311710B2 (ja) |
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2007148172A (ja) * | 2005-11-29 | 2007-06-14 | Matsushita Electric Ind Co Ltd | 声質制御装置および方法およびプログラム記憶媒体 |
JP2011180368A (ja) * | 2010-03-01 | 2011-09-15 | Fujitsu Ltd | 合成音声修正装置および合成音声修正方法 |
JP2013011828A (ja) * | 2011-06-30 | 2013-01-17 | Fujitsu Ltd | 音声合成装置、音質修正方法およびプログラム |
WO2015111256A1 (ja) * | 2014-01-24 | 2015-07-30 | クラリオン株式会社 | 音声調整システム、サーバ及び車載装置 |
US20200294484A1 (en) * | 2017-11-29 | 2020-09-17 | Yamaha Corporation | Voice synthesis method, voice synthesis apparatus, and recording medium |
JP2020166298A (ja) * | 2020-07-01 | 2020-10-08 | ヤマハ株式会社 | 音声合成方法 |
-
2003
- 2003-02-14 JP JP2003036524A patent/JP4311710B2/ja not_active Expired - Fee Related
Cited By (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2007148172A (ja) * | 2005-11-29 | 2007-06-14 | Matsushita Electric Ind Co Ltd | 声質制御装置および方法およびプログラム記憶媒体 |
JP4664194B2 (ja) * | 2005-11-29 | 2011-04-06 | パナソニック株式会社 | 声質制御装置および方法およびプログラム記憶媒体 |
JP2011180368A (ja) * | 2010-03-01 | 2011-09-15 | Fujitsu Ltd | 合成音声修正装置および合成音声修正方法 |
JP2013011828A (ja) * | 2011-06-30 | 2013-01-17 | Fujitsu Ltd | 音声合成装置、音質修正方法およびプログラム |
WO2015111256A1 (ja) * | 2014-01-24 | 2015-07-30 | クラリオン株式会社 | 音声調整システム、サーバ及び車載装置 |
JPWO2015111256A1 (ja) * | 2014-01-24 | 2017-03-23 | クラリオン株式会社 | 音声調整システム、サーバ及び車載装置 |
US20200294484A1 (en) * | 2017-11-29 | 2020-09-17 | Yamaha Corporation | Voice synthesis method, voice synthesis apparatus, and recording medium |
US11495206B2 (en) * | 2017-11-29 | 2022-11-08 | Yamaha Corporation | Voice synthesis method, voice synthesis apparatus, and recording medium |
JP2020166298A (ja) * | 2020-07-01 | 2020-10-08 | ヤマハ株式会社 | 音声合成方法 |
JP7180642B2 (ja) | 2020-07-01 | 2022-11-30 | ヤマハ株式会社 | 音声合成方法、音声合成システムおよびプログラム |
Also Published As
Publication number | Publication date |
---|---|
JP4311710B2 (ja) | 2009-08-12 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP4237915B2 (ja) | ユーザが文字列の発音を設定することを可能にするためにコンピュータ上で実行される方法 | |
EP0216129B1 (en) | Apparatus for making and editing dictionary entries in a text to speech conversion system | |
US6915258B2 (en) | Method and apparatus for displaying and manipulating account information using the human voice | |
JP2005174026A (ja) | 情報処理装置及びその制御方法、プログラム | |
JP2013072957A (ja) | 文書読み上げ支援装置、方法及びプログラム | |
US7099828B2 (en) | Method and apparatus for word pronunciation composition | |
US20090281808A1 (en) | Voice data creation system, program, semiconductor integrated circuit device, and method for producing semiconductor integrated circuit device | |
JP4311710B2 (ja) | 音声合成制御装置 | |
JP2005345699A (ja) | 音声編集装置、音声編集方法および音声編集プログラム | |
JP5423466B2 (ja) | 音声合成装置、音声合成方法、及び音声合成プログラム | |
JP6003115B2 (ja) | 歌唱合成用シーケンスデータ編集装置および歌唱合成用シーケンスデータ編集方法 | |
JP2003167600A (ja) | 音声認識装置及び方法、ページ記述言語表示装置及びその制御方法、並びにコンピュータ・プログラム | |
JP5082971B2 (ja) | 音声合成装置およびそれを用いた読み上げシステム。 | |
JPH08272388A (ja) | 音声合成装置及びその方法 | |
JP2580565B2 (ja) | 音声情報辞書作成装置 | |
JP2002268664A (ja) | 音声変換装置及びプログラム | |
JPH09325787A (ja) | 音声合成方法、音声合成装置、文章への音声コマンド組み込み方法、及び装置 | |
JP2005181840A (ja) | 音声合成装置及び音声合成プログラム | |
JP4551066B2 (ja) | 音声合成装置、音声合成方法及び音声合成プログラム | |
JP2002023781A (ja) | 音声合成装置、音声合成装置におけるフレーズ単位修正方法、音声合成装置における韻律パターン編集方法、音声合成装置における音設定方法および音声合成プログラムを記録したコンピュータ読み取り可能な記録媒体 | |
JP2007127994A (ja) | 音声合成方法及び音声合成装置並びにプログラム | |
JPH11272673A (ja) | 文書処理方法および文書処理装置ならびに文書処理のためのコンピュータプログラムを記録した記録媒体 | |
JP2001100754A (ja) | データ処理方法、データ処理装置およびデータ処理プログラムを格納したコンピュータ読み取り可能な記録媒体 | |
JP2003150182A (ja) | 音声合成装置、音声合成装置の制御方法、音声合成制御プログラム及び記録媒体 | |
JPH0883270A (ja) | 音声合成装置及びその方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
RD04 | Notification of resignation of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7424 Effective date: 20050331 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20060131 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20090212 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20090223 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20090227 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20090324 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20090507 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20090511 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120522 Year of fee payment: 3 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 Ref document number: 4311710 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130522 Year of fee payment: 4 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20140522 Year of fee payment: 5 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
S531 | Written request for registration of change of domicile |
Free format text: JAPANESE INTERMEDIATE CODE: R313531 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
LAPS | Cancellation because of no payment of annual fees |