JP2015060038A - 音声合成装置、言語辞書修正方法及び言語辞書修正用コンピュータプログラム - Google Patents

音声合成装置、言語辞書修正方法及び言語辞書修正用コンピュータプログラム Download PDF

Info

Publication number
JP2015060038A
JP2015060038A JP2013192984A JP2013192984A JP2015060038A JP 2015060038 A JP2015060038 A JP 2015060038A JP 2013192984 A JP2013192984 A JP 2013192984A JP 2013192984 A JP2013192984 A JP 2013192984A JP 2015060038 A JP2015060038 A JP 2015060038A
Authority
JP
Japan
Prior art keywords
phrase
prosodic
prosody
word
notation
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2013192984A
Other languages
English (en)
Other versions
JP6197523B2 (ja
Inventor
野田 拓也
Takuya Noda
拓也 野田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP2013192984A priority Critical patent/JP6197523B2/ja
Publication of JP2015060038A publication Critical patent/JP2015060038A/ja
Application granted granted Critical
Publication of JP6197523B2 publication Critical patent/JP6197523B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Machine Translation (AREA)

Abstract

【課題】言語辞書に登録された単語の読み情報が修正されても、その単語を含む句の韻律情報を反映させることが可能な音声合成装置を提供する。【解決手段】音声合成装置1は、読み情報が修正された単語を含む韻律修正対象句を検出する検索部21と、検出された韻律修正対象句に、その韻律修正対象句の韻律情報を修正するときに連続する文字列を結合して対象範囲を設定する対象範囲決定部22と、対象範囲内で、韻律修正対象句の少なくとも一部と読み情報が修正された単語を含むアクセント句を韻律継承アクセント句とするアクセント句判定部23と、単語の修正された読み情報を含む言語辞書を用いて対象範囲を言語解析して得られた中間表記のうちの韻律継承アクセント句に対応する中間表記を、言語辞書に登録された韻律継承アクセント句についての韻律情報で修正する修正部25と、修正された中間表記に基づいて言語辞書を更新する更新部26とを有する。【選択図】図3

Description

本発明は、例えば、テキストデータから音声信号を合成する音声合成装置及びその音声合成装置で利用される言語辞書の修正方法及び言語辞書修正用コンピュータプログラムに関する。
近年、音声を自動合成する音声合成技術が開発されている。音声合成技術は、短時間で所望の音声を作成できるというメリットを有するため、これまで予め録音されたプロのナレータによる音声を用いていたアプリケーションの中には、このような音声合成技術を採用したものもある。特に、商業施設における案内放送、ハイウェイラジオ、ハイウェイテレホンまたは天気予報の放送など、短い時間間隔で提供する情報が更新されるアプリケーションでは、上記のメリットを持つ音声合成技術が有用である。
合成したい音声信号を生成するために、音声合成装置には、例えば、キーボードなどを介して漢字仮名交じりのテキストデータが入力される。そして音声合成装置は、そのテキストデータに対して、単語の読みなどを登録した言語辞書を利用して、形態素解析または係り受け解析といった言語処理を行う。そして音声合成装置は、その言語処理によって、形態素単位の読み表記を表す形態素情報と、その形態素情報にアクセント位置、アクセントの強弱あるいは抑揚の大小といった韻律を表す韻律記号を付した中間表記を生成する。そして音声合成装置は、その中間表記に基づいて、合成音声信号を生成する。なお、漢字仮名表記の読み、アクセント位置及びその漢字仮名表記を含むアクセント句の範囲を表す情報を、本明細書では読み情報と呼ぶ。また、漢字仮名表記におけるアクセントの強弱、音程の高低、抑揚の大小、話速の緩急、音量の大小、及び発音中の区切り位置などを、本明細書では韻律情報と呼ぶ。
漢字には、複数の読み方があり、また、単語によってその単語に含まれる漢字の読み方は異なる。また、日常で使用される単語は日々変化するので、全ての単語を予め言語辞書に登録することは事実上不可能であり、入力されたテキストデータに、言語辞書に登録されていない単語が含まれていることもある。そのため、言語処理の結果得られる中間表記が正確でないこともある。このような場合、正しい合成音声信号を得るために、ユーザが手動で中間表記を修正する必要がある。このような修正作業は、ユーザにとって煩雑であるため、できるだけこのような修正作業が発生しないことが好ましい。そこで、入力テキストデータの終端に至った際にいままで抽出された未知語を一括してユーザに伝え、その未知語とユーザにより入力されたその未知語についての情報を単語辞書に登録する技術が提案されている(例えば、特許文献1を参照)。また、言語解析結果のうちの第1候補の言語解析結果の中に記憶された置換条件と一致する部分が存在する場合、その一致部分を置換条件に対応する置換情報に置き換えて新たな言語解析結果を生成する技術が提案されている(例えば、特許文献2を参照)。この技術では、新たな言語解析結果と同じものが第1候補以外の言語解析結果として存在している場合には、新たな言語解析結果に基づいて合成音声が生成される。
特開平7−244491号公報 特開平10−312377号公報
言語辞書に、読み情報及び韻律情報が登録されている単語について、例えば、複数のユーザがその単語の合成音声のレビューを行ってより適切な合成音声を得ようとする場合など、その読み情報または韻律情報が修正されることがある。特に、単語の読み情報が修正されると、その単語またはその単語を含む文の韻律情報も、場合によっては修正が必要となる。韻律情報は、読み情報に影響されるためである。もし、読み情報が修正されても韻律情報が修正されなければ、韻律情報が付された単語等の読みと実際の読みとが異なるために、その韻律情報が使用されなくなるか、その韻律情報を無理に使用しても適切な韻律とならなくなる。一方、単語の読み情報の修正に伴って、その単語に関連する韻律情報を全て修正するのは煩雑な手間を要する。
そこで本明細書は、一つの側面として、言語辞書に登録された単語の読み情報が修正されても、その単語を含む句に言語辞書に登録済みの韻律情報を反映させることが可能な音声合成装置を提供することを目的とする。
一つの実施形態によれば、テキストデータから生成した、そのテキストデータの読み及び韻律を表す韻律情報を含む中間表記に基づいて合成音声信号を生成する音声合成装置が提供される。この音声合成装置は、少なくとも1以上の単語の漢字仮名表記及びその単語の読み情報と、少なくとも1以上の韻律修正対象句の漢字仮名表記と、韻律修正対象句の中間表記と、韻律修正対象句の中間表記に含まれる韻律情報が適用されるときに韻律修正対象句と連続する文字列の漢字仮名表記とが登録され、かつ、テキストデータから中間表記を生成するために利用される言語辞書を記憶し、読み情報は単語の読み及びアクセント位置に関する情報である記憶部と、少なくとも1以上の単語の何れかの読み情報が修正されると、少なくとも1以上の韻律修正対象句の中から、読み情報が修正された単語を含む韻律修正対象句を検出する検索部と、読み情報が修正された単語を含む韻律修正対象句と、その韻律修正対象句と連続する文字列とを結合することで得られる文字列を韻律修正対象句の韻律情報を継承するか否かを判定する対象範囲として設定する対象範囲決定部と、対象範囲をアクセント句単位に分割し、韻律修正対象句の少なくとも一部と読み情報が修正された単語を含むアクセント句を、韻律修正対象句の韻律情報を継承する韻律継承アクセント句と判定するアクセント句判定部と、修正された単語の読み情報を含む言語辞書を用いて対象範囲を言語解析することにより得られた中間表記のうちの韻律継承アクセント句に対応する部分の中間表記を、韻律継承アクセント句についての韻律情報で修正する修正部と、韻律修正対象句を韻律継承アクセント句で置換するとともに、置換後の韻律修正対象句に対応する中間表記を韻律継承アクセント句についての修正された中間表記とすることで言語辞書を更新する更新部とを有する。
本発明の目的及び利点は、請求項において特に指摘されたエレメント及び組み合わせにより実現され、かつ達成される。
上記の一般的な記述及び下記の詳細な記述の何れも、例示的かつ説明的なものであり、請求項のように、本発明を限定するものではないことを理解されたい。
本明細書に開示された音声合成装置は、言語辞書に登録された単語の読み情報が修正されても、その単語を含む句に言語辞書に登録済みの韻律情報を反映させることができる。
修正された読み情報と韻律情報間に不整合が生じた中間表記の一例を示す図である。 一つの実施形態による音声合成装置の概略構成図である。 (a)は、ユーザ辞書の一例を示す図であり、(b)は、中間表記辞書の一例を示す図である。 一つの実施形態による音声合成装置が有する処理部の機能ブロック図である。 中間表記辞書及びユーザ辞書と韻律継承アクセント句の関係の一例を示す図である。 中間表記辞書及びユーザ辞書と韻律継承アクセント句の関係の他の一例を示す図である。 中間表記辞書及びユーザ辞書と韻律継承アクセント句の関係のさらに他の一例を示す図である。 中間表記辞書及びユーザ辞書と韻律継承アクセント句の関係のさらに他の一例を示す図である。 複合名詞の一例を示す図である。 複合名詞の他の一例を示す図である。 修正単語が複合名詞に含まれない場合における、韻律情報継承範囲の一例を示す図である。 修正単語が複合名詞に含まれない場合における、韻律情報継承範囲の他の一例を示す図である。 修正単語が複合名詞に含まれない場合における、韻律情報継承範囲のさらに他の一例を示す図である。 修正単語が複合名詞に含まれる場合における、韻律情報継承範囲の一例を示す図である。 修正単語が複合名詞に含まれる場合における、韻律情報継承範囲の一例を示す図である。 辞書修正処理の動作フローチャートである。
以下、図を参照しつつ、一つの実施形態による音声合成装置について説明する。
最初に、図1を参照しつつ、修正された読み情報と韻律情報間に不整合が生じた中間表記の例を説明する。
ユーザにより編集され、単語の漢字仮名表記、中間表記、品詞及び活用形などを格納した、言語辞書の一例であるユーザ辞書100には、先ず、単語「Data」について、その読みが「データー」として登録されているとする。また、韻律情報を記憶する言語辞書の一例である中間表記辞書110には、韻律情報の修正対象となる、単語「Data」を含む句の漢字仮名表記「Dataです」が登録されている。また、中間表記辞書110には、その韻律情報修正対象となる句についての韻律情報を含む中間表記「デMーターデス」が登録されている。さらに、中間表記辞書110には、韻律情報の修正対象となる句についての中間表記に含まれる韻律情報が適用される場合に、その句と連続する文字列、すなわち、その句に前置される漢字仮名表記「これは」及び後置される漢字仮名表記「。」が登録されている。なお、本明細書では、漢字仮名表記と中間表記の区別を容易にするために、中間表記では片仮名を使用する。また、記号「M」は、韻律情報を表す記号であり、例えば、記号「M」は、アクセントが中程度のレベルであることを表す。この場合、音声合成装置は、漢字仮名表記が「これはDataです。」という文が入力されると、言語辞書及び中間表記辞書を参照することにより、「コレハ|デMーターデス.」という中間表記を作成する。
ここで、ユーザ辞書100に登録されている単語「Data」の読みが「データー」から「データ」に修正されたとする。この修正後に、「これはDataです。」という文が入力されると、ユーザ辞書100に登録されている「Data」の読みが変更されているために、中間表記辞書110に登録されている韻律情報が反映されず、「コレハ|データデHス.」という中間表記が生成される。このように、ユーザが作成した韻律情報が、言語辞書の修正に伴って利用されなくなってしまう。
そこで、本実施形態による音声合成装置は、ユーザ辞書に登録された単語の読み情報が修正されると、中間表記辞書に登録されている、韻律情報の修正対象となる単語、句又は文節などの漢字仮名表記の中から、その修正された単語を含むものを検出する。さらに音声合成装置は、検出された句などの漢字仮名表記に、中間表記辞書に登録されている前後の単語などの漢字仮名表記を結合したものを、中間表記辞書に登録されている韻律情報を継承させる可能性がある対象範囲に設定する。そしてこの音声合成装置は、対象範囲を構成するアクセント句のうちで、読み情報が修正された単語を含むアクセント句を、韻律情報を継承する範囲として設定する。さらにこの音声合成装置は、読み情報が修正された単語が特定の複合名詞に含まれるか否かによって、中間表記辞書に登録されている韻律情報を継承するか否かを判定する。なお、アクセント句とは、アクセントを一つのみ含む句である。また、以下の実施形態では、理解を容易にするために、韻律情報としてアクセントの強弱のみが示されるが、上記のように、韻律情報には、音程の高低、抑揚の大小、話速の緩急、音量の大小、及び発音中の区切り位置も含まれる。
図2は、一つの実施形態による音声合成装置の概略構成図である。本実施形態では、音声合成装置1は、入力部2と、記憶部3と、処理部4と、出力部5とを有する。
入力部2は、合成音声の原文であり、漢字仮名交じり文であるテキストデータを取得する。そのために、入力部2は、例えば、キーボードを有する。また、入力部2は、マウスなどのポインティングデバイスとそのポインティングデバイスにより指示される入力すべき文字または数値などを表示するディスプレイとを有する。あるいは、入力部2は、タッチパネルディスプレイを有してもよい。
さらにまた、入力部2は、テキストデータを通信ネットワークを介して音声合成装置1と接続された他の機器から取得してもよい。この場合、入力部2は、音声合成装置1を通信ネットワークに接続するためのインターフェース回路を有する。
そして入力部2は、入力されたテキストデータを処理部4へ渡す。
記憶部3は、例えば、半導体メモリ回路、磁気記憶装置または光記憶装置のうちの少なくとも一つを有する。そして記憶部3は、処理部4で用いられる各種コンピュータプログラム及び音声合成処理に用いられる各種のデータを記憶する。
記憶部3は、音声合成処理に用いられるデータとして、例えば、韻律モデルと、音声波形辞書を記憶する。さらに記憶部3は、言語処理に用いられるデータとして、テキストデータ中に出現すると想定される様々な単語について、その単語の漢字仮名表記、中間表記、品詞及び活用形などを格納した言語辞書を記憶する。さらに記憶部3は、ユーザにより登録された単語について、その単語の漢字仮名表記、中間表記、品詞及び活用形などを格納したユーザ辞書を記憶する。さらに記憶部3は、韻律情報の修正対象となる単語、句または文節などの漢字仮名表記及びその韻律情報と、その単語、句または文節などの前後に位置する1以上の単語または句読点などの漢字仮名表記とを格納した中間表記辞書を記憶する。なお、以下では、便宜上、韻律情報の修正対象となる単語、句または文節などの文字列を、韻律修正対象句と呼ぶ。なお、ユーザ辞書及び中間表記辞書も、言語辞書の一例である。
図3(a)は、ユーザ辞書の一例を示す図である。この例では、単語「Data」がユーザ辞書300に登録されている。そしてユーザ辞書300には、その単語の漢字仮名表記「Data」と、中間表記「データ」と、単語「Data」の品詞(普通名詞)が登録されている。
図3(b)は、中間表記辞書の一例を示す図である。この例では、アクセント句「Dataです」が韻律修正対象句として中間表記辞書310に登録されている。そして中間表記辞書310には、その韻律修正対象句の漢字仮名表記「Dataです」及び韻律情報を含む中間表記「デMーターデス」が登録される。さらに、中間表記辞書310には、韻律修正対象句についての中間表記に含まれる韻律情報が適用されるときに韻律修正対象句に前置される単語等の文字列の漢字仮名表記「これは」及びアクセント句に後置される単語等の文字列の漢字仮名表記「。」が登録される。
出力部5は、処理部4から受け取った合成音声信号をスピーカ6へ出力する。そのために、出力部5は、例えば、スピーカ6を音声合成装置1と接続するためのオーディオインターフェース回路を有する。
また出力部5は、合成音声信号を、通信ネットワークを介して音声合成装置1と接続された他の装置へ出力してもよい。この場合、出力部5は、その通信ネットワークに音声合成装置1と接続するためのインターフェース回路を有する。なお、入力部2も通信ネットワークを介してテキストデータを取得する場合、入力部2と出力部5は一体化されていてもよい。
処理部4は、一つまたは複数のプロセッサと、メモリ回路と、周辺回路とを有する。そして処理部4は、入力されたテキストデータに基づいて、合成音声信号を作成する。
図4は、処理部4の機能ブロック図である。処理部4は、言語処理部10と、音声合成部11と、辞書登録部12と、辞書修正部13とを有する。
処理部4が有するこれらの各部は、例えば、処理部4が有するプロセッサ上で動作するコンピュータプログラムにより実現される機能モジュールである。あるいは、処理部4が有するこれらの各部は、その各部の機能を実現する一つの集積回路として音声合成装置1に実装されてもよい。
言語処理部10は、入力された、漢字仮名交じり文であるテキストデータから形態素読み表記を生成するとともに、そのテキストデータに含まれる各形態素情報を特定する。さらに、言語処理部10は、入力されたテキストデータから、中間表記及びそのテキストデータに含まれる各品詞の情報を特定する。ここで、形態素読み表記とは、形態素単位の読み表記を表し、例えば、カタカナで表される。また、中間表記とは、形態素読み表記に、韻律を表す韻律記号が追加されたものである。韻律記号には、例えば、「アクセント位置」、「アクセント強弱」、「音程高低」、「抑揚大小」、「話速緩急」、「音量大小」及び「区切り」を表現する記号が含まれる。したがって、中間表記から韻律記号を除いたものは、形態素読み表記と一致する。また、中間表記から韻律記号を除いたものにおける、各品詞の情報は、形態素情報と1対1に対応する。すなわち、中間表記と品詞情報から、形態素読み表記と形態素情報が抽出される。
言語処理部10は、入力されたテキストデータから形態素読み表記及び中間表記などを生成するために、記憶部3に記憶されている言語辞書、ユーザ辞書及び中間表記辞書を読み込む。そして言語処理部10は、例えば、その言語辞書及びユーザ辞書を用いて、テキストデータに対して形態素解析及び係り受け解析を行って、テキストデータ中に出現する各単語の順序及び読み、アクセントの位置及び区切りの位置を決定する。その際、言語処理部10は、テキストデータ中に言語辞書とユーザ辞書の両方に登録されている単語がある場合、ユーザ辞書に登録されている単語を優先的に利用してもよい。
言語処理部10は、形態素解析として、例えば、動的計画法を用いる方法を利用できる。また言語処理部10は、係り受け解析として、例えば、先読みLRパーザまたはLL法といった構文解析の手法を利用できる。そして言語処理部10は、各単語の順序、読み、アクセントの位置及び区切りの位置に応じて形態素読み表記及び中間表記を作成する。
さらに、言語処理部10は、入力テキストデータ中で、中間表記辞書に登録されている韻律修正対象句の漢字仮名表記及びその前後の漢字仮名表記と一致する部分があれば、その一致する部分に対応する中間表記の韻律情報を中間表記辞書に従って修正する。
言語処理部10は、生成した形態素読み表記及び中間表記などを記憶部3に一時的に記憶する。
音声合成部11は、入力されたテキストデータの中間表記に基づいて合成音声信号を作成する。
音声合成部11は、中間表記に基づいて、合成音声信号を生成する際の目標韻律を生成する。そのために、音声合成部11は、記憶部3から複数の韻律モデルを読み込む。この韻律モデルは、声を高くする位置及び声を低くする位置などを時間順に表したものである。そして音声合成部11は、複数の韻律モデルのうち、中間表記に示されたアクセントの位置などに最も一致する韻律モデルを選択する。そして音声合成部11は、選択した韻律モデル及び合成パラメータに従って、中間表記に対して声が高くなる位置あるいは声が低くなる位置、声の抑揚、ピッチなどを設定することにより、目標韻律を作成する。目標韻律は、音声波形を決定する単位となる音素ごとに、音素の長さ及びピッチ周波数を含む。なお、音素は、例えば、一つの母音あるいは一つの子音とすることができる。
音声合成部11は、生成した目標韻律に従って、例えば、HMM(Hidden Markov Model)合成方式、音素接続方式またはコーパスベース方式によって合成音声信号を作成する。
例えば、音声合成部11は、音素ごとに、目標韻律の音素長及びピッチ周波数に最も近い音声波形を、例えばパターンマッチングにより音声波形辞書に登録されている複数の音声波形の中から選択する。そのために、音声合成部11は、記憶部3から音声波形辞書を読み込む。音声波形辞書は、複数の音声波形及び各音声波形の識別番号を記録する。また音声波形は、例えば、一人以上のナレータが様々なテキストを読み上げた様々な音声を録音した音声信号から、音素単位で取り出された波形信号である。
さらに、音声合成部11は、音素ごとに選択された音声波形を目標韻律に沿って接続できるようにするため、それら選択された音声波形と目標韻律に示された対応する音素の波形パターンとのずれ量を、波形変換情報として算出してもよい。
音声合成部11は、音素ごとに選択された音声波形の識別番号を含む波形生成情報を作成する。波形生成情報は、波形変換情報をさらに含んでもよい。
音声合成部11は、波形生成情報に含まれる各音素の音声波形の識別番号に対応する音声波形信号を記憶部3から読み込む。そして音声合成部11は、各音声波形信号を連続的に接続することにより、合成音声信号を作成する。なお、波形生成情報に波形変換情報が含まれている場合、音声合成部11は、各音声波形信号を、対応する音素について求められた波形変換情報に従って補正して音声波形信号を連続的に接続することにより、合成音声信号を作成する。
音声合成部11は、合成音声信号を出力部5へ出力する。
辞書登録部12は、言語処理部10が生成した中間表記をユーザが修正したときに、その修正内容をユーザ辞書または中間表記辞書に登録する。
処理部4は、入力部2から中間表記の編集を行うことを示す操作信号を受け取ると、辞書登録部12を起動する。そして辞書登録部12は、例えば、編集対象となる中間表記を、対応するテキストデータとともに入力部2が有するディスプレイに表示させる。
そして辞書登録部12は、入力部2のキーボード等から、編集対象の中間表記の一部、例えば、ある単語の読み情報を修正する操作信号を受け取ると、その操作信号に従って、ユーザ辞書に登録されているその単語の読み情報を修正する。また辞書登録部12は、読み情報が修正された単語がユーザ辞書に登録されていなかった場合には、その単語の漢字仮名表記と中間表記とをユーザ辞書に登録する。
さらにまた、辞書登録部12は、入力部2のキーボード等から、ある単語の韻律情報を修正する操作信号を受け取ると、中間表記辞書に登録されている韻律修正対象句の中から、修正された単語を含む韻律修正対象句及び前後の単語等と一致するものを抽出する。そして辞書登録部12は、抽出した韻律修正対象句の韻律情報を、上記の操作信号に従って修正する。また辞書登録部12は、韻律情報が修正された韻律修正対象句及びその前後の単語などと一致するものが中間表記辞書に登録されていなければ、その韻律修正対象句の漢字仮名表記と韻律情報を、前後の単語等の漢字仮名表記とともに中間表記辞書に登録する。
なお、音声合成に対する専門知識が無いユーザでも、中間表記を修正できるように、辞書登録部12は、入力部2が有するディスプレイに韻律記号を日本語で表示させたり、各形態素の形態素情報を表示させてもよい。またユーザが、例えば、入力部2が有するマウスなどを介して修正する韻律記号を選択したり、韻律記号を追加する位置を指定すると、辞書登録部12は、例えば、プルダウンメニューなどで、選択可能な韻律記号を表す日本語表記をディスプレイに表示させる。そして辞書登録部12は、マウスなどを介して選択された日本語表記に対応する韻律記号で、中間表記の指定された位置の韻律記号を置換したり、選択された日本語表記に対応する韻律記号をその指定された位置に自動的に追加する。
また辞書登録部12は、ユーザが自分で修正した内容を把握できるようにするために、修正後の中間表記をディスプレイに表記させてもよい。さらに、辞書登録部12は、修正後の中間表記を音声合成部11に入力することにより、修正後の中間表記に対して実際に生成される合成音声をスピーカ6から出力させることで、ユーザに修正内容を確認させてもよい。
辞書修正部13は、ユーザ辞書に新たな単語が登録されるか、またはユーザ辞書に登録された単語の読み情報が修正された場合に、中間表記辞書に登録されている、その単語を含む韻律修正対象句の韻律情報を修正後の単語に適用するか否かを決定する。そのために、辞書修正部13は、検索部21と、対象範囲決定部22と、アクセント句判定部23と、品詞判定部24と、修正部25と、辞書更新部26とを有する。
検索部21は、中間表記辞書に登録された韻律修正対象句の漢字仮名表記うち、ユーザ辞書に新たに登録された単語またはユーザ辞書に登録済みの単語のうちで読み情報が修正された単語を含む漢字仮名表記を検出する。なお、ユーザ辞書に登録がない単語については、言語辞書に登録されたその単語の読み情報を参照して中間表記が作成される。また上記のように、ユーザ辞書は、ユーザが読み情報を修正した単語のみが登録される、言語辞書の一例である。このことから、ユーザ辞書に新規に単語とその読み情報を登録することも、言語辞書に登録された単語の読み情報の修正の一形態である。また以下では、便宜上、ユーザ辞書に新たに登録された単語またはユーザ辞書に登録済みの単語のうちで読み情報が修正された単語を、修正単語と呼ぶ。
再度図3(a)及び図3(b)を参照しつつ、検索部21により検出される漢字仮名表記の例について説明する。ユーザ辞書300に登録された単語「Data」の読み情報が修正され、その結果としてその単語の中間表記が修正されたとする。この場合、検索部21は、中間表記辞書310に登録されている韻律修正対象句の漢字仮名表記のなかから、単語「Data」を含む漢字仮名表記を検出する。この例では、中間表記辞書310に、「Data」を含む漢字仮名表記「Dataです」が登録されているので、検索部21は、その漢字仮名表記「Dataです」を検出する。
対象範囲決定部22は、検索部21により検出された漢字仮名表記に対応する、中間辞書に登録された前置漢字仮名表記と後置漢字仮名表記とを、その検出された漢字仮名表記と連結する。これにより、対象範囲決定部22は、中間表記辞書に登録された韻律情報を継承するか否かを判定する漢字仮名表記の対象範囲を決定する。
再度図3(b)を参照する。検索部21により中間表記辞書310から漢字仮名表記「Dataです」が検出されたとすると、対象範囲決定部22は、その前置漢字仮名表記「これは」と後置漢字仮名表記「。」とを、検出された漢字仮名表記「Dataです」と連結する。そして対象範囲決定部22は、連結された漢字仮名表記「これはDataです。」を対象範囲とする。
アクセント句判定部23は、対象範囲全体の漢字仮名表記をアクセント句単位で分割し、アクセント句単位で、中間表記辞書に登録されている韻律情報をそのアクセント句において継承するか否か判定する。
そのために、アクセント句判定部23は、対象範囲全体の漢字仮名表記を言語処理部10へ入力して、言語処理部10に、修正後のユーザ辞書を用いてその対象範囲全体を言語解析することで対象範囲全体についての中間表記を生成させる。その際、言語処理部10は、中間表記辞書を使用せずに中間表記を生成してもよい。中間表記辞書には、アクセントの位置に関する情報が含まれていないためである。そしてアクセント句判定部23は、対象範囲全体の中間表記を言語処理部10から受け取る。なお、以下では、便宜上、対象範囲全体の中間表記を修正後中間表記と呼ぶ。アクセント句判定部23は、修正後中間表記を参照して、アクセントが一つのみ含まれるアクセント句単位で、その修正後中間表記に対応する対象範囲全体の漢字仮名表記を分割する。
韻律修正対象句がアクセント句単位である場合、アクセント句判定部23は、対象範囲全体を分割したアクセント句のうち、修正単語の漢字仮名表記及び中間表記辞書に登録された韻律修正対象句の漢字仮名表記の少なくとも一部を含むアクセント句を特定する。そしてアクセント句判定部23は、その特定されたアクセント句を、中間表記辞書に登録されている韻律修正対象句の韻律情報を継承する韻律継承アクセント句とする。一方、アクセント句判定部23は、韻律継承アクセント句以外のアクセント句を、中間表記辞書に登録された韻律情報を継承しない韻律不継承アクセント句とする。
図5は、中間表記辞書及びユーザ辞書と韻律継承アクセント句の関係の一例を示す図である。この例では、中間表記辞書500には、韻律修正対象句の漢字仮名表記「Dataです」と、その前後の漢字仮名表記「これは」、「。」と、韻律情報を含む中間表記「デMーターデス」が登録されている。なお、韻律記号「M」は、アクセントが中程度であることを表す。ここで、漢字仮名表記「Data」の読みを「データー」から「データ」に変更するべく、ユーザ辞書510に、単語「Data」の漢字仮名表記とその中間表記「データ」及び品詞(普通名詞)が登録されたとする。この場合、「これはDataです。」が対象範囲となる。そこで対象範囲「これはDataです。」がユーザ辞書510を用いて言語処理される。その結果として、この対象範囲は、二つのアクセント句「これは」(中間表記「コレワ」)、「Dataです」(中間表記「データデHス」)に分割される。なお、韻律記号「H」は、アクセントが強であることを表す。この場合、アクセント句「Dataです」に、ユーザ辞書に新規登録された単語「Data」及び中間表記辞書に登録された韻律修正対象句が含まれるので、アクセント句「Dataです」が韻律継承アクセント句となる。
図6は、中間表記辞書及びユーザ辞書と韻律継承アクセント句の関係の他の一例を示す図である。この例では、中間表記辞書600には、韻律修正対象句の漢字仮名表記「Dataも」と、その前後の漢字仮名表記「良い」、「なく、」と、韻律情報を含む中間表記「デMーターモ」が登録されている。ここで、漢字仮名表記「Data」の読みを「データー」から「データ」に変更するべく、ユーザ辞書610に単語「Data」の漢字仮名表記とその中間表記「データ」及び品詞(普通名詞)が登録されたとする。この場合、「良いDataもなく、」が対象範囲となる。そこでこの対象範囲「良いDataもなく、」が、ユーザ辞書610を用いて言語処理される。その結果として、この対象範囲は、二つのアクセント句「良い」(中間表記「ヨHイ」)「Dataもなく」(中間表記「データデナHク」)に分割される。この場合、韻律修正対象句とその後置文字列の漢字仮名表記が結合されたアクセント句「Dataもなく」に、ユーザ辞書に新規登録された単語「Data」及び中間表記辞書に登録された韻律修正対象句が含まれる。そのため、アクセント句「Dataもなく」が韻律継承アクセント句となる。
なお、中間表記辞書に登録されている漢字仮名表記がアクセント句単位でないこともある。この場合、アクセント句判定部23は、対象範囲全体の漢字仮名表記を言語処理部10へ入力して、言語処理部10に、修正前のユーザ辞書を用いて言語解析させることでその対象範囲全体の中間表記を生成させてもよい。なお、以下では、便宜上、修正前のユーザ辞書を用いて作成された、対象範囲全体の漢字仮名表記に対応する中間表記を修正前中間表記と呼ぶ。そしてアクセント句判定部23は、修正前中間表記と修正後中間表記とを比較する。アクセント句判定部23は、修正前中間表記と修正後中間表記とで、韻律修正対象句の少なくとも一部を含むアクセント句が一致する場合には、ユーザ辞書において修正された単語を含まなくてもその一致するアクセント句を韻律継承アクセント句とする。
図7は、中間表記辞書及びユーザ辞書と韻律継承アクセント句の関係のさらに他の一例を示す図である。この例では、中間表記辞書700には、韻律修正対象句の漢字仮名表記「分別もなく」と、その前後の漢字仮名表記「何の」、「、」と、韻律情報を含む中間表記「ブンベツモナMク」が登録されている。ここで、漢字仮名表記「分別」の読みを「ブンベツ」から「フンベツ」に変更し、アクセント位置を先頭に変更するべく、ユーザ辞書710に漢字仮名表記「分別」とその中間表記「フAンベツ」及び品詞(普通名詞)が登録されたとする。なお、記号「A」は、アクセント位置を表す。この場合、「何の分別もなく、」が対象範囲となる。そこでこの対象範囲「何の分別もなく、」が、ユーザ辞書710を用いて言語処理されることによって修正後中間表記701が得られる。その結果として、この対象範囲は、三つのアクセント句「何の」(中間表記「ナンノ」)「分別も」(中間表記「フHンベツモ」)、「なく」(中間表記「ナHク」)に分割される。
一方、対象範囲「何の分別もなく、」を、ユーザ辞書710を用いずに言語処理することによって修正前中間表記702が得られる。その結果として、この対象範囲は、二つのアクセント句「何の」(中間表記「ナンノ」)「分別もなく」(中間表記「ブンベツモナHク」)に分割される。
この場合、修正後中間表記701におけるアクセント句「分別も」に、ユーザ辞書に新規登録された単語「分別」及び中間表記辞書に登録された韻律修正対象句の一部が含まれるので、アクセント句「分別も」が韻律継承アクセント句となる。一方、アクセント句「なく」は、韻律修正対象句の一部ではあるが、ユーザ辞書に新規登録された単語「分別」を含まず、かつ、修正前中間表記702の何れのアクセント句とも一致しないので、韻律情報を継承しない。
図8は、中間表記辞書及びユーザ辞書と韻律継承アクセント句の関係のさらに他の一例を示す図である。この例では、中間表記辞書800には、韻律修正対象句の漢字仮名表記「機密Data保持で」と、その前後の漢字仮名表記「。」、「、」と、韻律情報を含む中間表記「キミツデMーター|ホHジデ」が登録されている。なお、記号「|」は、アクセント句の区切りを表す。ここで、漢字仮名表記「Data」の読みを「データー」から「データ」に変更するべく、ユーザ辞書810に漢字仮名表記「Data」とその中間表記「データ」及び品詞(普通名詞)が登録されたとする。この場合、「機密Data保持で、」が対象範囲となる。そこでこの対象範囲「機密Data保持で、」を、ユーザ辞書810を用いて言語処理することによって修正後中間表記801が得られる。そして修正後中間表記801は、二つのアクセント句「機密データ」(中間表記「キミツデHータ」)「保持で」(中間表記「ホMジデ」)に分割される。
一方、対象範囲「機密Data保持で、」を、ユーザ辞書810を用いずに言語処理することによって修正前中間表記802が得られる。そして修正前中間表記802は、二つのアクセント句「機密データ」(中間表記「キミツデHーター」)「保持で」(中間表記「ホMジデ」)に分割される。この場合、修正前中間表記802の二つのアクセント句と修正後中間表記801の二つのアクセント句は一致し、かつ、何れのアクセント句も中間表記辞書800に登録された韻律情報を持つ。そこでアクセント句判定部23は、二つのアクセント句とも韻律継承アクセント句とする。
品詞判定部24は、対象範囲決定部22により決定された対象範囲内で修正単語の品詞を判定する。そのために、品詞判定部24は、言語処理部10に、修正後のユーザ辞書を用いて対象範囲を言語処理させ、形態素単位の品詞情報を特定する。この場合も、言語処理部10は、中間表記辞書を使用しなくてよい。そして品詞判定部24は、修正単語の品詞と修正単語の前後の形態素の品詞とに基づいて、修正単語が複合名詞の一部か否か判定する。すなわち、品詞判定部24は、修正単語の品詞が名詞でないか、修正単語の前後の形態素の何れも名詞でなければ、修正単語は複合名詞の一部ではなく、ユーザ辞書において修正単語と関連付けられた品詞を、その修正単語の品詞とする。
また品詞判定部24は、修正単語が名詞で、かつ、修正単語の前後の何れかの形態素が名詞であれば、修正単語を含む連続する名詞の集合を複合名詞と判定する。この場合、品詞判定部24は、修正単語に対応する中間表記を参照して、さらに、修正単語のアクセント位置が修正単語中の何れの位置にも規定されていない、いわゆる「平板」であるか否か判定する。さらに品詞判定部24は、修正単語が複合名詞の終端に位置するか否か判定する。修正単語のアクセントが「平板」であるか、あるいは、修正単語が複合名詞の終端以外に位置していれば、品詞判定部24は、その複合名詞を、中間表記辞書に登録された韻律情報の継承対象となる韻律継承複合名詞と判定する。
一方、修正単語のアクセントが「平板」でなく、かつ、修正単語が複合名詞の終端に位置している場合には、品詞判定部24は、その複合名詞を、中間表記辞書に登録された韻律情報の継承対象とならない韻律不継承複合名詞と判定する。この理由は、複合名詞では、複合名詞の終端の名詞のアクセントが「平板」以外の場合には、いわゆるアクセント結合が生じて、複合名詞終端の名詞のアクセントが維持されるので、中間表記辞書の韻律情報が無視されるためである。
図9は、複合名詞の一例を示す図である。複合名詞900は、3個の名詞「機密」、「Data」、「保持」が連結された名詞である。このうち、名詞「Data」が修正単語であるとする。この場合、修正単語「Data」は、複合名詞900の終端に位置していないので、複合名詞900は、韻律継承複合名詞である。
図10は、複合名詞の他の一例を示す図である。複合名詞1000は、3個の名詞「次世代」、「オープン」、「クラウド」が連結された複合名詞である。このうち、終端の名詞「クラウド」が修正単語であり、アクセントの位置が「ク」に設定されていると、複合名詞1000は、韻律不継承複合名詞である。
修正部25は、対象範囲内の各アクセント句について、韻律継承アクセント句か否か、及び、韻律継承複合名詞に含まれるか否かによって、対象範囲のうちで中間表記辞書の韻律情報を継承させる範囲を決定する。そして修正部25は、韻律情報を継承させる範囲について、修正後中間表記のうち、韻律情報継承範囲についての中間表記を、中間表記辞書の韻律情報を用いて修正する。本実施形態では、修正部25は、下記の規則に従って、韻律情報を継承させる範囲を決定する。
(1)修正単語が複合名詞に含まれない場合、または、修正単語を含む複合名詞が韻律継承複合名詞である場合
この場合、修正部25は、韻律継承アクセント句について中間表記辞書の韻律情報を継承させ、韻律不継承アクセント句については中間表記辞書の韻律情報を継承させない。
(2)修正単語を含む複合名詞が韻律不継承複合名詞である場合
この場合、修正部25は、韻律継承アクセント句であっても、韻律不継承複合名詞の一部を含むものについては中間表記辞書の韻律情報を継承させない。また、修正部25は、その他のアクセント句については、(1)と同様の規則に従って韻律情報を継承するか否か決定する。
図11は、修正単語が複合名詞に含まれない場合における、韻律情報継承範囲の一例を示す図である。図11において、ユーザ辞書1100には、単語「Data」の漢字仮名表記とその中間表記「データ」が登録されている。また、中間表記辞書1101には、韻律修正対象句の漢字仮名表記「Dataです」及びその前後の漢字仮名表記「これは」、「。」と、韻律情報を含む中間表記「デMーターデス」が登録されている。なお、中間表記辞書1101は、ユーザ辞書1100の修正がまだ反映されていないので、「Data」の形態素読み表記が「データー」となっている。この場合、対象範囲「これはDataです」は、二つのアクセント句「これは」(中間表記「コレワ」)、「Dataです」(中間表記「データデHス」)に分割され、アクセント句「Dataです」が韻律継承アクセント句となる。そしてアクセント句「Dataです」の中間表記には、アクセントの強弱を表す韻律記号が含まれているので、このアクセント句では中間表記辞書に登録されている韻律情報が継承され、韻律記号が「H」から「M」に修正される。その結果として、最終的に得られる中間表記1102は「コレハ|データデMス」となる。
図12は、修正単語が複合名詞に含まれない場合における、韻律情報継承範囲の他の一例を示す図である。図12において、ユーザ辞書1200には、単語「分別」の漢字仮名表記とその中間表記「フAンベツ」が登録されている。また、中間表記辞書1201には、韻律修正対象句の漢字仮名表記「分別もなく」及びその前後の漢字仮名表記「何の」、「、」と、韻律情報を含む中間表記「ブンベツモナMク」が登録されている。なお、中間表記辞書1201は、ユーザ辞書1200の修正がまだ反映されていないので、「分別」の形態素読み表記が「ブンベツ」となっている。この場合、対象範囲「何の分別もなく」は、三つのアクセント句「何の」(中間表記「ナンノ」)、「分別も」(中間表記「フHンベツモ」)、「なく」(中間表記「ナHク」)に分割され、アクセント句「分別も」が韻律継承アクセント句となる。そしてアクセント句「分別も」の中間表記には、アクセントの強弱を表す韻律記号が含まれているので、このアクセント句では中間表記辞書に登録されている韻律情報が継承され、韻律記号が「H」から「M」に修正される。その結果として、最終的に得られる中間表記1202は「ナンノ|フMンベツモ|ナHク」となる。
図13は、修正単語が複合名詞に含まれない場合における、韻律情報継承範囲のさらに他の一例を示す図である。図13において、ユーザ辞書1300には、単語「Data」の漢字仮名表記とその中間表記「データ」が登録されている。また、中間表記辞書1301には、韻律修正対象句の漢字仮名表記「機密Data保持で」及びその前後の漢字仮名表記「。」、「、」と、韻律情報を含む中間表記「キミツデMーター|ホHジデ」が登録されている。なお、中間表記辞書1301は、ユーザ辞書1300の修正がまだ反映されていないので、「Data」の形態素読み表記が「データー」となっている。この場合、対象範囲「機密Data保持で」は、二つのアクセント句「機密Data」(中間表記「キミツデHータ」)、「ホジデ」(中間表記「ホMジデ」)に分割され、何れのアクセント句も韻律継承アクセント句となる。そしてアクセント句「機密Data」、「保持で」の両方の中間表記には、それぞれ、アクセントの強弱を表す韻律記号が含まれているので、これらのアクセント句では中間表記辞書に登録されている韻律情報が継承される。その結果、前側のアクセント句では、韻律記号が「H」から「M」に修正され、後ろ側のアクセント句では、韻律記号が「M」から「H」に修正される。その結果として、最終的に得られる中間表記1302は「キミツデMータ|ホHジデ」となる。
図14は、修正単語が複合名詞に含まれる場合における、韻律情報継承範囲の一例を示す図である。図14において、ユーザ辞書1400には、単語「クラウド」の漢字仮名表記とその中間表記「クラウド」が登録されている。また、中間表記辞書1401には、韻律修正対象句の漢字仮名表記「次世代オープンクラウドは」及びその前後の漢字仮名表記「。」、「、」と、韻律情報を含む中間表記「ジセHダイ|オープンクラMウドハ」が登録されている。この場合、対象範囲「次世代オープンクラウドは」は、それ自体が一つのアクセント句(中間表記「ジセダイオープンクHラウドワ」)となる。この場合、「次世代オープンクラウド」は、終端の名詞「クラウド」にアクセントがあるので、韻律不継承複合名詞である。そのため、アクセント句「次世代オープンクラウドは」では、中間表記辞書の韻律情報は継承されない。したがって、最終的に得られる中間表記1402は、ユーザ辞書1400を用いて作成された中間表記と同一である。
図15は、修正単語が複合名詞に含まれる場合における、韻律情報継承範囲の一例を示す図である。図15において、ユーザ辞書1500には、単語「クラウド」の漢字仮名表記とその中間表記「クラウド」が登録されている。また、中間表記辞書1501には、韻律修正対象句の漢字仮名表記「次世代クラウドサービスは」及びその前後の漢字仮名表記「。」、「、」と、韻律情報を含む中間表記「ジセダイ|クラウドサHービスハ」が登録されている。この場合、対象範囲「次世代クラウドサービスは」は、それ自体が一つのアクセント句となる。ここで、複合名詞「次世代クラウドサービス」では、ユーザ辞書において修正された単語「クラウド」は、複合名詞の終端ではないので、複合名詞「次世代クラウドサービス」は韻律継承複合名詞である。そのため、アクセント句「次世代クラウドサービスは」では、中間表記辞書の韻律情報が継承される。
辞書更新部26は、修正後中間表記のうち、韻律情報継承範囲について中間表記辞書の韻律情報を継承させることで得られる中間表記である韻律継承後中間表記と整合するように、中間表記辞書を更新する。ここで、韻律継承後中間表記は、元の中間表記辞書に登録された韻律修正対象句の漢字仮名表記に、その前置漢字仮名表記と後置漢字仮名表記を連結して得られる対象範囲全体に対して言語解析を行って得られるものである。そのため、韻律継承後中間表記における韻律情報継承範囲と、元の韻律修正対象句の範囲が異なっていることもある。このような場合、辞書更新部26は、韻律修正対象句を、韻律情報継承範囲に合わせるように修正する。本実施形態では、韻律情報継承範囲は、アクセント句単位で決定されるので、辞書更新部26は、更新後の韻律修正対象句もアクセント句単位とすることが好ましい。また、韻律情報継承範囲内の読み情報が変更されている場合には、辞書更新部26は、変更後の読み情報を中間表記辞書の中間表記に反映させる。
辞書更新部26は、更新後の中間表記辞書を記憶部3に記憶する。
例えば、再度図11を参照すると、韻律情報継承範囲は「Dataです」となっており、元の韻律修正対象句と同じである。そのため、辞書更新部26は、中間表記辞書の韻律修正対象句及びその前置漢字仮名表記及び後置漢字仮名表記を修正せず、中間表記のみを「デMーターデス」から「データデMス」に修正する。
また、図12を参照すると、韻律情報継承範囲はアクセント句「分別も」であり、中間表記辞書に登録されている韻律修正対象句「分別もなく」より短くなっている。そこで辞書更新部26は、中間表記辞書の韻律修正対象句を「分別もなく」から「分別も」に修正し、「なく」を後置漢字仮名表記に含める。また辞書更新部26は、中間表記を「ブンベツモナMク」から「フMンベツモ」)に修正する。
図16は、辞書修正部13により実行される、辞書修正処理の動作フローチャートである。
検索部21は、中間表記辞書に登録された韻律修正対象句の漢字仮名表記うち、修正単語を含む漢字仮名表記を検出する(ステップS101)。対象範囲決定部22は、検索部21により検出された漢字仮名表記に対応する、中間辞書に登録された前置漢字仮名表記と後置漢字仮名表記とを、その検出された漢字仮名表記と連結することで対象範囲を決定する(ステップS102)。
アクセント句判定部23は、対象範囲全体の漢字仮名表記をアクセント句単位で分割する。そしてアクセント句判定部23は、そのアクセント句のうち、韻律修正対象句の少なくとも一部と修正単語とを含むアクセント句を、中間表記辞書に登録されている韻律情報を継承する韻律継承アクセント句とする(ステップS103)。一方、品詞判定部24は、対象範囲内で修正単語の品詞を判定し、修正単語を終端とする韻律不継承複合名詞があるか否か判定する(ステップS104)。
修正部25は、対象範囲内で着目するアクセント句に設定されていないアクセント句のうちの先頭を着目するアクセント句に設定する(ステップS105)。そして修正部25は、着目するアクセント句が韻律不継承複合名詞に含まれるか否か判定する(ステップS106)。着目するアクセント句が韻律不継承複合名詞に含まれる場合(ステップS106−Yes)、修正部25は、着目するアクセント句を韻律継承範囲から外す(ステップS107)。一方、着目するアクセント句が韻律不継承複合名詞に含まれない場合(ステップS106−No)、修正部25は、着目するアクセント句が韻律継承アクセント句か否か判定する(ステップS108)。
着目するアクセント句が韻律不継承アクセント句であれば(ステップS108−No)、修正部25は、着目するアクセント句を韻律継承範囲から外す(ステップS107)。一方、着目するアクセント句が韻律継承アクセント句であれば(ステップS108−Yes)、修正部25は、着目するアクセント句を韻律継承範囲に含める(ステップS109)。
ステップS107またはS108の後、修正部25は、着目済みでないアクセント句が残っているか否か判定する(ステップS110)。着目済みでないアクセント句が残っていれば(ステップS110−Yes)、修正部25は、ステップS105以降の処理を繰り返す。
一方、着目済みでないアクセント句が残っていなければ(ステップS110−No)、修正部25は、韻律継承範囲の中間表記を、中間表記辞書に登録されている韻律情報を用いて修正することで、韻律継承後中間表記を作成する(ステップS111)。辞書更新部26は、韻律継承後中間表記と整合するように、中間表記辞書を更新する(ステップS112)。そして辞書修正部13は、辞書修正処理を終了する。なお、辞書修正部13は、ステップS103とS104の処理の順序を入れ替えてもよい。また、ステップS104にて、韻律不継承複合名詞が無いと判定された場合には、ステップS106の処理は省略されてもよい。
以上に説明してきたように、この音声合成装置は、中間表記辞書に登録された韻律修正対象句の少なくとも一部に含まれる単語の読み情報が修正されると、その修正に合わせて、中間表記辞書も自動的に更新できる。そのため、この音声合成装置は、言語辞書に登録された単語の読み情報が変更されても、変更後の読み情報に対してその単語を含む句などの韻律情報を反映させることができる。
変形例によれば、中間表記辞書に登録される単語について、その単語の漢字仮名表記及び中間表記とともに、その単語に前置される1以上の単語またはその単語に後続する1以上の単語の何れかのみが登録されてもよい。また、中間表記辞書には、一つの単語が、その単語に前置または後置される1以上の異なる単語の組み合わせごとに、複数登録されてもよい。
上記の実施形態では、言語辞書、ユーザ辞書及び中間表記辞書は、それぞれ、別個の辞書としたが、言語辞書、ユーザ辞書及び中間表記辞書は、一つの辞書であってもよい。この場合には、ユーザが中間表記及び読み情報についてした修正内容は、全て言語辞書に反映される。そして言語処理部10は、言語辞書のうち、ユーザ修正の結果により追加または修正された内容を優先して言語処理を行えばよい。
また、複合名詞のアクセント結合を考慮しなくてよい場合には、品詞判定部24は省略されてもよい。この場合には、韻律継承アクセント句が韻律継承範囲そのものとなる。
さらに、上記の各実施形態による音声合成装置の処理部が有する各機能をコンピュータに実現させるコンピュータプログラムは、コンピュータによって読み取り可能な媒体、例えば、磁気記録媒体、光記録媒体または半導体メモリに記録された形で提供されてもよい。
ここに挙げられた全ての例及び特定の用語は、読者が、本発明及び当該技術の促進に対する本発明者により寄与された概念を理解することを助ける、教示的な目的において意図されたものであり、本発明の優位性及び劣等性を示すことに関する、本明細書の如何なる例の構成、そのような特定の挙げられた例及び条件に限定しないように解釈されるべきものである。本発明の実施形態は詳細に説明されているが、本発明の精神及び範囲から外れることなく、様々な変更、置換及び修正をこれに加えることが可能であることを理解されたい。
以上説明した実施形態及びその変形例に関し、更に以下の付記を開示する。
(付記1)
テキストデータから生成した、該テキストデータの読み及び韻律を表す韻律情報を含む中間表記に基づいて合成音声信号を生成する音声合成装置であって、
少なくとも1以上の単語の漢字仮名表記及び該単語の読み情報と、少なくとも1以上の韻律修正対象句の漢字仮名表記と、前記韻律修正対象句の前記中間表記と、前記韻律修正対象句の前記中間表記に含まれる韻律情報が適用されるときに前記韻律修正対象句と連続する文字列の漢字仮名表記とが登録され、かつ、前記テキストデータから前記中間表記を生成するために利用される言語辞書を記憶し、前記読み情報は前記単語の読み及びアクセント位置に関する情報である記憶部と、
前記少なくとも1以上の単語の何れかの読み情報が修正されると、前記少なくとも1以上の韻律修正対象句の中から、当該読み情報が修正された単語を含む韻律修正対象句を検出する検索部と、
前記読み情報が修正された単語を含む韻律修正対象句と、当該韻律修正対象句と連続する前記文字列とを結合することで得られる文字列を当該韻律修正対象句の韻律情報を継承するか否かを判定する対象範囲として設定する対象範囲決定部と、
前記対象範囲をアクセント句単位に分割し、前記韻律修正対象句の少なくとも一部と前記読み情報が修正された単語を含むアクセント句を、前記韻律修正対象句の韻律情報を継承する韻律継承アクセント句と判定するアクセント句判定部と、
前記修正された単語の読み情報を含む前記言語辞書を用いて前記対象範囲を言語解析することにより得られた中間表記のうちの前記韻律継承アクセント句に対応する部分の中間表記を、前記韻律継承アクセント句についての前記韻律情報で修正する修正部と、
前記韻律修正対象句を前記韻律継承アクセント句で置換するとともに、置換後の前記韻律修正対象句に対応する中間表記を前記韻律継承アクセント句についての修正された中間表記とすることで前記言語辞書を更新する更新部と、
を有する音声合成装置。
(付記2)
前記言語辞書には、当該言語辞書に登録されている単語ごとに、該単語の品詞がさらに登録され、
前記言語辞書を参照して、前記対象範囲内の前記修正された単語の品詞及び前記修正された単語の前後の単語の品詞に基づいて、前記対象範囲内で前記修正された単語が複合名詞の終端に位置する名詞か否か判定し、かつ、前記修正された単語が複合名詞の終端に位置する名詞である場合、前記修正された単語の読み情報を含む前記言語辞書を用いて前記対象範囲を言語解析することにより得られた中間表記に基づいて前記修正された単語にアクセントがあるか否か判定し、前記修正された単語が複合名詞の終端に位置する名詞であり、かつ、前記修正された単語にアクセントがあれば、前記複合名詞を韻律不継承複合名詞とする品詞判定部をさらに有し、
前記修正部は、前記韻律継承アクセント句が前記韻律不継承複合名詞に含まれる場合、当該韻律継承アクセント句の中間表記を修正しない、付記1に記載の音声合成装置。
(付記3)
前記アクセント句判定部は、前記少なくとも1以上の単語の何れかの読み情報が修正される前の前記言語辞書を用いて前記対象範囲を言語解析することにより前記対象範囲をアクセント句単位に分割したときの前記韻律修正対象句に含まれる第1のアクセント句が、前記少なくとも1以上の単語の何れかの読み情報が修正された後の前記言語辞書を用いて前記対象範囲を言語解析することにより前記対象範囲をアクセント句単位に分割したときの前記韻律修正対象句に含まれるアクセント句の何れかと一致する場合、前記第1のアクセント句を前記韻律継承アクセント句とする、付記1または2に記載の音声合成装置。
(付記4)
前記言語辞書を参照して、文字列の漢字仮名表記を言語解析することにより、当該文字列の前記中間表記を作成する言語処理部をさらに有し、
前記アクセント句判定部は、前記対象範囲の漢字仮名表記を前記言語処理部に入力することで前記対象範囲の中間表記を作成させ、当該中間表記におけるアクセントの位置を参照することで、前記対象範囲をアクセント句単位に分割する、付記1に記載の音声合成装置。
(付記5)
テキストデータから合成音声信号を生成するための、該テキストデータの読み及び韻律を表す韻律情報を含む中間表記の作成に利用され、少なくとも1以上の単語の漢字仮名表記と、該単語の読み及びアクセント位置を表す読み情報と、少なくとも1以上の韻律修正対象句の漢字仮名表記と、前記韻律修正対象句の前記中間表記と、前記韻律修正対象句の前記中間表記に含まれる韻律情報が適用されるときに前記韻律修正対象句と連続する文字列の漢字仮名表記とが登録される言語辞書の修正方法であって、
プロセッサが、前記少なくとも1以上の単語の何れかの読み情報が修正されると、前記少なくとも1以上の韻律修正対象句の中から、当該読み情報が修正された単語を含む韻律修正対象句を検出し、
前記プロセッサが、前記読み情報が修正された単語を含む韻律修正対象句と、当該韻律修正対象句と連続する前記文字列とを結合することで得られる文字列を当該韻律修正対象句の韻律情報を継承するか否かを判定する対象範囲として設定し、
前記プロセッサが、前記対象範囲をアクセント句単位に分割し、前記韻律修正対象句の少なくとも一部と前記読み情報が修正された単語を含むアクセント句を、前記韻律修正対象句の韻律情報を継承する韻律継承アクセント句と判定し、
前記プロセッサが、前記修正された読み情報を含む前記言語辞書を用いて前記対象範囲を言語解析することにより得られた中間表記のうちの前記韻律継承アクセント句に対応する部分の中間表記を、前記韻律継承アクセント句についての前記韻律情報で修正し、
前記プロセッサが、前記韻律修正対象句を前記韻律継承アクセント句で置換するとともに、置換後の前記韻律修正対象句に対応する中間表記を前記韻律継承アクセント句についての修正された中間表記とすることで前記言語辞書を更新する、
言語辞書修正方法。
(付記6)
テキストデータから合成音声信号を生成するための、該テキストデータの読み及び韻律を表す韻律情報を含む中間表記の作成に利用され、少なくとも1以上の単語の漢字仮名表記と、該単語の読み及びアクセント位置を表す読み情報と、少なくとも1以上の韻律修正対象句の漢字仮名表記と、前記韻律修正対象句の前記中間表記と、前記韻律修正対象句の前記中間表記に含まれる韻律情報が適用されるときに前記韻律修正対象句と連続する文字列の漢字仮名表記とが登録される言語辞書をコンピュータに修正させるための言語辞書修正用コンピュータプログラムであって、
前記少なくとも1以上の単語の何れかの読み情報が修正されると、前記少なくとも1以上の韻律修正対象句の中から、当該読み情報が修正された単語を含む韻律修正対象句を検出し、
前記読み情報が修正された単語を含む韻律修正対象句と、当該韻律修正対象句と連続する前記文字列とを結合することで得られる文字列を当該韻律修正対象句の韻律情報を継承するか否かを判定する対象範囲として設定し、
前記対象範囲をアクセント句単位に分割し、前記韻律修正対象句の少なくとも一部と前記読み情報が修正された単語を含むアクセント句を、前記韻律修正対象句の韻律情報を継承する韻律継承アクセント句と判定し、
前記修正された読み情報を含む前記言語辞書を用いて前記対象範囲を言語解析することにより得られた中間表記のうちの前記韻律継承アクセント句に対応する部分の中間表記を、前記韻律継承アクセント句についての前記韻律情報で修正し、
前記韻律修正対象句を前記韻律継承アクセント句で置換するとともに、置換後の前記韻律修正対象句に対応する中間表記を前記韻律継承アクセント句についての修正された中間表記とすることで前記言語辞書を更新する、
ことをコンピュータに実行させるための言語辞書修正用コンピュータプログラム。
1 音声合成装置
2 入力部
3 記憶部
4 処理部
5 出力部
6 スピーカ
10 言語処理部
11 音声合成部
12 辞書登録部
13 辞書修正部
21 検索部
22 対象範囲決定部
23 アクセント句判定部
24 品詞判定部
25 修正部
26 辞書更新部

Claims (5)

  1. テキストデータから生成した、該テキストデータの読み及び韻律を表す韻律情報を含む中間表記に基づいて合成音声信号を生成する音声合成装置であって、
    少なくとも1以上の単語の漢字仮名表記及び該単語の読み情報と、少なくとも1以上の韻律修正対象句の漢字仮名表記と、前記韻律修正対象句の前記中間表記と、前記韻律修正対象句の前記中間表記に含まれる韻律情報が適用されるときに前記韻律修正対象句と連続する文字列の漢字仮名表記とが登録され、かつ、前記テキストデータから前記中間表記を生成するために利用される言語辞書を記憶し、前記読み情報は前記単語の読み及びアクセント位置に関する情報である記憶部と、
    前記少なくとも1以上の単語の何れかの読み情報が修正されると、前記少なくとも1以上の韻律修正対象句の中から、当該読み情報が修正された単語を含む韻律修正対象句を検出する検索部と、
    前記読み情報が修正された単語を含む韻律修正対象句と、当該韻律修正対象句と連続する前記文字列とを結合することで得られる文字列を当該韻律修正対象句の韻律情報を継承するか否かを判定する対象範囲として設定する対象範囲決定部と、
    前記対象範囲をアクセント句単位に分割し、前記韻律修正対象句の少なくとも一部と前記読み情報が修正された単語を含むアクセント句を、前記韻律修正対象句の韻律情報を継承する韻律継承アクセント句と判定するアクセント句判定部と、
    前記修正された単語の読み情報を含む前記言語辞書を用いて前記対象範囲を言語解析することにより得られた中間表記のうちの前記韻律継承アクセント句に対応する部分の中間表記を、前記韻律継承アクセント句についての前記韻律情報で修正する修正部と、
    前記韻律修正対象句を前記韻律継承アクセント句で置換するとともに、置換後の前記韻律修正対象句に対応する中間表記を前記韻律継承アクセント句についての修正された中間表記とすることで前記言語辞書を更新する更新部と、
    を有する音声合成装置。
  2. 前記言語辞書には、当該言語辞書に登録されている単語ごとに、該単語の品詞がさらに登録され、
    前記言語辞書を参照して、前記対象範囲内の前記修正された単語の品詞及び前記修正された単語の前後の単語の品詞に基づいて、前記対象範囲内で前記修正された単語が複合名詞の終端に位置する名詞か否か判定し、かつ、前記修正された単語が複合名詞の終端に位置する名詞である場合、前記修正された単語の読み情報を含む前記言語辞書を用いて前記対象範囲を言語解析することにより得られた中間表記に基づいて前記修正された単語にアクセントがあるか否か判定し、前記修正された単語が複合名詞の終端に位置する名詞であり、かつ、前記修正された単語にアクセントがあれば、前記複合名詞を韻律不継承複合名詞とする品詞判定部をさらに有し、
    前記修正部は、前記韻律継承アクセント句が前記韻律不継承複合名詞に含まれる場合、当該韻律継承アクセント句の中間表記を修正しない、請求項1に記載の音声合成装置。
  3. 前記アクセント句判定部は、前記少なくとも1以上の単語の何れかの読み情報が修正される前の前記言語辞書を用いて前記対象範囲を言語解析することにより前記対象範囲をアクセント句単位に分割したときの前記韻律修正対象句に含まれる第1のアクセント句が、前記少なくとも1以上の単語の何れかの読み情報が修正された後の前記言語辞書を用いて前記対象範囲を言語解析することにより前記対象範囲をアクセント句単位に分割したときの前記韻律修正対象句に含まれるアクセント句の何れかと一致する場合、前記第1のアクセント句を前記韻律継承アクセント句とする、請求項1または2に記載の音声合成装置。
  4. テキストデータから合成音声信号を生成するための、該テキストデータの読み及び韻律を表す韻律情報を含む中間表記の作成に利用され、少なくとも1以上の単語の漢字仮名表記と、該単語の読み及びアクセント位置を表す読み情報と、少なくとも1以上の韻律修正対象句の漢字仮名表記と、前記韻律修正対象句の前記中間表記と、前記韻律修正対象句の前記中間表記に含まれる韻律情報が適用されるときに前記韻律修正対象句と連続する文字列の漢字仮名表記とが登録される言語辞書の修正方法であって、
    プロセッサが、前記少なくとも1以上の単語の何れかの読み情報が修正されると、前記少なくとも1以上の韻律修正対象句の中から、当該読み情報が修正された単語を含む韻律修正対象句を検出し、
    前記プロセッサが、前記読み情報が修正された単語を含む韻律修正対象句と、当該韻律修正対象句と連続する前記文字列とを結合することで得られる文字列を当該韻律修正対象句の韻律情報を継承するか否かを判定する対象範囲として設定し、
    前記プロセッサが、前記対象範囲をアクセント句単位に分割し、前記韻律修正対象句の少なくとも一部と前記読み情報が修正された単語を含むアクセント句を、前記韻律修正対象句の韻律情報を継承する韻律継承アクセント句と判定し、
    前記プロセッサが、前記修正された読み情報を含む前記言語辞書を用いて前記対象範囲を言語解析することにより得られた中間表記のうちの前記韻律継承アクセント句に対応する部分の中間表記を、前記韻律継承アクセント句についての前記韻律情報で修正し、
    前記プロセッサが、前記韻律修正対象句を前記韻律継承アクセント句で置換するとともに、置換後の前記韻律修正対象句に対応する中間表記を前記韻律継承アクセント句についての修正された中間表記とすることで前記言語辞書を更新する、
    言語辞書修正方法。
  5. テキストデータから合成音声信号を生成するための、該テキストデータの読み及び韻律を表す韻律情報を含む中間表記の作成に利用され、少なくとも1以上の単語の漢字仮名表記と、該単語の読み及びアクセント位置を表す読み情報と、少なくとも1以上の韻律修正対象句の漢字仮名表記と、前記韻律修正対象句の前記中間表記と、前記韻律修正対象句の前記中間表記に含まれる韻律情報が適用されるときに前記韻律修正対象句と連続する文字列の漢字仮名表記とが登録される言語辞書をコンピュータに修正させるための言語辞書修正用コンピュータプログラムであって、
    前記少なくとも1以上の単語の何れかの読み情報が修正されると、前記少なくとも1以上の韻律修正対象句の中から、当該読み情報が修正された単語を含む韻律修正対象句を検出し、
    前記読み情報が修正された単語を含む韻律修正対象句と、当該韻律修正対象句と連続する前記文字列とを結合することで得られる文字列を当該韻律修正対象句の韻律情報を継承するか否かを判定する対象範囲として設定し、
    前記対象範囲をアクセント句単位に分割し、前記韻律修正対象句の少なくとも一部と前記読み情報が修正された単語を含むアクセント句を、前記韻律修正対象句の韻律情報を継承する韻律継承アクセント句と判定し、
    前記修正された読み情報を含む前記言語辞書を用いて前記対象範囲を言語解析することにより得られた中間表記のうちの前記韻律継承アクセント句に対応する部分の中間表記を、前記韻律継承アクセント句についての前記韻律情報で修正し、
    前記韻律修正対象句を前記韻律継承アクセント句で置換するとともに、置換後の前記韻律修正対象句に対応する中間表記を前記韻律継承アクセント句についての修正された中間表記とすることで前記言語辞書を更新する、
    ことをコンピュータに実行させるための言語辞書修正用コンピュータプログラム。
JP2013192984A 2013-09-18 2013-09-18 音声合成装置、言語辞書修正方法及び言語辞書修正用コンピュータプログラム Active JP6197523B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2013192984A JP6197523B2 (ja) 2013-09-18 2013-09-18 音声合成装置、言語辞書修正方法及び言語辞書修正用コンピュータプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2013192984A JP6197523B2 (ja) 2013-09-18 2013-09-18 音声合成装置、言語辞書修正方法及び言語辞書修正用コンピュータプログラム

Publications (2)

Publication Number Publication Date
JP2015060038A true JP2015060038A (ja) 2015-03-30
JP6197523B2 JP6197523B2 (ja) 2017-09-20

Family

ID=52817628

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2013192984A Active JP6197523B2 (ja) 2013-09-18 2013-09-18 音声合成装置、言語辞書修正方法及び言語辞書修正用コンピュータプログラム

Country Status (1)

Country Link
JP (1) JP6197523B2 (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2018169434A (ja) * 2017-03-29 2018-11-01 富士通株式会社 音声合成装置、音声合成方法及び音声合成システムならびに音声合成用コンピュータプログラム
CN111105780A (zh) * 2019-12-27 2020-05-05 出门问问信息科技有限公司 一种韵律纠正方法、装置以及计算机可读存储介质

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002123281A (ja) * 2000-10-12 2002-04-26 Oki Electric Ind Co Ltd 音声合成装置
JP2007248886A (ja) * 2006-03-16 2007-09-27 Mitsubishi Electric Corp 読み修正装置

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002123281A (ja) * 2000-10-12 2002-04-26 Oki Electric Ind Co Ltd 音声合成装置
JP2007248886A (ja) * 2006-03-16 2007-09-27 Mitsubishi Electric Corp 読み修正装置

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
佐々木 啓友: "複合名詞に対する複合語アクセント規則", 電子情報通信学会技術研究報告, vol. 第101巻、第603号, JPN6017027098, 17 January 2002 (2002-01-17), JP, pages 9 - 15, ISSN: 0003603732 *

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2018169434A (ja) * 2017-03-29 2018-11-01 富士通株式会社 音声合成装置、音声合成方法及び音声合成システムならびに音声合成用コンピュータプログラム
CN111105780A (zh) * 2019-12-27 2020-05-05 出门问问信息科技有限公司 一种韵律纠正方法、装置以及计算机可读存储介质

Also Published As

Publication number Publication date
JP6197523B2 (ja) 2017-09-20

Similar Documents

Publication Publication Date Title
US20130231935A1 (en) Method and apparatus for generating synthetic speech with contrastive stress
US8571870B2 (en) Method and apparatus for generating synthetic speech with contrastive stress
JP2009186820A (ja) 音声処理システム、音声処理プログラム及び音声処理方法
US8170876B2 (en) Speech processing apparatus and program
WO2004066271A1 (ja) 音声合成装置,音声合成方法および音声合成システム
Ekpenyong et al. Statistical parametric speech synthesis for Ibibio
JP2008268477A (ja) 韻律調整可能な音声合成装置
US20090281808A1 (en) Voice data creation system, program, semiconductor integrated circuit device, and method for producing semiconductor integrated circuit device
JP5079718B2 (ja) 外国語学習支援システム、及びプログラム
JP6197523B2 (ja) 音声合成装置、言語辞書修正方法及び言語辞書修正用コンピュータプログラム
JP2010117528A (ja) 声質変化判定装置、声質変化判定方法、声質変化判定プログラム
JP6232724B2 (ja) 音声合成装置及び言語辞書登録方法
JP3589972B2 (ja) 音声合成装置
JP4751230B2 (ja) 韻律素片辞書作成方法、並びに音声合成装置及びプログラム
JP3414326B2 (ja) 音声合成用辞書登録装置及び方法
JP3284976B2 (ja) 音声合成装置及びコンピュータ可読記録媒体
Romsdorfer Polyglot text-to-speech synthesis: Text analysis & prosody control
JP6340839B2 (ja) 音声合成装置、合成音声編集方法及び合成音声編集用コンピュータプログラム
JP2003005776A (ja) 音声合成装置
JPH08185197A (ja) 日本語解析装置、及び日本語テキスト音声合成装置
JP2004258561A (ja) 歌唱合成用データ入力プログラムおよび歌唱合成用データ入力装置
JPH09258763A (ja) 音声合成装置
JP2728440B2 (ja) 音声出力装置
JP2023006055A (ja) プログラム、情報処理装置、方法
Martin Towards improved speech recognition for resource poor languages

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20160606

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20170707

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20170725

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20170807

R150 Certificate of patent or registration of utility model

Ref document number: 6197523

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150