JP5870686B2 - 合成音声修正装置,方法,及びプログラム - Google Patents

合成音声修正装置,方法,及びプログラム Download PDF

Info

Publication number
JP5870686B2
JP5870686B2 JP2011284926A JP2011284926A JP5870686B2 JP 5870686 B2 JP5870686 B2 JP 5870686B2 JP 2011284926 A JP2011284926 A JP 2011284926A JP 2011284926 A JP2011284926 A JP 2011284926A JP 5870686 B2 JP5870686 B2 JP 5870686B2
Authority
JP
Japan
Prior art keywords
phrase
accent
range
accent position
correction
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2011284926A
Other languages
English (en)
Other versions
JP2013134396A (ja
Inventor
野田 拓也
拓也 野田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP2011284926A priority Critical patent/JP5870686B2/ja
Publication of JP2013134396A publication Critical patent/JP2013134396A/ja
Application granted granted Critical
Publication of JP5870686B2 publication Critical patent/JP5870686B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Machine Translation (AREA)

Description

本発明は,音声合成技術に関するものであり,特に,合成音声のアクセント位置の修正処理に関する。
ユーザが入力した仮名漢字混じりの日本語テキストを合成音声に変換して読み上げる音声合成処理では,日本語テキストに言語解析を行って,文字テキストをその読みやアクセント位置等の情報を表記した表音テキストに変換し,表音テキストに従って合成音声を生成する。
言語解析情報の1つである,表音テキストに含まれるアクセントは,便宜上,各モーラの音の高さを「高」又は「低」で表現したものである。また,アクセント位置(アクセント核ともいう)は,アクセントが「高」から「低」に変化する「高」のモーラ位置に相当する。表音テキストでは,アクセントに関する表音テキストの区切りが「アクセント句」という単位で示される。アクセント句は,先頭が「低」から「高」,又は「高」から「低」に変化し,1つ以下のアクセント位置が存在する区切り単位である。したがって,アクセント位置の数(2以上)や位置によっては,アクセント句の分割や結合が必要となる。
また,言語解析の結果によっては,アクセント位置に誤りが生じることがある。その場合には,ユーザは,アクセント位置誤りを手動で修正しなければならない。また,テキストの読み誤りが生じた場合も,読み誤りの修正に伴い,アクセント位置を手動で設定しなければならない。
アクセント位置修正を支援する一の従来手法として,日本語テキストと表音テキストとを表示し,表音テキスト上のアクセント位置を示す記号をユーザが手動で修正するインタフェースを設ける手法が提案されている。
また,別の従来手法として,表音テキストを表示し,スライドバーを利用してアクセント位置をずらしながら合成音声を試聴してアクセント位置を指定するインタフェースを設ける手法が提案されている。
また,さらに別の従来手法として,表音テキストと読み記号とを表示し,汎用規則を利用して1つのアクセント位置候補を提示したり,あり得ないアクセント位置への修正を不可能にしたりする機能を追加したインタフェースを設ける手法が提案されている
特開平4−166899号公報 特開2008−268478号公報 特開平9−171392号公報
一般ユーザにとって,アクセント位置の指定,表音テキストの各種の記号やその意味の理解等が難しいことがある。
上記の一の従来手法のように,表音テキスト上のアクセント位置を示す記号をユーザが手動で設定・修正するという作業は,一般ユーザにとってかなり困難となる。特に,アクセント位置の修正では,「アクセント句」という概念が必須であり,アクセント句の分割・結合を必要に応じて手動で修正する必要があるため,アクセント位置修正をさらに困難にしている。
また,上記の別の従来手法においても,最終的にはアクセント位置の正解に辿り着くことができるが,モーラ数の多い単語ではアクセント位置の候補数が増え,正解に辿り着くまでに要する時間が長くなるという問題がある。また,アクセント位置修正のために「アクセント句」という概念が必要であり,アクセント句の分割・結合を必要に応じて手動で修正しなければならない。
以上のように,音声合成に精通していない一般ユーザにとって,アクセント句の理解が難しく,アクセント位置修正は困難なものとなっている。
本発明は,上記の問題に鑑みてなされたものであり,その目的は,音声合成に精通していない一般ユーザであっても,簡便かつ効率よくアクセント位置修正が可能な合成音声修正装置を提供することである。また,本発明の別の目的は,上記合成音声修正装置で実行される処理をコンピュータが実行する処理方法,又は,上記合成音声修正装置で実行される処理をコンピュータに実行させるプログラムを提供することである。
本発明の一態様として開示する合成音声修正装置は,1)処理対象となる日本語テキストに対して言語解析を行い,該日本語テキストの各単語の品詞や,該日本語テキストの読み及び少なくともアクセント句とアクセント位置とを示す言語解析情報を含む表音テキストを生成する言語解析部と,2)前記日本語テキストを表示してユーザ操作を受け付け,該日本語テキストのアクセント位置を修正する修正範囲のアクセント位置候補を優先順位に応じて表示してユーザ操作を受け付ける入出力部と,3)前記入出力部から,前記ユーザ操作により前記日本語テキストから指定されたユーザ指定範囲を取得し,前記言語解析情報をもとに,取得したユーザ指定範囲を含むアクセント句を修正範囲に設定する修正範囲設定部と,4)前記言語解析情報に基づいて,前記修正範囲を自立語が先頭となる境界で分割した分割句を生成する分割句生成部と,5)モーラ数及び品詞に基づいて,各アクセント位置を示すアクセント位置候補の優先順位を登録したアクセント位置候補順位情報を記憶する記憶部と,6)前記アクセント位置候補順位情報を参照して,前記修正範囲の分割句毎に,該分割句のモーラ数及び含まれる自立語の品詞に基づいてアクセント位置候補の表示時の前記優先順位を決定する候補順位決定部と,7)前記入出力部から,前記ユーザ操作により前記修正範囲のアクセント位置候補から選択されたユーザ選択候補を取得し,取得したユーザ選択候補が示すアクセント位置をユーザ指定アクセント位置とするアクセント位置取得部と,8)前記ユーザ指定アクセント位置をもとに前記ユーザ選択候補に対応する分割句と該分割句と隣接する分割句とがアクセント結合をするかを判定し,前記ユーザ選択候補に対応する分割句と隣接する分割句とがアクセント結合をする場合に,前記ユーザ選択候補に対応する分割句と隣接する分割句とを結合して1アクセント句に修正し,修正したアクセント句のアクセント位置を前記ユーザ指定アクセント位置で修正するアクセント句修正部と,9)前記結合されたアクセント句及び前記修正されたアクセント位置をもとに,前記修正範囲に対応する前記表音テキストを修正する表音テキスト修正部と,10)前記入出力部から,前記ユーザ操作により前記修正範囲のアクセント位置候補から出力範囲として選択されたアクセント位置候補を取得し,取得した出力範囲の表音テキストの読み及び取得したアクセント位置候補が示すアクセント位置に従って該出力範囲の合成音声を生成する音声合成部とを備える。
上記した合成音声修正装置によれば,ユーザは,アクセント位置の修正に必要なアクセント句やアクセント句の分割・結合を意識することなく,簡単かつ効果的にアクセント位置修正を行うことが可能となる。
実施例における合成音声修正装置の構成例を示す図である。 実施例におけるアクセント位置候補順位情報の構成例を示す図である。 実施例における合成音声修正装置の概要処理の処理フロー例を示す図である。 表示画面の例を示す図である。 分割句生成の例を示す図である。 分割句のアクセント位置候補を示す表示画面の例を示す図である。 結合判定規則の例を示す図である。 分割句の結合例を示す図である。 ユーザ指定範囲が複合語の一部である場合の例を示す図である。 ユーザ指定範囲が連語の一部である場合の例を示す図である。 修正範囲の設定処理の詳細処理の処理フロー例を示す図ある。 分割句生成処理の詳細処理の処理フロー例を示す図である。 候補順位の決定処理の詳細処理の処理フロー例を示す図である。 アクセント句修正処理の詳細処理の処理フロー例を示す図である。 アクセント句修正処理の詳細処理の処理フロー例を示す図である。 アクセント句修正処理の詳細処理の処理フロー例を示す図である。 第2の実施例におけるユーザが読み誤りを修正した場合の例を示す図である。 第3の実施例におけるユーザが読み誤りを修正した場合の例を示す図である。 第4の実施例におけるユーザ指定範囲に未知語が含まれている場合の例を示す図である。 第5の実施例における第1の再生モードの場合の表示画面の例を示す図である。 第5の実施例における第2の再生モードの場合の表示画面の例を示す図である。 第5の実施例における第3の再生モードの場合の表示画面の例を示す図である。 実施例における合成音声装置のハードウェア構成例を示す図である。
以下,本発明の一態様として開示する合成音声修正装置について説明する。
〔第1の実施例〕
第1の実施例として,合成音声修正装置1の基本的な構成及び動作を説明する。
図1は,一実施例における合成音声修正装置の構成例を示す図である。
合成音声修正装置1は,入力された日本語テキストを表音テキストに変換して合成音声を出力し,ユーザによって指定された箇所のアクセント位置を修正する装置である。
合成音声修正装置1は,入出力部10,言語解析部11,修正範囲設定部12,分割句生成部13,候補順位決定部14,アクセント位置取得部15,アクセント句修正部16,表音テキスト修正部17,音声合成部18及び記憶部2を備える。
記憶部2は,アクセント位置候補順位情報を記憶する。
アクセント位置候補順位情報は,アクセント位置候補とその優先順位を,モーラ数及び品詞情報に応じて登録した情報である。なお,アクセント位置候補順位情報の詳細については,後述する。
入出力部10は,入力装置(図示しない)を介してユーザの指定を受け付け,又は,各処理部で生成された情報を提示するインタフェースである。
入出力部10は,ユーザに指定された処理対象となる日本語テキストを取得する。日本語テキストは,入力装置又はデータ記録媒体から入力される。さらに,入出力部10は,各分割句のアクセント位置候補を表示装置(図示しない)に表示し,音声合成部18で合成された合成音声を出力する。
言語解析部11は,日本語テキストを言語解析して言語解析情報を生成し,日本語テキストを表音テキストに変換する。言語解析情報は,少なくとも,日本語テキストの各単語の品詞情報(例えば名詞,動詞,形容詞,接頭語,接尾語,未知語等),及び日本語テキストの読み,アクセント情報(アクセント句,アクセント位置等)を含む情報である。表音テキストは,言語解析情報に基づいて,処理対象の日本語テキストの読み(発音)をカタカナ表記し,さらに,音声合成処理に必要なアクセント情報(アクセント句,アクセント位置)等を含む付加情報を記号で表記したデータである。
修正範囲設定部12は,入出力部10を介して,表示された日本語テキストでユーザが指定したアクセント位置の修正範囲を示すユーザ指定範囲を取得し,言語解析情報をもとに,ユーザ指定範囲を含むアクセント句の範囲を修正範囲に設定する。
一般ユーザが,アクセント句の概念を理解していることは期待できず,アクセント句を意識して修正範囲を指定することは困難である。修正範囲設定部12によれば,ユーザ指定範囲から適切な修正範囲を設定するため,ユーザは,アクセント句を意識せずにユーザ指定範囲を指定しても,適切な修正範囲が自動的に設定され,アクセント位置修正を行うことができる。
さらに,修正範囲設定部12は,言語解析情報を参照し,ユーザ指定範囲が複合語の一部である場合に,その複合語全体を修正範囲に設定する。また,修正範囲設定部12は,言語解析情報を参照し,ユーザ指定範囲が連語の一部である場合に,その連語全体に対応するアクセント句を修正範囲に設定する。
修正範囲設定部12によれば,ユーザが指定した範囲が,複合語や連語の一部である場合でも,複合語,連語の全体を自動的に修正範囲に設定するため,ユーザは,複合語や連語を意識することなく,適切な範囲でのアクセント位置修正を行うことができる。
分割句生成部13は,言語解析情報に基づいて,修正範囲を自立語が先頭となる境界で分割し,分割句を生成する。
例えば,複合語は,複数の自立語の組み合わせで1つのアクセント句を形成する。そのため,複合語のアクセント句ではモーラ数が多くなる傾向にあり,その結果,1つのアクセント句におけるアクセント位置候補数が増大し,ユーザが正解に辿り着くのに時間がかかってしまう。
分割句生成部13によれば,修正範囲のアクセント句が,より細かい分割句に自動的に分割され,ユーザが指定した修正範囲を分割句単位で扱うことが可能になる。そのため,分割句のモーラ数は減少し,その結果,修正範囲に対して提示される修正単位(分割句)毎のアクセント位置候補数も減少するため,ユーザは,効率よくアクセント位置正解に辿り着くことができる。
候補順位決定部14は,記憶部2に記憶されたアクセント位置候補順位情報を参照して,分割句のモーラ数と含まれる自立語の品詞とに応じて,修正範囲の各分割句のアクセント位置候補の優先順位付けを行う。
候補順位決定部14によれば,アクセント位置が正解である確率が高いアクセント位置候補が上位に提示される。ユーザは,入出力部10で表示されるアクセント位置候補の上位からアクセント位置を選択することで,簡便かつ効率よくアクセント位置を修正することができる。
アクセント位置取得部15は,入出力部10を介して,修正範囲のアクセント位置候補からユーザによって選択されたユーザ選択候補を取得し,取得したユーザ選択候補が示すアクセント位置をユーザ指定アクセント位置とする。
アクセント句修正部16は,ユーザ指定アクセント位置に応じて,選択されたアクセント位置候補に対応する分割句が,隣接する分割句とアクセント結合をするか否かを判定し,両分割句がアクセント結合をすると判定した場合に,ユーザ選択候補に対応する分割句と隣接する分割句とを結合して1アクセント句に修正し,さらに,修正したアクセント句のアクセント位置を,ユーザ指定アクセント位置を用いて修正する。
アクセント句修正部16によれば,アクセント位置が変更となった分割句について,隣接する分割句とのアクセント結合の有無が判定されてアクセント句が自動的に修正される。ユーザは,アクセント位置修正に伴うアクセント句の分割や結合を意識することなく,簡単にアクセント位置修正を行うことができる。
表音テキスト修正部17は,アクセント句修正部16によって修正されたアクセント句及びアクセント位置に基づいて,言語解析部11が出力した表音テキストを修正する。
音声合成部18は,入出力部10を介して,ユーザによって選択されたアクセント位置候補に基づく出力範囲を取得し,出力範囲の表音テキストの読み及びに選択されたアクセント位置候補が示すアクセント位置に基づいて合成音声を生成する。生成された合成音声は,入出力部10によって出力される。
図2は,アクセント位置候補順位情報の構成例を示す図である。
図2は,アクセント位置候補順位情報をテーブル化した候補順位テーブルを示す。候補順位テーブルには,例えば,言語解析部11の処理で利用される言語辞書から,品詞別及びモーラ数別におけるアクセント位置の分布を調査し,分布の多い順に,アクセント位置候補の優先順位が登録されている。図2(A)は,モーラ数が7以下の場合に適用される候補順位テーブルの例,図2(B)は,モーラ数が8以上の場合に適用される候補順位テーブルの例を示す。
図2(A)に示すテーブルでは,N=0〜7である。0型は,アクセント位置がないことを示し,1型は,アクセント位置がアクセント句の1番目のモーラにあることを,それぞれ示している。N型は,アクセント位置が先頭からN番目のモーラにあることを表している。
発明者が検討したところ,アクセント位置の正解と,品詞及びモーラ数の組み合わせとには相関があり,品詞及びモーラ数の組み合わせから得られるアクセント位置の上位3つのアクセント位置候補で,70%以上のアクセント位置の正解率が得られることがわかっている。この検討結果に基づいて,図2(A)に示す候補順位テーブルでは,モーラ数が2〜7までのアクセント位置候補に対して,優先順位として,分布の多い上位を3位まで順位付けし,その他を4位としている。なお,図2に示す例では,優先順位の4位以降を全て「4位」と設定しているが,4位以下を分布に応じて順位付けしてもよい。
さらに,一般に,外来語などを除いてモーラ数の多い自立語は極めて少なく,調査による分布精度が疑わしい。実際に,前述の外来語などのカタカナ表記を除くと,ユーザ辞書登録などによって,連語や複合語を1単語かつ1品詞として登録したものが大半を占めるため,これらを除外すると8モーラ以上の自立語から分布に応じた順位付けをすることが困難である。また,8モーラ以上になると,カタカナ表記の外来語が大半を占める,中間以降のモーラにアクセント位置が集中する傾向にある。以上の点を踏まえると,8モーラ以上の優先順位は,1テーブルにまとめて代用することが好ましい。図2(B)に示す候補テーブルでは,自立語のモーラ数が8モーラ以上の場合は,全て同一のアクセント位置候補の優先順位で代用している。
第1の実施例の合成音声修正装置1では,分割句生成部13が,自立語単位で分割句を設定するため,修正単位となる1分割句のモーラ数は減少し,1分割句あたりのモーラ数は,ほぼ7モーラ以下となる。その結果,8モーラ以上のアクセント位置候補の優先順位の使用頻度が低くなり,8モーラ以上の場合に図2(B)に示すような1テーブルを用いることは,アクセント位置修正の精度に悪影響を与えない。
また,合成音声修正装置1によれば,候補順位テーブルに基づいて正解率が高いアクセント位置候補を上位に提示するため,ユーザは,効率よくアクセント位置を修正することができる。
図3は,合成音声修正装置1の概要処理の処理フロー例を示す図である。
ステップS1:日本語テキストの言語解析
入出力部10は,ユーザに指定された日本語テキストを取得する。
言語解析部11は,日本語テキストに対して言語解析処理を行い,言語解析情報に基づいて表音テキストを生成する。言語解析部11が行う言語解析は,既存の手法であればどのような手法であってもよく,処理の詳細の説明は省略する。
ステップS2:修正範囲の設定
入出力部10は,読みを付加した日本語テキストを示す表示画面D1を表示し,ユーザがアクセント位置の修正箇所として指定したユーザ指定範囲を受け付ける。
図4は,表示画面の例を示す図である。
図4(A)は,入出力部10が備えるGUI例であり,ユーザが修正範囲を指定するための表示画面D1の例である。表示画面D1が備える日本語テキストd1上でのマウスドラッグ等のユーザ操作により,アクセント位置を修正したい箇所であるユーザ指定範囲(図中,矩形で表す)が選択される。
ユーザ指定範囲の選択後,入出力部10は,図4(B)に示すような,操作可能な項目を一覧表示する表示画面D2を表示する。表示画面D2が備える選択項目から項目「アクセント」が選択された場合に,アクセント修正処理が実行され,図4(C)に示すような表示画面D3でアクセント位置候補d31が優先順位に従って表示され,ユーザがアクセント位置を修正できるようになる。
なお,図4(B)の表示画面D2が示す他の項目は,本発明との関連が薄いため説明を省略する。また,図4(C)の表示画面D3については,後述する。
修正範囲設定部12は,入出力部10から得たユーザ指定範囲と言語解析情報とを照らし合わせ,ユーザ指定範囲に対応するアクセント句を修正範囲に設定する。
ユーザ指定範囲が1アクセント句内に包含される場合に,修正範囲設定部12は,その1アクセント句を修正範囲に設定する。また,ユーザ指定範囲が2つ以上のアクセント句にまたがっている場合には,修正範囲設定部12は,ユーザ指定範囲がまたがる全てのアクセント句を修正範囲に設定する。
図4(A)の表示画面D1で指定された日本語テキストd1の「品質には…」でユーザ指定範囲が「品質」であるとする。「品質」は自立語(名詞)であり,自立語「品質」と付属語(助詞)「には」とを含む範囲が1アクセント句となる。修正範囲設定部12は,言語解析情報をもとに,ユーザ指定範囲「品質」から,1アクセント句の範囲の分割句である「品質には」を修正範囲に設定する。
ステップS3:分割句の生成
分割句生成部13は,言語解析情報に基づいて,修正範囲の先頭から自立語を探索し,自立語が存在する場合に,検出した自立語を先頭位置とする境界で分割句を生成する。さらに,分割句生成部13は,言語解析情報から,自立語の品詞,自立語のモーラ数,アクセント位置を取得して,分割句の読みテキスト及び表音テキストを取得する。分割句生成部13は,修正範囲の全体について分割句を生成する。
図5は,分割句生成の例を示す図である。
図5(A)は,ユーザ指定範囲及び修正範囲の例を示す図である。ユーザ指定範囲が「高速道路寸断」である場合に,言語解析情報から,ユーザ指定範囲を包含する1アクセント句に対応する,自立語と付属語とを含む範囲「高速道路寸断で」が修正範囲に設定される。
図5(B)は,修正範囲のアクセント位置を示す図である。アクセント位置は,修正範囲の読みテキストの文字の上部に黒丸で表されている。修正範囲「高速道路寸断で」では,読みテキスト「こーそくどーろすんだんで」の「す」にアクセント位置が置かれている。図5(B)に示すアクセント位置は誤りであり,この誤りによって,指定範囲「高速道路寸断で」が1アクセント句(11モーラ,8型)であると判断されている。
分割句生成部13は,修正範囲「高速道路寸断で」を,自立語が先頭となる境界で分割し,3つの分割句「高速」「道路」「寸断で」を生成する。生成される分割句には,1つの自立語のみのもの及び1つの自立語と1つ以上の付属語で構成されるものがある。
さらに,分割句生成部13は,各分割句の自立語の品詞,モーラ数,アクセント位置を設定する。例えば,図5(C)に示すように,「高速」「道路」「寸断で」は,それぞれ「名詞;4モーラ;0型」「名詞;3モーラ;0型」「名詞;4モーラ;1型」に設定される。「寸断で」は,本来,「5モーラ;1型」であるが,分割句生成部13では,分割句の自立語に着目するため,自立語「寸断」のみを判定部分とし,「4モーラ,1型」となる。
さらに,分割句生成部13は,「高速」「道路」「寸断で」の読みテキストを「こーそく」「どーろ」「すんだんで」,表音テキストを「コーソク」「ドーロ」「ス*ンダンデ」と設定する。表音テキストにおいて,「*」は,その直前の文字にアクセント位置があることを表す。
ステップS4:候補順位の決定
候補順位決定部14は,図2に示す候補順位テーブルを参照して,修正範囲設定部12で設定された,各分割句の自立語の品詞とモーラ数をもとに,アクセント位置候補及びその候補順位を決定する。例えば,分割句「高速」は,名詞かつ4モーラであるので,アクセント位置候補の優先順位は,0型,2型,1型,3型となる。
なお,候補順位決定部14は,長音にアクセントは位置しないというアクセント位置制約を保持して,該当するアクセント位置の候補を除外することができる。
候補順位決定部14が,各分割句のアクセント位置候補とその候補順位を決定すると,入出力部10は,決定された優先順位に基づいて分割句のアクセント位置候補d31を順位毎に並べた表示画面D3を表示する。
図4(C)に示す表示画面D3は,アクセント位置候補d31と各アクセント位置候補を指定する候補指定ボタンd32,指定の確定を指示する確定ボタンd33を備える。候補指定ボタンd32の四角形が黒塗りであるアクセント位置候補(例えば「ひんしつに*は」)は,現時点でユーザが選択しているアクセント位置候補であることを示す。
図6は,分割句のアクセント位置候補を示す表示画面の例を示す図である。
図6に示す表示画面D3は,図4(C)に示す表示画面D3と同様の構成である。図6の表示画面D3では,各分割句のアクセント位置候補d31として,最上行に現在のアクセント位置を表示し,2段目以降の行を,候補順位決定部14が決定され優先順位に従ってアクセント位置候補を表示している。
表示画面D3ではアクセント位置候補d31は,分布の多さの上位から順に表示されるため,ユーザは,上から順にアクセント位置候補d31を見て選択することによって,アクセント位置の正解に早く辿り着くことができ,修正を効率よく行うことができる。
ステップS5:アクセント句の修正
図6に示す表示画面D3で,ユーザが「こーそくど*ーろすんだんで」に修正するため,先頭分割句「高速」に対してはアクセントの修正なし(第1番目のまま),中間分割句「道路」に対しては第2番目のアクセント位置候補(1型)の候補指定ボタンd32をマウスクリックし(図6中,丸付き数字1で示す),終端分割句「寸断で」に対しては第2番目のアクセント位置候補(0型)の候補指定ボタンd32をマウスクリックし(図6中,丸付き数字2で示す),確定する確定ボタンd33が押下される(図6中,丸付き数字3で示す)とする。
入出力部10は,ユーザが選択したアクセント位置候補を示すユーザ選択候補を出力すると,アクセント位置取得部15は,ユーザ選択候補が示す分割句のアクセント位置をユーザ指定アクセント位置とする。
次に,アクセント句修正部16は,アクセント結合判定規則に基づいて,ユーザ指定アクセント位置の場合に,分割句間のアクセント結合の有無を判定し,判定結果に応じてアクセント句を再構成し,各アクセント句のモーラ数及びモーラ型の情報を生成する。
図7は,結合判定規則の例を示す図である。
図7(A)は,2つの分割句間で前に位置する分割句を前分割句,後に位置する分割句を後分割句とする場合に,分割句同士がアクセント句として結合する場合の品詞種別の組み合わせ例を示している。図7(A)に示すように,一般に,前分割句が「名詞」「動詞(連用形)」「形容詞(語幹)」のいずれかであり,後分割句が「名詞(名詞句を含む)」「動詞(動詞句を含む)」「形容詞(形容詞句を含む)」のいずれかであるという組み合わせの場合には,2つの分割句は複合語として結合し,1つのアクセント句となる場合がある。
図7(B)は,アクセント結合による品詞の変化例を示している。図7(B)に示すように,前分割句と後分割句の品詞の種類に応じて,結合した複合語は,名詞化,動詞化,形容詞化する。ここでは,自立語と付属語の組み合わせで構成される分割句を「(品詞)句」と表現する。例えば,分割句が「名詞+各助詞」である場合に,これを「名詞句」と表現する。
アクセント句修正部16は,2つの分割句において,前分割句の品詞が「名詞」であり,後分割句の品詞が「名詞」「名詞句」のいずれかである場合に,名詞化の複合語であると判定する。又は,アクセント句修正部16は,前分割句の品詞が「名詞」「動詞連用形」「形容詞語幹」のいずれかであり,後分割句の品詞が「名詞」「名詞句」「動詞」「動詞句」「形容詞」「形容詞句」のいずれかである場合に,名詞化,動詞化,形容詞化のいずれかの複合語候補であると判定する。
さらに,アクセント句修正部16は,2つの分割句が複合語候補であると判定した場合に,両分割句のアクセント位置の関係をもとに,分割句を結合して1アクセント句とするかを判定する。アクセント句修正部16は,予め「前分割句及び後分割句のモーラ型が0型同士である場合は結合する」「前分割句のモーラ型が0型であり後分割句のモーラ型が1型である場合は結合する」等のアクセント結合規則を保持し,このアクセント結合規則をもとに,2つの分割句同士のアクセント結合の有無を判定する。
図8は,分割句の結合例を示す図である。図8(A)は,アクセント位置修正前の修正範囲の例を示し,図8(B)は,アクセント位置修正後の修正範囲の例を示す図である。
図8(A)に示すように,修正範囲「高速道路寸断で」は,「高速」「道路」「寸断」の3分割句で構成されるが,1アクセント句「こーそくどーろすんだんで」である。図8(B)に示すように,ユーザによって,中分割句「どーろ」の「ど」にアクセント位置が修正されると,3分割句「高速」「道路」「寸断」のアクセント位置が「0型」「1型」「0型」となる。
アクセント句修正部16は,前分割句「高速」と後分割句「道路」について,名詞同士であり,アクセント位置が「0型」「1型」となるため,2つの分割句を結合し,1アクセント句とする。これにより,修正範囲「高速道路寸断で」は,2つのアクセント句「こーそくどーろ(7モーラ,5型)」「すんだんで(4モーラ,0型)」となる。
そして,上記の結合により,現アクセント句が5型,終端分割句「寸断で」が0型となるので,アクセント句修正部16は,2つの分割句の関係が結合規則に該当せず,現アクセント句と終端分割句とを非結合と判定する。アクセント句修正部16は,非結合と判定したので,現アクセント句を「7モーラ,5型」の1アクセント句として確定し,さらに,終端分割句「寸断で」に対する後分割句が存在しないため,終端分割句を単独で1アクセント句として確定する。その結果,ユーザが指定したアクセント位置である「高速(4モーラ,0型)」「道路(3モーラ,1型)」「寸断で(4モーラ,0型)」の3分割句は,「高速道路(7モーラ,5型)」「寸断で(4モーラ,0型)」の2アクセント句に修正される。
次に,表音テキスト修正部17は,修正されたアクセント位置や,分割句間の結合によって生じるモーラ数やアクセント位置の変化を,表音テキストに反映する。例えば,アクセント句修正部16による処理の結果,各アクセント句のアクセント位置が,対応する各アクセント句の表音テキストのアクセント位置と異なる場合に,表音テキスト修正部17は,表音テキストに対してアクセント位置の修正を行う。
同様に,分割句の結合・非結合によってアクセント句の修正が行われ,アクセント句の境界位置が変化した場合に,表音テキスト修正部17は,結合部分のアクセント句境界記号の削除や,非結合部分のアクセント句境界記号の追加を行う。
図8(A)に示すように,修正前の表音テキストは,「コーソクドーロス*ンダンデ」となっている。アクセント句修正部16の処理結果である,2アクセント句「高速道路(7モーラ,5型)」「寸断で(4モーラ,0型)」に対応させるため,表音テキスト修正部17は,まず,アクセント句境界を示す表音記号「|」を追加し,「コーソクドーロ|ス*ンダンデ」とする。さらに,表音テキスト修正部17は,アクセント位置をそれぞれ,5型の「コーソクド*ーロ」と,0型の「スンダンデ」に修正する。最終的な表音テキストは,「コーソクド*ーロ|スンダンデ」となる。
その後,音声合成部18は,表音テキスト修正部17が出力した,ユーザ指定アクセント情報に応じて修正した表音テキストを得て,修正済みの表音テキストに準じた合成音声を作成し,入出力部10を経由して合成音声を再生する。
次に,分割句が自立語と付属語で形成される場合のアクセント位置候補について,より詳細に説明する。
図4(A)に示す表示画面D1でユーザが「品質」のアクセント位置を修正する場合に,指定された範囲「品質」は自立語であるが,その後に助詞「には」が存在する。
修正範囲設定部12は,「品質」を包含する1アクセント句である「品質には」を修正範囲に設定する。さらに,分割句生成部13は,自立語「品質」と付属語「には」の1アクセント句を,自立語先頭で分割して1分割句を生成する。この場合には,「ひんしつには」が1分割句となる。
1分割句が「自立語+付属語」かつ自立語のアクセント位置が「0型」である場合に,その後置の付属語にアクセント位置が存在する場合がある。したがって,「自立語+付属語」かつ自立語が「0型」の修正範囲に対して,付属語のアクセント位置候補を含め,「自立語+付属語」のアクセント位置候補をユーザに提示する必要がある。図4に示す例の場合には,付属語のアクセント位置は,「ひんしつには」「ひんしつに*は」「ひんしつには*」となる。しかし,原則的に,付属語の最後尾はアクセント位置とならないという規則から,「ひんしつには*」は,表示画面D3に表示するアクセント位置候補から除外される。
候補順位決定部14は,自立語の品詞及びモーラ数からアクセント位置候補の優先順位を決定する。付属語は対象外となるため,自立語が0型の場合には,候補順位決定部14は,自立語に付随する付属語について,順次付属語の先頭モーラからアクセント位置を付与したアクセント位置候補を設定する。
分割句「品質」は,品詞が名詞かつ4モーラであり,図2の候補順位テーブルから,アクセント位置候補の優先順位は,0型,2型,1型,…となる。したがって,図4(C)に示す表示画面D3では,アクセント位置候補は,「ひんしつには」「ひんしつに*は」「ひん*しつには」の順に表示され,第2番目のアクセント位置候補のアクセント位置が正解となる。よって,ユーザは,多くとも2回目でアクセント位置の正解に辿り着くことができる。
次に,ユーザ指定範囲が複合語や連語の一部である場合の修正範囲について,より詳細に説明する。
修正範囲設定部12は,ユーザ指定範囲と言語解析情報とを照らし合わせ,ユーザ指定範囲が複合語の一部である場合に,複合語全体のアクセント句をアクセント位置の修正範囲として出力する。
図9は,ユーザ指定範囲が複合語の一部である場合の例を示す図である。
図9(A)に示す表示画面D1の日本語テキストd1上で,ユーザが「高速道路寸断で」の「道路寸断」の部分を指定したとする。修正範囲設定部12は,言語解析情報から,ユーザ指定範囲の「道路寸断」が1アクセント句「高速道路寸断で」の一部であり,かつ「高速」「道路」「寸断」の3名詞がアクセント結合した複合語と判定する。そして,修正範囲設定部12は,ユーザ指定範囲より広い「高速道路寸断で」を修正範囲として設定する。その後,分割句生成部13,候補位置決定部14の処理を経由し,図9(B)に示す表示画面D3では,ユーザ自身が指定した範囲とは異なる,適切な修正範囲でのアクセント位置候補d31が分割句毎に表示される。
図10は,ユーザ指定範囲が連語の一部である場合の例を示す図である。
「連語」は様々な定義があるが,合成音声修正装置1では,「連語」は,2アクセント句以上のアクセント句の全体で1つの意味をなす語彙であり,かつ,各々のアクセント句境界は自立語と自立語で挟まれているものと定義する。例えば,図10(A)に示す表示画面D1の日本語テキストd1に出現する「全国模試開催は」は,連語の例である。連語「全国模試開催は」は,「全国」「模試開催は」の2アクセント句で構成され,2アクセント句全体で1つの意味をなし,かつアクセント句境界は「全国」「模試」の2つの自立語(名詞)の間にある。
図10(A)に示す表示画面D1の日本語テキストd1上で,ユーザが「全国模試」の部分を指定したとする。
修正範囲設定部12は,言語解析情報を参照して,「全国模試」が,連語「全国模試開催は」の一部であると判定し,ユーザ指定範囲より広い「全国模試開催は」を修正範囲に設定する。なお,「模試開催は」は,「模試」と「開催は」がアクセント結合によって複合語化したものであり,「全国模試開催は」は,連語と複合語の混在であるともいえる。
その後,分割句生成部13,候補位置決定部14の処理を経由し,図10(B)に示す表示画面D3において,ユーザ自身が指定した範囲とは異なる,適切な修正範囲でのアクセント位置候補d31が分割句毎に表示される。
図11〜図16は,合成音声修正装置1の概要処理のより詳細な処理フロー例を示す図である。
図11は,修正範囲の設定処理(ステップS2)の詳細処理の処理フロー例である。
修正範囲設定部12は,言語解析部11から言語解析情報を取得し(ステップS21),入出力部10から,ユーザ指定範囲を取得する(ステップS22)。
ユーザ指定範囲が,複合語又は連語の一部であれば(ステップS23のY),修正範囲設定部12は,ユーザ指定範囲された複合語又は連語の全体のアクセント句を修正範囲に設定し,修正範囲とその言語解析情報を出力する(ステップS24)。
ユーザ指定範囲が,複合語又は連語の一部でなければ(ステップS23のN),修正範囲設定部12は,ユーザ指定範囲が1アクセント句に包含されているかを調べ,ユーザ指定範囲が1アクセント句に包含されていれば(ステップS25のY),ユーザ指定範囲を包含する1アクセント句を修正範囲に設定し,修正範囲とその言語解析情報を出力する(ステップS26)。一方,ユーザ指定範囲が1アクセント句に包含されていなければ(ステップS25のN),修正範囲設定部12は,ユーザ指定範囲に対応する複数のアクセント句を修正範囲に設定し,修正範囲とその言語解析情報を出力する(ステップS27)。ステップS24,S26,S27の処理の後,終了する。
図12は,分割句生成処理(ステップS3)の詳細処理の処理フロー例である。
分割句生成部13は,修正範囲設定部12から修正範囲及び言語解析情報を取得し(ステップS31),分割句数NをN=0に初期化する(ステップS32)。
分割句生成部13は,修正範囲の先頭から自立語を検索し,自立語があれば(ステップS33のY),自立語を先頭として修正範囲を分割し,分割句を生成する(ステップS34)。次に,分割句生成部13は,言語解析情報を参照して,自立語の品詞をPrt[N]に設定し(ステップS35),自立語のモーラ数をMor[N]に設定し(ステップS36),自立語のアクセント位置をAcc[N]に設定する(ステップS37)。
さらに,分割句生成部13は,分割句のモーラ数をNum「N」に設定し(ステップS38),分割句の読みテキストをTxt[N]に設定し(ステップS39),分割句の表音テキストをPhn[N]に設定する(ステップS310)。
次に,分割句生成部13は,分割句数を更新(N=N+1)して,ステップS33の処理へ戻る(ステップS311)。
分割句生成部13は,修正範囲に自立語がなければ(ステップS33のN),分岐Aを経て,図13に示す処理フローのステップS41の処理へ進む。
図13は,候補順位の決定処理(ステップS4)の詳細処理の処理フロー例である。
候補順位決定部14は,分割句番号nをn=0に初期化し(ステップS41),分割句番号nが分割句数N以上であるかを調べ,n≧Nになるまで(ステップS42のN),ステップS43以降の処理を行う。
候補順位決定部14は,m>Mor[n]であれば(ステップS44のY),分割句番号を更新(n=n+1)し(ステップS415),ステップS42の処理へ戻る。候補順位決定部14は,分割句番号n≧分割句数Nであれば(ステップS42のY),処理を終了する。
図14〜図16は,アクセント句修正処理(ステップS5)の詳細処理の処理フロー例である。
アクセント句修正部16は,アクセント位置取得部15からユーザ指定アクセント情報及び言語解析情報を取得し,言語解析情報を品詞情報Seg[0,…,(N−1)]に設定し,ユーザ指定アクセント位置をアクセント位置情報UsrAcc[0,…,(N−1)]に設定する(ステップS51)。アクセント句修正部16は,分割句番号nをn=0に,修正アクセント句数xをx=0にそれぞれ初期化する(ステップS52)。
アクセント句修正部16は,分割句(n=0)のモーラ数Mor[n],ユーザ指定アクセント位置UsrAcc[n],表音テキストPhn[n]を,それぞれ,先頭アクセント句(x=0)のモーラ数FixMor[x],アクセント位置FixAcc[x],表音テキストFixPhn[x]に設定する(ステップS53)。なお,ここで,表音テキスト修正部17は,表音テキストFixPhn[x]が,ユーザ指定アクセント位置(UsrAcc[n])となるように,適時,後分割句の表音テキストPhn[n]を修正する。
アクセント句修正部16は,分割句番号nが分割句数N以上(n≧N)となるまで(ステップS54のN),ステップS55以降の処理を行う。
アクセント句修正部16は,分割句nの品詞情報Seg[n]及びSeg[n+1]が,以下の条件A0,A1に一致するかを調べる(ステップS55)。
・条件A0:分割句の品詞情報Seg[n]が,名詞である,
・条件A1:分割句の品詞情報Seg[n+1]が,名詞又は名詞句である。
分割句nの品詞情報Seg[n]及びSeg[n+1]が条件A0及びA1に一致すれば(ステップS55のY),アクセント句修正部16は,名詞化複合語の可能性があると判定し,分岐Aを経て,ステップS57の処理へ進む。一方,分割句nの品詞情報Seg[n]及びSeg[n+1]が条件A0及びA1に一致しなければ(ステップS55のN),アクセント句修正部16は,さらに,分割句nの品詞情報Seg[n]及びSeg[n+1]が,以下の条件B0,B1に一致するかを調べる(ステップS56)。
・条件B0:分割句の品詞情報Seg[n]が,名詞,動詞連用形又は形容詞語幹である,
・条件B1:分割句の品詞情報Seg[n+1]が,名詞,名詞句,動詞,動詞句,形容詞又は形容詞句である。
分割句nの品詞情報Seg[n]及びSeg[n+1]が条件B0及びB1に一致すれば(ステップS56のY),アクセント句修正部16は,名詞化,動詞化,形容詞化のいずれかの複合語の可能性があると判定し,分岐Bを経て,ステップS515の処理へ進む。一方,品詞情報Seg[n]及びSeg[n+1]が条件B0及びB1に一致しなければ(ステップS56のN),アクセント句修正部16は,2つの分割句は非結合であると判定し,分岐Yを経て,ステップS522の処理へ進む。
ステップS57の処理において,アクセント句修正部16は,さらに,現アクセント句のアクセント位置FixAcc[x]が0型であれば(ステップS57のY),後分割句(n+1)についてユーザ指定アクセント位置UsrAcc[n+1]が0型であるか調べる(ステップS58)。後分割句(n+1)のユーザ指定アクセント位置UsrAcc[n+1]が0型であれば(ステップS58のY),アクセント句修正部16は,現アクセント句が後分割句と結合すると判定する。アクセント句修正部16は,現アクセント句に後分割句を加えて1つのアクセント句とし,アクセント句のモーラ数,アクセント位置,表音テキスト等の情報を,下式で更新する(ステップS59)。
・モーラ数FixMor[x]=FixMor[x]+Mor[n+1];
・アクセント位置FixAcc[x]=0;
・表音テキストFixPhn[x]=FixPhn[x]+Phn[n+1]
なお,アクセント句修正部16は,更新されたアクセント句を,さらに次の分割句(後分割句)と非結合とならない限り,1アクセント句として確定せずに,再構成過程のアクセント句に相当するものとして設定しておく。
表音テキスト修正部17は,表音テキストFixPhn[x]のアクセント位置が,ユーザ指定のアクセント位置となるように,適時,後分割句の表音テキストPhn[n+1]を修正する(図14:ステップS520)。
アクセント句修正部16は,分割句番号nを更新(n=n+2)して(ステップS521),ステップS54の処理へ戻る。
後分割句(n+1)のユーザ指定アクセント位置UsrAcc[n+1]が0型ではなく(ステップS58のN),1型である場合(ステップS510のY)に,アクセント句修正部16は,現アクセント句のアクセント位置FixAcc[x]が0型かつ後分割句のアクセント位置UsrAcc[n+1]が1型であり,現アクセント句が後分割句と結合すると判定する。アクセント句修正部16は,現アクセント句に後分割句を加えて1つのアクセント句とし,アクセント句の情報を下式で更新する(ステップS511)。
・モーラ数FixMor[x]=FixMor[x]+Mor[n+1];
・アクセント位置FixAcc[x]=FixMor[x]+1;
・表音テキストFixPhn[x]=FixPhn[x]+Phn[n+1]
後分割句(n+1)のユーザアクセント位置UsrAcc[n+1]が1型でなければ(ステップS510のN),アクセント句修正部16は,現アクセント句は後分割句と非結合であると判定し,現アクセント句を1アクセント句として確定して,アクセント句の情報を修正する。
表音テキスト修正部17は,表音テキストFixPhn[x]のアクセント位置が,ユーザ指定のアクセント位置となるように,適時,後分割句の表音テキストPhn[n+1]を修正する(ステップS522)。
アクセント句修正部16は,アクセント句x及び分割句番号nを更新(x=x+1,n=n+1)し(ステップS523),ステップS53の処理へ戻る。
現アクセント句のアクセント位置FixAcc[x]が0型ではなく(ステップS57のN),さらに,現アクセント句のアクセント位置FixAcc[x]がFixMor[x]型(例えば,分割句が3モーラで3型)であれば(ステップS512のY),アクセント句修正部16は,現アクセント句が後分割句(n+1)と結合すると判定して,後分割句(n+1)のユーザ指定アクセント位置UsrAcc[n+1]をその値に関係なく0型に変換し,現アクセント句に後分割句を加えて1つのアクセント句とする。さらに,アクセント句修正部16は,アクセント句情報を下式で更新する(ステップS513)。
・モーラ数FixMor[x]=FixMor[x]+Mor[n+1];
・アクセント位置FixAcc[x]=FixMor[x];
・表音テキストFixPhn[x]=FixPhn[x]+Phn[n+1]
ステップS512の処理で,現アクセント句のアクセント位置FixAcc[x]がFixMor[x]型ではない場合(ステップS512のN)に,アクセント句修正部16は,現アクセント句のアクセント位置FixAcc[x]が0型でもFixMor[x]型でもなく,現アクセント句は後分割句(n+1)と非結合であると判定し,ステップS522の処理へ進む。
ステップS56の処理において,分割句nの品詞情報Seg[n]及びSeg[n+1]が条件B0及びB1に一致する場合に(ステップS56のY),アクセント句修正部16は,さらに,現アクセント句のアクセント位置FixAcc[x]が0型であるかを調べ(ステップS515),現アクセント句のアクセント位置FixAcc[x]が0型であれば(ステップS515のY),現アクセント句が後分割句(n+1)と結合すると判定して,現アクセント句に後分割句を加えて1つのアクセント句とし,アクセント句情報を下式で更新する(ステップS516)。
・モーラ数FixMor[x]=FixMor[x]+Mor[n+1];
・アクセント位置FixAcc[x]=FixMor[x]+UsrAcc[n+1];
・表音テキストFixPhn[x]=FixPhn[x]+Phn[n+1]
現アクセント句のアクセント位置FixAcc[x]が0型でなく(ステップS515のN),さらに,現アクセント句のアクセント位置FixAcc[x]がFixMor[x]型(例えば,分割句が3モーラなら3型)であれば(ステップS517のY),アクセント句修正部16は,現アクセント句に後分割句が結合すると判定する。アクセント句修正部16は,後分割句のアクセント位置UsrAcc[n+1]を,その値に関係なく0型に変換し,現アクセント句に後分割句を加えて1つのアクセント句とし,アクセント句の情報を下式で更新する(ステップS518)。
・モーラ数FixMor[x]=FixMor[x]+Mor[n+1];
・アクセント位置FixAcc[x]=FixMor[x];
・表音テキストFixPhn[x]=FixPhn[x]+Phn[n+1]
さらに,現アクセント句のアクセント位置FixAcc[x]が0型でもなく(ステップS515のN),FixMor[x]型でもない場合に(ステップS517のN),アクセント句修正部16は,現アクセント句が後分割句(n+1)とは非結合であると判定し,ステップS522の処理へ進む。
アクセント句修正部16は,上記の処理を行い,ステップS54の処理において,分割句番号nが分割句数N以上(n≧N)となった場合に(ステップS54のY),処理を終了する。
以下に,合成音声修正装置1が追加的な機能を実現する場合の処理例を,第2〜第4の実施例として説明する。第2〜第4の実施例において,合成音声修正装置1の構成例及び概要処理の流れは,第1の実施例と同様である。
〔第2の実施例〕
第2の実施例として,読み誤りの修正と共にアクセント位置の修正が行われる場合の処理を説明する。
音声合成処理において,言語解析精度の向上により日本語テキストの読み誤りは少ないものの,一部で読み誤りが生じる場合がある。読み誤りが生じた場合に,ユーザは,読み誤りの修正と同時にアクセント位置の修正も行う必要がある。一般的には,地名,姓,名などの固有名詞の読み誤りが生じることがある。発明者の検討によれば,読み誤りが生じる分割句は,言語解析情報で得られる品詞情報も不正解である可能性が高く,また,読み誤りが生じる分割句を構成する自立語の品詞は固有名詞である確率が高いという経験則が存在する。
第2の実施例では,修正範囲設定部12は,日本語テキストの読みがユーザによって修正された場合に,ユーザによって読みが修正された読み修正範囲を,アクセント位置の修正範囲に設定する。そして,分割句生成部13は,修正範囲がユーザの読み誤りの修正範囲に基づいて設定されている場合に,その修正範囲を1分割句とし,かつその自立語の品詞を固有名詞と定義する。さらに,候補順位決定部14は,分割句に定義された固有名詞とモーラ数に基づいてアクセント位置候補の優先順位付けを行う。
上述するように,読み誤りの箇所を修正範囲とする場合に,修正範囲から生成された分割句の品詞情報も不正解である可能性が高く,一方で,自立語の品詞が固有名詞である確率が高い。第2の実施例では,修正範囲を1分割句かつ自立語の品詞を固有名詞として扱って,アクセント位置候補の順位を決定するため,読み誤りの箇所についても簡単かつ効率的なアクセント位置修正を行うことができる。
図17は,第2の実施例において,ユーザが読み誤りを修正した場合の例を示す図である。
図17(A)は,第2の実施例における表示画面D1の例を示す図である。図17(A)に示す表示画面D1において,ユーザが読み誤り範囲として「小動(しょーどー)」を指定し,表示された読み候補により,読みが「こゆるぎ」に修正されたとする。
修正範囲設定部12は,読み修正の終了後に,ユーザが指定した読み誤り範囲「小動」を修正範囲に設定する。さらに,修正範囲設定部12は,「小動」の後に「岬」があり,2つの分割句が連語の関係となるため,「小動岬」を修正範囲に設定する。
分割句生成部13は,修正範囲の読み誤り範囲「小動」を1分割句に設定し,自立語(小動)の品詞を固有名詞と定義する。したがって,分割句「小動(こゆるぎ)」については,4モーラかつ固有名詞とされる。候補順位決定部14は,図2の候補順位テーブルを参照して,この分割句について,自立語の品詞(固有名詞)とモーラ数からアクセント位置候補の順位付けを行う。
図17(B)は,第2の実施例における表示画面D3の例を示す図である。
図17(B)に示す表示画面D3では,「小動(こゆるぎ)」と「岬(みさき)」についてアクセント位置候補d31が表示される。
図2に示す候補順位テーブルで,分割句「小動」(4モーラ,固有名詞)のアクセント位置の正解は,優先順位の1位ではなく2位である。表示画面D3は,候補順位テーブルに基づいて決定された優先順位に従って表示するため,正解のアクセント位置候補は第2番目に表示される。しかし,ユーザは,多くとも2回目でアクセント位置に辿り着くことができるため,アクセント位置修正の効率を向上させることができる。
〔第3の実施例〕
第3の実施例として,読み誤りの修正と共にアクセント位置の修正が行われる場合の別の処理を説明する。第3の実施例では,第2の実施例の場合と同様に,ユーザの読み誤りの修正範囲に基づいて設定された修正範囲を1分割句かつ固有名詞としたうえで,さらに,その修正範囲の直後の分割句(後分割句)の自立語が接尾語である場合に,自立語の接尾語を手掛かりに修正範囲である分割句の固有名詞の種類を決定する。
第3の実施例では,品詞情報として,細分化された固有名詞が設けられ,細分化された固有名詞毎にアクセント位置候補の優先順位が登録されている候補順位テーブルが記憶されている。細分化された固有名詞とは,例えば,「固有名詞」を,さらに「地名」,「姓」,「名」などに分類したものである。
分割句生成部13は,接尾語と接尾語に前置する固有名詞との対応関係を示す固有名詞情報を有し,読み誤りの修正範囲に基づく修正範囲から設定された1分割句に後分割句が存在し,後分割句の自立語が接尾語であるときは,固有名詞情報の接尾語の種類に応じて,修正範囲から設定された分割句の固有名詞を決定する。固有名詞情報には,例えば,接尾語「岬」に,前置する自立語の品詞として「固有名詞(地名)」が対応づけられている場合に,「小動」の品詞は,「固有名詞(地名)」と定義される。
上述するように,読み誤りの箇所を修正範囲とする場合に,修正範囲から生成された分割句の品詞情報も不正解である可能性が高い。しかし,読み誤りの箇所に接尾語が続く場合には,その接尾語の種類によって前分割句がどのような固有名詞であるかを類推することができる。第3の実施例では,固有名詞情報に基づいて,後分割句となる接尾語を手掛かりに前分割句の細分化した固有名詞を定義し,細分化した固有名詞とモーラ数に基づいてアクセント位置候補の優先順位を決定するため,アクセント位置修正の効率をさらに向上させることができる。
図18は,第3の実施例において,ユーザが読み誤りを修正した場合の例を示す図である。
図18(A)は,第3の実施例における表示画面D1の例を示す図である。図18(A)に示す表示画面D1において,読み誤り範囲「小動(しょーどー)」が,表示された読み候補により,読みが「こゆるぎ」に修正されたとする。
分割句生成部13は,指定範囲「小動(こゆるぎ)」を1分割句に設定し,後置の分割句の自立語「岬(みさき)」が接尾語であるので,固有名詞情報を参照し,接尾語「岬」をもとに,指定範囲の分割句「小動(こゆるぎ)」に「固有名詞(地名)」を定義する。
図18(B)は,第3の実施例における候補順位テーブルの一部を示す図である。候補順位テーブルには,4モーラの固有名詞(地名)のアクセント位置候補の優先順位が,0型,2型,1型,3型,…の順で登録されているとする。
候補順位決定部14は,図18(B)に示す候補順位テーブルを参照して,品詞「固有名詞(地名)」とモーラ数「4」から,アクセント位置候補の順位付けを行う。
図18(C)は,第3の実施例における表示画面D3の例を示す図である。
図18(B)に示す候補順位テーブルで,分割句「小動(こゆるぎ)」のアクセント位置の正解は,優先順位の1位である。図18(C)に示す表示画面D3においても,アクセント位置候補d31の第1番目に正解のアクセント位置候補が表示されるため,ユーザは,即座にアクセント正解に辿り着くことができる。
〔第4の実施例〕
第4の実施例として,修正範囲に未知語が含まれる場合の処理を説明する。
一般に,言語解析は,正しい文法の日本語テキストの解析に対しては高い精度を持つ。しかし,誤った文法の日本語,口語的表現等に対しては,言語解析誤りが生じやすく,その結果,品詞解析が不能な未知語が出現したり,品詞解析が可能であっても,その品詞間の接続コストが非常に高くなる傾向が強い。第4の実施例において,「未知語」とは,言語解析の結果,その品詞分類が困難となった語を示す品詞情報であり,便宜上,その品詞情報を名詞としている。
第1〜第3の実施例では,言語解析部11は,日本語テキストに含まれる未知語を名詞として解析し,さらに,分割句生成部13は,未知語を自立語として扱い,その結果,1分割句として設定する。
しかし,実際には,未知語はその前後の分割句と接続して意味をなすものが大半であるため,前後分割句と接続して1分割句に構成することが好ましい。
また,接続コストは,品詞種別によって接続する可能性が高いものや低いものがあることを示す情報であり,品詞間の接続の可能性をコストとして定量化した情報である。接続コストの値は,接続の可能性が低いほど高くなる。分割句同士の接続コストが高い場合は,日本語テキストの文法誤りや口語表現等のような言語解析が困難なケースであることが多い。言語解析において,接続コストが高い場合には,テキストが細分化され無理やり該当する品詞が割り当てられるため,修正範囲の分割句生成では分割句が細切れとなる。その結果,ユーザは無駄に細切れ化した分割句についてアクセント修正しなければならず,アクセント修正の効率が低下する場合がある。
第4の実施例において,修正範囲設定部12は,ユーザ指定範囲に未知語が含まれる場合,又は,隣接する分割句間の接続コストが所定の閾値を超える場合に,未知語が含まれる分割句もしくは隣接する分割句間の接続コストが所定の閾値を超える分割句とその分割句に隣接する分割句とを含んだ範囲を修正範囲として設定する。
さらに,分割句生成部13は,修正範囲設定部12が設定した修正範囲,すなわち未知語の分割句とその隣接分割句,又は接続コストが所定の閾値を超える分割句とその隣接分割句が修正範囲とされている場合に,それらの分割句を結合して1分割句とし,その自立語品詞を固有名詞と定義する。
第4の実施例によれば,修正範囲に未知語や接続コストが高い分割句が含まれる場合でも,結合により意味をなすと考えられる,隣接する分割句同士を結合して1分割句とするため,不適切な分割句によるアクセント位置の修正数の増加を抑えることができる。さらに,結合した1分割句の品詞情報を固有名詞で代用し,アクセント位置候補とその優先順位を決定することができる。そのため,言語解析に誤りが生じた場合であっても,ユーザは,少ない工数でアクセント位置の修正を完了させることが可能となる。
図19は,第4の実施例において,ユーザ指定範囲に未知語が含まれている場合の例を示す図である。
図19(A)は,第4の実施例における表示画面D1の例を示す図である。図19(A)に示す表示画面D1においてユーザ指定範囲として「言ったじゃん(いったじゃん)」という口語表現が指定されたとする。
ユーザ指定範囲「言ったじゃん」は,言語解析情報から,動詞+助動詞の「言った」,接続詞の「じゃ」,未知語(名詞)の「ん」で構成されていると解析される。したがって,第1の実施例では,分割句生成部13は,修正範囲を,「言った」「じゃ」「ん」の3分割句に分割する。しかし,2つの分割句の接続関係について,先頭分割句の品詞「動詞+助動詞」→中分割句の品詞「接続詞」,及び,中分割句の品詞「接続詞」→終端分割句の品詞「未知語」は,一般的に接続不可とされて,その接続コストは非常に大きくなる。さらに,終端分割句は,未知語を含んでいる。
修正範囲設定部12は,図19(B)に示すように,ユーザ指定範囲「言ったじゃん(いったじゃん)」について,接続コストが高い先頭分割句「言った」と中分割句「じゃ」,及び接続コストが高くかつ未知語を含む中分割句「じゃ」と終端分割句「ん」をそれぞれ結合して修正範囲に設定し,その品詞情報を固有名詞として定義する。
候補順位決定部14は,図2に示す候補順位テーブルを参照して,5モーラ及び固有名詞をもとにアクセント位置候補の順位付けを行う。
図19(C)は,第4の実施例における表示画面D3の例を示す図である。図19(C)に示す表示画面D3では,第1番目のアクセント位置候補が正解であるため,ユーザは,即座にアクセント位置の正解に辿り着くことができ,アクセント修正を効率よく行うことができる。
〔第5の実施例〕
第5の実施例として,合成音声の再生モードを複数備える場合の処理を説明する。
アクセント位置の修正中又は終了時に,ユーザは,実際の合成音声を試聴し,修正結果を確かめたい場合がある。
第5の実施例において,入出力部10は,合成音声を出力する際の再生モードとして,第1〜第3の再生モードを備えて,合成音声の出力対象となる出力範囲を設定する。
第1の再生モードは,ユーザによって選択された1又は複数のアクセント候補位置の範囲を出力範囲とするモードである。
入出力部10が第1の再生モードを備えることにより,修正範囲が複合語や連語である場合や複数の分割句に分割されている場合に,アクセント位置候補単位の合成音声を視聴するだけでなく,例えば1番目と2番目の分割句のアクセント位置候補をつなげて視聴する,又は全分割句のアクセント位置候補をまとめて視聴する等の様々な形態での視聴に対応することができる。よって,ユーザのアクセント位置修正の効率向上を支援する。
図20は,第5の実施例における第1の再生モードの場合の表示画面D4の例を示す図である。
入出力部10は,アクセント位置候補の合成音声を視聴できる範囲を指定する表示画面D4を表示する。
図20に示す表示画面D4では,アクセント位置候補d41,アクセント位置候補の再生を指示する再生ボタンd42,修正範囲(分割句の全体)の再生を指示する全体再生ボタンd43,再生する複数の分割句を指定する指定ボタンd44,複数の分割句の再生を指示する部分再生ボタンd45を備える。表示画面D4のアクセント位置候補d41は,表示画面D3に表示されるアクセント位置候補d31と同じである。
図20に示す表示画面D4は,3つの分割句「高速」「道路」「寸断」のアクセント位置修正を行う場合の例である。再生ボタンd42の三角部分が黒塗りであるアクセント位置候補(例えば「こーそく」)は,現時点でユーザが選択しているアクセント位置候補であることを示す。
指定ボタンd44のA〜Cは,3つの分割句「高速」「道路」「寸断」にそれぞれ対応し,A〜Cで表す指定ボタンd44のうち,丸部分が黒塗りである分割句が,現時点でユーザが選択している分割句であることを示す。
ユーザが,視聴したい分割句の再生ボタンd42を押下すると,入出力部10は,選択されたアクセント位置候補を出力範囲に設定する。音声合成部18は,出力範囲の分割句を指定されたアクセント位置候補が示すアクセント位置で合成された音声を生成する。
また,ユーザが,A〜Cの指定ボタンd44を選択し,部分再生ボタンd45を押下すると,入出力部10は,その分割句を出力範囲に設定する。ユーザが全体ボタンd43を押下すると,入出力部10は,全分割句の指定されたアクセント位置候補を出力範囲に設定する。
第2の再生モードは,結合して1アクセント句となる分割句の1つがユーザによって選択されたときに,1アクセント句全体を出力範囲に設定するモードである。
複数の分割句がアクセント結合して1アクセント句となる場合に,その部分を分割句単位で個別に聞いても連続性がなく,アクセント位置の正解・不正解を判断することが難しい場合がある。
入出力部10が第2の再生モードを備えることにより,アクセント結合している複数の分割句を連続して再生できるようにする。ユーザは,アクセント結合を意識することなく,アクセント結合された部分を連続して視聴し,アクセント位置の正解・不正解を容易に判断できるようになる。よって,アクセント位置修正の効率の向上させることができる。
図21は,第5の実施例における第2の再生モードの場合の表示画面D4の例を示す図である。
図21に示す表示画面D4の画面構成は,図20に示す表示画面D4と同じである。
図21に示す表示画面D4では,ユーザによって,「高速」のアクセント位置が0型(こーそく),「道路」のアクセント位置を1型(ど*ーろ)が指定されている。両分割句のアクセント位置から,アクセント句修正部16によって,2つの分割句は結合して1アクセント句となる。
ここで,表示画面D4において,ユーザによって第1番目のアクセント位置(こーそく)の再生ボタンd42が押下されると,入出力部10は,指定された分割句を含む1アクセント句の範囲を出力範囲に設定する。音声合成部18では,出力範囲となるアクセント句「高速道路」(7モーラ,5型)の「こーそくど*ーろ」の合成音声を生成する。
第3の再生モードは,ユーザによって選択された分割句のアクセント位置が「Nモーラ,N型」となる場合に,入出力部10は,該当する分割句の後分割句のアクセント位置を0型に修正し,両分割句を出力範囲に設定するモードである。
修正範囲の分割句がNモーラである場合に,考えられるアクセント位置は,最大でN+1(0,1,…,N−1,N)個の型となる。アクセント位置は,次のモーラで音が下がることを意味するため,「Nモーラ,N型」,すなわち,最後のモーラにアクセント位置が置かれる場合に,その分割句は後分割句とアクセント結合(1アクセント句)を生じて,後分割句の先頭モーラで音が下がる。したがって,Nモーラの分割句のみを再生する場合に,0型とN型のアクセント位置による合成音声の再生では,両者は同じアクセントに聞こえてしまう。
入出力部10が第3の再生モードを備えることにより,ユーザが選択した分割句とそのアクセント位置が「Nモーラ,N型」となる場合には,後分割句のアクセント型を0型に自動修正し,指定の分割句と結合させて,合成音声を生成・再生できるようにする。ユーザは,NモーラのN型アクセントの正しい視聴が可能となり,よって,アクセント位置修正の効率の向上させることができる。
図22は,第5の実施例における第3の再生モードの場合の表示画面D4の例を示す図である。図22に示す表示画面D4の画面構成は,図20に示す表示画面D4と同じである。
図22に示す表示画面D4は,修正範囲「相模湾(さがみわん)」から2つの分割句「相模(さがみ)」「湾(わん)」が生成され,各分割句のアクセント位置候補が提示されている。ユーザによって,分割句「相模(さがみ)」については3型が選択され,分割句「湾(わん)」については1型が選択されているとする。
しかし,分割句「相模(さがみ)」は,「Nモーラ,N型(3モーラ,3型)」に該当する。アクセント位置修正部16は,入出力部10を介してアクセント位置候補の選択を受け付けると,分割句「相模(さがみ)」の後分割句「湾(わん)」の1型を0型に変更し,両分割句を結合して1アクセント句とする。そして,入出力部10は,表示画面D4において,分割句「相模(さがみ)」の合成音声の再生が指示された場合に,アクセント結合されている両分割句の範囲を出力範囲に設定する。音声合成部18は,出力範囲となるアクセント句「相模湾」(5モーラ,3型)の「さがみ*わん」の合成音声を生成する。これにより,正しいアクセント位置「さがみ*」「わん」と混同しやすい「さがみ*」「わ*ん」により,ユーザが分割句「湾(わん)」のアクセント位置を誤って指定している場合であっても,正しいアクセント位置の合成音声を試聴することができる。
図23は,合成音声装置1のハードウェア構成例を示す図である。
合成音声修正装置1は,CPU100,記憶装置101,通信装置102,入出力装置103を備えた処理装置,例えば,パソコン,ワークステーションや,携帯端末全般(タブレットPC,PDA,携帯電話など)等により実施することができる。
CPU100は,記憶装置101に記憶した,図1に示す合成音声修正装置1の各処理部及び機能を実現するプログラムの制御やデータ管理等を行う。すなわち,合成音声修正装置1の入出力部10,言語解析部11,修正範囲設定部12,分割句生成部13,候補順位決定部14,アクセント位置取得部15,アクセント句修正部16,表音テキスト修正部17,音声合成部18などは,プログラムで構成することができ,CPU100配下のメモリにロードされてCPU100で実行されることにより,合成音声修正装置1の処理部が有する各機能が実現される。
記憶装置101は,ハードディスク(HDD)等に代表される記憶媒体であり,その他,CD/DVD/BD−ROM/RAM,メモリ,USBやLANによって合成音声修正装置1に接続する外部記憶媒体等に相当する。すなわち,合成音声修正装置1の記憶部2及び処理に要するデータを記憶する記憶部は,記憶装置101により実現される。
通信装置102は,各種ネットワークを経由して,外部の処理装置と接続するインタフェース(IF)である。合成音声修正装置1が通信装置102を備える場合に,例えば,CPU性能が乏しい,記憶装置の容量制限がある等の制約により,実行負荷や容量負荷が大きな処理部や機能,例えば音声合成部18の機能を外部の音声合成サーバ等で実行することが可能となり,合成音声修正装置1の負荷を軽減させ,装置上での音声合成処理や,合成音声修正処理を実現することができる。
入出力装置103は,アクセント位置修正等を行うGUIを表示する表示IF,音声合成における日本語テキスト入力,アクセント位置修正等を行う入力IF,合成音声を出力する出力IF等を備える装置により実施することができる。表示IFは,例えばモニタ画面で実施することができる。入力IFは,文字入力を行うキーボード,タッチパネルの他,ポインディングデバイスであるマウス,タッチパッド,タッチペンなどで実施することができる。出力IFは,内部/外部スピーカの他,イヤホンなどの音声再生機器で実施することができる。
なお,合成音声修正装置1の各処理及び機能を実現するプログラム及びデータは,必ずしも記憶装置101に記憶されている必要はなく,可搬型記憶媒体に記憶されているプログラム及びデータが入出力装置103によって読み取られ,又は,通信装置102を介して取得され,記憶装置101に格納されるようにしてもよい。
以上説明したように,開示する合成音声修正装置1によれば,ユーザがアクセント位置の修正のために指定した範囲に対して,正解である確率が高いアクセント位置候補を上位に提示する。よって,ユーザは,提示されたアクセント位置候補の上位からアクセント位置を選択することで,簡便かつ効率よくアクセント位置修正を行うことができる。
さらに,合成音声修正装置1によれば,修正範囲のアクセント句を,自立語を先頭とする境界によって,より細かい分割句に分割し,アクセント修正後に隣接の分割句間でアクセント結合の有無を判定して,自動的にアクセント句を修正する。よって,ユーザは,アクセント位置修正に伴うアクセント句の分割や結合を意識することなく,簡単にアクセント位置修正を行うことが可能となる。
上記の実施例により説明した本発明の特徴を以下に列記する。
(付記1)
処理対象となる日本語テキストに対して言語解析を行い,該日本語テキストの各単語の品詞や,該日本語テキストの読み及び少なくともアクセント句とアクセント位置とを示す言語解析情報を含む表音テキストを生成する言語解析部と,
前記日本語テキストを表示してユーザ操作を受け付け,該日本語テキストのアクセント位置を修正する修正範囲のアクセント位置候補を優先順位に応じて表示してユーザ操作を受け付ける入出力部と,
前記入出力部から,前記ユーザ操作により前記日本語テキストから指定されたユーザ指定範囲を取得し,前記言語解析情報をもとに,取得したユーザ指定範囲を含むアクセント句を修正範囲に設定する修正範囲設定部と,
前記言語解析情報に基づいて,前記修正範囲を自立語が先頭となる境界で分割した分割句を生成する分割句生成部と,
モーラ数及び品詞に基づいて,各アクセント位置を示すアクセント位置候補の優先順位を登録したアクセント位置候補順位情報を記憶する記憶部と,
前記アクセント位置候補順位情報を参照して,前記修正範囲の分割句毎に,該分割句のモーラ数及び含まれる自立語の品詞に基づいてアクセント位置候補の表示時の前記優先順位を決定する候補順位決定部と,
前記入出力部から,前記ユーザ操作により前記修正範囲のアクセント位置候補から選択されたユーザ選択候補を取得し,取得したユーザ選択候補が示すアクセント位置をユーザ指定アクセント位置とするアクセント位置取得部と,
前記ユーザ指定アクセント位置をもとに前記ユーザ選択候補に対応する分割句と該分割句と隣接する分割句とがアクセント結合をするかを判定し,前記ユーザ選択候補に対応する分割句と隣接する分割句とがアクセント結合をする場合に,前記ユーザ選択候補に対応する分割句と隣接する分割句とを結合して1アクセント句に修正し,修正したアクセント句のアクセント位置を前記ユーザ指定アクセント位置で修正するアクセント句修正部と,
前記結合されたアクセント句及び前記修正されたアクセント位置をもとに,前記修正範囲に対応する前記表音テキストを修正する表音テキスト修正部と,
前記入出力部から,前記ユーザ操作により前記修正範囲のアクセント位置候補から出力範囲として選択されたアクセント位置候補を取得し,取得した出力範囲の表音テキストの読み及び取得したアクセント位置候補が示すアクセント位置に従って該出力範囲の合成音声を生成する音声合成部とを備える
ことを特徴とする合成音声修正装置。
(付記2)
前記修正範囲設定部は,前記言語解析情報を参照し,前記ユーザ指定範囲が複合語の一部である場合に,該複合語の全体のアクセント句を前記修正範囲に設定する
ことを特徴とする前記付記1記載の合成音声修正装置。
(付記3)
前記修正範囲設定部は,前記言語解析情報を参照し,前記ユーザ指定範囲が連語の一部である場合に,該連語の全体のアクセント句を前記修正範囲に設定する
ことを特徴とする前記付記1又は前記付記2に記載の合成音声修正装置。
(付記4)
前記入出力部は,前記日本語テキストの読み誤りの修正をする読み修正範囲を受け付け,
前記修正範囲設定部は,前記受け付けられた読み修正範囲を前記修正範囲に設定し,
前記分割句生成部が,前記読み修正範囲から設定された前記修正範囲を1分割句に設定し,設定した分割句に含まれる自立語の品詞を固有名詞と定義する
ことを特徴とする前記付記1ないし前記付記3のいずれか一項に記載の合成音声修正装置。
(付記5)
前記修正範囲設定部は,前記ユーザ指定範囲に未知語が含まれる場合に,該未知語を含む分割句に隣接する分割句を前記ユーザ指定範囲に含めた範囲を前記修正範囲に設定し,
前記分割句生成部は,前記未知語を含む分割句及び隣接する分割句を結合した範囲を1分割句に設定し,該設定した1分割句の自立語の品詞を固有名詞と定義する
ことを特徴とする前記付記1ないし前記付記4のいずれか一項に記載の合成音声修正装置。
(付記6)
前記修正範囲設定部は,前記ユーザ指定範囲に分割句間の接続コストが所定の閾値を超える分割句が含まれる場合に,接続コストが所定の閾値を超える分割句に隣接する分割句を前記ユーザ指定範囲に含めた範囲を前記修正範囲に設定し,
前記分割句生成部は,前記接続コストが所定の閾値を超える分割句及び隣接する分割句を結合した範囲を1分割句に設定し,設定した分割句の自立語の品詞を固有名詞と定義する
ことを特徴とする前記付記1ないし前記付記5のいずれか一項に記載の合成音声修正装置。
(付記7)
前記入出力部は,前記出力範囲として選択されたアクセント位置候補及び該アクセント位置候補の分割句に隣接する分割句を含む範囲,又は,前記出力範囲として選択されたアクセント位置候補を含む修正範囲の全体の範囲を,該出力範囲として出力する
ことを特徴とする請求項1ないし請求項6のいずれか一項に記載の合成音声修正装置。
(付記8)
前記入出力部は,前記出力範囲として選択されたアクセント位置候補が示すアクセント位置によって,該選択されたアクセント位置候補の分割句及び該分割句に前置又は後置する分割句がアクセント結合をする場合に,結合する分割句の範囲を前記出力範囲として出力する
ことを特徴とする前記付記1ないし前記付記6のいずれか一項に記載の合成音声修正装置。
(付記9)
前記入出力部は,前記出力範囲として選択されたアクセント位置候補が示すアクセント位置が,Nモーラ数におけるN番目のアクセント位置であるNモーラN型である場合に,該選択されたアクセント位置候補の分割句に後置する分割句をアクセント位置がない0型に修正して結合し,結合した分割句の範囲を前記出力範囲として出力する
ことを特徴とする前記付記1ないし前記付記6のいずれか一項に記載の合成音声修正装置。
(付記10)
前記記憶部は,前記品詞として固有名詞の細分化された種類が設定されている前記アクセント位置候補順位情報を記憶し,
前記分割句生成部は,接尾語と接尾語に前置する固有名詞の種類とを示す固有名詞情報を備え,前記読み修正範囲から設定された前記修正範囲の分割句に後置する分割句に含まれる自立語が接尾語である場合に,後置する分割句の接尾語の種類に応じて該設定された分割句の固有名詞の種類を決定し,
前記候補順位決定部は,前記読み修正範囲から設定された前記修正範囲の分割句について,前記モーラ数及び前記決定された固有名詞の種類に基づいて前記アクセント位置候補の表示時の優先順位を決定する
ことを特徴とする請求項4に記載の合成音声修正装置。
(付記11)
合成音声修正方法であって,
処理対象となる日本語テキストに対して言語解析を行い,該日本語テキストの各単語の品詞や,該日本語テキストの読み及び少なくともアクセント句とアクセント位置とを示す言語解析情報を含む表音テキストを生成し,
前記日本語テキストを表示し,ユーザ操作によって前記日本語テキストから指定されたユーザ指定範囲を受け付け,
前記言語解析情報をもとに,前記ユーザ指定範囲を含むアクセント句を修正範囲に設定し,
前記言語解析情報に基づいて,前記修正範囲を自立語が先頭となる境界で分割した分割句を生成し,
前記コンピュータが備える記憶部に記憶されている,モーラ数及び品詞に基づいて,各アクセント位置を示すアクセント位置候補の優先順位を登録したアクセント位置候補順位情報を参照して,前記修正範囲の分割句毎に,該分割句のモーラ数及び含まれる自立語の品詞に基づいてアクセント位置候補の表示時の前記優先順位を決定し,
前記修正範囲のアクセント位置候補を前記優先順位に応じて表示し,ユーザ操作によって該表示したアクセント位置候補から選択されたユーザ選択候補を受け付け,
前記ユーザ選択候補が示すアクセント位置をユーザ指定アクセント位置に設定し,
前記ユーザ指定アクセント位置をもとに前記ユーザ選択候補に対応する分割句と該分割句と隣接する分割句とがアクセント結合をするかを判定し,前記ユーザ選択候補に対応する分割句と隣接する分割句とがアクセント結合をする場合に,前記ユーザ選択候補に対応する分割句と隣接する分割句とを結合して1アクセント句に修正し,修正したアクセント句のアクセント位置を前記ユーザ指定アクセント位置で修正し,
前記結合されたアクセント句及び前記修正されたアクセント位置をもとに,前記修正範囲に対応する前記表音テキストを修正し,
前記表示するアクセント位置候補からユーザ操作によって選択されたアクセント位置候補を出力範囲として受け付け,
前記受け付けた出力範囲の表音テキストの読み及び取得したアクセント位置候補が示すアクセント位置に従って該出力範囲の合成音声を生成する処理を,
コンピュータが実行する
ことを特徴とする合成音声修正方法。
(付記12)
合成音声修正プログラムであって,
処理対象となる日本語テキストに対して言語解析を行い,該日本語テキストの各単語の品詞や,該日本語テキストの読み及び少なくともアクセント句とアクセント位置とを示す言語解析情報を含む表音テキストを生成し,
前記日本語テキストを表示し,ユーザ操作によって前記日本語テキストから指定されたユーザ指定範囲を受け付け,
前記言語解析情報をもとに,前記ユーザ指定範囲を含むアクセント句を修正範囲に設定し,
前記言語解析情報に基づいて,前記修正範囲を自立語が先頭となる境界で分割した分割句を生成し,
前記コンピュータが備える記憶部に記憶されている,モーラ数及び品詞に基づいて,各アクセント位置を示すアクセント位置候補の優先順位を登録したアクセント位置候補順位情報を参照して,前記修正範囲の分割句毎に,該分割句のモーラ数及び含まれる自立語の品詞に基づいてアクセント位置候補の表示時の前記優先順位を決定し,
前記修正範囲のアクセント位置候補を前記優先順位に応じて表示し,ユーザ操作によって該表示したアクセント位置候補から選択されたユーザ選択候補を受け付け,
前記ユーザ選択候補が示すアクセント位置をユーザ指定アクセント位置に設定し,
前記ユーザ指定アクセント位置をもとに前記ユーザ選択候補に対応する分割句と該分割句と隣接する分割句とがアクセント結合をするかを判定し,前記ユーザ選択候補に対応する分割句と隣接する分割句とがアクセント結合をする場合に,前記ユーザ選択候補に対応する分割句と隣接する分割句とを結合して1アクセント句に修正し,修正したアクセント句のアクセント位置を前記ユーザ指定アクセント位置で修正し,
前記結合されたアクセント句及び前記修正されたアクセント位置をもとに,前記修正範囲に対応する前記表音テキストを修正し,
前記表示するアクセント位置候補からユーザ操作によって選択されたアクセント位置候補を出力範囲として受け付け,
前記受け付けた出力範囲の表音テキストの読み及び取得したアクセント位置候補が示すアクセント位置に従って該出力範囲の合成音声を生成する処理を,
コンピュータに実行させる
ことを特徴とする合成音声修正プログラム。
1 合成音声修正装置
10 入出力部
11 言語解析部
12 修正範囲設定部
13 分割句生成部
14 候補順位決定部
15 アクセント位置取得部
16 アクセント句修正部
17 表音テキスト修正部
18 音声合成部
2 記憶部

Claims (8)

  1. 処理対象となる日本語テキストに対して言語解析を行い,該日本語テキストの各単語の品詞や,該日本語テキストの読み及び少なくともアクセント句とアクセント位置とを示す言語解析情報を含む表音テキストを生成する言語解析部と,
    前記日本語テキストを表示してユーザ操作を受け付け,該日本語テキストのアクセント位置を修正する修正範囲のアクセント位置候補を優先順位に応じて表示してユーザ操作を受け付ける入出力部と,
    前記入出力部から,前記ユーザ操作により前記日本語テキストから指定されたユーザ指定範囲を取得し,前記言語解析情報をもとに,取得したユーザ指定範囲を含むアクセント句を修正範囲に設定する修正範囲設定部と,
    前記言語解析情報に基づいて,前記修正範囲を自立語が先頭となる境界で分割した分割句を生成する分割句生成部と,
    モーラ数及び品詞に基づいて,各アクセント位置を示すアクセント位置候補の優先順位を登録したアクセント位置候補順位情報を記憶する記憶部と,
    前記アクセント位置候補順位情報を参照して,前記修正範囲の分割句毎に,該分割句のモーラ数及び含まれる自立語の品詞に基づいてアクセント位置候補の表示時の前記優先順位を決定する候補順位決定部と,
    前記入出力部から,前記ユーザ操作により前記修正範囲のアクセント位置候補から選択されたユーザ選択候補を取得し,取得したユーザ選択候補が示すアクセント位置をユーザ指定アクセント位置とするアクセント位置取得部と,
    前記ユーザ指定アクセント位置をもとに前記ユーザ選択候補に対応する分割句と該分割句と隣接する分割句とがアクセント結合をするかを判定し,前記ユーザ選択候補に対応する分割句と隣接する分割句とがアクセント結合をする場合に,前記ユーザ選択候補に対応する分割句と隣接する分割句とを結合して1アクセント句に修正し,修正したアクセント句のアクセント位置を前記ユーザ指定アクセント位置で修正するアクセント句修正部と,
    前記結合されたアクセント句及び前記修正されたアクセント位置をもとに,前記修正範囲に対応する前記表音テキストを修正する表音テキスト修正部と,
    前記入出力部から,前記ユーザ操作により前記修正範囲のアクセント位置候補から出力範囲として選択されたアクセント位置候補を取得し,取得した出力範囲の表音テキストの読み及び取得したアクセント位置候補が示すアクセント位置に従って該出力範囲の合成音声を生成する音声合成部とを備える
    ことを特徴とする合成音声修正装置。
  2. 前記入出力部は,前記日本語テキストの読み誤りの修正をする読み修正範囲を受け付け,
    前記修正範囲設定部は,前記受け付けられた読み修正範囲を前記修正範囲に設定し,
    前記分割句生成部が,前記読み修正範囲から設定された前記修正範囲を1分割句に設定し,設定した分割句に含まれる自立語の品詞を固有名詞と定義する
    ことを特徴とする請求項1に記載の合成音声修正装置。
  3. 前記修正範囲設定部は,前記ユーザ指定範囲に未知語が含まれる場合に,該未知語を含む分割句に隣接する分割句を前記ユーザ指定範囲に含めた範囲を前記修正範囲に設定し,
    前記分割句生成部は,前記未知語を含む分割句及び隣接する分割句を結合した範囲を1分割句に設定し,該設定した1分割句の自立語の品詞を固有名詞と定義する
    ことを特徴とする請求項1又は請求項2に記載の合成音声修正装置。
  4. 前記修正範囲設定部は,前記ユーザ指定範囲に分割句間の接続コストが所定の閾値を超える分割句が含まれる場合に,接続コストが所定の閾値を超える分割句に隣接する分割句を前記ユーザ指定範囲に含めた範囲を前記修正範囲に設定し,
    前記分割句生成部は,前記接続コストが所定の閾値を超える分割句及び隣接する分割句を結合した範囲を1分割句に設定し,設定した分割句の自立語の品詞を固有名詞と定義する
    ことを特徴とする請求項1ないし請求項3のいずれか一項に記載の合成音声修正装置。
  5. 前記入出力部は,前記出力範囲として選択されたアクセント位置候補が示すアクセント位置によって,該選択されたアクセント位置候補の分割句及び該分割句に前置又は後置する分割句がアクセント結合をする場合に,結合する分割句の範囲を前記出力範囲として出力する
    ことを特徴とする請求項1ないし請求項4のいずれか一項に記載の合成音声修正装置。
  6. 前記入出力部は,前記出力範囲として選択されたアクセント位置候補が示すアクセント位置が,Nモーラ数におけるN番目のアクセント位置であるNモーラN型である場合に,該選択されたアクセント位置候補の分割句に後置する分割句をアクセント位置がない0型に修正して結合し,結合した分割句の範囲を前記出力範囲として出力する
    ことを特徴とする請求項1ないし請求項5のいずれか一項に記載の合成音声修正装置。
  7. 合成音声修正方法であって,
    処理対象となる日本語テキストに対して言語解析を行い,該日本語テキストの各単語の品詞や,該日本語テキストの読み及び少なくともアクセント句とアクセント位置とを示す言語解析情報を含む表音テキストを生成し,
    前記日本語テキストを表示し,ユーザ操作によって前記日本語テキストから指定されたユーザ指定範囲を受け付け,
    前記言語解析情報をもとに,前記ユーザ指定範囲を含むアクセント句を修正範囲に設定し,
    前記言語解析情報に基づいて,前記修正範囲を自立語が先頭となる境界で分割した分割句を生成し,
    ンピュータが備える記憶部に記憶されている,モーラ数及び品詞に基づいて,各アクセント位置を示すアクセント位置候補の優先順位を登録したアクセント位置候補順位情報を参照して,前記修正範囲の分割句毎に,該分割句のモーラ数及び含まれる自立語の品詞に基づいてアクセント位置候補の表示時の前記優先順位を決定し,
    前記修正範囲のアクセント位置候補を前記優先順位に応じて表示し,ユーザ操作によって該表示したアクセント位置候補から選択されたユーザ選択候補を受け付け,
    前記ユーザ選択候補が示すアクセント位置をユーザ指定アクセント位置に設定し,
    前記ユーザ指定アクセント位置をもとに前記ユーザ選択候補に対応する分割句と該分割句と隣接する分割句とがアクセント結合をするかを判定し,前記ユーザ選択候補に対応する分割句と隣接する分割句とがアクセント結合をする場合に,前記ユーザ選択候補に対応する分割句と隣接する分割句とを結合して1アクセント句に修正し,修正したアクセント句のアクセント位置を前記ユーザ指定アクセント位置で修正し,
    前記結合されたアクセント句及び前記修正されたアクセント位置をもとに,前記修正範囲に対応する前記表音テキストを修正し,
    前記表示するアクセント位置候補からユーザ操作によって選択されたアクセント位置候補を出力範囲として受け付け,
    前記受け付けた出力範囲の表音テキストの読み及び取得したアクセント位置候補が示すアクセント位置に従って該出力範囲の合成音声を生成する処理を,
    コンピュータが実行する
    ことを特徴とする合成音声修正方法。
  8. 合成音声修正プログラムであって,
    処理対象となる日本語テキストに対して言語解析を行い,該日本語テキストの各単語の品詞や,該日本語テキストの読み及び少なくともアクセント句とアクセント位置とを示す言語解析情報を含む表音テキストを生成し,
    前記日本語テキストを表示し,ユーザ操作によって前記日本語テキストから指定されたユーザ指定範囲を受け付け,
    前記言語解析情報をもとに,前記ユーザ指定範囲を含むアクセント句を修正範囲に設定し,
    前記言語解析情報に基づいて,前記修正範囲を自立語が先頭となる境界で分割した分割句を生成し,
    ンピュータが備える記憶部に記憶されている,モーラ数及び品詞に基づいて,各アクセント位置を示すアクセント位置候補の優先順位を登録したアクセント位置候補順位情報を参照して,前記修正範囲の分割句毎に,該分割句のモーラ数及び含まれる自立語の品詞に基づいてアクセント位置候補の表示時の前記優先順位を決定し,
    前記修正範囲のアクセント位置候補を前記優先順位に応じて表示し,ユーザ操作によって該表示したアクセント位置候補から選択されたユーザ選択候補を受け付け,
    前記ユーザ選択候補が示すアクセント位置をユーザ指定アクセント位置に設定し,
    前記ユーザ指定アクセント位置をもとに前記ユーザ選択候補に対応する分割句と該分割句と隣接する分割句とがアクセント結合をするかを判定し,前記ユーザ選択候補に対応する分割句と隣接する分割句とがアクセント結合をする場合に,前記ユーザ選択候補に対応する分割句と隣接する分割句とを結合して1アクセント句に修正し,修正したアクセント句のアクセント位置を前記ユーザ指定アクセント位置で修正し,
    前記結合されたアクセント句及び前記修正されたアクセント位置をもとに,前記修正範囲に対応する前記表音テキストを修正し,
    前記表示するアクセント位置候補からユーザ操作によって選択されたアクセント位置候補を出力範囲として受け付け,
    前記受け付けた出力範囲の表音テキストの読み及び取得したアクセント位置候補が示すアクセント位置に従って該出力範囲の合成音声を生成する処理を,
    コンピュータに実行させる
    ことを特徴とする合成音声修正プログラム。
JP2011284926A 2011-12-27 2011-12-27 合成音声修正装置,方法,及びプログラム Active JP5870686B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2011284926A JP5870686B2 (ja) 2011-12-27 2011-12-27 合成音声修正装置,方法,及びプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2011284926A JP5870686B2 (ja) 2011-12-27 2011-12-27 合成音声修正装置,方法,及びプログラム

Publications (2)

Publication Number Publication Date
JP2013134396A JP2013134396A (ja) 2013-07-08
JP5870686B2 true JP5870686B2 (ja) 2016-03-01

Family

ID=48911111

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2011284926A Active JP5870686B2 (ja) 2011-12-27 2011-12-27 合成音声修正装置,方法,及びプログラム

Country Status (1)

Country Link
JP (1) JP5870686B2 (ja)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP6411015B2 (ja) * 2013-09-12 2018-10-24 富士通株式会社 音声合成装置、音声合成方法、およびプログラム
JP6340839B2 (ja) * 2014-03-11 2018-06-13 富士通株式会社 音声合成装置、合成音声編集方法及び合成音声編集用コンピュータプログラム
WO2016143420A1 (ja) * 2015-03-06 2016-09-15 シャープ株式会社 提示装置、提示装置の制御方法、および制御プログラム

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008083239A (ja) * 2006-09-26 2008-04-10 Toshiba Corp 中間言語編集装置、中間言語編集方法および中間言語編集プログラム

Also Published As

Publication number Publication date
JP2013134396A (ja) 2013-07-08

Similar Documents

Publication Publication Date Title
US8712776B2 (en) Systems and methods for selective text to speech synthesis
US8355919B2 (en) Systems and methods for text normalization for text to speech synthesis
KR100378898B1 (ko) 발음 설정 방법, 컴퓨터 판독가능 매체를 포함하는 제조 물품 및, 그래픽 사용자 인터페이스 시스템
US8583418B2 (en) Systems and methods of detecting language and natural language strings for text to speech synthesis
US8352268B2 (en) Systems and methods for selective rate of speech and speech preferences for text to speech synthesis
US8396714B2 (en) Systems and methods for concatenation of words in text to speech synthesis
JP5610197B2 (ja) 検索装置、検索方法、及び、プログラム
US8751238B2 (en) Systems and methods for determining the language to use for speech generated by a text to speech engine
US20100082346A1 (en) Systems and methods for text to speech synthesis
US20100082327A1 (en) Systems and methods for mapping phonemes for text to speech synthesis
US7454343B2 (en) Speech synthesizer, speech synthesizing method, and program
WO2010036486A2 (en) Systems and methods for speech preprocessing in text to speech synthesis
US9009051B2 (en) Apparatus, method, and program for reading aloud documents based upon a calculated word presentation order
JP5620349B2 (ja) 対話装置、対話方法および対話プログラム
JP2007058509A (ja) 言語処理システム
JP5870686B2 (ja) 合成音声修正装置,方法,及びプログラム
JP5404726B2 (ja) 情報処理装置、情報処理方法およびプログラム
JP2012168349A (ja) 音声認識システムおよびこれを用いた検索システム
JP5189413B2 (ja) 音声データ検索システム
US20110022378A1 (en) Translation system using phonetic symbol input and method and interface thereof
KR20090107012A (ko) 컴퓨터 실행 가능한 프로그램, 방법, 및 처리장치
JP5819147B2 (ja) 音声合成装置、音声合成方法およびプログラム
JPWO2011004502A1 (ja) 音声編集合成装置及び音声編集合成方法
JP4846548B2 (ja) 音声情報選択装置及び音声情報選択方法
JP5123347B2 (ja) 音声合成装置

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20140904

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20150617

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20150623

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20150713

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20151215

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20151228

R150 Certificate of patent (=grant) or registration of utility model

Ref document number: 5870686

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150