JP2002023786A - 口語文形式テキスト作成装置及びテキスト音声変換装置 - Google Patents

口語文形式テキスト作成装置及びテキスト音声変換装置

Info

Publication number
JP2002023786A
JP2002023786A JP2000203152A JP2000203152A JP2002023786A JP 2002023786 A JP2002023786 A JP 2002023786A JP 2000203152 A JP2000203152 A JP 2000203152A JP 2000203152 A JP2000203152 A JP 2000203152A JP 2002023786 A JP2002023786 A JP 2002023786A
Authority
JP
Japan
Prior art keywords
text
information
unit
instruction
colloquial
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2000203152A
Other languages
English (en)
Inventor
Hisako Asano
久子 浅野
Hisashi Obara
永 小原
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP2000203152A priority Critical patent/JP2002023786A/ja
Publication of JP2002023786A publication Critical patent/JP2002023786A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Machine Translation (AREA)
  • Document Processing Apparatus (AREA)

Abstract

(57)【要約】 【課題】記述文形式テキストから自動生成された口語文
形式テキストの修正、自動生成で用いるデータのメンテ
ナンスに対する支援を行う。 【解決手段】記述文形式テキストを入力し、書き換え表
現情報を用いて変換情報を生成する書き換え処理を、言
語規則と単語辞書を用いて、表層解析、形態素解析、構
文解析、文脈解析等を行う言語解析を制御しながら行
い、自動生成された口語文形式テキストを表示し、この
表示に基づいてユーザからの修正等の指示を受け、書き
換え部による自動作成された口語文形式テキストの修
正、及び書き換え部及び言語解析部のメンテナンスの支
援を行う。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、記述文形式テキス
トを音声に変換する際に利用する、口語文形式テキスト
作成装置及びテキスト音声変換装置に関し、特に、あら
かじめ記述文形式のテキストが存在し、それを元に、分
かり易く正確な音声を提供するサービス、例えば、新聞
記事、メールマガジン、WWWテキスト(各種情報案内ペ
ージなど)等の音声提供サービスの効率化に役立つ口語
文形式テキスト作成装置及びテキスト音声変換装置に関
する。
【0002】
【従来の技術】テキスト音声変換装置では、通常、入力
されたテキストに対して言語解析を行い、言語解析結果
を用いて、読み、アクセント、ポーズ情報等からなる発
声パラメータを生成し、発声パラメータから合成音声を
生成している。しかし、現状の言語解析技術、発声パラ
メータ生成技術では、発声パラメータを完全に正確に生
成することは不可能である。このため、正確な音声が必
要であって、テキストからリアルタイムに音声を合成す
る必要のない場合は、一般に、発声パラメータを人手を
介して修正する。
【0003】この発声パラメータの修正を支援する発明
としては、特開平9−171392号公報「発音情報作
成方法およびその装置」等が存在する。しかしこれらの
発明では、入力されたテキストをそのまま音声に変換す
ることを前提としており、入力文を音声に適した表現
(口語文形式)に書き換えることは考慮していない。ま
た、テキスト書き換えを自動的に行う発明としては、特
開平6−325079号公報「日本語文章書換え装置」
等があり、記述文形式テキストから口語文形式テキスト
への書き換えルールを作成することで、口語文形式テキ
ストを生成することができる。しかし、現状の言語解析
技術、書き換え技術では、口語文形式テキストを完全に
正しく生成することは不可能である。このため、聞き易
く、分かり易い音声が必要であってテキストからリアル
タイムに音声を合成する必要のない場合は、書き換え後
の口語文記述テキストを人手によりチェックし、修正を
行っている。
【0004】
【発明が解決しようとする課題】従来のテキスト音声変
換技術は、テキストを音声に変換する際に、自動的に生
成した発声パラメータを人手で修正するのを支援でき
る。しかし、入力されたテキストの書き換えを支援する
ことは想定していない。しかし、文字ベースでの提出用
として作成されたテキスト(記述文形式テキスト)を、
そのまま音声化すると、聞き難い、理解できない場合が
数多く存在する。
【0005】例えば、「今秋」という単語は、文字の場
合は問題ないが、音声の場合は「今週」と誤解する可能
性がある。また、「アジア航海図(重文)の展示」とい
う表現をそのまま「あじあこうかいず、じゅうぶんのて
んじ」と音声で聞いた場合に、理解するのは難しい。そ
れは「重要文化財」が「重文」という略語で表記されて
いる、および、補足などの用途に用いられる括弧表現
は、構文的、意味的なつながりを分断するためである。
このように、記述文形式テキストをそのまま音声化する
のは、聞き易さ、分かり易さの点から問題である。
【0006】このため、文字ベースでの提出用に、あら
かじめ記述文形式のテキストが存在している場合、それ
を音声化するためのテキストの作成は、人手ですべて書
き換える、あるいは、完全な精度を達成していない口語
文形式テキスト生成技術を適用し出力された口語文記述
テキストを支援環境なしに人手でチェックし、修正する
という非効率な作業が行われていた。後者の作業では、
どのように書き換えられたかチェックするのが困難、人
手による修正が書き換えルール等に反映される枠組みが
なかったため、修正した部分と同じ表現が出現した場合
には、同様の修正を何度も行う必要がある等の問題があ
った。
【0007】また、あわせて合成音声での出力を行う場
合にでも、同様に、口語文形式テキストの修正の非効率
性が問題となる。本発明は、上記問題点を鑑み、記述文
形式テキストを音声化するとき、効率的に、口語文形式
テキストへの書き換え支援を行う口語文形式テキスト作
成装置、および前記機能に加え、音声パラメータの修正
支援を行い、聞き易く正確な合成音声を出力して音声情
報サービス等で利用するテキスト音声変換装置を提供す
ることを目的とする。
【0008】
【課題を解決するための手段】請求項1に記載の発明
は、記述文形式テキストを入力し、書き換え表現情報を
用いて変換情報を生成する書き換え処理を、言語規則と
単語辞書を用いて、表層解析、形態要素解析、構文解
析、文脈解析等を行う言語解析を制御しながら行い、そ
の結果をユーザへ分かり易く表示し、ユーザからの修正
等の指示を受け、前記書き換え部による自動作成された
口語文形式テキストの修正、前記書き換え部および言語
解析部のメンテナンスの支援を行う。
【0009】請求項7に記載の発明は、記述文形式テキ
ストを入力し、書き換え表現情報を用いて変換情報を生
成する書き換え処理を、言語規則と単語辞書を用いて、
表層解析、形態要素解析、構文解析、文脈解析等を行う
言語解析を制御しながら行い、変換情報から得られる口
語文形式テキストに対して発声パラメータ生成を行い、
これらの結果をユーザへ分かり易く表示、音声出力し、
ユーザからの修正等の指示を受け、前記書き換え部によ
る自動作成された口語文形式テキストの修正、前記書き
換え部および言語解析部のメンテナンスの支援を行い、
情報提供用に外部装置での合成音声の生成、音声出力・
保存を行う。
【0010】
【発明の実施の形態】以下、本発明を図面を参照して説
明する。図1は本発明の一実施例である口語文形式テキ
スト作成装置及びテキスト音声変換装置の概略構成図で
ある。口語文形式テキスト作成装置は、テキスト音声変
換制御部1、テキスト入力部2、書き換え部3、書き換
え表現情報記憶部4、言語解析部5、言語規則記憶部
6、単語辞書記憶部7から構成される。
【0011】また、テキスト音声変換装置は、口語文形
式テキスト作成装置、テキスト音声変換制御部1、発声
パラメータ生成部9、音声生成部10、音声出力・保存
部11から構成される。テキスト音声変換制御部1は、
テキストの入力、言語解析、書き換え、ユーザインタラ
クション、および、音声変換装置においては、発声パラ
メータ生成、音声生成、音声出力等の処理を制御する。
【0012】口語文形式テキスト作成装置においては、
最終的に書き換えられた口語文テキストを出力する。テ
キスト入力部2は、音声として発声させるための記述文
形式テキストを入力する。このテキストの入力は、キー
ボードからの入力、OCR(Optical Character Reader)
からの入力、ディスクやメモリなどの内部記憶装置から
の入力、ネットワークを介した外部装置からの入力など
がある。
【0013】書き換え部3は、書き換え表現情報記憶部
4に記憶した書き換え表現情報テーブル(4)に記述され
た書き換え規則を適用し、言語解析部5を制御しながら
書き換えを行い、言語情報や書き換え履歴が埋め込まれ
た変換情報を出力する。書き換えは、浅い解析レベルか
ら順に、言語解析、およびその言語解析レベルに応じた
書き換えを逐次行っていく単純な手法(逐次書き換
え)、あるいは、特開平6−325079号公報に記載
のように、浅い言語解析レベルでの書き換え結果を、そ
れより深い言語解析を行う際に利用する効率的な手法
(連動書き換え)のいずれかを利用する。
【0014】書き換え表現情報テーブル(4)は、書き換
えの対象とする表現毎に、その抽出を行う言語解析レベ
ル(抽出レベル)、書き換えを実行する言語解析レベル
(書き換えレベル)、およびどのように書き換えを行う
かを指示する書き換え規則を記述したテーブルである。
ただし、逐次書き換えの場合は、抽出レベル、書き換え
レベルは同レベルに限定されるため、これらは統合され
る。言語解析部5は、表層解析、形態素解析、構文解
析、文脈解析等(後者ほど解析レベルが深い)の言語解
析のうち、書き換え部3や発声パラメータ生成部9で指
定された言語解析を行い、その言語解析結果を出力す
る。ここに入力される情報は、テキスト入力部2より入
力されたテキスト、またはそのテキスト(一部書き換え
られている場合もある)の解析実行を指定された言語解
析より解析レベルが低い階層の言語解析結果である。
【0015】言語規則記憶部6に記憶された言語規則
(6)は、言語解析部5で用いる、表層規則、形態素規
則、構文規則、文脈規則等に関する情報を保持する。単
語辞書記憶部7の単語辞書(7)は、言語解析部5の言語
解析で用いる、各単語に対する、表記、読み、アクセン
ト、意味カテゴリなどの各種情報を保持する。この単語
辞書は、一般ユーザから書き込み不可のシステム辞書
と、ユーザが自由に単語の追加、修正、削除が行えるユ
ーザ辞書、特定分野を利用する場合に組み込む分野辞書
(例えば住所解析において地名辞書を使うなど)など複
数の辞書に分ける場合もある。
【0016】ユーザインタラクション部8は、ユーザか
らの各種入力・指示やユーザへの各種出力・確認等、ユ
ーザと装置・データ間のインターフェース及びユーザか
らの各種入力・指示を実行する。発声パラメータ生成部
9は、変換情報に含まれる言語情報を利用して、読み、
アクセント、ポーズの付与を行い、変換情報に発声パラ
メータを追加する。音声生成部10は、発声パラメータ
から、合成音声を生成する。これは、内部装置として存
在するのに加え、ネットワークを介した外部装置として
複数存在することもある。
【0017】音声出力・保存部11は、音声生成部10
で生成された合成音声を拡声部に出力したり、また記憶
部に保存したりする。これは、内部装置として存在する
のに加え、ネットワークを介した外部装置、例えば電話
やカーナビ、WEBサーバとして複数存在することもあ
る。次に、口語文形式テキスト作成装置に対する実施例
の動作(記述文形式テキストから口語文形式テキストへ
の書き換え)を図2のフローチャートに基づいて説明す
る。 ステップ101:テキスト入力部2から図3(a)のような記
述文形式テキストを入力し、ステップ102に移る。 ステップ102:入力されたテキストは、書き換え部3の
制御により、必要に応じて言語解析部5の表層解析、形
態素解析、構文解析、文脈解析等の言語解析結果、およ
び書き換え表現情報テーブル(4)を用いて、書き換えの
対象を抽出し、書き換えを行う。書き換えられた最終結
果は、全書き換え終了後の言語解析結果、および、書き
換えられた部分に対する書き換え前の言語解析結果およ
び書き換えに適応されたルールを統合した変換情報とし
て出力し、ステップ103に移る。(図3(a)の記述文形式
テキストに対する、変換情報例1を図4に示す。ただ
し、図4の例では記述の簡略化のため、言語解析とし
て、表層解析、形態素解析のみを行った場合を示してい
る。図4においては、単語情報として、表記と品詞のみ
しか記述していないが、この他、読み、アクセント型、
意味カテゴリなどの単語の属性に関する情報をもつ。) ステップ103:ユーザインタラクション部8は、テキス
ト音声変換制御部1で作成された変換情報の表記をつな
げた口語文形式テキストを図3(b)、(c)または(d)(口
語文形式テキスト表示例1〜3)のように表示し、ステ
ップ104に移る。(書き換えレベル別に、書き換えられ
た個所を分けて表示する(網掛け)ことにより、正しく
書き換えられているかの確認を簡単に行えるようにな
る。図3(b)の表示形式では、はじめに表示されるのは
口語文形式テキストのみであるが、書き換えられた部分
(網掛け部)をクリックする等の操作により、書き換え
前の情報を表示させることができる。図3(c)の表示形
式では、書き換え前の情報(「30−」、「表明した」)
をあわせて表示する。ここで、複数の書き換え規則が適
応された場合には、その中間状態もあわせて表示する。
【0018】また、図3(d)では、図3(b)の表示に加
え、単語情報の詳細表示を行っている。ここでは最もシ
ンプルな表示形態として未知語のみ下線(「受諾」)で
表示しているが、例えば、体言、用言、付属語、未知語
別に色分けして表示したり、品詞名もあわせて表示する
など、様々な表示形態が考えられる。図3(b)、(c)、
(d)のいずれで表示するかはあらかじめ、ユーザが指示
を与えておく。) ステップ104:ユーザインタラクション部8は、ユーザ
の操作指示をチェックし、その指示に応じて次の各ステ
ップに進む。終了指示の場合はステップ105へ移る。表
示切り換え指示の場合はステップ106に移る。書き換え
表現情報指示の場合はステップ107へ移る。言語規則指
示の場合はステップ108へ移る。単語指示の場合はステ
ップ109へ移る。書き換え前の表現指示の場合はステッ
プ110へ移る。その他の場合はステップ111へ移る。これ
らの指示は画面上の指示ボタンやメニュー、キーボード
上であらかじめ定めた指示キー(指示入力手段)をユー
ザが選択することで行う。 ステップ105:口語文形式テキストの修正が終了したも
のとして、テキスト音声変換制御部1において、口語文
形式テキストを出力し、処理を終了する。 ステップ106:画面に口語文形式テキストのみを表示す
るか(図3(b))、書き換えられた部分に対しては書き
換え前のテキストもあわせて表示するか(図3(c))の
切り換え、単語情報の詳細表示(図3(d)、未知語「
」)をするかしないかの切り換えなど、各種表示形式
の変更を行い、ステップ103に戻る。 ステップ107:口語文形式テキストの特定の書き換えら
れた部分の選択、あるいは書き換え表現情報の書き換え
表現情報テーブル(4)の一覧表の検索により、書き換え
表現情報(4)を表示し、ユーザによる書き換え表現情報
の新規登録、修正、削除等を受け付ける。また、この作
業履歴を記憶部に保存しておき、修正等を以前の状態に
復元可能とする。その後ステップ112に移る。 ステップ108:口語文形式テキストあるいは記述文形式
テキストの特定部分の選択、あるいは言語規則(6)の一
覧表の検索により、言語規則(6)を表示し、ユーザによ
る言語規則の新規登録、修正、削除等を受け付ける。ま
た、この作業履歴を記憶部に保存しておき、修正等を以
前の状態に復元可能とする。その後ステップ112に移
る。 ステップ109:口語文形式テキストあるいは記述文形式
テキストの特定部分の選択、あるいは単語辞書の検索に
より、単語情報(単語辞書7に登録されている1単語の
情報)を表示し、ユーザによる単語の新規登録、修正、
削除等を受け付ける。また、この作業履歴を記憶部に保
存しておき、修正等を以前の状態に復元可能とする。そ
の後ステップ112に移る。 ステップ110:口語文形式テキストの選択された書き換
え部分を、書き換え前の表現に戻す、あるいは一度戻し
た表現をとりやめ、書き換え後の表現に戻すというユー
ザの指示を受け付け、記憶部に保存された交換情報を更
新する。その後ステップ103に戻る。 ステップ111:口語文形式テキストのユーザによる直接
修正が行われた場合には記憶部の交換情報を更新する。
その後ステップ103に戻る。 ステップ112:登録・修正・復元等により情報が変更さ
れたかチェックする。変更されていない場合(表示のみ
の場合)は、ステップ104に戻る。復元の場合にはステ
ップ113へ移る。登録・修正の場合はステップ113に移
る。
【0019】ステップ113:情報が変更されたレベル以
上に対する書き換えを行い、変換情報を更新する、ただ
し、ステップ110で書き換え前表現に戻された部分、お
よびステップ111で直接修正された部分は変更しない。
その後ステップ103に戻る。(以下、ステップ103の表示
として、図3(d)を用い、ステップ104で単語を選択した
場合の本実施例の動作を説明する。ここでは簡略化のた
め、言語解析として、表層解析、形態素解析のみを行う
とする。
【0020】ステップ109において、ユーザが「クリン
トン」を選択した場合、図5(a)のように、単語辞書に
登録されている内容を表示する。ここで、「読み・アク
セント」欄の網掛けはアクセントの位置を表している。
また、ユーザが未知語表示(下線)されている「受諾」
を選択した場合、図5(b)のような内容、すなわち、表
記=選択範囲、読み=1文字単位の未知語の読みをつな
げたもの、その他の情報=デフォルト値(例:アクセン
ト型=0型)を表示する。ここで、ユーザが品詞を「サ
変名詞」に変更(品詞は、メニュー等で選択できるよう
にしておく)し、登録を指示することで、単語辞書5に
図5(c)の単語情報が新規に登録される。
【0021】ステップ112に移り、登録が行われている
ので、ステップ113に移る。ステップ113では、単語登録
は、表層解析へは影響を与えないので再実行しない、形
態素解析には影響を与えるので、形態素解析を再実行す
る。この結果、「受諾」は正しく「サ変名詞」として認
定される。さらに、形態素レベルの書き換えを行い、サ
変名詞となったことで書き換えの抽出条件を満たしたル
ールが適応され変換情報を更新し、ステップ103に戻
り、図5(d)のような口語文記述テキストを表示す
る。) 次に、テキスト音声変換装置の口語文形式テキスト、発
声パラメータ生成の実施例の動作を図6のフローチャー
トに基づいて説明する。
【0022】ステップ201:テキスト入力部2から図3
(a)のような記述文形式テキストを入力し、ステップ202
に移る。 ステップ202:入力されたテキストは、書き換え部3の
制御により、必要に応じて言語解析部5の表層解析、形
態素解析、構文解析、文脈解析等の言語解析結果、およ
び書き換え表現情報テーブル(4)を用いて、書き換えの
対象を抽出し、書き換えを行う。さらに書き換え後の言
語処理結果を用いて、発声パラメータ生成部9により発
声パラメータを生成する。
【0023】全書き換え終了後の言語解析結果、および
書き換えられた部分に対する書き換え前の言語解析結果
および書き換えに適応されたルール、発声パラメータ情
報を統合して変換情報として出力し、ステップ203へ移
る。(図3(a)の記述文形式テキストに対する、変換情
報の一例を図8に示す。ただし、図8の例では記述の簡
略化のため、言語解析として、表層解析、形態素解析の
みを行った場合を示し、書き換え前の言語解析結果や書
き換えに適用されたルールは図4にも示されている通り
であるので省略している。発声パラメータは、発声の単
位であるアクセント句毎の読みとアクセント型、アクセ
ント句境界において隣接するアクセント句を結合する尺
度である音調結合型(強結合、弱結合、小ポーズ、中ポ
ーズ、大ポーズなど)などからなる。) ステップ203:ユーザインタラクション部8は、テキス
ト音声変換制御部1で作成された変換情報の表記をつな
げた口語文形式テキスト、および、発声パラメータ生成
部9で生成された発声パラメータ(直感的に分かり易く
変形する)を表示し、ステップ204に移る。(表示形態
はユーザがあらかじめ指示した様々な形態を取れる(例
えば、書き換え前の記述文形式テキストは表示しないな
ど)。
【0024】図7に表示例を示す。これは、図5(c)の
表示に加えて、発声パラメータの情報を、直感的に分か
り易い表示により加えたものである。口語文記述テキス
トの上には、読みとアクセント(「くりんとん」の
「り」のように網掛けで表示)が表示され、アクセント
句の単位でまとまって記述されている。アクセント句境
界に設定する音調結合型は、:=強結合、::=弱結合
(これら2つはポーズがない境界)、|=小ポーズ、|
|=中ポーズ、|||=大ポーズ(これら3つはポーズ
ありでその大きさが異なる)のように表示し、音調結合
型に不慣れなユーザでも理解し易い。) ステップ204:ユーザインタラクション部8は、ユーザ
の操作指示をチェックし、その指示に応じて次の各ステ
ップに進む。終了指示の場合はステップ205へ移る。発
声指示の場合はステップ206へ移る。表示切り換え指示
の場合はステップ207へ移る。書き換え表現情報指示の
場合はステップ208へ移る。言語規則指示の場合はステ
ップ209へ移る。単語指示の場合はステップ210へ移る。
書き換え前表現指示の場合はステップ211へ移る。境界
変更指示の場合はステップ212へ移る。その他の場合は
ステップ213へ移る。これらの指示は画面上の指示ボタ
ンやメニュー、キーボード上であらかじめ定めた指示キ
ー(指示入力手段)をユーザが選択することで行う。
【0025】ステップ205:口語文形式テキスト、発声
パラメータの修正が終了したものとして、テキスト音声
変換制御部1において、口語文形式テキスト、発声パラ
メータを出力し、生成処理を終了する。ステップ206:
ユーザに指定された部分を対象に、音声生成部10で合
成音声を生成し、音声出力・保存部11より合成音声を
出力する。ユーザは、全体、文単位(複数選択可)、ア
クセント句単位(複数選択可)をマウスで選択する等に
より、出力する範囲を指示することができる。また、繰
り返しや一時停止の機能をもつ。
【0026】ステップ207:画面に、書き換えられた部
分に対しては書き換え前のテキストもあわせて表示する
かの切り換え、単語情報の詳細表示を行うかの切り換
え、読み、アクセント表示を行うかの切り換え、音調結
合型表示を行うかの切り換えなど、各種表示形式の変更
を行い、ステップ203に戻る。 ステップ208:口語文形式テキストの特定の書き換えら
れた部分の選択、あるいは書き換え表現情報テーブル4
の書き換え表現情報一覧表の検索により、書き換え表現
情報4を表示し、ユーザによる書き換え表現情報の新規
登録、修正、削除等を受け付ける。また、この作業履歴
を記憶部に保存しておき、修正等を以前の状態に復元可
能とする。その後ステップ214に移る。
【0027】ステップ209:口語文形式テキストあるい
は記述文形式テキストの特定部分の選択、あるいは言語
規則(6)の一覧表の検索により、言語規則6を表示し、
ユーザによる言語規則の新規登録、修正、削除等を受け
付ける。また、この作業履歴を記憶部に保存しておき、
修正等を以前の状態に復元可能とする。その後ステップ
214に移る。 ステップ210:口語文形式テキストあるいは記述文形式
テキストの特定部分の選択、あるいは単語辞書の検索に
より、単語情報(単語辞書7に登録されている1単語の
情報)を表示し、ユーザによる単語の新規登録、修正、
削除等を受け付ける。また、この作業履歴を記憶部に保
存しておき、修正等を以前の状態に復元可能とする。そ
の後ステップ214に移る。
【0028】ステップ211:口語文形式テキストの選択
された書き換え部分を、書き換え前の表現に戻すという
ユーザの指示を受け付け、変換情報を更新する。その後
ステップ214に移る。 ステップ212:アクセント句境界の位置の変更を受け付
ける。また、この作業履歴を記憶部に保存しておき、以
前の状態に復元可能とする。その後ステップ216に移
る。
【0029】ステップ213:口語文形式テキスト、読
み、アクセント型、音調結合型のユーザによる直接修正
を受け付ける。また、この作業履歴を記憶部に保存して
おき、修正前の状態に復元可能とする。修正・復元が行
われた場合には変換情報を更新する。その後ステップ21
7に移る。 ステップ214:登録・修正・復元等により情報が変更さ
れたかチェックする。変更されていない場合(表示のみ
の場合)は、ステップ204に移る。変更されている場合
はステップ215へ移る。
【0030】ステップ215:情報が変更されたレベル以
上に対する書き換えを行い、変換情報を更新する。ただ
し、ステップ211で書き換え前表現に戻された部分、お
よびステップ213で直接修正された部分に対する変更は
行わない。その後ステップ216へ移る。 ステップ216:対象部分の発声パラメータを生成し、変
換情報を更新する。ここで、書き換えの修正が行われて
いる場合には、言語情報をもたない情報がありえるの
で、その場合には言語解析部5を利用する。その後ステ
ップ203に移る。
【0031】ステップ217:ステップ213で口語文形式テ
キストが修正されたかチェックする。修正されている場
合には、ステップ216へ移る。修正されていない場合は
ステップ204に戻る。(以下、ステップ203の表示とし
て、図7(a)を用い、ステップ204の境界変更を選択し
た場合の本実施例の動作を説明する。ここでは簡略化の
ため、言語解析として、表層解析、形態素解析のみを行
うとする。
【0032】ステップ212において、ユーザが「全面」
と「撤退させると」というアクセント句を1つのアクセ
ント句にまとめた場合を考える。この作業は例えば、境
界なし、強結合から大ポーズまでの段階的に結合を変化
させるキー(例えば矢印キーの上下)を操作することで
実現できる。2つのアクセント句をユーザが一つにまと
めた場合には、直感的に分かり易いように、アクセント
句境界の記号(ここでは「:」)を取り除いて表示す
る。
【0033】次にステップ216に移り、「全面撤退させ
ると」を強制的に1アクセント句として発声パラメータ
生成部9でアクセント型を自動設定する。ここで、付属
語(用言活用語尾も含む)には、副次アクセントという
特徴をもつ語が存在し、この例の「と」が該当する
(「と」の直前にアクセントが必ずくる)。はじめに設
定されたアクセント句での自立語「撤退」は、アクセン
トがないため「てったいする’と」(’=アクセント位
置)と1アクセント句で自然なアクセントとなる。しか
し、ユーザの指示によりまとめられた「全面撤退」とい
う自立語のアクセントは「ぜんめんて’ったい」と5型
のアクセントをもち、「と」の直前にアクセントをおく
ことができない(1つのアクセント句には最大1つのア
クセントしか存在しえない)ので「ぜんめんて’ったい
/させる’と」のように自動的に2アクセント句に分割
し、変換情報を更新する。
【0034】そしてステップ203に戻り、図7(b)のよ
うな口語文記述テキストを表示する。) 次に、音声生成部10、音声出力・保存部11を外部装
置としてもつ場合の具体例を示す。図6に示したフロー
の処理が終了すると、発声パラメータという情報量の少
ないデータの配信により、聞き易く正確な合成音声を生
成することが可能となる。
【0035】例えば、電話による音声情報提供では、通
常、ユーザが電話アクセスする回線制御サーバを設置す
る。この回線制御サーバに、音声生成部10、音声出力
・保存部11を回線制御サーバに組み込み、テキスト音
声変換制御部1が発声パラメータを回線制御サーバに配
信することで、電話を用いた音声情報提供サービスが実
現できる。また、この回線制御サーバをカーナビ制御サ
ーバに置き換えると、カーナビを用いた音声情報提供サ
ービスが実現できる。
【0036】また、WWWサーバに、音声生成部10、音
声出力・保存部11を組み込むことで、WWWの音声情報
提供が実現できる。
【0037】
【発明の効果】以上説明したように、本発明によれば、
記述文形式テキストを入力し、書き換え表現情報を用い
て変換情報を生成する書き換え処理を言語規則と単語辞
書を用いて、表層解析、形態素解析、構文解析、文脈解
析等を行う言語解析を制御しながら行い、その結果をユ
ーザへ分かり易く表示し、ユーザからの修正等の指示を
受け、前記書き換え部による自動作成された口語文形式
テキストの修正、前記書き換え部および言語解析部のメ
ンテナンスの支援を行うことにより効率的に口語文記述
テキストを生成することができる。
【0038】また、記述文形式テキストを入力し、書き
換え表現情報を用いて変換情報を生成する書き換え処理
を、言語規則と単語辞書を用いて表層解析、形態素解
析、構文解析、文脈解析等を行う言語解析を制御しなが
ら行い変換情報から得られる口語文形式テキストに対し
て発声パラメータ生成を行い、これらの結果をユーザへ
分かり易く表示、音声出力し、ユーザからの修正等の指
示を受け、前記書き換え部による自動作成された口語文
形式テキストの修正、前記書き換え部および言語解析部
のメンテナンスの支援を行うことにより、効率的に正し
い合成音声を生成することができ、また、外部装置での
合成音声の生成、音声出力・保存を行うことにより、音
声情報提供サービスの効率的な運営が可能となる。
【図面の簡単な説明】
【図1】本発明の口語文形式テキスト作成装置およびテ
キスト音声変換装置の概要構成を示す図。
【図2】口語文形式テキスト作成処理のフローの一例を
示す図。
【図3】記述文形式テキスト/口語文形式テキスト例を
示す図。
【図4】変換情報例1を示す図。
【図5】口語文形式テキスト作成の動作例を示す図。
【図6】テキスト音声変換における口語文形式テキスト
・発声パラメータ生成処理のためのフローの一例を示す
図。
【図7】口語文形式テキスト/発声パラメータ表示例を
示す図。
【図8】変換情報例2を示す図。
【符号の説明】
1 変換制御部 2 テキスト入力部 3 書き換え部 4 書き換え表現情報記憶部 5 言語解析部 6 言語規則記憶部 7 単語辞書記憶部 8 ユーザインタラクション部 9 発声パラメータ生成部 10 音声生成部 11 音声出力・保存部

Claims (14)

    【特許請求の範囲】
  1. 【請求項1】記述文形式テキストから口語文形式テキス
    トを作成する口語文形式テキスト作成装置において、 処理対象の記述文形式テキストを入力するテキスト入力
    部と、 記述文形式テキストから書き換え対象表現を抽出し、書
    き換え表現情報記憶部に記憶された書き換え表現情報を
    適用し、書き換え前後の言語解析結果と適用された書き
    換え規則からなる変換情報を生成する書き換え部と、 記述文形式テキストを言語規則記憶部に記憶された言語
    規則と単語辞書記憶部に記憶された単語辞書を適用し、
    表層解析、形態素解析、構文解析、文脈解析のすべて、
    あるいは一部を行い言語解析結果を生成する言語解析部
    と、 これらの制御を行い記述文形式テキストと変換情報と言
    語処理結果から口語文形式テキストを作成する変換制御
    部と、 記憶部に保存された記述文形式テキスト、書き換えが行
    われた部分を明示した口語文形式テキスト、書き換え表
    現情報、変換情報、言語規則、単語辞書情報、言語解析
    結果を表示器に表示する第1の表示制御手段と、これら
    各情報に対する表示の有無、検索、登録、修正、復元を
    指示する第1の指示入力手段と、第1の指示入力手段の
    指示を実行し、これら各情報を更新する第1の指示実行
    手段を有するユーザインタラクション部と、 前記変換制御部は、ユーザインタラクション部で更新さ
    れた各情報に基づいて最終的な口語文形式テキストを出
    力し、 口語文形式テキストの修正、書き換え部及び言語解析部
    のメンテナンスのユーザ支援を行うことを特徴とする口
    語文形式テキスト作成装置。
  2. 【請求項2】請求項1に記載の口語文形式テキスト作成
    装置において、 前記ユーザインタラクション部は、記述文形式テキスト
    や口語文形式テキストの特定部分、あるいは条件検索に
    より探しだされた部分に対する言語規則、単語辞書情
    報、言語解析結果、書き換え表現情報、変換情報を表示
    器に表示する第2の表示制御手段と、これら各情報に対
    する表示の有無、条件検索、登録、修正、復元を指示す
    る第2の指示入力手段と、第2の指示入力手段の指示を
    実行し、これら各情報を更新する第2の指示実行手段と
    を有することを特徴とする口語文形式テキスト作成装
    置。
  3. 【請求項3】請求項1又は2に記載の口語文形式テキス
    ト作成装置において、 前記ユーザインタラクション部は、表示器に口語文形式
    テキストの書き換えが行われた部分を異なる表示とする
    ことにより区別し、また、単語辞書を含む詳細情報も合
    わせて表示するか否かの選択手段を有し、選択手段によ
    り表示器に単語辞書を含む詳細情報を表示する表示制御
    手段を備えたことを特徴とする口語文形式テキスト作成
    装置。
  4. 【請求項4】請求項1乃至3のいずれか1項に記載の口
    語文形式テキスト作成装置において、 前記ユーザインタラクション部は、口語文形式テキスト
    の書き換えが行われた部分の書き換え表現情報、あるい
    は条件検索により探しだされた書き換え情報の表示、登
    録、修正、復元を指示する第3の指示入力手段と、第3
    の指示入力手段の指示を実行し、これら各情報を更新す
    る第3の指示実行手段とを有し、更新された各情報を書
    き換えに反映することを特徴とする口語文形式テキスト
    作成装置。
  5. 【請求項5】請求項1乃至4のいずれか1項に記載の口
    語文形式テキスト作成装置において、 前記ユーザインタラクション部は、口語文形式テキスト
    の任意部分の言語規則または単語辞書情報、あるいは条
    件検索により探しだされた言語規則または単語辞書情報
    の表示、登録、修正、復元を指示する第4の指示入力手
    段と、第4の指示入力手段の指示を実行し、これら各情
    報を更新する第4の指示実行手段とを有し、更新された
    各情報を書き換えに反映することを特徴とする口語文形
    式テキスト作成装置。
  6. 【請求項6】請求項1乃至5のいずれか1項に記載の口
    語文形式テキスト作成装置において、 前記ユーザインタラクション部は、口語文形式テキスト
    の書き換えが行われた部分を書き換え前の表現に戻す、
    あるいはそれを取りやめることを指示する第5の指示入
    力手段と、第5の指示入力手段の指示を実行し、これら
    各情報を更新する第5の指示実行手段とを有し、更新さ
    れた各情報を書き換えに反映することを特徴とする口語
    文形式テキスト作成装置。
  7. 【請求項7】記述文形式テキストから口語文形式テキス
    トを作成し、口語文形式テキストに対する合成音声を保
    存・出力するテキスト音声変換装置において、 処理対象の記述文形式テキストを入力するテキスト入力
    部と、 記述文形式テキストから書き換え対象表現を抽出し、書
    き換え表現情報記憶部に記憶された書き換え表現情報を
    適用し、書き換え前後の言語解析結果と適用された書き
    換え規則からなる変換情報を生成する書き換え部と、 記述文形式テキストを言語規則記憶部に記憶された言語
    規則と単語辞書記憶部に記憶された単語辞書を適用し、
    表層解析、形態素解析、構文解析、文脈解析のすべて、
    あるいは一部を行い言語解析結果を生成する言語解析部
    と、 これらの制御を行い記述文形式テキストと変換情報と言
    語解析結果から口語文形式テキストを作成する変換制御
    部と、 書き換え後の言語解析結果を用いて発声パラメータを生
    成する発声パラメータ生成部と、 記憶部に保存された記述文形式テキスト、書き換えが行
    われた部分を明示した口語文形式テキスト、書き換え表
    現情報、変換情報、言語規則、単語辞書情報、言語解析
    結果、発声パラメータを表示器に表示する第3の表示制
    御手段と、これら各情報に対する表示の有無、条件検
    索、登録、修正、復元を指示する第6の指示入力手段
    と、第6の指示入力手段の指示を実行し、これら各情報
    を更新する第6の指示実行手段を有するユーザインタラ
    クション部と前記発声パラメータ生成部は、更新された
    各情報に基づき変換制御部で作成された口語文形式テキ
    ストから発声パラメータを生成し、 発声パラメータから合成音声の生成を行う音声生成部
    と、 合成音声の出力と保存を行う音声出力・保存部と、 書き換え部で自動作成された口語文形式テキストの修
    正、発声パラメータ生成部により自動生成された発声パ
    ラメータの修正、書き換え部及び言語解析部のメンテナ
    ンスのユーザ支援を行うことを特徴とするテキスト音声
    変換装置。
  8. 【請求項8】請求項7に記載のテキスト音声変換装置に
    おいて、 前記 ユーザインタラクション部は、記述文形式テキス
    トと書き換えが行われた部分を明示した口語文形式テキ
    ストの表示、口語文形式テキストと対応させて発声パラ
    メータを表示する第4の表示制御手段を有し、口語文形
    式テキストや記述文形式テキストの特定部分、あるいは
    条件検索により探しだされた部分に対する言語規則、単
    語辞書情報、言語解析結果、書き換え表現情報、変換情
    報を表示する表示制御手段を有し、これら各情報に対す
    る表示有無、条件検索、登録、修正、復元や、口語文形
    式の特定領域の音声出力の指示を行う第8の指示入力手
    段と、第8の指示入力手段の指示を実行し、各情報を更
    新する第8の指示実行手段を備えたことを特徴とするテ
    キスト音声変換装置。
  9. 【請求項9】請求項7又は8に記載のテキスト音声変換
    装置において、 前記ユーザインタラクション部は、表示器に口語文形式
    テキストの書き換えが行われた部分を異なる表示とする
    ことにより区別し、また、単語辞書を含む詳細情報も合
    わせて表示するか否かの選択手段を有し、選択手段によ
    り表示器に単語辞書を含む詳細情報を表示する第5の表
    示制御手段を備えたことを特徴とするテキスト音声変換
    装置。
  10. 【請求項10】請求項7乃至9のいずれか1項に記載のテ
    キスト音声変換装置において、 前記ユーザインタラクション部は、口語文形式の書き換
    えが行われた部分の書き換え表現情報、あるいは条件検
    索により探しだされた書き換え情報の表示、登録、修
    正、復元を指示する第9の指示入力手段と、第9の指示
    入力手段の指示を実行し、これら各情報を更新する第9
    の指示実行手段とを有し、更新された各情報を発声パラ
    メータ生成に反映することを特徴とするテキスト音声変
    換装置。
  11. 【請求項11】請求項7乃至10のいずれか1項に記載のテ
    キスト音声変換装置において、 前記ユーザインタラクション部は、口語文形式テキスト
    の任意部分の言語規則または単語辞書情報、あるいは条
    件検索により探しだされた言語規則または単語辞書情報
    の表示、登録、修正、復元を指示する第10の指示入力手
    段と、第10の指示入力手段の指示を実行し、これら各情
    報を更新する第10の指示実行手段とを有し、更新された
    各情報を発声パラメータ生成に反映することを特徴とす
    るテキスト音声変換装置。
  12. 【請求項12】請求項7乃至11のいずれか1項に記載のテ
    キスト音声変換装置において、 前記ユーザインタラクション部は、書き換えが行われた
    部分を書き換え前の表現に戻す、あるいはそれを取りや
    めることを指示する第11の指示入力手段と、第11の指示
    入力手段の指示を実行し、これら各情報を更新する第11
    の指示実行手段とを有し、更新された各情報を発声パラ
    メータ生成に反映することを特徴とするテキスト音声変
    換装置。
  13. 【請求項13】請求項7乃至12のいずれか1項に記載のテ
    キスト音声変換装置において、 前記ユーザインタラクション部は、口語文形式テキスト
    の任意の部分の音声出力をユーザが指示できる指示手段
    を備え、指示手段の指示により音声出力・保存部から音
    声を出力する手段を備えたことを特徴とするテキスト音
    声変換装置。
  14. 【請求項14】請求項7乃至13のいずれか1項に記載のテ
    キスト音声変換装置において、 前記ユーザインタラクション部は、口語文形式テキスト
    の任意の部分のアクセント句境界を行い、自動的にアク
    セント型の変更や他に必要と成った句境界の挿入を行う
    アクセント句境界、アクセント型変更、アクセント句境
    界挿入手段を備えたことを特徴とするテキスト音声変換
    装置。
JP2000203152A 2000-07-05 2000-07-05 口語文形式テキスト作成装置及びテキスト音声変換装置 Pending JP2002023786A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2000203152A JP2002023786A (ja) 2000-07-05 2000-07-05 口語文形式テキスト作成装置及びテキスト音声変換装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2000203152A JP2002023786A (ja) 2000-07-05 2000-07-05 口語文形式テキスト作成装置及びテキスト音声変換装置

Publications (1)

Publication Number Publication Date
JP2002023786A true JP2002023786A (ja) 2002-01-25

Family

ID=18700590

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2000203152A Pending JP2002023786A (ja) 2000-07-05 2000-07-05 口語文形式テキスト作成装置及びテキスト音声変換装置

Country Status (1)

Country Link
JP (1) JP2002023786A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100967555B1 (ko) * 2009-06-25 2010-07-05 김지훈 영어교육을 위한 이-러닝 방법 및 시스템

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100967555B1 (ko) * 2009-06-25 2010-07-05 김지훈 영어교육을 위한 이-러닝 방법 및 시스템

Similar Documents

Publication Publication Date Title
KR100378898B1 (ko) 발음 설정 방법, 컴퓨터 판독가능 매체를 포함하는 제조 물품 및, 그래픽 사용자 인터페이스 시스템
US8572209B2 (en) Methods and systems for authoring of mixed-initiative multi-modal interactions and related browsing mechanisms
US7904291B2 (en) Communication support apparatus and computer program product for supporting communication by performing translation between languages
KR100661687B1 (ko) 대화형 음성 응답 애플리케이션 구현 장치 및 방법, 머신 판독가능 매체 및 대화형 음성 응답 시스템
US20030074196A1 (en) Text-to-speech conversion system
JP6336749B2 (ja) 音声合成システム及び音声合成方法
JPH1125098A (ja) 情報処理装置、リンク先ファイルの取得方法および記憶媒体
JP2008268477A (ja) 韻律調整可能な音声合成装置
WO2011033834A1 (ja) 音声翻訳システム、音声翻訳方法および記録媒体
JP2008243080A (ja) 音声を翻訳する装置、方法およびプログラム
JP2010169973A (ja) 外国語学習支援システム、及びプログラム
JP3059398B2 (ja) 自動通訳装置
JP3589972B2 (ja) 音声合成装置
JP2008146019A (ja) 音声合成用辞書作成システム、半導体集積回路装置及び半導体集積回路装置の製造方法
JP2002023786A (ja) 口語文形式テキスト作成装置及びテキスト音声変換装置
JP6197523B2 (ja) 音声合成装置、言語辞書修正方法及び言語辞書修正用コンピュータプログラム
JP2003162524A (ja) 言語処理装置
Gros et al. SI-PRON pronunciation lexicon: a new language resource for Slovenian
JP6340839B2 (ja) 音声合成装置、合成音声編集方法及び合成音声編集用コンピュータプログラム
JPH08190562A (ja) 機械翻訳装置
JP3414326B2 (ja) 音声合成用辞書登録装置及び方法
JP5370138B2 (ja) 入力補助装置、入力補助プログラム、音声合成装置及び音声合成プログラム
JPH08221095A (ja) 文章読み上げ方法
JP3280729B2 (ja) 発音記号作成装置
JP2004287193A (ja) データ作成装置、データ作成プログラム、及び車載装置