JPH08194494A - 文解析方法および装置 - Google Patents

文解析方法および装置

Info

Publication number
JPH08194494A
JPH08194494A JP7004023A JP402395A JPH08194494A JP H08194494 A JPH08194494 A JP H08194494A JP 7004023 A JP7004023 A JP 7004023A JP 402395 A JP402395 A JP 402395A JP H08194494 A JPH08194494 A JP H08194494A
Authority
JP
Japan
Prior art keywords
analysis
sentence
solution
result
analysis result
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP7004023A
Other languages
English (en)
Inventor
Yasuo Okuya
泰夫 奥谷
Toshiaki Fukada
俊明 深田
Yasunori Ohora
恭則 大洞
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Inc
Original Assignee
Canon Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Inc filed Critical Canon Inc
Priority to JP7004023A priority Critical patent/JPH08194494A/ja
Publication of JPH08194494A publication Critical patent/JPH08194494A/ja
Pending legal-status Critical Current

Links

Abstract

(57)【要約】 【目的】 複数の文解析結果のうちユーザが所望する文
解析結果を選択でき、また、ユーザが容易に文解析結果
のデータを編集することができる文解析方法および装置
を提供することを目的とする。 【構成】 入力された文データをステップS202で形
態素を単位ブロックとしたフレーム構造で解析し、その
解析結果が複数であればステップS204で複数の解を
表示し、その中からステップS205で設定した探索条
件に合致するものをステップS206で探索し、該探索
された解のうちユーザが所望する解をステップS207
で選択し、ステップS208で該選択さた解を形態素単
位で編集する。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は文解析方法及び装置に関
し、例えば、音声合成のための文解析方法及び装置に関
する。
【0002】
【従来の技術】一般に、音声合成のための文解析方法及
び装置においては、まず入力文の文解析(形態素解析、
係り受け解析等)を行い、その結果として複数の解の候
補が得られたとしても、その中から尤度などを利用して
一つの解に確定し、その解から音声合成のための表音テ
キストを作成し出力していた。ここで表音テキストと
は、音素情報、アクセント情報、制御情報等の音響情報
をプレーンテキストの形で表したものである。ユーザ
は、表音テキストに記載されている音響情報に修正を加
えることによって、好みの合成音声を生成していた。
【0003】
【発明が解決しようとする課題】しかしながら上記従来
の方法による音声合成では、ユーザが修正可能な情報は
文解析情報ではなく、例えば音素情報,アクセント情
報,制御情報等の音響情報に限られていた。従って、例
えば形態素解析における単語の切り出しの間違い等、文
解析が正しくなかった場合には対処することができない
という欠点があった。
【0004】また、ユーザ自身で文解析結果のデータを
修正したい場合でも、それには多大な労力と特殊な知識
を要するため、一般にユーザにとって文解析結果のデー
タを修正することは非常に困難であった。
【0005】本発明は上述した従来の欠点を解決するた
めになされたものであり、複数の文解析結果のうちユー
ザが所望する文解析結果を選択でき、また、ユーザが容
易に文解析結果のデータを編集することができる文解析
方法および装置を提供することを目的とする。
【0006】
【課題を解決するための手段】上述した目的を達成する
ための一手段として、本発明の文解析方法および装置は
以下の構成を備える。
【0007】即ち、語を示す文字列データを最小論理単
位に分割して解析する解析手段と、前記解析手段による
解析結果を保持する解析結果保持手段と、前記解析手段
による解析結果から所望する解析結果を選択する選択手
段と、前記選択手段により選択された解析結果から得ら
れる情報を編集する編集手段とを有することを特徴とす
る。
【0008】例えば、前記編集工程で編集される情報
は、品詞情報及びアクセント情報を含むことを特徴とす
る。
【0009】例えば、前記編集手段は、前記情報を前記
最小論理単位で編集することを特徴とする。
【0010】更に、前記解析手段による解析結果を表示
する表示手段を有し、前記選択手段は前記表示手段に表
示された解析結果より所望する解析結果を選択すること
を特徴とする。
【0011】例えば、前記最小論理単位は形態素単位で
あることを特徴とする。
【0012】例えば、前記選択手段は、前記解析手段に
よる解析結果を選択するための選択条件を設定する設定
手段と、前記選択条件に従って前記解析手段による解析
結果を選択する条件選択手段と、前記条件選択手段によ
り選択された解析結果から所望する1つの解析結果を選
択する最終選択手段とを有することを特徴とする。
【0013】例えば、前記編集手段は、前記解析結果が
音声合成用のデータとなるように編集することを特徴と
する。
【0014】
【作用】以上の構成により、語を示す文字列データの最
小論理単位での解析結果を複数保持し、該複数の解析結
果から操作者の所望する1つを選択し、該選択された解
析結果を最小論理単位で編集することができる。
【0015】従って、音声合成において従来容易に行え
なかった形態素の区切りの変更や、係り先の変更等、文
解析情報の修正が操作者の所望するように容易に行うこ
とができるという特有の作用効果が得られる。
【0016】
【実施例】以下、本発明に係る一実施例について、図面
を参照して詳細に説明する。
【0017】<第1実施例>図1は、本実施例の文解析
装置の概要構成を示すブロック図である。図1において
601はROM等によって構成される制御メモリであ
り、後述する図4のフローチャートに示す制御手順に従
った制御プログラムを記憶する。602は制御メモリ6
01に保持されている制御手順に従って判断・演算を行
う中央処理装置である。603はRAM等によって構成
されるメモリであり、本実施例における作業領域用メモ
リとして使用される。604はディスク装置であり、本
実施例における文解析辞書を有している。尚、605は
上述した各構成を接続するバスである。
【0018】次に、図2のブロック図に上述した本実施
例の文解析装置の詳細構成を示す。図2において、10
0は文データを入力する入力部、101は入力された文
データを保持する入力文保持部、102は形態素解析、
係り受け解析等の文解析を行い、複数の解の存在をも受
理しうる文解析処理部、103は文解析結果を保持する
文解析結果保持部、104は表示部、105は文解析結
果保持部103から渡される複数解をフレーム構造等、
ユーザに分かりやすい形式で表示部104に表示する解
表示部、106は複数解から所望の解を探索する解探索
部、107は探索結果を保持する探索解保持部、108
は探索結果から所望の解を選択する解選択部、109は
選択した解を保持する選択解保持部、110は選択した
解のデータを編集するデータ編集部、111は編集した
データを保持する編集結果保持部、112は文解析で用
いる文解析辞書,113は複数解の中から所望の解を得
るための探索条件を設定する探索条件設定部、114は
設定した探索条件を保持する探索条件保持部である。
【0019】尚、入力文保持部101、文解析処理部1
02、文解析結果保持部103、解表示部105、解探
索部106、探索解保持部107、解選択部108、選
択解保持部109、データ編集部110、編集結果保持
部111、探索条件設定部113、探索条件保持部11
4は、上述した図1に示すメモリ603内に備わってい
る。
【0020】次に、図3のフローチャートを参照して、
本実施例における文解析処理について説明する。
【0021】まず、ステップS201では、入力装置1
00に文データの入力があるか否かの判定を行い、入力
がない限りステップS201を繰り返す。文データの入
力があれば、該文データを入力文保持部101に保持し
て、ステップS202に進む。以下、入力された文デー
タを「入力文」と称する。ステップS202では、入力
文に対し文解析処理部102で文解析辞書112を参照
して文解析を行う。本実施例では、文解析の例として形
態素解析を行うとする。本実施例においては文解析の結
果複数解が存在しても、そのうちの一つの結果を解析結
果として絞り込むことをせず、複数の結果を文解析結果
保持部103に保持してステップS203に進む。
【0022】ここで、入力文が「くるまでまつ。」とい
う文データであった場合の形態素解析結果の例を図4に
示す。図4では、「解1」として「来るまで待つ。」を
意味する解を、「解2」として「車で待つ。」を意味す
る解を、「解3」として「車で松」を意味する解を解析
結果として得たことを示す。
【0023】ステップS203においては、文解析結果
の解の個数を判別する。解が一つだけである場合はステ
ップS208に進むが、解が複数個ある場合にはステッ
プS204に進む。ステップS204では、解表示部1
05において文解析結果保持部103に保持しているす
べての複数解(図4に示す「解1」〜「解3」)を表示
部104に表示する。
【0024】ここで、表示部104における表示例を図
5に示す。図4に示した複数の解析結果を表示部104
に表示する場合には、各解を形態素を単位ブロックとし
たフレーム構造で表現する。形態素単位の各フレーム
は、それぞれの「形態素」,「読み」,「アクセン
ト」,「品詞」,「活用形」,「テーブル番号」,「見
出し」等の情報を伴って表示される。ここで、各フレー
ムにおける「アクセント」とは、各形態素のアクセント
型を示す情報であり、「テーブル番号」とは各解におけ
る該形態素の出現番号を示す情報である。
【0025】尚、ここでアクセントとは、個々の単語に
ついて決まっている強弱また高低の配置のことであり、
日本語の場合、高い位置から低い位置にピッチ周波数が
変化するところをアクセント核と呼び、そのアクセント
核のあるモーラまでのモーラ数をアクセント型と称す
る。このアクセント型をもって、アクセント情報として
扱うのが一般的である。
【0026】尚、表示部104における表示方法は、図
5に示す例に限定されるものではなく、ユーザの使用目
的に応じて適宜設定すればよい。
【0027】続いてステップS205に進み、表示部1
04に表示した解の中からユーザが所望の解を探索する
ための探索条件が、探索条件保持部114に設定されて
いるか否かの判定を行う。ステップS205における探
索条件設定判定処理について、図6を参照して詳細に説
明する。探索条件の設定は探索条件設定部113により
ユーザが行うが、図6に、探索条件設定部113の具体
例である探索条件入力パネルを示す。図6の探索条件入
力パネルは、「見出し」,「読み」,「アクセント」,
「品詞」等の探索条件入力部を備え、各入力部にユーザ
が探索条件を入力することにより、探索条件が設定さ
れ、探索条件保持部114に保持される。尚、探索条件
設定部113による設定は、例えば表示部104に表示
されることにより、ユーザが確認できることが望まし
い。本実施例においては、ステップS202における形
態素解析の結果、図4に示す3つの解が得られており、
この中からユーザが形態素「車」が存在する解を探索し
たい場合には、図6の探索条件入力パネルの「見出し」
入力部に「車」と入力する。これにより、探索条件保持
部114には形態素「くるま」が保持される。尚、図6
の探索条件入力パネルには、必要最低限の条件を入力す
るだけで良い。ステップS205において探索条件が設
定されていなければ、設定されるまでステップS205
を繰り返す。そして、探索条件が設定されるとステップ
S206に進む。
【0028】ステップS206では、解探索部106に
おいて文書解析結果保持部103に保持されている複数
解の中から探索条件保持部114に設定されている探索
条件に適合する解の探索を行い、その結果探索された解
を探索解保持部107に格納すると同時に、表示部10
4に表示する。即ち、形態素「くるま」の存在する解を
探索し、その結果「解2」及び「解3」が探索され、表
示される。そして解の探索が終了すると、探索条件保持
部114をクリアしてステップS207に進む。
【0029】ステップS207では、表示部104に表
示された探索解を参照して、ユーザが解選択部108を
介して所望する解を1つ選択し、ステップS208に進
む。例えば、「解2」が選択されたとする。尚、選択さ
れた解は選択解保持部109に保持される。ここで、ユ
ーザが所望する解が無い場合、処理はステップS205
に戻り、探索条件を再設定して再度探索を行う。
【0030】ステップS208では、選択解保持部10
9に保持された文解析結果に対して、データ編集部によ
り該解析結果におけるフレーム単位でのデータ編集を行
う。ステップS208におけるデータ編集は、例えば
「解2」のデータを表示部104に表示し、データ編集
部110を介してユーザにより編集が行われる。編集し
たデータは編集結果保持部111に保持され、本実施例
における文解析処理を終了する。
【0031】尚、図3のフローチャートでは、ステップ
S203において解が1つしかなければそのままステッ
プS208の編集処理を行うとして説明したが、この様
な場合でもステップS204以降の処理を行っても、も
ちろんかまわない。
【0032】以上説明したように本実施例によれば、複
数の文解析結果からユーザが所望する1つの解を選択す
ることができる。更に、該選択された解が形態素単位の
フレーム構造からなっているため、ユーザが容易に編集
することができる。従って、より柔軟な音声合成のため
の表音テキストの作成が可能となる。
【0033】<その他の実施例>上記実施例において
は、文解析の例として形態素解析を行う場合について説
明したが、本発明はこれに限定されるものでなく係り受
け関係解析、意味解析、文脈解析等の文解析を行っても
良い。また、形態素解析をその他の文解析と組み合わせ
る等、複数の文解析を実行し、それらすべての解の組み
合わせを文解析処理部102の解として出力してもよ
い。
【0034】また、上記実施例では解の表示方法の例と
して、フレーム構造による表示について説明したが、も
ちろんこの例に限定されるものでなく、表形式での表現
や文解析データの羅列等、文解析データを表現しうる形
式であれば、どのような形式で表示を行っても良い。ま
た、複数解の表示例として、すべての解を単純に並べて
表示する場合について説明したが、文解析時に各解に文
節数や最長一致文字数(モーラ数)等から求まる尤度情
報を与えておき、尤度の高い(あるいは低い)順に表示
しても良いし、文解析に尤度情報を与えておき、尤度の
高い順に数個を表示するようにしても良い。
【0035】また、複数解の表示内容を「形態素」,
「読み」,「アクセント」,「品詞」,「活用形」,
「テーブル番号」,「見だし」等の文解析情報を例に説
明したが、音声合成に利用可能な情報をすべてに関して
任意に表示してもよい。例えば、「感情」,「男女
別」,「話者」,「発話スピード」等の情報を表示内容
にしても良い。
【0036】また、上記実施例では、文解析結果を「形
態素」を単位ブロックとしたフレーム構造として表現す
る場合について説明したが、本発明はこれに限定される
ものでなく、「音素」,「モーラ」,「アクセント
句」,「文節」,「ポーズ句」等を単位ブロックとして
も、上記実施例と同様の効果が得られる。
【0037】また、上記実施例では探索条件の設定例と
して、文解析結果に基づく場合について説明したが、例
えば音声合成時にある場所にポーズを置くことが可能な
解が探索できるように、マウス、ポインティングカーソ
ル等の位置指定可能な入力装置から、ポーズ位置を設定
できるような探索条件設定を行ってもよい。
【0038】また、上記実施例では文解析の結果を利用
してユーザが編集対象となる解の選択を行うことを前提
とした場合について説明したが、これに限定されるもの
でなく、ユーザ自身がブロックを作成して、図6と同様
なフレーム構造を作成してもよい。
【0039】また、上記実施例では、設定された探索条
件により探索された解から、編集対象となる解をユーザ
が選択する例について説明したが、本発明はこれに限定
されるものでなく、必ずしも探索された解でなく、探索
にもれた解でも選択可能なようにしても良い。
【0040】尚、本発明は、複数の機器から構成される
システムに適用しても1つの機器から成る装置に適用し
ても良い。また、本発明は、システム或は装置にプログ
ラムを供給することによって達成される場合にも適用で
きることはいうまでもない。
【発明の効果】以上説明したように本発明によれば、複
数の文解析結果を表示し、ユーザが編集対象としての条
件を満たした所望の解を選択することができる。この解
は形態素を単位としたフレーム構造からなるため、従来
容易に行えなかった形態素の区切りの変更や係り先の変
更等の文解析情報の修正も簡単に行うことができる。従
って、合成音声のための表音テキストを容易に編集する
ことができるという効果が得られる。
【0041】
【図面の簡単な説明】
【図1】本発明に係る一実施例における文解析装置の概
要構成を示すブロック図である。
【図2】本実施例における文解析装置の詳細構成を示す
ブロック図である。
【図3】本実施例における文解析処理を示すフローチャ
ートである。
【図4】本実施例における文解析結果例を示す図であ
る。
【図5】本実施例における複数の解析結果の表示例を示
す図である。
【図6】本実施例における探索条件の設定例を示す図で
ある。
【符号の説明】
100 入力装置 101 入力文保持部 102 文解析処理部 103 文解析結果保持部 104 表示部 105 解表示部 106 解探索部 107 探索解保持部 108 解選択部 109 選択解保持部 110 データ編集部 111 編集結果保持部 112 言語解析辞書 113 探索条件設定部 114 探索条件保持部 601 制御メモリ 602 中央処理装置 603 メモリ 604 ディスク装置 605 バス

Claims (14)

    【特許請求の範囲】
  1. 【請求項1】 語を示す文字列データを最小論理単位に
    分割して解析する解析工程と、 前記解析工程による解析結果から所望する解析結果を選
    択する選択工程と、 前記選択工程により選択された解析結果から得られる情
    報を編集する編集工程とを有することを特徴とする文解
    析方法。
  2. 【請求項2】 前記編集工程で編集される情報は、品詞
    情報及びアクセント情報を含むことを特徴とする請求項
    1記載の文解析方法。
  3. 【請求項3】 前記編集工程は、前記情報を前記最小論
    理単位で編集することを特徴とする請求項2記載の文解
    析方法。
  4. 【請求項4】 前記解析工程による解析結果を表示する
    表示工程を更に有し、 前記選択工程は、前記表示工程において表示された解析
    結果より所望する解析結果を選択することを特徴とする
    請求項1記載の文解析方法。
  5. 【請求項5】 前記最小論理単位は形態素単位であるこ
    とを特徴とする請求項1記載の文解析方法。
  6. 【請求項6】 前記選択工程は、前記解析工程による解
    析結果を選択するための選択条件を設定する設定工程
    と、 前記選択条件に従って前記解析工程による解析結果を選
    択する条件選択工程と、 前記条件選択工程により選択された解析結果から操作者
    が所望する1つの解析結果を選択する最終選択工程とを
    有することを特徴とする請求項1記載の文解析方法。
  7. 【請求項7】 前記編集工程は、前記解析結果が音声合
    成用のデータとなるように編集することを特徴とする請
    求項1記載の文解析方法。
  8. 【請求項8】 語を示す文字列データを最小論理単位に
    分割して解析する解析手段と、 前記解析手段による解析結果を保持する解析結果保持手
    段と、 前記解析手段による解析結果から所望する解析結果を選
    択する選択手段と、 前記選択手段により選択された解析結果から得られる情
    報を編集する編集手段とを有することを特徴とする文解
    析装置。
  9. 【請求項9】 前記編集工程で編集される情報は、品詞
    情報及びアクセント情報を含むことを特徴とする請求項
    8記載の文解析装置。
  10. 【請求項10】 前記編集手段は、前記情報を前記最小
    論理単位で編集することを特徴とする請求項9記載の文
    解析装置。
  11. 【請求項11】 前記解析手段による解析結果を表示す
    る表示手段を更に有し、 前記選択手段は前記表示手段に表示された解析結果より
    所望する解析結果を選択することを特徴とする請求項8
    記載の文解析装置。
  12. 【請求項12】 前記最小論理単位は形態素単位である
    ことを特徴とする請求項8記載の文解析装置。
  13. 【請求項13】 前記選択手段は、前記解析手段による
    解析結果を選択するための選択条件を設定する設定手段
    と、 前記選択条件に従って前記解析手段による解析結果を選
    択する条件選択手段と、 前記条件選択手段により選択された解析結果から所望す
    る1つの解析結果を選択する最終選択手段とを有するこ
    とを特徴とする請求項8記載の文解析装置。
  14. 【請求項14】 前記編集手段は、前記解析結果が音声
    合成用のデータとなるように編集することを特徴とする
    請求項8記載の文解析装置。
JP7004023A 1995-01-13 1995-01-13 文解析方法および装置 Pending JPH08194494A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP7004023A JPH08194494A (ja) 1995-01-13 1995-01-13 文解析方法および装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP7004023A JPH08194494A (ja) 1995-01-13 1995-01-13 文解析方法および装置

Publications (1)

Publication Number Publication Date
JPH08194494A true JPH08194494A (ja) 1996-07-30

Family

ID=11573374

Family Applications (1)

Application Number Title Priority Date Filing Date
JP7004023A Pending JPH08194494A (ja) 1995-01-13 1995-01-13 文解析方法および装置

Country Status (1)

Country Link
JP (1) JPH08194494A (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008292789A (ja) * 2007-05-25 2008-12-04 Nippon Telegr & Teleph Corp <Ntt> 学習データのラベル誤り候補抽出装置、その方法及びプログラム、その記録媒体
US7584105B2 (en) 1997-08-05 2009-09-01 At&T Intellectual Property Ii, L.P. Method and system for aligning natural and synthetic video to speech synthesis
JP2009266240A (ja) * 1997-08-05 2009-11-12 At & T Corp ビデオと音とを整合させる方法および装置、コンピュータ可読媒体、ならびにデータを複合化する方法およびデコーダ

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7584105B2 (en) 1997-08-05 2009-09-01 At&T Intellectual Property Ii, L.P. Method and system for aligning natural and synthetic video to speech synthesis
JP2009266240A (ja) * 1997-08-05 2009-11-12 At & T Corp ビデオと音とを整合させる方法および装置、コンピュータ可読媒体、ならびにデータを複合化する方法およびデコーダ
US7844463B2 (en) 1997-08-05 2010-11-30 At&T Intellectual Property Ii, L.P. Method and system for aligning natural and synthetic video to speech synthesis
JP2008292789A (ja) * 2007-05-25 2008-12-04 Nippon Telegr & Teleph Corp <Ntt> 学習データのラベル誤り候補抽出装置、その方法及びプログラム、その記録媒体

Similar Documents

Publication Publication Date Title
JPH10274997A (ja) 文書読み上げ装置
JPH05181491A (ja) 音声合成装置
JPH08248971A (ja) テキスト朗読読み上げ装置
US7103533B2 (en) Method for preserving contextual accuracy in an extendible speech recognition language model
JPH08194494A (ja) 文解析方法および装置
JP3762300B2 (ja) テキスト入力処理装置及び方法並びにプログラム
JPH09146972A (ja) 自然言語対話型情報処理装置
JPH1115497A (ja) 氏名読み音声合成装置
JPH08272388A (ja) 音声合成装置及びその方法
JP2580565B2 (ja) 音声情報辞書作成装置
JPH06119144A (ja) 文書読み上げ装置
JPH07210185A (ja) 朗読情報作成装置および朗読装置
JP3414326B2 (ja) 音声合成用辞書登録装置及び方法
JPH0962286A (ja) 音声合成装置および音声合成方法
JP2003005776A (ja) 音声合成装置
JPH08185197A (ja) 日本語解析装置、及び日本語テキスト音声合成装置
JPH0969087A (ja) 文書作成装置及び文書作成方法
JPS62119591A (ja) 文章読上げ装置
JPH06176023A (ja) 音声合成システム
JP3573889B2 (ja) 音声出力装置
JP2007127994A (ja) 音声合成方法及び音声合成装置並びにプログラム
JP2000056788A (ja) 音声合成装置の韻律制御方法
JP2000172286A (ja) 中国語音声合成のための同時調音処理装置
JPH09185629A (ja) 機械翻訳方法
JP2003302993A (ja) 音声合成装置、音声合成方法、プログラム、記憶媒体

Legal Events

Date Code Title Description
A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20030210