JPH06348753A - 自然言語文処理用データの作成支援システム - Google Patents

自然言語文処理用データの作成支援システム

Info

Publication number
JPH06348753A
JPH06348753A JP5138084A JP13808493A JPH06348753A JP H06348753 A JPH06348753 A JP H06348753A JP 5138084 A JP5138084 A JP 5138084A JP 13808493 A JP13808493 A JP 13808493A JP H06348753 A JPH06348753 A JP H06348753A
Authority
JP
Japan
Prior art keywords
natural language
language sentence
syntax
data
grammar
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP5138084A
Other languages
English (en)
Inventor
Tadamichi Tagawa
忠道 田川
Teru Hirayama
輝 平山
Yoshie Seto
美枝 瀬戸
Satoru Myojin
知 明神
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Oki Electric Industry Co Ltd
Osaka Gas Co Ltd
Original Assignee
Oki Electric Industry Co Ltd
Osaka Gas Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Oki Electric Industry Co Ltd, Osaka Gas Co Ltd filed Critical Oki Electric Industry Co Ltd
Priority to JP5138084A priority Critical patent/JPH06348753A/ja
Publication of JPH06348753A publication Critical patent/JPH06348753A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Machine Translation (AREA)
  • Document Processing Apparatus (AREA)

Abstract

(57)【要約】 【目的】 データ作成者にかかる負担を少なくできる、
多様な同義文を規定する自然言語文処理用データを生成
できる支援システムを提供する。 【構成】 自然言語文処理用データの作成支援システム
20は、自然言語文処理システムが利用する、同義文を
規定する自然言語文処理用データの作成を支援する。こ
のシステムは、変換可能要素情報格納手段22とデータ
生成支援処理手段21とからなる。変換可能要素情報格
納手段は、自然言語文の一部要素を置換えても同義とな
る変換可能要素の情報を格納している。データ生成支援
処理手段は、入力された自然言語文処理用データが規定
する1以上の同義文と、同義となる他の文の存在を、上
述の変換可能要素情報に基づいて確認し、他の同義文が
存在する場合に、この他の同義文をも規定するように、
入力された自然言語文処理用データに情報を追加して最
終的な自然言語文処理用データを得る。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は自然言語文処理用データ
の作成支援システムに関し、特に、音声入力された文を
認識する音声認識システムに対する文認識用データの作
成を支援しようとしたものである。
【0002】
【従来の技術】例えば、対話型質問応答システムや、外
国語会話を学ぶことを目的とする語学訓練用知的CAI
システム(コンピュータ援用の教育システム)において
は、ユーザが文章をシステムに適宜入力することを要す
る。このような入力手段として、ユーザが発音した音声
を認識する音声認識システムを適用することが検討、開
発されている。対話型質問応答システムや語学訓練用知
的CAIシステムの場合には、ユーザが入力する文を予
測でき、そのため、対話型質問応答システムや語学訓練
用知的CAIシステムの入力手段に適用される音声認識
システムでは、ユーザが入力すると思われる文のデータ
を予め用意しておいて音声認識結果の向上を計ってい
る。
【0003】このような文の認識用データを予め用意し
て音声認識を行なう音声認識システムについては、例え
ば、文献『平山輝、平島充雄共著、「不特定話者、連続
音声認識システムの開発とその応用」、International
Symposium "Computer World'91," 、pp.189-196、(199
1)』に記載されている。
【0004】図2は、この文献に記載されている音声認
識システムの概略構成を示すものであり、特に、文の認
識に重みをおいて示したものである。
【0005】図2において、音声認識システム5は、音
声認識処理部2とシンタックスファイル4からなる。シ
ンタックスファイル4は、音声認識処理部2が認識する
ことができる、単語間の接続等の文構造についてのデー
タ(以下、シンタックスと呼ぶ)を複数記述したもので
あり、データ作成者によって予め作成されたものであ
る。音声認識処理部2には、ユーザが発音した音声を図
示しない音声捕捉手段(マイクロホン)が捕捉し、その
音声信号を図示しないサンプラがサンプリングした音声
データ1が入力される。音声認識処理部2は、例えば、
入力音声データ1をフレーム単位で特徴パラメータに変
換した後音韻コード列に変換し、その後、音韻列と音素
とを対応付けた図示しない音韻コードブックや、音素列
と単語とを対応付けた図示しない音韻辞書や、単語間の
接続情報等の文についてのデータを記述したシンタック
スファイル4を参照して、最も確からしい文字列データ
(文のデータ)3を得て、文字列データ3の図示しない
処理部(例えアプリケーションプログラム)に与える。
この際には、音素、単語、文の順に確定していくが、確
定しようとする文がシンタックスファイル4に格納され
ている文に該当しない場合には、単語や音素の見直し
(候補音素や候補単語の変更)等を行なって最も確から
しい文字列データ3を得る。
【0006】図3は、シンタックスファイル4に記述さ
れたシンタックスの例を示す図表である。また、図4
は、図3のシンタックスで規定される文を示す図表であ
る。
【0007】シンタックスは、認識すべき多数の文形を
コンパクトにしかも自然な記述に近い形で表現しようと
したものであり、図3に示すように、文法変数10と1
又はそれ以上の文法変数定義11との組(レコード)か
らなる。文法変数10は、例えば、アンダーバー”
とローマ字大文字とからなる語で表された文法上の変数
である。文法変数定義11は、文法変数10の内容を単
語列で定義したものであり、この単語列の要素として文
法変数10が繰返し構造や再帰構造で挿入されていても
良い。また、文法変数「 DRINK」に示すように、
1個の文法変数10に対して、複数の文法変数定義11
を定義することができる。文法変数「 S」は、1個の文
構造のルートを表しており、シンタックスファイル4内
に複数存在していても構わない。
【0008】なお、シンタックスは観点を変えると、1
又はそれ以上の同義文を規定するものということができ
る。
【0009】図3に示す3個のシンタックスだけがシン
タックスファイル4に格納されている場合、上述した音
声認識処理部2は、図4に示す2個の文だけを認識する
ことができる。
【0010】
【発明が解決しようとする課題】ところで、音声認識シ
ステムが、より多くの文を認識できるようにするために
は、データ作成者が、文の数や種類に応じた多くのシン
タックスをシンタックスファイル4に記述しなければな
らない。また、音声認識システムに入力される音声に
は、様々な誤りや様々な言換えが含まれていることが多
く、このような同一意味の多様な音声を認識しようとす
ると、さらに多くのシンタックスをシンタックスファイ
ル4に記述しなければならない。
【0011】例えば、対話型質問応答システムや語学訓
練用知的CAIシステムの入力手段に適用される音声認
識システムの場合、質問の観点変えや訓練場面の変更等
によって、ユーザが応答する文の数も多く、また、その
表現も多様であり、シンタックスファイル4に用意する
シンタックスが非常に多くなることを避けることができ
ない。
【0012】しかしながら、シンタックスを自動的に生
成するためのシステムが現在は存在せず、データ作成者
が多くのシンタックスをシンタックスファイル4に記述
しようとした場合、手作業によるほかなく多大な労力を
要しており、データ作成者の負担は大きい。
【0013】例えば、語学訓練用知的CAIシステムの
中には、シンタックスファイル4を訓練用のアプリケー
ションプログラムと共に、訓練段階毎に、別個の記録媒
体に格納するものもあり、このようなシステムの場合、
シンタックスファイル4の作成回数も非常に多い。
【0014】以上、音声認識システムが利用するシンタ
ックス(自然言語文処理用データ)の作成について課題
を説明したが、このような課題は、他の自然言語文処理
システムにおいても同様に生じている。例えば、キーボ
ード等から入力された自然言語文を同定するためにも、
同定用データ(自然言語文処理用データ)が必要である
が、この同定用データの作成においても同様な課題が生
じている。
【0015】本発明は、以上の点を考慮してなされたも
のであり、データ作成者にかかる負担を軽減できる、同
義の多様な自然言語文を規定できる自然言語文処理用デ
ータを得ることができる自然言語文処理用データの作成
支援システムを提供しようとしたものである。
【0016】
【課題を解決するための手段】かかる課題を解決するた
め、本発明においては、自然言語文処理システムが、入
力された自然言語文を認識するために、又は、出力する
自然言語文を生成するために用いる、1又はそれ以上の
同義の自然言語文を規定する自然言語文処理用データの
作成を支援する自然言語文処理用データの作成支援シス
テムを、以下の各手段で構成した。
【0017】すなわち、自然言語文の一部要素を置換え
ても同義となる変換可能要素の情報を格納している変換
可能要素情報格納手段と、入力された自然言語文処理用
データが規定する同義の1又はそれ以上の自然言語文
と、同義となる他の自然言語文の存在を、上記変換可能
要素情報格納手段に格納されている変換可能要素情報に
基づいて確認し、他の自然言語文が存在する場合に、こ
の他の自然言語文をも規定するように、入力された自然
言語文処理用データに情報を追加して最終的な自然言語
文処理用データを得るデータ生成支援処理手段とで構成
した。
【0018】ここで、入力された自然言語文処理用デー
タ自体、又は、入力された自然言語文処理用データに含
まれている変換可能要素の情報が上記変換可能要素情報
格納手段に格納されていない場合に、上記データ生成支
援処理手段がこの未格納情報を上記変換可能要素情報格
納手段に格納することが好ましい。
【0019】
【作用】本発明の自然言語文処理用データの作成支援シ
ステムにおいては、変換可能要素情報格納手段に、予
め、自然言語文の一部要素を置換えても同義となる変換
可能要素の情報を格納しておく。データ作成者等が自然
言語文処理用データを作成して当該システムに入力した
ときには、データ生成支援処理手段は、入力された自然
言語文処理用データが規定する同義の1又はそれ以上の
自然言語文(省略文や文法的な誤り文を含んでいても良
い)と、同義となる他の自然言語文の存在を、変換可能
要素情報格納手段に格納されている変換可能要素情報に
基づいて確認する。そして、他の自然言語文が存在する
場合には、データ生成支援処理手段は、この他の自然言
語文をも規定するように、入力された自然言語文処理用
データに情報を追加して最終的な自然言語文処理用デー
タを得る。
【0020】これにより、データ作成者が完璧な自然言
語文処理用データを作成する必要がなくなり、作成者の
負担を軽減でき、しかも、最終的に得られた自然言語文
処理用データが規定する自然言語文は多様である。
【0021】なお、入力された自然言語文処理用データ
自体、又は、入力された自然言語文処理用データに含ま
れている変換可能要素の情報が変換可能要素情報格納手
段に格納されていない場合に、データ生成支援処理手段
がこの未格納情報を変換可能要素情報格納手段に格納す
るようにすれば、変換可能要素情報格納手段の格納内容
を自動的に充実できて好ましい。
【0022】
【実施例】以下、本発明を、音声認識のためのデータ作
成支援システムに適用した一実施例を図面を参照しなが
ら詳述する。ここで、図1がこの実施例のデータ作成支
援システムの構成を示すブロック図であり、図5及び図
6がこの実施例のデータ作成支援システムの処理を示す
フローチャート(その1及びその2)である。
【0023】この実施例のデータ作成支援システム20
は、上述した図2に示した音声認識システム5を前提と
しており、データ作成者が作成した1又はそれ以上のシ
ンタックス(入力シンタックス)25から、それを含め
てシンタックスファイル4に格納するシンタックス情報
を作成するものである。
【0024】図1において、データ作成支援システム2
0は、いわゆるパソコンやワークステーション等のコン
ピュータシステムとそのコンピュータシステム上に搭載
されたプログラムから構成されており(例えば、いわゆ
るオーサリングシステムの一部を利用できる)、機能的
には、シンタックス生成支援処理部21及び文法変数定
義変換テーブル22からなる。
【0025】シンタックス生成支援処理部21は、デー
タ作成者が作成したシンタックス25が入力されると、
文法変数定義変換テーブル22に格納された内容を参照
して、入力シンタックス25の文法変数に対する文法変
数定義が追加できるか否かを確認して、追加できる場合
には文法変数定義を追加してシンタックスファイル4に
格納させるものである。また、シンタックス生成支援処
理部21は、入力シンタックス25の内に、文法変数定
義変換テーブル22に格納されていない文法変数が存在
する場合には、その文法変数と文法変数定義との組情報
を、文法変数定義変換テーブル22に追加格納させるも
のである。
【0026】なお、シンタックス生成支援処理部21が
行なう処理の詳細については後述する。
【0027】図7は、シンタックス生成支援処理部21
が使用する文法変数定義変換テーブル22のデータ構成
を示すものである。
【0028】文法変数定義変換テーブル22は、図7に
示すように、文法変数30と文法変数定義31とからな
り、文法変数30毎に、シンタックス生成支援処理部2
1による参照が容易になるように識別番号32が付与さ
れている。
【0029】ここで、音声認識システムのユーザが同一
内容の異なる文を入力してもシンタックスファイル4が
対応できるように、同一の文法変数30に対する文法変
数定義31として、置換え可能な複数の単語列をできる
だけ用意するようにしている。例えば、文法変数「
ANT−TO」について、互いに置換え可能な文法変数
定義「want to」と「would like t
o」とを用意している。また、音声認識システムのユー
ザが文法上誤った文を入力してもシンタックスファイル
4が対応できるように、同一の文法変数30に対する文
法変数定義31として、文法的に正しいものだけでな
く、文法的に誤ったものをも用意している。図7の備考
欄(a) 、(b) 、(e) 、(f) に係る文法変数定義は、文法
的に誤った文を規定するものであり、備考欄(c) 、(d)
、(g) に係る文法変数定義は、文法的に正しい文を規
定するものである。
【0030】なお、図7の備考欄は、以上のことを説明
するために記載したものであり、この実施例の文法変数
定義変換テーブル22には、図7の備考欄に示した内容
は格納されておらず、シンタックスの生成支援には利用
されない。
【0031】次に、シンタックス生成支援処理部21が
行なうシンタックスの生成支援処理の詳細を、図5及び
図6に示すフローチャートを参照して説明する。
【0032】シンタックスの生成支援処理を開始する
と、まず、入力シンタックス25の数(文法変数の数)
を入力シンタックス数パラメータSnに設定すると共
に、その時点における文法変数定義変換テーブル22の
レコード数(文法変数の数)を格納レコード数パラメー
タGnに設定する(ステップ100)。その後、着目シ
ンタックス規定変数snを0に設定する(ステップ10
1)。
【0033】このような初期設定処理が終了すると、入
力シンタックス数パラメータSnと着目シンタックス規
定変数snとを大小比較することを通じて、入力された
全てのシンタックスに対する生成支援処理が終了したか
否かを判断する(ステップ102)。終了しているとい
う判断結果を得ると、一連の当該シンタックスの生成支
援処理を終了する。
【0034】入力された全てのシンタックスに対する生
成支援処理が終了していない場合には、着目シンタック
ス規定変数snを1インクリメントした後、sn番目の
入力されたシンタックスの文法変数及び文法変数定義を
そのままシンタックスファイル4に格納させる(ステッ
プ103、104)。
【0035】その後、文法変数定義変換テーブル22に
ついての着目レコード変数gnを0に設定する(ステッ
プ105)。そして、着目レコード変数gnと格納レコ
ード数パラメータGnとを大小比較することを通じて、
現時点で着目している入力シンタックスについて、文法
変数定義変換テーブル22内の全てのレコードを参照し
たか否かを確認する(ステップ106)。
【0036】文法変数定義変換テーブル22内の全ての
レコードに対する参照が終了していない場合には、着目
レコード変数gnを1インクリメントして参照しようと
するレコードを次のものに切替え、文法変数定義変換テ
ーブル22内のgn番目のレコードの文法変数とsn番
目の入力シンタックスの文法変数が一致しているか否か
を判断する(ステップ107、108)。この判断で一
致していなければ、上述したステップ106に戻る。
【0037】従って、文法変数定義変換テーブル22内
のいずれかの文法変数と一致する文法変数を有するsn
番目の入力シンタックスについては、ステップ106〜
108でなる処理ループを何回(0回を含む)か繰返す
ことで、ステップ108で一致するという判断がなされ
る。
【0038】このとき、文法変数定義変換テーブル22
内のgn番目のレコードの文法変数定義のうち、sn番
目の入力シンタックスの文法変数定義として規定されて
いないものがあれば、その文法変数定義をシンタックス
ファイル14に追加する(ステップ109)。すなわ
ち、sn番目のシンタックスについて、文法変数定義変
換テーブル22内に規定されていれば、データ作成者に
よって作成された以上の情報(文法変数定義)がシンタ
ックスファイル4に格納されることになる。このこと
は、シンタックスが規定する同義文を増加させたことを
意味する。
【0039】また、現在処理対象となっているsn番目
の入力シンタックスの文法変数定義のうち、文法変数定
義変換テーブル22のgn番目のレコードの文法変数定
義として存在しないものがあれば、このような文法変数
定義を文法変数定義変換テーブル22に追加登録する
(ステップ110)。すなわち、文法変数定義変換テー
ブル22の内容を、入力シンタックスの内容に応じて充
実させ、これ以降のシンタックスの生成支援の向上を計
っている。
【0040】以上のように、現在処理対象のsn番目の
入力シンタックスの文法変数が、文法変数定義変換テー
ブル22内のいずれかの文法変数と一致するときには、
文法変数定義変換テーブル22内の文法変数定義に従っ
て、当該シンタックスを充実化させることができるかを
確認して充実できる場合には充実した内容をシンタック
スファイル4に格納させ、また、文法変数定義変換テー
ブル22を充実化させることができるかを確認して充実
できる場合には充実した内容を文法変数定義変換テーブ
ル22を登録し、しかる後、他の入力シンタックスにつ
いての支援処理を実行するために、又は、一連の支援処
理を終了させるために、上述したステップ102に戻
る。
【0041】現在処理対象となっているsn番目の入力
シンタックスの文法変数と同じ文法変数を有する文法変
数定義変換テーブル22内のレコードを、ステップ10
6〜108でなる処理ループを繰返して探索しても発見
できない場合には、すなわち、sn番目の入力シンタッ
クスの文法変数と同じ文法変数を有するレコードが文法
変数定義変換テーブル22内に存在しない場合には、処
理ループを繰返していくうちにやがてステップ106で
否定結果が得られる。このときには、sn番目の入力シ
ンタックスについての文法変数及び文法変数定義を文法
変数定義変換テーブル22に追加格納して、文法変数定
義変換テーブル22の充実を計る(ステップ111)。
これにより、文法変数定義変換テーブル22内のレコー
ド数がそれ以前より1個だけ増えたので、格納レコード
数パラメータGnを1インクリメントする(ステップ1
12)。そして、他の入力シンタックスについての支援
処理を実行するために、又は、一連の作成支援処理を終
了させるために、上述したステップ102に戻る。
【0042】入力シンタックス毎に行なっていた具体的
な作成支援処理が、全ての入力シンタックスについて終
了すると、ステップ102で否定結果が得られて、一連
の作成支援処理を終了させる。
【0043】次に、シンタックス生成支援処理部21に
よる図5及び図6に示す生成支援処理を、具体例を用い
て説明する。ここでは、文法変数定義変換テーブル22
が図7に示す3個のレコードでなる構造を有するとき
に、図3に示す3個のシンタックスがデータ作成者から
入力されたとして説明する。
【0044】まず、入力シンタックス数パラメータSn
に3が設定されると共に、格納レコード数パラメータG
nに3が設定され、その後、着目シンタックス規定変数
snに0が設定される(ステップ100、101)。
【0045】この段階で一連の処理の終了確認ステップ
に進んだときには、1番目の入力シンタックスに対する
処理すら終了していないので、直ちに、着目シンタック
ス規定変数snが1に更新されて、文法変数 Sの入力
シンタックスが処理対象入力シンタックスとなる(ステ
ップ102、103)。そして、この文法変数 Sの入
力シンタックスの情報が全てシンタックスファイル4に
格納される(ステップ104)。
【0046】その後、着目レコード変数gnを0とした
後(ステップ105)、ステップ106〜108でなる
処理ループを何回(0回を含む)か繰返して、文法変数
Sのレコードが文法変数定義変換テーブル22に存在
するか否かを検索する。図7に示すように、文法変数
Sのレコードは文法変数定義変換テーブル22には存在
しないので、現在処理対象となっている1番目の入力シ
ンタックス(文法変数 Sのシンタックス)の文法変数及
び文法変数定義を文法変数定義変換テーブル22に追加
し、格納レコード数パラメータGnを4に変更してステ
ップ102に戻る(ステップ111、112)。
【0047】このときの着目シンタックス規定変数sn
が1であって、入力シンタックス数パラメータSn(=
3)より小さいので、着目シンタックス規定変数snが
2に変更され、2番目の入力シンタックス、すなわち、
文法変数 WANT−TOの入力シンタックスの全ての
情報(文法変数及び文法変数定義)がシンタックスファ
イル4に格納される(ステップ102〜104)。
【0048】その後、着目レコード変数gnを0とした
後(ステップ105)、ステップ106〜108でなる
処理ループを何回(0回を含む)か繰返して、文法変数
WANT−TOのレコードが文法変数定義変換テーブ
ル22に存在するか否かを検索する。図7に示すよう
に、文法変数 WANT−TOのレコードは文法変数定
義変換テーブル22に1番目のレコードとして存在する
ので、処理ループの0回目で当該レコードが検索され
る。その結果、文法変数 WANT−TOの入力シンタ
ックスの文法変数定義と、文法変数 WANT−TOの
文法変数定義変換テーブル22のレコードにおける文法
変数定義とが照合される(ステップ109、110)。
図3及び図7の比較から明らかなように、文法変数定義
変換テーブル22のレコードの方が、「would l
ike to」、「want」及び「would li
ke」という文法変数定義を多く有しており、そのた
め、これら3個の文法変数定義が、シンタックスファイ
ル4の文法変数 WANT−TOに対する文法変数定義
として追加される(ステップ109)。なお、文法変数
WANT−TOの入力シンタックスだけ存在する文法変
数定義はないので、ステップ110に基づく、文法変数
定義変換テーブル22に対する文法変数定義の追加処理
は実行されない。その後、ステップ102に戻る。
【0049】このときには、着目シンタックス規定変数
snが2であって、入力シンタックス数パラメータSn
(=3)より小さいので、着目シンタックス規定変数s
nが3に変更され、3番目の入力シンタックス、すなわ
ち、文法変数 DRINKの入力シンタックスの全ての
情報(文法変数及び文法変数定義)がシンタックスファ
イル4に格納される(ステップ102〜104)。
【0050】その後、着目レコード変数gnを0とした
後(ステップ105)、ステップ106〜108でなる
処理ループを何回(0回を含む)か繰返して、文法変数
DRINKのレコードが文法変数定義変換テーブル2
2に存在するか否かを検索する。図7に示すように、文
法変数 DRINKのレコードは文法変数定義変換テー
ブル22に2番目のレコードとして存在するので、処理
ループの1回の繰返しによって当該レコードが検索され
る。その結果、文法変数 DRINKの入力シンタック
スの文法変数定義と、文法変数 DRINKの文法変数
定義変換テーブル22のレコードにおける文法変数定義
とが照合される(ステップ109、110)。図3及び
図7の比較から明らかなように、3番目の入力シンタッ
クスの方が、「have」という文法変数定義だけを有
しており、そのため、文法変数定義「have」が、文
法変数定義変換テーブル22の文法変数 DRINKの
文法変数定義として追加される(ステップ110)。な
お、文法変数 DRINKについて文法変数定義変換テ
ーブル22だけに記述されている文法変数定義は存在し
ないので、シンタックスファイル4の文法変数 WAN
T−TOに関し、ステップ109による追加処理は実行
されない。このような処理の後、ステップ102に戻
る。
【0051】このときには、着目シンタックス規定変数
snが3であって、入力シンタックス数パラメータSn
(=3)より小さくないので、一連の生成支援処理が終
了される。
【0052】図8は、以上のようなシンタックス生成支
援処理部21による処理が実行された後のシンタックス
ファイル4の格納内容を示すものであり、図9は、以上
のようなシンタックス生成支援処理部21による処理が
実行された後の文法変数定義変換テーブル22の格納内
容を示すものである。また、図10は、図8に示すシン
タックスファイル4を音声認識システム5に適用した場
合に、音声認識処理部2が認識できる文を示したもので
ある。
【0053】図3及び図8の比較から明らかなように、
データ作成者が作成したシンタックス25に比較して、
シンタックスの生成支援処理を経て格納されたシンタッ
クスファイル4の内容は充実している。そのため、図4
及び図10の比較から明らかなように、シンタックスの
生成支援処理を経たシンタックスファイル4を適用した
場合には、データ作成者が作成したシンタックス25を
そのままシンタックスファイル4に格納して適用した場
合に比べて、音声認識処理部2が認識できる文の数が増
大する(4倍になる)。
【0054】また、図10から明らかなように、シンタ
ックスの生成支援処理を経たシンタックスファイル4を
適用した場合には、音声認識処理部2は、文法的に正し
い文((1) 〜(4) )だけでなく、文法的に誤った文
((5) 〜(8) )をも認識することができる。しかも、音
声認識処理部2は、同義の多様な文((1) 〜(8) )を文
法的な正誤に拘らずに認識することができる。
【0055】さらに、図7及び図9の比較から明らかな
ように、データ作成者が作成したシンタックス25をシ
ンタックス生成支援処理部21に入力して生成支援処理
を実行させることで、文法変数定義変換テーブル22を
充実でき、その後の支援処理を充実化することができ
る。
【0056】以上のように、上記実施例によれば、置換
え可能な文法変数定義を文法変数に対応付けて格納した
文法変数定義変換テーブル22を設け、シンタックス生
成支援処理部21が、データ作成者による入力シンタッ
クスの文法変数定義に置換えられるものが文法変数定義
変換テーブル22にあれば、その文法変数定義も含めて
入力シンタックスをシンタックスファイル4に格納する
ようにしたので、データ作成者によって作成されたシン
タックスが完璧である必要はなく、データ作成者のシン
タックスを作成する労力や負担を少なくすることができ
る。
【0057】しかも、データ作成者が少ない労力でシン
タックスを作成したとしても、シンタックスファイル4
に格納されたシンタックスは、文法的に正誤のものを含
めて同義の多様な文に対応できるものとなっており、そ
の結果、音声認識率をも向上させることができる。
【0058】なお、上記実施例においては、シンタック
スが文法変数及び文法変数定義でなるものを示したが、
シンタックスの構成はこれに限られるものではない。例
えば、図7の備考欄に示した文法的な正誤情報をも盛り
込むようにしても良く、このようにした場合には、音声
認識した最終的な文の情報(文字列データ)に文法的な
正誤情報を付加することもできる。
【0059】また、上記実施例においては、作成された
シンタックス(自然言語文処理用データ)を音声認識の
ために利用する場合を説明したが、シンタックスの利用
方法はこれに限られるものではない。例えば、キーボー
ド入力手段から入力された文の内容を同定するために用
いるようにしても良い。この場合には、シンタックスは
いわゆるテンプレートとして用意される。また、例え
ば、CAIシステム等がユーザに提供する文を規定する
ものとして生成されたシンタックスを用いても良い。
【0060】さらに、上記実施例においては、対象とす
る自然言語文が英語文のものを示したが、日本語文等の
他の言語の文をも当然に対象とすることができる。
【0061】本発明により生成されたシンタックス(自
然言語文処理用データ)を利用する自然言語文処理シス
テムも当然に限定されるものではない。以下の(1)及
び(2)の自然言語文処理システムに適用する場合に
は、本発明の自然言語文処理用データの作成支援システ
ムを、以下のような点(1-1) 〜(1-3) 、(2-1) を考慮し
て適用すれば良い。
【0062】(1)会話型処理で外国語会話を学ぶこと
を目的とする語学訓練用知的CAIシステム (1-1) 学習者のバギーモデルを、正しい文のシンタック
スから、文法的な誤りを含む文のシンタックスを生成す
ることによって作成する。 (1-2) 学習者の語学能力レベルを推測するための学習者
モデルを、多様なレベルの言替え文のシンタックスを生
成することによって作成する。 (1-3) 学習者のレベルに応じて難易度調節可能なシステ
ム側の発話文を、言替え文のシンタックスを生成するこ
とによって作成する。
【0063】(2)対話型質問応答システム (2-1) 言替え文、省略文、文法誤り文のシンタックスを
生成することによって入力文の認識率を高め、円滑な対
話を実現する。
【0064】
【発明の効果】以上のように、本発明によれば、自然言
語文処理用データの作成支援システムを、自然言語文の
一部要素を置換えても同義となる変換可能要素の情報を
格納している変換可能要素情報格納手段と、入力された
自然言語文処理用データが規定する同義の1又はそれ以
上の自然言語文と、同義となる他の自然言語文の存在
を、上記変換可能要素情報格納手段に格納されている変
換可能要素情報に基づいて確認し、他の自然言語文が存
在する場合に、この他の自然言語文をも規定するよう
に、入力された自然言語文処理用データに情報を追加し
て最終的な自然言語文処理用データを得るデータ生成支
援処理手段とで構成したので、データ作成者にかかる負
担を少なくでき、しかも、多様な同義文を規定する自然
言語文処理用データを生成することができる。
【図面の簡単な説明】
【図1】実施例の構成を示すブロック図である。
【図2】音声認識システムの構成を示すブロック図であ
る。
【図3】図2のシンタックスファイルの構成を示す説明
図である。
【図4】図3のシンタックスが規定する自然言語文を示
す説明図である。
【図5】実施例によるシンタックスの生成支援処理を示
すフローチャート(その1)である。
【図6】実施例によるシンタックスの生成支援処理を示
すフローチャート(その2)である。
【図7】実施例の文法変数定義変換テーブル22の初期
構成を示す説明図である。
【図8】実施例によるシンタックスの生成支援処理が実
行された後のシンタックスファイル4の構成を示す説明
図である。
【図9】実施例によるシンタックスの生成支援処理が実
行された後の文法変数定義変換テーブル22の構成を示
す説明図である。
【図10】図8のシンタックスが規定する自然言語文を
示す説明図である。
【符号の説明】
4…シンタックスファイル、5…音声認識システム(自
然言語文処理システム)、20…音声認識のためのデー
タ作成支援システム、21…シンタックス生成支援処理
部(データ生成支援処理手段)、22…文法変数定義変
換テーブル(変換可能要素情報格納手段)、25…入力
シンタックス(入力された自然言語文処理用データ)。
フロントページの続き (72)発明者 瀬戸 美枝 愛知県名古屋市千種区内山三丁目8番10号 株式会社沖テクノシステムズラボラトリ 内 (72)発明者 明神 知 大阪府大阪市西区千代崎3丁目2番95号 株式会社オージス総研内

Claims (2)

    【特許請求の範囲】
  1. 【請求項1】 自然言語文処理システムが、入力された
    自然言語文を認識するために、又は、出力する自然言語
    文を生成するために用いる、1又はそれ以上の同義の自
    然言語文を規定する自然言語文処理用データの作成を支
    援する自然言語文処理用データの作成支援システムであ
    って、 自然言語文の一部要素を置換えても同義となる変換可能
    要素の情報を格納している変換可能要素情報格納手段
    と、 入力された自然言語文処理用データが規定する同義の1
    又はそれ以上の自然言語文と、同義となる他の自然言語
    文の存在を、上記変換可能要素情報格納手段に格納され
    ている変換可能要素情報に基づいて確認し、他の自然言
    語文が存在する場合に、この他の自然言語文をも規定す
    るように、入力された自然言語文処理用データに情報を
    追加して最終的な自然言語文処理用データを得るデータ
    生成支援処理手段とを備えたことを特徴とする自然言語
    文処理用データの作成支援システム。
  2. 【請求項2】 入力された自然言語文処理用データ自
    体、又は、入力された自然言語文処理用データに含まれ
    ている変換可能要素の情報が上記変換可能要素情報格納
    手段に格納されていない場合に、上記データ生成支援処
    理手段がこの未格納情報を上記変換可能要素情報格納手
    段に格納することを特徴とした請求項1に記載の自然言
    語文処理用データの作成支援システム。
JP5138084A 1993-06-10 1993-06-10 自然言語文処理用データの作成支援システム Pending JPH06348753A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP5138084A JPH06348753A (ja) 1993-06-10 1993-06-10 自然言語文処理用データの作成支援システム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP5138084A JPH06348753A (ja) 1993-06-10 1993-06-10 自然言語文処理用データの作成支援システム

Publications (1)

Publication Number Publication Date
JPH06348753A true JPH06348753A (ja) 1994-12-22

Family

ID=15213584

Family Applications (1)

Application Number Title Priority Date Filing Date
JP5138084A Pending JPH06348753A (ja) 1993-06-10 1993-06-10 自然言語文処理用データの作成支援システム

Country Status (1)

Country Link
JP (1) JPH06348753A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2013512461A (ja) * 2009-12-16 2013-04-11 浦項工科大學校 産學協力團 外国語学習装置及び対話システム

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2013512461A (ja) * 2009-12-16 2013-04-11 浦項工科大學校 産學協力團 外国語学習装置及び対話システム

Similar Documents

Publication Publication Date Title
US7873508B2 (en) Apparatus, method, and computer program product for supporting communication through translation between languages
JP5040909B2 (ja) 音声認識辞書作成支援システム、音声認識辞書作成支援方法及び音声認識辞書作成支援用プログラム
Black et al. Building voices in the Festival speech synthesis system
US6778962B1 (en) Speech synthesis with prosodic model data and accent type
JP3481497B2 (ja) 綴り言葉に対する複数発音を生成し評価する判断ツリーを利用する方法及び装置
US5875426A (en) Recognizing speech having word liaisons by adding a phoneme to reference word models
US8155963B2 (en) Autonomous system and method for creating readable scripts for concatenative text-to-speech synthesis (TTS) corpora
Ghyselen et al. Clearing the transcription hurdle in dialect corpus building: The corpus of southern Dutch dialects as case study
Klovstad et al. The CASPERS linguistic analysis system
JP3441400B2 (ja) 言語変換規則作成装置、及びプログラム記録媒体
JPH06348753A (ja) 自然言語文処理用データの作成支援システム
JP3589972B2 (ja) 音声合成装置
JPH03226785A (ja) 音声認識装置付き語学用教育装置
Carson-Berndsen Multilingual time maps: portable phonotactic models for speech technology
KR102107445B1 (ko) 선택적 음성 모델의 적용이 가능한 텍스트 음성 변환 장치 및 그 동작 방법
JPS6229796B2 (ja)
JP2000330588A (ja) 音声対話処理方法、音声対話処理システムおよびプログラムを記憶した記憶媒体
US8635071B2 (en) Apparatus, medium, and method for generating record sentence for corpus and apparatus, medium, and method for building corpus using the same
JP3522005B2 (ja) 音声合成装置
Ghyselen et al. Clearing the Transcription Hurdle in Dialect Corpus Building: The Corpus of Southern Dutch Dialects as Case Study. Front
JP3001334B2 (ja) 認識用言語処理装置
CN117711370A (zh) 注音方法、装置、语音合成系统、存储介质及电子设备
JP2966954B2 (ja) 文書読上げ指示装置
DE CARVALHO CHAPTER SIX HMM-BASED SPEECH SYNTHESIS USING THE HTS-2.2
JPH04199421A (ja) 文書読上げ装置