JPH08190399A - 規則生成装置 - Google Patents
規則生成装置Info
- Publication number
- JPH08190399A JPH08190399A JP7001218A JP121895A JPH08190399A JP H08190399 A JPH08190399 A JP H08190399A JP 7001218 A JP7001218 A JP 7001218A JP 121895 A JP121895 A JP 121895A JP H08190399 A JPH08190399 A JP H08190399A
- Authority
- JP
- Japan
- Prior art keywords
- word
- words
- rule
- dictionary
- sentence template
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Landscapes
- Character Discrimination (AREA)
Abstract
させることなく記述し、かつ、構文的,意味的に正し
い、条件にあった語や語列を規則として生成する。 【構成】 文テンプレート1は、認識する語または語の
グループを記述したものである。単語辞書2は、語と語
のグループを表すグループ名から成っている。規則生成
部3は、前記文テンプレート1の記述に従い規則を生成
する。すなわち、規則生成部3と単語辞書2と文テンプ
レート1とからなる。文テンプレート1に認識すべき語
が記述され、これに基づいて、単語辞書2を参照しなが
ら規則を生成する。認識のための規則を自動的に辞書か
ら生成することで、人出では作成時に抜けや誤りがあっ
たものを、これらを回避することができ、認識したい単
語を記述するだけで(文テンプレート)規則を別に書く
作業がなくなり、効率的である。
Description
より詳細には、音声認識の文認識や対話処理における規
則生成装置に関する。
定するときに、一般的に書き替え規則の形で記述するこ
とがある。書き替え規則は機械で扱いやすい形をしてお
り、機械処理でよく使われるデータ記述法である。書き
替え規則は、言語現象を対象とした場合に、人間の直観
的な記述においては非常に書きにくい。これは、言語現
象を記述しようとしたときには、一つの観点で記述して
いくことは不可能で、構文,意味など複数の観点が混在
することが理由の一つである。
テムのための構文解析法の比較・検討」(中川 外1名
情報処理学会論文誌 vol.30, No.8, 1989.10)によ
れば、文脈自由文法をLRテーブルにして、HMM(Hi
dden Markov Model)と統合して決定的に認識を行って
いく方法を提案している。使用されている文法をみる
と、構文的な性質(名詞)と意味との二つの観点が混在
して書かれている。
ルについて」(北 外1名 人工知能学会研究会 SIG-SL
UD-9201,9201)のように、複雑な言語現象を書き替え規
則で書き示そうとすると、非文を多く生成してしまうと
いう報告もある。すなわち、HMM−LRでは、タスク
を記述する文脈自由文法を用いることにより、音声認識
の探索範囲を縮小している。HMM−LRで用いられて
いる文法からランダムに文を生成し、生成された文のう
ちの何割が日本語として正しいかをチェックしたもので
ある。また、音声認識では、認識候補単語数が認識率や
認識時間に影響する。できるだけ候補単語を絞り込むこ
とが重要である。構文的に正しさだけでなく、タスクで
の意味やその他の観点から認識する語を絞り込む必要が
ある。
意味を考慮した2段LRパーザ」(南 外3名 日本音
響学会講演論文集 3-4-10, 1993.3)によれば、文法,
LRテーブルを意味のレベルで分けてつくるようにして
いる。すなわち、電話番号案内のタスクでの自由発声文
に対応するために、文脈自由文法は、認識の途中で問い
合わせ内容が全く同じ候補でも、音韻系列の少しだけ違
う候補を沢山生成して探索空間の爆発を起こす。このた
め、有効な意味をもつ候補がビーム幅の外側に追いやら
れて、認識性能の劣化の原因の一つとなっていた。そこ
で、認識の過程で意味を考慮して、同じ意味を持つ音韻
系列の候補をマージし、有効な候補をビーム幅内に残し
ていくことが提案されている。
のものは、語を追加,修正するときには、常に複数の分
類観点を意識して記述していかねばならない。また、文
献のものは、正しい候補を生成するという点で、書き
替え規則は記述性が低いという点がある。さらに、文献
のものは、タスクによっては、一つの基準での分類に
とどまらず、複数の基準が必要になるものや、ある特定
の条件の語だけ先に照合したいといった場合が考えられ
る。
えると規則を書き変えなければならない。また、それだ
け枝分かれが増え、かつノードの種類も増え、データの
記述が非常に繁雑になっていた。また、特に音声認識の
場合、文を規則化する構文的な単位とは必ずしも一致せ
ず、長さの短いものは複数の単語を組み合わせて認識し
た方が認識しやすい場合もある。この場合も、そのため
の規則をそれごとに用意する必要があった。
たもので、複数の分類基準をもつ語や表現を基準を混在
させることなく記述し、かつ、構文的,意味的に正し
い、条件にあった語や語列を規則として生成する規則生
成装置を提供することを目的としている。
決するために、(1)認識する語または語のグループを
記述した文テンプレートと、語と語のグループを表すグ
ループ名からなる単語辞書と、文テンプレートの記述に
従い規則を生成する規則生成部とを有すること、更に
は、(2)前記文テンプレートで語について生成する制
限を記述し、該記述に基づいて規則を生成すること、更
には、(3)前記文テンプレートで複数の語をつなげて
生成することを記述し、該記述に基づいて規則を生成す
ること、更には、(4)前記文テンプレートで語が省略
可能であることを記述し、該記述に基づいて規則を生成
すること、更には、(5)前記文テンプレートで語につ
いての制限に条件名とその値とを記述し、該記述に基づ
いて規則を生成すること、更には、(6)前記(5)に
おいて、前記文テンプレートで語について条件名とその
値とを対にした制限を複数記述し、該記述に基づいて規
則を生成すること、更には、(7)前記(5)におい
て、前記文テンプレートで語について条件名とその値の
可能な範囲を制限として記述し、該記述に基づいて規則
を生成すること、或いは、(8)認識する語または語の
グループを記述した文テンプレートと、語と語のグルー
プを表すグループ名からなる単語辞書と、語とその接続
パタンを記述した接続パタン辞書と、品詞と活用品詞と
活用語尾を記述した活用辞書と、複数の語をつなげて生
成する場合に、語の接続可否を検定し、それに基づいて
規則を生成する規則生成部とを有すること、更には、
(9)前記(8)において、前記複数の語をつなげて生
成する場合に、接続パタンが複数あった場合に、語の接
続可否を検定し、それに基づいて規則を生成することを
特徴としたものである。
(1)認識する語または語のグループを記述した文テン
プレートと、語と語のグループを表すグループ名からな
る単語辞書と、文テンプレートの記述に従い規則を生成
する規則生成部とを有するので、認識のための規則を自
動的に辞書から生成することで、人出では作成時に抜け
や誤りがあったものを、これらを回避することができ、
認識したい単語を記述するだけで(ここでいう文テンプ
レート)規則を別に書く作業がなくなり、効率的であ
る。 (2)前記文テンプレートで語について生成する制限を
記述し、これに基づいて規則を生成するので、記述に別
の観点が必要であるときに、それを混在させることな
く、正しい規則だけを生成することができる。また、観
点を分けて記述できるので、データの記述性や拡張性が
高まる。
なげて生成することを記述し、これに基づいて規則を生
成するので、記述の単位として複数の語を組み合わせる
ことができ、そのための規則を自動的に生成できるの
で、効率的である。 (4)前記文テンプレートで語が省略可能であることを
記述し、これに基づいて規則を生成するので、省略の可
能性のある語句について、その有無をトップレベルのデ
ータに記述するだけで有無を考慮した規則を生成するの
で、記述の手間が省け、効率的であり、データの記述性
や拡張性が高まる。
制限に条件名とその値とを記述し、これに基づいて規則
を生成するので、別観点での記述が必要な場合に、それ
を混在させることなく、また、人手で分類することな
く、正しい規則を生成できる。また、その時に必要な観
点とその値を指定できるので、優先して認識したい規則
だけを生成することができ、データの記述性や拡張性が
高まる。また、認識時に認識対象の絞り込みを行うこと
ができる。
件名とその値とを対にした制限を複数記述し、これに基
づいて規則を生成するので、記述の観点が複数あったと
きに、それを混在させることなく、また、人手で分類す
ることなく、正しい規則を生成できる。また、データの
記述性や拡張性が高まる。また、その時に必要な観点と
その値を指定できるので、その場合に優先して認識した
い規則だけを生成することができる。さらに、認識時に
認識対象の絞り込みを行うことができる。 (7)前記文テンプレートで語について条件名とその値
の可能な範囲を制限として記述し、これに基づいて規則
を生成するので、別観点での記述が必要な場合に、それ
を混在させることなく、また、人手で分類することな
く、正しい規則を生成できる。また、別観点の制限につ
いて、可能範囲を記述できることで、データの記述性や
拡張性が高まる。
述した文テンプレートと、語と語のグループを表すグル
ープ名からなる単語辞書と、語とその接続パタンを記述
した接続パタン辞書と、品詞と活用品詞と活用語尾を記
述した活用辞書と、複数の語をつなげて生成する場合
に、語の接続可否を検定し、それに基づいて規則を生成
する規則生成部とを有するので、助動詞など意味や品詞
以外の接続という別の観点での記述が必要なものに対し
て、それを自動的に生成することで、人手で分類するこ
となく、正しい規則ができ、効率的である。 (9)前記複数の語をつなげて生成する場合に、接続パ
タンが複数あった場合に、語の接続可否を検定し、それ
に基づいて規則を生成するので、助動詞など意味や品詞
以外の接続という別の観点での記述が必要なものに対し
て、それを自動的に生成することで、人手で分類するこ
となく、正しい規則ができ、効率的である。特に、意味
は同じでも接続の仕方の異なる語について、人手で分類
しなくてもよく、効率的であり、データの記述性が高ま
る。
する。図1は、本発明による規則生成装置の一実施例
(請求項1)を説明するための構成図で、図中、1は文
テンプレート、2は単語辞書、3は規則生成部である。
文テンプレート1は、認識する語または語のグループを
記述したものである。単語辞書2は、語と語のグループ
を表すグループ名から成っている。規則生成部3は、前
記文テンプレート1の記述に従い規則を生成する。すな
わち、本実施例の規則生成装置は、規則生成部3と単語
辞書2と文テンプレート1とからなる。文テンプレート
1に認識すべき語が記述され、これに基づいて、単語辞
書2を参照しながら規則を生成する。
示す図である。認識する単語の単語自体あるいは語のグ
ループ名を記述する。この記述に基づいて規則を生成す
るが、テンプレートの記述をトップレベルの左辺とし、
辞書を参照しながら、よみのレベルまでを規則として生
成する。
の表記とグループ名(ここでは意味),よみを対応づけ
て記述してある。文テンプレートで指定された語を辞書
から抽出し、認識対象語として規則を生成する。
された語と語のグループをトップの左辺とし、これらが
語であればよみを、グループ名であれば語(表記)を単
語辞書から抽出して右辺とする。次に、右辺について、
それぞれ単語辞書からよみを抽出し、左辺と右辺とす
る。右辺がよみになるまで行う。読みは、この場合、す
べてをひらがなで書かれた場合をいう。
の左辺を「$外出」とし、単語辞書から「$外出」の記
述を調べ、その語表記を得、それらを右辺として規則を
生成する。規則は、以下の表1のとおりである。
はないので、「外出」「出かける」について辞書を調
べ、「がいしゅつ」「でかける」を得る。それぞれを左
辺,右辺として、表2のような規則を生成する。
を終了する。最終的に生成された規則は(左辺→右辺
列)表3のとおりである。
する。本実施例の規則生成装置の構成図は、図1と同じ
である。図4は、請求項2の文テンプレートの例を示す
図である。認識する単語の単語自体あるいは語のグルー
プ名と、単語自体あるいは語のグループ名で指される語
の集合に制限を加える条件を付随して記述する。例で
は、「:」の前方「$外出」に対しての制限として「名
詞」という条件が記述されている。この記述に基づいて
規則を生成するが、テンプレートの記述をトップレベル
の左辺とし、辞書を参照しながらよみのレベルまでを規
則として生成する。
の表記とグループ名(ここでは意味),よみと品詞とを
対応づけて記述してある。ここでは、品詞を条件として
テンプレートに記述する。文テンプレートで指定された
語とその条件を参照して辞書から抽出し、認識対象語と
して規則を生成する。
ら順に処理を行う。文テンプレートに記述された語と語
のグループと条件をトップの左辺とし、これらについて
テンプレートの記述に従い、単語辞書から語を抽出して
右辺とする。次に右辺について、同様に単語辞書から語
を抽出し、左辺と右辺とする。これを右辺がよみになる
まで行う。よみは、この場合、すべてをひらがなで書か
れた場合をいう。
で、規則の左辺を「$外出:名詞」とし、単語辞書から
まず「$外出」の記述のある語を調べ、「外出」「出か
ける」を得る。「:」以降が条件なので、これらに対し
て「名詞」という記述が辞書にあるかどうか調べる。
「外出」にあるので、これを右辺とする。まだよみのレ
ベルではないので、次に「外出」を単語辞書からひき、
「がいしゅつ」を得、左辺と右辺とする。「がいしゅ
つ」はよみのレベルなので、ここでこの記述に対する処
理を終了する。残りのテンプレートの記述にも同様に処
理を行う。最終的に得られる規則は、以下の表4のとお
りである。
する。本実施例の規則生成装置の構成図は、図1と同じ
である。図6は、請求項3の文テンプレートの例を示す
図である。認識する単語の単語自体あるいは語のグルー
プ名を出現する順に記述してあるが、「+」の記号のあ
る項は前方の項とつなげて一単位で規則を生成する意味
である。例は、「$会議」に対して、「+」のついた
「$が」をつなげて一単位で規則を生成する意味であ
る。この記述に基づいて規則を生成するが、テンプレー
トの記述をトップレベルの左辺とし、辞書を参照しなが
らよみのレベルまでを規則として生成する。
の表記とグループ名(ここでは意味),よみとを対応づ
けて記述してある。文テンプレートで指定された語を辞
書から抽出し、認識対象語として規則を生成する。
された語と語のグループをトップの左辺とし、これらに
ついてテンプレートの記述に従い、単語辞書から語を抽
出して右辺とする。この時、後方の語に「+」の記号が
あれば、「+」のついた語を一まとまりで規則を生成す
る。左辺には、「+」で2項をつなげた記号を生成し、
その右辺には、それぞれの項をおく。次に、右辺の各項
について、単語辞書から語を抽出し、左辺と右辺とす
る。次に、右辺のよみを単語辞書から調べ、よみを右辺
におく。よみは、この場合、すべてをひらがなで書かれ
た場合をいう。
に「+」があるので、後方の語とつなげて生成する。後
方は、「$が」なので、規則の左辺を「$会議+$が」
とし、右辺には「$会議」,「$が」をおく。これを表
5に示す。
議」の記述のある語を調べ、語「会議」「打ち合わせ」
を得る。「$が」についても同様にし、語「が」「は」
を得る。各右辺について、よみのレベルでない「会議」
「打ち合わせ」について単語辞書をひき、「かいぎ」
「うちあわせ」を得る。右辺がすべてよみのレベルなの
で、ここでこの記述に対する処理を終了する。最終的に
得られる規則は、以下の表6のとおりである。
する。本実施例の規則生成装置の構成図は、図1と同じ
である。図8は、請求項4の文テンプレートの例を示す
図である。認識する単語の単語自体あるいは語のグルー
プ名を出現する順に記述してある。「%」は、その語が
省略される可能性のある語であることを表している。こ
の記述に基づいて規則を生成するが、テンプレートの記
述をトップレベルの左辺とし、辞書を参照しながら、よ
みのレベルまでを規則として生成する。
の表記とグループ名(ここでは意味),よみとを対応づ
けて記述してある。文テンプレートで指定された語を辞
書から抽出し、認識対象語として規則を生成する。
された語と語のグループをトップの左辺とし、これらに
ついてテンプレートの記述に従い、単語辞書から語を抽
出して右辺とする。この時、語に「%」の記号があれ
ば、省略される可能性があるので、例えば「+」のつい
た語であれば、この語とつなげたものと、この語のない
ものとの2種類の規則を生成する。「+」がなければ、
「%」を除いた記号のものを生成する。
に「+」があるので、後方の語とつなげて生成するが、
後方は「%$が」なので、規則の左辺を「$会議+%$
が」とし、「$が」があるのと、ないのとを生成する。
これを表7に示す。
議」の記述のある語を調べ、「会議」「打ち合わせ」を
得る。「$が」についても同様にし、「が」「は」を得
る。各右辺について、よみのレベルでない「会議」「打
ち合わせ」について単語辞書をひき、「かいぎ」「うち
あわせ」を得る。右辺がすべてよみのレベルなので、こ
こでこの記述に対する処理を終了する。最終的に得られ
る規則は、以下の表8のとおりである。
する。本実施例の規則生成装置の構成図は図1と同じで
ある。図9は、請求項5の文テンプレートの例を示す図
である。認識する単語の単語自体あるいは語のグループ
名と、単語自体あるいは語のグループ名で指される語の
集合に制限を加える条件名とその値を付随して記述す
る。例では「:」の前方「$会議」に対しての制限とし
て条件名「頻度」,その値「1」であるものを指定する
ことで、「$会議」で指される語の中からその条件にあ
ったものだけを規則として生成する。
語の表記とグループ名(ここでは意味)とよみと条件と
を対応づけて記述してある。ここでは、頻度を条件とし
てその値を記述する。文テンプレートで指定された語と
その条件を参照して辞書から抽出し、認識対象語として
規則を生成する。
された語と語のグループと条件をトップの左辺とし、こ
れらについてテンプレートの記述に従い、単語辞書から
語を抽出して右辺とする。次に、右辺について、同様に
単語辞書から語を抽出し、左辺と右辺とする。これを右
辺がよみになるまで行う。よみは、この場合、すべてを
ひらがなで書かれた場合をいう。
で、規則の左辺を「$会議:頻度=1」とし、単語辞書
から、まず「$会議」の記述のある語を調べ、「会議」
「打ち合わせ」を得る。「:」以降が条件なので、これ
らに対して「頻度」の項目の値が「1」であるという記
述のものが辞書にあるかどうか調べる。「会議」が該当
するので、これを右辺とする。まだよみのレベルではな
いので、次に「会議」を単語辞書からひき、「かいぎ」
を得、左辺と右辺とする。「かいぎ」はよみのレベルな
ので、ここでこの記述に対する処理を終了する。残りの
テンプレートの記述にも同様に処理を行う。最終的に得
られる規則は、以下の表9のとおりである。
する。本実施例の規則生成装置の構成図は図1と同じで
ある。図11は、請求項6の文テンプレートの例を示す
図である。認識する単語の単語自体あるいは語のグルー
プ名と、単語自体あるいは語のグループ名で指される語
の集合に制限を加える条件名とその値を付随して記述す
る。例では、「:」の前方「$会議」に対しての制限と
して条件名「品詞」,その値「名詞」と条件名「頻
度」,その値「1」であるものを指定している。「$会
議」で指される語の中から、その条件にあったものだけ
を規則として生成する。
語の表記とグループ名(ここでは意味)とよみと条件と
を対応づけて記述してある。ここでは、頻度を条件とし
てその値を記述する。文テンプレートで指定された語と
その条件を参照して辞書から抽出し、認識対象語として
規則を生成する。
された語と語のグループと条件をトップの左辺とし、こ
れらについてテンプレートの記述に従い、単語辞書から
語を抽出して右辺とする。次に、右辺について、同様に
単語辞書から語を抽出し、左辺と右辺とする。これを右
辺がよみになるまで行う。よみは、この場合、すべてを
ひらがなで書かれた場合をいう。
述されているので、規則の左辺を「$会議:品詞=名
詞,頻度=1」とし、単語辞書から、まず「$会議」の
記述のある語を調べ、「会議」「打ち合わせ」「打ち合
せる」を得る。「:」以降が条件なので、これらに対し
て「品詞」の項目の値が「名詞」であるという記述のも
のが辞書にあるかどうか調べる。「会議」「打ち合わ
せ」が該当する。続いて、これらに対して「頻度」の項
目の値が「1」であるという記述のものが辞書にあるか
どうか調べる。「会議」が該当する。これを右辺とす
る。まだ、よみのレベルではないので、次に「会議」を
単語辞書からひき、「かいぎ」を得、左辺と右辺とす
る。「かいぎ」はよみのレベルなので、ここでこの記述
に対する処理を終了する。残りのテンプレートの記述に
も同様に処理を行う。最終的に得られる規則は、以下の
表10のとおりである。
する。本実施例の規則生成装置の構成図は図1と同じで
ある。図13は、請求項7の文テンプレートの例を示す
図である。認識する単語の単語自体あるいは語のグルー
プ名と、単語自体あるいは語のグループ名で指される語
の集合に制限を加える条件名とその値の範囲を付随して
記述する。例では、「:」の前方「$会議」に対しての
制限として、条件名「頻度」でその値の範囲が「0」よ
り大であるものを指定することで、「$会議」で指され
る語の中からその条件にあったものだけを規則として生
成する。値の範囲に、例の「>」(指定より大)以外
に、「<」(指定より小)「!=」(指定以外の値)も
指定可能である。
語の表記とグループ名(ここでは意味)とよみと条件と
を対応づけて記述してある。ここでは、頻度を条件とし
てその値を記述する。文テンプレートで指定された語と
その条件を参照して辞書から抽出し、認識対象語として
規則を生成する。
された語と語のグループと条件をトップの左辺とし、こ
れらについてテンプレートの記述に従い、単語辞書から
語を抽出して右辺とする。次に、右辺について、同様に
単語辞書から語を抽出し、左辺と右辺とする。これを右
辺がよみになるまで行う。よみは、この場合、すべてを
ひらがなで書かれた場合をいう。
ので、規則の左辺を「$会議:頻度>0」とし、単語辞
書から、まず「$会議」の記述のある語を調べ、「会
議」「打ち合わせ」を得る。「:」以降が条件なので、
これらに対して「頻度」の項目の値が「0より大」であ
るという記述のものが辞書にあるかどうか調べる。「会
議」が該当するので、これを右辺とする。まだ、よみの
レベルではないので、次に「会議」を単語辞書からひ
き、「かいぎ」を得、左辺と右辺とする。「かいぎ」は
よみのレベルなので、ここでこの記述に対する処理を終
了する。残りのテンプレートの記述にも同様に処理を行
う。最終的に得られる規則は、以下の表11のとおりで
ある。
する。図15は、本発明による規則生成装置の他の実施
例(請求項8)を説明するための構成図で、図中、4は
接続パタン辞書、5は活用辞書で、その他、図1と同じ
作用をする部分は同一の符号を付してある。文テンプレ
ート1は、認識する語又は語のグループを記述したもの
である。単語辞書2は、語と語のグループを表すグルー
プ名から成っている。接続パタン辞書4は、語とその接
続パタンを記述したものである。活用辞書5は、品詞と
活用品詞と活用語尾を記述したものである。規則生成部
3は、複数の語をつなげて生成する場合に、語の接続可
否を検定し、それに基づいて規則を生成するものであ
る。
テンプレート1と単語辞書2と接続パタン辞書4と活用
辞書5と規則生成部3とからなる。文テンプレート1に
認識すべき語が記述され、これに基づいて、単語辞書2
を参照しながら規則を生成する。「+」の記号がある場
合には、2語を結合して規則を生成するが(請求項
3)、この場合に接続しうるものか、そうでないものか
を、接続パタンで検定し、接続しうる規則だけを、場合
によっては活用辞書5で活用形に展開して生成する。特
に、日本語では助動詞が接続の制限がきついので、特に
助動詞についてこの処理が行われる。
を示す図である。認識する単語の単語自体あるいは語の
グループ名を出現する順に記述してあるが、「+」の記
号のある項は、前方の項とつなげて一単位で規則を生成
する意味である。例は、「$外出」に対して「+」のつ
いた「$意志」をつなげて、一単位で規則を生成する意
味である。この時、語によっては接続するものとしない
ものとがある。それらを接続パタンに記述し、この記述
に基づいて接続検定し規則を生成する。
語の表記とグループ名(ここでは意味)とよみと品詞と
を対応づけて記述してある。文テンプレートで指定され
た語とその条件を参照して辞書から抽出し、認識対象語
として規則を生成する。
動詞や助動詞など、活用のある語について活用形と語尾
を記述する。品詞名と活用品詞名と語尾とからなる。語
尾は基本形から1文字とって、付け加える語のことであ
る。「*」は一文字とるだけで何も加えない意味であ
る。
ある。品詞名と接続パタンとからなる。その品詞が前方
に接続しうる品詞や活用形を接続パタンとして書く。品
詞や活用形は、単語辞書の品詞名もしくは活用辞書の活
用品詞名の一文字以上である(識別できる範囲)。本実
施例の処理は、文テンプレートに記述された語と語のグ
ループをトップの左辺とし、これらについてテンプレー
トの記述に従い、単語辞書から語を抽出し右辺とする。
この時、後方の語に「+」の記号があれば、「+」のつ
いた語を一まとまりで生成する。
「+」で2項をつなげた記号として生成する。 (2),後方の語の品詞が接続パタンにあれば、その接続
パタンを得る。 (3),前方の語について、単語辞書、またその品詞で活
用辞書を参照し、接続パタンがあれば(接続パタンが部
分文字列にあれば)、その活用形の表記,よみを生成す
る。 (4),前方の語には接続パタンを制約名として「:」
で区切って生成する。 (5),(1)を左辺として、その右辺に制約付きの前
方の語と後方の語をおく。 (6),右辺のそれぞれを対応する表記,よみで規則を
生成する。
かつ後方に「+」があるので、後方の語とつなげて生成
する。「$外出+$意志」 (2),後方は「$意志」であり、後方の語を単語辞書
で調べると、語「たい」品詞「助動詞たい」を得る。接
続パタン辞書で調べると、品詞「助動詞たい」は「用」
である。 (3),前方の「$外出」を辞書検索し、語「外出」品
詞「サ変名詞」,語「出かける」品詞「一段動詞」を得
る。「用」という記述はないので、次に活用辞書を品詞
で調べ、「一段動詞」の「連用」を得る(部分文字列に
あればよい)。 (4),一段動詞「出かける」の語尾を活用辞書に従
い、一文字とり、「出かけ」を得る。よみも同様にして
「でかけ」を得る。 (5),前方の語「$外出」に制約をつけ「$外出:
用」を生成する。 (6),(1)の左辺と制約つきの(5)と後方の語を
おく。これを表12に示す。
びつける。 最終的に得られる規則は、以下の表13のとおりであ
る。
する。本実施例の規則生成装置の構成図は図15と同じ
である。図20は、請求項9の文テンプレートの例を示
す図である。認識する単語の単語自体あるいは語のグル
ープ名を出現する順に記述してあるが、「+」の記号の
ある項は前方の項とつなげて一単位で規則を生成する意
味である。例は、「$予約」に対して「+」のついた
「$受身」をつなげて一単位で規則を生成する意味であ
る。この時、語によっては接続するものとしないものと
がある。それらを接続パタンに記述し、この記述に基づ
いて接続検定し、規則を生成する。
語の表記とグループ名(ここでは意味)とよみと品詞と
を対応づけて記述してある。文テンプレートで指定され
た語とその条件を参照して辞書から抽出し、認識対象語
として規則を生成する。
動詞や助動詞など、活用のある語について活用形と語尾
を記述する。品詞名と活用品詞名と語尾とからなる語尾
は、基本形から1文字とって付け加える語のことであ
る。「*」は一文字とるだけで何も加えない意味であ
る。
ある。品詞名と接続パタンとからなる。その品詞が前方
に接続しうる品詞や活用形を接続パタンとして書く。品
詞や活用形は単語辞書の品詞名もしくは活用辞書の活用
品詞名の一文字以上である(識別できる範囲)。
された語と語のグループをトップの左辺とし、これらに
ついてテンプレートの記述に従い、単語辞書から語を抽
出して右辺とする。この時、後方の語に「+」の記号が
あれば「+」のついた語を一まとまりで生成する。
を「+」で2項をつなげた記号として生成する。 (2),後方の語の品詞が接続パタンにあれば、以下を
接続パタンの数だけ繰り返す。 (3),前方の語について、単語辞書、またその品詞で
活用辞書を参照し、接続パタンがあればその活用形の表
記,よみを生成する。 (4),前方の語には接続パタンを制約名として「:」
で区切って生成する。 (5),後方の語には接続パタンを要求した制約名とし
て「<」で区切って生成する。 (6),(1)を左辺として、その右辺に制約付きの前
方の語と後方の語をおく。 (7),右辺のそれぞれを対応する表記,よみで規則を
生成する。
かつ後方に「+」があるので、後方の語とつなげて生成
する。「$予約+$受身」 (2),後方は「$受身」であり、後方の語を単語辞書
で調べると、語「れる」品詞「助動詞れる」,語「られ
る」品詞「助動詞られる」を得る。それぞれを接続パタ
ン辞書で調べると、品詞「助動詞れる」は「未」、品詞
「助動詞られる」は「1用」である。
詞「わ行5段動詞」,語「入れる」品詞「一段動詞」を
得る。「未」という記述はないので、次に活用辞書を品
詞で調べ、「わ行5段動詞」の「未」を得る。 (4),わ行5段動詞「使う」の語尾を一文字とり、語
尾「わ」を加え、「使わ」を得る。よみも同様にして
「つかわ」を得る。 (5),前方の語「$予約」に制約をつけ「$予約:
未」を、後方の語「$受身」に要求の制約をつけ、「$
受身<未」を生成する。 (6),(1)の左辺と、(5)をおく。これを表14
に示す。
びつける。
詞「わ行5段動詞」,語「入れる」品詞「一段動詞」を
得る。「1用」という記述はないので、次に活用辞書を
品詞で調べ、「1段動詞」の「1用」を得る。 (9),一段動詞「入れる」の語尾を一文字とり、「入
れ」を得、よみも同様にして「いれ」を得る。 (10),前方の語「$予約に制約をつけ「$予約:1
用」を、後方の語「$受身」に要求の制約をつけ「$受
身<1用」を生成する。 (11),(1)の左辺と(10)をおく。これを表1
5に示す。
ける。最終的に得られる規則は以下の表16である。
によると、以下のような効果がある。 (1)請求項1に対応する効果:認識のための規則を自
動的に辞書から生成することで、人出では作成時に抜け
や誤りがあったものを、これらを回避することができ、
認識したい語を記述するだけで(ここでいう文テンプレ
ート)規則を別に書く作業がなくなり、効率的である。 (2)請求項2に対応する効果:記述に別の観点が必要
であるときに、それを混在させることなく、正しい規則
だけを生成することができる。観点を分けて記述できる
ので、データの記述性や拡張性が高まる。 (3)請求項3に対応する効果:記述の単位として複数
の語を組み合わせることができ、そのための規則を自動
的に生成できるので、効率的である。 (4)請求項4に対応する効果:省略の可能性のある語
句について、その有無をトップレベルのデータに記述す
るだけで、有無を考慮した規則を生成するので、記述の
手間が省け、効率的であり、データの記能性や拡張性が
高まる。 (5)請求項5に対応する効果:別観点での記述が必要
な場合に、それを混在させることなく、人手で分類する
ことなく、正しい規則を生成できる。また、その時に必
要な観点とその値を指定できるので、優先して認識した
い規則だけを生成することができ、データの記述性や拡
張性が高まる。 (6)請求項6に対応する効果:記述の観点が複数あっ
たときに、それを混在させることなく、人手で分類する
ことなく、正しい規則を生成できる。データの記述性や
拡張性が高まる。また、その時に必要な観点とその値を
指定できるので、その場合に優先して認識したい規則だ
けを生成することができる。認識時に認識対象の絞り込
みを行うことができる。 (7)請求項7に対応する効果:別観点での記述が必要
な場合に、それを混在させることなく、人手で分類する
ことなく、正しい規則を生成できる。別観点の制限につ
いて、可能範囲を記述できることで、データの記述性や
拡張性が高まる。 (8)請求項8に対応する効果:助動詞など意味や品詞
以外の接続という別の観点での記述が必要なものに対し
て、それを自動的に生成することで、人手で分類するこ
となく、正しい規則ができ、効率的である。 (9)請求項9に対応する効果:助動詞など意味や品詞
以外の接続という別の観点での記述が必要なものに対し
て、それを自動的に生成することで、人手で分類するこ
となく、正しい規則ができ、効率的である。特に意味は
同じでも、接続の仕方の異なる語について、人手で記述
しなくてもよく、効率的であり、データの記述性が高ま
る。
するための構成図である。
である。
る。
す図である。
ある。
を示す図である。
図である。
を示す図である。
を示す図である。
す図である。
例を示す図である。
す図である。
例を示す図である。
す図である。
説明するための構成図である。
例を示す図である。
す図である。
図である。
る。
例を示す図である。
す図である。
示す図である。
である。
4…接続パタン辞書、5…活用辞書。
Claims (9)
- 【請求項1】 認識する語または語のグループを記述し
た文テンプレートと、語と語のグループを表すグループ
名からなる単語辞書と、文テンプレートの記述に従い規
則を生成する規則生成部とを有することを特徴とする規
則生成装置。 - 【請求項2】 前記文テンプレートで語について生成す
る制限を記述し、該記述に基づいて規則を生成すること
を特徴とする請求項1記載の規則生成装置。 - 【請求項3】 前記文テンプレートで複数の語をつなげ
て生成することを記述し、該記述に基づいて規則を生成
することを特徴とする請求項1記載の規則生成装置。 - 【請求項4】 前記文テンプレートで語が省略可能であ
ることを記述し、該記述に基づいて規則を生成すること
を特徴とする請求項1記載の規則生成装置。 - 【請求項5】 前記文テンプレートで語についての制限
に条件名とその値とを記述し、該記述に基づいて規則を
生成することを特徴とする請求項1記載の規則生成装
置。 - 【請求項6】 前記文テンプレートで語について条件名
とその値とを対にした制限を複数記述し、該記述に基づ
いて規則を生成することを特徴とする請求項5記載の規
則生成装置。 - 【請求項7】 前記文テンプレートで語について条件名
とその値の可能な範囲を制限として記述し、該記述に基
づいて規則を生成することを特徴とする請求項5記載の
規則生成装置。 - 【請求項8】 認識する語または語のグループを記述し
た文テンプレートと、語と語のグループを表すグループ
名からなる単語辞書と、語とその接続パタンを記述した
接続パタン辞書と、品詞と活用品詞と活用語尾を記述し
た活用辞書と、複数の語をつなげて生成する場合に、語
の接続可否を検定し、それに基づいて規則を生成する規
則生成部とを有することを特徴とする規則生成装置。 - 【請求項9】 前記複数の語をつなげて生成する場合
に、接続パタンが複数あった場合に、語の接続可否を検
定し、それに基づいて規則を生成することを特徴とする
請求項8記載の規則生成装置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP00121895A JP3526095B2 (ja) | 1995-01-09 | 1995-01-09 | 規則生成装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP00121895A JP3526095B2 (ja) | 1995-01-09 | 1995-01-09 | 規則生成装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
JPH08190399A true JPH08190399A (ja) | 1996-07-23 |
JP3526095B2 JP3526095B2 (ja) | 2004-05-10 |
Family
ID=11495336
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP00121895A Expired - Fee Related JP3526095B2 (ja) | 1995-01-09 | 1995-01-09 | 規則生成装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP3526095B2 (ja) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2019091416A (ja) * | 2017-11-16 | 2019-06-13 | バイドゥ オンライン ネットワーク テクノロジー (ベイジン) カンパニー リミテッド | 人工知能応用を構築する方法及び装置 |
JP2023013585A (ja) * | 2021-07-16 | 2023-01-26 | 株式会社東芝 | 情報処理装置、方法およびプログラム |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS6386019A (ja) * | 1986-09-30 | 1988-04-16 | Ricoh Co Ltd | メツセ−ジ発生装置 |
JPS63136260A (ja) * | 1986-11-28 | 1988-06-08 | Fujitsu Ltd | 機械翻訳システムにおける文生成処理方式 |
JPS63198162A (ja) * | 1987-02-13 | 1988-08-16 | Matsushita Electric Ind Co Ltd | 文章生成用文脈処理装置 |
JPH05298349A (ja) * | 1992-04-20 | 1993-11-12 | Hitachi Ltd | 共起関係知識学習方法、そのシステム、並びに共起関係辞書およびその利用方法 |
JPH06186994A (ja) * | 1992-12-15 | 1994-07-08 | Ricoh Co Ltd | 音声認識装置 |
JPH07175496A (ja) * | 1993-12-18 | 1995-07-14 | Ricoh Co Ltd | 文生成装置 |
-
1995
- 1995-01-09 JP JP00121895A patent/JP3526095B2/ja not_active Expired - Fee Related
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS6386019A (ja) * | 1986-09-30 | 1988-04-16 | Ricoh Co Ltd | メツセ−ジ発生装置 |
JPS63136260A (ja) * | 1986-11-28 | 1988-06-08 | Fujitsu Ltd | 機械翻訳システムにおける文生成処理方式 |
JPS63198162A (ja) * | 1987-02-13 | 1988-08-16 | Matsushita Electric Ind Co Ltd | 文章生成用文脈処理装置 |
JPH05298349A (ja) * | 1992-04-20 | 1993-11-12 | Hitachi Ltd | 共起関係知識学習方法、そのシステム、並びに共起関係辞書およびその利用方法 |
JPH06186994A (ja) * | 1992-12-15 | 1994-07-08 | Ricoh Co Ltd | 音声認識装置 |
JPH07175496A (ja) * | 1993-12-18 | 1995-07-14 | Ricoh Co Ltd | 文生成装置 |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2019091416A (ja) * | 2017-11-16 | 2019-06-13 | バイドゥ オンライン ネットワーク テクノロジー (ベイジン) カンパニー リミテッド | 人工知能応用を構築する方法及び装置 |
JP2023013585A (ja) * | 2021-07-16 | 2023-01-26 | 株式会社東芝 | 情報処理装置、方法およびプログラム |
Also Published As
Publication number | Publication date |
---|---|
JP3526095B2 (ja) | 2004-05-10 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Roche et al. | Deterministic part-of-speech tagging with finite state transducers | |
US5610812A (en) | Contextual tagger utilizing deterministic finite state transducer | |
US6778949B2 (en) | Method and system to analyze, transfer and generate language expressions using compiled instructions to manipulate linguistic structures | |
US20040167771A1 (en) | Method and system for reducing lexical ambiguity | |
US8392191B2 (en) | Chinese prosodic words forming method and apparatus | |
JP3921523B2 (ja) | テキスト生成方法及びテキスト生成装置 | |
EP0953192A1 (en) | Natural language parser with dictionary-based part-of-speech probabilities | |
JP5625827B2 (ja) | 形態素解析装置、音声合成装置、形態素解析方法及び形態素解析プログラム | |
Feldman et al. | TEG—a hybrid approach to information extraction | |
Filippova et al. | Generating constituent order in German clauses | |
Kadim et al. | Parallel HMM-based approach for arabic part of speech tagging. | |
Goyal et al. | Analysis of Sanskrit text: Parsing and semantic relations | |
JP3526095B2 (ja) | 規則生成装置 | |
JP3526063B2 (ja) | 音声認識装置 | |
JP3518340B2 (ja) | 読み韻律情報設定方法及び装置及び読み韻律情報設定プログラムを格納した記憶媒体 | |
Min et al. | Syntactic recovery and spelling correction of ill-formed sentences | |
Gibbon et al. | Spoken Language Characterization | |
Kardava et al. | Morphological synthesis and analysis of georgian words | |
Zhang et al. | Exploring features for identifying edited regions in disfluent sentences | |
JP3358100B2 (ja) | 日本語質問メッセージ解析方法及び装置 | |
Shiue et al. | Smart vs. Solid Solutions in Computational Linguistics—Machine Translation or Information Retrieval | |
JPH07175496A (ja) | 文生成装置 | |
Eme et al. | Hiatus Resolution in Urhobo: A Constraint-Based Account | |
JP3378059B2 (ja) | 文生成装置 | |
Murthy | Parsing Telugu in the UCSG formalism |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20040210 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20040212 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20080227 Year of fee payment: 4 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20090227 Year of fee payment: 5 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20100227 Year of fee payment: 6 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20110227 Year of fee payment: 7 |
|
LAPS | Cancellation because of no payment of annual fees |