JPH08190399A

JPH08190399A - 規則生成装置

Info

Publication number: JPH08190399A
Application number: JP7001218A
Authority: JP
Inventors: Masako Hirose; 雅子広瀬
Original assignee: Ricoh Co Ltd
Current assignee: Ricoh Co Ltd
Priority date: 1995-01-09
Filing date: 1995-01-09
Publication date: 1996-07-23
Anticipated expiration: 2019-05-10
Also published as: JP3526095B2

Abstract

(57)【要約】【目的】複数の分類基準をもつ語や表現を基準を混在
させることなく記述し、かつ、構文的，意味的に正し
い、条件にあった語や語列を規則として生成する。【構成】文テンプレート１は、認識する語または語の
グループを記述したものである。単語辞書２は、語と語
のグループを表すグループ名から成っている。規則生成
部３は、前記文テンプレート１の記述に従い規則を生成
する。すなわち、規則生成部３と単語辞書２と文テンプ
レート１とからなる。文テンプレート１に認識すべき語
が記述され、これに基づいて、単語辞書２を参照しなが
ら規則を生成する。認識のための規則を自動的に辞書か
ら生成することで、人出では作成時に抜けや誤りがあっ
たものを、これらを回避することができ、認識したい単
語を記述するだけで（文テンプレート）規則を別に書く
作業がなくなり、効率的である。

Description

【発明の詳細な説明】

【０００１】

【産業上の利用分野】本発明は、規則生成装置に関し、
より詳細には、音声認識の文認識や対話処理における規
則生成装置に関する。

【０００２】

【従来の技術】音声認識で文節内などの語内の並びを規
定するときに、一般的に書き替え規則の形で記述するこ
とがある。書き替え規則は機械で扱いやすい形をしてお
り、機械処理でよく使われるデータ記述法である。書き
替え規則は、言語現象を対象とした場合に、人間の直観
的な記述においては非常に書きにくい。これは、言語現
象を記述しようとしたときには、一つの観点で記述して
いくことは不可能で、構文，意味など複数の観点が混在
することが理由の一つである。

【０００３】例えば、文献「連続音声認識・理解シス
テムのための構文解析法の比較・検討」（中川外１名
情報処理学会論文誌 vol.30, No.8, 1989.10）によ
れば、文脈自由文法をＬＲテーブルにして、ＨＭＭ（Hi
dden Markov Model）と統合して決定的に認識を行って
いく方法を提案している。使用されている文法をみる
と、構文的な性質（名詞）と意味との二つの観点が混在
して書かれている。

【０００４】また、文献「音声認識における言語モデ
ルについて」（北外１名人工知能学会研究会 SIG-SL
UD-9201,9201）のように、複雑な言語現象を書き替え規
則で書き示そうとすると、非文を多く生成してしまうと
いう報告もある。すなわち、ＨＭＭ−ＬＲでは、タスク
を記述する文脈自由文法を用いることにより、音声認識
の探索範囲を縮小している。ＨＭＭ−ＬＲで用いられて
いる文法からランダムに文を生成し、生成された文のう
ちの何割が日本語として正しいかをチェックしたもので
ある。また、音声認識では、認識候補単語数が認識率や
認識時間に影響する。できるだけ候補単語を絞り込むこ
とが重要である。構文的に正しさだけでなく、タスクで
の意味やその他の観点から認識する語を絞り込む必要が
ある。

【０００５】また、文献「自由発話音声認識における
意味を考慮した２段ＬＲパーザ」（南外３名日本音
響学会講演論文集 3-4-10, 1993.3）によれば、文法，
ＬＲテーブルを意味のレベルで分けてつくるようにして
いる。すなわち、電話番号案内のタスクでの自由発声文
に対応するために、文脈自由文法は、認識の途中で問い
合わせ内容が全く同じ候補でも、音韻系列の少しだけ違
う候補を沢山生成して探索空間の爆発を起こす。このた
め、有効な意味をもつ候補がビーム幅の外側に追いやら
れて、認識性能の劣化の原因の一つとなっていた。そこ
で、認識の過程で意味を考慮して、同じ意味を持つ音韻
系列の候補をマージし、有効な候補をビーム幅内に残し
ていくことが提案されている。

【０００６】

【発明が解決しようとする課題】前述のように、文献
のものは、語を追加，修正するときには、常に複数の分
類観点を意識して記述していかねばならない。また、文
献のものは、正しい候補を生成するという点で、書き
替え規則は記述性が低いという点がある。さらに、文献
のものは、タスクによっては、一つの基準での分類に
とどまらず、複数の基準が必要になるものや、ある特定
の条件の語だけ先に照合したいといった場合が考えられ
る。

【０００７】前述した文脈自由文法では、分類基準が増
えると規則を書き変えなければならない。また、それだ
け枝分かれが増え、かつノードの種類も増え、データの
記述が非常に繁雑になっていた。また、特に音声認識の
場合、文を規則化する構文的な単位とは必ずしも一致せ
ず、長さの短いものは複数の単語を組み合わせて認識し
た方が認識しやすい場合もある。この場合も、そのため
の規則をそれごとに用意する必要があった。

【０００８】本発明は、このような実情に鑑みてなされ
たもので、複数の分類基準をもつ語や表現を基準を混在
させることなく記述し、かつ、構文的，意味的に正し
い、条件にあった語や語列を規則として生成する規則生
成装置を提供することを目的としている。

【０００９】

【課題を解決するための手段】本発明は、上記課題を解
決するために、（１）認識する語または語のグループを
記述した文テンプレートと、語と語のグループを表すグ
ループ名からなる単語辞書と、文テンプレートの記述に
従い規則を生成する規則生成部とを有すること、更に
は、（２）前記文テンプレートで語について生成する制
限を記述し、該記述に基づいて規則を生成すること、更
には、（３）前記文テンプレートで複数の語をつなげて
生成することを記述し、該記述に基づいて規則を生成す
ること、更には、（４）前記文テンプレートで語が省略
可能であることを記述し、該記述に基づいて規則を生成
すること、更には、（５）前記文テンプレートで語につ
いての制限に条件名とその値とを記述し、該記述に基づ
いて規則を生成すること、更には、（６）前記（５）に
おいて、前記文テンプレートで語について条件名とその
値とを対にした制限を複数記述し、該記述に基づいて規
則を生成すること、更には、（７）前記（５）におい
て、前記文テンプレートで語について条件名とその値の
可能な範囲を制限として記述し、該記述に基づいて規則
を生成すること、或いは、（８）認識する語または語の
グループを記述した文テンプレートと、語と語のグルー
プを表すグループ名からなる単語辞書と、語とその接続
パタンを記述した接続パタン辞書と、品詞と活用品詞と
活用語尾を記述した活用辞書と、複数の語をつなげて生
成する場合に、語の接続可否を検定し、それに基づいて
規則を生成する規則生成部とを有すること、更には、
（９）前記（８）において、前記複数の語をつなげて生
成する場合に、接続パタンが複数あった場合に、語の接
続可否を検定し、それに基づいて規則を生成することを
特徴としたものである。

【００１０】

【作用】前記構成を有する本発明の規則生成装置は、
（１）認識する語または語のグループを記述した文テン
プレートと、語と語のグループを表すグループ名からな
る単語辞書と、文テンプレートの記述に従い規則を生成
する規則生成部とを有するので、認識のための規則を自
動的に辞書から生成することで、人出では作成時に抜け
や誤りがあったものを、これらを回避することができ、
認識したい単語を記述するだけで（ここでいう文テンプ
レート）規則を別に書く作業がなくなり、効率的であ
る。（２）前記文テンプレートで語について生成する制限を
記述し、これに基づいて規則を生成するので、記述に別
の観点が必要であるときに、それを混在させることな
く、正しい規則だけを生成することができる。また、観
点を分けて記述できるので、データの記述性や拡張性が
高まる。

【００１１】（３）前記文テンプレートで複数の語をつ
なげて生成することを記述し、これに基づいて規則を生
成するので、記述の単位として複数の語を組み合わせる
ことができ、そのための規則を自動的に生成できるの
で、効率的である。（４）前記文テンプレートで語が省略可能であることを
記述し、これに基づいて規則を生成するので、省略の可
能性のある語句について、その有無をトップレベルのデ
ータに記述するだけで有無を考慮した規則を生成するの
で、記述の手間が省け、効率的であり、データの記述性
や拡張性が高まる。

【００１２】（５）前記文テンプレートで語についての
制限に条件名とその値とを記述し、これに基づいて規則
を生成するので、別観点での記述が必要な場合に、それ
を混在させることなく、また、人手で分類することな
く、正しい規則を生成できる。また、その時に必要な観
点とその値を指定できるので、優先して認識したい規則
だけを生成することができ、データの記述性や拡張性が
高まる。また、認識時に認識対象の絞り込みを行うこと
ができる。

【００１３】（６）前記文テンプレートで語について条
件名とその値とを対にした制限を複数記述し、これに基
づいて規則を生成するので、記述の観点が複数あったと
きに、それを混在させることなく、また、人手で分類す
ることなく、正しい規則を生成できる。また、データの
記述性や拡張性が高まる。また、その時に必要な観点と
その値を指定できるので、その場合に優先して認識した
い規則だけを生成することができる。さらに、認識時に
認識対象の絞り込みを行うことができる。（７）前記文テンプレートで語について条件名とその値
の可能な範囲を制限として記述し、これに基づいて規則
を生成するので、別観点での記述が必要な場合に、それ
を混在させることなく、また、人手で分類することな
く、正しい規則を生成できる。また、別観点の制限につ
いて、可能範囲を記述できることで、データの記述性や
拡張性が高まる。

【００１４】（８）認識する語または語のグループを記
述した文テンプレートと、語と語のグループを表すグル
ープ名からなる単語辞書と、語とその接続パタンを記述
した接続パタン辞書と、品詞と活用品詞と活用語尾を記
述した活用辞書と、複数の語をつなげて生成する場合
に、語の接続可否を検定し、それに基づいて規則を生成
する規則生成部とを有するので、助動詞など意味や品詞
以外の接続という別の観点での記述が必要なものに対し
て、それを自動的に生成することで、人手で分類するこ
となく、正しい規則ができ、効率的である。（９）前記複数の語をつなげて生成する場合に、接続パ
タンが複数あった場合に、語の接続可否を検定し、それ
に基づいて規則を生成するので、助動詞など意味や品詞
以外の接続という別の観点での記述が必要なものに対し
て、それを自動的に生成することで、人手で分類するこ
となく、正しい規則ができ、効率的である。特に、意味
は同じでも接続の仕方の異なる語について、人手で分類
しなくてもよく、効率的であり、データの記述性が高ま
る。

【００１５】

【実施例】実施例について、図面を参照して以下に説明
する。図１は、本発明による規則生成装置の一実施例
（請求項１）を説明するための構成図で、図中、１は文
テンプレート、２は単語辞書、３は規則生成部である。
文テンプレート１は、認識する語または語のグループを
記述したものである。単語辞書２は、語と語のグループ
を表すグループ名から成っている。規則生成部３は、前
記文テンプレート１の記述に従い規則を生成する。すな
わち、本実施例の規則生成装置は、規則生成部３と単語
辞書２と文テンプレート１とからなる。文テンプレート
１に認識すべき語が記述され、これに基づいて、単語辞
書２を参照しながら規則を生成する。

【００１６】図２は、請求項１の文テンプレートの例を
示す図である。認識する単語の単語自体あるいは語のグ
ループ名を記述する。この記述に基づいて規則を生成す
るが、テンプレートの記述をトップレベルの左辺とし、
辞書を参照しながら、よみのレベルまでを規則として生
成する。

【００１７】図３は、単語辞書の例を示す図である。語
の表記とグループ名（ここでは意味），よみを対応づけ
て記述してある。文テンプレートで指定された語を辞書
から抽出し、認識対象語として規則を生成する。

【００１８】本実施例の処理は、文テンプレートに記述
された語と語のグループをトップの左辺とし、これらが
語であればよみを、グループ名であれば語（表記）を単
語辞書から抽出して右辺とする。次に、右辺について、
それぞれ単語辞書からよみを抽出し、左辺と右辺とす
る。右辺がよみになるまで行う。読みは、この場合、す
べてをひらがなで書かれた場合をいう。

【００１９】実施例１テンプレートに「＄外出」が記述されているので、規則
の左辺を「＄外出」とし、単語辞書から「＄外出」の記
述を調べ、その語表記を得、それらを右辺として規則を
生成する。規則は、以下の表１のとおりである。

【００２０】

【表１】

【００２１】次に、右辺の各項をみると、よみレベルで
はないので、「外出」「出かける」について辞書を調
べ、「がいしゅつ」「でかける」を得る。それぞれを左
辺，右辺として、表２のような規則を生成する。

【００２２】

【表２】

【００２３】右辺をみると、よみのレベルなので、生成
を終了する。最終的に生成された規則は（左辺→右辺
列）表３のとおりである。

【００２４】

【表３】

【００２５】次に、実施例２（請求項２）について説明
する。本実施例の規則生成装置の構成図は、図１と同じ
である。図４は、請求項２の文テンプレートの例を示す
図である。認識する単語の単語自体あるいは語のグルー
プ名と、単語自体あるいは語のグループ名で指される語
の集合に制限を加える条件を付随して記述する。例で
は、「：」の前方「＄外出」に対しての制限として「名
詞」という条件が記述されている。この記述に基づいて
規則を生成するが、テンプレートの記述をトップレベル
の左辺とし、辞書を参照しながらよみのレベルまでを規
則として生成する。

【００２６】図５は、単語辞書の例を示す図である。語
の表記とグループ名（ここでは意味），よみと品詞とを
対応づけて記述してある。ここでは、品詞を条件として
テンプレートに記述する。文テンプレートで指定された
語とその条件を参照して辞書から抽出し、認識対象語と
して規則を生成する。

【００２７】本実施例の処理は、文テンプレートの左か
ら順に処理を行う。文テンプレートに記述された語と語
のグループと条件をトップの左辺とし、これらについて
テンプレートの記述に従い、単語辞書から語を抽出して
右辺とする。次に右辺について、同様に単語辞書から語
を抽出し、左辺と右辺とする。これを右辺がよみになる
まで行う。よみは、この場合、すべてをひらがなで書か
れた場合をいう。

【００２８】実施例２テンプレートに「＄外出：名詞」が記述されているの
で、規則の左辺を「＄外出：名詞」とし、単語辞書から
まず「＄外出」の記述のある語を調べ、「外出」「出か
ける」を得る。「：」以降が条件なので、これらに対し
て「名詞」という記述が辞書にあるかどうか調べる。
「外出」にあるので、これを右辺とする。まだよみのレ
ベルではないので、次に「外出」を単語辞書からひき、
「がいしゅつ」を得、左辺と右辺とする。「がいしゅ
つ」はよみのレベルなので、ここでこの記述に対する処
理を終了する。残りのテンプレートの記述にも同様に処
理を行う。最終的に得られる規則は、以下の表４のとお
りである。

【００２９】

【表４】

【００３０】次に、実施例３（請求項３）について説明
する。本実施例の規則生成装置の構成図は、図１と同じ
である。図６は、請求項３の文テンプレートの例を示す
図である。認識する単語の単語自体あるいは語のグルー
プ名を出現する順に記述してあるが、「＋」の記号のあ
る項は前方の項とつなげて一単位で規則を生成する意味
である。例は、「＄会議」に対して、「＋」のついた
「＄が」をつなげて一単位で規則を生成する意味であ
る。この記述に基づいて規則を生成するが、テンプレー
トの記述をトップレベルの左辺とし、辞書を参照しなが
らよみのレベルまでを規則として生成する。

【００３１】図７は、単語辞書の例を示す図である。語
の表記とグループ名（ここでは意味），よみとを対応づ
けて記述してある。文テンプレートで指定された語を辞
書から抽出し、認識対象語として規則を生成する。

【００３２】本実施例の処理は、文テンプレートに記述
された語と語のグループをトップの左辺とし、これらに
ついてテンプレートの記述に従い、単語辞書から語を抽
出して右辺とする。この時、後方の語に「＋」の記号が
あれば、「＋」のついた語を一まとまりで規則を生成す
る。左辺には、「＋」で２項をつなげた記号を生成し、
その右辺には、それぞれの項をおく。次に、右辺の各項
について、単語辞書から語を抽出し、左辺と右辺とす
る。次に、右辺のよみを単語辞書から調べ、よみを右辺
におく。よみは、この場合、すべてをひらがなで書かれ
た場合をいう。

【００３３】実施例３テンプレートに「＄会議」が記述されており、かつ後方
に「＋」があるので、後方の語とつなげて生成する。後
方は、「＄が」なので、規則の左辺を「＄会議＋＄が」
とし、右辺には「＄会議」,「＄が」をおく。これを表
５に示す。

【００３４】

【表５】

【００３５】右辺を単語辞書で調べる。まず、「＄会
議」の記述のある語を調べ、語「会議」「打ち合わせ」
を得る。「＄が」についても同様にし、語「が」「は」
を得る。各右辺について、よみのレベルでない「会議」
「打ち合わせ」について単語辞書をひき、「かいぎ」
「うちあわせ」を得る。右辺がすべてよみのレベルなの
で、ここでこの記述に対する処理を終了する。最終的に
得られる規則は、以下の表６のとおりである。

【００３６】

【表６】

【００３７】次に、実施例４（請求項４）について説明
する。本実施例の規則生成装置の構成図は、図１と同じ
である。図８は、請求項４の文テンプレートの例を示す
図である。認識する単語の単語自体あるいは語のグルー
プ名を出現する順に記述してある。「％」は、その語が
省略される可能性のある語であることを表している。こ
の記述に基づいて規則を生成するが、テンプレートの記
述をトップレベルの左辺とし、辞書を参照しながら、よ
みのレベルまでを規則として生成する。

【００３８】図７は、単語辞書の例を示す図である。語
の表記とグループ名（ここでは意味），よみとを対応づ
けて記述してある。文テンプレートで指定された語を辞
書から抽出し、認識対象語として規則を生成する。

【００３９】本実施例の処理は、文テンプレートに記述
された語と語のグループをトップの左辺とし、これらに
ついてテンプレートの記述に従い、単語辞書から語を抽
出して右辺とする。この時、語に「％」の記号があれ
ば、省略される可能性があるので、例えば「＋」のつい
た語であれば、この語とつなげたものと、この語のない
ものとの２種類の規則を生成する。「＋」がなければ、
「％」を除いた記号のものを生成する。

【００４０】実施例４テンプレートに「＄会議」が記述されており、かつ後方
に「＋」があるので、後方の語とつなげて生成するが、
後方は「％＄が」なので、規則の左辺を「＄会議＋％＄
が」とし、「＄が」があるのと、ないのとを生成する。
これを表７に示す。

【００４１】

【表７】

【００４２】右辺を単語辞書で調べる。まず、「＄会
議」の記述のある語を調べ、「会議」「打ち合わせ」を
得る。「＄が」についても同様にし、「が」「は」を得
る。各右辺について、よみのレベルでない「会議」「打
ち合わせ」について単語辞書をひき、「かいぎ」「うち
あわせ」を得る。右辺がすべてよみのレベルなので、こ
こでこの記述に対する処理を終了する。最終的に得られ
る規則は、以下の表８のとおりである。

【００４３】

【表８】

【００４４】次に、実施例５（請求項５）について説明
する。本実施例の規則生成装置の構成図は図１と同じで
ある。図９は、請求項５の文テンプレートの例を示す図
である。認識する単語の単語自体あるいは語のグループ
名と、単語自体あるいは語のグループ名で指される語の
集合に制限を加える条件名とその値を付随して記述す
る。例では「：」の前方「＄会議」に対しての制限とし
て条件名「頻度」，その値「１」であるものを指定する
ことで、「＄会議」で指される語の中からその条件にあ
ったものだけを規則として生成する。

【００４５】図１０は、単語辞書の例を示す図である。
語の表記とグループ名（ここでは意味）とよみと条件と
を対応づけて記述してある。ここでは、頻度を条件とし
てその値を記述する。文テンプレートで指定された語と
その条件を参照して辞書から抽出し、認識対象語として
規則を生成する。

【００４６】本実施例の処理は、文テンプレートに記述
された語と語のグループと条件をトップの左辺とし、こ
れらについてテンプレートの記述に従い、単語辞書から
語を抽出して右辺とする。次に、右辺について、同様に
単語辞書から語を抽出し、左辺と右辺とする。これを右
辺がよみになるまで行う。よみは、この場合、すべてを
ひらがなで書かれた場合をいう。

【００４７】実施例５テンプレート「＄会議：頻度＝１」が記述されているの
で、規則の左辺を「＄会議：頻度＝１」とし、単語辞書
から、まず「＄会議」の記述のある語を調べ、「会議」
「打ち合わせ」を得る。「：」以降が条件なので、これ
らに対して「頻度」の項目の値が「１」であるという記
述のものが辞書にあるかどうか調べる。「会議」が該当
するので、これを右辺とする。まだよみのレベルではな
いので、次に「会議」を単語辞書からひき、「かいぎ」
を得、左辺と右辺とする。「かいぎ」はよみのレベルな
ので、ここでこの記述に対する処理を終了する。残りの
テンプレートの記述にも同様に処理を行う。最終的に得
られる規則は、以下の表９のとおりである。

【００４８】

【表９】

【００４９】次に、実施例６（請求項６）について説明
する。本実施例の規則生成装置の構成図は図１と同じで
ある。図１１は、請求項６の文テンプレートの例を示す
図である。認識する単語の単語自体あるいは語のグルー
プ名と、単語自体あるいは語のグループ名で指される語
の集合に制限を加える条件名とその値を付随して記述す
る。例では、「：」の前方「＄会議」に対しての制限と
して条件名「品詞」，その値「名詞」と条件名「頻
度」，その値「１」であるものを指定している。「＄会
議」で指される語の中から、その条件にあったものだけ
を規則として生成する。

【００５０】図１２は、単語辞書の例を示す図である。
語の表記とグループ名（ここでは意味）とよみと条件と
を対応づけて記述してある。ここでは、頻度を条件とし
てその値を記述する。文テンプレートで指定された語と
その条件を参照して辞書から抽出し、認識対象語として
規則を生成する。

【００５１】本実施例の処理は、文テンプレートに記述
された語と語のグループと条件をトップの左辺とし、こ
れらについてテンプレートの記述に従い、単語辞書から
語を抽出して右辺とする。次に、右辺について、同様に
単語辞書から語を抽出し、左辺と右辺とする。これを右
辺がよみになるまで行う。よみは、この場合、すべてを
ひらがなで書かれた場合をいう。

【００５２】実施例６テンプレートに「＄会議：品詞＝名詞，頻度＝１」が記
述されているので、規則の左辺を「＄会議：品詞＝名
詞，頻度＝１」とし、単語辞書から、まず「＄会議」の
記述のある語を調べ、「会議」「打ち合わせ」「打ち合
せる」を得る。「：」以降が条件なので、これらに対し
て「品詞」の項目の値が「名詞」であるという記述のも
のが辞書にあるかどうか調べる。「会議」「打ち合わ
せ」が該当する。続いて、これらに対して「頻度」の項
目の値が「１」であるという記述のものが辞書にあるか
どうか調べる。「会議」が該当する。これを右辺とす
る。まだ、よみのレベルではないので、次に「会議」を
単語辞書からひき、「かいぎ」を得、左辺と右辺とす
る。「かいぎ」はよみのレベルなので、ここでこの記述
に対する処理を終了する。残りのテンプレートの記述に
も同様に処理を行う。最終的に得られる規則は、以下の
表１０のとおりである。

【００５３】

【表１０】

【００５４】次に、実施例７（請求項７）について説明
する。本実施例の規則生成装置の構成図は図１と同じで
ある。図１３は、請求項７の文テンプレートの例を示す
図である。認識する単語の単語自体あるいは語のグルー
プ名と、単語自体あるいは語のグループ名で指される語
の集合に制限を加える条件名とその値の範囲を付随して
記述する。例では、「：」の前方「＄会議」に対しての
制限として、条件名「頻度」でその値の範囲が「０」よ
り大であるものを指定することで、「＄会議」で指され
る語の中からその条件にあったものだけを規則として生
成する。値の範囲に、例の「＞」（指定より大）以外
に、「＜」（指定より小）「！＝」（指定以外の値）も
指定可能である。

【００５５】図１４は、単語辞書の例を示す図である。
語の表記とグループ名（ここでは意味）とよみと条件と
を対応づけて記述してある。ここでは、頻度を条件とし
てその値を記述する。文テンプレートで指定された語と
その条件を参照して辞書から抽出し、認識対象語として
規則を生成する。

【００５６】本実施例の処理は、文テンプレートに記述
された語と語のグループと条件をトップの左辺とし、こ
れらについてテンプレートの記述に従い、単語辞書から
語を抽出して右辺とする。次に、右辺について、同様に
単語辞書から語を抽出し、左辺と右辺とする。これを右
辺がよみになるまで行う。よみは、この場合、すべてを
ひらがなで書かれた場合をいう。

【００５７】実施例７テンプレートに「＄会議：頻度＞０」が記述されている
ので、規則の左辺を「＄会議：頻度＞０」とし、単語辞
書から、まず「＄会議」の記述のある語を調べ、「会
議」「打ち合わせ」を得る。「：」以降が条件なので、
これらに対して「頻度」の項目の値が「０より大」であ
るという記述のものが辞書にあるかどうか調べる。「会
議」が該当するので、これを右辺とする。まだ、よみの
レベルではないので、次に「会議」を単語辞書からひ
き、「かいぎ」を得、左辺と右辺とする。「かいぎ」は
よみのレベルなので、ここでこの記述に対する処理を終
了する。残りのテンプレートの記述にも同様に処理を行
う。最終的に得られる規則は、以下の表１１のとおりで
ある。

【００５８】

【表１１】

【００５９】次に、実施例８（請求項８）について説明
する。図１５は、本発明による規則生成装置の他の実施
例（請求項８）を説明するための構成図で、図中、４は
接続パタン辞書、５は活用辞書で、その他、図１と同じ
作用をする部分は同一の符号を付してある。文テンプレ
ート１は、認識する語又は語のグループを記述したもの
である。単語辞書２は、語と語のグループを表すグルー
プ名から成っている。接続パタン辞書４は、語とその接
続パタンを記述したものである。活用辞書５は、品詞と
活用品詞と活用語尾を記述したものである。規則生成部
３は、複数の語をつなげて生成する場合に、語の接続可
否を検定し、それに基づいて規則を生成するものであ
る。

【００６０】すなわち、実施例８の規則生成装置は、文
テンプレート１と単語辞書２と接続パタン辞書４と活用
辞書５と規則生成部３とからなる。文テンプレート１に
認識すべき語が記述され、これに基づいて、単語辞書２
を参照しながら規則を生成する。「＋」の記号がある場
合には、２語を結合して規則を生成するが（請求項
３）、この場合に接続しうるものか、そうでないものか
を、接続パタンで検定し、接続しうる規則だけを、場合
によっては活用辞書５で活用形に展開して生成する。特
に、日本語では助動詞が接続の制限がきついので、特に
助動詞についてこの処理が行われる。

【００６１】図１６は、請求項８の文テンプレートの例
を示す図である。認識する単語の単語自体あるいは語の
グループ名を出現する順に記述してあるが、「＋」の記
号のある項は、前方の項とつなげて一単位で規則を生成
する意味である。例は、「＄外出」に対して「＋」のつ
いた「＄意志」をつなげて、一単位で規則を生成する意
味である。この時、語によっては接続するものとしない
ものとがある。それらを接続パタンに記述し、この記述
に基づいて接続検定し規則を生成する。

【００６２】図１７は、単語辞書の例を示す図である。
語の表記とグループ名（ここでは意味）とよみと品詞と
を対応づけて記述してある。文テンプレートで指定され
た語とその条件を参照して辞書から抽出し、認識対象語
として規則を生成する。

【００６３】図１８は、活用辞書の例を示す図である。
動詞や助動詞など、活用のある語について活用形と語尾
を記述する。品詞名と活用品詞名と語尾とからなる。語
尾は基本形から１文字とって、付け加える語のことであ
る。「＊」は一文字とるだけで何も加えない意味であ
る。

【００６４】図１９は、接続パタン辞書の例を示す図で
ある。品詞名と接続パタンとからなる。その品詞が前方
に接続しうる品詞や活用形を接続パタンとして書く。品
詞や活用形は、単語辞書の品詞名もしくは活用辞書の活
用品詞名の一文字以上である（識別できる範囲）。本実
施例の処理は、文テンプレートに記述された語と語のグ
ループをトップの左辺とし、これらについてテンプレー
トの記述に従い、単語辞書から語を抽出し右辺とする。
この時、後方の語に「＋」の記号があれば、「＋」のつ
いた語を一まとまりで生成する。

【００６５】（１),テンプレートの記述の左辺の記号を
「＋」で２項をつなげた記号として生成する。（２),後方の語の品詞が接続パタンにあれば、その接続
パタンを得る。（３),前方の語について、単語辞書、またその品詞で活
用辞書を参照し、接続パタンがあれば（接続パタンが部
分文字列にあれば）、その活用形の表記，よみを生成す
る。（４)，前方の語には接続パタンを制約名として「：」
で区切って生成する。（５)，（１）を左辺として、その右辺に制約付きの前
方の語と後方の語をおく。（６)，右辺のそれぞれを対応する表記，よみで規則を
生成する。

【００６６】実施例８（１)，テンプレートに「＄外出」が記述されており、
かつ後方に「＋」があるので、後方の語とつなげて生成
する。「＄外出＋＄意志」（２)，後方は「＄意志」であり、後方の語を単語辞書
で調べると、語「たい」品詞「助動詞たい」を得る。接
続パタン辞書で調べると、品詞「助動詞たい」は「用」
である。（３)，前方の「＄外出」を辞書検索し、語「外出」品
詞「サ変名詞」，語「出かける」品詞「一段動詞」を得
る。「用」という記述はないので、次に活用辞書を品詞
で調べ、「一段動詞」の「連用」を得る（部分文字列に
あればよい）。（４)，一段動詞「出かける」の語尾を活用辞書に従
い、一文字とり、「出かけ」を得る。よみも同様にして
「でかけ」を得る。（５)，前方の語「＄外出」に制約をつけ「＄外出：
用」を生成する。（６)，（１）の左辺と制約つきの（５）と後方の語を
おく。これを表１２に示す。

【００６７】

【表１２】

【００６８】（７)，右辺のそれぞれの表記とよみを結
びつける。最終的に得られる規則は、以下の表１３のとおりであ
る。

【００６９】

【表１３】

【００７０】次に、実施例９（請求項９）について説明
する。本実施例の規則生成装置の構成図は図１５と同じ
である。図２０は、請求項９の文テンプレートの例を示
す図である。認識する単語の単語自体あるいは語のグル
ープ名を出現する順に記述してあるが、「＋」の記号の
ある項は前方の項とつなげて一単位で規則を生成する意
味である。例は、「＄予約」に対して「＋」のついた
「＄受身」をつなげて一単位で規則を生成する意味であ
る。この時、語によっては接続するものとしないものと
がある。それらを接続パタンに記述し、この記述に基づ
いて接続検定し、規則を生成する。

【００７１】図２１は、単語辞書の例を示す図である。
語の表記とグループ名（ここでは意味）とよみと品詞と
を対応づけて記述してある。文テンプレートで指定され
た語とその条件を参照して辞書から抽出し、認識対象語
として規則を生成する。

【００７２】図２３は、活用辞書の例を示す図である。
動詞や助動詞など、活用のある語について活用形と語尾
を記述する。品詞名と活用品詞名と語尾とからなる語尾
は、基本形から１文字とって付け加える語のことであ
る。「＊」は一文字とるだけで何も加えない意味であ
る。

【００７３】図２２は、接続パタン辞書の例を示す図で
ある。品詞名と接続パタンとからなる。その品詞が前方
に接続しうる品詞や活用形を接続パタンとして書く。品
詞や活用形は単語辞書の品詞名もしくは活用辞書の活用
品詞名の一文字以上である（識別できる範囲）。

【００７４】本実施例の処理は、文テンプレートに記述
された語と語のグループをトップの左辺とし、これらに
ついてテンプレートの記述に従い、単語辞書から語を抽
出して右辺とする。この時、後方の語に「＋」の記号が
あれば「＋」のついた語を一まとまりで生成する。

【００７５】（１)，テンプレートの記述の左辺の記号
を「＋」で２項をつなげた記号として生成する。（２)，後方の語の品詞が接続パタンにあれば、以下を
接続パタンの数だけ繰り返す。（３)，前方の語について、単語辞書、またその品詞で
活用辞書を参照し、接続パタンがあればその活用形の表
記，よみを生成する。（４)，前方の語には接続パタンを制約名として「：」
で区切って生成する。（５)，後方の語には接続パタンを要求した制約名とし
て「＜」で区切って生成する。（６)，（１）を左辺として、その右辺に制約付きの前
方の語と後方の語をおく。（７)，右辺のそれぞれを対応する表記，よみで規則を
生成する。

【００７６】実施例９（１)，テンプレートに「＄予約」が記述されており、
かつ後方に「＋」があるので、後方の語とつなげて生成
する。「＄予約＋＄受身」（２)，後方は「＄受身」であり、後方の語を単語辞書
で調べると、語「れる」品詞「助動詞れる」，語「られ
る」品詞「助動詞られる」を得る。それぞれを接続パタ
ン辞書で調べると、品詞「助動詞れる」は「未」、品詞
「助動詞られる」は「１用」である。

【００７７】（接続パタン「未」について）（３)，前方の「＄使う」を辞書検索し、語「使う」品
詞「わ行５段動詞」，語「入れる」品詞「一段動詞」を
得る。「未」という記述はないので、次に活用辞書を品
詞で調べ、「わ行５段動詞」の「未」を得る。（４)，わ行５段動詞「使う」の語尾を一文字とり、語
尾「わ」を加え、「使わ」を得る。よみも同様にして
「つかわ」を得る。（５)，前方の語「＄予約」に制約をつけ「＄予約：
未」を、後方の語「＄受身」に要求の制約をつけ、「＄
受身＜未」を生成する。（６)，（１）の左辺と、（５）をおく。これを表１４
に示す。

【００７８】

【表１４】

【００７９】（７)，右辺のそれぞれの表記とよみを結
びつける。

【００８０】（接続パタン「１用」について）（８)，前方の「＄使う」を辞書検索し、語「使う」品
詞「わ行５段動詞」，語「入れる」品詞「一段動詞」を
得る。「１用」という記述はないので、次に活用辞書を
品詞で調べ、「１段動詞」の「１用」を得る。（９)，一段動詞「入れる」の語尾を一文字とり、「入
れ」を得、よみも同様にして「いれ」を得る。（１０)，前方の語「＄予約に制約をつけ「＄予約：１
用」を、後方の語「＄受身」に要求の制約をつけ「＄受
身＜１用」を生成する。（１１)，（１）の左辺と（１０）をおく。これを表１
５に示す。

【００８１】

【表１５】

【００８２】(12)右辺のそれぞれの表記とよみを結びつ
ける。最終的に得られる規則は以下の表１６である。

【００８３】

【表１６】

【００８４】

【発明の効果】以上の説明から明らかなように、本発明
によると、以下のような効果がある。（１）請求項１に対応する効果：認識のための規則を自
動的に辞書から生成することで、人出では作成時に抜け
や誤りがあったものを、これらを回避することができ、
認識したい語を記述するだけで（ここでいう文テンプレ
ート）規則を別に書く作業がなくなり、効率的である。（２）請求項２に対応する効果：記述に別の観点が必要
であるときに、それを混在させることなく、正しい規則
だけを生成することができる。観点を分けて記述できる
ので、データの記述性や拡張性が高まる。（３）請求項３に対応する効果：記述の単位として複数
の語を組み合わせることができ、そのための規則を自動
的に生成できるので、効率的である。（４）請求項４に対応する効果：省略の可能性のある語
句について、その有無をトップレベルのデータに記述す
るだけで、有無を考慮した規則を生成するので、記述の
手間が省け、効率的であり、データの記能性や拡張性が
高まる。（５）請求項５に対応する効果：別観点での記述が必要
な場合に、それを混在させることなく、人手で分類する
ことなく、正しい規則を生成できる。また、その時に必
要な観点とその値を指定できるので、優先して認識した
い規則だけを生成することができ、データの記述性や拡
張性が高まる。（６）請求項６に対応する効果：記述の観点が複数あっ
たときに、それを混在させることなく、人手で分類する
ことなく、正しい規則を生成できる。データの記述性や
拡張性が高まる。また、その時に必要な観点とその値を
指定できるので、その場合に優先して認識したい規則だ
けを生成することができる。認識時に認識対象の絞り込
みを行うことができる。（７）請求項７に対応する効果：別観点での記述が必要
な場合に、それを混在させることなく、人手で分類する
ことなく、正しい規則を生成できる。別観点の制限につ
いて、可能範囲を記述できることで、データの記述性や
拡張性が高まる。（８）請求項８に対応する効果：助動詞など意味や品詞
以外の接続という別の観点での記述が必要なものに対し
て、それを自動的に生成することで、人手で分類するこ
となく、正しい規則ができ、効率的である。（９）請求項９に対応する効果：助動詞など意味や品詞
以外の接続という別の観点での記述が必要なものに対し
て、それを自動的に生成することで、人手で分類するこ
となく、正しい規則ができ、効率的である。特に意味は
同じでも、接続の仕方の異なる語について、人手で記述
しなくてもよく、効率的であり、データの記述性が高ま
る。

【図面の簡単な説明】

【図１】本発明による規則生成装置の一実施例を説明
するための構成図である。

【図２】本発明における文テンプレートの例を示す図
である。

【図３】本発明における単語辞書の例を示す図であ
る。

【図４】本発明における文テンプレートの他の例を示
す図である。

【図５】本発明における単語辞書の他の例を示す図で
ある。

【図６】本発明における文テンプレートの更に他の例
を示す図である。

【図７】本発明における単語辞書の更に他の例を示す
図である。

【図８】本発明における文テンプレートの更に他の例
を示す図である。

【図９】本発明における文テンプレートの更に他の例
を示す図である。

【図１０】本発明における単語辞書の更に他の例を示
す図である。

【図１１】本発明における文テンプレートの更に他の
例を示す図である。

【図１２】本発明における単語辞書の更に他の例を示
す図である。

【図１３】本発明における文テンプレートの更に他の
例を示す図である。

【図１４】本発明における単語辞書の更に他の例を示
す図である。

【図１５】本発明による規則生成装置の他の実施例を
説明するための構成図である。

【図１６】本発明における文テンプレートの更に他の
例を示す図である。

【図１７】本発明における単語辞書の更に他の例を示
す図である。

【図１８】本発明における接続パタン辞書の例を示す
図である。

【図１９】本発明における活用辞書の例を示す図であ
る。

【図２０】本発明における文テンプレートの更に他の
例を示す図である。

【図２１】本発明における単語辞書の更に他の例を示
す図である。

【図２２】本発明における接続パタン辞書の他の例を
示す図である。

【図２３】本発明における活用辞書の他の例を示す図
である。

【符号の説明】

１…文テンプレート、２…単語辞書、３…規則生成部、
４…接続パタン辞書、５…活用辞書。

Claims

【特許請求の範囲】

【請求項１】認識する語または語のグループを記述し
た文テンプレートと、語と語のグループを表すグループ
名からなる単語辞書と、文テンプレートの記述に従い規
則を生成する規則生成部とを有することを特徴とする規
則生成装置。
【請求項２】前記文テンプレートで語について生成す
る制限を記述し、該記述に基づいて規則を生成すること
を特徴とする請求項１記載の規則生成装置。
【請求項３】前記文テンプレートで複数の語をつなげ
て生成することを記述し、該記述に基づいて規則を生成
することを特徴とする請求項１記載の規則生成装置。
【請求項４】前記文テンプレートで語が省略可能であ
ることを記述し、該記述に基づいて規則を生成すること
を特徴とする請求項１記載の規則生成装置。
【請求項５】前記文テンプレートで語についての制限
に条件名とその値とを記述し、該記述に基づいて規則を
生成することを特徴とする請求項１記載の規則生成装
置。
【請求項６】前記文テンプレートで語について条件名
とその値とを対にした制限を複数記述し、該記述に基づ
いて規則を生成することを特徴とする請求項５記載の規
則生成装置。
【請求項７】前記文テンプレートで語について条件名
とその値の可能な範囲を制限として記述し、該記述に基
づいて規則を生成することを特徴とする請求項５記載の
規則生成装置。
【請求項８】認識する語または語のグループを記述し
た文テンプレートと、語と語のグループを表すグループ
名からなる単語辞書と、語とその接続パタンを記述した
接続パタン辞書と、品詞と活用品詞と活用語尾を記述し
た活用辞書と、複数の語をつなげて生成する場合に、語
の接続可否を検定し、それに基づいて規則を生成する規
則生成部とを有することを特徴とする規則生成装置。
【請求項９】前記複数の語をつなげて生成する場合
に、接続パタンが複数あった場合に、語の接続可否を検
定し、それに基づいて規則を生成することを特徴とする
請求項８記載の規則生成装置。