JPH01114983A

JPH01114983A - 品詞推定方式

Info

Publication number: JPH01114983A
Application number: JP62273829A
Authority: JP
Inventors: Ko Iino; 飯野　香
Original assignee: NEC Corp
Current assignee: NEC Corp
Priority date: 1987-10-28
Filing date: 1987-10-28
Publication date: 1989-05-08

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】（産業上の利用分野）本発明は、自然言語処理装置において、辞書を用いない
で、文字列の性質から品詞を推定する品詞推定方式に関
するものである。

（従来の技術）従来、自然言語理解における品詞推定は、ひらがな、漢
字、アルファベットなどの文字種及び語尾を用いて行っ
ている。

（発明が解決しようとする問題点）しかしながら、文字種や語尾の情報のみでは、品詞推定
の精度に限界がある。

本発明は、品詞推定に、文字列の性質を利用した品詞推
定規則を用いることにより、品詞推定の精度を上げるこ
とを目的とする。

（問題を解決するための手段）本発明は、自然言語処理装置において、文字列の性質か
ら品詞を推定する規則を保持する機能によって辞書を用
いないで品詞を推定する機能を提供するものである。

（実施例）本発明の実施例を図面を参照して、説明する。

なお、例としては、日本語入力を用いる。

第１図は、本発明の一実施例を説明するフローチャート
である。計算機には、品詞を推定すべき文字列が入力さ
れ、また、品詞推定規則が格納されている。

１で入力された文字列と、前記品詞推定規則の綴りを比
較し、文字列が規則を満たすが否がを判定する。

前記１で、文字列が規則を満たすと判定された場合２で
、前記品詞推定規則により品詞を付与する。前記１で文
字列が満たす規則がないと判定された場合には、３であ
らかじめ格納されたデフォルト値を付与する。このデフ
ォルト値は、適宜決めてさしつかえない。第２図は、前
記品詞推定規則の一例を示したものである。同図におい
て、ｒＡ」はひらがな１文字、ｒＢ、はカタカナ１文字
、「Ｃ」は漢字１文字、「Ｄ」はアルファベット１文字
を示している。

また「＊」は直前の文字種の１回以上のくり返し、「＋
」は直前の文字種の２回以上のくり返しがあることを示
している。

さらに、記号［］は、［］内の文字種列のいずれかを示
している。たとえば［Ａ　　Ｂｌはひらがな、カタカナ
のいずれでも゛よｙ）こと・を示している。また０は、
０内の文字種列をまとまりを示しており、「ノｌ」は直
前の文字種（あるいは文字種列」の２回のくり返しを示
している。　　−品詞推定規則は、文字列の性質と推定
される品詞の組の、集まりである０文字列の性質は、た
とえば文字と文字種を表す記号とを使って表現する。１
を例にして説明すると、文字列の性質「ＡっＡす」は、
ひらがな４文字で、第２字、第４字がそれぞれ「つ」　
「す」である文字列を意味し、したがって、これに該当
する文字列は、副詞と推定されることを表わしている。

たとえば「ゆっくり」は副詞と推定される。

文字列の性質の表記法は、第２図にあげた例にこだわら
ず、どのような方法を用いてもさしつかえない。また、
推定される品詞は、あいまい性がある場合には、複数記
述してさしつかえない。

（発明の効果）本発明によれば、字種及び語尾による品詞推定に加えて
、文字列の性質を利用した品詞推定を行うことにより、
・より精度の高い品詞推定を゛行うことが可能となる。

【図面の簡単な説明】

第１図１１本発明の一実施例を示す図、第２図４１品詞
推定規則の例を示す図である。

Claims

【特許請求の範囲】

自然言語処理において、文字列の性質から品詞を推定す
る規則を保持し、入力文字列が前記規則を満足する場合
には、その品詞を出力することを特徴とする品詞推定方
式。