JPH01114983A - 品詞推定方式 - Google Patents
品詞推定方式Info
- Publication number
- JPH01114983A JPH01114983A JP62273829A JP27382987A JPH01114983A JP H01114983 A JPH01114983 A JP H01114983A JP 62273829 A JP62273829 A JP 62273829A JP 27382987 A JP27382987 A JP 27382987A JP H01114983 A JPH01114983 A JP H01114983A
- Authority
- JP
- Japan
- Prior art keywords
- speech
- character string
- rules
- parts
- estimating
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims description 5
- 238000003058 natural language processing Methods 0.000 claims description 3
- 235000002256 Diospyros oleifera Nutrition 0.000 abstract 1
- 244000153389 Diospyros oleifera Species 0.000 abstract 1
- 235000016496 Panda oleosa Nutrition 0.000 abstract 1
- 240000000220 Panda oleosa Species 0.000 abstract 1
- 238000010586 diagram Methods 0.000 description 2
- 230000006870 function Effects 0.000 description 1
Landscapes
- Machine Translation (AREA)
Abstract
(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。
め要約のデータは記録されません。
Description
【発明の詳細な説明】
(産業上の利用分野)
本発明は、自然言語処理装置において、辞書を用いない
で、文字列の性質から品詞を推定する品詞推定方式に関
するものである。
で、文字列の性質から品詞を推定する品詞推定方式に関
するものである。
(従来の技術)
従来、自然言語理解における品詞推定は、ひらがな、漢
字、アルファベットなどの文字種及び語尾を用いて行っ
ている。
字、アルファベットなどの文字種及び語尾を用いて行っ
ている。
(発明が解決しようとする問題点)
しかしながら、文字種や語尾の情報のみでは、品詞推定
の精度に限界がある。
の精度に限界がある。
本発明は、品詞推定に、文字列の性質を利用した品詞推
定規則を用いることにより、品詞推定の精度を上げるこ
とを目的とする。
定規則を用いることにより、品詞推定の精度を上げるこ
とを目的とする。
(問題を解決するための手段)
本発明は、自然言語処理装置において、文字列の性質か
ら品詞を推定する規則を保持する機能によって辞書を用
いないで品詞を推定する機能を提供するものである。
ら品詞を推定する規則を保持する機能によって辞書を用
いないで品詞を推定する機能を提供するものである。
(実施例)
本発明の実施例を図面を参照して、説明する。
なお、例としては、日本語入力を用いる。
第1図は、本発明の一実施例を説明するフローチャート
である。計算機には、品詞を推定すべき文字列が入力さ
れ、また、品詞推定規則が格納されている。
である。計算機には、品詞を推定すべき文字列が入力さ
れ、また、品詞推定規則が格納されている。
1で入力された文字列と、前記品詞推定規則の綴りを比
較し、文字列が規則を満たすが否がを判定する。
較し、文字列が規則を満たすが否がを判定する。
前記1で、文字列が規則を満たすと判定された場合2で
、前記品詞推定規則により品詞を付与する。前記1で文
字列が満たす規則がないと判定された場合には、3であ
らかじめ格納されたデフォルト値を付与する。このデフ
ォルト値は、適宜決めてさしつかえない。第2図は、前
記品詞推定規則の一例を示したものである。同図におい
て、rA」はひらがな1文字、rB、はカタカナ1文字
、「C」は漢字1文字、「D」はアルファベット1文字
を示している。
、前記品詞推定規則により品詞を付与する。前記1で文
字列が満たす規則がないと判定された場合には、3であ
らかじめ格納されたデフォルト値を付与する。このデフ
ォルト値は、適宜決めてさしつかえない。第2図は、前
記品詞推定規則の一例を示したものである。同図におい
て、rA」はひらがな1文字、rB、はカタカナ1文字
、「C」は漢字1文字、「D」はアルファベット1文字
を示している。
また「*」は直前の文字種の1回以上のくり返し、「+
」は直前の文字種の2回以上のくり返しがあることを示
している。
」は直前の文字種の2回以上のくり返しがあることを示
している。
さらに、記号[]は、[]内の文字種列のいずれかを示
している。たとえば[A Blはひらがな、カタカナ
のいずれでも゛よy)こと・を示している。また0は、
0内の文字種列をまとまりを示しており、「ノl」は直
前の文字種(あるいは文字種列」の2回のくり返しを示
している。 −品詞推定規則は、文字列の性質と推定
される品詞の組の、集まりである0文字列の性質は、た
とえば文字と文字種を表す記号とを使って表現する。1
を例にして説明すると、文字列の性質「AっAす」は、
ひらがな4文字で、第2字、第4字がそれぞれ「つ」
「す」である文字列を意味し、したがって、これに該当
する文字列は、副詞と推定されることを表わしている。
している。たとえば[A Blはひらがな、カタカナ
のいずれでも゛よy)こと・を示している。また0は、
0内の文字種列をまとまりを示しており、「ノl」は直
前の文字種(あるいは文字種列」の2回のくり返しを示
している。 −品詞推定規則は、文字列の性質と推定
される品詞の組の、集まりである0文字列の性質は、た
とえば文字と文字種を表す記号とを使って表現する。1
を例にして説明すると、文字列の性質「AっAす」は、
ひらがな4文字で、第2字、第4字がそれぞれ「つ」
「す」である文字列を意味し、したがって、これに該当
する文字列は、副詞と推定されることを表わしている。
たとえば「ゆっくり」は副詞と推定される。
文字列の性質の表記法は、第2図にあげた例にこだわら
ず、どのような方法を用いてもさしつかえない。また、
推定される品詞は、あいまい性がある場合には、複数記
述してさしつかえない。
ず、どのような方法を用いてもさしつかえない。また、
推定される品詞は、あいまい性がある場合には、複数記
述してさしつかえない。
(発明の効果)
本発明によれば、字種及び語尾による品詞推定に加えて
、文字列の性質を利用した品詞推定を行うことにより、
・より精度の高い品詞推定を゛行うことが可能となる。
、文字列の性質を利用した品詞推定を行うことにより、
・より精度の高い品詞推定を゛行うことが可能となる。
第1図11本発明の一実施例を示す図、第2図41品詞
推定規則の例を示す図である。
推定規則の例を示す図である。
Claims (1)
- 自然言語処理において、文字列の性質から品詞を推定す
る規則を保持し、入力文字列が前記規則を満足する場合
には、その品詞を出力することを特徴とする品詞推定方
式。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP62273829A JPH01114983A (ja) | 1987-10-28 | 1987-10-28 | 品詞推定方式 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP62273829A JPH01114983A (ja) | 1987-10-28 | 1987-10-28 | 品詞推定方式 |
Publications (1)
Publication Number | Publication Date |
---|---|
JPH01114983A true JPH01114983A (ja) | 1989-05-08 |
Family
ID=17533127
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP62273829A Pending JPH01114983A (ja) | 1987-10-28 | 1987-10-28 | 品詞推定方式 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JPH01114983A (ja) |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS59201172A (ja) * | 1983-04-28 | 1984-11-14 | Nec Corp | 曖味さ解析方式 |
-
1987
- 1987-10-28 JP JP62273829A patent/JPH01114983A/ja active Pending
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS59201172A (ja) * | 1983-04-28 | 1984-11-14 | Nec Corp | 曖味さ解析方式 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Silberztein | Formalizing natural languages: The NooJ approach | |
US5418718A (en) | Method for providing linguistic functions of English text in a mixed document of single-byte characters and double-byte characters | |
EP0370778A3 (en) | Method for manipulating digital text data | |
Ekbal et al. | A conditional random field approach for named entity recognition in Bengali and Hindi | |
JP5231698B2 (ja) | 日本語の表意文字の読み方を予測する方法 | |
JPH01114983A (ja) | 品詞推定方式 | |
JPS60247770A (ja) | 文字処理装置 | |
JPS6037510B2 (ja) | ロ−マ字漢字変換方式 | |
US20040117774A1 (en) | Linguistic dictionary and method for production thereof | |
JP6472466B2 (ja) | 文体変換装置、方法、及びプログラム | |
JPS6371767A (ja) | 文書作成装置 | |
JPH0441399Y2 (ja) | ||
Hema et al. | Malayalam spell checker using n-gram method | |
JPH11161651A (ja) | 発音記号生成装置 | |
Foran | Clear writing | |
JPS6395565A (ja) | 仮名漢字変換手法 | |
JPH038053A (ja) | 仮名漢字変換システムの単語登録方法 | |
JPS635793B2 (ja) | ||
JP3126952B2 (ja) | 構文解析装置 | |
Ogawa et al. | Derivational grammar approach to morphological analysis of Japanese sentences | |
JPH04372047A (ja) | 仮名漢字変換装置 | |
Ríha et al. | Computer testing of a generative grammar | |
Bear | A NIOR PHOTO CICAT, RECO GNIZER VV ITHI SYNTACTIC AND PHONOLO CICAT, RUT, ES | |
Tianfield | Knowledge-Based System Method for the Unitarization of Meaningful Augmentation in Horizontal Transliteration of Hanman Characters | |
Alnajem et al. | A finite-state approach to Arabic triliteral nominal morphology |