JPH01114983A - 品詞推定方式 - Google Patents

品詞推定方式

Info

Publication number
JPH01114983A
JPH01114983A JP62273829A JP27382987A JPH01114983A JP H01114983 A JPH01114983 A JP H01114983A JP 62273829 A JP62273829 A JP 62273829A JP 27382987 A JP27382987 A JP 27382987A JP H01114983 A JPH01114983 A JP H01114983A
Authority
JP
Japan
Prior art keywords
speech
character string
rules
parts
estimating
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP62273829A
Other languages
English (en)
Inventor
Ko Iino
飯野 香
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Priority to JP62273829A priority Critical patent/JPH01114983A/ja
Publication of JPH01114983A publication Critical patent/JPH01114983A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Machine Translation (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 (産業上の利用分野) 本発明は、自然言語処理装置において、辞書を用いない
で、文字列の性質から品詞を推定する品詞推定方式に関
するものである。
(従来の技術) 従来、自然言語理解における品詞推定は、ひらがな、漢
字、アルファベットなどの文字種及び語尾を用いて行っ
ている。
(発明が解決しようとする問題点) しかしながら、文字種や語尾の情報のみでは、品詞推定
の精度に限界がある。
本発明は、品詞推定に、文字列の性質を利用した品詞推
定規則を用いることにより、品詞推定の精度を上げるこ
とを目的とする。
(問題を解決するための手段) 本発明は、自然言語処理装置において、文字列の性質か
ら品詞を推定する規則を保持する機能によって辞書を用
いないで品詞を推定する機能を提供するものである。
(実施例) 本発明の実施例を図面を参照して、説明する。
なお、例としては、日本語入力を用いる。
第1図は、本発明の一実施例を説明するフローチャート
である。計算機には、品詞を推定すべき文字列が入力さ
れ、また、品詞推定規則が格納されている。
1で入力された文字列と、前記品詞推定規則の綴りを比
較し、文字列が規則を満たすが否がを判定する。
前記1で、文字列が規則を満たすと判定された場合2で
、前記品詞推定規則により品詞を付与する。前記1で文
字列が満たす規則がないと判定された場合には、3であ
らかじめ格納されたデフォルト値を付与する。このデフ
ォルト値は、適宜決めてさしつかえない。第2図は、前
記品詞推定規則の一例を示したものである。同図におい
て、rA」はひらがな1文字、rB、はカタカナ1文字
、「C」は漢字1文字、「D」はアルファベット1文字
を示している。
また「*」は直前の文字種の1回以上のくり返し、「+
」は直前の文字種の2回以上のくり返しがあることを示
している。
さらに、記号[]は、[]内の文字種列のいずれかを示
している。たとえば[A  Blはひらがな、カタカナ
のいずれでも゛よy)こと・を示している。また0は、
0内の文字種列をまとまりを示しており、「ノl」は直
前の文字種(あるいは文字種列」の2回のくり返しを示
している。  −品詞推定規則は、文字列の性質と推定
される品詞の組の、集まりである0文字列の性質は、た
とえば文字と文字種を表す記号とを使って表現する。1
を例にして説明すると、文字列の性質「AっAす」は、
ひらがな4文字で、第2字、第4字がそれぞれ「つ」 
「す」である文字列を意味し、したがって、これに該当
する文字列は、副詞と推定されることを表わしている。
たとえば「ゆっくり」は副詞と推定される。
文字列の性質の表記法は、第2図にあげた例にこだわら
ず、どのような方法を用いてもさしつかえない。また、
推定される品詞は、あいまい性がある場合には、複数記
述してさしつかえない。
(発明の効果) 本発明によれば、字種及び語尾による品詞推定に加えて
、文字列の性質を利用した品詞推定を行うことにより、
・より精度の高い品詞推定を゛行うことが可能となる。
【図面の簡単な説明】
第1図11本発明の一実施例を示す図、第2図41品詞
推定規則の例を示す図である。

Claims (1)

    【特許請求の範囲】
  1. 自然言語処理において、文字列の性質から品詞を推定す
    る規則を保持し、入力文字列が前記規則を満足する場合
    には、その品詞を出力することを特徴とする品詞推定方
    式。
JP62273829A 1987-10-28 1987-10-28 品詞推定方式 Pending JPH01114983A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP62273829A JPH01114983A (ja) 1987-10-28 1987-10-28 品詞推定方式

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP62273829A JPH01114983A (ja) 1987-10-28 1987-10-28 品詞推定方式

Publications (1)

Publication Number Publication Date
JPH01114983A true JPH01114983A (ja) 1989-05-08

Family

ID=17533127

Family Applications (1)

Application Number Title Priority Date Filing Date
JP62273829A Pending JPH01114983A (ja) 1987-10-28 1987-10-28 品詞推定方式

Country Status (1)

Country Link
JP (1) JPH01114983A (ja)

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS59201172A (ja) * 1983-04-28 1984-11-14 Nec Corp 曖味さ解析方式

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS59201172A (ja) * 1983-04-28 1984-11-14 Nec Corp 曖味さ解析方式

Similar Documents

Publication Publication Date Title
Silberztein Formalizing natural languages: The NooJ approach
US5418718A (en) Method for providing linguistic functions of English text in a mixed document of single-byte characters and double-byte characters
EP0370778A3 (en) Method for manipulating digital text data
Ekbal et al. A conditional random field approach for named entity recognition in Bengali and Hindi
JP5231698B2 (ja) 日本語の表意文字の読み方を予測する方法
JPH01114983A (ja) 品詞推定方式
JPS60247770A (ja) 文字処理装置
JPS6037510B2 (ja) ロ−マ字漢字変換方式
US20040117774A1 (en) Linguistic dictionary and method for production thereof
JP6472466B2 (ja) 文体変換装置、方法、及びプログラム
JPS6371767A (ja) 文書作成装置
JPH0441399Y2 (ja)
Hema et al. Malayalam spell checker using n-gram method
JPH11161651A (ja) 発音記号生成装置
Foran Clear writing
JPS6395565A (ja) 仮名漢字変換手法
JPH038053A (ja) 仮名漢字変換システムの単語登録方法
JPS635793B2 (ja)
JP3126952B2 (ja) 構文解析装置
Ogawa et al. Derivational grammar approach to morphological analysis of Japanese sentences
JPH04372047A (ja) 仮名漢字変換装置
Ríha et al. Computer testing of a generative grammar
Bear A NIOR PHOTO CICAT, RECO GNIZER VV ITHI SYNTACTIC AND PHONOLO CICAT, RUT, ES
Tianfield Knowledge-Based System Method for the Unitarization of Meaningful Augmentation in Horizontal Transliteration of Hanman Characters
Alnajem et al. A finite-state approach to Arabic triliteral nominal morphology