JPH01207869A - 日本語文章処理方式 - Google Patents

日本語文章処理方式

Info

Publication number
JPH01207869A
JPH01207869A JP63033402A JP3340288A JPH01207869A JP H01207869 A JPH01207869 A JP H01207869A JP 63033402 A JP63033402 A JP 63033402A JP 3340288 A JP3340288 A JP 3340288A JP H01207869 A JPH01207869 A JP H01207869A
Authority
JP
Japan
Prior art keywords
representative
notation
japanese
morphological analysis
attribute information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP63033402A
Other languages
English (en)
Other versions
JPH0731684B2 (ja
Inventor
Makoto Shiozu
塩津 誠
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP63033402A priority Critical patent/JPH0731684B2/ja
Publication of JPH01207869A publication Critical patent/JPH01207869A/ja
Publication of JPH0731684B2 publication Critical patent/JPH0731684B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Machine Translation (AREA)
  • Document Processing Apparatus (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 〔概要〕 日本語文の形態素解析に関し。
辞書の容量を圧縮すると共に辞書データの保守を容易に
することを目的とし。
異表記を存する単語に対して異なる表記ごとに別々に属
性情報を持たせず、予め1つの代表表記を定めてその代
表表記のみに属性情報を設定し。
他の表記には代表表記のみを設定した日本語辞書と9日
本語辞書を検索して入力文を形態素に分解する形態素解
析部とをそなえ、形態素解析部は。
入力文を、異表記を有する単語のうち代表表記以外の表
記については2代表表記を対応づけて形態素に分解する
第1の形態素解析処理と、第1の形態素解析処理の結果
について1代表表記を対応づけられた形態素に関しては
3代表表記で日本語辞書を再度検索し1代表表記に設定
されている属性情報を代表表記を対応づけられた形態素
に代入する第2の形態素解析処理とを行うように構成す
る。
〔産業上の利用分野〕
本発明は2日本語文章処理力式、特に日本語文の形態素
解析に関する。
日本語文章処理においては、構文解析や意味解析の前段
階として、形態素解析が行われる。
形態素解析とは、数・性・特称・人称などの範曜に従っ
て、また、格などに従って文章を構成する語の多様な形
態を同定し、さらに、その語の構造、すなわち、その語
基やそれと結合している形態素を抽出することにより、
それらの語が如何に構成されているかを解析することで
ある。いいがえると1文字列として与えられた文から形
態の列を同定し、これらから形態素の列を抽出すること
である。
この形態素解析は、辞書を検索しながら行われるので、
使用する辞書の構造が重要な役割を果た〔従来の技術〕 第3図は、従来例を示す図である。
第3図において、31は日本語辞也、32は形態素解析
部である。
日本語辞書3]は、各単語をレコードとして持っている
。各レコードは、見出し語および意味属性1文法属性な
どの属性情報がら構成されている。
形態素解析部32は、入力文から形態の列を同定し、こ
れらから形態素の列を抽出する。
以下第3図を用いて、従来の形態素解析を詳細に説明す
る。
日本語では、同一の単語を別々に表記する異表記という
ことが行われている。日本語辞書31には、同一の単語
の異表記ごとに、それを見出し語として意味属性1文法
属性などの属性情報を持たせている。第3図に示した日
本語辞書31には。
異表記の例として、「絹合せ」 「組め合わせ」「くめ
あわせ」か示しである。「組合せ」、「組め合わせ」お
よび「くみあわせ」は、同一の単語であるが表記が異な
っている。日本語辞書31の中では、「組合せ」、「組
み合わせ」および「くめあわせ」は、それぞれ見出し語
として登録されており、意味属性9文法属性などの属性
情報を持っている。
次に、第3図に示した例を用いて、従来の形態素解析の
具体的な手順を説明する。
まず、「組み合わせは正しい」という文が入力されたも
のとする。
形態素解析部32は1日本語辞書31を検索して入力文
を形態素に分解する。すなわち、「組み合わせは正しい
」という入力文を「組み合わせ」。
「は」、「正し」および「い」という′形態素に分解す
る。各形態素には日本語辞書31に登録されている各種
の属性を持たせる。この例の場合。
「組み合わせ」には意味属性および文法属性を持たせ、
「は」には文法属性を持たせ、「正し」にしJ意味属性
および文法属性を持たせ、「い」には文法属性を持たせ
る。
形態素解析部32での解析結果は、構文解析。
意味解析などに利用される。
〔発明が解決しようとする課題〕
従来のように同一単語に異表記がある場合9日本語辞書
に異表記を別々に見出し語として、それらに意味属性2
文法属性なとの属性情報を持たせると日本語辞書の容量
が増大すると共に日本語辞書データの保守が困難である
という問題が生じていた。
本発明は2日本語辞書の容量を圧縮すると共に日本語辞
書データの保守を容易にした1日本語文の形態素解析を
行うことのできる日本語文章処理方式を提供することを
目的としている。
〔課題を解決するための手段〕   −本発明は2異表
記を有する単語に対して異なる表記ごとに別々に属性情
報を持たせず、予め1つの代表表記を定めてその代表表
記のめに属性情報を設定し、他の表記には代表表記のみ
を設定した日本語辞書と2日本語辞書を検索して入力文
を形態素に分解する形態素解析部とをそなえ、形態素解
析部は、入力文を、異表記を有する単語のうち代表表記
以外の表記については1代表表記を対応づけて形態素に
分解する第1の形態素解析処理と。
第1の形態素解析処理の結果について2代表表記を対応
づけられた形態素に関しては1代表表記で日本語辞書を
再度検索し1代表表記に設定されている属性情報を代表
表記を対応づけられた形態素に代入する第2の形態素解
析処理とを行うように構成することにより2日本語辞書
の容量を圧縮すると共に日本語辞書データの保守を容易
にした。
日本語文の形態素解析を行うことのできる日本語文章処
理方式を提供するものである。
第1図は2本発明の原理説明図である。
第1図において、■は日本語辞書、2は形態素解析部で
ある。
日本語辞書1は、異表記を有する単語に対して各表記が
別々に属性情報を持たず、当該異表記が属する単語の、
予め定められた1つの代表表記のみが属性情報を持ち、
異表記は代表表記のみを持つように構成されている。
形態素解析部2は、入力文を2段階に分けて形態素に分
解する。
以下、第1図を用いて本発明の作用を詳細に説明する。
異表記を有する単語の例として、「組合せ」1組み合わ
せ」「<メあわせ」を考える。そして。
代表表記を1組合せ」とする。そうすると1日本語辞書
1の中では、  rlJ1合せ」だけが意味属性。
文法属性などの属性情報を持ち、1組み合わせ」および
「くみあわせ」は9代表表記である1組合せ」のみを持
つ。このことを第1回では、  &REP(組合せ)と
いう形で表現している。
次に9本発明による形態素解析の手順を具体例を用いて
詳細に説明する。
まず、「組み合わせは正しい」という文が入力されたも
のとする。
入力文は、形態素解析部2の第1の形態素解析処理にお
いて1日本語辞書1を検索して各形態素に分解される。
ずなわら、「組み合わせ」 「は」「正し」 「い」と
いうように分解される。この場合、「組み合わせ」は異
表記であるから9代表表記である「組合せ」を持つ。こ
のことを第1図では、&REP (組合せ)という形で
表現している。
その他の形態素は、それぞれ各種の属性を持つ。
すなわち、「は」は文法属性を持ち、「正し」は意味属
性および文法属性を持ち、「い」は文法属性を持つ。
第1の形態素解析処理における解析結果は、第2の形態
素解析処理へ送られる。
第2の形態素解析処理では、異表記の形態素が持つ代表
表記で日本語辞書1を再度検索して代表表記が持つ属性
情報を異表記の形態素に代入する。
すなわち、「組み合わせ」の代表表記である「組合せ」
で日本語辞書1を検索し、「組合せ」が持つ意味属性お
よび文法属性を「組み合わせ」に代入する。
第2の形態素解析処理の結果出力は、構文解析。
意味解析などに利用される。
〔実施例〕
第2図は1本発明の1実施例構成図である。
第2図において、21は入出力装置、22は入力ファイ
ル、23は推敲制御部、23aば機能選択部、23bは
推敲制御機能、23cは修正制御機能、24は推敲処理
部、24aは推敲エンジン。
24bは形態素解析部、24cは構文解析部、24dは
推敲知識蓄積部、25は日本語辞書、26は日本語文法
辞書、27は出力ファイル、28は推敲結果処理部であ
る。
入出力装置21は、推敲を行うべき日本語文章を入力し
、推敲結果を取り出す装置である。−括型装置や対話型
装置、あるいは、その双方から構成されてもよい。
入力ファイル22には、推敲を行うべき日本語文章が格
納されている。
推敲制御部23は推敲あるいは修正に関するコマンドの
解析と対応する処理部の制御を行い9機能選択部23a
、推敲制御機能23bおよび修正制御機能23cを含む
機能選択部23aは、入出力装置21からの指示に従っ
て、推敲か修正かという機能を選択する。
推敲制御機能23bは、推敲制御コマンドに従って、推
敲処理部24を起動する。
修正制御機能23cば、修正制御コマンドに従って、推
敲結果処理部28を起動する。
+(I敲処理部24は、推敲エンジン24a、形態・素
解析部24b、構文解析部24cおよび推敲知識蓄積部
24dからなる。
推敲エンジン24aは、形態素解析部24bおよび構文
解析部24. cを制御すると共に推敲知識蓄積部24
dに蓄えられている推敲知識に基づいて、入力された日
本語文章の推敲を行う。
形態素解析部24bは2日本語辞書25を検索して、入
ノコ文を形態素に解析する。
構文解析部24cは、形B素解析部24bにおいて解析
された形態素によって得られた情報を基に7日本語文法
辞書26を検索して入力文の構造を求める。
推敲知識蓄積部24dは、入力文の推敲に必要な知識が
蓄積されている。
日本語辞書25は、異表記を有する単語に対して、各表
記に別々に属性情報を設定せず、当該異表記が属する卑
語の代表表記のみに属性情報を設定し、異表記には代表
表記のみを設定するように構成されている。
日本語文法辞書26には1日本語の文法、すなわち構文
上の規則が格納されている。
出力ファイル27には、推敲処理部24において推敲さ
れた入力文の推敲結果が出力される。
推敲結果処理部28は、修正制御機能23cからの指示
により、出力ファイル27に格納されている推敲結果デ
ータを基にして入力文を修正し。
その結果を推敲制御部23を通して、入出力装置21へ
出力する。
以下1本実施例の動作を説明する。
対話型推敲の場合、入出力装置21はキーボードおよび
デイスプレィからなり、推敲すべき日本語文はキーボー
ドから1文づつ入力し、推敲結果はデイスプレィ画面上
に表示される。また、−括推敲の場合には5人出力装置
21はキーボードおよびプリンタからなり、推敲すべき
日本語文は文章として入力ファイル22に格納しておき
、推敲結果はプリンタにより印刷される。
対話型推敲および一括推敲のいずれの場合でも。
推敲すべき文を入力した後、入出力装置21から推敲制
御部23の機能選択部23aに指示を与えて、まず、推
敲制御機能23bを起動する。
推敲制御機能23bは、推敲処理部24の推敲エンジン
24aを起動すると共に入力文データを転送する。
推敲エンジン24aは、形態素解析部24bを起動する
と共に入力文データを転送する。
形態素解析部24bは、2段階に分けて形態素解析処理
を行う。
第1の形態素解析処理では2日本語辞書25を検索して
入力文を各形態素に分解する。その結果。
分解された形態素が異表記である場合、その形態素は意
味属性2文法属性などの属性情報を持たず。
当該形態素が属する単語の代表表記のみを持つ。
また、解析された形態素が異表記を有さない場合および
解析された形態素が代表表記である場合には、当該形態
素は、意味属性2文法属性などの属性情報を持つ。
第2の形態素解析処理では2第1の形態素解析処理にお
いて形態素に分解された結果、異表記の形態素がある場
合、再度、当該形態素が属する単語の代表表記で日本語
辞書25を検索し1代表表記が持っている意味属性1文
法属性などの属性情報を異表記の形態素に代入する。
形態素解析が終了すると、推敲エンジン24aは、構文
解析部24cを起動する。
構文解析部24Cは、形態素解析部24bにより解析さ
れた形態素を基にして日本語文法辞書26を検索するこ
とにより、入力文の構造を求める。
構文解析が終了すると、推敲エンジン24aは。
推敲知識蓄積部24dに蓄えられている推敲知識に基づ
いて、入力文を推敲する。推敲した結果のデータは、出
力ファイル27に出力される。また。
入出力装置21へも出力される。
次いで、入出力装置21から推敲制御部23の機能選択
部23aを介して修正制御機能23Cを起動する。
修正制御機能23Cは、推敲結果処理部28を起動させ
て、出力ファイル27に格納されている推敲結果データ
を修正する。
+th敲結果処理部28の処理結果は、推敲制御部23
を通して入出力装置21へ出力される。
〔発明の効果〕
本発明によれば、同一単語について代表表記のみが属性
情報を持ち、異表記は属性情報を持たずに3代表表記の
みを持つだけであるから2日本語辞書の容量を圧縮する
ことができる。
また、同−単語の異表記に対して同一の属性情報を別個
に与えなくて済むので1 日本語辞書データの保守が容
易になる。
【図面の簡単な説明】
第1図は本発明の原理説明図、第2図は本発明の1実施
例構成図、第3図は従来例を示す図である。 第1図において に日本語辞書 2:形態素解析部

Claims (1)

  1. 【特許請求の範囲】 異表記を有する単語に対して異なる表記ごとに別々に属
    性情報を持たせず、予め1つの代表表記を定めてその代
    表表記のみに属性情報を設定し、他の表記には代表表記
    のみを設定した日本語辞書(1)と、日本語辞書(1)
    を検索して入力文を形態素に分解する形態素解析部(2
    )とをそなえ、形態素解析部(2)は、入力文を、異表
    記を有する単語のうち代表表記以外の表記については、
    代表表記を対応づけて形態素に分解する第1の形態素解
    析処理と、 第1の形態素解析処理の結果について、代表表記を対応
    づけられた形態素に関しては、代表表記で日本語辞書(
    1)を再度検索し、代表表記に設定されている属性情報
    を代表表記を対応づけられた形態素に代入する第2の形
    態素解析処理とを行うことを特徴とする日本語文章処理
    方式。
JP63033402A 1988-02-16 1988-02-16 日本語文章処理方式 Expired - Fee Related JPH0731684B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP63033402A JPH0731684B2 (ja) 1988-02-16 1988-02-16 日本語文章処理方式

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP63033402A JPH0731684B2 (ja) 1988-02-16 1988-02-16 日本語文章処理方式

Publications (2)

Publication Number Publication Date
JPH01207869A true JPH01207869A (ja) 1989-08-21
JPH0731684B2 JPH0731684B2 (ja) 1995-04-10

Family

ID=12385601

Family Applications (1)

Application Number Title Priority Date Filing Date
JP63033402A Expired - Fee Related JPH0731684B2 (ja) 1988-02-16 1988-02-16 日本語文章処理方式

Country Status (1)

Country Link
JP (1) JPH0731684B2 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH01138161U (ja) * 1988-03-15 1989-09-21

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH01138161U (ja) * 1988-03-15 1989-09-21

Also Published As

Publication number Publication date
JPH0731684B2 (ja) 1995-04-10

Similar Documents

Publication Publication Date Title
US4773039A (en) Information processing system for compaction and replacement of phrases
US5579224A (en) Dictionary creation supporting system
JPS63231674A (ja) コンピュータによる形態論的テキスト解析方法
JPH05314166A (ja) 電子化辞書および辞書検索装置
JPH05120324A (ja) 言語処理方式
JPH01207869A (ja) 日本語文章処理方式
JPS6190269A (ja) 翻訳方式
JPS62197864A (ja) 言語情報提供装置
JP2521435B2 (ja) 日本語生成装置
JPS62163174A (ja) 機械翻訳装置
JPH0561902A (ja) 機械翻訳システム
JPS60200369A (ja) 機械翻訳装置
JP2759123B2 (ja) かな漢字変換装置
JPS6389976A (ja) 言語解析装置
JP2819766B2 (ja) 外国語電子辞書検索方式
JP3048793B2 (ja) 文字変換装置
JPH0414168A (ja) 文書作成装置
JPS63261467A (ja) 翻訳方法および装置
JP2005293069A (ja) 電子辞書
JPH08241319A (ja) 機械翻訳装置
JPS6180358A (ja) 翻訳装置
JPH04306766A (ja) 機械翻訳装置
JPH086950A (ja) キーワード翻訳機能付き機械翻訳装置
JPH0797372B2 (ja) 言語解析装置
JPH04321178A (ja) 機械翻訳システム

Legal Events

Date Code Title Description
LAPS Cancellation because of no payment of annual fees