JPH01231166A - 日本語文章処理方式 - Google Patents

日本語文章処理方式

Info

Publication number
JPH01231166A
JPH01231166A JP63057839A JP5783988A JPH01231166A JP H01231166 A JPH01231166 A JP H01231166A JP 63057839 A JP63057839 A JP 63057839A JP 5783988 A JP5783988 A JP 5783988A JP H01231166 A JPH01231166 A JP H01231166A
Authority
JP
Japan
Prior art keywords
japanese
expression
sentence
dictionary
word
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP63057839A
Other languages
English (en)
Inventor
Makoto Shiozu
塩津 誠
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP63057839A priority Critical patent/JPH01231166A/ja
Publication of JPH01231166A publication Critical patent/JPH01231166A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Document Processing Apparatus (AREA)
  • Machine Translation (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 〔概要〕 日本語文の冗長な重複表現を指摘する方式に関し。
日本語文の冗長な重複表現を適切に指摘することができ
るようにすることを目的とし。
日本語辞書を検索して入力文を形態素に解析する形態素
解析部と3日本語文法辞書を検索して入力文の構文構造
を求める構文解析部とをそなえた推敲処理システムを用
いて日本語文の冗長な重複表現を指摘する日本語文章処
理方式において、構文解析部の結果に基づいて入力文中
の単語または文節の係り元と係り先とを把握する概念構
造作成部と、i念構造作成部の結果に基づいて係り元と
係り先とに同一の表記または同一の意味を表す単語また
は文節があるかどうかを日本語辞書を検索することによ
りチェックし、同一の表記または同一の意味を表す単語
または文節がある場合には。
重複表現とみなして、それを指摘する重複表現チェック
部とを設けるように構成する。
〔産業上の利用分野〕
本発明は1日本語文章処理力式、特に日本語文の冗長な
重複表現を指摘する方式に関する。
〔従来の技術〕
日本語で文章を作成する機会は非常に多いが。
適切な文章を作成することは難しい、そのために。
推敲支援システムが開発されている。推敲支援システム
は1日本語辞書1日本語文法辞書、推敲知識などから構
成されており1作成された文章を推敲して誤字などを自
動的に修正するものである。
以下に推敲支援システムによる不適明文の自動修正の例
を示す。
例  −自動修正 ・誤字    除々に −徐々に ・不適切用語  裏日本 −日本海側 ・句読点    昨日見た。映画 −昨日見た映画 ・冗長     3国以上から5c+mまで −31か
ら5cI11まで ・括弧対応   この本(9月発売〕を読んだ・文体 
    昨日休みましたので、遅れた→ ・・・・・・
 遅れました ・重複     馬から落馬した ・足なし文   私は、この論文は正しい・ようにの否
定 彼のように仕事しない・長文字列   まことにあ
りがとうございました ・曖昧     損傷等があれば ・文語     好むと好まざるとにかかわらず−好ま
ない ・二重否定   間に合わないわけではない −間に合
う ・誤用     効果が見れる −効果が見られる ・長文     彼は・・・・・・し、・・・・・・し
、・・・・・・した→ 彼は・・・・・・した。そして ・連用中止   東京へ行き+ gFd査する −東京
へ行ってから調査する ・連語     機械11訳する −機械で翻訳する ・未登録語   」油田を見学した ・省略     ATLASで翻訳する・呼応    
 明日見た映画 ・共起     翻訳率が大きくなる −高くなる 〔発明が解決しようとする課題〕 人間が文章を作成する場合、「馬から落馬した」という
ような冗長な重複表現を用いることがある。
従来の推敲支援システムでも、これをチェックすること
はある程度可能であるが、従来の方式は単なる文字列で
比較するだけであるので1例えば。
「五に乗っていて落五した」という文も重複表現とみな
してしまうというように不完全であるという問題があっ
た。
本発明は1日本語文の冗長な重複表現を適切に指摘する
ことのできる日本語文章処理方式を提供することを目的
とする。
〔課題を解決するための手段〕
上記目的を達成するために1本発明の日本語文章処理方
式は1日本語辞書を検索して入力文を形態素に解析する
形態素解析部と1日本語文法辞書を検索して入力文の構
文構造を求める構文解析部とをそなえた推敲処理システ
ムを用いて日本語文の冗長な重複表現を指摘する日本語
文章処理方式において、構文解析部の結果に基づいて入
力文中の単語または文節の係り元と係り先とを把握する
概念構造作成部と、4!を念構造作成部の結果に基づい
て係り元と係り先とに同一の表記または同一の意味を表
す単語または文節があるかどうかを日本語辞書を検索す
ることによりチェックし、同一の表記または同一の意味
を表す単語または文節がある場合には1重複表現とみな
して、それを指摘する重複表現チェック部とを設けるよ
うに構成する。
第1図は1本発明の原理説明図である。
第1図において、1は形態素解析部、2は構文解析部、
3は概念構造作成部、4は重複表現チェック部、5は日
本語辞書、6は日本語文法辞書である。
形態素解析部lは1日本語辞書5を検索することにより
、入力文を形態素に解析する。
構文解析部2は1日本語文法辞書6を検索することによ
り、入力文の構文構造を求める。
概念構造作成部3は、構文解析部2の結果に基づいて入
力文中の単語または文節の係り元と係り先とを把握する
重複表現チェック部4は、概念構造作成部3の結果に基
づいて係り元と係り先とに同一の表記または同一の意味
を表す単語または文節があるかどうかをチェックし、同
一の表記または同一の意味を表す単語または文節がある
場合には1重複表現とみなして、それを指摘する。
日本語辞書5には、各単語の表記とそれが有する意味属
性1文法属性などの属性情報が格納されている。
日本語文法辞書6には9日本語の文法、すなわち、構文
上の規則が格納されている。
〔作用〕
具体例を用いて9本発明の詳細な説明する。
まず、「馬から落馬した」という文が入力されたものと
する。
この入力文は、形態素解析部1において2日本語辞書5
を検索することにより、形態素に解析される。すなわち
、「馬」 「から」「落馬」「シた」というように解析
される。各形態素「馬」。
「から」、「落馬」および「した」には1日本語辞書5
に格納されている意味属性1文法属性などの属性情報が
持たされる。
次いで、構文解析部2において1日本語文法辞書6を検
索することにより、構文構造が求められる。すなわち、
「馬」 (名詞)、「から」 (助詞)、「落馬」 (
名詞)、「シた」 (動詞)のように構文構造が求めら
れる。
構文解析部2において、その構文構造が求められた入力
文は、4!1念構造作成部3において、入力文を構成す
る単語または文節の係り元と係り先とが把握される。す
なわち、「馬から」が係り元であり、「落馬した」が係
り先であることが把握される。
その後1重複表現チェック部4において、概念構造作成
部3で把握された係り元の単語または文節と係り先の単
語または文節との間に同一の表記または同一の意味を表
す単語または文節があるがどうかが1日本語辞書5を検
索することにより。
チェックされる。
重複表現チェック部4において重複表現が発見された場
合には、その旨のメツセージが出力される。すなわち、
この例の場合では。
「馬と落馬は重複表現です」 のように、メツセージが出力される。
(実施例〕 第2図は9本発明の1実施例構成図である。
第2図において、21は入出力装置、22は入力ファイ
ル、23は推敲制御部、23aは機能選択部、23bは
推敲制御機能、23Cは表示制御機能、24は推敲処理
部、24aは推敲エンジン。
24bは形態素解析部、24Cは構文解析部、24dは
重複表現チェック部、25は日本語辞書。
26は日本語文法辞書、27は出力ファイル、28はチ
ェック結果処理部である。
人出力値ff21は1重複表現チェックを行うべき日本
語文章を入力し、チェック結果を取り出す装置である。
−捨型装置や対話型装置、あるいは。
その双方から構成されてもよい。
人力ファイル22には9重複表現チェックを行うべき日
本語文章が格納されている。
推敲制御部23は推敲に関するコマンドの解析と対応す
る処理部の制御を行い1機能選択部23a、推敲制御機
能23bおよび表示制御機能23Cを含む。
機能選択部23aは1人出力装置21からの指示に従っ
て、推敲か表示かという機能を選択する。
推敲制御機能23bは、推敲制御コマンドに従って、推
敲処理部24を起動する。
表示制御機能23cは1表示制御コマンドに従って、チ
ェック結果処理部28を起動する。
推敲処理部24は、推敲エンジン24a、形態素解析部
24b、構文解析部24cおよび重複表現チェック部2
4dからなる。
推敲エンジン24aは、形態素解析部24b。
構文解析部24Cおよび重複表現チェック部24dを制
御する。
形態素解析部24bは1日本語辞書25を検索して、入
力文を形態素に解析する。
構文解析部24cは、形態素解析部24bにおいて解析
された形態素によって得られた情報を基に1日本語文法
辞書26を検索して入力文の構造を求める。
重複表現チェック部24dは、構文解析部24Cの結果
に基づいて係り元と係り先とに同一の表記または同一の
意味を表す単語または文節があるかどうかを日本語辞書
25を検索することによりチェックする。
日本語辞書25は1日本語の単語表記とその属性情報と
を登録した辞書である。
日本語文法辞書26には1日本語の文法、すなわち構文
上の規則が格納されている。
出力ファイル27には、推敲処理部24において)1敲
された入力文の重複表現チェック結果が出力される。
チェック結果処理部28は9表示制御機能23Cからの
指示により、出力ファイル27に格納されている重複表
現チェック結果データを推敲制御部23を通して、入出
力装置21へ出力する。
以下1本実施例の動作を説明する。
対話型推敲の場合、入出力装置21はキーボードおよび
デイスプレィからなり1重複表現チェックを行うべき日
本語文はキーボードから1文づつ入力し、チェック結果
はデイスプレィ画面上に表示される。また、−括推敲の
場合には、入出力装置21はキーボードおよびプリンタ
からなり2重複表現チェックを行うべき日本語文は文章
として入力ファイル22に格納しておき、チェック結果
はプリンタにより印刷される。
対話型推敲および一括推敲のいずれの場合でも。
推敲すべき文を入力した後、入出力装置21から推敲制
御部23の機能選択部23aに指示を与えて、まず、推
敲制御機能23bを起動する。
推敲制御機能23bは、入力文データを推敲処理部24
の推敲エンジン24aに転送する。
推敲エンジン24aは、形態素解析部24bを起動する
と共に入力文データを転送する。
形態素解析部24bは1日本語辞書25を検索して入力
文を形態素に解析する。
形態素解析が終了すると、推敲エンジン24aは、構文
解析部24Cを起動する。
構文解析部24cは、形態素解析部24bにより解析さ
れた形態素を基にして日本語文法辞書26を検索するこ
とにより、入力文の構造を求めると共に係り元、係り先
からなるf1m関係を求める。
構文解析が終了すると、推敲エンジン24aは。
重複表現チェック部24dを起動する。
重複表現チェック部24dは、構文解析部24Cの結果
に基づいて係り元と係り先とに同一の表記または同一の
意味を表す単語または文節があるかどうかを日本語辞書
25を検索することによりチェックする。チェックした
結果のデータは、出力ファイル27に出力される。また
1人出力装置21へも出力される。
次いで、入出力装置21から推敲制御部23の機能i!
択部23aを介して表示制御機能23cを起動する。
表示側?11機能23Gは、チェック結果処理部28を
起動して、出力ファイル27に格納されている重複表現
チェック結果データに基づいて1重複表現がある場合に
は、その旨のメツセージを作成する。
チェック結果処理部28の処理結果は、推敲制御部23
を通して入出力装置21へ出力される。
第3図は、推敲エンジンの処理フロー図である。
第3図を用いて、推敲エンジンの動作をより詳細に説明
する。
■推敲対象となる日本語文を取り込む。
■形態素解析部を起動する。
■形態素解析部は3日本語辞6を検索して入力文を形態
素に解析する。
■構文解析部を起動する。
■構文解析部は、形態素解析部で解析された形態素を基
にして日本語文法辞書を検索することにより2人力文の
構文構造を求める。
■構造解析の結果に基づいて、係り元、係り先からなる
修飾関係などの概念構造を作成する。
■重複表現チェック部を起動する。
■概念構造に基づいて0日本語辞書を検索することによ
り、係り元と係り先とに同一の表記または同一の意味を
表す単語または文節があるかどうかをチェックする。
■重複表現が存在するかどうかを判断する。YESなら
ば次の[相]の処理を実行し、NOならば終了する。
[相]重複表現である旨をメツセージ出力する。
ここで9重複表現チェックの例を説明する。
i) 「馬から落馬した」 この文の場合、係り元は「馬から」であり、係り先は「
落馬した」である、係り元と係り先とをチェックすると
、「馬」という給量が重複しているので、「馬と落馬は
重複表現です」とメツセージ出力する。
1i)r馬に乗って落馬した」 この文の場合、「馬」は「乗って」の係り元であるが、
「落馬した」の係り元ではないので。
「馬」と「落馬した」との間には直接の係り関係は存在
しない、したがって、「重複表現はありません」とメツ
セージ出力する。
1ii)r馬から彼が落馬した」 この文の場合、「馬」と「彼が」は共に「落馬した」の
係り元であるので5係り元と係り先とをチェックすると
、「馬」という語霊が重複していることとなり、「馬と
落馬は重複表現です」とメツセージ出力する。
1v)r彼は道を歩き、彼女は山を歩いた」この文の場
合、「彼は道を歩き」は「彼女は山を歩いた」の係り元
であると共に、「彼は」と「道を」が「歩き」の係り元
であり、「彼女は」と「山を」が「歩いた」の係り元で
ある。そして。
「歩き」と「歩いた」は、「歩く」という同一の単語で
あるから、「彼は道を歩き」と「彼女は山を歩いた」と
は、並立関係にある0、このように係り関係が並立関係
にある場合には9重複表現とはみなさない、したがって
、「重複表現はありません」とメツセージ出力する。
〔発明の効果〕
本発明によれば5日本語文の冗長な重複表現を適切に指
摘することができる。
【図面の簡単な説明】
第1図は本発明の原理説明図、第2図は本発明の1実施
例構成図、第3図は推敲エンジンの処理フロー図である
。 第1図において 1:形態素解析部 2:構文解析部 3:lfi念構造作成部 4rm複表現チェック部 5:日本語辞書 6:日本語文法辞書

Claims (1)

  1. 【特許請求の範囲】 日本語辞書(5)を検索して入力文を形態素に解析する
    形態素解析部(1)と、日本語文法辞書(6)を検索し
    て入力文の構文構造を求める構文解析部(2)とをそな
    えた推敲処理システムを用いて日本語文の冗長な重複表
    現を指摘する日本語文章処理方式において、構文解析部
    (2)の結果に基づいて入力文中の単語または文節の係
    り元と係り先とを把握する概念構造作成部(3)と、 概念構造作成部(3)の結果に基づいて係り元と係り先
    とに同一の表記または同一の意味を表す単語または文節
    があるかどうかを日本語辞書(5)を検索することによ
    りチェックし、同一の表記または同一の意味を表す単語
    または文節がある場合には、重複表現とみなして、それ
    を指摘する重複表現チェック部(4)とを設けたことを
    特徴とする日本語文章処理方式。
JP63057839A 1988-03-11 1988-03-11 日本語文章処理方式 Pending JPH01231166A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP63057839A JPH01231166A (ja) 1988-03-11 1988-03-11 日本語文章処理方式

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP63057839A JPH01231166A (ja) 1988-03-11 1988-03-11 日本語文章処理方式

Publications (1)

Publication Number Publication Date
JPH01231166A true JPH01231166A (ja) 1989-09-14

Family

ID=13067134

Family Applications (1)

Application Number Title Priority Date Filing Date
JP63057839A Pending JPH01231166A (ja) 1988-03-11 1988-03-11 日本語文章処理方式

Country Status (1)

Country Link
JP (1) JPH01231166A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5276897A (en) * 1989-06-16 1994-01-04 Stalmarck Gunnar M N System for determining propositional logic theorems by applying values and rules to triplets that are generated from boolean formula

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5276897A (en) * 1989-06-16 1994-01-04 Stalmarck Gunnar M N System for determining propositional logic theorems by applying values and rules to triplets that are generated from boolean formula

Similar Documents

Publication Publication Date Title
JP2654001B2 (ja) 機械翻訳方法
Duran et al. Propbank-Br: a Brazilian Treebank annotated with semantic role labels.
Hajič Complex corpus annotation: The Prague dependency treebank
Basile et al. A platform for collaborative semantic annotation
Boguslavsky SynTagRus–a deeply annotated corpus of Russian
JPH05120324A (ja) 言語処理方式
Ranta Multilingual Text Generation for Abstract Wikipedia in Grammatical Framework: Prospects and Challenges
Simov et al. A Language Resources Infrastructure for Bulgarian.
JPH01231166A (ja) 日本語文章処理方式
JPH01231164A (ja) 日本語文章処理方式
JP3113257B2 (ja) 機械翻訳装置
JPS60193074A (ja) 日本語解析装置
JPH01231167A (ja) 日本語文章処理方式
Eyes et al. Progress in UCREL research: Improving corpus annotation practices
JPH01207868A (ja) 日本語文章処理方式
Szabó Information Retrieval Thesaurus
Skadiņa et al. Comprehension Assistant for Languages of Baltic States
Alansary et al. IAN: An Automatic tool for Natural Language Analysis
JP3132563B2 (ja) 文書作成支援装置
JP2726416B2 (ja) 翻訳装置及び翻訳方法
JPH07141382A (ja) 外国語文書作成支援装置
JP2839419B2 (ja) イディオム登録機能を持つ機械翻訳装置
JP2752025B2 (ja) 機械翻訳装置
Khin IMPLEMENTATION OF NATURAL LANGUAGE TRANSLATION SYSTEM BASED ON NLP: MYANMAR TO JAPAN TRANSLATION PROCESS
Rosner Finite state analysis of prepositional phrases in Maltese