JPH02129758A - 日本語文推敲処理装置 - Google Patents

日本語文推敲処理装置

Info

Publication number
JPH02129758A
JPH02129758A JP63283147A JP28314788A JPH02129758A JP H02129758 A JPH02129758 A JP H02129758A JP 63283147 A JP63283147 A JP 63283147A JP 28314788 A JP28314788 A JP 28314788A JP H02129758 A JPH02129758 A JP H02129758A
Authority
JP
Japan
Prior art keywords
sentence
corrected
japanese
network
concept
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP63283147A
Other languages
English (en)
Other versions
JP2655703B2 (ja
Inventor
Yoshiyuki Nobukuni
信国 佳之
Masuki Takanashi
益樹 高梨
Akemi Okamoto
岡本 朱美
Noboru Iwasaki
昇 岩崎
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP63283147A priority Critical patent/JP2655703B2/ja
Publication of JPH02129758A publication Critical patent/JPH02129758A/ja
Application granted granted Critical
Publication of JP2655703B2 publication Critical patent/JP2655703B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Machine Translation (AREA)
  • Document Processing Apparatus (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 〔概要〕 日本語文の推敲処理を行う日本語文推敲処理装置に関し
、 入力文の概念ネットワークを作成してこれを修正などし
た後に日本文を生成し、日本文の誤りなどを自動修正す
ることを目的とし、 入力文を形態素解析した結果および更に構文解析して生
成した構文木から概念を取り出して入力文の概念ネット
ワークを作成し、この入力文の概念ネットワークについ
て、予め指定した常体、敬体、分割などに対応して、間
違っている概念を正しい概念に修正、および分割指示に
対応して分割可能な部分に接続詞を付加などした補正後
の概念ネットワークを生成し、この補正後の概念ネット
ワークから日本語文を生成するように構成する。
〔産業上の利用分野〕
本発明は、日本語文の推敲処理を行う日本語文推敲処理
装置に関するものである。ワードブロセンサの普及に伴
い、多くの文書が電子化され、人間が作成した日本語文
の誤り箇所を自動的に修正する推敲処理装置が望まれて
いる。
〔従来の技術と発明が解決しようとする課題〕従来の推
敲処理装置は、日本文の誤り箇所を自動修正する場合、
解析処理で得た誤り情報をもとに、単に文字列(単語)
を置き換えるに過ぎなかった0例えば第8図(イ)に示
すように、“この文は誤まっている°という原文に対し
て、予め“誤ま”の中に置き換え情報“誤”を設定して
おき、これを参照して指摘6送り仮名誤り:誤ま一誤”
というように画面上に表示し、これによって置き換えて
(Tl正した原文゛この文は誤っている”というように
修正していた。
しかし、文字列を単に置き換えることにより、誤り箇所
以外の部分に影響がでる場合には、人が直接に原文を書
き換える必要が生じてしまうという問題があった0例え
ば第8図(ロ)に示すように、“雨が降りましたので、
学校を休んだ”という原文に対して、“まし” (敬体
)の中に置き換え情報を設定しておくだけでは、前後に
活用、音便などがあるために、単に文字列の置き換えの
みでは、自動修正できず、手修正によって修正した原文
“雨が降ったので、学校を休んだ“というように書き換
える必要があつた。
本発明は、入力文の概念ネットワークを作成してこれを
修正などした後に日本文を生成し、日本文の誤りなどを
自動修正することを目的としている。
〔課題を解決する手段〕
第1図を参照して課題を解決する手段を説明する。
第1図において、概念ネットワーク(入力文)9は、入
力文を形態素解析した結果(主語、述語、品詞など)お
よび更に形態素解析して生成した構文木から概念を取り
出して生成したものである(第6図(イ)参照)。
概念ネットワーク(補正後) 11は、入力文に対応す
る概念ネットワーク9について、予め指定した常体、敬
体、分割などに対応して、間違っている概念を正しい概
念に修正、および分割指示に対応して分割可能な部分に
接続詞を付加などした補正後のものである(第6図(ロ
)参照)。
〔作用〕
本発明は、第1図に示すように、入力文を形態素解析し
た結果および更に構文解析して生成した構文木から概念
を取り出して概念ネットワーク9を生成し、この概念ネ
ットワーク9について、予め指定した常体、敬体、分割
などに対応して、補正後の概念ネットワーク11を作成
し、この補正後の概念ネットワーク11から日本語文を
生成するようにしている。
従って、入力文の概念に着目して作成した概念ネットワ
ーク9上で日本語文の誤りを修正、および分割指示に対
応して接続詞を付加などして補正した後、日本語文に戻
すことにより、日本語文を正確かつ迅速に自動修正する
ことが可能となる。
〔実施例〕
次に、第1図から第7図を用いて本発明の1実施例の構
成および動作を順次詳細に説明する。
第1図において、入力部1は、日本語の原文を入力する
ものである。
記憶部2は、原文および原文の推敲結果などを記憶する
ものである。
編集処理制御部3は、原文および原文の推敲結果などの
編集を制御するものである。
出力部4は、原文および原文の推敲結果などを出力(印
字など)するものである。
推敲処理部5は、入力された日本語原文を解析して誤り
箇所を見つけ、修正するものである。
形態素解析処理部6は、入力された日本語原文について
、日本語辞書13を参照して、形態素列に分割するもの
である(第3図参照)。
構文解析処理部7は、形態素解析処理部6によって形態
素列に分割された結果について、日本語解析文法14を
参照して、構文解析を行って構文木を生成するものであ
る(第4図参照)。
概念構造生成処理部8は、形態素列および構文木から、
概念構造文法15を参照して、概念を取り出して入力文
の概念ネットワーク9を作成するものである(第6図(
イ)参照)。
推敲知識部10は、入力文の概念ネットワーク9につい
て、意味辞書16を参照して、原文中の誤りを見つけて
当該概念ネットワーク9を自動補正、更に分割指示に対
応して接続詞などを付加し、補正後の概念ネットワーク
11を生成するものである。
生成処理部12は、補正後の概念ネットワーク11から
、日本語生成文法17を参照して、正しい日本語文を生
成するものである。
以上の処理によって、入力文の概念ネットワーク9を作
成し、この概念レベルで誤りを見つけて修正(例えば敬
体指定に対応して常体を敬体に修正)、および更に分割
指定に対応して、分割可能な部分に接続詞を追加などし
た補正後の概念ネットワーク11を作成し、これから正
しい日本語文を自動生成するようにしている。
第2図に示す順序に従い、本発明の1実施例の構成の動
作を第3図から第7図を用いて具体的に順次説明する。
第2図において、■は、形態素解析し、形態素(語幹、
活用語尾、接頭語、接尾語など)列をメモリ上に展開す
る。これは、入力文について、日本語辞書13を参照し
て形態素解析し、各単語の文法情報、隣接情報などを表
現することを意味している(第3図参照)。
■は、構文解析し、構文木をメモリ上に展開する。これ
は、■で形態素解析の文法情報をもとに、日本語解析文
法14を参照して構文解析し、単語どうしの結びつきか
ら文節を得、文節どうしの関係を構文木(t r e 
e、ノードを第5図に示すように結合したもの)で表現
することを意味している(第4図、第5図参照)。
■は、概念構造を作成し、概念のネットワークをメモリ
上に展開する。これは、■で形態素解析した結果である
形態素列、および■で構文解析した結果である構文木か
ら、概念構造文法15を参照して概念maのためのアー
ク(ノード間の関係、ノードへのポインタなどが格納さ
れている)、ノード(文法情報、アークへのポインタ、
語の中の原文における文字位置などが格納されている)
を作成し、概念ネットワーク9を作成することを意味し
ている。このアークのうち、く文〉で示されるアークが
概念ネットワークの入口である。このアークからポイン
タを辿ることにより、全てのノード、アークを参照する
ことができる。
■は、推敲知識を適用し、■〜■から原文中の誤りを修
正した概念構造に補正し、補正後の概念ネットワーク1
1をメモリ上に展開する。これは、■から■の結果に基
づいて、意味辞書16を参照して入力文の概念ネットワ
ーク9の誤りを修正、および分割指定に対応して分割可
能な部分に接続詞を追加などすることを意味している。
この修正・追加の際に、必要に応じて概念ネットワーク
9のアーク、ノードを補正し、補正後の概念ネットワー
ク11を作成するようにしている。
■は、日本文を修正、即ち■で得られた概念構造(概念
ネットワーク11)をもとに、日本語生成文法17を参
照して正しい日本文を生成することを意味している。
■は、修正文を出力する。
以上の処理によって、日本語文の誤りを自動修正すると
共に、更に分割指定に対応して入力文を自動的に複数の
判り易い正しい日本文に分割することが可能となる。
第3図は、形態素列例を示す。これは、第2図■で形態
素解析された実例を示す。ここで、入力文は、“雨が降
りましたので、学校を休んだ”である。図中下線を引い
た部分が形態素解析された単語であり、その下に文法情
報がそれぞれ記載しである。
第4図は、構文木(t r e e)例を示す。これは
、第3図形態素列例を構文解析して生成した構文木を示
す。この構文木のノード(矩形で表す)には、最下段に
示す単語が対応している。これらノードにはポインタが
格納され、第5図に示すように、親ノードと子ノードと
が接続され、図示構文木が構成されている。
第5図は、親子ノードの関係の例を示す。各ノードは、
ポインタによって例えば図示のように親ノードと、子ノ
ードとが接続され、第4凹溝文木を構成している。
第6図は、本発明に係わる概念ネットワーク例を示す、
第6図(イ)は入力文の概念ネットワーク例を示し、第
6図(ロ)は補正後の概念ネットワーク例を示す。
第6図(イ)に示す入力文の概念ネットワーク9は、第
3図形態素列および第4凹溝文木から、概念に注目して
、作成されたものである。ここで、■は、入力文“雨が
降りましたので、学校を休んだ”中の“雨”と“降る“
との関係についての′まし°が第3図から“助動詞、敬
体°と形態素解析されているので、文体が“敬体”とさ
れたものである、同様にして、■は、“だ” (末尾の
助詞)が“常体°と形態素解析されているので、文体が
“常体′とされたものである。
第6図(ロ)に示す補正後の概念ネットワーク11は、
第6図(イ)入力文の概念ネットワーク9中の■“敬体
”と、■“常体”とが文法誤りであることが自動検出さ
れたので、これを予め指定した“常体゛に自動修正(補
正)したものである。
この補正後の概念ネットワーク11を日本語文に生成す
ると、“雨が降ったので、学校を休んだ”と自動的に“
常体”となった正しい日本語文に修正されることとなる
第7図は、本発明に係わる文分割例を示す、第7図(イ
)入力文“雨が降ったので、私は学校を休んだ”を示す
第7図(ロ)は、第7図(イ)入力文の概念ネットワー
ク9を示す。
第7図(ハ)は、補正後の概念ネットワークを示す、こ
れは、以下の手順によって補正されたものである。
+11  分割可能な部分を第7図(ロ)入力文の概念
ネットワーク9中から探す、この場合には、(A)の部
分として見つかる。
(2)  (1)で見つけた分割可能な部分である(A
)のく原因〉に対応する接続詞“だから“を図示外の辞
書から選択する。
(3)第7図(ロ)入力文の概念ネットワーク9の概念
構造を、(2)に対応して補正、即ち第7図(ハ)に示
すように、新たに追加する接続詞“だから”によって2
つの文に分割する。
(4)第7図(ハ)補正後の概念ネットワーク11から
、第7図(ニ)に示す日本語文の出力文“雨が降った。
だから私は学校を休んだ、”を出力する。
また、文分割の他に、冗長表現、重複表現、あいまい表
現などを持つ入力文の概念ネットワーク9から不要な部
分を削除し、冗長、重複、あいまいな表現などのない日
本語文を自動生成することもできる。
〔発明の効果〕
以上説明したように、本発明によれば、入力文から概念
ネットワーク9を作成し、誤りを修正、および更に分割
指定に対応して接続詞を追加などして補正後の概念ネッ
トワーク11を作成した後、日本語文を生成する構成を
採用しているため、概念に着目して日本語文の誤りを正
確にかつ迅速に自動修正することができると共に、更に
分割指定に対応して自動的に日本語文を複数に分割する
ことができる。
【図面の簡単な説明】
第1図は本発明のシステム構成図、第2図は本発明の動
作説明図、第3図は形態素列例、第4図は構文木(t 
r e e)例、第5図は親子ノードの関係の例、第6
図は本発明に係わる概念ネットワーク例、第7図は本発
明に係わる文分割例、第8図は従来技術の説明図を示す
。 図中、5は推敲処理部、6は形態素解析処理部、7は構
文解析処理部、8は概念構造生成処理部、9は入力文の
概念ネットワーク、10は推敲知識部、11は補正後の
概念ネットワーク、12は生成処理部を表す。 本発明の動作説明図 第 図 主語 連用 敬体 過去 原因 り1象 連用常体 過去 形態素列例 第 図 雨 が 降 リ まし た ので 学校  を 休 ん
 だ構文木(t r e e)例 第 図 親子ノードの関係の例 (うまくいく例) (うまくいかない例) (ロ) 従来技術の説明図 1修正 ■ 1  入力文の概念ネットワーク例 1         (イ) 補正後の概念ネットワーク (ロ) 本発明に係る概念ネットワーク例 第 図

Claims (1)

  1. 【特許請求の範囲】 日本語文の推敲処理を行う日本語文推敲処理装置におい
    て、 入力文を形態素解析した結果および更に構文解析して生
    成した構文木から概念を取り出して入力文の概念ネット
    ワーク(9)を作成し、 この入力文の概念ネットワーク(9)について、予め指
    定した常体、敬体、分割などに対応して、間違っている
    概念を正しい概念に修正、および分割指示に対応して分
    割可能な部分に接続詞を付加などした補正後の概念ネッ
    トワーク(11)を生成し、この補正後の概念ネットワ
    ーク(11)から日本語文を生成するように構成したこ
    とを特徴とする日本語文推敲処理装置。
JP63283147A 1988-11-09 1988-11-09 日本語文推敲処理方法 Expired - Fee Related JP2655703B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP63283147A JP2655703B2 (ja) 1988-11-09 1988-11-09 日本語文推敲処理方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP63283147A JP2655703B2 (ja) 1988-11-09 1988-11-09 日本語文推敲処理方法

Publications (2)

Publication Number Publication Date
JPH02129758A true JPH02129758A (ja) 1990-05-17
JP2655703B2 JP2655703B2 (ja) 1997-09-24

Family

ID=17661827

Family Applications (1)

Application Number Title Priority Date Filing Date
JP63283147A Expired - Fee Related JP2655703B2 (ja) 1988-11-09 1988-11-09 日本語文推敲処理方法

Country Status (1)

Country Link
JP (1) JP2655703B2 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH04233598A (ja) * 1990-06-28 1992-08-21 American Teleph & Telegr Co <Att> テキスト−音声変換装置

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS62150462A (ja) * 1985-12-24 1987-07-04 Nec Corp 文章誤り自動修正方式

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS62150462A (ja) * 1985-12-24 1987-07-04 Nec Corp 文章誤り自動修正方式

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH04233598A (ja) * 1990-06-28 1992-08-21 American Teleph & Telegr Co <Att> テキスト−音声変換装置

Also Published As

Publication number Publication date
JP2655703B2 (ja) 1997-09-24

Similar Documents

Publication Publication Date Title
JP4330285B2 (ja) 機械翻訳用辞書登録装置、機械翻訳用辞書登録方法、機械翻訳装置、機械翻訳方法及び記録媒体
US5111398A (en) Processing natural language text using autonomous punctuational structure
JPS62163173A (ja) 機械翻訳方法
JPH0351022B2 (ja)
JPH02129758A (ja) 日本語文推敲処理装置
JP2704945B2 (ja) 重複表現処理装置
JPH0424825A (ja) 文法編集処理装置
JP2875100B2 (ja) 翻訳装置
JP3051747B2 (ja) 機械翻訳方法及び機械翻訳システム
JP3892227B2 (ja) 機械翻訳システム
JPH04158477A (ja) 機械翻訳装置
JPS62272357A (ja) 機械翻訳システムにおける入力文のエラ−表示方式
JPH01231167A (ja) 日本語文章処理方式
JPS63136265A (ja) 機械翻訳装置
JPH04367073A (ja) 機械翻訳システムにおける文法作成支援方法
JPH0550778B2 (ja)
JPH0728821A (ja) テキスト処理装置
JPH07122876B2 (ja) 機械翻訳装置
JPH05225232A (ja) テキスト自動前編集装置
JP2004086919A (ja) 機械翻訳システム
JPS6244872A (ja) 機械翻訳装置
JPH0444981B2 (ja)
JP2004157688A (ja) 翻訳装置、翻訳方法及び翻訳プログラム
JPH03156669A (ja) 文書処理装置
JP2012203586A (ja) 文書処理装置およびプログラム

Legal Events

Date Code Title Description
LAPS Cancellation because of no payment of annual fees