JP2655703B2 - 日本語文推敲処理方法 - Google Patents

日本語文推敲処理方法

Info

Publication number
JP2655703B2
JP2655703B2 JP63283147A JP28314788A JP2655703B2 JP 2655703 B2 JP2655703 B2 JP 2655703B2 JP 63283147 A JP63283147 A JP 63283147A JP 28314788 A JP28314788 A JP 28314788A JP 2655703 B2 JP2655703 B2 JP 2655703B2
Authority
JP
Japan
Prior art keywords
sentence
concept
japanese
concept network
network
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP63283147A
Other languages
English (en)
Other versions
JPH02129758A (ja
Inventor
佳之 信国
益樹 高梨
朱美 岡本
昇 岩崎
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP63283147A priority Critical patent/JP2655703B2/ja
Publication of JPH02129758A publication Critical patent/JPH02129758A/ja
Application granted granted Critical
Publication of JP2655703B2 publication Critical patent/JP2655703B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Machine Translation (AREA)
  • Document Processing Apparatus (AREA)

Description

【発明の詳細な説明】 〔概要〕 日本語文の推敲処理を行う日本語文推敲処理装置に関
し、 入力文の概念ネットワークを作成してこれを修正など
した後に日本文を生成し、日本文の誤りなどを自動修正
することを目的とし、 入力文を形態素解析した結果および更に構文解析して
生成した構文木から概念を取り出して入力文の概念ネッ
トワークを作成し、この入力文の概念ネットワークにつ
いて、予め指定した常体、敬体、分割などに対応して、
間違っている概念を正しい概念に修正、および分割指示
に対応して分割可能な部分に接続詞を付加などした補正
後の概念ネットワークを生成し、この補正後の概念ネッ
トワークから日本語文を生成するように構成する。
〔産業上の利用分野〕 本発明は、日本語文の推敲処理を行う日本語文推敲処
理装置に関するものである。ワードプロセッサの普及に
伴い、多くの文書が電子化され、人間が作成した日本語
文の誤り箇所を自動的に修正する推敲処理装置が望まれ
ている。
〔従来技術と発明が解決しようとする課題〕
従来の推敲処理装置は、日本文の誤り箇所を自動修正
する場合、解析処理で得た誤り情報をもとに、単に文字
列(単語)を置き換えるに過ぎなかった。例えば第8図
(イ)に示すように、“この文は誤まっている”という
原文に対して、予め“誤ま”の中に置き換え情報“誤”
を設定しておき、これを参照して指摘“送り仮名誤り:
誤ま→誤”というように画面上に表示し、これによって
置き換えて修正した原文“この文は誤っている”という
ように修正していた。
しかし、文字列を単に置き換えることにより、誤り箇
所以外の部分に影響がでる場合には、人が直接に原文を
書き換える必要が生じてしまうという問題があった。例
えば第8図(ロ)に示すように、“雨が降りましたの
で、学校を休んだ”という原文に対して、“まし”(敬
体)の中に置き換え情報を設定したおくだけでは、前後
に活用、音便などがあるために、単に文字列の置き換え
のみでは、自動修正できず、手修正によって修正した原
文“雨が降ったので、学校を休んだ”というように書き
換える必要があった。
本発明は、入力文の概念ネットワークを作成してこれ
を修正などした後に日本文を生成し、日本文の誤りなど
を自動修正することを目的としている。
〔課題を解決する手段〕
第1図を参照して課題を解決する手段を説明する。
第1図において、概念ネットワーク(入力文)9は、
入力文を形態素解析した結果(主語、述語、品詞など)
および更に形態素解析して生成した構文木から概念を取
り出して生成したものである(第6図(イ)参照)。
概念ネットワーク(補正後)11は、入力文に対応する
概念ネットワーク9について、予め指定した常体、敬
体、分割などに対応して、間違っている概念を正しい概
念に修正、および分割指示に対応して分割可能な部分に
接続詞を付加などした補正後のものである(第6図
(ロ)参照)。
〔作用〕
本発明は、第1図に示すように、入力文を形態素解析
した結果および更に構文解析して生成した構文木から概
念を取り出して概念ネットワーク9を生成し、この概念
ネットワーク9について、予め指定した常体、敬体、分
割などに対応して、補正後の概念ネットワーク11を作成
し、この補正後の概念ネットワーク11から日本語文を生
成するようにしている。
従って、入力文の概念に着目して作成した概念ネット
ワーク9上で日本語文の誤りを修正、および分割指示に
対応して接続詞を付加などして補正した後、日本語文に
戻すことにより、日本語文を正確かつ迅速に自動修正す
ることが可能となる。
〔実施例〕
次に、第1図から第7図を用いて本発明の1実施例の
構成および動作を順次詳細に説明する。
第1図において、入力部1は、日本語の原文を入力す
るものである。
記憶部2は、原文および原文の推敲結果などを記憶す
るものである。
編集処理制御部3は、原文および原文の推敲結果など
の編集を制御するものである。
出力部は、原文および原文の推敲結果などを出力(印
字など)するものである。
推敲処理部5は、入力された日本語原文を解析して誤
り箇所を見つけ、修正するものである。
形態素解析処理部6は、入力された日本語原文につい
て、日本語辞書13を参照して、形態素列に分割するもの
である(第3図参照)。
構文解析処理部7は、形態素解析処理部6によって形
態素列に分割された結果について、日本語解析文法14を
参照して、構文解析を行って構文木を生成するものであ
る(第4図参照)。
概念ネットワーク生成処理部8は、形態素列および構
文木から、概念構造文法15を参照して、概念を取り出し
て入力文の概念ネットワーク9を作成するものである
(第6図(イ)参照)。
推敲知識部10は、入力文の概念ネットワーク9につい
て、意味辞書16を参照して、原文中の誤りを見つけて当
該概念ネットワーク9を自動補正、更に分割指示に対応
して接続詞などを付加し、補正後の概念ネットワーク11
を生成するものである。
生成処理部12は、補正後の概念ネットワーク11から、
日本語生成文法17を参照して、正しい日本語文を生成す
るものである。
以上の処理によって、入力文の概念ネットワーク9を
作成し、この概念レベルで誤りを見つけて修正(例えば
敬体指定に対応して常体を敬体に修正)、および更に分
割指定に対応して、分割可能な部分に接続詞を追加など
した補正の概念ネットワーク11を作成し、これから正し
い日本語文を自動生成するようにしている。
第2図に示す順序に従い、本発明の1実施例の構成の
動作を第3図から第7図を用いて具体的に順次説明す
る。
第2図において、は、形態素解析し、形態素(語
幹、活用語尾、接頭語、接尾語など)列をメモリ上に展
開する。これは、入力文について、日本語辞書13を参照
して形態素解析し、各単語の文法情報、隣接情報などを
表現することを意味している(第3図参照)。
は、構文解析し、構文木をメモリ上に展開する。こ
れは、で形態素解析の文法情報をもとに、日本語解析
文法14を参照して構文解析し、単語どうしの結びつきか
ら文節を得、文節どうしの関係を構文木(tree、ノード
を第5図に示すように結合したもの)で表現することを
意味している(第4図、第5図参照)。
は、概念構造を作成し、概念のネットワークをメモ
リ上に展開する。これは、で形態素解析した結果であ
る形態素列、およびで構文解析した結果である構文木
から、概念構造文法15を参照して概念構造のためのアー
ク(ノード間の関係、ノードへのポインタなどが格納さ
れている)、ノード(文法情報、アークへのポインタ、
語の中の原文における文字位置などが格納されている)
を作成し、概念ネットワーク9を作成することを意味し
ている。このアークのうち<文>で示されるアークが概
念ネットワークの入口である。このアークからポインタ
を辿ることにより、全てのノード、アークを参照するこ
とができる。
は、推敲知識を適用し、〜から原文中の誤りを
修正した概念構造に補正し、補正後の概念ネットワーク
11をメモリ上に展開する。これは、からの結果に基
づいて、意味辞書16を参照して入力文の概念ネットワー
ク9の誤りを修正、および分割指定に対応して分割可能
な部分に接続詞を追加などすることを意味している。こ
の修正・追加の際に、必要に応じて概念ネットワーク9
をアーク、ノードを補正し、補正後の概念ネットワーク
11を作成するようにしている。
は、日本文を修正、即ちで得られた概念構造(概
念ネットワーク11)をもとに、日本語生成文法17を参照
して正しい日本文を作成することを意味している。
は、修正文を出力する。
以上の処理によって、日本語文の誤りを自動修正する
と共に、更に分割指定に対応して入力文を自動的に複数
の判り易い正しい日本文に分割することが可能となる。
第3図は、形態素列例を示す。これは、第2図で形
態素解析された実例を示す。ここで、入力文は、“雨が
降りましたので、学校を休んだ”である。図中下線を引
いた部分が形態素解析された単語であり、その下に文法
情報がそれぞれ記載してある。
第4図は、構文木(tree)例を示す。これは、第3図
形態素列例を構文解析して生成した構文木を示す。この
構文木のノード(矩形で表す)には、最下段に示す単語
が対応している。これらノードにはポインタが格納さ
れ、第5図に示すように、親ノードと子ノードとが接続
され、図示構文木が構成されている。
第5図は、親ノードの関係の例を示す。各ノードは、
ポインタによって例えば図示のように親ノードと、子ノ
ードとが接続され、第4図構文木を構成している。
第6図は、本発明に係わる概念ネットワーク例を示
す。第6図(イ)は入力文の概念ネットワーク例を示
し、第6図(ロ)は補正後の概念ネットワーク例を示
す。
第6図(イ)に示す入力文の概念ネットワーク9は、
第3図形態素列および第4図構文木から、概念に注目し
て、作成されたものである。ここで、は、入力文“雨
が降りましたので、学校を休んだ”中の“雨”と“降
る”との関係についての“まし”が第3図から“助動
詞、敬体”と形態素解析されているので、文体が“敬
体”されたものである。同様にして、は、“だ”(末
尾の助詞)が“常体”と形態素解析されているので、文
体が“常体”とされたものである。
第6図(ロ)に示す補正後の概念ネットワーク11は、
第6図(イ)入力文の概念ネットワーク9中の“敬
体”と、“常体”とが文法誤りであることが自動検出
されたので、これを予め指定した“常体”に自動修正
(補正)したものである。この補正後の概念ネットワー
ク11を日本語文に生成すると、“雨が降ったので、学校
を休んだ”と自動的に“常体”となった正しい日本語文
に修正されることとなる。
第7図は、本発明に係わる文分割例を示す。第7図
(イ)入力文“雨が降ったので、私は学校を休んだ”を
示す。
第7図(ロ)は、第7図(イ)入力文の概念ネットワ
ーク9を示す。
第7図(ハ)は、補正後の概念ネットワークを示す。
これは、以下の手順によって補正されたものである。
(1) 分割可能な部分を第7図(ロ)入力文の概念ネ
ットワーク9中から探す。この場合には、(A)の部分
として見つかる。
(2) (1)で見つけた分割可能な部分である(A)
の<原因>に対応する接続詞“だから”を図示外の辞書
から選択する。
(3) 第7図(ロ)入力文の概念ネットワーク9の概
念構造を、(2)に対応して補正、即ち第7図(ハ)に
示すように、新たに追加する接続詞“だから”によって
2つの文に分割する。
(4) 第7図(ハ)補正後の概念ネットワーク11か
ら、第7図(ニ)に示す日本語文の出力文“雨が降っ
た。だから私は学校を休んだ。”を出力する。
また、文分割の他に、冗長表現、重複表現、あいまい
表現などを持つ入力文の概念ネットワーク9から不要な
部分を削除し、冗長、重複、あいまいな表現などのない
日本語文を自動生成することもできる。
〔発明の効果〕
以上説明したように、本発明によれば、入力文から概
念ネットワーク9を作成し、誤りを修正、および更に分
割指定に対応して接続詞を追加などして補正後の概念ネ
ットワーク11を作成した後、日本語文を生成する構成を
採用しているため、概念に着目して日本語文の誤りを正
確にかつ迅速に自動修正することができると共に、更に
分割指定に対応して自動的に日本語文を複数に分割する
ことができる。
【図面の簡単な説明】
第1図は本発明のシステム構成図、第2図は本発明の動
作説明図、第3図は形態素列例、第4図は構文木(tre
e)例、第5図は親子ノードの関係の例、第6図は本発
明に係わる概念ネットワーク例、第7図は本発明に係わ
る文分割例、第8図は従来技術の説明図を示す。 図中、5は推敲処理部、6は形態素解析処理部、7は構
文解析処理部、8は概念ネットワーク生成処理部、9は
入力文の概念ネットワーク、10は推敲知識部、11は補正
後の概念ネットワーク、12は生成処理部を表す。
───────────────────────────────────────────────────── フロントページの続き (72)発明者 岡本 朱美 神奈川県川崎市中原区上小田中1015番地 富士通株式会社内 (72)発明者 岩崎 昇 神奈川県川崎市中原区上小田中1015番地 富士通株式会社内 (56)参考文献 特開 昭62−150462(JP,A) 特開 昭62−198961(JP,A)

Claims (1)

    (57)【特許請求の範囲】
  1. 【請求項1】入力部(1)と、出力部(4)と、記憶・
    推敲処理部(X)とを有する日本語文推敲処理装置であ
    って、 記憶・推敲処理部(X)は、入力部(1)から日本語文
    を入力して、形態素解析処理をし、構文解析処理をし、
    概念ネットワーク生成処理をして、入力文の概念ネット
    ワークを生成し、 その入力文の概念ネットワークに対し、各種推敲指令信
    号に応じて、文体を統一する処理をし、文を分割する処
    理をして各種推敲処理をし、推敲された概念ネットワー
    クを生成し、 その推敲された概念ネットワークから入力文を推敲した
    日本語文を生成する日本語文推敲処理装置。
JP63283147A 1988-11-09 1988-11-09 日本語文推敲処理方法 Expired - Fee Related JP2655703B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP63283147A JP2655703B2 (ja) 1988-11-09 1988-11-09 日本語文推敲処理方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP63283147A JP2655703B2 (ja) 1988-11-09 1988-11-09 日本語文推敲処理方法

Publications (2)

Publication Number Publication Date
JPH02129758A JPH02129758A (ja) 1990-05-17
JP2655703B2 true JP2655703B2 (ja) 1997-09-24

Family

ID=17661827

Family Applications (1)

Application Number Title Priority Date Filing Date
JP63283147A Expired - Fee Related JP2655703B2 (ja) 1988-11-09 1988-11-09 日本語文推敲処理方法

Country Status (1)

Country Link
JP (1) JP2655703B2 (ja)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5157759A (en) * 1990-06-28 1992-10-20 At&T Bell Laboratories Written language parser system

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS62150462A (ja) * 1985-12-24 1987-07-04 Nec Corp 文章誤り自動修正方式

Also Published As

Publication number Publication date
JPH02129758A (ja) 1990-05-17

Similar Documents

Publication Publication Date Title
JP4330285B2 (ja) 機械翻訳用辞書登録装置、機械翻訳用辞書登録方法、機械翻訳装置、機械翻訳方法及び記録媒体
JP2654001B2 (ja) 機械翻訳方法
JP3385141B2 (ja) 機械翻訳システム
Ouersighni A major offshoot of the DIINAR-MBC project: AraParse, a morphosyntactic analyzer for unvowelled Arabic texts
JPS638864A (ja) 翻訳装置
JPH07282055A (ja) 文解析方法および装置
JPH04235672A (ja) 翻訳装置
JPH0351022B2 (ja)
JP2655703B2 (ja) 日本語文推敲処理方法
JP2704945B2 (ja) 重複表現処理装置
Diaconescu et al. General system for normal and phonetic inflection
JP3892227B2 (ja) 機械翻訳システム
JPH01312666A (ja) 前編集支援方式
JPS62203266A (ja) 機械翻訳システム
JP3244286B2 (ja) 翻訳処理装置
JPS62272357A (ja) 機械翻訳システムにおける入力文のエラ−表示方式
JP3051747B2 (ja) 機械翻訳方法及び機械翻訳システム
Homola et al. Shallow transfer between slavic languages
Alfter Analyzer and generator for Pali
JP2004086919A (ja) 機械翻訳システム
JPH07122876B2 (ja) 機械翻訳装置
JPS62272358A (ja) 翻訳装置における翻訳中断時の表示方式
JPH04296969A (ja) 機械翻訳装置
JPH05342258A (ja) 自然語処理システム
JPH0415750A (ja) 自然言語文解析装置

Legal Events

Date Code Title Description
LAPS Cancellation because of no payment of annual fees