JPH06162075A - 自動リライト装置 - Google Patents

自動リライト装置

Info

Publication number
JPH06162075A
JPH06162075A JP4311649A JP31164992A JPH06162075A JP H06162075 A JPH06162075 A JP H06162075A JP 4311649 A JP4311649 A JP 4311649A JP 31164992 A JP31164992 A JP 31164992A JP H06162075 A JPH06162075 A JP H06162075A
Authority
JP
Japan
Prior art keywords
sentence
rewriting
rule
japanese
rewrite
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP4311649A
Other languages
English (en)
Inventor
Naotoshi Maruyama
直利 丸山
Yuko Den
優子 伝
Akiyoshi Matsuzaki
明美 松崎
Hiroyuki Kanza
浩幸 勘座
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sharp Corp
Original Assignee
Sharp Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sharp Corp filed Critical Sharp Corp
Priority to JP4311649A priority Critical patent/JPH06162075A/ja
Publication of JPH06162075A publication Critical patent/JPH06162075A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Machine Translation (AREA)
  • Document Processing Apparatus (AREA)

Abstract

(57)【要約】 【目的】リライトルールに基づいて自動的に文章を書き
換える自動リライト装置を提供する。 【構成】日本語文章を記憶する文章記憶部と、日本語文
章を読み込む入力部と、多数の日本語単語毎に表記、読
み、及び品詞等の言語情報を記憶する辞書部と、日本語
文章を言語解析する解析部と、リライトルールを記憶す
るリライトルール記憶部と、言語解析結果とリライトル
ールに基づいて日本語文章を書き換えるリライト部と、
リライト部出力の日本語文章を保存する保存部とから構
成される。またリライトルール変更のための変更部を有
する。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は利用者が日本語文章を意
図する別の日本語文章に自由に書き換えることが可能な
自動リライト装置に関し、特に、日英機械翻訳システム
において良好な翻訳結果が得られるよう入力された日本
語文章を翻訳実行以前に他の表現に書き換える前処理シ
ステムとして、あるいは、英日機械翻訳システムにおい
ては翻訳出力された日本語文章の中で不自然な部分を書
き換える後処理システムとして、または、日本語文章推
敲システム等において日本語文の誤った表現や好ましく
ない表現を適切なものに自動的に書き換える装置に応用
して好適な自動リライト装置に関するものである。
【0002】
【従来の技術】従来の技術では、例えば日本語文章推敲
システム等において、使用者はシステムからの対話的な
推敲支援を受けながらも、最終的にはリライト作業、即
ち文章の書き換えは人手で行なわねばならなかった。一
例として、複文や重文などで1文が長すぎ(文字数が多
すぎ)て複数の短い文に分けなければならない場合、従
来ではシステムがその旨のメッセージを利用者に伝え、
該当する文章を指摘するにとどまっており、使用者自身
の検討に基づいて使用者自身が文章を書き換えていた。
【0003】
【発明が解決しようとする課題】このように従来の方法
では、文章の実際の訂正作業は、文書処理システムに備
わったエディタ等を用いて使用者が手作業で行なわなけ
ればならなかった。
【0004】更に従来の方法では、リライトの指摘項目
はシステム内で固定されていて、これらを利用者が簡単
に作成したり変更したりすることは不可能であったの
で、使用者の用途や目的によって指摘項目を変更すると
いうことはほとんどできなかった。本発明はこれらの問
題点を解決するためになされたものでる。
【0005】
【課題を解決するための手段】上記課題を解決するため
本願発明に係る自動リライト装置は、日本語文章を記憶
する文章記憶部と、リライトするため前記文章記憶部か
ら日本語文章を読み込む入力部と、多数の日本語単語毎
に表記、読み、及び品詞等の言語情報を記憶している辞
書部と、前記入力部から読み込んだ日本語文章を言語解
析する解析部と、リライトルールを記憶するリライトル
ール記憶部と、前記解析部の言語解析結果と前記リライ
トルールに基づいて、前記日本語文章を書き換えるリラ
イト部と、前記リライト部の出力であるリライトされた
日本語文章を保存する保存部とからなることを特徴とす
るよう構成されている。
【0006】又、前記自動リライト装置に更にリライト
ルール変更部を設け、リライトルールの変更を可能とし
たことを特徴とするよう構成している。
【0007】
【作用】リライトルールは、機械で自動的にリライトで
きる訂正作業をルール化しており、リライトルール記憶
部に格納されている。リライトルールは、言語情報と書
き換え規則を合わせ持っており、入力日本語文章を解析
部で言語解析した結果と、ルールで記述された言語情報
とを照合し、一致していればルールで記述した書き換え
規則を適用する。これによって、従来の対話的なリライ
ト作業に依存せず、本装置によって自動的にリライトが
実行される。
【0008】又、リライトルール変更部を用いてリライ
トルール記憶部の内容をルール書式に従って自由に変更
できる。これによって、既存のリライトルールを簡単に
作成及び修正でき、文章の分野や用途別にリライトルー
ルを設定することができる。あるいは、リライトルール
を別途汎用エディタなどで使用者が予め作成しておき、
該リライトルールデータをリライトルール記憶部に格納
して使用することもできる。
【0009】
【実施例】図1は、システムの構成を示すブロック図で
ある。1は、リライトしたい文章を5の文章記憶部から
読み込む入力部である。2は、入力部から読み込んだ文
章を形態素単位に分かち書きし、品詞やその他の言語情
報を獲得する言語解析部である。この時、6の辞書部の
内容が参照され言語解析が行なわれる。辞書部6には文
章を言語解析するため、多くの日本語単語毎にその表記
や読み、品詞などの様々な言語情報が登録されている。
3は、言語解析部で獲得した情報およびリライトルール
記憶部7に保存されているリライトルールを用いること
によって文章の書き換えを行なうリライト部である。4
は、リライトされた文章などを保存する結果保存部であ
る。
【0010】図2は、本装置のリライトルールの書式例
を示す図である。図2(a)は、ルール一つぶんの書式
例である。この例では、一つの括弧は一つの形態素を表
し、“+”記号は形態素が連続していることを表す。
【0011】左辺は、形態素の表記や品詞、意味などの
文法条件、あるいは文中での位置などその他の条件を記
述する記述枠である。また右辺は、左辺で指定した形態
素に相当する原文中の形態素に対して、書き換え規則を
適用するための記述枠である。即ち、 全ての左辺で記
述した条件が、入力原文のある部分の形態素列と一致し
た時に、それぞれの形態素に右辺で記述した書き換え規
則を適用する。
【0012】ルールの一形態として、右辺が省略され、
左辺のみ記述されることもある。この場合は、左辺と原
文形態素が照合されるのみであり、書き換えは行われ
ず、その形態素は変化しない。
【0013】図2(b)は、図2(a)の一つの括弧に
対する記述の書式例であり、記号“│”より左側の記述
部分が図2(a)で示した左辺に、右側の記述部分が図
2(a)で示した右辺にそれぞれ対応する。
【0014】図2(b)の左辺における”表記”は、入
力原文の形態素の表記と照合させるための条件を表す。
左辺における”記号(1〜i)”は、入力原文の形態素
の品詞、活用形、意味などの文法情報、位置情報などと
照合させるための条件を表す。
【0015】右辺における”表記”は、書換えが行なわ
れる場合、左辺で照合した入力原文の形態素の表記をこ
の表記に書き換える文字例を表す。右辺における”記号
(1〜j)”は、書換えが行なわれる場合、左辺で照合
した入力原文の形態素の活用形を変更したり、時制を変
更したり、入力日本語文章の形態素列から削除したりす
る処理内容を表す。
【0016】左辺の”表記”と全ての”記号”が入力日
本語文章の形態素列の条件と一致した場合のみ、該当形
態素が一致したとみなす。 左辺、右辺とも”表記”
や”記号”は省略可能である。
【0017】ここで示したリライトルール書式はあくま
でも一例であり、入力日本語文章の形態素と照合するた
めの様々な言語情報と一致した場合の書き換え規則を備
えているかぎり、どのような書式でも構わない。
【0018】図3は、上記で説明した書式例と同様な形
式を持つルールを用いて、入力日本語文章のリライトを
行なう様子を具体的に説明する図である。ここで、 (の│を)+($G$0│%2)+(を│%−)+ (行なう$J$2│%−)+(て) という仮想記述ルールを用意する。
【0019】ここで、記号“$”は、次に続く記号が左
辺の記号であることを示し、記号“%”は、次に続く記
号が右辺の記号であることを示す。さらに、“$G”は
サ変名詞であることの記号、続く“$0”はその活用形
が語幹であることの記号、“%−”は左辺の形態素を入
力文から削除する記号、“$J”は動詞であることの記
号、続く“$2”は、その活用形が連用形であることの
記号をそれぞれ表しているものとする。
【0020】このルールが、「弁の開放を行なってい
る」という入力文に対してリライトを行ない、「弁を開
放している」という文にリライトされる様子を図3によ
って説明する。
【0021】まず、<STEP0>では、「弁の開放を
行なっている」という日本語文章が入力される。
【0022】次に<STEP1>では、上記入力日本語
文章が言語解析されて「弁(名詞)」、「の(助
詞)」、「開放する(サ変名詞)」、「を(助詞)」、
「行なう(動詞)」、「て(助詞)」、「いる(動
詞)」という7つの形態素に分かち書きされ、品詞、活
用形、意味などの文法情報、位置情報などを得る。
【0023】<STEP2>では、これら入力日本語文
章の各形態素の様々な情報とルール中の各左辺の記述内
容とが照合される。ルールの第1要素の左辺「の」とい
う表記が、原文の形態素の表記に含まれているかどう
か、1番目の形態素から順番に照合を行なう。ここでは
2番目の形態素の表記「の」と一致するので、ルールの
第2要素以降の左辺の条件が3番目以降の形態素の条件
と照合して一致するかどうか調べる。一致しない形態素
があれば、ルールの最後の要素まで調べずに、このルー
ルはこの入力文に適用しない。
【0024】<STEP3>では、最後の要素まで一致
すれば(ルールの第5要素と6番目の形態素)、ルール
をこの入力文に適用し、各形態素を右辺で指定した内容
に置き換える。
【0025】ここではまず2番目の形態素「の」が
「を」に置き換えられ、3番目の形態素「開放」は連用
形になり「開放し」に置き換えられ、4番目の形態素
「を」と5番目の形態素は連用形になり「開放し」に置
き換えられ、4番目の形態素「を」と5番目の形態素
「行なっ」は入力文から削除される。6番目の形態素
「て」は、該当要素(第5要素)に右辺の記述がないの
で変化しない。
【0026】<STEP4>では、最後に、それぞれ書
き換えられた形態素や、変化しない形態素が再構築さ
れ、<STEP5>では「弁を開放している」というリ
ライト文が得られる。
【0027】図4は、以上説明した自動リライト装置に
更にリライトルール変更部を設けたものである。図中、
1から7までは図1のものと同一である。8はリライト
ルール変更部である。リライトルール変更部8では、リ
ライトルール記憶部に記憶されているリライトルール
を、本発明が実施される文書処理装置に通常具備されて
いる表示手段に呼び出し、同様のキー入力手段等によっ
てリライトルールを変更、あるいは追加できるようにし
たものである。この場合、前述したリライトルールの書
式に沿って訂正を加えることになる。
【0028】また、リライトルール変更部8に、外部か
らデータを読み込む手段を設ければ、リライトルールを
汎用エディタ等で上記書式に基づいて別途作成してお
き、該データをリライトルール変更部8に読み込ませ、
リライトルール変更部8を経由してリライトルール記憶
部7に該データを格納させることにより、自由にリライ
トルールを変更することが可能になる。
【0029】
【発明の効果】以上のように本発明の自動リライト装置
によれば、従来では使用者が行わねばならなかった書き
換え操作を不要にし、装置自体が自動的に書き換えを行
うので、文書処理の効率が大幅に向上する。
【0030】また、使用者は簡単な書式に従ってリライ
トルールを変更できるので、不都合なルールは即座に修
正できるし、新たに効果的なルールを適宜追加すること
もできる。又、扱う文章の分野によってリライトルール
のセットを複数作成し、使用毎に入れ換えることも可能
である。リライトルールの作成に汎用のエディタを用い
て作業を分散させることもできる。
【0031】本発明は、日英機械翻訳システムにおいて
は良好な翻訳を得るための前処理システムへの応用、ま
た英日機械翻訳システムにおいては翻訳結果の日本語文
章意図した文章に編集する後処理システムへの応用が考
えられ、リライトルールを日本語推敲ルールとして構築
すれば、原文の日本語をより良い日本語にリライトする
日本語推敲システムにも応用でき、各種文書処理におい
て処理効率と文書作成の質の向上に大きな効果を奏する
ものである。
【図面の簡単な説明】
【図1】本発明の請求項1に係る自動リライト装置の構
成を示すブロック図である。
【図2】本発明のリライトルールの書式例である。
【図3】本発明の自動リライト装置の処理過程を説明す
るための図である。
【図4】本発明の請求項2に係る自動リライト装置の構
成を示すブロック図である。
【符号の説明】
1 入力部 2 言語解析部 3 リライト部 4 結果保存部 5 文章記憶部 6 辞書部 7 リライトルール記憶部 8 リライトルール変更部
───────────────────────────────────────────────────── フロントページの続き (72)発明者 勘座 浩幸 大阪府大阪市阿倍野区長池町22番22号 シ ャープ株式会社内

Claims (2)

    【特許請求の範囲】
  1. 【請求項1】 日本語文章を記憶する文章記憶部と、 リライトするため前記文章記憶部から日本語文章を読み
    込む入力部と、 多数の日本語単語毎に表記、読み、及び品詞等の言語情
    報を記憶している辞書部と、 前記入力部から読み込んだ日本語文章を言語解析する解
    析部と、 リライトルールを記憶するリライトルール記憶部と、 前記解析部の言語解析結果と前記リライトルールに基づ
    いて、前記日本語文章を書き換えるリライト部と、 前記リライト部の出力であるリライトされた日本語文章
    を保存する保存部とから構成されることを特徴とする自
    動リライト装置。
  2. 【請求項2】 リライトルール変更部を有し、リライト
    ルールの変更を可能としたことを特徴とする請求項1に
    記載の自動リライト装置。
JP4311649A 1992-11-20 1992-11-20 自動リライト装置 Pending JPH06162075A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP4311649A JPH06162075A (ja) 1992-11-20 1992-11-20 自動リライト装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP4311649A JPH06162075A (ja) 1992-11-20 1992-11-20 自動リライト装置

Publications (1)

Publication Number Publication Date
JPH06162075A true JPH06162075A (ja) 1994-06-10

Family

ID=18019827

Family Applications (1)

Application Number Title Priority Date Filing Date
JP4311649A Pending JPH06162075A (ja) 1992-11-20 1992-11-20 自動リライト装置

Country Status (1)

Country Link
JP (1) JPH06162075A (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007122660A (ja) * 2005-10-31 2007-05-17 Toshiba Corp 文書データ処理装置および文書データ処理プログラム
JP2009515253A (ja) * 2005-11-08 2009-04-09 マルチモダル テクノロジーズ,インク. 草稿文書における編集パターンの自動検出及び適用
KR20150074020A (ko) * 2012-10-17 2015-07-01 아브 이니티오 테크놀로지 엘엘시 데이터에 규칙 지정 및 적용

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007122660A (ja) * 2005-10-31 2007-05-17 Toshiba Corp 文書データ処理装置および文書データ処理プログラム
JP2009515253A (ja) * 2005-11-08 2009-04-09 マルチモダル テクノロジーズ,インク. 草稿文書における編集パターンの自動検出及び適用
KR20150074020A (ko) * 2012-10-17 2015-07-01 아브 이니티오 테크놀로지 엘엘시 데이터에 규칙 지정 및 적용
JP2016504642A (ja) * 2012-10-17 2016-02-12 アビニシオ テクノロジー エルエルシー データに対する規則の指定及び適用

Similar Documents

Publication Publication Date Title
JP3220560B2 (ja) 機械翻訳装置
US5999896A (en) Method and system for identifying and resolving commonly confused words in a natural language parser
US20050015240A1 (en) Machine translation
JP2007265458A (ja) 複数の圧縮オプションを生成する方法およびコンピュータ
Luukko et al. Akkadian treebank for early neo-assyrian royal inscriptions
JPH06162075A (ja) 自動リライト装置
JPH02112068A (ja) テキスト簡略表示方式
Itkonen et al. Helsinki-NLP at SemEval-2022 Task 2: A Feature-Based Approach to Multilingual Idiomaticity Detection
JPH0474259A (ja) 文書要約装置
JP3113257B2 (ja) 機械翻訳装置
JP3131432B2 (ja) 機械翻訳方法及び機械翻訳装置
JP3329476B2 (ja) かな漢字変換装置
JP3389313B2 (ja) 機械翻訳装置
JPS63136265A (ja) 機械翻訳装置
JP2000112967A (ja) 記事要約装置および記事要約処理方法および当該方法を記述したプログラムを記録した記録媒体
JP2871300B2 (ja) 機械翻訳装置
JP2687334B2 (ja) 機械翻訳装置
JPH03233671A (ja) 文章編集方法及び該方法を利用した文章作成装置
JPH0377166A (ja) 表現変換方式
JPH10340264A (ja) 機械翻訳装置及び機械翻訳処理プログラムを記録したコンピュータ読み取り可能な記録媒体
JPH06295310A (ja) 機械翻訳装置
JP2002132763A (ja) 原文書き換え装置及び原文書き換え方法
JPH08190570A (ja) 文書データの比較検証システム
JP2000057142A (ja) 文章書換え方法及び装置及び文章書換えプログラムを格納した記憶媒体
JPH02159629A (ja) 計算機言語翻訳方式