JP2870375B2 - 文章訂正装置 - Google Patents

文章訂正装置

Info

Publication number
JP2870375B2
JP2870375B2 JP5240977A JP24097793A JP2870375B2 JP 2870375 B2 JP2870375 B2 JP 2870375B2 JP 5240977 A JP5240977 A JP 5240977A JP 24097793 A JP24097793 A JP 24097793A JP 2870375 B2 JP2870375 B2 JP 2870375B2
Authority
JP
Japan
Prior art keywords
memory
correction
word
sentence
information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP5240977A
Other languages
English (en)
Other versions
JPH0793330A (ja
Inventor
義美 竹元
俊一 福島
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
Nippon Electric Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Electric Co Ltd filed Critical Nippon Electric Co Ltd
Priority to JP5240977A priority Critical patent/JP2870375B2/ja
Publication of JPH0793330A publication Critical patent/JPH0793330A/ja
Application granted granted Critical
Publication of JP2870375B2 publication Critical patent/JP2870375B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Landscapes

  • Machine Translation (AREA)
  • Document Processing Apparatus (AREA)

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、入力された日本語文章
について単語辞書を用いた文法解析に基づいて不適正箇
所(誤字・脱字、適切でない表現、わかりにくい表現な
ど)を訂正する文章訂正装置に関する。
【0002】
【従来技術】従来の文章訂正装置では、まず、入力され
た文章を単語辞書を用いて文法解析した結果に基づいて
不適正箇所を検出し、その不適正箇所に対してマークを
付与する。次に、その不適正箇所について、各々、訂正
候補を表示し、そのなかからユーザに所望のものを選択
させ、それに置き換えることで文章を訂正する。その種
の従来技術は、例えば、特開昭61ー208164号公
報「日本語文章校正装置の表示方式」などに記載されて
いる。
【0003】不適正箇所の認定方法は、主に、文法解析
で失敗した箇所を検出する方法(第一の方法)、文法解
析結果が特定の条件にマッチした箇所を検出する方法
(第二の方法)、単語辞書にあらかじめ不適正語を登録
しておき、文法解析結果において不適正語と認定された
箇所を検出する方法(第三の方法)などがある。このう
ち、第三の方法では、単語辞書に不適正語の訂正方法も
登録しておくことで、単に不適正箇所を検出するだけで
なく、訂正も可能となり、従来の文章訂正装置において
採用されている。
【0004】図5は、従来の文章訂正装置の構成例を示
すブロック図である。
【0005】従来の文章訂正装置は、文章入力手段1、
入力文章メモリ2、文法解析手段3、校正情報付き単語
辞書メモリ4、解析結果メモリ5、逐次訂正手段6、候
補選択指示入力手段7、作業メモリ11、訂正後文章メ
モリ17、訂正候補情報メモリ18、表示制御手段2
1、表示手段22から成る。
【0006】文章入力手段1は、ユーザが入力する文章
を読込み、入力文章をその位置情報などとともに入力文
章メモリ2に記憶する。文法解析手段3は、校正情報付
き単語辞書メモリ4を参照して途中結果を作業メモリ1
1に一時的に格納しながら文法解析を行い、解析結果を
解析結果メモリ5に記憶する。校正情報付き単語辞書メ
モリ4は、通常の文法解析を行うための単語辞書に訂正
の対象となる語(不適正語)やその訂正候補などの校正
情報を加えたものである。逐次訂正手段6は、校正情報
付き単語辞書メモリ4と解析結果メモリ5を参照して入
力文章の不適正箇所に対する訂正候補を検索し、その不
適正箇所に対する訂正候補の情報を訂正候補情報メモリ
18に書き込むことによって表示手段22に表示させ、
候補選択指示入力手段7からの候補選択指示にしたがっ
て、入力文章の訂正を逐次訂正する。その結果の訂正さ
れた文章は訂正後文章メモリ17が記憶する。表示制御
手段21は、訂正後文章メモリ17や訂正候補情報メモ
リ18の内容にしたがって、表示手段22を制御し、入
力文章の表示、不適正箇所や訂正箇所に対するマークの
付与、訂正候補の表示などを行う。
【0007】文章入力手段1には、キーボード、マウ
ス、文字認識装置、かな漢字変換入力装置など、候補選
択指示入力手段7には、キーボード、マウスなどが用い
られる。入力文章メモリ2、校正情報付き単語辞書メモ
リ4、解析結果メモリ5、作業メモリ11、訂正後文章
メモリ17、訂正候補情報メモリ18には、ICメモ
リ、磁気ディスク装置、磁気テープ装置などが用いられ
る。文法解析手段3、逐次訂正手段6、表示制御手段2
1には、コンピュータのCPUなどが用いられる。文章
表示手段22には、CRTディスプレイなどが用いられ
る。
【0008】すなわち、従来の訂正候補装置は、不適正
箇所を指摘し、その箇所に対して訂正候補を示してユー
ザに選択させる(あるいは、その箇所をユーザに直接訂
正させる)ことによって、逐次的に、文章を適正なもの
に訂正してゆくものであった。さらに、ユーザが訂正に
要する操作回数を減らして効率を高めるために、次のよ
うな従来技術も考案されている。
【0009】その一つは、特開平2ー140861号公
報「文章作成装置」に記載されているもので、検出した
個々の不適正箇所について、一つ一つ訂正候補を確認す
る操作を省き、キー押下一つで修正できるというもので
ある。もう一つは、特開平3ー240160号公報「文
字列置換方法」に記載されているもので、ある箇所につ
いて訂正候補への置換を行った場合、それ以降に出現す
るその箇所と同様の不適正箇所は、一括して置換してし
まうというものである。
【0010】また、文章訂正装置に採用されているわけ
ではないが、一般の文章編集装置において、文字列Aを
文字列Bに一括置換してしまい、その置換が不適切だっ
た箇所については、後から、元の文字列Aに戻せるよう
にしておくことも考えられている(例えば、特開平3ー
233669号公報「文書作成装置」に記載されてい
る)。この方法によれば、置換が不適切で元に戻さなく
てはならない箇所が少なければ、全体として訂正に要す
る操作回数は少なくなる。
【0011】
【発明が解決しようとする課題】最初に述べたような従
来の文章訂正装置では、検出された不適正の可能性が高
い箇所の各々について、訂正候補を確認し、その中から
適切なものを選択して置き換える操作が、逐次的に必要
になる。それに対して、従来も操作回数を削減する工夫
が検討されているが、最も大きな効果があると考えられ
るのは、従来技術の項の最後に述べたような一括置換
を、文章訂正装置においても実現することである。すな
わち、訂正候補(特に第一候補)が適切な訂正結果であ
ることが多いならば、先に一括して自動的に訂正してし
まって、その訂正が適切でなかったときに元に戻す操作
を行うようにした方が、全体としての操作回数は減って
作業効率が高くなる可能性がある。
【0012】しかし、不適正箇所である可能性が低い箇
所を訂正してしまったり、不確実な訂正候補へ置き換え
てしまったりすることが多いと、逆に元に戻す操作が多
くなって効率は上がらない。したがって、不適正である
ことが確実で、かつ、その訂正方法が確実な箇所に絞っ
て、自動訂正を行うのが好ましい。
【0013】一方、自動訂正を行わなかった箇所は、従
来の文章訂正装置と同様に、逐次的に確認しながら訂正
してゆくことになる。その際、不適正箇所として検出し
た箇所に不確実性があるならば、それがわかるようにユ
ーザに提示するのが好ましい。
【0014】上記のような不確実性を発生させる要因と
して、文法解析の曖昧性がある。例えば、同形だが読み
の違いにより、文法解析において複数通りの解釈が可能
な場合に、不適正箇所の検出や訂正方法に不確実性が生
じる。具体的には、「焼土」という単語について、「や
けつち」という読みと「しょうど」という読みの2通り
の解釈があり得たとする。このとき、「やけつち」のと
いう解釈ならば、送りがな不適正語と認定され、「焼け
土」への訂正が正しい。一方、「しょうど」という解釈
ならば、誤用語と認定され、「焦土」への訂正が正し
い。
【0015】このような場合、深い意味や文脈を理解し
た処理により、適切な解釈が可能になる場合もあるが、
従来の文法解析技術では、そのような処理は実用的なレ
ベルには達していない。しかも、ときには、人間が解釈
しても解釈に曖昧性が生ずる場合(複数通りの解釈が可
能な場合)がある。このような場合について、従来の文
章訂正装置では、適切な解釈を行うのに十分な情報がな
くとも強引に、一方の解釈を選択してしまう。その結
果、誤った解釈をとってしまうことも少なくなく、検出
洩れを生じさせたり、文章訂正装置(あるいは文章の不
適正箇所検出装置)に対するユーザの信頼感を失わせる
ことになっていた。
【0016】そこで、本発明は、以上のような従来の文
章訂正装置の欠点を除去し、文法解析によって不適正語
と認定された箇所を一括して自動訂正する際に、不確実
な訂正を行わないことで、訂正作業の効率を向上させ、
さらに、逐次的な訂正を行う際に、文法解析における曖
昧性を考慮した表示を行うことによって、検出洩れが少
なく、しかも、ユーザが理解しやすい文章訂正を実現で
きる文章訂正装置を提供することを目的とする。
【0017】
【課題を解決するための手段】本発明では、上記の目的
を達成するために、次のような2種類の文章訂正装置を
提供する。
【0018】第一の発明の文章訂正装置は、入力された
文章を記憶する入力文章メモリと、不適正語を含み不適
正語の種別や訂正候補などの校正情報を持つ単語辞書を
記憶する校正情報付き単語辞書メモリと、前記校正情報
付き単語辞書メモリを参照して前記入力された文章の文
法解析を行い不適正語を認定する文法解析手段と、前記
入力された文章について前記文法解析の結果を記憶する
解析結果メモリと、前記文法解析の途中結果として少な
くとも前記入力された文章中の単語の候補の位置情報お
よび表記、品詞、読み、校正用属性を一時格納する作業
メモリと、前記作業メモリ内で前記校正情報を持つ語が
他の単語の候補と重複する区間に出現する場合を曖昧性
箇所として検出する曖昧性判定手段と、前記曖昧性判定
手段の判定結果を記憶する判定結果メモリと、前記曖昧
性判定手段の検出した箇所及び前記不適正語の種類別に
自動訂正の対象とするか否かを記述して記憶する訂正条
件メモリと、前記解析結果メモリと前記判定結果メモリ
を参照して前記訂正条件メモリの自動訂正の対象に該当
する箇所を検出する訂正対象箇所判定手段と、前記訂正
対象箇所判定手段の判定箇所を記憶する訂正対象箇所メ
モリと、前記校正情報付き単語辞書メモリを参照して前
記入力された文章を前記訂正対象箇所メモリに格納され
た箇所について自動訂正を行う自動判定手段とを備える
ことを特徴とする。
【0019】第二の発明の文章訂正装置は、入力された
文章を記憶する入力文章メモリと、不適正語を含み不適
正語の種別や訂正候補などの校正情報を持つ単語辞書を
記憶する校正情報付き単語辞書メモリと、前記校正情報
付き単語辞書メモリを参照して前記入力された文章の文
法解析を行い不適正語を認定する文法解析手段と、前記
入力された文章について前記文法解析の結果を記憶する
解析結果メモリと、前記文法解析の途中結果として少な
くとも前記入力された文章中の単語の候補の位置情報お
よび表記、品詞、読み、校正用属性を一時格納する作業
メモリと、前記作業メモリ内で前記校正情報を持つ語が
他の単語の候補と重複する区間に出現する場合を曖昧性
箇所として検出する曖昧性判定手段と、前記曖昧性判定
手段の判定結果を記憶する判定結果メモリと、不適正語
の認定に関する曖昧性を解消するための指示を入力する
曖昧解消指示入力手段と、前記判定結果メモリを参照し
て前記入力された文章における不適正語の認定が曖昧な
箇所を検出し前記曖昧解消指示入力手段からの指示によ
って該箇所の曖昧性を解消する曖昧箇所決定手段と、不
適正箇所に関する訂正候補の選択指示を入力する候補選
択指示入力手段と、前記曖昧箇所決定手段の決定と前記
解析結果メモリを参照して前記入力された文章における
不適正箇所を検出し該不適正箇所に関する訂正候補を前
記校正情報付き単語辞書メモリから検索し前記候補選択
指示入力手段から指示された訂正候補に該不適正箇所を
置き換える逐次訂正手段とを備えることを特徴とする。
【0020】
【作用】本発明では、まず、文法解析によって不適正語
と認定された箇所を一括して自動訂正する際に、不確実
な訂正を行わないことで、訂正作業の効率を向上させ
る。不確実な訂正であるかの判定は、主に、文法解析過
程で、ある種の曖昧性が発生していないかを調べる。例
えば、「焼土」が「やけつち」とも「しょうど」とも解
釈できるような場合、その箇所を自動訂正の対象から外
すような判断が可能となる。
【0021】次に、不適正箇所として検出された箇所に
ついて、訂正候補を表示してユーザに選択させるような
逐次的な訂正の際に、文法解析における曖昧性を考慮し
た表示を行うことによって、検出洩れが少なく、しか
も、ユーザが理解しやすい文章訂正を実現する。文法解
析における曖昧性を考慮した表示というのは、例えば、
上記の「焼土」の場合、いったん不適正語として検出し
て、色マークなどを付与した上で、その部分の訂正候補
を表示するときに、「やけつち」という解釈と「しょう
ど」という解釈(読み方)の2通りがあることを、ユー
ザにわかるように表示する。いずれかの解釈をユーザに
選択させた上で、それに対応する訂正候補を示す。すな
わち、ユーザが「やけつち」の方を選べば「焼け土」と
いう訂正候補を示し、「しょうど」の方を選べば「焦
土」という訂正候補を示す。このような場合、一方の解
釈を強引に選択して訂正候補を提示してしまうと、ユー
ザは意に反する訂正を促されることになって、文章訂正
装置に対する信頼感を失わせることになってしまうが、
上記のような表示方法をとることで、ユーザの自然な理
解を得ることが可能となる。
【0022】また、上記の例では、2通りの不適正語と
解釈できる場合の説明をしたが、適正語と不適正語の2
通りの解釈が可能な場合もある。例えば、「香車」が
「きょうしゃ」あるいは「きゃしゃ」と解釈できるとき
がある。「きょうしゃ」と解釈すれば、適正語で訂正の
必要はない。一方、「きゃしゃ」と解釈すると、正しく
は「華奢」なので訂正する必要がある。この場合、強引
に適正語の「きょうしゃ」の解釈をとると、もし「きゃ
しゃ」のつもりで書かれたものであれば検出洩れが発生
することになる。逆に、不適正語の「きゃしゃ」と解釈
を常に優先すると、不適正語の検出洩れは避けられる
が、ユーザに不自然な印象を強く与えることになる。こ
のような場合についても、本発明では、検出洩れを避
け、かつ、ユーザに自然な理解を与えることが可能とな
る。
【0023】
【実施例】図1は、本発明の文章訂正装置の第一の実施
例の構成を示すブロック図である。以下、各構成要素を
説明する。
【0024】文章入力手段1は、日本語文章の漢字かな
混じり文字列を入力する手段である。標準キーボードを
用いたかな漢字変換装置、全文字配列キーボード、文字
認識装置、音声認識装置などが用いられる。あるいは、
ワードプロセッサなどで作成した文章ファイルを読み込
むための、磁気ディスク装置や磁気テープ装置などを用
いてもよい。
【0025】入力文章メモリ2は、文章入力手段1によ
って入力された文章を記憶する。ICメモリ、磁気ディ
スク装置、磁気テープ装置などが用いられる。
【0026】校正情報付き単語辞書メモリ4は、不適正
語を含み不適正語の種別や訂正候補などの校正情報を持
つ単語辞書を記憶する。ICメモリ、磁気ディスク装
置、磁気テープ装置などが用いられる。図7に、校正情
報付き単語辞書メモリの内容の例を示す。図7の単語辞
書では、各単語に対して、表記700、品詞701、読
み702、校正用属性703、訂正候補704が登録さ
れている。そのうち、通常の文法解析に用いる単語辞書
でも一般に登録されているのは、表記700、品詞70
1、読み702の項目である。図7の校正情報付き単語
辞書メモリ4では、それらの項目に加えて、校正用属性
703や訂正候補704などの項目が追加されている。
また、通常の単語(適正語)だけでなく、訂正の対象と
なる語(不適正語)も登録されている。
【0027】図7の例では、「完璧」「焦土」「焼け
土」などが適正語であり、「完壁」「焼土」などが不適
正語である。不適正語については、校正用属性703と
して、誤用語、送りがな不適正語などといった不適正種
別が付与されている。不適正種別としては、誤用語、送
りがな不適正語の以外にも、書き換え推奨語、かな書き
推奨語、同音類語、禁止語など、文章訂正装置の対象分
野や用途に応じて、様々な定義が可能である(本発明で
は、不適正種別について、特に限定はしない)。また、
不適正語については、訂正候補704も付与されてい
る。訂正候補が複数考えられる場合には、複数個を登録
しておいてよい。逆に、不適正語であっても、訂正候補
は決められないなどの理由により、訂正候補が登録され
ていないこともあり得る。本明細書では、通常の単語辞
書には登録されていなかった部分、すなわち、不適正
語、および、それらの不適正種別や訂正候補などを、ま
とめて校正情報と呼ぶ。なお、図7では、校正情報付き
単語辞書が1ファイルとして構成されているような形態
の例を示したが、本発明では、校正情報付き単語辞書の
構造を、図7の形態に限定するものではない。検索キー
となる表記の部分をインデックスファイルとして分離し
たり、訂正候補の部分や校正情報全体を別ファイルに分
けたりするなど、複数ファイルとして構成することも可
能である。
【0028】文法解析手段3は、校正情報付き単語辞書
メモリ4を参照して、入力文章メモリに格納された文章
の文法解析を行い、その文章中の不適正語を認定する。
コンピュータのCPUなどが用いられる。図17は、文
法解析手段3の実現例を示すフローチャートである。図
17では、まずステップ170で、単語辞書を検索し、
入力された文章の部分文字列に一致する単語の候補を抽
出する。次にステップ171では、ステップ170で検
索された単語について、文法的な制約を満たすような組
み合わせを形成する。最後に、組み合わせが複数通り形
成された場合は、ステップ172において、最も確から
しいものを選択する。最も確からしいものを選択する方
法は、意味的な制約を利用する方法や、文節数が最小の
組み合わせが最も確からしいといったヒューリスティッ
クスを利用する方法など、様々な方法が考案されてい
る。その詳細は、例えば、『国語辞書の記憶と日本語文
の自動分割』(長尾・他、「情報処理」第19巻第6
号、1978)、『日本文音声出力のための言語処理方
式』(宮崎・大山、「情報処理学会論文誌」第27巻第
11号、1986)、『文節数最小法を用いたべた書き
日本語文の形態素解析』(吉村・他、「情報処理学会論
文誌」第24巻第1号、1983)、『接続コスト最小
法による形態素解析の提案と計算量評価について』(久
光・新田、「電子情報通信学会研究報告」NLC90−
8、1990)などに記載されている。
【0029】本発明の文法解析手段3では、上記の文献
に記載されているような通常の文法解析手段と異なり、
単語辞書に校正情報を付与している。それによって、図
17で述べたような処理手順に変更は生じないが、ステ
ップ170で単語辞書から校正情報のうちの必要な項目
を読み出し、解析結果において不適正語に関する情報が
得られる点が異なる。そのような、校正情報付き単語辞
書を参照して行う文法解析の詳細は、『専用ハードウェ
アを用いた高速な校閲支援システムの提案』(竹元・
他、情報処理学会第43回全国大会論文集、1991)
や『日本語文書校正支援システムSt.WORDS』
(福島・他、情報処理学会第45回全国大会論文集、1
992)などに記載されている。
【0030】作業メモリ11は、文法解析手段3による
文法解析の途中結果を一時格納する。ICメモリ、磁気
ディスク装置、磁気テープ装置などが用いられる。図8
に作業メモリ11の内容の例を示す。図8に示した内容
は、「戦争で私の故郷は完壁に焼土になった。」という
例文に対する文法解析の、候補選択ステップ172の直
前(接続検定ステップ171の直後)の状態を表してい
る。入力文章中の各文字列がどのような品詞・読みとし
て解釈され得るかが表現されており、不適正語について
は、その不適正種別や訂正候補の情報も単語辞書から読
み出されて格納されている。
【0031】解析結果メモリ5は、入力文章メモリ2に
格納された文章に対する、文法解析手段3による文法解
析の結果を記憶する。図9に解析結果メモリ5の内容の
例を示す。図9に示した内容は、「戦争で私の故郷は完
壁に焼土になった。」という例文に対する文法解析の結
果であり、図8の作業メモリ11の状態からさらに候補
選択が行われて、解釈が一意に決定されている。曖昧性
判定手段12は、作業メモリ11を参照して、入力文章
メモリに格納された文章に関する、文法解析手段3の文
法解析における曖昧性を判定する。コンピュータのCP
Uなどが用いられる。図18に曖昧性判定手段12の実
現例のフローチャートを示す。図18のフローチャート
では、文法解析の候補選択ステップの直前の作業メモリ
11の内容について、単語辞書から読み出された不適正
語種別に着目し、不適正語が他の単語候補と重複する区
間に出現する場合を検出し、その部分の解析情報を判定
結果メモリ13に書き込んでいる。不適正語に着目して
いるのは、訂正対象箇所になるのは不適正語の部分だけ
だから、余計な情報は格納しないようにしていたためで
ある。しかし、そのような節約は、この手段の実現に必
須のものではなく、後述する訂正条件メモリ19に記述
する条件のタイプに応じて、様々な実現方法があり得
る。例えば、複数通りの解釈があり得る箇所はすべて検
出するとか、同形語をもつ部分のみを検出するなどの実
現方法もある。
【0032】判定結果メモリ13は、曖昧性判定手段1
2の判定結果を記憶する。ICメモリ、磁気ディスク装
置、磁気テープ装置などが用いられる。図10は判定結
果メモリ13の内容の例である。図10に示した内容
は、図8の作業メモリ11の例に対して、曖昧性判定手
段12が図18のような処理手順で実行された場合の判
定結果メモリ13の内容に対応する。図10の判定結果
メモリ13では、曖昧性のあった箇所について、その位
置と解析情報が格納されている。
【0033】訂正条件メモリ19は、自動訂正の対象箇
所の満たすべき条件を記憶する。ICメモリ、磁気ディ
スク装置、磁気テープ装置などが用いられる。図11
は、訂正条件メモリ19の例を示す図である。図11の
訂正条件メモリ19の例では、曖昧性判定手段12の検
出した箇所を自動訂正の対象とするか否かや、どんな種
別の不適正語を自動訂正の対象とするかが、対象とする
なら1、対象としないなら0で記述してある。図11の
例では、曖昧性判定手段12の検出した箇所は自動訂正
の対象とせず、それ以外の箇所で不適正種別が誤用語、
送りがな不適正語、書き換え推奨語のいずれかの場合に
自動訂正を行うという条件を表している。ただし、条件
の記述形式は、このようなフラグ形式に限定されるもの
ではなく、自然言語やプログラムとして記述するような
形式をとっても構わない。
【0034】訂正箇所判定手段14は、解析結果メモリ
5と判定結果メモリ13を参照して、訂正条件メモリ1
9の条件に該当する箇所を検出する。コンピュータのC
PUなどが用いられる。図19は、図11の訂正条件メ
モリ19の例にあわせた訂正箇所判定手段14の実現例
を示すフローチャートである。図19のフローチャート
におけるステップ191が図11の不適正種別の条件チ
ェックに対応し、ステップ192が図11の解析曖昧性
の生じた箇所かどうかの条件チェックに対応する。
【0035】訂正対象箇所メモリ15は、訂正対象箇所
判定手段14の検出箇所を記憶する。ICメモリ、磁気
ディスク装置、磁気テープ装置などが用いられる。図1
2は、訂正対象箇所メモリ15の内容の例を示す図であ
る。図12では、「戦争で私の故郷は完壁に焼土になっ
た。」という例文に対する訂正箇所は、9番目の文字位
置から長さ2の単語( 完壁) であることが示されてい
る。必要に応じて、該当箇所の不適正種別も記憶してよ
い。
【0036】自動訂正手段16は、校正情報付き辞書メ
モリ4を参照して、入力文章メモリ2に格納された文章
を、訂正対象箇所メモリ15に格納された箇所について
訂正候補(複数ある場合は第一候補)に置き換えること
で、自動訂正する。コンピュータのCPUなどが用いら
れる。図20は、自動訂正手段16の実現例のフローチ
ャートである。図20のフローチャートでは、訂正対象
箇所メモリ15から入力文章中の訂正対象箇所を見つけ
て、その訂正箇所に対する訂正候補を校正情報付き単語
辞書メモリ4から検索し、訂正箇所と検索した訂正候補
の第一候補を置き換えている。入力文章の最後に達した
ら訂正後の文章を訂正後文章メモリ17に書き込む。
【0037】訂正後文章メモリ17は、入力文章メモリ
2に格納された文章の、自動訂正手段16による訂正結
果を格納する。ICメモリ、磁気ディスク装置、磁気テ
ープ装置などが用いられる。本実施例では、訂正後文章
メモリ17を入力文章メモリ2とは別の構成要素とした
が、訂正後文章メモリ17を設けずに、自動訂正手段1
6が入力文章メモリ2を直接書き換えるように構成する
ことも可能である。図13は、訂正後文章メモリ20の
内容の例を示す図である。文章出力手段20は、訂正後
文章メモリ17の内容を出力する。プリンタやCRTデ
ィスプレイなどが用いられる。
【0038】以上のような構成要素のうち、文章入力手
段1、入力文章メモリ2、文法解析手段3、校正情報付
き単語辞書メモリ4、解析結果メモリ5、作業メモリ1
1、訂正後文章メモリ17は、図5に示した従来の文章
訂正装置の構成要素と同じである。曖昧性判定手段1
2、判定結果メモリ13、訂正対象箇所判定手段14、
訂正対象箇所メモリ15、自動訂正手段16、訂正条件
メモリ19が、本発明による新しい構成要素である。
【0039】次に、「戦争で私の故郷は完壁に焼土にな
った。」という文章が文章入力手段1を用いて入力され
た場合の動作例について説明する。入力された文章は、
図6に示すように入力文章メモリ2に記憶される。図6
に示したような先頭から数えた文字数を、以下では、文
字位置を表すために用いる。文法解析手段3は、図7に
示すような校正情報付き単語辞書メモリ4を参照しなが
ら文法解析を行う。文法解析の途中結果は、図8に示す
ように「焼土」の解釈に二つの可能性を残した形で作業
メモリ11に一時的に格納される。
【0040】曖昧性判定手段12は、図18のフローチ
ャートに示すように、ステップ181で作業メモリ11
の9番目の単語候補「完壁」が不適正語であると判定す
ると、ステップ182で「完壁」と存在区間が重複する
単語があるかどうかを調べる。「完壁」には存在区間が
重複する単語が作業メモリ11の中で存在しないのでス
テップ182でNOと判定されて次の文字位置である1
0番目の判定処理に移る。同様に、ステップ182で1
2番目の単語候補「焼土」が不適正語であると判定する
と、「焼土」と存在区間が重複する単語があるかどうか
を調べる。「焼土」には存在区間が重複する単語が作業
メモリ11の中で存在するのでステップ182でYES
と判定されて、12番目の文字位置から長さ2の「焼
土」は、「やけつち」と「しょうど」の二通りの読みの
曖昧性が発生し、送りがなの不適正語と誤用語の二通り
の訂正項目に該当する語であることが判定結果メモリ1
3に図10に示すように記憶される。
【0041】解析結果メモリ5では、文法解析手段3に
よって図8の作業メモリ11の状態からさらに候補選択
が行われて、図9に示すように解釈が一意に決定されて
いる。
【0042】訂正条件メモリ19には、図11に示すよ
うな条件が記述されているものとする。このとき、訂正
箇所判定手段14が、解析結果メモリ5と判定結果メモ
リ13を参照して検出する訂正箇所は、訂正対象箇所メ
モリ15のようになる。
【0043】訂正対象箇所メモリ15には、図12のよ
うに訂正箇所が9番目の文字位置から長さ2の単語( 完
壁) であることが示されている。
【0044】自動訂正手段16は、校正情報付き辞書メ
モリ4を参照して、入力文章メモリ2に格納された図6
の文章を、訂正対象箇所メモリ15に格納された箇所に
ついて第一訂正候補「完璧」に置き換えることで、自動
訂正する。
【0045】訂正後文章メモリ17は、入力文章メモリ
2に格納された文章の、自動訂正手段16による訂正結
果を図13のように格納する。文章出力手段20は、訂
正後文章メモリ17の内容を出力する。結果として、
「完壁」は「完璧」に自動訂正されるが、「焼土」の部
分は解釈が曖昧になるため自動訂正は実行されず、その
まま残る。
【0046】図2は、本発明の文章訂正装置の第二の実
施例の構成を示すブロック図である。図1の構成に、訂
正条件入力手段25が構成要素として加わっている。
【0047】訂正条件入力手段25は、訂正条件メモリ
19に記憶した内容をユーザが変更するための入力手段
である。訂正条件入力手段25としてキーボードなどが
用いられる。例えば、図11のような訂正条件メモリ1
9について、不適正種別の誤用語の値を1から0に書き
換えると上述の動作例で検出され、訂正箇所となった
「完壁」( 訂正候補:「完璧」) は、自動訂正されない
ようにできる。
【0048】図3は、本発明の文章訂正装置の第三の実
施例の構成を示すブロック図である。
【0049】図5に示した従来の文章訂正装置の構成
に、曖昧箇所決定手段31、曖昧解消指示入力手段3
2、曖昧箇所情報メモリ33が構成要素として加わって
いる。曖昧箇所決定手段31は、判定結果メモリ13を
参照することで入力文章における不適正語の認定が曖昧
な箇所を検出し、その曖昧性を持つ箇所の情報を曖昧箇
所情報メモリ33に書き込むことによって表示手段22
に表示させるようにし、曖昧解消指示入力手段32から
の曖昧解消指示にしたがって、その検出箇所の曖昧性を
解消する。その結果は、逐次訂正手段6へ通知する。曖
昧箇所決定手段31には、コンピュータのCPUなどが
用いられる。曖昧解消指示入力手段32は、曖昧箇所決
定手段31によって不適正語の認定に関する曖昧性を解
消するための指示を入力する手段で、キーボード、マウ
スなどが用いられる。図21は、曖昧箇所決定手段31
の実現例を示すフローチャートである。曖昧箇所情報メ
モリ33は、曖昧箇所決定手段31によって検出され
た、入力文章における不訂正語の認定が曖昧な箇所の複
数通りの解釈に関する情報を表示するために一時格納す
るメモリで、ICメモリ、磁気ディスク装置、磁気テー
プ装置などが用いられる。
【0050】「戦争で私の故郷は完壁に焼土になっ
た。」という入力文章を用いて第三の実施例の動作例に
ついて説明する。第一の実施例で説明したように判定結
果メモリ13には、12番目の文字位置から長さ2の
「焼土」は「やけつち」と「しょうど」の二通りの解釈
( 読み) があり、送りがなの不適正語と誤用語の二通り
の訂正項目に該当する語であることが図10に示すよう
に記憶されていることになる。曖昧箇所決定手段31
は、「焼土」の箇所が不適正語の認定に関して曖昧性を
持つ箇所であることを検出し、その情報を曖昧箇所情報
メモリ33に書き込む。その結果、例えば、図22(
a) のような表示が行われる。
【0051】図22( a) では、「焼土」について「し
ょうど」と「やけつち」という二通りの読みがあり、い
ずれかが選択できることを示している。
【0052】曖昧解消指示入力手段32によってユーザ
は、「やけつち」と「しょうど」のどちらの読みを選択
することができる。ユーザが「しょうど」の読みを選択
したとすると、逐次訂正手段6は、校正情報付き単語辞
書メモリ4を参照して、入力文章の曖昧箇所決定手段3
1の決定結果である「しょうど」の読みの方の「焼土」
に対する訂正候補を検索し、その訂正候補「焦土」を訂
正候補情報メモリ18に書き込むことによって表示手段
22に表示させる。図22( b) が、その状態の表示例
である。候補選択指示入力手段7によって、ユーザが
「焼土」に対する訂正候補として「焦土」を指定すると
訂正後文章メモリ17には「戦争で私の故郷は完壁に焦
土になった。」という文章が書き込まれる。一方、曖昧
解消指示入力手段32で「やけつち」を選択した場合
は、図22( b’) のようになる。
【0053】以上のようにして、本実施例では、不適正
語の解釈に曖昧性が生じた箇所をユーザに自然な形で掲
示できる。なお、上記の説明では、不適正語の認定に曖
昧性の生じなかった「完壁」の部分をとばしてしまった
が、その部分については、従来の文章訂正装置と同様に
解析結果メモリ5の内容に基づいて逐次訂正手段6が誤
用語として検出し、「完璧」という訂正候補を示して置
き換えることができる。
【0054】同じく第三の実施例において、「それは香
車である。」という入力文章を処理する場合の例を説明
する。文法解析に曖昧が発生するのは「香車」の部分で
あり、「きょうしゃ」と読む候補と「きゃしゃ」と読む
候補が出来たとする。このとき、従来の文章訂正装置で
は、強引に一方の解釈に決定してしまう。そのため、
「きょうしゃ」の方をとれば適正語なので検出されず、
「きゃしゃ」の方をとれば誤用語と検出される。どちら
の解釈が正しいかをユーザは判断できるが、ユーザから
見れば文章訂正装置が検出洩れを起こしたか、あるい
は、誤った解釈をしたと感じてしまう。これに対して、
本実施例の文章訂正装置では、図23(a)のように、
一旦「香車」をマークし、「きょうしゃ」と「きゃし
ゃ」の二通りの読みがあることをユーザに示し、選択さ
せる。「きょうしゃ」を選べば、図23( b) のように
不適正語ではないのでマークをはずし、「きゃしゃ」を
選んだときは図23( b’) のように誤用語として訂正
候補を示す。これによって検出洩れを防げるし、ユーザ
に自然な理解を与えられる。
【0055】図4は、本発明の文章訂正装置の第四の実
施例の構成を示すブロック図である。
【0056】図2の構成と図3の構成を組み合わせた構
成に、訂正取消指示入力手段34、訂正取消手段35、
自動訂正情報メモリ36が構成要素として加わってい
る。
【0057】訂正取消指示入力手段34は、訂正取消指
示を入力する。自動訂正情報メモリ36は、自動訂正手
段16が訂正候補と置き換えた箇所の位置や解析情報を
記憶する。訂正取消手段35は、自動訂正情報メモリ3
6を参照し、訂正後文章の自動訂正された箇所を元の単
語に戻す。訂正取消指示入力手段34は、キーボード、
マウスなどが用いられる。訂正取消手段35は、コンピ
ュータのCPUなどが用いられる。
【0058】自動訂正情報メモリ36は、ICメモリ、
磁気ディスク装置、磁気テープ装置などが用いられる。
これらの手段は、自動訂正の結果が不適切だった箇所に
ついて、元の単語に戻せるようにするためのものであ
る。
【0059】例えば、入力文章「戦争で私の故郷は完壁
に焼土になった。」が、自動訂正手段16の結果、訂正
後文章メモリ17に「戦争で私の故郷は完璧に焼土にな
った。」という文章になって記憶されているものとす
る。そのとき自動訂正情報メモリ36は、自動訂正した
9番目の箇所に対して「完壁」が訂正前の元の表記であ
ることを記憶している。自動訂正された箇所には、その
旨を表すマークをつけて表示し、その箇所について、訂
正取消指示入力手段34によって指示を与えると、訂正
前の単語に戻すようにできる。第四の実施例の文章訂正
装置では、まず、第二の実施例に対応する構成要素を動
作させて、自動訂正の条件に適合する箇所を置き換えて
掲示し、次に第三の実施例に対応する構成要素を動作さ
せて、自動訂正しなかった箇所の不適正語の逐次訂正を
行うような使い方ができる。さらには上述のように自動
訂正したことが適切でなかった箇所は元に戻すような操
作も可能である。
【0060】
【発明の効果】以上のようにして、本発明の文章訂正装
置によれば、まず、文法解析によって不適正語と認定さ
れた箇所を一括して自動訂正する際に、不確実な訂正を
避けるようにしているので、自動訂正した箇所を後から
元に戻すような操作が従来より大幅に減少し、訂正作業
の効率が向上する。さらに、逐次的な訂正を行う際に、
文法解析における曖昧性を考慮した表示を行っているの
で、検出洩れが少なく、しかも、ユーザが理解しやすい
文章訂正が実現できる。
【図面の簡単な説明】
【図1】本発明の文章訂正装置の第一の実施例を表すブ
ロック図である。
【図2】本発明の文章訂正装置の第二の実施例を表すブ
ロック図である。
【図3】本発明の文章訂正装置の第三の実施例を表すブ
ロック図である。
【図4】本発明の文章訂正装置の第四の実施例を表すブ
ロック図である。
【図5】従来の文章訂正装置の一実施例を表すブロック
図である。
【図6】入力文章メモリ2の内容の例を示す図である。
【図7】校正情報付き単語辞書メモリ4の内容の例を示
す図である。
【図8】作業メモリ11の内容の例を示す図である。
【図9】解析結果メモリ19の内容の例を示す図であ
る。
【図10】判定結果メモリ13の内容の例を示す図であ
る。
【図11】訂正条件メモリ19の内容の例を示す図であ
る。
【図12】訂正対象箇所メモリ15の内容の例を示す図
である。
【図13】訂正後文章メモリ20の内容の例を示す図で
ある。
【図14】曖昧箇所情報メモリ33の内容の例を示す図
である。
【図15】訂正候補情報メモリ18の内容の例を示す図
である。
【図16】自動訂正情報メモリ36の内容の例を示す図
である。
【図17】文法解析手段3の実現例を示すフローチャー
トである。
【図18】曖昧性判定手段12の実現例を示すフローチ
ャートである。
【図19】訂正対象箇所判定手段14の実現例を示すフ
ローチャートである。
【図20】自動訂正手段16の実現例を示すフローチャ
ートである。
【図21】曖昧箇所決定手段31の実施例を示すフロー
チャートである。
【図22】不適正語の認定に曖昧性のある箇所の表示例
その1を示す図である。
【図23】不適正語の認定に曖昧性のある箇所の表示例
その2を示す図である。
【符号の説明】
1 文章入力手段 2 入力文章メモリ 3 文法解析手段 4 校正情報付き単語辞書メモリ 5 解析結果メモリ 6 逐次訂正手段 7 候補選択指示入力手段 11 作業メモリ 12 曖昧性判定手段 13 判定結果メモリ 14 訂正対象箇所判定手段 15 訂正対象箇所メモリ 16 自動訂正手段 17 訂正後文章メモリ 18 訂正候補情報メモリ 19 訂正条件メモリ 20 文章出力手段 21 表示制御手段 25 訂正条件入力手段 31 曖昧箇所決定手段 32 曖昧解消指示入力手段 33 曖昧箇所情報メモリ 34 訂正取消指示入力手段 35 訂正取消手段 36 自動訂正情報メモリ

Claims (2)

    (57)【特許請求の範囲】
  1. 【請求項1】入力された文章を記憶する入力文章メモリ
    と、 不適正語を含み不適正語の種別や訂正候補などの校正情
    報を持つ単語辞書を記憶する校正情報付き単語辞書メモ
    リと、 前記校正情報付き単語辞書メモリを参照して前記入力さ
    れた文章の文法解析を行い不適正語を認定する文法解析
    手段と、 前記入力された文章について前記文法解析の結果を記憶
    する解析結果メモリと、 前記文法解析の途中結果として少なくとも前記入力され
    た文章中の単語の候補の位置情報および表記、品詞、読
    み、校正用属性を一時格納する作業メモリと、 前記作業メモリ内で前記校正情報を持つ語が他の単語の
    候補と重複する区間に出現する場合を曖昧性箇所として
    検出する曖昧性判定手段と、 前記曖昧性判定手段の判定結果を記憶する判定結果メモ
    リと、 前記曖昧性判定手段の検出した箇所及び前記不適正語の
    種類別に自動訂正の対象とするか否かを記述して記憶す
    る訂正条件メモリと、 前記解析結果メモリと前記判定結果メモリを参照して前
    訂正条件メモリの自動訂正の対象に該当する箇所を検
    出する訂正対象箇所判定手段と、 前記訂正対象箇所判定手段の判定箇所を記憶する訂正対
    象箇所メモリと、 前記校正情報付き単語辞書メモリを参照して前記入力さ
    れた文章を前記訂正対象箇所メモリに格納された箇所に
    ついて自動訂正を行う自動判定手段とを備えることを特
    徴とする文章訂正装置。
  2. 【請求項2】入力された文章を記憶する入力文章メモリ
    と、 不適正語を含み不適正語の種別や訂正候補などの校正情
    報を持つ単語辞書を記憶する校正情報付き単語辞書メモ
    リと、 前記校正情報付き単語辞書メモリを参照して前記入力さ
    れた文章の文法解析を行い不適正語を認定する文法解析
    手段と、 前記入力された文章について前記文法解析の結果を記憶
    する解析結果メモリと、 前記文法解析の途中結果として少なくとも前記入力され
    た文章中の単語の候補の位置情報および表記、品詞、読
    み、校正用属性を一時格納する作業メモリと、前記作業メモリ内で前記校正情報を持つ語が他の単語の
    候補と重複する区間に出現する場合を曖昧性箇所として
    検出する 曖昧性判定手段と、 前記曖昧性判定手段の判定結果を記憶する判定結果メモ
    リと、 不適正語の認定に関する曖昧性を解消するための指示を
    入力する曖昧解消指示入力手段と、 前記判定結果メモリを参照して前記入力された文章にお
    ける不適正語の認定が曖昧な箇所を検出し前記曖昧解消
    指示入力手段からの指示によって該箇所の曖昧性を解消
    する曖昧箇所決定手段と、 不適正箇所に関する訂正候補の選択指示を入力する候補
    選択指示入力手段と、 前記曖昧箇所決定手段の決定と前記解析結果メモリを参
    照して前記入力された文章における不適正箇所を検出し
    該不適正箇所に関する訂正候補を前記校正情報付き単語
    辞書メモリから検索し前記候補選択指示入力手段から指
    示された訂正候補に該不適正箇所を置き換える逐次訂正
    手段とを備えることを特徴とする文章訂正装置。
JP5240977A 1993-09-28 1993-09-28 文章訂正装置 Expired - Lifetime JP2870375B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP5240977A JP2870375B2 (ja) 1993-09-28 1993-09-28 文章訂正装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP5240977A JP2870375B2 (ja) 1993-09-28 1993-09-28 文章訂正装置

Publications (2)

Publication Number Publication Date
JPH0793330A JPH0793330A (ja) 1995-04-07
JP2870375B2 true JP2870375B2 (ja) 1999-03-17

Family

ID=17067482

Family Applications (1)

Application Number Title Priority Date Filing Date
JP5240977A Expired - Lifetime JP2870375B2 (ja) 1993-09-28 1993-09-28 文章訂正装置

Country Status (1)

Country Link
JP (1) JP2870375B2 (ja)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6782510B1 (en) 1998-01-27 2004-08-24 John N. Gross Word checking tool for controlling the language content in documents using dictionaries with modifyable status fields
JP6210194B2 (ja) * 2013-05-17 2017-10-11 日本電気株式会社 文書分析システム、方法およびプログラム
JP6617647B2 (ja) * 2016-05-31 2019-12-11 京セラドキュメントソリューションズ株式会社 画像形成装置及び画像形成方法

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS6039228A (ja) * 1983-08-11 1985-03-01 Ricoh Co Ltd カナ漢字変換処理装置
JPS61208164A (ja) * 1985-03-12 1986-09-16 Agency Of Ind Science & Technol 日本語文章校正装置の表示方式
JPS6272082A (ja) * 1985-09-25 1987-04-02 Toshiba Corp 画像入力装置

Also Published As

Publication number Publication date
JPH0793330A (ja) 1995-04-07

Similar Documents

Publication Publication Date Title
JPH07325828A (ja) 文法チェックシステム
JP2004220616A (ja) 3つ以上の対訳画面を同時に表示し編集可能にする機械翻訳装置
JP2870375B2 (ja) 文章訂正装置
JPS61156466A (ja) 単語抽出方式
JPH06215184A (ja) 抽出領域のラベリング装置
JP2570681B2 (ja) ワード・プロセッサ
JPH08190561A (ja) 文書修正装置
JPS62212871A (ja) 文章読み上げ校正装置
JPH03233669A (ja) 文書作成装置
JPH0484261A (ja) 誤り表記検索方式
JPH09138835A (ja) 文字認識装置
JP3077820B2 (ja) 文章の不適正箇所検出装置
JPH05314303A (ja) 誤読文字修正方法
JPH07295983A (ja) 文章校正支援方法及びその装置
JPS5899829A (ja) 誤り文字検出・修正支援装置
JP2010055561A (ja) 電子辞書、電子辞書における検索方法、およびプログラム
JPH01281561A (ja) 日本文訂正候補文字抽出方法
JPS6249582A (ja) 光学文字読取り装置
JPH02158864A (ja) 文書作成装置
JPH07129577A (ja) 文書校正支援装置
JPH08329068A (ja) 文字列処理方法およびその装置
JPH05233619A (ja) 日本語文章誤り訂正方法およびその装置
JPH0721176A (ja) 文字訂正方法および文字訂正装置
JPS63103375A (ja) 文書処理装置
JPH08335250A (ja) 誤字訂正装置

Legal Events

Date Code Title Description
FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080108

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090108

Year of fee payment: 10

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100108

Year of fee payment: 11

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110108

Year of fee payment: 12

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110108

Year of fee payment: 12

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120108

Year of fee payment: 13

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130108

Year of fee payment: 14

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130108

Year of fee payment: 14

EXPY Cancellation because of completion of term