JPH05143587A - 文書処理方法及び装置 - Google Patents

文書処理方法及び装置

Info

Publication number
JPH05143587A
JPH05143587A JP3306290A JP30629091A JPH05143587A JP H05143587 A JPH05143587 A JP H05143587A JP 3306290 A JP3306290 A JP 3306290A JP 30629091 A JP30629091 A JP 30629091A JP H05143587 A JPH05143587 A JP H05143587A
Authority
JP
Japan
Prior art keywords
word
document
information
words
stored
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
JP3306290A
Other languages
English (en)
Inventor
Kazuyo Ikeda
和世 池田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Inc
Original Assignee
Canon Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Inc filed Critical Canon Inc
Priority to JP3306290A priority Critical patent/JPH05143587A/ja
Publication of JPH05143587A publication Critical patent/JPH05143587A/ja
Withdrawn legal-status Critical Current

Links

Landscapes

  • Document Processing Apparatus (AREA)
  • Machine Translation (AREA)

Abstract

(57)【要約】 【目的】 文書情報中で同じ読みを有し、表記が異なる
単語を指摘することにより、文書中に出現する表記の統
一が取れていない単語を全て検出できると共に、文書情
報上で直接指摘して、それらを所望の文字列で置き換え
ることができる文書処理方法及び装置を提供する。又、
指定された全ての文書情報における、表記が異なる単語
を指摘することにより、文書中に出現する表記の統一が
取れていない単語を全て検出できると共に、文書中に出
現する表記の統一が取れていない単語の指摘事項を容易
に確認できる文書処理方法及び装置を提供する。 【構成】 単語の表記と文法的な情報とを対応させて格
納し、同じ読みを持つ単語を結び付ける情報を有する単
語辞書を用いて文書情報を解析し、その文書情報におい
て使用されている単語の情報を求める。そして、これら
求められた文書情報で使用されている単語の情報を記憶
し、それら格納されている単語の中に読みが同じで表記
が異なる単語が存在する場合に、その単語をその文書情
報上で指摘して表示する。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は文書情報を処理する文書
処理装置に関し、例えば、文書情報中の同音異義語の誤
りや表記の統一が取れていない箇所を指摘するの校正支
援機能を備えた文書処理方法及び装置に関するものであ
る。
【0002】
【従来の技術】従来、ワードプロセッサ等の文書処理装
置では、文法的に誤りのない文書や、文書データの表現
上、見苦しくない文書を作成するために、同音異義語の
誤りや表記の統一が取れていない単語を指摘する校正支
援機能を備えた機種がある。このような機種では、例え
ば、表記の統一を取るために、「行う」と「行なう」の
ように表記が一致していない単語対のうち、一方の単語
を予め用意しておき、文書中にその単語が出現した場合
に、その単語を表記の統一が取れない単語として指摘す
ることができる。
【0003】また、「山に昇る」などというように、同
音異義語の誤りのパターンをあらかじめ用意しておき、
文書中にそのパターンが出現した場合に、そのパターン
を同音異義語の誤りとして指摘し、置き換え候補である
「山に登る」等の単語群を表示できるものがあった。
【0004】また、情報処理学会論文誌(Vol. 30, No.
11,P.1402〜P.1412) で提案されている、KWIC上で
読みが同じで表記の異なる単語を指摘する方法では、同
じ読みで表記の異なる全ての単語を指摘することができ
る。
【0005】
【発明が解決しようとする課題】しかしながら従来の校
正支援機能のように、指摘する単語やパターンを予め用
意しておく方法では、用意されていない同音異義語の誤
りのパターンや、用意されていない表記を持つ単語が出
現した場合は、これら単語の全てを指摘できないという
欠点があった。また、表記がゆれている単語対のいずれ
もが、その文書中で使用されていないのに、表記の統一
が取れていないと指摘されるという欠点があった。ま
た、用意されていない単語の表記に統一したい場合であ
っても、その用意されていないほうの表記を指摘するこ
とができないという欠点があった。
【0006】又、このような従来の支援機能では、置き
換え候補を表示して、その中から1つを選んで置き換え
ることはできたが、文書中に同じパターンが行くとも存
在する時、これらを一括して変換することができなかっ
た。
【0007】また、KWIC上で読みが同じで、表記の
異なる単語を指摘する方法では、KWIC上では1行に
1単語しか表示することができないことや、仮名読みに
よってソートされているので文書の順番で単語が出てこ
ないので不自然であるとか、文書中での単語の位置が分
からず使いにくいという欠点があった。また、指摘した
単語の前後の文字列も同時に1行に表示するので、同じ
単語が別の行に何度も出現することになり、KWICデ
ータが膨大になるという欠点があった。
【0008】又、このようにして指摘された単語が表示
された時、その単語が表域のゆれに対応しているのか、
同音異義語であるのかが表示されないため、ユーザがそ
れら単語を見て、判断しなければならなかった。又、こ
のような機能は、1つの文書に対してのみ行われるもの
であるため、複数の文書に亙って表記の統一や、同音異
義語の誤りを検出することができなかった。
【0009】本発明は上記従来例に鑑みてなされたもの
で、文書情報中で同じ読みを有し、表記が異なる単語を
指摘することにより、文書中に出現する表記の統一が取
れていない単語を全て検出できるようにした文書処理方
法及び装置を提供することを目的とする。
【0010】また、文書情報上で直接指摘して、それら
を所望の文字列で置き換えることができる文書処理方法
及び装置を提供することを目的とする。
【0011】指定された全ての文書情報における、表記
が異なる単語を指摘することにより、文書中に出現する
表記の統一が取れていない単語を全て検出できるように
した文書処理方法及び装置を提供することを目的とす
る。
【0012】文書中に出現する表記の統一が取れていな
い単語の指摘事項を容易に確認できる文書処理方法及び
装置を提供することにある。
【0013】
【課題を解決するための手段】上記目的を達成するため
に本発明の文書処理装置は以下のような構成を備える。
即ち、入力された文書情報を記憶し、前記文書情報を表
示して文書情報の編集を行うことができる文書処理装置
であって、単語の表記と文法的な情報とを対応させて格
納し、同じ読みを持つ単語を結び付ける情報を有する単
語辞書手段と、前記単語辞書手段を用いて前記文書情報
を解析し、前記文書情報において使用されている単語の
情報を求める文書解析手段と、前記文書解析手段によっ
て求められた前記文書情報で使用されている単語の情報
を記憶する使用単語記憶手段と、前記使用単語記憶手段
に格納されている単語の中に読みが同じで表記が異なる
単語が存在する場合に、その単語を前記文書情報上で指
摘して表示する同読み異表記指摘手段とを有する。
【0014】上記目的を達成するために本発明の文書処
理方法は以下のような工程を備える。即ち、入力された
文書情報を記憶し、前記文書情報を表示して文書情報の
編集を行う文書処理方法において、記憶されている複数
の文書情報の内所望の文書情報を指定する指定工程と、
単語の表記と文法的な情報とを対応させて格納し、同じ
読みを持つ単語を結び付ける情報を有する単語辞書を用
いて、前記指定工程により指定された文書情報を順次読
出して解析し、前記文書情報において使用されている単
語の情報を求める工程と、前記工程で求められた文書情
報で使用されている単語の情報を記憶する工程と、記憶
されている単語の中に読みが同じで表記が異なる単語が
存在する場合に、その単語を前記文書情報上で指摘して
表示する工程とを有する。
【0015】
【作用】以上の構成において、単語の表記と文法的な情
報とを対応させて格納し、同じ読みを持つ単語を結び付
ける情報を有する単語辞書手段を用いて文書情報を解析
し、その文書情報において使用されている単語の情報を
求める。こうして求められた、その文書情報で使用され
ている単語の情報を記憶しておき、それら格納されてい
る単語の中に読みが同じで表記が異なる単語が存在する
場合に、その単語をその文書情報上で指摘して表示す
る。
【0016】
【実施例】以下、添付図面を参照して本発明の好適な実
施例を詳細に説明する。
【0017】図1は本発明に係る一実施例の全体構成を
示すブロック図である。
【0018】図1において、1はROM2に格納され
た、後述する図10〜図18のフローチャートに示す制
御手順に従って本実施例の文書処理装置全体を制御する
ためのCPUである。このCPU1は、例えばマイクロ
プロセッサで構成され、文書処理のための演算、論理判
断等を行い、アドレスバスAB,コントロールバスCB
及びデータバスDBを介して、それらのバスに接続され
た各構成要素を制御している。2は読出し専用の固定メ
モリROMであり、ROM2中のPA2aは上述した制
御手順等を記憶させたプログラムエリアである。3はR
AMで、CPU1のワークエリアとして使用され各種デ
ータを一時的に記憶している。ここでは、このRAM3
は、1ワード16ビットで構成されている。
【0019】このRAM3において、TBUFは文書バ
ッファであり、キーボードKB4より入力された文書情
報をコードで格納している。TLSTは文書名リストで
あり、文書バッファTBUFに格納されている文書名を
格納している。DICは文書バッファTBUFに格納さ
れている文書情報を解析し、文節情報を取り出すための
単語辞書である。又、UWRDは使用単語リストであ
り、文書名リストTLSTによって示される文書名の文
書中で使用されている単語の情報を格納する領域であ
る。SWRDは指摘単語リストであり、使用単語リスト
UWRDに格納されている単語の情報の中で、指摘すべ
き単語の情報を取り出して格納する領域である。TYP
Eは指摘タイプ領域で、指摘すべき単語のタイプを格納
する2バイトの領域である。HOUHは指摘方法領域
で、2バイトで構成され、単語を指摘する方法を格納し
ている。TBU2はワーク文書バッファであり、文書名
リストTLSTで示される文書を一時的に呼び出して作
業するための領域である。
【0020】更に、4はキーボードKBであり、アルフ
ァベットキー、平仮名キー及びカタカナキー等の文字記
号入力キー、及びカーソル移動を指示するカーソル移動
キー等の各種のファンクションキーを備えている。この
キーボードKB4において、SITEは読みが同じで表
記が異なる単語が混在している単語(これ以後、このよ
うな単語を同読み異表記語と呼ぶ)の指摘を指示するた
めの同読み異表記指摘指示キー、KAKUは指摘された
同読み異表記語の情報を確認するための同読み異表記確
認キー、IKKAは同読み異表記語の表記を一括して置
き換えることを指示する一括置き換えキーである。
【0021】5は定型文書を記憶するための大容量外部
メモリDISKであり、作成された文書情報を保管し、
この保管された文書情報はキーボード4よりの指示入力
により、必要に応じて呼び出すことができる。6はカー
ソルレジスタCRであり、CRT8に表示されるカーソ
ル表示位置を指示するものである。カーソルレジスタC
R6は、CPU1によりその内容が読み書きされ、この
CPU1よりの書込み内容に従ってCRT8の表示画面
位置に表示される。即ち、CRTコントローラCRTC
7は、カーソルレジスタCR6に蓄えられたアドレスに
対する表示装置CRT8上の位置にカーソルを表示す
る。7はCRTコントローラCRTCであり、CPU1
の制御に従ってカーソルレジスタCR6及びバッファD
BUF10に蓄えられた内容をCRT8に表示してい
る。8は陰極線管等を用いた表示装置CRTであり、C
RT8に表示されるドットパターン及びカーソルの表示
位置はCRTC7によって制御されている。さらに、9
はキヤラクタジエネレータCGであり、CRT8に表示
する文字や記号等のパターン情報を記憶するものであ
る。また、10は表示用バッファメモリDBUFであ
り、RAM3中の文書バッファTBUFに蓄えられた文
書情報等に対応したパターン情報を記憶している。
【0022】アドレスバスAB21は、CPU1の制御
の対象とする構成要素を指示するアドレス信号等を転送
する。コントロールバスCB22はCPU1の制御の対
象とする各構成要素のコントロール信号を転送してい
る。更に、データバスDB23は、接続された各構成要
素間でのデータの転送を行っている。
【0023】以上の構成を有する本実施例の文書処理装
置は、原則としてキーボード4からの各種指示入力に応
じて動作するものとする。いま、キーボード4からの指
示入力があると、まずキーインタラプト信号がキーボー
ド4よりCPU1に送られ、CPU1はこのインタラプ
ト信号に従って起動されるROM2内に記憶されている
各種の制御手順(インタラプトプログラム)に従って、
各種の制御を実行する。
【0024】以下、本実施例の文書処理装置における、
同読み異表記語の指摘、及び同読み異表記語の確認が実
行される例を、図2及び図3を参照して説明する。
【0025】図2において、201はCRT8に同読み
異表記語の指摘の対象となる文書の文書名のリストが表
示されている状態が示されている。尚、210はCRT
8に表示されたカーソルを示している。
【0026】今、201で示す状態において、例えば指
示キーSITEが入力され、続いて211,212で示
される数字キー“3”“1”が順次入力されると、本実
施例の後述する同読み異表記指摘処理が文書を直接指摘
する形式で実行される。これにより、DISK5から文
書名のリストTLSTの先頭にある「文書1」が呼び出
され、「文書1」から「文書5」の中で、同読み異表記
語のうち、「文書1」に出現する単語が指摘される。
【0027】この同読み異表記指摘処理を実行した後の
CRT8の表示状態は、202で示されている。
【0028】202において、213,214で示され
るように網かけが施されて表示されている単語は、本実
施例処理により指摘された単語であることを示す。
【0029】なお、以上のキー操作において、指示キー
SITEは、同読み異表記語の指摘を指示するキーであ
り、このキーに続いて入力されているキー211は、指
摘する同読み異表記語のタイプを指示するキーである。
ここで、“3”はその単語の読みと意味が同じで表記が
異なる単語(例えば、202の文書中で示された「行な
う」と「行う」等、以後、これを表記のゆれと呼ぶ)が
混在している単語と、同音異義語が混在する単語(例え
ば、202で示された文書中の「対称」「対象」)の両
方を指摘することを指示している。
【0030】この211で入力できるキーは、キーボー
ド4の“1”から“3”までの数字キーであり、それ以
外のキー入力は無視される。ここでキー“1”は、表記
のゆれが混在する単語のみを指摘することを指示し、キ
ー“2”は同音異義語が混在する単語のみを指摘するこ
とを指示し、“3”は表記のゆれが混在する単語と同音
異義語が混在する単語の両方を指摘することを指示す
る。
【0031】また、212で示されるキー入力は、指摘
の方法を指示するキー入力であり、キー“1”またはキ
ー“2”のいずれかが入力可能であり、それ以外のキー
入力は無視される。ここで、キー“1”の入力は同読み
異表記語を直接指摘する方法を指示し、キー“2”の入
力は、同読み異表記語をリスト形式で出力する方法を指
示する。図2の202では、212で示すようにキー
“1”が入力されているため、同読み異表記語が網かけ
により直接指摘されている。
【0032】次に、202で示された同読み異表記指摘
処理により指摘された単語に対する同読み異表記確認処
理を203〜206を参照して説明する。
【0033】202で示す状態において、キーボード4
の確認キーKAKUが押下されると203で示す状態に
移行する。即ち、215で示すように、カーソル位置よ
りも後ろ側(文末側)に存在する最初の指摘された単語
(「行なう」)の位置にカーソルが移動し、同時にウイ
ンドウ216が表示される。このウインドウ216に
は、同読み異表記語のタイプ、指摘されている単語、置
き換え候補の単語が表示される。このウインドウ216
の「表記のゆれ」は、同読み異表記語のタイプを表し、
「0:行なう」は指摘されている単語を表し、「1:行
う」は置き換え候補の単語を表している。即ち、このウ
インドウ216は、「行なう」という単語に対して、表
記のゆれである「行う」が混在していることを示してい
る。
【0034】203で示された状態において、217で
示すように、キーボード4のキー“1”が入力されると
204で示す状態に移行する。即ち、ウインドウ216
が消去され、218で示すように、カーソル位置の単語
「行なう」213が、ウインドウ216に表示されたキ
ー“1”に対応した単語「行う」に置き換えられる。そ
して、この置き換えられた単語218には、網かけは施
されていない。ここで、217で示されるキー入力は、
ウインドウ216に表示されている置き換え候補を指定
し、カーソル位置の単語を指定した置き換え候補で置き
換えることを指示するキー入力を示している。このよう
に、置き換え候補に対応する数字キーを入力することに
より、その単語の表記を簡単に置き換えることができ
る。例えば、203に示した状態では、キー“0”も入
力することが可能であり、この場合は、ウインドウ21
6の表示が消え、カーソル位置の単語「行なう」213
が変更されず、網かけが消えるだけである。(キー
“0”に対応した単語「行なう」に置き換えられたと解
釈することができる。) 次に、204で示す状態でキーボード4の確認キーKA
KUが押下されると、205で示す状態に移行する。即
ち、203の場合と同じように、カーソル位置よりも後
ろ側(文末側)に存在する最初の指摘された単語「対
称」219の位置にカーソルが移動し、同時にウインド
ウ220が表示される。このウインドウ220の「同音
異義語」は、同読み異表記語のタイプを表し、「0:対
称」は指摘されている単語を表し、「1:対象」は置き
換え候補の単語を表している。即ち、このウインドウ2
20は、「対称」という単語に対して同音異義語である
単語「対象」が混在しているという情報を示している。
【0035】次に、205で示された状態において、キ
ーボード4の一括キーIKKAが押下され、続いて22
1で示されるキー“1”が入力されると、本実施例の後
述する一括置き換え処理が実行されて206で示す状態
に移行する。即ち、ウインドウ220が消去され、22
2で示されるように、カーソル位置の単語「対称」21
9が、ウインドウ220に表示されていたキー“1”に
対応する単語「対象」に置き換えられる。そして、この
置き換えられた単語222には網かけは施されていな
い。また、単語219と同じ単語及び単語219と同音
異表記であるすべての単語が検索されて、223で示さ
れるように、221で示されたキー“1”入力に対応し
た単語「対象」に置き換えられて網かけ表示が消去され
る。
【0036】なお、以上のキー操作において、一括キー
IKKAは、対称となっている単語の全ての同読み異表
記語に対して一括して置き換えを行うことを指示するキ
ーである。そして、この一括キーIKKAに続いて入力
される、221で示されたキー入力は、置き換え先の単
語を指示するキーであり、“1”は対象となっている単
語のすべての同読み異表記語を“1”に対応した「対
象」(ウインドウ220の場合)に置き換えることを指
示する。尚、このキー入力221で入力できるキーは、
その時表示されているウインドウに表示される置き換え
候補に対応した数字キーであり、それ以外のキー入力は
無視される。
【0037】なお、203の状態においても、キーボー
ド4の一括キーIKKAを入力して一括置き換え処理を
実行することができる。また、205の状態において、
キーボード4のキー“0”または“1”を入力して、2
19で示す単語のみを置き換えることができる。
【0038】尚、図2には記載されていないが、「文書
1」で指摘された単語の確認を全て終え、網かけが施さ
れた単語がなくなった状態で確認キーKAKUが押下さ
れると「文書1」をDISK5に保存し、201で表示
された「文書1」の次の文書である「文書2」がDIS
K5から呼び出される。この後、202と同様にして
「文書1」から「文書5」の中で、同読み異表記語のう
ち「文書2」に出現する単語が指摘される。更に、20
3で示したのと同じように、「文書2」の最初の同読み
異表記語に対する情報を示すウインドウが表示される。
この場合、一括キーIKKAによって一括置き換え処理
が施された同読み異表記語は「文書2」では指摘されな
い。
【0039】図3は、同音異表記語の指摘を同音異表記
語のリストを出力することによって行った場合の表示例
を示す図である。
【0040】図3において、上段に示す301は、図2
における201と全く同じ状態である。301で示す状
態において、例えば指示キーSITEが入力され、続い
て302,303で示されるキー“3”“2”が順次入
力されると、本実施例の後述する同読み異表記指摘処理
がリストを出力する形式で実行される。これにより、全
ての同読み異表記語のリストが、304で示すようにリ
スト形式で文書として作成される。
【0041】以上のキー操作において302,303に
おいて入力できるキーは、図2におけるキー入力21
1,21の場合と全く同じである。
【0042】304において、同読み異表記語のリスト
は、指定された文書の出現に並んでおり、各同読み異表
記語に対して、305〜310の情報とともに表示され
る。305,306,307のそれぞれは、同読み異表
記語が出現する文書名、ページ番号、行番号を示してお
り、308,309のそれぞれは指摘された単語の表
記、同読み異表記語のタイプを示している。更に、31
0は同読み異表記語の置き換え候補を示している。同読
み異表記語のタイプ309において、「ゆれ」とあるの
は前述した「表記のゆれ」を意味し、「異義」とあるの
は「同音異義語」を意味している。
【0043】以上の処理等において、文書情報を記憶す
る文書バッファTBUFの構成を図4に示す。
【0044】図4(A)は、指摘された単語が存在しな
いときの文書の構成を示した図である。指摘された単語
が存在しない場合は、文書バッファTBUFの先頭か
ら、文書の文字が1文字が2バイトのキャラクタコード
(例えばJISコード)で格納され、文書の末尾は、2
バイトの文書末コード401で示される。
【0045】図4(B)は、文書バッファTBUF中に
おける指摘された単語の構成を示した図である。
【0046】1文字2バイトで表していた単語が指摘さ
れると、その2バイトのデータが指摘単語開始コード4
02と指摘単語終了コード403で挟まれた、不定長の
データ(指摘単語)に置き換えられる。この指摘単語開
始コード402と指摘単語終了コード403の間には、
先頭から順次、2バイトの指摘情報404、4バイトの
同読み単語群へのポインタ405、1文字2バイトのキ
ャラクタコード(JISコード等)で表される指摘され
た単語の単語文字コード列406が続けて格納されてい
る。この同読み単語群へのポインタ405には、図8に
おいて後述する使用単語リストの指摘単語と同じ読みの
単語が格納された同読み単語群へのポインタが格納され
る。この同読み単語群へのポインタ405を辿ることに
よって、指摘単語に対する置き換え候補の表記を得るこ
とができる。
【0047】図4(C)は、図4(B)における指摘情
報404の詳細構成を説明するための図である。
【0048】この指摘情報404には、指摘された単語
の指摘タイプが格納されており、指摘タイプを示すもの
として、表記のゆれフラグ407と、同音異義語フラグ
408から構成される。表記のゆれフラグ407は
“0”または“1”の値をとり、“0”は表記のゆれが
混在しないことを意味し、“1”は表記のゆれが混在す
ることを意味する。また、同音異義語フラグ408は
“0”または“1”の値をとり、“0”は同音異義語が
混在しないことを意味し、“1”は同音異義語が混在す
ることを意味している。
【0049】ワーク文書バッファTBU2は、図4に示
される文書バッファTBUFと全く同じ構成をとる。
【0050】図5に、文書名リストTLSTの詳細構成
を示す。
【0051】文書名リストTLSTは、図5の(A)に
示すように、先頭に2バイトの文書名個数501が格納
され、その直後に、固定長の文書名が文書名個数501
に示される個数だけ格納される。
【0052】そして文書名は、図5の(B)に示すよう
に、先頭に2バイトの文書名の文字数502が格納さ
れ、その直後に、文字数502で示される文字数分の文
書名が、1文字2バイトのキャラクタコード(JISコ
ード等)で記憶されている。
【0053】図6に単語辞書DICの詳細構成を示す。
【0054】単語辞書DICは、図6(A)に示すよう
に、索引情報部601と単語情報部602から構成され
ている。索引情報部601には、先頭に、索引情報部6
01に格納されている索引情報603の個数を格納する
2バイトの索引個数があり、その直後に索引情報603
が複数格納されている。また、単語情報部602には、
単語情報604が複数格納されている。
【0055】これら索引情報603は、図6(B)に示
されるように、固定長の表記605と2バイトの単語I
Dから構成される。また、単語情報604は、図6
(C)に示されるように、固定長の読み606と、2バ
イトの品詞から構成される。これら索引情報603の表
記605と、単語情報604の読み606の構成を図6
の(D)に示す。これら表記605、読み606では、
先頭に2バイトの文字数が格納され、その直後に単語の
表記(或いは読み)が、1文字2バイトからなる最大1
0個のキャラクタコードで格納される。
【0056】索引情報部601に格納される索引情報6
03は、索引情報603の表記605のキャラクタコー
ドによってソーティングされている。また、索引情報6
03の単語IDは、単語の読み、文法的特性、語義が同
一の単語に1つ1つ付けられた固有の識別番号であり、
表記が異なっていても、同じ単語IDを持つことがある
(この場合、表記のゆれと判断できる。)単語情報部6
02に格納される単語情報604は、1つの単語IDに
対して1つの単語情報が格納されており、単語ID順に
ソーティングされている。この単語情報604は固定長
なので、索引情報603の単語IDをたどることによっ
て、単語の読み606、品詞を得ることができる。
【0057】図7は、同読み異表記語を指摘するため
に、文書バッファTBUF中の文書を解析した結果を格
納する解析結果テーブルKAISの詳細構成を示した図
である。
【0058】図7(A)は、解析結果テーブルKAIS
の詳細構成を示す図であり、解析の結果、図示のごとく
文書バッファTBUF中の文書の先頭から切りだされた
文節情報702が、解析結果テーブルの個数701の次
から順次詰めて格納される。これら文節情報702のそ
れぞれには、図7(B)に示すように、文節情報のサイ
ズ703、文書の先頭からの文字数で表わした文節開始
位置704、文節文字数705、自立語文字数706、
自立語の単語を示す単語ID706、及び自立語読み7
07が格納されている。この自立語読み707のデータ
構成は図7(C)に示されており、文字数708で示さ
れた文字数により、自立語の読みが1文字2バイトのキ
ャラクタコード(例えばJISコード等)で格納されて
いる。図8は、使用単語リストUWRDの詳細な構成を
示す図である。
【0059】図8(A)に示すように、使用単語リスト
UWRDの先頭には、同読み単語群の個数を格納する2
バイトの格納読み数801が設けられている。そして、
その直後に、文書中で使用されている同じ読みを持つ単
語をまとめた同読み単語群802(最大1000語)が
続いている。この同読み単語群802の単語は、読みに
よってソーティングされている。
【0060】これら同読み単語群802のデータ構成
は、図8(B)に示すように、先頭に固定長の単語の読
み803があり、続いて格納されている表記情報805
の個数を格納する2バイトの表記数804があり、最後
に表記情報805の領域(最大10個分)がある。
【0061】更に、この表記情報805は、図8(C)
に示すように、先頭に固定長の単語の表記806があ
り、続いてその表記の単語IDを格納するための2バイ
トの単語ID807がある。更に、その後に、格納され
ている位置情報80の個数を格納する2バイトの位置数
809があり、最後に、この単語が出現した位置を表す
位置情報808を格納する領域(最大100個分)があ
る。ここで、同じ単語ID807を持つ単語は、同じ表
記情報805のなかに格納される。
【0062】また、同読み単語群802の読み803
と、表記情報805の表記806は、図8(D)に示す
ように、先頭に2バイトの文字数810が格納され、そ
の直後に単語の表記(読み)が、1文字2バイトのキャ
ラクタコードで格納される。
【0063】更に、表記情報805の位置情報808
は、図8(E)に示すように、先頭から順に、単語が存
在する文書を示す2バイトの文書番号811、文書番号
811で指定された文書の先頭から何文字目から始まる
単語であるかを示す2バイトのバイト数812から構成
される。
【0064】図9は、指摘単語リストSWRDの詳細な
構成を示す図である。
【0065】図9(A)に示すように、この指摘単語リ
ストSWRDは、指摘単語リストSWRDに格納されて
いる指摘単語情報902の個数を示す2バイトの格納個
数901と、指摘すべき単語の情報を格納する固定長の
指摘単語情報902とから構成される。これら指摘単語
情報902は、図9(B)に示されるように、指摘すべ
き単語の存在する位置を示す位置情報903と、指摘す
べき単語の文字数を示す2バイトの文字数904と、指
摘する理由を示す2バイトの指摘情報905と、指摘す
べき単語と同じ読みを持つ使用単語リストUWRD内の
同読み単語群へのポインタ906(4バイト)から構成
される。ここで、位置情報903の構成は、前述の図8
(E)の使用単語リストUWRDの位置情報808の構
成と全く同じである。また、指摘情報905の構成も、
図4(C)の文書バッファTBUFの指摘情報404の
構成と全く同じである。
【0066】上述の構成に基づく各仕様に従つた本実施
例の作動を、図10〜図18のフローチャートに従って
以下に説明する。
【0067】図10は本実施例の文書処理装置の概略動
作を示すフローチャートである。
【0068】この実施例の文書処理装置は、まずステッ
プS1において、キーボード4のキーが押下され、CP
U1に割り込みが発生するのを待つ。キーが入力される
とステップS2に進み、入力されたキーの種別を判定
し、キーの種類に応じてステップS3,ステップS4,
ステップS5のいずれかの処理に分岐する。
【0069】ステップS3は、同読み異表記指摘キーS
ITEが押下されたときの処理であり、文書バッファT
BUFに格納されている文書名で指示される文書に存在
する同読み異表記語を指摘する。次にSITEキーに後
続するキーに従って、指示された文書を文書バッファT
BUFに呼び出して文書中の単語を直接指摘したり、指
摘した単語の情報をリスト形式で文書バッファTBUF
に出力したりする。このステップS3の処理は、図11
〜図14のフローチャートを参照して詳しく後述する。
【0070】ステップS4は同読み異表記確認キーKA
KUが押下されたときの処理であり、ステップS3で指
摘された単語に対して、同読み異表記語のタイプや置き
換え候補の情報を表示して確認し、必要に応じて文書中
の単語を置き換え候補に置き換える。この時、文書バッ
ファTBUF上に指摘された単語が存在しなければ、ス
テップS3で指示された別の文書を呼び出して、その文
書に存在する同読み異表記語の情報を表示する。この処
理は、図15〜図18のフローチャートを参照して詳し
く後述する。
【0071】ステップS5では、同読み異表記指摘キー
SITE、同読み異表記確認キーKAKU以外のキー
(例えば、カーソル移動キーなどの文書編集で用いるキ
ー等)が押下された場合の処理であり、同種の文書処理
装置において一般に行なわれている処理であり、公知で
あるため詳細な説明は省略する。
【0072】以上の各処理に続きステップS6の表示処
理を実行する。ステップS6は上記の処理の結果、変更
された部分を表示する表示処理である。文書中のデータ
1文字の文字コードを読んではCG9を参照してパター
ンに展開し、表示バッファDBUFに出力するという通
常広く行なわれている処理である。
【0073】以上の説明におけるステップS3の処理の
詳細を、図11〜図14のフローチャートを参照して以
下に説明する。
【0074】ステップS11は、指摘すべき同読み異表
記語のタイプを設定する処理である。ステップS11で
は、キーボード4よりキーが押下され、割り込みが発生
するのを待つ。キーが入力されると、図2のキー入力2
11で説明したように入力されたキーが“1”から
“3”までの数字キーであるか否かを判定する。“1”
から“3”までの数字キーでなければ、更に次のキーが
入力されるのを待つ。“1”から“3”までの数字キー
であれば、そのキーの数字の値をRAM3中の指摘タイ
プTYPEに格納し、ステップS12へ進む。ここで、
前述したように“1”は表記のゆれが混在する単語のみ
の指摘、“2”は同音異義語が混在する単語のみの指
摘、そして“3”は表記のゆれが混在する単語と同音異
義語が混在する単語の両方の指摘を意味している。
【0075】ステップS12は、指摘方法を設定するた
めの処理である。ステップS12では、キーボード4よ
り押下され、割り込みが発生するのを待つ。キーが入力
されると、入力されたキーが“1”または“2”の数字
キーであるか否かを判定する。“1”または“2”の数
字キーでなければ、そのキー入力は無視され、更に次の
キーが入力されるのを待つ。“1”(同読み異表記語を
直接指示する)または“2”(同読み異表記語をリスト
形式で出力)の数字キーであればそのキーの数字の値を
RAM3中の指摘方法HOUHに格納し、ステップS1
3へ進む。
【0076】ステップS13では、文書バッファTBU
Fに格納されている文書名を、文書名リストTSLTに
取り込む処理である。文書バッファTBUFから1文字
ずつ文字コードを読み込み、改行コードを検出するまで
に読み込んだ文字列を文書名として、文書名リストTL
STに格納し、ステップS14へ進む。ステップS14
では、文書名リストTLSTに格納されている文書名に
よって示される文書で使用されている単語を、使用単語
リストUWRDに格納する。こうして、使用単語リスト
UWRDを作成してステップS15へ進む。このステッ
プS14の使用単語リストの作成処理については、図1
2のフローチャートを参照して詳しく後述する。
【0077】ステップS15では、ステップS14で作
成した使用単語リストUWRDから指摘すべき単語を決
定し、指摘すべき単語のリストSWRDに格納する処理
である。こうして指摘単語リストSWRDを作成してス
テップS16へ進む。このステップS15の指摘単語リ
ストの作成処理は、図13のフローチャートを参照して
詳しく説明する。ステップS16では、ステップS12
において設定された指摘方法によって、処理が分岐す
る。即ち、指摘方法HOUHの値が“1”であればステ
ップS17の直接指摘処理へ進み、“2”であればステ
ップS18のリスト出力処理へ進む。
【0078】ステップS17では、ステップS15で作
成された指摘単語リストSWRDに従って、文書をDI
SK5から文書バッファTBUFへ呼出し、指摘単語リ
ストSWRDに格納されている単語を直接指摘する。こ
うして文書を1つ呼び出して指摘を終えると、元の処理
にリターンする。一方、ステップS18では、ステップ
S15で作成された指摘単語リストSWRDに格納され
ている単語を、文書バッファTBUFに図3の304で
示すリスト形式で出力する処理である。こうして文書バ
ッファTBUFに出力し終えると、元の処理にリターン
する。
【0079】以上の説明におけるステップS14の使用
単語リスト作成処理の詳細を、図12のフローチャート
を参照して以下に説明する。
【0080】ステップS21は、文書名リストTLST
から順次文書名を取り出す処理である。文書名リストT
LSTの先頭から順次文書名を1つ取り出してステップ
S22へ進む。ステップS22では、ステップS21の
結果に従って分岐する。即ち、ステップS21において
文書名を取り出すことができればステップS23へ進
み、文書名リストTLSTから全ての文書名を取り出し
終え、ステップS22において文書名を取り出すことが
できなければリターンする。
【0081】ステップS23はステップS21で取り出
した文書名に従って、文書を呼び出す処理で、DISK
5からステップS21で取り出した文書名を持つ文書を
文書バッファTBUFに呼び出して、ステップS24に
進む。ステップS24では、RAM3の文書バッファT
BUFに格納されている文書を、解析用の辞書DICを
用いて解析し、文節単位に分割し、使用されている単語
の情報を同じくRAM3中の解析結果テーブルKAIS
に出力する。この解析用の辞書DICを用いて文章を文
節単位に分割する処理は公知であるので、詳細な説明を
省略する。
【0082】次にステップS25に進み、ステップS2
4において作成された解析結果テーブルKAISに基づ
いて、文書バッファTBUFに格納されている文書で使
用されている単語を使用単語リストUWRDに追加す
る。即ち、解析結果テーブルKAISから1文節分の文
節情報702(図7参照)を順次取り出して、その自立
語の情報を使用単語リストUWRDに登録する。
【0083】その際、使用単語リストUWRDの位置情
報808の文書番号811(図8参照)は、文書リスト
TLST中の先頭の文書名の文書番号を1とし、文書バ
ッファTBUFに格納されている文書が文書名リストT
LST中で何番目の文書であるかにより決定される。ま
た、使用単語リストUWRDの位置情報の文字数812
は、解析結果テーブルKAIS中の文節情報の文節開始
位置704とする。さらに、使用単語リストUWRDの
単語ID807は、文節情報702の単語ID706と
し、単語表記806は、文節情報702の文節開始位置
704から自立語文字数706にセットされている文字
数分だけ文書バッファTBUF中から取ってくることに
より得られる。また、使用単語リストUWRDの読み8
03は、文節情報702の自立語読み707とする。こ
うして、解析結果テーブルKAISに格納されている文
節情報の単語を使用単語リストUWRDに全て追加し終
えるとステップS21に戻る。
【0084】以上の説明におけるステップS15の指摘
単語リスト作成処理の詳細を、図13のフローチャート
を参照して以下に説明する。
【0085】ステップS31は、使用単語リストUWR
Dから、順次同読み単語群802を1つずつ取り出す処
理である。ステップS32では、ステップS31の結果
に従って分岐する。即ち、ステップS31において同読
み単語群802を取り出すことができればステップS3
3に進むが、使用単語リストUWRDの全ての同読み単
語群802を取り出し終えるとステップS36のソート
処理に進む。
【0086】ステップS33では、同読み単語群802
の中に、表記が異なる単語が複数存在するかどうかを判
断し、同読み単語群802の中に表記情報805が2つ
以上あればステップS34に進み、2以下であればステ
ップS31に戻る。
【0087】ステップS34では、ステップS31で取
り出した同読み単語群802が、ステップS11で指摘
されたタイプの同読み異表記語かどうかを判定する。こ
こでは、指摘タイプTYPEの値が“1”(表記のゆれ
が混在する単語のみの指摘)であれば、同読み単語群8
02の中に単語ID807が同じである表記情報805
が2つ以上ある時に適合していると判定し、また、指摘
タイプTYPEの値が“2”(同音異義語が混在する単
語のみの指摘)であれば、同読み単語群802の中に単
語ID807が異なる表記情報805が2つ以上ある時
に適合していると判定する。また、指摘タイプTYPE
の値が“3”(表記のゆれが混在する単語と同音異義語
が混在する単語の両方の指摘)であれば、常に適合して
いると判定する。適合していると判定されればステップ
S35へ進み、そうでなければステップS31へ戻る。
【0088】ステップS35は、ステップS31で取り
出した同読み単語群802の情報から、指摘単語リスト
SWRDに単語を追加する処理である。同読み単語群8
02に格納されている表記情報805の位置情報809
の各1つに対して、1つの指摘単語情報902(図9参
照)を作成し、指摘単語リストSWRDに追加する。即
ち、指摘単語情報902の位置情報903には、同読み
単語群802の表記情報805の位置情報808をその
まま格納し、指摘単語情報902の文字数904には同
読み単語群802の表記情報805の表記806の文字
数810をそのまま記憶する。また、指摘単語情報90
2の指摘情報905では、同読み単語群802中に登録
しようとしている表記情報805に対して、単語ID8
07が異なる他の表記情報805が存在すれば同音異義
語フラグを“1”にセットし、単語ID807が同じ他
の表記情報805が存在すれば、表記のゆれフラグを
“1”にセットする。更に、同読み単語群へのポインタ
906には、その同読み単語群802の先頭アドレスを
格納する。このように、同読み単語群802の全ての位
置情報808に対して指摘単語情報902を作成し、指
摘単語リストSWRDに追加し終えたら、ステップS3
1に戻る。
【0089】ステップS36は、指摘単語リストSWR
Dに格納されている指摘単語情報902を、その位置情
報903によってソートする処理である。即ち、指摘単
語リストSWRDの中で位置情報903の文書番号が小
さい指摘単語情報902が前に来るように、更に、位置
情報903の文字数904が小さい指摘単語情報902
が前に来るようにソートする。このソート処理を終える
とリターンする。
【0090】以上の説明におけるステップS17の直接
指摘処理の詳細を、図14のフローチャートを参照して
以下に説明する。
【0091】ステップS41は、指摘すべき単語の情報
を指摘単語リストSWRDから1つ取り出す処理であ
る。ステップS42では、ステップS41で取り出す結
果に従って分岐する。即ち、ステップS41で指摘単語
リストSWRDの指摘単語情報902があればステップ
S43に進むが、指摘単語リストSWRDの全ての指摘
単語情報902を取り出し終えると元の処理にリターン
する。
【0092】ステップS43では、ステップS41で得
られた指摘単語情報902の位置情報903に格納され
ている文書番号に対応する文書リストTLST中の文書
名に従って、DISK5からその文書の内容を文書バッ
ファTBUFに読込む。この文書データの読み出しが終
了するとステップS44に進み、ステップS41もしく
はステップS45で得られた指摘単語情報902に従っ
て単語を指摘する。即ち、指摘単語情報902の位置情
報903の文字数904によって、文書バッファTBU
F上で指摘する単語の開始位置を求める。次に、その指
摘単語情報902の文字数904を参照して、文書バッ
ファTBUF上で指摘する単語の終了位置を求める。そ
して、文書バッファTBUF上で指摘する単語を、図4
に示すように、指摘単語開始コード402と指摘単語終
了コード403とで挟み、指摘単語情報902の指摘情
報905と同読み単語群へのポインタ906を、そのコ
ードの間に、図4の指摘情報404及び同読み単語群へ
のポインタ405として埋込む。
【0093】次にステップS45に進み、指摘単語情報
を指摘単語リストSWRDから順次1つずつ取り出す。
これはステップS41と同じ処理である。この指摘単語
情報の取り出し処理を終えるとステップS46へ進み、
ステップS45の結果に従って分岐する。ステップS4
5において指摘単語情報902を取り出すことができる
とステップS47に進むが、指摘単語リストSWRDの
全ての指摘単語情報902を取り出し終えた時はリター
ンする。
【0094】ステップS47では、ステップS45で得
られた指摘単語情報902の位置情報903の文書番号
が文書バッファTBUF上の文書と対応しているか判定
し、文書バッファTBUF上の文書と同じ文書を指して
いればステップS44へ戻り、違う文書を指していれば
リターンする。
【0095】以上の説明におけるステップS4の同読み
異表記確認処理の詳細を、図15のフローチャートを参
照して以下に説明する。
【0096】まずステップS51では、文書バッファT
BUF上に存在する指摘された単語を検索する。これは
文書バッファTBUFの先頭から順次1文字ずつチェッ
クし指摘単語開始コード402を検索するものである。
ステップS52では、ステップS51で指摘単語開始コ
ード402が検出できたかどうかを調べ、指摘単語が見
つかればステップS53に進む。一方、文書バッファT
BUFに格納されている文書の末尾まで検索しても指摘
単語が見つからなければステップS59へ進む。
【0097】ステップS53では、ステップS51で検
出した指摘単語の先頭にカーソルを移動し、次にステッ
プS54は、ステップS51で検出した指摘単語の情報
をウインドウ形式(図2の216,220参照)で表示
する。そして、ウインドウの上部には、指摘単語の指摘
情報404に従って、その指摘単語の指摘情報を表示す
る。即ち、表記ゆれフラグ407と同音異義語フラグ4
08の両方が“1”であれば「ゆれ&異義」と表示し、
表記ゆれフラグ407のみが“1”であれば「表記ゆ
れ」(図2の216参照)と表示し、同音異義語フラグ
408のみが“1”であれば「同音異義語」(図2の2
20参照)と表示する。また、ウインドウの下部には、
“0”に対応させて指摘する単語の文字コードを表示
し、順次“1”から順に対応させて、同読み単語群への
ポインタ405によって得られる同読み単語群から、指
摘された単語以外の表記を取ってきて表示する(図2の
ウインドウ表示参照)。
【0098】ステップS55では、キーボード4よりキ
ーが押下され、CPU1に割り込みが発生するのを待
つ。キーが入力されるとステップS56に進み、入力さ
れたキー種別を判別し、キーの種類に応じてステップS
57,ステップS58,ステップS55に分岐する。ス
テップS57は、ステップS54で表示したウインドウ
の下部に表示した数字に対応する数字キーが入力された
時の処理であり、文書バッファTBUF上のカーソル位
置の指摘された箇所を、ステップS55で入力された数
字キーに対応した単語で置き換える。
【0099】ステップS58は、一括置き換えキーIK
KAが入力された時の処理を示し、文書バッファTBU
F上のカーソル位置の指摘単語と同じ読みを持つ単語を
一括して置き換えるものである。この処理は次の図16
のフローチャートを参照して詳しく説明する。
【0100】ステップS57,ステップS58で受け付
ける可能なキー以外のキーが入力されるとステップS5
5分岐する。
【0101】一方、ステップS52で、その文書で他の
最後まで指摘単語が見つからなければステップS59に
進み、文書バッファTBUFに格納されている文書を、
DISK5に保存する。次にステップS60に進み、ス
テップS15で作成された指摘単語リストSWRD内
で、文書バッファTBUFに格納されている文書中の単
語を指摘している指摘単語情報902の後に続く指摘単
語情報902が示す単語を指摘する。そのために、後に
続く指摘単語情報902が指し示す文書をDISK5か
ら文書バッファTBUFへ呼出し、指摘単語リストSW
RDに格納されている文書バッファTBUFに呼び出し
た文書の単語を直接指摘する。この処理は、図11にお
いて説明したステップS17の処理と同じなので、詳細
な説明は省略する。ステップS61では、ステップS6
0において、新しい文書を呼び出して単語を指摘できれ
ばステップS51に戻り、指摘単語リストSWRDに格
納されている指摘単語情報902が示す単語を全て指摘
し終えて単語を指摘できなければリターンする。
【0102】以上の説明におけるステップS58の一括
置き換え処理の詳細を、図16のフローチャートを参照
して以下に説明する。
【0103】ステップS71は、指摘されている単語の
置き換え候補を得る処理である。ステップS71では、
キーボード4よりキーが押下され、割り込みが発生する
のを待つ。キーが入力されると、入力されたキーが数字
キーで、“0”からウインドウ(図2参照)に表示され
ている候補番号の最大値までの数字キーであるか否かを
判定する。その範囲の数字キー(図2のウインドウ22
0の場合は“0”或いは“1”キー)でなければ、さら
に次のキーが入力されるのを待つ。その範囲の数字キー
であれば、文書バッファTBUF上のカーソル位置の単
語を、その数字に対応した表記で置き換えることとし、
ステップS72へ進む。
【0104】ステップS72は、指摘単語リストSWR
Dからカーソル位置の単語よりも後ろにある単語を指摘
する指摘単語情報902を順次1つずつ取り出す。次に
ステップS73に進み、ステップS72の取り出し結果
に従って分岐する。即ち、ステップS72で指摘単語情
報902を取り出すことができればステップS74に進
み、そうでなければリターンする。ステップS74で
は、ステップS72で取り出した指摘単語情報902が
示す単語の読みが、カーソル位置の単語の読みと同じで
あるかどうか判定する。ここでは、指摘単語情報902
の同読み単語群へのポインタ906と、カーソル位置の
単語を指し示す指摘単語情報の同読み単語群へのポイン
タとが同じ値であれば、読みが同じであると判定する。
同じ読みであると判定されればステップS75へ進み、
同じ読みと判定されなければステップS72へ戻る。
【0105】ステップS75では、ステップS72で取
り出した指摘単語情報902が示す単語が、文書バッフ
ァTBUF上の単語であるかどうかを判定する。即ち、
その指摘単語情報902の位置情報808の文書番号8
11と、カーソル位置の単語を指し示す指摘単語情報の
位置情報の文書番号とが同じ値であれば、文書バッファ
TBUF上の単語であると判定する。文書バッファTB
UF上の単語であれはと判定されればステップS76へ
進み、文書バッファTBUF上の単語でないと判定され
ればステップS77へ進む。ステップS76では、その
指摘単語情報902が示す文書バッファTBUF上の単
語を、ステップS71で指定された置き換え候補単語に
置き換え、ステップS72で読出したその指摘単語情報
902を指摘単語リストSWRDから削除する。処理が
終わればステップS72へ戻る。一方、ステップS77
では、ステップS72で読出した指摘単語情報902が
示す文書バッファTBUF上に格納されていない文書上
の単語を置き換える。
【0106】以上の説明におけるステップS76の指摘
無効・置換処理の詳細を、図17のフローチャートを参
照して以下に説明する。
【0107】ステップS81では、指摘単語情報902
が指示する単語の表記が、置き換え先の単語の表記と同
じかどうか判定する。表記が同じであればステップS8
3へ進み、表記が異なればステップS82へ進む。ステ
ップS82では、指摘単語情報902が指示する単語を
置き換え先の単語で置き換えてステップS83に進む。
ステップS83では、対象となっている指摘単語情報を
指摘単語リストWRDから取り除く。
【0108】以上の説明におけるステップS77の他文
書置き換え処理の詳細を、図18のフローチャートを参
照して以下に説明する。
【0109】まずステップS91で、指摘単語情報90
2の位置情報903によって示される文書をワーク文書
バッファTBU2に呼び出す。そして位置情報808の
文書番号811によって文書名リストTLSTから文書
名を得て、DISK5からその文書名を持つ文書をワー
ク文書バッファTBU2に読み込む。次にステップS9
2に進み、指摘単語情報902によって示されるワーク
文書バッファTBU2上の単語を置き換え候補で置き換
え、対象となっている指摘単語情報902を指摘単語リ
ストSWRDから削除する。
【0110】次にステップS93に進み、対象となって
いる指摘単語情報902の次の指摘単語情報を指摘単語
リストSWRDから取り出す。ステップS94では、ス
テップS93の結果に従って分岐する。即ち、ステップ
S93で指摘単語情報902を取り出すことができると
ステップS95に進み、できない時はステップS98に
進む。ステップS95では、ステップS93で取り出し
た指摘単語情報902が示す単語の読みが、文書バッフ
ァTBUF上のカーソル位置の単語の読みと同じである
かどうか判定する。即ち、ステップS93で取ってきた
指摘単語情報902の同読み単語群へのポインタ906
と、カーソル位置の単語を指し示す指摘単語情報の同読
み単語群へのポインタとが同じ値であれば、読みが同じ
であると判定する。同じ読みと判定されればステップS
96へ進み、同じ読みと判定されなければステップS9
3へ進む。
【0111】ステップS96では、ステップS93で取
ってきた指摘単語情報902が示す単語が、ワーク文書
バッファTBU2上の単語であるかどうかを判定する。
即ち、ステップS93で取ってきた指摘単語情報902
の位置情報808の文書番号811によって示される文
書名リストTLST上の文書名がワーク文書バッファT
BU2上の文書名と同じであれば、ワーク文書バッファ
TBU2上の単語であると判定する。ワーク文書バッフ
ァTBU2上の単語であると判定されればステップS9
2へ戻るが、ワーク文書バッファTBU2上の単語でな
いと判定されればステップS97へ進み、ワーク文書バ
ッファTBU2上の文書をDISK5に保存する。こう
して保存が終わるとステップS91に戻る。
【0112】一方、ステップS98では、ワーク文書バ
ッファTBU2上の文書をDISK5に保存し、保存が
終了すると元の処理にリターンする。
【0113】以上の説明において、文書中の単語を直接
指摘する方法として、一括して同音異表記語に網かけを
施して表示し、後でまとめてこれらの単語の確認・置き
換えができる方法をとっているが、1つの同音異表記語
に対する指摘と確認・置き換えを続けて行い、同音異表
記語を1つ1つ順番に指摘しながら、確認・置き換えを
行うようにしても良い。
【0114】また、以上の実施例では、文書バッファT
BUFに格納されている文書名によって、同読み異表記
語の指摘の対象となる文書を指定しているが、文書バッ
ファTBUFに格納されている文書に対して直接同読み
異表記語の指摘を行うようにしても良い。
【0115】また、以上の実施例では、同読み異表記語
の指摘の対象となる文書を、文書名を文書バッファTB
UFに格納することによって指示していたが、DISK
5に格納されている文書名の一覧を表示して、その中か
ら選んで指定するようにしても良い。
【0116】また、以上の実施例では、文書バッファT
BUFに格納されている文書中に指摘された同読み異表
記語の情報を埋込んでいるが、指摘単語リストSWRD
の位置情報903によって文書上の指摘された箇所と同
読み異表記語の情報を容易に結び付けることが可能なの
で、指摘された単語の情報を必ずしも文書中に埋込む必
要はない。即ち、文書バッファTBUFの構成は、図4
(A)に示す構成で十分であり、必ずしも図4(B),
(C)の構成を備える必要はない。
【0117】また、以上の実施例では、同読み異表記語
の対象となるのは自立語のみであるが、助詞や助動詞な
どの付属語を同読み異表記語の対象に加えても良い。
【0118】また、以上の実施例では、単語辞書DIC
のデータ構成は、索引情報部601と単語情報部602
とに分れているとして説明したが、必ずしも分ける必要
がなく、例えば索引情報603の直後に単語情報604
を格納するようにしても良い。
【0119】また、以上の実施例では、「表記のゆれ」
と「同音異義語」を判定する方法として単語IDを使用
しているが、他の方法によって判定することも可能であ
る。例えば、「表記のゆれ」の単語動詞をポインタで指
示したり、「表記のゆれ」の単語のリストを別に持った
り、他にもいろいろな方法によって表記のゆれと同音異
義語の判定を行うことができる。
【0120】また、以上の実施例では、同読み異表記単
語の情報を確認する際に、置き換えを行って次の同読み
異表記語の情報を確認するために、数字キーと一括キー
KAKUを続けて入力する必要があるが、置き換えのた
めの数字キーを入力しただけで置き換えを行い、それに
続けて次の同読み異表記語の情報を表示するようにして
も良い。
【0121】尚、本発明は複数の機器から構成されるシ
ステムに適用しても、1つの機器からなる装置に適用し
ても良い。また、本発明はシステム或は装置に、本発明
を実施するプログラムを供給することによって達成され
る場合にも適用できることは言うまでもない。
【0122】以上の説明したように本実施例によれば、
文書中に使用されている単語の中で、読みが同じで表記
の異なる単語を全て指摘することによって、文書中に出
現する表記の統一が取れていない単語を全て検出でき、
また同音異義語の誤りも検出できる。更に、それら検出
した表記の統一が取れていない単語を、置き換え候補文
字で置き換えることができ、同音異義語も訂正すること
ができる。
【0123】また、文書上で直接単語を指摘することが
できるので、利用者にとって不自然さがなく、使いやす
い操作環境を提供できる。また、膨大なデータ量を必要
としないので、少ないメモリ容量で、同音異義語の誤り
や表記の統一が取れていない単語を検出して置き換える
ことができる。
【0124】又、上述した単語或いは文字列の抽出は、
複数の文書に対して行うことができるので、1つの文書
中で抽出できない場合でも、全ての文書の内容を調べて
抽出することができる。
【0125】
【発明の効果】以上説明したように本発明によれば、文
書情報中で同じ読みを有し、表記が異なる単語を指摘す
ることにより、文書中に出現する表記の統一が取れてい
ない単語を全て検出できる効果がある。
【0126】また、文書情報上で直接指摘して、それら
を所望の文字列で置き換えることができる効果がある。
【0127】又、指定された全ての文書情報における、
表記が異なる単語を指摘することにより、文書中に出現
する表記の統一が取れていない単語を全て検出できる効
果がある。
【0128】さらに、文書中に出現する表記の統一が取
れていない単語の指摘事項を容易に確認できる効果があ
る。
【図面の簡単な説明】
【図1】本発明に係る一実施例の文書処理装置の概略構
成を示すブロック図である。
【図2】本実施例の文書処理装置において、表記のゆれ
や同音異表記語を直接指摘して確認する操作を説明する
ための図である。
【図3】本実施例の同音異表記語をリスト形式で出力す
る操作を説明する図である。
【図4】本実施例の文書処理装置における文書バッファ
のデータ構成の詳細を示す図である。
【図5】本実施例の文書処理装置における文書名リスト
のデータ構成の詳細を示す図である。
【図6】本実施例の文書処理装置における単語辞書のデ
ータ構成の詳細を示す図である。
【図7】本実施例の文書処理装置における解析結果テー
ブルのデータ構成の詳細を示す図である。
【図8】本実施例の文書処理装置における使用単語リス
トのデータ構成の詳細を示す図である。
【図9】本実施例の文書処理装置における指摘単語リス
トのデータ構成の詳細を示す図である。
【図10】
【図11】
【図12】
【図13】
【図14】
【図15】
【図16】
【図17】
【図18】本実施例の文書処理装置における同音異表記
語の指摘確認処理を示すフローチャートである。
【符号の説明】
1 CPU 2 ROM 2a プログラムエリア(PA) 3 RAM 4 キーボード 5 ハードディスク(DISK) 8 CRT 9 キャラクタジェネレータ(CG) 402 指摘単語開始コード 403 指摘単語終了コード 404 指摘情報 407 表記のゆれフラグ 408 同音異義語フラグ 603 索引情報 604 単語情報 605 索引情報の表記 606 単語情報の読み 702 文節情報 802 同読み単語群 803 同読み単語群の読み 805 表記情報 806 表記情報の表記 811 文書番号 902 指摘単語情報 903 指摘単語情報の位置情報 904 指摘単語情報の文字数 905 指摘単語情報の指摘情報 906 指摘単語情報の同読み単語群へのポインタ

Claims (11)

    【特許請求の範囲】
  1. 【請求項1】 入力された文書情報を記憶し、前記文書
    情報を表示して文書情報の編集を行うことができる文書
    処理装置であって、 単語の表記と文法的な情報とを対応させて格納し、同じ
    読みを持つ単語を結び付ける情報を有する単語辞書手段
    と、 前記単語辞書手段を用いて前記文書情報を解析し、前記
    文書情報において使用されている単語の情報を求める文
    書解析手段と、 前記文書解析手段によって求められた前記文書情報で使
    用されている単語の情報を記憶する使用単語記憶手段
    と、 前記使用単語記憶手段に格納されている単語の中に読み
    が同じで表記が異なる単語が存在する場合に、その単語
    を前記文書情報上で指摘して表示する同読み異表記指摘
    手段と、 を有することを特徴とする文書処理装置。
  2. 【請求項2】 前記同読み異表記指摘手段により指摘さ
    れた単語と同じ読みを有する単語を前記使用単語記憶手
    段に格納されている単語群から選択して候補文字列を表
    示する表示手段を更に有することを特徴とする請求項1
    に記載の文書処理装置。
  3. 【請求項3】 前記同読み異表記指摘手段により指摘さ
    れた単語と同じ読みで、意味の異なる単語を前記使用単
    語記憶手段に格納されている単語群から選択して候補文
    字列を表示する表示手段を更に有することを特徴とする
    請求項1に記載の文書処理装置。
  4. 【請求項4】 前記表示手段に表示された前記候補文字
    列の内、所望の文字列を選択する選択手段と、前記選択
    手段により選択された候補文字列で前記指摘された単語
    を置き換える置換手段を更に有することを特徴とする請
    求項2又は3に記載の文書処理装置。
  5. 【請求項5】 前記置換手段は、前記文書情報の全ての
    単語を選択された前記候補文字列で一括して置き換える
    ことを特徴とする請求項4に記載の文書処理装置。
  6. 【請求項6】 前記同読み異表記指摘手段は、表示され
    ている単語の指摘事項を表示するようにしたことを特徴
    とする請求項1に記載の文書処理装置。
  7. 【請求項7】 入力された文書情報を記憶し、前記文書
    情報を表示して文書情報の編集を行うことができる文書
    処理装置であって、 記憶されている複数の文書情報の内所望の文書情報を指
    定する指定手段と、 単語の表記と文法的な情報とを対応させて格納し、同じ
    読みを持つ単語を結び付ける情報を有する単語辞書手段
    と、 前記単語辞書手段を用いて前記指定手段により指定され
    た文書情報を順次読出して解析し、前記文書情報におい
    て使用されている単語の情報を求める文書解析手段と、 前記文書解析手段によって求められた前記文書情報で使
    用されている単語の情報を記憶する使用単語記憶手段
    と、 前記使用単語記憶手段に格納されている単語の中に読み
    が同じで表記が異なる単語が存在する場合に、その単語
    を前記文書情報上で指摘して表示する同読み異表記指摘
    手段と、 を有することを特徴とする文書処理装置。
  8. 【請求項8】 前記同読み異表記指摘手段により指摘さ
    れた単語と同じ読みを有する単語を前記使用単語記憶手
    段に格納されている単語群から選択して候補文字列を表
    示する表示手段を更に有することを特徴とする請求項7
    に記載の文書処理装置。
  9. 【請求項9】 前記同読み異表記指摘手段により指摘さ
    れた単語と同じ読みで、意味の異なる単語を前記使用単
    語記憶手段に格納されている単語群から選択して候補文
    字列を表示する表示手段を更に有することを特徴とする
    請求項7に記載の文書処理装置。
  10. 【請求項10】 前記表示手段に表示された前記候補文
    字列の内、所望の文字列を選択する選択手段と、前記選
    択手段により選択された候補文字列で前記指摘された単
    語を置き換える置換手段を更に有することを特徴とする
    請求項8又は9に記載の文書処理装置。
  11. 【請求項11】 入力された文書情報を記憶し、前記文
    書情報を表示して文書情報の編集を行う文書処理方法に
    おいて、 記憶されている複数の文書情報の内所望の文書情報を指
    定する指定工程と、 単語の表記と文法的な情報とを対応させて格納し、同じ
    読みを持つ単語を結び付ける情報を有する単語辞書を用
    いて、前記指定工程により指定された文書情報を順次読
    出して解析し、前記文書情報において使用されている単
    語の情報を求める工程と、 前記工程で求められた文書情報で使用されている単語の
    情報を記憶する工程と、 記憶されている単語の中に読みが同じで表記が異なる単
    語が存在する場合に、その単語を前記文書情報上で指摘
    して表示する工程と、 を有することを特徴とする文書処理方法。
JP3306290A 1991-11-21 1991-11-21 文書処理方法及び装置 Withdrawn JPH05143587A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP3306290A JPH05143587A (ja) 1991-11-21 1991-11-21 文書処理方法及び装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP3306290A JPH05143587A (ja) 1991-11-21 1991-11-21 文書処理方法及び装置

Publications (1)

Publication Number Publication Date
JPH05143587A true JPH05143587A (ja) 1993-06-11

Family

ID=17955318

Family Applications (1)

Application Number Title Priority Date Filing Date
JP3306290A Withdrawn JPH05143587A (ja) 1991-11-21 1991-11-21 文書処理方法及び装置

Country Status (1)

Country Link
JP (1) JPH05143587A (ja)

Similar Documents

Publication Publication Date Title
JPH10301922A (ja) コマンド入力方法,かな漢字変換用ソフトウェアを用いて文字を入力する際のコマンド入力方法およびその方法をコンピュータに実行させるためのプログラムを記録したコンピュータ読み取り可能な記録媒体
JPH05143587A (ja) 文書処理方法及び装置
JP3847801B2 (ja) 文字処理装置及びその処理方法
JP2000057134A (ja) 文書作成装置
JPS59135533A (ja) 校正方式
JPH0922411A (ja) 文書処理方法及びその装置
JPS5985532A (ja) 文章編集範囲指定方式
JP2592793B2 (ja) 文字処理方法
JPH10222502A (ja) 文書作成装置及び入力処理方法
JPH0380363A (ja) 文書処理装置
JP2771020B2 (ja) 文字処理装置
JPH11203279A (ja) かな漢字変換装置、かな漢字変換方法、及び記憶媒体
JPH0962666A (ja) 文書処理方法及びその装置
JPH08194701A (ja) 文字処理装置
JPH03147055A (ja) 文章作成装置
JPH0981555A (ja) 文書処理装置及びその方法
JPH0512267A (ja) 自動段落付け方式
JPH08212210A (ja) 文書作成装置及び漢字混じりかな漢字変換方法、辞書作成装置及び辞書作成方法
JPH10187705A (ja) 文書処理方法及びその装置
JPH03142657A (ja) 文書処理装置
JPH04332073A (ja) 文字処理方法及びその装置
JPH08292953A (ja) 文書処理装置
JPH09231210A (ja) 文字処理装置および読み出し可能な記憶媒体
JPH0520316A (ja) 文字処理装置
JPH11328159A (ja) 中国語入力変換処理装置、中国語入力変換処理方法、中国語入力変換処理プログラムを記録した記録媒体

Legal Events

Date Code Title Description
A300 Withdrawal of application because of no request for examination

Free format text: JAPANESE INTERMEDIATE CODE: A300

Effective date: 19990204