JPH0622026B2 - 文字処理装置 - Google Patents

文字処理装置

Info

Publication number
JPH0622026B2
JPH0622026B2 JP1274636A JP27463689A JPH0622026B2 JP H0622026 B2 JPH0622026 B2 JP H0622026B2 JP 1274636 A JP1274636 A JP 1274636A JP 27463689 A JP27463689 A JP 27463689A JP H0622026 B2 JPH0622026 B2 JP H0622026B2
Authority
JP
Japan
Prior art keywords
character string
katakana
notation
dictionary
document
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP1274636A
Other languages
English (en)
Other versions
JPH03135662A (ja
Inventor
厚志 榊原
英一朗 戸島
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Inc
Original Assignee
Canon Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Inc filed Critical Canon Inc
Priority to JP1274636A priority Critical patent/JPH0622026B2/ja
Publication of JPH03135662A publication Critical patent/JPH03135662A/ja
Publication of JPH0622026B2 publication Critical patent/JPH0622026B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Machine Translation (AREA)
  • Document Processing Apparatus (AREA)

Description

【発明の詳細な説明】 [産業上の利用分野] 本発明は、文書を作成編集する文字処理装置に関し、特
に、校正すべき、あるいは、確認を促すべき箇所を検索
し、指摘する機能を有する文字処理装置に関するもので
ある。
[従来の技術] 従来、作成した文書を検索し、校正すべき箇所を指摘す
る機能を有する文字処理装置では、校正すべき文字列を
文書中に存在するか、存在しないかにかからず、辞書に
既に登録、あるいは自分で登録しており、前記辞書によ
り校正すべき箇所を指摘する機能を有する文字処理装置
が提案されている。
[発明が解決しようとしている課題] しかしながら、この従来方式の作成した文書を検索し、
校正すべき箇所を指摘する機能を有する文字処理装置に
おいては、校正すべき文字列が文書中に存在しないにも
かかわらず、辞書に既に登録してあるために、必要以上
に大量のメモリーを必要とするという欠点があった。
また、校正すべき文字列が文書中に存在しても、大量の
メモリーを持つ辞書に末登録のために、指摘されない可
能性があるという欠点があった。
[課題を解決するための手段(および作用)] 上記課題を解決するために、本発明では、文字処理装置
に、文書を記憶する文書記憶手段と、該文書記憶手段に
記憶された文書からカタカナ表記を抽出する抽出手段
と、該抽出手段により抽出されたカタカナ表記を記憶す
るカタカナ表記記憶手段と、表記揺れを起こすカタカナ
表記の条件を記憶する条件記憶手段と、該条件記憶手段
に記憶された条件に該当するカタカナ表記を、前記カタ
カナ表記記憶手段より検索する第1の検索手段と、該検
索手段の検索により条件に該当したカタカナ表記より、
該表記に対して表記揺れとなるカタカナ表記の候補を作
成する候補作成手段と、該候補作成手段により作成され
たカタカナ表記の候補と一致するカタカナ表記を前記カ
タカナ表記記憶手段より検索する第2の検索手段と、該
第2の検索手段により、作成されたカタカナ表記の候補
と一致するカタカナ表記が検索された場合に、前記文書
記憶手段に記憶された文書中で、当該候補を作成する元
となったカタカナ表記と他の部分とを識別可能に表示さ
せる表示制御手段とを具えることにより、大容量の辞書
を要することなく、文書中に存在するカタカナ表記の揺
れを着実に検出して報知できるようにしたものである。
[実施例] 以下図面を参照しながら本発明を詳細に説明する。
第1図は本発明の全体構成を示すブロック図である。
図示の構成において、CPUは、マイクロプロセッサで
あり、文字処理のための演算、論理判断等を行ない、ア
ドレスバスAB、コントロールバスCB、データバスD
Bを介して、それらのバスに接続され各構成要素を制御
する。
アドレスバスABはマイクロプロセッサCPUの制御の
対象とする構成要素を指示するアドレス信号を転送す
る。コントロールバスCBはマイクロプロセッサCPU
の制御の対象とする各構成要素のコントロール信号を転
送して印加する。データバスDBは各構成機器相互間の
データの転送を行なう。
つぎにROMは、読出し専用の固定メモリであり、第1
3図〜第20図につき後述するマイクロプロセッサCP
Uによる制御の手順、及び、カタカナ表記揺れをしてい
る文字列をカタカナ文字列テーブルKSKATATBよ
り抽出するための文字列規則を格納しているカタカナ表
記揺れ抽出規則辞書KTRULDICの固定データ、及
び、表記揺れをしている文字列をカタカナ文字列テーブ
ルKSKATATBより抽出するための規則に該当しな
い文字列を格納しているカタカナ表記揺れ抽出文字列辞
書KTSTRDICの固定データ、及び、前記カタカナ
表記揺れ抽出規則辞書KTRULDIC固定データを適
用しても表記揺れしていない例外の文字列を格納してい
るカタカナ表記揺れ抽出規則不適用辞書KTNRLDI
Cの固定データ記憶させておく。
カタカナ表記揺れ抽出規則辞書KTRULDICは、第
7図につき後述するように、抽出規則見出し情報、抽出
規則置き換え情報を記憶した辞書である。
カタカナ表記揺れ抽出文字列辞書KTSTRDICは、
第8図につき後述するように、抽出文字列見出し情報、
抽出文字列置き換え情報を記憶した辞書である。
カタカナ表記揺れ抽出規則不適用辞書KTNRLDIC
は、第9図につき後述するように、抽出文字列見出し情
報、抽出文字列置き換え情報を記憶した辞書である。
また、RAMは、1ワード16ビットの構成の書込み可
能のランダムアクセスメモリであって、各構成要素から
の各種データの一時記憶に用いる。
TEXTはテキストバッファであり、第12図に後述す
るように、本文字処理装置で取り扱う文書を内部形式で
記憶する。
KBBUFは入力された読み列を蓄えるためのキーボー
ドバッファである。
KSSBUFは、第11図に後述するように、カタカナ
表記揺れ指摘用辞書KSSDICを用いて、テキストバ
ッファTEXTで指摘した情報を蓄えるための校正指摘
用バッファーであり、指摘文書位置情報、指摘文字数情
報、置き換え候補数情報、置き換え候補情報を記憶して
いる。
KSSDICは、第10図に後述するように、テキスト
バッファTEXT上、及び、一時呼出用テキストバッフ
ァTEXT1上から抽出され、カタカナ表記揺れ抽出規
則辞書KTRULDIC、カタカナ表記揺れ抽出文字列
辞書KTSTRDIC、及びカタカナ表記揺れ抽出規則
不適用辞書KTNRLDICを用いて、作成されたカタ
カナ文字列テーブルKSKATATBより、作成され
た、校正すべき文字列を格納しているカタカナ表記揺れ
指摘用辞書であり、指摘パターン情報、指摘パターンの
置き換え候補情報格納番地情報、指摘パターンの置き換
え候補情報を記憶している。
KSKATATBは、第5図に後述するように、テキス
トバッファTEXT上、及び、一時呼出用テキストバッ
ファTEXT1上から抽出されたカタカナ文字列情報を
格納したカタカナ文字列テーブルであり、カタカナ文字
列テーブルの有効長情報、カタカナ文字列情報、表記揺
れ候補情報格納番地情報(初期状態はOFFFFHを格
納している)を記憶する。またカタカナ表記揺れ抽出規
則辞書KTRULDIC、カタカナ表記揺れ抽出文字列
辞書KTSTRDIC、及び、カタカナ表記揺れ抽出規
則不適用辞書KTNRLDICを用いて、表記揺れどう
しがあれば、表記揺れ候補情報格納番地情報を格納す
る。
KSKATWRKは、第6図に後述するように、テキス
トバッファTEXT上、及び、一時呼出用テキストバッ
ファTEXT1上から抽出されたカタカナ文字列情報
を、カタカナ文字列テーブルKSKATATBに格納す
る際に、カタカナ文字列テーブルKSKATATBに同
一の文字列が登録されているかチェックを行なうため
の、カタカナ文字列テーブル登録用ワークである。な
お、カタカナ文字列テーブルKSKATATBに同一の
文字列が存在すれば、カタカナ文字列テーブルKSKA
TATBに、本カタカナ文字列テーブル登録用ワークK
SKATWRKのデータは登録しない。
TEXT1は、外部記憶装置DISKから文書をRAM
上に呼び出すための一時呼び出し用テキストバッファで
あり、第12図に後述するように、本文字処理装置で取
り扱う文書を内部形式で記憶する。
KBはキーボードであって、アルファベットキー、ひら
かなキー、カタカナキー等の文字記号入力キー、及び、
数字キー、校正指摘開始キー、表記揺れデータ複数文書
指定キー、表記揺れデータ単一文書指定キー、カーソル
移動キー、選択終了キー、選択キー、選択取消キー、選
択サーチキー等の本文字処理装置に対する各種機能を指
示するための各種のファンクションキーを備えている。
DISKは文書データを記憶するための外部記憶装置で
あり、テキストバッファTEXT上に作成された文書の
保管を行ない、保管された文書はキーボードの指示によ
り、必要な時呼び出される。
CRはカーソルレジスタである。CPUにより、カーソ
ルレジスタの内容を読み書きできる。後述するCRTコ
ントローラCRTCは、ここに蓄えられたアドレスに対
応する表示装置CRT上の位置にカーソルを表示する。
DBUFは表示用バッファメモリで、表示すべきデータ
のパターンを蓄える。文書データの内容の表示を行なう
ときは、テキストバッファTEXT上のデータに基いて
DBUF上にパターンを展開することにより行なわれ
る。
CRTCはカーソルレジスタCR及びバッファDBUF
に蓄えられた内容を表示器CRTに表示する役割を担
う。
またCRTは陰極線管等を用いた表示装置であり、その
表示装置CRTにおけるドット構成の表示パターンおよ
びカーソルの表示をCRTコントローラで制御する。
さらに、CGはキャラクタジェネレータであって、表示
装置CRTに表示する文字、記号のパターンを記憶する
ものである。
かかる各構成要素からなる本発明文字処理装置において
は、キーボードKBからの各種の入力に応じて作動する
ものであって、キーボードKBからの入力が供給される
と、まず、インタラプト信号がマイクロプロセツサCP
Uに送られ、そのマイクロプロセッサCPUがROM内
に記憶してある各種の制御信号を読出し、それらの制御
信に従って各種の制御が行なわれる。
第2図は、本発明装置の表示装置CRT上に形成される
画面構成をした図である。
図中、DSPは表示画面を意味する。
TSはテキスト画面であり、テキストバッファTEXT
に記憶されている文書の内容が表示される。
KSはソフトキーを表示するエリアであり、操作状況に
よって必要なキー、例えば校正指摘開始キー、表記揺れ
データ複数文書指定キー、表記揺れデータ単一文書指定
キー、カーソル移動キー、選択終了キー、選択キー、選
択取消キー、選択サーチキー等を表示させ、キーボード
KBの対応する位置のキーにより入力させるために用い
られる。
WDSPは、ウインドウ表示画面であり、表記揺れをし
たカタカナ文字列を抽出するために、外部記憶装置DI
SKにある文書を1つ以上指定するための選択表示、あ
るいは、指摘時の置き換え候補が選択されるエリアであ
る。
第3図は、表記揺れをしたカタカナ文字列を抽出するた
めに、外部記憶装置DISKにある文書を1つ以上指定
する画面の推移を説明した図である。
テキストバッファTEXT上の文書が表示された状態
で、校正指摘開始キーが入力され,表記揺れデータ複数
文書指定キーが入力されると、(a)に示すように、外
部記憶装置DISKにある文書の文書名が、ウインドウ
表示画面WDSPに、表示される。ここで、操作者は、
カーソルで示された文書名に対し、反転していない状態
なら、「選択」をキー入力することにより、文書をカタ
カナ表記揺れ文字列の抽出対象文書に変更することがで
き、反転している状態なら、「選択取消」をキー入力す
ることにより、文書をカタカナ表記揺れ文字列の抽出対
象外文書に変更することができる。
また、「選択終了」をキー入力することにより、操作者
が選択したカタカナ表記揺れ文字列の抽出対象文書によ
り、校正指摘処理を行なうことができる。
ここで、操作者は、カーソル移動キーにより、カーソル
位置を保存文書2に移動させ(第3図(b)),「選
択」をキー入力することにより、保存文書2をカタカナ
表記揺れ文字列の抽出対象文書にする(第3図
(c))。
そして,操作者は、「選択終了」をキー入力することに
より、操作者が選択した保存文書2、及び、テキストバ
ッファTEXTに記憶されている文書により、校正指摘
処理を行なうことができる(指摘するのは、テキストバ
ッファTEXTのみである)。
第4図は、テキストバッファTEXT上に存在する文書
内容を説明した図(第4図(a))、操作者が選択した
保存文書2上に存在する文書内容を説明した図(第4図
(b))と、テキストバッファTEXT上に存在する文
書に対して、校正の対象となる箇所を指摘する校正指摘
機能による、画面の推移を説明した図である(第4図
(c))〜(g))。
第3図(c)において、保存文書2をカタカナ表記揺れ
文字列の抽出対象文書に指定後、第4図(c)に示すよ
うに、校正の対象となる箇所が自動的に抽出され,校正
の対象となる箇所が、低輝度の反転表示で表示される。
ここで、操作者は、選択サーチキーを入力すると、校正
指摘用バッファーKSSBUFに従って、置き換え候補
を表示する画面になる。
この時、テキストバッファTEXT上で校正すべき箇所
のうち、先頭のものが、表示上で高輝度の反転された状
態になる。
第4図(d)では、「アイデア」が反転表示され、その
置き換え候補が、「アイデア」と「アイディア」である
ことが示される。
ここで、「アイディア」は、外部記憶装置DISKの保
存文書2に存在した文字列であり、「アイデア」は、カ
タカナ表記揺れ抽出文字列辞書KTSTRDICにより
指摘された文字列である。
ここで、操作者は、カーソル移動キーにより、カーソル
位置を「アイディア」の文字列に移動させ(第4図
(e)),「選択」をキー入力することにより、テキス
トバッファTEXT上を「アイディア」の文字列に置き
換え、選択サーチキーを入力すると、校正指摘用バッフ
ァーKSSBUFに従って、次にテキストバッファTE
XT上で校正すべき箇所を、表示上で高輝度の反転され
た状態になり、置き換え候補を表示する画面になる(第
4図(f))。
第4図(f)では、「フェリ」が反転表示され、その置
き換え候補が、「フェリ」と「フェリー」であることが
示される。
ここで、「フェリー」は、外部記憶装置DISKの保存
文書2に存在した文字列であり、「フェリ」は、カタカ
ナ表記揺れ抽出規則辞書KTRULDICの抽出規則見
出し情報「イ段文字+長音」、抽出規則置き換え情報
「イ段文字」により指摘された文字列である。
ここで、操作者は、「選択」をキー入力することによ
り、テキストバッファTEXT上を「フェリ」の文字列
のままにする(第4図(g))。
校正の対象となる箇所がない状態(第4図(g))にお
いては、「選択サーチキー」はソフトキーに表示されな
い(無効である)。
テキストバッファTEXT上、及び、保存文書2上に
は、「ジョッキ」と「ジョッキー」のカタカナ文字列が
存在するが、カタカナ表記揺れ抽出規則辞書KTRUL
DICの抽出規則見出し情報「イ段文字+長音」、抽出
規則置き換え情報「イ段文字」により、表記揺れ文字列
として抽出された後に、カタカナ表記揺れ抽出規則不適
用辞書KTNRLDICにより、カタカナ表記揺れの対
象外となる。
第5図はカタカナ文字列テーブルKSKATATBの構
成を説明した図である。
カタカナ文字列テーブルは、カタカナ文字列テーブルの
有効長と、テキストバッファTEXT上、及び、外部記
憶装置DISKの文書上より抽出されたカタカナ文字列
個数分の文字数情報、カタカナ文字列情報(1文字が2
バイトのJISX0208コードで格納される)、表記
揺れ候補情報格納番地情報(初期状態はOFFFFHを
格納している、カタカナ文字列テーブル上の相対番地)
を格納される。
また、表記揺れ候補情報格納番地情報について、初期状
態はOFFFFHを格納しているが、カタカナ表記揺れ
抽出規則辞書KTRULDIC、カタカナ表記揺れ抽出
文字列辞書KTSTRDIC、及び、カタカナ表記揺れ
抽出規則不適用辞書KTNRLDICを用いて、表記揺
れどうしがあれば、表記揺れ候補情報格納番地情報を格
納する。
第6図は、カタカナ文字列テーブル登録用ワークKSK
ATWRKの構成を説明した図である。
カタカナ文字列テーブル登録用ワークは、テキストバッ
ファTEXT上、及び、一時呼出用テキストバッファT
EXT1上から抽出されたカタカナ文字列情報を、カタ
カナ文字列テーブルKSKATATBに格納する際に、
カタカナ文字列テーブルKSKATATBに同一の文字
列が登録されているかチェックを行なうために存在して
おり、カタカナ文字列テーブル登録用ワークの有効長
と、必要分の文字数情報、カタカナ文字列情報(1文字
が2バイトのJISX0208コードで格納される)を
格納される。
第7図は、カタカナ表記揺れ抽出規則辞書KTRULD
ICの構成を説明した図である。
カタカナ表記揺れ抽出規則辞書は、抽出規則見出し情
報、抽出規則置き換え情報から構成され、カタカナ表記
揺れをしている文字列をカタカナ文字列テーブルKSK
ATATBより抽出するための文字列規則を格納してい
る辞書である。
例えば、「ア段文字+長音」という抽出規則見出し情報
に対し、その抽出規則置き換え情報が「ア段文字」のよ
うに、文字列が短くなる方向に、規則が格納されてい
る。
第8図は、カタカナ表記揺れ抽出文字列辞書KTSTR
DICの構成を説明した図である。
カタカナ表記揺れ抽出文字列辞書は、抽出文字列見出し
情報(1文字が2バイトのJISX0208コードで格
納され、JISX0208コードの若い順番に格納され
ている)、抽出文字列置き換え情報(1文字が2バイト
のJISX0208コードで格納される)から構成さ
れ、カタカナ表記揺れをしている文字列をカタカナ文字
列テーブルKSKATATBより抽出するための規則に
該当しない文字列を格納している辞書である。
例えば、「アーティスト」という抽出文字列見出し情報
に対し、その抽出文字列置き換え情報が「アーチスト」
のように、文字列が短くなる方向に、文字列が格納され
ている。
第9図は、カタカナ表記揺れ抽出規則不適用辞書KTN
RLDICの構成を説明した図である。
カタカナ表記揺れ抽出規則不適用辞書は、抽出文字列見
出し情報(1文字が2バイトのJISX0208コード
で格納され、JISX0208コードの若い順番に格納
されている)、抽出文字列置き換え情報(1文字が2バ
イトのJISX0208コードで格納される)から構成
され、前記カタカナ表記揺れ抽出規則辞書KTRULD
ICの固定データを適用しても表記揺れしていない例外
の文字列を格納している辞書である。
例えば、「アピア」という抽出文字列見出し情報に対
し、その抽出文字列置き換え情報が「アッピア」のよう
に、文字列が格納されている。
第10図は、カタカナ表記揺れ指摘用辞書KSSDIC
の構成を説明した図である。
カタカナ表記揺れ指摘用辞書は、カタカナ文字列テーブ
ルKSKATATBより、作成された、校正すべき文字
列をしており、テキストバッファTEXT上、及び、外
部記憶装置DISKの文書上より抽出された指摘個数分
の指摘パターンの文字数、指摘パターンの文字列情報
(1文字が2バイトのJISX0208コードで格納さ
れる)、指摘パターンの置き換え候補情報格納番地情
報、指摘パターンの置き換え候補数と、各指摘パターン
の置き換え候補数に対応した数の置き換え候補の文字数
情報、置き換え候補の文字列情報(1文字が2バイトの
JISX0208コードで格納される)が格納される。
なお、指摘パターンの文字列情報は、JISX0208
コードの若い順番に格納されている。
第11図は、校正指摘用バッファーKSSBUFの構成
を説明した図である。
校正指摘用バッファーは、カタカナ表記揺れ指摘用辞書
KSSDICを用いて、テキストバッファTEXT上で
指摘した情報を格納しており、テキストバッファTEX
T上で指摘する個数分の指摘文書位置情報、指摘文字数
情報、置き換え候補数情報と、置き換え候補数に対応し
た数の置き換え候補の文字列長情報、置き換え候補の文
字列情報(1文字が2バイトのJISX0208コード
で格納される)が格納される。
なお、本校正指摘用バッファーKSSBUFの指摘文書
位置情報、指摘文字数情報、置き換え候補数情報と、置
き換え候補数に対応した数の置き換え候補の文字列長情
報、置き換え候補の文字列情報は、テキストバッファT
EXTの先頭から指摘された順番に格納される。
第12図は、テキストバッファTEXT、及び、一時呼
出用テキストバッファTEXT1の構成を示した図であ
る。
テキストは複数個の固定長からなる行データより構成さ
れる。各行データは同じく複数個の文字データより構成
される。各文字データは1文字2バイトで構成され、例
えば、JISX0208コードで格納される。
また、各文字の位置は行を示すY座標とその行内の文字
位置を示すY座標により指定される。例えば、テキスト
先頭より3行目で左から4文字目の文字はX座標=4、
Y座標=3で指定される。同様に、カーソルが現在どの
位置にあるかも、このX座標、Y座標で管理される。
次に、上述の実施例の動作を、第13図〜第20図に示
すフローチャートに従って説明する。
第13図は、カタカナ表記揺れデータを検索する範囲を
指定する処理、カタカナ表記揺れ指摘用辞書を作成する
処理、及び、校正すべき箇所の指摘を行なう処理の全体
フローチャートである。
先ず、ステップ13−1では、キーボードKBからの入
力を待ち、入力を受けるとデータをキーボードバッファ
KBBUFに取り込む処理を行なう。ここで、キーボー
ドバッファKBBUF先頭が校正指摘開始キーであれ
ば、ステップ13−2に分岐し、校正指摘開始キー以外
ならば、ステップ13−3に分岐する。
ステップ13−3では、入力キーに従い、校正指摘以外
の一般のワードプロセッサにおいて見られるその他の処
理を行なう。
ステップ13−2では、キーボードKBからの入力を待
ち、入力を受けるとデータをキーボードバッファKBB
UFに取り込む処理を行なう。ここで、キーボードバッ
ファKBBUF先頭が表記揺れデータ複数文書指定キー
であれば、ステップ13−5に分岐し、表記揺れデータ
単一文書指定キーであれば、ステップ13−7に分岐
し、表記揺れデータ複数文書指定キー、表記揺れデータ
単一文書指定キー以外ならば、ステップ13−4に分岐
する。
ステップ13−4では、何も処理を行なわない。
ステップ13−5では、第14図に詳述するように、外
部記憶装置DISKにある文書の文書名を、ウインドウ
表示画面WDSPに表示し、表記揺れデータを抽出する
文書を指定する処理を行ない、処理を終える。
次に、ステップ13−6では、第15図に詳述するよう
に、テキストバッファTEXT上、及び、ステップ13
−5において指定された外部記憶装置DISKにある文
書から、カタカナ文字列情報を抽出し、カタカナ文字列
テーブルKSKATATBに格納する処理を行ない、処
理を終える。但し、本ステップ13−6において、カタ
カナ文字列テーブルの表記揺れ候補情報格納番地情報
は、初期状態のOFFFFHを格納する。
ステップ13−7では、第16図に詳述するように、テ
キストバッファTEXT上から、カタカナ文字列情報を
抽出し、カタカナ文字列テーブルKSKATATBに格
納する処理を行ない、処理を終える。但し、本ステップ
13−7において、カタカナ文字列テーブルの表記揺れ
候補情報格納番地情報は、初期状態のOFFFFHを格
納する。
次に、ステップ13−8では、第17図に詳述するよう
に、カタカナ文字列テーブルKSKATATBに格納さ
れたカタカナ文字列情報に対し、カタカナ表記揺れ抽出
規則辞書KTRULDIC、カタカナ表記揺れ抽出文字
列辞書KTSTRDIC、及び、カタカナ表記揺れ抽出
規則不適用辞書KTNRLDICを用いて、表記揺れど
うしがあれば、表記揺れ候補情報格納番地情報を格納す
る。
次に、ステップ13−9では、第18図に詳述するよう
に、ステップ13−8において作成された、表記揺れ候
補情報格納番地情報を格納したカタカナ文字列テーブル
KSKATATBより、校正すべき文字列の情報を辞書
形式にして(置き換え候補情報も含む)、カタカナ表記
揺れ抽出指摘用辞書KSSDICを作成する処理を行な
い、処理を終える。
次に、ステップ13−10では、第19図に詳述するよ
うに、ステップ13−9におて作成されたカタカナ表記
揺れ指摘用辞書KSSDICを用いて、テキストバッフ
ァTEXT上で指摘すべき箇所を検索し、指摘すべき箇
所の情報(置き換え候補情報も含む)を作成し、校正指
摘用バッファーKSSBUFに格納する処理を行ない、
処理を終える。
次に、ステップ13−11では、第20図に詳述するよ
うに、ステップ13−10において作成され、校正指摘
用バッファーKSSBUFに格納された指摘データによ
り、校正すべき指摘箇所の置き換え候補情報を表示し
て、置き換え処理を行ない、処理を終える。
第14図は、ステップ13−5の表記揺れデータ複数文
書指定処理を詳細化したフローチャートである。
先ず、ステップ14−1において、外部記憶装置DIS
Kにある文書の文書名を、ウインドウ表示画面WDSP
に表示する処理を行なう。
次に、ステップ14−2では、キーボードKBからの入
力を待ち、入力を受けるとデータをキーボードバッファ
KBBUFに取り込む処理を行なう。ここで、キーボー
ドバッファKBBUF先頭が選択終了キーであれば、ス
テップ14−3に分岐し、選択キーであれば、ステップ
14−4に分岐し、選択取消キーであれば、ステップ1
4−5に分岐し、カーソル移動キーであれば、ステップ
14−6に分岐し、上記キー以外ならば、ステップ14
−7に分岐する。
ステップ14−7では、何も処理を行なわない。
ステップ14−3では、ウインドウ表示画面WDSPの
外部記憶装置DISKにある文書指定表示を消去し、指
定状態を記憶して処理を終える。
ステップ14−4では、カーソルで示された文書名に対
し、反転していない状態なら(選択されていない)、カ
ーソルで示された文書をカタカナ表記揺れ文字列の抽出
対象文書に変更する処理を行ない(選択される)、反転
している状態なら(選択されている)、何も処理を行な
わない。
ステップ14−5では、カーソルで示された文書名に対
し、反転している状態なら(選択されている)、カーソ
ルで示された文書をカタカナ表記揺れ文字列の抽出対象
文書に変更する処理を行ない(選択されない)、反転し
ていない状態なら(選択されていない)、何も処理を行
なわない。
ステップ14−6では、ウインドウ表示画面WDSPの
文書指定表示のカーソルの位置を指定された移動方向
へ、変更する処理を行なう。
第15図は、ステップ13−6の複数文書文字列検索処
理を詳細化したフローチャートである。
先ず、ステップ15−1において、テキストバッファT
EXT上でカタカナ文字列を検索し、抽出する処理を行
なう。但し、カタカナ文字列が抽出されたら、本処理を
終了する。カタカナ文字列が存在しなければ、ステップ
15−5に分岐し、カタカナ文字列が存在すれば、ステ
ップ15−2に分岐する。
次に、ステップ15−2では、ステップ15−1におい
て抽出されたカタカナ文字列を、カタカナ文字列テーブ
ル登録用ワークKSKATWRKへ、格納する。
次に、ステップ15−3では、カタカナ文字列テーブル
登録用ワークKSKATWRKへ、格納された文字列に
対し、カタカナ文字列テーブルKSKATATBに同一
の文字列が格納されているかチェックする処理を行な
う。同一の文字列が格納されていたら、ステップ15−
1に分岐する。同一の文字列が格納されていなければ、
ステップ15−4に分岐する。
ステップ15−4では、カタカナ文字列テーブル登録用
ワークKSKATWRKへ格納された文字列を、カタカ
ナ文字列テーブルKSKATATBに、所定のテーブル
形式にして格納する処理を行なう。但し、カタカナ文字
列テーブルの表記揺れ候補情報格納番地情報は、初期状
態のOFFFFHを格納する。
ステップ15−5では、ステップ15−5の表記揺れデ
ータ複数文書指定処理において、指定された外部記憶装
置DISKの文書のうち、カタカナ文字列の抽出処理を
行なっていない1文書を、一時呼出用テキストバッファ
TEXT1へ呼び出す処理を行なう。
次に、ステップ15−6において、一時呼出用テキスト
バッファTEXT1上でカタカナ文字列を検索し、抽出
する処理を行なう。但し、カタカナ文字列が抽出された
ら、本処理を終了する。カタカナ文字列が存在しなけれ
ば、ステップ15−10に分岐し、カタカナ文字列が存
在すれば、ステップ15−7に分岐する。
次に、ステップ15−7では、ステップ15−6におい
て抽出されたカタカナ文字列を、カタカナ文字列テーブ
ル登録用ワークKSKATWRKへ、格納する。
次に、ステップ15−8では、カタカナ文字列テーブル
登録用ワークKSKATWRKへ、格納された文字列に
対し、カタカナ文字列テーブルKSKATATBに同一
の文字列が格納されているかチェックする処理を行な
う。同一の文字列が格納されていたら、ステップ15−
6に分岐する。同一の文字列が格納されていなければ、
ステップ15−9に分岐する。
ステップ15−9では、カタカナ文字列テーブル登録用
ワークKSKATWRKへ格納された文字列を、カタカ
ナ文字列テーブルKSKATATBに、所定のテーブル
形式にして格納する処理を行なう。但し、カタカナ文字
列テーブルの表記揺れ候補情報格納番地情報は、初期状
態のOFFFFHを格納する。
ステップ15−10では、ステップ13−5の表記揺れ
データ複数文書指定処理において、指定された外部記憶
装置DISKの文書のうち、カタカナ文字列の抽出処理
を行なっていない文書が存在するか判別する処理を行な
う。カタカナ文字列の抽出処理を行なっていない文書が
存在するならば、ステップ15−5に分岐する。カタカ
ナ文字列の抽出処理を行なっていない文書が存在しない
ならば、ステップ17−1に分岐する。
第16図は、ステップ13−7の文字列検索処理を詳細
化したフローチャートである。
先ず、ステップ16−1において、テキストバッファT
EXT上でカタカナ文字列を検索し、抽出する処理を行
なう。但し、カタカナ文字列が抽出されたら、本処理を
終了する。カタカナ文字列が存在しなければ、ステップ
17−1に分岐し、カタカナ文字列が存在すれば、ステ
ップ16−2に分岐する。
次に、ステップ16−2では、ステップ16−1におい
て抽出されたカタカナ文字列を、カタカナ文字列テーブ
ル登録用ワークKSKATWRKへ、格納する。
次に、ステップ16−3では、カタカナ文字列テーブル
登録用ワークKSKATWRKへ、格納された文字列に
対し、カタカナ文字列テーブルKSKATATBに同一
の文字列が格納されているかチェックする処理を行な
う。同一の文字列が格納されていたら、ステップ16−
1に分岐する。同一の文字列が格納されていなければ、
ステップ16−4に分岐する。
ステップ16−4では、カタカナ文字列テーブル登録用
ワークKSKATWRKへ格納された文字列を、カタカ
ナ文字列テーブルKSKATATBに、所定のテーブル
形式にして格納する処理を行なう。但し、カタカナ文字
列テーブルの表記揺れ候補情報格納番地情報は、初期状
態のOFFFFHを格納する。
第17図は、ステップ13−8の表記揺れ文字列抽出処
理を詳細化したフローチャートである。
先ず、ステップ17−1において、カタカナ文字列テー
ブルKSKATATBから、表記揺れ文字列の抽出する
ポイントをカタカナ文字列テーブルKSKATATBの
先頭に設定する処理を行なう。
次に、ステップ17−2では、カタカナ文字列テーブル
KSKATATBから表記揺れ文字列を抽出するポイン
トの文字列に対し、カタカナ表記揺れ抽出規則辞書KT
RULDICにより、表記揺れ文字列候補を作成可能か
判別処理を行ない、作成可能ならば、考えうるすべての
表記揺れ文字列候補を作成する処理を行なう。作成可能
ならば、ステップ17−3に分岐する。作成不可能なら
ば、ステップ17−4に分岐する。
ステップ17−3では、ステップ17−2において作成
した表記揺れ文字列候補が、カタカナ表記揺れ抽出規則
不適用辞書KTNRLDICに格納されているか検索す
る処理を行なう。検索処理の結果、存在すれば、ステッ
プ17−7に分岐する。検索処理の結果、存在しなけれ
ば、ステップ17−5に分岐する。
ステップ17−4では、カタカナ文字列テーブルKSK
ATATBから表記揺れ文字列を抽出するポイントの文
字列に対し、カタカナ表記揺れ抽出文字列辞書KTST
RDICにより、表記揺れ文字列候補を作成可能か判別
処理を行ない、作成可能ならば、表記揺れ文字列候補を
作成する処理を行なう。作成可能ならば、ステップ17
−5に分岐する。作成不可能ならば、ステップ17−7
に分岐する。
ステップ17−5では、ステップ17−2、及び、ステ
ップ17−4で作成された表記揺れ文字列候補が、カタ
カナ文字列テーブルKSKATATBに格納されている
か検索する処理を行なう。検索処理の結果、存在すれ
ば、ステップ17−6に分岐する。検索処理の結果、存
在しなければ、ステップ17−7に分岐する。
ステップ17−6では、カタカナ文字列テーブルKSK
ATATBの表記揺れ候補情報格納番地情報に、ステッ
プ17−5において検索された表記揺れ文字列候補の所
在番地(カタカナ文字列テーブルKSKATATBの相
対番地)を格納する処理を行なう。
ステップ17−7では、カタカナ文字列テーブルKSK
ATATBから、表記揺れ文字列の抽出するポイント
を、表記揺れ候補情報格納番地情報に表記揺れ候補の所
在番地が格納されていない(初期状態のOFFFFHの
ままである)次のポイントに設定する処理を行なう。も
し、次のポイントに設定処理時に、カタカナ文字列テー
ブルKSKATATBの終了位置に到達したら、ステッ
プ18−1に分岐する。次のポイントに設定処理時に、
カタカナ文字列テーブルKSKATATBの終了位置に
到達してなければ、ステップ17−2に分岐する。
第18図は、ステップ13−9のカタカナ表記揺れ指摘
用辞書作成処理を詳細化したフローチャートである。
先ず、ステップ18−1において、カタカナ文字列テー
ブルKSKATATBから、カタカナ表記揺れ指摘用辞
書KSSDICの作成するポイントを、カタカナ文字列
テーブルKSKATATBの先頭に設定する処理を行な
う。
次に、ステップ18−2では、カタカナ文字列テーブル
KSKATATBから、カタカナ表記揺れ指摘用辞書K
SSDICの作成するポイントを、表記揺れ候補情報格
納番地情報に表記揺れ候補の所在番地が格納されている
(初期状態のOFFFFHのままでない)次のポイント
に設定する処理を行なう、もし、次のポイントに設定処
理時に、カタカナ文字列テーブルKSKATATBの終
了位置に到達したら、ステップ19−1に分岐する。次
のポイントに設定処理時に、カタカナ文字列テーブルK
SKATATBの終了位置に到達してなければ、ステッ
プ18−3に分岐する。
ステップ18−3では、カタカナ表記揺れ指摘用辞書K
SSDICへ、指摘パターンの文字列情報がJISX0
208コードの若い順番になるように、ステップ18−
2で定めたポイントの指摘パターン情報、置き換え候補
情報を追加格納する処理を行なう。
第19図は、ステップ13−10の校正箇所の検索処
理、及び、校正指摘用データ作成処理を詳細化したフロ
ーチャートである。
先ず、ステップ19−1において、カタカナ表記揺れ指
摘用辞書KSSDICによる、テキストバッファTEX
T上の校正指摘箇所の検索ポイントを、テキストバッフ
ァTEXT上の先頭に設定する処理を行なう。
次に、ステップ19−2では、カタカナ表記揺れ指摘用
辞書KSSDICにより、テキストバッファTEXT上
の校正指摘箇所を検索する処理を行なう。但し、校正指
摘箇所が検出されたら、本処理を終了する。校正指摘箇
所が検出されなければ、ステップ19−5に分岐し、校
正指摘箇所が検出されれば、ステップ19−3に分岐す
る。
ステップ19−3では、校正箇所の情報(指摘文書位置
情報、指摘文字数情報、置き換え候補数情報、置き換え
候補情報)を、カタカナ表記揺れ指摘用辞書KSSDI
Cにより、校正指摘用バッファKSSBUFに、追加格
納する処理を行なう。
次に、ステップ19−4では、カタカナ表記揺れ指摘用
辞書KSSDICによる、テキストバッファTEXT上
の校正指摘箇所の検索ポイントを、校正指摘箇所が検出
されたテキストバッファTEXT上の文字列の直後に設
定する処理を行なう。
ステップ19−5では、校正指摘用バッファKSSBU
Fに格納された情報により、テキストバッファTEXT
上の校正指摘箇所すべての表示形態を、網掛け状態にす
る処理を行なう。
第20図は、ステップ13−11の校正すべき指摘箇所
の指摘処理を詳細化したフローチャートである。
先ず、ステップ20−1では、キーボードKBからの入
力を待ち、入力を受けるとデータをキーボードバッファ
KBBUFに取り込む処理を行なう。ここで、キーボー
ドバッファKBBUF先頭が選択サーチキーであれば、
ステップ20−2に分岐し、選択サーチキー以外なら
ば、ステップ20−3に分岐する。
ステップ20−3では、入力キーに従い、指摘箇所サー
チ以外の一般のワードプロセツサにおいて見られるその
他の処理を行なう。
ステップ20−2では、校正指摘用バッファKSSBU
Fに格納された情報により、テキストバッファTEXT
上の校正指摘箇所を先頭から検索する処理を行なう。も
し、校正指摘箇所が存在しなければ、ステップ20−4
に分岐する。もし、校正指摘箇所が存在すれば、ステッ
プ20−5に分岐する。
ステップ20−5では、ステップ20−2において検索
されたテキストバッファTEXT上の指摘箇所につい
て、校正指摘用バッファKSSBUFに格納された情報
により、置き換え候補文字列を、ウインドウ表示画面W
DSPに反転カーソルと共に、表示する処理を行なう。
ステップ20−6では、キーボードKBからの入力を待
ち、入力を受けるとデータをキーボードバッファKBB
UFに取り込む処理を行なう。ここで、キーボードバッ
ファKBBUF先頭が選択キーであれば、ステップ20
−7に分岐し、カーソル移動キーであれば、ステップ2
0−8に分岐し、選択キー、カーソル移動キー以外なら
ば、ステップ20−9に分岐する。
ステップ20−9では、何も処理を行わない。
ステップ20−7では、ウインドウ表示画面WDSPに
反転カーソル位置がある置き換え候補文字列へ、テキス
トバッファTEXT上の指摘箇所について、置き換え、
本指摘箇所の校正指摘用バッファKSSBUFに格納さ
れた情報を無効にする処理を行なう。
ステップ20−8では、ウインドウ表示画面WDSP上
の反転カーソル位置をカーソル移動方向にしたがって、
変更する処理を行なう。
[他の実施例] テキストバッファ、及び、外部記憶装置DISKに存在
する文書から、カタカナ文字列を抽出し、カタカナ表記
揺れ抽出規則辞書、カタカナ表記揺れ抽出文字列辞書、
及び、カタカナ表記揺れ抽出規則不適用辞書を用いて、
カタカナ表記揺れ指摘用辞書を自動的に作成し、前記カ
タカナ表記揺れ指摘用辞書により、テキストバッファ上
の表記揺れ箇所を指摘できることを説明をしてきた。
同様に、テキストバッファ、及び、外部記憶装置DIS
Kに存在する文書から、英文字列を抽出し、英文字表記
揺れ抽出規則辞書、英文字表記揺れ抽出文字列辞書、及
び、英文字表記揺れ抽出規則不適用辞書を用いて、英文
字表記揺れ指摘用辞書を自動的に作成し、前記英文字表
記揺れ指摘用辞書により、テキストバッファ上の表記揺
れ箇所を指摘することも、可能である。
このときは、第15図、第16図のフローチャートにお
いて、カタカナ文字列をテキストバッファ、及び、一時
呼出用テキストバッファから抽出する処理を英文字を抽
出する処理に変更し、カタカナ表記揺れ抽出規則辞書、
カタカナ表記揺れ抽出文字列辞書、及び、カタカナ表記
揺れ抽出規則不適用辞書を、英文字表記揺れ抽出規則辞
書、英文字表記揺れ抽出文字列辞書、及び、英文字表記
揺れ抽出規則不適用辞書に、変更することにより実現さ
れる。
また、同様に、テキストバッファ、及び、外部記憶装置
DISKに存在する文書から、平仮名文字列を抽出し、
平仮名表記揺れ抽出規則辞書、平仮名表記揺れ抽出文字
列辞書、及び、平仮名表記揺れ抽出規則不適用辞書を用
いて、平仮名表記揺れ指摘用辞書を自動的に作成し、前
記平仮名表記揺れ指摘用辞書により、テキストバッファ
上の表記揺れ箇所を指摘することも、可能である。
このときは、第15図、第16図のフローチャートにお
いて、カタカナ文字列をテキストバッファ、及び、一時
呼出用テキストバッファから抽出する処理を平仮名を抽
出する処理に変更し、カタカナ表記揺れ抽出規則辞書、
カタカナ表記揺れ抽出文字列辞書、及び、カタカナ表記
揺れ抽出規則不適用辞書を、平仮名表記揺れ抽出規則辞
書、平仮名表記揺れ抽出文字列辞書、及び、平仮名表記
揺れ抽出規則不適用辞書に、変更することにより実現さ
れる。
[発明の効果] 以上説明したように、本発明によれば、大容量の辞書を
要することなく、文書中に存在するカタカナ表記の揺れ
を着実に検出して報知できるという効果がある。
【図面の簡単な説明】
第1図は本発明の全体構成のブロック図、 第2図は本発明装置の画面構成をした図、 第3図は本発明における表記揺れを示したカタカナ文字
列を抽出するために、外部記憶にある文書を指定する方
法の例を示した図、 第4図は本発明における校正すべき指摘箇所を指摘する
方法の例を示した図、 第5図は本発明におけるカタカナ文字列テーブルの構成
を示した図、 第6図は本発明におけるカタカナ文字列テーブル登録用
ワークの構成を示した図、 第7図は本発明におけるカタカナ表記揺れ抽出規則辞書
の構成を示した図、 第8図は本発明におけるカタカナ表記揺れ抽出文字列辞
書の構成を示した図、 第9図は本発明におけるカタカナ表記揺れ抽出規則不適
用辞書の構成を示した図、 第10図は本発明におけるカタカナ表記揺れ指摘用辞書
の構成を示した図、 第11図は本発明における校正指摘用バッファの構成を
示した図、 第12図は本発明におけるテキストバッファ、及び一時
呼出用テキストバッファの構成を示した図、 第13図〜第20図は本発明における本発明文字処理装
置の動作を示すフローチャート。 DISK……外部記憶装置、 CPU……マイクロプロセッサ、 ROM……読み出し専用メモリ、 RAM……ランダムアクセスメモリ、 KBBUF……キーボードバッファ、 KSSBUF……校正指摘用バッファ、 TEXT……テキストバッファ、 TEXT1……一時呼出用テキストバッファ、 KSSDIC……校正指摘用辞書、 KTRULDIC ……カタカナ表記揺れ抽出規則辞書、 KTSTRDIC ……カタカナ表記揺れ抽出文字列辞書、 KTNRLDIC ……カタカナ表記揺れ抽出規則不適用辞書、 KSSDIC ……カタカナ表記揺れ指摘用辞書、 KSKATATB ……カタカナ表記揺れ指摘用辞書、 KSKATWRK ……カタカナ文字列テーブル登録用ワーク。

Claims (1)

    【特許請求の範囲】
  1. 【請求項1】文書を記憶する文書記憶手段と、 該文書記憶手段に記憶された文書からカタカナ表記を抽
    出する抽出手段と、 該抽出手段により抽出されたカタカナ表記を記憶するカ
    タカナ表記記憶手段と、 表記揺れを起こすカタカナ表記の条件を記憶する条件記
    憶手段と、 該条件記憶手段に記憶された条件に該当するカタカナ表
    記を、前記カタカナ表記記憶手段より検索する第1の検
    索手段と、 該検索手段の検索により条件に該当したカタカナ表記よ
    り、該表記に対して表記揺れとなるカタカナ表記の候補
    を作成する候補作成手段と、 該候補作成手段により作成されたカタカナ表記の候補と
    一致するカタカナ表記を前記カタカナ表記記憶手段より
    検索する第2の検索手段と、 該第2の検索手段により、作成されたカタカナ表記の候
    補と一致するカタカナ表記が検索された場合に、前記文
    書記憶手段に記憶された文書中で、当該候補を作成する
    元となったカタカナ表記と他の部分とを識別可能に表示
    させる表示制御手段とを具えたことを特徴とする文字処
    理装置。
JP1274636A 1989-10-20 1989-10-20 文字処理装置 Expired - Fee Related JPH0622026B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP1274636A JPH0622026B2 (ja) 1989-10-20 1989-10-20 文字処理装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP1274636A JPH0622026B2 (ja) 1989-10-20 1989-10-20 文字処理装置

Publications (2)

Publication Number Publication Date
JPH03135662A JPH03135662A (ja) 1991-06-10
JPH0622026B2 true JPH0622026B2 (ja) 1994-03-23

Family

ID=17544466

Family Applications (1)

Application Number Title Priority Date Filing Date
JP1274636A Expired - Fee Related JPH0622026B2 (ja) 1989-10-20 1989-10-20 文字処理装置

Country Status (1)

Country Link
JP (1) JPH0622026B2 (ja)

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH069048B2 (ja) * 1986-06-10 1994-02-02 日本電気株式会社 表記のゆれ統一方式
JPS63163571A (ja) * 1986-12-25 1988-07-07 Nec Corp 文章検査装置
JPS6453259A (en) * 1987-08-24 1989-03-01 Matsushita Electric Ind Co Ltd Sentence proofreading device

Also Published As

Publication number Publication date
JPH03135662A (ja) 1991-06-10

Similar Documents

Publication Publication Date Title
JPH0812663B2 (ja) 画像処理システム及びその方法
JPH06149467A (ja) 情報処理装置
JPH0117184B2 (ja)
JPH0622026B2 (ja) 文字処理装置
JPH0622027B2 (ja) 文字処理装置
JPH0622024B2 (ja) 文字処理装置
JPH0622025B2 (ja) 文字処理装置
JP3469816B2 (ja) ジェスチャー処理装置及びジェスチャー処理方法
JP2723109B2 (ja) 画像処理方法
JPH06131109A (ja) 情報処理装置
JPS5826031B2 (ja) 編集処理方式
JPS6137671B2 (ja)
JP2561000B2 (ja) 文字列出力方法
JP2786260B2 (ja) かな漢字変換装置
JPH03134766A (ja) 文書処理装置
JP2697901B2 (ja) 文字処理装置
JP2771020B2 (ja) 文字処理装置
JPH03134765A (ja) 文書処理装置
JPH0750476B2 (ja) データ処理装置
JPH03134767A (ja) 文書処理装置
JPH07271548A (ja) 文字列出力方法
JPH0922411A (ja) 文書処理方法及びその装置
JPH0512267A (ja) 自動段落付け方式
JPS6133567A (ja) 文書処理装置
JPH0520316A (ja) 文字処理装置

Legal Events

Date Code Title Description
FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080323

Year of fee payment: 14

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090323

Year of fee payment: 15

LAPS Cancellation because of no payment of annual fees