JPS62256070A - 文書処理装置 - Google Patents

文書処理装置

Info

Publication number
JPS62256070A
JPS62256070A JP61098162A JP9816286A JPS62256070A JP S62256070 A JPS62256070 A JP S62256070A JP 61098162 A JP61098162 A JP 61098162A JP 9816286 A JP9816286 A JP 9816286A JP S62256070 A JPS62256070 A JP S62256070A
Authority
JP
Japan
Prior art keywords
word
document
dictionary section
address
stored
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP61098162A
Other languages
English (en)
Inventor
Naoki Shimada
直樹 島田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Inc
Original Assignee
Canon Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Inc filed Critical Canon Inc
Priority to JP61098162A priority Critical patent/JPS62256070A/ja
Publication of JPS62256070A publication Critical patent/JPS62256070A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Document Processing Apparatus (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 [a業上の利用分野] 本発明は文書処理装置、特に入力された単語の綴りの正
誤を判定する文書処理袋−に関する。
[従来の技術] 従来の文書処理装置、特に入力した単語の綴りの正誤を
判定する文書処理装置において、入力された単語群から
なる文章を記憶する方法としては、書と込み及び読み出
し可能な記憶装置、例えばRAM或いはディスク装置に
、入力されたデータをそのまま記憶する方法が取られて
いるか、又は文書を単語単位に分解し、その単語を別な
、書き込み読み出し可能な記憶装置に記憶し、その記憶
された単語の番号(1,D、)を文章中の単語として記
憶する等の手法が用いられてきた。
前者の場合は、文章をそのまま記憶するため、同じ内容
が文書中に存在する等の重複が発生し、非常に冗長性が
太きものである。また、後者の場合には辞書部の他に単
語別に記憶しておく、特別な記録エリア等のテーブルを
設ける必要があり、メモリは膨大なものとなる。
さ、らに、文書処理装置において、単語の頻度を調べる
場合、通常は、処理装置が動作している間において作成
された文書中のすべての単語に対して検索を行っており
、操作者が複数の場合は、単語に対する使用頻度の信頼
性は個人差によってそれ程高いものでは無くなっている
また、その単語の頻度を記憶しておく専用の領域も必要
となる。
[発明が解決しようとする問題点] 本発明はかかる従来の技術に鑑みなされたものであり、
文書情報に係るメモリを効率良く処理す、る文書処理装
置を提供することにある。
[問題点を解決するための手段] この問題を解決するために本発明は、複数の単語の綴り
を記憶している少なくと・も1つの辞書部でもって、入
力した単語の綴りの正誤の判定処理する文書処理装置で
あって、入力した単語が前記辞書部に存在するか否かを
検索する検索手段と、該検索手段により入力した単語が
前記辞書部に存在することを検出したときに、入力した
単語に代って前記辞書部の検索したアドレスでもって文
書記憶領域に格納する格納手段とを備える。
[作用] かかる本発明の構成において、検索手段により入力した
単語でもって辞書部を検索し、その単語が辞書部に存在
することを検出したときに、その検索したときのアドレ
スを表す情報でもって文書記憶領域に格納手段により格
納する。
[実施例] 以下、添付図面に従って本発明に係る実施例を詳細に説
明する。
第1図は本実施例の文書処理装置のブロック構成図であ
る。
図中、1は文書情報を表示する表示装置である。2は文
字記号等を入力する入力装置であり、例えばキーボード
からなる。3は文書処理装置全体を制御するCPUであ
る。4は後述する第3図(a)〜(C)に示すフローチ
ャートのプログラムが格納されているプログラムROM
である。5は入力装置2より入力した単語(本実施例で
は英語とするが、本発明を限定するものではない)を後
述する処理で格納する文書記憶装置である。6はCPU
3のワークエリアとして使用するRAMであり、内部に
入力した1単語分を記憶する単語記憶エリア6aを設け
ている。7は主辞書部であり、各単語を記憶している。
8はユーザ辞書部であり、ユーザに固有の単語を新たに
登録することができる。尚ユーザ辞書部8と主辞書部7
とのアドレスは重複することがない様に、それぞれ第2
図(a)、(b)に示す様なアドレスが違う用になって
いる。
以上の様な構成からなる本実施例の文書処理装置におけ
る動作を第2図(a)〜(e)で説明する。
第2図(c)に示す様に入力装置2より、いま“Th1
s machine is ・−” と入力したとする
。このときの表示装置1には、後述する検索処理を経て
、その入力された単語が表示装置1に表示される。この
とき、文書記憶装置5には入力された単語に対する主辞
書部7の検索処理情報であるアドレスが、文書記憶装置
5に記憶されていく。
第2図(b)では“Th1s”に対応する主辞書部7の
先頭のアドレス“4198” (2バイト)、“mac
hine”に対応するアドレス“2756”、及び“i
s”に対応するアドレス“0123”が順次文書記憶装
置5内に格納されている状態を示している。よって、文
書記憶装置5には入力された単語を構成する各文字コー
ドで格納していくのではなく、主辞書部7或いはユーザ
辞書部8内に登録されている各単語のアドレスでもって
格納していくことになる。これによって、単語の綴りの
長さに関係なく2バイトでもって格納されていくので文
書記憶装置5のメモリ容量に対する単語の格納数は飛躍
的に拡大されることがわかる。なぜなら、“Th1s”
という単語を見た場合、従来では単語を構成する文字コ
ードでもって記憶していたため、8バイト(或いは4バ
イト)を必要としていたからである。また、更に綴りの
長い単語の場合においては言うまでもないことであろう
ところで、文書を編集していく際、或いは作成後におい
て、往々として特定の単語を指定した単語に変換したい
場合が生ずる。後えば本実施例において、“machi
ne ”を“telephone ”に置換する場合を
想定してみる。従来では文書記憶領域中に“machi
ne″の単語があるか否かは単語を構成する各文字コー
ドを頭から順次検索することによりmachine”な
る単語を捜す処理をしていたが、本実施例では“mac
hine″に相当するアドレス“2756”を捜すだけ
で済むことになるから、極めて簡単に、且つ高速に捜す
ことが可能となる。第2図(d)はその処理後の表示装
置1と文書記憶装置5を示す図であり、“machin
e”に対応1°るアドレスが“tetephone“の
アドレス“3846″に置換されているのがわかる。ま
た、例えば入力装置2より“My name is M
ary ”と入力した場合を想定してみる。この場合、
“Mary”という単語は固有名詞であるのでユーザ辞
書部8内に登録されているから(なかった場合にはユー
ザ辞書部に登録する)、この単語に相当するコードはユ
ーザ辞書部8に割当られたアドレス“FOOO“ (1
6進数)以降のコードが文書記憶装置5内に格納される
。これを示すのが第2図(e)である。
さて、以上の様な処理概要を基に、その処理動作を第3
図(a)〜(C)に示すフローチャートに従って説明す
ることにする。
第3図(a)は本実施例における文書作成に係るフロー
チャートである。
先ず、ステップS1において入力装置2より1文字分入
力し、ステップS2では入力した文字コードを順に単語
記憶エリア6aに一格納する。次にステップS3におい
て、入力された文字の区切り(例えばスペースキー)が
入力されたか否かを判断する。尚、本実施例においては
、英文区係る文書処理装置に想定して説明しているが、
例えば日本語においての単語の区切りは仮名漢字変換キ
ーの押下により判断することが可能である0区切りが入
力されなかった場合にはステップS1に戻り、同様の処
理を繰返す、つまり、区切りが入力された時点で、それ
以前に単語記憶エリア6aに格納されていった文字から
なるものを単語として認識するのである。さて、区切り
が入力された場合には次のステップS5において、単語
記憶エリア6a内に記憶された単語を主辞書部7で検索
する。検索した結果、入力された単語が主辞書部7内に
存在した場合には主辞書部7内を検索したアドレス、例
えば入力された単語が“Th1s”の場合には“419
8″を文書記憶装置5に記憶することになる(ステップ
S6)、また、ステップS5において、入力された単語
が主辞書部7内に存在しないことが判明した場合にはス
テップS7において、今度はユーザ辞書部8を検索する
。ステップS8では同様に検索した結果、存在したか否
かを判断する。このとき、存在したことが判明した場合
にはステップS6と同様に検索したアドレスでもって文
書記憶装置S内に記憶する(ステップ510)、また、
ユーザ辞書部8にも存在しないことが判明した場合には
ステップS9で入力した単語をユーザ辞書部8に記憶し
、その記憶したときのアドレスでもって文書記憶装置5
内に記憶することになる。
以上の処理手順を経てオペレータは文書を作成していく
ことになるが、文書作成が終了後に、オペレータは入力
した単語が正しい綴りでもってユーザ辞書部8に登録さ
れたか否かを判断する。
このとき、登録された単語の綴りを修正することが考え
られるが、その処理手順を第3図(b)のフローチャー
トに従って説明する。
ステップS20において、今回新たに登録された単語を
ユーザ辞書部8より読出し、表示袋e1に表示する0次
にオペレータは表示装置1に表示された単語の綴りが正
しいか否かく!21りを修正するか否か)を入力する(
ステップ521)、このままで良い場合にはステップS
22に穆り、表示装置1に表示された単語でもって、ユ
ーザー辞書部8に再登録し、ステップ320に戻り次の
単語の処理に移る。またステップ321においてオペレ
ータが修正を要すると判断した場合には、その旨のキー
を押下することによって、ステップS23に穆ることに
なる。ステップS23では表示装置1に表示された単語
に対して正しい綴りでもって入力する0次いでステップ
S24においてステップS23で入力された単語を主辞
書部7により検索する。これは先に示した文書作成時に
誤って!#語を入力した場合に備えているものである。
ステップS25において主辞書部7内に存在することが
判明した場合にはステップS26に穆り、検索したとき
のアドレスでもって、以前に文書記憶装置5内に記憶さ
れた単語を全て更新する。また、ステップS25で修正
された単語が主辞書部7内に存在しないと判明した場合
にはステップS27に移り、今度はユーザ辞書部8を検
索する。
ステップ328においてユーザ辞書部8内に存在したと
判明した場合には、ステップS30で、検索したアドレ
スでもって文書記憶装置5内の単語を更新する。また、
存在しないと判断した場合には、ユーザ辞書部8に新た
に登録(ステップ529)し、ステップS30で同様に
登録したアドレスでもって文書記憶装置5内の単語を更
新することになる。
以上の様な過程を経て文書処理がなされることになるが
、例えば完成した文書中の単語の使用頻度を求めたい場
合がある。このときの処理動作を第3図(C)のフロー
チャートに従って説明する。
ステップS50において、文書記憶装置5内に格納され
たアドレスを順に読出し、ステップS51で同じアドレ
ス数をカウントする。次にステップS52において、カ
ウント結果をRAM5内の所定の位置に記憶する。この
処理からもわかる様に任意(或い全ての)の単語の頻度
を計測するときには、車に文書記憶装置5内に格納され
た2バイトのアドレス情報をカウントするだけでよく、
単語の綴りの長さに関係なくするくとができるため、そ
の処理速度は極めて早くなる。その結果特定の単語を指
定された単語でもって置換する等という処理が高速に行
なわれることになる。
以上説明した様に本実施例によれば文書情報を記憶する
ときに、文書情報中の単語を辞書部に格納されているア
ドレスでもって文書記憶装置内に格納していくので、メ
モリを節約することが可能となり、その結果、従来の文
書記憶装置よりも長文の文書を作成することが可能とな
る。
また、文書情報中の単語を検索する場合にも、特定長の
アドレスでもって検索され、そのとき処理は高速になる
から、文書処理装置における検索処理に単独で使用する
ことも考えられる。
また、この様なシステムにおいて、主辞書部5の大きさ
が問題となるが、英文の場合、約9万語を約400にバ
イトで記憶できる例があるが、9万語で日常英文の中に
表われる単語99%を含んでいることがわかっている。
従って、ユーザー辞書部8は、小さなものでも十分機能
することになる。又、英単語の場合、平均単語長は4〜
7文字であるが、本実施例において、アドレスは最長で
も3バイトで十分であり、文書記憶装置は十分節約でき
る。
更に、通常の文書処理装置では、文書中の単語単位の出
現頻度を求めようとする場合、大きな労力と記憶エリア
、時間を必要としたが、先に示した様に本実施例ではア
ドレスを比較するだけで容易に単語の出現頻度を求める
事ができる。
更にまた、文章処理装置の多くは、綴りの検査を文章完
成後に行なうのがほとんどであるが、本発明は入力しな
がら行なうため、最終的な文章完成迄の時間は短くなる
[発明の効果] 以上説明した様に本発明によれば、文書記憶領域に単語
を格納するときに、各単語を辞書部でのアドレスを表す
情報でもって格納していくことにより、文書記憶領域の
メモリの効率化を図ることが可能となる。
【図面の簡単な説明】
第1図は本実施例の文書処理装置のブロック構成図、 第2図(a)、(b)は本実施例の主辞書部及びユーザ
辞書部の内容を示す図、 第2図(c)〜(e)は文書の表示と文書記憶装置内の
格納状態を対比して示す歯、 第3図(a)は本実施例の文書処理装置に係る文書入力
時のフローチャート、 第3図(b)は単語の修正のフローチャート、第3図(
C)は単語の使用頻度を求めるためのフローチャートで
ある。 図中、1・・・表示装置、2・・・入力装置、3・・・
cptJ、 4・・・プログラムROM、5・・・文書
記憶装置、6・・・RAM、6a・・・単語記憶エリア
、7・・・主辞書部、8・・・ユーザ辞書部である。 第 1 図 第2図 (e)

Claims (3)

    【特許請求の範囲】
  1. (1)複数の単語の綴りを記憶している少なくとも1つ
    の辞書部でもって、入力した単語の綴りの正誤の判定処
    理する文書処理装置であって、入力した単語が前記辞書
    部に存在するか否かを検索する検索手段と、該検索手段
    により入力した単語が前記辞書部に存在することを検出
    したときに、入力した単語に代って前記辞書部の検索し
    たアドレスを表す情報でもって文書記憶領域に格納する
    格納手段とを備えることを特徴とする文書処理装置。
  2. (2)検索手段により入力した単語が辞書部に存在しな
    いことを検出したときには、前記辞書部に登録する登録
    手段を備え、前記入力した単語を登録手段により前記辞
    書部に登録したアドレスを表す情報でもって文書記憶領
    域に格納手段により格納することを特徴とする特許請求
    の範囲第1項記載の文書処理装置。
  3. (3)アドレスを表す情報は辞書部内の単語の記憶位置
    を表す物理アドレスであることを特徴とする特許請求の
    範囲第1項又は第2項記載の文書処理装置。
JP61098162A 1986-04-30 1986-04-30 文書処理装置 Pending JPS62256070A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP61098162A JPS62256070A (ja) 1986-04-30 1986-04-30 文書処理装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP61098162A JPS62256070A (ja) 1986-04-30 1986-04-30 文書処理装置

Publications (1)

Publication Number Publication Date
JPS62256070A true JPS62256070A (ja) 1987-11-07

Family

ID=14212403

Family Applications (1)

Application Number Title Priority Date Filing Date
JP61098162A Pending JPS62256070A (ja) 1986-04-30 1986-04-30 文書処理装置

Country Status (1)

Country Link
JP (1) JPS62256070A (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH02293969A (ja) * 1989-04-05 1990-12-05 Xerox Corp テキストコーディング方法
JPH08320892A (ja) * 1995-05-24 1996-12-03 Nec Corp 文字列データ管理システム

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS60241157A (ja) * 1984-05-15 1985-11-30 Sharp Corp 電子辞書を利用した文章デ−タ圧縮方法
JPS61120269A (ja) * 1984-11-16 1986-06-07 Canon Inc 文書処理装置

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS60241157A (ja) * 1984-05-15 1985-11-30 Sharp Corp 電子辞書を利用した文章デ−タ圧縮方法
JPS61120269A (ja) * 1984-11-16 1986-06-07 Canon Inc 文書処理装置

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH02293969A (ja) * 1989-04-05 1990-12-05 Xerox Corp テキストコーディング方法
JPH08320892A (ja) * 1995-05-24 1996-12-03 Nec Corp 文字列データ管理システム

Similar Documents

Publication Publication Date Title
US4785413A (en) Character input device in document processing apparatus
JPS62256070A (ja) 文書処理装置
JPS62256069A (ja) 文書処理装置
JPH0612548B2 (ja) 文書処理装置
JP2776069B2 (ja) 文章検査装置
JPS62245366A (ja) 文書処理装置
JP2786260B2 (ja) かな漢字変換装置
JP2845235B2 (ja) 文書データ処理装置
JP2002358301A (ja) 電子辞書
JP2634596B2 (ja) かな漢字変換装置
JPH0719189B2 (ja) データ入力装置
JPH10177573A (ja) 文書処理方法および装置
JPH03137768A (ja) 文書処理装置
JPS5827268A (ja) 日本語処理装置
JPH07160720A (ja) 機械で読み取り可能な情報の翻訳を支援し、効率化する装置及びその方法
JPS6029823A (ja) 適応型記号列変換方式
JPH04155574A (ja) キー入力の練習機能を備えた文書作成装置
JPS62267857A (ja) ワ−ドプロセツサ
JPS6097426A (ja) 日本語入力装置
JPH06282567A (ja) 翻訳支援装置
JPH10207888A (ja) スペルチェック装置およびスペル修正装置
JPS6325763A (ja) 文書作成装置
JPS63196973A (ja) 仮名漢字変換方式
JPH01306959A (ja) 単語分割誤り検出方式
JPS60251464A (ja) 電子辞書