JPS62256069A - 文書処理装置 - Google Patents

文書処理装置

Info

Publication number
JPS62256069A
JPS62256069A JP61098161A JP9816186A JPS62256069A JP S62256069 A JPS62256069 A JP S62256069A JP 61098161 A JP61098161 A JP 61098161A JP 9816186 A JP9816186 A JP 9816186A JP S62256069 A JPS62256069 A JP S62256069A
Authority
JP
Japan
Prior art keywords
word
document
address
stored
dictionary section
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP61098161A
Other languages
English (en)
Inventor
Naoki Shimada
直樹 島田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Inc
Original Assignee
Canon Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Inc filed Critical Canon Inc
Priority to JP61098161A priority Critical patent/JPS62256069A/ja
Publication of JPS62256069A publication Critical patent/JPS62256069A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Document Processing Apparatus (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 [産業上の利用分野] 本発明は文書処理装置、特に人力された単語の壕りの正
誤を判定する文書処理装置に関する。
[従来の技術] 従来の文書処理装置、特に入力した単語の綴りの正誤を
判定する文書処理装置において、入力された単語群から
なる文章を記憶する方法としては、書き込み及び読み出
し可能な記憶装置、例えばRAM或いはディスク装置に
、入力されたデータをそのまま記憶する方法が取られて
いるか、又は文書を単語単位に分解し、その単語を別な
、書き込み読み出し可能な記憶装置に記憶し、その記憶
された単語の番号(1,D、)を文章中の単語として記
憶する等の手法が用いられてきた。
前者の場合は、文意をそのまま記憶するため、同じ内容
が文書中に存在する等の重複が発生し、非常に冗長性が
太きものである。また、後者の場合には辞書部の他に単
語別に記憶しておく、特別な記録エリア等のテーブルを
設ける必要があり、メモリは膨大なものとなる。
さらに、文書処理装置において、単語の頻度を調べる場
合、通常は、処理装置が動作している間において作成さ
れた文書中のすべての単語に対して検索を行っており、
操作者が複数の場合は、単語に対する使用頻度の信頼性
は旧人差によってそれ程高いものでは無くなっている。
そのため、単語の使用状況(使用頻度)を短時間で効率
よく計数することが必要となるが、これを解決するもの
が従来においてはなかった。
[発明が解決しようとする問題点] 本発明はかかる従来の技術に鑑みなされたものであり、
文書記憶領域中の各単語の使用頻度を効率よく、短時間
で係数することが可能な文書処理装置を提供することに
な、る。
[問題点を解決するための手段] この問題を解決するために本発明は、複数の単語の綴り
を記憶している辞書部でもって、入力した単語の綴りの
正誤の判定処理する文書処理装置であって、人力した単
語を前記辞書部に記憶されているアドレスを表す情報で
格納する格納手段と、該格納手段により前記文書記憶領
域中に格納されたアドレスを表す情報に基づいて単語の
頻度をを計数する計数手段とを有する。
[作用] かかる本発明の構成において、格納手段により格納され
たアドレスを表す情報を計数手段により計数する。
[実施例] 以下、添付図面に従って本発明に係る実施例を詳細に説
明する。
第1図は本実施例の文書処理装置゛のブロックオa成図
である。
図中、1は文書情報を表示する表示装置である。2は文
字記号等を入力する入力装置であり、例えばキーボード
からなる。3は文書処理装置全体をillするCPUで
ある。4は後述する第3図(a)〜(C)に示すフロー
チャートのプログラムが格納されているプログラムRO
Mである。5は入力装置2より入力した単語(本実施例
では英語とするが、本発明を限定するものではない)を
後述する処理で格納する文書記憶装置である。6はCP
L13のワークエリアとして使用するRAMであり、内
部に入力したIJIL語分を記憶する単語記憶エリア6
aを設けている。7は主辞書部であり、各単語を記憶し
ている。8はユーザ辞書部であり、ユーザに固有の単語
を新たに登録することができる。尚ユーザ辞書部8と主
辞書部7とのアドレスは重複することがない様に、それ
ぞれ第2図(a)、(b)に示す様なアドレスが違う用
になっている。
以上の様な構成からなる本実施例の文書処理装置におけ
る動作を第2図(a)〜(6)で説明する。
第2図(c)に示す様に入力装置2より、いま“Th1
s machine is・・・”と入力したとする。
このときの表示装置1には、後述する検索処理を経て、
その人力された単語が表示装置1に表示される。このと
き、文書記憶装置5には入力された単語に対する主辞書
部7の検索処理情報であるアドレスが、文書記憶装置5
に記憶されていく。
第2図(a)では“Th1s“に対応する主辞書部7の
先頭のアドレス“4198” (2バイト)、”mac
hine ”に対応するアドレス”2756”、及び“
is”に対応するアドレス“0123″が順次文書記憶
装置5内に格納されている状態を示している。よって、
文書記憶装置5には入力された単語を構成する各文字コ
ードで格納していくのではなく、主辞書部7或いはユー
ザ辞書部8内に登録されている各単語のアドレスでもっ
て格納していくことになる。これによって、単語の綴り
の長さに関係なく2バイトでもって格納されていくので
文書記憶装置5のメモリ容量に対する単語の格納数は飛
躍的に拡大されることがわかる。なぜなら、“Th1s
”という単語を見た場合、従来では単語を構成する文字
コードでもって記憶していたため、8バイト(或いは4
バイト)を必要としていたからである。また、更に綴り
の長い単語の場合においては言うまでもないことであろ
う。
ところで、文書を編集していく際、或いは作成後におい
て、往々として特定の単語を指定した単語に変換したい
場合が生ずる。後えば本実施例において、machin
e ”を“telephone ”にM換する場合を想
定してみる。従来では文書記憶領域中に“machin
e ”の単語があるか否かは単語を構成  −する各文
字コードを頭から順次検索することにより“machi
ne”なる単語を捜す処理をしていたが、本実施例では
“machine”に相当するアドレス“2756”を
捜すだけで済むことになるから、極めて簡単に、且つ高
速に捜すことが可能となる。第2図(d)はその処理後
の表示装置1と文書記憶装置5を示す図であり、“ma
chine”に対応するアドレスが“telephon
e ”のアドレス“3846”に置換されているのがわ
かる。また、例えば入力装置2より′″My name
 is Mary″と入力した場合を想定してみる°、
この場合、“Mary”という単語は固有名詞であるの
でユーザ辞書部8内に登録されているから(なかった場
合にはユーザ辞書部8に登録する)、この単語に相当す
るアドレスはユーザ辞書部8に割当られたアドレス“F
ooo” (16進数)以降のコードが文書記憶装置5
内に格納される。これを示すのが第2図(e)である。
さて、以上の様な処理概要を基に、その処理動作を第3
図(a)〜(c)に示すフローチャートに従って説明す
ることにする。
第3図(a)は本実施例における文書作成に係るフロー
チャートである。
先ず、ステップS1において入力装置2より1文字分入
力し、ステップS2では入力した文字コードを順に単語
記憶エリア6aに格納する。次にステップS3において
、入力された文字の区切り(例えばスペースキー)が入
力されたか否かを判断する。尚、本実施例においては、
英文に係る文書処理装置を想定して説明しているが、例
えば日本語においての単語の区切りは仮名漢字変換キー
の押下により判断することが可能である。さて、区切り
が入力されなかった場合にはステップS1に戻り、同様
の処理を繰返す。つまり、区切りが入力された時点で、
それ以前に単語記憶エリア6aに格納されていった文字
からなるものを車藷として認識するのである。また、区
切りが入力された場合には次のステップS5において、
単語記憶エリア6a内に記憶された単語を主辞書部7で
検索する。検索した結果、人力された単語が主辞書部7
内に存在した場合には主辞書部7内を検索したアドレス
、例えば入力された単語が”Th1s″の場合には41
98”を文書記憶装置5に記憶することになる(ステッ
プS6)。ま、  た、ステップS5において、入力さ
れた単語が主辞書部7内に存在しないことが判明した場
合にはステップS7において、今度はユーザ辞書部8を
検索する。ステップS8では同様に検索した結果、存在
したか否かを判断する。このとき、存在したことが判明
した場合にはステップS6と同様に検索したアドレスで
もって文書記憶装置5内に記憶する(ステップ5tO)
、また、ユーザ辞書部8にも存在しないことが判明した
場合にはステップS9で入力した単語をユーザ辞書部8
に記憶し、その記憶したときのアドレスでもって文書記
憶装置5内に記憶することになる。
以上の処理手順を経てオペレータは文書を作成していく
ことになるが、文書作成が終了後に、オペレータは入力
した単語が正しい綴りでもってユーザ辞書部8に登録さ
れたか否かを判断する。
このとき、登録された単語の綴りを修正することが考え
られるが、その処理手順を第3図(b)のフローチャー
トに従って説明する。
ステップS20において、今回新たに登録された単語を
ユーザ辞書部8より読出し、表示装置1に表示する。次
にオペレータは表示装置1に表示された単語の綴りが正
しいか否かく!2Iりを修正するか否か)を入力する(
ステップ521)。このままで良い場合にはステップS
22に穆り、表示装置1に表示された単語でもって、ユ
ーザー辞書部8に再登録し、ステップS20に戻り次の
単語の処理に移る。またステップS21においてオペレ
ータが修正を要すると判断した場合には、その旨のキー
を押下することによって、ステップS23に穆ることに
なる。ステップS°23では表示装置1に表示された単
語に対して正しい綴りでもって入力する。次、いてステ
ップ324においてステップ323で入力された単語を
主辞書部7により検索する。これは先に示した文書作成
時に誤って単語を人力した場合に備えているものである
ステップS25において主辞書部7内に存在することが
判明した場合にはステップS26に穆り、検索したとき
のアドレスでもって、以前に文書記憶装置5内に記憶さ
れた単語を全て更新する。また、ステップS25で修正
された単語が主辞書部7内に存在しないと判明した場合
にはステップS27に穆り、今度はユーザ辞書部8を検
索する。
ステップ328においてユーザ辞書部8内に存在したと
判明した場合には、ステップS30で、検索したアドレ
スでもって文書記憶装置5内の単語を更新する。また、
存在しないと判断した場合には、ユーザ辞書部8に新た
に登録(ステップ529)し、ステップS30で同様に
登録したアドレスでもって文書記憶装置5内の単語を更
新することになる。
以上の様な過程を経て文書処理がなされることになるが
、例えば完成した文書中の単語の使用頭度を求めたい場
合がある。このときの処理動作を第3図(c)のフロー
チャートに従って説明する。
ステップS50において、文書記憶装置5内に格納され
たアドレスを順に読出し、ステップS51で同じアドレ
ス数をカウントする。次にステップS52において、カ
ウント結果をRAM5内の所定の位誼に記憶する。
以上説明した様に本実施例によれば、文書記憶装置5内
の各単語の頻度を計測するときには、単に文書記憶装置
5内に格納された2バイトのアドレス情報をカウントす
るだけでよく、単語の綴りの長さに関係なくすることが
できるため、その処理速度は極めて早くなる。
また、単語の頻度数の計数処理が高速に処理されること
になるわけであるから、入力した単語中の最も使用頻度
の高い候補を表示する文書処理装置にもその応用が可能
となる。
また、文書情報中の単語を検索する場合にも、特定長の
アドレスでもって検索されるものであるから、特定の単
語を指定された単語でもって置換する等という処理も高
速に行なわれることになり、文書処理装置に係る検索処
理に単独で使用することも可能である。
以上説明した本実施例の複数の効果を基に、夫々単独で
文書処理装置を操作するこよが望まれる。
また、文章処理装置の多くは、綴りの検査を文章完成後
に行なうのがほとんどであるが、本発明は入力しながら
行なうため、最終的な文章完成迄の時間は短くなる。
[発明の効果] 以上説明した様に本発明によれば、文書記憶領域に格納
された辞書部の検索でのアドレスを表す各々の情報を計
数することにより、単語の綴りの長さに関係なく、極め
て高速に単語の使用頻度を求めることが可能となる。
【図面の簡単な説明】
第1図は本実施例の文書処理装置のブロック構成図、 第2図(a)、(b)は本実施例の主辞書部及びユーザ
辞書部の内容を示す図、 第2図(e)〜(e)は文書の表示と文書記憶装置内の
格納状態を対比して示す図、 第3図(a)は本実施例の文書処理装置に係る文書入力
時のフローチャート、 第3図(b)は単語の修正のフローチャート、第3図(
C)は単語の使用頻度を求めるためのフローチャートで
ある。 図中、1・・・表示装置、2・・・入力装置、3・・・
cpU、4・・・プログラムROM、5・・・文書記憶
装置、6・・・RAM、6a・・・単語記憶エリア、7
・・・主辞書部、8・・・ユーザ辞書部である。 第1図 第2図 (e)

Claims (2)

    【特許請求の範囲】
  1. (1)複数の単語の綴りを記憶している辞書部でもって
    、入力した単語の綴りの正誤の判定処理する文書処理装
    置であって、入力した単語を前記辞書部に記憶されてい
    るアドレスを表す情報で格納する格納手段と、該格納手
    段により前記文書記憶領域中に格納されたアドレスを表
    す情報に基づいて単語の頻度をを計数する計数手段とを
    有することを特徴とする文書処理装置。
  2. (2)アドレスを表す情報は辞書部内の単語の記憶位置
    を表す物理アドレスであることを特徴とする特許請求の
    範囲第1項記載の文書処理装置。
JP61098161A 1986-04-30 1986-04-30 文書処理装置 Pending JPS62256069A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP61098161A JPS62256069A (ja) 1986-04-30 1986-04-30 文書処理装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP61098161A JPS62256069A (ja) 1986-04-30 1986-04-30 文書処理装置

Publications (1)

Publication Number Publication Date
JPS62256069A true JPS62256069A (ja) 1987-11-07

Family

ID=14212382

Family Applications (1)

Application Number Title Priority Date Filing Date
JP61098161A Pending JPS62256069A (ja) 1986-04-30 1986-04-30 文書処理装置

Country Status (1)

Country Link
JP (1) JPS62256069A (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH03116369A (ja) * 1989-09-29 1991-05-17 Canon Inc 文字処理装置
US5293314A (en) * 1990-09-04 1994-03-08 Brother Kogyo Kabushiki Kaisha Word processor having a word frequency count unit

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH03116369A (ja) * 1989-09-29 1991-05-17 Canon Inc 文字処理装置
US5293314A (en) * 1990-09-04 1994-03-08 Brother Kogyo Kabushiki Kaisha Word processor having a word frequency count unit

Similar Documents

Publication Publication Date Title
JPS5858714B2 (ja) 翻訳装置
JPS6170660A (ja) 機械翻訳システムにおける多義表示・選択方法
JPS58192173A (ja) 機械翻訳装置
JPS62256069A (ja) 文書処理装置
JPS62249270A (ja) 文書処理装置
JPS62256070A (ja) 文書処理装置
JPS6118074A (ja) プレ・エデイツト方式
JPH05282360A (ja) 多国語入力装置
JP2893239B2 (ja) 翻訳支援辞書検索表示システム
JP3466761B2 (ja) 文書処理装置及びその制御方法
JPS6029823A (ja) 適応型記号列変換方式
JPH03137768A (ja) 文書処理装置
JPH07160720A (ja) 機械で読み取り可能な情報の翻訳を支援し、効率化する装置及びその方法
JPS62249273A (ja) 文書処理装置
JPS5827268A (ja) 日本語処理装置
JPS62278663A (ja) ワ−ドプロセツシング方式
JPH01306959A (ja) 単語分割誤り検出方式
JPH0750481B2 (ja) 文書校正ツール
JPH07141376A (ja) 翻訳装置
JPH0458381A (ja) 光学的文字読取装置
JPS60166070A (ja) 情報入力方式
JPH0258159A (ja) 日本文の校正システム
JPH0460754A (ja) 仮名漢字変換方法
JPH04361361A (ja) 表記のゆらぎ処理方法および表記のゆらぎ処理装置
JPH086951A (ja) 電子辞書引き装置