JPS62173568A - Electronic dictionary - Google Patents

Electronic dictionary

Info

Publication number
JPS62173568A
JPS62173568A JP61015342A JP1534286A JPS62173568A JP S62173568 A JPS62173568 A JP S62173568A JP 61015342 A JP61015342 A JP 61015342A JP 1534286 A JP1534286 A JP 1534286A JP S62173568 A JPS62173568 A JP S62173568A
Authority
JP
Japan
Prior art keywords
dictionary
data
words
area
user
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP61015342A
Other languages
Japanese (ja)
Other versions
JPH0523458B2 (en
Inventor
Yoshizo Saito
齋藤 佳三
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sharp Corp
Original Assignee
Sharp Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sharp Corp filed Critical Sharp Corp
Priority to JP61015342A priority Critical patent/JPS62173568A/en
Publication of JPS62173568A publication Critical patent/JPS62173568A/en
Priority to US07/646,358 priority patent/US5297038A/en
Publication of JPH0523458B2 publication Critical patent/JPH0523458B2/ja
Granted legal-status Critical Current

Links

Landscapes

  • Machine Translation (AREA)
  • Document Processing Apparatus (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

PURPOSE:To attain high-speed processing and also to improve the function of an electronic dictionary by providing an area where a user dictionary stores registered words by means of numerical data using a Hash method and an area where those words are stored in the form of character data. CONSTITUTION:A user dictionary 1 includes an index part 2, a data part 3 containing an area where words registered by users are stored by means of the numerical data using a Hash method, and a data part 4 containing an area where those registered words are stored in the form of the character data. The Hash method is available for the spelling check of the dictionary 1 and therefore the high-speed processing is possible. While the character data is available for such processes as registration, deletion, list output, etc. that require no high-speed operations.

Description

【発明の詳細な説明】 〈産業上の利用分野〉 本発明は電子辞書に関し、特にその中のユーザ辞書の改
良に関する。
DETAILED DESCRIPTION OF THE INVENTION <Field of Industrial Application> The present invention relates to electronic dictionaries, and particularly to improvements to user dictionaries therein.

〈従来の技術〉 単語情報を取り扱う計算機システム、ワードプロセッサ
あるいは電子タイプライタ等においては、入力した単語
の綴りに誤りがないかどうかをチェックするために電子
辞書を備えている。この電子辞書は、メイン辞書とユー
ザ辞書からなり、メイン辞書はシステムがあらかじめ供
給した単語情報を保持し、ユーザ辞書はユーザが登録し
た単語情報を保持する。
<Prior Art> Computer systems, word processors, electronic typewriters, etc. that handle word information are equipped with electronic dictionaries to check whether there are any errors in the spelling of input words. This electronic dictionary consists of a main dictionary and a user dictionary, where the main dictionary holds word information supplied in advance by the system, and the user dictionary holds word information registered by the user.

通常のスペルチェックは、第6図に示すように、メイン
辞書に当該単語情報と同じ情報が有るかどうか検索し、
同じ情報が無ければユーザ辞書−に同じ単語情報が有る
かどうか検索し、メイン辞書またはユーザ辞書に同じ単
語情報が有るときは綴りは正しく無いときは綴りは誤り
であることを判断する。
Normal spell checking, as shown in Figure 6, searches to see if the main dictionary has the same information as the word in question.
If the same information is not found, a search is made to see if the same word information exists in the user dictionary, and if the same word information is found in the main dictionary or user dictionary and the spelling is incorrect, it is determined that the spelling is incorrect.

〈発明が解決しようとする問題点〉 上述のスペルチェックにおいて、メイン辞書のデータ構
造が良くて処理が速くても、ユーザ辞書の処理に時間が
かかっては、全体として処理は遅くなる。ユーザ辞書は
、メイン辞書と違ってシステムが供給するものではなく
、ユーザが自由に単語を登録できるようにしているので
、それなりの対応性を持たなくてはならない。すなわち
、メイン辞書と同じように高速処理が実現でき、なお且
つユーザ辞書に登録されている単語情報を自由にリスト
出力できることが必要である。ユーザ辞書の領域は限ら
れているので、データ領域が満了になった場合、どの単
語情報を削除するかはリストがないと判別できない。
<Problems to be Solved by the Invention> In the spell check described above, even if the main dictionary has a good data structure and processing is fast, if processing of the user dictionary takes time, the overall processing becomes slow. Unlike the main dictionary, the user dictionary is not provided by the system, but allows the user to freely register words, so it must have a certain degree of compatibility. That is, it is necessary to be able to realize high-speed processing like the main dictionary, and to be able to freely output a list of word information registered in the user dictionary. Since the area of the user dictionary is limited, when the data area expires, it is impossible to determine which word information to delete without the list.

第7図はl1ash法のみを用いたユーザ辞書の構造を
示す。II a s h法では、ユーザが登録する単語
情報を数値データとHashすなわちデータブロック長
を一定にするための無意味情報とを組み合わせて登録す
る。このユーザ辞書では、インデックスはHa s h
により平均的にデータが割り振られてデータを検索する
速度は速いが、データ部が満了になった場合や、現在登
録されている単語を確認したい場合に、元の単語を再生
し直すのは困難である。また、ユーザ辞書に登録する単
語が偶然にもHash値が同し場合の対処が問題である
。同じHash値なので兼用するとすれば、今度削除す
るときにどちらを削除するのか残すのかがわからない。
FIG. 7 shows the structure of a user dictionary using only the l1ash method. In the II a s h method, the word information registered by the user is registered by combining numerical data and Hash, that is, meaningless information for making the data block length constant. In this user dictionary, the index is Ha s h
Data is allocated on average and the data search speed is fast, but it is difficult to replay the original word when the data section expires or when you want to check the currently registered words. It is. Another problem is what to do when words registered in the user dictionary happen to have the same Hash value. Since they have the same Hash value, if they are to be used together, it is difficult to know which one to delete or leave when deleting next time.

第8図はII a s h値を使用せずに文字列を使用
した例である。このように単に文字列だけを並べた場合
、単語の長さごとに文字を比較するわけであるが、ユー
ザ領域にどのような単語が登録されているかはわかる反
面、スペルチェックの場合に単語の比較になるのでどう
しても処理が遅くなる。これをカバーするために、ユー
ザ領域にある単語を頻度順や最新に使用した順番に並べ
る方法がとられることもあるが、実際に娯綴りの単語が
入力された場合、やはりユーザ領域の最後まで検索する
ので時間がかかってしまう。また、第9図に示すように
Hashを用いないインデックス例えば単語の頭文字や
単語の長さからインデックスを構成したとしても、Ra
5hを用いたインデックスのように平均的にデータが割
り振られない(CやSで始まる8文字単語は多いが、2
やXで始まる8文字単語はほとんど皆無であるので)か
ら、単語によってはHash法を用いた場合より検索に
時間がかがる。
FIG. 8 is an example in which a character string is used without using the II a sh value. When just character strings are arranged in this way, the characters are compared according to the length of the word, but while it is possible to see what kind of words are registered in the user area, when checking the spelling, it is difficult to compare the characters. Since it is a comparison, the processing will inevitably be slow. To cover this, a method is sometimes taken to arrange the words in the user area in order of frequency or in the order of most recent use, but if a word that is actually spelled as entertainment is entered, it will still be until the end of the user area. Searching takes time. Furthermore, even if an index that does not use Hash is constructed from the initial letter of a word or the length of a word, as shown in FIG.
Data is not allocated on average like an index using 5h (there are many 8-letter words starting with C or S, but 2
There are almost no 8-letter words that start with `` or

く問題点を解決する為の手段〉 本発明による電子辞書は、ユーザが登録した単語をHa
sh法を用いた数値データで記憶するエリアと上記単語
を文字データで記憶するエリアとを有するユーザ辞書を
備えたことを特徴とする。
Means for Solving the Problems〉 The electronic dictionary according to the present invention stores words registered by the user in Ha
The present invention is characterized in that it includes a user dictionary having an area for storing numerical data using the sh method and an area for storing the above words as character data.

〈実施例〉 第1図は本実施例のユーザ辞書の構造を示す。<Example> FIG. 1 shows the structure of the user dictionary of this embodiment.

コ(7)ニーーIJ’辞書1は、インデックス部2、ユ
ーザが登録した単語をHash法を用いた数値データで
記憶するエリアからなるデータ部3、並びに、上記単語
を文字データで記憶するエリアからなるデータ部4によ
り構成される。
(7) Knee IJ' dictionary 1 consists of an index section 2, a data section 3 consisting of an area for storing words registered by the user as numerical data using the Hash method, and an area for storing the above words as character data. It is composed of a data section 4.

第2図はこのユーザ辞W:1を用いた計算機システムの
構成を示す。入力装置5は、文字やi語の情報を記憶装
置6に入力するための装置であり、例えば鍵盤装置、タ
ブレット装置、OCR,磁気テープ装置等からなる。記
憶装置6は、入力装置5から入力された文字や単語の情
報を保存する領域であり、例えばコアメモリ、ICメモ
リ、磁気ディスク等からなる。出力装置7は、記憶装置
6において保存・編集された結果の情報を出力する装置
であり、例えばプリンタ、ディスプレイ装置。
FIG. 2 shows the configuration of a computer system using this user dictionary W:1. The input device 5 is a device for inputting character and i-word information into the storage device 6, and includes, for example, a keyboard device, a tablet device, an OCR device, a magnetic tape device, and the like. The storage device 6 is an area that stores information on characters and words inputted from the input device 5, and includes, for example, a core memory, an IC memory, a magnetic disk, and the like. The output device 7 is a device that outputs the information stored and edited in the storage device 6, and is, for example, a printer or a display device.

磁気テープ装置、磁気ディスク装置等からなる。Consists of magnetic tape devices, magnetic disk devices, etc.

スペルチェック辞書装置8は、記憶装置6に格納されて
いる文字や単語の綴り情報の問い合わせに対して適宜有
効な情報を供給するための辞書領域であり、メイン辞書
(図示せず)及び上述のユーザ辞書1から構成される。
The spell check dictionary device 8 is a dictionary area for supplying valid information as appropriate in response to inquiries about the spelling information of characters and words stored in the storage device 6, and includes a main dictionary (not shown) and the above-mentioned It consists of a user dictionary 1.

このスペルチェック辞書装置8は、例えばコアメモリ、
ICメモリ、ROM。
This spell check dictionary device 8 includes, for example, a core memory,
IC memory, ROM.

磁気ディスク等からなる。制御装置9ば、以上の構成要
素間の信号及びデータのやりとりを制御するコンピュー
タからなる。
Consists of magnetic disks, etc. The control device 9 consists of a computer that controls the exchange of signals and data between the above components.

以下、作用について説明する。The effect will be explained below.

スペルチェックを行なう場合は、if a s h法に
より当該単語のHash値を算出し、インデックス部2
より当該データを高速で検索する。
When performing a spell check, the Hash value of the word is calculated using the if a h method, and the Hash value of the word is
The data can be searched at high speed.

ユーザ辞書1の単語情報の登録、削除、リスト出力には
、データ部4を主に使用する。
The data section 4 is mainly used to register, delete, and output a list of word information in the user dictionary 1.

ユーザ辞書1に単語を登録する場合は、第3図に示すよ
うに、まずメイン辞書に同じ単語情報が有るかどうか検
索しくステップ#11) 、無ければユーザ辞書1のデ
ータ部4に同じ単語情報が有るかどうか検索する(ステ
ップ#12)。メイン辞書またはデータ部4に同じ単語
情報が有るときは、エラーになる。同じ単語情報が無い
ときは、当該単語情報についてHash値を作成しくス
テップ#13)、作成したHash値と同じII a 
s h値がデータ部3に有るかどうか検索する(ステッ
プ#14)。
When registering a word in the user dictionary 1, as shown in FIG. It is searched to see if it exists (Step #12). If the same word information exists in the main dictionary or data section 4, an error will occur. If the same word information does not exist, create a Hash value for the word information (Step #13), and set the same Hash value as the created Hash value.
A search is made to see if the s h value exists in the data section 3 (step #14).

同じHash値が有るときは、2重フラグをONする(
ステップ#15)。Hash値は27ビツトで表わされ
、その前半の5ビツトでインデックスを構成しているた
め、データ部分は22ビツトで表現される。しかし、実
際は、ユーザ辞書1のデータ部。
If the same Hash value exists, turn on the double flag (
Step #15). The Hash value is represented by 27 bits, and the first 5 bits constitute an index, so the data part is represented by 22 bits. However, in reality, it is the data part of the user dictionary 1.

3は3バイトで格納されるので、2ビツトの余裕がある
。そこで、2ビツトのうちの1ビツトがONになってい
れば、それは2MにHash値が使用されていることを
表わすものとする。以上の処理の後、インデックスのカ
ウントアツプ、Hash値のセット並びにデータ部4に
文字データの追加を行ない、単語情報の登録を完了する
(ステップ#16)。
Since 3 is stored in 3 bytes, there is a margin of 2 bits. Therefore, if one of the two bits is ON, it means that the Hash value is used for 2M. After the above processing, the index is counted up, the Hash value is set, and character data is added to the data section 4, thereby completing the registration of word information (step #16).

ユーザ辞書」から単語を削除する場合は、第4図に示す
ように、まずユーザ辞書1に当該単語の文字データが有
るかどうか検索しくステップ#21)、文字データが有
るときはデータ部4からこの文字データを削除する(ス
テップ#22)。次に、当該単語についてHash値を
作成しくステップ#23)、データ部3の同じHash
値に2重フラグがONしているかどうか検索する(ステ
・ンプ#24)。2重フラグがONしていなければ、こ
のII a s h値を削除しくステップ#25)、イ
ンデックスをカウントダウンする(ステップ#29)。
When deleting a word from the "User Dictionary", as shown in Figure 4, first search to see if there is character data for the word in the User Dictionary 1 (Step #21), and if there is character data, delete it from the data section 4. This character data is deleted (step #22). Next, create a Hash value for the word (step #23), and use the same Hash value in the data section 3.
Search whether the double flag is ON for the value (Step #24). If the double flag is not ON, this II a s h value is deleted (step #25), and the index is counted down (step #29).

一方、2重フラグがONしていると、ユーザ辞書1の全
ての単語について1lash法によりHash値を算出
して同じHa s h値がまだ複数個有るかどうか検察
しくステップ#26、#27) 、複数個有るときはそ
のままインデックスをカウントダウンしくステップ#2
9)、1個だけなら2重フラグをOFFにして(ステッ
プ928)、インデックスをカウントダウンする(ステ
ップ#29)。
On the other hand, if the double flag is ON, Hash values are calculated for all words in user dictionary 1 using the 1-lash method, and the process is performed to determine whether there are more than one same Hash value (Steps #26 and #27) , if there are multiple indexes, just count down the index Step #2
9) If there is only one, the double flag is turned OFF (step 928), and the index is counted down (step #29).

ユーザ辞書1に登録しである単語情報をリスト出力する
場合は、第5図に示すように、ユーザ辞書1のデータ部
4に当該文字データが有るかどうか検索しくステップ#
31)、文字データが有るときはこの文字データを出力
装置7へ送る(ステップ#32)。データ部4は、頭文
字がアルファベント順に単語情報を保持するので、リス
トを見易く出力できる。
When outputting a list of word information registered in the user dictionary 1, as shown in FIG.
31) If there is character data, send this character data to the output device 7 (step #32). Since the data section 4 holds word information in alphabetical order of initial letters, it is possible to output a list in an easy-to-read manner.

〈発明の効果〉 以上説明したように本発明においては、ユーザ辞書が登
録された単語をRa5h法を用いた数値データで記憶す
るエリアとこの単語を文字データで記憶するエリアとを
有するようにじたので、ユーザ辞書に対してスペルチェ
ックのときはHash値を利用して高速処理が可能にな
るとともに、登録、削除、リスト出力等の高速を必要と
しない処理のときは文字データを利用することにより対
応でき、電子辞書の機能を高めることができる。
<Effects of the Invention> As explained above, in the present invention, the user dictionary has an area for storing registered words as numerical data using the Ra5h method and an area for storing the words as character data. Therefore, when spell checking a user dictionary, Hash values can be used for high-speed processing, and character data can be used for processes that do not require high speed, such as registration, deletion, and list output. This makes it possible to improve the functionality of electronic dictionaries.

【図面の簡単な説明】[Brief explanation of drawings]

第1図は本発明実施例のユーザ辞書の構造を示す図、第
2図は本発明を適用した計算機システムの構成を示すブ
ロック図、第3図、第4図並びに第5図は本発明実施例
の処理手順を示すフローチャート、第6図はスペルチェ
ックの処理手順を示すフローチャート、第7図、第8図
並びに第9図は従来例のユーザ辞書の構造を示す図であ
る。 1・・・ユーザ辞書 2・・・インデックス 3.4・・・データ部 特許出願人    シャープ株式会社 代 理 人    弁理士 西1)新 第3図 コーサ゛避)■劇た ?−IAS/LA龜起リド 文1トデ°′−9&ウロ スヘ8ルミス 第7図          第8図 第9図
FIG. 1 is a diagram showing the structure of a user dictionary according to an embodiment of the present invention, FIG. 2 is a block diagram showing the configuration of a computer system to which the present invention is applied, and FIGS. FIG. 6 is a flowchart showing an example processing procedure. FIG. 6 is a flowchart showing a spell check processing procedure. FIGS. 7, 8, and 9 are diagrams showing the structure of a conventional user dictionary. 1...User Dictionary 2...Index 3.4...Data Department Patent Applicant Sharp Co., Ltd. Representative Patent Attorney Nishi 1) New Figure 3 Course Avoidance) ■Drama? -IAS/LA 龜OKRIDO 1 Tode °'-9 & Uroshe 8 Lumis Fig. 7 Fig. 8 Fig. 9

Claims (1)

【特許請求の範囲】[Claims] ユーザが登録した単語をHash法を用いた数値データ
で記憶するエリアと上記単語を文字データで記憶するエ
リアとを有するユーザ辞書を備えたことを特徴とする電
子辞書。
An electronic dictionary comprising a user dictionary having an area for storing words registered by a user as numerical data using a Hash method and an area for storing the words as character data.
JP61015342A 1985-09-27 1986-01-27 Electronic dictionary Granted JPS62173568A (en)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP61015342A JPS62173568A (en) 1986-01-27 1986-01-27 Electronic dictionary
US07/646,358 US5297038A (en) 1985-09-27 1991-01-25 Electronic dictionary and method of codifying words therefor

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP61015342A JPS62173568A (en) 1986-01-27 1986-01-27 Electronic dictionary

Publications (2)

Publication Number Publication Date
JPS62173568A true JPS62173568A (en) 1987-07-30
JPH0523458B2 JPH0523458B2 (en) 1993-04-02

Family

ID=11886116

Family Applications (1)

Application Number Title Priority Date Filing Date
JP61015342A Granted JPS62173568A (en) 1985-09-27 1986-01-27 Electronic dictionary

Country Status (1)

Country Link
JP (1) JPS62173568A (en)

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS55954A (en) * 1978-06-20 1980-01-07 Nippon Telegr & Teleph Corp <Ntt> Data retrieval system

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS55954A (en) * 1978-06-20 1980-01-07 Nippon Telegr & Teleph Corp <Ntt> Data retrieval system

Also Published As

Publication number Publication date
JPH0523458B2 (en) 1993-04-02

Similar Documents

Publication Publication Date Title
JP2783558B2 (en) Summary generation method and summary generation device
JPS62173568A (en) Electronic dictionary
JP3187671B2 (en) Electronic dictionary display
JPH01307865A (en) Character string retrieving system
JPH0612451A (en) Illustrative sentence retrieving system
JPH0567146A (en) Data editor
JP2002358301A (en) Electronic dictionary
JP3914590B2 (en) Kanji conversion device
JP2634926B2 (en) Kana-Kanji conversion device
JP3809238B2 (en) Document processing method and apparatus
JP3305343B2 (en) Dictionary editing device
JPS595335A (en) Japanese language input device
JPH03129568A (en) Document processor
JPH0410052A (en) Preparing retrieving device for electronic dictionary of foreign language
JPH0225544B2 (en)
JPH0371370A (en) English word retrieving device
JPS6198475A (en) Japanese sentence input device
JPS62282364A (en) Character string retrieval system
JPS61169961A (en) Character processor provided with user dictionary
JP2000348055A (en) Method and device for retrieving information and computer readable recording medium
JPS62160534A (en) Character string collating system
JPS60128561A (en) Document forming device
JPH0378081A (en) Word processor
JPH0335349A (en) Document processor with example display function
JPS63314672A (en) Kana/kanji conversion processor