JPS6274153A - Retrieving method for electronic dictionary - Google Patents

Retrieving method for electronic dictionary

Info

Publication number
JPS6274153A
JPS6274153A JP60215691A JP21569185A JPS6274153A JP S6274153 A JPS6274153 A JP S6274153A JP 60215691 A JP60215691 A JP 60215691A JP 21569185 A JP21569185 A JP 21569185A JP S6274153 A JPS6274153 A JP S6274153A
Authority
JP
Japan
Prior art keywords
word
character
group
data
dictionary
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP60215691A
Other languages
Japanese (ja)
Other versions
JPH0378667B2 (en
Inventor
Yoshizo Saito
齋藤 佳三
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sharp Corp
Original Assignee
Sharp Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sharp Corp filed Critical Sharp Corp
Priority to JP60215691A priority Critical patent/JPS6274153A/en
Publication of JPS6274153A publication Critical patent/JPS6274153A/en
Priority to US07/646,358 priority patent/US5297038A/en
Publication of JPH0378667B2 publication Critical patent/JPH0378667B2/ja
Granted legal-status Critical Current

Links

Abstract

PURPOSE:To shorten the time required for checking a spelling, by adjusting the number of words per one group by increasing or decreasing the number of digits of the index of a hash value, when grouping a word group and registering it to a dictionary. CONSTITUTION:Character and word information inputted and edited by an input device 1 is stored in a memory device 2. An electronic dictionary 4 for a spelling check which is connected to the memory device 2 is provided with an operation processing part for a spelling check processing, and offers information related to whether the spelling of an inputted word is correct or not, in accordance with an inquiry from the memory device 2. This operation processing part which is used exclusively for the spelling check processing is constituted so that the number of words per one group can be adjusted by increasing or decreasing the number of digits of the index of the hash value, when grouping the words and registering them in the dictionary 4.

Description

【発明の詳細な説明】 (産業上の利用分!J!P) 本発明はワードプロセッザ、タイプライタ等を含む種々
の言語処理装置に付随する電子辞書の検索方法に関する
DETAILED DESCRIPTION OF THE INVENTION (Industrial Application! J!P) The present invention relates to a search method for electronic dictionaries attached to various language processing devices including word processors, typewriters, and the like.

(技術背景) 欧文ワードプロセッザ、欧文タイプライタ等に付属され
ろ電子式単語辞書において、スペルヂエック機能は重要
であり、かっこのようなスペルチェック処理はできる限
り迅速に行いたいという要請がある。そこでスペルチェ
ックを行うに当り、例えば第1表に例示するように、辞
書に登録する弔語群を頭文字及び文字数7、−よって2
火星的1.丁グループ分(−j(〜、該当オろrj8語
が属4′ろグル プ内でのみ検索を行うことか考えられ
る4、なお、第1表に示す数値iJ各ダグループ属オろ
単語数で・ある3、(発明が解決すべき課題) ところがに記検索方法に、1.1Lば、電子計−)に登
録されるQj語群をグループ分番士しているにも拘り二
)ず、なお個々のグループ7こ属する91語の促1数が
がなり多数にのほろので(例えば頭文字が“C”で8文
字の単語(7目154.17i)、該当する単語の検索
に要−4゛ろl!j間が長くなるという問題がある9、
そのため、タイプライタ等にお1.Lるリアルクィノ、
処理(、二は供し難い。
(Technical background) In electronic word dictionaries attached to Roman word processors, Roman typewriters, etc., a spell check function is important, and there is a demand for spell check processing such as parentheses to be performed as quickly as possible. Therefore, when performing a spell check, for example, as shown in Table 1, the group of eulogy words to be registered in the dictionary has an initial letter and a number of characters of 7, - therefore 2.
Mars-like 1. It is conceivable that the corresponding ororj8 words are searched only within the group 4, and the number of words in each group iJ shown in Table 1. 3. (Problem to be solved by the invention) However, in the search method described in 1.1L, although the Qj word group registered in electronic meter -) is used as a group number, 2) , because the number of 91 words that belong to 7 individual groups is large, and there are many words (for example, a word with the initial letter "C" and 8 letters (7th letter 154.17i), it is necessary to search for the corresponding word. -4゛rol!j There is a problem that the interval becomes long 9,
Therefore, 1. L real quino,
Processing (, 2 is difficult to provide.

父上記検索力法においては、各単語が1文字中1!ソで
コ−1・化されて電子計−11こ登録さJlろ、j:う
7.=なっているので、1語当りの記憶に要4゛る容積
が文字数によ−・て変動し、特に文字数の多い111語
の場合、1語当りの記憶容量が大きくなるという問題が
ある。しかも文字数の多い11語では、1語当りの検索
時間もかなり長時間となろ3、史に又、上記検索方法に
よれば、万 誤、たスペルの単語が人jJさイ1へ−場
合、該当グル プ内の全ての単語と照合1−た後でなI
jtl、ばミススペルと判定4ろことかで八ないので、
判定時間がr=くなるとい・)問題らある3、 (問題点を解決4゛ろため(ハ丁段) 本発明は1.述L ic種々の不μ合を解消することを
目的と1.ている。そのたy)、本発明に係る電子辞書
の検索方法は、メモリ装置からなる電1′・辞I)に複
数の単語を格納して検索を行・)ζ、−= ’10、r
め各アルファベット文字に対し文字ウ−r、 、、1’
 l−を定めるととt)にQi語内の各位置r) 、、
 (+−を定め、各Qi語にお1する語頭の文字に)い
で文字(、’) j1′トと位置ウェイトを乗算した値
を予め定めた所定素数で除算して剰余を求め、引続き後
続するh文字に−)いて文字ウェ、イトと位置ウゴ、イ
トの乗′c>値11、曲回の剰余を加算したり(を上記
所定素数で除痒し7:′剰余を求める操作を語肥の文字
まで1文字fiiに繰り返して行い、語尾の文字に対す
る最終剰余としで得られたハソン、1値を下位一定柘数
のインテ・ツクスと下位一定桁数のデータに分割して各
単語のデータを1−配電子辞書にインデックスが共通な
グループhjに登録しておき、検索すべき単語について
上記ハンソコ値を)I出し、該検索単語のデ タとf=
記電子辞書内の検索単語のインデックスに対応するグル
ープのデータ群との一致又は不一致を照合するようにし
たことを特徴とする。
Father In the above search power method, each word has 1 out of 1 letters! It has been converted into a code 1 and the electronic meter 11 has been registered in Japan. =, the storage capacity required to store one word varies depending on the number of characters, and especially in the case of 111 words, which have a large number of characters, there is a problem that the storage capacity per word becomes large. Moreover, for 11 words with a large number of characters, the search time per word would be quite long3.In addition, according to the above search method, in the case of a wrongly spelled word, After matching all words in the group,
jtl, it's a misspelled word and the judgment is 4 or so, so
The purpose of the present invention is to solve the various inconveniences mentioned in 1. Therefore, the electronic dictionary search method according to the present invention stores a plurality of words in the electronic dictionary I) consisting of a memory device and performs a search. , r
For each alphabetic character, write the letters U-r, ,,1'
When l- is defined, each position r) in the Qi word is set to t), ,
(Determine +- and add 1 to the first letter of each Qi word.) Then, multiply the character (,') j1' by the position weight, divide the value by a predetermined prime number, find the remainder, and continue to Add the remainder of the curvature of the character wa, it and the position ugo, the power of it'c>value 11, and (divide it by the predetermined prime number 7:') to find the remainder. The process is repeated for each character fii up to the letter ``hi'', and the final remainder for the final character is divided into the lower constant number of inte tx and the lower constant number of digits to calculate the value of each word. Register the data in a group hj with a common index in the electronic dictionary, obtain the above-mentioned value for the word to be searched, and combine the data of the search word and f=
The present invention is characterized in that the index of the search word in the electronic dictionary is checked for match or mismatch with the data group of the group corresponding to the index.

その場合、各グルーブノ、二属するデータ群を数値の小
さい順に登録することが好適である。
In this case, it is preferable to register the data groups belonging to each groove number in ascending order of numerical value.

(実施例) 以下、添付図面及び添付図表を参照1.なから本発明を
実施例に基づいて説明する。
(Example) Please refer to the attached drawings and charts below.1. The present invention will be explained based on examples.

図面には本発明法を適用しうる言δP、処理装置の一般
構成が示されている。同図において、■は本言語処理装
置に文字、単語情報を入力するための入力装置であって
、具体的には例えば鍵盤装置、タブレット装置、OCI
z (光学的文字読取装置)、磁気テ プ装置等が使用
される。
The drawings show the general structure of a processing device and a word δP to which the method of the present invention can be applied. In the same figure, ■ is an input device for inputting characters and word information to the language processing device, and specifically, for example, a keyboard device, a tablet device, an OCI device, etc.
z (optical character reader), magnetic tape device, etc. are used.

2は人力装置lに接続され、人力装置1によって人力さ
れて編集さA1だ文字、単語情報を保存ずる記憶装置で
あって、例えばコアメモリ、I Cメモリ、磁気ディス
ク装置等が使用される9、3は記憶装置2に接続され、
記憶装置2で保存された情報を出勾オる出力装置であ−
、て、例えば各種プリンタ、ディスプレイ装置、磁気テ
 ブ装置、磁気ディスク装置等が使用されろ4.4は記
憶装置2に接続されろスペル舌上ツタ用電子辞書であ−
)で、例えば:lアメモリ、ICメモリ、ROM(ラン
グ1、アクセスメモリ)、磁気ディスク装置等により構
成されろ。後述−セるよ5に該辞書4はスペルヂエック
処理専用の演算処理部を備え、記憶装置2からの間合1
1に応じて、人勾された単語のスペルが正しいか否かの
情報を提供1゜うるようになっている。
Reference numeral 2 denotes a storage device which is connected to the human-powered device 1 and stores the character and word information edited by the human-powered device 1, such as a core memory, an IC memory, a magnetic disk device, etc. 9 , 3 are connected to the storage device 2,
It is an output device for outputting information stored in the storage device 2.
For example, various printers, display devices, magnetic tape devices, magnetic disk devices, etc. are used. 4.4 is an electronic dictionary for spelling tongue ivy connected to the storage device 2.
), for example, it is composed of: l memory, IC memory, ROM (rung 1, access memory), magnetic disk device, etc. As will be described later, the dictionary 4 is equipped with an arithmetic processing section dedicated to spell check processing,
1, it is possible to provide information on whether the spelling of the word that has been deduced is correct or not.

又5は各装置1〜4に接続されろ制御装置で、例えばコ
ンビコータによって構成され、各装置1〜4間?こおけ
る信号の授受の制御を行う。
Reference numeral 5 denotes a control device connected to each device 1 to 4, which is configured by a combi coater, for example, and is connected to each device 1 to 4. Controls the transmission and reception of signals at this station.

次に、本発明におけるハッシコ法による欧文単語のコー
ド化について述べる。
Next, encoding of European words using the hashco method in the present invention will be described.

このコード化に際しては、まず第3表に人文字のアルフ
ァベットの一部を例示するように、各文字にそれぞれ2
進数からなる固有の文字ウェイ)・(便宜」二10進表
示で表す)を定める。なお第3表では省略しているが、
小文字のアルファベット、数字等に対しても同様に文字
ウェイトが定められる。
When encoding this, first, as shown in Table 3, which shows part of the human alphabet, each character has two characters.
A unique character way consisting of a base number) (conveniently expressed in decimal notation) is determined. Although omitted in Table 3,
Character weights are similarly determined for lowercase alphabets, numbers, and the like.

それとともに第4表に示すように、単語内の各文字位置
に対し、それぞれ2進数からなる固有の位置ウェイト(
便宜」−16進表示で表す)を定めろ。
At the same time, as shown in Table 4, for each character position within a word, a unique position weight (
(expressed in hexadecimal).

なお第4表には1文字目〜7文字目の位置ウェイトが例
示されているが、8文字目以降についても同様の位置ウ
ェイトが定められる。
Table 4 shows position weights for the first to seventh characters, but similar position weights are determined for the eighth and subsequent characters.

次に、上記文字ウェイト及び位置ウェイトに基づいて、
下記の手順で各弔語のハツシュ値を算出する。
Next, based on the above character weight and position weight,
Calculate the hash value of each eulogy using the following procedure.

(i)すなわち、まず各単語の1文字目(語頭)の文字
の文字ウェイトと位置ウェイトを乗算する。
(i) That is, first, the character weight and position weight of the first character (initial character) of each word are multiplied.

例えば“AIR”という単語の場合、“A”の文字ウェ
イト“60”と1文字目の位置ウェイト“ooogoo
oo“を乗算する。その場合、文字ウェイトを3ビット
単位に分割して位置ウェイトに乗算することが好適であ
る。そして、その乗算値を227に最も近い素数で除算
して剰余を求め、該剰余を記憶する。
For example, in the case of the word "AIR", the character weight of "A" is "60" and the positional weight of the first character is "ooogoo".
oo". In that case, it is preferable to divide the character weight into 3-bit units and multiply by the position weight. Then, divide the multiplied value by the prime number closest to 227 to obtain the remainder. Remember the remainder.

(11)引続き、2文字目の文字の文字ウェイトと位置
ウェイトを乗算した値に1文字目について求めた剰余を
加算してその値を」1記素数で除算し、新たな剰余を算
出する。以下、最後(語尾)の文字まで1文字毎に同様
の演算を繰り返し、最終的に求めた剰余をその単語のハ
ツシュ値とする。ここでは、各回の除算にお客」る除数
として227に最も近い素数を選定しているので、−ト
記ハッンユ値は全て27桁以内の2進数で表現される。
(11) Next, add the remainder obtained for the first character to the value obtained by multiplying the character weight and position weight of the second character, and divide that value by a prime number to calculate a new remainder. Thereafter, the same operation is repeated for each character up to the last character (the end of the word), and the finally obtained remainder is used as the hash value of the word. Here, since the prime number closest to 227 is selected as the divisor for each division, all the values are expressed as binary numbers within 27 digits.

なお、除数を変えることによって、ハツシュ値の桁数を
任意に変更できる。
Note that by changing the divisor, the number of digits of the hash value can be changed arbitrarily.

第5表にアルファベットの冒頭部分について上記手順で
ハツシュ値を算出した結果を例示する。
Table 5 shows the results of calculating the hash value using the above procedure for the beginning of the alphabet.

このようにして求めたハツシュ値を昇り順(数値の小さ
い順)に並べ換えたものの先頭部分を第6表に示す。こ
れら第5.6表においては、便宜上ハツシュ値を8進表
示で表している。
Table 6 shows the first part of the hash values obtained in this way, rearranged in ascending order (in ascending order). In Table 5.6, hash values are expressed in octal for convenience.

上記のようにしてハツシュ法によるコード化が終了すれ
ば、次に各単語のハツシュ値を上位11桁(2進表示の
場合)のインデックス部分(以下単にインデックスとい
う)と下位16桁のデータ部分(以下単にデータという
)に分割し、インデックスの共通な単語毎にグループ分
けを行う。例えば、第6表に示す単語群のうち、ハツシ
ュ値が2+6(8進表示にお13る200000)未満
の43個の単語群nevus〜accommodato
rはインデックス“0″として第1番目のグループに分
類される。又、ハラノコ−値が21′1以上でかつ21
7未満の単語群はインデックス“ビとして第2番目のグ
ループに分類される。このようにして全ての単語がイン
デックスの桁数に対応する2048(−2’り通りのグ
ループに分類される。なお、インデックスの桁数を変え
ることによりグループ数を任意に増減することができる
Once the encoding using the hash method is completed as described above, the hash value of each word is divided into the upper 11 digits (in the case of binary representation) of the index part (hereinafter simply referred to as index) and the lower 16 digits of the data part ( (hereinafter simply referred to as data), and grouped by words with common indexes. For example, among the word groups shown in Table 6, the 43 word groups with hash values less than 2+6 (13 in octal notation, 200,000)
r is classified into the first group with index "0". In addition, the Haranoko value is 21'1 or more and 21
Words with an index of less than 7 are classified into the second group with the index "bi". In this way, all words are classified into 2048 (-2') groups corresponding to the number of digits in the index. , the number of groups can be increased or decreased arbitrarily by changing the number of digits of the index.

第2表にグループ数を2048とした場合の各グループ
に属する単語の個数(便宜上16進表示で表す)を示す
。第2表の欄外の縦軸には、グループ番号の」1位3桁
(各桁を16進表示で表す)が、欄外の横軸にはグルー
プ番号の最下位の1桁(8進表示で表す)が示されてい
る。同表から明らかなように、本性ではグループ数を増
加させることにより、個々のグループに属する単語の個
数が減少1.ている。
Table 2 shows the number of words belonging to each group (expressed in hexadecimal for convenience) when the number of groups is 2048. The vertical axis outside the margin of Table 2 shows the first three digits of the group number (each digit is expressed in hexadecimal), and the horizontal axis outside the margin shows the lowest digit of the group number (in octal notation). ) is shown. As is clear from the table, by increasing the number of groups, the number of words belonging to each group decreases.1. ing.

ちなみに、第2表中にアンダーラインで示すように、本
性ではIグループにおける最大の単語数が88(+ 6
表示における58)であり、従って最大限88回の検索
で全てのスペルチェックが行えることになる。
By the way, as shown underlined in Table 2, the maximum number of words in the I group in nature is 88 (+ 6
58) in the display, therefore, all spell checks can be performed with a maximum of 88 searches.

以上のようにグループ化された単語のデータは、各グル
ープ毎にそれぞれ昇り順に辞書4に格納される。又、第
2表に示される各グループの単語数に基づいて各グルー
プの先頭アドレスが求められて記憶される(第7表参照
)。これらのアドレスはスペルチェック時における該当
グループの選択に利用される。
The word data grouped as described above is stored in the dictionary 4 in ascending order for each group. Furthermore, the start address of each group is determined and stored based on the number of words in each group shown in Table 2 (see Table 7). These addresses are used to select the relevant group during spell checking.

以下、上記辞書4によるスペルチェック処理について述
べる。
The spell check process using the dictionary 4 will be described below.

記憶装置2から辞書4にスペルチェックを行うべき単語
(以下検索単語という)が送られると、辞書4内の図示
しない演算処理部により上述と同様のルifW方法で検
索11”i語の・\ソンコ値が騨出される4、引続き、
検索中5t1のfン子・Iリスに、l−り該当りループ
がfす別みねた後、上記検索111語のう−り鼾該当グ
ル ブに属−計るデ タ1!′Tとの一致又は不致が順
次照合さ石ろ3.照合の結果、検索11’i語のブタが
該当グループのい「イ1かのデータと 致4゛わは、記
憶装置ニジ(盲目2いスペルCあ/)旨を示3)信号が
送信さA1ろ。一方、検索ljj語のデータか該当グル
 ブのいずれのデータとも一致しなljj 41ば、記
憶装置2にミススペルである旨を・云・+−(1; ’
、3が送信さイ1ろ3、不法で(J各!?ル ブの一?
゛−タか−71)ll[Qに配列されているの−(=、
特にミススペルの場合、検索単語のデータが該当1〕゛
ループ(、i)−+’  りiji (J)’、)らの
い4″れかのデ タより小さくなり、かつそれ−丁での
い一4゛れのデータとも 致しな([れは、その時点で
ミススペルの判定を十すごとができろ3、とこ/)で第
8表(、−例7■り電ろように、不法においてはンノニ
ノ−3(同M詔)が発生上ろ3,5−ごてノノー二。
When a word to be spell-checked (hereinafter referred to as a search word) is sent from the storage device 2 to the dictionary 4, an arithmetic processing unit (not shown) in the dictionary 4 performs a search 11" for the i word using the same IFW method as described above. 4. Continuing, the Sonko value is calculated.
During the search, 5t1's fonko/I squirrel found the corresponding loop, and then the above searched word 111 belonged to the corresponding group. Data 1! Match or mismatch with 'T is checked sequentially.3. As a result of the matching, the pig in the search 11'i word matches the data in the corresponding group's 1. A1. On the other hand, if the data of the search word ljj does not match any of the data of the corresponding group, write a message to the storage device 2 that it is a misspelling.
, 3 is sent, 1, 3, illegally (J each!? Lube one?
-(=,
In particular, in the case of a misspelling, the data of the search word is smaller than any of the data in the corresponding 1゛loop (, i) - +' riji (J)',), and I don't agree with the previous data. In this case, Nnonino-3 (the same M-edict) occurred, and 3,5-goteno-no-2.

ノー、とは、2語以]−の甲語のハソン:+、 (iI
′iが同 になろことをい゛)9.シかしながら、こ(
ハよ・“)なジノ。二ノー・は、辞書・11、−格納4
−ろ甲、1ハ(j)総数72000語中32 、;7r
())♂) −Q I’s i)、誤認識は2250語
に対1−. I ;+!−8とFトめ−(−稀に1−5
か/l l−:ないから、:ljj Itl 、、i−
’、’に障はなしら(r)J。
``No'' means 2 or more words] ``Hason'' in the first word of -: +, (iI
9. While I was thinking,
Hayo ") na Jino. Nino is dictionary 11, - storage 4
- Roko, 1ha (j) 32 out of 72,000 words, ;7r
())♂) -Q I's i), erroneous recognition is 1 to 2250 words. I ;+! -8 and F tome-(-rarely 1-5
ka/l l-: Because there is no, :ljj Itl,,i-
There is no obstacle to ','(r)J.

思わl11ろ5、 (発明の効果) 以1説明しj−、ことから明らかな31、′)に、本発
明によA1ば、jli語群を)、自I−ブ分(1(7て
辞、11(σ録Wろ(J当り、上記J\ツノーノ値のf
ンデリ′ノスの(t」数を増減−計ることに31−1て
り゛ノ1. 7i′数、換、−1−4−れば゛グJレー
ーーー7°当ζ)の!)1i菖のIl、’=1数を調整
−4−ろ、二とかご、\ろ4、その場り、rンデ・2層
lスの桁数を充分大1−\く設疋4゛ろことにより、前
記頭文字及び文字数に3Lろ9ル プ分()の場合よi
)らツノループ数を増して、そイ1だlL’7”ル ブ
当l)(ハ中、ia数を減少さ1東ろごとかでΔろ。j
L−i 、スペルチ」!ケの所要時間を短縮−4゛ろこ
とかで、)ろ5、な711、萌詞頭文字伎び文字数に括
づ<′ノ゛ル ブ化にt;いで(J、辞書にσ緑さイ]
るljj語の総数が 定である限り、本発明のよ・′)
なりループ数、−9゛1す′ノ゛ルーーーノ°゛I戸)
のI)I語数の調整は不可能である。
(Effect of the invention) As explained below, it is clear from 31, ') that according to the present invention, A1, jli word group), and own I-b (1 (7)). 11 (σ record Wro (per J, f of the above J\tsunono value
Increasing or decreasing the number (t) of the number 31-1 to calculate the number 1.7i', converting it to -1-4, then the number 7 is 7°. ) 1i irises Il, '=1 Adjust the number -4-ro, 2 and basket, \ro4, spot, rnde, 2nd layer Il, set the number of digits large enough 1-\ku 4 By the way, if the initial letter and number of letters are 3L and 9 loops (), then i
), increase the number of horn loops, then 1 L'7" l) (during the middle, decrease the number of ia, 1 east loop and Δro.j
L-i, Spellch”! Shorten the time required for ``-4゛゛゛゛ word or something,゛゛゛゛゛゛゛゛゚゛゛゛゛゛゛゛゛゛゛゛゛゛゛゛゛゛゛゛゛゛゛゛゛゛゛゛゛゛゛゛゛゛゛゛)゛゛゛゛゛stomach]
As long as the total number of ljj words in the present invention is constant,
Number of loops, -9゛1su'no゛runo゛I door)
I) It is not possible to adjust the number of words.

叉萌述1−ノニよ・−)に、従来は各111語を1文字
中位で′−1−ド化して辞書に登録していたのし対18
、本発明で(Jバッジ、1法の採用に31−〇中語中位
で二11・化して登録する、)−うにしへので、1語当
り、ン)記憶容Mを一定に4ろとともに該1語当り0)
記憶容量を充分小さく十ろことができろ。、従−・て仝
辞書容晴も低減セる。。
Previously, each of the 111 words was registered in the dictionary by changing it to '-1-' with one letter in the middle.
, In the present invention (J badge, 1 method is adopted, 31-0 is registered as 211 in the middle of Chinese) (with 0 per word)
Make the storage capacity sufficiently small. , it also reduces the dictionary appearance. .

更に又、古りル ブに属するデ タ+tyをそA′Iぞ
れWり順に配列1−1てお(jば、万−誤一、へスペル
の単語が入力へれた場合、人力弔語のデ タを辞書の該
当グ゛ル ゾの全デ タと照合・1′ろまてらなく、人
力A1語のデータが該当グル ブのいす、i]かのデー
タより小さくな−、ノ二時点でミススペルの判定をI;
せろので、処理時間の短縮化を図るごとが7′恣ろ。。
Furthermore, the data + ty belonging to the old rubbish are arranged 1-1 in the order of A'I respectively (j, if by mistake, if a spelled word is entered, it will be manually written). Compare the data of the word with all the data of the corresponding group in the dictionary. At this point, judge the misspelling by I;
Because of this, every effort to shorten the processing time is 7' arbitrary. .

(以1・゛余白) 第1表 頭文字 筑 9 夷 ンコ 乙 次 □−一−−〇− 第3表 第4表 第7表 第5表       第6表 第8表(1・゛margin) Table 1 initials Chiku 9 Ii Nko Otsuji □−1−−〇− Table 3 Table 4 Table 7 Table 5 Table 6 Table 8

【図面の簡単な説明】[Brief explanation of drawings]

図面は本発明法を適用しうる言語処理装置の一般構成を
示すブロック図である。 4・・・辞書。
The drawing is a block diagram showing the general configuration of a language processing device to which the method of the present invention can be applied. 4...Dictionary.

Claims (2)

【特許請求の範囲】[Claims] (1)メモリ装置からなる電子辞書に複数の単語を格納
して検索を行うに当り、 予め各アルファベット文字に対し文字ウェイトを定める
とともに単語内の各位置ウェイトを定め、各単語におけ
る語頭の文字について文字ウェイトと位置ウェイトを乗
算した値を予め定めた所定素数で除算して剰余を求め、
引続き後続する各文字について文字ウェイトと位置ウェ
イトの乗算値に前回の剰余を加算した値を上記所定素数
で除算して剰余を求める操作を語尾の文字まで1文字毎
に繰り返して行い、 語尾の文字に対する最終剰余として得られたハッシュ値
を上位一定桁数のインデックスと下位一定桁数のデータ
に分割して各単語のデータを、上記電子辞書にインデッ
クスが共通なグループ毎に登録しておき、 検索すべき単語について上記ハッシュ値を算出し、該検
索単語のデータと上記電子辞書内の検索単語のインデッ
クスに対応するグループのデータ群との一致又は不一致
を照合するようにしたことを特徴とする電子辞書の検索
方法。
(1) When storing multiple words in an electronic dictionary consisting of a memory device and performing a search, a character weight is determined in advance for each alphabetic character, a position weight is determined for each position within the word, and the initial character of each word is determined. Divide the value obtained by multiplying the character weight and position weight by a predetermined prime number to find the remainder,
For each subsequent character, the value obtained by adding the previous remainder to the multiplication value of the character weight and position weight is divided by the above predetermined prime number to obtain the remainder, and the operation is repeated for each character up to the last character of the word. The hash value obtained as the final remainder is divided into an index with a certain number of upper digits and data with a certain number of lower digits, and the data for each word is registered in the electronic dictionary for each group with a common index, and then searched. The electronic device is characterized in that the hash value is calculated for the word to be searched, and the match or mismatch between the data of the search word and the data group of the group corresponding to the index of the search word in the electronic dictionary is checked. How to search a dictionary.
(2)各グループに属するデータ群を数値の小さい順に
登録した特許請求の範囲第1項に記載の方法。
(2) The method according to claim 1, in which data groups belonging to each group are registered in order of decreasing numerical value.
JP60215691A 1985-09-27 1985-09-27 Retrieving method for electronic dictionary Granted JPS6274153A (en)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP60215691A JPS6274153A (en) 1985-09-27 1985-09-27 Retrieving method for electronic dictionary
US07/646,358 US5297038A (en) 1985-09-27 1991-01-25 Electronic dictionary and method of codifying words therefor

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP60215691A JPS6274153A (en) 1985-09-27 1985-09-27 Retrieving method for electronic dictionary

Publications (2)

Publication Number Publication Date
JPS6274153A true JPS6274153A (en) 1987-04-04
JPH0378667B2 JPH0378667B2 (en) 1991-12-16

Family

ID=16676558

Family Applications (1)

Application Number Title Priority Date Filing Date
JP60215691A Granted JPS6274153A (en) 1985-09-27 1985-09-27 Retrieving method for electronic dictionary

Country Status (1)

Country Link
JP (1) JPS6274153A (en)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS63271533A (en) * 1987-04-28 1988-11-09 Nec Corp Reference solution system for name of translation system
JPH01162951A (en) * 1987-12-19 1989-06-27 Fujitsu Ltd File managing system

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS63271533A (en) * 1987-04-28 1988-11-09 Nec Corp Reference solution system for name of translation system
JPH01162951A (en) * 1987-12-19 1989-06-27 Fujitsu Ltd File managing system

Also Published As

Publication number Publication date
JPH0378667B2 (en) 1991-12-16

Similar Documents

Publication Publication Date Title
US5119296A (en) Method and apparatus for inputting radical-encoded chinese characters
US6172625B1 (en) Disambiguation method and apparatus, and dictionary data compression techniques
US4383307A (en) Spelling error detector apparatus and methods
CN100549915C (en) Go polysemy voice entry system and method
US8745077B2 (en) Searching and matching of data
US4903206A (en) Spelling error correcting system
US20040095327A1 (en) Alphanumeric data input system and method
US5475767A (en) Method of inputting Chinese characters using the holo-information code for Chinese characters and keyboard therefor
JPH08211987A (en) Keyboard provided with solution logic of fuzziness
US9396201B2 (en) Method of data sorting
US5331557A (en) Audio-video coding system for Chinese characters
US5297038A (en) Electronic dictionary and method of codifying words therefor
US4747053A (en) Electronic dictionary
EP0575192B1 (en) Finite state automaton text search apparatus having two-level memory structure
CN100403239C (en) Tibetan input method based on English keyboard
US20140253457A1 (en) Inputting Chinese Characters
JPS6274153A (en) Retrieving method for electronic dictionary
US5137383A (en) Chinese and Roman alphabet keyboard arrangement
CN114595665A (en) Method for constructing binary extremely-short code word character and word coding set
JPS62165238A (en) Retrieving method for electronic dictionary
CN100371866C (en) Fast and convenient inputting method with code number and pictograph
CN116011430B (en) Vowel duplication elimination method, nonvolatile readable storage medium and electronic equipment
JPS5960691A (en) Optical character reader
CN101901062B (en) Computer Chinese character information processing method based on phoneme encoding
US20230004730A1 (en) Chinese Character Input Method, System and Keyboard