JPH10105578A - Similar word retrieving method utilizing point - Google Patents

Similar word retrieving method utilizing point

Info

Publication number
JPH10105578A
JPH10105578A JP9244280A JP24428097A JPH10105578A JP H10105578 A JPH10105578 A JP H10105578A JP 9244280 A JP9244280 A JP 9244280A JP 24428097 A JP24428097 A JP 24428097A JP H10105578 A JPH10105578 A JP H10105578A
Authority
JP
Japan
Prior art keywords
point
stage
input key
score
input
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP9244280A
Other languages
Japanese (ja)
Inventor
Yokei Boku
容圭 朴
Kosho Zen
孝渉 全
Eikun Ri
永勲 李
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
KOREA TELECOMMUN
Original Assignee
KOREA TELECOMMUN
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by KOREA TELECOMMUN filed Critical KOREA TELECOMMUN
Publication of JPH10105578A publication Critical patent/JPH10105578A/en
Pending legal-status Critical Current

Links

Landscapes

  • Machine Translation (AREA)
  • Document Processing Apparatus (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

PROBLEM TO BE SOLVED: To provide an algorithm for enabling access to required information only with known information when a user does not know the exact name of an object to be retrieved. SOLUTION: This similar word retrieving method utilizing point is composed of a stage for inputting an input key to be retrieved to an input part 10 while utilizing an input device, stage for calculating the point of a comparison object word by matching the input key with the comparison object word stocked in a stock part 13 through a calculation part 11, stage for sorting the comparison object words, of which the points are calculated in the calculation stage, by point rankings at the calculation part 11, and stage for displaying the sorted words by point rankings at an output part 12. Then, when constructing a data base, the point is applied for the unit of spelling or syllable in data and data are displayed in order from the highest point so that the exact input key can be retrieved.

Description

【発明の詳細な説明】DETAILED DESCRIPTION OF THE INVENTION

【0001】[0001]

【発明の属する技術分野】本発明は類似単語検索方法に
関し、特に、データベースに点数を付与して入力キーに
対するデータベース内のデータの点数の高低により情報
を検索するための点数を利用した類似単語検索方法に関
するものである。
BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to a similar word search method, and more particularly to a similar word search using a score for assigning a score to a database and searching for information according to the level of data in the database with respect to an input key. It is about the method.

【0002】[0002]

【従来の技術】現在、全世界的に情報の重要性が認識さ
れるに伴い、殆ど全ての情報がデータベース化されてお
り、情報使用者はこれらデータベースにアクセスして必
要な情報を抽出している。また、これらデータベースに
貯蔵された多様な情報を効率的に抽出するために多様な
アルゴリズムが用いられている。
2. Description of the Related Art At present, as the importance of information is recognized worldwide, almost all information is stored in a database. An information user accesses these databases to extract necessary information. I have. Also, various algorithms are used to efficiently extract various information stored in these databases.

【0003】[0003]

【発明が解決しようとする課題】従来の情報データベー
ス検索方法はツリー構造を基本に採用している。この方
法は種々な段階を経て使用者が望む情報にアクセスし得
るようにしているため、情報のアクセスに多量の時間を
必要とし、またツリー上で使用者が望む情報の位置を正
確に知ることができないため情報のアクセスに種々の不
具合が生じる。
A conventional information database search method employs a tree structure as a basic method. Since this method allows the user to access the desired information through various steps, it takes a lot of time to access the information, and it is necessary to know the exact position of the desired information on the tree. Because of this, various problems occur in access to information.

【0004】この不具合を補うため、“go KBS ”のよ
うなジャンプ機能を付加したツリー構造アクセス方法を
用いれば、速やかに必要な情報にアクセスすることがで
きる。しかし、この方法は、電話番号案内サービスに適
用した場合、使用者が着信地の名称を正確に知っていな
ければならない問題点を有している。即ち、電話番号案
内サービスでは、使用者が探そうとする人名を正確に知
っている場合には使用者が望む電話番号を探すことがで
きるが、次のように間違って知っている場合が非常に多
い。
If a tree structure access method with a jump function such as "go KBS" is used to make up for this problem, necessary information can be quickly accessed. However, this method has a problem that when applied to a telephone directory service, the user must know the name of the destination accurately. That is, the telephone number guide service can search for the telephone number desired by the user if the user knows the exact name of the person he is trying to find. Many

【外1】 [Outside 1]

【0005】従って、本発明は、使用者が検索しようと
する対象の正確な名称を知らない場合であっても、知っ
ている情報のみで必要な情報にアクセスできるようにす
るアルゴリズムを提供することを目的とする。
[0005] Accordingly, the present invention provides an algorithm that allows a user to access necessary information with only known information even when the user does not know the exact name of the object to be searched. With the goal.

【0006】[0006]

【課題を解決するための手段】前記目的を達成するた
め、本発明の点数を利用した類似単語検索方法は、入力
装置を利用して検索しようとする入力キーを入力する段
階と、入力キーと貯蔵部に貯蔵された比較対象単語とを
マッチングさせて比較対象単語の点数を計算する段階
と、前記計算段階で点数を計算された比較対象単語を点
数順位別にソーティングする段階と、ソーティングされ
た単語を点数順位別に表示する段階とよりなることを特
徴とするものである。
To achieve the above object, according to the present invention, there is provided a similar word search method using a score, comprising the steps of: inputting an input key to be searched using an input device; Calculating a score of the comparison target word by matching the comparison target word stored in the storage unit; sorting the comparison target words whose scores have been calculated in the calculation step according to a score ranking; and sorting the sorted words. Are displayed for each score order.

【0007】本発明方法によれば、データベースの構築
の際、データのスペル単位、又は音節単位に点数を与え
て一番高い点数を取得した順にデータを表示することに
より、正確な入力キーを検索できるようにすることがで
きる。
According to the method of the present invention, when constructing a database, data is displayed in the order in which the highest score is obtained by giving a score to each spelling unit or syllable unit, thereby searching for an accurate input key. You can do it.

【0008】本発明は、情報検索で入力キーを用いる場
合に生じ得る誤った入力と、同一の物体や対象の略字を
多様に用いることにより発生する入力キーの問題点とを
解決するため提案された方法である。例えば、
The present invention has been proposed to solve the problem of erroneous input that may occur when input keys are used in information retrieval and the problem of input keys that occur when various abbreviations of the same object or object are used. It is a method. For example,

【外2】 [Outside 2]

【0009】上述した目的及びその他の目的と特徴、長
所は添付の図面と関連して、次の詳細な説明を介して一
層明らかになるはずである。
The above and other objects, features and advantages will become more apparent through the following detailed description in conjunction with the accompanying drawings.

【0010】[0010]

【発明の実施の形態】以下、本発明の実施形態を図面に
基づき詳細に説明する。図1は、本発明に基づく類似単
語検索方法を実施するための装置のブロック図である。
図1に基づく装置は以下のように動作する。即ち、キー
ボード等の入力装置によりデータが入力部(10)に入
力された後、計算部(11)では、入力データの比較対
象単語の全ての可能な方法に対しマッチングを行って比
較対象単語の点数を計算した後、点数の高い順にソーテ
ィングして出力部(12)で表示する。計算部(11)
で用いる比較対象単語は貯蔵部(13)から持ってくる
ことになるが、貯蔵部(13)では、データベース内の
データが重要度に応じて既に点数が与えられた状態で貯
蔵されている。
Embodiments of the present invention will be described below in detail with reference to the drawings. FIG. 1 is a block diagram of an apparatus for implementing a similar word search method according to the present invention.
The device according to FIG. 1 operates as follows. That is, after data is input to the input unit (10) by an input device such as a keyboard, the calculation unit (11) performs matching for all possible methods of the comparison target word of the input data, and performs the matching of the comparison target word. After calculating the points, the points are sorted in descending order of the points and displayed on the output unit (12). Calculation unit (11)
The comparison target word used in (1) is fetched from the storage unit (13). In the storage unit (13), the data in the database is stored in a state where a score is already given according to the importance.

【外3】 [Outside 3]

【0011】図2には、本発明に係る一実施形態が現わ
されている。図2は、構築されているデータベースが3
つの状態を有する場合の、点数を算出するための検索ア
ルゴリズム状態順序を表す図である。本実施形態では、
データベース構築の際には、各状態(S1,S2,S3)別に
点数を与える。この際、各状態の点数は状態の重要度に
応じてそれぞれ別途に与えることが可能である。このよ
うな状況で、この入力キーに対する点数は図2のように
左側から右側に入力キーとデータベースの状態とを比較
して、入力キーと異なる場合にはその状態をスキップ
し、同ーである場合には点数を合算して、最終的に出さ
れた種々な点数中の一番高い点数を有するものから順に
整列させる。
FIG. 2 shows an embodiment according to the present invention. FIG. 2 shows that the constructed database is 3
It is a figure showing the search algorithm state order for calculating a score when there are two states. In this embodiment,
When constructing a database, a score is given for each state (S1, S2, S3). At this time, the score of each state can be separately given according to the importance of the state. In such a situation, the score for this input key is compared from the left to the right as shown in FIG. 2 and the state of the database is compared with the state of the input key. In such a case, the scores are summed up and sorted in order from the one having the highest score among the various scores finally issued.

【外4】 [Outside 4]

【0012】図5は、本発明に係るさらに他の実施形態
として、英文“KOREA ”という単語を検索しようとする
場合の検索アルゴリズムの状態順序を示す図である。英
文の場合には英文アルファベット単位に点数を与えてデ
ータベースを構築する。検索者が入力キーを“COREA ”
と誤って入力した場合にも“KOREA ”というデータが4
0点を得て正確な入力キーとして表示される確率が高
い。
FIG. 5 is a diagram showing a state order of a search algorithm when an attempt is made to search for the word "KOREA" in English as yet another embodiment according to the present invention. In the case of English sentences, a database is constructed by giving points in English alphabet units. Searcher changes input key to "COREA"
"KOREA" will be displayed even if you mistakenly enter
There is a high probability that a point is obtained and displayed as an accurate input key.

【0013】図6は、本発明に係るさらに他の実施形態
として、英文“International Business Machine ”を
検索しようとする場合の検索アルゴリズムの状態順序を
示す図である。一般に、前記英文は“IBM ”でさらに広
く知られており、その正確な名称を知っている者はあま
り多くないと推定される。この場合にも本発明の点数を
利用した類似単語検索方法によれば、入力キーで“IBM
”を選択した場合であっても、図6に示すように“Int
ernational Business Machine”をデータベースに構築
する際、“I”,“B”,“M”のような重要なアルフ
ァベットにはそれぞれ10点ずつを与え、残りにはそれ
より非常に小さい1点ずつを与えることにより、検索し
ようとする対象の正確な名称を知らなくても、その略称
のみを利用して正確な入力キーを検索することができ
る。
FIG. 6 is a diagram showing a state order of a search algorithm when a search is made for an English sentence "International Business Machine" according to yet another embodiment of the present invention. Generally, the English sentence is more widely known as "IBM" and it is presumed that few people know the exact name. Also in this case, according to the similar word search method using the score of the present invention, "IBM
"Is selected as shown in FIG.
When building the "European Business Machine" in the database, give 10 points to important alphabets such as "I", "B", and "M", and give a very small point to the rest. Thus, an accurate input key can be searched using only the abbreviation without knowing the exact name of the search target.

【0014】なお、本発明による点数を利用した類似単
語検索方法は、入力キーとデータベースマッチングに一
定の時間が要求されるが、技術の急激な発展によりコン
ピュータの性能もまた急激に向上しているため、このよ
うなマッチングに伴う速度の問題は解決することが可能
である。
In the similar word search method using scores according to the present invention, a certain time is required for input key and database matching, but the performance of a computer is also rapidly improving due to rapid development of technology. Therefore, it is possible to solve the problem of speed associated with such matching.

【0015】本発明の好ましい実施形態は例示の目的を
開示したものであり、当業者であれば本発明の思想と範
囲内で多様な修正、変更、付加等が可能であり、このよ
うな修正変更等は上述した特許請求の範囲に属するもの
と見なすべきである。
The preferred embodiments of the present invention disclose an example, and those skilled in the art can make various modifications, changes, additions, etc. within the spirit and scope of the present invention. Modifications and the like should be considered as belonging to the appended claims.

【0016】[0016]

【発明の効果】前述したように本発明は、使用者自身が
知っている情報や用語のみを利用して必要な情報にアク
セスできるよう支援するため、全てのデータベース情報
検索時に、入力キーを用いる場合(情報提供データベー
ス、電話番号検索サービス等)や、コンピュータのワー
ドプロセッサで単語(文字群又は単語群)の誤謬を例え
ば綴字法により訂正する場合等、情報通信産業分野での
活用が可能である。
As described above, the present invention uses an input key when searching for all database information in order to assist the user in accessing necessary information using only information and terms known to the user himself / herself. It can be used in the field of information and communication industry, for example, when an error in a word (character group or word group) is corrected by a spelling method using a computer word processor.

【図面の簡単な説明】[Brief description of the drawings]

【図1】図1は、本発明に基づく類似単語検索方法を実
施するための装置のブロック図である。
FIG. 1 is a block diagram of an apparatus for implementing a similar word search method according to the present invention.

【図2】図2は、本発明に基づく3個の文字の検索アル
ゴリズム状態順序を表わす図である。
FIG. 2 is a diagram showing a search algorithm state sequence of three characters according to the present invention.

【図3】図3は、本発明に基づくハングル8個の文字
(韓国電気通信公社)の検索アルゴリズム状態順序を表
わす図である。
FIG. 3 is a diagram showing a search algorithm state order of eight Korean characters (Korea Telecommunications Corporation) based on the present invention.

【図4】図4は、図3の状態順序図に基づくFIG. 4 is based on the state sequence diagram of FIG. 3;

【外5】 [Outside 5]

【図5】図5は、本発明に基づく英文5個の文字(KORE
A )の検索アルゴリズムの状態順序を示す図である。
FIG. 5 is a diagram showing five letters (KORE) according to the present invention.
FIG. 4A is a diagram showing a state order of the search algorithm of FIG.

【図6】図6は、本発明に基づく英文“International
Business Machine”の検索アルゴリズムの状態順序を示
す図である。
FIG. 6 is a diagram illustrating the English language “International” according to the present invention;
FIG. 21 is a diagram showing a state order of a search algorithm of “Business Machine”.

【符号の説明】[Explanation of symbols]

10 入力部 11 計算部 12 出力部 13 貯蔵部 DESCRIPTION OF SYMBOLS 10 Input part 11 Calculation part 12 Output part 13 Storage part

Claims (1)

【特許請求の範囲】[Claims] 【請求項1】 入力装置を利用して検索しようとする入
力キーを入力する段階と、 入力キーと貯蔵部に貯蔵された比較対象単語とをマッチ
ングさせて比較対象単語の点数を計算する段階と、 前記計算段階で点数を計算された比較対象単語を点数順
位別にソーティングする段階と、 ソーティングされた単語を点数順位別に表示する段階と
よりなることを特徴とする点数を利用した類似単語検索
方法。
A step of inputting an input key to be searched using an input device; and a step of calculating a score of the comparison target word by matching the input key with a comparison target word stored in a storage unit. A similar word search method using a score, comprising: sorting the words to be compared whose scores have been calculated in the calculation step according to the score ranking; and displaying the sorted words according to the score ranking.
JP9244280A 1996-09-09 1997-09-09 Similar word retrieving method utilizing point Pending JPH10105578A (en)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
KR96-38862 1996-09-09
KR1019960038862A KR19980020385A (en) 1996-09-09 1996-09-09 How to search similar words using score

Publications (1)

Publication Number Publication Date
JPH10105578A true JPH10105578A (en) 1998-04-24

Family

ID=19473095

Family Applications (1)

Application Number Title Priority Date Filing Date
JP9244280A Pending JPH10105578A (en) 1996-09-09 1997-09-09 Similar word retrieving method utilizing point

Country Status (2)

Country Link
JP (1) JPH10105578A (en)
KR (1) KR19980020385A (en)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2007097531A1 (en) * 2006-02-21 2007-08-30 Dong Arm Kim Method and apparatus for providing search result using language chain
JP2010211256A (en) * 2009-03-06 2010-09-24 Sky Co Ltd Formal name determination system and program

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100408965B1 (en) * 2000-06-26 2003-12-06 주식회사쓰리소프트 A method for providing search result including recommendation of search condition, and a server thereof

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH01193928A (en) * 1988-01-28 1989-08-03 Chugoku Nippon Denki Software Kk Information retrieval system with inference mechanism
JPH02232768A (en) * 1989-03-07 1990-09-14 Yamaha Corp Data retrieving system
JPH06325091A (en) * 1993-05-13 1994-11-25 Nippon Telegr & Teleph Corp <Ntt> Similarity evaluation type data base retrieval device
JPH08166966A (en) * 1994-12-15 1996-06-25 Sony Corp Dictionary retrieval device, database device, character recognizing device, speech recognition device and sentence correction device

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH01193928A (en) * 1988-01-28 1989-08-03 Chugoku Nippon Denki Software Kk Information retrieval system with inference mechanism
JPH02232768A (en) * 1989-03-07 1990-09-14 Yamaha Corp Data retrieving system
JPH06325091A (en) * 1993-05-13 1994-11-25 Nippon Telegr & Teleph Corp <Ntt> Similarity evaluation type data base retrieval device
JPH08166966A (en) * 1994-12-15 1996-06-25 Sony Corp Dictionary retrieval device, database device, character recognizing device, speech recognition device and sentence correction device

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100819846B1 (en) 2005-04-08 2008-04-07 김동암 Method For Providing Query Language Chain Made from Informations For Internet Search
US8131707B2 (en) 2005-04-08 2012-03-06 Dong Arm Kim Method and apparatus for providing search result using language chain
WO2007097531A1 (en) * 2006-02-21 2007-08-30 Dong Arm Kim Method and apparatus for providing search result using language chain
JP2010211256A (en) * 2009-03-06 2010-09-24 Sky Co Ltd Formal name determination system and program

Also Published As

Publication number Publication date
KR19980020385A (en) 1998-06-25

Similar Documents

Publication Publication Date Title
Park et al. Hybrid text mining for finding abbreviations and their definitions
US6256630B1 (en) Word-containing database accessing system for responding to ambiguous queries, including a dictionary of database words, a dictionary searcher and a database searcher
US10402493B2 (en) System and method for inputting text into electronic devices
JP3041268B2 (en) Chinese Error Checking (CEC) System
US7536297B2 (en) System and method for hybrid text mining for finding abbreviations and their definitions
US5794177A (en) Method and apparatus for morphological analysis and generation of natural language text
CN102708095B (en) Select the method for the language being used for text segmentation
WO1997004405A9 (en) Method and apparatus for automated search and retrieval processing
CN101815996A (en) Detect name entities and neologisms
KR20010024309A (en) Reduced keyboard disambiguating system
JPH1145241A (en) Japanese syllabary-chinese character conversion system and computer-readable recording medium where programs making computer function as means of same system is recorded
EP0775963B1 (en) Indexing a database by finite-state transducer
US20040186706A1 (en) Translation system, dictionary updating server, translation method, and program and recording medium for use therein
WO2003085562A9 (en) Searching a database with a key table
JPH0652221A (en) Automatic extracting system for proper noun
JPH10105578A (en) Similar word retrieving method utilizing point
JPH0778183A (en) Data base retrieving system
KR100376931B1 (en) A Method of Database System Implementation for Korean-English Translation Using Information Retrieval Techniques
JPH09319767A (en) Synonym dictionary registering method
JPH07182333A (en) Japanese processor
KR100452024B1 (en) Searching engine and searching method
JP2821213B2 (en) Database matching method
JPH05113964A (en) Electronic dictionary
JP2006178865A (en) Device, method and program for extracting intrinsic expression, and recording medium with the program recorded thereon
JP3161660B2 (en) Keyword search method