JPH10105578A - Similar word retrieving method utilizing point - Google Patents
Similar word retrieving method utilizing pointInfo
- Publication number
- JPH10105578A JPH10105578A JP9244280A JP24428097A JPH10105578A JP H10105578 A JPH10105578 A JP H10105578A JP 9244280 A JP9244280 A JP 9244280A JP 24428097 A JP24428097 A JP 24428097A JP H10105578 A JPH10105578 A JP H10105578A
- Authority
- JP
- Japan
- Prior art keywords
- point
- stage
- input key
- score
- input
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Landscapes
- Machine Translation (AREA)
- Document Processing Apparatus (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
Description
【0001】[0001]
【発明の属する技術分野】本発明は類似単語検索方法に
関し、特に、データベースに点数を付与して入力キーに
対するデータベース内のデータの点数の高低により情報
を検索するための点数を利用した類似単語検索方法に関
するものである。BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to a similar word search method, and more particularly to a similar word search using a score for assigning a score to a database and searching for information according to the level of data in the database with respect to an input key. It is about the method.
【0002】[0002]
【従来の技術】現在、全世界的に情報の重要性が認識さ
れるに伴い、殆ど全ての情報がデータベース化されてお
り、情報使用者はこれらデータベースにアクセスして必
要な情報を抽出している。また、これらデータベースに
貯蔵された多様な情報を効率的に抽出するために多様な
アルゴリズムが用いられている。2. Description of the Related Art At present, as the importance of information is recognized worldwide, almost all information is stored in a database. An information user accesses these databases to extract necessary information. I have. Also, various algorithms are used to efficiently extract various information stored in these databases.
【0003】[0003]
【発明が解決しようとする課題】従来の情報データベー
ス検索方法はツリー構造を基本に採用している。この方
法は種々な段階を経て使用者が望む情報にアクセスし得
るようにしているため、情報のアクセスに多量の時間を
必要とし、またツリー上で使用者が望む情報の位置を正
確に知ることができないため情報のアクセスに種々の不
具合が生じる。A conventional information database search method employs a tree structure as a basic method. Since this method allows the user to access the desired information through various steps, it takes a lot of time to access the information, and it is necessary to know the exact position of the desired information on the tree. Because of this, various problems occur in access to information.
【0004】この不具合を補うため、“go KBS ”のよ
うなジャンプ機能を付加したツリー構造アクセス方法を
用いれば、速やかに必要な情報にアクセスすることがで
きる。しかし、この方法は、電話番号案内サービスに適
用した場合、使用者が着信地の名称を正確に知っていな
ければならない問題点を有している。即ち、電話番号案
内サービスでは、使用者が探そうとする人名を正確に知
っている場合には使用者が望む電話番号を探すことがで
きるが、次のように間違って知っている場合が非常に多
い。If a tree structure access method with a jump function such as "go KBS" is used to make up for this problem, necessary information can be quickly accessed. However, this method has a problem that when applied to a telephone directory service, the user must know the name of the destination accurately. That is, the telephone number guide service can search for the telephone number desired by the user if the user knows the exact name of the person he is trying to find. Many
【外1】 [Outside 1]
【0005】従って、本発明は、使用者が検索しようと
する対象の正確な名称を知らない場合であっても、知っ
ている情報のみで必要な情報にアクセスできるようにす
るアルゴリズムを提供することを目的とする。[0005] Accordingly, the present invention provides an algorithm that allows a user to access necessary information with only known information even when the user does not know the exact name of the object to be searched. With the goal.
【0006】[0006]
【課題を解決するための手段】前記目的を達成するた
め、本発明の点数を利用した類似単語検索方法は、入力
装置を利用して検索しようとする入力キーを入力する段
階と、入力キーと貯蔵部に貯蔵された比較対象単語とを
マッチングさせて比較対象単語の点数を計算する段階
と、前記計算段階で点数を計算された比較対象単語を点
数順位別にソーティングする段階と、ソーティングされ
た単語を点数順位別に表示する段階とよりなることを特
徴とするものである。To achieve the above object, according to the present invention, there is provided a similar word search method using a score, comprising the steps of: inputting an input key to be searched using an input device; Calculating a score of the comparison target word by matching the comparison target word stored in the storage unit; sorting the comparison target words whose scores have been calculated in the calculation step according to a score ranking; and sorting the sorted words. Are displayed for each score order.
【0007】本発明方法によれば、データベースの構築
の際、データのスペル単位、又は音節単位に点数を与え
て一番高い点数を取得した順にデータを表示することに
より、正確な入力キーを検索できるようにすることがで
きる。According to the method of the present invention, when constructing a database, data is displayed in the order in which the highest score is obtained by giving a score to each spelling unit or syllable unit, thereby searching for an accurate input key. You can do it.
【0008】本発明は、情報検索で入力キーを用いる場
合に生じ得る誤った入力と、同一の物体や対象の略字を
多様に用いることにより発生する入力キーの問題点とを
解決するため提案された方法である。例えば、The present invention has been proposed to solve the problem of erroneous input that may occur when input keys are used in information retrieval and the problem of input keys that occur when various abbreviations of the same object or object are used. It is a method. For example,
【外2】 [Outside 2]
【0009】上述した目的及びその他の目的と特徴、長
所は添付の図面と関連して、次の詳細な説明を介して一
層明らかになるはずである。The above and other objects, features and advantages will become more apparent through the following detailed description in conjunction with the accompanying drawings.
【0010】[0010]
【発明の実施の形態】以下、本発明の実施形態を図面に
基づき詳細に説明する。図1は、本発明に基づく類似単
語検索方法を実施するための装置のブロック図である。
図1に基づく装置は以下のように動作する。即ち、キー
ボード等の入力装置によりデータが入力部(10)に入
力された後、計算部(11)では、入力データの比較対
象単語の全ての可能な方法に対しマッチングを行って比
較対象単語の点数を計算した後、点数の高い順にソーテ
ィングして出力部(12)で表示する。計算部(11)
で用いる比較対象単語は貯蔵部(13)から持ってくる
ことになるが、貯蔵部(13)では、データベース内の
データが重要度に応じて既に点数が与えられた状態で貯
蔵されている。Embodiments of the present invention will be described below in detail with reference to the drawings. FIG. 1 is a block diagram of an apparatus for implementing a similar word search method according to the present invention.
The device according to FIG. 1 operates as follows. That is, after data is input to the input unit (10) by an input device such as a keyboard, the calculation unit (11) performs matching for all possible methods of the comparison target word of the input data, and performs the matching of the comparison target word. After calculating the points, the points are sorted in descending order of the points and displayed on the output unit (12). Calculation unit (11)
The comparison target word used in (1) is fetched from the storage unit (13). In the storage unit (13), the data in the database is stored in a state where a score is already given according to the importance.
【外3】 [Outside 3]
【0011】図2には、本発明に係る一実施形態が現わ
されている。図2は、構築されているデータベースが3
つの状態を有する場合の、点数を算出するための検索ア
ルゴリズム状態順序を表す図である。本実施形態では、
データベース構築の際には、各状態(S1,S2,S3)別に
点数を与える。この際、各状態の点数は状態の重要度に
応じてそれぞれ別途に与えることが可能である。このよ
うな状況で、この入力キーに対する点数は図2のように
左側から右側に入力キーとデータベースの状態とを比較
して、入力キーと異なる場合にはその状態をスキップ
し、同ーである場合には点数を合算して、最終的に出さ
れた種々な点数中の一番高い点数を有するものから順に
整列させる。FIG. 2 shows an embodiment according to the present invention. FIG. 2 shows that the constructed database is 3
It is a figure showing the search algorithm state order for calculating a score when there are two states. In this embodiment,
When constructing a database, a score is given for each state (S1, S2, S3). At this time, the score of each state can be separately given according to the importance of the state. In such a situation, the score for this input key is compared from the left to the right as shown in FIG. 2 and the state of the database is compared with the state of the input key. In such a case, the scores are summed up and sorted in order from the one having the highest score among the various scores finally issued.
【外4】 [Outside 4]
【0012】図5は、本発明に係るさらに他の実施形態
として、英文“KOREA ”という単語を検索しようとする
場合の検索アルゴリズムの状態順序を示す図である。英
文の場合には英文アルファベット単位に点数を与えてデ
ータベースを構築する。検索者が入力キーを“COREA ”
と誤って入力した場合にも“KOREA ”というデータが4
0点を得て正確な入力キーとして表示される確率が高
い。FIG. 5 is a diagram showing a state order of a search algorithm when an attempt is made to search for the word "KOREA" in English as yet another embodiment according to the present invention. In the case of English sentences, a database is constructed by giving points in English alphabet units. Searcher changes input key to "COREA"
"KOREA" will be displayed even if you mistakenly enter
There is a high probability that a point is obtained and displayed as an accurate input key.
【0013】図6は、本発明に係るさらに他の実施形態
として、英文“International Business Machine ”を
検索しようとする場合の検索アルゴリズムの状態順序を
示す図である。一般に、前記英文は“IBM ”でさらに広
く知られており、その正確な名称を知っている者はあま
り多くないと推定される。この場合にも本発明の点数を
利用した類似単語検索方法によれば、入力キーで“IBM
”を選択した場合であっても、図6に示すように“Int
ernational Business Machine”をデータベースに構築
する際、“I”,“B”,“M”のような重要なアルフ
ァベットにはそれぞれ10点ずつを与え、残りにはそれ
より非常に小さい1点ずつを与えることにより、検索し
ようとする対象の正確な名称を知らなくても、その略称
のみを利用して正確な入力キーを検索することができ
る。FIG. 6 is a diagram showing a state order of a search algorithm when a search is made for an English sentence "International Business Machine" according to yet another embodiment of the present invention. Generally, the English sentence is more widely known as "IBM" and it is presumed that few people know the exact name. Also in this case, according to the similar word search method using the score of the present invention, "IBM
"Is selected as shown in FIG.
When building the "European Business Machine" in the database, give 10 points to important alphabets such as "I", "B", and "M", and give a very small point to the rest. Thus, an accurate input key can be searched using only the abbreviation without knowing the exact name of the search target.
【0014】なお、本発明による点数を利用した類似単
語検索方法は、入力キーとデータベースマッチングに一
定の時間が要求されるが、技術の急激な発展によりコン
ピュータの性能もまた急激に向上しているため、このよ
うなマッチングに伴う速度の問題は解決することが可能
である。In the similar word search method using scores according to the present invention, a certain time is required for input key and database matching, but the performance of a computer is also rapidly improving due to rapid development of technology. Therefore, it is possible to solve the problem of speed associated with such matching.
【0015】本発明の好ましい実施形態は例示の目的を
開示したものであり、当業者であれば本発明の思想と範
囲内で多様な修正、変更、付加等が可能であり、このよ
うな修正変更等は上述した特許請求の範囲に属するもの
と見なすべきである。The preferred embodiments of the present invention disclose an example, and those skilled in the art can make various modifications, changes, additions, etc. within the spirit and scope of the present invention. Modifications and the like should be considered as belonging to the appended claims.
【0016】[0016]
【発明の効果】前述したように本発明は、使用者自身が
知っている情報や用語のみを利用して必要な情報にアク
セスできるよう支援するため、全てのデータベース情報
検索時に、入力キーを用いる場合(情報提供データベー
ス、電話番号検索サービス等)や、コンピュータのワー
ドプロセッサで単語(文字群又は単語群)の誤謬を例え
ば綴字法により訂正する場合等、情報通信産業分野での
活用が可能である。As described above, the present invention uses an input key when searching for all database information in order to assist the user in accessing necessary information using only information and terms known to the user himself / herself. It can be used in the field of information and communication industry, for example, when an error in a word (character group or word group) is corrected by a spelling method using a computer word processor.
【図1】図1は、本発明に基づく類似単語検索方法を実
施するための装置のブロック図である。FIG. 1 is a block diagram of an apparatus for implementing a similar word search method according to the present invention.
【図2】図2は、本発明に基づく3個の文字の検索アル
ゴリズム状態順序を表わす図である。FIG. 2 is a diagram showing a search algorithm state sequence of three characters according to the present invention.
【図3】図3は、本発明に基づくハングル8個の文字
(韓国電気通信公社)の検索アルゴリズム状態順序を表
わす図である。FIG. 3 is a diagram showing a search algorithm state order of eight Korean characters (Korea Telecommunications Corporation) based on the present invention.
【図4】図4は、図3の状態順序図に基づくFIG. 4 is based on the state sequence diagram of FIG. 3;
【外5】 [Outside 5]
【図5】図5は、本発明に基づく英文5個の文字(KORE
A )の検索アルゴリズムの状態順序を示す図である。FIG. 5 is a diagram showing five letters (KORE) according to the present invention.
FIG. 4A is a diagram showing a state order of the search algorithm of FIG.
【図6】図6は、本発明に基づく英文“International
Business Machine”の検索アルゴリズムの状態順序を示
す図である。FIG. 6 is a diagram illustrating the English language “International” according to the present invention;
FIG. 21 is a diagram showing a state order of a search algorithm of “Business Machine”.
10 入力部 11 計算部 12 出力部 13 貯蔵部 DESCRIPTION OF SYMBOLS 10 Input part 11 Calculation part 12 Output part 13 Storage part
Claims (1)
力キーを入力する段階と、 入力キーと貯蔵部に貯蔵された比較対象単語とをマッチ
ングさせて比較対象単語の点数を計算する段階と、 前記計算段階で点数を計算された比較対象単語を点数順
位別にソーティングする段階と、 ソーティングされた単語を点数順位別に表示する段階と
よりなることを特徴とする点数を利用した類似単語検索
方法。A step of inputting an input key to be searched using an input device; and a step of calculating a score of the comparison target word by matching the input key with a comparison target word stored in a storage unit. A similar word search method using a score, comprising: sorting the words to be compared whose scores have been calculated in the calculation step according to the score ranking; and displaying the sorted words according to the score ranking.
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR96-38862 | 1996-09-09 | ||
KR1019960038862A KR19980020385A (en) | 1996-09-09 | 1996-09-09 | How to search similar words using score |
Publications (1)
Publication Number | Publication Date |
---|---|
JPH10105578A true JPH10105578A (en) | 1998-04-24 |
Family
ID=19473095
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP9244280A Pending JPH10105578A (en) | 1996-09-09 | 1997-09-09 | Similar word retrieving method utilizing point |
Country Status (2)
Country | Link |
---|---|
JP (1) | JPH10105578A (en) |
KR (1) | KR19980020385A (en) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2007097531A1 (en) * | 2006-02-21 | 2007-08-30 | Dong Arm Kim | Method and apparatus for providing search result using language chain |
JP2010211256A (en) * | 2009-03-06 | 2010-09-24 | Sky Co Ltd | Formal name determination system and program |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR100408965B1 (en) * | 2000-06-26 | 2003-12-06 | 주식회사쓰리소프트 | A method for providing search result including recommendation of search condition, and a server thereof |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH01193928A (en) * | 1988-01-28 | 1989-08-03 | Chugoku Nippon Denki Software Kk | Information retrieval system with inference mechanism |
JPH02232768A (en) * | 1989-03-07 | 1990-09-14 | Yamaha Corp | Data retrieving system |
JPH06325091A (en) * | 1993-05-13 | 1994-11-25 | Nippon Telegr & Teleph Corp <Ntt> | Similarity evaluation type data base retrieval device |
JPH08166966A (en) * | 1994-12-15 | 1996-06-25 | Sony Corp | Dictionary retrieval device, database device, character recognizing device, speech recognition device and sentence correction device |
-
1996
- 1996-09-09 KR KR1019960038862A patent/KR19980020385A/en not_active Application Discontinuation
-
1997
- 1997-09-09 JP JP9244280A patent/JPH10105578A/en active Pending
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH01193928A (en) * | 1988-01-28 | 1989-08-03 | Chugoku Nippon Denki Software Kk | Information retrieval system with inference mechanism |
JPH02232768A (en) * | 1989-03-07 | 1990-09-14 | Yamaha Corp | Data retrieving system |
JPH06325091A (en) * | 1993-05-13 | 1994-11-25 | Nippon Telegr & Teleph Corp <Ntt> | Similarity evaluation type data base retrieval device |
JPH08166966A (en) * | 1994-12-15 | 1996-06-25 | Sony Corp | Dictionary retrieval device, database device, character recognizing device, speech recognition device and sentence correction device |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR100819846B1 (en) | 2005-04-08 | 2008-04-07 | 김동암 | Method For Providing Query Language Chain Made from Informations For Internet Search |
US8131707B2 (en) | 2005-04-08 | 2012-03-06 | Dong Arm Kim | Method and apparatus for providing search result using language chain |
WO2007097531A1 (en) * | 2006-02-21 | 2007-08-30 | Dong Arm Kim | Method and apparatus for providing search result using language chain |
JP2010211256A (en) * | 2009-03-06 | 2010-09-24 | Sky Co Ltd | Formal name determination system and program |
Also Published As
Publication number | Publication date |
---|---|
KR19980020385A (en) | 1998-06-25 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Park et al. | Hybrid text mining for finding abbreviations and their definitions | |
US6256630B1 (en) | Word-containing database accessing system for responding to ambiguous queries, including a dictionary of database words, a dictionary searcher and a database searcher | |
US10402493B2 (en) | System and method for inputting text into electronic devices | |
JP3041268B2 (en) | Chinese Error Checking (CEC) System | |
US7536297B2 (en) | System and method for hybrid text mining for finding abbreviations and their definitions | |
US5794177A (en) | Method and apparatus for morphological analysis and generation of natural language text | |
CN102708095B (en) | Select the method for the language being used for text segmentation | |
WO1997004405A9 (en) | Method and apparatus for automated search and retrieval processing | |
CN101815996A (en) | Detect name entities and neologisms | |
KR20010024309A (en) | Reduced keyboard disambiguating system | |
JPH1145241A (en) | Japanese syllabary-chinese character conversion system and computer-readable recording medium where programs making computer function as means of same system is recorded | |
EP0775963B1 (en) | Indexing a database by finite-state transducer | |
US20040186706A1 (en) | Translation system, dictionary updating server, translation method, and program and recording medium for use therein | |
WO2003085562A9 (en) | Searching a database with a key table | |
JPH0652221A (en) | Automatic extracting system for proper noun | |
JPH10105578A (en) | Similar word retrieving method utilizing point | |
JPH0778183A (en) | Data base retrieving system | |
KR100376931B1 (en) | A Method of Database System Implementation for Korean-English Translation Using Information Retrieval Techniques | |
JPH09319767A (en) | Synonym dictionary registering method | |
JPH07182333A (en) | Japanese processor | |
KR100452024B1 (en) | Searching engine and searching method | |
JP2821213B2 (en) | Database matching method | |
JPH05113964A (en) | Electronic dictionary | |
JP2006178865A (en) | Device, method and program for extracting intrinsic expression, and recording medium with the program recorded thereon | |
JP3161660B2 (en) | Keyword search method |