KR100285119B1 - Method and device for retrieval of Hangul two character string - Google Patents

Method and device for retrieval of Hangul two character string Download PDF

Info

Publication number
KR100285119B1
KR100285119B1 KR1019980007582A KR19980007582A KR100285119B1 KR 100285119 B1 KR100285119 B1 KR 100285119B1 KR 1019980007582 A KR1019980007582 A KR 1019980007582A KR 19980007582 A KR19980007582 A KR 19980007582A KR 100285119 B1 KR100285119 B1 KR 100285119B1
Authority
KR
South Korea
Prior art keywords
hangul
keyword
data
string
search
Prior art date
Application number
KR1019980007582A
Other languages
Korean (ko)
Other versions
KR19980019333A (en
Inventor
조관현
Original Assignee
조관현
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 조관현 filed Critical 조관현
Priority to KR1019980007582A priority Critical patent/KR100285119B1/en
Publication of KR19980019333A publication Critical patent/KR19980019333A/en
Application granted granted Critical
Publication of KR100285119B1 publication Critical patent/KR100285119B1/en

Links

Landscapes

  • Document Processing Apparatus (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Input From Keyboards Or The Like (AREA)

Abstract

이 발명은 한글 검색에 있어서 키워드의 입력을 간편화 하는 한글 두음문자 열 검색방법 및 장치를 제안하려는 것으로, 키워드 입력장치로부터 한글문자열을 입력받아 정립하고 데이터베이스의 데이데를 검색단위로 순차 읽어와 키워드와 비교하는것에 있어서, 입력장치로부터 한글키워드의 두음문자열을 입력받아 키워드로서 정립하고 데이터검색으로 이행하며; 데이터 검색에서 검색대상 한글데이터 문자열을 검색단위로 비교하되, 키워드에 대응하는 두음문자열 데이터로 변환하여 키워드와 비교하는 것을 특징으로하는 한글 두음문자열 검색방법 및 장치이다. 이 발명에 의하면 한글 키워드 문자열중 두음문자만을 간편하게 입력하여 검색하므로 한글검색의 간편성을 이룩하는 것이다.The present invention is to propose a method and apparatus for retrieving Hangul acronyms strings to simplify the input of keywords in Hangul search. In the comparison, the second character string of the Hangul keyword is input from the input device, is established as a keyword, and the data transition is made; In the data retrieval, a Korean target character string search method and apparatus for comparing a target Hangul data string by a search unit, and converting the input character string data corresponding to the keyword to compare with the keyword. According to the present invention, it is possible to easily enter and search only acronyms among Korean keyword strings, thereby achieving simplicity of Hangul search.

Description

한글 두음문자열 검색방법 및 장치Method and device for retrieving Hangeul Eum string

이 발명은 한글 검색에 있어서 키워드의 입력을 간편화 하는 한글 두음문자열 검색방법 및 장치를 제안하려는 것이다.The present invention is to propose a method and apparatus for retrieving a Hangul consonant string that simplifies the input of keywords in the Hangul search.

이 발명에서 한글 두음문자열 검색이라 함은 키워드문자열을 입력함에 있어서; 두음문자열(첫 자음문자열); 예컨데 키워드 문자열이 '세종대왕'인 경우 'ㅅㅈㄷㅇ'을 검색 키워드로 사용하는 검색을 말한다.In the present invention, the Hangul abbreviation string search refers to a keyword string input; Consonant string (first consonant string); For example, if the keyword string is 'Sejong the Great', it means a search that uses 'ㅅ ㅈㄷㅇ' as a search keyword.

컴퓨터 한글키보드에서 한글의 두음문자는 시프트 키를 사용하지 않고 손 끝으로 쉽게 타이프할 수 있도록 배열되어 있다. 특허출원 96-40503, 96-47923 및 1996년 11월 16일자 조선일보 41면 "전화기가 한글을 깨쳤다"의 기사에서 조관현씨와 한국통신은 전화기의 텐키로서 한글을 쉽게 입력 할 수 있게하는 한글 콤팩트키보드를 제안하고 있다.Hangul acronyms on a computer Hangul keyboard are arranged so that you can easily type them at your fingertips without using a shift key. In the articles of patent application 96-40503, 96-47923 and Chosun Ilbo, page 16, November 16, 1996, Mr. Kwan-Hyun Cho and Korea Telecom entered Hangul to easily input Hangul as the tenkey of the phone. A compact keyboard is proposed.

위와같이 정보화 과정에서 전화기의 텐키나 간단한 휴대 통신장치의 키패드에서 한글을 입력할 수 있게하는 방안이 강구되고 있으며; 다양한 형태의 한글 입력장치가 보급될 것으로 전망되고 있다.As described above, a method of allowing Korean characters to be input from a tenkey of a telephone or a keypad of a simple portable communication device has been devised in an information process; Various types of Hangul input devices are expected to spread.

컴퓨터에서 사용하는 ASCII코드는 7비트로 코드화 되고 계열별로 순차로 배열하여 표1과 같이 비트 0x7에 '0'을 세팅하므로 프로그램에서 비트마스크를 통해 ASCII코드를 다른종류의 문자나 제어명령들과 식별할 수 있고 문자 연산을 가능하게 하고있는 것이다.The ASCII code used in the computer is coded into 7 bits and arranged in sequence for each series to set '0' to bit 0x7 as shown in Table 1, so the program can identify the ASCII code from other types of characters or control commands through the bit mask. It can and can do character operations.

[표 1]TABLE 1

영문자 'A'의 ASCII 코드ASCII code of the letter 'A' 식별자Identifier 'A' 7 비트코드'A' 7 bit code 77 66 55 44 33 22 1One 00 00 1One 00 00 00 00 00 1One

이에 대하여 한글코는 음절문단위 한글폰트 및 한자폰트에 2바이트 코드를 부여하는 완성형 한글코드나, 2바이트 코드중 하위 15비트에 두음, 증음, 종음코드를 5비트씩을 할당하여 한글코드를 조합하는 조합형 한글코드(도 1)가 다같이 영문자코드와 식별을 위하여 표2와 같이 상위비트 0xF 비트를 '1'로 세팅하고 있다.On the other hand, Hangeul Ko combines Hangul code by assigning 5 bits of the complete Hangul code that gives 2-byte code to syllable unit Hangul font and Hanja font or the lower 15 bits of 2-byte code. The combined Korean code (FIG. 1) sets the upper bit 0xF bit to '1' as shown in Table 2 for the English character code and identification.

[표 2]TABLE 2

16 bit 조합형 한글코드의 조합 ('한' 자의예)Combination of 16 bit combinatorial Hangul code ('one' character example) 식별자Identifier ㅎ (초성)(First) ㅏ (중성)ㅏ (neutral) ㄴ (종성)B (jongjong) FF EE DD CC BB AA 99 88 77 66 55 44 33 22 1One 00 1One 1One 00 1One 00 00 00 00 00 1One 1One 00 00 1One 00 00

위와같이 한글코드의 특성은 한 문자에 2바이트 개별코드를 부여 하거나 또는 두음, 중음, 종음코드를 조합하여 2바이트코드의 하위 15비트 영역에 할당하고 있으므로; 한글 검색에 있어서 두음문자에 의한 키워드 검색을 불가능하게 하였던 것이다.As described above, the characteristics of the Hangul code are assigned to the lower 15-bit area of the 2-byte code by assigning a 2-byte individual code to a character or by combining two, mid, and final codes; In Korean search, it was impossible to search keywords by acronyms.

이 발명은 한글데이터의 키워드를 두음문자열만 간단히 입력하고 검색엔진에서도 한글데이터에서 두음문자열을 발췌하여 검색하게 하므로 한글데이터의 검색을 간편화하는 한글 두음문자 검색방법 및 장치를 제공함에 목적이 있다.An object of the present invention is to provide a method and an apparatus for retrieving Hangul abbreviations, which simplify the search of Hangul data, by simply inputting the keywords of Hangul data into the Duom string and extracting them from the Hangul data.

도1는 조합형 한글코드표1 is a combination type Hangul code table

도2는 검색컴퓨터의 블럭도2 is a block diagram of a search computer;

도3은 이 발명 두음문자 검색처리의 실시예 블록도3 is a block diagram of an embodiment of the present invention acronym search process;

이와같은 이 발명 한글 두음문자 검색은;This invention Hangul acronyms search like this;

키워드 입력장치로부터 키워드를 입력받아 정립하고 데이터베이스의 데이터를 검색단위로 순차 읽어와 키워드와 비교하는것에 있어서,In receiving and establishing a keyword from a keyword input device, reading data from the database sequentially in a search unit and comparing the keyword with the keyword,

입력장치로부터 한글키워드 문자열의 두음문자열을 입력받아 키워드로서 정립하고 데이터검색으로 이행하며;Receive an input string of Hangul keyword string from the input device, establish it as a keyword, and shift to data search;

데이터 검색에서 검색대상 한글데이터를 검색단위로 비교하되,Compare the searched Hangul data in the search unit in the data search.

한글데이터를 키워드에 대응하는 두음문자열 데이터로 변환하여 키워드와 비교하는 것을 특징으로하는 한글 두음문자열 검색방법 및 장치를 특징으로 하는 것이다.A method and apparatus for retrieving a Hangul consonant string, characterized by converting Hangul data into a consonant string data corresponding to a keyword and comparing the result with a keyword.

이 발명을 실시예 도3의 흐름도에 의해 설명하면 다음과 같다.The present invention will be described with reference to the flowchart in Fig. 3 as follows.

주제어부는 입력장치 및 표시장치를 통해 사용자에게 대화상자와 커서를 제공하여 데이터베이스의 한글코드종류가 정의되어 있지 아니하면 한글코드종류(조합형, 완성형 또는 기타)를 정의한다. (한글코드가 조합형코드로 정의되어 있는 경우 이 과정은 생략된다) 이러한 사용자 인터페이스를 위한 대화는 네트웍을 통한 대화를 포함한다.The main control unit provides a dialog box and a cursor to the user through the input device and the display device to define the Korean code type (combined type, complete type, or others) if the Korean code type of the database is not defined. (This process is omitted if the Hangul code is defined as a combination code.) The dialogue for this user interface includes the dialogue over the network.

주제어부는 사용자에게 대화상자와 커서를 제공하여 입력장치로부터 한글 두음문자열 키워드를 입력받아 바이트타입 두음문자열로 정립한다. 키워드는 예컨데 표3과같이 문자열 '세종대왕'에 대하여 조합형 한글코드의 두음문자열 'ㅅㅈㄷㅇ'(k0)이며 이러한 5비트 두음문자 코드열(k0)을 바이트타입 두음문자열(k1)로 정립하는 것이다.The main control unit provides a dialog box and a cursor to the user and receives the Hangul two character string keyword from the input device to establish a byte type two character string. For example, as shown in Table 3, for the string 'Sejong the Great', the consonant string 'ㅅ ㅈㄷㅇ' (k0) of the combined Hangul code is established as a byte type consonant string (k1).

표 3)Table 3

키워드 5비트 두음코드열 (k0)Keyword 5-bit double code string (k0) ㅅ1011S1011 ㅈ11101110 ㄷ101C101 ㅇ1101ㅇ 1101 바이트 타입키워드 두음문자열(k1)Byte Type Keyword Abbreviated String (k1) 10110001011000 11100001110000 101000101000 11010001101000

바이트타입 키워드 두음문자열이 정립되면; 키워드를 보존하고 데이터 검색으로 이행한다.The byte type keyword abbreviation string is established; Preserve the keywords and move on to data retrieval.

데이터 검색의 반복비교 과정은;Iterative comparison process of data retrieval includes;

데이터베이스에서 지정된 포맷(검색단위)에 따라 데이터 문자열을 읽어오고;Read a data string from the database according to a specified format (search unit);

독취된 데이터 문자열이 조합형 한글코드가 아니면 한글 코드변환 프로그램을 호출하여 데이터 문자열을 조합형 한글 코드로 변환하며;If the read data string is not a combined Hangul code, the Hangul code conversion program is called to convert the data string into the Combined Hangul code;

표4와같이 데이터 조합형 한글 데이터 문자열에서 5비트 두음코드열 비트마스크하여 발췌하여 바이트 타입 두음문자열 데이터로 정립하여 키워드와 데이터를 비교하는 것이다.As shown in Table 4, a 5-bit double code string bit mask is extracted from a data-combined Hangul data string, established as byte type double string data, and keyword and data are compared.

또한 비교결과가 동일하면 데이터 정보를 검색결과 정보로서 보존함을 반복하며;If the comparison result is the same, data data is stored as search result information repeatedly;

데이터 영역의 검색이 종료되면 검색된 데이터 정보를 대화 상자에 제공하게 하는 것이다.When the search of the data area is completed, the searched data information is provided to the dialog box.

표 4)Table 4

독취된 한글문자열Read Hangul string three Bell versus king 16비트코드 문자열16-bit code string 10101101010000001010110101000000 10111001101101111011100110110111 10010100100000001001010010000000 10110101110101111011010111010111 비트마스크 두음코드열Beat Mask Double Code String 0101101011 0111001110 0010100101 0110101101 바이트 타입두음문자열Byte type prefix string 0010110000101100 0011100000111000 0001010000010100 0011010000110100

이 발명에서 표4의 바이트 타입 두음문자열은 표5과 같이 상위 0X7 비트에 한글식별 비트를 포함 할 수 있다.In the present invention, as shown in Table 5, the byte-type abbreviation string of Table 4 may include a Korean identification bit in the upper 0X7 bits.

표 5)Table 5

두음코드열Two-chord string 0101101011 0111001110 0010100101 0110101101 바이트 타입두음코드열Byte type Sequential code string 1010110010101100 1011100010111000 1001010010010100 1011010010110100

이와같이 이 발명은 간략한 두음문자열로 한글검색 키워드를 입력 할 수 있어서, 한글 검색을 간편, 신속하게 처리 할 수 있는 것이고, 특히 휴대용 단말장치 등 통신장치의 콤팩트 키보드를 통해 검색 키워드를 입력하기 용이하게 되는 것이며, 한글명 파일관리에 있어서 한글파일 검색을 용이하게 할 수 있는 등의 효과가 있는 것이다.As described above, the present invention can input a Korean search keyword as a simple acronym string, so that the Korean search can be easily and quickly processed, and it is particularly easy to input a search keyword through a compact keyboard of a communication device such as a portable terminal device. It is possible to facilitate the retrieval of Hangul files in Hangul name file management.

Claims (2)

키워드 입력장치로부터 키워드를 입력받아 정립하고 데이터베이스의 데이데를 검색단위로 순차 읽어와 키워드와 비교하는것에 있어서,In inputting and establishing a keyword from the keyword input device, and sequentially reading the database data in a search unit and comparing it with the keyword, 입력장치로부터 한글키워드 문자열의 두음문자열을 입력받아 키워드로서 정립하고 데이터검색으로 이행하며;Receive an input string of Hangul keyword string from the input device, establish it as a keyword, and shift to data search; 데이터 검색에서 검색대상 한글데이터를 검색단위로 비교하되,Compare the searched Hangul data in the search unit in the data search. 한글데이터를 키워드에 대응하는 두음문자열 데이터로 변환하여 키워드와 비교하는 것을 특징으로하는 한글 두음문자열 검색방법.A method for retrieving Hangul abbreviation strings, characterized by converting Hangul data into a pair of abbreviation string data corresponding to a keyword and comparing the result with a keyword. 키워드 입력장치로부터 키워드를 입력받아 정립하고 데이터베이스의 데이데를 검색단위로 순차 읽어와 키워드와 비교하는것에 있어서,In inputting and establishing a keyword from the keyword input device, and sequentially reading the database data in a search unit and comparing it with the keyword, 입력장치로부터 한글키워드 문자열의 두음문자열을 입력받아 키워드로서 정립하고 데이터검색으로 이행하며;Receive an input string of Hangul keyword string from the input device, establish it as a keyword, and shift to data search; 데이터 검색에서 검색대상 한글데이터를 검색단위로 비교하되,Compare the searched Hangul data in the search unit in the data search. 한글데이터를 키워드에 대응하는 두음문자열 데이터로 변환하여 키워드와 비교하는 것을 특징으로하는 한글 두음문자열 검색장치.A Hangul input string search device, characterized in that for converting Hangul data into a pair of string data corresponding to the keyword to compare with the keyword.
KR1019980007582A 1998-03-07 1998-03-07 Method and device for retrieval of Hangul two character string KR100285119B1 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1019980007582A KR100285119B1 (en) 1998-03-07 1998-03-07 Method and device for retrieval of Hangul two character string

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1019980007582A KR100285119B1 (en) 1998-03-07 1998-03-07 Method and device for retrieval of Hangul two character string

Publications (2)

Publication Number Publication Date
KR19980019333A KR19980019333A (en) 1998-06-05
KR100285119B1 true KR100285119B1 (en) 2001-03-15

Family

ID=65908807

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1019980007582A KR100285119B1 (en) 1998-03-07 1998-03-07 Method and device for retrieval of Hangul two character string

Country Status (1)

Country Link
KR (1) KR100285119B1 (en)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100722513B1 (en) 2005-11-10 2007-05-28 주식회사 코난테크놀로지 Method and system for indexing and retrieving in search engine and search service using query by initial sound

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100321848B1 (en) * 1999-04-01 2002-02-02 정상모 Korean word processor
KR100659542B1 (en) * 2006-03-13 2006-12-19 주식회사 퓨전소프트 Method and system for searching the korean alphabet, and computer readable storage
KR100753779B1 (en) * 2006-05-29 2007-08-31 팅크웨어(주) Method for executing initial sound letter search of mixed form and system for executing the method
KR101633403B1 (en) 2014-11-28 2016-06-24 비큐리오 주식회사 An apparatus and method of searching using an index without a final consonant

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100722513B1 (en) 2005-11-10 2007-05-28 주식회사 코난테크놀로지 Method and system for indexing and retrieving in search engine and search service using query by initial sound

Also Published As

Publication number Publication date
KR19980019333A (en) 1998-06-05

Similar Documents

Publication Publication Date Title
US8095526B2 (en) Efficient retrieval of variable-length character string data
KR100490240B1 (en) Data compressing apparatus, data decompressing apparatus, data compressing method, data decompressing method, and program recording medium
WO2009098350A1 (en) Device and method for providing fast phrase input
JP3722359B2 (en) Character input system and communication terminal
CN101303628B (en) Method and device for performing character word input by digital keyboard
KR100324634B1 (en) Telephone keypad and character input system using the same
KR100285119B1 (en) Method and device for retrieval of Hangul two character string
JPS62274360A (en) Word processor
KR100201211B1 (en) Korean alphabet code input apparatus of compact keyboard
US20030177289A1 (en) Method, device and program for input prediction processing, and recording medium for recording program thereof
JP4487614B2 (en) Information display control device and program
KR19990068397A (en) The e-mail searching method by telephone number.
KR100226206B1 (en) Compact hangul keyboard
KR20010069565A (en) System for Inputting Chinese Characters for the Electronic Apparatuses by Using the Root
US20020090081A1 (en) Electronic device with keyboard
JP2002055899A (en) Network resource name input method
JP3304935B2 (en) Japanese input device
KR100427225B1 (en) Apparatus for searching character string by basic consonant of Hangul
KR101910491B1 (en) A method and apparatus for efficient string similarity search based on generating inverted list of variable length grams
KR100406747B1 (en) Method for searching internet domain name
JPH09153044A (en) Character processor and device for kana and english letter conversion
JPH07160724A (en) Document retrieval device
JPS58172735A (en) Japanese input device
KR100358445B1 (en) Character String Search Method In Communication System
KR101063601B1 (en) Mobile terminal and his phone number search method

Legal Events

Date Code Title Description
A201 Request for examination
G15R Request for early opening
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20120126

Year of fee payment: 12

LAPS Lapse due to unpaid annual fee