KR20070036293A - Method for searching string by seperating phneme of characters, method for searching web document and storage medium storing execution program for that method - Google Patents

Method for searching string by seperating phneme of characters, method for searching web document and storage medium storing execution program for that method Download PDF

Info

Publication number
KR20070036293A
KR20070036293A KR1020050091170A KR20050091170A KR20070036293A KR 20070036293 A KR20070036293 A KR 20070036293A KR 1020050091170 A KR1020050091170 A KR 1020050091170A KR 20050091170 A KR20050091170 A KR 20050091170A KR 20070036293 A KR20070036293 A KR 20070036293A
Authority
KR
South Korea
Prior art keywords
code
string
text
search
input
Prior art date
Application number
KR1020050091170A
Other languages
Korean (ko)
Inventor
권찬영
Original Assignee
엔에이치엔(주)
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 엔에이치엔(주) filed Critical 엔에이치엔(주)
Priority to KR1020050091170A priority Critical patent/KR20070036293A/en
Publication of KR20070036293A publication Critical patent/KR20070036293A/en

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/205Parsing

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

본 발명은, 문자열 검색 방법, 웹문서 검색 방법 및 방법 실행 프로그램을 기록한 저장매체에 관한 것이다. 본 발명에 따르면, 검색 대상 문자열로 입력된 음절 중 복수의 음소로 분리된 음절이 존재하는 경우, 입력된 문자열을 조합형 코드로 인식하여. 입력된 문자열의 조합형 코드와 상기 텍스트를 구성하는 문자들의 조합형 코드간 일치 부분이 존재하는 경우, 일치 부분을 표시한다. 이 때, 초성, 중성, 혹은 종성으로 입력된 각 음소의 조합으로 발생 가능한 모든 문자열의 조합형 코드 각각에 대해, 상기 텍스트를 구성하는 문자들의 조합형 코드와 일치 부분이 존재하는지에 대한 검색이 실행된다. 따라서, 검색 대상 자료로부터 사용자가 실제 입력한 키워드에 관계없이, 사용자가 찾기를 원하는 문자열을 다양하게 찾아낼 수 있다. 특히, 연음효과, 외래어, 한글로 기재된 영어 단어 등이 동일한 의미임에도 불구하고 여러 가지 형태로 변형된 경우, 혹은 형용사 혹은 동사 등이 다양하게 활용된 경우에도 해당 문자열을 편리하게 찾아낼 수 있다.The present invention relates to a storage medium having recorded thereon a string searching method, a web document searching method and a method executing program. According to the present invention, when there are syllables divided into a plurality of phonemes among syllables input as a search target string, the input string is recognized as a combination code. If there is a matching part between the combined code of the input string and the combined code of the characters constituting the text, the matching part is displayed. At this time, for each combination code of all the strings that can be generated by the combination of the phonemes inputted as the initial, neutral, or final, a search is made to see if there is a matching code and a matching part of the characters constituting the text. Therefore, regardless of the keyword actually input by the user from the search target data, it is possible to find a variety of strings that the user wants to find. In particular, even if the sound effect, foreign words, English words written in Korean, etc. have the same meaning, even if they are modified in various forms, or even if a variety of adjectives or verbs, etc. can be found conveniently.

Description

음소 분리를 통한 문자열 검색 방법, 웹 문서 검색 방법 및 방법 실행 프로그램을 기록한 저장매체{METHOD FOR SEARCHING STRING BY SEPERATING PHNEME OF CHARACTERS, METHOD FOR SEARCHING WEB DOCUMENT AND STORAGE MEDIUM STORING EXECUTION PROGRAM FOR THAT METHOD}METHODE FOR SEARCHING STRING BY SEPERATING PHNEME OF CHARACTERS, METHOD FOR SEARCHING WEB DOCUMENT AND STORAGE MEDIUM STORING EXECUTION PROGRAM FOR THAT METHOD}

도 1은 본 발명의 실시예에 따른 문자열 검색 방법이 적용되는 화면이다.1 is a screen to which a string search method is applied according to an exemplary embodiment of the present invention.

도 2는 본 발명의 실시예에 따른 문자열 검색 방법 흐름도이다.2 is a flowchart illustrating a string search method according to an exemplary embodiment of the present invention.

도 3은 한글 완성형 코드와 한글 조합형 코드간의 매칭 테이블의 예로서 테이블의 일부이다.  3 is a part of a table as an example of a matching table between a Hangul complete code and a Hangul combined code.

도 4는 본 발명의 또 다른 실시예에 따른 문자열 검색 방법 흐름도이다4 is a flowchart illustrating a string search method according to another embodiment of the present invention.

도 5는 본 발명의 실시예에 따른 문자열 검색 방법이 적용되는 또 다른 화면이다.5 is another screen to which a string search method is applied according to an exemplary embodiment of the present invention.

도 6은 본 발명의 다른 실시예에 다른 문자열 검색 방법 흐름도이다.6 is a flowchart illustrating a method of searching for a string according to another embodiment of the present invention.

도 7은 본 발명의 실시예에 따른 문자열 검색 방법이 적용되는 또 다른 화면이다.7 is another screen to which a string search method according to an embodiment of the present invention is applied.

도 8은 본 발명의 다른 실시예에 따른 문자열 검색 방법 흐름도이다.8 is a flowchart illustrating a string search method according to another embodiment of the present invention.

본 발명은 음소 분리를 통한 문자열 검색 방법, 웹 문서 검색 방법 및 방법 실행 프로그램을 기록한 저장매체에 관한 것이다.The present invention relates to a storage medium recording a method of searching a string through phoneme separation, a web document searching method, and a method executing program.

일반적으로, 특정 문서를 대상으로 사용자가 원하는 문자열을 포함하는 부분을 검색하거나 사용자가 원하는 문자열을 포함하는 자료를 검색하는 경우, 사용자가 찾기를 원하는 특정 문자열이 우선 입력된다.Generally, when searching for a part containing a string desired by a user for a specific document or searching for a material including a string desired by a user, a specific string desired by the user is first input.

워드 프로세서와 같은 문서 작성 프로그램의 경우, 실행중인 텍스트 파일에서 해당 문자열을 포함하는 부분이 구분 표시되거나, 해당 문자열을 포함하는 부분으로 디스플레이 영역이 이동되기도 한다.In the case of a document writing program such as a word processor, a part including a corresponding character string is displayed in a text file being executed or the display area is moved to a part containing the character string.

또, 인터넷을 통해 공개된 자료들 중 사용자가 원하는 자료 검색에 흔히 이용되는 검색 엔진의 경우, 사용자가 입력한 키워드를 포함하는 자료들이 인터넷 서비스 업체의 정책에 따른 순서로 제시된다.In addition, in the case of a search engine that is commonly used to search for data desired by a user among data published through the Internet, materials including a keyword inputted by a user are presented in an order according to the policy of an Internet service company.

이 때, 사용자가 외래어, 한글로 기재된 영어단어 혹은 연음현상이 일어나는 단어등을 검색하고자 하는 경우, 조합 가능한 모든 경우의 수의 단어들을 개별적으로 검색해야 했다. At this time, if the user wants to search for a foreign word, an English word written in Korean or a word in which a symptom occurs, the user has to search for the number of words in all possible combinations individually.

예를 들어, 특정 텍스트에서 "플래시"라는 단어를 검색하고자 하는 경우, 혹은 "플래시"라는 단어를 포함하는 자료를 인터넷을 통해 검색하고자 하는 경우, 사용자는 "플래시" 뿐만 아니라, 플래시와 동일한 의미로 흔히 사용되는 "후레시", "후래시", "플레시", "프래시", "후라시" 등 다양한 단어를 개별적으로 입력하고 검색결과를 개별적으로 확인해야 했다. For example, if you want to search for the word "flash" in a particular text, or if you want to search the Internet for materials that contain the word "flash," the user has the same meaning as the flash, They had to type in a variety of words, such as "flash", "flash", "flash", "flash", and "flash", and check the search results individually.

이 경우, 일부 인터넷 검색 엔진들은 사용자가 입력한 단어와 유사 발음 단어들을 제시하기도 했다. 즉, 예를 들어 사용자가 특정 영어단어를 검색창에 입력하는 경우, 사용자가 입력한 단어와 유사 발음 혹은 철자중 일부만 다른 유사 단어들이 함께 제시되기도 했다.In this case, some Internet search engines have suggested pronunciation words and similar pronunciation words. That is, for example, when a user inputs a specific English word into a search box, the user's input word and similar pronunciation or spelling of similar words may be presented together.

그러나, 이는 유사 단어를 포함하는 자료 자체를 검색한 경우도 아닐 뿐만 아니라, 미리 저장된 기존 사용자들의 검색 패턴 정보에 따라 기입력된 단어 검색자들이 자주 검색하는 유사단어들을 제시하는 것에 불과하여, 실제 사용자가 원하는 자료 자체가 편리하게 제시되지 못했다.However, this is not only a case of searching for data containing similar words, but also suggests similar words frequently searched by word searchers inputted according to search pattern information of existing users. The desired data itself was not presented conveniently.

따라서, 본 발명이 이루고자 하는 기술적 과제는, 검색 대상 자료로부터 사용자가 실제 입력한 키워드에 관계없이, 사용자가 찾기를 원하는 문자열을 다양하게 찾아낼 수 있도록 하는데 있다.Therefore, the technical problem to be achieved by the present invention is to enable the user to find a variety of character strings that the user wants to find, regardless of the keyword actually input by the user from the search target material.

상술한 기술적 과제를 달성하기 위한 본 발명의 특징에 따른 문자열 검색 방법은, 화면을 통해 디스플레이된 텍스트내에서 특정 문자열을 검색하는 문자열 검색 방법으로서, a) 검색 대상 문자열로 입력된 음절 중 복수의 음소로 분리된 음절이 존재하는 경우, 입력된 문자열을 조합형 코드로 인식하는 단계; 및 b) 입력된 문자열의 조합형 코드와 상기 텍스트를 구성하는 문자들의 조합형 코드간 일치 부분이 존재하는 경우, 일치 부분을 표시하는 단계를 포함한다.According to another aspect of the present invention, there is provided a string search method for searching for a specific string within a text displayed on a screen, the method comprising: a) a plurality of phonemes among syllables input as a search target string; Recognizing the input string as a combination code when there are syllables separated by; And b) if there is a matching part between the combined code of the input string and the combined code of the characters constituting the text, displaying the matching part.

또, 상술한 기술적 과제를 달성하기 위한 본 발명의 특징에 따른 문자열 검 색 방법은, 텍스트 파일내 특정 문자열을 검색하는 문자열 검색 방법으로서, a) 검색 대상 문자열로 입력된 음절 중 복수의 음소로 분리된 음절이 존재하는 경우, 입력된 문자열을 조합형 코드로 인식하는 단계; 및 b) 선택된 텍스트 파일을 구성하는 문자의 조합형 코드 중 상기 입력된 문자열의 조합형 코드와 일치하는 부분이 존재하는 경우, 텍스트 파일을 열어 일치부분을 화면에 표시하는 단계를 포함한다.In addition, a string search method according to a feature of the present invention for achieving the above technical problem is a string search method for searching for a specific character string in a text file, a) separating into a plurality of phonemes among syllables input as a search target string; Recognizing the input character string as a combination code when the present syllable exists; And b) if a part of the combined code of the characters constituting the selected text file matches the combined code of the input character string, opening the text file to display the matched portion on the screen.

그리고, 상술한 기술적 과제를 달성하기 위한 본 발명의 특징에 따른 웹문서 검색 방법은, a) 검색 대상 문자열로 입력된 음절 중 복수의 음소로 분리된 음절이 존재하는 경우, 입력된 문자열을 조합형 코드로 인식하는 단계; 및 b) 소정 단어를 포함한 웹문서에 대한 링크 정보가 해당 단어를 인덱스로 하여, 단어와 해당 단어를 포함한 웹문서 링크 정보가 일대일 매칭 저장된 데이터베이스로부터 단어 인덱스 목록을 검색하여, 조합형 코드가 입력된 문자열의 조합형 코드와 일치하는 인덱스 단어를 발견한 경우, 해당 인덱스 단어에 대해 매칭 저장된 웹문서 링크 정보를 표시하는 단계를 포함한다.In addition, the web document search method according to a feature of the present invention for achieving the above-described technical problem, a) when there are syllables divided into a plurality of phonemes among the syllables input as the search target string, the combination string is input code Recognizing as; And b) a string in which a combination code is input by retrieving a list of word indices from a database in which the link information for the web document including the predetermined word is the index, the word and the web document link information including the word are one-to-one matching. If an index word matching with the combined code of is found, displaying matching web document link information for the index word.

또한 상술한 기술적 과제를 달성하기 위한 본 발명의 특징에 따른 기록매체는 상기 방법을 실행하는 프로그램을 기록한 저장매체이다.In addition, the recording medium according to the characteristics of the present invention for achieving the above technical problem is a storage medium recording a program for executing the method.

일반적으로 하나의 텍스트는 복수의 단락, 그리고 각 단락을 구성하는 문장으로 이루어진다. 또한 각 문장은 차례로, 어절, 음절, 음소등으로 세분화될 수 있다.In general, a text consists of a plurality of paragraphs and the sentences constituting each paragraph. In addition, each sentence may be subdivided into words, syllables, syllables, and phonemes.

이 때, 음소란 음운론에서 음운의 최소단위, 즉 그 이상 작은 단위로 나눌수 없는 음운의 최소단위를 가리키며, 하나 이상의 음소가 모여 음절을 이룬다. 예를 들어, "학"이란 음절은 "ㅎ", "ㅏ", "ㄱ" 이란 3개의 음소로 이루어진다.In this case, the phoneme refers to the minimum unit of the phoneme in phonology, that is, the minimum unit of phoneme that cannot be divided into smaller units, and one or more phonemes form a syllable. For example, the syllable "hak" consists of three phonemes: "ㅎ", "ㅏ", and "ㄱ".

한편, 특정 문서를 대상으로 사용자가 원하는 문자열을 포함하는 부분을 검색하거나, 사용자가 원하는 문자열을 포함하는 자료를 검색하는 경우, 사용자가 찾기를 원하는 특정 문자열 혹은 키워드로 판단되는 단어를 검색창에 입력하게 된다. 그리고 입력된 문자열 혹은 키워드가 그대로 반영된 텍스트 부분 혹은 문서 자료가 사용자에게 제시된다.On the other hand, when searching for a part containing a string desired by a user for a specific document or searching for a material including a desired string of a user, a word determined as a specific string or a keyword desired to be searched by the user is entered in a search box. Done. The text portion or the document data that reflects the input string or keyword is presented to the user.

그러나, 외래어, 한글로 기재된 영어 단어, 혹은 연음현상이 일어나는 단어의 경우, 다양한 형태의 단어가 동일한 의미로 사용될 수 있다. 예를 들어, "슈퍼맨"의 경우, "수퍼맨" 또한 동일한 의미로 널리 사용되고 있다. 즉, 본 예에 있어서 "슈"라는 음절에 다양한 변형 형태를 고려할 수 있다.However, in the case of a foreign word, an English word written in Korean, or a word in which a symptom occurs, various types of words may be used as the same meaning. For example, in the case of "Superman", "Superman" is also widely used in the same sense. That is, in this example, various variations can be considered in the syllable "Shoe".

발명의 실시예에 따르면, 검색 입력창에 "슈퍼맨" 이라고만 기재하는 대신 "슈" 음절은 <ㅅ, ㅠㅜ, φ>로 입력한다. 즉, “슈” 음절을 음소검색 대상으로 선택하여, 초성으로 “ㅅ”, 중성으로 “ㅠ, ㅜ”, 종성은 존재하지 않으므로 적당한 널(NULL)값(본 예에서는 φ 삽입)을 각각 입력한다. According to an embodiment of the present invention, instead of describing only "Superman" in the search input window, "Shu" syllable is input as <ㅅ, ㅠㅜ, φ>. In other words, select the "Shu" syllable as the phoneme search target, and input the appropriate null value (insert φ in this example) since "S" as the initial consonant, "ㅠ, TT" as the neutral, and no finality exist. .

이 때, 초성, 중성 혹은 종성 각각에는 복수개의 음소가 입력될 수 있으며, 따라서, 초성, 중성 혹은 종성으로 입력된 각 음소간의 조합으로 생성될 수 있는 음절의 종류는 다양해진다. 그 결과 복수의 음소로 분리된 음절을 포함하는 단어로서 사용자가 한번에 검색할 수 있는 단어의 종류가 다양해질 수 있다.In this case, a plurality of phonemes may be input to each of the initial, neutral, or final voices, and thus, the types of syllables that may be generated by a combination of each of the phonemes input as the initial, neutral, or final voices vary. As a result, a word including a syllable divided into a plurality of phonemes may be variously searched for by the user.

상술한 예에서도, <ㅅ, ㅠㅜ, φ>에는 중성으로 “ㅠ, ㅜ” 2가지의 음소가 입력되어 있으므로, 입력된 음소간의 조합으로부터 생성될 수 있는 다양한 음절에는 “슈” 뿐만 아니라 “수”도 포함되므로, 결과적으로 “슈퍼맨”뿐만 아니라 “수퍼맨”도 검색 대상 단어가 된다. In the above-described example, since two phonemes are input as neutral in <ㅅ, ㅠ TT, and φ>, “shu” as well as “number” for various syllables that can be generated from the combination of the input phonemes. As a result, not only "superman" but also "superman" becomes a search target word.

따라서, 특정 텍스트에서 “슈퍼맨” 또는 “수퍼맨”을 포함한 부분이 표시되거나, “슈퍼맨” 혹은 “수퍼맨”을 포함한 자료가 검색결과 리스트로 사용자에게 제공된다.Thus, the portion of the text containing "Superman" or "Superman" is displayed, or the material containing "Superman" or "Superman" is provided to the user as a list of search results.

즉, 본 발명의 실시예에 따르면, 검색 대상 단어를 구성하는 음절 중 동일 의미이나 복수의 형태 변화가 가능한 음절은 해당 음절을 구성하는 음소로 분리 하여, 검색 대상 단어 입력창에 초성, 중성, 종성을 개별 입력할 수 있도록 한다.That is, according to an embodiment of the present invention, the syllables having the same meaning or plural forms among the syllables constituting the search target word are divided into phonemes constituting the syllable, and the initial, neutral, and finality are displayed in the search target word input window. Allows you to enter them individually.

이 때, 초성, 중성, 종성은 상술한 예에 제시된 바와 같이, 각각 복수로 At this time, the initial, neutral, and final properties are each in plural, as shown in the above examples.

입력 가능하다. 따라서, 입력된 초성, 중성, 종성의 조합을 통해 생성 가능한 복수의 음절과, 음소로 분리되지 않은 나머지 음절 각각의 조합을 통해 생성되는 단어가 검색대상 단어가 된다(이하, 검색대상 음절중 특정 음절을 음소로 분리하여, 초성, 중성, 종성에 해당하는 각 음소의 조합으로 발생가능한 모든 단어를 검색하는 방식을 “음소검색”이라고도 한다).Input is possible. Accordingly, the search target word is a word generated through a combination of a plurality of syllables that can be generated through the combination of the input consonants, the neutral, and the final syllables, and the remaining syllables not divided into phonemes (hereinafter, the specific syllables among the search syllables). Is divided into phonemes to search for all words that can be generated by the combination of phonemes corresponding to initial, neutral, and final (also called "phoneme search").

이 때, 검색 대상 음절 혹은 음소로서 “*”, “?”와 같은 특수기호도 사용될 수 있다. “*”는 입력된 음절 혹은 음소의 뒤에 문자가 이어진다는 의미로서, 문자가 이어지지 않을 수도 있을 때 사용되며, “?”는 입력된 음절 혹은 음소의 뒤에 하나 이상의 문자가 이어진다는 의미로서, 반드시 문자가 이어진다. At this time, a special symbol such as “*” or “?” May be used as a syllable or phoneme to be searched. “*” Means that a character is followed by an entered syllable or phoneme. It is used when a character may not be followed. “?” Means that one or more characters are followed by an entered syllable or phoneme. Is followed.

따라서, 본 발명의 실시예에 따른 문자열 검색의 활용예를 정리하면 다음과 같다. Accordingly, the application of the string search according to the embodiment of the present invention is summarized as follows.

Figure 112005055089983-PAT00001
Figure 112005055089983-PAT00001

이하 첨부도면을 참조하여 본 발명의 다양한 실시예를 중심으로 문자열검색 방법을 상세히 설명한다.Hereinafter, a string search method will be described in detail with reference to the accompanying drawings.

도 1은 본 발명의 특징에 따른 문자열 검색 방법을 일반적인 문서 프로그램에 응용하여 추가한 경우의 실시예이다.FIG. 1 illustrates an example in which a string search method according to an aspect of the present invention is added to a general document program.

즉, 사용자가 현재 실행중인 텍스트에서 특정 문자열을 검색하고자 할 때, 도시된 바와 같은 찾을 내용 입력창에서, 음소 검색 옵션을 선택한 후 상술한 바와 같이 문자열을 입력하면, 텍스트에서 다양하게 변형되어 활용중인 문자열을 검색할 수 있다. 이 때, 음소 검색 옵션을 별도로 선택하지 않아도 검색 대상 문자열 입력 스타일에 따라 음소 검색을 실행하도록 구성될 수도 있음은 물론이다. 또는 음소 검색창을 별도로 구성하여, 음소 검색창에 음소 분리된 음절이 입력되면 음소 검색을 실행하도록 구성될 수도 있다.That is, when the user wants to search for a specific string in the currently running text, in the find content input window as shown, if the user selects a phoneme search option and inputs a string as described above, the text is variously modified and utilized. You can search for a string. In this case, the phoneme search may be configured to execute the phoneme search according to the search target string input style without separately selecting the phoneme search option. Alternatively, the phoneme search window may be separately configured to perform a phoneme search when a phoneme-separated syllable is input to the phoneme search window.

보다 구체적으로, 도 2에 도시된 바와 같이 문서 작성 프로그램을 통해 특정 텍스트가 실행되고(S100), 사용자가 문자열 찾기 창을 통해 검색 대상 문자열을 입력한 경우(S101), 문자열 입력 방식 혹은 사용자 선택에 따라 음소 검색이 실행된다(S103). More specifically, as shown in FIG. 2, when a specific text is executed through a document writing program (S100), and a user inputs a search target string through a string search window (S101), the text input method or user selection is performed. Accordingly, the phoneme search is executed (S103).

다음, 음소 검색 경우로서 텍스트를 구성하는 문자가 완성형 코드인 경우, 조합형 코드로 변환된다(S105).Next, as the phoneme search case, when the characters constituting the text are the completed codes, they are converted to the combined codes (S105).

이 때, 완성형 코드란 완성된 글자에 대해 코드값을 매긴 것으로, 초성, 중성, 종성에 대한 구분이 없다. 즉 완성된 글자를 일종의 그림처럼 다루는 방식으로, 현대 한글에서 조합 가능한 글자 배열하여 코드값을 매긴 것이다.At this time, the completed code is a code value for the completed character, there is no distinction between the initial, neutral, and final. In other words, it treats the completed characters as a kind of picture, and assigns code values by arranging combinable characters in modern Hangul.

예를 들어, "감"의 완성형 코드는 0xb0a8인데, "각", "간" "갈" "감"과 같은 완성된 글자의 코드가 표현된다.For example, the complete code of "persimmon" is 0xb0a8, where the code of the completed character such as "angle", "liver", "go" and "persimmon" is represented.

반면, 조합형 코드는 한글의 구성 원리인 초성-중성-종성의 음운을 코드 자료로 삼아 설계된다. 따라서, 조합형 코드에서는 완성된 글자 자체에 초점이 있는 것이 아니라, 각 음운들에 초점이 놓인다. 조합형의 경우 2byte로 표현되는 문자로서 16bit중 한글임을 표현하는 1bit를 제외한 나머지 15bit중 초성, 중성, 종성을 각각 5bit로 표현한다.On the other hand, the combinatorial code is designed based on the phoneme of Choseong-neung-jong, the constituent principle of Hangul. Thus, in the combined code, the focus is not on the finished letter itself, but on each phoneme. In the case of the combination type, the characters represented by 2 bytes are expressed as 5 bits each of the initial, neutral, and finality of the remaining 15 bits except 1 bit, which represents Korean.

초성은 첫소리로서 ㄱ,ㄴ,ㄷ,ㄹ,ㅁ,ㅅ,ㅇ,ㅈ,ㅊ,ㅋ,ㅌ,ㅍ,ㅎ,ㄲ,ㄸ,ㅃ,ㅆ,ㅉ (이상 19개)이 사용될 수 있고, 중성은 모음으로 ㅏ, ㅑ, ㅓ, ㅕ, ㅗ, ㅛ, ㅜ, ㅠ, ㅡ,ㅣ,ㅐ, ㅒ, ㅔ, ㅖ, ㅘ, ㅙ, ㅚ, ㅝ, ㅞ, ㅟ, ㅢ(이상 21개)가 사용될 수 있으며, 종성은 받침으로서 ㄱ,ㄴ,ㄷ,ㄹ,ㅁ,ㅂ,ㅅ,ㅇ,ㅈ,ㅊ,ㅋ,ㅌ,ㅍ,ㅎ,ㄲ,ㅆ,ㄳ,ㄵ,ㄶ,ㄺ,ㄻ,ㄼ,ㄽ,ㄾ,ㅀ,ㅄ(이상27개)가 사용될 수 있다. 이 때, 각 음소들을 일련의 순서로 번호를 매긴 후, 이를 5bit의 이진수로 표현하여 조합형 코드를 설계할 수 있다.The first voice can be used as a, b, c, d, ㅁ, ㅅ, ㅇ, ㅈ, ㅋ, ㅌ, ,, ㅎ, ㄲ, ㄸ, ㅆ, ㅉ (more than 19), and neutral 모음, ㅏ, ㅓ, ㅕ, ㅗ, ㅛ, ㅜ, ㅠ, ㅡ, ㅣ, ㅐ, ㅒ, ㅔ, ㅖ, ㅘ, ㅙ, ㅚ, ㅝ, ㅞ, ㅟ, ㅢ (more than 21) Can be used, and as a bearing, a, b, c, l, l, l, l, l, l, l, l, l, l, l, l, l, l, l, l, l, l, ㄼ, ㄽ, ㄾ, ㅀ, ㅄ (more than 27) can be used. In this case, each phoneme is numbered in a sequence, and then a combinational code can be designed by expressing it as a 5-bit binary number.

예를 들어, "감"의 조합형 코드 "0x8871"은 이진수로 표현될 때 "1000100001110001"이 되며, 한글임을 표현하는 1bit, 초성, 중성, 종성 각각에 대한 5bit로 분해 표현하면 "1/00010/00011/10001"이 된다. 또한 "곰"의 조합형 코드 "0x89b1"은 이진수로 표현될 때 "1/00010/01101/10001"이 된다. 즉 "감"과 "곰"은 초성과 종성은 각각 "ㄱ"과 "ㅁ"으로 동일하고 중성만이 각각 "ㅏ"와 "ㅗ"로 다른데, "감"과 "곰"을 조합형 코드의 이진수로 표현할 때 역시 중성을 나타내는 5bit값만이 "00011"과 "11101"로 다르다. 이와 같이 음소를 분리하면, 음소별로 일치여부를 판별할 수 있다For example, the combination code "0x8871" of "Gam" becomes "1000100001110001" when expressed in binary, and when it is expressed in 5 bits for 1 bit, initial, neutral, and final for Korean, "1/00010/00011" / 10001 ". In addition, the combination code "0x89b1" of "bear" becomes "1/00010/01101/10001" when expressed in binary. In other words, "persimmon" and "bear" are the same as "a" and "ㅁ", respectively, and only neutral is different with "ㅏ" and "ㅗ", respectively. In this case, only the 5-bit value representing neutral is different from "00011" and "11101". By separating the phonemes in this way, it is possible to determine whether they match by phone.

음소 검색에서는 검색창에 입력된 글자를 조합형 코드로 인식하여, 음소 분리 부분에서 초성, 중성, 종성을 각각 구분할 수 있다. In the phoneme search, the letters inputted in the search box are recognized as a combination code, and the phoneme separation part can distinguish the initial, neutral, and final characters, respectively.

이 때, 검색창에 입력된 글자 전체를 조합형 코드로 인식할 수도 있고 음소분리된 음절부분만을 조합형 코드로 인식하도록 구성될 수도 있다..In this case, the entire text inputted in the search box may be recognized as a combination code, or only the phoneme-separated syllable part may be configured as a combination code.

다음, 도 3에 도시된 바와 같이, 검색 대상 텍스트를 구성하는 문자가 완성Next, as shown in Fig. 3, the characters constituting the search target text are completed.

형 코드인 경우 한글 완성형 코드와 한글 조합형 코드간의 매칭 테이블을 이용하 여, 각 문자를 조합형 코드로 변환하여 저장한다. In the case of a type code, each character is converted into a combined type code and stored using a matching table between the Hangul complete type code and the Hangul combined type code.

그리고, 입력된 문자열과 텍스트를 구성하는 문자간의 코드 비교를 통해 매And, through the code comparison between the input string and the characters that make up the text,

칭 부분을 검색하는데, 특히 입력된 문자열중 음소 분리된 부분은 초성, 중성, 종성의 차례로 각 음소 단위로 각 음소의 조합형 코드와 텍스트를 구성하는 문자의 조합형 코드를 비교한다. 이 때 입력된 문자열 중 음소 분리되지 않은 부분은 음절 단위로 각 음절의 완성형 코드와 텍스트를 구성하는 문자의 완성형 코드를 서로 비교하도록 구성될 수도 있다.Particularly, the phoneme-separated part of the input string compares the phoneme code of each phoneme with the phoneme code of the letters constituting the text in the order of each phoneme in the order of initial, neutral, and final. In this case, the non-phoneme-free part of the input string may be configured to compare the complete code of each syllable and the complete code of the characters constituting the text with each syllable unit.

그리고, 텍스트를 구성하는 조합형 코드로부터 음소 검색을 위해 입력된 문And a sentence input for phoneme search from the combined code constituting the text.

자열의 조합형 코드와의 매칭 부분을 발견하여, 최종적으로 입력된 문자열 전체에 해당하는 부분을 텍스트 내에서 발견한 경우, 각 문서 작성 프로그램에서 제공하는 함수 혹은 별도로 마련된 함수를 이용하여, 텍스트 내의 매칭 부분으로 디스플레이 영역을 이동할 수 있다(S107, S109, S111).When the matching part with the combined code of the string is found and the part corresponding to the entire inputted string is found in the text, the matching part in the text using a function provided by each document writing program or a function provided separately The display area can be moved (S107, S109, S111).

이 때, 입력된 문자열과 텍스트내의 첫번째 매칭 부분을 표시한 후, 사용자 At this time, after displaying the input string and the first matching part in the text, the user

선택에 따라 다음 매칭 부분을 검색하고 차례로 표시할 수도 있다(S113). 그리고 검색 결과 본문 끝까지 해당 문자열이 없거나(S115), 사용자 선택에 따라 계속 검색을 수행하지 않을 수도 있음은 물론이다.According to the selection, the next matching part may be searched for and displayed in turn (S113). The string may not exist until the end of the search result body (S115), or may not be continuously searched according to a user's selection.

또한, 발명의 실시예에 따라서는 검색창에 입력된 문자열과 일치하는 부분을 In addition, according to an embodiment of the present invention, the portion matching the character string entered in the search box is

텍스트내에서 발견한 경우, 디스플레이 영역 자체를 옮기기보다 발견된 매칭 부분을 구분 표시 처리할 수도 있다.When found in the text, the found matching part may be separated and displayed instead of moving the display area itself.

그리고, 검색 대상 텍스트를 구성하는 문자가 완성형 코드인 경우, 해당 텍스And, if the character constituting the text to be searched is the completion code, the corresponding text

트 문서를 전부 조합형 코드로 변환한 후 음소 검색을 위해 입력된 문자열의 조합형 코드와 일치 여부를 체크할 수 있을 뿐만 아니라, 혹은 검색 대상 텍스트를 구성하는 문자를 단어 단위 혹은 문장단위와 같이 소정 단위로 조합형 코드로 변환하고, 변환시마다 입력된 문자열과 일치 여부를 체크하도록 구성할 수도 있다.After converting the entire document into a combination code, the user can not only check whether the input string matches the combination code of the input string for phoneme search, but also convert the characters constituting the search text into a predetermined unit such as a word unit or a sentence unit. It can be configured to convert to a combinatorial code and check whether or not it matches the input string every time it is converted.

도 4는 본 발명의 또 다른 실시예에 따른 문자열 검색 방법 흐름도이다.4 is a flowchart illustrating a string search method according to another embodiment of the present invention.

일반적인 문서 작성 프로그램이 아닌 음소 검색 기능을 실행하는 독립적인 애플리케이션을 구현하는 경우, 사용자가 파일 선택 창등을 통해 음소 검색을 원하는 파일을 선택하면, 검색 대상 파일에 대한 로딩이 실행된다(S200). 이 때, 해당 텍스트는 화면에 표시될 수도 있고 표시되지 않을 수도 있다. When implementing an independent application that executes a phoneme search function rather than a general document writing program, when a user selects a file to be searched for a phoneme through a file selection window or the like, loading of the search target file is performed (S200). At this time, the text may or may not be displayed on the screen.

다음, 사용자가 찾기를 원하는 문자열을 입력하면, 텍스트를 구성하는 글자들의 조합형 코드중 입력된 문자열의 조합형 코드와 매칭되는 부분이 있는지 여부에 대한 검색이 실행된다(S201, S203).Next, when the user inputs a string to be searched for, a search is performed to determine whether there is a part of the combined code of the letters constituting the text that matches the combined code of the input string (S201 and S203).

이 때, 파일 헤더 정보를 통해 파일에 포함된 텍스트를 구성하는 글자가 완성형 코드로 판명된 경우, 해당 파일에서 텍스트를 추출하여 완성형 코드- 조합형 코드 매칭 테이블을 이용하여 텍스트를 구성하는 글자들을 조합형으로 변환하며, 변환에 대한 구체적인 과정은 상술한 바와 같다. 그리고, 입력된 문자열 전체를 조합형 코드로 인식할 수도 있고 음소 분리된 음절부분만을 조합형 코드로 인식하도록 구성될 수도 있음은 당연하다.In this case, when the characters constituting the text included in the file are identified as the complete code through the file header information, the text is extracted from the file and the characters constituting the text using the complete code-combination code matching table are combined. The conversion process is as described above. In addition, it is natural that the entire input string may be recognized as a combination code, or the phoneme-separated syllable portion may be configured to recognize only a combination code.

그리고, 상술한 바와 같이 입력된 문자열과 텍스트를 구성하는 문자간의 코And, as described above, the code between the input character string and the characters constituting the text

드 비교를 통해 매칭 부분을 검색하는데, 특히 입력된 문자열중 음소 분리된 부분 은 초성, 중성, 종성의 차례로 각 음소 단위로 각 음소의 조합형 코드와 텍스트를 구성하는 문자의 조합형 코드를 비교하는데, 입력된 문자열 중 음소 분리되지 않은 부분은 음절 단위로 각 음절의 완성형 코드와 텍스트를 구성하는 문자의 완성형 코드를 서로 비교하도록 구성될 수도 있음도 이미 언급하였다.In particular, the matching part is searched through the comparison. In particular, the phoneme-separated part of the input string compares the combined code of each phoneme and the combined code of the characters constituting the text in the order of each phoneme in the order of initial, neutral, and final. It has already been mentioned that the undiagnosed part of a string may be configured to compare the complete chords of each syllable and the complete chords of the characters that make up the text in syllable units.

다음, 텍스트를 구성하는 조합형 코드로부터 음소 검색을 위해 입력된 문Next, the statement entered for phoneme search from the combined code that composes the text.

자열의 조합형 코드와의 매칭 부분을 발견하여, 최종적으로 입력된 문자열 전체에 해당하는 부분을 텍스트 내에서 발견한 경우, 텍스트 내의 매칭 부분을 구성하는 글자 코드를 사용자가 볼 수 있도록 디스플레이 할 수 있다(S205, S207).When the matching part with the combined code of the string is found and the part corresponding to the entire inputted string is finally found in the text, the character code constituting the matching part in the text may be displayed for the user to see ( S205, S207).

또, 입력된 문자열과 텍스트내의 첫번째 매칭 부분을 표시한 후, 사용자 선택It also displays the input string and the first matching part in the text, then selects the user.

에 따라 다음 매칭 부분을 검색하고 차례로 표시할 수도 있다(S209). 그리고 검색 결과 본문 끝까지 해당 문자열이 없거나(S211), 사용자 선택에 따라 계속 검색을 수행하지 않을 수도 있음은 앞서 설명한 바와 같다. 또한 완성형 코드로 구성된 해당 텍스트를 전부 조합형 코드로 변환하여 않고, 소정 단위로 변환하고 변환시마다 입력된 문자열과의 일치여부를 체크하도록 구성될 수도 있다는 점도 이미 언급한 바와 같다.Next, the next matching part may be searched for and displayed in turn (S209). As described above, the corresponding string may not exist until the end of the search result body (S211), or the search may not be continuously performed according to the user's selection. In addition, as mentioned above, it may be configured to convert the corresponding text composed of the complete code into a combination code, convert the data into a predetermined unit, and check whether or not the input string matches each time the conversion.

도 5는 본 발명의 또 다른 실시예에 따른 화면이다.   5 is a screen according to another embodiment of the present invention.

즉, 일반적인 인터넷을 이용한 자료 검색 후, 해당 자료내에서 원하는 문자열을 찾을 때, 본 발명의 특징에 따른 음소 검색을 활용할 수 있다.That is, after searching for a material using a general Internet, when searching for a desired character string in a corresponding material, a phoneme search according to a feature of the present invention may be utilized.

예를 들어 도시된 바와 같은 브라우저 내의 "원하는 문자열 찾기"창에 음소 검색 옵션을 부여하여 사용자가 원하는 경우 음소 검색을 실행할 수도 있다. 사용 자의 별도 선택 없이 입력된 문자열의 형태에 따라 자동으로 음소 검색 기능이 실행될 수도 있음도 앞서 설명한 바와 같다. 또 음소 검색창을 별도로 구성하여, 음소 검색창에 음소 분리된 음절이 입력되면 음소 검색을 실행하도록 구성될 수도 있다.For example, a phoneme search option may be given to a “find desired string” window in the browser as shown, and a phoneme search may be executed if desired by the user. As described above, the phoneme search function may be automatically executed according to the type of the input string without the user's separate selection. In addition, the phoneme search window may be separately configured to perform a phoneme search when a phoneme-separated syllable is input to the phoneme search window.

보다 구체적으로 도 6에 도시된 바와 같이, 사용자가 검색 엔진을 통해 인터넷을 통해 공개된 자료 검색을 실행하여 원하는 자료를 찾은 경우, 사용자는 검색 엔진이 제공하는 링크를 통해 해당 자료가 제공되는 웹페이지에 접속할 수 있다(S300, S301).More specifically, as illustrated in FIG. 6, when a user executes a search for an open data through the search engine to find a desired material, the user may search for a webpage provided with the material through a link provided by the search engine. (S300, S301).

이 때, 해당 자료에 포함되는 텍스트로부터 특정 문자열을 검색하고자 하는 At this time, you want to search for a specific string from the text included in the material.

경우, 검색어 입력창(예를 들어, 현재의 웹브라우저 실행 상태에서 Ctrl+F 키를 실행할 때 나타나는 창)에 검색을 원하는 문자열을 입력하여 음소 검색을 수행할 수 있다(S303, S305).In this case, a phoneme search may be performed by inputting a string to search for in a search word input window (for example, a window displayed when the Ctrl + F key is executed in the current web browser execution state) (S303 and S305).

그리고, 이 때, 텍스트를 구성하는 글자의 조합형코드 중 검색창에 입력된 글자의 조합형 코드와 일치되는 부분이 있는 경우, 텍스트 내의 해당 문자열 포함 부분을 구분 표시 할 수 있다(S307, S309).In this case, when there is a part of the combined code of the letters constituting the text that matches the combined code of the letters input in the search box, the corresponding part including the corresponding string in the text may be distinguished and displayed (S307 and S309).

이 때 텍스트를 구성하는 문자가 완성형 코드인 경우, 완성형 코드를 조합형 코드로 변환하는 방법 또한 앞서 설명한 바와 같다. 입력된 문자열 전체를 조합형 코드로 인식할 수도 있고 음소 분리된 음절부분만을 조합형 코드로 인식하도록 구성될 수도 있음도 이미 언급하였다. 또, 상술한 바와 같이 입력된 문자열과 텍스트를 구성하는 문자간의 코드 비교를 통해 매칭 부분을 검색하는데, 특히 입력된 문 자열중 음소 분리된 부분은 초성, 중성, 종성의 차례로 각 음소 단위로 각 음소의 조합형 코드와 텍스트를 구성하는 문자의 조합형 코드를 비교하고, 입력된 문자열 중 음소 분리되지 않은 부분은 음절 단위로 각 음절의 완성형 코드와 텍스트를 구성하는 문자의 완성형 코드를 서로 비교하도록 구성될 수도 있음도 이미 언급하였다.In this case, when the character constituting the text is a complete code, the method of converting the complete code to the combined code is also as described above. It has already been mentioned that the entire input string may be recognized as a combination code, or it may be configured to recognize only phoneme-separated syllable parts as a combination code. In addition, as described above, a matching part is searched through a code comparison between the input string and the characters constituting the text. Particularly, the phoneme-separated part of the input string is each phoneme in each phoneme unit in the order of initial, neutral, and final. Comparing the combinatorial code of and the combinatorial code of the characters constituting the text, and the non-membrane part of the input string may be configured to compare the complete code of each syllable and the complete code of the characters constituting the text with each syllable unit. I already mentioned.

그리고, 실시예에 따라서는, 텍스트를 구성하는 글자의 조합형 코드 중 검색창에 입력된 글자의 조합형 코드와 일치되는 부분이 있고 최종적으로 입력된 문자열 전체가 해당 텍스트 내에서 발견된 경우, 텍스트 내에서 검색 대상 문자열을 포함한 부분으로 디스플레이 영역을 이동할 수 있는 것 또한 앞서 설명한 바와 같다. 또한 텍스트를 구성하는 문자를 소정 단위로 조합형 코드로 변환하고, 변환시마다 혹은 일정 주기로 입력된 문자열과의 일치 여부를 비교하도록 구성될 수도 있음 또한 앞서 언급한 바와 같다.And, according to the embodiment, if there is a part of the combined code of the letters constituting the text that matches the combined code of the letters entered in the search box and finally the entire inputted string is found in the text, within the text As described above, the display area may be moved to a part including the search target string. In addition, it may be configured to convert the characters constituting the text into a combination code in a predetermined unit, and to compare whether or not matching with the input character string at each conversion or at regular intervals as described above.

도 7은 본 발명의 또 다른 실시예에 따른 화면이다.7 is a screen according to another embodiment of the present invention.

일반적인 웹 문서 검색의 경우 검색창에 입력된 단어를 포함하는 문서가 인터넷 검색 결과 페이지에 제공된다. In a typical web document search, a document containing the words entered in the search box is provided on the Internet search results page.

검색 사이트의 데이터베이스에는 웹 문서 단어와 문서간의 일대일 매칭을 통해 해당 문서에 대한 링크가 저장되어 있는데, 즉 각 단어를 인덱스로 하여 매칭되는 문서의 링크 정보가 저장되어 있다. 그리고, 검색창에 입력된 단어를 포함하는 웹문서 검색 결과는 해당 단어를 인덱스로 하여 매칭 저장된 링크 목록을 제시하는 것이다.In the database of the search site, a link to a corresponding document is stored through one-to-one matching between a web document word and a document. That is, link information of a matching document is stored using each word as an index. The web document search result including the word entered in the search box is to present a list of matching and stored links using the word as an index.

따라서, 사용자가 특정 단어를 검색창에 입력하면, 검색 사이트는 데이터베이스에 저장된 인덱스 목록을 검색하여 해당 단어로 인덱스되는 웹페이지 링크 목록을 화면에 표시한다.Therefore, when a user inputs a specific word into the search box, the search site searches a list of indexes stored in the database and displays a list of web page links indexed by the word on the screen.

이 때, 인덱스 목록 검색에 본 발명의 실시예에 따른 음소검색을 활용할 수 있는데, 도면에 도시된 바와 같은 음소 검색 기능을 추가하여 인덱스 목록 검색시 음소 검색을 실행할 수도 있다. 또한 앞서 상술한 다른 예와 같이, 별도의 음소 검색 기능 선택에 관계없이, 검색창에 입력된 단어의 형태에 따라 자동으로 음소 검색을 실행할 수도 있고, 음소 검색을 위한 별도의 음소 검색창을 마련할 수도 있음을 물론이다.In this case, the phoneme search according to an embodiment of the present invention may be used for the index list search. The phoneme search function may be added to search the index list by adding a phoneme search function as shown in the drawing. In addition, as in the above-described other example, regardless of the selection of a separate phoneme search function, the phoneme search may be automatically executed according to the type of the word input into the search box, or a separate phoneme search box may be provided for the phoneme search. Of course it may.

예를 들어, "로<ㅋ,ㅓㅏ,ㄹ>라이징"으로 검색을 실행하는 경우, 검색 사이트에서는 단어 인덱스 목록에서 음소 검색을 실행하여 조건에 부합하는 인덱스 목록을 구할 수 있다. 그 결과, "로칼라이징"으로 인덱스 되는 웹페이지 링크 목록 및 "로컬라이징"으로 인덱스되는 웹페이지 링크 목록이 모두 검색 결과로 제공될 수 있다.For example, if you perform a search with "rising", the search site can perform a phoneme search from the word index list to obtain a list of indexes that meet the criteria. As a result, both the webpage link list indexed as "localizing" and the webpage link list indexed as "localizing" can be provided as search results.

보다 구체적으로 도 8에 도시된 바와 같이, 사용자가 특정 단어를 검색창에 입력하여 웹문서를 검색하는 경우, 검색 사이트는 데이터베이스에 저장된 인덱스 목록을 검색하여 해당 단어로 인덱스되는 웹페이지 링크 목록을 화면에 표시한다(S400).More specifically, as shown in FIG. 8, when a user searches a web document by inputting a specific word into a search box, the search site searches a list of indexes stored in a database and displays a list of web page links indexed by the word. To display on (S400).

이 때, 인덱스 목록 검색시 음소 검색을 실행하여, 조건에 부합하는 단어 인덱스를 구할 수 있다(S403, S405). 앞서 상술한 예에 따르면, "로칼라이징"과 "로 컬라이징" 2가지 단어 인덱스를 구할 수 있다.At this time, a phoneme search is performed during the index list search to obtain a word index that satisfies the condition (S403 and S405). According to the above-described example, two word indexes can be obtained, "localizing" and "low collating".

그리고, 각각의 단어 인덱스에 대해 매칭된 웹페이지 링크 목록이 취합되어 화면에 표시되는데, 상기 예에 따르면 "로칼라이징"과 "로컬라이징" 각각에 매칭된 웹문서 링크 목록이 함께 화면에 표시된다(S407).Then, a list of web page links matched for each word index is collected and displayed on the screen. According to the above example, a list of web document links matching each of "localizing" and "localizing" is displayed together on the screen (S407). ).

이상 설명한 바는 본 발명의 실시예에 불과한 것으로, 본 발명의 권리범위가 이에 한정되는 것은 아니며, 당업자에 자명한 사항에 대하여 다양한 변형실시가 가능함은 당연하다. As described above is only an embodiment of the present invention, the scope of the present invention is not limited thereto, and it is obvious that various modifications may be made to matters apparent to those skilled in the art.

예를 들어, ㉮와 같이 텍스트내 삽입되는 특수문자로서 실질적으로는 의미를 갖는 글자이나 특수문자로 별도 취급되는 경우, 해당 특수문자의 조합형 코드간의 매칭관계도 추가적으로 정의할 수 있다. 그 결과 텍스트내 삽입되는 특수문자 역시 조합형 코드로 변환되고, 실질적으로는 음소 검색 기능에 따른 검색 대상이 될 수 있다. For example, when a special character inserted in the text, such as 별도, is separately treated as a character or a special character having a meaning, a matching relationship between the combined codes of the special characters may be further defined. As a result, the special characters inserted into the text are also converted into a combinational code, and can be a search target according to the phoneme search function.

본 발명의 권리범위는 후술할 특허청구범위 기재사항 및 그와 균등사항으로 인정되는 모든 기술적 구성요소를 포함할 것이다.The scope of the present invention will include all the technical components recognized as the claims described below and equivalents thereof.

이상 설명한 바와 같이 본 발명에 따르면, 검색 대상 자료로부터 사용자가 실제 입력한 키워드에 관계없이, 사용자가 찾기를 원하는 문자열을 다양하게 찾아낼 수 있다. 특히, 연음효과, 외래어, 한글로 기재된 영어 단어 등이 동일한 의미임에도 불구하고 여러 가지 형태로 변형된 경우, 혹은 형용사 혹은 동사 등이 다양하게 활용된 경우에도 해당 문자열을 편리하게 찾아낼 수 있다.As described above, according to the present invention, regardless of the keyword actually input by the user, various types of strings that the user wants to find can be found. In particular, even if the sound effect, foreign words, English words written in Korean, etc. have the same meaning, even if they are modified in various forms, or even if a variety of adjectives or verbs, etc. can be found conveniently.

Claims (33)

화면을 통해 디스플레이된 텍스트내에서 특정 문자열을 검색하는 문자열 검색 방법에 있어서,In the string search method for searching for a specific string in the text displayed on the screen, a) 검색 대상 문자열로 입력된 음절 중 복수의 음소로 분리된 음절이 존재하는 경우, 입력된 문자열을 조합형 코드로 인식하는 단계; 및a) recognizing the input string as a combination code when there are syllables divided into a plurality of phonemes among syllables input as a search target string; And b) 입력된 문자열의 조합형 코드와 상기 텍스트를 구성하는 문자들의 조합형 코드간 일치 부분이 존재하는 경우, 일치 부분을 표시하는 단계를 포함하는b) if there is a matching part between the combined code of the input string and the combined code of the characters constituting the text, displaying the matching part; 문자열 검색 방법.String search method. 제1항에 있어서,The method of claim 1, 상기 a) 단계에서 검색 대상으로 입력되는 문자열에는 특수기호도 포함되는The character string input as a search target in step a) includes a special symbol. 문자열 검색 방법.String search method. 제1항에 있어서,The method of claim 1, 상기 a) 단계는,Step a) is 복수의 음소로 분리된 음절만을 조합형 코드로 인식하는 단계인Recognizing only syllables divided into a plurality of phonemes as a combination code 문자열 검색 방법.String search method. 제1항에 있어서,The method of claim 1, 상기 b) 단계는,B), 상기 텍스트를 구성하는 문자들이 완성형 코드인 경우, 완성형 코드와 조합형 코드간의 매칭 테이블을 이용하여 텍스트를 구성하는 모든 문자들을 조합형 코드로 변환하여, 초성, 중성, 혹은 종성으로 입력된 각 음소의 조합으로 발생 가능한 모든 문자열의 조합형 코드 각각에 대해, 상기 텍스트를 구성하는 문자들의 조합형 코드와 일치 부분이 존재하는지 검색하여 일치 부분을 표시하는 단계인If the characters constituting the text are complete codes, all the characters constituting the text are converted into combined codes using a matching table between the completed codes and the combined codes, and the combinations of the phonemes inputted as initial, neutral, or final characters are used. For each of the combination codes of all possible strings, searching for the combination code and the matching portion of the characters constituting the text and displaying the matching portion, 문자열 검색 방법.String search method. 제1항에 있어서,The method of claim 1, 상기 b) 단계는, B), 상기 텍스트를 구성하는 문자들이 완성형 코드인 경우, 완성형 코드와 조합형 코드간의 매칭 테이블을 이용하여 텍스트를 구성하는 문자들을 소정 단위로 조합형 코드로 변환하여, 변환시 마다 혹은 소정 주기로 초성, 중성, 혹은 종성으로 입력된 각 음소의 조합으로 발생 가능한 모든 문자열의 조합형 코드 각각에 대해, 상기 텍스트를 구성하는 문자들의 조합형 코드와 일치 부분이 존재하는지 검색하여 일치 부분을 표시하는 단계인 If the characters constituting the text are complete codes, the characters constituting the text are converted into the combined code by a predetermined unit by using a matching table between the completed code and the combined code, and are converted to initial, neutral, or finality at each conversion or at a predetermined period. For each combination code of all the strings that can be generated by the combination of each phoneme input, searching for a matched code and a combination code of the characters constituting the text and displaying the matched portion. 문자열 검색 방법String search method 제4항 또는 제5항에 있어서,The method according to claim 4 or 5, 초성, 중성 혹은 종성 중 적어도 하나에는 복수의 음소가 입력되고, A plurality of phonemes are input to at least one of the initial, neutral, or final star, 상기 b)단계는,Step b), 초성, 중성, 종성의 차례대로 각 음소 단위로 각 음소의 조합형 코드와 텍스트를 구성하는 문자의 조합형 코드를 비교하여, 입력된 문자열과 텍스트를 구성하는 문자들간의 일치 부분을 표시하는 단계인Comparing the combination code of each phoneme and the combination code of the characters constituting the text in the order of the initial, neutral, and final digits, and displaying the matching part between the input string and the characters constituting the text. 문자열 검색 방법.String search method. 제1항 내지 제5항 중 어느 한 항에 있어서,The method according to any one of claims 1 to 5, 상기 b) 단계에서의 일치 부분을 표시하는 단계는,Marking the matched portion in step b), 해당 텍스트내에서, 입력된 문자열의 조합형 코드와 상기 텍스트를 구성하는 문자들의 조합형 코드가 일치하는 부분으로 디스플레이 영역을 이동하는 단계인Within the text, the display area is moved to a portion where the combined code of the input character string and the combined code of the characters constituting the text match. 문자열 검색 방법.String search method. 제1항 내지 제5항 중 어느 한 항에 있어서,The method according to any one of claims 1 to 5, 상기 b) 단계에서의 일치 부분을 표시하는 단계는,Marking the matched portion in step b), 해당 텍스트내에서, 입력된 문자열의 조합형 코드와 상기 텍스트를 구성하는 문자들의 조합형 코드가 일치하는 부분을 구분 표시하는 단계인In the corresponding text, distinguishing and displaying a portion where the combined code of the input string matches the combined code of the characters constituting the text; 문자열 검색 방법.String search method. 제4항 또는 제5항에 있어서,The method according to claim 4 or 5, 상기 완성형 코드와 조합형 코드간의 매칭 테이블은, The matching table between the complete code and the combined code, 특수 문자와 상기 특수 문자와 동일한 의미를 갖는 일반 문자 조합형 코드간의 매칭관계 정보를 더 포함하는Further comprising matching relationship information between a special character and a general character combination code having the same meaning as the special character 문자열 검색 방법.String search method. 제7항에 있어서, The method of claim 7, wherein 디스플레이 영역을 이동하는 단계는, To move the display area, 해당 텍스트내 검색 시작부분으로부터, 입력 문자열의 조합형 코드와 텍스트 구성 문자들의 조합형 코드간의 첫번째 일치 영역으로 디스플레이 영역을 이동하는 단계인 From the beginning of the search in the text, moving the display area to the first matching area between the combined code of the input string and the combined code of the text construct characters. 문자열 검색 방법.String search method. 제1항 내지 제5항 중 어느 한 항의 방법이 컴퓨터에서 실행되도록 하는 프로그램을 기록한 저장매체.A storage medium having recorded thereon a program for executing the method of any one of claims 1 to 5 on a computer. 제6항의 방법이 컴퓨터에서 실행되도록 하는 프로그램을 기록한 저장매체A storage medium recording a program for causing the method of claim 6 to run on a computer. 텍스트 파일내 특정 문자열을 검색하는 문자열 검색 방법에 있어서, In the string search method for searching a specific string in a text file, 검색 대상 문자열로 입력된 음절 중 복수의 음소로 분리된 음절이 존재하Among the syllables entered as the search target string, there are syllables divided into phonemes. 는 경우, 입력된 문자열을 조합형 코드로 인식하는 단계; 및Recognizing the input character string as a combination code; And 선택된 텍스트 파일을 구성하는 문자의 조합형 코드 중 상기 입력된 문자열 의 조합형 코드와 일치하는 부분이 존재하는 경우, 텍스트 파일을 열어 일치부분을 화면에 표시하는 단계를 포함하는       If there is a part of the combined code of the characters constituting the selected text file that matches the combined code of the input string, opening the text file and displaying the matched portion on the screen. 문자열 검색 방법String search method 제13항에 있어서,The method of claim 13, 상기 a) 단계는,Step a) is 복수의 음소로 분리된 음절만을 조합형코드로 인식하는 단계인Recognizing only syllables divided into a plurality of phonemes as a combined code 문자열 검색 방법.String search method. 제13항에 있어서, The method of claim 13, 상기 a) 단계에서 검색 대상으로 입력되는 문자열에는 특수기호도 포함되는The character string input as a search target in step a) includes a special symbol. 문자열 검색 방법.String search method. 제13항에 있어서, The method of claim 13, 상기 b) 단계는,B), 상기 텍스트를 구성하는 문자들이 완성형 코드인 경우, 완성형 코드와 조합형 코드간의 매칭 테이블을 이용하여 텍스트를 구성하는 모든 문자들을 조합형 코드로 변환하여, 초성, 중성, 혹은 종성으로 입력된 각 음소의 조합으로 발생 가능한 모든 문자열의 조합형 코드 각각에 대해, 상기 텍스트를 구성하는 문자들의 조합형 코드와 일치 부분이 존재하는지 검색하여 일치 부분을 표시하는 단계인If the characters constituting the text are complete codes, all the characters constituting the text are converted into combined codes using a matching table between the completed codes and the combined codes, and the combinations of the phonemes inputted as initial, neutral, or final characters are used. For each of the combination codes of all possible strings, searching for the combination code and the matching portion of the characters constituting the text and displaying the matching portion, 문자열 검색 방법.String search method. 제13항에 있어서, The method of claim 13, 상기 b) 단계는,B), 상기 텍스트를 구성하는 문자들이 완성형 코드인 경우, 완성형 코드와 조합형 코드간의 매칭 테이블을 이용하여 텍스트를 구성하는 문자들을 소정 단위로 조합형 코드로 변환하여, 변환시마다 혹은 소정 주기로 초성, 중성, 혹은 종성으로 입력된 각 음소의 조합으로 발생 가능한 모든 문자열의 조합형 코드 각각에 대해, 상기 텍스트를 구성하는 문자들의 조합형 코드와 일치 부분이 존재하는지 검색하여 일치 부분을 표시하는 단계인If the characters constituting the text are complete codes, the characters constituting the text are converted into the combined code by a predetermined unit by using a matching table between the completed code and the combined code, and are converted to initial, neutral, or finality at each conversion or at a predetermined period. For each combination code of all the strings that can be generated by the combination of each phoneme input, searching for a matched code and a combination code of the characters constituting the text and displaying the matched portion. 문자열 검색 방법String search method 제16항 또는 제17항에 있어서, The method according to claim 16 or 17, 초성, 중성 혹은 종성 중 적어도 하나에는 복수의 음소가 입력되고,A plurality of phonemes are input to at least one of the initial, neutral, or final star, 상기 b)단계는,Step b), 초성, 중성, 종성의 차례대로 각 음소단위로 각 음소의 조합형 코드와 텍스트를 구성하는 문자의 조합형 코드를 비교하여, 입력된 문자열과 텍스트를 구성하는 문자들간의 일치부분을 표시하는 단계인Comparing the combination code of each phoneme and the combination code of the characters constituting the text in each phoneme unit in the order of initial, neutral, and final, and displaying the matching portion between the input string and the characters constituting the text. 문자열 검색 방법.String search method. 제13항 내지 제17항 중 어느 한 항에 있어서, The method according to any one of claims 13 to 17, 상기 b) 단계에서의 일치 부분을 표시하는 단계는,Marking the matched portion in step b), 텍스트 파일을 열어 해당 텍스트내에서, 입력된 문자열의 조합형 코드와 상기 텍스트를 구성하는 문자들의 조합형 코드가 일치하는 부분으로 디스플레이 영역을 이동하여 표시하는 단계인Opening the text file and moving the display area to the part where the combined code of the input string matches the combined code of the characters constituting the text in the text. 문자열 검색 방법.String search method. 제13항 내지 제17항 중 어느 한 항에 있어서, The method according to any one of claims 13 to 17, 상기 b) 단계에서의 일치 부분을 표시하는 단계는,Marking the matched portion in step b), 텍스트 파일을 열어 해당 텍스트내에서, 입력된 문자열의 조합형 코드와 상기 텍스트를 구성하는 문자들의 조합형 코드가 일치하는 부분을 디스플레이영역에서 구분 표시하는 단계인Opening a text file and displaying a portion in the display area where the combined code of the input string matches the combined code of the characters constituting the text. 문자열 검색 방법.       String search method. 제16항 또는 제17항에 있어서, The method according to claim 16 or 17, 상기 완성형 코드와 조합형 코드간의 매칭 테이블은, The matching table between the complete code and the combined code, 특수 문자와 상기 특수 문자와 동일한 의미를 갖는 일반 문자 조합형 코드간의 매칭관계 정보를 더 포함하는Further comprising matching relationship information between a special character and a general character combination code having the same meaning as the special character 문자열 검색 방법.String search method. 제19항에 있어서, The method of claim 19, 디스플레이 영역을 이동하여 표시하는 단계는, Moving and displaying the display area may include 해당 텍스트내 검색 시작부분으로부터, 입력 문자열의 조합형 코드와 텍스트 구성 문자들의 조합형 코드간의 첫번째 일치 영역으로 디스플레이 영역을 이동하여 표시하는 단계인 From the beginning of the search in the text, the display area is moved to the first matching area between the combined code of the input string and the combined code of the text constituent characters. 문자열 검색 방법.String search method. 제13항 내지 제17항 중 어느 한 항의 방법을 컴퓨터에서 실행되도록 하는 프로그램을 기록한 저장매체.A storage medium having recorded thereon a program for executing the method of claim 13 on a computer. 제18항의 방법을 컴퓨터에서 실행되도록 하는 프로그램을 기록한 저장매체.A storage medium having recorded thereon a program for executing the method of claim 18 on a computer. 웹문서 검색 방법에 있어서,In the web document search method, a) 검색 대상 문자열로 입력된 음절 중 복수의 음소로 분리된 음절이 존재하는 경우, 입력된 문자열을 조합형 코드로 인식하는 단계; 및a) recognizing the input string as a combination code when there are syllables divided into a plurality of phonemes among syllables input as a search target string; And b) 소정 단어를 포함한 웹문서에 대한 링크 정보가 해당 단어를 인덱스로 하여, 단어와 해당 단어를 포함한 웹문서 링크 정보가 일대일 매칭 저장된 데이터베이스로부터 단어 인덱스 목록을 검색하여, 조합형 코드가 입력된 문자열의 조합형 코드와 일치하는 인덱스 단어를 발견한 경우, 해당 인덱스 단어에 대해 매칭 저장된 웹문서 링크 정보를 표시하는 단계를 포함하는b) The link information for the web document containing the predetermined word is the index and the word and the web document link information including the word are matched one-to-one. If an index word matching the combined code is found, displaying matching web document link information for the index word. 웹문서 검색 방법.How to search web documents. 제25항에 있어서,The method of claim 25, 상기 a) 단계에서 검색 대상으로 입력되는 문자열에는 특수기호도 포함되는The character string input as a search target in step a) includes a special symbol. 웹문서 검색 방법.How to search web documents. 제25항에 있어서,The method of claim 25, 상기 a) 단계는,Step a) is 복수의 음소로 분리된 음절만을 조합형코드로 인식하는 단계인Recognizing only syllables divided into a plurality of phonemes as a combined code 문자열 검색 방법.String search method. 제25항에 있어서,The method of claim 25, 상기 b) 단계는,B), 상기 인덱스 단어를 구성하는 문자들이 완성형 코드인 경우, 완성형 코드와 조합형 코드간의 매칭 테이블을 이용하여 인덱스 단어를 구성하는 모든 문자들을 조합형 코드로 변환하여, 초성, 중성, 혹은 종성으로 입력된 각 음소의 조합으로 발생 가능한 모든 문자열의 조합형 코드 각각에 대해, 상기 인덱스 단어를 구성하는 문자들의 조합형 코드와 일치 부분이 존재하는지 검색하여, 일치하는 인덱스 단어를 발견한 경우 해당 인덱스 단어에 대해 매칭 저장된 웹문서 링크 정보를 표시하는 단계인When the letters constituting the index word are complete codes, all the letters constituting the index word are converted into a combination code by using a matching table between the completion code and the combination code, so that each phoneme input as the initial, neutral, or final word of each phoneme. For each combination code of all possible strings, search for a matching part with the combination code of the letters constituting the index word, and if a matching index word is found, matches the index word. To display information 웹문서 검색 방법.How to search web documents. 제25항에 있어서,The method of claim 25, 상기 b) 단계는,B), 상기 인덱스 단어를 구성하는 문자들이 완성형 코드인 경우, 완성형 코드와 조합형 코드간의 매칭 테이블을 이용하여 인덱스 단어를 구성하는 문자들을 소정 단위로 조합형 코드로 변환하여, 초성, 중성, 혹은 종성으로 입력된 각 음소의 조합으로 발생 가능한 모든 문자열의 조합형 코드 각각에 대해, 상기 인덱스 단어를 구성하는 문자들의 조합형 코드와 일치 부분이 존재하는지 검색하여, 일치하는 인덱스 단어를 발견한 경우 해당 인덱스 단어에 대해 매칭 저장된 웹문서 링크 정보를 표시하는 단계인If the characters constituting the index word are complete codes, the characters constituting the index word are converted into combination codes in a predetermined unit by using a matching table between the complete code and the combined code, and each input of the initial, neutral, or final type is performed. For each combination code of all the strings that can be generated by phoneme combination, search whether there is a matching part with the combination code of the letters constituting the index word, and if a matching index word is found, matching and storing the web for the index word To display document link information 웹문서 검색 방법.How to search web documents. 제28항 또는 제29항에 있어서,The method of claim 28 or 29, 초성, 중성 혹은 종성 중 적어도 하나에는 복수의 음소가 입력되고, A plurality of phonemes are input to at least one of the initial, neutral, or final star, 상기 b)단계는,Step b), 초성, 중성, 종성의 차례대로 각 음소 단위로 각 음소의 조합형 코드와 텍스트를 구성하는 문자의 조합형 코드를 비교하여, 입력된 문자열과 텍스트를 구성하는 문자들간의 일치 부분을 표시하는 단계인Comparing the combination code of each phoneme and the combination code of the characters constituting the text in the order of the initial, neutral, and final digits, and displaying the matching part between the input string and the characters constituting the text. 웹문서 검색 방법.How to search web documents. 제28항 또는 제29항에 있어서,The method of claim 28 or 29, 상기 완성형 코드와 조합형 코드간의 매칭 테이블은, The matching table between the complete code and the combined code, 특수 문자와 상기 특수 문자와 동일한 의미를 갖는 일반 문자 조합형 코드간의 매칭관계 정보를 더 포함하는Further comprising matching relationship information between a special character and a general character combination code having the same meaning as the special character 웹문서 검색 방법.How to search web documents. 제25항 내지 제29항 중 어느 한 항의 방법이 컴퓨터에서 실행되도록 하는 프로그램을 기록한 저장매체. A storage medium having recorded thereon a program for executing the method of any one of claims 25-29. 제30항의 방법이 컴퓨터에서 실행되도록 하는 프로그램을 기록한 저장매체.A storage medium having recorded thereon a program for executing the method of claim 30 on a computer.
KR1020050091170A 2005-09-29 2005-09-29 Method for searching string by seperating phneme of characters, method for searching web document and storage medium storing execution program for that method KR20070036293A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020050091170A KR20070036293A (en) 2005-09-29 2005-09-29 Method for searching string by seperating phneme of characters, method for searching web document and storage medium storing execution program for that method

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020050091170A KR20070036293A (en) 2005-09-29 2005-09-29 Method for searching string by seperating phneme of characters, method for searching web document and storage medium storing execution program for that method

Publications (1)

Publication Number Publication Date
KR20070036293A true KR20070036293A (en) 2007-04-03

Family

ID=38158494

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020050091170A KR20070036293A (en) 2005-09-29 2005-09-29 Method for searching string by seperating phneme of characters, method for searching web document and storage medium storing execution program for that method

Country Status (1)

Country Link
KR (1) KR20070036293A (en)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20160101604A (en) * 2015-02-17 2016-08-25 삼성전자주식회사 Device for Determining Sameness Between Difference Languages and Method thereof
KR20170137285A (en) * 2016-06-03 2017-12-13 주식회사 허브케이 Appratus and method of correcting image reading/input error word
KR20210047192A (en) * 2019-10-21 2021-04-29 (주)나라지식정보 Apparatus and method for searching text based on phoneme

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20160101604A (en) * 2015-02-17 2016-08-25 삼성전자주식회사 Device for Determining Sameness Between Difference Languages and Method thereof
KR20170137285A (en) * 2016-06-03 2017-12-13 주식회사 허브케이 Appratus and method of correcting image reading/input error word
KR20210047192A (en) * 2019-10-21 2021-04-29 (주)나라지식정보 Apparatus and method for searching text based on phoneme

Similar Documents

Publication Publication Date Title
Keuleers et al. Wuggy: A multilingual pseudoword generator
KR101265263B1 (en) Method and system for name matching using phonetic sign and computer readable medium recording the method
EP2153352B1 (en) Recognition architecture for generating asian characters
JP4302326B2 (en) Automatic classification of text
US6999918B2 (en) Method and apparatus to facilitate correlating symbols to sounds
US20070100890A1 (en) System and method of providing autocomplete recommended word which interoperate with plurality of languages
JP2013117978A (en) Generating method for typing candidate for improvement in typing efficiency
JP5688941B2 (en) Method for searching Chinese using tone and system for performing the method
KR102182672B1 (en) The method for searching integrated multilingual consonant pattern and apparatus thereof
CN116685966A (en) Adjusting query generation patterns
JP2002149643A (en) Method for predicting reading of japanese ideogram
KR20070036293A (en) Method for searching string by seperating phneme of characters, method for searching web document and storage medium storing execution program for that method
KR100288144B1 (en) Foreign language coding method in Korean and search method using the same
KR100542757B1 (en) Automatic expansion Method and Device for Foreign language transliteration
WO2019179884A1 (en) Processing speech-to-text transcriptions
JP2008059389A (en) Vocabulary candidate output system, vocabulary candidate output method, and vocabulary candidate output program
US10614065B2 (en) Controlling search execution time for voice input facility searching
KR101163458B1 (en) Method for Calculating Similarity of Korean Word
Nongmeikapam et al. Genetic algorithm (ga) implementation for feature selection in manipuri pos tagging
JP3758241B2 (en) Voice information retrieval device
KR20120029505A (en) Method for calculating similarity of korean word
JP2014164260A (en) Information processor and information processing method
JP2007257188A (en) Dictionary search device and its control program
JP2004206659A (en) Reading information determination method, device, and program
JPH07325826A (en) Japanese language processing system

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
AMND Amendment
E601 Decision to refuse application
J201 Request for trial against refusal decision
AMND Amendment
E801 Decision on dismissal of amendment
B601 Maintenance of original decision after re-examination before a trial
J301 Trial decision

Free format text: TRIAL DECISION FOR APPEAL AGAINST DECISION TO DECLINE REFUSAL REQUESTED 20070621

Effective date: 20080314