KR20010016679A - 외국어로 표기된 한글을 한글표기로 변환하여 검색하는 시스템및 그 방법 - Google Patents

외국어로 표기된 한글을 한글표기로 변환하여 검색하는 시스템및 그 방법 Download PDF

Info

Publication number
KR20010016679A
KR20010016679A KR1019990031697A KR19990031697A KR20010016679A KR 20010016679 A KR20010016679 A KR 20010016679A KR 1019990031697 A KR1019990031697 A KR 1019990031697A KR 19990031697 A KR19990031697 A KR 19990031697A KR 20010016679 A KR20010016679 A KR 20010016679A
Authority
KR
South Korea
Prior art keywords
hangul
foreign language
matching
notation
search
Prior art date
Application number
KR1019990031697A
Other languages
English (en)
Other versions
KR100326936B1 (ko
Inventor
신의섭
송치양
정민교
이진호
Original Assignee
이계철
한국전기통신공사
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 이계철, 한국전기통신공사 filed Critical 이계철
Priority to KR1019990031697A priority Critical patent/KR100326936B1/ko
Publication of KR20010016679A publication Critical patent/KR20010016679A/ko
Application granted granted Critical
Publication of KR100326936B1 publication Critical patent/KR100326936B1/ko

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/3331Query processing
    • G06F16/3332Query translation
    • G06F16/3337Translation of the query language, e.g. Chinese to English
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/338Presentation of query results

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Machine Translation (AREA)
  • Document Processing Apparatus (AREA)
  • Computational Linguistics (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)

Abstract

1. 청구범위에 기재된 발명이 속한 기술분야
본 발명은 외국어로 표기된 한글을 한글표기로 변환하여 검색하는 시스템 및 그 방법과 상기 방법을 실현시키기 위한 프로그램을 기록한 컴퓨터로 읽을 수 있는 기록매체에 관한 것임.
2. 발명이 해결하려고 하는 기술적 과제
본 발명은, 한글 지명, 인명 등에 대해 외국어로 표기하여 검색 요청이 들어오면 이를 우선 한글표기로 변환하여 정보를 검색하는 시스템 및 그 방법과 상기 방법을 실현시키기 위한 프로그램을 기록한 컴퓨터로 읽을 수 있는 기록매체를 제공하고자 함.
3. 발명의 해결방법의 요지
본 발명은, 사용자로부터 외국어로 표기된 한글을 정보 검색어로 입력받는 제 1 단계; 외국어-한글 변환수단을 통해 상기 외국어로 표기된 한글을 한글표기로 변환하는 제 2 단계; 및 한글표기된 검색어를 정보 검색수단으로 보내어 정보 검색 결과를 생성하는 제 3 단계를 포함함.
4. 발명의 중요한 용도
본 발명은 정보 검색 시스템 등에 이용됨.

Description

외국어로 표기된 한글을 한글표기로 변환하여 검색하는 시스템 및 그 방법{SYSTEM AND METHOD FOR TRANSLATING FOREIGN LANGUAGE PHONETIC PRESENTATION OF KOREAN WORD TO KOREAN WORD AND RETRIEVING INFORMATION RELATED TO TRANSLATED KOREAN WORD}
본 발명은 검색 시스템 및 그 방법과 상기 방법을 실현시키기 위한 프로그램을 기록한 컴퓨터로 읽을 수 있는 기록매체에 관한 것으로, 특히 인명, 지명 등 외국어로 표기된 한글을 한글표기로 변환하여 검색하는 시스템 및 그 방법과 상기 방법을 실현시키기 위한 프로그램을 기록한 컴퓨터로 읽을 수 있는 기록매체에 관한 것이다.
종래에는 지리정보, 인명 자료 등에서 원래 한글 자료에 대해 외국어 표현으로 검색하고자 할 때, 원래의 한글 자료를 영어, 일어 등의 검색 대상 언어로 번역하여 저장해 놓은 상태에서 정보 검색기를 이용하여 자료를 검색할 수 있었다.
그러나, 기존의 한글 자료를 대상 언어로 표기할 경우, 표기자마다 서로 다르게 표기하기 때문에 한글 자료를 검색하고자 할 때, 표기 상의 차이로 인하여 원하는 자료를 찾지 못하는 경우가 발생하는 문제점이 있었다.
이에 대해 보다 상세히 설명하면 다음과 같다.
한글의 경우 표준 영문 표기법이 마련되어 있고, 타 외국어로 표기하는 방법은 마련되어 있지 않은 상태이다. 한글을 외국어로 표기할 때, 표기하는 사람마다 표기법이 틀려서 표준 표기법으로 한글 자료를 번역해도 한글 자료의 검색시 검색 효율이 크게 떨어지는 문제점이 있다. 즉 영어의 경우, 표준 표기법으로 번역을 해도 입력되는 영문이 표준 표기법과 다른 경우가 많기 때문에 검색이 제대로 되지 않는 경우가 많은 문제점이 있다.
예를 들어, "서초구"를 영문으로 표기하는 경우에, 우선, "서초"는 seocho, suhcho, socho 등으로 표현될 수 있고, "구"는 ku, gu, koo, goo 등으로 표현될 수 있다.
상기한 바와 같은 문제점을 해결하기 위하여 안출된 본 발명은, 한글 지명, 인명 등에 대해 외국어로 표기하여 검색 요청이 들어오면 이를 우선 한글표기로 변환하여 정보를 검색하는 시스템 및 그 방법과 상기 방법을 실현시키기 위한 프로그램을 기록한 컴퓨터로 읽을 수 있는 기록매체를 제공하는데 그 목적이 있다.
도 1 은 본 발명에 따른 외국어로 표기된 한글을 한글표기로 변환하여 검색하는 시스템에 대한 일실시에 구성도.
도 2 는 본 발명에 따른 외국어-한글 매칭 테이블에 사용되는 트리의 일예시도.
도 3 은 본 발명에 따른 외국어로 표기된 한글을 한글표기로 변환하여 검색하는 방법에 대한 일실시예 흐름도.
*도면의 주요 부분에 대한 부호의 설명
11 : 외국어-한글 변환부 12 : 한글-외국어 변환부
101 : 외국어-한글 매칭 처리부 102 : 외국어-한글 매칭 테이블
103 : 한글 정보 검색기 104 : 한글-외국어 매칭 처리부
105 : 한글-외국어 매칭 테이블
상기 목적을 달성하기 위한 본 발명의 시스템은, 한글 자료에 대한 검색 시스템에 있어서, 정보 검색을 위한 사용자의 외국어로 표기된 한글 입력을 한글표기로 변환하기 위한 외국어-한글 변환수단; 및 상기 외국어-한글 변환수단에 의해 한글로 변환된 검색어를 이용하여 정보 검색을 하기 위한 정보 검색수단을 포함하여 이루어진 것을 특징으로 한다.
또한, 본 발명의 방법은, 검색 시스템에 적용되는 외국어로 표기된 한글을 한글표기로 변환하여 검색하는 방법에 있어서, 사용자로부터 외국어로 표기된 한글을 정보 검색어로 입력받는 제 1 단계; 외국어-한글 변환수단을 통해 상기 외국어로 표기된 한글을 한글표기로 변환하는 제 2 단계; 및 한글표기된 검색어를 정보 검색수단으로 보내어 정보 검색 결과를 생성하는 제 3 단계를 포함하여 이루어진 것을 특징으로 한다.
또한, 본 발명은, 대용량 프로세서를 구비한 검색 시스템에, 사용자로부터 외국어로 표기된 한글을 정보 검색어로 입력받는 제 1 기능; 외국어-한글 변환수단을 통해 상기 외국어로 표기된 한글을 한글표기로 변환하는 제 2 기능; 및 한글표기된 검색어를 정보 검색수단으로 보내어 정보 검색 결과를 생성하는 제 3 기능을 실현시키기 위한 프로그램을 기록한 컴퓨터로 읽을 수 있는 기록매체를 제공한다.
본 발명은 기존의 한글 자료를 대상 언어로 표기할 경우, 표기자마다 서로 다르게 표기하기 때문에 한글 자료를 검색하고자 할 때, 표기 상의 차이로 인하여 원하는 자료를 찾지 못하는 경우가 많이 발생되는데, 이를 극복하기 위하여 기존의 한글 자료를 외국어로 표기할 필요없이 입력된 외국어를 발음상 가장 근사한 한글로 번역하여, 이를 한글 정보 검색기에 입력으로 이용하여 검색을 수행함으로써 검색 효율을 크게 높이는 것이다.
즉, 본 발명은 지리정보(지명), 인명자료 등 외국어로 번역하여도 한글의 특성이 그대로 남아있는 자료를 컴퓨터 시스템에서 검색할 때 한글의 외국어 표현이 사용하는 사람마다 틀리기 때문에 원하는 자료를 검색할 수 없는 것을 방지하기 위하여, 입력된 외국어를 발음이 가장 근사한 한글로 만들고, 새로 만들어진 한글을 이용하여 검색을 수행하여 검색 효율을 높인다. 또한, 유사한 한글이 여러 개 일 경우, 반복 수행하여 검색자가 가장 근사한 자료를 찾을 수 있도록 하는 것이다.
또한, 본 발명은, 외국인 혹은 한글을 사용할 수 없는 외국에서 한글 자료를 검색할 경우, 한글의 외국어 표기가 사용하는 사람마다 다르기 때문에 한글의 외국어 표기만으로는 한글 자료를 검색하기가 어렵기 때문에 이를 해결하려고 한다. 즉 한글의 외국어 표기를 발음에 가장 가까운 한글로 만들어서 직접 한글 검색을 하면 원하는 자료를 검색할 수 있다. 만일 유사한 글자가 여러 개 발생될 경우 반복하여 처리가 가능하다.
상술한 목적, 특징들 및 장점은 첨부된 도면과 관련한 다음의 상세한 설명을 통하여 보다 분명해 질 것이다. 이하, 첨부된 도면을 참조하여 본 발명에 따른 바람직한 일실시예를 상세히 설명한다.
도 1 은 본 발명에 따른 외국어로 표기된 한글을 한글표기로 변환하여 검색하는 시스템에 대한 일실시예 구성도이다.
본 발명에서 제안하는 시스템은 도면에 도시된 바와 같이, 외국어-한글 매칭부(11), 한글-외국어 매칭부(12) 및 한글 정보 검색기(103)로 구성된다.
외국어-한글 매칭부(11)는 외국어-한글 매칭 처리부(101)와 외국어(영어, 일어 등)-한글 매칭 테이블(102)로 이루어지며, 한글-외국어 매칭부(12)는 한글-외국어 매칭 처리부(104)와 한글-외국어 매칭 테이블(105)로 이루어진다.
본 실시예에서는 사용자가 영어를 사용하는 것을 가정하고 설명한다. 일어 혹은 다른 외국어도 경우는 마찬가지이며, 사용 테이블을 해당 언어에 맞도록 설정만 해주면 된다. 외국어의 특성이 서로 다르기 때문에 외국어-한글 매칭 테이블의 구성은 달라질 수 있다. 그러나 외국어의 한글 표기를 한글로 바꿔서 정보 검색을 행하는 기본 사상은 일치한다.
사용자가 검색어로 영문을 입력하였을 경우 입력된 영문은 외국어-한글 매칭 처리부(101)로 전달된다.
외국어-한글 매칭 처리부(101)에서는 입력된 영문을 한 글자씩 외국어-한글 매칭 테이블(102)로 보내어 입력된 영문과 일치된 한글을 받아온다. 이때 일치되는 한글의 글자가 여러 개 있을 수 있다. 이 경우 일치되는 글자와 먼저 혹은 후에 받은 글자를 조합하여 여러 개의 단어를 생성한다. 한글 조합시 생성된 한글의 순서는 바꾸지 않는다.
외국어-한글 매칭 처리부(101)에서는 생성된 한글 단어를 한글 정보 검색기(103)로 보낸다. 여러 개일 경우는 순차적으로 한글 정보 검색기(103)로 보낸다.
한글 정보 검색기(103)는 검색된 정보를 한글-외국어 매칭 처리부(104)로 보낸다. 한글-외국어 매칭 처리부(104)에서는 한글 정보 검색기(103)로부터 받은 내용 중 지명, 인명 등을 글자대로 한글-외국어 매칭 테이블(105)로 보내서 일치되는 영문을 받는다. 변환된 영문을 사용자에게 보낸다.
변환된 영문을 받은 사용자는 1개에서 여러 개의 검색 결과를 받을 수 있으며, 그중 원하는 검색 결과를 골라서, 시스템에서 제공하는 상세 정보 검색, 지도 검색 등의 서비스를 이용하게 된다. 원하는 검색 결과가 없을 경우에는 해당되는 메시지를 사용자에게 보내게 된다.
이를 각 구성요소 별로 상세히 설명하면 다음과 같다.
우선, 외국어-한글 매칭 처리부(101)는 사용자가 입력한 정보(글자)를 한 개씩(외국어의 표기상 한 글자) 해당되는 외국어-한글 매칭 테이블(102)로 보낸다. 외국어-한글 매칭 테이블(102)은 외국어 당 한 개씩 따로 구성된다.
외국어-한글 매칭 테이블(102)은 "외국어-한글 매칭 처리부(101)에서 받은 정보를 바탕으로 발음에 가장 근사한 한글을 찾아 외국어-한글 매칭 처리부(101)로 보내준다. 이때, 근사한 한글이 여러 개일 수도 있다. 여러 개일 경우는 여러 개를 전부 보낸다. 외국어-한글 매칭 처리부(101)는 외국어-한글 매칭 테이블(102)에서 받은 한글을 조합하여 순차적으로 한글 정보 검색기(103)로 보낸다. 만약 매칭되는 글자가 없을 경우는 맞는 글자가 없다는 메시지를 사용자에게 보낸다.
예를 들어, "sochoku"라고 입력되면 이는 외국어-한글 매칭 테이블(102)을 통하여 "서초구", "소초구" 등으로 출력된다.
다음으로 외국어-한글 매칭 테이블(102)을 설명한다.
외국어-한글 매칭 테이블(102)은 외국어 당 한 개씩 구성된다. 외국어-한글 매칭 처리부(101)에서 받은 정보를 바탕으로 가장 유사한 발음을 갖는 한글을 찾아 외국어-한글 매칭 처리부(101)로 되돌려 보내는 역할을 한다.
외국어-한글 매칭 테이블(102)의 구성은 다음과 같다. 여기서는 영어를 대상으로 설명하고 있다.
다음의 (표 1)과 같이 한글 순서대로 해당되는 외국어의 발음을 기입한다. 이때 가능이 되는 모든 글자 조합을 모두 넣는다. 또한, 발음되는 한글을 모두 표기한다.
ga, ka
na
da, ta
la, ra
: : ::
(표 1)과 같이 만들어진 표를 바탕으로 도 2에서 보여지는 바와 같은 알파벳 순서의 트리 형태로 다시 배열한다. 첫번째의 알파벳은 전부 존재한다(a z). 그러나 두번째부터는 해당되는 한글이 있을 경우와 해당되는 한글이 아래쪽 노드에 있을 경우만 존재한다.(예: bb의 경우는 해당되는 한글이 없으나, bba(빠, 빼), bbe(빼) 등은 한글이 있다.) 여기서 한글은 각 트리 노드의 속성(attribute)이 된다. 도 2의 트리 구조는 몇 가지 예만 간략하게 표시한 것이다.
트리 형태로 배열한 후에, 글자가 입력되면 해당되는 글자로 포인터가 옮겨가게 되며 외국어-한글 매칭 처리부(101)로 다음 글자를 확인한다. 확인하고자 하는 다음 글자가 포인터의 하위 레벨을 검색하여 있으면 그 노드로 옮겨가며, 없으면 현재의 포인터가 가리키는 노드의 속성(한글)을 외국어-한글 매칭 처리부(101)로 보낸다. 그리고 새로 입력된 글자를 다시 입력으로 하여 새로운 글자를 찾는다. 만약 입력할 글자가 없다면 역시 포인터가 위치한 노드의 속성을 보내준다.
한글 정보 검색기(103)에 대해 설명하면 다음과 같다.
한글 정보 검색기(103)는 지도, 웹(Web) 상의 홈페이지 검색, 신문 내용 검색 등과 같은 기존의 한글 자료에 대한 검색기인데, 특히, 내용상에서 번역이 필요하기보다는 지명, 인명 등과 같이 외국어로 표현시 발음에 따른 변환이 필요한 자료에 대한 검색기이다.
한글-외국어 매칭 처리부(104)에 대해 설명하면 다음과 같다.
한글-외국어 매칭 처리부(104)는 인명, 지명과 같이 번역이 필요하지 않고, 단지 한글의 외국어 표현이 필요한 한글 자료를 외국어로 1:1 변환하여 준다. 변환하고자 하는 외국어에 대한 한글-외국어 매칭 테이블(105)을 참조한다. 한글-외국어 매칭 처리부(104)는 한 글자씩 한글-외국어 매칭 테이블(105)로 보내어 변환되어 온 값을 받아 사용자에게 보여준다.
한글-외국어 매칭 테이블(105)에 대해 설명하면 다음과 같다.
한글-외국어 매칭 테이블(105)은 변환하고자 하는 외국어 당 1개의 표로 구성된다. 한글-외국어 매칭 테이블은 다음의 (표 2)와 같이 구성된다.
(표 2)에서는 한글-영문 매칭일 경우를 보여주며, 모든 한글을 다 표현하기에 너무 길고, 단순하므로 간단한 예만 보여준다.
ka
na
ta
ra
ma
pa
:: ::
테이블에는 표시할 수 있는 모든 한글에 대하여 표시하고 순서에 따라 입력한다. 대응되는 외국어는 표준 표기 방법에 따라 한 개씩만 표기한다.
도 2 는 본 발명에 따른 외국어-한글 매칭 테이블에 사용되는 트리의 일예시도이다.
외국어-한글 매칭 테이블(102)에 한글로 변환하고자 하는 외국어가 입력되면 도 2 에 도시된 바와 같은 트리를 이용하여 해당되는 한글을 찾게 된다. 도 2 에서도 영어를 대상으로 설명하고 있다.
도 3 은 본 발명에 따른 외국어로 표기된 한글을 한글표기로 변환하여 검색하는 방법에 대한 일실시예 흐름도이다.
사용자는 한글을 모르는 사람이라고 가정한다. 사용자가 취득한 정보는 한글을 영어로 표기한 정보이다(예: 주소, 인명 등). 사용자는 한국을 여행하기 위하여 취득한 정보를 바탕으로 지도를 얻기 원하여 한국의 지도 서비스 홈페이지에 접속한 상태이다.
사용자가 지도를 검색하기 위하여 검색창에 영문을 입력한다(예: seochoku(서초구)). 이 경우 지도에 정확하게 "seochoku"라고 표기되어 있지 않으면, 원하는 정보를 검색할 수 없다. 혹은 "seocho-ku"라고 거의 비슷하게 표기 되여 있어도 "-"이 있기 때문에 검색이 불가능하다. 그러나 본 발명에서는 입력된 영문을 바탕으로 가장 근사한 한글을 사용하여 검색하므로 원하는 정보를 검색할 수 있다. 외국어-한글 매칭 처리부(101)에 의하여 검색된 한글을 출력하게 된다. 만약 일치된 정보가 없으면 사용자에게 일치되는 정보가 없다는 메시지를 출력한다.
본 발명에 의하여 출력된 결과를 바탕으로 사용자는 정확한 정보를 찾는다. 출력된 결과가 여러 개일 경우, 출력된 결과 중 가장 유사한 것을 골라 선택하면 이를 바탕으로 원하는 지도를 얻게된다. 만약 원하는 것이 아니라면, 다른 결과를 이용하여 반복하여 검색이 가능하다.
이를 도면의 흐름에 따라 설명하면 다음과 같다.
우선, 자료 검색을 위해 사용자의 외국어 입력을 받는다(301). 외국어-한글 매칭 처리부(101)에서 입력된 외국어를 외국어-한글 매칭 테이블(102)로 전송한다(302). 이때 외국어-한글 매칭 처리부(101)에서는 한 글자씩 전송한다.
외국어-한글 매칭 테이블(102)에서는 일치되는 한글을 찾아 외국어-한글 매칭 처리부(101)로 전송한다(303). 외국어-한글 매칭 테이블(102)에서는 우선 수신된 외국어 한 글자를 확인하여 외국어-한글 매칭 테이블(102)의 매칭 트리에서 해당되는 글자의 노드로 이동한 후, 다음 글자를 확인하고, 다음 글자가 현재 포인터가 가리키는 글자 노드의 하위 레벨의 노드에 존재하면 그 하위 레벨의 글자 노드로 이동하여 또 다시 다음 글자를 확인하는 과정을 반복하고, 다음 글자가 하위 레벨의 노드에 존재하지 않으면 현재 가리키는 글자 노드의 속성인 한글을 외국어-한글 매칭 처리부(101)로 전송한다. 또한, 만약 다음 글자를 확인하고자 하였는데 다음 글자가 없으면 이 또한 현재 가리키는 글자 노드의 속성인 한글을 외국어-한글 매칭 처리부(101)로 전송한다.
외국어-한글 매칭 처리부(101)에서는 외국어-한글 매칭 테이블(102)에서 수신된 일치되는 한글을 이용하여 한글 단어를 생성한다(303). 일치되는 한글의 글자가 여러 개 있을 수 있는데, 이 경우 일치하는 글자와 먼저 혹은 후에 받은 글자를 조합하여 여러 개의 단어를 생성한다. 한글의 순서는 바꾸지 않는다. 외국어에 매칭되는 한글 글자가 없는 경우에는 이를 사용자에게 알려주게 된다.
외국어-한글 매칭 처리부(102)에서는 생성된 한글 단어를 한글 정보 검색기(103)로 보내어 한글 정보를 검색한다(305). 여러 개의 한글 단어가 생성되었으면 순차적으로 한글 정보 검색기(103)로 이를 보내고, 한글 정보 검색기(103)에서는 이에 대해 자료를 검색하여 한글-외국어 매칭 처리부(104)로 이를 전송한다.
한글-외국어 매칭 처리부(104)에서는 한글 정보 검색기(103)에서 검색된 결과를 받아 번역이 아니라 외국어 변환이 필요한 한글표기에 대해 한글-외국어 매칭 테이블(105)로 전송한다(306). 이때도 한글-외국어 매칭 테이블(105)로 한 글자씩 전송한다.
한글-외국어 매칭 테이블(105)에서는 입력된 한글에 매칭되는 외국어를 찾아 한글-외국어 매칭 처리부(104)로 전송한다(307). 한글-외국어 매칭 테이블(105)은 각 외국어당 1개의 테이블을 가지고 있으며, 해당 테이블은 한글에 대응되는 외국어를 표준 표기 방식에 따라 한 개씩만 가지고 있으므로, 해당 테이블에서 해당하는 한글을 찾아 이때의 외국어 표기를 한글-외국어 매칭 처리부(104)로 전송하면 된다.
한글-외국어 매칭 처리부(104)에서는 외국어 변환이 끝난 검색 결과를 사용자에게 제공한다(308). 사용자는 검색 결과를 바탕으로 정확한 정보를 찾는다.
이상에서 설명한 본 발명은 전술한 실시예 및 첨부된 도면에 의해 한정되는 것이 아니고, 본 발명의 기술적 사상을 벗어나지 않는 범위 내에서 여러 가지 치환, 변형 및 변경이 가능하다는 것이 본 발명이 속하는 기술분야에서 통상의 지식을 가진 자에게 있어 명백할 것이다.
상기한 바와 같은 본 발명은, 정보 검색을 위해 외국어로 입력된 지명, 인명 등 검색어에 대해 번역이 아닌 한글로 변환하여 정보 검색하고, 검색 결과를 다시 외국어로 변환하여 사용자에게 제공함으로써, 여러 가지 요인으로 인하여 표기자마다 표기 방법이 달라 발생하는 문제를 극복할 수 있으며, 외국인이 국내의 자료를 검색할 경우에 겪는 어려움을 많이 줄이는 효과가 있다.
또한, 본 발명은, 기존의 한글 자료들 중 지명, 인명 등과 같이 번역이 곤란한 자료들에 대하여 새로운 데이터베이스를 구축할 필요없이 기존의 한글 자료를 그대로 활용할 수 있으므로 자원 재활용 및 새로운 자원을 추가 투입할 필요없이 서비스가 이루어지므로 서비스 속도가 빨라지며, 자원 절약이 가능한 효과가 있다.

Claims (16)

  1. 한글 자료에 대한 검색 시스템에 있어서,
    정보 검색을 위한 사용자의 외국어로 표기된 한글 입력을 한글표기로 변환하기 위한 외국어-한글 변환수단; 및
    상기 외국어-한글 변환수단에 의해 한글로 변환된 검색어를 이용하여 정보 검색을 하기 위한 정보 검색수단
    을 포함하여 이루어진 외국어로 표기된 한글을 한글표기로 변환하여 검색하는 시스템.
  2. 제 1 항에 있어서,
    상기 정보 검색수단에 의해 검색된 결과 중 외국어로의 번역이 필요하지 않고, 단지 한글의 외국어 표기가 필요한 결과에 대해 외국어로 변환을 행하여 사용자에게 제공하기 위한 한글-외국어 변환수단
    을 더 포함하여 이루어진 외국어로 표기된 한글을 한글표기로 변환하여 검색하는 시스템.
  3. 제 2 항에 있어서,
    상기 한글-외국어 변환수단은,
    표시할 수 있는 한글에 대하여 해당 외국어를 한 개씩 설정하여 두어서 한글의 외국어 변환 요청이 들어오면, 그 변환 결과를 제공하기 위한 한글-외국어 매칭 테이블; 및
    상기 정보 검색수단에 의해 검색된 결과 중 외국어로의 번역이 필요하지 않고, 단지 한글의 외국어 표기가 필요한 결과에 대해 한 글자씩 상기 한글-외국어 매칭 테이블로 전송하여 매칭되는 외국어를 받아 사용자에게 제공하기 위한 한글-외국어 매칭 처리수단
    을 포함하여 이루어진 외국어로 표기된 한글을 한글표기로 변환하여 검색하는 시스템.
  4. 제 1 항 내지 제 3 항 중 어느 한 항에 있어서,
    상기 외국어-한글 변환수단은,
    외국어의 발음에 일치되는 한글을 저장하고 있다가 외국어의 한글 변환 요청이 들어오면, 유사한 발음을 갖는 한글을 찾아 제공하기 위한 외국어-한글 매칭 테이블; 및
    사용자에 의해 입력된 외국어로 표기된 한글 정보에 대해 상기 외국어-한글 매칭 테이블로 보내어 유사한 발음의 한글을 받아 이를 상기 정보 검색수단의 검색어로 입력하기 위한 외국어-한글 매칭 처리수단
    을 포함하여 이루어진 외국어로 표기된 한글을 한글표기로 변환하여 검색하는 시스템.
  5. 제 4 항에 있어서,
    상기 외국어-한글 매칭 테이블은,
    한글로 가능한 모든 글자 조합에 대한 외국어 표기에 대해 이를 알파벳과 같이 외국어 표기 순서에 따라 트리 형태로 배열된 테이블인 것을 특징으로 하는 외국어로 표기된 한글을 한글표기로 변환하여 검색하는 시스템.
  6. 제 5 항에 있어서,
    상기 외국어-한글 매칭 테이블은,
    한글표기로의 변환이 요청된 외국어에 대해 한 글자씩 확인하여 해당되는 한글표기가 없거나 외국어 입력이 더 이상 없는 상태 직전에 파악된 한글표기를 상기 외국어-한글 매칭 처리수단으로 전송하고, 남은 외국어가 있으면 한글 변환을 계속 수행하는 것을 특징으로 하는 외국어로 표기된 한글을 한글표기로 변환하여 검색하는 시스템.
  7. 제 4 항에 있어서,
    상기 외국어-한글 매칭 처리수단은,
    상기 외국어-한글 매칭 테이블로부터 받은 한글 글자가 여럿인 경우, 일치되는 글자와 먼저 혹은 후에 받은 글자를 조합하여 여러 개의 단어를 생성해 상기 정보 검색수단으로 전송하고, 매칭되는 한글이 없으면 이를 사용자에게 알리는 것을 특징으로 하는 외국어로 표기된 한글을 한글표기로 변환하여 검색하는 시스템.
  8. 검색 시스템에 적용되는 외국어로 표기된 한글을 한글표기로 변환하여 검색하는 방법에 있어서,
    사용자로부터 외국어로 표기된 한글을 정보 검색어로 입력받는 제 1 단계;
    외국어-한글 변환수단을 통해 상기 외국어로 표기된 한글을 한글표기로 변환하는 제 2 단계; 및
    한글표기된 검색어를 정보 검색수단으로 보내어 정보 검색 결과를 생성하는 제 3 단계
    를 포함하여 이루어진 외국어로 표기된 한글을 한글표기로 변환하여 검색하는 방법.
  9. 제 8 항에 있어서,
    상기 정보 검색수단에 의해 생성된 검색 결과 중 외국어로의 번역이 필요하지 않고, 단지 한글의 외국어 표기가 필요한 결과에 대해 외국어로 변환을 행하여 사용자에게 제공하는 제 4 단계
    를 더 포함하여 이루어진 외국어로 표기된 한글을 한글표기로 변환하여 검색하는 방법.
  10. 제 9 항에 있어서,
    상기 제 4 단계는,
    상기 정보 검색수단에서 검색된 결과를 받은 한글-외국어 매칭 처리수단에서 외국어로의 번역이 필요하지 않고 단지 한글의 외국어 표기가 필요한 결과에 대해 한글-외국어 매칭 테이블로 전송하는 제 5 단계;
    상기 한글-외국어 매칭 테이블에서는 입력된 한글에 매칭되는 외국어를 찾아 상기 한글-외국어 매칭 처리수단으로 전송하는 제 6 단계; 및
    상기 한글-외국어 매칭 처리수단에서 외국어 변환이 끝난 검색 결과를 사용자에게 제공하는 제 7 단계
    를 포함하여 이루어진 외국어로 표기된 한글을 한글표기로 변환하여 검색하는 방법.
  11. 제 8 항 내지 제 10 항 중 어느 한 항에 있어서,
    상기 제 2 단계는,
    상기 외국어-한글 변환수단에 있는 외국어-한글 매칭 처리수단에서 사용자로부터 입력된 외국어를 외국어-한글 테이블로 전송하여 한글표기로의 변환을 요청하는 제 8 단계;
    상기 외국어-한글 테이블에서 한글표기로의 변환이 요청된 외국어에 대해 일치되는 한글을 찾아 상기 외국어-한글 처리수단으로 전송하는 제 9 단계; 및
    상기 외국어-한글 처리수단에서 상기 외국어-한글 테이블로부터 수신된 일치되는 한글을 이용하여 한글 단어를 생성하는 제 10 단계
    를 포함하여 이루어진 외국어로 표기된 한글을 한글표기로 변환하여 검색하는 방법.
  12. 제 11 항에 있어서,
    상기 제 9 단계는,
    상기 외국어-한글 매칭 테이블에서 한글 표기로의 변환이 요청된 외국어에 대해 한 글자를 확인하여 상기 외국어-한글 매칭 테이블의 매칭 트리에서 해당되는 글자의 노드로 이동하는 제 11 단계;
    현재 글자의 다음 글자가 있는지를 검사하는 제 12 단계;
    상기 제 12 단계의 검사 결과, 다음 글자가 없으면 현재 포인터가 가리키는 글자 노드의 속성인 한글을 상기 외국어-한글 매칭 처리수단으로 전송하는 제 13 단계;
    상기 제 12 단계의 검사 결과, 다음 글자가 있으면 다음 글자가 현재 포인터가 가리키는 글자 노드의 하위 레벨의 노드에 존재하는지를 확인하는 제 14 단계;
    상기 제 14 단계의 확인 결과, 하위 레벨의 노드에 존재하면, 상기 제 12 단계부터 반복 수행하는 제 15 단계; 및
    상기 제 14 단계의 확인 결과, 현재 포인터가 가리키는 글자 노드의 속성인 한글을 상기 외국어-한글 매칭 처리수단으로 전송하고, 다음 글자에 대해 상기 제 11 단계부터 반복 수행하는 제 16 단계
    를 포함하여 이루어진 외국어로 표기된 한글을 한글표기로 변환하여 검색하는 방법.
  13. 제 11 항에 있어서,
    상기 제 10 단계는,
    상기 외국어-한글 처리수단에서 상기 외국어-한글 테이블로부터 수신된 일치되는 한글이 있는지를 확인하는 제 11 단계;
    상기 제 11 단계의 확인 결과, 일치되는 한글이 없으면 이를 사용자에게 알리는 제 12 단계;
    상기 제 11 단계의 확인 결과, 일치되는 한글이 있으면 일치되는 한글 글자가 여럿인지를 판단하는 제 13 단계;
    상기 제 13 단계의 판단 결과, 일치되는 한글 글자가 여럿이 아니면 일치되는 한글 글자로 정보 검색어로 쓰일 단어를 생성하는 제 14 단계; 및
    상기 제 13 단계의 판단 결과, 일치되는 한글 글자가 여럿이면 일치되는 한글 글자와 먼저 혹은 후에 받은 글자를 조합하여 여러 개의 한글 단어를 생성하는 제 15 단계
    를 포함하여 이루어진 외국어로 표기된 한글을 한글표기로 변환하여 검색하는 방법.
  14. 제 8 항 내지 제 10 항 중 어느 한 항에 있어서,
    상기 제 3 단계는,
    한글표기로 변환된 검색어가 여러 개 있는지를 확인하는 제 8 단계;
    상기 제 8 단계의 확인 결과, 한글표기로 변환된 검색어가 여러 개 있지 않으면 상기 검색어를 정보 검색수단으로 보내어 정보 검색 결과를 생성하는 제 9 단계; 및
    상기 제 8 단계의 확인 결과, 한글표기로 변환된 검색어가 여러 개 있으면 여러 개의 상기 검색어를 순차적으로 상기 정보 검색수단으로 보내어 정보 검색 결과를 생성하는 제 10 단계
    를 포함하여 이루어진 외국어로 표기된 한글을 한글표기로 변환하여 검색하는 방법.
  15. 대용량 프로세서를 구비한 검색 시스템에,
    사용자로부터 외국어로 표기된 한글을 정보 검색어로 입력받는 제 1 기능;
    외국어-한글 변환수단을 통해 상기 외국어로 표기된 한글을 한글표기로 변환하는 제 2 기능; 및
    한글표기된 검색어를 정보 검색수단으로 보내어 정보 검색 결과를 생성하는 제 3 기능
    을 실현시키기 위한 프로그램을 기록한 컴퓨터로 읽을 수 있는 기록매체.
  16. 제 15 항에 있어서,
    상기 정보 검색수단에 의해 생성된 검색 결과 중 외국어로의 번역이 필요하지 않고, 단지 한글의 외국어 표기가 필요한 결과에 대해 외국어로 변환을 행하여 사용자에게 제공하는 제 4 기능
    을 더 실현시키기 위한 프로그램을 기록한 컴퓨터로 읽을 수 있는 기록매체.
KR1019990031697A 1999-08-02 1999-08-02 외국어로 표기된 한글을 한글표기로 변환하여 검색하는 시스템및 그 방법 KR100326936B1 (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1019990031697A KR100326936B1 (ko) 1999-08-02 1999-08-02 외국어로 표기된 한글을 한글표기로 변환하여 검색하는 시스템및 그 방법

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1019990031697A KR100326936B1 (ko) 1999-08-02 1999-08-02 외국어로 표기된 한글을 한글표기로 변환하여 검색하는 시스템및 그 방법

Publications (2)

Publication Number Publication Date
KR20010016679A true KR20010016679A (ko) 2001-03-05
KR100326936B1 KR100326936B1 (ko) 2002-03-13

Family

ID=19606025

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1019990031697A KR100326936B1 (ko) 1999-08-02 1999-08-02 외국어로 표기된 한글을 한글표기로 변환하여 검색하는 시스템및 그 방법

Country Status (1)

Country Link
KR (1) KR100326936B1 (ko)

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20010067734A (ko) * 2001-03-14 2001-07-13 금하연 인터넷상에서의 한자색인어를 병용한 한글검색장치 및그검색방법
KR100835172B1 (ko) * 2006-10-16 2008-06-05 한국전자통신연구원 동의어를 이용한 정보 검색 시스템 및 그 방법
US7979268B2 (en) 2005-08-30 2011-07-12 Samsung Electronics Co., Ltd. String matching method and system and computer-readable recording medium storing the string matching method
US8117026B2 (en) 2006-01-02 2012-02-14 Samsung Electronics Co., Ltd. String matching method and system using phonetic symbols and computer-readable recording medium storing computer program for executing the string matching method
KR101159493B1 (ko) * 2011-08-31 2012-06-22 나이스신용평가정보주식회사 외국어 인명 추천시스템
KR20180131350A (ko) * 2017-05-31 2018-12-10 존 백 다국어 키보드 시스템
US10223414B2 (en) 2015-02-17 2019-03-05 Samsung Electronics Co., Ltd. Device for determining sameness between different languages and method thereof

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100449717B1 (ko) * 2002-02-22 2004-09-22 삼성전자주식회사 문자 디스플레이 방법 및 장치
KR100966239B1 (ko) 2008-10-29 2010-06-25 엔에이치엔(주) 로마자 표기 결정 방법 및 장치
KR101249890B1 (ko) 2011-05-23 2013-04-03 한국과학기술원 개인어휘시스템 및 이를 이용한 외국어 검색방법
KR101345483B1 (ko) * 2011-11-01 2013-12-27 김윤아 한글 문자열에 기초하여 영문 문자열을 생성하는 장치 및 방법

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR980004126A (ko) * 1997-12-16 1998-03-30 양승택 다국어 웹 문서 검색을 위한 질의어 변환 장치 및 방법

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20010067734A (ko) * 2001-03-14 2001-07-13 금하연 인터넷상에서의 한자색인어를 병용한 한글검색장치 및그검색방법
US7979268B2 (en) 2005-08-30 2011-07-12 Samsung Electronics Co., Ltd. String matching method and system and computer-readable recording medium storing the string matching method
US8117026B2 (en) 2006-01-02 2012-02-14 Samsung Electronics Co., Ltd. String matching method and system using phonetic symbols and computer-readable recording medium storing computer program for executing the string matching method
KR100835172B1 (ko) * 2006-10-16 2008-06-05 한국전자통신연구원 동의어를 이용한 정보 검색 시스템 및 그 방법
KR101159493B1 (ko) * 2011-08-31 2012-06-22 나이스신용평가정보주식회사 외국어 인명 추천시스템
US10223414B2 (en) 2015-02-17 2019-03-05 Samsung Electronics Co., Ltd. Device for determining sameness between different languages and method thereof
KR20180131350A (ko) * 2017-05-31 2018-12-10 존 백 다국어 키보드 시스템

Also Published As

Publication number Publication date
KR100326936B1 (ko) 2002-03-13

Similar Documents

Publication Publication Date Title
KR101435265B1 (ko) 언어 변환에 있어서 다중 리딩 모호성 해결을 위한 방법
US5432948A (en) Object-oriented rule-based text input transliteration system
US8027966B2 (en) Method and system for searching a multi-lingual database
US5469355A (en) Near-synonym generating method
KR19980080220A (ko) 언어 식별 장치, 언어 식별 방법 및 언어 식별의 프로그램을 기록한 기록매체
KR100326936B1 (ko) 외국어로 표기된 한글을 한글표기로 변환하여 검색하는 시스템및 그 방법
EP0775963A2 (en) Indexing a database by finite-state transducer
CN103970751A (zh) 多国语言网页转换系统及方法
JP2007157123A (ja) 改善された中国語−英語翻訳ツール
JPS5816488B2 (ja) 日本語文入力方式
CN100561469C (zh) 创建和使用中文语言数据和用户自纠正数据的方法和系统
US20050289161A1 (en) Integrated document directory generator apparatus and methods
KR20070083757A (ko) 텍스트 데이터 구조, 텍스트 데이터 처리방법, 텍스트데이터 처리 프로그램 및 텍스트 데이터 처리 프로그램을기록한 기록 매체
KR20010067827A (ko) 다국어 한자 데이터 베이스 구조
JPH08115330A (ja) 類似文書検索方法および装置
JPS6246029B2 (ko)
JPS60195664A (ja) 仮名漢字変換方式
JP2015184998A (ja) 翻訳装置、翻訳方法及び翻訳プログラム
CN115310458A (zh) 一种人名翻译方法、系统、设备及计算机可读存储介质
JPH0785040A (ja) 表記不統一検出方法およびかな漢字変換方法
JPS6198475A (ja) 日本語文章入力装置
JPS60112175A (ja) 仮名漢字変換装置における略称語変換方式
JPH086950A (ja) キーワード翻訳機能付き機械翻訳装置
JPH0352102B2 (ko)
JPH0756943A (ja) 全文データベースシステム

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20100208

Year of fee payment: 9

LAPS Lapse due to unpaid annual fee