KR101116581B1 - 다국어 독음 검색 장치 - Google Patents

다국어 독음 검색 장치 Download PDF

Info

Publication number
KR101116581B1
KR101116581B1 KR1020090013296A KR20090013296A KR101116581B1 KR 101116581 B1 KR101116581 B1 KR 101116581B1 KR 1020090013296 A KR1020090013296 A KR 1020090013296A KR 20090013296 A KR20090013296 A KR 20090013296A KR 101116581 B1 KR101116581 B1 KR 101116581B1
Authority
KR
South Korea
Prior art keywords
syllable
korean
syllables
vowel
language
Prior art date
Application number
KR1020090013296A
Other languages
English (en)
Other versions
KR20100003178A (ko
Inventor
양왕성
정경식
조은정
이동훈
Original Assignee
주식회사 한글과컴퓨터
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 주식회사 한글과컴퓨터 filed Critical 주식회사 한글과컴퓨터
Publication of KR20100003178A publication Critical patent/KR20100003178A/ko
Application granted granted Critical
Publication of KR101116581B1 publication Critical patent/KR101116581B1/ko

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/40Processing or translation of natural language
    • G06F40/58Use of machine translation, e.g. for multi-lingual retrieval, for server-side translation for client devices or for real-time translation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/263Language identification

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Document Processing Apparatus (AREA)

Abstract

제1 국어에 대응되는 다국어를 제1 국어로 입력하고 입력된 제1 국어를 제1 국어를 제외한 나머지 다국어로 검색할 수 있는 다국어 독음 검색 장치가 개시되어 있다. 본 발명의 다국어 독음 검색 장치는, 다국어 중 제1 국어에 대응되는 다국어(제1국어 제외)를 제1 국어로 입력하는 제1 국어 독음 입력부; 및 상기 제1 국어 독음 입력부를 통해 입력된 제1 국어의 단어를 음절 단위로 분리한 후 분리된 제1 국어 음절과 제1 국어를 제외한 나머지 다국어의 표제부 및 그 표제부의 발음 기호의 쌍을 근거로 상기 제1 국어의 음절 대비 다국어 음절을 추출한 후 조합하여 독음된 제1 국어에 대응되는 다국어의 단어로 표시하는 독음 검색 서버를 포함하고, 본 발명에 의하면, 독음된 제1 국어의 단어에 대응되는 제1 국어를 제외한 나머지 다국어의 단어를 정확하게 또는 유사성이 높은 검색 순위로 검색 및 표시하여 독음된 제1 국어의 단어를 제1 국어를 제외한 나머지 다국어의 단어로 정확하게 검색할 수 있다.
독음, 한국어, 다국어, 영어

Description

다국어 독음 검색 장치{APPARATUS FOR SEARCHING MULTI-LANGUAGE APPARATUS}
본 발명은 다국어 독음 검색 장치에 관한 것으로, 더욱 상세하게는 제1 국어의 독음된 단어를 상기 제1 국어를 제외한 나머지 다국어의 단어로 검색 및 표시할 수 있도록 한 장치에 관한 것이다.
최근에는 개발되고 있는 한글 워드 프로세스에는 [외래어 표기]라는 기능이 있다. 이러한 외래어 표기/검색 기능은 원어에 해당하는 올바른 외래어 표기를 검색하거나 특정 외래어에 해당하는 원어를 검색할 때 사용하는 기능이다.
즉, 컴퓨터의 한글 워드 프로세서에서 [도구-외래어 표기]를 실행 후 [외래어 표기] 대화 상자가 나타나면 “찾을 낱말” 입력 상자에 “컴퓨터”를 입력하고, [찾기] 단추를 누른다. 그러면 “분류-영어, 내용-컴퓨터 computer”를 찾아 보여주게 된다.
이때 사용자에 의해“삽입 모양-한글표기(원어)”가 선택되고 [넣기] 단추를 누르면 본문의 커서 위치에 “컴퓨터(computer)”가 삽입되는 형태로 작동된다.
예를 들어, “찾을 낱말-원더”를 입력하면, “wander, wonder”를 찾아준다.
그러나 이러한 외래어 표시/검색 기능은 사용자가 입력한 단어와 출력되는 단어를 서버에서 미리 매칭시켜 놓았을 경우에만 검색되기 때문에 사용자가 표준어에 입각하여 정확한 외래어 표기를 입력했을 경우에만 정확한 원어가 출력된다.
그러나 일반적인 상황에서 원어를 알고 싶은 사용자가 정확한 외래어 표기를 입력하는 경우는 희박하다.
또한 일일이 잘못 넣을 데이터를 근거로 동일한 외래어를 조사할 수 있는 매칭 시스템을 가지는 서버를 구축한다 할지라도 사용자가 단어를 잘못 입력하는 경우를 대비하기 위해 데이터 서버를 구축하는 것 자체가 불가능하다.
따라서, 사용자가 표준 단어와 다른 유사 단어를 입력하는 경우 해당 원어를 유추하여 검색할 수 있는 별도의 장치가 필요하게 되었다.
본 발명은 상기한 사정을 감안하여 창출된 것으로서, 본 발명에서 도달하고자 하는 목적은 제1 국어에 대응되는 다국어를 상기 제1 국어로 입력하는 제1 국어 독음 입력부와, 상기 제1 국어를 제외한 다국어의 표제부와 발음 기호를 각 음절로 분리하고 각 분리된 음절에 대응되는 제1 국어의 음절과 상기 제1 국어 독음 입력부에서 입력 및 분리된 음절에 해당하는 다국어의 음절을 출력하는 독음 검색 서버를 포함하여 독음된 제1국어의 단어에 대응되는 다국어의 단어를 정확하게 또는 유사성이 높은 순위로 순차 검색 및 표시할 수 있도록 한 장치를 제공하고자 함에 있다.
상기 목적을 달성하기 위한 본 발명의 제 1 관점에 따른 다국어 독음 검색 장치는,
제1 국어에 대응되는 다국어를 상기 제1 국어로 입력하는 제1 국어 독음 입력부;
상기 제1 국어 독음 입력부를 통해 입력된 제1 국어의 단어를 음절 단위로 분리한 후 분리된 제1 국어 음절과 제1 국어를 제외한 나머지 다국어의 표제부 및 그 표제부의 발음 기호의 쌍을 근거로 상기 제1 국어의 음절 대비 다국어 음절을 추출한 후 조합하여 제1 국어 독음 입력부의 제1 국어에 대응되는 다국어의 단어를 검색하여 표시하는 독음 검색 서버를 포함한다.
여기서, 상기 제1 국어 독음 입력부는,
상기 제1 국어를 입력하기 위한 키보드, 음성 인식 기능을 가지는 PDA 및 이동 단말기, 키 패드 중 하나인 것을 특징으로 한다.
또한, 상기 독음 검색 서버는,
상기 제1 국어 독음 입력부를 통해 입력된 제1 국어의 단어를 음절 단위로 분리하는 제1 국어 음절 분석부;
상기 제1 국어 음절 분석부에 의해 분리된 각 음절에 대응되는 다국어의 음절을 출력하는 독음 변환 서버;
상기 독음 변환 서버로부터 공급되는 제1 국어의 각 음절에 대응되는 다국어의 음절을 미리 저장된 검증 규칙 서버의 제1 국어 및 다국어 간의 결합 규칙을 근거로 조합하여 유추 가능한 다국어의 단어 목록을 출력하는 다국어 음절 결합부; 및
상기 다국어 음절 결합부를 통해 출력된 다국어 단어의 조합 속도를 증가하기 위해 상기 검증 규칙 서버를 통해 상기 제1 국어 독음 입력부의 제1 국어의 단어에 대응되는 다국어의 단어를 출력하는 단어 검색부를 포함한다.
상기 독음 변환 서버는,
다국어의 표제어 및 발음 기호를 가지는 사전부;
상기 사전부에 기재된 발음 기호를 다국어 언어의 음절 규칙에 따라 다국어의 음절 단위로 분리하는 다국어 음절 분리부;
상기 다국어 음절 분리부의 음절을 기 저장된 매칭 테이블과 상기 제1 국어 및 다국어 간의 조합 규칙성을 근거로 다국어의 음절을 생성하여 저장하는 다국어 대비 제1 국어 음절 생성부; 및
상기 제1 국어 음절 분석부로부터 분리된 제1 국어의 음절에 대응되는 다국어의 음절을 상기 다국어 대비 제1 국어 음절 생성부를 통해 검색한 후 출력하는 다국어 음절 출력부를 포함한다.
여기서, 상기 제1 국어는 한국어이고, 상기 다국어는 영어인 것을 특징으로 한다.
상기 다국어 음절 분리부는 영어 음절 분리부로서,
상기 사전부에 기록된 표제부 및 발음 기호를 한국어의 음절에 대응되는 규칙성에 따라 각각 분리하는 것을 특징으로 한다.
상기 표제부에 대한 한국어의 음절에 대응되는 규칙성은,
영어의 자음 군과 모음 군 중 영어에 대한 음절 규칙성에 따라 분리 1하는 것을 특징으로 하며,
또한, 영어에 대한 음절 규칙성에 따른 분리 1은,
영어의 표제부에서 자음이 겹치는 경우 하나의 음절로 분리하며,
영어의 표제부가 모음 1+자음+모음 2로 구성된 경우 모음 1, 자음 및 모음 2의 두 개의 음절로 분리하고,
영어의 표제부가 모음 +자음 1+자음 2로 구성된 경우 모음 + 자음 1, 자음 2의 두 개의 음절로 분리하며,
영어의 표제부가 모음 1+자음 1+모음 2+자음 2로 구성된 경우 모음 1, 자음 1+모음 1+자음 2인 두 개의 음절로 분리하고,
영어의 표제부가 모음 1+자음 1+모음 2+ 모음 3으로 구성된 경우 모음 1, 자음 1+모음 1+모음 3인 두 개의 음절로 분리하는 것을 특징으로 한다.
한편, 영어의 발음 기호에 대한 한국어의 대응되는 음절 분리 규칙성은,
영어의 자음군과 모음 군에서 영어에 대한 음절 규칙성에 따라 분리 2하는 것을 특징으로 하며,
영어의 음절에 대한 음절 규칙성에 따른 분리 2는.
영어의 발음 기호가 모음 1+ 자음+모음 2인 경우 모음 1, 자음+모음 2의 두 개의 음절로 분리하고,
영어의 발음 기호가 모음 1+자음 1+모음 2+자음 2로 구성된 경우 모음 1, 자음 1+모음 1+자음 2인 두 개의 음절로 분리하며,
영어의 발음 기호가 모음 1+자음 1+모음 2+ 모음 3로 구성된 경우 모음 1, 자음 1+모음 1+모음 3인 두 개의 음절로 분리하는 것을 특징으로 한다.
여기서, 영어의 발음 기호에 대한 한국어의 대응되는 음절 분리 규칙성에서 제외되는 영어의 발음 기호의 경우 영어의 발음 기호에 대한 한국어의 분리된 음절을 기록하여 저장하도록 구비하는 것을 특징으로 한다.
상기 다국어 대비 제1 국어 음절 생성부는 영어 대비 한국어 음절 생성부로서,
상기 영어 음절 분리부에서 분리된 음절에 대응되는 한국어의 음절을 매칭 테이블 값 및 한국어 및 영어 간의 조합 규칙성을 기초로 생성하도록 구비되는 것을 특징으로 한다.
상기 영어 대비 한국어 음절 생성부의 매칭 테이블값은,
각 발음 기호의 각 자음에 대응되는 초성, 중성 및 낱자에 대한 한국어의 음절을 보인 자음 대표 테이블;
각 발음 기호의 모음에 대응되는 초성 중성에 대한 한국어의 음절을 보인 모음 대표 테이블;
각 발음 기호의 각 자음에 대응되는 초성 및 낱자에 대한 한국어의 음절을 보인 보조 테이블; 및
각 발음 기호 중 묵음에 대한 한국어의 음절을 보인 묵음 테이블을 포함하는 것을 특징으로 한다.
여기서, 상기 영어 대비 한국어 음절 생성부의 조합 규칙성은,
상기 한국어의 자음의 초성과 모음이 결합하는 제1 모음형 음절과,
상기 한국어의 자음의 초성과 모음과 자음의 종성이 결합하는 제2 모음형 음절과,
상기 한국어의 초성이 없는 경우 ㅇ와 결합하여 낱자를 형성하는 제3 모음형 음절과,
상기 한국어의 제3 모음형 음절과 자음의 종성이 결합하는 제4 모음형 음절을 포함하는 것을 특징으로 한다.
상기 다국어 음절 출력부는 상기 영어 대비 한국어 음절 생성부의 조합 규칙에 따라 생성된 한국어 음절 대비 영문 음절을 출력하는 영어 음절 출력부로서,
상기 영어 대비 한국어 음절 생성부에서 생성된 영어의 음절이 자음 1 + 자음 2인 경우 상기 한국어의 자음 1은 한국어의 낱자의 음절로 출력되고,
상기 영어 대비 한국어 음절 생성부에서 생성된 영어 음절이 자음 + 모음 1 + 모음 2인 경우 초성 + 제1 모음형 + 제3 모음형의 한국어 음절로 출력되며,
상기 영어 대비 한국어 음절 생성부에서 생성된 영어 음절이 모음1+ 모음 2인 경우 초성 + 제1 모음형 + 제3 모음형의 한국어 음절로 출력되고,
상기 영어 대비 한국어 음절 생성부에서 생성된 영어 음절이 자음 + 모음 1+ 모음 2+ 자음 2인 경우 상기 초성 + 제1 모음형 + 제4 모음형+ 낱자의 한국어 음절로 출력되며,
상기 영어 대비 한국어 음절 생성부에서 생성된 영어 음절이 모음+ 자음인 경우 상기 제4 모음형 + 낱자의 한국어의 음절로 출력되고,
상기 제2 모음형 + 낱자 또는 상기 제4 모음형 + 낱자의 영어 음절은 제1 모음형 + 낱자 또는 상기 제3 모음형 + 낱자의 한국어 음절로 각각 변환하는 것을 특징으로 한다
또한, 상기 다국어 음절 결합부는 영어 음절 결합부로서,
상기 한국어 음절 분석부를 통해 분석된 한국어의 음절 대비 상기 영어 음절 출력부의 영어의 음절을 조합하여 유추 가능한 단어 목록을 출력하도록 구비되는 것을 특징으로 한다.
바람직하게, 상기 제1 국어는 한국어이고, 상기 다국어는 일본어인 것을 특징으로 하고, 여기서, 상기 독음 변환 서버는,
일본어의 표제어 및 발음 기호를 가지는 사전부;
상기 사전부의 음절을 기 저장된 매칭 테이블과 상기 한국어 및 일본어 간의 조합 규칙성을 근거로 일본어의 음절을 생성하여 저장하는 일본어 대비 한국어 음절 생성부; 및
상기 제1 국어 음절 분석부인 한국어 음절 분석부로부터 분리된 한국어의 음절에 대응되는 일본어의 음절을 상기 일본어 대비 한국어 음절 생성부를 통해 검색한 후 출력하는 일본어 음절 출력부를 포함한다.
또한, 상기 다국어 음절 결합부는 일본어 음절 결합부로서,
상기 한국어 음절 분석부를 통해 분석된 한국어 음절 대비 상기 일본어 음절 출력부의 일본어의 음절을 조합하고 조합 후 유추 가능한 단어 목록을 출력하도록 구비되는 것을 특징으로 한다.
또한, 바람직하게, 상기 제1 국어는 한국어이고, 상기 다국어는 중국어인 것을 특징으로 하고, 여기서, 상기 독음 변환 서버는,
중국어의 표제어 및 한어병음을 가지는 사전부;
상기 사전부에 기재된 병음을 단어 단위로 분류하는 중국어 병음 단어 분리부;
상기 중국어 병음 단어 분리부의 단어를 기 저장된 매칭 테이블과 상기 한국어 및 중국어 간의 조합 규칙성을 근거로 중국어 대비 한국어 생성부; 및
상기 중국어 병음 단어 분리부에 의해 분리된 병음의 단어에 대응되는 한국어 음절 간의 결합 상태를 미리 정해진 한국어 음절 결합 사전을 통해 검색한 후 결합된 한국어 음절에 대응되는 중국어 단어를 출력하는 중국어 단어 출력부를 포함하는 것을 특징으로 하며,
상기 다국어 음절 결합부는 중국어 단어 결합부로서,
상기 한국어 음절 분석부의 한국어 음절에 대응되는 중국어 단어 출력부를 출력하고 유추 가능한 중국어 단어 목록을 출력하는 구비하는 것을 특징으로 한다.
한편, 상기 단어 검색부는,
독음된 제1 국어 대비 다국어 단어를 신속하게 검색하기 위해, 상기 제1 국어 음절 분석부를 통해 분석된 제1 국어의 음절 대비 상기 다국어 음절 출력부의 다국어의 음절 간의 결합된 다국어의 단어를 미리 저장된 검증 규칙 서버의 부분 검증 사전을 통해 유효성 여부를 판정하여 부분 검증하고,
상기 부분 검증된 다국어의 단어 중 유효 판정된 단어와 상기 검증 규칙 서버에 미리 저장된 단어 검색 사전의 단어의 일치 여부를 통해 단어 검증하는 것을 특징으로 하고,
상기 부분 검증 사전은 독음된 제1 국어의 하나의 음절에 대응되는 다국어의 음절이 후 다국어의 하나의 음절씩을 확장하여 저장하는 것을 특징으로 하며,
상기 단어 검색 사전은 상기 사전부에 저장된 표제부, 지명, 및 인명을 더 포함하는 것을 특징으로 한다.
그에 더하여 상기 단어 검색부는,
독음된 제1 국어 대비 검색된 다국어 단어의 정확성을 향상시키기 위해, 상기 제1 국어의 독음된 음절 중 앞 및 뒤 두 음절과 상기 제1 국어의 앞 및 뒤 두 음절에 대응되는 다국어의 4음절을 추출하여 상기 검증 규칙 서버에 필터 사전을 더 저장하고, 상기 제1 국어의 앞 두 음절과 뒤 두 음절의 겹치는 음절을 근거로 정확성을 판정하도록 구비되고,
또한 상기 단어 검색부는,
조합된 다국어의 단어의 음절 수(SC), 제1 국어에 대응되는 상기 다국어의 단어를 난이도에 따라 설정된 변수 값(WL), 및 상기 다국어의 단어의 각 음절이 가지는 난이도에 따른 변수 값의 가산 값을 상기 음절 수(SC)로 나눈 연산 값(FV)에 따라 상기 다국어의 단어를 그룹화하여 순위를 표시하도록 구비되는 것을 특징으로 한다.
이에, 본 발명의 다국어 독음 검색 장치에 의하면, 제1 국어에 대응되는 다국어(제1 국어 제외)를 제1 국어로 입력하고 입력된 제1 국어를 음절 단위로 분리한 후 분리된 제1 국어의 음절과 상기 제1 국어를 제외한 나머지 다국어의 표제부 및 그 표제부의 발음 기호의 쌍을 근거로 독음된 음절에 대응된 발음 기호의 다국어의 음절을 추출하여 제1 국어의 음절 대비 다국어의 음절의 조합을 통해 독음된 제1 국어의 단어에 대응되는 제1 국어를 제외한 나머지 다국어의 단어를 정확하게 또는 유사성이 높은 검색 순위로 표시하여 독음된 제1 국어의 단어를 제1 국어를 제외한 나머지 다국어의 단어로 정확하게 검색할 수 있다.
이하, 첨부된 도면을 참조하여 본 발명의 바람직한 실시 예에 대하여 설명한다.
<실시예 1>
본 발명의 실시 예에서는 사용자가 원하는 영어 단어를 한국어로 독음 입력될 때 한국어(한글형태)의 영어 단어를 알파벳의 영어 단어로 변환하여 표시하는 것을 일 예로 설명한다.
도 1은 본 발명에 따른 다국어 독음 검색 장치를 개략적으로 도시한 도면이다.
도 1에 도시된 바와 같이, 본 발명에 따른 다국어 독음 검색 장치는, 한국어 독음 입력부(100)와, 한국어 독음 입력부(100)의 단어의 음절에 대응되어 해당 영어의 표제부 및 발음 기호를 한국어의 음절별로 분리한 후 변환하여 저장하고 저장된 한국어의 음절과 같은 해당 영어의 음절을 추출하여 표시하는 독음 검색 서버(500)를 포함한다. 여기서, 상기 한국어 독음 입력부(100)는 영어 단어(일 예로 'science')를 한국어(사이언스)로 입력하기 위한 키보드, 음성인식 기능을 가지는 PDA 및 이동 단말기, 키패드 중 하나로 구비된다.
여기서, 상기 독음 검색 서버(500)는, 상기 한국어 독음 입력부(100)를 통해 입력된 한국어(사이언스)를 음절 단위로 분리하는 한국어 음절 분석부(510)과, 영어의 표제부와 발음 기호를 상기 한국어의 음절 특성에 따라 분리하고 분리된 발음 기호 대비 테이블값 및 조합 규칙성에 따라 설정된 한국어 음절을 저장하는 독음 변환 서버(520)와, 상기 한국어 음절 분석 모듈(510)의 음절 및 상기 독음 변환 서버(520)로부터 공급되는 한국어의 각 음절에 대응되는 해당 영어의 음절을 한국어 및 영어 간의 결합 규칙을 근거로 결합하여 해당 영어의 단어를 조합하고 유추 가능한 단어 목록을 출력하는 영어 음절 결합부(530)와, 상기 영어 음절 결합부(53) 에서 결합된 영어의 단어를 미리 정해진 검증 규칙에 따라 검증한 후 출력하는 단어 검색부(540)와, 상기 검증 규칙이 저장된 검증 규칙 서버(550)를 포함한다.
상기 독음 변환 서버(520)는 영어의 표제어 및 발음 기호를 가지는 사전부(521)와, 상기 사전부(521)에 기재된 표제부 및 발음 기호 각각을 영어의 음절 규칙에 따라 영어의 음절별로 분리하는 영어 음절 분리부(522)와, 상기 영어 음절 분리부(522)의 음절을 기 저장된 발음 테이블값 및 한국어 및 영어 간의 조합 규칙성을 근거로 한국어 음절로 생성하여 저장하는 영어 대비 한국어 음절 생성부(523)와, 상기 영어 대비 한국어 음절 생성부(523)의 각 음절을 한국어의 음절 결합 규칙성에 따라 결합하여 한국어 음절에 해당하는 영어 음절을 출력하는 영어 음절 출력부(524)를 포함한다.
즉, 상기 사전부(521)는 각 영어의 표제부 및 발음 기호를 가지며, 상기 영어 음절 분리부(522)는 각 표제부 및 발음 기호를 한국어 음절에 따라 분리한다. 한편, 영어 대비 한국어 음절 생성부(523)는 발음 기호의 영어 음절 대비 각 한국어 음절을 포함하는 독음 사전을 생성하여 저장한다.
일 예로 영어 단어(abort)의 표제부가 abort이고 발음 기호는
Figure 112009009956776-pat00001
인 경우 사전부(521)에는 표제부 abort와 발음기호
Figure 112009009956776-pat00002
가 각각 저장되므로, 영어 음절 분리부(522)는 표제부를 a+bort로 역시 발음 기호를
Figure 112009009956776-pat00003
로 분리하고, 따라서, 영어 대비 한국어 음절 생성부(523)는 상기 영어 음절 분리부(522)의 독음 사전는 표제어 a, ac, ad 에 대응되는 어, 으, 등의 한국어 음절을 가지며 또한 표제어 bort에 대응되는 보트, 볼드, 버트, 벌트 등의 한국어 음절을 가진다.
즉, 영어 음절 분리부(522)는 상기 사전부(521)에 기록된 표제부를 한국어 음절에 대응되는 규칙성에 따라 분리하고, 상기 각 표제부에 대한 발음 기호를 한국어의 음절에 대응되는 규칙성에 따라 분리하도록 구비된다.
또한, 상기 표제부에 대한 한국어의 음절에 대응되는 규칙성은, 영어에 대한 자음 군과 모음 군 중 해당 영어에 대한 음절 규칙성에 따라 분리 1 한다.
또한, 표제부에 대한 한국어의 음절 규칙성에 따른 분리 1은 다음과 같이 실행된다.
우선, 상기 표제부에서 자음이 겹치는 경우 하나의 음절로 분리하며, 영어의 표제부가 모음 1+자음+모음 2로 구성된 경우 모음 1, 자음 및 모음 2의 두 개의 음절로 분리하고, 해당 영어의 표제부가 모음 +자음 1+자음 2로 구성된 경우 모음 + 자음 1, 자음 2의 두 개의 음절로 분리하며, 해당 영어의 표제부가 모음 1+자음 1+모음 2+자음 2로 구성된 경우 모음 1, 자음 1+모음 1+자음 2인 두 개의 음절로 분리하고, 해당 영어의 표제부가 모음 1+자음 1+모음 2+ 모음 3으로 구성된 경우 모음 1, 자음 1+모음 1+모음 3인 두 개의 음절로 분리한다.
즉, 상기 표제부의 음절 단위의 분리 1 과정을 예를 들어 설명하면, 자음1+자음 2 형태인 sh, ch, th, wh, ph는 하나로 처리하고, 모음 1+자음+모음 2 형태의 표제부에서 acock 는 a(모음)+ cock로 분리되며, 모음 +자음 1+자음 2 형태의 표제부에서 abroach 는 ab + roach로 분리되고, 모음 1+자음 1+모음 2+자음 2 형태의 표제부에서 acock 는 a + cock 로 분리되며, 모음 1+자음 1+모음 2+ 모음 3 형태의 표제부에서 abroach 는 ab + roach로 분리된다.
한편, 상기 각 표제부에 대한 발음 기호에 대한 한국어 음절의 규칙성은, 해당 영어의 발음 기호를 자음군과 모음 군에서 영어에 대한 음절 규칙성에 따라 분리 2 한다.
여기서, 발음 기호에 대한 분리 2는, 해당 영어의 발음 기호가 모음 1+ 자음+모음 2인 경우 모음 1, 자음+모음 2의 두 개의 음절로 분리하고, 해당 영어의 발음 기호가 모음 + 자음 1 + 자음 2인 경우 바로 다음의 자음 1에서 분리하고, 영어의 발음 기호가 모음 1+자음 1+모음 2+자음 2로 구성된 경우 모음 1, 자음 1+모음 1+자음 2인 두 개의 음절로 분리하며, 영어의 발음 기호가 모음 1+자음 1+모음 2+ 모음 3로 구성된 경우 모음 1, 자음 1+모음 1+모음 3인 두 개의 음절로 분리한다.
발음 기호에 대한 분리 2 규칙을 예를 설명하면, 모음 1+ 자음 1+모음 2 형태의 발음 기호에서
Figure 112009009956776-pat00004
으로 분리되고, 모음 + 자음 1+ 자음 2 형태의 발음 호에서
Figure 112009009956776-pat00005
로 분리되며, 모음 1+자음 1+모음 2+자음 2 형태의 발음 기호에서
Figure 112009009956776-pat00006
로 분리되고, 모음 1+자음 1+모음 2+ 모음 3형태의 발음 기호에서
Figure 112009009956776-pat00007
로 분리된다.
여기서, 영어의 발음 기호에 대한 한국어의 대응되는 음절 분리 2 규칙성에서 제외되는 영어의 발음 기호의 경우 영어의 발음 기호에 대한 한국어의 분리된 음절을 별도로 기록하여 저장한다.
해당 영어의 발음 기호 중 모음 군으로 분리되는 경우, 예를 들어
Figure 112009009956776-pat00008
또는
Figure 112009009956776-pat00009
, 및 묵음으로 처리되는 경우, 예 를 들어
Figure 112009009956776-pat00010
또는
Figure 112009009956776-pat00011
는 각각 별도로 저장된다.
상기 영어 대비 한국어 음절 생성부(523)는 상기 영어 음절 분리부(522)에서 분리된 음절에 대응되는 한국어의 음절을 매칭 테이블 값 및 한국어 및 영어 간의 조합 규칙성을 기초로 생성하도록 구비된다.
즉, 상기 영어 대비 한국어 음절 생성부(523)의 분리된 영어 음절에 대응되는 한국어의 음절을 보인 매칭 테이블 값을 가지며, 각 발음 기호의 각 자음에 대응되는 초성, 중성 및 낱자에 대한 한국어의 음절을 보인 자음 대표 테이블을 가진다. 일 예로, 자음 b에 대한 매칭 테이블 값은 자음 b가 초성인 경우 'ㅂ, ㅃ' 이고, 초성인 경우 'ㅂ' 이다. 또한, 자음 k 에 대한 테이블 값은 자음 k가 초성인 경우 'ㅋ'이고, 중성인 경우 '그' 이며, 낱자의 경우 '크, 그' 로 생성되어 저장된다. 이러한 매칭 테이블값은 표제부에 대한 각 자음 군 및 모음 군과 발음 기호의 자음 및 모음 각각에 대해 생성된다.
또한, 각 발음 기호의 모음에 대응되는 초성 중성에 대한 한국어의 음절을 보인 모음 대표 테이블 값을 가지는데, 일 예로 모음 a, α가 초성인 경우 테이블값은 '아', 중성인 경우 '어'이며, 모음 u가 초성인 경우 '우', 중성인 경우 '어, 아'이 테이블 값을 가진다.
한편, 예외적으로 구비되는 각 발음 기호의 각 자음에 대응되는 초성 및 낱자에 대한 한국어의 음절을 보인 보조 테이블 값이 생성되어 저장되고, 또한 각 발음 기호 중 묵음에 대한 한국어의 음절을 보인 묵음 테이블 값이 생성되어 저장된다.
또한, 상기 영어 대비 한국어 음절 생성부(523)의 한국어 및 영어 간의 조합 규칙 성은, 상기 한국어의 자음 군에 대해, 상기 한국어의 자음의 초성은 한국어의 첫소리에 대응되고, 상기 한국어의 자음의 종성은 한국어의 끝소리에 대응되며, 상기 한국어의 자음의 낱자는 한국어의 단독 글자에 대응된다.
그리고, 상기 한국어의 모음 군에 대해, 상기 한국어의 자음의 초성과 모음이 결합하는 제1 모음형 음절(예를 들어 '가')과, 상기 한국어의 자음의 초성과 모음과 자음의 종성이 결합하는 제2 모음형 음절( 예를 들어 '각') 과, 상기 한국어의 초성이 없는 경우 o과 결합하여 낱자를 형성하는 제3 모음형 음절(예를 들어 '아')과, 상기 한국어의 제3 모음형과 자음의 종성이 결합하는 제4 모음형 음절(예를 들어 '악')에 대응된다.
이러한 한국어 결합 규칙에 생성된 영어의 음절을 출력하는 상기 영어 음절 출력부(524)의 규칙은, 상기 영어 대비 한국어 음절 생성부(523)에서 생성된 영어의 음절이 자음 1 + 자음 2인 경우 상기 영어의 자음 1은 한국어의 낱자의 음절로 출력되고, 상기 영어 대비 한국어 음절 생성부(523)에서 생성된 영어 음절이 자음 + 모음 1 + 모음 2인 경우 초성 + 제1 모음형 + 제3 모음형의 한국어 음절로 출력되며, 상기 영어 대비 한국어 음절 생성부(523)에서 생성된 영어의 음절이 자음 1 +모음 +자음 2인 경우 초성 + 제2 모음형 + 낱자의 한국어 음절로 출력되고, 상기 영어 대비 한국어 음절 생성부(523)에서 생성된 영어의 음절이 모음1+ 모음 2인 경우 초성 + 제1 모음형 + 제3 모음형의 한국어 음절로 출력되고, 상기 영어 대비 한국어 음절 생성부(523)에서 생성된 영어의 음절이 자음 + 모음 1+ 모음 2+ 자음 2인 경우 초성 + 제1 모음형 + 제4 모음형+ 낱자의 한국어 음절로 출력되며, 상기 영어 대비 한국어 음절 생성부(523)에서 생성된 영어 음절이 모음+ 자음인 경우 상기 제4 모음형 + 낱자의 한국어의 음절로 출력되고, 상기 제2 모음형 + 낱자 또는 상기 제4 모음형 + 낱자의 한국어 음절은 제1 모음형 + 낱자 또는 상기 제3 모음형 + 낱자의 한국어 음절로 변환 가능하도록 구비되어 있다.
즉, 예를 들어, 자음 1 + 자음 2 형태의 영어 음절의 경우 상기 한국어의 자음 1은 한국어의 낱자의 음절(예를 들어
Figure 112009009956776-pat00012
)로 출력되고, 자음 + 모음 1 + 모음 2 형태의 영어 음절의 경우 초성 + 제1 모음형 + 제3 모음형의 한국어 음절(일 예로
Figure 112009009956776-pat00013
)로 출력되며, 자음 1 +모음 +자음 2인 형태의 영어 음절의 경우 초성 + 제2 모음형 + 낱자의 한국어 음절(일 예로
Figure 112009009956776-pat00014
)로 출력된다.
또한, 모음1+ 모음 2형태의 영어 음절의 경초성 + 제1 모음형 + 제3 모음형의 한국어 음절(일 예로
Figure 112009009956776-pat00015
)로 출력되고, 자음 + 모음 1+ 모음 2+ 자음 2 형태의 영어 음절의 경우 초성 + 제1 모음형 + 제4 모음형+ 낱자의 한국어 음절( 일 예로
Figure 112009009956776-pat00016
)로 출력된다.
한편, 모음+ 자음 형태의 영어 음절의 경우 상기 제4 모음형 + 낱자의 한국어 음절(예를 들어
Figure 112009009956776-pat00017
)로 출력된다.
여기서, 제2 모음형 + 낱자의 한국어 음절의 경우 제1 모음형 + 낱자의 한국어 음절(일 예로
Figure 112009009956776-pat00018
)로 변환이 가능하고, 제4 모음형 + 낱자의 한국어 음절의 경우 제3 모음형 + 낱자의 한국어 음절(일 예로
Figure 112009009956776-pat00019
) 으로 변환이 가능하다.
또한, 상기 영어 음절 결합부(524)는, 상기 한국어 음절 분석부(510)을 통해 분석된 한국어의 음절과 상기 영어 음절 출력부(524)의 한국어 음절에 대응되는 영어의 음절을 조합하여 유추 가능한 단어 목록을 출력하도록 구비된다.
예를 들어 한국어 독음 입력부(510)를 통해 '피노미나'가 입력되면 한국어 음절 '피'에 해당하는 독음 변환 서버(520)를 통해 영어 음절 'fe, fea, fee, phe'가 출력되고, 한국어 음절 '노'에 해당하는 영어 음절 'nio, non, noc, no'가 출력되며, 한국어 음절 '미'에 해당하는 영어 음절 'ma, mae, me, mid'가 출력되고, 한국어 음절 '나'에 해당하는 영어 음절 'gna, na, nac, nna'가 출력된다.
이 후 단어 검색부(540)는 검증 규칙 서버(550)로부터 공급되는 검증 규칙에 따라 각 한국어 음절 대비 영어 단어를 정확하고 신속하게 검색하게 된다. 즉 검증 규칙 서버(550)에는 한국어 음절 대비 영어 음절 간의 조합 처리 속도를 향상시키기 위한 부분 검증 사전과 처리된 영어 단어의 정확성을 증가하기 위한 필터 사전을 포함한다.
즉, 단어 검색부(540)는 상기 영어 음절 결합부(524)의 음절 간의 결합된 영어 단어를 미리 저장된 부분 검증 사전을 통해 결합된 영어 단어의 유효성 여부를 판정하여 1차 부분 검증하고, 상기 1차 부분 검증된 해당 영어의 단어 중 유효 판정된 단어와 상기 검증 규칙 서버(550)에 기 저장된 단어 검색 사전의 단어의 일치 여부를 통해 단어 검증을 통해 처리 속도를 신속하게 한다.
즉, 상기의 부분 검증 사전은, 최소 영어 음절의 3글자부터 최대 단어 길이 만큼 한 음절씩 확장하여 형성된다. 예를 들어 영어 단어 'friend'에 대한 부분 검증 사 전은 'fri', 'fire', 'frien', 'friend'로 생성된다. 'fe'와 'nio'를 조합한 후 'ma'를 조합하기 이전에 'fenio'가 부분 검증 사전에 해당 단어가 없다면 이 후 조합은 생략하게 된다. 따라서, 조합된 영어 단어 검색을 신속하게 이루어지게 된다.
또한, 영어 단어 중 정확성을 증가하기 위해 상기 검증 규칙 서버(550)에는 필터 사전을 형성하게 되는데, 상기 필터 사전은 앞과 뒤의 한국어 음절 2개에 해당하는 영어 음절 4음절씩의 추출하여 형성한다.
즉, 한국어 음절 '러시'에 대한 영문 음절 4음절은 'laci, lacy, lasc, licy, lisi, llac, loss, lous, lusc, lush'로 형성되고, 한국어 음절 '커튼'은 영어 음절 'cord'로 형성한다. 또한 뒤의 한국어 음절 '시아'에 대한 영문 음절 4음절은 'asai, asci, foci, hesy, hsys, high, hthi, isci, lles, loci, lsci'로 형성되고, 뒤 한국어 음절 '샤크'에 대한 영어 4음절은 'cker, hank, hark, hock, shak'로 형성된다.
예를 들어 상기 제1 국어 독음 입력부(100)를 통해 입력된 한국어의 음절이 '러시아'인 경우 'rati, racial, rather, russia' 등의 다수의 검색 결과가 영어 음절 결합부(524)를 통해 출력되면, 상기 단어 검색부(540)는 앞의 한국어 음절 '러시'를 키로 해서 'rati'가 있는 지 필터 사전에서 검색한 후 위의 한국어 음절 '시아'를 키로 해서 'atio'가 있는 지 검색한 후 검색 결과 필터 사전에 없으면 첫번째 'ratio'는 검색 리스트에서 제거된다. 이후 상기의 과정을 반복하여 실행한다.
또한 영어 단어 중 정확성을 증가하기 위해 상기 검증 규칙 서버(550)에는 검증 규칙을 저장하는데, 검증 규칙은, 조합된 영어 단어의 음절 수(SC), 한국어에 대응되 는 상기 영어의 단어를 난이도에 따라 설정된 변수 값(WL), 및 상기 영어의 단어의 각 음절이 가지는 난이도에 따른 변수 값의 가산 값을 상기 음절 수(SC)로 나눈 연산 값(FV)에 따라 상기 영어의 단어를 그룹하고, 이러한 그룹의 결과는 표시부를 통해 한국어 음절에 대응되는 영문 단어의 발생 빈도수에 따른 순위를 표시하게 된다. 여기서, 상기 난이도는 해당 교육 과정의 영어 교과서에 기재된 단어를 기준으로 설정된다. 즉, 중학교 기본 어휘 1500 단어, 고등학교 기본어휘 4500 단어, 대학 교양정도의 어휘 6000 단어를 기준으로 난이도가 결정된다.
이상에서 전술한 바와 같이, 본 발명의 다국어 독음 검색 장치는, 제1 국어에 대응되는 다국어(제1 국어 제외)를 제1 국어로 입력하고 입력된 제1 국어를 음절 단위로 분리한 후 분리된 제1 국어의 음절과 상기 제1 국어를 제외한 나머지 다국어의 표제부 및 그 표제부의 발음 기호의 쌍을 근거로 독음된 음절에 대응된 발음 기호의 다국어의 음절을 추출하여 독음된 제1 국어의 단어에 대응되는 제1 국어를 제외한 나머지 다국어의 단어를 정확하게 또는 유사성이 높은 검색 순위로 표시하여 독음된 제1 국어의 단어를 제1 국어를 제외한 나머지 다국어의 단어로 정확하게 검색할 수 있다.
<실시예 2>
본 발명의 실시 예에서는 사용자가 원하는 일본어 단어를 한국어로 독음 입력될 때 한국어(한글형태)의 일본어 단어를 일본어로 변환하여 표시하는 것을 일 예로 설명한다.
도 2는 본 발명의 다른 실시 예에 따른 다국어 독음 장치의 구성을 보인 도면으로서, 이에 도시된 바와 같이, 한국어 독음 입력부(100), 한국어 음절 분석부(510), 독음 변환 서버(600), 일본어 음절 결합부(610), 단어 검색부(540), 및 검증 규칙 서버(550)로 구비되는데, 여기서, 상기 한국어 독음 입력부(100), 한극어 음절 분석부(510), 단어 검색부(540), 및 검증 규칙 서버(550)는 도 1에 도시된 바와 동일하므로 그에 따른 상세한 설명은 생략한다.
한편, 상기 독음 변환 서버(600)는 일본어의 표제어 및 발음 기호를 가지는 사전부(601)와, 상기 사전부(601)의 발음 기호를 기 저장된 매칭 테이블을 근거로 일본어의 음절을 생성하여 저장하는 일본어 대비 한국어 음절 생성부(603)와, 한국어 음절 생성부(603)에서 생성된 한국어 음절에 대응되는 일본어의 음절을 출력하는 일본어 음절 출력부(605)를 포함한다.
또한, 상기 일본어 음절 결합부(610)는 상기 한국어 음절 분석부(510)를 통해 분석된 한국어 음절 대비 상기 일본어 음절 출력부(605)의 일본어의 음절을 일본어 대응 한국어 규칙에 의거하여 조합하고 조합 후 유추 가능한 단어 목록을 출력하도록 구비된다.
여기서, 일본어 대응 한국어 규칙은,
1) 탁음 규칙
2) 결합 규칙
가. 일본어 촉음'っ'와의 결합
일본어 'か' 행 앞의 한국어 받침 'ㄱ'은 일본어 촉음 'っ'에 대응되고, 일본어 ' ぽ' 행 앞의 한국어 받침 'ㅂ'은 일본어 촉음'っ'에 대응되며, 일본어 촉음'っ'의 뒤에 일본어 'さ' 행 'た' 이 오는 경우 한국어 받침 'ㅅ' 또는 'ㄷ'에 대응된다. 즉, 예를 들어 한국어 음절 분석부(510)로부터 입력된 한국어 '익카이'가 한국어 음절'익''가''이'로 독음되어 상기 일본어 음절 결합부(610)에 수신되면 상기 일본어 음절 결합부(610)는 상기 일본어 음절 출력부(605)로부터 한국어'익'에 대응되는 일본어 'ぃ', 한국어 '가'에 대응되는 일본어 'か', 및 한국어 '이'에 대응되는 일본어 'ぃ'가 출력되고, 이때 일본어 'ぃかぃ'가 출력되는데 이때 일본어 'か'행 앞의 한국어 'ㄱ' 받침은 일본어 촉음'っ'를 삽입하는 일본어 대응 한국어 규칙에 의거하여 한국어 '익가이'에 대응되는 일본어 'ぃっかぃ'가 출력된다.
나. 발음(ん) 결합
발음(ん) 뒤에 일본어 'さ' 'ざ' 'た' 'だ' 'な' 'ち' 행이 오는 경우 한국어 받침 'ㄴ'에 대응되고, 발음(ん) 뒤에 일본어 'ま' 'ぼ' 'ぽ' 행이 오는 경우 한국어 받침 'ㅁ'에 대응되며, 발음(ん) 뒤에 일본어 'あ' 'か' 'が' 'ゃ' 'ゎ' 행이 오거나 발음(ん)이 단어의 맨뒤에 오는 경우 한국어 받침 'ㅇ'에 대응된다.
또한, 한국어 받침 'ㄴ' 'ㅁ' 'ㅇ' 이 오는 경우 무조건 일본어 발음(ん)을 한번 더 삽입한다.
다. 요음(や, ゆ, よ) 결합
일본어 요음과 모음이 'i'로 발음 되는 일본어(예를 들어 き, し, ち 등)이 결합되면 '자음ya' '자음yo' '자음yu'로 발음되므로 이에 대응되도록 한글어에 대응되는 일본어를 출력한다.
3) 장모음 규칙
일본어 모음 (e)와 모음(i)의 결합은 한국어 '예의 장모음'에 대응되고, 일본어 모음(ㅇ)와 모음(u)의 결합은 한국어 '오의 장모음'에 대응된다.
4) 한글자가 두개의 발음으로 나는 경우
5) 관용적 어구
등이 있다.
이러한 규칙에 의거하여 상기 일본어 음절 결합부(610)는 한국어 음절 분석부(510)에서 출력된 한국어 음절 대비 일본어 음절 결합하여 일본어 단어를 출력한다.
이러한 일본어 단어에 대한 검증은 실시예 1에서 설명한 바와 동일하므로 그에 따른 상세한 설명은 생략한다.
<실시예 3>
본 발명의 실시 예에서는 사용자가 원하는 중국어 단어를 한국어로 독음 입력될 때 한국어(한글형태)의 중국어 단어를 중국어로 변환하여 표시하는 것을 일 예로 설명한다.
도 3은 본 발명의 다른 실시 예에 따른 다국어 독음 장치의 구성을 보인 도면으로서, 이에 도시된 바와 같이, 한국어 독음 입력부(100), 한국어 음절 분석부(510), 독음 변환 서버(700), 중국어 음절 결합부(730), 단어 검색부(540), 및 검증 규칙 서버(550)로 구비되는데, 여기서, 상기 한국어 독음 입력부(100), 한극어 음절 분석부(510), 단어 검색부(540), 및 검증 규칙 서버(550)는 도 1에 도시된 바와 동일 하므로 그에 따른 상세한 설명은 생략한다.
한편, 상기 독음 변환 서버(700)는 중국어 표제어 및 병음을 가지는 사전부(701)와, 상기 사전부(701) 병음을 단어 별로 분류하는 중국어 단어 분리부(703)와, 상기 중국어 단어 분리부(703)를 통해 분리된 각 단어에 대응되는 중국어 대비 한국어를 생성하는 중국어 대비 한국어 생성부(705)와, 상기 중국어 대비 한국어 생성부(705)에서 생성된 한국어 단어 대비 중국어를 출력하는 중국어 음절 출력부(707)를 포함한다.
또한 중국어 음절 결합부(710)는 한국어 음절 분석부(510)에서 출력된 한국어 음절에 대응되는 상기 중국어 음절 출력부(707)의 중국어 음절을 결합하도록 구비된다.
이때 결합 규칙은, 미리 정해진 한어 병음 테이블을 기초로 결합된다.
이러한 중국어 단어에 대한 검증은 실시예 1에서 설명한 바와 동일하므로 그에 따른 상세한 설명은 생략한다.
지금까지 본 발명을 바람직한 실시 예를 참조하여 상세히 설명하였지만, 본 발명이 상기한 실시 예에 한정되는 것은 아니며, 이하의 특허청구범위에서 청구하는 본 발명의 요지를 벗어남이 없이 본 발명이 속하는 기술 분야에서 통상의 지식을 가진 자라면 누구든지 다양한 변형 또는 수정이 가능한 범위까지 본 발명의 기술적 사상이 미친다 할 것이다.
도 1은 본 발명에 따른 다국어 독음 장치의 구성을 보인 도이다.
도 2는 본 발명의 다른 실시예에 따른 다국어 독음 장치의 구성을 보인 도이다.
도 3은 본 발명의 또 다른 실시 예에 따른 다국어 독음 장치의 구성을 보인 도이다.
<도면의 주요부분에 대한 부호의 설명>
100 : 한국어 독음 입력부
500 : 독음 검색 서버
510 : 한국어 음절 분석부
520, 600. 700 : 독음 변환 서버
530 : 영어 음절 결합부
540 : 단어 검색부
550 : 검증 규칙 서버
521, 601, 701 : 사전부
603 : 일본어 대비 한국어 음절 생성부
605 : 일본어 음절 출력부
610 : 일본어 음절 결합부
703 : 중국어 단어 분리부
705 : 중국어 대비 한국어 생성부
707 : 중국어 음절 출력부
710 : 중국어 음절 결합부

Claims (27)

  1. 제1 국어에 대응되는 다국어를 상기 제1 국어로 입력하는 제1 국어 독음 입력부;
    상기 제1 국어 독음 입력부를 통해 입력된 제1 국어의 단어를 음절 단위로 분리한 후 분리된 제1 국어 음절과 제1 국어를 제외한 나머지 다국어의 표제부 및 그 표제부의 발음 기호의 쌍을 근거로 상기 제1 국어의 음절 대비 다국어 음절을 추출한 후 조합하여 독음된 제1 국어에 대응되는 다국어의 단어를 표시하는 독음 검색 서버를 포함하되,
    상기 독음 검색 서버는,
    상기 제1 국어 독음 입력부를 통해 입력된 제1 국어의 단어를 음절 단위로 분리하는 제1 국어 음절 분석부;
    상기 제1 국어 음절 분석부에 의해 분리된 각 음절에 대응되는 다국어의 음절을 출력하는 독음 변환 서버;
    상기 독음 검색 서버로부터 공급되는 제1 국어의 각 음절에 대응되는 다국어의 음절을 미리 저장된 검증 규칙 서버에 저장된 제1 국어 및 다국어 간의 결합 규칙을 근거로 결합하여 조합하고 조합 후 유추 가능한 다국어의 단어 목록을 출력하는 다국어 음절 결합부; 및
    상기 다국어 음절 결합 모듈을 통해 출력된 다국어 단어의 조합 속도를 증가하기 위해 상기 검증 규칙 서버를 통해 입력된 제1 국어의 단어에 대응되는 다국어의 단어를 출력하는 단어 검색부를 포함하는 것을 특징으로 하는 다국어 독음 검색 장치.
  2. 청구항 1에 있어서, 상기 제1 국어 독음 입력부는,
    상기 제1 국어를 입력하기 위한 키보드, 음성인식 기능을 가지는 PDA 및 이동 단말기, 키패드 중 하나인 것을 특징으로 하는 다국어 독음 검색 장치.
  3. 삭제
  4. 청구항 1에 있어서, 상기 독음 변환 서버는,
    다국어의 표제어 및 발음 기호를 가지는 사전부;
    상기 사전부에 기재된 발음 기호를 다국어 언어의 음절 규칙에 따라 다국어의 음절 단위로 분리하는 다국어 음절 분리부;
    상기 다국어 음절 분리부의 음절을 기 저장된 매칭 테이블과 상기 제1 국어 및 다국어 간의 조합 규칙성을 근거로 다국어의 음절을 생성하여 저장하는 다국어 대비 제1국어 음절 생성부; 및
    상기 제1 국어 음절 생성부로부터 분리된 제1 국어의 음절에 대응되는 다국어의 음절을 출력하는 다국어 음절 출력부를 포함하는 것을 특징으로 하는 다국어 독음 검색 장치.
  5. 청구항 4에 있어서, 상기 제1 국어는 한국어이고, 상기 다국어는 영어인 것을 특징으로 하는 다국어 독음 검색 장치.
  6. 청구항 5에 있어서, 상기 다국어 음절 분리부는 영어 음절 분리부로서,
    상기 사전부에 기록된 표제부 및 발음 기호를 한국어의 음절에 대응되는 규칙성에 따라 각각 분리하는 것을 특징으로 하는 것을 특징으로 하는 다국어 독음 검색 장치.
  7. 청구항 6에 있어서, 상기 표제부에 대한 한국어의 음절에 대응되는 규칙성은,
    영어에 대한 자음 군과 모음 군 중 해당 영어에 대한 음절 규칙성에 따라 분리 1하는 것을 특징으로 하는 다국어 독음 검색 장치.
  8. 청구항 7에 있어서, 영어에 대한 음절 규칙성에 따른 분리 1은,
    표제부가 자음이 겹치는 경우 하나의 음절로 분리하며,
    영어의 표제부가 모음 1+자음+모음 2로 구성된 경우 모음 1, 자음 및 모음 2의 두 개의 음절로 분리하고,
    영어의 표제부가 모음 +자음 1+자음 2로 구성된 경우 모음 + 자음 1, 자음 2의 두 개의 음절로 분리하며,
    영어의 표제부가 모음 1+자음 1+모음 2+자음 2로 구성된 경우 모음 1, 자음 1+모음 1+자음 2인 두 개의 음절로 분리하고,
    영어의 표제부가 모음 1+자음 1+모음 2+ 모음 3으로 구성된 경우 모음 1, 자음 1+모음 1+모음 3인 두 개의 음절로 분리하는 것을 특징으로 하는 다국어 독음 검색 장치.
  9. 청구항 6에 있어서, 영어의 발음 기호에 대한 한국어의 대응되는 음절 분리 규칙성은,
    영어의 자음 군과 모음 군에서 음절 규칙성에 따라 분리 2하는 것을 특징으로 하는 다국어 독음 검색 장치.
  10. 청구항 9에 있어서, 영어의 음절에 대한 음절 규칙성에 따른 분리 2는.
    영어의 발음 기호가 모음 1+ 자음+모음 2인 경우 모음 1, 자음+모음 2의 두 개의 음절로 분리하고,
    영어의 발음 기호가 모음 1+자음 1+모음 2+자음 2로 구성된 경우 모음 1, 자음 1+모음 1+자음 2인 두 개의 음절로 분리하며,
    영어의 발음 기호가 모음 1+자음 1+모음 2+ 모음 3로 구성된 경우 모음 1, 자음 1+모음 1+모음 3인 두 개의 음절로 분리하는 것을 특징으로 하는 다국어 독음 검색 장치.
  11. 청구항 10에 있어서, 영어의 발음 기호에 대한 한국어의 대응되는 음절 분리 규칙성에서 제외되는 영어의 발음 기호의 경우 영어의 발음 기호에 대한 한국어의 분리된 음절을 기록하여 저장하도록 구비하는 것을 특징으로 하는 다국어 독음 검색 장치.
  12. 청구항 11에 있어서, 상기 다국어 대비 제1국어 음절 생성부는 영어 대비 한국어 음절 생성부로서,
    상기 영어 음절 분리부에서 분리된 음절에 대응되는 한국어의 음절을 매칭 테이블 값 및 한국어 및 영어 간의 조합 규칙성을 기초로 생성하도록 구비되는 것을 특징으로 하는 다국어 독음 검색 장치.
  13. 청구항 12에 있어서, 상기 영어 대비 한국어 음절 생성부의 매칭 테이블값은,
    각 발음 기호의 각 자음에 대응되는 초성, 중성 및 낱자에 대한 한국어의 음절을 보인 자음 대표 테이블;
    각 발음 기호의 모음에 대응되는 초성 중성에 대한 한국어의 음절을 보인 모음 대표 테이블;
    각 발음 기호의 각 자음에 대응되는 초성 및 낱자에 대한 한국어의 음절을 보인 보조 테이블; 및
    각 발음 기호 중 묵음에 대한 한국어의 음절을 보인 묵음 테이블을 포함하는 것을 특징으로 하는 다국어 독음 검색 장치.
  14. 청구항 13항에 있어서, 상기 영어 대비 한국어 음절 생성부의 조합 규칙성은,
    상기 한국어의 자음의 초성과 모음이 결합하는 제1 모음형 음절과,
    상기 한국어의 자음의 초성과 모음과 자음의 종성이 결합하는 제2 모음형음절과,
    상기 한국어의 초성이 없는 경우 ㅇ와 결합하여 낱자를 형성하는 제3 모음형 음절과,
    상기 한국어의 제3 모음형과 자음의 종성이 결합하는 제4 모음형 음절을 포함하는 것을 특징으로 하는 다국어 독음 검색 장치.
  15. 청구항 14에 있어서, 상기 다국어 음절 출력부는 상기 영어 대비 한국어 음절 생성부의 조합 규칙에 따라 생성된 한국어 음절 대비 영문 음절을 출력하는 영어 음절 출력부로서,
    상기 영어 대비 한국어 음절 생성부에서 생성된 영어의 음절이 자음 1 + 자음 2인 경우 상기 한국어의 자음 1은 한국어의 낱자의 음절로 출력되고,
    상기 영어 대비 한국어 음절 생성부에서 생성된 영어 음절이 자음 + 모음 1 + 모음 2인 경우 초성 + 제1 모음형 + 제3 모음형의 한국어 음절로 출력되며,
    상기 영어 대비 한국어 음절 생성부에서 생성된 영어 음절이 모음1+ 모음 2인 경우 초성 + 제1 모음형 + 제3 모음형의 한국어 음절로 출력되고,
    상기 영어 대비 한국어 음절 생성부에서 생성된 영어 음절이 자음 + 모음 1+ 모음 2+ 자음 2인 경우 상기 초성 + 제1 모음형 + 제4 모음형+ 낱자의 한국어 음절로 출력되며,
    상기 영어 대비 한국어 음절 생성부에서 생성된 영어 음절이 모음+ 자음인 경우 상기 제4 모음형 + 낱자의 한국어의 음절로 출력되고,
    상기 제2 모음형 + 낱자 또는 상기 제4 모음형 + 낱자의 영어 음절은 제1 모음형 + 낱자 또는 상기 제3 모음형 + 낱자의 한국어 음절로 각각 변환하는 것을 특징으로 하는 다국어 독음 검색 장치.
  16. 청구항 15에 있어서, 상기 다국어 음절 결합부는 영어 음절 결합부로서,
    상기 한국어 음절 분석부를 통해 분석된 한국어의 음절 대비 상기 영어 음절 출력부의 영어의 음절을 조합하고 조합 후 유추 가능한 단어 목록을 출력하도록 구비되는 것을 특징으로 하는 다국어 독음 검색 장치.
  17. 청구항 1에 있어서, 상기 제1 국어는 한국어이고, 상기 다국어는 일본어인 것을 특징으로 하는 다국어 독음 검색 장치.
  18. 청구항 17에 있어서, 상기 독음 변환 서버는,
    일본어의 표제어 및 발음 기호를 가지는 사전부와,
    상기 사전부의 발음 기호를 기 저장된 매칭 테이블을 근거로 일본어의 음절을 생성하여 저장하는 일본어 대비 한국어 음절 생성부와,
    한국어 음절 생성부에서 생성된 한국어 음절에 대응되는 일본어의 음절을 출력하는 일본어 음절 출력부를 포함하는 것을 특징으로 하는 다국어 독음 검색 장치.
  19. 청구항 18에 있어서, 상기 다국어 음절 결합부는 일본어 음절 결합부로서,
    상기 한국어 음절 분석부를 통해 분석된 한국어 음절 대비 상기 일본어 음절 출력 부의 일본어의 음절을 일본어 대응 한국어 규칙에 의거하여 조합하고 조합 후 유추 가능한 단어 목록을 출력하도록 구비되는 것을 특징으로 하는 다국어 독음 검색 장치.
  20. 청구항 1에 있어서, 상기 제1 국어는 한국어이고, 상기 다국어는 중국어인 것을 특징으로 하는 다국어 독음 검색 장치.
  21. 청구항 20에 있어서, 상기 독음 변환 서버는,
    중국어 표제어 및 병음을 가지는 사전부와,
    상기 사전부 병음을 단어 별로 분류하는 중국어 단어 분리부와,
    상기 중국어 단어 분리부를 통해 분리된 각 단어에 대응되는 중국어 대비 한국어를 생성하는 중국어 대비 한국어 생성부와,
    상기 중국어 대비 한국어 생성부에서 생성된 한국어 단어 대비 중국어를 출력하는 중국어 음절 출력부를 포함하는 것을 특징으로 하는 다국어 독음 검색 장치.
  22. 청구항 21에 있어서, 상기 다국어 음절 결합부는 중국어 단어 결합부로서,
    미리 정해진 한어 병음 테이블을 통해 한국어 음절 분석부에서 출력된 한국어 음절에 대응되는 상기 중국어 음절 출력부의 중국어 음절을 결합하도록 구비되는 것을 특징으로 하는 다국어 독음 검색 장치.
  23. 청구항 4에 있어서, 상기 단어 검색부는,
    독음된 제1 국어 대비 다국어 단어를 신속하게 검색하기 위해, 상기 제1 국어 음절 분석부를 통해 분석된 제1 국어의 음절 대비 상기 다국어 음절 출력부의 다국어의 음절 간의 결합된 다국어의 단어를 미리 저장된 검증 규칙 서버의 부분 검증 사전을 통해 유효성 여부를 판정하여 부분 검증하고,
    상기 부분 검증된 다국어의 단어 중 유효 판정된 단어와 상기 검증 규칙 서버에 미리 저장된 단어 검색 사전의 단어의 일치 여부를 통해 단어 검증하는 것을 특징으로 하는 다국어 독음 검색 장치.
  24. 청구항 23에 있어서, 상기 부분 검증 사전은 독음된 제1 국어의 하나의 음절에 대응되는 다국어의 음절이 후 다국어의 하나의 음절씩을 확장하여 저장하는 것을 특징으로 하는 다국어 독음 검색 장치.
  25. 청구항 24에 있어서, 상기 단어 검색 사전은 상기 사전부에 저장된 표제부, 지명, 및 인명을 더 포함하는 것을 특징으로 하는 다국어 독음 검색 장치.
  26. 청구항 25에 있어서, 상기 단어 검색부는,
    독음된 제1 국어 대비 검색된 다국어 단어의 정확성을 향상시키기 위해, 상기 제1 국어의 독음된 음절 중 앞 및 뒤 두 음절과 상기 제1 국어의 앞 및 뒤 두 음절에 대응되는 다국어의 4음절을 추출하여 상기 검증 규칙 서버에 필터 사전을 더 저장 하고, 상기 제1 국어의 앞 두 음절과 뒤 두 음절의 겹치는 음절을 근거로 정확성을 판정하도록 구비되는 것을 특징으로 하는 다국어 독음 검색 장치.
  27. 청구항 26에 있어서, 상기 단어 검색부는,
    조합된 다국어의 단어의 음절 수(SC), 제1 국어에 대응되는 상기 다국어의 단어를 난이도에 따라 설정된 변수 값(WL), 및 상기 다국어의 단어의 각 음절이 가지는 난이도에 따른 변수 값의 가산 값을 상기 음절 수(SC)로 나눈 연산 값(FV)에 따라 상기 다국어의 단어를 그룹화하여 순위를 표시하도록 구비되는 것을 특징으로 하는 다국어 독음 검색 장치.
KR1020090013296A 2008-06-30 2009-02-18 다국어 독음 검색 장치 KR101116581B1 (ko)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
KR1020080063083 2008-06-30
KR20080063083 2008-06-30

Publications (2)

Publication Number Publication Date
KR20100003178A KR20100003178A (ko) 2010-01-07
KR101116581B1 true KR101116581B1 (ko) 2012-03-15

Family

ID=41813112

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020090013296A KR101116581B1 (ko) 2008-06-30 2009-02-18 다국어 독음 검색 장치

Country Status (1)

Country Link
KR (1) KR101116581B1 (ko)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8543598B2 (en) 2010-03-01 2013-09-24 Microsoft Corporation Semantic object characterization and search
CN102981633A (zh) * 2011-09-06 2013-03-20 雅虎公司 利用拼音输入法输入读音未知汉字的方法和系统
KR101334154B1 (ko) * 2012-06-27 2013-11-28 (주)신명시스템즈 중국어 단어 입력 장치 및 방법
KR101669408B1 (ko) * 2014-09-30 2016-10-26 이만홍 외국어 독음 장치 및 그 방법
KR102192376B1 (ko) * 2019-02-18 2020-12-17 네이버 주식회사 음역 모델을 이용하여 외래 동의어를 자동 추출하는 방법 및 시스템

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20080000720A (ko) * 2006-06-28 2008-01-03 삼성전자주식회사 다국어 번역 장치 및 방법

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20080000720A (ko) * 2006-06-28 2008-01-03 삼성전자주식회사 다국어 번역 장치 및 방법

Also Published As

Publication number Publication date
KR20100003178A (ko) 2010-01-07

Similar Documents

Publication Publication Date Title
Pagel et al. Letter to sound rules for accented lexicon compression
El-Imam Phonetization of Arabic: rules and algorithms
JP2008209717A (ja) 入力された音声を処理する装置、方法およびプログラム
KR101990021B1 (ko) 영어 발음기호를 이용한 외국어 및 자국어 표시장치 및 방법
KR101116581B1 (ko) 다국어 독음 검색 장치
US6393444B1 (en) Phonetic spell checker
KR20180025559A (ko) 발음 사전 학습 방법 및 장치
KR100509917B1 (ko) 어절 엔-그램을 이용한 띄어쓰기와 철자 교정장치 및 방법
KR102109858B1 (ko) 자모 및 음절 임베딩 결합을 이용하는 한국어 형태소 분석을 위한 장치 및 방법
KR20130122437A (ko) 영어의 한글 표기 방법 및 시스템
JP3366253B2 (ja) 音声合成装置
Parsons et al. A character-based analysis of impacts of dialects on end-to-end Norwegian ASR
Manghat et al. Normalization of code-switched text for speech synthesis.
Taguchi et al. Transliteration for low-resource code-switching texts: Building an automatic Cyrillic-to-Latin converter for Tatar
JP2004294542A (ja) 音声認識装置及びそのプログラム
Jangtjik et al. The Indonesian Language speech synthesizer based on the hidden Markov model
Ren Methods in Reverse Transliteration of English Loanwords in Japanese
Milon et al. A Comprehensive Dialect Conversion Approach from Chittagonian to Standard Bangla
JP2008249761A (ja) 統計的言語モデル生成装置及び方法、及びこれを用いた音声認識装置
JP2004206659A (ja) 読み情報決定方法及び装置及びプログラム
JP2008083410A (ja) 音声認識装置及びその方法
JPH08185197A (ja) 日本語解析装置、及び日本語テキスト音声合成装置
KR100564742B1 (ko) 문자의 음성변환장치 및 방법
KR20060021721A (ko) 외국어 단어의 한글 표기와 이를 통한 사전 검색 방법
Gafni A Universal System for Automatic Text-to-Phonetics Conversion

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20150205

Year of fee payment: 4

FPAY Annual fee payment

Payment date: 20160212

Year of fee payment: 5

FPAY Annual fee payment

Payment date: 20170208

Year of fee payment: 6

FPAY Annual fee payment

Payment date: 20180208

Year of fee payment: 7

FPAY Annual fee payment

Payment date: 20200203

Year of fee payment: 9