KR101543024B1 - 발음 기반의 번역 방법 및 그 장치 - Google Patents

발음 기반의 번역 방법 및 그 장치 Download PDF

Info

Publication number
KR101543024B1
KR101543024B1 KR1020080134349A KR20080134349A KR101543024B1 KR 101543024 B1 KR101543024 B1 KR 101543024B1 KR 1020080134349 A KR1020080134349 A KR 1020080134349A KR 20080134349 A KR20080134349 A KR 20080134349A KR 101543024 B1 KR101543024 B1 KR 101543024B1
Authority
KR
South Korea
Prior art keywords
word
input
hangul
english
conversion
Prior art date
Application number
KR1020080134349A
Other languages
English (en)
Other versions
KR20100076337A (ko
Inventor
박종복
송은숙
이진희
Original Assignee
에스케이커뮤니케이션즈 주식회사
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 에스케이커뮤니케이션즈 주식회사 filed Critical 에스케이커뮤니케이션즈 주식회사
Priority to KR1020080134349A priority Critical patent/KR101543024B1/ko
Publication of KR20100076337A publication Critical patent/KR20100076337A/ko
Application granted granted Critical
Publication of KR101543024B1 publication Critical patent/KR101543024B1/ko

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/40Processing or translation of natural language
    • G06F40/58Use of machine translation, e.g. for multi-lingual retrieval, for server-side translation for client devices or for real-time translation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Document Processing Apparatus (AREA)
  • Machine Translation (AREA)

Abstract

본 발명은 발음 기반의 번역 방법 및 그 장치에 관한 것이다.
본 발명은 변환 테이블 및 변환 규칙을 참조하여, 한글 자모로 표현된 한글독음이 입력되면 입력된 한글독음을 하나 이상의 영어단어로 변환하고, 알파벳으로 표현된 영어독음이 입력되면 입력된 영어독음을 하나 이상의 영어단어로 변환하며, 알파벳으로 표현된 영어단어가 입력되면 입력된 영어단어를 한글독음으로 변환하는 것을 특징으로 하는 발음 기반의 번역 장치를 제공한다.
본 발명에 의하면, 사용자가 정확한 철자를 알고 있는 영어단어를, 사용자가 읽어서 발음을 따라할 수 있는 쉬운 형태의 한글독음으로 변환하거나, 사용자가 읽을 수 있도록 쉽게 표현된 한글독음 또는 영어독음을 정확한 철자로 표현된 영어단어로 변환해주는 효과가 있다.
발음, 번역

Description

발음 기반의 번역 방법 및 그 장치{Method and Apparatus for Translating Word based on Pronunciation}
본 발명은 발음 기반의 번역 방법 및 그 장치에 관한 것이다. 더욱 상세하게는, 사용자가 정확한 철자를 알고 있는 영어단어를, 사용자가 읽어서 발음을 따라할 수 있는 형태의 한글독음으로 변환하거나, 사용자가 읽을 수 있도록 쉽게 표현된 한글독음 또는 영어독음을 정확한 철자로 표현된 영어단어로 변환해주는 발음 기반의 번역 방법 및 그 장치에 관한 것이다.
종래의 영어 관련 서비스 등을 통해서, 사용자는 영어단어의 정확한 철자를 알고 있어야만 검색을 하여, 그 의미 또는 발음을 확인해 볼 수 있다. 또한, 사용자는 영어단어의 정확한 철자를 모르는 경우에는, 그 의미라도 정확히 알아야만 영어단어의 철자 및 발음을 확인해 볼 수 있다.
종래의 영어 관련 서비스 등을 통해서는, 사용자가 영어로 된 뉴스, 영화, 연설 등을 청취하던 중, 들린 특정 영어단어에 대한 발음이나 의미가 궁금하여도, 특정 영어단어에 대한 정확한 철자를 알지 못한다면, 발음이 그 의미를 확인해 볼 수 없는 문제점이 있다.
한편, 사용자가 철자를 정확히 아는 특정 영어단어를 어떻게 발음해야하는지 궁금한 경우, 그 사용자가 영어발음기호에 익숙하지 않은 사용자라면, 영어사전에 표기된 영어단어의 영어발음기호를 보고 어떻게 발음해야하는지 알 수가 없는 문제점이 있다. 물론, 기존의 영어 관련 서비스에서는 영어단어의 발음을 오디오 형태로 제공해주고 있으나, 자신의 모국어가 아닌 사용자가 외국어의 발음을 오디오로 듣고 그 발음을 자신의 발음으로 만들기는 쉽지가 않다.
전술한 문제점을 해결하고 사용자 요구를 만족시키기 위해서는, 단어를 사용자가 읽어서 발음을 쉽게 따라할 수 있는 형태의 독음으로 변환하거나, 쉽게 읽을 수 있도록 표현된 독음을 이용하여 정확한 철자의 단어로 변환하는 등의 기술이 필요로 하나, 종래의 영어 관련 서비스에서는 이러한 기술을 제공해주지 못하는 실정이다.
전술한 문제점을 해결하기 위해 본 발명의 목적은, 사용자가 정확한 철자를 알고 있는 영어단어를, 사용자가 읽어서 발음을 따라할 수 있는 형태의 한글독음으로 변환하거나, 사용자가 읽을 수 있도록 쉽게 표현된 한글독음 또는 영어독음을 정확한 철자로 표현된 영어단어로 변환해주는 데 있다.
또한, 본 발명의 다른 목적은, 사용자가 영어단어의 영어발음을 듣고, 그 영어단어의 정확한 철자를 알고자 하는 경우, 들린 영어단어의 영어발음을 쉬운 한글독음이나 영어독음으로 간단히 표현하고, 한글독음 또는 영어독음을 이용하여 정확 한 철자로 표현된 영어단어로 변환해주는 데 있다.
또한, 본 발명의 또 다른 목적은, 영어발음기호에 익숙하지 않은 사용자에게도, 철자를 정확히 아는 특정 영어단어에 대한 발음을 쉬운 한글독음으로 표현하여 제공하는 데 있다.
전술한 목적을 달성하기 위해 본 발명은, 하나 이상의 한글 자모로 표현된 한글독음인 제 1 입력어, 하나 이상의 알파벳으로 표현된 영어독음인 제 2 입력어 및 하나 이상의 알파벳으로 표현된 영어단어인 제 3 입력어 중 하나를 입력받는 입력부; 상기 제 1 입력어가 입력되면, 미리 생성된 변환 테이블 및 변환 규칙을 참조하여, 상기 제 1 입력어를 영어단어의 형태인 하나 이상의 제 1 출력어로 변환하는 제 1 변환부; 상기 제 2 입력어가 입력되면, 상기 변환 테이블 및 상기 변환 규칙을 참조하여, 상기 제 2 입력어를 영어단어의 형태인 하나 이상의 제 2 출력어로 변환하는 제 2 변환부; 상기 제 3 입력어가 입력되면, 상기 변환 테이블 및 상기 변환 규칙을 참조하여, 상기 제 3 입력어를 한글독음의 형태인 하나 이상의 제 3 출력어로 변환하는 제 3 변환부; 및 상기 제 1 출력어, 상기 제 2 출력어 및 상기 제 3 출력어 중 하나를 출력하는 출력부를 포함하는 것을 특징으로 하는 발음 기반의 번역을 제공하는 장치를 제공한다.
또한, 본 발명은, 하나 이상의 한글 자모로 표현된 한글독음인 제 1 입력어, 하나 이상의 알파벳으로 표현된 영어독음인 제 2 입력어 및 하나 이상의 알파벳으로 표현된 영어단어인 제 3 입력어 중 하나를 입력받는 입력 단계; 상기 제 1 입력어를 입력받으면, 미리 생성된 변환 테이블 및 변환 규칙을 참조하여, 상기 제 1 입력어를 영어단어의 형태인 하나 이상의 제 1 출력어로 변환하는 제 1 변환 단계; 상기 제 2 입력어를 입력받으면, 상기 변환 테이블 및 상기 변환 규칙을 참조하여, 상기 제 2 입력어를 영어단어의 형태인 하나 이상의 제 2 출력어로 변환하는 제 2 변환 단계; 상기 제 3 입력어를 입력받으면, 상기 변환 테이블 및 상기 변환 규칙을 참조하여, 상기 제 3 입력어를 한글독음의 형태인 하나 이상의 제 3 출력어로 변환하는 제 3 변환 단계; 및 상기 제 1 출력어, 상기 제 2 출력어 및 상기 제 3 출력어 중 하나를 출력하는 출력 단계를 포함하는 것을 특징으로 하는 발음 기반의 번역을 제공하는 방법을 제공한다.
이상에서 설명한 바와 같이 본 발명에 의하면, 사용자가 정확한 철자를 알고 있는 영어단어를, 사용자가 읽어서 발음을 따라할 수 있는 형태의 한글독음으로 변환하거나, 사용자가 읽을 수 있도록 쉽게 표현된 한글독음 또는 영어독음을 정확한 철자로 표현된 영어단어로 변환해주는 효과가 있다.
또한, 본 발명에 의하면, 사용자가 영어단어의 영어발음을 듣고, 그 영어단어의 정확한 철자를 알고자 하는 경우, 들린 영어단어의 영어발음을 쉬운 한글독음이나 영어독음으로 간단히 표현하고, 한글독음 또는 영어독음을 이용하여 정확한 철자로 표현된 영어단어로 변환해주는 효과가 있다.
또한, 본 발명에 의하면, 영어발음기호에 익숙하지 않은 사용자에게도, 철자를 정확히 아는 특정 영어단어에 대한 발음을 쉬운 한글독음으로 표현하여 제공하는 효과가 있다.
본 발명은 발음 기반의 번역 방법 및 그 장치를 제공하는데, 본 발명에서의 "발음 기반의 번역"이란, 사람이 말한 영어단어의 발음을 알파벳으로 표현한 영어독음 또는 한글 자모로 표현한 한글독음을 정확한 영어단어로 변환하거나, 사람이 말하거나 본 영어단어를 사람이 실제로 말할때 발음을 표현할 수 있는 한글독음으로 변환하는 것을 의미한다. 즉, 본 발명에서의 발음 기반의 번역 방법은 단어를 발음에 기반하여 읽을 수 있는 독음으로 변환하거나, 읽을 수 있도록 표현된 독음을 발음에 기반하여 단어로 변환하는 등의 번역 서비스를 사용자에게 제공해줄 수 있다.
이러한 발음 기반의 번역을 수행하는 장치 및 방법은, 부가된 예시적인 도면을 참조하여 이하에서 더욱 상세하게 설명한다. 본 발명의 일 실시예를 설명하기 위한 부가된 각 도면의 구성요소들에 참조부호를 부가함에 있어서, 동일한 구성요소들에 대해서는 비록 다른 도면상에 표시되더라도 가능한 한 동일한 부호를 가지도록 하고 있음에 유의해야 한다. 또한, 본 발명을 설명함에 있어, 관련된 공지 구성 또는 기능에 대한 구체적인 설명이 본 발명의 요지를 흐릴 수 있다고 판단되는 경우에는 그 상세한 설명은 생략한다.
또한, 본 발명의 구성 요소를 설명하는 데 있어서, 제 1, 제 2, A, B, (a), (b) 등의 용어를 사용할 수 있다. 이러한 용어는 그 구성 요소를 다른 구성 요소와 구별하기 위한 것일 뿐, 그 용어에 의해 해당 구성 요소의 본질이나 차례 또는 순서 등이 한정되지 않는다. 어떤 구성 요소가 다른 구성요소에 "연결", "결합" 또는 "접속"된다고 기재된 경우, 그 구성 요소는 그 다른 구성요소에 직접적으로 연결되거나 또는 접속될 수 있지만, 각 구성 요소 사이에 또 다른 구성 요소가 "연결", "결합" 또는 "접속"될 수도 있다고 이해되어야 할 것이다.
도 1은 본 발명의 일 실시예에 따른 발음 기반의 번역을 제공하는 장치(100)에 대한 블록 구성도이다.
도 1을 참조하면, 본 발명의 일 실시예에 따른 발음 기반의 번역을 제공하는 장치(100)는 3가지의 입력어 유형 중 하나의 입력어 유형의 입력어를 입력받는 입력부(110); 입력부(110)에서 입력받은 입력어의 입력어 유형에 따라 입력어를 해당 출력어로 변환하는 변환부(120); 및 변환부(120)에서 변환된 출력어를 출력하는 출력부(130) 등을 포함한다.
입력부(110)에서 입력받는 입력어는 3가지 입력어 유형 중 하나가 될 수 있는데, 이러한 3가지의 입력어 유형은, 하나 이상의 한글 자모로 표현된 한글독음의 형태를 가진 제 1 입력어 유형, 하나 이상의 알파벳으로 표현된 영어독음의 형태를 가진 제 2 입력어 유형 및 하나 이상의 알파벳으로 표현된 영어단어의 형태를 가진 제 3 입력어 유형을 포함한다.
위에서 언급한 한글독음은 사용자가 영어단어를 들리는 대로 하나 이상의 한글 자모로 표현한 것이고, 영어독음은 사용자가 영어단어를 들리는 데로 하나 이상의 알파벳으로 표현한 것이다.
본 명세서에서는, 한글독음의 형태인 제 1 입력어 유형의 입력어를 "제 1 입력어"라 명명하고, 영어독음의 형태인 제 2 입력어 유형의 입력어를 "제 2 입력어" 라 명명하며, 그리고 영어단어의 형태인 제 3 입력어 유형의 입력어를 "제 3 입력어"라 명명한다.
따라서, 입력부(110)는, 하나 이상의 한글 자모로 표현된 한글독음인 제 1 입력어, 하나 이상의 알파벳으로 표현된 영어독음인 제 2 입력어 및 하나 이상의 알파벳으로 표현된 영어단어인 제 3 입력어 중 하나를 구분하여 사용자 단말기로부터 입력받는다.
전술한 변환부(120)는 입력부(110)에서 입력받은 입력어의 입력어 유형에 따라 입력어의 변환을 다르게 수행한다.
따라서, 변환부(120)는, 입력부(110)에서 입력받은 입력어가 하나 이상의 한글 자모로 표현된 한글독음인 제 1 입력어를 변환하는 제 1 변환부(121); 입력부(110)에서 입력받은 입력어가 하나 이상의 알파벳으로 표현된 영어독음인 제 2 입력어를 변환하는 제 2 변환부(122); 및 입력부(110)에서 입력받은 입력어가 하나 이상의 알파벳으로 표현된 영어단어인 제 3 입력어를 변환하는 제 3 변환부(123)를 포함한다.
다시 말해, 제 1 변환부(121)는, 제 1 입력어가 입력되면, 미리 생성된 변환 테이블 및 변환 규칙을 참조하여, 제 1 입력어를 영어단어의 형태인 하나 이상의 제 1 출력어로 변환한다. 제 2 변환부(122)는, 제 2 입력어가 입력되면, 미리 생성된 변환 테이블 및 변환 규칙을 참조하여, 제 2 입력어를 영어단어의 형태인 하나 이상의 제 2 출력어로 변환한다. 제 3 변환부(123)는, 제 3 입력어가 입력되면, 미리 생성된 변환 테이블 및 변환 규칙을 참조하여, 제 3 입력어를 한글독음의 형태 인 하나 이상의 제 3 출력어로 변환한다.
전술한 출력부(130)는 제 1 출력어, 제 2 출력어 및 제 3 출력어 중 하나를 출력한다.
전술한 제 1 변환부(121)에 의해 수행되는 변환을 입력어와 출력어 관점에서 예를 들면 다음과 같다. 예를 들어, 사용자가 특정 영어(예: card)를 듣고 들은 특정 영어의 영어단어(철자)가 무엇인지 궁금하여, 들은 특정 영어의 발음을 한글 자모를 이용하여 "카드"라 표현하고 이를 제 1 입력어로서 입력한 경우, 제 1 변환부(121)는 "카드"라는 한글독음인 제 1 입력어를 아래에서 상세하게 설명하게 될 변환 방법에 따라 card 및 CAD가 포함된 영어단어를 제 1 출력어로서 변환한다. 즉, 제 1 입력어(한글독음): "카드" -> 제 1 출력어(영어단어): card 및 CAD
이로 인해, 영어단어 card를 듣고 정확한 철자(알파벳)를 몰랐던 사용자는 영어단어의 형태인 제 2 출력어 card, CAD를 보고 정확한 철자를 알 수 있다. 물론, 원하는 영어단어의 의미를 확인하여, card와 CAD 중 하나를 선택할 수 있다.
또한, 전술한 제 2 변환부(122)에 의해 수행되는 변환을 입력어와 출력어 관점에서 예를 들면 다음과 같다. 예를 들어, 사용자가 특정 영어(예: card)를 듣고 들은 특정 영어의 영어단어(철자)가 무엇인지 궁금하여, 들은 특정 영어의 발음을 알파벳을 이용하여 "kard"라 표현하고 이를 제 2 입력어로서 입력한 경우, 제 2 변환부(122)는 "kard"라는 영어독음인 제 2 입력어를 아래에서 상세하게 설명하게 될 변환 방법에 따라 card 및 CAD가 포함된 영어단어를 제 2 출력어로서 변환한다. 즉, 제 2 입력어(영어독음): "kard" -> 제 2 출력어(영어단어): card 및 CAD
이로 인해, 영어단어 card를 듣고 정확한 철자(알파벳)를 몰랐던 사용자는 영어단어의 형태인 제 2 출력어 card, CAD를 보고 정확한 철자를 알 수 있다. 물론, 원하는 영어단어의 의미를 확인하여, card와 CAD 중 하나를 선택할 수 있다.
또한, 전술한 제 3 변환부(123)에 의해 수행되는 변환을 입력어와 출력어 관점에서 예를 들면 다음과 같다. 예를 들어, 사용자, 특히 영어발음기호에 익숙하지 않은 사용자가 특정 영어단어(예: card)를 듣거나 보고난 이후, 이 특정 영어를 어떻게 발음해야하는지 궁금하여, 특정 영어인 card를 제 3 입력어로서 입력한 경우, 제 3 변환부(123)는 card라는 영어단어인 제 3 입력어를 아래에서 상세하게 설명하게 될 변환 방법에 따라 "카드"를 포함한 한글독음을 제 3 출력어로서 변환한다. 즉, 제 3 입력어(영어단어): card -> 제 3 출력어(한글독음): "카드"
이로 인해, 영어단어 card에 대하여, 영어발음기호로 표현된 영어발음 [ca:rd]를 보고 발음할 수 없는 사용자도, 한글독음의 형태로 된 제 3 출력어 "카드"를 보고 발음을 할 수 있다.
도 1에 도시된 바와 같이, 본 발명의 일 실시예에 따른 발음 기반의 번역을 제공하는 장치(100)는, 기계학습 또는 장치(100)의 운영자 입력을 통해, 변환 테이블 및 변환 규칙을 생성하고, 생성된 변환 테이블 및 변환 규칙을 참조 데이터베이스(140)에 저장하는 변환 참조 정보 생성부(150)를 추가로 포함할 수 있다.
일 예로서 도시된 도 2를 참조하면, 위에서 언급한 미리 생성된 변환 테이블(200)은, 하나 이상의 한글 자모를 합쳐서 표현한 한글독음; 하나 이상의 한글발음기호를 합쳐서 표현한 한글발음(즉, 한글발음기호의 집합 개념임); 하나 이상의 영어발음기호를 합쳐서 표현한 영어발음(즉, 영어발음기호의 집합 개념임); 및 하나 이상의 알파벳을 합쳐서 표현한 영어단어를 연계하여 저장한다.
도 2를 참조하면, 변환 테이블(200)은, 한글독음, 한글발음, 영어발음 및 영어단어에 대한 4개의 필드를 가지며, 각 필드에는 그 필드 값을 저장하고 있으며, 저장된 필드 값들은 서로 연계된다. 도 2의 예를 참조하면, 「"카드" - [ㅋ ㅏ ㄷ ㅡ] - [ka:rd] - card」및 「"캐드" - [ㅋ ㅐ ㄷ ㅡ] - [kæd] - CAD」와 같이 4개의 필드 값이 서로 연계되어 저장된다.
전술한 제 1 변환부(121), 제 2 변환부(122) 및 제 3 변환부(123)는 이러한 변환 테이블(200)을 참조하여, 입력된 해당 입력어의 입력어 유형을 찾고 그와 연계된 필드값들 중에서 해당 출력어 형태를 추출함으로써, 해당 입력어를 변환할 수 있다.
본 명세서에서, 한글독음 및 영어독음은 "한글 자모" 및 "알파벳"의 형식으로 기재하고, 한글발음기호 및 영어발음기호가 포함된 한글발음 및 영어발음은 [한글발음기호] 및 [영어발음기호]의 형식으로 기재한다.
위에서 언급한 미리 생성된 변환 규칙은, 하나 이상의 한글 자모 및 하나 이상의 한글발음기호 간의 변환을 위한 제 1 변환 규칙; 하나 이상의 한글발음기호 및 하나 이상의 알파벳 간의 변환을 위한 제 2 변환 규칙; 및 복수 개의 다른 한글발음기호를 하나의 대표 기호로 변환하거나, 복수 개의 다른 알파벳을 하나의 대표 기호로 변환하는 대표 변환 규칙 등에서 하나 이상을 포함한다. 위에서 전술한 대표 변환 규칙은 폭넓은 변환 결과를 제공해주기 위한 변환 규칙이다.
도 3을 참조하여, 전술한 변환 규칙을 예를 들어 설명한다.
도 3을 참조하면, 제 1 변환 규칙은, 일 예로서, 한글 자모인 ㅋ과 한글발음기호 []은 서로 변환될 수 있는 변환 규칙을 포함한다. 즉, ㅋ↔[]는 제 1 변환 규칙 중 하나이다.
도 3을 참조하면, 제 2 변환 규칙은, 일 예로서, 한글발음기호 []와 알파벳 c 및 k는 서로 변환될 수 있는 변환 규칙을 포함한다. 즉, []↔c, k는 제 2 변환 규칙 중 하나이다.
여기서, 알파벳 c와 k는 동일하거나 유사한 발음이므로, c와 k를 대표하는 하나의 대표 기호로 표시하거나 변환 또는 관리할 수도 있다. 도 3을 참조하면, 즉, c와 k는 대표 기호(예: #)로 변환되거나 대표 기호(예: #)로부터 변환될 수 있다. 이것이 대표 변환 규칙이다. 또 다른 대표 변환 규칙으로는, 일 예로서, 한글발음기호인 []와 []는 대표 기호인 [*]와 서로 변환될 수 있다. 알파벳 a는 경우에 따라서 [] 또는 []의 발음이 될 수 있기 때문에 보다 폭넓은 변환 결과를 제공해주기 위함이다.
이러한 대표 변환 규칙은 하나의 알파벳에 제한되지 않고, 여러 개의 다른 알파벳의 영어발음기호를 하나의 대표 기호로 변환하는 규칙을 포함할 수도 있다. 또는, 두 개의 이상의 알파벳으로 이루어진 영어단어를 하나의 대표 기호로 변환할 수 있는 규칙과, 두 개의 이상의 알파벳으로 이루어진 영어단어의 영어발음을 하나의 대표 기호로 변환하는 규칙을 포함할 수 있다. 예를 들어, car와 ka를 하나의 대표기호로 변환하거나, car의 영어발음과 ka의 영어발음을 하나의 대표기호(영어 발음)으로 변활 수도 있다.
변환부(120) 내의 각 변환부(121, 122, 123)는, 이러한 대표 변환 규칙을 적용하여 하나의 대표 기호로 변환될 수 있는 하나 이상의 알파벳들 또는 영어발음 간을 서로 매핑시킬 수 있는 토큰 맵핑기를 포함할 수도 있다. 예를 들어, car의 영어발음 및 ka의 영어 발음을 서로 매핑할 수 있고, 이를 확장하여, carbo의 영어발음과 kabeu의 영어발음을 서로 매핑할 수도 있다.
전술한 변환 규칙은, 폭 넓은 변환 결과를 제공하기 위해서, 또는 제 1 변환 규칙, 제 2 변환 규칙 및 대표 변환 규칙 중 하나 이상을 확장하여 새로운 변환 규칙을 생성하기 위해서, 하나 이상의 한글발음기호 및 하나 이상의 영어발음기호 간의 변환을 위한 제 3 변환 규칙; 및 하나 이상의 영어발음기호 및 하나 이상의 알파벳 간의 변환을 위한 제 4 변환 규칙 중 하나 이상을 추가로 더 포함할 수도 있다.
도 3을 참조하면, 전술한 제 3 변환 규칙은, 일 예로서, 한글발음기호 []와 영어발음기호 [k]를 서로 변환할 수 있는 변환 규칙을 포함할 수 있다. 즉, []↔[k]는 제 3 변환 규칙 중 하나이다.
도 3을 참조하면, 전술한 제 4 변환 규칙은, 일 예로서, 영어발음기호 [k]와 알파벳 c 및 k를 서로 변환할 수 있는 변환 규칙을 포함할 수 있다. 즉, [k]↔c/k는 제 4 변환 규칙 중 하나이다.
이상에서 전술한 변환 규칙은, 전 세계 언어의 발음을 하나의 문자로 표기하기 위해 고안된 국제 음성 기호(IPA: International Phonetic Alphabet)를 근간으 로 하여 만들어질 수 있다.
전술한 변환 규칙은 전술한 바와 같은 변환 참조 정보 생성부(150)에 생성되고 정의될 수 있다. 이러한 변환 참조 정보 생성부(150)는 변환 규칙의 종류에 따라 여러 가지의 변환규칙 생성기를 포함할 수 있으며, 이들은 기계학습을 통해 또는 사용자 입력을 통해, 변환 규칙을 생성할 수 있으며, 생성된 변환 규칙은 각 변환부(121, 122, 123)에 의해 참조될 수 있도록 참조 데이터베이스(140)에 저장되고 갱신되고 관리된다.
이하에서는, 본 발명의 일 실시예에 따른 발음 기반의 번역을 제공하는 장치(100)에서의 변환부(120)에 포함된 제 1 변환부(121), 제 2 변환부(122) 및 제 3 변환부(123)에 의해 수행된 변환 기능을 상세하게 설명한다.
먼저, 제 1 변환부(121)에 의해 수행되는 변환, 즉, 한글독음(제 1 입력어)에서 영어단어(제 1출력어)로의 변환을 설명한다.
제 1 변환부(121)는, 하나 이상의 한글 자모로 표현된 한글독음인 제 1 입력어가 입력되면, 도 2에 예시된 바와 같은, 변환 테이블(200)을 검색하여, 제 1 입력어로서의 한글독음과 연계되어 저장된 하나 이상의 영어단어를 제 1 출력어로서 추출함으로써, 제 1 입력어를 제 1 출력어로 변환한다. 여기서, 제 1 변환부(121)는 변환 테이블(200)을 검색할 때, 변환 테이블 검색기(사전 검색기라고도 함)를 이용할 수 있다.
예를 들어, "카드"라는 한글독음의 제 1 입력어가 입력되면, 제 1 변환부(121)는 미리 생성되어 저장된 변환 테이블(200)을 검색하여 "카드"와 연계된 영 어단어인 card를 추출한다. 추출된 card란 영어단어가 제 1 출력어가 되어, 제 1 변환을 수행한다.
만약, "카아드"라는 한글독음이 제 1 입력어로서 입력된 경우, "카아드"라는 한글독음이 미리 생성되어 저장된 변환 테이블에서 검색되지 않는다. 이 경우, 제 1 변환부(121)는, 미리 생성되어 저장된 제 1 변환 규칙을 참조하여, 제 1 입력어를 표현하는 하나 이상의 한글 자모(ㅋ, ㅏ, ㅇ, ㅏ, ㄷ, ㅡ)를 각각 한글발음기호로 변환하고, 이렇게 각각 변환된 한글발음기호를 합쳐서 한글발음으로 표현하고, 변환 테이블을 다시 검색하여, 표현된 한글발음과 연계되어 저장된 하나 이상의 영어단어를 제 1 출력어로서 추출함으로써, 제 1 입력어를 제 1 출력어로 변환하는 제 1 변환을 수행한다.
예를 들어, 제 1 변환 규칙을 참조하여, 한글독음인 "카아드"의 한글 자모를 각각 한글발음기호로 변환하면, [][][][][][ㅡ]가 되고, [][][]에서, []와 []가 중복되기 때문에, [][][]를 []로 표현할 수 있다. 이를 적용하면, 한글발음기호들 [][][][][][ㅡ]는 [][][][ㅡ]로 다시 표현되고, [][][][ㅡ]를 합쳐서 한글발음 [ㅋ ㅏ ㄷ ㅡ]으로 표현되고, []와 []는 대표 기호인 [*]와 서로 변환될 수 있는 대표 변환 규칙을 한글발음 [ㅋ ㅏ ㄷ ㅡ]에 적용하면, 한글발음 [ㅋ ㅏ ㄷ ㅡ]는 한글발음 [ㅋ * ㄷ ㅡ]로 다시 표현할 수 있다. 이 한글발음 [ㅋ * ㄷ ㅡ]와 연계되어 저장된 card 및 CAD를 제 1 출력어로 변환할 수 있다.
바로 앞선 예시를 통해, 대표 변환 규칙을 사용하면, 더욱 폭넓은 변환 결과 를 얻을 수 있음을 확인할 수 있다. 만약, 사용자가 들은 영어가 실제로는 CAD인데, 잘못 들어 "카아드"를 제 1 입력어로 입력한 경우에도, 사용자는 정확한 CAD를 찾을 수 있게 된다.
다음으로, 제 2 변환부(122)에 의해 수행되는 변환, 즉, 영어독음(제 2 입력어)에서 영어단어(제 2 출력어)로의 변환을 설명한다.
제 2 변환부(122)는 하나 이상의 알파벳으로 표현된 영어독음인 제 2 입력어가 입력되면, 제 2 변환 규칙을 참조하여, 제 2 입력어인 영어독음을 한글발음으로 표현하고, 변환 테이블을 검색하여, 한글발음과 연계된 영어 단어를 제 2 출력어로서 추출함으로써, 제 2 변환을 수행할 수 있다.
여기서, 제 2 변환부(122)는, 변환 테이블을 검색할 때 변환 테이블 검색기(사전 검색기라고도 함)를 이용할 수 있으며, 영어독음을 한글발음으로 표현할 때 독음 변환기를 이용할 수 있다.
예를 들어, 입력된 제 2 입력어가 "kard"라는 영어독음인 경우, 제 2 변환 규칙을 적용하여, 영어독음 "kard"를 한글발음 [ㅋ ㅏ ㄷ ㅡ]로 변환한다. 변환된 한글발음 [ㅋ ㅏ ㄷ ㅡ]와 연계된 영어단어 card를 변환 테이블(도 2의 200)에서 제 2 출력어로서 추출한다. 이때, 한글발음 [ㅋ ㅏ ㄷ ㅡ]에 대표 변환 규칙이 적용되면 한글발음 [ㅋ * ㄷ ㅡ]로 변환되고, 변환된 한글발음 [ㅋ * ㄷ ㅡ]와 연계된 영어단어를 변환 테이블(도 2의 200)에서 추출하면, card 및 CAD를 포함하는 영어단어를 제 2 출력어로서 폭넓게 추출하여, 제 2 변환을 수행할 수 있다.
위에서 전술한 제 2 변환부(122)의 제 2 변환을 다시 설명하면, 제 2 변환 부(122)는, 하나 이상의 알파벳으로 표현된 영어독음인 제 2 입력어가 입력되면, 제 2 변환 규칙을 참조하여, 제 2 입력어를 표현하는 하나 이상의 알파벳을 각각 한글발음기호로 변환하고, 각각 변환된 한글발음기호를 합쳐서 한글발음으로 표현하고, 변환 테이블에서 표현된 한글발음과 연계되어 저장된 하나 이상의 영어단어를 상기 제 2 출력어로서 검색함으로써,상기 제 2 입력어를 상기 제 2 출력어로 변환하여, 제 2 변환을 수행한다.
마지막으로, 제 3 변환부(123)에 의해 수행되는 변환, 즉, 영어단어(제 3 입력어)에서 한글독음(제 3 출력어)으로의 제 3 변환을 설명한다. 후술할 제 3 변환은, 제 3 입력어인 영어단어의 변환 테이블에서의 존재 여부에 따라 그 변환 방식이 달라진다.
먼저, 제 3 입력어인 영어단어가 변환 테이블에 존재하는 경우에 대하여 설명한다.
하나 이상의 알파벳으로 표현된 영어단어인 제 3 입력어가 입력되고, 제 3 변환부(123)는, 입력된 제 3 입력어로서의 영어단어가 변환 테이블에서 검색되면, 검색된 영어단어와 연계되어 저장된 한글발음을 추출하고, 미리 정의된 한글독음 표현 규칙에 근거하여 추출된 한글발음을 한글독음으로 표현함으로써, 제 3 입력어에서 제 3 출력어로의 제 3 변환을 수행한다. 위에서 전술한 한글독음 표현 규칙은, 해당 한글발음을 한글 표현에 맞게 표현하기 위해 참조하는 규칙으로서, 자음 뒤에 오는 모음은 자음과 모음을 합치는 규칙(예: [ㅋ ㅗ]-> "코"), 또는 모음과 모음이 연속해서 오면, 중모음이나 뒤의 모음의 앞에 자음 ㅇ을 붙이는 규칙(예: [ㅋ ㅏ ㅣ]-> "캐" 또는 "카이") 등을 포함할 수 있으며, 이는 한글맞춤법 등에 근거하여 정의할 수 있다.
여기서, 제 3 변환부(123)는, 변환 테이블을 검색할 때 변환 테이블 검색기(사전 검색기라고도 함)를 이용할 수 있으며, 한글독음 표현 규칙을 적용하여 한글발음을 한글독음으로 표현할 때 한글독음기호 표현기를 이용할 수 있다.
예를 들어, 제 3 입력어로서 card라는 영문단어가 입력된 경우, 제 3 입력부(123)는 card라는 영문단어가 미리 생성되어 저장된 변환 테이블(도 2의 200)에서 검색될 수 있는지 확인하여, 검색이 가능하면, 영어단어 card와 연계되어 저장된 한글독음 "카드"가 변환 테이블(도 2의 200)에 존재하면, 존재하는 한글독음 "카드"를 직접 추출하여 변환할 수도 있다. 만약, 영어단어 card와 연계되어 저장된 한글독음 "카드"가 변환 테이블(도 2의 200)에 존재하지 않으면, 영어단어 card와 연계되어 저장된 한글발음 [ㅋ * ㄷ ㅡ]을 추출하고, 미리 정의된 한글독음 표현 규칙에 근거하여, 추출된 한글발음 [ㅋ * ㄷ ㅡ]을 한글독음 "카드"로 표현하여 이를 제 3 출력어로 변환할 수 있다.
다음으로 제 3 입력어인 영어단어가 변환 테이블에 존재하지 않는 경우에 대하여 설명한다. 이 경우도, 몇 가지 방식으로 나누어 그 예를 들어 설명한다.
하나 이상의 알파벳으로 표현된 영어단어인 제 3 입력어가 입력되고, 입력된 제 3 입력어로서의 영어단어가 변환 테이블에서 검색되지 않는 경우, 변환 테이블에서 검색된 경우에서의 변환 방식과는 다르게, 제 3 변환부(123)는, 제 2 변환 규칙을 참조하여, 입력된 제 3 입력어로서의 영어단어를 표현하는 하나 이상의 알파 벳을 각각 한글발음기호로 변환하고, 각각 변환된 한글발음기호를 합쳐서 한글발음으로 표현하며, 미리 정의된 한글독음 표현 규칙에 근거하여 표현된 한글발음을 한글독음으로 다시 표현함으로써, 제 3 입력어를 상기 제 3 출력어로 변환하여, 제 3 변환을 수행할 수 있다.
여기서, 제 3 변환부(123)는, 변환 테이블을 검색할 때 변환 테이블 검색기(사전 검색기라고도 함)를 이용할 수 있으며, 제 2 변환 규칙을 적용하여 알파벳을 한글발음기호로 변환할 때 발음 변환기를 이용할 수 있고, 한글독음 표현 규칙을 적용하여 한글발음을 한글독음으로 표현할 때 한글독음기호 표현기를 이용할 수 있다.
예를 들어 설명하면, 제 3 입력어로서 cyworld라는 영어단어가 입력되고 이 영어단어가 변환 테이블에 존재하지 않으면, 제 2 변환 규칙(한글발음기호↔알파벳)을 적용하여, 영어단어 cyworld에서의 알파벳 c, y, w, o, r, l 및 d를 한글발음기호로 각각 변환한다. 변환된 한글발음기호는, [], [], [], [], [], [] 및 []가 된다. 그리고, 변환된 한글발음기호를 모두 합치면, [ㅆ ㅏ ㅇㅣ ㅇ ㅝ ㄹ ㄷ ㅡ]와 같은 한글발음이 만들어지고, 이를 한글독음 표현 규칙에 적용하면 "싸이월드"라는 한글독음, 즉 제 3 출력어가 표현됨으로써, 제 3 변환을 수행하는 것이다.
또한, 하나 이상의 알파벳으로 표현된 영어단어인 제 3 입력어가 입력되고, 입력된 제 3 입력어로서의 영어단어가 변환 테이블에서 검색되지 않는 경우, 제 3 변환부(123)는, 변환 테이블을 참조하여, 입력된 제 3 입력어로서의 영어단어와 유 사한 후보 영어단어를 검색하고, 제 3 입력어로서의 영어단어에서 검색된 후보 영어단어와 공통된 부분을 공통 영어단어로 추출하여, 공통 영어단어의 한글발음을 변환 테이블에서 추출하며, 제 3 입력어로서의 영어단어에서 공통 영어단어와 차이가 나는 잔차를 추출하며, 변환 규칙에 근거하여, 잔차를 한글발음으로 변환하고, 공통 영어단어의 한글발음 및 잔차가 변환된 한글발음을 조합하고, 미리 정의된 한글독음 표현 규칙에 근거하여 조합된 한글발음을 한글독음으로 다시 표현함으로써, 제 3 입력어를 제 3 출력어로 변환하여, 제 3 변환을 수행할 수도 있다. 이러한 제 3 변환에서, 후보 영어단어의 검색, 공통 영어단어의 추출 및 잔차의 추출은 모음을 기준으로 하여 수행된다.
여기서, 제 3 변환부(123)는, 변환 테이블을 검색할 때 변환 테이블 검색기(사전 검색기라고도 함)를 이용할 수 있으며, 후보 영어단어를 검색할 때 발음 후보 검색기를 이용할 수 있다. 또한, 공통 영어단어 및 잔차의 한글발음 변환시, 발음 생성기를 이용할 수 있으며, 공통 영어단어의 한글발음 및 잔차가 변환된 한글발음을 조합할때 부분발음 조합기를 이용할 수 있다. 또한, 한글독음 표현 규칙을 적용하여 한글발음을 한글독음으로 표현할 때 한글독음기호 표현기를 이용할 수 있다.
예를 들어 설명하면, 제 3 입력어로서 입력받은 영어단어인 cyworld가 변환 테이블에 존재하지 않는 경우, cyworld와 철자가 유사한 후보 영어단어를 변환 테이블에서 검색한다. 이렇게 검색된 후보 영어단어가 myworld라고 가정하면, 제 3 입력어 cyworld와 검색된 후보 영어단어 myworld 간의 공통된 부분을 추출한다. 이 러한 공통된 부분의 추출은, 일 예로서, 모음을 기준으로 하여 이루어진다. 모음을 기준으로 하여, cyworld는 cy와 world로 나누어지고, myworld는 my와 world로 나누어진다. 따라서, 공통된 부분의 공통 영어단어는 world가 된다. 이후, 제 3 입력어인 cyworld와 공통 영어단어인 world 간의 차이는 cy가 되고, 이를 본 명세서에서는 잔차라 명명한다. 이후, 잔차 cy의 한글발음과 공통 영어단어 world의 한글발음의 한글발음을 조합한다. 여기서, 잔차 cy의 가능한 모든 한글발음을 [ㅅ ㅏ ㅇㅣ], [ㅆ ㅏ ㅇ ㅣ] 및 [ㅋ ㅏ ㅇ ㅣ]를 포함한 3가지로 가정하고, 공통 영어단어 world의 한글발음은 [ㅇ ㅝ ㄹ ㄷ ㅡ]로 가정하고, 이들을 조합하여 얻은 한글발음은 [ㅅ ㅏ ㅇㅣ ㅇ ㅝ ㄹ ㄷ ㅡ], [ㅆ ㅏ ㅇ ㅣ ㅇ ㅝ ㄹ ㄷ ㅡ], [ㅋ ㅏ ㅇ ㅣ ㅇ ㅝ ㄹ ㄷ ㅡ]를 포함한 3가지 한글발음이 만들어진다. 이렇게 만들어진 3가지 한글발음에 한글독음 표현 규칙을 적용하면, "사이월드", "싸이월드" 및 "카이월드"를 포함한 3가지의 한글독음이 만들어지고, 이것이 제 3 출력어이다.
전술한 변환 과정은 국제 음성 기호(IPA: International Phonetic Alphabet)에 근거하여 이루어질 수 있다. 가령, 잔차 cy 및 공통 영어단어 world의 한글발음을 구할 때, 국제 음성 기호를 이용할 수 있다.
또한, 하나 이상의 알파벳으로 표현된 영어단어인 제 3 입력어가 입력되고, 입력된 제 3 입력어로서의 영어단어가 변환 테이블에서 검색되지 않는 경우, 제 3 변환부(123)는, 모음을 기준으로 하여 입력된 제 3 입력어로서의 영어단어를 복수 개의 부분으로 나누고, 나누어진 각 부분과 유사한 후보 영어단어를 검색하고, 제 3 입력어로서의 영어단어와 나누어진 각 부분에 대해 검색된 후보 영어단어 간의 공통된 부분을 공통 영어단어로 추출하여, 추출된 공통 영어단어에 대한 한글발음을 획득하고, 획득된 한글발음을 조합하고, 미리 정의된 한글독음 표현 규칙에 근거하여 상기 조합된 한글발음을 한글독음으로 다시 표현함으로써, 제 3 입력어를 제 3 출력어로 변환하는 제 3 변환을 수행할 수도 있다.
여기서, 제 3 변환부(123)는, 변환 테이블을 검색할 때 변환 테이블 검색기(사전 검색기라고도 함)를 이용할 수 있으며, 후보 영어단어를 검색할 때 발음 후보 검색기를 이용할 수 있다. 또한, 공통 영어단어의 한글발음 변환시, 발음 생성기를 이용할 수 있으며, 공통 영어단어의 한글발음을 조합할 때 부분발음 조합기를 이용할 수 있다. 또한, 한글독음 표현 규칙을 적용하여 한글발음을 한글독음으로 표현할 때 한글독음기호 표현기를 이용할 수 있다.
예를 들어 설명하면, 제 3 변환부(123)는 입력된 제 3 입력어인 cyworld가 변환 테이블에 존재하지 않다는 것이 확인되면, 모음을 기준으로 하여 입력된 제 3 입력어인 cyworld를 cy와 world로 나누고, 나누어진 cy와 world 각각에 대하여 유사한 후보 영어단어를 검색한다. 검색 결과, cyan과 myworld를 포함한 후보 영어단어가 검색된 것을 가정한다. 이후, 제 3 입력어로서 입력된 cyworld와 후보 영어단어 중 하나인 cyan 간의 공통된 공통 영어단어인 cy를 추출하고, 제 3 입력어로서 입력된 cyworld와 후보 영어단어 중 또 다른 하나인 myworld 간의 공통된 공통 영어단어인 world도 추출한다. 이렇게 추출된 공통 영어단어인 cy의 한글발음 및 world의 한글발음을 국제 음성 기호(IPA)를 이용하여 각각 [ㅆ ㅏ ㅇ ㅣ] 및 [ㅇ ㅝ ㄹ ㄷ ㅡ]을 획득하고, 획득된 한글발음을 조합하여, 미리 정의된 한글독음 표 현 규칙에 근거하여 조합된 한글발음인 [ㅆ ㅏ ㅇ ㅣ ㅇ ㅝ ㄹ ㄷ ㅡ] 을 한글독음인 "싸이월드" 로 다시 표현함으로써, 제 3 입력어를 제 3 출력어로 변환하는 제 3 변환을 수행한다.
도 1을 참조하여 전술한 본 발명의 일 실시예에 따른 발음 기반의 번역 장치(100)는 사용자에게 발음 기반의 번역 서비스를 제공해줄 수 있는 서버이거나 이러한 서버 내에서 구현될 수 있다. 여기서 서버는 클라이언트로서의 사용자 단말기와 유무선 통신망을 통해 연결될 수 있는 것으로서, 통상적으로 웹 서버( Web Server )일 수 있다.
또한, 도 1을 참조하여 전술한 본 발명의 일 실시예에 따른 발음 기반의 번역 장치(100)는 전술한 발음 기반의 번역을 위한 소프트웨어적인 모듈들로 구현될 수 있으며, 이 경우, 각 소프트웨어적인 모듈들은 그 기능을 위해, 프로세서( Processor ), 메모리, 통신 인터페이스 등의 하드웨어적인 구성을 이용한다.
또한, 도 1에 도시되고 전술한 바와 같은 참조 데이터베이스(140)는, 본 발명의 변환 기능을 수행하기 위해, 제 1 변환부(121), 제 2 변환부(122) 및 제 3 변환부(123) 등을 포함하는 변환부(120)에서 참조하는 변환 테이블 및 변환 규칙을 저장하고 있다. 참조 데이터베이스(140)는 이러한 변환 테이블 및 변환 규칙 이외에도 변환에 필요한 각종 정보 및 데이터를 저장할 수 있다.
도 4는 본 발명의 일 실시예에 따른 발음 기반의 번역을 제공하는 방법에 대한 흐름도이다. 이 방법은 도 1에 도시된 본 발명의 일 실시예에 따른 발음 기반의 번역을 제공하는 장치(100)에 의해 수행된다.
도 4를 참조하면, 본 발명의 일 실시예에 따른 발음 기반의 번역을 제공하는 방법은, 하나 이상의 한글 자모로 표현된 한글독음인 제 1 입력어, 하나 이상의 알파벳으로 표현된 영어독음인 제 2 입력어 및 하나 이상의 알파벳으로 표현된 영어단어인 제 3 입력어 중 하나를 입력어로서 입력받는 입력 단계(S400); 입력받은 입력어가 제 1 입력어, 제 2 입력어 및 제 3 입력어 중 어느 입력어 유형인지를 확인하는 단계(S402); 제 1 입력어를 입력받은 것으로 확인되면, 미리 생성된 변환 테이블 및 변환 규칙을 참조하여, 제 1 입력어를 영어단어의 형태인 하나 이상의 제 1 출력어로 변환하는 제 1 변환 단계(S404); 제 2 입력어를 입력받은 것으로 확인되면, 변환 테이블 및 변환 규칙을 참조하여, 제 2 입력어를 영어단어의 형태인 하나 이상의 제 2 출력어로 변환하는 제 2 변환 단계(S406); 제 3 입력어를 입력받은 것으로 확인되면, 변환 테이블 및 상기 변환 규칙을 참조하여, 제 3 입력어를 한글독음의 형태인 하나 이상의 제 3 출력어로 변환하는 제 3 변환 단계(S408); 및 제 1 출력어, 제 2 출력어 및 제 3 출력어 중 하나를 출력하는 출력 단계(S410) 등을 포함한다.
이상에서 설명한 바와 같이 본 발명에 의하면, 사용자가 정확한 철자를 알고 있는 영어단어를, 사용자가 읽어서 발음을 따라할 수 있는 형태의 한글독음으로 변환하거나, 사용자가 읽을 수 있도록 쉽게 표현된 한글독음 또는 영어독음을 정확한 철자로 표현된 영어단어로 변환해주는 효과가 있다.
또한, 본 발명에 의하면, 사용자가 영어단어의 영어발음을 듣고, 그 영어단어의 정확한 철자를 알고자 하는 경우, 들린 영어단어의 영어발음을 쉬운 한글독음 이나 영어독음으로 간단히 표현하고, 한글독음 또는 영어독음을 이용하여 정확한 철자로 표현된 영어단어로 변환해주는 효과가 있다.
또한, 본 발명에 의하면, 영어발음기호에 익숙하지 않은 사용자에게도, 철자를 정확히 아는 특정 영어단어에 대한 발음을 쉬운 한글독음으로 표현하여 제공하는 효과가 있다.
이상에서, 본 발명의 실시예를 구성하는 모든 구성 요소들이 하나로 결합되거나 결합되어 동작하는 것으로 설명되었다고 해서, 본 발명이 반드시 이러한 실시예에 한정되는 것은 아니다. 즉, 본 발명의 목적 범위 안에서라면, 그 모든 구성 요소들이 하나 이상으로 선택적으로 결합하여 동작할 수도 있다.
또한, 그 모든 구성 요소들이 각각 하나의 독립적인 하드웨어로 구현될 수 있지만, 각 구성 요소들의 그 일부 또는 전부가 선택적으로 조합되어 하나 또는 복수 개의 하드웨어에서 조합된 일부 또는 전부의 기능을 수행하는 프로그램 모듈을 갖는 컴퓨터 프로그램으로서 구현될 수도 있다. 그 컴퓨터 프로그램을 구성하는 코드들 및 코드 세그먼트들은 본 발명의 기술 분야의 당업자에 의해 용이하게 추론될 수 있을 것이다. 이러한 컴퓨터 프로그램은 컴퓨터가 읽을 수 있는 저장매체(Computer Readable Media)에 저장되어 컴퓨터에 의하여 읽혀지고 실행됨으로써, 본 발명의 실시예를 구현할 수 있다. 컴퓨터 프로그램의 저장매체로서는 자기 기록매체, 광 기록매체, 캐리어 웨이브 매체 등이 포함될 수 있다.
또한, 이상에서 기재된 "포함하다", "구성하다" 또는 "가지다" 등의 용어는, 특별히 반대되는 기재가 없는 한, 해당 구성 요소가 내재될 수 있음을 의미하는 것 이므로, 다른 구성 요소를 제외하는 것이 아니라 다른 구성 요소를 더 포함할 수 있는 것으로 해석되어야 한다. 기술적이거나 과학적인 용어를 포함한 모든 용어들은, 다르게 정의되지 않는 한, 본 발명이 속하는 기술 분야에서 통상의 지식을 가진 자에 의해 일반적으로 이해되는 것과 동일한 의미를 가진다. 사전에 정의된 용어와 같이 일반적으로 사용되는 용어들은 관련 기술의 문맥 상의 의미와 일치하는 것으로 해석되어야 하며, 본 발명에서 명백하게 정의하지 않는 한, 이상적이거나 과도하게 형식적인 의미로 해석되지 않는다.
이상의 설명은 본 발명의 기술 사상을 예시적으로 설명한 것에 불과한 것으로서, 본 발명이 속하는 기술 분야에서 통상의 지식을 가진 자라면 본 발명의 본질적인 특성에서 벗어나지 않는 범위에서 다양한 수정 및 변형이 가능할 것이다. 따라서, 본 발명에 개시된 실시예들은 본 발명의 기술 사상을 한정하기 위한 것이 아니라 설명하기 위한 것이고, 이러한 실시예에 의하여 본 발명의 기술 사상의 범위가 한정되는 것은 아니다. 본 발명의 보호 범위는 아래의 청구범위에 의하여 해석되어야 하며, 그와 동등한 범위 내에 있는 모든 기술 사상은 본 발명의 권리범위에 포함되는 것으로 해석되어야 할 것이다.
도 1은 본 발명의 일 실시예에 따른 발음 기반의 번역을 제공하는 장치에 대한 블록 구성도,
도 2는 변환 테이블에 대한 예시도,
도 3은 변환 규칙에 대한 예시도,
도 4는 본 발명의 일 실시예에 따른 발음 기반의 번역을 제공하는 방법에 대한 흐름도이다.
< 도면의 주요 부분에 대한 부호의 설명 >
100: 발음 기반의 번역 장치
110: 입력부
120: 변환부
121: 제 1 변환부
122: 제 2 변환부
123: 제 3 변환부
140: 참조 데이터베이스
150: 변환 참조 정보 생성부
200: 변환 테이블
300: 변환 규칙

Claims (14)

  1. 하나 이상의 한글 자모로 표현된 한글독음인 제 1 입력어, 하나 이상의 알파벳으로 표현된 영어독음인 제 2 입력어 및 하나 이상의 알파벳으로 표현된 영어단어인 제 3 입력어 중 하나를 구분하여 입력받는 입력부;
    상기 제 1 입력어가 입력되면, 미리 생성된 변환 테이블 및 변환 규칙을 참조하여, 상기 제 1 입력어를 영어단어의 형태인 하나 이상의 제 1 출력어로 변환하는 제 1 변환부;
    상기 제 2 입력어가 입력되면, 상기 변환 테이블 및 상기 변환 규칙을 참조하여, 상기 제 2 입력어를 영어단어의 형태인 하나 이상의 제 2 출력어로 변환하는 제 2 변환부;
    상기 제 3 입력어가 입력되면, 상기 변환 테이블 및 상기 변환 규칙을 참조하여, 상기 제 3 입력어를 한글독음의 형태인 하나 이상의 제 3 출력어로 변환하는 제 3 변환부; 및
    상기 제 1 출력어, 상기 제 2 출력어 및 상기 제 3 출력어 중 하나를 출력하는 출력부를 포함하되
    상기 변환 규칙은, 하나 이상의 한글 자모 및 하나 이상의 한글발음기호 간의 변환을 위한 제 1 변환 규칙, 하나 이상의 한글발음기호 및 하나 이상의 알파벳 간의 변환을 위한 제 2 변환 규칙 및 복수 개의 다른 한글발음기호를 하나의 대표 기호로 변환하거나, 복수 개의 다른 알파벳을 하나의 대표 기호로 변환하는 대표 변환 규칙 중 하나 이상을 포함하며,
    상기 제 3 변환부는,
    하나 이상의 알파벳으로 표현된 영어단어인 상기 제 3 입력어가 입력되고, 상기 입력된 제 3 입력어로서의 영어단어가 상기 변환 테이블에서 검색되지 않는 경우,
    모음을 기준으로 하여 상기 입력된 제 3 입력어로서의 영어단어를 복수 개의 부분으로 나누고, 상기 나누어진 각 부분과 유사한 후보 영어단어를 검색하고, 상기 제 3 입력어로서의 영어단어와 상기 나누어진 각 부분에 대해 검색된 후보 영어단어 간의 공통된 부분을 공통 영어단어로 추출하여, 상기 추출된 공통 영어단어의 한글발음을 획득하고, 상기 획득된 한글발음을 조합하고, 미리 정의된 한글독음 표현 규칙에 근거하여 상기 조합된 한글발음을 한글독음으로 다시 표현함으로써, 상기 제 3 입력어를 상기 제 3 출력어로 변환하는 것을 특징으로 하는 발음 기반의 번역을 제공하는 장치.
  2. 제 1항에 있어서,
    상기 한글독음은 사용자가 영어단어를 들리는 대로 하나 이상의 한글 자모로 표현한 것이고, 상기 영어독음은 사용자가 영어단어를 들리는 데로 하나 이상의 알파벳으로 표현한 것을 특징으로 하는 발음 기반의 번역을 제공하는 장치.
  3. 제 1항에 있어서,
    기계학습 또는 운영자 입력을 통해, 상기 변환 테이블 및 상기 변환 규칙을 생성하여 참조 데이터베이스에 저장하는 변환 참조 정보 생성부를 추가로 포함하는 것을 특징으로 하는 발음 기반의 번역을 제공하는 장치.
  4. 제 1항에 있어서,
    상기 미리 생성된 변환 테이블은,
    하나 이상의 한글 자모를 합쳐서 표현한 한글독음;
    하나 이상의 한글발음기호를 합쳐서 표현한 한글발음;
    하나 이상의 영어발음기호를 합쳐서 표현한 영어발음; 및
    하나 이상의 알파벳을 합쳐서 표현한 영어단어
    를 연계하여 저장하는 것을 특징으로 하는 발음 기반의 번역을 제공하는 장치.
  5. 삭제
  6. 제 4항에 있어서,
    상기 변환 규칙은,
    하나 이상의 한글발음기호 및 하나 이상의 영어발음기호 간의 변환을 위한 제 3 변환 규칙; 및 하나 이상의 영어발음기호 및 하나 이상의 알파벳 간의 변환을 위한 제 4 변환 규칙 중 하나 이상을 추가로 더 포함하되, 상기 제 3 변환 규칙 및 상기 제 4 변환 규칙 중 하나 이상을 이용하여, 상기 제 1 변환 규칙, 상기 제 2 변환 규칙 및 상기 대표 변환 규칙 중 하나 이상을 확장하는 것을 특징으로 하는 발음 기반의 번역을 제공하는 장치.
  7. 제 4항에 있어서,
    상기 제 1 변환부는,
    하나 이상의 한글 자모로 표현된 한글독음인 상기 제 1 입력어가 입력되면, 상기 변환 테이블을 검색하여, 상기 제 1 입력어로서의 한글독음과 연계되어 저장된 하나 이상의 영어단어를 상기 제 1 출력어로서 추출함으로써, 상기 제 1 입력어를 상기 제 1 출력어로 변환하는 것을 특징으로 하는 발음 기반의 번역을 제공하는 장치.
  8. 제 4항에 있어서,
    상기 제 1 변환부는,
    하나 이상의 한글 자모로 표현된 한글독음인 상기 제 1 입력어가 입력되면,
    상기 변환 규칙을 참조하여, 상기 제 1 입력어를 표현하는 하나 이상의 한글 자모를 각각 한글발음기호로 변환하고, 상기 각각 변환된 한글발음기호를 합쳐서 한글발음으로 표현하며, 상기 변환 테이블을 검색하여, 상기 표현된 한글발음과 연계되어 저장된 하나 이상의 영어단어를 상기 제 1 출력어로서 추출함으로써,
    상기 제 1 입력어를 상기 제 1 출력어로 변환하는 것을 특징으로 하는 발음 기반의 번역을 제공하는 장치.
  9. 제 4항에 있어서,
    상기 제 2 변환부는,
    하나 이상의 알파벳으로 표현된 영어독음인 상기 제 2 입력어가 입력되면, 상기 변환 규칙을 참조하여, 상기 제 2 입력어를 표현하는 하나 이상의 알파벳을 각각 한글발음기호로 변환하고, 상기 각각 변환된 한글발음기호를 합쳐서 한글발음으로 표현하며, 상기 변환 테이블에서 상기 표현된 한글발음과 연계되어 저장된 하나 이상의 영어단어를 상기 제 2 출력어로서 검색함으로써, 상기 제 2 입력어를 상기 제 2 출력어로 변환하는 것을 특징으로 하는 발음 기반의 번역을 제공하는 장치.
  10. 제 4항에 있어서,
    상기 제 3 변환부는,
    하나 이상의 알파벳으로 표현된 영어단어인 상기 제 3 입력어가 입력되고, 상기 입력된 제 3 입력어로서의 영어단어가 상기 변환 테이블에서 검색되는 경우,
    상기 검색된 영어단어와 연계되어 저장된 한글발음을 추출하고, 미리 정의된 한글독음 표현 규칙에 근거하여 상기 추출된 한글발음을 한글독음으로 표현함으로써, 상기 제 3 입력어를 상기 제 3 출력어로 변환하는 것을 특징으로 하는 발음 기반의 번역을 제공하는 장치.
  11. 제 4항에 있어서,
    상기 제 3 변환부는,
    하나 이상의 알파벳으로 표현된 영어단어인 상기 제 3 입력어가 입력되고, 상기 입력된 제 3 입력어로서의 영어단어가 상기 변환 테이블에서 검색되지 않는 경우,
    상기 변환 규칙을 참조하여, 상기 입력된 제 3 입력어로서의 영어단어를 표현하는 하나 이상의 알파벳을 각각 한글발음기호로 변환하고, 상기 각각 변환된 한글발음기호를 합쳐서 한글발음으로 표현하며, 미리 정의된 한글독음 표현 규칙에 근거하여 상기 표현된 한글발음을 한글독음으로 다시 표현함으로써, 상기 제 3 입력어를 상기 제 3 출력어로 변환하는 것을 특징으로 하는 발음 기반의 번역을 제공하는 장치.
  12. 제 4항에 있어서,
    상기 제 3 변환부는,
    하나 이상의 알파벳으로 표현된 영어단어인 상기 제 3 입력어가 입력되고, 상기 입력된 제 3 입력어로서의 영어단어가 상기 변환 테이블에서 검색되지 않는 경우,
    상기 변환 테이블을 참조하여, 상기 입력된 제 3 입력어로서의 영어단어와 유사한 후보 영어단어를 검색하고, 상기 제 3 입력어로서의 영어단어에서 상기 검색된 후보 영어단어와 공통된 부분을 공통 영어단어로 추출하여, 상기 공통 영어단어의 한글발음을 상기 변환 테이블에서 추출하며, 상기 제 3 입력어로서의 영어단어에서 상기 공통 영어단어와 차이가 나는 잔차를 추출하고, 상기 변환 규칙에 근거하여, 상기 잔차를 한글발음으로 변환하며, 상기 공통 영어단어의 한글발음 및 상기 잔차가 변환된 한글발음을 조합하고, 미리 정의된 한글독음 표현 규칙에 근거하여 상기 조합된 한글발음을 한글독음으로 다시 표현함으로써, 상기 제 3 입력어를 상기 제 3 출력어로 변환하되, 상기 후보 영어단어의 검색, 상기 공통 영어단어의 추출 및 상기 잔차의 추출은 모음을 기준으로 하여 수행되는 것을 특징으로 하는 발음 기반의 번역을 제공하는 장치.
  13. 삭제
  14. 하나 이상의 한글 자모로 표현된 한글독음인 제 1 입력어, 하나 이상의 알파벳으로 표현된 영어독음인 제 2 입력어 및 하나 이상의 알파벳으로 표현된 영어단어인 제 3 입력어 중 하나를 구분하여 입력받는 입력 단계;
    상기 제 1 입력어를 입력받으면, 미리 생성된 변환 테이블 및 변환 규칙을 참조하여, 상기 제 1 입력어를 영어단어의 형태인 하나 이상의 제 1 출력어로 변환하는 제 1 변환 단계;
    상기 제 2 입력어를 입력받으면, 상기 변환 테이블 및 상기 변환 규칙을 참조하여, 상기 제 2 입력어를 영어단어의 형태인 하나 이상의 제 2 출력어로 변환하는 제 2 변환 단계;
    상기 제 3 입력어를 입력받으면, 상기 변환 테이블 및 상기 변환 규칙을 참조하여, 상기 제 3 입력어를 한글독음의 형태인 하나 이상의 제 3 출력어로 변환하는 제 3 변환 단계; 및
    상기 제 1 출력어, 상기 제 2 출력어 및 상기 제 3 출력어 중 하나를 출력하는 출력 단계를 포함하되,
    상기 변환 규칙은, 하나 이상의 한글 자모 및 하나 이상의 한글발음기호 간의 변환을 위한 제 1 변환 규칙, 하나 이상의 한글발음기호 및 하나 이상의 알파벳 간의 변환을 위한 제 2 변환 규칙 및 복수 개의 다른 한글발음기호를 하나의 대표 기호로 변환하거나, 복수 개의 다른 알파벳을 하나의 대표 기호로 변환하는 대표 변환 규칙 중 하나 이상을 포함하며,
    상기 제 3 변환 단계는,
    하나 이상의 알파벳으로 표현된 영어단어인 상기 제 3 입력어가 입력되고, 상기 입력된 제 3 입력어로서의 영어단어가 상기 변환 테이블에서 검색되지 않는 경우,
    모음을 기준으로 하여 상기 입력된 제 3 입력어로서의 영어단어를 복수 개의 부분으로 나누고, 상기 나누어진 각 부분과 유사한 후보 영어단어를 검색하고, 상기 제 3 입력어로서의 영어단어와 상기 나누어진 각 부분에 대해 검색된 후보 영어단어 간의 공통된 부분을 공통 영어단어로 추출하여, 상기 추출된 공통 영어단어의 한글발음을 획득하고, 상기 획득된 한글발음을 조합하고, 미리 정의된 한글독음 표현 규칙에 근거하여 상기 조합된 한글발음을 한글독음으로 다시 표현함으로써, 상기 제 3 입력어를 상기 제 3 출력어로 변환하는 것을 특징으로 하는 발음 기반의 번역을 제공하는 방법.
KR1020080134349A 2008-12-26 2008-12-26 발음 기반의 번역 방법 및 그 장치 KR101543024B1 (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020080134349A KR101543024B1 (ko) 2008-12-26 2008-12-26 발음 기반의 번역 방법 및 그 장치

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020080134349A KR101543024B1 (ko) 2008-12-26 2008-12-26 발음 기반의 번역 방법 및 그 장치

Publications (2)

Publication Number Publication Date
KR20100076337A KR20100076337A (ko) 2010-07-06
KR101543024B1 true KR101543024B1 (ko) 2015-08-07

Family

ID=42638067

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020080134349A KR101543024B1 (ko) 2008-12-26 2008-12-26 발음 기반의 번역 방법 및 그 장치

Country Status (1)

Country Link
KR (1) KR101543024B1 (ko)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101294882B1 (ko) * 2011-09-28 2013-08-08 포항공과대학교 산학협력단 복수의 답을 생성하기 위한 기계 학습 방법 및 장치
KR102369923B1 (ko) * 2019-10-30 2022-03-04 주식회사 솔트룩스 음성 합성 시스템 및 이의 방법

Also Published As

Publication number Publication date
KR20100076337A (ko) 2010-07-06

Similar Documents

Publication Publication Date Title
US20200159755A1 (en) Summary generating apparatus, summary generating method and computer program
KR101694286B1 (ko) 양방향 자동 통역 및 번역 서비스 제공 장치 및 그 방법
US8364487B2 (en) Speech recognition system with display information
CN104573099B (zh) 题目的搜索方法及装置
EP0954856A1 (en) Context dependent phoneme networks for encoding speech information
JP2000353161A (ja) 自然言語生成における文体制御方法及び装置
CN110211562B (zh) 一种语音合成的方法、电子设备及可读存储介质
CN100592385C (zh) 用于对多语言的姓名进行语音识别的方法和系统
EP1623412A2 (en) Method for statistical language modeling in speech recognition
Prahallad et al. The blizzard challenge 2013–indian language task
JP5317093B2 (ja) 学習コンテンツ生成装置、学習コンテンツの生成方法、学習コンテンツ生成装置としてコンピュータを機能させるためのプログラム、および当該プログラムを格納したコンピュータ読み取り可能な記録媒体
CN113157852A (zh) 语音处理的方法、系统、电子设备及存储介质
KR101543024B1 (ko) 발음 기반의 번역 방법 및 그 장치
Khoury Microtext normalization using probably-phonetically-similar word discovery
JP6619932B2 (ja) 形態素解析装置およびプログラム
Soky et al. Building wfst based grapheme to phoneme conversion for khmer
CN107423293A (zh) 数据翻译的方法和装置
Singh et al. An Integrated Model for Text to Text, Image to Text and Audio to Text Linguistic Conversion using Machine Learning Approach
JP2007206796A (ja) 文字処理装置、方法、プログラムおよび記録媒体
CN109065016B (zh) 语音合成方法、装置、电子设备及非暂态计算机存储介质
CN112270917B (zh) 一种语音合成方法、装置、电子设备及可读存储介质
Park et al. Generation of correct word sequences from multiple outputs of a conventional automatic speech recognizer for voice-activated information appliances
KR20130099666A (ko) 복합고유명사의 대역어 생성 장치 및 방법
Kamath et al. English to Konkani Translator Using Hindi as a Pivot Language
KR100932643B1 (ko) 한국어 tts 시스템을 위한 형태소, 구문 분석 없는음소열-발음열 변환방법 및 장치

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20180801

Year of fee payment: 4

FPAY Annual fee payment

Payment date: 20190802

Year of fee payment: 5