KR20130099666A - 복합고유명사의 대역어 생성 장치 및 방법 - Google Patents

복합고유명사의 대역어 생성 장치 및 방법 Download PDF

Info

Publication number
KR20130099666A
KR20130099666A KR1020120021346A KR20120021346A KR20130099666A KR 20130099666 A KR20130099666 A KR 20130099666A KR 1020120021346 A KR1020120021346 A KR 1020120021346A KR 20120021346 A KR20120021346 A KR 20120021346A KR 20130099666 A KR20130099666 A KR 20130099666A
Authority
KR
South Korea
Prior art keywords
unit
bandword
band word
target word
word
Prior art date
Application number
KR1020120021346A
Other languages
English (en)
Inventor
이수종
김상훈
윤승
왕지현
김정세
박상규
Original Assignee
한국전자통신연구원
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 한국전자통신연구원 filed Critical 한국전자통신연구원
Priority to KR1020120021346A priority Critical patent/KR20130099666A/ko
Publication of KR20130099666A publication Critical patent/KR20130099666A/ko

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/40Processing or translation of natural language
    • G06F40/42Data-driven translation
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/26Speech to text systems

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Theoretical Computer Science (AREA)
  • Artificial Intelligence (AREA)
  • General Health & Medical Sciences (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Machine Translation (AREA)

Abstract

소스 언어의 문장 중에 복합고유명사를 포함하고 있고 적합한 대역어가 없는 경우에 가능한 대역어 단위로 최대한 분리하여 타겟 언어의 대역어를 생성하도록 한 복합고유명사의 대역어 생성 장치 및 방법을 제시한다. 제시된 복합고유명사의 대역어 생성 장치는 복합고유명사에 대하여 단위 대역어의 조합 또는 대역어가 존재하지 않는 부분을 소정 문자의 표기로 변환한 단위 대역어들의 조합으로 구축되는 대역어 DB, 대역어 단위로 분리된 복합고유명사의 각 단위별 대역어 목록을 저장하는 단위 대역어 DB, 대역어 DB 및 단위 대역어 DB를 구축하는 대역어 구축부, 입력되는 소스 언어에 대한 음성 인식 문장을 출력하는 음성 인식부, 및 음성 인식 문장에 포함된 복합고유명사에 대하여 대역어 DB 및 단위 대역어 DB를 근거하여 대역어를 생성하는 대역어 생성부를 포함한다.

Description

복합고유명사의 대역어 생성 장치 및 방법{Apparatus and method for generating target word of a compound proper noun}
본 발명은 복합고유명사의 대역어 생성 장치 및 방법에 관한 것으로, 보다 상세하게는 음성인식, 자동번역 및 음성합성 등의 요소기술이 결합되어 이루어지는 자동통역 과정 중에서 소스 언어의 복합고유명사를 타겟 언어의 대역어로 변환하는 장치 및 방법에 관한 것이다.
통상의 자동통역 과정에 있어서, 복합고유명사는 소스 언어의 사용자에 의해 발성되어 텍스트로 인식되고, 타겟 언어의 대역어로 변환되어 타겟 언어 사용자에게 전달된다.
타겟 언어 사용자는 해당 대역어를 발성하여 텍스트로 대역어가 인식된 후 소스 언어의 복합고유명사로 역변환되는 과정을 통하여 의사소통이 이루어진다.
자동통역 과정에서, 실제 보통명사의 조합에 의해 하나의 복합명사 또는 복합고유명사가 다수 존재하게 되고, 이러한 경우에 타겟 언어의 대역어가 존재하지 않게 된다. 따라서, 이를 일괄 로마자 표기하게 되는 것을 볼 수 있다. 이 경우에는 타겟 언어의 사용자로 하여금 로마자 표기된 대역어를 발성하게 하므로 로마자 표기된 대역어를 인식하기 어렵다.
이하에서, 자동통역 과정을 좀 더 살펴본다. 먼저, 소스 언어의 문장을 발성하면, 음성인식에 의해 소스 언어의 음성인식 텍스트 문장이 생성된다. 음성인식 문장은 자동번역에 의해 타겟 언어의 문장으로 변환되고, 텍스트 문장은 타겟 언어의 음성으로 합성되어 상대방에게 전달된다. 상대방이 발성하는 경우에는 상대방의 언어가 소스 언어가 되고, 동일한 절차가 진행되어, 서로의 의사를 주고 받게 된다. 이러한 과정에서, 음성인식 문장 중에 고유명사가 포함되어 있는 경우에는 대역어가 존재하지 않으므로, 로마자 표기에 의해 대역어를 생성하여 타겟 언어에서 활용된다.
그러나, 로마자 표기는 그 본래의 음가를 온전히 나타낼 수 없으므로, 로마자 표기가 길어질수록 타겟 언어를 사용하는 상대방의 발성에 의해 로마자 표기된 대역어를 인식해 내기는 사실상 불가능하다. 따라서, 로마자 표기를 최소화하고 타겟 언어에서 인식 가능한 대역어로 변환할 필요가 있다.
예로서, 다양한 형태의 단어가 결합된 복합고유명사로서, “선사마을유적공원”을 로마자 표기하여 “Seonsamaeuryujeonggongwon”을 대역어로 활용하는 경우, 타겟 언어에 이러한 어휘가 존재하지 않을 뿐만 아니라, 타겟 언어를 사용하는 상대방이 이를 발성하여 로마자 표기된 어휘를 그대로 인식해 내기가 쉽지 않다. 또한, 로마자 표기는 소스 언어의 음가가 온전히 반영되지 않으므로 소스 언어의 고유명사로 직접 인식되게 할 수도 없다.
일례로, 한국등록특허 10-0946227(명칭: 컴퓨터를 이용한 한글 로마자 표기 변환방법 및 이 변환방법을 실행하는 컴퓨터프로그램이 수록된 기록매체)에서는 한글을 로마자로 변환하는 방법 및 기록매체를 기재하고 있다. 선행특허는 음절음소 분리단계, 음소지정 단계, 음절 구성 단계, 로마자 알파벳 열을 한글 표기의 글자 순서대로 나열하여 한글 표기를 로마자 표기로 변환한다. 하지만, 선행특허에서는 로마자 표기가 길어질수록 대역어 인식 성능이 저하되어 대역어 생성 성능이 저하되는 문제점이 있다.
본 발명은 상기한 종래의 문제점을 해결하기 위해 제안된 것으로, 소스 언어의 문장 중에 복합고유명사를 포함하고 있고 적합한 대역어가 없는 경우에 가능한 대역어 단위로 최대한 분리하여 타겟 언어의 대역어를 생성하도록 한 복합고유명사의 대역어 생성 장치 및 방법을 제공함에 그 목적이 있다.
상기와 같은 목적을 달성하기 위하여 본 발명의 바람직한 실시양태에 따른 복합고유명사의 대역어 생성 장치는, 복합고유명사에 대하여 단위 대역어의 조합 또는 대역어가 존재하지 않는 부분을 소정 문자의 표기로 변환한 단위 대역어들의 조합으로 구축되는 대역어 DB; 대역어 단위로 분리된 복합고유명사의 각 단위별 대역어 목록을 저장하는 단위 대역어 DB; 대역어 DB 및 단위 대역어 DB를 구축하는 대역어 구축부; 입력되는 소스 언어에 대한 음성 인식 문장을 출력하는 음성 인식부; 음성 인식 문장에 포함된 복합고유명사에 대하여 대역어 DB 및 단위 대역어 DB를 근거하여 대역어를 생성하는 대역어 생성부; 대역어가 포함된 음성 인식 문장을 타겟 언어의 문장으로 번역하는 자동 번역부; 및 타겟 언어의 문장을 해당 타겟 언어의 음성합성음으로 전환하여 출력하는 음성 합성부;를 포함한다.
대역어 구축부는 대역어 DB 및 단위 대역어 DB를 소스 언어와 타겟 언어의 쌍으로 구축한다.
대역어 구축부는 단위 대역어 DB를 구축함에 있어서 복합고유명사를 단위 대역어 단위로 분리한 후에 해당 단위의 대역어가 존재하면 단위 소스 언어와 단위 대역어 쌍으로 자료를 축적한다.
대역어 구축부는 복합고유명사에 대한 단위 대역어가 존재하는 경우에는 이들을 단위별로 결합하고, 대역어가 존재하지 않는 부분은 로마자 표기로 보충하여 소스 언어의 복합고유명사 및 타겟 언어의 대역어 쌍으로 자료를 대역어 DB에 저장한다.
대역어 생성부는 단위 대역어 DB를 근거로 상기 복합고유명사를 단위 대역어로 변환하는 경우에 소스 언어의 글자 길이가 긴 단위부터 비교한다.
대역어 생성부는 복합고유명사의 대역어를 검출함에 있어서 일차로 대역어 DB를 근거로 대역어를 검출하고, 대역어 DB에 존재하지 않으면 단위 대역어 DB로부터 단위별로 대역어를 검출하여 변환하고, 대역어 DB에도 검출되지 않는 부분은 로마자 표기에 의해 생성하여 보충한다.
대역어 생성부는 로마자 표기에 의한 대역어 생성시 소스 언어의 각각의 음절을 띄운 후에 자소 분리하고, 초성, 중성, 종성을 식별한 후에 로마자로 변환하고 결합한다.
본 발명의 바람직한 실시양태에 따른 복합고유명사의 대역어 생성 방법은, 복합고유명사에 대하여 단위 대역어의 조합 또는 대역어가 존재하지 않는 부분을 소정 문자의 표기로 변환한 단위 대역어들의 조합으로 구축되는 대역어 DB를 구축하는 단계; 대역어 단위로 분리된 복합고유명사의 각 단위별 대역어 목록을 저장하는 단위 대역어 DB를 구축하는 단계; 입력되는 소스 언어에 대한 음성 인식 문장을 출력하는 단계; 음성 인식 문장에 포함된 복합고유명사에 대하여 대역어 DB 및 단위 대역어 DB를 근거하여 대역어를 생성하는 단계; 대역어가 포함된 음성 인식 문장을 타겟 언어의 문장으로 번역하는 단계; 및 타겟 언어의 문장을 해당 타겟 언어의 음성합성음으로 전환하여 출력하는 단계;를 포함한다.
대역어 생성 단계는 단위 대역어 DB를 근거로 복합고유명사를 단위 대역어로 변환하는 경우에 소스 언어의 글자 길이가 긴 단위부터 비교한다.
대역어 생성 단계는 복합고유명사의 대역어를 검출함에 있어서 일차로 대역어 DB를 근거로 대역어를 검출하고, 대역어 DB에 존재하지 않으면 단위 대역어 DB로부터 단위별로 대역어를 검출하여 변환하고, 대역어 DB에도 검출되지 않는 부분은 로마자 표기에 의해 생성하여 보충한다.
대역어 생성 단계는 로마자 표기에 의한 대역어 생성시 소스 언어의 각각의 음절을 띄운 후에 자소 분리하고, 초성, 중성, 종성을 식별한 후에 로마자로 변환하고 결합한다.
이러한 구성의 본 발명에 따르면, 소스 언어의 복합고유명사와 타겟 언어의 대역어간 상호변환을 효과적으로 이루어, 소스 언어 사용자와 타겟 언어 사용자간 의사소통을 원활하게 해준다.
본 발명의 효과를 몇 가지로 나눠 살펴보면 다음과 같다.
첫째, 복합고유명사의 대역어 인식성능을 높일 수 있다. 복합고유명사의 대역어를 일괄 로마자 표기하지 않고, 대역어가 존재하는 단위로 분리한 후 더 이상 대역어가 존재하지 않는 부분만을 대상으로 최소한의 범위 내에서 로마자 표기 되도록 하여 결합함으로써, 대역어 인식성능을 높일 수 있다.
둘째, 타겟 언어 사용자의 이해도를 높일 수 있다. 복합고유명사를 부분 대역어 단위로 변환함으로써, 타겟 언어 사용자로 하여금 그 내용을 파악할 수 있게 해 준다. 만약, 복합고유명사 전체를 로마자 표기로 변환하여 타겟 언어 사용자에게 제공하는 경우에는 소스 언어의 왜곡된 음가만을 보거나 듣게 되므로 그 내용을 전혀 이해할 수 없게 된다.
셋째, 대역어 DB를 구축하여 활용함으로써, 소스 언어의 복합고유명사와 타겟 언어에서의 대역어간 변환 및 역변환이 원활하게 이루어진다. 단위 대역어 DB 및 대역어 DB는 소스 언어의 복합고유명사와 타겟 언어의 대역어 쌍으로 이루어져 있다. 그러므로, 이를 활용하면, 소스 언어의 복합고유명사와 타겟 언어의 대역어간 변환 및 역변환이 쉽게 이루어진다.
넷째, 소스 언어의 사용자와 타겟 언어의 사용자간 의사소통이 신속하게 이루어질 수 있다. 이를 위해서 먼저, 대역어 DB가 활용되고, 대역어 DB에 포함되어 있지 않은 복합고유명사의 경우에만, 단위 대역어 DB와 로마자 표기를 거쳐 필요한 대역어를 생성하여 활용하게 된다.
도 1은 본 발명의 실시예에 따른 복합고유명사의 대역어 생성 장치의 블록구성도이다.
도 2는 본 발명의 실시예에 따른 복합고유명사의 대역어 생성 방법을 설명하는 흐름도이다.
도 3은 복합고유명사의 대역어 생성 과정을 보다 자세히 설명하는 흐름도이다.
본 발명의 명세서에서, “복합고유명사”란 분리 가능한 다수의 보통명사 또는 고유명사가 결합된 것을 의미한다.
본 발명의 목적을 위해, 단위 대역어를 미리 작성하여 단위 대역어 DB에 축적하고, 단위 대역어가 존재하지 않는 단위에 대하여는 로마자 표기를 포함하여 대역어 DB에 축적한다. 이와 같은 대역어 DB를 활용하여 실제 복합고유명사를 대역어로 신속하게 변환시킬 수 있다. 만약, 대역어 DB로부터 대역어를 바로 찾을 수 없는 경우에는 단위 대역어 DB로부터 단위 대역어별로 변환하고, 단위 대역어 DB에도 존재하지 않는 부분은 로마자 표기하여 전체 대역어를 생성하여 활용하게 된다.
상술한 목적, 특징들 및 장점은 첨부된 도면과 관련한 다음의 상세한 설명을 통하여 보다 분명해질 것이다. 이하, 첨부된 도면을 참조하여 본 발명의 실시예에 따른 복합고유명사의 대역어 생성 장치 및 방법에 대하여 설명하면 다음과 같다.
도 1은 본 발명의 실시예에 따른 복합고유명사의 대역어 생성 장치의 블록구성도이다.
본 발명의 실시예에 따른 복합고유명사의 대역어 생성 장치는 대역어 DB(10), 단위 대역어 DB(12), 대역어 구축부(14), 음성 인식부(16), 대역어 생성부(18), 자동 번역부(20), 및 음성 합성부(22)를 포함한다.
대역어 DB(10)는 복합고유명사에 대하여 단위 대역어의 조합 또는 대역어가 존재하지 않는 부분을 소정 문자의 표기로 변환한 단위 대역어들의 조합으로 구축된 데이터베이스이다. 보다 상세하게, 대역어 DB(10)는 각각의 복합고유명사들에 대한 대역어 목록을 저장한다. 대역어 DB(10)는 실제 복합고유명사의 대역어를 바로 검출할 수 있도록 하기 위한 것이다. 예를 들어, 대역어 DB(10)에는 “선사마을유적공원/Prehistoric_village_heritage_park”, “서귀포유리박물관/Seogwipo_glass_museum”들과 같은 대역어 목록이 자료로써 축적된다. 한편, 대역어 DB(10)는 후술할 단위 대역어 DB(12)와는 달리, 필요한 로마자 표기도 포함되어 있다.
단위 대역어 DB(12)는 대역어 단위로 분리된 복합고유명사의 각 단위별 대역어 목록을 저장한 데이터베이스이다. 예를 들어, 단위 대역어 DB(12)는 “선사/Prehistoric”, “마을/village”등과 같이 소스 언어의 세부 단위와 타겟 언어 세부 단위간 대역관계 자료가 축적되어 있다. 대역어가 존재하지 않는 단위는 단위 대역어 DB(12)에 축적되거나 포함되지 않으며, 단위 대역어가 존재하지 않는 부분은 로마자 표기하게 되고 그 결과는 대역어 DB(10)에 포함된다.
단위 대역어 DB(12)에는 음식메뉴, 행정구역, 관습화된 영어표현이 포함된다. 먼저, 한식메뉴 영문표기 표준안을 수용할 수 있다. “김치찌개/Kimchi Stew”는 그 일례이다. 행정구역의 경우에는, 지명과 행정구역 단위로 이루어진다. 행정구역 단위를 전처리 후 고유명사인 지명을 로마자 표기하여 추가한다. 행정구역 단위 즉, 도, 시, 군, 구, 읍, 면, 리, 동'의 행정 구역 단위와 거리에 각각, “do, si, gun, gu, eup, myeon, ri, dong, ga”로 적고, 그 앞에는 붙임표 (-)를 넣는다. 단위 대역어가 존재할 수 없는 세부 단위를 로마자화하는 경우에도, “고려/Korea”, “조선/Chosun”과 같이 이미 관습화된 영어표현이 있는 경우에는 이들을 단위 대역어 DB(12)에 포함한다.
단위 대역어 DB(12)는 소스 언어 단위의 글자의 길이가 긴 순서로 정렬하여 비교할 수 있도록 한다. 이는, 단위 대역어 DB(12)와의 일치 여부를 비교할 때, 긴 글자의 단위 대역어부터 비교되도록 하기 위한 것이다. 소위, 장음일치 방법으로서, 장음의 대역어 일부가 짧은 단위의 대역어로 먼저 변환되는 것을 방지하기 위한 것이다. 예로서, 단위 대역어 DB(12)에 “중학교/middle_school”, “학교/school”가 포함되어 있는 경우, 장음일치 순서를 따르지 않는다면 “고산중학교”의 대역어는 “Gosan_middle_school”이 되지 않고, “Gosanjung_school”로 변환될 수 있다. 이는 “학교”가 먼저 단위 대역어로 변환됨으로 인하여, 단위 대역어 DB(12)에 포함되어 있지 않은 “고산중”이 로마자 표기되어 결합된 결과이다.
대역어 구축부(14)는 대역어 DB(10) 및 단위 대역어 DB(12)를 소스 언어와 타겟 언어의 쌍으로 구축한다. 대역어 구축부(14)는 단위 대역어 DB(12)를 구축함에 있어서 복합고유명사를 단위 대역어 단위로 분리한 후에 해당 단위의 대역어가 존재하면 단위 소스 언어와 단위 대역어 쌍으로 자료를 축적한다. 대역어 구축부(14)는 복합고유명사에 대한 단위 대역어가 존재하는 경우에는 이들을 단위별로 결합하고, 대역어가 존재하지 않는 부분은 로마자 표기로 보충하여 소스 언어의 복합고유명사 및 타겟 언어의 대역어 쌍으로 자료를 대역어 DB(10)에 저장한다.
음성 인식부(16)는 입력되는 소스 언어에 대하여 인식 단위별로 음성특징을 추출한 후에 인식 네트워크를 대상으로 가장 유사한 인식 결과를 조합하여 음성 인식 문장(대역어가 포함)으로 출력한다. 그리고, 음성 인식부(16)는 음성인식 문장을 대상으로 문형구분, 일부 오류에 대비한 유사문장 제공 등 다양한 형태의 음성언어이해 과정을 거친다.
대역어 생성부(18)는 음성 인식부(16)로부터의 음성 인식 문장에 포함된 복합고유명사에 대하여 대역어 DB(10) 및 단위 대역어 DB(12)를 근거하여 대역어를 생성한다. 대역어 생성부(18)는 대역어 DB(10)로부터 복합고유명사의 대역어를 검출할 때 대역어 DB(10)에 축적되어 있지 않은 경우에는 단위 대역어 DB(12)로부터 단위 대역어를 검출한다. 그 단위 대역어 DB(12)로부터도 검출되지 않는 부분은 로마자 표기 과정을 거쳐 대역어를 새로 생성하여 결합하게 된다. 여기서, 로마자 표기법에 의해 대역어를 생성하는 경우에 대해 예를 들어 설명하면 다음과 같다. 예로서, “서귀포유리박물관”의 대역어“Seogwipo_glass_museum”를 생성하는 경우를 설정한다. “서귀포”와 같이 더 이상 기존의 타겟 언어에 단위 대역어가 존재하지 않는 부분은 로마자 표기법에 의해 대역어를 생성하여 결합한 후 대역어 DB(10)에 축적한다. 또한,“비빔밥”과 같이 타겟 언어권에도 이미 잘 알려진 경우에는 단위 대역어 DB(12)에“비빔밥/Rice mixed with vegetables and beef”를 포함하기 보다는, 로마자 표기에 의해 “Bibimbap”을 생성하여 대역어로 활용할 수도 있다. 또한, 로마자 표기에서는 다양한 발음변환을 반영한다. 즉, “신라/Sinla”, “국민/Gukmin”은 발음변환에 따라 “신라/Silla”, “국민/Gungmin”으로 표기한다.
한편, 대역어 생성부(18)는 로마자 표기법에 의한 대역어를 생성하기 위하여는 한글의 음절을 자소로 분리하고, 각 자소별로 표기되어야 할 로마자를 서로 링크시킨다. 이를 위해, 한글 각 자소와 로마자간의 변환 테이블을 설정한다. 여기서 유의할 점은, 동일한 형태의 자소라 하더라도 초성으로 사용된 경우와 종성으로 사용된 경우의 로마자 표기가 달라진다는 점이다. 따라서, 한글의 음절은 대부분 초성/자음, 중성/모음, 종성/자음으로 구성되지만, 초성과 중성만으로 음절을 구성하는 경우가 있으므로, 종성과 초성의 관계가 혼동되지 않도록 해야 한다. 본 발명에서는 이러한 혼동을 피하기 위하여, 대역어 생성부(18)는 한글의 음절과 음절 사이를 띄운 후에 자소 구분하여 초성, 중성, 종성을 식별되도록 한 다음에, 로마자로 변환하고 결합하였다.
자동 번역부(20)는 대역어 생성부(18)에서 출력되는 대역어가 포함된 음성 인식 문장을 타겟 언어의 문장으로 번역한다.
음성 합성부(22)는 자동 번역부(20)에서의 타겟 언어의 문장을 해당 타겟 언어의 음성합성음으로 전환하여 출력한다.
한편, 상술한 바와 같은 단위 대역어 DB(12) 구축, 대역어 DB(10) 구축, 로마자 표기 이전에 전처리를 수행할 수 있다. 복합고유명사의 대역어를 검출하는 과정에서도 동일한 전처리 과정을 거치게 할 수 있다. 먼저, 한글과 영문이 섞여 있는 경우 under bar(_)로 구분한다. 숫자음은 숫자로 변환하는데, 예컨대, “십칠/17”로 변환한다. 로마자 표기에서는 소리음에 맞게 표기하기 위하여 발음변이 규칙에 의한 변이된 어휘를 적용한다. 다음으로, 후처리 과정에서는 단위 대역어 DB(12)와 일치된 부분은 under bar(_)로 구분하여 분리 가능한 단위임을 표시한다. 그리고 대역어의 첫 글자를 대문자로 바꿔준다.
도 2는 본 발명의 실시예에 따른 복합고유명사의 대역어 생성 방법을 설명하는 흐름도이다.
일단, 대역어 구축부(14)는 앞서 설명한 대역어 DB(10) 및 단위 대역어 DB(12)를 구축한다(S10).
이후, 소스 언어의 발성에 의해 소스 언어가 발생하면(S12), 음성 인식부(16)는 인식 단위별로 음성특징을 추출한 후 인식 네트워크를 대상으로 가장 유사한 인식결과를 조합하여 음성 인식 문장을 생성한다(S14).
그리고, 음성 인식부(16)는 음성 인식 문장을 대상으로 문형구분, 일부 오류에 대비한 유사문장 제공 등 다양한 형태의 음성언어이해 과정을 거친다(S16).
다음으로, 대역어 생성부(18)는 대역어 DB(10) 및 단위 대역어 DB(12)를 이용한 대역어 생성을 행한다. 즉, 대역어 생성부(18)는 음성 인식 문장에 복합고유명사가 포함되어 있는 경우에는 대역어 DB(10)를 근거로 상응하는 대역어로 변환한다. 만약, 대역어 DB(10)로부터 대역어를 찾을 수 없는 경우에는 단위 대역어 DB(12)로부터 단위 대역어를 찾아 단위별로 변환한다. 그리고, 대역어 생성부(18)는 단위 대역어를 찾을 수 없는 부분 혹은 전체를 로마자 표기하여 대역어를 생성한다(S18).
이와 같이 대역어 생성부(18)에 의해 생성된 대역어가 포함된 음성 인식 문장은 자동 번역부(20)에게로 입력된다(S20).
자동 번역부(20)는 입력받은 음성 인식 문장의 문장 구조를 분석하여 타겟 언어로 자동 번역 문장을 만든다(S22).
이후, 음성 합성부(22)는 자동 번역부(20)로부터의 타겟 언어의 자동 번역 문장을 타겟 언어의 음성합성음으로 전환한다(S24).
그리고 나서, 음성 합성부(22)는 음성합성음을 상대방에게 출력해준다(S26).
도 3은 복합고유명사의 대역어 생성 과정을 보다 자세히 설명하는 흐름도이다.
먼저, 단위 대역어 DB(12) 구축을 위한 학습절차부터 살펴본다. 학습용 복합고유명사를 대역어 단위로 분리한다(S100).
여기서, 음식메뉴 대역어, 행정구역 단위 대역어, 기타 전처리의 일환으로 숫자음의 숫자변환 등을 진행하여(S110; 예), 단위 대역어 DB(12)에 추가한다(S140). 또한, 이외의 단위 대역어를 작성하여(S120; 예), 단위 대역어 DB(12)에 추가한다. 한편, 단위 대역어가 존재하지 않는 경우에는 후술하는 로마자 표기를 진행하게 된다. 그러나, 로마자 표기에 앞서 이미 관습화된 표현이 있으면(S130; 예), 이들을 단위 대역어 DB(12)에 추가한다(S140). 이와 같은 과정이 반복되어 단위 대역어 DB(12)가 축적된다.
만약, 더 이상 타겟 언어로부터 단위 대역어를 찾을 수 없는 잔여단위인 경우(S150; 예), 필요한 발음변환을 거쳐(S160), 로마자 표기하여(S170) 대역어 DB(10)에 추가한다(S180).
이와 같이, 모든 학습용 복합고유명사를 대상으로 단위 대역어 DB(12)와 대역어 DB(10)를 축적한다. "곽지해수욕장"의 예를 들어 보면, 먼저, "곽지"와 "해수욕장"은 분리 가능하다. "해수욕장"은 대역어가 존재하므로 단위 대역어 DB(12)에는 "해수욕장/beach"을 추가한다. 이와 같이 해수욕장->beach로 변환되므로, "곽지_beach"가 된다. 그러나, "곽지"는 대역어가 존재하지 않으므로 로마자 표기(S170)에 의해 "곽지->gwakji"를 생성한다. 그에 따라, 대역어 DB(10)에는 "곽지해수욕장/Gwakji_beach"가 추가된다.
다음으로, 테스트용 복합고유명사를 대역어로 변환하는 절차를 살펴본다. 우선,
테스트용 복합고유명사를 입력받고(S190), 대역어 DB(10)를 검색(S200)하여 대역어가 존재하는지 확인한다. 예를 들어, "곽지해수욕장"의 대역어를 찾는 경우(S210; 예), 바로 " Gwakji_beach"를 찾아낼 수 있다. 그러나, 대역어가 존재하지 않는 경우(S210; 아니오), 단위 대역어 DB(12)로부터 로마자 표기 단계를 거쳐 대역어를 새로이 생성하게 된다.
한편, 대역어 DB(10)의 구축에 의하여, 타겟 언어의 대역어를 소스 언어의 복합고유명사로 역변환하는 과정도 동일한 방법으로 가능하다. 즉, 타겟 언어에서 "Gwakji_beach"가 인식된다면 대역어 DB(10)를 검색하여 바로 소스 언어의 "곽지해수욕장"으로 역변환할 수 있게 된다.
상술한 바와 같은 본 발명의 장치 및 방법에 의해, 대역어의 인식성능을 높일 수 있다. 복합고유명사는 대부분 대역어가 존재하지 않거나 장황한 서술형식으로 의미를 표현해야 한다. 따라서, 이를 일괄 로마자 표기하는 경우 소스 언어의 음가가 정확히 표기되지 않으므로, 타겟 언어의 사용자로 하여금 이를 발성하게 하여 인식되기를 기대할 수 없다. 그러나, 본 발명에서와 같이 세부 단위로 분리하여 대역어를 조합하는 경우에는 타겟 언어 사용자로 하여금 대역어를 발성함에 의해 인식이 가능하고 따라서 소스 언어의 복합고유명사로의 역변환도 가능하게 된다.
또한, 대역어를 효과적으로 조합하고 생성할 수 있다. 단위 대역어 DB(12)를 축적함으로써, 단위 대역어가 조합된 다양한 복합고유명사의 대역어를 효과적으로 생성해 낼 수 있다.
또한, 일부 또는 전부의 단위 대역어가 존재하지 않는 경우에도 로마자 표기 절차에 의해 대역어를 생성할 수 있다.
또한, 복합고유명사의 대역어 변환과정에서, 대역어 DB(10)를 먼저 검색하게 함으로써, 대역어 DB(10)로부터 신속하게 대역어를 검출할 수 있고, 존재하지 않는 경우에만 새로이 생성할 수 있도록 효율화하였다.
본 발명은 상술한 실시예로만 한정되는 것이 아니라 본 발명의 요지를 벗어나지 않는 범위내에서 수정 및 변형하여 실시할 수 있고, 그러한 수정 및 변형이 가해진 기술사상 역시 이하의 특허청구범위에 속하는 것으로 보아야 한다.
10 : 대역어 DB 12 : 단위 대역어 DB
14 : 대역어 구축부 16 : 음성 인식부
18 : 대역어 생성부 20 : 자동 번역부
22 : 음성 합성부

Claims (1)

  1. 복합고유명사에 대하여 단위 대역어의 조합 또는 대역어가 존재하지 않는 부분을 소정 문자의 표기로 변환한 단위 대역어들의 조합으로 구축되는 대역어 DB;
    대역어 단위로 분리된 복합고유명사의 각 단위별 대역어 목록을 저장하는 단위 대역어 DB;
    상기 대역어 DB 및 상기 단위 대역어 DB를 구축하는 대역어 구축부;
    입력되는 소스 언어에 대한 음성 인식 문장을 출력하는 음성 인식부; 및
    상기 음성 인식 문장에 포함된 복합고유명사에 대하여 상기 대역어 DB 및 상기 단위 대역어 DB를 근거하여 대역어를 생성하는 대역어 생성부;를 포함하는 것을 특징으로 하는 복합고유명사의 대역어 생성 장치.
KR1020120021346A 2012-02-29 2012-02-29 복합고유명사의 대역어 생성 장치 및 방법 KR20130099666A (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020120021346A KR20130099666A (ko) 2012-02-29 2012-02-29 복합고유명사의 대역어 생성 장치 및 방법

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020120021346A KR20130099666A (ko) 2012-02-29 2012-02-29 복합고유명사의 대역어 생성 장치 및 방법

Publications (1)

Publication Number Publication Date
KR20130099666A true KR20130099666A (ko) 2013-09-06

Family

ID=49450937

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020120021346A KR20130099666A (ko) 2012-02-29 2012-02-29 복합고유명사의 대역어 생성 장치 및 방법

Country Status (1)

Country Link
KR (1) KR20130099666A (ko)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10762302B2 (en) 2017-01-26 2020-09-01 Samsung Electronics Co., Ltd. Translation method and apparatus, and translation system

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10762302B2 (en) 2017-01-26 2020-09-01 Samsung Electronics Co., Ltd. Translation method and apparatus, and translation system
US11409967B2 (en) 2017-01-26 2022-08-09 Samsung Electronics Co., Ltd. Translation method and apparatus, and translation system
US11954452B2 (en) 2017-01-26 2024-04-09 Samsung Electronics Co., Ltd. Translation method and apparatus, and translation system

Similar Documents

Publication Publication Date Title
US8954333B2 (en) Apparatus, method, and computer program product for processing input speech
US9978364B2 (en) Pronunciation accuracy in speech recognition
Alsharhan et al. Improved Arabic speech recognition system through the automatic generation of fine-grained phonetic transcriptions
US20110106792A1 (en) System and method for word matching and indexing
CN104899192B (zh) 用于自动通译的设备和方法
Elmahdy et al. Rapid phonetic transcription using everyday life natural chat alphabet orthography for dialectal Arabic speech recognition
Nikulásdóttir et al. An Icelandic pronunciation dictionary for TTS
KR102069697B1 (ko) 자동 통역 장치 및 방법
Manghat et al. Malayalam-English Code-Switched: Grapheme to Phoneme System.
Soky et al. Building wfst based grapheme to phoneme conversion for khmer
KR20130099666A (ko) 복합고유명사의 대역어 생성 장치 및 방법
Juan et al. Analysis of malay speech recognition for different speaker origins
KR101553469B1 (ko) 다언어 어휘 음성 인식 장치 및 방법
Kabra et al. Auto spell suggestion for high quality speech synthesis in hindi
KR101543024B1 (ko) 발음 기반의 번역 방법 및 그 장치
Saychum et al. Efficient Thai Grapheme-to-Phoneme Conversion Using CRF-Based Joint Sequence Modeling.
Arafat et al. Speech synthesis for bangla text to speech conversion
Charoenpornsawat et al. Example-based grapheme-to-phoneme conversion for Thai.
Aroonmanakun et al. A unified model of Thai romanization and word segmentation
Phaiboon et al. Isarn Dharma Alphabets lexicon for natural language processing
Al-Daradkah et al. Automatic grapheme-to-phoneme conversion of Arabic text
Rajendran et al. Text processing for developing unrestricted Tamil text to speech synthesis system
Kodali et al. Bilingual speech recognition based on deep neural networks and directed acyclic word graphs
Lehečka et al. Improving speech recognition by detecting foreign inclusions and generating pronunciations
Chakraborty et al. Mining Large-Scale Low-Resource Pronunciation Data From Wikipedia

Legal Events

Date Code Title Description
WITN Withdrawal due to no request for examination