KR20180054236A - 음성기호 기반 사전 유사 탐색을 활용한 자동 통번역 시스템 및 그 방법 - Google Patents
음성기호 기반 사전 유사 탐색을 활용한 자동 통번역 시스템 및 그 방법 Download PDFInfo
- Publication number
- KR20180054236A KR20180054236A KR1020160151914A KR20160151914A KR20180054236A KR 20180054236 A KR20180054236 A KR 20180054236A KR 1020160151914 A KR1020160151914 A KR 1020160151914A KR 20160151914 A KR20160151914 A KR 20160151914A KR 20180054236 A KR20180054236 A KR 20180054236A
- Authority
- KR
- South Korea
- Prior art keywords
- symbol
- voice
- word
- unit
- pseudo
- Prior art date
Links
Images
Classifications
-
- G06F17/2809—
Landscapes
- Machine Translation (AREA)
Abstract
본 발명의 일면에 따른 음성기호 기반 사전 유사 탐색을 활용한 자동 통번역 시스템은 외부 음성 인식 시스템 및 텍스트 입력 시스템으로부터 음성 또는 문자의 형태로 문장을 입력받는 문장 입력부; 상기 입력된 문장을 형태소 분석 및 단어 분리하여, 유사 단어 검색하여 미등록어를 탐지하는 미등록어 탐지부; 상기 탐지된 미등록어를 음성 기호로 변환하는 음성 기호 변환부; 상기 변환된 음성 기호를 키값으로 하여 유사 음성 기호를 검색하여 검색된 유사 음성 기호의 어휘를 대역어로 선택하는 유사 음성 기호 검색부; 상기 선택된 대역어를 이용하여 상기 입력된 문장을 번역하는 번역 수행부; 및 상기 번역된 결과를 출력하는 출력부;를 포함하는 것을 특징으로 한다.
Description
본 발명은 음성기호 기반 사전 유사 탐색을 활용한 자동 통번역 시스템 및 그 방법에 관한 것으로서, 구체적으로 사람이 발화하는 자연 언어(Natural language)를 입력으로 받는 자동 통번역 응용 소프트웨어에서 대역어를 자동 생성하는 자동 통번역 시스템 및 그 방법에 관한 것이다.
최근 강연자의 발화를 외국인 청자(listener)에게 전달하기 위해 자동 통번역 시스템 및 관련 응용 프로그램이 활발하게 개발되고 있다. 본 발명은 자동 통번역 시스템 및 관련 응용 프로그램이 사용되는 환경을 바탕으로 두고 있다.
강연자가 청자에게 정보를 전달하기 위하여 발화하는 과정에서 모국어로 표현이 어려운 특정 전문 용어가 포함될 때, 해당 용어를 그대로 발화하는 경우가 많고, 이러한 용어는 자동 통번역 시스템의 사전에 포함되지 않는 경우가 많기 때문에 자동 통번역 시스템 상에서 미등록어로 분류하여 처리될 때, 올바른 대역어를 출력해주지 못하는 문제가 있다.
구체적으로, 자동 통번역 시스템 또는 음성 인식 시스템에 해당 어휘가 등록되지 않은 경우, 입력된 음성을 텍스트로 전사하는 과정에서 오류가 발생하여 잘못된 텍스트를 반환하게 될 수 있으며, 여기서 발생한 오류는 자동 번역 시스템의 번역문의 출력 품질에 악영향을 끼치게 된다.
종래 기술은 외래어를 올바로 인식하지 못해 발생하는 전사문 오류나, 혹은 텍스트 입력 시 외국어를 한국어 음절로 표현하는 경우 (ex. Sequential을 '시퀀셜' 또는 '시??셜'로 입력하는 경우)에도, 한국어로 표현된 외국어가 번역 지식에 포함되지 않는 경우 대역문의 출력 품질이 낮은 문제가 있다.
예컨대, 한국어-영어 자동 번역 시스템 또는 한국어-중국어 자동 번역 시스템에서 한국어 음절로 표현된 외국어가 미등록어인 경우, 한국어 음절을 해당 대역 언어의 음절로 변환하는 Romanization 또는 Latinization을 수행하게 된다. 이러한 음절 변환 시 올바른 대역어로 대치되지 않는 문제가 있다.
본 발명은 전술한 문제를 해결하기 위하여, 입력된 문장 내 어휘 중 미등록어 유무를 확인하고, 해당 미등록어에 대한 음성 기호를 생성한 뒤, 생성된 음성 기호와 유사한 음성 기호를 갖는 외국어 사전 내 후보를 탐색하여, 가장 가까운 외국어를 찾은 뒤, 유사 탐색 과정을 통해 획득한 외래어를 번역 결과에 반영할 수 있는 자동 통번역 시스템 및 방법을 제공하는 것을 목적으로 한다.
본 발명의 목적은 이상에서 언급한 목적으로 제한되지 않으며, 언급되지 않은 또 다른 목적들은 아래의 기재로부터 당업자에게 명확하게 이해될 수 있을 것이다.
전술한 목적을 달성하기 위한 본 발명의 일면에 따른 음성기호 기반 사전 유사 탐색을 활용한 자동 통번역 시스템은 외부 음성 인식 시스템 및 텍스트 입력 시스템으로부터 음성 또는 문자의 형태로 문장을 입력받는 문장 입력부; 상기 입력된 문장을 형태소 분석 및 단어 분리하여, 유사 단어 검색하여 미등록어를 탐지하는 미등록어 탐지부; 상기 탐지된 미등록어를 음성 기호로 변환하는 음성 기호 변환부; 상기 변환된 음성 기호를 키값으로 하여 유사 음성 기호를 검색하여 검색된 유사 음성 기호의 어휘를 대역어로 선택하는 유사 음성 기호 검색부; 상기 선택된 대역어를 이용하여 상기 입력된 문장을 번역하는 번역 수행부; 및 상기 번역된 결과를 출력하는 출력부;를 포함하는 것을 특징으로 한다.
본 발명의 다른 일면에 따른 본 발명에 따른 음성 기호 기반 사전 유사 탐색을 활용한 자동 통번역 방법은 통번역할 대상 문장이 입력되는 단계; 상기 입력된 문장에서 미등록어를 탐지하는 단계; 탐지된 미등록어를 음성 기호로 변환하는 단계; 변환된 음성 기호를 키값으로 하여 유사 음성 기호를 탐색하는 단계; 탐색된 유사 음성 기호를 대역어로 하여 자동 번역을 수행하는 단계; 및 번역 결과를 출력하는 단계를 포함한다.
본 발명에 따르면, 자동 통번역 시스템의 사전에 포함되지 않는 외국어를 올바르게 대역 표현으로 바꿔줄 수 있다. 오타나 잘못된 발음, 그리고 음성 인식 단계 및 자동 번역 단계에서 발생하는 미등록어 중 외국어에 대한 처리를 개선하여 자동 통번역 품질을 향상시켜 보다 보다 정확한 번역 서비스를 제공할 수 있다. 또한, 본 발명의 적용을 통해 다양한 외국어 표기 입력에 대해 강건한 처리 결과를 얻을 수 있다는 장점이 있다.
도 1은 본 발명에 따른 음성 기호 기반 사전 유사 탐색을 활용한 자동 통번역 방법이 구현되는 컴퓨터 시스템의 구성을 설명하기 위한 예시도.
도 2는 본 발명에 따른 음성 기호 기반 사전 유사 탐색을 활용한 자동 통번역 방법을 설명하기 위한 절차 흐름도.
도 3은 본 발명에 따른 대역어 사전 검색 방법을 설명하기 위한 절차 흐름도.
도 4는 본 발명에 따른 음성 기호 기반 사전 유사 탐색을 활용한 자동 통번역 시스템의 구성도.
도 2는 본 발명에 따른 음성 기호 기반 사전 유사 탐색을 활용한 자동 통번역 방법을 설명하기 위한 절차 흐름도.
도 3은 본 발명에 따른 대역어 사전 검색 방법을 설명하기 위한 절차 흐름도.
도 4는 본 발명에 따른 음성 기호 기반 사전 유사 탐색을 활용한 자동 통번역 시스템의 구성도.
본 발명의 이점 및 특징, 그리고 그것들을 달성하는 방법은 첨부되는 도면과 함께 상세하게 후술되어 있는 실시예들을 참조하면 명확해질 것이다. 그러나 본 발명은 이하에서 개시되는 실시예들에 한정되는 것이 아니라 서로 다른 다양한 형태로 구현될 것이며, 단지 본 실시예들은 본 발명의 개시가 완전하도록 하며, 본 발명이 속하는 기술분야에서 통상의 지식을 가진 자에게 발명의 범주를 완전하게 알려주기 위해 제공되는 것이며, 본 발명은 청구항의 범주에 의해 정의될 뿐이다. 한편, 본 명세서에서 사용된 용어는 실시예들을 설명하기 위한 것이며 본 발명을 제한하고자 하는 것은 아니다. 본 명세서에서, 단수형은 문구에서 특별히 언급하지 않는 한 복수형도 포함한다. 명세서에서 사용되는 "포함한다(comprises)" 및/또는 "포함하는(comprising)"은 언급된 구성소자, 단계, 동작 및/또는 소자는 하나 이상의 다른 구성소자, 단계, 동작 및/또는 소자의 존재 또는 추가를 배제하지 않는다.
이하, 본 발명의 바람직한 실시예에 대하여 첨부한 도면을 참조하여 상세히 설명하기로 한다.
도 1은 본 발명에 따른 음성기호 기반 사전 유사 탐색을 활용한 자동 통번역 방법이 구현되는 컴퓨터 시스템의 구성을 설명하기 위한 예시도이다.
한편, 본 발명의 실시예에 따른 음성기호 기반 사전 유사 탐색을 활용한 자동 통번역 방법은 컴퓨터 시스템에서 구현되거나, 또는 기록매체에 기록될 수 있다. 도 1에 도시된 바와 같이, 컴퓨터 시스템은 적어도 하나 이상의 프로세서(110)와, 메모리(120)와, 사용자 입력 장치(150)와, 데이터 통신 버스(130)와, 사용자 출력 장치(160)와, 저장소(140)를 포함할 수 있다. 전술한 각각의 구성 요소는 데이터 통신 버스(130)를 통해 데이터 통신을 한다.
컴퓨터 시스템은 네트워크(180)에 연결된 네트워크 인터페이스(170)를 더 포함할 수 있다. 상기 프로세서(110)는 중앙처리 장치(central processing unit (CPU))이거나, 혹은 메모리(130) 및/또는 저장소(140)에 저장된 명령어를 처리하는 반도체 장치일 수 있다.
상기 메모리(120) 및 상기 저장소(140)는 다양한 형태의 휘발성 혹은 비휘발성 저장매체를 포함할 수 있다. 예컨대, 상기 메모리(120)는 ROM(123) 및 RAM(126)을 포함할 수 있다.
따라서, 본 발명의 실시예에 따른 음성기호 기반 사전 유사 탐색을 활용한 자동 통번역 방법은 컴퓨터에서 실행 가능한 방법으로 구현될 수 있다. 본 발명의 실시예에 따른 음성기호 기반 사전 유사 탐색을 활용한 자동 통번역 방법이 컴퓨터 장치에서 수행될 때, 컴퓨터로 판독 가능한 명령어들이 본 발명에 따른 운영 방법을 수행할 수 있다.
한편, 상술한 본 발명에 따른 음성기호 기반 사전 유사 탐색을 활용한 자동 통번역 방법은 컴퓨터로 읽을 수 있는 기록매체에 컴퓨터가 읽을 수 있는 코드로서 구현되는 것이 가능하다. 컴퓨터가 읽을 수 있는 기록 매체로는 컴퓨터 시스템에 의하여 해독될 수 있는 데이터가 저장된 모든 종류의 기록 매체를 포함한다. 예를 들어, ROM(Read Only Memory), RAM(Random Access Memory), 자기 테이프, 자기 디스크, 플래시 메모리, 광 데이터 저장장치 등이 있을 수 있다. 또한, 컴퓨터로 판독 가능한 기록매체는 컴퓨터 통신망으로 연결된 컴퓨터 시스템에 분산되어, 분산방식으로 읽을 수 있는 코드로서 저장되고 실행될 수 있다.
도 2는 본 발명에 따른 음성 기호 기반 사전 유사 탐색을 활용한 자동 통번역 방법을 설명하기 위한 절차 흐름도이다.
본 발명에 따른 음성 기호 기반 사전 유사 탐색을 활용한 자동 통번역 방법은 통번역할 대상 문장이 입력되는 단계; 상기 입력된 문장에서 미등록어를 탐지하는 단계; 탐지된 미등록어를 음성 기호로 변환하는 단계; 변환된 음성 기호를 키값으로 하여 유사 음성 기호를 탐색하는 단계; 탐색된 유사 음성 기호를 대역어로 하여 자동 번역을 수행하는 단계; 및 번역 결과를 출력하는 단계를 포함한다.
음성 인식 시스템에 의한 결과로 반환되는 텍스트나 사람이 직접 키보드 등으로 작성된 텍스트가 문장으로 입력된다. 입력된 문장에 포함된 미등록어를 탐지한다. 미등록어가 외국어인 경우, 통상 자동 통번역 시스템에 포함된 사전에 포함되지 않는 경우, 적절한 대역어를 찾지 못하는 문제가 있다. 또한, 문장 전체에 대하여 자동 통번역을 변환 작업이 진행된 후, 외국어 여부를 탐색할 경우 잘못된 결과가 도출될 수 있고, 자동 통번역 시스템에 등록된 외국어를 인식하지 못하여 번역 오류가 발생할 수 있다. 본 발명에서는 자동 통번역을 위한 음성 변환 전에 입력된 문장에서 미등록어를 탐지하여 상술한 문제를 방지할 수 있다.
도 3은 본 발명에 따른 미등록어를 탐지하는 방법을 설명하기 위한 절차 흐름도이다.
예컨대, '우리가 다루고자 하는 건 바로 시퀀셜 데이터입니다.'라는 문장이 음성 인식 시스템에 입력되었을 때, '데이터'라는 명사의 경우 자료의 의미를 갖는 단어로 빈번하게 나타날 수 있으며, 이러한 고빈도 어휘의 경우 자동 통번역 시스템의 사전 정보에 포함될 수 있다. 즉, 모든 외국어가 미등록어가 되는 것은 아니며, 사전에 포함된 어휘를 먼저 구분하여 처리하고, 찾지 못한 어휘를 대상으로 미등록어를 탐지하게 된다. 상기 예문에서는 '시퀀셜'을 미등록어로 추출하는 것을 가정한다.
미등록어 탐지하는 방법은 자동 통번역 시스템에 따라, 규칙 기반 자동 번역(Rule Based Machine Translation; RBMT)과, 통계 기반 자동 번역(Statistical Machine Translation; SMT)인 경우에 따라 다를 수 있다.
미등록어를 탐지하는 방법은 문장이 입력되는 단계; 입력된 문장의 형태소를 분석하는 단계; 분석된 형태소를 바탕으로 단어를 분리하는 단계; 분리된 사전을 어휘 사전, 대역어 사전, N-gram 사전, Phrase 테이블로부터 유사 단어를 검색하는 단계; 및 검색된 단어 중에서 최적 단어를 선택하는 단계를 포함한다.
입력된 문장은 규칙 기반 자동 번역(RBMT)에서 사용되는 어휘 사전 및 대역어 사전(202)에 저장된 어휘 단위와 동일하게 형태소 분석(Morphological Analysis) 및 단어 분리(Word Tokenization)가 이루어진다.
형태소 분석 및 단어 분리가 이루어진 어휘 단위 별로 유사 단어를 검색하게 된다. 어휘 사전 및 대역어 사전으로부터 유사 단어를 검색한다.
통계 기반 자동번역을 사용하는 경우, 해당 자동 번역 엔진을 기계 학습 시키기 위해, 정련된 말뭉치(corpus)에서 추출된 일련의 어휘 묶음(n-gram)을 저장한 사전(N-gram 사전)이 필요하다. N-gram 사전은 단일 어휘(unigram)는 물론 지정된 개수의 연속된 어휘를 모두 가지고 있을 수 있다. 또한, 통계 기반 자동 번역 시스템을 구축하는 과정에서 산출되는 구 단위 묶음 정렬 정보 테이블(Phrase Table)를 사용할 수 있다.
본 발명은 규칙 기반 자동 번역 및 통계 시반 자동 번역 모두에 적용 가능하므로, 자동 번역 방식에 따라 입력된 문장에서 미등록어 후보 단어를 추출한 후, 어휘사전, 대역어 사전, N-gram 사전 및 Phrase 테이블로부터 유사 단어를 찾게 되면, 등록어로 간주하게 된다. 유사 단어를 찾지 못할 경우, 미등록어로 간주하여, 미등록어를 위한 대역어를 추출하는 처리가 필요하게 된다.
미등록어에 대한 대역어를 추출하기 위하여, 도 2에 도시된 바와 같이 미등록어를 음성 기호 변환하고, 변환된 음성 기호를 유사 음성 기호를 탐색한다.
상기 변환되는 음성 기호는 국제 음성 기호(International Phonetic Alphabet, IPA symbol)로 변환될 수 있다. 미등록어를 변환할 음차 표현 기호는 화자가 사용하고 있는 언어에 따라서 적절히 선택할 수 있으나, 국제 음성 기호를 이용한 '규칙 기반 IPA 생성 방법' 또는 '코퍼스 확률 기반 IPA 변환 방법'을 이용하여 미등록어를 IPA를 이용하여 음차 표현으로 변환할 수 있다. 다만, IPA를 이용하지 않고, 다른 음성 기호를 사용하여도 무관하고, 음성 표기 방법은 본 발명의 권리범위를 제한하는 것은 아니다.
상기 예문에서, '시퀀셜'이라는 어휘가 미등록어로 추출되면, '시퀀셜'을 음성 기호로 변환한다. 예컨대, 변환된 음성 기호가 /si kwon l/ 인 경우, 외국어 사전으로부터 상기 변환된 음성 기호와 유사한 음성 기호 후보를 검색한다. 외국어 사전은, 일반적인 영어 사전이나 다른 외국어 사전 내 포함된 음성 기호를 사용하여 검색한다. 검색 결과는 음성 기호가 아닌 해당 어휘로 출력한다.
검색 속도를 증가시키기 위해, 특정 기호열을 단순화 시켜 유사한 발음이 나오는 음성 기호끼리 묶는 방식으로 색인(index)을 생성할 수 있다.
예컨대, /si kwon l/에 대한 검색 결과로서 다음과 같은 후보를 검색할 수 있다.
후보 1) 키: skwnl - 검색 결과: sequential
후보 2) 키: sikwns - 검색 결과: sequence
유사 단어 후보의 키와, 변환된 음성 기호와의 편집 거리(Edit distance)를 이용하여 제시된 후보 중 그 편집 거리가 가장 가까운 것을 선택하여, 유사 단어를 결정할 수 있다. 편집 거리를 산출하기 위하여, Levenshtein distance를 이용할 수 있다.
예컨대, 상기 후보 1과의 편집 거리는 3, 상기 후보 2와의 편집 거리는 4라고 하면, 후보 1을 대역어로 한다. 즉, '시퀀셜'의 대역어로 sequential을 선택할 수 있다.
유사 단어 후보 중 대역어를 선택하면, 자동 번역을 수행하고, 번역 결과를 출력하게 된다. 다만, 번역 수행 방법론에 따라 선택된 후보를 반영한 번역 결과가 상이할 수 있다.
규칙 기반 자동 번역(RBMT)의 경우, 앞서 추출된 입력 어휘 '시퀀셜'과 그에 대응되는 대역 후보로 선정된 'sequential'을 대역어 사전에 직접 추가하여 단어 번역 단계에서 반영될 수 있다. 또한, 한국어-영어 자동번역이라면, 입력문 내 '시퀀셜'을 영어 'sequential'로 대치한 뒤 번역을 실시하는 경우, 자동 통번역 시스템은 'sequential'을 외국어로 보고 그대로 출력할 수 있다. 불필요한 Romanization을 수행하지 않고 올바른 대역어를 얻는 것이므로 더 효율적일 수 있다.
통계 기반 자동 번역(SMT)를 사용하는 경우, 변경하지 않은 원문을 그대로 번역하여 나온 번역 결과물에 대해 해당 어휘가 미등록어로 판별되면, 유사 음성 기호 탐색 단계에서 미등록어로 판별된 노드들을 검색된 결과로 대치하여 학습하는 방식의 후 처리(post-processing)를 통하여 최종 번역 결과물을 생성할 수 있다.
또한, 번역 간 생성되는 원어-대역어 정렬 정보(alignment)를 활용하여, 미등록어에 대하여 검색된 대역어를 최종 결과물에서 치환하는 방법을 사용할 수 있다.
대역어를 자동 통번역에 적용하는 상술한 내용은 본 발명의 권리범위를 제한하고자 하는 것은 아니다.
상기 예문 '우리가 다루고자 하는 것은 시퀀셜 데이터입니다'를 자동 번역할 경우, 기존 기술상으로는 'It is the Sikweonsyeol data that we are going to deal.'와 같을 수 있다. '시퀀셜'이 미등록어로서 대역어를 찾을 수 없는 경우, 음성 기호를 그대로 표시하기 때문이다. 그러나, 본 발명에 따라서 유사 음성 기호를 검색하여 대역어로서 'sequential'을 결정한 경우, 번역 결과로서 ' It is the sequential data that we are going to deal.'를 얻을 수 있다.
도 4는 본 발명에 따른 음성 기호 기반 사전 유사 탐색을 활용한 자동 통번역 시스템의 구성도를 나타낸다.
본 발명에 따른 음성기호 기반 사전 유사 탐색을 활용한 자동 통번역 시스템은 외부 음성 인식 시스템 및 텍스트 입력 시스템으로부터 음성 또는 문자의 형태로 문장을 입력받는 문장 입력부; 상기 입력된 문장을 형태소 분석 및 단어 분리하여, 유사 단어 검색하여 미등록어를 탐지하는 미등록어 탐지부; 상기 탐지된 미등록어를 음성 기호로 변환하는 음성 기호 변환부; 상기 변환된 음성 기호를 키값으로 하여 유사 음성 기호를 검색하여 검색된 유사 음성 기호의 어휘를 대역어로 선택하는 유사 음성 기호 검색부; 상기 선택된 대역어를 이용하여 상기 입력된 문장을 번역하는 번역 수행부; 및 상기 번역된 결과를 출력하는 출력부;를 포함하는 것을 특징으로 한다.
이상, 본 발명의 구성에 대하여 첨부 도면을 참조하여 상세히 설명하였으나, 이는 예시에 불과한 것으로서, 본 발명이 속하는 기술 분야에 통상의 지식을 가진 자라면 본 발명의 기술적 사상의 범위 내에서 다양한 변형과 변경이 가능함은 물론이다. 따라서 본 발명의 보호 범위는 전술한 실시예에 국한되어서는 아니 되며 이하의 특허청구범위의 기재에 의하여 정해져야 할 것이다.
100: 컴퓨터 시스템
110: 프로세서
120: 메모리
123: ROM
126: RAM
130: 데이터 통신 버스
140: 저장소
150: 사용자 입력 장치
160: 사용자 출력 장치
170: 네트워크 인터페이스
180: 네트워크
400: 자동 통번역 시스템
410: 입력부
420: 미등록어 탐지부
430: 음성 기호 변환부
440: 유사 음성 기호 검색부
450: 번역 수행부
460: 출력부
110: 프로세서
120: 메모리
123: ROM
126: RAM
130: 데이터 통신 버스
140: 저장소
150: 사용자 입력 장치
160: 사용자 출력 장치
170: 네트워크 인터페이스
180: 네트워크
400: 자동 통번역 시스템
410: 입력부
420: 미등록어 탐지부
430: 음성 기호 변환부
440: 유사 음성 기호 검색부
450: 번역 수행부
460: 출력부
Claims (1)
- 외부 음성 인식 시스템 및 텍스트 입력 시스템으로부터 음성 또는 문자의 형태로 문장을 입력받는 문장 입력부;
상기 입력된 문장을 형태소 분석 및 단어 분리하여, 유사 단어 검색하여 미등록어를 탐지하는 미등록어 탐지부;
상기 탐지된 미등록어를 음성 기호로 변환하는 음성 기호 변환부;
상기 변환된 음성 기호를 키값으로 하여 유사 음성 기호를 검색하여 검색된 유사 음성 기호의 어휘를 대역어로 선택하는 유사 음성 기호 검색부;
상기 선택된 대역어를 이용하여 상기 입력된 문장을 번역하는 번역 수행부; 및
상기 번역된 결과를 출력하는 출력부;
를 포함하는 음성기호 기반 사전 유사 탐색을 활용한 자동 통번역 시스템.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020160151914A KR20180054236A (ko) | 2016-11-15 | 2016-11-15 | 음성기호 기반 사전 유사 탐색을 활용한 자동 통번역 시스템 및 그 방법 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020160151914A KR20180054236A (ko) | 2016-11-15 | 2016-11-15 | 음성기호 기반 사전 유사 탐색을 활용한 자동 통번역 시스템 및 그 방법 |
Publications (1)
Publication Number | Publication Date |
---|---|
KR20180054236A true KR20180054236A (ko) | 2018-05-24 |
Family
ID=62296734
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020160151914A KR20180054236A (ko) | 2016-11-15 | 2016-11-15 | 음성기호 기반 사전 유사 탐색을 활용한 자동 통번역 시스템 및 그 방법 |
Country Status (1)
Country | Link |
---|---|
KR (1) | KR20180054236A (ko) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20220049693A (ko) * | 2020-10-15 | 2022-04-22 | 한동대학교 산학협력단 | 신경망 기반의 고유명사 기호화를 이용한 번역 방법 및 그 시스템 |
-
2016
- 2016-11-15 KR KR1020160151914A patent/KR20180054236A/ko unknown
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20220049693A (ko) * | 2020-10-15 | 2022-04-22 | 한동대학교 산학협력단 | 신경망 기반의 고유명사 기호화를 이용한 번역 방법 및 그 시스템 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US8954333B2 (en) | Apparatus, method, and computer program product for processing input speech | |
US9582489B2 (en) | Orthographic error correction using phonetic transcription | |
EP0262938B1 (en) | Language translation system | |
US6282507B1 (en) | Method and apparatus for interactive source language expression recognition and alternative hypothesis presentation and selection | |
US6442524B1 (en) | Analyzing inflectional morphology in a spoken language translation system | |
US6243669B1 (en) | Method and apparatus for providing syntactic analysis and data structure for translation knowledge in example-based language translation | |
US6278968B1 (en) | Method and apparatus for adaptive speech recognition hypothesis construction and selection in a spoken language translation system | |
US5384701A (en) | Language translation system | |
US6266642B1 (en) | Method and portable apparatus for performing spoken language translation | |
US8566076B2 (en) | System and method for applying bridging models for robust and efficient speech to speech translation | |
US20060224378A1 (en) | Communication support apparatus and computer program product for supporting communication by performing translation between languages | |
Huang et al. | Automatic extraction of named entity translingual equivalence based on multi-feature cost minimization | |
WO2003056450A1 (fr) | Procede et appareil d'analyse syntaxique | |
WO2000045377A9 (en) | A method and apparatus for performing spoken language translation | |
JP2013117978A (ja) | タイピング効率向上のためのタイピング候補の生成方法 | |
Scherrer et al. | Modernising historical Slovene words | |
US20150178274A1 (en) | Speech translation apparatus and speech translation method | |
KR20230009564A (ko) | 앙상블 스코어를 이용한 학습 데이터 교정 방법 및 그 장치 | |
KR20180054236A (ko) | 음성기호 기반 사전 유사 탐색을 활용한 자동 통번역 시스템 및 그 방법 | |
JP3441400B2 (ja) | 言語変換規則作成装置、及びプログラム記録媒体 | |
JP2009157888A (ja) | 音訳モデル作成装置、音訳装置、及びそれらのためのコンピュータプログラム | |
JP3825645B2 (ja) | 表現変換方法及び表現変換装置 | |
Núñez et al. | Phonetic normalization for machine translation of user generated content | |
JP3737817B2 (ja) | 表現変換方法及び表現変換装置 | |
KR20040018008A (ko) | 품사 태깅 장치 및 태깅 방법 |