KR20150116675A - 다양한 의미 범주에 기반한 번역 결과 제공 방법 및 시스템 - Google Patents

다양한 의미 범주에 기반한 번역 결과 제공 방법 및 시스템 Download PDF

Info

Publication number
KR20150116675A
KR20150116675A KR1020140041887A KR20140041887A KR20150116675A KR 20150116675 A KR20150116675 A KR 20150116675A KR 1020140041887 A KR1020140041887 A KR 1020140041887A KR 20140041887 A KR20140041887 A KR 20140041887A KR 20150116675 A KR20150116675 A KR 20150116675A
Authority
KR
South Korea
Prior art keywords
translation
sentence
sentences
providing
translated
Prior art date
Application number
KR1020140041887A
Other languages
English (en)
Other versions
KR101864361B1 (ko
Inventor
신중휘
박진이
김종환
권경희
김준석
Original Assignee
네이버 주식회사
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 네이버 주식회사 filed Critical 네이버 주식회사
Priority to KR1020140041887A priority Critical patent/KR101864361B1/ko
Priority to CN201510028718.6A priority patent/CN104978310B/zh
Priority to JP2015013224A priority patent/JP6333745B2/ja
Priority to TW104109873A priority patent/TWI629601B/zh
Priority to US14/680,184 priority patent/US9760569B2/en
Publication of KR20150116675A publication Critical patent/KR20150116675A/ko
Priority to US15/673,694 priority patent/US9971769B2/en
Application granted granted Critical
Publication of KR101864361B1 publication Critical patent/KR101864361B1/ko

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/40Processing or translation of natural language
    • G06F40/58Use of machine translation, e.g. for multi-lingual retrieval, for server-side translation for client devices or for real-time translation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/30Semantic analysis

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Machine Translation (AREA)

Abstract

다양한 의미 범주에 기반한 번역 결과 제공 방법 및 시스템이 개시된다. 컴퓨터로 구현되는 번역 결과 제공 방법에 있어서, 원시 언어(source language)로 작성된 원문을 목적 언어(target language)로 번역한 번역문을 생성하는 단계; 및 상기 번역문을 번역 결과로 제공하되, 상기 번역문을 문장의 의미 범주(semantic category)로 분류하여 제공하는 단계를 포함하는 번역 결과 제공 방법을 제공한다.

Description

다양한 의미 범주에 기반한 번역 결과 제공 방법 및 시스템{METHOD AND SYSTEM FOR PROVIDING TRANSLATED RESULT}
본 발명의 실시예들은 컴퓨터를 사용하여 원문에 대한 번역문을 생성하는 기계 번역 기술에 관한 것이다.
최근 국가간의 교류가 증대하고 정보통신망이 확대됨에 따라서 제1 언어 즉, 원시 언어(source language)의 문장을 제2 언어 즉, 목적 언어(target language)의 문장으로 번역하는 기계 번역 장치들의 필요성이 점점 증가하고 있다. 이러한 기계 번역 장치들은 입력 원문에 대하여 형태소 해석, 구문 해석, 변환 및 생성의 일반적인 단계를 거쳐서 다른 언어의 원문으로 번역하는 것을 목적으로 하고 있다.
종래의 기계 번역 방식으로는 문서의 분석 정도에 따라 직접 방식(direct method), 변환 방식(transfer method), 그리고 피봇 방식(pivot method) 등이 있다. 여기서, 직접 방식은 원시언어와 목적언어 사이의 직접적인 대응으로 번역이 이루어지고, 변환 방식은 원시언어와 목적언어 각각에 대해 2가지 형태의 중간 표현을 정의하고 분석, 변환, 생성 단계를 통해 번역이 이루어지고, 피봇 방식은 원시언어와 목적언어에 대해 하나의 중립 표현을 정의하여 크게 분석 단계와 생성 단계의 2단계를 거쳐 번역이 이루어진다.
한편, 90년대 들어서 발표된 기계 번역 방식들 중에는 규칙기반 기계번역, 통계기반 기계번역, 규칙기반과 통계기반 기계번역이 결합된 하이브리드 기계번역 등이 있는데, 이들은 미리 번역된 과정으로부터 얻은 지식이나 번역 예제들, 혹은 그 통계를 이용하여 번역을 행한다.
통계적 방법에 기반한 기계 번역 기술의 예로서, 한국공개특허 제10-2010-0037813호(공개일 2010년 04월 12일)에는 이중언어 코퍼스(bilingual parallel corpus)에 대한 분석에 기반한 통계적 기계 번역에 언어적인 정보를 반영하는 기계 번역 장치 및 기계 번역 방법이 개시되어 있다.
도 1은 확률적 번역 후보 예제를 도시한 것이다. 기존의 기계 번역 장치는 도 1과 같이 원문에 대한 번역 후보의 단어/구/규칙(word/phrase/rule)을 기반으로 스코어(score)를 측정하고 해당 후보를 결합하여 문장의 총 스코어를 정렬하는 방법으로 번역문을 생성하고 있다.
도 2는 독일어 원문에 대한 영어 번역의 올바른 경로를 찾는 예제를 도시한 것으로, 도시된 예제와 같은 방법으로 해당 후보들을 이용하여 확률이 높은 순으로 정렬하여 보여줄 수 있다.
이와 같이, 기존 기계 번역 기술은 원문에 대한 번역이 올바른지 여부만을 고려하는 방법에 불과하다.
원문에 대한 번역문에 대역이 되는 후보 문장을 완전한 형태의 문장으로 생성하는 번역 결과 제공 방법 및 시스템을 제공한다.
번역문의 후보 문장에 대한 생성 과정에서 의미적 분류에 맞는 후보 문장을 생성하는 번역 결과 제공 방법 및 시스템을 제공한다.
사용자의 목적이나 성향에 맞는 의미 범주의 번역문을 생성하는 번역 결과 제공 방법 및 시스템을 제공한다.
컴퓨터로 구현되는 번역 결과 제공 방법에 있어서, 원시 언어(source language)로 작성된 원문을 목적 언어(target language)로 번역한 번역문을 생성하는 단계; 및 상기 번역문을 번역 결과로 제공하되, 상기 번역문을 문장의 의미 범주(semantic category)로 분류하여 제공하는 단계를 포함하는 번역 결과 제공 방법을 제공한다.
일 측면에 따르면, 상기 의미 범주는 문장을 분류하기 위한 기준으로 문체, 문형, 시제 중 적어도 하나를 포함하는 것을 특징으로 한다.
다른 측면에 따르면, 상기 생성하는 단계는, 상기 원문에 번역이 되는 후보 문장을 기계번역 모델로 측정된 스코어 순으로 정렬하여 스코어가 높은 상위 복수 개의 문장을 추출하고, 상기 제공하는 단계는, 상기 복수의 문장을 번역 결과로 노출하되 상기 복수의 문장 중 스코어가 가장 높은 문장과 나머지 문장을 구분하여 노출하는 것을 특징으로 한다.
또 다른 측면에 따르면, 상기 제공하는 단계는, 상기 원문에 번역이 되는 후보 문장이 복수 개인 경우 상기 후보 문장을 의미 범주 별로 구분하여 노출하는 것을 특징으로 한다.
또 다른 측면에 따르면, 사용자로부터 번역 결과에 대한 의미 범주를 선택 받는 단계를 더 포함하고, 상기 제공하는 단계는, 상기 원문에 번역이 되는 후보 문장 중 상기 사용자에 의해 선택된 의미 범주로 분류된 문장을 노출하는 것을 특징으로 한다.
또 다른 측면에 따르면, 상기 원문을 작성한 사용자의 문장 성향을 분석하는 단계를 더 포함하고, 상기 제공하는 단계는, 상기 원문에 번역이 되는 후보 문장 중 상기 사용자의 문장 성향과 대응되는 의미 범주로 분류된 문장을 노출하는 것을 특징으로 한다.
또 다른 측면에 따르면, 상기 원문의 의미 범주를 분류하는 단계를 더 포함하고, 상기 제공하는 단계는, 상기 원문에 번역이 되는 후보 문장 중 상기 원문과 동일하거나 유사한 의미 범주로 분류된 문장을 노출하는 것을 특징으로 한다.
적어도 하나의 프로그램이 로딩된 메모리; 및 적어도 하나의 프로세서를 포함하고, 상기 적어도 하나의 프로세서는, 상기 프로그램의 제어에 따라, 원시 언어(source language)로 작성된 원문을 목적 언어(target language)로 번역한 번역문을 생성하는 과정; 및 상기 번역문을 번역 결과로 제공하되, 상기 번역문을 문장의 의미 범주(semantic category)로 분류하여 제공하는 과정을 처리하는 번역 결과 제공 시스템을 제공한다.
컴퓨터 시스템이 번역 결과를 제공하도록 제어하는 명령(instruction)을 포함하는 컴퓨터 판독가능 매체로서, 상기 명령은, 원시 언어(source language)로 작성된 원문을 목적 언어(target language)로 번역한 번역문을 생성하는 단계; 및 상기 번역문을 번역 결과로 제공하되, 상기 번역문을 문장의 의미 범주(semantic category)로 분류하여 제공하는 단계를 포함하는 방법에 의하여 상기 컴퓨터 시스템을 제어하는, 컴퓨터 판독가능 저장 매체를 제공한다.
사용자 단말에 설치되는 어플리케이션의 파일을 배포하는 파일 배포 시스템에 있어서, 상기 사용자 단말의 요청에 따라 상기 파일을 전송하는 파일 전송부를 포함하고, 상기 어플리케이션은, 원시 언어(source language)로 작성된 원문을 기계번역 서버로 전송하도록 상기 사용자 단말을 제어하는 모듈; 및 상기 기계번역 서버에서 제공하는, 상기 원문을 목적 언어(target language)로 번역한 번역문을 노출하도록 상기 사용자 단말을 제어하는 모듈을 포함하고, 상기 기계번역 서버에서는 상기 번역문을 문장의 의미 범주(semantic category)로 분류하여 상기 사용자 단말로 제공하는 것을 특징으로 하는 파일 배포 시스템을 제공한다.
원문에 대한 번역문에 대역이 되는 후보 문장을 완전한 형태의 문장으로 제공할 수 있는 번역 결과 제공 방법 및 시스템을 제공한다.
번역문의 후보 문장에 대한 생성 과정에서 의미적 분류에 맞는 후보 문장을 생성할 수 있는 번역 결과 제공 방법 및 시스템을 제공한다.
사용자의 목적이나 성향에 맞는 의미 범주의 번역문을 제공할 수 있는 번역 결과 제공 방법 및 시스템을 제공한다.
도 1과 도 2는 기존 기계번역 방법을 설명하기 위한 예시 도면들이다.
도 3은 본 발명의 일 실시예에 있어서, 사용자 단말과 기계 번역 시스템 간의 관계를 개괄적으로 나타낸 도면이다.
도 4는 본 발명의 일 실시예에 있어서, 기계 번역 시스템의 내부 구성을 도시한 블럭도이다.
도 5는 통계기반 기계번역을 위한 번역 확률 테이블 구축 과정을 도시한 순서도이다.
도 6은 통계기반 기계번역을 위한 언어 모델 구축 과정을 도시한 순서도이다.
도 7과 도 8은 번역 모델과 언어 모델을 이용한 번역문 선택 과정을 설명하기 위한 도면이다.
도 9 내지 도 12는 본 발명의 일 실시예에 있어서, 의미적 범주에 따라 분류된 번역 후보 문장을 노출하는 서비스 화면을 예시적으로 도시한 것이다.
이하, 본 발명의 실시예를 첨부된 도면을 참조하여 상세하게 설명한다.
본 실시예들은 컴퓨터를 사용하여 원문에 대한 번역문을 자동으로 생성하는 기계 번역 기술에 관한 것이다.
도 3은 본 발명의 일 실시예에 있어서, 사용자 단말과 기계 번역 시스템 간의 관계를 개괄적으로 나타낸 도면이다. 도 3은 사용자 단말(301)과 기계 번역 시스템(300)을 나타내고 있다. 도 3에서 화살표는 사용자 단말(301)과 기계 번역 시스템(300) 간에 유/무선 네트워크를 이용하여 데이터가 송수신될 수 있음을 의미한다.
기계 번역 시스템(300)은 사용자로부터 입력된 원시언어(source language)의 문장(이하, '원문'이라 칭함)을 목적언어(target language)의 문장(이하, '번역문'이라 칭함)으로 번역하여 번역 결과를 제공하는 번역 엔진 역할을 한다. 특히, 기계 번역 시스템(300)은 원문에 대한 번역문의 후보 문장을 스코어 순으로 정렬하여 적어도 하나 이상(N개)을 추출한 후 추출된 후보 문장을 의미 기반으로 분류하여 번역 결과를 제공할 수 있다.
사용자 단말(301)은 PC, 스마트폰(smart phone), 태블릿(tablet), 노트북 컴퓨터(laptop computer), 디지털 방송용 단말기(DMB), PMP(Portable Multimedia Player), 내비게이션(navigation) 단말 등 기계 번역 시스템(300)과 관련된 웹/모바일 사이트의 접속 또는 서비스 전용 어플리케이션의 설치 및 실행이 가능한 모든 단말 장치를 의미할 수 있다. 이때, 사용자 단말(301)은 웹/모바일 사이트 또는 전용 어플리케이션의 제어 하에 서비스 화면 구성, 데이터 입력, 데이터 송수신, 데이터 저장 등 서비스 전반의 동작을 수행할 수 있다. 또한, 사용자 단말(301)은 기계 번역 시스템(300)으로 원문을 입력하기 위한 입력 수단과 기계 번역 시스템(300)에서 제공하는 번역 결과를 출력하기 위한 출력 수단을 포함할 수 있으며, 이때 입력 수단으로는 키보드, 마우스, 스캐너, 마이크 등이 이용될 수 있고 출력 수단으로는 모니터, 프린터, 스피커 등이 이용될 수 있다.
도 4는 본 발명의 일 실시예에 있어서, 기계 번역 시스템의 내부 구성을 도시한 블럭도이다. 도 4에 도시한 바와 같이, 기계 번역 시스템은 번역문 생성부(410)와 결과 제공부(420)로 이루어진 프로세서(400), 메모리(401), 네트워크 인터페이스(402)를 포함하여 구성될 수 있다. 또한, 기계 번역 시스템은 원문으로부터 번역문을 자동으로 생성하기 위한 다양한 번역 모델과 관련된 데이터베이스 시스템이 포함될 수 있다. 일 예로, 기계 번역을 위한 번역 모델로서 규칙기반 기계번역 모델(403), 통계기반 기계번역 모델(404), 규칙기반 방식과 통계기반 방식이 혼합된 하이브리드 기계번역 모델(405) 등이 이용될 수 있다.
메모리(401)는 원문에 대한 번역문의 후보 문장을 생성하고 후보 문장의 의미적 범주를 분류하는 기계 번역 루틴에 해당되는 명령어를 포함하는 프로그램이 저장될 수 있다. 이하에서 설명하게 되는 기계 번역 시스템에서 수행되는 과정들은 메모리(401)에 저장된 프로그램에 의해 실행될 수 있다. 예를 들어, 메모리(401)는 하드디스크, SSD, SD 카드 및 기타 저장매체일 수 있다.
네트워크 인터페이스(402)는 의미 범주 기반의 기계 번역 서비스를 이용하는 사용자 단말들과의 통신을 위해 기계 번역 시스템을 네트워크에 결합할 수 있다.
프로세서(400)는 메모리(401)에 저장된 프로그램의 명령어에 따라 처리하는 장치로서, CPU 등의 마이크로프로세서가 포함될 수 있다. 프로세서(400)의 세부 구성은 다음과 같다.
번역문 생성부(410)는 원문에 대하여 사전에 정의된 기계번역 모델(규칙기반 기계번역 모델, 통계기반 기계번역 모델, 하이브리드 기계번역 모델 등)을 적용하여 번역문을 생성할 수 있다. 이때, 번역문 생성부(410)는 원문에 대한 번역문을 생성하는 과정에서 번역문의 후보 문장을 다양한 의미 범주의 문장으로 생성할 수 있다. 다시 말해, 번역문 생성부(410)는 원문에 번역이 되는 번역문의 후보 문장을 스코어 순으로 정렬하여 N개의 문장을 추출하고 추출된 후보 문장이 갖는 의미적 범주 별로 분류할 수 있다. 이때, 의미 범주는 문체, 문형, 시제(時制), 언어 규범 등 문장의 성격을 분류하기 위한 모든 기준을 의미할 수 있다. 예를 들어, 의미 범주는 문체에 따라 문어체, 구어체 등으로 구분되고, 문형에 따라 평서문, 청유문, 명령문, 높임말, 낮춤말 등으로 구분되고, 시제에 따라 과거형, 현재형, 미래형 등으로 구분되고, 언어 규범에 따라 표준어, 방언 등으로 구분될 수 있다.
결과 제공부(420)는 원문에 대한 번역문을 제공하되 의미가 비슷한 여러 후보 문장들을 번역 결과에 포함시켜 제공할 수 있다. 이때, 후보 문장이라 함은 단순히 비슷한 의미의 단어 후보를 제공하는 것이 아니라, 완전한 문장 형태를 갖는 것으로 의미가 비슷한 단어로 교체된 완전 문장은 물론 단어 내지 구조 자체가 전혀 상이하게 구성된 완전 문장까지 포함될 수 있다. 번역 결과를 제공하는 일 예로, 결과 제공부(420)는 번역문의 후보 문장을 의미 범주 별로 구분하여 노출할 수 있다. 다른 예로, 결과 제공부(420)는 번역문의 후보 문장 중 사용자의 목적, 즉 사용자가 선택한 의미 범주로 분류된 후보 문장을 선별하여 노출할 수 있다. 또 다른 예로, 결과 제공부(420)는 번역문의 후보 문장 중 사용자 성향(personality)에 맞는 의미 범주로 분류된 후보 문장을 선별하여 노출할 수 있다. 이때, 사용자 성향은 인터넷 상에 산재된 사용자 정보로부터 분석 가능한 것으로, 예컨대 사용자가 자주 이용하는 서비스 종류나 자주 이용하는 문체 등을 분석하여 사용자가 사용할 것으로 예상되는 문장의 의미 범주를 유추할 수 있다. 또 다른 예로, 결과 제공부(420)는 사용자로부터 입력된 원문의 의미 범주를 자동으로 분류하여 원문에 대한 번역 후보 문장 중 원문의 의미 범주와 동일하거나 유사한 문장을 선별하여 노출할 수 있다.
상기한 구성에 따르면, 본 발명의 기계 번역 시스템은 번역 후보 문장에 대한 생성 과정에서 아래 표 1의 예제와 같이 의미적 분류에 맞는 문장을 생성 또는 후처리 하여 제공할 수 있다.
원문 I just looking around.
번역문 (1) 문어체/높임/현재/정중/기사:
그냥 둘러보고 있습니다.
(2) 문어체/낮춤/과거/소설:
그냥 둘러보았다.
(3) 구어체/높임/의지/미래/대화 번역문:
그저 구경 좀 하겠습니다.
(4) 구어체/낮춤/현재/대화:
그냥 둘러보고 있어.
(5) 구어체/높임/현재/친밀/대화:
그냥 둘러보는 중이에요.
(6) 구어체/축약(SNS체)/낮춤/의지/미래:
걍 볼께
따라서, 기계 번역 시스템은 기계번역의 후보 문장을 생성하는 과정에서 후보 문장을 의미 범주에 따라 분류할 수 있으며, 이를 통해 사용자의 목적이나 성향에 맞는 번역문의 제공이 가능하다. 예컨대, 뉴스기사 원문에 대해 기사 형태의 문어체 문장을 생성하거나, SNS(메신저나 게시물 등) 상의 대화에 적합한 구어체 문장을 생성하는 것 등 다양한 의미 범주의 번역문 생성이 가능하다.
기계번역 구현에 따른 의미 범주화 방법을 구체적으로 설명하면 다음과 같다.
규칙기반 기계번역 모델
일반적인 규칙기반 기계번역 방식은 원시 언어와 목적 언어의 언어 정보를 이용하여 번역 규칙을 생성할 수 있으며, 이러한 번역 규칙에 맞게 원문에 대한 번역문을 생성할 수 있다.
원문(입력문) I drunk a cup of water.
번역문 나는 물 한 잔을 마셨다.
표 2의 예제에 대한 규칙기반 번역문 생성 과정은 다음과 같다.
1. 일반화: [주어] [동사과거] [목적어1] [목적어2].
2. 순서변경: [주어] [목적어2] [목적어1] [동사과거]
3. 언어특성 적용: [주어](은/는) [목적어2](을/를) [목적어1] [동사과거]
4. 번역 규칙 적용: [나]는 [물] [한 잔]을 [마셨다].
이에, 기계 번역 시스템은 다양한 의미 범주 별로 규칙을 생성한 후 의미 범주에 맞는 번역 문장을 생성할 수 있다. 다시 말해, 일반적인 규칙기반 기계번역 방식의 번역 규칙에 의미 범주에 따른 번역 규칙을 추가할 수 있다.
표 2의 번역문에 대하여 의미 범주에 따른 번역 규칙을 어미 변화에 적용하거나 문장 전체에 적용할 수 있으며 그 결과 예시들은 다음과 같다.
<예제>
미래형 규칙: 나는 물 한 잔을 마실 것이다.
구어체 규칙: 나는 물 한 잔을 마셔요.
대화체 규칙: 나 물 마셔
생략(축약) 규칙: 물 마셔
이와 같이 의미 범주에 따른 번역 규칙을 적용하여 다수의 후보 문장을 생성한 후 생성된 후보 문장을 적절한 의미 범주로 분류할 수 있다.
<예제>
나는 물 한 잔을 마실 것이다. → 미래형으로 분류
나는 물 한 잔을 마셔요. → 구어체로 분류
나 물 마셔 → 대화체로 분류
물 마셔 → 축약어로 분류
후보 문장은 통계적 방법 또는 규칙적 방법으로 분류가 가능하다.
먼저, 문장 분류의 통계적 방법은 문장들이 통계적으로 어떤 의미를 갖는지 추정하여 분류하는 방식이다. 예컨대, '나는 밥을 먹었다'는 확률적으로 문어체가 가깝고, '나 밥 먹었어'는 확률적으로 구어체에 가까운 것으로 추정될 수 있다.
다음, 분장 분류의 규칙적 방법은 문장의 구성요소를 의미적으로 분석한 후 해당 규칙을 적용하여 문장의 의미 분류를 부여하는 방식이다. 예컨대, "~요"로 끝나면 구어체로 분류하고, "~다"로 끝나면 문어체로 분류하는 등의 간단한 규칙부터 의미적 분석에 따르는 복잡도 있는 다양한 규칙까지 얼마든지 확대 가능하다.
통계기반 기계번역 모델
일반적인 통계기반 기계번역 방식은 번역 모델(translation model) 구축 과정; 언어 모델(language model) 구축 과정; 및 번역 모델과 언어 모델을 이용한 번역문 선택 과정으로 이루어질 수 있다.
먼저, 기계 번역 시스템은 서로 다른 두 언어의 번역쌍 데이터를 이용하여 번역 확률 테이블을 구축할 수 있다.
도 5는 통계기반 기계번역을 위한 번역 확률 테이블 구축 과정을 도시한 순서도이다. 일 예로, 기계 번역 시스템은 도 5에 도시한 바와 같이 두 언어의 대용량 번역쌍 데이터(501)로부터 단어 간 번역 확률을 추정한 후(502) 추정된 단어 확률로 구(phrase) 구간을 결정할 수 있다(503). 그리고, 기계 번역 시스템은 결정된 구 구간에 대하여 구 후보 데이터(504)에서 구를 추출하여(505) 번역 확률 테이블을 포함하는 번역 모델(506)을 구축할 수 있다.
그리고, 기계 번역 시스템은 각 언어 별로 해당 언어의 대용량 데이터를 이용하여 언어 모델을 구축하여 문장의 자연스러움에 대한 확률 리스트로 구축할 수 있다.
도 6은 통계기반 기계번역을 위한 언어 모델 구축 과정을 도시한 순서도이다. 일 예로, 기계 번역 시스템은 도 6에 도시한 바와 같이 특정 언어로 이루어진 문장의 대용량 데이터(601)로부터 각 단어열에서 해당 단어열의 확률을 추정하여(602) 저장함으로써 문장의 자연스러움에 대한 확률 리스트를 나타내는 언어 모델(603)을 구축할 수 있다.
이후, 기계 번역 시스템은 이중 언어의 번역 모델과 단일언어의 언어 모델을 이용하여 번역문을 선택할 수 있다.
도 7은 번역 모델과 언어 모델을 이용한 번역문 선택 과정을 설명하기 위한 도면이다. 일 예로, 기계 번역 시스템은 도 7에 도시한 바와 같이 디코더(decoder)를 통해 이중언어 코퍼스(bilingual corpus)로부터 구축된 번역 모델과 단일언어 코퍼스(monolingual corpus)로부터 구축된 언어 모델을 이용하여 원문에 대한 번역문의 여러 후보 중에서 최적 후보를 선택할 수 있다. 도 8은 독일어 원문에 대한 영어 번역문을 선택하는 과정을 도시한 것으로, 도 8에서 음영 처리된 열의 결합 문장이 번역 모델에서의 구(phrase) 확률과 언어 모델에서의 단어열 확률이 동시에 높은 문장열을 의미한다.
본 발명에서 제안한 후보 문장 생성 기술에 상기한 통계기반 기계번역 방식을 적용할 수 있다.
일 예로, 기계 번역 시스템은 통계기반 기계번역의 번역문 선택 방식을 적용하여 원문에 번역이 되는 번역문의 후보 문장을 스코어 순으로 정렬한 후 그 중 스코어가 높은 순으로 N개의 후보 문장을 추출할 수 있다. 그리고, 기계 번역 시스템은 추출된 N개의 후보 문장을 적절한 의미 범주로 분류할 수 있다. 이때, 후보 문장의 의미 범주는 통계적 방법 또는 규칙적 방법으로 분류가 가능하다. 이는 앞서 설명한 규칙기반 기계번역 방식과 동일하다.
이에, 기계 번역 시스템은 다양한 의미 범주에 대하여 각 의미 범주에 맞는 언어 모델을 추가로 구축하여 이를 기계번역에 적용함으로써 원문에 대한 번역문이 확률적으로 의미 범주에 맞게 번역되도록 유도할 수 있다. 의미 범주에 대해 구축된 언어 모델은 대용량의 문장이 적힌 말뭉치를 통해 확률적으로 자연스러운 문장을 생성하도록 하는 역할을 하며, 이때 언어 모델을 특정 의미 범주에 맞게 선택적으로 구축하여 의미 범주에 대한 확률을 추정할 수 있다. 예를 들어, 트위터의 대용량 말뭉치를 구축하여 확률 테이블을 만들면 트위터 스타일의 문장이 선택될 확률이 높아지는 것이다.
하이브리드 기계번역 모델
일반적인 하이브리드 기계번역 방식은 앞서 설명한 규칙기반 기계번역 방식과 통계기반 기계번역 방식을 적절히 적용하는 방식이다. 하이브리드 기계번역 방식에서도 마찬가지로 원문에 대해 여러 번역 후보 문장을 생성한 후 번역 후보 문장을 적절한 의미 범주로 분류할 수 있다.
기계번역 방식에서 규칙기반과 통계기반의 하이브리드가 가능하기 때문에, 번역 후보 문장을 의미 분류로 선택하는 방식 또한 규칙기반과 통계기반의 하이브리드가 가능하다.
요컨대, 모든 방법론(규칙기반, 통계기반, 하이브리드)의 기계 번역 시스템은 원문에 대한 번역문을 생성하는 과정에서 다양한 의미 범주에 따른 여러 번역 후보 문장을 생성할 수 있다.
본 발명에 따른 기계 번역 시스템은 원문에 대한 번역문을 제공하되 의미가 같거나 비슷한 여러 후보 문장들을 번역 결과에 포함시켜 제공할 수 있다. 일 예로, 기계 번역 시스템은 원문에 번역이 되는 번역문의 후보 문장을 스코어 순으로 정렬하여 N개의 문장을 추출하고 그 중 스코어가 가장 높은 최적 문장과 나머지 후보 문장들을 구분하여 번역 결과를 노출할 수 있다. 이때, 기계 번역 시스템은 번역 결과로서 최적 문장 이외에도 다른 후보 문장들을 완전한 문장 형태로 함께 포함시켜 제공할 수 있다.
도 9는 한국어를 영어로 번역하는 번역 결과 화면(900)을 예시적으로 도시한 것이다. 기계 번역 시스템은 한국어로 작성된 원문 '괜찮습니다' (910)가 입력되면 번역 결과로서 영어로 번역된 번역문(920)(930)을 노출할 수 있으며, 이때 원문 '괜찮습니다' (910)에 대한 번역 결과로, 스코어가 가장 높은 최적 문장 "That's all right." (920)와, "That's all right."와 의미가 같거나 비슷한 후보 문장들, 즉 "No problem.", "Never mind.", "It doesn't matter." 등(930)을 구분하여 노출할 수 있다.
도 10은 영어를 한국어로 번역하는 번역 결과 화면(1000)을 예시적으로 도시한 것이다. 기계 번역 시스템은 영어로 작성된 원문 'I'm just looking around.' (1010)가 입력되면 검색 결과로서 한국어로 번역된 번역문(1020)(1030)을 노출할 수 있으며, 이때 원문 'I'm just looking around.' (1010)에 대한 번역 결과로, 스코어가 가장 높은 최적 문장 "둘러보는 중이오." (1020)와, "둘러보는 중이오."와 의미가 같거나 비슷한 후보 문장들, 즉 "그저 구경 좀 하겠습니다.", "그냥 둘러보는 중이에요.", "그냥 둘러보고 있어요." 등(1030)을 구분하여 노출할 수 있다.
특히, 본 발명에 따른 기계 번역 시스템은 번역 결과에 포함되는 문장들을 의미 범주 별로 구분하여 노출할 수 있다. 이때, 의미 범주는 문체(문어체, 구어체 등), 문형(평서문, 청유문, 명령문, 높임말, 낮춤말 등), 시제(과거형, 현재형, 미래형 등), 언어 규범(표준어, 방언 등) 등 문장의 성격을 분류하는 기준을 의미할 수 있다. 일 예로, 도 11에 도시한 바와 같이 번역 결과에 포함된 문장(1120)(1130)과 인접하여 각 문장이 해당되는 의미 범주(1140)를 노출해줄 수 있다.
다른 예로, 본 발명에 따른 기계 번역 시스템은 사용자에 의해 선택된 의미 범주에 맞는 후보 문장을 번역 결과로 노출할 수 있다. 이때, 기계 번역 시스템은 여러 번역 후보 문장 중에서 사용자가 선택한 의미 범주에 해당되는 문장만 노출하거나, 여러 번역 후보 문장들을 노출하되 사용자가 선택한 의미 범주의 후보 문장을 다른 후보 문장과 구분하여 노출할 수 있다. 예를 들어, 도 12에 도시한 바와 같이 번역 결과 화면(1200)의 소정 위치에 사용자가 제공받고자 하는 번역문의 의미 범주를 지정할 수 있는 메뉴 환경(1250)이 제공될 수 있다. 이에, 기계 검색 시스템은 메뉴 환경(1250)을 통해 사용자로부터 의미 범주를 선택 받은 후 해당 의미 범주로 분류된 후보 문장을 선별하여 노출할 수 있다. 상기한 방식 이외에도 원문이 입력되면 의미 범주 선택을 요청하는 팝업이 노출되거나, 사전 설정이 가능하도록 번역기의 환경 설정 등을 통해 의미 범주 선택 경로가 제공될 수 있다.
더 나아가, 본 발명에 따른 기계 번역 시스템은 사용자가 특정 의미 범주를 일일이 선택하지 않더라도 사용자 성향으로부터 사용자가 제공받고자 하는 번역문의 의미 범주를 예측하여 자동 설정할 수 있다. 이때, 사용자 성향은 인터넷 상의 사용자 정보로부터 분석 가능한 것으로, 예컨대 사용자가 자주 이용하는 서비스(예컨대, 뉴스기사, 카페, 블로그, 메신저 등)나 자주 이용하는 문체 등을 분석하여 사용자 성향에 맞는 문장의 의미 범주를 설정할 수 있다. 다시 말해, 사용자가 선호하는 문장 성향을 분석하여 번역 결과 노출 시 사용자의 문장 성향을 자동 반영할 수 있다.
또한, 본 발명에 따른 기계 번역 시스템은 사용자로부터 원문이 입력되면 원문의 문체나 문형 등 의미 범주를 자동으로 분류할 수 있고, 이에 원문에 대해 생성된 번역 후보 문장 중 원문과 의미 범주가 동일하거나 가까운 문장을 구분하여 노출할 수 있다. 예컨대, 원문의 의미 범주가 구어체이고 높임말로 분류되면 번역 후보 문장 중 문체와 문형이 원문과 동일하게 구어체의 높임말로 분류되는 문장을 번역 결과로 노출할 수 있다.
상기한 기계 번역 방법은 도 3 내지 도 12를 통해 설명한 기계 번역 시스템의 상세 내용을 바탕으로 둘 이상의 동작들로 이루어질 수 있다.
본 발명의 실시예에 따른 방법들은 다양한 컴퓨터 시스템을 통하여 수행될 수 있는 프로그램 명령(instruction) 형태로 구현되어 컴퓨터 판독 가능 매체에 기록될 수 있다.
본 실시예에 따른 기계 번역 방법에서 원문 입력 및 번역문 출력과 관련된 프로그램은 PC 기반의 프로그램 또는 모바일 단말 전용의 어플리케이션으로 구성될 수 있다. 본 실시예에서의 기계 번역 앱은 독립적으로 동작하는 프로그램 형태로 구현되거나, 혹은 특정 어플리케이션(예컨대, 검색 프로그램 등)의 인-앱(in-app) 형태로 구성되어 상기 특정 어플리케이션 상에서 동작이 가능하도록 구현될 수 있다.
또한, 본 발명의 실시예에 따른 방법들은 번역 서비스를 제공하는 서버 시스템과 연관된 어플리케이션이 사용자 단말기를 제어하여 수행될 수 있다. 일 예로, 이러한 어플리케이션은 사용자로부터 원문을 입력 받거나 제공받고자 하는 번역문의 의미 범주를 선택 받아 서버 시스템으로 전달하기 위한 모듈; 및 서버 시스템으로부터 수신된 번역문을 출력하기 위한 모듈을 포함할 수 있다. 또한, 이러한 어플리케이션은 파일 배포 시스템이 제공하는 파일을 통해 사용자 단말기에 설치될 수 있다. 일 예로, 파일 배포 시스템은 사용자 단말기의 요청에 따라 상기 파일을 전송하는 파일 전송부(미도시)를 포함할 수 있다.
이와 같이, 본 발명의 실시예에 따르면, 원문에 대한 번역문에 대역이 되는 후보 문장을 완전한 형태의 문장으로 제공할 수 있으며, 번역 결과에 포함된 번역문의 문장을 의미적 범주에 따라 분류하여 노출할 수 있고, 특히 사용자의 목적이나 성향에 맞는 의미 범주의 번역문을 선별하여 제공할 수 있다.
이상에서 설명된 장치는 하드웨어 구성요소, 소프트웨어 구성요소, 및/또는 하드웨어 구성요소 및 소프트웨어 구성요소의 조합으로 구현될 수 있다. 예를 들어, 실시예들에서 설명된 장치 및 구성요소는, 예를 들어, 프로세서, 콘트롤러, ALU(arithmetic logic unit), 디지털 신호 프로세서(digital signal processor), 마이크로컴퓨터, FPGA(field programmable gate array), PLU(programmable logic unit), 마이크로프로세서, 또는 명령(instruction)을 실행하고 응답할 수 있는 다른 어떠한 장치와 같이, 하나 이상의 범용 컴퓨터 또는 특수 목적 컴퓨터를 이용하여 구현될 수 있다. 처리 장치는 운영 체제(OS) 및 상기 운영 체제 상에서 수행되는 하나 이상의 소프트웨어 애플리케이션을 수행할 수 있다. 또한, 처리 장치는 소프트웨어의 실행에 응답하여, 데이터를 접근, 저장, 조작, 처리 및 생성할 수도 있다. 이해의 편의를 위하여, 처리 장치는 하나가 사용되는 것으로 설명된 경우도 있지만, 해당 기술분야에서 통상의 지식을 가진 자는, 처리 장치가 복수 개의 처리 요소(processing element) 및/또는 복수 유형의 처리 요소를 포함할 수 있음을 알 수 있다. 예를 들어, 처리 장치는 복수 개의 프로세서 또는 하나의 프로세서 및 하나의 콘트롤러를 포함할 수 있다. 또한, 병렬 프로세서(parallel processor)와 같은, 다른 처리 구성(processing configuration)도 가능하다.
소프트웨어는 컴퓨터 프로그램(computer program), 코드(code), 명령(instruction), 또는 이들 중 하나 이상의 조합을 포함할 수 있으며, 원하는 대로 동작하도록 처리 장치를 구성하거나 독립적으로 또는 결합적으로(collectively) 처리 장치를 명령할 수 있다. 소프트웨어 및/또는 데이터는, 처리 장치에 의하여 해석되거나 처리 장치에 명령 또는 데이터를 제공하기 위하여, 어떤 유형의 기계, 구성요소(component), 물리적 장치, 가상 장치(virtual equipment), 컴퓨터 저장 매체 또는 장치, 또는 전송되는 신호 파(signal wave)에 영구적으로, 또는 일시적으로 구체화(embody)될 수 있다. 소프트웨어는 네트워크로 연결된 컴퓨터 시스템 상에 분산되어서, 분산된 방법으로 저장되거나 실행될 수도 있다. 소프트웨어 및 데이터는 하나 이상의 컴퓨터 판독 가능 기록 매체에 저장될 수 있다.
실시예에 따른 방법은 다양한 컴퓨터 수단을 통하여 수행될 수 있는 프로그램 명령 형태로 구현되어 컴퓨터 판독 가능 매체에 기록될 수 있다. 상기 컴퓨터 판독 가능 매체는 프로그램 명령, 데이터 파일, 데이터 구조 등을 단독으로 또는 조합하여 포함할 수 있다. 상기 매체에 기록되는 프로그램 명령은 실시예를 위하여 특별히 설계되고 구성된 것들이거나 컴퓨터 소프트웨어 당업자에게 공지되어 사용 가능한 것일 수도 있다. 컴퓨터 판독 가능 기록 매체의 예에는 하드 디스크, 플로피 디스크 및 자기 테이프와 같은 자기 매체(magnetic media), CD-ROM, DVD와 같은 광기록 매체(optical media), 플롭티컬 디스크(floptical disk)와 같은 자기-광 매체(magneto-optical media), 및 롬(ROM), 램(RAM), 플래시 메모리 등과 같은 프로그램 명령을 저장하고 수행하도록 특별히 구성된 하드웨어 장치가 포함된다. 프로그램 명령의 예에는 컴파일러에 의해 만들어지는 것과 같은 기계어 코드뿐만 아니라 인터프리터 등을 사용해서 컴퓨터에 의해서 실행될 수 있는 고급 언어 코드를 포함한다. 상기된 하드웨어 장치는 실시예의 동작을 수행하기 위해 하나 이상의 소프트웨어 모듈로서 작동하도록 구성될 수 있으며, 그 역도 마찬가지이다.
이상과 같이 실시예들이 비록 한정된 실시예와 도면에 의해 설명되었으나, 해당 기술분야에서 통상의 지식을 가진 자라면 상기의 기재로부터 다양한 수정 및 변형이 가능하다. 예를 들어, 설명된 기술들이 설명된 방법과 다른 순서로 수행되거나, 및/또는 설명된 시스템, 구조, 장치, 회로 등의 구성요소들이 설명된 방법과 다른 형태로 결합 또는 조합되거나, 다른 구성요소 또는 균등물에 의하여 대치되거나 치환되더라도 적절한 결과가 달성될 수 있다.
그러므로, 다른 구현들, 다른 실시예들 및 특허청구범위와 균등한 것들도 후술하는 특허청구범위의 범위에 속한다.
300: 기계 번역 시스템
301: 사용자 단말
410: 번역문 생성부
420: 결과 제공부

Claims (16)

  1. 컴퓨터로 구현되는 번역 결과 제공 방법에 있어서,
    원시 언어(source language)로 작성된 원문을 목적 언어(target language)로 번역한 번역문을 생성하는 단계; 및
    상기 번역문을 번역 결과로 제공하되, 상기 번역문을 문장의 의미 범주(semantic category)로 분류하여 제공하는 단계
    를 포함하는 번역 결과 제공 방법.
  2. 제1항에 있어서,
    상기 의미 범주는 문장을 분류하기 위한 기준으로 문체, 문형, 시제 중 적어도 하나를 포함하는 것
    을 특징으로 하는 번역 결과 제공 방법.
  3. 제1항에 있어서,
    상기 생성하는 단계는,
    상기 원문에 번역이 되는 후보 문장을 기계번역 모델로 측정된 스코어 순으로 정렬하여 스코어가 높은 상위 복수 개의 문장을 추출하고,
    상기 제공하는 단계는,
    상기 복수의 문장을 번역 결과로 노출하되 상기 복수의 문장 중 스코어가 가장 높은 문장과 나머지 문장을 구분하여 노출하는 것
    을 특징으로 하는 번역 결과 제공 방법.
  4. 제1항에 있어서,
    상기 제공하는 단계는,
    상기 원문에 번역이 되는 후보 문장이 복수 개인 경우 상기 후보 문장을 의미 범주 별로 구분하여 노출하는 것
    을 특징으로 하는 번역 결과 제공 방법.
  5. 제1항에 있어서,
    사용자로부터 번역 결과에 대한 의미 범주를 선택 받는 단계
    를 더 포함하고,
    상기 제공하는 단계는,
    상기 원문에 번역이 되는 후보 문장 중 상기 사용자에 의해 선택된 의미 범주로 분류된 문장을 노출하는 것
    을 특징으로 하는 번역 결과 제공 방법.
  6. 제1항에 있어서,
    상기 원문을 작성한 사용자의 문장 성향을 분석하는 단계
    를 더 포함하고,
    상기 제공하는 단계는,
    상기 원문에 번역이 되는 후보 문장 중 상기 사용자의 문장 성향과 대응되는 의미 범주로 분류된 문장을 노출하는 것
    을 특징으로 하는 번역 결과 제공 방법.
  7. 제1항에 있어서,
    상기 원문의 의미 범주를 분류하는 단계
    를 더 포함하고,
    상기 제공하는 단계는,
    상기 원문에 번역이 되는 후보 문장 중 상기 원문과 동일하거나 유사한 의미 범주로 분류된 문장을 노출하는 것
    을 특징으로 하는 번역 결과 제공 방법.
  8. 적어도 하나의 프로그램이 로딩된 메모리; 및
    적어도 하나의 프로세서
    를 포함하고,
    상기 적어도 하나의 프로세서는, 상기 프로그램의 제어에 따라,
    원시 언어(source language)로 작성된 원문을 목적 언어(target language)로 번역한 번역문을 생성하는 과정; 및
    상기 번역문을 번역 결과로 제공하되, 상기 번역문을 문장의 의미 범주(semantic category)로 분류하여 제공하는 과정
    을 처리하는 번역 결과 제공 시스템.
  9. 제8항에 있어서,
    상기 의미 범주는 문장을 분류하기 위한 기준으로 문체, 문형, 시제 중 적어도 하나를 포함하는 것
    을 특징으로 하는 번역 결과 제공 시스템.
  10. 제8항에 있어서,
    상기 생성하는 과정은,
    상기 원문에 번역이 되는 후보 문장을 기계번역 모델로 측정된 스코어 순으로 정렬하여 스코어가 높은 상위 복수 개의 문장을 추출하고,
    상기 제공하는 과정은,
    상기 복수의 문장을 번역 결과로 노출하되 상기 복수의 문장 중 스코어가 가장 높은 문장과 나머지 문장을 구분하여 노출하는 것
    을 특징으로 하는 번역 결과 제공 시스템.
  11. 제8항에 있어서,
    상기 제공하는 과정은,
    상기 원문에 번역이 되는 후보 문장이 복수 개인 경우 상기 후보 문장을 의미 범주 별로 구분하여 노출하는 것
    을 특징으로 하는 번역 결과 제공 시스템.
  12. 제8항에 있어서,
    상기 적어도 하나의 프로세서는, 상기 프로그램의 제어에 따라,
    사용자로부터 번역 결과에 대한 의미 범주를 선택 받는 과정
    을 더 처리하고,
    상기 제공하는 과정은,
    상기 원문에 번역이 되는 후보 문장 중 상기 사용자에 의해 선택된 의미 범주로 분류된 문장을 노출하는 것
    을 특징으로 하는 번역 결과 제공 시스템.
  13. 제8항에 있어서,
    상기 적어도 하나의 프로세서는, 상기 프로그램의 제어에 따라,
    상기 원문을 작성한 사용자의 문장 성향을 분석하는 과정
    을 더 처리하고,
    상기 제공하는 과정은,
    상기 원문에 번역이 되는 후보 문장 중 상기 사용자의 문장 성향과 대응되는 의미 범주로 분류된 문장을 노출하는 것
    을 특징으로 하는 번역 결과 제공 시스템.
  14. 제8항에 있어서,
    상기 적어도 하나의 프로세서는, 상기 프로그램의 제어에 따라,
    상기 원문의 의미 범주를 분류하는 과정
    을 더 처리하고,
    상기 제공하는 과정은,
    상기 원문에 번역이 되는 후보 문장 중 상기 원문과 동일하거나 유사한 의미 범주로 분류된 문장을 노출하는 것
    을 특징으로 하는 번역 결과 제공 시스템.
  15. 컴퓨터 시스템이 번역 결과를 제공하도록 제어하는 명령(instruction)을 포함하는 컴퓨터 판독가능 매체로서,
    상기 명령은,
    원시 언어(source language)로 작성된 원문을 목적 언어(target language)로 번역한 번역문을 생성하는 단계; 및
    상기 번역문을 번역 결과로 제공하되, 상기 번역문을 문장의 의미 범주(semantic category)로 분류하여 제공하는 단계
    를 포함하는 방법에 의하여 상기 컴퓨터 시스템을 제어하는, 컴퓨터 판독가능 저장 매체.
  16. 사용자 단말에 설치되는 어플리케이션의 파일을 배포하는 파일 배포 시스템에 있어서,
    상기 사용자 단말의 요청에 따라 상기 파일을 전송하는 파일 전송부
    를 포함하고,
    상기 어플리케이션은,
    원시 언어(source language)로 작성된 원문을 기계번역 서버로 전송하도록 상기 사용자 단말을 제어하는 모듈; 및
    상기 기계번역 서버에서 제공하는, 상기 원문을 목적 언어(target language)로 번역한 번역문을 노출하도록 상기 사용자 단말을 제어하는 모듈
    을 포함하고,
    상기 기계번역 서버에서는 상기 번역문을 문장의 의미 범주(semantic category)로 분류하여 상기 사용자 단말로 제공하는 것
    을 특징으로 하는 파일 배포 시스템.
KR1020140041887A 2014-04-08 2014-04-08 다양한 의미 범주에 기반한 번역 결과 제공 방법 및 시스템 KR101864361B1 (ko)

Priority Applications (6)

Application Number Priority Date Filing Date Title
KR1020140041887A KR101864361B1 (ko) 2014-04-08 2014-04-08 다양한 의미 범주에 기반한 번역 결과 제공 방법 및 시스템
CN201510028718.6A CN104978310B (zh) 2014-04-08 2015-01-20 基于各种意思类别的翻译结果的提供方法及系统
JP2015013224A JP6333745B2 (ja) 2014-04-08 2015-01-27 翻訳結果提供方法、翻訳結果提供システム、プログラムおよびファイル配布システム
TW104109873A TWI629601B (zh) 2014-04-08 2015-03-27 提供翻譯與分類翻譯結果的系統,電腦可讀存儲媒體,檔案分配系統及其方法
US14/680,184 US9760569B2 (en) 2014-04-08 2015-04-07 Method and system for providing translated result
US15/673,694 US9971769B2 (en) 2014-04-08 2017-08-10 Method and system for providing translated result

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020140041887A KR101864361B1 (ko) 2014-04-08 2014-04-08 다양한 의미 범주에 기반한 번역 결과 제공 방법 및 시스템

Related Child Applications (1)

Application Number Title Priority Date Filing Date
KR1020160050644A Division KR101916781B1 (ko) 2016-04-26 2016-04-26 다양한 의미 범주에 기반한 번역 결과 제공 방법 및 시스템

Publications (2)

Publication Number Publication Date
KR20150116675A true KR20150116675A (ko) 2015-10-16
KR101864361B1 KR101864361B1 (ko) 2018-06-04

Family

ID=54209896

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020140041887A KR101864361B1 (ko) 2014-04-08 2014-04-08 다양한 의미 범주에 기반한 번역 결과 제공 방법 및 시스템

Country Status (5)

Country Link
US (2) US9760569B2 (ko)
JP (1) JP6333745B2 (ko)
KR (1) KR101864361B1 (ko)
CN (1) CN104978310B (ko)
TW (1) TWI629601B (ko)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2017095113A1 (ko) * 2015-11-30 2017-06-08 삼성전자 주식회사 번역 서비스를 제공하는 방법 및 이를 위한 전자 장치
KR20180090641A (ko) * 2017-02-03 2018-08-13 네이버 주식회사 회화 관련 컨텐츠를 제공하는 방법 및 시스템
WO2019059574A1 (ko) * 2017-09-20 2019-03-28 삼성전자주식회사 전자 장치 및 그의 제어 방법
WO2020004717A1 (ko) * 2018-06-29 2020-01-02 네이버 주식회사 입력 어플리케이션을 이용한 번역 서비스 제공 방법 및 이를 이용하는 단말장치
KR102260396B1 (ko) * 2020-09-09 2021-06-03 주식회사 트위그팜 범용 신경망 기계번역기를 활용한 하이브리드 번역 시스템

Families Citing this family (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103577399B (zh) * 2013-11-05 2018-01-23 北京百度网讯科技有限公司 双语语料库的数据扩充方法和装置
KR101864361B1 (ko) * 2014-04-08 2018-06-04 네이버 주식회사 다양한 의미 범주에 기반한 번역 결과 제공 방법 및 시스템
CN104731776B (zh) * 2015-03-27 2017-12-26 百度在线网络技术(北京)有限公司 翻译信息的提供方法及系统
US9678954B1 (en) * 2015-10-29 2017-06-13 Google Inc. Techniques for providing lexicon data for translation of a single word speech input
JP6655788B2 (ja) * 2016-02-01 2020-02-26 パナソニックIpマネジメント株式会社 対訳コーパス作成方法、該装置および該プログラムならびに機械翻訳システム
US10121474B2 (en) * 2016-02-17 2018-11-06 Microsoft Technology Licensing, Llc Contextual note taking
US10318640B2 (en) * 2016-06-24 2019-06-11 Facebook, Inc. Identifying risky translations
KR102565275B1 (ko) 2016-08-10 2023-08-09 삼성전자주식회사 병렬 처리에 기초한 번역 방법 및 장치
US10769386B2 (en) * 2017-12-05 2020-09-08 Sap Se Terminology proposal engine for determining target language equivalents
CN109697292B (zh) * 2018-12-17 2023-04-21 北京百度网讯科技有限公司 一种机器翻译方法、装置、电子设备和介质
KR102545666B1 (ko) 2018-12-18 2023-06-21 삼성전자주식회사 페르소나에 기반하여 문장을 제공하는 방법 및 이를 지원하는 전자 장치
US11341340B2 (en) * 2019-10-01 2022-05-24 Google Llc Neural machine translation adaptation
US11861313B2 (en) * 2020-02-02 2024-01-02 International Business Machines Corporation Multi-level linguistic alignment in specific user targeted messaging
KR20240071777A (ko) * 2022-11-16 2024-05-23 삼성전자주식회사 전자 장치 및 이의 기계 번역 방법

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0589166A (ja) * 1991-09-27 1993-04-09 Kobe Nippon Dekin Software Kk 機械翻訳装置
JPH05128150A (ja) * 1991-10-30 1993-05-25 Ricoh Co Ltd 機械翻訳装置
JPH06295309A (ja) * 1993-04-06 1994-10-21 Ricoh Co Ltd 機械翻訳装置及び言語解析装置並びにディジタル複写装置
JPH06348751A (ja) * 1992-11-09 1994-12-22 Ricoh Co Ltd 言語変換装置
JP2004038406A (ja) * 2002-07-01 2004-02-05 Advanced Telecommunication Research Institute International 複数個の翻訳結果から最良訳を選択する方法、最良訳を選択するための回帰木データを生成する方法、最良訳選択型の機械翻訳プログラム、回帰木生成プログラム、および回帰木データを記憶した記憶媒体
KR20120035244A (ko) * 2010-10-05 2012-04-16 에스케이플래닛 주식회사 다양한 문체 제공이 가능한 자동 번역 장치 및 방법

Family Cites Families (18)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0417065A (ja) * 1990-05-11 1992-01-21 Hitachi Ltd 翻訳支援装置
JP3219937B2 (ja) * 1994-07-27 2001-10-15 日本電気株式会社 翻訳変換学習装置
JP4439431B2 (ja) * 2005-05-25 2010-03-24 株式会社東芝 コミュニケーション支援装置、コミュニケーション支援方法およびコミュニケーション支援プログラム
JP4047885B2 (ja) * 2005-10-27 2008-02-13 株式会社東芝 機械翻訳装置、機械翻訳方法および機械翻訳プログラム
JP5121252B2 (ja) * 2007-02-26 2013-01-16 株式会社東芝 原言語による音声を目的言語に翻訳する装置、方法およびプログラム
JP5128150B2 (ja) 2007-03-07 2013-01-23 三菱レイヨン株式会社 メタクリル酸メチルの回収方法
US8548791B2 (en) * 2007-08-29 2013-10-01 Microsoft Corporation Validation of the consistency of automatic terminology translation
KR20100037813A (ko) 2008-10-02 2010-04-12 삼성전자주식회사 통계적 자동 번역 장치 및 방법
JP5317061B2 (ja) * 2009-07-30 2013-10-16 独立行政法人情報通信研究機構 単語間の意味的関係の有無についての、複数言語での同時分類器及びそのためのコンピュータプログラム。
TW201222282A (en) * 2010-11-23 2012-06-01 Inventec Corp Real time translation method for mobile device
TWI456415B (zh) * 2010-12-16 2014-10-11 Inventec Corp 翻譯查詢與翻譯轉換系統及其方法
US9063931B2 (en) * 2011-02-16 2015-06-23 Ming-Yuan Wu Multiple language translation system
JP2012185654A (ja) * 2011-03-04 2012-09-27 Fujitsu Ltd 翻訳装置、翻訳プログラムおよび翻訳方法
CN102789451B (zh) * 2011-05-16 2015-06-03 北京百度网讯科技有限公司 一种个性化的机器翻译系统、方法及训练翻译模型的方法
CN103077165A (zh) * 2012-12-31 2013-05-01 威盛电子股份有限公司 自然语言对话方法及其系统
US20150199335A1 (en) * 2014-01-10 2015-07-16 Electronics And Telecommunications Research Institute Method and apparatus for representing user language characteristics in mpeg user description system
KR20150093482A (ko) * 2014-02-07 2015-08-18 한국전자통신연구원 화자 분할 기반 다자간 자동 통번역 운용 시스템 및 방법과 이를 지원하는 장치
KR101864361B1 (ko) * 2014-04-08 2018-06-04 네이버 주식회사 다양한 의미 범주에 기반한 번역 결과 제공 방법 및 시스템

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0589166A (ja) * 1991-09-27 1993-04-09 Kobe Nippon Dekin Software Kk 機械翻訳装置
JPH05128150A (ja) * 1991-10-30 1993-05-25 Ricoh Co Ltd 機械翻訳装置
JPH06348751A (ja) * 1992-11-09 1994-12-22 Ricoh Co Ltd 言語変換装置
JPH06295309A (ja) * 1993-04-06 1994-10-21 Ricoh Co Ltd 機械翻訳装置及び言語解析装置並びにディジタル複写装置
JP2004038406A (ja) * 2002-07-01 2004-02-05 Advanced Telecommunication Research Institute International 複数個の翻訳結果から最良訳を選択する方法、最良訳を選択するための回帰木データを生成する方法、最良訳選択型の機械翻訳プログラム、回帰木生成プログラム、および回帰木データを記憶した記憶媒体
KR20120035244A (ko) * 2010-10-05 2012-04-16 에스케이플래닛 주식회사 다양한 문체 제공이 가능한 자동 번역 장치 및 방법

Cited By (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2017095113A1 (ko) * 2015-11-30 2017-06-08 삼성전자 주식회사 번역 서비스를 제공하는 방법 및 이를 위한 전자 장치
KR20170063167A (ko) * 2015-11-30 2017-06-08 삼성전자주식회사 번역 서비스를 제공하는 방법 및 이를 위한 전자 장치
CN108369585A (zh) * 2015-11-30 2018-08-03 三星电子株式会社 用于提供翻译服务的方法及其电子装置
US10713445B2 (en) 2015-11-30 2020-07-14 Samsung Electronics Co., Ltd. Method for providing translation service, and electronic device therefor
CN108369585B (zh) * 2015-11-30 2022-07-08 三星电子株式会社 用于提供翻译服务的方法及其电子装置
KR20180090641A (ko) * 2017-02-03 2018-08-13 네이버 주식회사 회화 관련 컨텐츠를 제공하는 방법 및 시스템
WO2019059574A1 (ko) * 2017-09-20 2019-03-28 삼성전자주식회사 전자 장치 및 그의 제어 방법
WO2020004717A1 (ko) * 2018-06-29 2020-01-02 네이버 주식회사 입력 어플리케이션을 이용한 번역 서비스 제공 방법 및 이를 이용하는 단말장치
KR20200002490A (ko) * 2018-06-29 2020-01-08 네이버 주식회사 입력 어플리케이션을 이용한 번역 서비스 제공 방법 및 이를 이용하는 단말장치
JP2021528788A (ja) * 2018-06-29 2021-10-21 ネイバー コーポレーションNAVER Corporation 入力アプリケーションを用いた翻訳サービス提供方法及びこれを用いる端末装置
KR102260396B1 (ko) * 2020-09-09 2021-06-03 주식회사 트위그팜 범용 신경망 기계번역기를 활용한 하이브리드 번역 시스템
US11983506B2 (en) 2020-09-09 2024-05-14 Twig Farm Co., Ltd. Hybrid translation system using a general-purpose neural network machine translator

Also Published As

Publication number Publication date
CN104978310B (zh) 2018-05-18
JP2015201169A (ja) 2015-11-12
US9760569B2 (en) 2017-09-12
KR101864361B1 (ko) 2018-06-04
US9971769B2 (en) 2018-05-15
TW201539209A (zh) 2015-10-16
TWI629601B (zh) 2018-07-11
US20150286634A1 (en) 2015-10-08
CN104978310A (zh) 2015-10-14
JP6333745B2 (ja) 2018-05-30
US20170337189A1 (en) 2017-11-23

Similar Documents

Publication Publication Date Title
KR101864361B1 (ko) 다양한 의미 범주에 기반한 번역 결과 제공 방법 및 시스템
US11328017B2 (en) Method and system for generating a conversational agent by automatic paraphrase generation based on machine translation
JP2021089705A (ja) 翻訳品質を評価するための方法と装置
US20130185049A1 (en) Predicting Pronouns for Pro-Drop Style Languages for Natural Language Translation
US20130060769A1 (en) System and method for identifying social media interactions
US8874433B2 (en) Syntax-based augmentation of statistical machine translation phrase tables
Kenny Human and machine translation
Specia et al. Machine translation quality estimation: Applications and future perspectives
Menacer et al. Machine translation on a parallel code-switched corpus
KR102188564B1 (ko) 어체 변환이 가능한 기계 번역 방법 및 시스템
Lommatzsch et al. An Information Retrieval-based Approach for Building Intuitive Chatbots for Large Knowledge Bases.
Kuriyozov et al. Construction and evaluation of sentiment datasets for low-resource languages: The case of Uzbek
US20220365956A1 (en) Method and apparatus for generating patent summary information, and electronic device and medium
KR101916781B1 (ko) 다양한 의미 범주에 기반한 번역 결과 제공 방법 및 시스템
KR102083017B1 (ko) 플레이스의 소셜 리뷰 분석 방법 및 시스템
KR101709693B1 (ko) 크라우드 소싱을 이용한 웹툰 언어 자동 번역 방법
Patil et al. Novel technique for script translation using NLP: performance evaluation
CN102135957A (zh) 一种翻译短句的方法及装置
US20210263915A1 (en) Search Text Generation System and Search Text Generation Method
CN107908792B (zh) 信息推送方法和装置
Sinan Yüksel et al. A real-time social network-based knowledge discovery system for decision making
Shi et al. Topic-Selective Graph Network for Topic-Focused Summarization
JP2019197577A (ja) 照応・省略解析装置
KR102625347B1 (ko) 동사와 형용사와 같은 품사를 이용한 음식 메뉴 명사 추출 방법과 이를 이용하여 음식 사전을 업데이트하는 방법 및 이를 위한 시스템
US20240020482A1 (en) Corpus Annotation Method and Apparatus, and Related Device

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
AMND Amendment
E601 Decision to refuse application
AMND Amendment
A107 Divisional application of patent
J201 Request for trial against refusal decision
J301 Trial decision

Free format text: TRIAL NUMBER: 2016101002530; TRIAL DECISION FOR APPEAL AGAINST DECISION TO DECLINE REFUSAL REQUESTED 20160428

Effective date: 20180323

S901 Examination by remand of revocation
GRNO Decision to grant (after opposition)
GRNT Written decision to grant