KR20200134573A - 대화문맥 학습 기반 자동 번역 장치 및 방법 - Google Patents

대화문맥 학습 기반 자동 번역 장치 및 방법 Download PDF

Info

Publication number
KR20200134573A
KR20200134573A KR1020190060202A KR20190060202A KR20200134573A KR 20200134573 A KR20200134573 A KR 20200134573A KR 1020190060202 A KR1020190060202 A KR 1020190060202A KR 20190060202 A KR20190060202 A KR 20190060202A KR 20200134573 A KR20200134573 A KR 20200134573A
Authority
KR
South Korea
Prior art keywords
language
translation
learning
context
unit
Prior art date
Application number
KR1020190060202A
Other languages
English (en)
Inventor
권오욱
Original Assignee
한국전자통신연구원
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 한국전자통신연구원 filed Critical 한국전자통신연구원
Priority to KR1020190060202A priority Critical patent/KR20200134573A/ko
Priority to US16/852,791 priority patent/US20200372226A1/en
Publication of KR20200134573A publication Critical patent/KR20200134573A/ko

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/40Processing or translation of natural language
    • G06F40/42Data-driven translation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/40Processing or translation of natural language
    • G06F40/58Use of machine translation, e.g. for multi-lingual retrieval, for server-side translation for client devices or for real-time translation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/205Parsing
    • G06F40/211Syntactic parsing, e.g. based on context-free grammar [CFG] or unification grammars
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Health & Medical Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Computational Linguistics (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Biomedical Technology (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • Evolutionary Computation (AREA)
  • Data Mining & Analysis (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Biophysics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Machine Translation (AREA)

Abstract

본 발명은 대화문맥 학습 기반 자동 번역 장치에 관한 것이다. 본 발명에 따르면, 대화 형태의 양방향 대화번역 집합을 수집하는 양방향 대화번역 집합 수집부; 제1언어-제2언어 양방향 대화번역 집합을 이용하여 제1언어-제2언어 양방향 대화번역 학습 지식을 구축하는 자동 번역 지식 학습부; 및 제1언어 사용자 단말로부터 제1언어가 입력되면, 구축된 제1언어-제2언어 양방향 대화번역 학습 지식과 대화문맥 관리부를 통해 제공되는 제2언어의 대화문맥 정보를 이용하여 제2언어로 번역하는 번역부;를 포함한다.

Description

대화문맥 학습 기반 자동 번역 장치 및 방법{Conversation Contextual Learning Based Automatic Translation Device and Method}
본 발명은 대화문맥 학습 기반 자동 번역 장치 및 방법에 관한 것으로, 더욱 상세하게는 상대 언어에 나타난 정보를 공유하여 통역 및 번역 서비스 품질을 개선하고, 상대와의 소통을 원활히 하기 위한 대화문맥 학습 기반 자동 번역 장치 및 방법에 관한 것이다.
현재 출시되는 고품질의 자동 번역 장치들은 대용량의 양국어 번역 문장들로부터 번역 정보를 학습하는 통계 기반 번역(Statistical Machine Translation) 방법과 신경망 기반 번역(Neural Machine Translation) 방법을 이용한다.
이러한, 고품질의 자동 번역 장치들은 외국인과의 대화에 있어서 자국어를 상대방 언어로 번역하는 장치와 상대방 언어를 자국어로 번역하는 번역 장치가 각각 독립적으로 작동하는 것이 일반적이다.
다만, 종래 고품질의 자동 번역 장치인 독립적인 2개의 번역 장치는 대화 문맥에서 매우 중요한 상대방 대화 내용을 참고할 수 없는 문제점이 있다.
예를 들어, 한국인의 대화 "난 그를 동아리 회장으로 지명할거야."를 한영 자동 번역에 의해서, "I will nominate him for club president."라고 번역된다.
상기 번역을 충분히 이해한 상대방이 영어로 "I don't nominate him for the president."라고 했을 때, 영한 자동 번역에서는 상대가 "president"에 대해 "회장"으로 언급한 정보가 없이, 학습용 번역문장들에서 자주 번역된 정보를 이용하기 때문에 "나는 그를 대통령으로 지명하지 않는다."라고 번역될 수 있다.
한편, 한국특허 제10-1694286호(2017.01.03) "양방향 자동 통역 및 번역 서비스 제공 장치 및 그 방법"과 미국특허 US 9,058,322(2015.06.16) "Apparatus and method for providing two-way automatic interpretation and translation service"은 독립적인 2개의 번역 장치가 양방향으로 번역 및 통역 서비스를 제공할 때 상대방 대화정보를 포함하는 대화문맥 및 번역 정보를 활용할 수 있다.
그러나, 종래 양방향 자동 통역 및 번역 서비스 제공 장치 및 그 방법은 대용량 양방향 학습 문장들로부터 학습하는 번역 방법에서의 상대방 대화 문맥 정보를 활용하는 방법을 제공하지 못하는 문제점이 있다.
본 발명은 종래 문제점을 해결하기 위해 안출된 것으로, 상대방 대화 문맥 및 이력 정보를 활용하는 것은 동일하나 문법적, 의미적 애매성 해소를 단계적으로 하지 않는 학습 기반 자동 번역 장치에서도 적용할 수 있는 대화문맥 학습 기반 자동 번역 장치를 제공하는데 그 목적이 있다.
또한, 본 발명은 상대방 언어 정보를 이용하여 대화 문맥을 학습하고, 학습 단계를 통해 학습된 대화 문맥을 이용하여 고품질의 학습 기반 자동 번역을 제공할 수 있는 대화문맥 학습 기반 자동 번역 장치를 제공하는데 그 목적이 있다.
본 발명의 목적은 이상에서 언급한 목적으로 제한되지 않으며, 언급되지 않은 또 다른 목적들은 아래의 기재로부터 당업자에게 명확하게 이해될 수 있을 것이다.
전술한 목적을 달성하기 위한 본 발명의 일면에 따른 대화문맥 학습 기반 자동 번역 장치는, 대화 형태의 양방향 대화번역 집합을 수집하는 양방향 대화번역 집합 수집부; 상기 양방향 대화번역 집합을 이용하여 제1언어-제2언어 양방향 대화번역 학습 지식을 구축하는 자동 번역 지식 학습부; 및 상기 구축된 제1언어-제2언어 양방향 번역 학습 지식과 대화문맥 관리부를 통해 제공되는 상대방 언어의 대화문맥을 이용하여 상대방 언어로 번역하는 번역부;를 포함한다.
상기 번역부는, 제1언어 사용자 단말로부터 제1언어가 입력되면, 상기 구축된 제1언어-제2언어 양방향 대화번역 학습 지식과 대화문맥 관리부를 통해 제공되는 제2언어의 대화문맥 정보를 이용하여 제2언어로 번역하고, 제2언어 사용자 단말로부터 제2언어가 입력되면, 상기 구축된 제1언어-제2언어 양방향 대화번역 학습 지식과 대화문맥 관리부를 통해 제공되는 제1언어의 대화문맥 정보를 이용하여 제1언어로 번역한다.
상기 자동 번역 지식 학습부는, 제1언어 원문을 제2언어 번역문으로 자동 번역 하도록 학습된 제1언어-제2언어 자동 번역 학습 지식과, 제2언어 원문을 제1언어 번역문으로 자동 번역 하도록 학습된 제2언어-제1언어 자동 번역 학습 지식으로 구성된다.
그리고 상기 자동 번역 지식 학습부는 상기 학습언어 문맥정보 처리부를 통해 정렬된 제1언어의 원문과 대화문맥 상의 제2언어 대역어 정보를 이용하여 제2언어의 번역문이 생성될 수 있도록 신경망이나 통계기반 방법으로 학습하는 제1언어-제2언어 자동 번역 학습부상기 학습언어 문맥정보 처리부를 통해 정렬된 제2언어의 원문과 대화문맥 상의 제1언어 대역어 정보를 이용하여 제1언어의 번역문이 생성될 수 있도록 신경망이나 통계기반 방법으로 학습하는 제2언어-제1언어 자동 번역 학습부를 포함한다.
한편 상기 번역부는, 제1언어-제2언어 번역부; 제2언어-제1언어 번역부; 제1 언어 사용자와 제2 언어 사용자가 대화하는 각 사용자 언어의 입력문을 대화 순서에 따라 수집하여 대화 문맥을 구성하고, 대화 문맥을 상기 제1언어-제2언어 번역부와 제2언어-제1언어 번역부에 제공하여 상대방 언어 사용자의 이전 대화 문장들을 문맥으로 이용할 수 있도록 지원하는 대화문맥 관리부;를 포함한다.
그리고 상기 제1언어-제2언어 번역부는, 제1언어 사용자로부터 입력된 제1언어 입력문과 상기 대화문맥 관리부에서 저장한 이전 n개의 제2언어 사용자의 대화문장들을 입력으로 하여, 제1언어의 원문이 번역될 가능성이 있는 대역어가 제2언어 대화문맥(제2언어 사용자의 이전 n개의 대화문장들)에서 출현하였는가에 대한 정보를 생성하는 제1언어-제2언어 번역 문맥정보 처리부; 및 상기 제1언어-제2언어 번역 문맥정보 처리부를 통해 정렬된 제1언어의 원문과 대화문맥 상의 제2언어 대역어 정보 및 상기 제1언어-제2언어 자동 번역 지식 학습부에서 학습한 제1언어-제2언어 자동 번역 학습 지식을 이용하여 제1언어의 원문에 대한 제2언어의 번역문을 상기 제1언어-제2언어 자동 번역 지식 학습부에서 학습한 신경망이나 통계기반 방법에 따라 생성하는 제1언어-제2언어 자동 번역부;를 포함한다.
본 발명의 일 실시예에 따른 대화문맥 학습 기반 자동 번역 방법은 양방향 대화번역 집합 수집부를 통해, 대화 형태의 양방향 대화번역 집합을 수집하는 단계; 자동 번역 지식 학습부를 통해 제1언어-제2언어 양방향 대화번역 집합을 이용하여 제1언어-제2언어 양방향 대화번역 학습 지식을 구축하는 단계; 및 번역부를 통해 제1언어 사용자 단말로부터 제1언어가 입력되면, 상기 구축된 제1언어-제2언어 자동 번역 학습 지식과 대화문맥 관리부(미도시)를 통해 제공되는 제2언어 대화문맥정보를 이용하여 제2언어로 번역하는 단계;를 포함한다. 한편, 제2언어 사용자 단말로부터 제2언어가 입력되면, 상기 번역부를 통해, 상기 구축된 제1언어-제2언어 양방향 대화번역 학습 지식과 대화문맥 관리부를 통해 제공되는 제1언어의 대화문맥 정보를 이용하여 제1언어로 번역하는 단계를 포함한다.
상기 양방향 대화번역 집합은, 제1언어와 제2언어로 이루어진 대화문과 상대방 언어의 번역문으로 구성된 대화들의 집합이다. 이러한, 상기 양방향 대화번역 집합은, 각 대화의 시작 부분과 끝 부분을 표기되어 각 대화를 구분한다.
한편 상기 제1언어-제2언어 양방향 대화 번역 학습 학습 지식은, 제1언어 원문을 제2언어 번역문으로 자동 번역하도록 학습된 제1언어-제2언어 자동 번역 학습 지식과, 제2언어 원문을 제1언어 번역문으로 자동 번역하도록 학습된 제2언어-제1언어 자동 번역 학습 지식으로 구성된다.
한편 상기 제1언어를 제2언어 대화문맥정보를 이용하여 제2언어로 번역하는 단계는, 대화문맥 관리부를 통해, 제1 언어 사용자와 제2 언어 사용자가 대화하는 각 사용자 언어의 입력문을 대화 순서에 따라 수집하여 대화 문맥을 구성하는 단계; 대화문맥 관리부를 통해, 대화 문맥을 상기 제1언어-제2언어 번역부와 제2언어-제1언어 번역부에 제공하여 상대방 언어 사용자의 이전 대화 문장들을 문맥으로 이용할 수 있도록 제공하는 단계; 제1언어 사용자 단말로부터 제1언어가 입력되면, 상기 제1언어-제2언어 번역부를 통해, 상기 구축된 제1언어-제2언어 양방향 대화번역 학습 지식과 대화문맥 관리부를 통해 제공되는 제2언어의 대화문맥 정보를 이용하여 제2언어로 번역하는 단계; 제2언어 사용자 단말로부터 제2언어가 입력되면, 상기 제2언어-제1언어 번역부를 통해, 상기 구축된 제2언어-제1언어 양방향 대화번역 학습 지식과 대화문맥 관리부를 통해 제공되는 제1언어의 대화문맥 정보를 이용하여 제1언어로 번역하는 단계;를 포함한다.
한편, 상기 제2언어를 제1언어 대화문맥정보를 이용하여 제1언어로 번역하는 단계는, 대화문맥 관리부를 통해, 제2 언어 사용자와 제1 언어 사용자가 대화하는 각 사용자 언어의 입력문을 대화 순서에 따라 수집하여 대화 문맥을 구성하는 단계; 대화문맥 관리부를 통해, 대화 문맥을 상기 제2언어-제1언어 번역부와 제1언어-제2언어 번역부에 제공하여 상대방 언어 사용자의 이전 대화 문장들을 문맥으로 이용할 수 있도록 제공하는 단계; 제2언어 사용자 단말로부터 제2언어가 입력되면, 상기 제2언어-제1언어 번역부를 통해, 상기 구축된 제2언어-제1언어 양방향 대화번역 학습 지식과 대화문맥 관리부를 통해 제공되는 제1언어의 대화문맥 정보를 이용하여 제1언어로 번역하는 단계; 제1언어 사용자 단말로부터 제1언어가 입력되면, 상기 제1언어-제2언어 번역부를 통해, 상기 구축된 제1언어-제2언어 양방향 대화번역 학습 지식과 대화문맥 관리부를 통해 제공되는 제2언어의 대화문맥 정보를 이용하여 제2언어로 번역하는 단계;를 포함한다.
그리고 상기 대화 형태의 양방향 대화번역 집합을 수집하는 단계는, 양방향 대화 번역 수집부를 통해, 제1언어 사용자 단말과 제2언어 사용자 단말 간의 대화 원문이 있고, 각 원문에 대한 상대방 번역문을 작성되어 있는 제1언어-제2언어 대화문과 번역문으로 구축된 대화를 입력으로 받아서, 원문과 그 상대방 언어의 번역문으로 구성된 양방향 대화를 대화 시작과 끝이 표시하여 대화문맥의 범위를 표시한 제1언어-제2언어 양방향 대화 번역 문장 집합을 구축하는 단계; 단일언어 문서 번역 변환부를 통해, 제1언어나 제2언어 중 하나의 언어로 작성된 문서와 그 상대 언어로 번역된 문장들로 구성된 단일언어 문서 문장 및 번역문 집합을 입력으로 받아, 각 언어의 상대방 대화문맥을 문서의 이전 문장들의 상대방 언어의 문장(원문이나 번역문)들로 표기하여 제1언어-제2언어 양방향 대화 번역 문장 집합으로 변환하는 단계; 및 번역문장 변환부를 통해, 제1언어나 제2언어 중 하나의 언어로 작성된 문장과 번역문으로만 구성되어 이전 문맥이 없는 형태의 단일언어 문장 및 번역문 집합을 입력으로 받아, 각 문장의 상대방 대화문맥을 자신의 번역 문장으로 표기하여 제1언어-제2언어 양방향 대화 번역 문장 집합으로 변환하는 단계;를 포함한다.
상기 대화 형태의 양방향 대화번역 집합을 수집하는 단계는, 제1언어와 제2언어의 역방향에 대한 대화문맥의 범위를 표시한 제2언어-제1언어 양방향 대화 번역 문장 집합, 각 언어의 상대방 대화문맥을 문서의 이전 문장들의 상대방 언어의 문장(원문이나 번역문)들로 표기하여 제1언어-제2언어 양방향 대화 번역 문장 집합 및 각 문장의 상대방 대화문맥을 자신의 번역 문장으로 표기하여 제1언어-제2언어 양방향 대화 번역 문장 집합으로 변환할 수 있다.
본 발명의 일 실시예에 따르면, 학습을 통해 상대방 대화 문맥 정보를 저장하고, 학습된 대화 문맥 정보를 이용하여 번역을 수행함으로써, 외국어를 사용하는 상대방과의 대화에 있어 대화 문맥에 사용된 단어와 표현으로 번역할 수 있고, 대화 상대가 보다 상대방 의도를 쉽게 파악할 수 있는 효과가 있다.
도 1은 본 발명의 일 실시예에 따른 대화문맥 학습 기반 자동 번역 장치를 설명하기 위한 구성 블록도.
도 2는 도 1에 도시된 자동 번역 지식 학습부의 세부 구성을 설명하기 위한 구성 블록도.
도 3a는 도 2에 도시된 제1언어-제2언어 자동 번역 지식 학습부의 세부 구성을 설명하기 위한 구성 블록도.
도 3b는 도 2에 도시된 제2언어-제1언어 자동 번역 지식 학습부의 세부 구성을 설명하기 위한 구성 블록도.
도 4는 도 1의 번역부의 세부 구성을 설명하기 위한 구성 블록도.
도 5a는 도 4의 제1언어-제2언어 번역부를 설명하기 위한 구성 블록도.
도 5b는 도 4의 제2언어-제1언어 번역부를 설명하기 위한 구성 블록도.
도 6은 도 1의 양방향 대화번역 집합 수집부를 설명하기 위한 구성 블록도.
도 7은 본 발명의 일 실시예에 따른 대화문맥 학습 기반 자동 번역 방법을 설명하기 위한 순서도.
도 8은 도 7의 번역 단계를 설명하기 위한 순서도.
도 9는 도 7의 대화 형태의 양방향 대화번역 집합을 수집하는 단계를 설명하기 위한 순서도이다.
본 발명의 이점 및 특징, 그리고 그것들을 달성하는 방법은 첨부되는 도면과 함께 상세하게 후술되어 있는 실시예들을 참조하면 명확해질 것이다. 그러나 본 발명은 이하에서 개시되는 실시예들에 한정되는 것이 아니라 서로 다른 다양한 형태로 구현될 것이며, 단지 본 실시예들은 본 발명의 개시가 완전하도록 하며, 본 발명이 속하는 기술분야에서 통상의 지식을 가진 자에게 발명의 범주를 완전하게 알려주기 위해 제공되는 것이며, 본 발명은 청구항의 범주에 의해 정의될 뿐이다. 한편, 본 명세서에서 사용된 용어는 실시예들을 설명하기 위한 것이며 본 발명을 제한하고자 하는 것은 아니다. 본 명세서에서, 단수형은 문구에서 특별히 언급하지 않는 한 복수형도 포함한다. 명세서에서 사용되는 "포함한다(comprises)" 및/또는 "포함하는(comprising)"은 언급된 구성소자, 단계, 동작 및/또는 소자는 하나 이상의 다른 구성소자, 단계, 동작 및/또는 소자의 존재 또는 추가를 배제하지 않는다.
이하, 본 발명의 바람직한 실시예에 대하여 첨부한 도면을 참조하여 상세히 설명하기로 한다. 도 1은 본 발명의 일 실시예에 따른 대화문맥 학습 기반 자동 번역 장치를 설명하기 위한 구성 블록도이다.
도 1에 도시된 바와 같이, 본 발명의 일 실시예에 따른 대화문맥 학습 기반 자동 번역 장치는 양방향 대화번역 집합 수집부(100), 자동 번역 지식 학습부(200) 및 번역부(300)를 포함한다.
양방향 대화번역 집합 수집부(100)는 대화 형태의 양방향 대화번역 집합을 수집한다. 여기서, 양방향 대화번역 집합은 제1언어와 제2언어로 이루어진 대화문과 상대방 언어의 번역문으로 구성된 대화들의 집합이다. 이러한, 양방향 대화번역 집합은 대화들의 집합이기에 각 대화의 시작 부분과 끝 부분을 표기되어 각 대화를 구분하는 것을 포함한다.
여기서, 본 발명의 일 실시예에서 수집되는 양방향 대화번역 집합은 제1언어 사용자의 대화문과 그 제1언어 사용자의 대화문을 번역한 것이 바람직하나, 이에 한정하지 않고, 한 언어의 원문과 상대방 언어의 번역문만으로 구성된 단일방향 문장번역 집합도 이용될 수 있다.
자동 번역 지식 학습부(200)는 상기 제1언어-제2언어 양방향 대화번역 집합을 이용하여 제1언어-제2언어 양방향 대화번역 학습 지식을 구축하는 역할을 한다. 본 실시예에서 구축되는 제1언어-제2언어 양방향 대화번역 학습 지식은 제1언어 원문을 제2언어 번역문으로 자동 번역 하도록 학습된 제1언어-제2언어 자동 번역 학습 지식과, 제2언어 원문을 제1언어 번역문으로 자동 번역 하도록 학습된 제2언어-제1언어 자동 번역 학습 지식으로 구성될 수 있다.
번역부(300)는 상기 구축된 제1언어-제2언어 양방향 번역 학습 지식과 대화문맥 관리부를 통해 제공되는 상대방 언어의 대화문맥을 이용하여 상대방 언어로 번역한다.
이러한, 번역부(300)는 제1언어 사용자 단말로부터 제1언어가 입력되면, 상기 구축된 제1언어-제2언어 양방향 대화번역 학습 지식과 대화문맥 관리부(미도시)를 통해 제공되는 제2언어의 대화문맥 정보를 이용하여 제2언어로 번역하고, 반대로 제2언어 사용자 단말로부터 제2언어가 입력되면 상기 구축된 제2언어-제1언어 자동 번역 학습 지식과 대화문맥 관리부(미도시)를 통해 제공되는 제1언어 대화문맥정보를 이용하여 제1언어로 번역하는 역할을 한다.
본 발명의 일 실시예에 따르면, 학습을 통해 상대방 대화 문맥 정보를 저장하고, 학습된 대화 문맥 정보를 이용하여 번역을 수행함으로써, 외국어를 사용하는 상대방과의 대화에 있어 대화 문맥에 사용된 단어와 표현으로 번역할 수 있고, 대화 상대가 보다 상대방 의도를 쉽게 파악할 수 있는 효과가 있다.
한편, 도 2는 도 1에 도시된 자동 번역 지식 학습부의 세부 구성을 설명하기 위한 구성 블록도이다.
도 2에 도시된 바와 같이, 자동 번역 지식 학습부(200)는 제1언어-제2언어 자동 번역 지식 학습부(210), 제2언어-제1언어 자동 번역 지식 학습부(220)를 포함한다.
제1언어-제2언어 자동 번역 지식 학습부(210)는 상기 양방향 대화번역 집합을 이용하여 제1언어-제2언어 양방향 대화번역 학습 지식을 구축하는 역할을 한다.
제2언어-제1언어 자동 번역 지식 학습부(220)는 상기 양방향 대화번역 집합을 이용하여 제2언어-제1언어 양방향 대화번역 학습 지식을 구축하는 역할을 한다.
도 3a는 도 2에 도시된 제1언어-제2언어 자동 번역 지식 학습부의 세부 구성을 설명하기 위한 구성 블록도이다.
도 3a에 도시된 바와 같이, 제1언어-제2언어 자동 번역 지식 학습부(210)는, 제1언어-제2언어 학습 DB 구축부(211), 제1언어-제2언어 단어 구축부(212), 제1언어-제2언어 학습언어 문맥정보 처리부(213) 및 제1언어-제2언어 자동 번역 학습부(214)을 포함한다.
제1언어-제2언어 학습 DB 구축부(211)는 제1언어를 기준으로, 양방향 대화번역 집합을 이용하여 제2언어로 번역하는 제1언어-제2언어 대화 번역 학습용 DB를 구축한다. 여기서, 제1언어-제2언어 대화 번역 학습용 DB는 제1언어 원문, 제2언어 번역문 및 제2언어 대화문맥으로 구성된 트리플(triple) 데이터로 이루어진다. 그리고 제1언어 원문은 제1언어-제2언어 양방향 대화번역 집합에서 제1언어의 문장이고, 제2언어 번역문은 그 원문을 정확하게 번역한 문장이며, 제2언어 대화문맥은 상기 제1언어-제2언어 양방향 대화번역 집합에서 제1언어 원문 이전에 제2언어 원문 문장들을 대화문맥으로 추출한다. 대화 길이가 긴 경우를 대비하여 이전 n개 문장들만으로 한정할 수 있다.
또한, 제1언어-제2언어 단어 구축부(212)는 상기 제1언어-제2언어 대화 번역 학습용 DB에서 제1언어 단어에 대한 제2언어 단어들을 매칭하여 제1언어-제2언어 단어 정렬 DB을 구축한다. 이러한 제1언어-제2언어 단어 구축부(212)는 제1언어-제2언어 대화 번역 학습용 DB로부터 각 원문을 구성하는 원문 단어들과 그 번역문을 구성하는 대역 단어 간의 공기 정보(co-occurrence information) 또는 정렬 정보(alignment information)로 제1언어-제2언어 단어 정렬 DB을 구축한다. 이렇게 구축된 제1언어-제2언어 단어 정렬 DB는 제1언어-제2언어 단어 구축부(212)를 통해 추출된 제1언어 단어에 대한 제2언어 대역 단어와 그 가중치를 가진다.
따라서, 제1언어 단어에 대해 다수개의 제2언어 대역 단어들이 존재하고, 가중치가 높을수록 더 자주 대역 단어로 사용된 것을 의미한다.
한편 제1언어-제2언어 학습언어 문맥정보 처리부(213)은 제1언어를 제2언어로 자동 번역 학습 시, 제1언어-제2언어 대화 번역 학습용 DB에서 제1언어의 원문과 제2언어 대화문맥 문장들을 입력받고, 제1언어-제2언어 단어 정렬 DB에서 제1언어의 원문이 번역될 가능성이 있는 대역어가 제2언어 대화문맥에서 출현하였는가에 대한 정보를 생성한다. 가장 간단한 방법으로 원문 단어 뒤에 대화문맥의 단어로 가장 번역될 가능성이 높은 단어를 표기할 수 있다. 대화문맥의 단어로 가장 번역될 가능성은 먼저 상기 제1언어의 원문의 단어에 대한 상기 제1언어-제2언어 단어 정렬 DB에서의 제2언어 대역어 단어들이 대화문맥 문장들에서의 출현 가중치와 상기 제1언어-제2언어 단어 정렬 DB에서의 제1언어 단어에 대한 제2언어 대역어 가중치의 곱으로 구할 수 있다. 대화문맥에서의 출현한 가중치는 제2언어 대역어가 출현한 빈도를 대화문맥의 전체 단어 출현 빈도로 나누어주면 된다. 만약, 대화문맥에서 제1언어 원문에 가까운 대화문맥의 제2언어 원문에서 출현한 가중치를 높게 하고 멀리 떨어진 제2언어 원문에서 출현한 가중치를 높게 하고자 하면, 그 빈도 Count를 1/n으로 하면 된다. 여기에서 n은 제2언어 단어가 출현한 제2언어 원문이 현재 제1언어 원문과의 거리이다.
그리고 제1언어-제2언어 자동 번역 학습부(214)는 상기 제1언어-제2언어 학습언어 문맥정보 처리부(213)를 통해 정렬된 제1언어의 원문과 대화문맥 상의 제2언어 대역어 정보를 이용하여 제2언어의 번역문이 생성될 수 있도록 신경망이나 통계기반 방법으로 학습한다.
예를 들어, 상기 제1언어-제2언어 양방향 대화 번역 학습용 DB에 한국어 사용자 발화 "난 그를 동아리 회장으로 지명할거야." 이후에 영어 사용자가 "I don't nominate him for the president."를 발화한 양방향 대화가 있어서 한국 사용자 발화와 그 번역문은 제2언어-제1언어 학습용 DB로, 영어 사용자 발화와 그 번역문은 제1언어-제2언어 학습용 DB로 구축될 수 있다.
도 3b는 도 2에 도시된 제2언어-제1언어 자동 번역 지식 학습부의 세부 구성을 설명하기 위한 구성 블록도이다.
도 3b에 도시된 바와 같이, 제2언어-제1언어 자동 번역 지식 학습부(220)는, 제2언어-제1언어 학습 DB 구축부(221), 제2언어-제1언어 단어 구축부(222), 제2언어-제1언어 학습언어 문맥정보 처리부(223) 및 제2언어-제1언어 자동 번역 학습부(224)을 포함한다.
제1언어-제2언어 학습 DB 구축부(221)는 제2언어를 기준으로, 양방향 대화번역 집합을 이용하여 제1언어로 번역하는 제2언어-제1언어 대화 번역 학습용 DB를 구축한다.
또한, 제2언어-제1언어 단어 구축부(222)는 상기 제2언어-제1언어 대화 번역 학습용 DB에서 제2언어 단어에 대한 제1언어 단어들을 매칭하여 제2언어-제1언어 단어 정렬 DB을 구축한다.
한편 제2언어-제1언어 학습언어 문맥정보 처리부(223)은 제2언어를 제1언어로 자동 번역 학습 시, 제2언어-제1언어 대화 번역 학습용 DB에서 제2언어의 원문과 제1언어 대화문맥 문장들을 입력받고, 제2언어-제1언어 단어 정렬 DB에서 제2언어의 원문이 번역될 가능성이 있는 대역어가 제1언어 대화문맥에서 출현하였는가에 대한 정보를 생성한다.
그리고 제2언어-제1언어 자동 번역 학습부(224)는 상기 제2언어-제1언어 학습언어 문맥정보 처리부(223)를 통해 정렬된 제2언어의 원문과 대화문맥 상의 제1언어 대역어 정보를 이용하여 제1언어의 번역문이 생성될 수 있도록 신경망이나 통계기반 방법으로 학습한다.
이와 같이, 도 2의 제2언어-제1언어 자동 번역 지식 학습부는 상기 제1언어-제2언어 자동 번역 지식 학습부와 언어만 반대임에 따라, 각 세부 구성의 기능은 동일하다.
도 4는 도 1의 번역부(300)의 세부 구성을 설명하기 위한 구성 블록도이다.
도 4에 도시된 바와 같이, 번역부(300)는 대화문맥 관리부(310), 제1언어-제2언어 번역부(320) 및 제2언어-제1언어 번역부(330)를 포함한다.
상기 대화문맥 관리부(310)는 제1 언어 사용자 단말과 제2 언어 사용자 단말을 통해 대화하는 각 사용자 언어의 입력문을 대화 순서에 따라 수집하여 대화 문맥을 구성하고, 대화 문맥을 상기 제1언어-제2언어 번역부(320)와 제2언어-제1언어 번역부(330)에 제공하여 상대방 언어 사용자의 이전 대화 문장들을 문맥으로 이용할 수 있도록 한다.
여기서, 상기 제1언어-제2언어 번역부(320)와 제2언어-제1언어 번역부(330)는 처리되는 언어의 번역 방향만 상이할 뿐 그 구체적인 방법은 동일하다.
도 5a는 도 4의 제1언어-제2언어 번역부를 설명하기 위한 구성 블록도이다.
도 5a에 도시된 바와 같이, 제1언어-제2언어 번역부(320)는 제1언어-제2언어 번역 문맥정보 처리부(321) 및 제1언어-제2언어 자동 번역부(322)을 포함한다.
상기 제1언어-제2언어 번역 문맥정보 처리부(321)는 제1언어 사용자로부터 입력된 제1언어 입력문과 상기 대화문맥 관리부(310)에서 저장한 이전 n개의 제2언어 사용자의 대화문장들을 입력으로 하여, 제1언어의 원문이 번역될 가능성이 있는 대역어가 제2언어 대화문맥(제2언어 사용자의 이전 n개의 대화문장들)에서 출현하였는가에 대한 정보를 생성한다.
상기 제1언어-제2언어 자동 번역부(322)는 상기 제1언어-제2언어 번역 문맥정보 처리부(321)를 통해 정렬된 제1언어의 원문과 대화문맥 상의 제2언어 대역어 정보 및 상기 제1언어-제2언어 자동 번역 지식 학습부(210)에서 학습한 제1언어-제2언어 자동 번역 학습 지식을 이용하여 제1언어의 원문에 대한 제2언어의 번역문을 상기 제1언어-제2언어 자동 번역 지식 학습부(210)에서 학습한 신경망이나 통계기반 방법에 따라 생성한다. 예를 들어, 한국어 사용자 발화 "난 그를 동아리 회장으로 지명할거야." 이후에 영어 사용자가 "I don't nominate him for the president."를 발화하여 번역할 수 있다.
이럴 경우, 제1언어-제2언어 번역 문맥정보 처리부(321)는 제1언어 원문으로 "I don't nominate him for the president."을, 제2언어 대화문맥으로 "난 그를 동아리 회장으로 지명할거야."를 대화문맥 관리부(310)으로부터 입력으로 받아들여서 제1언어 원문+제2언어 문맥정보 "I +나 don't +@ nominate +지명하 him +그 for +@ the +@ president +회장. +@ sent +ㄹ거야"를 생성할 수 있다.
학습과정에서 본 발명에서 의도한 대로 잘 학습되었다면, "president +@"인 경우는 "대통령"으로 번역될 것이고 "president +회장"인 경우는 "회장"으로 번역될 것이다.
또한, "sent +ㄹ거야" 정보에 의해서 대화체 문맥에서 영어의 평서형이 자주 한국어로 번역될 때에 앞에 사용한 어미 정보를 활용되었다면, 전체 문장이 "나는 그를 회장으로 지명하지 않는다."보다는 "나는 그를 회장으로 지명하지 않을거야."로 번역될 수 있다.
도 6에 도시된 바와 같이, 양방향 대화번역 집합 수집부(100)는 제1언어 사용자 단말과 제2언어 사용자 단말의 대화 문장들과 상기 각 언어의 원문에 대한 상대방 언어의 번역문이 존재하며, 대화의 처음과 끝이 표시되어 있는 제1언어-제2언어 양방향 대화번역 집합을 수집한다.
양방향 대화번역 집합 수집부(100)는 양방향 대화 번역 수집부(110)와 단일언어 문서 번역 변환부(120) 및 번역문장 변환부(130)를 포함한다.
양방향 대화 번역 수집부(110)는 제1언어 사용자 단말과 제2언어 사용자 단말 간의 대화 원문이 있고, 각 원문에 대한 상대방 번역문을 작성되어 있는 제1언어-제2언어 대화문과 번역문으로 구축된 대화를 입력으로 받아서, 원문과 그 상대방 언어의 번역문으로 구성된 양방향 대화를 대화 시작과 끝이 표시하여 대화문맥의 범위를 표시한 제1언어-제2언어 양방향 대화 번역 문장 집합을 구축한다.
단일언어 문서 번역 변환부(120)는 제1언어나 제2언어 중 하나의 언어로 작성된 문서와 그 상대 언어로 번역된 문장들로 구성된 단일언어 문서 문장 및 번역문 집합을 입력으로 받아, 각 언어의 상대방 대화문맥을 문서의 이전 문장들의 상대방 언어의 문장(원문이나 번역문)들로 표기하여 제1언어-제2언어 양방향 대화 번역 문장 집합으로 변환한다.
번역문장 변환부(130)는 제1언어나 제2언어 중 하나의 언어로 작성된 문장과 번역문으로만 구성되어 이전 문맥이 없는 형태의 단일언어 문장 및 번역문 집합을 입력으로 받아, 각 문장의 상대방 대화문맥을 자신의 번역 문장으로 표기하여 제1언어-제2언어 양방향 대화 번역 문장 집합으로 변환한다.
양방향 대화번역 집합 수집부(100)에서 단일언어 문서 번역 변환부(120)과 번역문장 변환부(130)는 제1언어-제2언어 대화와 그 번역문들을 갖춘 양방향 대화번역 집합을 학습하기에 충분히 모으지 못할 경우에 사용하여 학습 집합 부족 문제를 해결하는데 사용한다.
도 5b는 도 4의 제2언어-제1언어 번역부를 설명하기 위한 구성 블록도이다. 도 5b에 도시된 바와 같이, 제2언어-제1언어 번역부(330)는 제2언어-제1언어 번역 문맥정보 처리부(331)과 제2언어-제1언어 자동 번역부(332)를 포함한다.
제2언어-제1언어 번역 문맥정보 처리부(331)는 제2언어 사용자로부터 입력된 제2언어 입력문과 상기 대화문맥 관리부에서 저장한 이전 n개의 제1언어 사용자의 대화문장들을 입력으로 하여, 제2언어의 원문이 번역될 가능성이 있는 대역어가 제1언어 대화문맥(제1언어 사용자의 이전 n개의 대화문장들)에서 출현하였는가에 대한 정보를 생성한다.
제2언어-제1언어 자동 번역부(332)는 상기 제2언어-제1언어 번역 문맥정보 처리부(331)를 통해 정렬된 제2언어의 원문과 대화문맥 상의 제1언어 대역어 정보 및 상기 제2언어-제1언어 자동 번역 지식 학습부에서 학습한 제2언어-제1언어 자동 번역 학습 지식을 이용하여 제2언어의 원문에 대한 제1언어의 번역문을 상기 제2언어-제1언어 자동 번역 지식 학습부에서 학습한 신경망이나 통계기반 방법에 따라 생성한다.
도 7은 본 발명의 일 실시예에 따른 대화문맥 학습 기반 자동 번역 방법을 설명하기 위한 순서도이다.
이하, 하기에서는 본 발명의 일 실시예에 따른 대화문맥 학습 기반 자동 번역 방법에 대하여 도 7을 참조하여 설명하기로 한다.
이러한, 대화문맥 학습 기반 자동 번역 방법은 대화문맥 학습 기반 자동 번역 장치의 세부 구성에 의해 수행되는 것이 바람직하다.
먼저, 양방향 대화번역 집합 수집부(100)를 통해, 대화 형태의 양방향 대화번역 집합을 수집한다(S100). 여기서, 양방향 대화번역 집합은 제1언어와 제2언어로 이루어진 대화문과 상대방 언어의 번역문으로 구성된 대화들의 집합이다. 양방향 대화번역 집합은 대화들의 집합이기에 각 대화의 시작 부분과 끝 부분을 표기되어 각 대화를 구분하는 것을 포함한다. 그리고 본 발명의 일 실시예에서 수집되는 양방향 대화번역 집합은 제1언어 사용자 단말과 제2언어 사용자 단말의 대화문과 그것을 번역한 것이 바람직하나, 이에 한정하지 않고 한 언어의 원문과 상대방 언어의 번역문만으로 구성된 단일방향 문장번역 집합도 이용될 수도 있다.
이어서, 자동 번역 지식 학습부(200)는 제1언어-제2언어 양방향 대화번역 집합을 이용하여 제1언어-제2언어 양방향 대화번역 학습 지식을 구축한다(S200). 본 실시예에서 구축되는 제1언어-제2언어 양방향 대화 번역 학습 학습 지식은 제1언어 원문을 제2언어 번역문으로 자동 번역하도록 학습된 제1언어-제2언어 자동 번역 학습 지식과, 제2언어 원문을 제1언어 번역문으로 자동 번역하도록 학습된 제2언어-제1언어 자동 번역 학습 지식으로 구성된다.
이와 같이, 제1언어-제2언어 양방향 대화번역 학습 지식을 구축하는 단계(S200)는 자동 번역 지식 학습부(200)의 제1언어-제2언어 학습 DB 구축부(211)를 이용하여, 제1언어를 기준으로, 제2언어의 번역하는 제1언어-제2언어 대화 번역 학습용 DB를 구축한다. 여기서, 제1언어-제2언어 대화 번역 학습용 DB는 제1언어 원문, 제2언어 번역문 및 제2언어 대화문맥으로 구성된 트리플(triple) 데이터로 이루어진다. 그리고 제1언어 원문은 제1언어-제2언어 양방향 대화번역 집합에서 제1언어의 문장이고, 제2언어 번역문은 그 원문을 정확하게 번역한 문장이다. 여기서, 제2언어 대화문맥은 상기 제1언어-제2언어 양방향 대화번역 집합에서 제1언어 원문 이전에 제2언어 원문 문장들을 대화문맥으로 추출한다. 대화 길이가 긴 경우를 대비하여 이전 n개 문장들만으로 한정할 수 있다.
이후, 제1언어-제2언어 자동 번역 학습부(214)는 제1언어-제2언어 학습언어 문맥정보 처리부(213)를 통해 정렬된 제1언어의 원문과 대화문맥 상의 제2언어 대역어 정보를 이용하여 제2언어의 번역문이 생성될 수 있도록 신경망이나 통계기반 방법으로 학습한다. 예를 들어, 상기 제1언어-제2언어 양방향 대화 번역 학습용 DB에 한국어 사용자 발화 "난 그를 동아리 회장으로 지명할거야." 이후에 영어 사용자가 "I don't nominate him for the president."를 발화한 양방향 대화가 있어서 한국 사용자 발화와 그 번역문은 제2언어-제1언어 학습용 DB로, 영어 사용자 발화와 그 번역문은 제1언어-제2언어 학습용 DB로 구축될 수 있다. 이럴 경우, 제1언어-제2언어 학습용 DB에는 제 1언어 원문으로 "I don't nominate him for the president."을, 제2언어 번역문으로 “나는 그를 회장으로 지명하지 않을거야.”를, 제2언어 대화문맥으로 "난 그를 동아리 회장으로 지명할거야."를 트리플로 저장된다. 이때, 대화문맥은 1 문장만을 둔 것이다.
또한, 제1언어-제2언어 양방향 대화번역 학습 지식을 구축하는 단계(S200)는 자동 번역 지식 학습부(200)의 제2언어-제1언어 학습 DB 구축부(221)를 이용하여, 제2언어를 기준으로, 제1언어의 번역하는 제2언어-제1언어 대화 번역 학습용 DB를 구축할 수 있다.
이후, 제2언어-제1언어 자동 번역 학습부(224)는 제2언어-제1언어 학습언어 문맥정보 처리부(223)를 통해 정렬된 제2언어의 원문과 대화문맥 상의 제1언어 대역어 정보를 이용하여 제1언어의 번역문이 생성될 수 있도록 신경망이나 통계기반 방법으로 학습한다.
이후, 번역부(300)는 제1언어 사용자 단말로부터 제1언어가 입력되면, 상기 구축된 제1언어-제2언어 자동 번역 학습 지식과 대화문맥 관리부(미도시)를 통해 제공되는 제2언어 대화문맥정보를 이용하여 제2언어로 번역한다(S300). 한편, 번역부(300)는 제2언어 사용자 단말로부터 제2언어가 입력되면, 상기 구축된 제2언어-제1언어 자동 번역 학습 지식과 대화문맥 관리부(미도시)를 통해 제공되는 제1언어 대화문맥정보를 이용하여 제1언어로 번역한다.
본 발명의 일 실시예에 따르면, 학습을 통해 상대방 대화 문맥 정보를 저장하고, 학습된 대화 문맥 정보를 이용하여 번역을 수행함으로써, 외국어를 사용하는 상대방과의 대화에 있어 대화 문맥에 사용된 단어와 표현으로 번역할 수 있고, 대화 상대가 보다 상대방 의도를 쉽게 파악할 수 있는 효과가 있다.
이하, 하기에서는 본 발명의 일 실시예에 따른 입력되는 제1언어를 제2언어 대화문맥정보를 이용하여 제2언어로 번역하는 단계(S300)에 대하여 도 8를 참조하여 설명하기로 한다.
먼저, 대화문맥 관리부(310)는 제1 언어 사용자와 제2 언어 사용자가 대화하는 각 사용자 언어의 입력문을 대화 순서에 따라 수집하여 대화 문맥을 구성한다(S310). 이어서, 대화문맥 관리부(310)는 대화 문맥을 상기 제1언어-제2언어 번역부(320)와 제2언어-제1언어 번역부(330)에 제공하여 상대방 언어 사용자의 이전 대화 문장들을 문맥으로 이용할 수 있도록 제공한다(S320).
이후, 상기 제1언어-제2언어 번역부(320)는 제1언어 사용자 단말로부터 제1언어가 입력되면, 상기 구축된 제1언어-제2언어 양방향 대화번역 학습 지식과 대화문맥 관리부를 통해 제공되는 제2언어의 대화문맥 정보를 이용하여 제2언어로 번역한다(S330).
그리고, 상기 제2언어-제1언어 번역부(330)는 제2언어 사용자 단말로부터 제2언어가 입력되면, 상기 구축된 제2언어-제1언어 양방향 대화번역 학습 지식과 대화문맥 관리부를 통해 제공되는 제1언어의 대화문맥 정보를 이용하여 제1언어로 번역한다(S340).
이러한, 본 발명의 일 실시예에 따르면, 학습을 통해 상대방 대화 문맥 정보를 저장하고, 학습된 대화 문맥 정보를 이용하여 번역을 수행함으로써, 외국어를 사용하는 상대방과의 대화에 있어 대화 문맥에 사용된 단어와 표현으로 번역할 수 있고, 대화 상대가 보다 상대방 의도를 쉽게 파악할 수 있는 효과가 있다.
한편, 도 9은 본 발명의 일 실시예에 따른 상기 대화 형태의 양방향 대화번역 집합을 수집하는 단계(S100)를 설명하기 위한 순서도이다.
도 9에 도시된 바와 같이, 양방향 대화 번역 수집부(110)는 제1언어 사용자 단말과 제2언어 사용자 단말 간의 대화 원문이 있고, 각 원문에 대한 상대방 번역문을 작성되어 있는 제1언어-제2언어 대화문과 번역문으로 구축된 대화를 입력으로 받아서, 원문과 그 상대방 언어의 번역문으로 구성된 양방향 대화를 대화 시작과 끝이 표시하여 대화문맥의 범위를 표시한 제1언어-제2언어 양방향 대화 번역 문장 집합을 구축한다(S110).
단일언어 문서 번역 변환부(120)는 제1언어나 제2언어 중 하나의 언어로 작성된 문서와 그 상대 언어로 번역된 문장들로 구성된 단일언어 문서 문장 및 번역문 집합을 입력으로 받아, 각 언어의 상대방 대화문맥을 문서의 이전 문장들의 상대방 언어의 문장(원문이나 번역문)들로 표기하여 제1언어-제2언어 양방향 대화 번역 문장 집합으로 변환한다(S120).
번역문장 변환부(130)는 제1언어나 제2언어 중 하나의 언어로 작성된 문장과 번역문으로만 구성되어 이전 문맥이 없는 형태의 단일언어 문장 및 번역문 집합을 입력으로 받아, 각 문장의 상대방 대화문맥을 자신의 번역 문장으로 표기하여 제1언어-제2언어 양방향 대화 번역 문장 집합으로 변환한다(S130).
이상, 본 발명의 구성에 대하여 첨부 도면을 참조하여 상세히 설명하였으나, 이는 예시에 불과한 것으로서, 본 발명이 속하는 기술분야에 통상의 지식을 가진자라면 본 발명의 기술적 사상의 범위 내에서 다양한 변형과 변경이 가능함은 물론이다. 따라서 본 발명의 보호 범위는 전술한 실시예에 국한되어서는 아니 되며 이하의 특허청구범위의 기재에 의하여 정해져야 할 것이다.
100 : 양방향 대화번역 집합 수집부 110 : 양방향 대화 번역 수집부
120 : 단일언어 문서 번역 변환부 130 : 번역문장 변환부
200 : 자동 번역 지식 학습부
210 : 제1언어-제2언어 자동 번역 지식 학습부
220 : 제2언어-제1언어 자동 번역 지식 학습부
300 : 번역부 310 : 대화문맥 관리부
320 : 제1언어-제2언어 번역부 330 : 제2언어-제1언어 번역부

Claims (19)

  1. 대화 형태의 양방향 대화번역 집합을 수집하는 양방향 대화번역 집합 수집부;
    상기 양방향 대화번역 집합을 이용하여 제1언어-제2언어 양방향 대화번역 학습 지식을 구축하는 자동 번역 지식 학습부; 및
    상기 구축된 제1언어-제2언어 양방향 번역 학습 지식과 대화문맥 관리부를 통해 제공되는 상대방 언어의 대화문맥을 이용하여 상대방 언어로 번역하는 번역부;를 포함하는 대화문맥 학습 기반 자동 번역 장치.
  2. 제 1항에 있어서,
    상기 번역부는,
    제1언어 사용자 단말로부터 제1언어가 입력되면, 상기 구축된 제1언어-제2언어 양방향 대화번역 학습 지식과 대화문맥 관리부를 통해 제공되는 제2언어의 대화문맥 정보를 이용하여 제2언어로 번역하고,
    제2언어 사용자 단말로부터 제2언어가 입력되면, 상기 구축된 제1언어-제2언어 양방향 대화번역 학습 지식과 대화문맥 관리부를 통해 제공되는 제1언어의 대화문맥 정보를 이용하여 제1언어로 번역하는 것인 대화문맥 학습 기반 자동 번역 장치.
  3. 제 1항에 있어서,
    상기 자동 번역 지식 학습부는,
    제1언어 원문을 제2언어 번역문으로 자동 번역 하도록 학습된 제1언어-제2언어 자동 번역 학습 지식과,
    제2언어 원문을 제1언어 번역문으로 자동 번역 하도록 학습된 제2언어-제1언어 자동 번역 학습 지식으로 구성된 것을 특징으로 하는 대화문맥 학습 기반 자동 번역 장치.
  4. 제 3항에 있어서,
    상기 자동 번역 지식 학습부는,
    상기 학습언어 문맥정보 처리부를 통해 정렬된 제1언어의 원문과 대화문맥 상의 제2언어 대역어 정보를 이용하여 제2언어의 번역문이 생성될 수 있도록 신경망이나 통계기반 방법으로 학습하는 제1언어-제2언어 자동 번역 학습부; 및
    상기 학습언어 문맥정보 처리부를 통해 정렬된 제2언어의 원문과 대화문맥 상의 제1언어 대역어 정보를 이용하여 제1언어의 번역문이 생성될 수 있도록 신경망이나 통계기반 방법으로 학습하는 제2언어-제1언어 자동 번역 학습부;를 포함하는 대화문맥 학습 기반 자동 번역 장치.
  5. 제 1항에 있어서,
    상기 번역부는,
    제1언어-제2언어 번역부;
    제2언어-제1언어 번역부; 및
    제1 언어 사용자와 제2 언어 사용자가 대화하는 각 사용자 언어의 입력문을 대화 순서에 따라 수집하여 대화 문맥을 구성하고, 대화 문맥을 상기 제1언어-제2언어 번역부와 제2언어-제1언어 번역부에 제공하여 상대방 언어 사용자의 이전 대화 문장들을 문맥으로 이용할 수 있도록 지원하는 대화문맥 관리부;를 포함하는 대화문맥 학습 기반 자동 번역 장치.
  6. 제 4항에 있어서,
    상기 제1언어-제2언어 번역부는,
    제1언어 사용자로부터 입력된 제1언어 입력문과 상기 대화문맥 관리부에서 저장한 이전 n개의 제2언어 사용자의 대화문장들을 입력으로 하여, 제1언어의 원문이 번역될 가능성이 있는 대역어가 제2언어 대화문맥(제2언어 사용자의 이전 n개의 대화문장들)에서 출현하였는가에 대한 정보를 생성하는 제1언어-제2언어 번역 문맥정보 처리부; 및
    상기 제1언어-제2언어 번역 문맥정보 처리부를 통해 정렬된 제1언어의 원문과 대화문맥 상의 제2언어 대역어 정보 및 상기 제1언어-제2언어 자동 번역 지식 학습부에서 학습한 제1언어-제2언어 자동 번역 학습 지식을 이용하여 제1언어의 원문에 대한 제2언어의 번역문을 상기 제1언어-제2언어 자동 번역 지식 학습부에서 학습한 신경망이나 통계기반 방법에 따라 생성하는 제1언어-제2언어 자동 번역부;를 포함하는 대화문맥 학습 기반 자동 번역 장치.
  7. 제 4항에 있어서,
    상기 제2언어-제1언어 번역부는,
    제2언어 사용자로부터 입력된 제2언어 입력문과 상기 대화문맥 관리부에서 저장한 이전 n개의 제1언어 사용자의 대화문장들을 입력으로 하여, 제2언어의 원문이 번역될 가능성이 있는 대역어가 제1언어 대화문맥(제1언어 사용자의 이전 n개의 대화문장들)에서 출현하였는가에 대한 정보를 생성하는 제2언어-제1언어 번역 문맥정보 처리부; 및
    상기 제2언어-제1언어 번역 문맥정보 처리부를 통해 정렬된 제2언어의 원문과 대화문맥 상의 제1언어 대역어 정보 및 상기 제2언어-제1언어 자동 번역 지식 학습부에서 학습한 제2언어-제1언어 자동 번역 학습 지식을 이용하여 제2언어의 원문에 대한 제1언어의 번역문을 상기 제2언어-제1언어 자동 번역 지식 학습부에서 학습한 신경망이나 통계기반 방법에 따라 생성하는 제2언어-제1언어 자동 번역부;를 포함하는 대화문맥 학습 기반 자동 번역 장치.
  8. 제 1항에 있어서,
    상기 양방향 대화번역 집합 수집부는,
    제1언어 사용자 단말과 제2언어 사용자 단말 간의 대화 원문이 있고, 각 원문에 대한 상대방 번역문을 작성되어 있는 제1언어-제2언어 대화문과 번역문으로 구축된 대화를 입력으로 받아서, 원문과 그 상대방 언어의 번역문으로 구성된 양방향 대화를 대화 시작과 끝이 표시하여 대화문맥의 범위를 표시한 제1언어-제2언어 양방향 대화 번역 문장 집합을 구축하는 양방향 대화 번역 수집부;
    제1언어나 제2언어 중 하나의 언어로 작성된 문서와 그 상대 언어로 번역된 문장들로 구성된 단일언어 문서 문장 및 번역문 집합을 입력으로 받아, 각 언어의 상대방 대화문맥을 문서의 이전 문장들의 상대방 언어의 문장(원문이나 번역문)들로 표기하여 제1언어-제2언어 양방향 대화 번역 문장 집합으로 변환하는 단일언어 문서 번역 변환부; 및
    제1언어나 제2언어 중 하나의 언어로 작성된 문장과 번역문으로만 구성되어 이전 문맥이 없는 형태의 단일언어 문장 및 번역문 집합을 입력으로 받아, 각 문장의 상대방 대화문맥을 자신의 번역 문장으로 표기하여 제1언어-제2언어 양방향 대화 번역 문장 집합으로 변환하는 번역문장 변환부를 포함하는 대화문맥 학습 기반 자동 번역 장치.
  9. 양방향 대화번역 집합 수집부를 통해, 대화 형태의 양방향 대화번역 집합을 수집하는 단계;
    자동 번역 지식 학습부를 통해 제1언어-제2언어 양방향 대화번역 집합을 이용하여 제1언어-제2언어 양방향 대화번역 학습 지식을 구축하는 단계; 및
    번역부를 통해 제1언어 사용자 단말로부터 제1언어가 입력되면, 상기 구축된 제1언어-제2언어 자동 번역 학습 지식과 대화문맥 관리부를 통해 제공되는 제2언어 대화문맥정보를 이용하여 제2언어로 번역하는 단계;를 포함하는 대화문맥 학습 기반 자동 번역 방법.
  10. 제 9항에 있어서,
    상기 번역하는 단계는,
    제2언어 사용자 단말로부터 제2언어가 입력되면, 상기 구축된 제1언어-제2언어 양방향 대화번역 학습 지식과 대화문맥 관리부를 통해 제공되는 제1언어의 대화문맥 정보를 이용하여 제1언어로 번역하는 것인 대화문맥 학습 기반 자동 번역 방법.
  11. 제 9항에 있어서,
    상기 제1언어-제2언어 양방향 대화번역 학습 지식을 구축하는 단계는,
    제1언어 원문을 제2언어 번역문으로 자동 번역 하도록 학습된 제1언어-제2언어 자동 번역 학습 지식과,
    제2언어 원문을 제1언어 번역문으로 자동 번역 하도록 학습된 제2언어-제1언어 자동 번역 학습 지식으로 구성된 것을 특징으로 하는 대화문맥 학습 기반 자동 번역 방법.
  12. 제 9항에 있어서,
    상기 제1언어-제2언어 양방향 대화번역 학습 지식을 구축하는 단계는,
    제1언어-제2언어 자동 번역 학습부는 상기 학습언어 문맥정보 처리부를 통해 정렬된 제1언어의 원문과 대화문맥 상의 제2언어 대역어 정보를 이용하여 제2언어의 번역문이 생성될 수 있도록 신경망이나 통계기반 방법으로 학습하는 단계; 및
    제2언어-제1언어 자동 번역 학습부는 상기 학습언어 문맥정보 처리부를 통해 정렬된 제2언어의 원문과 대화문맥 상의 제1언어 대역어 정보를 이용하여 제1언어의 번역문이 생성될 수 있도록 신경망이나 통계기반 방법으로 학습하는 단계;를 포함하는 대화문맥 학습 기반 자동 번역 방법.
  13. 제 9항에 있어서,
    상기 번역하는 단계는,
    대화문맥 관리부를 통해, 제1 언어 사용자와 제2 언어 사용자가 대화하는 각 사용자 언어의 입력문을 대화 순서에 따라 수집하여 대화 문맥을 구성하는 단계;
    대화 문맥을 상기 제1언어-제2언어 번역부와 제2언어-제1언어 번역부에 제공하여 상대방 언어 사용자의 이전 대화 문장들을 문맥으로 이용할 수 있도록 지원하는 단계;를 포함하는 대화문맥 학습 기반 자동 번역 방법.
  14. 제 13항에 있어서,
    상기 번역하는 단계는,
    제1언어-제2언어 번역 문맥정보 처리부를 통해, 제1언어 사용자로부터 입력된 제1언어 입력문과 상기 대화문맥 관리부에서 저장한 이전 n개의 제2언어 사용자의 대화문장들을 입력으로 하여, 제1언어의 원문이 번역될 가능성이 있는 대역어가 제2언어 대화문맥에서 출현하였는가에 대한 정보를 생성하는 단계; 및
    제1언어-제2언어 자동 번역부를 통해, 상기 제1언어-제2언어 번역 문맥정보 처리부를 통해 정렬된 제1언어의 원문과 대화문맥 상의 제2언어 대역어 정보 및 상기 제1언어-제2언어 자동 번역 지식 학습부에서 학습한 제1언어-제2언어 자동 번역 학습 지식을 이용하여 제1언어의 원문에 대한 제2언어의 번역문을 상기 제1언어-제2언어 자동 번역 지식 학습부에서 학습한 신경망이나 통계기반 방법에 따라 생성하는 단계;를 포함하는 대화문맥 학습 기반 자동 번역 방법.
  15. 제 13항에 있어서,
    상기 번역하는 단계는,
    제2언어-제1언어 번역 문맥정보 처리부를 통해, 제2언어 사용자로부터 입력된 제2언어 입력문과 상기 대화문맥 관리부에서 저장한 이전 n개의 제1언어 사용자의 대화문장들을 입력으로 하여, 제2언어의 원문이 번역될 가능성이 있는 대역어가 제1언어 대화문맥에서 출현하였는가에 대한 정보를 생성하는 단계; 및
    제2언어-제1언어 자동 번역부를 통해, 상기 제2언어-제1언어 번역 문맥정보 처리부를 통해 정렬된 제2언어의 원문과 대화문맥 상의 제1언어 대역어 정보 및 상기 제2언어-제1언어 자동 번역 지식 학습부에서 학습한 제2언어-제1언어 자동 번역 학습 지식을 이용하여 제2언어의 원문에 대한 제1언어의 번역문을 상기 제2언어-제1언어 자동 번역 지식 학습부에서 학습한 신경망이나 통계기반 방법에 따라 생성하는 단계;를 포함하는 대화문맥 학습 기반 자동 번역 방법.
  16. 제 9항에 있어서,
    상기 제1언어-제2언어 양방향 대화번역 학습 지식을 구축하는 단계는,
    제1언어-제2언어 대화 번역 학습용 DB 구축부를 통해, 제1언어를 기준으로, 제2언어의 번역하는 제1언어-제2언어 대화 번역 학습용 DB를 구축하는 단계; 및
    제1언어-제2언어 학습언어 문맥정보 처리부를 통해, 정렬된 제1언어의 원문과 대화문맥 상의 제2언어 대역어 정보를 이용하여 제2언어의 번역문이 생성될 수 있도록 신경망이나 통계기반 방법으로 학습하는 단계;를 포함하는 대화문맥 학습 기반 자동 번역 방법.
  17. 제 16항에 있어서,
    상기 제2언어의 번역하는 제1언어-제2언어 대화 번역 학습용 DB를 구축하는 단계는,
    제1언어-제2언어 대화 번역 학습용 DB는 제1언어 원문, 제2언어 번역문 및 제2언어 대화문맥으로 구성된 트리플(triple) 데이터로 이루어진 대화문맥 학습 기반 자동 번역 방법.
  18. 제 17항에 있어서,
    상기 제2언어 대화문맥은 상기 제1언어-제2언어 양방향 대화번역 집합에서 제1언어 원문 이전에 제2언어 원문 문장들을 대화문맥으로 추출하는 것인 대화문맥 학습 기반 자동 번역 방법.
  19. 제 9항에 있어서,
    상기 양방향 대화번역 집합은,
    제1언어와 제2언어로 이루어진 대화문과 상대방 언어의 번역문으로 구성된 대화들의 집합인 대화문맥 학습 기반 자동 번역 방법.
KR1020190060202A 2019-05-22 2019-05-22 대화문맥 학습 기반 자동 번역 장치 및 방법 KR20200134573A (ko)

Priority Applications (2)

Application Number Priority Date Filing Date Title
KR1020190060202A KR20200134573A (ko) 2019-05-22 2019-05-22 대화문맥 학습 기반 자동 번역 장치 및 방법
US16/852,791 US20200372226A1 (en) 2019-05-22 2020-04-20 Conversation contextual learning-based automatic translation device and method

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020190060202A KR20200134573A (ko) 2019-05-22 2019-05-22 대화문맥 학습 기반 자동 번역 장치 및 방법

Publications (1)

Publication Number Publication Date
KR20200134573A true KR20200134573A (ko) 2020-12-02

Family

ID=73457222

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020190060202A KR20200134573A (ko) 2019-05-22 2019-05-22 대화문맥 학습 기반 자동 번역 장치 및 방법

Country Status (2)

Country Link
US (1) US20200372226A1 (ko)
KR (1) KR20200134573A (ko)

Also Published As

Publication number Publication date
US20200372226A1 (en) 2020-11-26

Similar Documents

Publication Publication Date Title
US10073843B1 (en) Method and apparatus for cross-lingual communication
US9753914B2 (en) Natural expression processing method, processing and response method, device, and system
KR101694286B1 (ko) 양방향 자동 통역 및 번역 서비스 제공 장치 및 그 방법
US9646001B2 (en) Machine translation (MT) based spoken dialog systems customer/machine dialog
WO2019165748A1 (zh) 一种语音翻译方法及装置
KR102445519B1 (ko) 대화형 지능 서비스 제공 챗봇 제작 시스템 및 방법
CN109256133A (zh) 一种语音交互方法、装置、设备及存储介质
JP2017120616A (ja) 機械翻訳方法、及び、機械翻訳システム
KR20190041147A (ko) 사용자 맞춤형 통번역 장치 및 방법
US20180288109A1 (en) Conference support system, conference support method, program for conference support apparatus, and program for terminal
US20210342553A1 (en) Dialogue data generation device, dialogue data generation method, and program
US20190012313A1 (en) Speech converter
CN116933806A (zh) 一种同传翻译系统及同传翻译终端
CN104217039A (zh) 一种将电话对话实时记录并转化陈述句的方法和系统
WO2019142976A1 (ko) 사용자 발화 입력에 대한 대화 응답 후보를 표시하도록 하는 디스플레이 제어 방법, 컴퓨터 판독가능 기록 매체 및 컴퓨터 장치
KR20210068790A (ko) 수화통역 시스템
KR20200134573A (ko) 대화문맥 학습 기반 자동 번역 장치 및 방법
KR20050052943A (ko) 여행자용 키워드 기반 음성번역 시스템 및 그 방법
US20170185587A1 (en) Machine translation method and machine translation system
Ansari et al. Multilingual speech to speech translation system in bluetooth environment
KR20200081925A (ko) 음성인식 교감형 로봇, 교감형 로봇 음성인식 시스템 및 그 방법
WO2021218750A1 (en) System and method for translating sign language
JP6985311B2 (ja) 相槌判定によって応答発話生成を制御する対話実施プログラム、装置及び方法
JP2016151718A (ja) 簡易通訳装置
KR20220030448A (ko) 언어 대응 화상 출력 장치, 방법 및 시스템

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal