KR20140079598A - 문맥 검증 장치 및 방법 - Google Patents

문맥 검증 장치 및 방법 Download PDF

Info

Publication number
KR20140079598A
KR20140079598A KR1020120147536A KR20120147536A KR20140079598A KR 20140079598 A KR20140079598 A KR 20140079598A KR 1020120147536 A KR1020120147536 A KR 1020120147536A KR 20120147536 A KR20120147536 A KR 20120147536A KR 20140079598 A KR20140079598 A KR 20140079598A
Authority
KR
South Korea
Prior art keywords
word
input
translation
user
unitary
Prior art date
Application number
KR1020120147536A
Other languages
English (en)
Inventor
김창현
권오욱
나승훈
노윤형
서영애
양성일
이기영
정상근
최승권
김운
박은진
신종훈
황금하
박상규
Original Assignee
한국전자통신연구원
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 한국전자통신연구원 filed Critical 한국전자통신연구원
Priority to KR1020120147536A priority Critical patent/KR20140079598A/ko
Priority to US14/040,036 priority patent/US20140172411A1/en
Publication of KR20140079598A publication Critical patent/KR20140079598A/ko

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F15/00Digital computers in general; Data processing equipment in general
    • G06F15/16Combinations of two or more digital computers each having at least an arithmetic unit, a program unit and a register, e.g. for a simultaneous processing of several programs
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/40Processing or translation of natural language
    • G06F40/51Translation evaluation

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Computer Hardware Design (AREA)
  • Software Systems (AREA)
  • Machine Translation (AREA)

Abstract

본 발명은 사용자의 의사를 통해 입력문의 중의적 표현을 검증하고 검증된 표현을 통번역시 문맥으로 활용하는 문맥 검증 장치 및 방법에 관한 것이다. 이를 위한 본 발명의 구성은 사용자의 입력에 따라 제1 입력문 또는 제1 입력문에 대한 역번역문에서 중의적 표현을 검증하는 중의적 표현 검증부; 검증된 중의적 표현을 문맥으로 생성하는 문맥 생성부; 및 생성된 문맥이 제1 입력문 또는 제1 입력문 이후에 입력되는 제2 입력문들을 번역하거나 통역하는 데에 적용되도록 제어하는 문맥 제어부를 포함하는 것을 특징으로 한다. 본 발명에 따르면, 양방향 자동 통번역 장치의 통번역 품질을 개선하고 대화 상대자와의 의사 소통을 질적 및 시간적으로 개선시킬 수 있다.

Description

문맥 검증 장치 및 방법 {Apparatus and method for verifying context}
본 발명은 통번역을 위한 문맥을 검증하는 장치 및 방법에 관한 것이다. 보다 상세하게는, 양방향 자동 통번역을 위한 문맥을 검증하는 장치 및 방법에 관한 것이다.
종래 출시되어 있는 자동 통번역 장치는 자국어를 외국어로 번역하는 기기와 외국어를 자국어로 번역해주는 기기가 각각 독립적으로 작동하는 것이다. 그래서 외국인의 대화를 자국어로 통번역할 때나 자신의 대화를 외국어로 통번역할 때 상대방과의 대화 내용과는 관계없이 각각 독립적으로 통번역한다. 이러한 이유로 종래 자동 통번역 장치는 전체적인 대화의 흐름에 부합하는 문맥을 활용하지 못하는 문제점이 있으며, 부적합한 문맥을 통번역시 적용함으로써 통번역에 오류가 발생하는 문제점이 있다.
최근 들어 상기한 문제점을 해결하기 위한 방안으로 양방향 대화 문맥을 모두 활용하는 자동 통번역 장치가 제안되고 있다. 그러나 이러한 자동 통번역 장치는 사용자의 의중이 잘못 반영된 중의어를 문맥으로 활용함으로써 통번역에 오류가 발생하는 문제점이 있으며, 이로 인해 의사소통이 단절되는 등의 문제점도 발생될 수 있다.
본 발명은 상기한 문제점을 해결하기 위해 안출된 것으로서, 사용자의 의사를 통해 입력문의 중의적 표현을 검증하고 검증된 표현을 통번역시 문맥으로 활용하는 문맥 검증 장치 및 방법을 제안함을 목적으로 한다.
그러나 본 발명의 목적은 상기에 언급된 사항으로 제한되지 않으며, 언급되지 않은 또 다른 목적들은 아래의 기재로부터 당업자에게 명확하게 이해될 수 있을 것이다.
본 발명은 상기한 목적을 달성하기 위해 안출된 것으로서, 사용자의 입력에 따라 제1 입력문 또는 상기 제1 입력문에 대한 역번역문에서 중의적 표현을 검증하는 중의적 표현 검증부; 검증된 중의적 표현을 문맥으로 생성하는 문맥 생성부; 및 생성된 문맥이 상기 제1 입력문 또는 상기 제1 입력문 이후에 입력되는 제2 입력문들을 번역하거나 통역하는 데에 적용되도록 제어하는 문맥 제어부를 포함하는 것을 특징으로 하는 문맥 검증 장치를 제안한다.
바람직하게는, 상기 중의적 표현 검증부는 상기 중의적 표현으로 중의적 문장이 있으면 상기 중의적 문장을 각 의미를 담은 단의적 문장들로 구분하여 출력하거나, 상기 중의적 표현으로 중의적 단어가 있으면 상기 중의적 단어를 각 의미를 담은 단의적 단어들로 구분하여 출력하는 의미별 구분 출력부; 및 상기 단의적 문장들이나 상기 단의적 단어들 중에서 어느 하나의 단의적 문장이나 단의적 단어를 상기 사용자로부터 선택적으로 입력받는 제1 선택적 입력부를 포함한다.
바람직하게는, 상기 의미별 구분 출력부는 각 단의적 문장을 패러프레이징(paraphrasing)에 따라 구분하여 출력하거나, 각 단의적 단어를 문자나 이미지로 구분하여 출력한다.
바람직하게는, 상기 의미별 구분 출력부는 하나의 창에서 상기 중의적 문장의 상하 중 어느 한 부분에 상기 단의적 문장들을 일방향으로 순차 정렬시켜 출력하거나, 별도의 창에 상기 단의적 문장들만 일방향으로 순차 정렬시켜 출력하거나, 하나의 창에서 상기 중의적 단어의 상하좌우 중 어느 한 부분에 상기 단의적 단어들을 일방향으로 순차 정렬시켜 출력하거나, 별도의 창에 상기 단의적 단어들만 일방향으로 순차 정렬시켜 출력한다.
바람직하게는, 상기 제1 선택적 입력부는 각 단의적 문장의 일측에 해당 문장 선택 버튼과 해당 문장 미선택 버튼 중에서 적어도 하나의 버튼을 출력하거나, 각 단의적 단어의 일측에 해당 단어 선택 버튼과 해당 단어 미선택 버튼 중에서 적어도 하나의 버튼을 출력한다.
바람직하게는, 상기 중의적 표현 검증부는 상기 제1 입력문에 대한 번역문을 상기 사용자의 상대방에게 전달하기 전 상기 역번역문을 상기 제1 입력문과 함께 출력하는 제1 역번역문 출력부; 상기 역번역문과 상기 제1 입력문의 의미적 동일성 여부를 입력하는 동일성 여부 입력부; 상기 입력이 상기 역번역문과 상기 제1 입력문이 의미적으로 동일하지 않다는 것이면, 상기 역번역문과 비교할 때 상이한 상기 제1 입력문의 중의적 단어나 중의적 어구를 상기 역번역문에서 출력된 의미를 제외한 다른 의미를 담은 단의적 단어나 단의적 어구를 출력하는 타의미 문구 출력부; 및 출력된 단의적 단어나 단의적 어구가 1개이면 상기 사용자로부터 상기 출력된 단의적 단어나 단의적 어구의 선택 여부를 입력받으며, 출력된 단의적 단어나 단의적 어구가 적어도 2개이면 출력된 단의적 단어들이나 단의적 어구들 중에서 어느 하나의 단의적 단어나 단의적 어구를 상기 사용자로부터 선택적으로 입력받는 제2 선택적 입력부를 포함한다.
바람직하게는, 상기 제2 선택적 입력부는 단의적 단어나 단의적 어구가 1개일 때 상기 단의적 단어나 상기 단의적 어구를 출력하는 단어/어구 출력부; 및 출력된 단의적 단어나 단의적 어구를 선택할 것인지 여부를 상기 사용자로부터 입력받는 선택 여부 입력부를 포함하며, 상기 중의적 표현 검증부는 출력된 단의적 단어나 단의적 어구가 상기 사용자에 의해 선택되지 않으면 상기 사용자로부터 다른 단의적 단어나 단의적 어구를 입력받는 타 문구 입력부를 더욱 포함한다.
바람직하게는, 상기 제2 선택적 입력부는 단의적 단어나 단의적 어구가 적어도 2개일 때 상기 중의적 단어나 상기 중의적 어구의 상하좌우 중 어느 한 부분에 단의적 단어들이나 단의적 어구들을 일방향으로 순차 정렬시켜 출력하거나, 별도의 창에 상기 단의적 단어들이나 상기 단의적 어구들만 일방향으로 순차 정렬시켜 출력하는 단어/어구 정렬부; 및 상기 단의적 단어들이나 상기 단의적 어구들 중에서 어느 하나의 단의적 단어나 단의적 어구를 상기 사용자로부터 선택적으로 입력받는 단어/어구 택일부를 포함한다.
바람직하게는, 상기 단어/어구 택일부는 각 단의적 단어의 일측에 해당 단어 선택 버튼과 해당 단어 미선택 버튼 중에서 적어도 하나의 버튼을 출력하거나, 각 단의적 어구의 일측에 해당 어구 선택 버튼과 해당 어구 미선택 버튼 중에서 적어도 하나의 버튼을 출력한다.
바람직하게는, 상기 중의적 표현 검증부는 상기 제1 입력문에 대한 번역문을 상기 사용자의 상대방에게 전달한 후 상기 번역문에 대한 상기 상대방의 반응에 따라 상기 사용자로부터 상기 번역문을 재번역할 것인지 여부를 입력받는 재번역 여부 입력부; 상기 입력이 상기 번역문의 재번역 요청이면 상기 역번역문을 상기 제1 입력문과 함께 출력하는 제2 역번역문 출력부; 상기 역번역문과 상기 제1 입력문의 의미적 동일성 여부를 입력하는 동일성 여부 입력부; 상기 입력이 상기 역번역문과 상기 제1 입력문이 의미적으로 동일하지 않다는 것이면, 상기 역번역문과 비교할 때 상이한 상기 제1 입력문의 중의적 단어나 중의적 어구를 상기 역번역문에서 출력된 의미를 제외한 다른 의미를 담은 단의적 단어나 단의적 어구를 출력하는 타의미 문구 출력부; 및 출력된 단의적 단어나 단의적 어구가 1개이면 상기 사용자로부터 상기 출력된 단의적 단어나 단의적 어구의 선택 여부를 입력받으며, 출력된 단의적 단어나 단의적 어구가 적어도 2개이면 출력된 단의적 단어들이나 단의적 어구들 중에서 어느 하나의 단의적 단어나 단의적 어구를 상기 사용자로부터 선택적으로 입력받는 제2 선택적 입력부를 포함한다.
바람직하게는, 상기 재번역 여부 입력부는 미리 정해진 시간동안 상기 번역문을 수신한 상기 상대방이 무응답이거나 상기 상대방의 응답에 상기 번역문을 이해하지 못했음을 의미하는 단어나 구절이 포함되어 있으면 상기 번역문의 재번역을 요청하는 메시지를 출력하는 메시지 출력부; 및 상기 메시지를 확인한 상기 사용자로부터 상기 번역문을 재번역할 것인지 여부를 입력받는 메시지 응답부를 포함한다.
바람직하게는, 상기 재번역 여부 입력부는 상기 번역문을 수신한 상기 상대방의 응답을 출력하는 응답 출력부; 및 상기 응답을 확인한 상기 사용자로부터 상기 번역문을 재번역할 것인지 여부를 입력받는 메시지 응답부를 포함한다.
바람직하게는, 상기 응답 출력부는 상기 응답을 상기 상대방에 의해 입력된 문자나 상기 상대방의 제스처를 촬영한 이미지로 출력한다.
바람직하게는, 상기 중의적 표현 검증부는 상기 제1 입력문으로 음성으로 입력된 것 또는 키패드나 터치 패드를 비롯한 입력 장치로 입력된 것을 이용한다.
바람직하게는, 상기 문맥 검증 장치는 입력문을 제1 언어로 출력하는 제1 사용자 단말과 입력문을 제2 언어로 출력하는 제2 사용자 단말 사이에서 메신저 기능, 양방향 번역 기능 및 양방향 통역 기능 중 적어도 하나의 기능을 제공하는 서버에 장착되거나, 양방향 번역 프로그램과 양방향 통역 프로그램 중 적어도 하나의 프로그램과 입력 장치가 탑재된 단말에 장착된다.
또한 본 발명은 사용자의 입력에 따라 제1 입력문 또는 상기 제1 입력문에 대한 역번역문에서 중의적 표현을 검증하는 중의적 표현 검증 단계; 검증된 중의적 표현을 문맥으로 생성하는 문맥 생성 단계; 및 생성된 문맥이 상기 제1 입력문 또는 상기 제1 입력문 이후에 입력되는 제2 입력문들을 번역하거나 통역하는 데에 적용되도록 제어하는 문맥 제어 단계를 포함하는 것을 특징으로 하는 문맥 검증 방법을 제안한다.
바람직하게는, 상기 중의적 표현 검증 단계는 상기 중의적 표현으로 중의적 문장이 있으면 상기 중의적 문장을 각 의미를 담은 단의적 문장들로 구분하여 출력하거나, 상기 중의적 표현으로 중의적 단어가 있으면 상기 중의적 단어를 각 의미를 담은 단의적 단어들로 구분하여 출력하는 의미별 구분 출력 단계; 및 상기 단의적 문장들이나 상기 단의적 단어들 중에서 어느 하나의 단의적 문장이나 단의적 단어를 상기 사용자로부터 선택적으로 입력받는 제1 선택적 입력 단계를 포함한다.
바람직하게는, 상기 의미별 구분 출력 단계는 각 단의적 문장을 패러프레이징(paraphrasing)에 따라 구분하여 출력하거나, 각 단의적 단어를 문자나 이미지로 구분하여 출력한다.
바람직하게는, 상기 의미별 구분 출력 단계는 하나의 창에서 상기 중의적 문장의 상하 중 어느 한 부분에 상기 단의적 문장들을 일방향으로 순차 정렬시켜 출력하거나, 별도의 창에 상기 단의적 문장들만 일방향으로 순차 정렬시켜 출력하거나, 하나의 창에서 상기 중의적 단어의 상하좌우 중 어느 한 부분에 상기 단의적 단어들을 일방향으로 순차 정렬시켜 출력하거나, 별도의 창에 상기 단의적 단어들만 일방향으로 순차 정렬시켜 출력한다.
바람직하게는, 상기 제1 선택적 입력 단계는 각 단의적 문장의 일측에 해당 문장 선택 버튼과 해당 문장 미선택 버튼 중에서 적어도 하나의 버튼을 출력하거나, 각 단의적 단어의 일측에 해당 단어 선택 버튼과 해당 단어 미선택 버튼 중에서 적어도 하나의 버튼을 출력한다.
바람직하게는, 상기 중의적 표현 검증 단계는 상기 제1 입력문에 대한 번역문을 상기 사용자의 상대방에게 전달하기 전 상기 역번역문을 상기 제1 입력문과 함께 출력하는 제1 역번역문 출력 단계; 상기 역번역문과 상기 제1 입력문의 의미적 동일성 여부를 입력하는 동일성 여부 입력 단계; 상기 입력이 상기 역번역문과 상기 제1 입력문이 의미적으로 동일하지 않다는 것이면, 상기 역번역문과 비교할 때 상이한 상기 제1 입력문의 중의적 단어나 중의적 어구를 상기 역번역문에서 출력된 의미를 제외한 다른 의미를 담은 단의적 단어나 단의적 어구를 출력하는 타의미 문구 출력 단계; 및 출력된 단의적 단어나 단의적 어구가 1개이면 상기 사용자로부터 상기 출력된 단의적 단어나 단의적 어구의 선택 여부를 입력받으며, 출력된 단의적 단어나 단의적 어구가 적어도 2개이면 출력된 단의적 단어들이나 단의적 어구들 중에서 어느 하나의 단의적 단어나 단의적 어구를 상기 사용자로부터 선택적으로 입력받는 제2 선택적 입력 단계를 포함한다.
바람직하게는, 상기 제2 선택적 입력 단계는 단의적 단어나 단의적 어구가 1개일 때 상기 단의적 단어나 상기 단의적 어구를 출력하는 단어/어구 출력 단계; 및 출력된 단의적 단어나 단의적 어구를 선택할 것인지 여부를 상기 사용자로부터 입력받는 선택 여부 입력 단계를 포함하며, 상기 선택 여부 입력 단계 이후에 상기 중의적 표현 검증 단계는 출력된 단의적 단어나 단의적 어구가 상기 사용자에 의해 선택되지 않으면 상기 사용자로부터 다른 단의적 단어나 단의적 어구를 입력받는 타 문구 입력 단계를 더욱 포함한다.
바람직하게는, 상기 제2 선택적 입력 단계는 단의적 단어나 단의적 어구가 적어도 2개일 때 상기 중의적 단어나 상기 중의적 어구의 상하좌우 중 어느 한 부분에 단의적 단어들이나 단의적 어구들을 일방향으로 순차 정렬시켜 출력하거나, 별도의 창에 상기 단의적 단어들이나 상기 단의적 어구들만 일방향으로 순차 정렬시켜 출력하는 단어/어구 정렬 단계; 및 상기 단의적 단어들이나 상기 단의적 어구들 중에서 어느 하나의 단의적 단어나 단의적 어구를 상기 사용자로부터 선택적으로 입력받는 단어/어구 택일 단계를 포함한다.
바람직하게는, 상기 단어/어구 택일 단계는 각 단의적 단어의 일측에 해당 단어 선택 버튼과 해당 단어 미선택 버튼 중에서 적어도 하나의 버튼을 출력하거나, 각 단의적 어구의 일측에 해당 어구 선택 버튼과 해당 어구 미선택 버튼 중에서 적어도 하나의 버튼을 출력한다.
바람직하게는, 상기 중의적 표현 검증 단계는 상기 제1 입력문에 대한 번역문을 상기 사용자의 상대방에게 전달한 후 상기 번역문에 대한 상기 상대방의 반응에 따라 상기 사용자로부터 상기 번역문을 재번역할 것인지 여부를 입력받는 재번역 여부 입력 단계; 상기 입력이 상기 번역문의 재번역 요청이면 상기 역번역문을 상기 제1 입력문과 함께 출력하는 제2 역번역문 출력 단계; 상기 역번역문과 상기 제1 입력문의 의미적 동일성 여부를 입력하는 동일성 여부 입력 단계; 상기 입력이 상기 역번역문과 상기 제1 입력문이 의미적으로 동일하지 않다는 것이면, 상기 역번역문과 비교할 때 상이한 상기 제1 입력문의 중의적 단어나 중의적 어구를 상기 역번역문에서 출력된 의미를 제외한 다른 의미를 담은 단의적 단어나 단의적 어구를 출력하는 타의미 문구 출력 단계; 및 출력된 단의적 단어나 단의적 어구가 1개이면 상기 사용자로부터 상기 출력된 단의적 단어나 단의적 어구의 선택 여부를 입력받으며, 출력된 단의적 단어나 단의적 어구가 적어도 2개이면 출력된 단의적 단어들이나 단의적 어구들 중에서 어느 하나의 단의적 단어나 단의적 어구를 상기 사용자로부터 선택적으로 입력받는 제2 선택적 입력 단계를 포함한다.
바람직하게는, 상기 재번역 여부 입력 단계는 미리 정해진 시간동안 상기 번역문을 수신한 상기 상대방이 무응답이거나 상기 상대방의 응답에 상기 번역문을 이해하지 못했음을 의미하는 단어나 구절이 포함되어 있으면 상기 번역문의 재번역을 요청하는 메시지를 출력하는 메시지 출력 단계; 및 상기 메시지를 확인한 상기 사용자로부터 상기 번역문을 재번역할 것인지 여부를 입력받는 메시지 응답 단계를 포함한다.
바람직하게는, 상기 재번역 여부 입력 단계는 상기 번역문을 수신한 상기 상대방의 응답을 출력하는 응답 출력 단계; 및 상기 응답을 확인한 상기 사용자로부터 상기 번역문을 재번역할 것인지 여부를 입력받는 메시지 응답 단계를 포함한다.
바람직하게는, 상기 응답 출력 단계는 상기 응답을 상기 상대방에 의해 입력된 문자나 상기 상대방의 제스처를 촬영한 이미지로 출력한다.
바람직하게는, 상기 중의적 표현 검증 단계는 상기 제1 입력문으로 음성으로 입력된 것 또는 키패드나 터치 패드를 비롯한 입력 장치로 입력된 것을 이용한다.
바람직하게는, 상기 문맥 검증 방법은 입력문을 제1 언어로 출력하는 제1 사용자 단말과 입력문을 제2 언어로 출력하는 제2 사용자 단말 사이에서 메신저 기능, 양방향 번역 기능 및 양방향 통역 기능 중 적어도 하나의 기능을 제공하는 서버에서 수행되거나, 양방향 번역 프로그램과 양방향 통역 프로그램 중 적어도 하나의 프로그램과 입력 장치가 탑재된 단말에서 수행된다.
본 발명은 상기한 목적 및 그 구성에 따라 다음 효과를 얻을 수 있다.
첫째, 대화를 하는 쌍방의 대화 이력과 번역 과정 정보에 대한 문맥 정보를 확보하고 공유하는 문맥 기반 양방향 대화 자동 통번역 환경에서 문맥 오류를 검증하고 정확한 문맥만을 문맥으로 활용함으로써, 양방향 자동 통번역 장치의 통번역 품질을 개선하고 대화 상대자와의 원활한 의사 소통이 가능해진다.
둘째, 문맥 검증 과정에서 다중 검증 구조를 채택함으로써, 원문 및 번역 오류에 대한 적극적인 대처 및 해결책을 제시할 수 있고, 이를 통해 자동 통번역을 이용한 의사 소통의 질적/시간적 개선이 가능해진다.
도 1은 본 발명에서 제안하는 문맥 검증 장치를 포함하는 제1 양방향 통번역 시스템의 개략적인 구성도이다.
도 2는 도 1에 도시된 양방향 통번역 서버의 내부 구성을 개략적으로 도시한 블록도이다.
도 3은 도 2에 도시된 문맥 기반 통번역부의 내부 구성을 도시한 블록도이다.
도 4는 본 발명에서 제안하는 문맥 검증 장치를 포함하는 제2 양방향 통번역 시스템의 개략적인 구성도이다.
도 5는 도 4에 도시된 양방향 통번역 단말을 개략적으로 도시한 블록도이다.
도 6은 본 발명의 바람직한 실시예에 따른 문맥 검증부의 내부 구성을 개략적으로 도시한 블록도이다.
도 7은 도 6에 도시된 중의적 표현 검증부의 내부 구성을 도시한 블록도이다.
도 8과 도 9는 원문 분석 검증을 설명하기 위한 예시도이다.
도 10은 번역 결과 검증을 설명하기 위한 예시도이다.
도 11은 도 7에 도시된 제2 선택적 입력부의 내부 구성과 중의적 표현 검증부에 추가되는 구성을 도시한 블록도이다.
도 12는 도 7에 도시된 재번역 여부 입력부의 내부 구성을 도시한 블록도이다.
도 13은 본 발명의 바람직한 실시예에 따른 문맥 검증 방법을 개략적으로 도시한 흐름도이다.
이하, 본 발명의 바람직한 실시예를 첨부된 도면들을 참조하여 상세히 설명한다. 우선 각 도면의 구성요소들에 참조 부호를 부가함에 있어서, 동일한 구성요소들에 대해서는 비록 다른 도면상에 표시되더라도 가능한한 동일한 부호를 가지도록 하고 있음에 유의해야 한다. 또한, 본 발명을 설명함에 있어, 관련된 공지 구성 또는 기능에 대한 구체적인 설명이 본 발명의 요지를 흐릴 수 있다고 판단되는 경우에는 그 상세한 설명은 생략한다. 또한, 이하에서 본 발명의 바람직한 실시예를 설명할 것이나, 본 발명의 기술적 사상은 이에 한정하거나 제한되지 않고 당업자에 의해 변형되어 다양하게 실시될 수 있음은 물론이다.
도 1은 본 발명에서 제안하는 문맥 검증 장치를 포함하는 제1 양방향 통번역 시스템의 개략적인 구성도이다. 도 2는 도 1에 도시된 양방향 통번역 서버의 내부 구성을 개략적으로 도시한 블록도이다. 도 3은 도 2에 도시된 문맥 기반 통번역부의 내부 구성을 도시한 블록도이다.
제1 양방향 통번역 시스템(100)은 메신저와 같은 양방향 환경에서 통번역이 수행되는 시스템이다. 제1 양방향 통번역 시스템(100)은 제1 언어를 제2 언어로 통번역하고 제2 언어를 제1 언어로 통번역하는 양방향 자동 통번역 환경에서 원문과 번역문 결과를 이용하여 현재 번역할 문장의 애매성을 해소하려 할 때, 통번역 과정에서 등장하는 원문과 번역문 가운데 문맥으로 사용하면 안되는 문장들을 검증하고, 문맥으로 적합하다고 검증된 정보만을 문맥으로 활용하여 적용함으로써, 보다 정확하고 빠른 자동 통번역 결과를 제공할 수 있다.
도 1에 따르면, 제1 양방향 통번역 시스템(10)은 양방향 통번역 서버(11), 제1 사용자 단말(12) 및 제2 사용자 단말(13)을 포함한다.
제1 사용자 단말(12)은 제1 언어를 구사하는 사용자가 접속하는 단말로서, 모바일 기기나 컴퓨터로 구현될 수 있다.
제2 사용자 단말(13)은 제2 언어를 구사하는 사용자가 접속하는 단말로서, 제1 사용자 단말(12)의 경우와 마찬가지로 모바일 기기나 컴퓨터로 구현될 수 있다. 본 실시예에서 제1 언어와 제2 언어는 상이하며, 예컨대 제1 언어가 한국어라면 제2 언어는 한국어를 제외한 언어 즉 영어 등이 해당된다.
양방향 통번역 서버(11)는 통상의 서버(sever)로서, 본 실시예에서는 문맥에 기반하여 양방향 자동 통번역 기능을 수행한다. 이러한 양방향 통번역 서버(11)는 번역 서버, 통역 서버, 메신저 서버 등으로 구현될 수 있다. 양방향 통번역 서버(11)는 비록 서버라는 표현을 사용하고 있으나 본 실시예에서 모바일 기기나 컴퓨터 등 단말 형태의 것으로 구현되는 것도 가능하다.
도 2에 따르면, 양방향 통번역 서버(11)는 통신부(110), 문맥 기반 통번역부(120), 데이터베이스(130) 및 주제어부(140)를 포함한다.
통신부(110)는 제1 사용자 단말(12)로부터 통번역 대상 입력문을 수신하며, 입력문에 대한 통번역 결과를 제2 사용자 단말(13)로 전송한다. 양방향 환경을 고려하여 통신부(110)는 제2 사용자 단말(13)로부터도 통번역 대상 입력문을 수신하며 이 경우 그 통번역 결과를 제1 사용자 단말(12)로 전송한다.
문맥 기반 통번역부(120)는 문맥을 활용하여 입력문에 대한 통번역 결과를 생성한다. 특히 문맥 기반 통번역부(120)는 먼저 문맥을 검증하고 이후 검증된 문맥을 활용하여 통번역 결과를 생성한다.
도 3에 따르면, 문맥 기반 통번역부(120)는 문맥 검증부(121), 문맥 히스토리 관리부(122), 문맥 DB(123), 제1 언어 인식부(124), 제1 언어 분석부(125), 제1 언어 변환부(126), 제1 언어 합성부(127), 제1 언어 출력부(128), 제2 언어 인식부(129), 제2 언어 분석부(130), 제2 언어 변환부(131), 제2 언어 합성부(132) 및 제2 언어 출력부(133)를 포함한다.
문맥 검증부(121)는 사용자의 의사를 통해 입력문의 중의적 표현을 검증하고 검증된 표현을 통번역시 문맥으로 활용한다. 이러한 문맥 검증부(121)는 본 실시예에서 인터페이스 형태의 것으로 구현될 수 있다. 문맥 검증부(121)에 대한 보다 자세한 설명은 후술한다.
문맥 히스토리 관리부(122)는 문맥 검증부(121)에 의해 검증된 문맥이 문맥 DB(123)에 저장되도록 제어하거나, 입력문을 통번역할 때 문맥 DB(123)에 저장된 문맥을 활용할 수 있게 제공하는 기능을 수행한다.
제1 언어 인식부(124)는 제1 사용자 단말(12)을 통해 제1 언어(ex. 한국어)를 음성이나 텍스트로 입력받아 이를 음성 인식 또는 텍스트 인식하는 기능을 수행한다.
제1 언어 분석부(125)는 인식된 제1 언어를 형태소 분석 및 구조 분석하는 기능을 수행한다.
제1 언어 변환부(126)는 분석된 제1 언어를 제2 언어(ex. 영어)로 변환하는 기능을 수행한다.
제1 언어 합성부(127)는 변환을 통해 생성된 제2 언어를 출력 가능한 형태로 처리하는 기능을 수행한다. 제1 언어 합성부(127)는 제2 언어를 음성이나 텍스트 형태로 생성할 수 있다.
제1 언어 출력부(128)는 제2 언어를 제1 사용자 단말(12)로 출력하는 기능을 수행한다.
제2 언어 인식부(129)는 제2 사용자 단말(13)을 통해 제2 언어(ex. 영어)를 음성이나 텍스트로 입력받아 이를 음성 인식 또는 텍스트 인식하는 기능을 수행한다.
제2 언어 분석부(130)는 인식된 제2 언어를 형태소 분석 및 구조 분석하는 기능을 수행한다.
제2 언어 변환부(131)는 분석된 제2 언어를 제1 언어(ex. 한국어)로 변환하는 기능을 수행한다.
제2 언어 합성부(132)는 변환을 통해 생성된 제1 언어를 출력 가능한 형태로 처리하는 기능을 수행한다. 제2 언어 합성부(132)는 제1 언어를 음성이나 텍스트 형태로 생성할 수 있다.
제2 언어 출력부(133)는 제1 언어를 제2 사용자 단말(13)로 출력하는 기능을 수행한다.
데이터베이스(140)는 통번역 기능을 수행하기 위한 각종 정보, 통번역 결과 등을 저장한다. 문맥 기반 통번역부(120) 내에 문맥 DB(123)가 구비되지 않는다면 데이터베이스(140)는 문맥에 대해서도 저장한다.
주제어부(150)는 양방향 통번역 서버(110)를 구성하는 각 구성의 전체 작동을 제어한다.
도 4는 본 발명에서 제안하는 문맥 검증 장치를 포함하는 제2 양방향 통번역 시스템의 개략적인 구성도이다. 도 5는 도 4에 도시된 양방향 통번역 단말을 개략적으로 도시한 블록도이다.
도 4에 따르면, 제2 양방향 통번역 시스템(20)은 양방향 통번역 단말(21), 제1 사용자(22) 및 제2 사용자(23)를 포함한다.
제1 사용자(22)는 제1 언어를 구사하는 사용자를 말하며, 제2 사용자(23)는 제2 언어를 구사하는 사용자를 말한다.
양방향 통번역 단말(21)은 문맥에 기반한 양방향 자동 통번역 기능 등 도 1의 양방향 통번역 서버(11)와 동일한 기능을 수행하는 것이다. 다만 양방향 통번역 단말(21)은 양방향 통번역 서버(110)와 달리 모바일 기기나 컴퓨터 등 단말 형태의 것으로 구현된다.
양방향 통번역 단말(21)은 도 5에 도시된 바와 같이 입력부(210), 문맥 기반 통번역부(120), 디스플레이부(220), 메모리부(230), 통신부(110) 및 메인제어부(240)를 포함한다.
입력부(210)는 제1 사용자(22)로부터 통번역 대상 입력문을 입력받는다. 입력부(210)는 양방향성을 고려할 때 제2 사용자(23)로부터도 입력문을 입력받는다.
입력부(210)는 사용자의 음성을 입력문으로 입력받을 수 있다. 이 경우 입력부(210)는 마이크로폰(MIC)으로 구현될 수 있다. 한편 입력부(210)는 사용자의 터치를 통해 입력문을 입력받는 것도 가능하다. 이 경우 입력부(210)는 키패드나 터치 패드 등으로 구현될 수 있다.
디스플레이부(220)는 입력문이나 입력문의 통번역 결과를 디스플레이한다.
메모리부(230)는 통번역 기능을 수행하기 위한 프로그램, 제1 사용자(22)나 제2 사용자(23)로부터 입력된 입력문, 입력문의 통번역 결과 등을 저장한다.
메인제어부(240)는 양방향 통번역 단말(21)을 구성하는 각 구성의 전체 작동을 제어한다.
다음으로, 도 3의 문맥 검증부(121)에 대하여 설명한다. 도 6은 본 발명의 바람직한 실시예에 따른 문맥 검증부의 내부 구성을 개략적으로 도시한 블록도이다.
문맥 검증부(121)는 양방향 자동 통번역 수행시 양방향 대화 문맥을 구축할 때, 문맥의 오류 여부를 검증하여 정확한 문맥만이 구축되도록 함으로써, 잘못된 문맥으로 인해 발생할 수 있는 대화의 낭비를 제거하고 올바른 번역 결과를 제공할 수 있다.
문장을 통번역하는 과정에서 생성되는 분석 결과 및 통번역 결과와 관련된 모든 정보는 문맥으로서의 가치를 가지며, 이러한 문맥 정보는 현재의 번역 대상 문장이 상황에 적절하게 올바로 번역될 수 있도록 하는 데에 유용한 정보를 제공해 준다. 유용한 정보를 제공해 주는 경우에 대하여 일례를 들어 본다.
이전 문장 : 이치로가 배를 타고 싶어해.
현재 문장 : 이치로가 배를 싫어하는데?
위와 같은 대화 상황에서, 이전 문장이 올바로 번역이 된 경우에는 다음과 같은 형태의 문맥이 구축될 수 있다.
문맥 :
이치로가, 배를, 타고, 싶어해
이치로/명사, 배/명사, 타다/ride …
이치로-Ichiro, 배-boat, 타다-ride …
문장의 번역 과정에서 문맥은 다양하게 이용될 수 있다. 문장 "배를 싫어하는 이치로가?" 번역 과정에서 발생하는 다양한 중의성의 일부를 표시하면 다음과 같다.
음성 인식 후보 : 이치라, 이치로, 이치를, …
형태소 분석부 : 이치/명사+로, 이치로/명사, …
변환부 : 배/boat, 배/pear, …
음성 인식 후보 가운데, 문맥을 통해 검증되는 것은 "이치로"가 이미 이전에 발생한 음성 인식 문자열이라는 것이다. 따라서, 다른 후보들을 제치고 "이치로"가 올바른 음성 인식 결과로 인식될 수 있다.
형태소 분석 후보 가운데, 문맥을 통해 검증되는 것은 "이치로"가 하나의 명사라는 것이다. 따라서, "이치로"가 하나의 명사로써 분석될 수 있다.
변환 과정에서, "배"는 boat와 pear 모두가 가능하다. 이때에도 문맥을 통해 "배/pear"가 올바른 변환으로 선택될 수 있다.
그러나, 만일 이전 문장들의 번역 오류로 인해 문맥이 잘못 구축된다면, 문맥의 기능은 위의 예와 같이, 번역 과정에서의 중의성 해결에 도움이 되지 못할 뿐 아니라, 오히려 번역 과정에서 악영향을 미치게 된다. 앞에서 언급한 예를 통해 악영향의 결과가 나타나는 사례를 보면 다음과 같다.
대화 1 - 한국어 대화자 : "나는 배를 사고 싶어"
→ "I want to buy pear"
대화 2 - 영어 대화자 : "나도 배를 좋아해"
→ "I like pear too"
대화 3 - 한국어 대화자 : "배 타고 여행하고 싶어"
→ "I like to travel riding on a pear"
대화 4 - 영어 대화자 : "뭐라고?"
→ "What?"
대화 5 - 한국어 대화자 : "왜?"
→ "Why?"
대화 1, 2는 이미 문맥으로 구성되어 대화 3의 번역에 영향을 미치는 상황이다. 대화 1, 2를 통해 문맥 정보에는 "배/pear"가 구축되었으며, 이 정보는 향후 번역 과정에서 계속 이용된다. 이 때문에, 현재 문장의 "배"는 "pear"로 번역되고, 이러한 번역 오류는 향후 대화가 정상적으로 진행되지 못하는 핵심 요소로 작용한다.
따라서, 잘못 구축된 문맥은 향후 번역에 많은 문제를 야기시키며, 이러한 문제를 가능한 빨리 줄여야만 올바른 번역이 가능해짐과 동시에 원활한 대화도 가능해진다.
올바른 문맥을 구축하기 위해서는, 가능한한 조기에 여러 단계에서 올바른 문맥인지를 확인하고 이를 사용자에게 알려줌으로써 올바른 문맥 여부를 판단하게 하고, 가능한한 올바른 문맥이라고 검증된 정보를 문맥으로 구축하는 것이 필요하다.
문맥 검증부(121)는 중의적 표현 검증부(310), 문맥 생성부(320) 및 문맥 제어부(330)를 포함한다.
중의적 표현 검증부(310)는 사용자의 입력에 따라 제1 입력문 또는 제1 입력문에 대한 역번역문에서 중의적 표현을 검증하는 기능을 수행한다. 중의적 표현 검증부(310)는 제1 입력문으로 음성으로 입력된 것 또는 키패드나 터치 패드를 비롯한 입력 장치로 입력된 것을 이용할 수 있다.
문맥 생성부(320)는 검증된 중의적 표현을 문맥으로 생성하는 기능을 수행한다.
문맥 제어부(330)는 생성된 문맥이 제1 입력문 또는 제1 입력문 이후에 입력되는 제2 입력문들을 번역하거나 통역하는 데에 적용되도록 제어하는 기능을 수행한다.
본 실시예에서 문맥 검증은 원문 분석 검증, 번역 결과 검증 및 응답 기반 검증 중 어느 하나로 수행될 수 있다. 도 6에서 문맥 검증은 중의적 표현 검증부(310)가 수행한다. 이하 각 검증에 대하여 자세하게 설명한다.
도 7은 도 6에 도시된 중의적 표현 검증부의 내부 구성을 도시한 블록도이다. 도 7에서 의미별 구분 출력부(401)와 제1 선택적 입력부(402)는 원문 분석 검증을 위한 구성이며, 제1 역번역문 출력부(411)와 동일성 여부 입력부(412)와 타의미 문구 출력부(413) 및 제2 선택적 입력부(414)는 번역 결과 검증을 위한 구성이다. 그리고 재번역 여부 입력부(421)와 제2 역번역문 출력부(422)와 동일성 여부 입력부(412)와 타의미 문구 출력부(413) 및 제2 선택적 입력부(414)는 응답 기반 검증을 위한 구성이다.
① 원문 분석 검증
의미별 구분 출력부(401)는 중의적 표현으로 중의적 문장이 있으면 중의적 문장을 각 의미를 담은 단의적 문장들로 구분하여 출력한다. 또한 의미별 구분 출력부(401)는 중의적 표현으로 중의적 단어가 있으면 중의적 단어를 각 의미를 담은 단의적 단어들로 구분하여 출력한다.
의미별 구분 출력부(401)는 각 단의적 문장을 패러프레이징(paraphrasing)에 따라 구분하여 출력하거나, 각 단의적 단어를 문자나 이미지로 구분하여 출력한다. 전자의 예시는 도 8에 도시된 바와 같으며, 후자의 예시는 도 9에 도시된 바와 같다. 도 8과 도 9에서 A는 대화 내용을 표시하는 정보 표시 창을 의미하며, B는 대화 내용에 포함된 중의적 표현에 대한 분석 결과를 표시하는 메시지 창을 의미한다.
의미별 구분 출력부(401)는 단의적 문장들을 출력할 경우 하나의 창에서 중의적 문장의 상하 중 어느 한 부분에 단의적 문장들을 일방향으로 순차 정렬시켜 출력하거나, 별도의 창에 단의적 문장들만 일방향으로 순차 정렬시켜 출력한다. 또한 의미별 구분 출력부(401)는 단의적 단어들을 출력할 경우 하나의 창에서 중의적 단어의 상하좌우 중 어느 한 부분에 단의적 단어들을 일방향으로 순차 정렬시켜 출력하거나, 별도의 창에 단의적 단어들만 일방향으로 순차 정렬시켜 출력한다. 도 8에 도시된 바는 별도의 창에 단의적 문장들만 출력한 경우의 예시이고, 도 9에 도시된 바는 별도의 창에 단의적 단어들만 출력한 경우의 예시이다.
제1 선택적 입력부(402)는 단의적 문장들이나 단의적 단어들 중에서 어느 하나의 단의적 문장이나 단의적 단어를 사용자로부터 선택적으로 입력받는다. 여기서 사용자는 제1 사용자와 제2 사용자 중 화자(narrator)를 말한다.
제1 선택적 입력부(402)는 각 단의적 문장의 일측에 해당 문장 선택 버튼과 해당 문장 미선택 버튼 중에서 적어도 하나의 버튼을 출력하거나, 각 단의적 단어의 일측에 해당 단어 선택 버튼과 해당 단어 미선택 버튼 중에서 적어도 하나의 버튼을 출력한다. 도 8과 도 9에 도시된 바는 선택 버튼과 미선택 버튼이 모두 출력된 경우의 예시이다.
원문 분석 검증은 원문에 존재하는 중의적 표현의 해석 결과를 사용자가 평가하여 1차적으로 중의적 표현이 올바르게 통번역되도록 하고 최종적으로 이를 올바른 문맥을 획득하는 것을 목적으로 한다. 이러한 원문 분석 검증은 도 8 및 도 9에 도시된 바와 같이 크게 2가지 형태로 수행될 수 있다.
도 8의 예시는 패러프레이징을 이용하여 중의성이 존재하는 원문을 중의성이 없는 원문으로 변경하여 중의성을 해소하는 방법을 개시하고 있다. "누가 간대?"라는 문장은 "나는 안갈거야"라는 의미와 "누가 갈 예정인데?"라는 2가지 중의성이 존재하며, 이를 사용자에게 확인함으로써 정확한 번역이 가능하도록 한다. 만일 사용자의 의도가 "나는 안갈거야"인데 번역 엔진이 "누가 갈 예정인데?"로 해석하였다면 사용자가 이를 수정해줌으로써 정확한 번역이 가능해진다.
도 9의 예시는 번역 대상 문장에서 중의적 표현의 의미를 사용자가 평가하도록 하는 방법을 개시하고 있다. "배를 사다"의 경우 "배"가 가지는 다양한 의미들(과일, 탈 것, 신체 부위, 정도, …)을 사용자에게 제시하여 확인함으로써 정확한 번역이 가능하도록 한다. 만일 사용자에게 제시된 문장 의미가 "배(@과일)를 사다"인데 실제 사용자의 의미는 "배(@선박)를 사다"인 경우에, 사용자는 해당 의미를 올바로 선택해 줌으로써 정확한 번역이 가능해진다.
② 번역 결과 검증
제1 역번역문 출력부(411)는 제1 입력문에 대한 번역문을 사용자의 상대방에게 전달하기 전, 역번역문을 제1 입력문과 함께 출력하는 기능을 수행한다. 도 10은 번역 결과 검증 과정을 도시한 예시도이다. 제1 역번역문 출력부(411)는 도 10의 C와 같이 역번역문과 원문을 함께 출력할 수 있다.
동일성 여부 입력부(412)는 역번역문과 제1 입력문의 의미적 동일성 여부를 입력하는 기능을 수행한다.
타의미 문구 출력부(413)는 상기 입력이 역번역문과 제1 입력문이 의미적으로 동일하지 않다는 것이면 역번역문과 비교할 때 상이한 제1 입력문의 중의적 단어나 중의적 어구를 역번역문에서 출력된 의미를 제외한 다른 의미를 담은 단의적 단어나 단의적 어구를 출력하는 기능을 수행한다. 타의미 문구 출력부(413)는 도 10의 D와 같이 출력할 수 있다.
제2 선택적 입력부(414)는 출력된 단의적 단어나 단의적 어구가 1개이면 사용자로부터 출력된 단의적 단어나 단의적 어구의 선택 여부를 입력받으며, 출력된 단의적 단어나 단의적 어구가 적어도 2개이면 출력된 단의적 단어들이나 단의적 어구들 중에서 어느 하나의 단의적 단어나 단의적 어구를 사용자로부터 선택적으로 입력받는 기능을 수행한다. 제2 선택적 입력부(414)의 입력에 따라 중의성이 해소되는 원문과 번역문은 도 10의 E에 도시된 바와 같다.
도 11은 도 7에 도시된 제2 선택적 입력부의 내부 구성을 도시한 블록도이다. 또한 도 11은 중의적 표현 검증부에 추가될 수 있는 구성에 대해서도 도시하고 있다.
도 11에 따르면, 단의적 단어나 단의적 어구가 1개일 때 제2 선택적 입력부(414)는 단어/어구 출력부(501) 및 선택 여부 입력부(502)를 포함할 수 있다.
단어/어구 출력부(501)는 단의적 단어나 단의적 어구를 출력한다. 이때, 단의적 단어는 원문 분석 검증의 경우와 마찬가지로 문자 외에 이미지 형태로 출력하는 것도 가능하다.
선택 여부 입력부(502)는 출력된 단의적 단어나 단의적 어구를 선택할 것인지 여부를 사용자로부터 입력받는다.
한편 중의적 표현 검증부(310)는 타 문구 입력부(520)를 더욱 포함할 수 있다.
타 문구 입력부(520)는 출력된 단의적 단어나 단의적 어구가 사용자에 의해 선택되지 않으면 사용자로부터 다른 단의적 단어나 단의적 어구를 입력받는 구성이다.
단의적 단어나 단의적 어구가 적어도 2개일 때 제2 선택적 입력부(414)는 단어/어구 정렬부(511) 및 단어/어구 택일부(512)를 포함할 수 있다.
단어/어구 정렬부(511)는 중의적 단어나 중의적 어구의 상하좌우 중 어느 한 부분에 단의적 단어들이나 단의적 어구들을 일방향으로 순차 정렬시켜 출력하거나, 별도의 창에 단의적 단어들이나 단의적 어구들만 일방향으로 순차 정렬시켜 출력한다.
단어/어구 택일부(512)는 단의적 단어들이나 단의적 어구들 중에서 어느 하나의 단의적 단어나 단의적 어구를 사용자로부터 선택적으로 입력받는다. 단어/어구 택일부(512)는 각 단의적 단어의 일측에 해당 단어 선택 버튼과 해당 단어 미선택 버튼 중에서 적어도 하나의 버튼을 출력하거나, 각 단의적 어구의 일측에 해당 어구 선택 버튼과 해당 어구 미선택 버튼 중에서 적어도 하나의 버튼을 출력할 수 있다.
번역 결과 검증은 번역 결과를 상대방에게 전달하기 전 단계에서 수행된다. 번역 결과 검증은 번역 결과에 오류가 있다고 의심이 될 때 이를 사용자에게 확인하는 과정이다.
도 10에서 "나는 모욕을 먹었다"의 번역 결과가 "I ate insult"로 번역되었으나, "I ate insult"는 영어에서는 쓰이지 않는 표현이고, 이러한 표현은 언어 모델이나 번역 지식 등의 다양한 지식을 통해 오류가 있다는 판단이 가능하다. 따라서, 이러한 번역 오류 가능성이 높은 문장들에 대해서는 사용자에게 확인을 하고, 이를 더 나은 표현으로 수정하도록 권장한다.
사용자에게 확인하는 과정은 다음과 같다. 먼저 "I ate insult"의 번역 결과 즉 역번역 결과(backtranslation) "나는 모욕을 섭취했다"를 제시한다. 그러면 사용자는 어느 부분에서 번역 오류가 발생하였는지를 판단할 수 있다. 이후 번역문과 연계된 원문의 링크 정보를 활용하여 원문에서 번역 오류가 발생된 중의적 표현을 중의성이 없는 다른 표현 "나는 모욕을 당했다"로 재작성하여 제시한다.
③ 응답 기반 검증
재번역 여부 입력부(421)는 제1 입력문에 대한 번역문을 사용자의 상대방에게 전달한 후 번역문에 대한 상대방의 반응에 따라 사용자로부터 번역문을 재번역할 것인지 여부를 입력받는 기능을 수행한다.
도 12는 도 7에 도시된 재번역 여부 입력부의 내부 구성을 도시한 블록도이다. 번역문의 오역은 사용자가 상대방의 반응을 시각적으로 확인한 뒤 판단할 수 있지만, 양방향 통번역 서버(11)나 양방향 통번역 단말(21)에 의해 판단될 수도 있다.
사용자에 의해 판단될 경우, 재번역 여부 입력부(421)는 응답 출력부(611) 및 메시지 응답부(602)를 포함할 수 있다. 응답 출력부(611)는 번역문을 수신한 상대방의 응답을 출력한다. 응답 출력부(611)는 상기 응답을 상대방에 의해 입력된 문자나 상대방의 제스처를 촬영한 이미지로 출력한다. 메시지 응답부(602)는 응답을 확인한 사용자로부터 번역문을 재번역할 것인지 여부를 입력받는다.
한편 양방향 통번역 서버(11)나 양방향 통번역 단말(21)에 의해 판단될 경우, 재번역 여부 입력부(421)는 메시지 출력부(601) 및 메시지 응답부(602)를 포함할 수 있다. 메시지 출력부(601)는 미리 정해진 시간동안 번역문을 수신한 상대방이 무응답이거나 상대방의 응답에 번역문을 이해하지 못했음을 의미하는 단어나 구절이 포함되어 있으면 번역문의 재번역을 요청하는 메시지를 출력한다. 메시지 응답부(602)는 메시지를 확인한 사용자로부터 번역문을 재번역할 것인지 여부를 입력받는다.
제2 역번역문 출력부(422)는 상기 입력이 번역문의 재번역 요청이면 역번역문을 제1 입력문과 함께 출력하는 기능을 수행한다.
동일성 여부 입력부(412), 타의미 문구 출력부(413) 및 제2 선택적 입력부(414)에 대해서는 번역 결과 검증의 경우에서 이미 설명하였는 바, 여기서는 자세한 설명을 생략한다.
응답 기반 검증은 사용자의 번역 결과가 상대에게 이해가 되지 않아 오류로 판단된 이후의 프로세스는 번역 결과 검증의 경우와 동일하다. 그러나, 응답 기반 검증은 번역 결과 검증과 달리 사용자의 반응을 통해 번역 오류 여부를 판단한다.
한국어 사용자 :
[원문] 어디서 만났지?
[번역문] Where did they meet?
영어 사용자 :
??? What? What do you mean?
위와 같은 상황에서, 한국어 사용자 문장 "어디서 만났지?"가 "Where did they meet?"로 번역되었을 때, 영어 사용자는 해당 문장의 의미를 이해하지 못하고 있음을 알 수 있다. 이러한 대화가 발생했을 경우, 화자였던 한국어 사용자에게만 번역 프로세스 및 대화 프로세스를 맡겨둘 경우, 상호간의 올바른 대화가 제대로 진행되기 위해서는 오류 파악 및 이해 등에 많은 시간과 노력이 필요할 것이다.
그래서 응답 기반 검증은 다음 두가지로 구성된다.
- 사용자 응답 기반 번역 오류 발생 탐지
- 오류 파악 정보 제공 기반 원문 재작성
사용자 응답 기반 번역 오류 발생 탐지에서는 원문의 번역 결과에 대해 사용자가 어떻게 반응하는지를 파악하여 번역 오류 여부를 판단한다. 오류 판단은 사용자가 번역 오류 발생에 의해 대화 상에서 이해할 수 없는 번역 문장이 나타날 경우에 반응하는 다양한 경우를 탐지할 수 있도록 한다. 예를 들어, 위와 같이 "???", "What?", "What do you mean?" 등이 대표적인 경우이다.
이렇게 사용자 반응에 의해 번역 오류 가능성이 탐지되면, 번역 결과 검증의 경우와 동일하게 backtranslation 및 원문 링크 정보에 기반한 원문 재작성 결과를 제시하여 원문 작성자가 번역 오류를 파악할 수 있도록 함으로써, 번역 오류가 발생하지 않는 문장으로 재작성하도록 유도된다.
위의 예를 들어 그 과정을 살펴보면
- 사용자 응답 기반 번역 오류 발생 탐지 :
What? What do you mean?
- 오류 파악 정보 제공 기반 원문 재작성
[Backtranslation] 그들은 어디에서 만났습니까?
[원문 대치] 그들이 어디서 만났지?
이를 통해 원문 작성자는 만난 주체가 "우리"가 아닌 "그들"로 잘못 번역되었음을 확인하고, 원문을 "우리가 어디서 만났지?"와 같이 재작성할 수 있게 된다.
이상 설명한 바와 같이, 본 발명에서는 오류 가능성이 있는 문장들은 문맥 구성에서 배제하기 위해 원문 분석 검증, 번역 결과 검증, 응답 기반 검증 등으로 구분하여 번역 오류 여부를 판단하고, 이를 통해 정확한 문맥 구성을 가능하게 함으로써, 더욱 정확한 번역 및 올바른 대화가 더욱 빠른 시간 내에 가능해지도록 한다.
다음으로, 문맥 검증 장치의 문맥 검증 방법에 대하여 설명한다. 도 13은 본 발명의 바람직한 실시예에 따른 문맥 검증 방법을 개략적으로 도시한 흐름도이다. 본 실시예에 따른 문맥 검증 방법은 입력문을 제1 언어로 출력하는 제1 사용자 단말과 입력문을 제2 언어로 출력하는 제2 사용자 단말 사이에서 메신저 기능, 양방향 번역 기능 및 양방향 통역 기능 중 적어도 하나의 기능을 제공하는 서버에서 수행될 수 있다. 또한 문맥 검증 방법은 양방향 번역 프로그램과 양방향 통역 프로그램 중 적어도 하나의 프로그램과 입력 장치가 탑재된 단말에서 수행되는 것도 가능하다. 이하 설명은 도 6 내지 도 7, 및 도 11 내지 도 13을 참조한다.
먼저 중의적 표현 검증부(310)가 사용자의 입력에 따라 제1 입력문 또는 제1 입력문에 대한 역번역문에서 중의적 표현을 검증한다. 중의적 표현 검증부(310)는 원문 분석 검증, 번역 결과 검증 및 응답 기반 검증 중에서 어느 하나의 검증 방법에 따라 중의적 표현을 검증한다(S10). 이하 각 검증 방법에 대해 설명한다.
원문 분석 검증의 경우, 먼저, 중의적 표현으로 중의적 문장이 있으면 의미별 구분 출력부(401)가 중의적 문장을 각 의미를 담은 단의적 문장들로 구분하여 출력한다. 또한 중의적 표현으로 중의적 단어가 있으면 의미별 구분 출력부(401)가 중의적 단어를 각 의미를 담은 단의적 단어들로 구분하여 출력한다.
의미별 구분 출력부(401)는 각 단의적 문장을 패러프레이징(paraphrasing)에 따라 구분하여 출력하거나, 각 단의적 단어를 문자나 이미지로 구분하여 출력할 수 있다.
또한 의미별 구분 출력부(401)는 하나의 창에서 중의적 문장의 상하 중 어느 한 부분에 단의적 문장들을 일방향으로 순차 정렬시켜 출력하거나, 별도의 창에 단의적 문장들만 일방향으로 순차 정렬시켜 출력하거나, 하나의 창에서 중의적 단어의 상하좌우 중 어느 한 부분에 단의적 단어들을 일방향으로 순차 정렬시켜 출력하거나, 별도의 창에 단의적 단어들만 일방향으로 순차 정렬시켜 출력할 수 있다.
이후, 제1 선택적 입력부(402)가 단의적 문장들이나 단의적 단어들 중에서 어느 하나의 단의적 문장이나 단의적 단어를 사용자로부터 선택적으로 입력받는다.
제1 선택적 입력부(402)는 각 단의적 문장의 일측에 해당 문장 선택 버튼과 해당 문장 미선택 버튼 중에서 적어도 하나의 버튼을 출력하거나, 각 단의적 단어의 일측에 해당 단어 선택 버튼과 해당 단어 미선택 버튼 중에서 적어도 하나의 버튼을 출력할 수 있다.
번역 결과 검증의 경우, 먼저, 제1 역번역문 출력부(411)가 제1 입력문에 대한 번역문을 사용자의 상대방에게 전달하기 전 역번역문을 제1 입력문과 함께 출력한다.
이후, 동일성 여부 입력부(412)가 역번역문과 제1 입력문의 의미적 동일성 여부를 입력한다.
이후, 타의미 문구 출력부(413)가 상기 입력이 역번역문과 제1 입력문이 의미적으로 동일하지 않다는 것이면, 역번역문과 비교할 때 상이한 제1 입력문의 중의적 단어나 중의적 어구를 역번역문에서 출력된 의미를 제외한 다른 의미를 담은 단의적 단어나 단의적 어구를 출력한다.
이후, 제2 선택적 입력부(414)가 출력된 단의적 단어나 단의적 어구가 1개이면 사용자로부터 출력된 단의적 단어나 단의적 어구의 선택 여부를 입력받으며, 출력된 단의적 단어나 단의적 어구가 적어도 2개이면 출력된 단의적 단어들이나 단의적 어구들 중에서 어느 하나의 단의적 단어나 단의적 어구를 사용자로부터 선택적으로 입력받는다.
단의적 단어나 단의적 어구가 1개일 때, 먼저 단어/어구 출력부(501)가 단의적 단어나 단의적 어구를 출력하며, 이후 선택 여부 입력부(502)가 출력된 단의적 단어나 단의적 어구를 선택할 것인지 여부를 사용자로부터 입력받는다. 출력된 단의적 단어나 단의적 어구가 사용자에 의해 선택되지 않으면, 타 문구 입력부(520)가 사용자로부터 다른 단의적 단어나 단의적 어구를 입력받는다.
단의적 단어나 단의적 어구가 적어도 2개일 때, 먼저 단어/어구 정렬부(511)가 중의적 단어나 중의적 어구의 상하좌우 중 어느 한 부분에 단의적 단어들이나 단의적 어구들을 일방향으로 순차 정렬시켜 출력하거나, 별도의 창에 단의적 단어들이나 단의적 어구들만 일방향으로 순차 정렬시켜 출력한다. 이후 단어/어구 택일부(512)가 단의적 단어들이나 단의적 어구들 중에서 어느 하나의 단의적 단어나 단의적 어구를 사용자로부터 선택적으로 입력받는다. 단어/어구 택일부(512)는 각 단의적 단어의 일측에 해당 단어 선택 버튼과 해당 단어 미선택 버튼 중에서 적어도 하나의 버튼을 출력하거나, 각 단의적 어구의 일측에 해당 어구 선택 버튼과 해당 어구 미선택 버튼 중에서 적어도 하나의 버튼을 출력한다.
응답 기반 검증의 경우, 먼저, 재번역 여부 입력부(421)가 제1 입력문에 대한 번역문을 사용자의 상대방에게 전달한 후 번역문에 대한 상대방의 반응에 따라 사용자로부터 번역문을 재번역할 것인지 여부를 입력받는다.
사용자가 상대방의 반응을 시각적으로 확인하여 번역문의 오역을 판단할 경우, 먼저 응답 출력부(611)가 번역문을 수신한 상대방의 응답을 출력하며, 이후 메시지 응답부(602)가 응답을 확인한 사용자로부터 번역문을 재번역할 것인지 여부를 입력받는다.
한편 양방향 통번역 서버(11)나 양방향 통번역 단말(21)에 의해 번역문의 오역이 판단될 경우, 먼저 메시지 출력부(611)가 미리 정해진 시간동안 번역문을 수신한 상대방이 무응답이거나 상대방의 응답에 번역문을 이해하지 못했음을 의미하는 단어나 구절이 포함되어 있으면 번역문의 재번역을 요청하는 메시지를 출력하며, 이후 메시지 응답부(602)가 메시지를 확인한 사용자로부터 번역문을 재번역할 것인지 여부를 입력받는다.
이후, 제2 역번역문 출력부(422)가 상기 입력이 번역문의 재번역 요청이면 역번역문을 제1 입력문과 함께 출력한다.
이후, 동일성 여부 입력부(412)가 역번역문과 제1 입력문의 의미적 동일성 여부를 입력한다.
이후, 타의미 문구 출력부(413)가 상기 입력이 역번역문과 제1 입력문이 의미적으로 동일하지 않다는 것이면, 역번역문과 비교할 때 상이한 제1 입력문의 중의적 단어나 중의적 어구를 역번역문에서 출력된 의미를 제외한 다른 의미를 담은 단의적 단어나 단의적 어구를 출력한다.
이후, 제2 선택적 입력부(414)가 출력된 단의적 단어나 단의적 어구가 1개이면 사용자로부터 출력된 단의적 단어나 단의적 어구의 선택 여부를 입력받으며, 출력된 단의적 단어나 단의적 어구가 적어도 2개이면 출력된 단의적 단어들이나 단의적 어구들 중에서 어느 하나의 단의적 단어나 단의적 어구를 사용자로부터 선택적으로 입력받는다.
S10 단계 이후, 문맥 생성부(320)가 검증된 중의적 표현을 문맥으로 생성한다(S20).
S20 단계 이후, 문맥 제어부(330)가 생성된 문맥이 제1 입력문 또는 제1 입력문 이후에 입력되는 제2 입력문들을 번역하거나 통역하는 데에 적용되도록 제어한다(S30).
이상에서 설명한 본 발명의 실시예를 구성하는 모든 구성요소들이 하나로 결합하거나 결합하여 동작하는 것으로 기재되어 있다고 해서, 본 발명이 반드시 이러한 실시예에 한정되는 것은 아니다. 즉, 본 발명의 목적 범위 안에서라면, 그 모든 구성요소들이 하나 이상으로 선택적으로 결합하여 동작할 수도 있다. 또한, 그 모든 구성요소들이 각각 하나의 독립적인 하드웨어로 구현될 수 있지만, 각 구성요소들의 그 일부 또는 전부가 선택적으로 조합되어 하나 또는 복수개의 하드웨어에서 조합된 일부 또는 전부의 기능을 수행하는 프로그램 모듈을 갖는 컴퓨터 프로그램으로서 구현될 수도 있다. 또한, 이와 같은 컴퓨터 프로그램은 USB 메모리, CD 디스크, 플래쉬 메모리 등과 같은 컴퓨터가 읽을 수 있는 기록매체(Computer Readable Media)에 저장되어 컴퓨터에 의하여 읽혀지고 실행됨으로써, 본 발명의 실시예를 구현할 수 있다. 컴퓨터 프로그램의 기록매체로서는 자기 기록매체, 광 기록매체, 캐리어 웨이브 매체 등이 포함될 수 있다.
또한, 기술적이거나 과학적인 용어를 포함한 모든 용어들은, 상세한 설명에서 다르게 정의되지 않는 한, 본 발명이 속하는 기술 분야에서 통상의 지식을 가진 자에 의해 일반적으로 이해되는 것과 동일한 의미를 갖는다. 사전에 정의된 용어와 같이 일반적으로 사용되는 용어들은 관련 기술의 문맥상의 의미와 일치하는 것으로 해석되어야 하며, 본 발명에서 명백하게 정의하지 않는 한, 이상적이거나 과도하게 형식적인 의미로 해석되지 않는다.
이상의 설명은 본 발명의 기술 사상을 예시적으로 설명한 것에 불과한 것으로서, 본 발명이 속하는 기술 분야에서 통상의 지식을 가진 자라면 본 발명의 본질적인 특성에서 벗어나지 않는 범위 내에서 다양한 수정, 변경 및 치환이 가능할 것이다. 따라서, 본 발명에 개시된 실시예 및 첨부된 도면들은 본 발명의 기술 사상을 한정하기 위한 것이 아니라 설명하기 위한 것이고, 이러한 실시예 및 첨부된 도면에 의하여 본 발명의 기술 사상의 범위가 한정되는 것은 아니다. 본 발명의 보호 범위는 아래의 청구 범위에 의하여 해석되어야 하며, 그와 동등한 범위 내에 있는 모든 기술 사상은 본 발명의 권리 범위에 포함되는 것으로 해석되어야 할 것이다.
10 : 제1 양방향 통번역 시스템 11 : 양방향 통번역 서버
12 : 제1 사용자 단말 13 : 제2 사용자 단말
20 : 제2 양방향 통번역 시스템 21 : 양방향 통번역 단말
22 : 제1 사용자 23 : 제2 사용자

Claims (20)

  1. 사용자의 입력에 따라 제1 입력문 또는 상기 제1 입력문에 대한 역번역문에서 중의적 표현을 검증하는 중의적 표현 검증부;
    검증된 중의적 표현을 문맥으로 생성하는 문맥 생성부; 및
    생성된 문맥이 상기 제1 입력문 또는 상기 제1 입력문 이후에 입력되는 제2 입력문들을 번역하거나 통역하는 데에 적용되도록 제어하는 문맥 제어부
    를 포함하는 것을 특징으로 하는 문맥 검증 장치.
  2. 제 1 항에 있어서,
    상기 중의적 표현 검증부는,
    상기 중의적 표현으로 중의적 문장이 있으면 상기 중의적 문장을 각 의미를 담은 단의적 문장들로 구분하여 출력하거나, 상기 중의적 표현으로 중의적 단어가 있으면 상기 중의적 단어를 각 의미를 담은 단의적 단어들로 구분하여 출력하는 의미별 구분 출력부; 및
    상기 단의적 문장들이나 상기 단의적 단어들 중에서 어느 하나의 단의적 문장이나 단의적 단어를 상기 사용자로부터 선택적으로 입력받는 제1 선택적 입력부
    를 포함하는 것을 특징으로 하는 문맥 검증 장치.
  3. 제 2 항에 있어서,
    상기 의미별 구분 출력부는 각 단의적 문장을 패러프레이징(paraphrasing)에 따라 구분하여 출력하거나, 각 단의적 단어를 문자나 이미지로 구분하여 출력하는 것을 특징으로 하는 문맥 검증 장치.
  4. 제 2 항에 있어서,
    상기 의미별 구분 출력부는 하나의 창에서 상기 중의적 문장의 상하 중 어느 한 부분에 상기 단의적 문장들을 일방향으로 순차 정렬시켜 출력하거나, 별도의 창에 상기 단의적 문장들만 일방향으로 순차 정렬시켜 출력하거나, 하나의 창에서 상기 중의적 단어의 상하좌우 중 어느 한 부분에 상기 단의적 단어들을 일방향으로 순차 정렬시켜 출력하거나, 별도의 창에 상기 단의적 단어들만 일방향으로 순차 정렬시켜 출력하는 것을 특징으로 하는 문맥 검증 장치.
  5. 제 2 항에 있어서,
    상기 제1 선택적 입력부는 각 단의적 문장의 일측에 해당 문장 선택 버튼과 해당 문장 미선택 버튼 중에서 적어도 하나의 버튼을 출력하거나, 각 단의적 단어의 일측에 해당 단어 선택 버튼과 해당 단어 미선택 버튼 중에서 적어도 하나의 버튼을 출력하는 것을 특징으로 하는 문맥 검증 장치.
  6. 제 1 항에 있어서,
    상기 중의적 표현 검증부는,
    상기 제1 입력문에 대한 번역문을 상기 사용자의 상대방에게 전달하기 전 상기 역번역문을 상기 제1 입력문과 함께 출력하는 제1 역번역문 출력부;
    상기 역번역문과 상기 제1 입력문의 의미적 동일성 여부를 입력하는 동일성 여부 입력부;
    상기 입력이 상기 역번역문과 상기 제1 입력문이 의미적으로 동일하지 않다는 것이면, 상기 역번역문과 비교할 때 상이한 상기 제1 입력문의 중의적 단어나 중의적 어구를 상기 역번역문에서 출력된 의미를 제외한 다른 의미를 담은 단의적 단어나 단의적 어구를 출력하는 타의미 문구 출력부; 및
    출력된 단의적 단어나 단의적 어구가 1개이면 상기 사용자로부터 상기 출력된 단의적 단어나 단의적 어구의 선택 여부를 입력받으며, 출력된 단의적 단어나 단의적 어구가 적어도 2개이면 출력된 단의적 단어들이나 단의적 어구들 중에서 어느 하나의 단의적 단어나 단의적 어구를 상기 사용자로부터 선택적으로 입력받는 제2 선택적 입력부
    를 포함하는 것을 특징으로 하는 문맥 검증 장치.
  7. 제 6 항에 있어서,
    상기 제2 선택적 입력부는,
    단의적 단어나 단의적 어구가 1개일 때 상기 단의적 단어나 상기 단의적 어구를 출력하는 단어/어구 출력부; 및
    출력된 단의적 단어나 단의적 어구를 선택할 것인지 여부를 상기 사용자로부터 입력받는 선택 여부 입력부
    를 포함하며,
    상기 중의적 표현 검증부는,
    출력된 단의적 단어나 단의적 어구가 상기 사용자에 의해 선택되지 않으면 상기 사용자로부터 다른 단의적 단어나 단의적 어구를 입력받는 타 문구 입력부
    를 더욱 포함하는 것을 특징으로 하는 문맥 검증 장치.
  8. 제 6 항에 있어서,
    상기 제2 선택적 입력부는,
    단의적 단어나 단의적 어구가 적어도 2개일 때 상기 중의적 단어나 상기 중의적 어구의 상하좌우 중 어느 한 부분에 단의적 단어들이나 단의적 어구들을 일방향으로 순차 정렬시켜 출력하거나, 별도의 창에 상기 단의적 단어들이나 상기 단의적 어구들만 일방향으로 순차 정렬시켜 출력하는 단어/어구 정렬부; 및
    상기 단의적 단어들이나 상기 단의적 어구들 중에서 어느 하나의 단의적 단어나 단의적 어구를 상기 사용자로부터 선택적으로 입력받는 단어/어구 택일부
    를 포함하는 것을 특징으로 하는 문맥 검증 장치.
  9. 제 8 항에 있어서,
    상기 단어/어구 택일부는 각 단의적 단어의 일측에 해당 단어 선택 버튼과 해당 단어 미선택 버튼 중에서 적어도 하나의 버튼을 출력하거나, 각 단의적 어구의 일측에 해당 어구 선택 버튼과 해당 어구 미선택 버튼 중에서 적어도 하나의 버튼을 출력하는 것을 특징으로 하는 문맥 검증 장치.
  10. 제 1 항에 있어서,
    상기 중의적 표현 검증부는,
    상기 제1 입력문에 대한 번역문을 상기 사용자의 상대방에게 전달한 후 상기 번역문에 대한 상기 상대방의 반응에 따라 상기 사용자로부터 상기 번역문을 재번역할 것인지 여부를 입력받는 재번역 여부 입력부;
    상기 입력이 상기 번역문의 재번역 요청이면 상기 역번역문을 상기 제1 입력문과 함께 출력하는 제2 역번역문 출력부;
    상기 역번역문과 상기 제1 입력문의 의미적 동일성 여부를 입력하는 동일성 여부 입력부;
    상기 입력이 상기 역번역문과 상기 제1 입력문이 의미적으로 동일하지 않다는 것이면, 상기 역번역문과 비교할 때 상이한 상기 제1 입력문의 중의적 단어나 중의적 어구를 상기 역번역문에서 출력된 의미를 제외한 다른 의미를 담은 단의적 단어나 단의적 어구를 출력하는 타의미 문구 출력부; 및
    출력된 단의적 단어나 단의적 어구가 1개이면 상기 사용자로부터 상기 출력된 단의적 단어나 단의적 어구의 선택 여부를 입력받으며, 출력된 단의적 단어나 단의적 어구가 적어도 2개이면 출력된 단의적 단어들이나 단의적 어구들 중에서 어느 하나의 단의적 단어나 단의적 어구를 상기 사용자로부터 선택적으로 입력받는 제2 선택적 입력부
    를 포함하는 것을 특징으로 하는 문맥 검증 장치.
  11. 제 10 항에 있어서,
    상기 재번역 여부 입력부는,
    미리 정해진 시간동안 상기 번역문을 수신한 상기 상대방이 무응답이거나 상기 상대방의 응답에 상기 번역문을 이해하지 못했음을 의미하는 단어나 구절이 포함되어 있으면 상기 번역문의 재번역을 요청하는 메시지를 출력하는 메시지 출력부; 및
    상기 메시지를 확인한 상기 사용자로부터 상기 번역문을 재번역할 것인지 여부를 입력받는 메시지 응답부
    를 포함하는 것을 특징으로 하는 문맥 검증 장치.
  12. 제 10 항에 있어서,
    상기 재번역 여부 입력부는,
    상기 번역문을 수신한 상기 상대방의 응답을 출력하는 응답 출력부; 및
    상기 응답을 확인한 상기 사용자로부터 상기 번역문을 재번역할 것인지 여부를 입력받는 메시지 응답부
    를 포함하는 것을 특징으로 하는 문맥 검증 장치.
  13. 제 12 항에 있어서,
    상기 응답 출력부는 상기 응답을 상기 상대방에 의해 입력된 문자나 상기 상대방의 제스처를 촬영한 이미지로 출력하는 것을 특징으로 하는 문맥 검증 장치.
  14. 제 1 항에 있어서,
    상기 중의적 표현 검증부는 상기 제1 입력문으로 음성으로 입력된 것 또는 키패드나 터치 패드를 비롯한 입력 장치로 입력된 것을 이용하는 것을 특징으로 하는 문맥 검증 장치.
  15. 제 1 항에 있어서,
    상기 문맥 검증 장치는 입력문을 제1 언어로 출력하는 제1 사용자 단말과 입력문을 제2 언어로 출력하는 제2 사용자 단말 사이에서 메신저 기능, 양방향 번역 기능 및 양방향 통역 기능 중 적어도 하나의 기능을 제공하는 서버에 장착되거나, 양방향 번역 프로그램과 양방향 통역 프로그램 중 적어도 하나의 프로그램과 입력 장치가 탑재된 단말에 장착되는 것을 특징으로 하는 문맥 검증 장치.
  16. 사용자의 입력에 따라 제1 입력문 또는 상기 제1 입력문에 대한 역번역문에서 중의적 표현을 검증하는 중의적 표현 검증 단계;
    검증된 중의적 표현을 문맥으로 생성하는 문맥 생성 단계; 및
    생성된 문맥이 상기 제1 입력문 또는 상기 제1 입력문 이후에 입력되는 제2 입력문들을 번역하거나 통역하는 데에 적용되도록 제어하는 문맥 제어 단계
    를 포함하는 것을 특징으로 하는 문맥 검증 방법.
  17. 제 16 항에 있어서,
    상기 중의적 표현 검증 단계는,
    상기 중의적 표현으로 중의적 문장이 있으면 상기 중의적 문장을 각 의미를 담은 단의적 문장들로 구분하여 출력하거나, 상기 중의적 표현으로 중의적 단어가 있으면 상기 중의적 단어를 각 의미를 담은 단의적 단어들로 구분하여 출력하는 의미별 구분 출력 단계; 및
    상기 단의적 문장들이나 상기 단의적 단어들 중에서 어느 하나의 단의적 문장이나 단의적 단어를 상기 사용자로부터 선택적으로 입력받는 제1 선택적 입력 단계
    를 포함하는 것을 특징으로 하는 문맥 검증 방법.
  18. 제 16 항에 있어서,
    상기 중의적 표현 검증 단계는,
    상기 제1 입력문에 대한 번역문을 상기 사용자의 상대방에게 전달하기 전 상기 역번역문을 상기 제1 입력문과 함께 출력하는 제1 역번역문 출력 단계;
    상기 역번역문과 상기 제1 입력문의 의미적 동일성 여부를 입력하는 동일성 여부 입력 단계;
    상기 입력이 상기 역번역문과 상기 제1 입력문이 의미적으로 동일하지 않다는 것이면, 상기 역번역문과 비교할 때 상이한 상기 제1 입력문의 중의적 단어나 중의적 어구를 상기 역번역문에서 출력된 의미를 제외한 다른 의미를 담은 단의적 단어나 단의적 어구를 출력하는 타의미 문구 출력 단계; 및
    출력된 단의적 단어나 단의적 어구가 1개이면 상기 사용자로부터 상기 출력된 단의적 단어나 단의적 어구의 선택 여부를 입력받으며, 출력된 단의적 단어나 단의적 어구가 적어도 2개이면 출력된 단의적 단어들이나 단의적 어구들 중에서 어느 하나의 단의적 단어나 단의적 어구를 상기 사용자로부터 선택적으로 입력받는 제2 선택적 입력 단계
    를 포함하는 것을 특징으로 하는 문맥 검증 방법.
  19. 제 16 항에 있어서,
    상기 중의적 표현 검증 단계는,
    상기 제1 입력문에 대한 번역문을 상기 사용자의 상대방에게 전달한 후 상기 번역문에 대한 상기 상대방의 반응에 따라 상기 사용자로부터 상기 번역문을 재번역할 것인지 여부를 입력받는 재번역 여부 입력 단계;
    상기 입력이 상기 번역문의 재번역 요청이면 상기 역번역문을 상기 제1 입력문과 함께 출력하는 제2 역번역문 출력 단계;
    상기 역번역문과 상기 제1 입력문의 의미적 동일성 여부를 입력하는 동일성 여부 입력 단계;
    상기 입력이 상기 역번역문과 상기 제1 입력문이 의미적으로 동일하지 않다는 것이면, 상기 역번역문과 비교할 때 상이한 상기 제1 입력문의 중의적 단어나 중의적 어구를 상기 역번역문에서 출력된 의미를 제외한 다른 의미를 담은 단의적 단어나 단의적 어구를 출력하는 타의미 문구 출력 단계; 및
    출력된 단의적 단어나 단의적 어구가 1개이면 상기 사용자로부터 상기 출력된 단의적 단어나 단의적 어구의 선택 여부를 입력받으며, 출력된 단의적 단어나 단의적 어구가 적어도 2개이면 출력된 단의적 단어들이나 단의적 어구들 중에서 어느 하나의 단의적 단어나 단의적 어구를 상기 사용자로부터 선택적으로 입력받는 제2 선택적 입력 단계
    를 포함하는 것을 특징으로 하는 문맥 검증 방법.
  20. 제 16 항에 있어서,
    상기 문맥 검증 방법은 입력문을 제1 언어로 출력하는 제1 사용자 단말과 입력문을 제2 언어로 출력하는 제2 사용자 단말 사이에서 메신저 기능, 양방향 번역 기능 및 양방향 통역 기능 중 적어도 하나의 기능을 제공하는 서버에서 수행되거나, 양방향 번역 프로그램과 양방향 통역 프로그램 중 적어도 하나의 프로그램과 입력 장치가 탑재된 단말에서 수행되는 것을 특징으로 하는 문맥 검증 방법.
KR1020120147536A 2012-12-17 2012-12-17 문맥 검증 장치 및 방법 KR20140079598A (ko)

Priority Applications (2)

Application Number Priority Date Filing Date Title
KR1020120147536A KR20140079598A (ko) 2012-12-17 2012-12-17 문맥 검증 장치 및 방법
US14/040,036 US20140172411A1 (en) 2012-12-17 2013-09-27 Apparatus and method for verifying context

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020120147536A KR20140079598A (ko) 2012-12-17 2012-12-17 문맥 검증 장치 및 방법

Publications (1)

Publication Number Publication Date
KR20140079598A true KR20140079598A (ko) 2014-06-27

Family

ID=50931938

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020120147536A KR20140079598A (ko) 2012-12-17 2012-12-17 문맥 검증 장치 및 방법

Country Status (2)

Country Link
US (1) US20140172411A1 (ko)
KR (1) KR20140079598A (ko)

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20180107881A (ko) 2017-03-23 2018-10-04 이동민 사용자 상태를 고려한 중의적 표현 분석 장치 및 방법
KR20190059561A (ko) * 2017-11-23 2019-05-31 삼성전자주식회사 기계 번역 방법 및 장치
CN110546634A (zh) * 2017-04-27 2019-12-06 松下知识产权经营株式会社 翻译装置
WO2020009261A1 (ko) * 2018-07-02 2020-01-09 엘지전자 주식회사 음성 인식이 가능한 디지털 디바이스 및 그 제어 방법
KR102138663B1 (ko) * 2019-03-29 2020-07-28 이승진 다국어 번역 지원이 가능한 채팅시스템 및 번역 제공방법
US10846487B2 (en) 2018-01-26 2020-11-24 Samsung Electronics Co., Ltd. Machine translation method and apparatus
US11093719B2 (en) 2018-02-12 2021-08-17 Samsung Electronics Co., Ltd. Machine translation method and apparatus
WO2022186434A1 (ko) * 2021-03-03 2022-09-09 삼성전자주식회사 전자 장치 및 이의 제어 방법
US11928111B2 (en) 2021-03-03 2024-03-12 Samsung Electronics Co., Ltd. Electronic apparatus and method for controlling electronic apparatus

Families Citing this family (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20130096978A (ko) * 2012-02-23 2013-09-02 삼성전자주식회사 사용자 단말, 서버, 상황기반 정보 제공 시스템 및 그 방법
US9594749B2 (en) * 2014-09-30 2017-03-14 Microsoft Technology Licensing, Llc Visually differentiating strings for testing
US10152476B2 (en) 2015-03-19 2018-12-11 Panasonic Intellectual Property Management Co., Ltd. Wearable device and translation system
CN106649283B (zh) * 2015-11-02 2020-04-28 姚珍强 用于移动设备的基于自然对话方式的翻译装置和方法
JP6775202B2 (ja) * 2017-06-19 2020-10-28 パナソニックIpマネジメント株式会社 処理方法、処理装置、及び処理プログラム
KR102450816B1 (ko) 2017-11-28 2022-10-05 한국전자통신연구원 실시간 자동 통역 시스템 및 이의 발화 검증 방법
US10936635B2 (en) * 2018-10-08 2021-03-02 International Business Machines Corporation Context-based generation of semantically-similar phrases
CN114514529A (zh) * 2019-11-11 2022-05-17 深圳市欢太科技有限公司 摘要生成方法、装置、电子设备和存储介质
JP7427553B2 (ja) * 2020-07-16 2024-02-05 株式会社デンソーテン タクシー管理装置、タクシー運用システム及び運賃設定方法
CN112671700B (zh) * 2020-10-22 2023-06-20 垒途智能教科技术研究院江苏有限公司 一种企业经济管理信息安全系统

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP0968475B1 (en) * 1997-05-28 2001-12-19 Shinar Linguistic Technologies Inc. Translation system
JP2008511883A (ja) * 2004-08-31 2008-04-17 テックマインド ソシエタ ア レスポンサビリタ リミタータ 第1言語から第2言語への自動翻訳のための方法および/またはそのための集積回路処理装置における処理機能およびその方法を実行するための装置
US7827026B2 (en) * 2004-12-21 2010-11-02 Xerox Corporation Bilingual authoring assistant for the “tip of the tongue” problem
US7848915B2 (en) * 2006-08-09 2010-12-07 International Business Machines Corporation Apparatus for providing feedback of translation quality using concept-based back translation
US9002869B2 (en) * 2007-06-22 2015-04-07 Google Inc. Machine translation for query expansion

Cited By (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20180107881A (ko) 2017-03-23 2018-10-04 이동민 사용자 상태를 고려한 중의적 표현 분석 장치 및 방법
CN110546634A (zh) * 2017-04-27 2019-12-06 松下知识产权经营株式会社 翻译装置
KR20190059561A (ko) * 2017-11-23 2019-05-31 삼성전자주식회사 기계 번역 방법 및 장치
US10846487B2 (en) 2018-01-26 2020-11-24 Samsung Electronics Co., Ltd. Machine translation method and apparatus
US11093719B2 (en) 2018-02-12 2021-08-17 Samsung Electronics Co., Ltd. Machine translation method and apparatus
WO2020009261A1 (ko) * 2018-07-02 2020-01-09 엘지전자 주식회사 음성 인식이 가능한 디지털 디바이스 및 그 제어 방법
KR102138663B1 (ko) * 2019-03-29 2020-07-28 이승진 다국어 번역 지원이 가능한 채팅시스템 및 번역 제공방법
WO2020204680A1 (ko) * 2019-03-29 2020-10-08 이승진 다국어 번역 지원이 가능한 채팅시스템 및 번역 제공방법
WO2022186434A1 (ko) * 2021-03-03 2022-09-09 삼성전자주식회사 전자 장치 및 이의 제어 방법
US11928111B2 (en) 2021-03-03 2024-03-12 Samsung Electronics Co., Ltd. Electronic apparatus and method for controlling electronic apparatus

Also Published As

Publication number Publication date
US20140172411A1 (en) 2014-06-19

Similar Documents

Publication Publication Date Title
KR20140079598A (ko) 문맥 검증 장치 및 방법
Li et al. Multi-modal repairs of conversational breakdowns in task-oriented dialogs
US10217464B2 (en) Vocabulary generation system
JP6649124B2 (ja) 機械翻訳方法、機械翻訳装置及びプログラム
KR101781557B1 (ko) 텍스트 입력을 용이하게 하기 위한 방법 및 시스템
Skantze Exploring human error recovery strategies: Implications for spoken dialogue systems
JP4517260B2 (ja) 自動通訳システム、自動通訳方法、および自動通訳用プログラムを記録した記憶媒体
US20140316764A1 (en) Clarifying natural language input using targeted questions
EP3491641B1 (en) Acoustic model training using corrected terms
Koulouri et al. Do (and say) as I say: Linguistic adaptation in human–computer dialogs
US10810381B2 (en) Speech converter
US10747560B2 (en) Computerized task guidance across devices and applications
US11257484B2 (en) Data-driven and rule-based speech recognition output enhancement
KR101534413B1 (ko) 상담 정보를 이용하여 상담 대화를 제공하는 방법 및 장치
US11907665B2 (en) Method and system for processing user inputs using natural language processing
KR20140094919A (ko) 문장 형식별 구성요소 배열 및 확장에 따른 언어 교육 시스템 및 방법과 기록 매체: 팩토리얼 언어 교육법
KR20130112654A (ko) 통역 장치 및 방법
EP3642732A1 (en) System and method for authoring electronic messages
KR101405893B1 (ko) 단말기를 이용한 영어문장의 분석시스템 및 그 방법
Connolly et al. Linguistic concepts and methods in CSCW
Prasad et al. BBN TransTalk: Robust multilingual two-way speech-to-speech translation for mobile platforms
Seligman et al. Evaluation and revision of a speech translation system for healthcare
da Silva Alves et al. Web scripts and mediation dialogues as a quality factor in the interaction of the deaf
McDermott-Wells Math in the dark: Tools for expressing mathematical content by visually impaired students
JP4371080B2 (ja) 自然言語学習支援装置及び方法

Legal Events

Date Code Title Description
WITN Application deemed withdrawn, e.g. because no request for examination was filed or no examination fee was paid