KR102407630B1

KR102407630B1 - 서버, 사용자 단말 및 이들의 제어 방법.

Info

Publication number: KR102407630B1
Application number: KR1020150126986A
Authority: KR
Inventors: 유지상; 이진식; 김상하; 김은경; 이동현; 이재원
Original assignee: 삼성전자주식회사
Priority date: 2015-09-08
Filing date: 2015-09-08
Publication date: 2022-06-10
Also published as: WO2017043715A1; KR20170029866A; US10055406B2; US20170068661A1

Abstract

서버, 사용자 단말 및 이들의 제어 방법이 제공된다. 본 서버의 제어 방법은 사용자 단말로부터 텍스트를 수신하고, 수신된 텍스트를 번역하여 번역 텍스트를 생성하며, 번역 텍스트에서 적어도 하나의 핵심 어휘를 추출하고, 적어도 하나의 핵심 어휘 각각에 대하여 적어도 하나의 핵심 어휘에 대응되는 이미지 정보를 추출하여 사용자 단말로 번역 텍스트 및 추출된 이미지 정보를 제공한다.

Description

서버, 사용자 단말 및 이들의 제어 방법.{SERVER, USER TERMINAL AND A METHOD FOR CONTROLLING THEREOF}

본 발명은 서버, 사용자 단말 및 이들의 제어 방법에 관한 것으로, 더욱 상세하게는 번역 텍스트와 번역 텍스트의 핵심 어휘에 대응되는 이미지 정보를 제공하는 서버, 서버의 제어 방법, 사용자 단말 및 사용자 단말의 제어 방법에 관한 것이다.

종래 통/번역 기술의 경우, 입력된 원본 언어의 번역을 담당하는 디코딩 부를 거쳐 대상 언어로 변환하고, 변환된 대상 언어를 텍스트, 합성음 등을 통해 출력하는 방식이 대부분이다. 이러한 방식의 경우, 사용자가 모르는 대상 언어로 통/변역 한다면, 사용자는 통/번역이 정확히 이루어졌는지 평가하는데 어려움이 있다.

어려움을 극복하기 위하여, 대상 언어로 번역된 결과를 원본 언어로 역번역하여 사용자로 하여금 문장의 오번역 여부를 확인할 수 있도록 하는 방식이 제공되었으나, 순번역/역번역을 수행함으로써 번역 오차가 누적될 가능성이 크기 때문에 번역의 정확도가 높지 않을 수 있다.

따라서, 대상 언어를 모르는 사용자가 원본 언어가 대상 언어로 번역된 번역 언어가 정확히 번역되었는지 직관적으로 알 필요성과 정확도를 높이기 위한 수정에 대한 필요성이 대두되고 있다.

본 발명은 상술한 문제점을 해결하기 위해 안출된 것으로, 본 발명의 목적은 통/번역된 텍스트의 핵심 어휘를 추출하여, 핵심 어휘에 대응되는 이미지를 함께 디스플레이함으로써 수정 가능한 통/번역 텍스트를 제공하는 서버, 서버의 제어 방법, 사용자 단말, 사용자 단말의 제어 방법을 제공함에 있다.

상기 목적을 달성하기 위한 본 발명의 일 실시 예에 따른, 서버의 제어 방법은, 사용자 단말로부터 텍스트를 수신하는 단계; 상기 수신된 텍스트를 번역하여 번역 텍스트를 생성하는 단계; 상기 번역 텍스트에서 적어도 하나의 핵심 어휘를 추출하는 단계; 상기 적어도 하나의 핵심 어휘 각각에 대하여 상기 적어도 하나의 핵심 어휘에 대응되는 이미지 정보를 추출하는 단계; 및 상기 사용자 단말로 상기 번역 텍스트 및 상기 추출된 이미지 정보를 송신하는 단계;를 포함한다.

그리고, 상기 이미지 정보를 수정하기 위한 사용자 명령이 수신되면, 상기 사용자 명령에 대응되는 이미지 정보를 대체하기 위한 적어도 하나의 수정 이미지 정보를 송신하는 단계;를 더 포함할 수 있다.

또한, 상기 수정 이미지 정보를 선택하기 위한 사용자 명령이 수신되면, 상기 사용자 명령에 의해 선택된 수정 이미지 정보를 바탕으로 상기 번역 텍스트를 수정하는 단계; 및 상기 수정된 번역 텍스트를 송신하는 단계;를 더 포함할 수 있다.

그리고, 상기 핵심 어휘를 추출하는 단계는, 동음이의어 사전 또는 유사 발음 사전에 기재된 어휘를 핵심 어휘로 추출할 수 있다.

또한, 상기 적어도 하나의 수정 이미지 정보는, 상기 선택된 이미지 정보가 나타내는 핵심 어휘와 동음이의어이거나 유사 발음을 가지는 단어에 대응될 수 있다.

그리고, 상기 이미지 정보를 추출하는 단계는, 상기 핵심 어휘와 복수의 이미지 정보의 관련 정도를 판단하는 단계; 및 상기 판단된 관련 정도가 가장 높은 이미지 정보를 상기 핵심 어휘에 대응되는 이미지 정보로 추출하는 단계;를 포함할 수 있다.

또한, 상기 이미지 정보는 사진, 동영상, 아이콘 중 하나일 수 있다.

한편, 상기 목적을 달성하기 위한 본 발명의 일 실시 예에 따른, 서버는, 사용자 단말과 통신하는 통신부; 및 상기 사용자 단말로부터 텍스트를 수신하도록 상기 통신부를 제어하고, 상기 수신된 텍스트를 번역하여 번역 텍스트를 생성하고, 상기 번역된 텍스트에서 적어도 하나의 핵심 어휘를 추출하고, 상기 적어도 하나의 핵심 어휘 각각에 대하여 상기 적어도 하나의 핵심 어휘에 대응되는 이미지 정보를 추출하고, 상기 사용자 단말로 상기 번역된 텍스트 및 상기 추출된 이미지 정보를 송신하도록 상기 통신부를 제어하는 제어부를 포함한다.

그리고, 상기 제어부는, 상기 이미지 정보를 수정하기 위한 사용자 명령이 수신되면, 상기 사용자 명령에 대응되는 이미지 정보를 대체하기 위한 적어도 하나의 수정 이미지 정보를 송신하도록 상기 통신부를 제어할 수 있다.

또한, 상기 제어부는, 상기 수정 이미지 정보를 선택하기 위한 사용자 명령이 수신되면, 상기 사용자 명령에 의해 선택된 수정 이미지 정보를 이용하여 상기 번역 텍스트를 수정하고, 상기 수정된 번역 텍스트를 송신하도록 상기 통신부를 제어할 수 있다.

그리고, 상기 제어부는, 동음이의어 사전 또는 유사 발음 사전에 기재된 어휘를 핵심 어휘로 추출할 수 있다.

또한, 상기 적어도 하나의 수정 이미지 정보는, 상기 번역 텍스트와 동음이의어 또는 유사 발음을 가지는 단어에 대응될 수 있다.

그리고, 상기 제어부는, 상기 핵심 어휘와 복수의 이미지 정보의 관련 정도를 판단하고, 상기 판단된 관련 정도가 가장 높은 이미지 정보를 상기 핵심 어휘로 추출할 수 있다.

한편, 상기 목적을 달성하기 위한 본 발명의 일 실시 예에 따른, 사용자 단말의 제어 방법은, 텍스트를 입력받는 단계; 상기 입력된 텍스트를 서버로 전송하는 단계; 상기 서버로부터 번역된 번역 텍스트 및 상기 번역된 텍스트의 핵심 어휘에 대응되는 이미지 정보를 수신하는 단계; 및 상기 수신된 번역 텍스트 및 상기 이미지 정보를 디스플레이하는 단계;를 포함한다.

그리고, 텍스트를 입력받는 단계는, 음성을 인식하는 단계; 및 인식된 음성을 텍스트로 변환하는 단계;를 포함할 수 있다.

또한, 이미지 정보를 수정하기 위한 사용자 명령을 입력되면, 상기 서버로 상기 수정하기 위한 사용자 명령을 전송하는 단계; 상기 서버로부터 상기 수정하기 위한 사용자 명령에 대응되는 이미지 정보를 대체하기 위한 적어도 하나의 수정 이미지 정보를 수신하는 단계; 상기 수신된 적어도 하나의 수정 이미지 정보를 디스플레이하는 단계;를 더 포함할 수 있다.

그리고, 상기 적어도 하나의 수정 이미지 정보 중 하나를 선택하기 위한 사용자 명령이 입력되면, 상기 서버로 상기 선택하기 위한 사용자 명령을 전송하는 단계; 상기 서버로부터 상기 선택하기 위한 사용자 명령에 의해 선택된 수정 이미지 정보를 이용하여 수정된 번역 텍스트를 수신하는 단계; 및 상기 수신된 수정된 번역 텍스트 및 선택된 수정 이미지 정보를 디스플레이하는 단계;를 더 포함할 수 있다.

또한, 상기 디스플레이하는 단계는, 상기 입력된 텍스트 및 상기 이미지 정보와 대칭되도록 상기 번역 텍스트를 디스플레이할 수 있다.

한편, 상기 목적을 달성하기 위한 본 발명의 일 실시 예에 따른, 사용자 단말은, 텍스트를 입력받는 입력부; 서버와 통신하는 통신부; 디스플레이부; 및 상기 입력된 텍스트를 서버로 전송하고, 상기 서버로부터 번역된 번역 텍스트 및 상기 번역 텍스트의 핵심 어휘에 대응되는 이미지 정보를 수신하도록 상기 통신부를 제어하고, 상기 수신된 번역 텍스트 및 상기 이미지 정보를 디스플레이하도록 상기 디스플레이부를 제어하는 제어부;를 포함한다.

그리고, 상기 제어부는, 음성을 입력받도록 상기 입력부를 제어하고, 상기 인식된 음성을 텍스트로 변환할 수 있다.

또한, 상기 제어부는, 이미지 정보를 수정하기 위한 사용자 명령이 입력되면, 상기 서버로 상기 수정하기 위한 사용자 명령을 전송하고, 상기 서버로부터 상기 수정하기 위한 사용자 명령에 대응되는 이미지 정보를 대체하기 위한 적어도 하나의 수정 이미지 정보를 수신하도록 상기 통신부를 제어하고, 상기 수신된 적어도 하나의 수정 이미지 정보를 디스플레이하도록 상기 디스플레이부를 제어할 수 있다.

그리고, 상기 제어부는, 상기 적어도 하나의 수정 이미지 정보 중 하나를 선택하기 위한 사용자 명령이 입력되면, 상기 서버로 상기 선택하기 위한 사용자 명령을 전송하고, 상기 서버로부터 상기 선택하기 위한 사용자 명령에 의해 선택된 수정 이미지 정보를 이용하여 상기 수정된 번역 텍스트를 수신하도록 상기 통신부를 제어하고, 상기 수신된 수정된 번역 텍스트 및 선택된 수정 이미지 정보를 디스플레이하도록 상기 디스플레이부를 제어할 수 있다.

또한, 상기 제어부는, 상기 입력된 텍스트 및 상기 이미지 정보와 대칭되도록 상기 번역 텍스트를 디스플레이하도록 상기 디스플레이부를 제어할 수 있다.

상술한 바와 같이, 본 발명의 다양한 실시 예에 따라, 사용자 단말은 사용자에게 더욱 정확한 통/번역을 제공할 수 있게 된다.

도 1은 본 발명의 일 실시 예에 따른, 서버와 사용자 단말을 포함하는 시스템도,
도 2는 본 발명의 일 실시 예에 따른, 서버의 구성을 간략히 도시한 블럭도,
도 3은 본 발명의 일 실시 예에 따른, 동음이의어의 혼동에 의한 오역의 예시를 설명하기 위한 도면,
도 4는 본 발명의 일 실시 예에 따른, 유사 발음 단어의 혼동에 의한 오역의 예시를 설명하기위한 도면,
도 5는 본 발명의 일 실시 예에 따른, 사용자 단말의 구성을 간략히 도시한 블럭도,
도 6은 본 발명의 일 실시 예에 따른, 사용자 단말의 구성을 상세히 도시한 블럭도,
도 7 내지 도 13은 본 발명의 다양한 실시 예에 따른, 번역된 텍스트와 핵심 어휘에 대응하는 이미지 정보를 함께 제공하는 다양한 실시 예를 설명하기 위한 도면들,
도 14 및 도 15는 본 발명의 다양한 실시 예에 따른, 서버의 제어 방법을 설명하기 위한 흐름도들, 그리고,
도 16은 본 발명의 일 실시 예에 따른, 시스템을 설명하기 위한 시퀀스도이다.

본 발명의 실시 예에서 사용되는 용어에 대해 간략히 설명하고, 본 실시예들에 대해 구체적으로 설명하기로 한다.

본 발명의 실시 예에서 사용되는 용어는 본 발명에서의 기능을 고려하면서 가능한 현재 널리 사용되는 일반적인 용어들을 선택하였으나, 이는 당 분야에 종사하는 기술자의 의도 또는 판례, 새로운 기술의 출현 등에 따라 달라질 수 있다. 또한, 특정한 경우는 출원인이 임의로 선정한 용어도 있으며, 이 경우 해당되는 실시 예들의 설명 부분에서 상세히 그 의미를 기재할 것이다. 따라서 본 실시 예들에서 사용되는 용어는 단순한 용어의 명칭이 아닌, 그 용어가 가지는 의미와 본 실시 예들의 전반에 걸친 내용을 토대로 정의되어야 한다.

본 발명의 실시 예에서, 제1, 제2 등과 같이 서수를 포함하는 용어는 다양한 구성요소들을 설명하는데 사용될 수 있지만, 상기 구성요소들은 상기 용어들에 의해 한정되지는 않는다. 상기 용어들은 하나의 구성요소를 다른 구성요소로부터 구별하는 목적으로만 사용된다. 예를 들어, 본 발명의 권리 범위를 벗어나지 않으면서 제1 구성요소는 제2 구성요소로 명명될 수 있고, 유사하게 제2 구성요소도 제1 구성요소로 명명될 수 있다. 및/또는 이라는 용어는 복수의 관련된 기재된 항목들의 조합 또는 복수의 관련된 기재된 항목들 중의 어느 항목을 포함한다.

또한, 본 발명의 실시 예에서, 단수의 표현은 문맥상 명백하게 다르게 뜻하지 않는 한, 복수의 표현을 포함한다.

또한, 본 발명의 실시 예에서, "포함하다" 또는 "가지다" 등의 용어는 명세서상에 기재된 특징, 숫자, 단계, 동작, 구성요소, 부품 또는 이들을 조합한 것이 존재함을 지정하려는 것이지, 하나 또는 그 이상의 다른 특징들이나 숫자, 단계, 동작, 구성요소, 부품 또는 이들을 조합한 것들의 존재 또는 부가 가능성을 미리 배제하지 않는 것으로 이해되어야 한다.

또한, 본 발명의 실시 예에서, ‘모듈’ 혹은 ‘부’는 적어도 하나의 기능이나 동작을 수행하며, 하드웨어 또는 소프트웨어로 구현되거나 하드웨어와 소프트웨어의 결합으로 구현될 수 있다. 또한, 복수의‘모듈’ 혹은 복수의‘부’는 특정한 하드웨어로 구현될 필요가 있는 ‘모듈’ 혹은 ‘부’를 제외하고는 적어도 하나의 모듈로 일체화되어 적어도 하나의 프로세서로 구현될 수 있다.

또한, 본 발명의 실시 예에서, 어떤 부분이 다른 부분과 "연결"되어 있다고 할 때, 이는 "직접적으로 연결"되어 있는 경우뿐 아니라, 그 중간에 다른 소자를 사이에 두고 "전기적으로 연결"되어 있는 경우도 포함한다.

또한, 본 발명의 실시 예에서, 사용자 입력은, 터치 입력, 벤딩 입력, 음성 입력, 버튼 입력 및 다중(multimodal) 입력 중 적어도 하나를 포함할 수 있으나, 이에 한정되는 것은 아니다.

또한, 본 발명의 실시 예에서, “어플리케이션”은 특정한 업무를 수행하기 위해 고안된 일련의 컴퓨터 프로그램 집합을 말한다. 본 발명의 실시 예에서, 어플리케이션은 다양할 수 있다. 예를 들어, 게임 어플리케이션, 동영상 재생 어플리케이션, 지도 어플리케이션, 메모 어플리케이션, 캘린더 어플리케이션, 폰 북 어플리케이션, 방송 어플리케이션, 운동 지원 어플리케이션, 결제 어플리케이션, 사진 폴더 어플리케이션 등이 있을 수 있으나, 이에 한정되는 것은 아니다.

다르게 정의되지 않는 한, 기술적이거나 과학적인 용어를 포함해서 여기서 사용되는 모든 용어들은 본 발명이 속하는 기술 분야에서 통상의 지식을 가진 자에 의해 일반적으로 이해되는 것과 동일한 의미를 가지고 있다. 일반적으로 사용되는 사전에 정의되어 있는 것과 같은 용어들은 관련 기술의 문맥상 가지는 의미와 일치하는 의미를 가지는 것으로 해석되어야 하며, 본 출원에서 명백하게 정의하지 않는 한, 이상적이거나 과도하게 형식적인 의미로 해석되지 않는다.

이하에서는 도면을 참조하여 본 발명에 대해 설명하기로 한다. 도 1은 본 발명의 일 실시 예에 따른, 번역 시스템(10)을 나타내는 도면이다. 도 1에 도시된 바와 같이, 시스템(10)은 서버(100) 및 사용자 단말(200)을 포함한다. 한편, 본 발명의 일 실시 예에 따라, 사용자 단말(200)이 하나인 것으로 도시하였지만, 이에 제한되지 않는다. 또한, 본 발명의 일 실시 예에 따른, 사용자 단말(200)은 스마트 폰, 스마트 워치, 태블릿 PC, 노트북 PC 등과 같은 다양한 전자 장치로 구현될 수 있다.

사용자 단말(200)은 원문 텍스트를 입력받아 입력된 원문 텍스트를 바탕으로 번역 텍스트 및 번역 텍스트의 핵심 어휘에 대응되는 이미지 정보를 함께 디스플레이할 수 있다. 특히, 이미지 정보를 이용하여 번역 텍스트를 수정하기 위한 사용자 명령이 입력되면, 사용자 단말(200)은 이미지 정보를 대체하기 위한 적어도 하나의 수정 이미지 정보를 디스플레이할 수 있다. 그리고, 수정 이미지 정보를 선택하기 위한 사용자 명령이 입력되면, 사용자 단말(200)은 수정 이미지 정보를 바탕으로 수정된 번역 텍스트를 디스플레이할 수 있다.

구체적으로, 사용자 단말(200)은 원문 텍스트를 입력받을 수 있다. 원문 텍스트가 음성으로 입력되는 경우, 사용자 단말(200)은 입력된 음성을 텍스트로 전환하여 원문 텍스트를 서버(100)로 전송할 수 있다.

원문 텍스트가 수신되면, 서버(100)는 원문 텍스트를 번역하여 번역 텍스트를 생성할 수 있다. 구체적으로, 서버(100)는 번역기(Machine Translation Decoder)를 이용함으로써 수신된 원문 텍스트를 대상 언어로 번역하여 번역 텍스트를 생성할 수 있다.

그리고, 서버(100)는 번역 텍스트의 핵심 어휘를 추출할 수 있다. 이때, 핵심 어휘는 명사 또는 서술어 등일 수 있다. 특히, 서버(100)는 번역 텍스트에 포함된 어휘 중 동음이의어 또는 유사 발음 단어에 해당하는 어휘를 핵심 어휘로 추출할 수 있다.

서버(100)는 추출된 핵심 어휘 각각에 대응되는 이미지 정보를 추출할 수 있다. 이때, 이미지 정보는 아이콘, 사진, 그림, 동영상 또는 동영상의 캡쳐 사진일 수 있다. 그리고, 서버(100)는 번역 텍스트와 번역 텍스트의 핵심 어휘에 대응되는 이미지 정보를 사용자 단말(200)로 전송할 수 있다.

번역 텍스트와 번역 텍스트의 핵심 어휘에 대응되는 이미지 정보를 수신하면, 사용자 단말(200)은 번역 텍스트와 이미지 정보를 함께 디스플레이할 수 있다. 그리고, 번역 텍스트를 수정하기 위하여 이미지 정보를 선택하는 사용자 명령이 입력되면, 사용자 단말(200)은 이미지 정보를 선택하기 위한 사용자 명령을 서버(100)로 전송할 수 있다.

이미지 정보를 선택하기 위한 사용자 명령이 수신되면, 서버(100)는 선택된 이미지 정보를 대체하기 위한 적어도 하나의 수정 이미지 정보를 추출한다. 이때, 수정 이미지 정보는 선택된 이미지 정보에 대응되는 핵심 어휘의 동음이의어 또는 유사 발음 단어에 대응되는 이미지 정보일 수 있다. 그리고, 서버(100)는 추출된 적어도 하나의 이미지 정보를 사용자 단말(200)로 전송할 수 있다.

적어도 하나의 수정 이미지 정보가 수신되면, 사용자 단말(200)은 수정 이미지 정보를 선택하기 위한 사용자 명령을 입력받기 위하여 적어도 하나의 수정 이미지 정보를 포함하는 UI를 디스플레이할 수 있다. 사용자 단말(200)은 수정 이미지 정보와 함께 번역을 요하지 않는 어휘(예를 들어, 고유명사)를 지정받기 위한 UI 엘리먼트를 함께 디스플레이할 수 있다. 그리고, 수정 이미지 정보를 선택하기 위한 사용자 명령이 입력되면, 사용자 단말(200)은 선택된 수정 이미지 정보를 서버(100)로 전송할 수 있다.

선택된 수정 이미지 정보가 수신되면, 서버(100)는 선택된 수정 이미지 정보를 바탕으로 번역 텍스트를 수정한다. 그리고, 번역을 요하지 않는 어휘를 지정받기 위한 UI 엘리먼트를 선택하는 사용자 명령이 입력되면, 서버(100)는 해당 어휘를 고유 명사로 판단하고, 입력 텍스트를 수정할 수 있다. 서버(100)는 수정된 번역 텍스트를 사용자 단말(200)로 전송할 수 있다.

수정된 번역 텍스트가 수신되면, 사용자 단말(200)은 수정된 번역 텍스트와 수정 이미지 정보를 함께 디스플레이할 수 있다.

도 2는 본 발명의 일 실시 예에 따른, 서버(100)의 구성을 나타내는 도면이다. 도 2에 도시된 바와 같이, 서버(100)는 통신부(110), 데이터 베이스(120), 제어부(130)를 포함한다.

통신부(110)는 외부 장치와 통신을 수행한다. 특히, 통신부(110)는 사용자 단말(200)로부터 원문 텍스트 및 사용자 명령을 수신할 수 있다. 또한, 통신부(110)는 사용자 단말(200)에 번역 텍스트, 번역 텍스트의 핵심 어휘에 대응되는 이미지 정보 및 수정된 번역 텍스트, 수정 이미지 정보를 송신할 수 있다.

데이터 베이스(120)는 원문 텍스트를 번역하거나 번역 텍스트의 핵심 어휘를 추출하거나 추출된 핵심 어휘에 대응되는 이미지 정보를 추출하기 위하여 다양한 데이터를 저장한다. 특히, 데이터 베이스(120)는 번역 텍스트의 핵심 어휘를 추출하기 위하여 동음이의어 및 유사 발음 단어에 대한 정보를 저장할 수 있다. 또한, 데이터 베이스(120)는 핵심 어휘 및 이미지 정보를 매칭하여 저장할 수 있다.

제어부(130)는 서버(100)의 전반적인 동작을 제어한다. 특히, 제어부(130)는 번역 텍스트의 핵심 어휘를 추출하고, 핵심 어휘에 대응되는 이미지 정보를 추출할 수 있다. 또한, 번역 텍스트의 오류를 수정하기 위한 사용자 명령이 수신되면, 제어부(130)는 이미지 정보를 대체하기 위한 수정 이미지 정보를 추출할 수 있다.

구체적으로, 제어부(130)는 원문 텍스트를 수신하도록 통신부(110)를 제어할 수 있다. 제어부(130)는 수신된 원문 텍스트를 번역하여 번역 텍스트를 생성할 수 있다. 구체적으로, 제어부(130)는 수신된 원문 텍스트를 대상 언어로 번역하여 번역 텍스트를 생성할 수 있다. 본 발명의 일 실시 예에 따르면, 제어부(130)는 번역 모델의 파라미터 값을 바탕으로 수신된 원문 텍스트를 번역하여 번역 텍스트를 생성할 수 있다. 제어부(130)가 구 기반 번역(Phrase-based Machine Translation)을 수행하는 경우, 제어부(130)는 번역 테이블(Decoder Phrase Table)을 이용하여 번역 모델의 파라미터 값을 구할 수 있다.

또한, 본 발명의 일 실시 예에 따르면, 제어부(130)는 기존의 사용자 로그(log)를 바탕으로 동일한 원문 텍스트를 상이한 의미로 번역할 수 있다. 예를 들어, 통신부(110)를 통해 "공항에서 신고할 내용이 없습니다"가 수신된 경우, 제어부(130)는 general domain이라면, "There is nothing to report at the airport"로 번역할 수 있고, air port domain이라면, "There is nothing to declare"로 번역할 수 있고, call domain이라면, "There is nothing to call at the airport"로 번역할 수 있다.

그리고, 제어부(130)는 번역 텍스트에서 적어도 하나의 핵심 어휘를 추출할 수 있다. 제어부(130)는 번역 텍스트에 포함된 명사 및 서술어를 핵심 어휘로 추출할 수 있다. 특히, 제어부(130)는 번역 텍스트에 포함된 명사 및 서술어 중 동음이의어 사전에 기재된 어휘이거나 유사 발음 사전에 기재된 어휘에 해당하는 명사 및 서술어를 핵심 어휘로 추출할 수 있다.

그리고, 제어부(130)는 핵심 어휘 각각에 대하여 적어도 하나의 핵심 어휘에 대응되는 이미지 정보를 추출할 수 있다. 구체적으로, 제어부(130)는 핵심 어휘 각각에 대응되는 복수의 이미지 정보를 추출할 수 있다. 제어부(130)는 핵심 어휘와 핵심 어휘에 대응되는 복수의 이미지 정보의 관련 정도를 판단할 수 있다. 제어부(130)는 핵심 어휘에 대응되는 복수의 이미지 정보 중 핵심 어휘와 관련 정도가 가장 높은 이미지 정보를 핵심 어휘에 대응되는 이미지 정보로 추출할 수 있다. 제어부(130)는 기존에 번역 텍스트를 수정하기 위하여 선택된 적이 있는 이미지 정보를 대응되는 핵심 어휘와의 관련 정도가 낮은 이미지 정보로 판단할 수 있다. 반면에, 제어부(130)는 수정 이미지 정보로 추출된 적이 있는 이미지 정보를 대응되는 핵심 어휘와의 관련 정도가 높은 이미지 정보로 판단할 수 있다. 이때, 이미지 정보는 사진, 동영상, 아이콘 중 하나일 수 있다.

그리고, 제어부(130)는 번역 텍스트 및 번역 텍스트의 핵심 어휘에 대응되는 적어도 하나의 이미지 정보를 사용자 단말(200)로 전송하도록 통신부(110)를 제어할 수 있다.

그리고, 이미지 정보를 수정하기 위한 사용자 명령이 수신되면, 제어부(130)는 사용자 명령에 대응되는 이미지 정보를 대체하기 위한 적어도 하나의 수정 이미지 정보를 추출할 수 있다. 수정 이미지 정보를 선택하기 위한 사용자 명령이 수신되면, 제어부(130)는 선택된 수정 이미지 정보를 바탕으로 번역 텍스트를 수정할 수 있다. 이때, 적어도 하나의 수정 이미지 정보는 선택된 이미지 정보에 대응되는 핵심 어휘와 동음이의어이거나 유사 발음을 가지는 단어에 대응되는 이미지 정보일 수 있다.

구체적으로, 번역 텍스트를 수정하기 위하여 이미지 정보를 선택하는 사용자 명령이 수신되면, 제어부(130)는 사용자 명령을 바탕으로 번역 모델의 파라미터 값을 변경할 수 있다. 제어부(130)는 선택된 이미지 정보에 대응되는 파라미터 값을 감소시킬 수 있다. 이미지 정보가 번역 텍스트를 수정하기 위하여 선택된 이미지 정보가 아니거나, 번역 텍스트가 오류가 없음을 알리는 사용자 명령이 입력되면, 서버(100)는 이미지 정보에 대응되는 파라미터 값을 증가시킬 수 있다. 본 발명의 일 실시 예에 따르면, 제어부(130)는 특정 구(Phrase)가 대상 언어의 구로 번역될 확률 또는 점수 정보를 저장할 수 있고, 사용자의 수정 명령에 따라 확률 또는 점수 정보를 조정할 수 있다.

동음이의어 또는 유사 발음 단어에 해당하는 경우, 오역이 발생하는 예에 대하여 도 3 및 도 4를 참조하여 설명하기로 한다.

통계적 번역의 경우, 의미 분석 결과를 기반한 방법이 아니므로 동음이의어 또는 발음이 유사한 단어 사이의 혼동으로 인해 번역이 잘못될 확률이 높다. 따라서, 제어부(130)는 오역이 일어날 확률이 큰 동음이의어 또는 발음이 유사한 단어에 해당하는 단어를 핵심 어휘로 추출할 수 있다. 도 3은 본 발명의 다양한 실시 예에 따른, 동음이의어의 혼동에 의한 잘못된 번역의 예시를 나타내는 도면이다. 예를 들어, 사용자 단말(200)로부터 통신부(110)를 통해 "나는 지금 배가 고픈 것 같아"가 수신된 경우, 제어부(130)는 통계적 번역의 결과로 "배(310)"를 stomach가 아닌 "ship(315)"으로 혼동하여 오류가 있는 "Now I think ship and land I"를 생성할 수 있다. 또는 사용자 단말(200)로부터 통신부(110)를 통해 "밥을 많이 먹어서 배가 부르다"가 수신된 경우, 제어부(130)는 통계적 번역의 결과로 "배가(320)" "부르다(330)"를 full이 아닌 "doubled(325)" "sing(335)"로 혼동하여 오류가 있는 "Eat a lot of rice doubled sing"을 생성할 수 있다.

본 발명의 또 다른 실시 예들에 따르면, 도 4는 발음이 유사한 단어의 혼동을 나타내는 예시이다. 예를 들어, 사용자 단말(200)로부터 통신부(110)를 통해 "결제(140) 올립니다"가 수신된 경우, 제어부(130)는 통계적 번역을 하여 "raise payment(415)"를 생성할 수 있다. 그리고, 사용자 단말(200)로부터 통신부(110)를 통해 "결재(420) 올립니다"가 수신된 경우, 제어부(130)는 통계적 번역을 하여 "raise approval(425)"를 생성할 수 있다. 결제(410)와 결재(420)는 발음이 유사하지만 의미가 상이한 단어이므로, 특히 음성 인식을 통해 원문 텍스트를 입력받는 경우 오역이 발생할 확률이 크다. 따라서, 제어부(130)는 번역 텍스트에 포함된 발음이 유사한 단어를 핵심 어휘로 추출하여 정확도 높은 수정을 유도할 수 있다.

도 5는 본 발명의 일 실시 예에 따른, 사용자 단말의 구성을 나타내는 도면이다. 도 5에 도시된 바와 같이, 사용자 단말(200)은 통신부(210), 디스플레이부(220), 입력부(230) 및 제어부(240)를 포함한다. 한편, 본 발명의 일 실시 예에 따른, 사용자 단말(200)은 스마트 폰, 스마트 워치, 태블릿 PC, 노트북 PC 등과 같은 다양한 전자 장치로 구현될 수 있다.

통신부(210)는 외부 장치와 통신을 수행한다. 특히, 통신부(210)는 서버(100)와 텍스트 및 이미지 정보를 송수신할 수 있다.

디스플레이부(220)는 영상 데이터를 출력한다. 특히, 디스플레이부(220)는 서버에서 수신된 번역 텍스트 및 번역 텍스트의 핵심 어휘에 대응되는 이미지 정보를 디스플레이할 수 있다.

입력부(230)는 사용자 단말을 제어하기 위한 사용자 명령을 입력받는다. 입력부(230)는 음성, 텍스트, 이미지 등을 입력받을 수 있다. 이때, 입력부(230)는 사용자 단말(200)의 본체에 구비될 수 있으나, 이는 일 실시 예에 불과할 뿐, 본체의 외부(예를 들어, 별도의 마이크, 키보드 등)에 구비될 수 있다. 입력부(230)가 본체의 외부에 구비되는 경우, 입력부(230)는 유/무선 인터페이스(예를 들어, 와이파이, 블루투스 등)를 통해 생성된 사용자의 명령 신호를 사용자 단말(200)의 본체에 전송할 수 있다.

제어부(240)는 사용자 단말(200)의 전반적인 동작을 제어한다. 특히, 제어부(240)는 입력부(230)를 통해 입력된 텍스트를 서버(100)로 전송하고, 서버(100)로부터 번역 텍스트 및 번역 텍스트의 핵심 어휘에 대응되는 이미지 정보를 수신하도록 통신부(210)를 제어할 수 있다. 수신된 번역 텍스트 및 번역 텍스트의 핵심 어휘에 대응되는 이미지 정보를 디스플레이하도록 디스플레이부(220)를 제어할 수 있다.

구체적으로, 제어부(240)는 입력부(230)를 통해 입력된 텍스트를 서버(100)로 전송하도록 통신부(210)를 제어할 수 있다. 원문 텍스트가 음성 인식되어 입력된 경우, 제어부(240)는 인식된 음성을 텍스트로 변환하고, 텍스트를 서버(100)로 전송하도록 통신부(210)를 제어할 수 있다.

그리고, 제어부(240)는 서버(100)로부터 번역된 번역 텍스트 및 번역 텍스트의 핵심 어휘에 대응되는 이미지 정보를 수신하도록 통신부(210)를 제어할 수 있다. 이때, 이미지 정보는 사진, 동영상, 아이콘 중 하나일 수 있다.

그리고, 제어부(240)는 수신된 번역 텍스트 및 번역 텍스트의 핵심 어휘에 대응되는 적어도 하나의 이미지 정보를 디스플레이하도록 디스플레이부(220)를 제어할 수 있다.

그리고, 번역 텍스트를 수정하기 위하여 이미지 정보를 선택하는 사용자 명령이 입력되면, 제어부(240)는 서버(100)로 이미지 정보를 선택하는 사용자 명령을 전송하고, 이미지 정보를 선택하는 사용자 명령에 대응되는 이미지 정보를 대체하기 위한 적어도 하나의 수정 이미지 정보를 수신하도록 통신부(210)를 제어할 수 있다. 적어도 하나의 수정 이미지 정보가 수신되면, 제어부(240)는 수신된 적어도 하나의 수정 이미지 정보를 포함하는 UI를 디스플레이하도록 디스플레이부(220)를 제어할 있다. 또한, 적어도 하나의 수정 이미지 정보를 포함하는 UI는 핵심 어휘가 번역을 요하지 않는 단어(예를 들어, 고유 명사 등)로 지정하는 사용자 명령을 입력받기 위한 UI 엘리먼트를 포함할 수 있다.

적어도 하나의 수정 이미지 정보 중 하나의 수정 이미지 정보를 선택하는 사용자 명령이 입력되면, 제어부(240)는 서버(100)로 하나의 수정 이미지 정보를 선택하는 사용자 명령을 전송하고, 서버(100)로부터 선택된 수정 이미지 정보를 이용하여 수정된 번역 텍스트를 수신하도록 통신부(210)를 제어할 수 있다. 그리고, 핵심 어휘가 번역을 요하지 않는 단어로 지정하는 사용자 명령이 입력되면, 제어부(240)는 서버(100)로 사용자 명령을 전송하고, 서버(100)로부터 사용자 명령에 대응하는 핵심 어휘를 고유 명사 등으로 판단하여 수정된 번역 텍스트를 수신하도록 통신부(210)를 제어할 수 있다. 수정된 번역 텍스트가 수신되면, 제어부(240)는 수신된 수정된 번역 텍스트 및 선택된 수정 이미지 정보를 디스플레이하도록 디스플레이부(230)를 제어할 수 있다.

상술한 바와 같은 사용자 단말(200)에 의해, 사용자는 보다 높은 정확도로 번역 텍스트를 제공받을 수 있게 된다.

이하에서는 도 6 내지 도 13을 참조하여 본 발명의 다양한 실시 예에 대해 설명하기로 한다. 도 6은 본 발명의 일 실시 예에 따른, 사용자 단말(200)이 구성을 상세히 도시한 블럭도이다. 도 6에 도시된 바와 같이, 사용자 단말(200)은 디스플레이부(610), 오디오 출력부(620), 통신부(630), 저장부(640), 감지부(650), 입력부(660) 및 제어부(670)를 포함한다.

한편, 도 6은 사용자 단말(200)이 텍스트 입력 기능, 디스플레이 기능 등과 같이 다양한 기능을 구비한 장치인 경우를 예로 들어, 각종 구성요소들을 종합적으로 도시한 것이다. 따라서, 실시 예에 따라서는, 도 6에 도시된 구성요소 중 일부는 생략 또는 변경될 수도 있고, 다른 구성요소가 더 추가될 수도 있다.

디스플레이부(610)는 영상수신부(미도시)로부터 수신한 영상 데이터를 영상 처리부(미도시)에서 처리한 비디오 프레임 및 그래픽 처리부(673)에서 생성된 다양한 화면 중 적어도 하나를 디스플레이한다. 특히, 디스플레이부(610)는 서버와 송수신된 번역 텍스트 및 번역 텍스트의 핵심 어휘에 대응되는 이미지 정보를 디스플레이할 수 있다. 또한, 디스플레이부(610)는 번역 텍스트를 수정하기 위하여 이미지 정보를 선택하는 사용자 명령을 입력받기 위한 UI를 디스플레이할 수 있다.

오디오 출력부(620)는 오디오 처리부(미도시)에 의해 디코딩이나 증폭, 노이즈 필터링과 같은 다양한 처리 작업이 수행된 각종 오디오 데이터뿐만 아니라 각종 알림 음이나 음성 메시지를 출력하는 구성이다. 본 발명의 일 실시 예에 따라, 오디오 출력부(620)는 번역 텍스트를 음성으로 출력할 수 있다. 특히, 오디오 출력부(620)는 스피커로 구현될 수 있으나, 이는 일 실시 예에 불과할 뿐, 오디오 데이터를 출력할 수 있는 출력 단자로 구현될 수 있다.

통신부(630)는 다양한 유형의 통신방식에 따라 다양한 유형의 외부 기기와 통신을 수행하는 구성이다. 통신부(630)는 와이파이 칩, 블루투스 칩, NFC칩, 무선 통신 칩 등과 같은 다양한 통신 칩을 포함할 수 있다. 이때, 와이파이 칩, 블루투스 칩, NFC 칩은 각각 WiFi 방식, 블루투스 방식, NFC 방식으로 통신을 수행한다. 이 중 NFC 칩은 135kHz, 13.56MHz, 433MHz, 860~960MHz, 2.45GHz 등과 같은 다양한 RF-ID 주파수 대역들 중에서 13.56MHz 대역을 사용하는 NFC(Near Field Communication) 방식으로 동작하는 칩을 의미한다. 와이파이 칩이나 블루투스 칩을 이용하는 경우에는 SSID 및 세션 키 등과 같은 각종 연결 정보를 먼저 송수신하여, 이를 이용하여 통신 연결한 후 각종 정보들을 송수신할 수 있다. 무선 통신 칩은 IEEE, 지그비, 3G(3rd Generation), 3GPP(3rd Generation Partnership Project), LTE(Long Term Evoloution) 등과 같은 다양한 통신 규격에 따라 통신을 수행하는 칩을 의미한다.

특히, 통신부(630)는 서버(100)와 텍스트 및 이미지를 송수신할 수 있다.

저장부(640)는 사용자 단말(200)을 구동하기 위한 다양한 모듈을 저장한다. 예를 들어, 저장부(640)에는 베이스 모듈, 센싱 모듈, 통신 모듈, 프리젠테이션 모듈, 웹 브라우저 모듈, 서비스 모듈을 포함하는 소프트웨어가 저장될 수 있다. 이때, 베이스 모듈은 사용자 단말(200)에 포함된 각 하드웨어들로부터 전달되는 신호를 처리하여 상위 레이어 모듈로 전달하는 기초 모듈이다. 센싱 모듈은 각종 센서들로부터 정보를 수집하고, 수집된 정보를 분석 및 관리하는 모듈로서, 얼굴 인식 모듈, 음성 인식 모듈, 모션 인식 모듈, NFC 인식 모듈 등을 포함할 수도 있다. 프리젠테이션 모듈은 디스플레이 화면을 구성하기 위한 모듈로서, 멀티미디어 컨텐츠를 재생하여 출력하기 위한 멀티미디어 모듈, UI 및 그래픽 처리를 수행하는 UI 렌더링 모듈을 포함할 수 있다. 통신 모듈은 외부와 통신을 수행하기 위한 모듈이다. 웹 브라우저 모듈은 웹 브라우징을 수행하여 웹 서버에 액세스하는 모듈을 의미한다. 서비스 모듈은 다양한 서비스를 제공하기 위한 각종 어플리케이션을 포함하는 모듈이다.

상술한 바와 같이, 저장부(640)는 다양한 프로그램 모듈들을 포함할 수 있으나, 각종 프로그램 모듈들은 사용자 단말(200)의 종류 및 특성에 따라 일부 생략되거나 변형 또는 추가될 수 있음은 물론이다. 가령, 상술한 사용자 단말(200)이 태블릿 PC로 구현된 경우, 베이스 모듈에는 GPS 기반의 위치를 판단하기 위한 위치 판단 모듈을 더 포함하며, 센싱 모듈에는 사용자의 동작을 감지하는 센싱 모듈을 더 포함할 수 있다.

특히, 저장부(640)는 수신된 번역 텍스트의 핵심 어휘에 대응되는 이미지 정보를 저장할 수 있다.

한편 본 발명의 일 실시 예에서, 저장부(640)는 제어부(670) 내 롬(672), 램(671) 또는 사용자 단말(200)에 장착되는 메모리 카드(미도시)(예를 들어, micro SD 카드, 메모리 스틱)를 포함하여 정의될 수 있다.

감지부(650)는 사용자 단말(200)의 주변 환경을 감지한다. 특히, 감지부(650)는 위치 정보를 감지할 수 있는 GPS 센서, 사용자 단말(200)의 움직임을 감지할 수 있는 움직임 감지 센서(예를 들어, 자이로 센서, 가속도 센서 등), 압력 센서, 노이즈 센서 등과 같은 다양한 센서를 포함할 수 있다.

입력부(660)는 원문 텍스트 및 사용자 단말(200)을 제어하기 위한 사용자 명령을 입력받는다. 특히, 입력부(660)는 원문 텍스트 및 사용자 명령을 입력받기 위해 터치 입력부, 버튼, 음성 입력부, 모션 입력부, 키보드 마우스 등과 같은 다양한 입력 장치를 포함할 수 있다.

제어부(670)는 도 6에 도시된 바와 같이, RAM(671), ROM(672), 그래픽 처리부(673), 메인 CPU(674), 제1 내지 n 인터페이스(675-1 ~ 675-n), 버스(676)를 포함한다. 이때, RAM(671), ROM(672), 그래픽 처리부(673), 메인 CPU(674), 제1 내지 n 인터페이스(675-1 ~ 675-n) 등은 버스(676)를 통해 서로 연결될 수 있다.

ROM(672)에는 시스템 부팅을 위한 명령어 세트 등이 저장된다. 턴 온 명령이 입력되어 전원이 공급되면, 메인 CPU(674)는 ROM(672)에 저장된 명령어에 따라 저장부(640)에 저장된 O/S를 RAM(671)에 복사하고, O/S를 실행시켜 시스템을 부팅시킨다. 부팅이 완료되면, 메인 CPU(674)는 저장부(640)에 저장된 각종 어플리케이션 프로그램을 RAM(671)에 복사하고, RAM(671)에 복사된 어플리케이션 프로그램을 실행시켜 각종 동작을 수행한다.

그래픽 처리부(673)는 연산부(미도시) 및 렌더링부(미도시)를 이용하여 포인터, 아이콘, 이미지, 텍스트 등과 같은 다양한 객체를 포함하는 화면을 생성한다. 연산부는 입력부로부터 수신된 제어 명령을 이용하여 화면의 레이아웃에 따라 각 객체들이 표시될 좌표값, 형태, 크기, 컬러 등과 같은 속성값을 연산한다. 렌더링부는 연산부에서 연산한 속성값에 기초하여 객체를 포함하는 다양한 레이아웃의 화면을 생성한다. 렌더링부에서 생성된 화면은 디스플레이부(610)의 디스플레이 영역 내에 표시된다.

메인 CPU(674)는 저장부(640)에 액세스하여, 저장부(640)에 저장된 O/S를 이용하여 부팅을 수행한다. 그리고, 메인 CPU(674)는 저장부(640)에 저장된 각종 프로그램, 컨텐츠, 데이터 등을 이용하여 다양한 동작을 수행한다.

제1 내지 n 인터페이스(675-1 내지 675-n)는 상술한 각종 구성요소들과 연결된다. 인터페이스들 중 하나는 네트워크를 통해 외부 장치와 연결되는 네트워크 인터페이스가 될 수도 있다.

특히, 제어부(670)는 입력부(660)를 통해 입력된 원문 텍스트를 서버(100)로 전송하고, 서버(100)로부터 번역 텍스트 및 번역 텍스트의 핵심 어휘에 대응되는 이미지 정보를 수신하도록 통신부(630)를 제어한다. 그리고, 제어부(670)는 수신된 번역 텍스트 및 번역 텍스트의 핵심 어휘에 대응되는 이미지 정보를 디스플레이하도록 디스플레이부(610)를 제어할 수 있다.

구체적으로, 제어부(670)는 입력부(660)를 통해 원문 텍스트를 입력받는다. 입력부(660)를 통해 원문 텍스트가 음성으로 입력되는 경우, 제어부(670)는 입력된 음성을 텍스트로 전환할 수 있다.

그리고, 제어부(670)는 원문 텍스트를 서버(100)로 전송하도록 통신부(630)를 제어할 수 있다. 제어부(670)는 서버(100)로부터 원문 텍스트를 번역하여 생성된 번역 텍스트 및 번역 텍스트의 핵심 어휘에 대응되는 이미지 정보를 수신하도록 통신부(630)를 제어할 수 있다.

그리고, 제어부(670)는 수신된 번역 텍스트 및 번역 텍스트의 핵심 어휘에 대응되는 이미지 정보를 디스플레이하도록 디스플레이부(610)를 제어할 수 있다. 이때, 이미지 정보는 사진, 동영상, 아이콘 중 하나일 수 있고, 핵심 어휘의 의미를 나타낼 수 있다.

구체적으로, 도 7에 도시된 바와 같이, 입력부(660)를 통해 "배가 아플땐 어느 병원을 가나요(740)"라는 원문 텍스트가 입력된 경우, 제어부(670)는 서버(100)로 "배가 아플땐 어느 병원을 가나요(740)"를 전송하도록 통신부(630)를 제어할 수있다. 제어부(670)는 서버(100)로부터 "배가 아플땐 어느 병원을 가나요(740)"를 번역하여 생성된 번역 텍스트 "Which hospital ship types(750)" 및 번역 텍스트의 핵심 어휘에 대응되는 배 이미지(710), 병원 이미지(720), 지도 이미지(730)를 수신하도록 통신부(630)를 제어할 수 있다.

그리고, 제어부(670)는 수신된 "Which hospital ship types(750)" 및 "Which hospital ship types(750)"의 핵심 어휘에 대응되는 배 이미지(710), 병원 이미지(720), 지도 이미지(730)를 디스플레이하도록 디스플레이부(610)를 제어할 수 있다. 도 7에 도시된 바와 같이, 원문 텍스트 및 번역 텍스트의 핵심 어휘에 대응되는 이미지 정보가 디스플레이되고, 디스플레이된 원문 텍스트 및 이미지와 선 대칭되는 구조로 번역 텍스트를 디스플레이하는 것은 일 실시 예에 불과할 뿐, 다양한 구조로 디스플레이될 수 있다.

입력 텍스트 "배가 아플땐 어느 병원을 가나요(740)"에 포함된 "배"는 통계적으로 번역 텍스트 "Which hospital ship types(750)"에 포함된 "ship"으로 번역될 확률이 높지만, 원문 텍스트 "배가 아플땐 어느 병원을 가나요(740)"에 포함된 "배"와 상이한 의미를 갖는 어휘로 오역에 해당한다. 대상 언어를 전혀 모르는 사용자라 하더라도 "배가 아플땐 어느 병원을 가나요(740)"와 관련성이 낮은 배 이미지(710)를 통해 오역 되었음을 판단할 수 있게 된다.

따라서, 번역 텍스트 "Which hospital ship types"를 수정하기 위하여 배 이미지(810)를 선택하는 사용자 명령이 입력되면, 제어부(670)는 배 이미지(810)를 선택하는 사용자 명령을 서버(100)로 전송하고, 서버(100)로부터 배 이미지(810)를 대체하기 위한 적어도 하나의 수정 이미지 정보를 수신하도록 통신부(630)를 제어할 수 있다.

그리고, 도 8에 도시된 바와 같이, 제어부(670)는 배 이미지(810)를 대체하기 위한 수정 이미지(820,830,840)를 디스플레이하도록 디스플레이부(610)를 제어할 수 있다. 예를 들어, 수정 이미지(820,830,840)는 선택된 배 이미지(810)가 나타내는 "배"의 동음이의어에 해당하는 과일 배 이미지(820), 신체 배 이미지(830)를 포함할 수 있고, 번역을 요하지 않는 고유 명사임을 나타내는 아이콘(840)을 포함할 수 있다.

그리고, "배가 아플땐 어느 병원을 가나요"에서의 "배"에 해당하는 신체 배 이미지(830)가 선택되면, 제어부(670)는 선택된 이미지(830) 정보를 서버(100)로 전송하고, 선택된 이미지(830) 정보를 바탕으로 수정된 번역 텍스트를 수신하도록 통신부(630)를 제어할 수 있다. 또한, 고유명사 아이콘(840)이 선택되면, 제어부(670)는 선택된 고유명사 아이콘(840) 정보를 서버(100)로 전송하고, "배"를 고유명사로 판단하여 수정된 번역 텍스트를 수신하도록 통신부(630)를 제어할 수 있다.

그리고, 도 9에 도시된 바와 같이, 제어부(670)는 수정된 번역 텍스트 "Have a stomachache which hospital go(950)" 및 "Have a stomachache which hospital go(950)"의 핵심 어휘에 대응되는 배 이미지(910), 병원 이미지(920), 지도 이미지(930)를 디스플레이하도록 디스플레이부(610)를 제어할 수 있다. "Have a stomachache which hospital go(950)"의 핵심 어휘에 대응되는 배 이미지(910), 병원 이미지(920), 지도 이미지(930)를 함께 디스플레이함으로써 상술한 수정 방법을 반복하는 것이 가능하다.

본 발명의 일 실시 예에 따라, 도 10에 도시된 바와 같이, 제어부(670)는 번역 텍스트의 핵심 어휘 각각을 대응되는 이미지 정보와 연결하여 디스플레이하도록 디스플레이부(610)를 제어할 수 있다. 예를 들어, 번역 텍스트 "Which hospital ship types"의 핵심 어휘 "Which(1051)", "hospital(1053)", "ship(1055)" 각각에 대응하는 이미지가 연결되어 디스플레이되도록 "Which(1051)"와 지도 이미지(1030) 사이에 연결 선을 표시하고, "hospital(1053)"와 병원 이미지(1053) 사이에 연결 선을 표시하고, "ship(1055)" 배 이미지(1010) 사이에 연결 선을 표시하여 디스플레이하도록 디스플레이부(610)를 제어할 수 있다. 또는, 제어부(670)는 핵심 어휘 각각을 대응하는 이미지 정보로 치환하여 디스플레이하도록 디스플레이부(610)를 제어할 수 있다.

본 발명의 또 다른 실시 예에 따라, 도 11에 도시된 바와 같이, 제어부(670)는 번역 텍스트와 번역 텍스트에 대응되는 영화 자막의 장면(1110)을 클립(clip) 형태로 디스플레이하도록 디스플레이부(610)를 제어할 수 있다. 이때, 번역 텍스트에 대응되는 영화 자막의 장면(1110)은 번역 텍스트와 기 설정된 퍼센트 이상 일치하는 자막의 장면일 수 있다. 번역 텍스트와 기 설정된 퍼센트 이상 일치하는 자막이 복수 개인 경우, 제어부(670)는 복수 개의 자막의 장면 시작 화면을 동시에 디스플레이하도록 디스플레이부(610)를 제어함으로써 한 개의 자막의 장면을 선택하여 재생하기 위한 사용자 명령을 입력받을 수 있다. 한편, 제어부(670)는 서버(100)로부터 번역 텍스트에 대응되는 영화 자막의 장면(1110)을 수신하도록 통신부(630)를 제어할 수도 있고, 저장부(640)에 저장된 영화 자막 중 번역 텍스트에 대응되는 영화 자막의 장면(1110)을 추출할 수도 있다.

본 발명의 또 다른 실시 예에 따르면, 도 12 및 도 13에 도시된 바와 같이, 번역 텍스트의 핵심 어휘에 대응되는 하나 이상의 이미지 정보를 대체하는 사용자 명령이 입력되면, 제어부(670)는 사용자 명령을 전송하고, 대체 이미지 정보를 수신하도록 통신부(630)를 제어할 수 있다. 예를 들어, 제어부(670)는 입력부(640)를 통해 "파란 셔츠를 보여주세요(1230)"를 입력받을 수 있다. 그리고, 제어부(670)는 "파란 셔츠를 보여주세요(1230)"를 서버(100)로 전송하고, "Show me a blue shirts(1240)" 및 "Show me a blue shirts(1240)"의 핵심 어휘에 대응되는 파란 셔츠 이미지(1210), 두 눈 이미지(1220)를 수신하도록 통신부(630)를 제어할 수 있다. 그리고, 제어부(670)는 "Show me a blue shirts(1240)" 및 "Show me a blue shirts(1240)"의 핵심 어휘에 대응되는 파란 셔츠 이미지(1210), 두 눈 이미지(1220)를 디스플레이하도록 디스플레이부(610)를 제어할 수 있다.

그리고, "보여주세요"에 대응되는 두 눈 이미지(1220)를 대체하기 위한 사용자 명령이 입력되면, 제어부(670)는 두 눈 이미지(1220)에 대한 정보를 서버(100)로 전송하고, 대체 이미지 정보를 수신하도록 통신부(630)를 제어할 수 있다. 이때, 두 눈 이미지(1220)를 대체하기 위한 대체 이미지 정보는 "살게요", "얼마인가요" 등의 의미를 나타내는 이미지 정보일 수 있다.

그리고, "살게요"의 의미를 나타내는 카트 이미지(1320)를 선택하는 사용자 명령이 입력되면, 제어부(670)는 카트 이미지(1320) 정보를 서버(100)로 전송하고, 카트 이미지(1320)를 바탕으로 수정된 번역 텍스트를 수신하도록 통신부(630)를 제어할 수 있다. 도 13에 도시된 바와 같이, 제어부(670)는 원문 텍스트 "파란 셔츠를 살게요(1330)", 수정된 번역 텍스트 "I will take the blue shirt(1340)", 파란 셔츠 이미지(1310), 카트 이미지(1320)를 디스플레이하도록 디스플레이부(610)를 제어할 수 있다.

이하에서는 도 14를 참조하여 본 발명의 일 실시 예에 따른, 서버(100)의 제어 방법을 설명하기로 한다.

우선, 서버(100)는 사용자 단말(200)로부터 원문 텍스트를 수신한다(S1410).

그리고, 서버(100)는 원문 텍스트를 번역하여 번역 텍스트를 생성한다(S1420). 구체적으로, 서버(100)는 번역 모델의 파라미터 값을 바탕으로 수신된 원문 텍스트를 번역하여 번역 텍스트를 생성할 수 있다.

그리고, 서버(100)는 번역 텍스트의 핵심 어휘를 추출한다(S1430). 구체적으로, 번역 텍스트의 명사, 서술어 등을 핵심 어휘로 추출할 수 있다. 특히, 서버(100)는 번역 텍스트의 명사, 서술어 중 동음이의어에 해당하거나 유사 발음을 가지는 단어에 해당하는 명사, 서술어 등을 핵심 어휘로 추출할 수 있다.

그리고, 서버(100)는 추출된 핵심 어휘에 대응되는 이미지 정보를 추출한다(S1440). 이때, 이미지 정보는 사진, 동영상, 아이콘 중 하나일 수 있으며, 기 저장된 이미지 정보이거나 외부(예를 들어, 인터넷)로부터 검색될 수도 있다.

그리고, 서버(100)는 번역 텍스트 및 번역 텍스트의 핵심 어휘에 대응되는 이미지 정보를 사용자 단말(200)로 전송한다(S1450).

이하에서는 도 15를 참조하여 본 발명의 일 실시 예에 따른, 번역 텍스트를 수정하기 위한 서버(100)의 제어 방법을 설명하기로 한다.

우선, 서버(100)는 이미지 정보를 수정하기 위한 사용자 명령을 수신한다(S1510).

그리고, 서버(100)는 사용자 명령에 대응하는 이미지 정보를 대체하기 위한 수정 이미지 정보를 추출한다. 그리고, 서버(100)는 수정 이미지 정보를 사용자 단말(200)로 전송한다(S1520). 구체적으로, 서버(100)는 사용자 명령에 대응되는 이미지 정보가 나타내는 어휘의 동음이의어이거나 유사 발음을 가지는 단어에 대한 이미지 정보를 수정 이미지 정보로 추출할 수 있다.

그리고, 사용자 단말(200)로부터 수정 이미지 정보를 선택하는 명령이 수신되면(S1530), 서버(100)는 수정 이미지 정보를 바탕으로 번역 텍스트를 수정한다(S1540).

그리고, 서버(100)는 수정된 번역 텍스트를 사용자 단말(200)로 전송한다(S1550).

이하에서는 도 16을 참조하여 본 발명의 일 실시 예에 따른, 시스템(10)의 제어 방법을 설명하기로 한다.

우선, 사용자 단말(200)은 원문 텍스트를 입력받는다(S1605). 사용자 단말(200)은 텍스트, 음성 등으로 원문 텍스트를 입력받을 수 있다. 원문 텍스트가 입력되면, 사용자 단말(200)은 입력 텍스트를 서버(100)로 전송한다(S1610).

입력 텍스트가 수신되면, 서버(100)는 입력 텍스트를 번역하여 번역 텍스트를 생성한다(S1615). 구체적으로, 서버(100)는 번역 모델의 파라미터 값을 바탕으로 수신된 원문 텍스트를 번역하여 번역 텍스트를 생성할 수 있다.

그리고, 서버(100)는 번역 텍스트의 핵심 어휘를 추출한다(S1620). 구체적으로, 번역 텍스트의 명사, 서술어 등을 핵심 어휘로 추출할 수 있다. 특히, 서버(100)는 번역 텍스트의 명사, 서술어 중 동음이의어에 해당하거나 유사 발음을 가지는 단어에 해당하는 명사, 서술어 등을 핵심 어휘로 추출할 수 있다.

그리고, 서버(100)는 추출된 핵심 어휘에 대응되는 이미지 정보를 추출한다(S1625). 이때, 이미지 정보는 사진, 동영상, 아이콘 중 하나일 수 있으며, 기 저장된 이미지 정보 이거나 외부(예를 들어, 인터넷)로부터 검색될 수도 있다.

그리고, 서버(100)는 번역 텍스트 및 번역 텍스트의 핵심 어휘에 대응되는 이미지 정보를 사용자 단말(200)로 전송한다(S1630).

그리고, 사용자 단말(200)은 수신된 번역 텍스트 및 번역 텍스트의 핵심 어휘에 대응되는 이미지 정보를 디스플레이한다. 번역 텍스트를 수정하기 위하여 이미지 정보를 선택하는 사용자 명령이 입력(S1635)되면, 사용자 단말(200)은 이미지 정보 선택 명령을 서버(100)로 전송한다(S1640).

이미지 정보 선택을 위한 사용자 명령이 수신되면, 서버(100)는 선택된 이미지 정보를 대체하기 위한 수정 이미지 정보를 추출한다(S1645). 구체적으로, 서버(100)는 선택된 이미지 정보가 나타내는 핵심 어휘의 동음이의어에 대응되거나 유사 발음을 가지는 단어에 대응되는 이미지 정보를 수정 이미지 정보로 추출할 수 있다. 서버(100)는 추출된 수정 이미지 정보를 사용자 단말(200)로 전송한다(S1650).

그리고, 사용자 단말(200)은 수신된 수정 이미지 정보를 포함하는 UI를 디스플레이하고, 수정 이미지 정보를 선택하기 위한 사용자 명령을 입력받는다(S1655). 사용자 단말(200)은 수정 이미지 정보를 선택하는 사용자 명령을 서버(100)로 전송한다.

수정 이미지 정보를 선택하는 사용자 명령이 수신되면, 서버(100)는 선택된 수정 이미지 정보를 바탕으로 번역 텍스트를 수정하고(S1665), 수정된 번역 텍스트를 사용자 단말(200)로 전송한다(S1670).

그리고, 사용자 단말(200)은 수정된 번역 텍스트 및 수정 이미지 정보를 디스플레이한다(S1675). 수정 이미지 정보를 선택하는 사용자 명령이 입력되면, 상술한 바와 같은 수정 방법이 반복될 수 있다.

한편, 상술한 바와 같은 본 발명의 다양한 실시 예에 의해, 사용자는 대상 언어를 모르는 상황에서 더욱 정확한 번역이 이루어진 번역 텍스트를 제공받을 수 있다.

한편, 상술한 방법은 컴퓨터에서 실행될 수 있는 프로그램으로 작성 가능하고, 컴퓨터로 읽을 수 있는 기록매체를 이용하여 상기 프로그램을 동작시키는 범용 디지털 컴퓨터에서 구현될 수 있다. 또한, 상술한 방법에서 사용된 데이터의 구조는 컴퓨터로 읽을 수 있는 기록매체에 여러 수단을 통하여 기록될 수 있다. 상기 컴퓨터로 읽을 수 있는 기록매체는 마그네틱 저장매체(예를 들면, 롬, 플로피 디스크, 하드 디스크 등), 광학적 판독 매체(예를 들면, 시디롬, 디브이디 등)와 같은 저장매체를 포함한다.

본 실시예와 관련된 기술 분야에서 통상의 지식을 가진 자는 상기된 기재의 본질적인 특성에서 벗어나지 않는 범위에서 변형된 형태로 구현될 수 있음을 이해할 수 있을 것이다. 그러므로 개시 방법들은 한정적인 관점이 아니라 설명적인 관점에서 고려되어야 한다. 본 발명의 범위는 전술한 설명이 아니라 특허청구범위에 나타나 있으며, 그와 동등한 범위 내에 있는 모든 차이점은 본 발명에 포함된 것으로 해석되어야 할 것이다.

10: 시스템
100: 서버
110: 통신부
120: 데이터베이스
130: 제어부
200: 사용자 단말

Claims

서버의 제어 방법에 있어서,
사용자 단말로부터 타겟 언어에 대한 정보 및 텍스트를 수신하는 단계;
상기 수신된 텍스트를 상기 타겟 언어로 번역하여 번역 텍스트를 생성하는 단계;
상기 번역 텍스트에서 적어도 하나의 핵심 어휘를 추출하는 단계;
상기 적어도 하나의 핵심 어휘 각각에 대하여 상기 적어도 하나의 핵심 어휘에 대응되는 이미지 정보를 추출하는 단계;
상기 사용자 단말로 상기 번역 텍스트 및 상기 추출된 이미지 정보를 송신하는 단계;
상기 사용자 단말로부터 상기 이미지 정보의 수정을 위한 제1 명령을 수신하면, 상기 이미지 정보를 대체하기 위한 상기 제1 명령에 대응하는 수정 이미지 정보 항목을 송신하는 단계:
상기 사용자 단말로부터 상기 수정 이미지 정보를 선택하는 제2 명령을 수신하면, 상기 선택된 수정 이미지 정보를 바탕으로, 상기 번역 텍스트를 수정하는 단계;
상기 사용자 단말로 상기 수정된 번역 텍스트를 송신하는 단계;
상기 사용자 단말로부터 상기 수정된 번역 텍스트에 대응하는 컨텐츠를 획득하기 위한 제3 명령을 수신하면, 상기 수정된 번역 텍스트에 기초하여 컨텐츠 정보를 획득하는 단계; 및
상기 사용자 단말로 상기 컨텐츠 정보를 송신하는 단계;를 포함하며,
상기 컨텐츠 정보는 상기 수정된 번역 텍스트에 해당되는 장면의 시간 정보를 포함하는 것을 특징으로 하는 서버의 제어 방법.
삭제
삭제
제1항에 있어서,
상기 핵심 어휘를 추출하는 단계는,
동음이의어 사전 또는 유사 발음 사전에 기재된 어휘를 핵심 어휘로 추출하는 것을 특징으로 하는 서버의 제어 방법.
제4항에 있어서,
상기 수정 이미지 정보는,
상기 선택된 이미지 정보가 나타내는 핵심 어휘와 동음이의어이거나 유사 발음을 가지는 단어에 대응되는 것을 특징으로 하는 서버의 제어 방법.
제1항에 있어서,
상기 이미지 정보를 추출하는 단계는,
상기 핵심 어휘와 복수의 이미지 정보의 관련 정도를 판단하는 단계; 및
상기 판단된 관련 정도가 가장 높은 이미지 정보를 상기 핵심 어휘에 대응되는 이미지 정보로 추출하는 단계;를 포함하는 것을 특징으로 하는 서버의 제어 방법.
제1항에 있어서,
상기 이미지 정보는 사진, 동영상, 아이콘 중 하나인 것을 특징으로 하는 서버의 제어 방법.
서버에 있어서,
사용자 단말과 통신하는 통신부; 및
상기 사용자 단말로부터 타겟 언어에 대한 정보 및 텍스트를 수신하도록 상기 통신부를 제어하고, 상기 수신된 텍스트를 상기 타겟 언어로 번역하여 번역 텍스트를 생성하고, 상기 번역된 텍스트에서 적어도 하나의 핵심 어휘를 추출하고, 상기 적어도 하나의 핵심 어휘 각각에 대하여 상기 적어도 하나의 핵심 어휘에 대응되는 이미지 정보를 추출하고, 상기 사용자 단말로 상기 번역된 텍스트 및 상기 추출된 이미지 정보를 송신하도록 상기 통신부를 제어하는 제어부를 포함하며,
상기 제어부는,
상기 사용자 단말로부터 상기 이미지 정보의 수정을 위한 제1 명령을 수신하면, 상기 이미지 정보를 대체하기 위한 상기 제1 명령에 대응하는 수정 이미지 정보 항목을 송신하도록 상기 통신부를 제어하고, 상기 사용자 단말로부터 상기 수정 이미지 정보를 선택하는 제2 명령을 수신하면, 상기 선택된 수정 이미지 정보를 바탕으로 상기 번역 텍스트를 수정하고, 상기 사용자 단말로 상기 수정된 번역 텍스트를 송신하도록 상기 통신부를 제어하고,
상기 사용자 단말로부터 상기 수정된 번역 텍스트에 대응하는 컨텐츠를 획득하기 위한 제3 명령을 수신하면, 상기 수정된 번역 텍스트에 기초하여 컨텐츠 정보를 획득하고, 상기 사용자 단말로 상기 컨텐츠 정보를 송신하도록 상기 통신부를 제어하고,
상기 컨텐츠 정보는 상기 수정된 번역 텍스트에 해당되는 장면의 시간 정보를 포함하는 것을 특징으로 하는 서버.
삭제
삭제
제8항에 있어서,
상기 제어부는,
동음이의어 사전 또는 유사 발음 사전에 기재된 어휘를 핵심 어휘로 추출하는 것을 특징으로 하는 서버.
제11항에 있어서,
상기 수정 이미지 정보는,
상기 번역 텍스트와 동음이의어 또는 유사 발음을 가지는 단어에 대응되는 것을 특징으로 하는 서버.
제8항에 있어서,
상기 제어부는,
상기 핵심 어휘와 복수의 이미지 정보의 관련 정도를 판단하고, 상기 판단된 관련 정도가 가장 높은 이미지 정보를 상기 핵심 어휘로 추출하는 것을 특징으로 하는 서버.
제8항에 있어서,
상기 이미지 정보는 사진, 동영상, 아이콘 중 하나인 것을 특징으로 하는 서버.
사용자 단말의 제어 방법에 있어서,
텍스트를 입력받는 단계;
상기 입력된 텍스트를 서버로 전송하는 단계;
상기 서버로부터 번역된 번역 텍스트 및 상기 번역 텍스트의 핵심 어휘에 대응되는 이미지 정보를 수신하는 단계;
상기 수신된 번역 텍스트 및 상기 이미지 정보를 디스플레이하는 단계;
상기 이미지 정보를 수정하기 위한 사용자 명령이 입력되면, 상기 서버로 상기 수정하기 위한 사용자 명령을 전송하고, 상기 서버로부터 상기 수정하기 위한 사용자 명령에 대응되는 이미지 정보를 대체하기 위한 적어도 하나의 수정 이미지 정보를 수신하고, 상기 수신된 적어도 하나의 수정 이미지 정보를 디스플레이하는 단계;
상기 적어도 하나의 수정 이미지 정보 중 하나를 선택하기 위한 사용자 명령이 입력되면, 상기 서버로 상기 선택하기 위한 사용자 명령을 전송하고, 상기 서버로부터 상기 선택하기 위한 사용자 명령에 의해 선택된 수정 이미지 정보를 이용하여 상기 수정된 번역 텍스트를 수신하고, 상기 수신된 수정된 번역 텍스트 및 선택된 수정 이미지 정보를 디스플레이하는 단계; 및
상기 수정된 번역 텍스트에 대응하는 컨텐츠를 획득하기 위한 사용자 명령이 입력되면, 상기 서버로 상기 컨텐츠를 획득하기 위한 사용자 명령을 전송하고, 상기 서버로부터 컨텐츠 정보를 수신하고, 상기 컨텐츠 정보를 디스플레이하는 단계;를 포함하는 사용자 단말의 제어 방법.
제15항에 있어서,
텍스트를 입력받는 단계는,
음성을 인식하는 단계; 및
인식된 음성을 텍스트로 변환하는 단계;를 포함하는 것을 특징으로 하는 사용자 단말의 제어 방법.
삭제
삭제
제15항에 있어서,
상기 디스플레이하는 단계는,
상기 입력된 텍스트 및 상기 이미지 정보와 대칭되도록 상기 번역 텍스트를 디스플레이하는 것을 특징으로 하는 사용자 단말의 제어 방법.
사용자 단말에 있어서,
텍스트를 입력받는 입력부;
서버와 통신하는 통신부;
디스플레이부; 및
상기 입력된 텍스트를 서버로 전송하고, 상기 서버로부터 번역된 번역 텍스트 및 상기 번역 텍스트의 핵심 어휘에 대응되는 이미지 정보를 수신하도록 상기 통신부를 제어하고, 상기 수신된 번역 텍스트 및 상기 이미지 정보를 디스플레이하도록 상기 디스플레이부를 제어하는 제어부;를 포함하고,
상기 제어부는,
상기 이미지 정보를 수정하기 위한 사용자 명령이 입력되면, 상기 서버로 상기 수정하기 위한 사용자 명령을 전송하고, 상기 서버로부터 상기 수정하기 위한 사용자 명령에 대응되는 이미지 정보를 대체하기 위한 적어도 하나의 수정 이미지 정보를 수신하도록 상기 통신부를 제어하고, 상기 수신된 적어도 하나의 수정 이미지 정보를 디스플레이하도록 상기 디스플레이부를 제어하고,
상기 적어도 하나의 수정 이미지 정보 중 하나를 선택하기 위한 사용자 명령이 입력되면, 상기 서버로 상기 선택하기 위한 사용자 명령을 전송하고, 상기 서버로부터 상기 선택하기 위한 사용자 명령에 의해 선택된 수정 이미지 정보를 이용하여 상기 수정된 번역 텍스트를 수신하도록 상기 통신부를 제어하고, 상기 수신된 수정된 번역 텍스트 및 선택된 수정 이미지 정보를 디스플레이하도록 상기 디스플레이부를 제어하고,
상기 수정된 번역 텍스트에 대응하는 컨텐츠를 획득하기 위한 사용자 명령이 입력되면, 상기 서버로 상기 컨텐츠를 획득하기 위한 사용자 명령을 전송하고, 상기 서버로부터 컨텐츠 정보를 수신하도록 상기 통신부를 제어하고, 상기 컨텐츠 정보를 디스플레이하도록 상기 디스플레이부를 제어하는 것을 특징으로하는 사용자 단말.
제20항에 있어서,
상기 제어부는,
음성을 입력받도록 상기 입력부를 제어하고, 상기 입력된 음성을 텍스트로 변환하는 것을 특징으로 하는 사용자 단말.
삭제
삭제
제20항에 있어서,
상기 제어부는,
상기 입력된 텍스트 및 상기 이미지 정보와 대칭되도록 상기 번역 텍스트를 디스플레이하도록 상기 디스플레이부를 제어하는 것을 특징으로 하는 사용자 단말.