KR102186866B1 - 로그 데이터를 이용한 자동 번역 장치 및 그 방법 - Google Patents

로그 데이터를 이용한 자동 번역 장치 및 그 방법 Download PDF

Info

Publication number
KR102186866B1
KR102186866B1 KR1020130154590A KR20130154590A KR102186866B1 KR 102186866 B1 KR102186866 B1 KR 102186866B1 KR 1020130154590 A KR1020130154590 A KR 1020130154590A KR 20130154590 A KR20130154590 A KR 20130154590A KR 102186866 B1 KR102186866 B1 KR 102186866B1
Authority
KR
South Korea
Prior art keywords
translation
speech
log data
situation
sentence
Prior art date
Application number
KR1020130154590A
Other languages
English (en)
Other versions
KR20150068663A (ko
Inventor
이기영
권오욱
김창현
나승훈
노윤형
서영애
정상근
최승권
김운
박은진
신종훈
황금하
김영길
박상규
Original Assignee
한국전자통신연구원
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 한국전자통신연구원 filed Critical 한국전자통신연구원
Priority to KR1020130154590A priority Critical patent/KR102186866B1/ko
Publication of KR20150068663A publication Critical patent/KR20150068663A/ko
Application granted granted Critical
Publication of KR102186866B1 publication Critical patent/KR102186866B1/ko

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/40Processing or translation of natural language
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/30Semantic analysis
    • G06F40/35Discourse or dialogue representation

Abstract

본 발명은 로그 데이터를 이용한 자동 번역 장치 및 그 방법에 관한 것으로, 번역을 요청한 사용자로부터 로그 데이터를 수집하는 로그 수집부; 상기 사용자의 단말로부터 입력된 발화 문장 및 상기 로그 데이터를 분석한 결과를 토대로 상기 발화 문장에 해당하는 발화 상황을 인식하고 분류하는 로그 데이터 처리부; 및 분류된 발화 상황을 토대로 상기 발화 문장에 대한 번역 지식을 생성하고 관리하는 번역 지식 관리부;를 포함하는 것을 특징으로 한다.

Description

로그 데이터를 이용한 자동 번역 장치 및 그 방법{APPARATUS AND METHOD FOR AUTO TRANSLATION USING LOG DATA}
본 발명은 로그 데이터를 이용한 자동 번역 장치 및 그 방법에 관한 것으로, 보다 자세하게는 사용자 발화 로그 데이터를 수집하고 이를 분석하고 분류하여 자동 번역을 위한 상황 기반 번역 지식을 생성하는 로그 데이터를 이용한 자동 번역 장치 및 그 방법에 관한 것이다.
자동번역은 일반적으로 텍스트 문장을 입력으로 하며, 텍스트 문장은 규칙 기반 또는 통계 기반의 번역 방식을 사용하여 번역문을 생성하고 생성된 번역문을 다시 텍스트 문장으로 출력하는 것을 기본으로 한다. 지금까지 자동번역 기술은 주로 특정 도메인을 대상으로 개발되고 있다.
최근에는 모바일 네트워크 기술의 발달과 함께 단말의 보급으로 음성 번역에 대한 요구가 생겨났으며, 이를 위해 음성 인식된 문장을 번역해 주는 자동번역 시스템 관련 기술이 개발되고 있다. 자동번역 시스템은 그 대상이 음성이라는 것과 주로 번역 도메인이 대화체 관련 도메인이라는 점 그리고 사용하는 번역지식도 서로 다르다는 점에서 자동번역과는 차이가 있다. 또한 자동 번역의 입력이 되는 음성 대화체 문장은 문어체와는 달리 생략적인 요소들을 많이 포함하고 대화체의 특성을 지니기 때문에 번역하기가 까다롭다는 문제점이 있었다.
그러나, 종래의 자동번역 시스템은 상기와 같은 문제점을 해결하기 보다는 성능 향상을 위해 풍부한 번역메모리를 구축하거나 시스템을 구성하는 각 서브 모듈들의 성능을 독립적으로 향상시키기 위한 노력이 주를 이루었다.
이와 관련하여, 한국공개특허 제2011-0027361호는 "구조화된 번역 메모리 기반의 자동 번역 시스템 및 자동 번역 방법"에 관하여 개시하고 있다.
본 발명은 상기와 같은 문제점을 해결하기 위해 발명된 것으로서, 사용자 발화 로그 데이터를 위치 및 시간에 따라 다양하게 분석하여 해당 발화와 그와 연관된 해당 상황을 인지하는 로그 데이터를 이용한 자동 번역 장치 및 그 방법을 제공하는데 그 목적이 있다.
또한, 본 발명은 인지된 상황을 토대로 하는 상황 기반 번역 지식을 생성하고 제공하는 로그 데이터를 이용한 자동 번역 장치 및 그 방법을 제공하는데 그 목적이 있다.
상기한 목적을 달성하기 위하여 본 발명의 실시예에 따른 로그 데이터를 이용한 자동 번역 장치는 번역을 요청한 사용자로부터 로그 데이터를 수집하는 로그 수집부; 상기 사용자의 단말로부터 입력된 발화 문장 및 상기 로그 데이터를 분석한 결과를 토대로 상기 발화 문장에 해당하는 발화 상황을 인식하고 분류하는 로그 데이터 처리부; 및 분류된 발화 상황을 토대로 상기 발화 문장에 대한 번역 지식을 생성하고 관리하는 번역 지식 관리부;를 포함한다.
또한, 상기 로그 데이터는, 상기 사용자 정보, 번역을 요청한 발화 시간 정보 및 번역을 요청한 위치 정보 중 어느 하나를 포함하는 것을 특징으로 한다.
또한, 상기 로그 데이터 처리부는, 상기 발화 문장의 형태소 및 구조를 분석하는 문장 분석부; 상기 로그 데이터를 분석하는 로그 분석부; 및 기 분석된 분석 결과와 현재 분석 결과를 비교하여 상기 발화 문장의 발화 상황을 인식하여, 다수의 발화 상황들 중에서 어느 하나의 발화 상황으로 분류하는 상황 분류부;를 포함하는 것을 특징으로 한다.
또한, 상기 상황 분류부는 기 분석된 분석 결과와 현재 분석 결과를 비교하여, 현재 분석 결과와 유사도가 가장 높은 기 분석된 분석 결과에서 인식된 발화 상황을 상기 발화 문장의 발화 상황으로 인식하고 분류하는 것을 특징으로 한다.
또한, 상기 번역 지식 관리부는, 분류된 발화 상황을 토대로 상기 발화 문장에 대한 번역 지식을 생성하는 번역 지식 생성부; 생성된 상기 번역 지식을 상기 사용자 단말에 제공하는 번역 지식 제공부; 및 생성된 상기 번역 지식을 발화 상황 별로 구분하여 저장하는 번역 지식 저장부;를 포함하는 것을 특징으로 한다.
또한, 상기 번역 지식 관리부는 분류된 발화 상황에 따라 상기 발화 문장에 대한 번역 지식을 상기 번역 지식 저장부에 발화 상황 별로 기 저장된 번역 지식에서 선택하여 상기 사용자 단말에 제공하는 번역 지식 선택부;를 더 포함하는 것을 특징으로 한다.
상기한 목적을 달성하기 위하여 본 발명의 실시예에 따른 로그 데이터를 이용한 자동 번역 방법은 로그 수집부에 의해, 번역을 요청한 사용자로부터 로그 데이터를 수집하는 단계; 로그 데이터 처리부에 의해, 상기 사용자의 단말로부터 입력된 발화 문장 및 상기 로그 데이터를 분석한 결과를 토대로 상기 발화 문장에 해당하는 발화 상황을 인식하고 분류하는 단계; 및 번역 지식 관리부에 의해, 분류된 발화 상황을 토대로 상기 발화 문장에 대한 번역 지식을 생성하고 관리하는 단계;를 포함한다.
또한, 상기 사용자의 단말로부터 입력된 발화 문장 및 상기 로그 데이터를 분석한 결과를 토대로 상기 발화 문장에 해당하는 발화 상황을 인식하고 분류하는 단계는, 상기 발화 문장의 형태소 및 구조를 분석하는 단계; 상기 로그 데이터를 분석하는 단계; 및 기 분석된 분석 결과와 현재 분석 결과를 비교하여 상기 발화 문장의 발화 상황을 인식하여, 다수의 발화 상황들 중에서 어느 하나의 발화 상황으로 분류하는 단계;를 포함하는 것을 특징으로 한다.
또한, 기 분석된 분석 결과와 현재 분석 결과를 비교하여 상기 발화 문장의 발화 상황을 인식하여, 다수의 발화 상황들 중에서 어느 하나의 발화 상황으로 분류하는 단계는, 기 분석된 분석 결과와 현재 분석 결과를 비교하여, 현재 분석 결과와 유사도가 가장 높은 기 분석된 분석 결과로부터 인식된 발화 상황을 상기 발화 문장의 발화 상황으로 인식하고 분류하는 것을 특징으로 한다.
또한, 분류된 상황을 토대로 상기 발화 문장에 대한 번역 지식을 생성하고 관리하는 단계는, 분류된 발화 상황을 토대로 상기 발화 문장에 대한 번역 지식을 생성하는 단계; 생성된 상기 번역 지식을 상기 사용자 단말에 제공하는 단계; 및 생성된 상기 번역 지식을 발화 상황 별로 저장하는 단계;를 포함하는 것을 특징으로 한다.
또한, 분류된 상황을 토대로 상기 발화 문장에 대한 번역 지식을 생성하고 관리하는 단계는, 분류된 발화 상황에 따라 상기 발화 문장에 대한 번역 지식을 상기 번역 지식 저장부에 발화 상황 별로 기 저장된 번역 지식으로부터 선택하여 상기 사용자 단말에 제공하는 단계;를 더 포함하는 것을 특징으로 한다.
상기와 같은 구성을 갖는 본 발명에 의한 로그 데이터를 이용한 자동 번역 장치 및 그 방법은 사용자 발화 로그 데이터를 위치 및 시간에 따라 다양하게 분석하고 해당 발화와 그와 연관된 해당 상황을 인지하여 상황 기반을 토대로 하는 번역 지식을 생성하고 제공함으로써, 기존의 자동 번역 시스템에서 발생하는 모호성을 해소할 수 있는 효과가 있다.
따라서, 본 발명은 사용자에게 보다 높은 품질의 번역 결과물을 제공할 수 있는 효과가 있다.
도 1은 본 발명에 따른 로그 데이터를 이용한 자동 번역 장치의 구성을 설명하기 위한 도면이다.
도 2는 본 발명에 따른 로그 데이터를 이용한 자동 번역 장치에 채용되는 로그 수집부에서 수집되는 로그 데이터를 설명하기 위한 도면이다.
도 3은 본 발명에 따른 로그 데이터를 이용한 자동 번역 장치에 채용되는 로그 데이터 처리부의 세부 구성을 설명하기 위한 도면이다.
도 4는 본 발명에 따른 로그 데이터를 이용한 자동 번역 장치에 채용되는 번역 지식 관리부의 세부 구성을 설명하기 위한 도면이다.
도 5는 도 4의 번역 지식 관리부에 채용되는 번역 지식 저장부의 구조를 설명하기 위한 도면이다.
도 6은 본 발명에 따른 로그 데이터를 이용한 자동 번역 방법의 순서를 설명하기 위한 순서도이다.
이하, 본 발명이 속하는 기술분야에서 통상의 지식을 가진 자가 본 발명의 기술적 사상을 용이하게 실시할 수 있을 정도로 상세히 설명하기 위하여, 본 발명의 가장 바람직한 실시예를 첨부 도면을 참조하여 설명하기로 한다. 우선, 각 도면의 구성요소들에 참조부호를 부가함에 있어서, 동일한 구성요소들에 대해서는 비록 다른 도면상에 출력되더라도 가능한 한 동일한 부호를 가지도록 하고 있음에 유의해야 한다. 또한, 본 발명을 설명함에 있어, 관련된 공지 구성 또는 기능에 대한 구체적인 설명이 본 발명의 요지를 흐릴 수 있다고 판단되는 경우에는 그 상세한 설명은 생략한다.
이하에서는, 본 발명의 실시예에 따른 로그 데이터를 이용한 자동 번역 장치 및 그 방법에 대하여 첨부된 도면을 참고로 하여 상세히 설명한다.
최근에 자동번역 어플리케이션을 사용자의 단말에 탑재한 사용자가 급증하고 있다, 따라서, 자동번역 서버에 축적되는 로그 데이터도 기하급수적으로 증가하고 있다. 일반적으로 자동번역 로그 데이터는 기본적인 사용자 정보 외에도 발화시간, 발화위치(GPS 기반의 위치정보), 발화문장 등이 있을 수 있다. 하지만, 본 발명에서는 로그 데이터의 종류를 제한하지 않으며, 얼마든지 다변화되어 정의될 수 있다. 따라서, 빅 데이터 분석과 같이 자동번역 로그 데이터도 그 개수가 많아질수록 분석 결과의 신뢰성을 가질 수 있으며 특정 패턴을 가질 수 있다. 또한 로그 데이터를 기반으로 하여 발화 예측 모델도 설정이 가능하여 특정 시간 및 특정 장소에서의 발화 예측도 가능해 질 수 있다. 즉, 특정 시간 및 특정 위치에서는 주로 어떠한 문장에 대한 번역 요청이 많다든지, 주로 어떤 번역 도메인에 대한 번역 요청이 많다든지 하는 정보가 생성될 수 있으며 이러한 정보들은 다음에 설명되는 자동번역에서의 모호성 문제를 해결하는데 큰 도움이 될 수 있다.
자동번역에서의 모호성 문제는 다음과 같이 정의될 수 있다. 모호성은 음성인식 및 자동번역 2가지 측면에서 고려될 수 있다. 음성인식의 경우, 서로 유사한 발음적 특성을 지니지만, 해당 발화가 일어난 장소 등의 상황을 간주해 볼 때 그 모호성이 해소될 수 있는 문제가 그 예이다. 예를 들어, ‘grass’와 ‘glass’가 유사함 발음 어휘인데, 식당이라는 발화 상황에서는 ‘glass’로 인식하는 것에 확률적 가중치를 더 두는 것이 성능 향상에 바람직하다. 또한, 자동번역에서 “Have it your way.”라는 문장은 자주 사용되는 문장으로서 번역메모리(Translation Memory)에 저장되어 번역 과정 없이 바로 번역문이 생성될 수 있다. 하지만, 이 문장은“마음대로 하세요.”로 번역될 수도 있고, “골라서 드세요.”라고 번역될 수 있다는 점에서 모호성을 가지고 있다. 이러한 모호성을 해소할 수 있는 클루(clue)는 이 발화가 이루어진 상황이다. 즉, 만약 식당에서 발화된 상황이라면, “골라서 드세요.”에 번역 가중치를 더 두는 것이 성능 향상에 바람직하다.
상술한 바와 같이, 본 발명에서는 번역 도메인을 설정하고 기존의 다양한 사용자로부터 받은 로그 데이터를 분석하여 해당 로그 데이터에 적절한 도메인을 자동으로 분류하여 제공한다. 이때, 도메인은 본 발명에서의 발화 상황을 의미한다.
도 1은 본 발명에 따른 로그 데이터를 이용한 자동 번역 장치의 구성을 설명하기 위한 도면이다.
도 1을 참조하여 설명하면, 본 발명에 따른 로그 데이터를 이용한 자동 번역 장치(100)는 크게 로그 수집부(110), 로그 데이터 처리부(120) 및 번역 지식 관리부(130)를 포함한다.
로그 수집부(110)는 단말(10)에 탑재된 번역시스템을 이용하여 번역을 요청한 사용자로부터 로그 데이터(108)를 수집한다. 이때, 로그 데이터는 번역을 요청한 발화 시간 정보, 번역을 요청한 위치 정보(GPS 위치 정보), 사용자의 사적 프라이버시가 문제되지 않는 한에서의 사용자 정보 및 기타 활용할 수 있는 기타 정보 중 어느 하나를 포함한다.
로그 데이터 처리부(120)는 사용자의 단말(10)로부터 입력된 발화 문장 및 로그 데이터를 분석한 결과를 토대로 발화 문장에 해당하는 발화 상황을 인식하고 분류한다. 로그 데이터 처리부(120)는 발화 문장 및 로그 데이터를 분석하여, 기 분석된 분석 결과와 현재 분석 결과를 비교하여 발화 문장의 발화 상황을 인식하여, 다수의 발화 상황들 중에서 어느 하나의 발화 상황으로 분류한다.
번역 지식 관리부(130)는 분류된 발화 상황을 토대로 발화 문장에 대한 번역 지식을 생성하고 관리한다. 번역 지식 관리부(130)는 분류된 발화 상황을 토대로 발화 문장에 대한 번역 지식을 생성하여 발화 상황 별로 구분하여 저장하고 사용자의 단말에 제공한다.
도 2는 본 발명에 따른 로그 데이터를 이용한 자동 번역 장치에 채용되는 로그 수집부에서 수집되는 로그 데이터를 설명하기 위한 도면이다.
도 2를 참조하여 설명하면, 본 발명에 따른 로그 수집부(110)는 단말(10)에 탑재된 번역시스템을 이용하여 번역을 요청한 사용자로부터 로그 데이터(108)를 수집한다.
로그 수집부(110)로부터 수집되는 로그 데이터는 번역을 요청한 발화 시간 정보, 번역을 요청한 위치 정보(GPS 기반 위치 정보), 사용자의 사적 프라이버시가 문제되지 않는 한에서의 사용자 정보 및 기타 활용할 수 있는 기타 정보 중 어느 하나를 포함한다. 보다 자세하게, 사용자 정보는 번역 요청한 사용자 관련 정보이며, 발화 시간 정보는 사용자가 발화 문장을 번역 요청한 시간 정보이며, GPS 기반 위치 정보는 사용자가 발화 문장을 번역 요청한 위치 정보이며, 발화 문장은 번역 요청한 문장이며, 기타 정보는 이용 가능한 기타 로그 정보이다.
도 3은 본 발명에 따른 로그 데이터를 이용한 자동 번역 장치에 채용되는 로그 데이터 처리부의 세부 구성을 설명하기 위한 도면이다.
도 3을 참조하여 설명하면, 본 발명에 따른 로그 데이터 처리부(120)는 사용자의 단말(10)로부터 입력된 발화 문장 및 로그 데이터를 분석한 결과를 토대로 발화 문장에 해당하는 발화 상황을 인식하고 분류한다.
이를 위해, 로그 데이터 처리부(120)는 문장 분석부(121), 로그 분석부(122) 및 상황 분류부(123)를 포함한다.
문장 분석부(121)는 발화 문장의 형태소 및 구조를 분석한다.
로그 분석부(122)는 로그 데이터를 분석한다.
상황 분류부(123)는 기 분석된 분석 결과와 현재 분석 결과를 비교하여 발화 문장의 발화 상황을 인식하여, 다수의 발화 상황들 중에서 어느 하나의 발화 상황으로 분류한다. 상황 분류부(123)는 기 분석된 분석 결과와 현재 분석 결과를 비교하여, 현재 분석 결과와 유사도가 가장 높은 기 분석된 분석 결과에서 인식된 발화 상황을 발화 문장의 발화 상황으로 인식하고 분류한다. 이때, 발화 상황은 식당 상황, 공항 상황, 호텔 상황 및 기타 다양한 상황으로 분류될 수 있다.
도 4는 본 발명에 따른 로그 데이터를 이용한 자동 번역 장치에 채용되는 번역 지식 관리부의 세부 구성을 설명하기 위한 도면이고, 도 5는 도 4의 번역 지식 관리부에 채용되는 번역 지식 저장부의 구조를 설명하기 위한 도면이다.
도 4를 참조하여 설명하면, 본 발명에 따른 번역 지식 관리부(130) 분류된 발화 상황을 토대로 발화 문장에 대한 번역 지식을 생성하고 관리한다.
이를 위해, 번역 지식 관리부(130)는 번역 지식 생성부(131), 번역 지식 제공부(132), 번역 지식 저장부(133) 및 번역 지식 선택부(134)를 포함한다.
번역 지식 생성부(131)는 분류된 발화 상황을 토대로 발화 문장에 대한 번역 지식을 생성한다.
번역 지식 제공부(132)는 생성된 번역 지식을 사용자 단말에 제공한다.
번역 지식 저장부(133)는 생성된 번역 지식을 발화 상황 별로 구분하여 저장한다. 번역 지식 저장부(133)는 도 5에 도시된 바와 같이 식당 상황, 공항 상황, 호텔 상황 및 기타 다양한 상황 별로 각각의 데이터베이스(134,135,136,137)를 구비하여 저장한다.
번역 지식 선택부(134)는 분류된 발화 상황에 따라 발화 문장에 대한 번역 지식을 번역 지식 저장부(133)에 발화 상황 별로 기 저장된 번역 지식에서 선택하여 사용자 단말에 제공한다.
도 6은 본 발명에 따른 로그 데이터를 이용한 자동 번역 방법의 순서를 설명하기 위한 순서도이다.
도 6을 참조하여 설명하면, 본 발명에 따른 로그 데이터를 이용한 자동 번역 방법은 앞서 설명한 바와 같은 자동 번역 장치를 이용하는 것으로 이하, 중복되는 설명은 생략하기로 한다.
먼저, 번역을 요청한 사용자로부터 로그 데이터를 수집한다(S100). 이때, 이때, 로그 데이터는 번역을 요청한 발화 시간 정보, 번역을 요청한 위치 정보(GPS 위치 정보), 사용자의 사적 프라이버시가 문제되지 않는 한에서의 사용자 정보 및 기타 활용할 수 있는 기타 정보 중 어느 하나를 포함한다.
다음, 사용자의 단말로부터 입력된 발화 문장 및 로그 데이터를 분석한다(S120).
다음, 분석한 결과를 토대로 발화 문장에 해당하는 발화 상황을 인식하고 분류한다(S130). S130 단계는 기 분석된 분석 결과와 S120 단계에서 분석된 현재 분석 결과를 비교하여 발화 문장의 발화 상황을 인식하여, 다수의 발화 상황들 중에서 어느 하나의 발화 상황으로 분류한다.
마지막으로, 분류된 발화 상황을 토대로 상기 발화 문장에 대한 번역 지식을 생성하고 관리한다(S140). S140 단계는 분류된 발화 상황을 토대로 발화 문장에 대한 번역 지식을 생성하여 발화 상황 별로 구분하여 저장하고 사용자의 단말에 제공한다.
상기와 같은 로그 데이터를 이용한 자동 번역 장치 및 그 방법의 예는 다음과 같이 설명할 수 있다,
예를 들어, 어느 날 점심 시간에 사용자 A가 서울 명동의 피자집에서“피자를 주문하고 싶습니다.”라는 문장에 대한 번역을 단말에 탑재된 번역시스템 어플리케이션을 사용하여 번역 요청을 하는 경우 본 발명에 따른 로그 데이터를 이용한 자동 번역 장치로 해당 발화 문장과 함께 관련 로그 데이터가 입력된다. 즉, 낮 12시30분이라는 시간 정보, 대략 명동의 식당골목이라는 위치 정보, 20대 중반이라는 사용자 정보 등이 수집될 수 있다. 이 경우에 본 발명은 사용자가 번역 요청한 발화 문장을 분석하고 분류하여 ‘여행 도메인’ 가운데 ‘식당’에서 주문을 위한 문장이라는 것을 인식할 수 있고, 해당 문장은 시간/장소 등의 로그 정보와 함께 분류되어 저장된다.
한편, 본 발명은 사용자 A가 “Have it your way."라는 문장에 대한 번역을 단말에 탑재된 번역 시스템 어플리케이션을 사용하여 번역 요청을 하는 경우를 예를 들어 설명하면, “Have it your way.”는 2가지 이상의 의미를 가질 수 있다. 즉, 일반 발화 상황인 경우 “마음대로 하세요.”라고 번역될 수 있고, 식당에서의 발화 상황인 경우, “골라서 드세요.”라고 번역될 수 있다. 즉,“Have it your way.”는 정확한 발화 상황 인지 없이는 오류를 생성할 수 있는 문장이다. 따라서, 본 발명에 의해 사용자는 “Have it your way.”라고 한 발화 문장의 발화 상황이 기존 로그 데이터 분석 결과와 현재 로그 데이터 분석 결과를 비교를 통해서 해당 발화 상황이‘식당’으로 인지된다면 발화 상황에 맞게 “골라서 드세요.”라는 올바른 번역문을 생성할 수 있다.
이처럼, 본 발명에 의한 로그 데이터를 이용한 자동 번역 장치 및 그 방법은 사용자 발화 로그 데이터를 위치 및 시간에 따라 다양하게 분석하고 해당 발화와 그와 연관된 해당 상황을 인지하여 상황 기반을 토대로 하는 번역 지식을 생성하고 제공함으로써, 기존의 자동 번역 시스템에서 발생하는 모호성을 해소할 수 있어 보다 높은 품질의 번역 결과물을 제공할 수 있다.
이상에서, 본 발명에 따른 바람직한 실시예에 대해 설명하였으나, 다양한 형태로 변형이 가능하며, 본 기술분야에서 통상의 지식을 가진 자라면 본 발명의 특허청구범위를 벗어남이 없이 다양한 변형예 및 수정예를 실시할 수 있을 것으로 이해된다.
100 : 로그 데이터를 이용한 자동 번역 장치
110 : 로그 수집부 120 : 로그 데이터 처리부
130 : 번역 지식 관리부

Claims (10)

  1. 번역을 요청한 사용자로부터 발화 시간 정보 및 번역을 요청한 위치 정보를 포함하는 로그 데이터를 수집하는 로그 수집부;
    상기 사용자의 단말로부터 입력된 발화 문장 및 상기 로그 데이터를 분석한 결과를 토대로 상기 발화 문장에 해당하는 발화 상황을 인식하고 분류하는 로그 데이터 처리부; 및
    상기 분류된 발화 상황을 토대로 상기 발화 문장에 대한 번역 지식을 생성하고, 생성된 번역 지식을 발화 상황 별로 구분하여 저장하여 관리하는 번역 지식 관리부를 포함하되,
    로그 데이터를 기반으로 발화 상황에 따른 발화 예측 모델을 설정하고,
    발화 예측 모델을 통해 발화 시간 및 위치 정보에서 빈번히 번역 요청되는 문장 정보를 예측하는 것을 특징으로 하는 로그 데이터를 이용한 자동 번역 장치.
  2. 제 1 항에 있어서,
    상기 로그 데이터는 번역을 요청한 발화 시간 정보, 번역을 요청한 위치 정보, 번역을 요청한 상기 사용자에 관련된 사용자 정보 중에서 적어도 하나를 포함하는 것을 특징으로 하는 로그 데이터를 이용한 자동 번역 장치.
  3. 제 2 항에 있어서,
    상기 위치 정보는 GPS 기반 위치 정보를 포함하는 것을 특징으로 하는 로그 데이터를 이용한 자동 번역 장치.
  4. 제 1 항에 있어서,
    상기 로그 데이터 처리부는,
    상기 발화 문장의 형태소 및 구조를 분석하는 문장 분석부;
    상기 로그 데이터를 분석하는 로그 분석부; 및
    이전에 분석된 분석 결과와 현재 분석 결과를 비교함으로써 상기 발화 문장의 발화 상황을 인식하고, 상기 인식한 발화 상황을 다수의 발화 상황들 중에서 어느 하나로 분류하는 상황 분류부를 포함하는 것을 특징으로 하는 로그 데이터를 이용한 자동 번역 장치.
  5. 삭제
  6. 제 4 항에 있어서,
    상기 번역 지식 관리부는,
    상기 번역 지식을 생성하는 번역 지식 생성부;
    상기 생성된 번역 지식을 상기 사용자의 단말에 제공하는 번역 지식 제공부;
    상기 생성된 번역 지식을 발화 상황 별로 구분하여 저장하는 번역 지식 저장부; 및
    상기 분류된 발화 상황에 따라 상기 발화 문장에 대한 번역 지식을 상기 발화 상황 별로 상기 저장된 번역 지식에서 선택하고, 상기 선택된 번역 지식을 상기 사용자의 단말로 제공하는 번역 지식 선택부를 포함하는 것을 특징으로 하는 로그 데이터를 이용한 자동 번역 장치.
  7. 로그 데이터를 이용한 자동 번역 장치의 동작 방법에 있어서,
    번역을 요청한 발화 시간 정보, 번역을 요청한 위치 정보, 번역을 요청한 사용자 관련 사용자 정보 중에서 적어도 하나를 갖는 로그 데이터 및 번역을 요청한 발화 문장을 상기 사용자의 사용자 단말로부터 수집하는 단계;
    상기 발화 문장과 상기 로그 데이터를 분석하여 발화 상황을 인식 및 분류하는 단계; 및
    상기 분류된 발화 상황을 토대로 상기 발화 문장에 대한 번역 지식을 생성하고, 생성된 번역 지식을 발화 상황 별로 구분하여 저장하고 관리하는 단계를 포함하되,
    로그 데이터를 기반으로 발화 상황에 따른 발화 예측 모델을 설정하고,
    발화 예측 모델을 통해 발화 시간 및 위치 정보에서 빈번히 번역 요청되는 문장 정보를 예측하는 것을 특징으로 하는 방법.
  8. 제 7 항에 있어서,
    상기 발화 상황을 인식 및 분류하는 단계는,
    상기 발화 문장의 형태소와 구조를 분석하는 단계를 더 포함하는 방법.
  9. 제 7 항에 있어서,
    상기 발화 상황을 인식 및 분류하는 단계는,
    이전에 분석된 분석 결과와 현재 분석 결과를 비교하여 상기 발화 문장의 발화 상황을 인식하는 단계; 및
    상기 인식된 발화 상황을 다수의 발화 상황들 중에서 어느 하나로 분류하는 단계를 포함하는 방법.
  10. 제 7 항에 있어서,
    상기 관리하는 단계는,
    상기 발화 문장에 대한 번역 지식을 생성하여 발화 상황 별로 구분 및 저장하는 단계; 및
    상기 사용자의 단말에 상기 생성된 번역 지식을 제공하는 단계를 포함하는 방법.
KR1020130154590A 2013-12-12 2013-12-12 로그 데이터를 이용한 자동 번역 장치 및 그 방법 KR102186866B1 (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020130154590A KR102186866B1 (ko) 2013-12-12 2013-12-12 로그 데이터를 이용한 자동 번역 장치 및 그 방법

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020130154590A KR102186866B1 (ko) 2013-12-12 2013-12-12 로그 데이터를 이용한 자동 번역 장치 및 그 방법

Publications (2)

Publication Number Publication Date
KR20150068663A KR20150068663A (ko) 2015-06-22
KR102186866B1 true KR102186866B1 (ko) 2020-12-04

Family

ID=53516047

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020130154590A KR102186866B1 (ko) 2013-12-12 2013-12-12 로그 데이터를 이용한 자동 번역 장치 및 그 방법

Country Status (1)

Country Link
KR (1) KR102186866B1 (ko)

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2012129392A1 (en) 2011-03-22 2012-09-27 Selective Broadcasting Corporation Apparatus, method and system for locating and monitoring the movement of an object

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100853173B1 (ko) * 2007-01-22 2008-08-20 포항공과대학교 산학협력단 통계적 자동 번역 방식에 기반한 음성 자동 통역 시스템 및그에 적용되는 번역 처리 방법 및 그 훈련방법
KR101640024B1 (ko) * 2009-09-23 2016-07-15 삼성전자주식회사 사용자의 상황에 기반한 휴대용 통역 장치 및 방법
KR20120089502A (ko) * 2010-12-09 2012-08-13 한국전자통신연구원 번역지식 서버 생성 방법 및 그 장치

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2012129392A1 (en) 2011-03-22 2012-09-27 Selective Broadcasting Corporation Apparatus, method and system for locating and monitoring the movement of an object

Also Published As

Publication number Publication date
KR20150068663A (ko) 2015-06-22

Similar Documents

Publication Publication Date Title
US10380160B2 (en) Dynamic language model
US10657966B2 (en) Better resolution when referencing to concepts
JP6734748B2 (ja) 情報ソースの情報ソース用言語を選択するためのコンピュータ実装方法、コンピュータ・システム、コンピュータ・プログラム製品
KR101770527B1 (ko) 기계학습에 기초한 자동 태스크 분류 방법
US7742922B2 (en) Speech interface for search engines
US7809568B2 (en) Indexing and searching speech with text meta-data
US20160275196A1 (en) Semantic search apparatus and method using mobile terminal
US10713288B2 (en) Natural language content generator
US9898455B2 (en) Natural language understanding cache
CN113268498A (zh) 业务推荐方法和具有智能助手的装置
US8688447B1 (en) Method and system for domain-specific noisy channel natural language processing (NLP)
US10860588B2 (en) Method and computer device for determining an intent associated with a query for generating an intent-specific response
JP6869835B2 (ja) 音声認識システム、端末装置、及び辞書管理方法
CN110164416B (zh) 一种语音识别方法及其装置、设备和存储介质
CN114817465A (zh) 一种用于多语言语义理解的实体纠错方法及智能设备
JP2020042131A (ja) 情報処理装置、情報処理方法、およびプログラム
KR102186866B1 (ko) 로그 데이터를 이용한 자동 번역 장치 및 그 방법
JP2014110005A (ja) 情報検索装置及び情報検索方法
EP3552114A1 (en) Natural language content generator
US20130166283A1 (en) Method and apparatus for generating phoneme rule
JP6115487B2 (ja) 情報収集方法、対話システム及び情報収集装置
KR101072890B1 (ko) 데이터베이스 정제 장치 및 그 방법, 이를 이용한 음성 이해 장치 및 그 방법
KR20120040166A (ko) 초성 자동완성 및 그에 따른 검색 결과 제공 방법 및 시스템
KR20180062006A (ko) 개인 언어 정보 처리 장치 및 그 방법
JP2005242948A (ja) 自動対話によるバーチャル会話方法、及びそのシステム

Legal Events

Date Code Title Description
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant