KR20200017600A - 번역 서비스 제공 장치 및 방법 - Google Patents

번역 서비스 제공 장치 및 방법 Download PDF

Info

Publication number
KR20200017600A
KR20200017600A KR1020180089921A KR20180089921A KR20200017600A KR 20200017600 A KR20200017600 A KR 20200017600A KR 1020180089921 A KR1020180089921 A KR 1020180089921A KR 20180089921 A KR20180089921 A KR 20180089921A KR 20200017600 A KR20200017600 A KR 20200017600A
Authority
KR
South Korea
Prior art keywords
message
translation
original
morpheme
dictionary
Prior art date
Application number
KR1020180089921A
Other languages
English (en)
Inventor
김민철
Original Assignee
김민철
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 김민철 filed Critical 김민철
Priority to KR1020180089921A priority Critical patent/KR20200017600A/ko
Publication of KR20200017600A publication Critical patent/KR20200017600A/ko
Priority to KR1020200065331A priority patent/KR102437008B1/ko

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/40Processing or translation of natural language
    • G06F40/58Use of machine translation, e.g. for multi-lingual retrieval, for server-side translation for client devices or for real-time translation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/237Lexical tools
    • G06F40/242Dictionaries
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/268Morphological analysis

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Machine Translation (AREA)

Abstract

본 발명은 빅 데이터를 이용한 인공지능 기반의 번역 서비스 제공 장치 및 방법에 관한 것으로, 번역 요청하는 원문 메시지를 입력받는 단계, 상기 입력받은 원문 메시지를 번역하여 번역 메시지를 생성하는 단계, 상기 번역 메시지를 상기 원문 메시지 언어로 재번역하는 단계, 상기 입력받은 원문 메시지와 상기 생성된 번역 메시지, 상기 원문 메시지 언어로 재번역된 재번역 메시지를 동시에 하나의 화면에 표시하는 단계, 상기 표시된 화면상에서 상기 원문 메시지의 수정 사항을 입력받는 단계, 상기 입력되는 수정 사항을 반영하여 상기 번역 메시지와, 재번역 메시지를 보정 생성하는 단계 및 상기 보정 생성된 번역 메시지와 재번역 메시지를 동시에 하나의 화면에 표시하는 단계를 포함하는 번역 서비스 제공 방법에 의해 번역된 내용을 확인하는 화면상에 원문 내용을 같이 표시하여 번역된 내용을 확인하면서 원문 내용을 수정하는 것이 가능하기 때문에 이미 번역한 이후에도 오번역된 내용의 보정이 용이하기 때문에 번역된 내용의 보정을 위한 시간과 수고를 덜 수 있는 효과가 도출된다.

Description

번역 서비스 제공 장치 및 방법{Apparatus and Method for Providing Translation Service}
본 발명은 번역 서비스 제공 장치 및 방법에 관한 것으로 보다 상세하게는 빅 데이터를 이용한 인공지능 기반의 번역 서비스 제공 장치 및 방법에 관한 것이다.
자동번역은 일반적으로 텍스트 문장을 입력으로 하며, 텍스트 문장은 규칙 기반 또는 통계 기반의 번역 방식을 사용하여 번역문을 생성 한다. 그리고 생성된 번역문을 다시 텍스트 문장으로 출력하는 것을 기본으로 한다.
한편, 최근 빅데이터 기술의 발전과 보급 확대로 빅데이터 기술의 응용 분야도 다양해 지고 있다. 특히 인공지능 (Artificial Intelligence) 기술의 성능향상은 빅데이터 기술의 활용 분야를 더욱 확대시키고 있다. 종래의 자동 번역기술은 규칙기반(Rule-Based Machine Translation: RBMT), 패턴기반, 통계기반(Statistical Machine Translation: SMT) 등의 기술로 발전되어 왔으나, 자동 번역의 품질의 신뢰도가 떨어지는 문제점을 갖고 있다.
최근에는 자동번역기술에 인공지능 기술을 접목시킨 인공지능 기계번역(Neuronal Machine Translation: NMT) 기술이 급부상하며, 자동번역의 번역 품질을 향상시킬 수 있는 대안으로 떠오르고 있다.
그러나 규칙기반 기계번역엔진에서 자동번역 과정은 원문 문장의 형태소분석과 구문분석을 수행하고, 대상 언어의 문장 형태로의 변환과 생성의 4단계를 거쳐 수행된다. 구체적으로 종래 규칙 기반 번역 엔진 구조에서의 번역 흐름은 원문을 입력 받아, 언어별 형태소 사전과 문법 사전 데이터베이스를 기반으로 형태소 분석과 구문 분석을 수행하고, 원문 언어의 어휘를 번역문 언어의 어휘로 변환 후, 번역문을 생성하는 방식이다.
그러나 하나의 단어가 여러 품사를 갖고 있거나, 여러 가지 의미를 갖고 있어서, 형태소 분석 및 구문분석에서 언어의 모호성이 상시 존재한다. 이로 인해 어순에 오류가 발생하거나 자연스럽지 못한 번역문이 생성되는 경우가 빈번하다. 이 때문에, 자동번역의 품질은 번역자가 직접 번역한 결과와 비교하여 기계번역의 품질이 현저하게 떨어지는 것이 기존규칙기반 기계번역엔진의 기술적인 한계라 하겠다.
기계번역 엔진의 기술적 한계를 극복하기 위한 기술이 제안되고 있긴 하지만 어느정도 사용자가 직접적으로 보정해야할 필요성이 존재한다. 그런데 기존 번역 툴의 경우 일단 번역을 실행한 이후에 다시 원문 언어로 재번역을 하려면, 번역 언어 전환을 해야한다. 예를들어 한국어->영어로 번역된 번역문을 한국어로 다시 확인해보려면 번역 언어를 영어->한국어로 전환하여 재설정해야하기 때문에 최초 입력했던 원문(한글)의 내용은 사라지게된다.
따라서 원문의 내용에 기반하여 수정하려고 할 경우에 번역 원문의 내용을 다시 확인해야하고 처음부터 다시 입력해야하는 번거로움이 존재한다.
본 발명은 이같은 배경에서 도출된 것으로, 제 1 목적은 번역된 내용을 확인하는 화면상에 원문 내용을 같이 표시하여 번역된 내용을 확인하면서 원문 내용을 수정하는 것이 가능하기 때문에 오번역된 내용의 보정을 위해 시간과 수고를 덜 수 있는 번역 서비스 제공 장치 및 방법을 제공함에 있다.
또한, 제 2 목적은 번역된 내용을 원문 언어로 다시 재번역하여 번역된 내용과 함께 화면 표시함으로써 사용자가 자신이 원한 의도대로 번역이 이루어졌는지를 실시간으로 확인하고 수정하는 것이 가능하여 번역의 정확성을 높일 수 있도록 함에 있다.
뿐만 아니라, 제 3 목적은 기존에 수정된 내용을 분석하여 빅데이터화하여 관리하고 인공지능으로 학습하여 학습된 내용에 기반한 번역을 수행함으로써 정확성에 있어서 진화하는 능력을 가지는 번역 툴을 제공함에 있다.
상기의 과제를 달성하기 위한 본 발명은 다음과 같은 구성을 포함한다.
즉 본 발명의 실시예에 따른 번역 서비스 제공 방법은 번역 요청하는 원문 메시지를 입력받는 단계, 상기 입력받은 원문 메시지를 번역하여 번역 메시지를 생성하는 단계, 상기 번역 메시지를 상기 원문 메시지 언어로 재번역하는 단계, 상기 입력받은 원문 메시지와 상기 생성된 번역 메시지, 상기 원문 메시지 언어로 재번역된 재번역 메시지를 동시에 하나의 화면에 표시하는 단계, 상기 표시된 화면상에서 상기 원문 메시지의 수정 사항을 입력받는 단계, 상기 입력되는 수정 사항을 반영하여 상기 번역 메시지와, 재번역 메시지를 보정 생성하는 단계 및 상기 보정 생성된 번역 메시지와 재번역 메시지를 동시에 하나의 화면에 표시하는 단계를 포함한다.
본 발명의 추가적인 양상에 따라 번역 서비스 제공 방법은 상기 입력되는 수정 사항을 반영하여 빅데이터로 저장하는 단계를 더 포함하고, 상기 번역 메시지를 생성하는 단계는 상기 빅데이터로 저장된 내용을 참조하여 번역 메시지를 생성한다.
일 양상에 따라 상기 번역 메시지를 생성하는 단계는, 기 구축된 형태소 사전을 기반으로 상기 입력되는 원문 메시지의 형태소를 분석하는 단계, 기 구축된 문법 사전을 기반으로 구문 분석을 수행하는 단계 및 상기 분석 결과에 따라 원문 메시지를 번역하여 번역 메시지를 생성하는 단계를 포함하고, 상기 빅 데이터로 저장하는 단계는, 상기 원문 메시지와 수정 사항을 형태소 단위로 매핑하여 상기 형태소 사전과 상기 문법 사전의 내용을 추가로 구축하는 것임을 특징으로 한다.
또 다른 양상에 따르면 번역 메시지를 생성하는 단계는, 기 구축된 형태소 사전을 기반으로 상기 입력되는 원문 메시지의 형태소를 분석하는 단계, 기 구축된 문법 사전을 기반으로 구문 분석을 수행하는 단계 및 상기 분석 결과에 따라 원문 메시지를 번역하여 번역 메시지를 생성하는 단계를 포함하고, 상기 빅 데이터로 저장하는 단계는, 상기 번역 메시지와 수정 사항을 형태소 단위로 매핑하여 내용을 상기 형태소 사전과 상기 문법 사전의 내용을 추가 구축하는 것임을 특징으로 한다.
한편, 일 실시예에 따른 번역 서비스 제공 장치는 번역 요청하는 원문 메시지를 입력받아 상기 원문 메시지를 분석하고, 번역하여 번역 메시지를 생성하고, 상기 생성된 번역 메시지를 상기 원문 메시지 언어로 재번역하는 번역부; 상기 입력받은 원문 메시지와 상기 번역부에서 생성된 번역 메시지와 상기 재번역된 재번역 메시지를 동시에 하나의 화면에 표시하는 화면 표시부; 상기 화면 표시부에 표시된 화면상에서 상기 원문 메시지의 수정 사항을 입력받는 수정사항 입력부; 및 상기 수정사항 입력부로 입력되는 수정 사항을 반영하여 상기 번역 메시지와, 재번역 메시지를 보정 생성하는 보정부;를 포함하고, 상기 화면 표시부는 상기 보정부에서 보정 생성된 번역 메시지와 상기 재번역 메시지를 동시에 하나의 화면에 표시하는 것을 특징으로 한다.
추가적인 양상에 따른 번역 서비스 제공 장치는 기 구축된 형태소 사전과 문법 사전을 저장하는 빅데이터 저장부를 더 포함하고, 상기 번역부는 상기 빅데이터 저장부에 저장된 형태소 사전과 문법 사전을 기반으로 원문의 형태소와 구문 분석을 수행하고, 상기 분석 결과에 따라 원문 메시지를 번역하여 번역 메시지를 생성하며, 상기 빅데이터 저장부는 상기 원문 메시지와 수정 사항을 형태소 단위로 매핑하여 상기 형태소 사전과 상기 문법 사전의 내용을 추가로 구축하는 것을 특징으로 한다.
본 발명에 따르면, 번역된 내용을 확인하는 화면상에 원문 내용을 같이 표시하여 번역된 내용을 확인하면서 원문 내용을 수정하는 것이 가능하기 때문에 이미 번역한 이후에도 오번역된 내용의 보정이 용이하기 때문에 번역된 내용의 보정을 위한 시간과 수고를 덜 수 있는 효과가 도출된다.
나아가 번역된 내용을 원문 언어로 다시 재번역하여 번역된 내용과 함께 화면 표시함으로써 사용자가 자신이 원한 의도대로 번역이 이루어졌는지를 실시간으로 확인하고 수정하는 것이 가능하여 번역의 정확성을 보다 높일 수 있는 효과가 있다.
또한, 기존에 수정된 내용을 분석하여 빅데이터화하여 관리하고 인공지능으로 학습하여 학습된 내용에 기반한 번역을 수행함으로써 정확도가 향상되는 발전 지향적인, 진화하는 능력을 가지는 번역을 수행하는 번역 서비스 장치 및 방법을 제공할 수 있는 효과가 있다.
도 1 은 본 발명의 일 실시예에 따른 번역 서비스 제공 장치의 구성을 도시한 블록도,
도 2는 본 발명의 일 실시예에 따른 번역 서비스 제공방법의 흐름을 도시한 흐름도,
도 3은 본 발명의 일 실시예에 따라 원문 메시지와 번역 메시지, 원문 메시지 언어로 재번역된 재번역 메시지를 동시에 하나의 화면에 표시한 예시도,
도 4는 본 발명의 일 실시예에 따라 번역 과정을 보다 상세히 도시한 흐름도이다.
본 발명에서 사용되는 기술적 용어는 단지 특정한 실시 예를 설명하기 위해 사용된 것으로, 본 발명을 한정하려는 의도가 아님을 유의해야 한다. 또한, 본 발명에서 사용되는 기술적 용어는 본 발명에서 특별히 다른 의미로 정의되지 않는 한, 본 발명이 속하는 기술 분야에서 통상의 지식을 가진 자에 의해 일반적으로 이해되는 의미로 해석되어야 하며, 과도하게 포괄적인 의미로 해석되거나, 과도하게 축소된 의미로 해석되지 않아야 한다.
이하, 첨부된 도면을 참조하여 본 발명에 따른 바람직한 실시예를 상세히 설명한다.
도 1 은 본 발명의 일 실시예에 따른 번역 서비스 제공 장치의 구성을 도시한 블록도이다.
일 실시예에 있어서 번역 서비스 제공 장치는 예를 들면, 스마트 폰(smartphone), 태블릿 PC(tablet personal computer), 이동 전화기(mobile phone), 영상 전화기, 전자책 리더기(e-book reader), 데스크탑 PC(desktop personal computer), 랩탑 PC(laptop personal computer), 넷북 컴퓨터(netbook computer), 워크 스테이션(workstation), 서버, PDA(personal digital assistant), PMP(portable multimedia player), MP3 플레이어, 모바일 의료기기, 카메라(camera) 또는 웨어러블 장치(wearable device) 중 적어도 하나를 포함할 수있다.
다양한 실시예에 따르면, 웨어러블 장치는 액세서리형(예: 시계, 반지, 팔찌, 발찌, 목걸이, 안경, 콘택트 렌즈 또는 머리 착용형 장치(head-mounted-device(HMD)), 직물 또는 의류 일체형(예: 전자의복), 신체 부착형(예: 스킨 패드(skin pad) 또는 문신), 또는 생체 이식형(예: implantable circuit) 중 적어도 하나를 포함 할 수 있다.
그러나 번역 서비스 제공 장치는 전술한 기기들에 한정되지 않으며, 기술 발전에 따른 새로운 전자 장치를 포함하도록 해석된다.
도 1에 도시된 바와 같이, 본 발명의 일 실시예에 따른 번역 서비스 제공 장치는 번역부(10), 화면 표시부(20), 수정사항 입력부(30), 보정부(40) 및 빅데이터 저장부(50)를 포함한다.
번역부(10)는 번역 요청하는 원문 메시지를 입력받아 원문 메시지를 분석하고, 번역하여 번역 메시지를 생성한다. 또한, 생성된 번역 메시지를 원문 메시지 언어로 재번역하여 재번역 메시지를 생성한다.
화면 표시부(20)는 번역부(10)로 입력받은 원문 메시지와 번역부(10)에서 생성된 번역 메시지, 재번역 메시지를 동시에 한 화면에 표시한다. 화면상에서 원문 메시지와 동일한 언어로 재번역된 재번역 메시지를 확인함으로써 사용자 입장에서는 자신의 의도대로 번역이 이루어졌는지를 인지할 수 있는 효과가 있다.
일 실시예에 있어서 화면 표시부(20)는 번역 서비스 제공장치에서 처리되는 정보를 표시(출력)한다. 예를 들어, 화면 표시부(20)는 번역 서비스 제공장치에서 구동되는 응용 프로그램의 실행화면 정보, 또는 이러한 실행화면 정보에 따른 UI(User Interface), GUI(Graphic User Interface) 정보를 표시할 수 있다.
화면 표시부(20)는 터치 센서와 상호 레이어 구조를 이루거나 일체형으로 형성됨으로써, 터치 스크린을 구현 할 수 있다. 이러한 터치 스크린은, 번역 서비스 제공장치와 사용자 사이의 입력 인터페이스를 제공하는 사용자 입력부로써 기능함과 동시에, 번역 서비스 제공장치와 사용자 사이의 출력 인터페이스를 제공할 수 있다.
수정사항 입력부(30)는 화면 표시부(20)에 표시된 화면상에서 원문 메시지의 수정 사항을 입력받는다. 수정사항 입력부(30)는 데스크탑 혹은 노트북에 연결되는 키패드일 수 있고, 전술한 터치 스크린에 구현되는 입력 인터페이스로 구현될 수 있다. 화면 표시부(20)에 표시된 원문 메시지를 수정하기 위한 수정 사항을 입력받을 수 있는 기술적 구성은 모두 포괄하도록 해석된다.
이때 수정사항 입력부(30)는 번역이 수행되고 번역 메시지가 화면에 표시된 상태에서 수정사항을 입력받는다. 따라서 사용자는 번역 요청한 원문 메시지와 번역 완료된 번역 메시지를 한 화면에서 동시에 확인하면서 수정 사항을 입력할 수 있다.
기존에 번역을 수행한 이후에 번역된 내용을 다시 원문의 언어로 확인하고 싶을 때에는 번역 과정을 다시 수행해야하기 때문에 최초 사용자가 입력하였던 원문 메시지의 내용은 확인하기 어렵다는 한계가 있다.
본 발명의 이같은 양상에 따르면 최초 입력된 원문 메시지와, 번역되었다가 다시 원문 메시지의 언어로 재번역된 내용을 동시에 확인함으로써 번역이 제대로 원하는 의도대로 이루어졌는지를 확인하는 것이 가능하다.
보정부(40)는 수정사항 입력부(30)로 입력되는 수정 사항을 반영하여 번역 메시지와, 재번역 메시지를 보정 생성한다. 이때 화면 표시부(20)는 보정부(40)에서 보정 생성된 번역 메시지와 재번역 메시지를 동시에 하나의 화면에 표시한다.
본 실시예에 있어서 사용자가 원문 메시지와 번역 메시지가 함께 출력된 화면 상에서 원문 메시지를 수정하면, 실시간으로 수정된 원문메시지에 대한 번역 메시지 및 재번역 메시지를 확인하는 것이 가능하다.
빅데이터 저장부(50)는 기 구축된 형태소 사전과 문법 사전을 저장한다. 일 실시예에 있어서 빅데이터 저장부(50)는 자동 번역에 필요한 일련의 데이터를 저장 및 관리한다. 빅데이터 저장부(50)는 언어 별 형태소 사전, 문법사전, 구(phrase) 사전 및 병렬 코퍼스(corpus) 데이터베이스로 구성될 수 있다.
형태소 사전은 언어별로 뜻을 가진 가장 작은 말의 단위가 되는 형태소를 데이터베이스화하여 저장한다. 문법 사전은 언어 별로 문장을 구성하는 규칙 및 품사별 활용 규칙 등 문법데이터를 저장하고, 구(phrase) 사전에는 둘 이상의 단어로 이루어진 이어 동사와 같은 구에 대한 데이터가 저장된다.
일 실시예에 있어서 빅데이터 저장부(50)는 언어학에서 구조를 이루고 있는 텍스트인 코퍼스(말뭉치)를 더 저장한다. 코퍼스는 단일한 언어(단일언어 말뭉치) 또는 여러 언어(다중언어 말뭉치)의 텍스트를 포함하고 있는경우가 있다. 여러 언어 간의 비교를 위해 특별히 형태화된 다중언어 코퍼스는 '정렬된 병렬 코퍼스(aligned parallel corpora)'이고, 번역의 정확도를 높이기 위해 병렬 코퍼스도 빅데이터 저장부(50)에 더 저장된다.
빅데이터 저장부(50)는 번역 서비스 제공 장치내에 탑재되는 기술적 구성으로 구현되는 것도 가능하고, 번역 서비스 제공 서버에 연계되는 기술적 구성되는 것도 가능하다.
이때 번역 서비스 제공 서버는 다수의 클라이언트 장치로 구현되는 번역 서비스 제공 장치에서 접속 가능한 번역 서비스 제공을 위한 웹 페이지를 제공하고, 관리하기 위한 관리자 서버로 구현될 수 있다.
또한 번역 서비스 제공 서버는 번역 서비스 제공을 위한 전용 어플리케이션을 제공하고 관리하는 기능을 더 수행가능한 관리자 서버로 구현될 수도 있다.
본 발명의 일 양상에 따라 번역부(10)는 빅데이터 저장부에 저장된 형태소 사전과 문법 사전을 기반으로 원문의 형태소와 구문 분석을 수행하고, 분석 결과에 따라 원문 메시지를 번역하여 번역 메시지를 생성하며, 이때 빅데이터 저장부(50)는 원문 메시지와 수정 사항을 형태소 단위로 매핑하여 형태소 사전과 문법 사전의 내용을 추가로 더 구축한다.
뿐만 아니라 빅데이터 저장부(50)는 새로 인식되는 코퍼스가 존재하는 경우에 이를 추가로 더 저장한다.
번역부(10)는 입력된 원문 메시지의 띄어쓰기 구조에 따라 원문 메시지에 포함된 단어의 형태소와 문장구조 및 구문을 분석한다.
예컨데 번역부(10)는 사람이 번역한 대량의 양방향 코퍼스(약 100만 문장 이상)를 대상으로 각각의 원문과 번역문에 대한 형태소분석(명사, 동사, 형용사 등의 품사) 및 구문분석(주어, 서술, 목적어, 보어 등)을 수행할 수 있다.
그리고 번역부(10)는 분석 결과를 기반으로 원문의 문장 성분을 번역문의 문장성분으로 변환하고, 문장 패턴 사전 및 코퍼스 데이터를 기반으로 번역문을 생성한다. 예컨대, 번역부(10)는 원문 메시지상의 형태소와 번역문 메시지의 형태소 단위로 사전을 참조하여 대역을 연결한다.
번역부(10)는 빅데이터 저장부(50)에 대용량으로 구축된 고품질 병렬 코퍼스에 대해서 각 문장 별로 형태소 및 구문분석을 수행하여 구(phrase) 사전과 문장 생성 사전을 구축하여 번역시 활용함으로써 정확도를 높이고, 번역 품질을 향상시킬 수 있다.
본 발명의 추가적인 양상에 따라 번역부(10)는 번역 요청하는 원문 메시지를 실행중인 채팅 어플리케이션의 채팅창으로부터 입력받고, 번역 메시지 또는 보정 생성된 번역 메시지를 실행중인 채팅 어플리케이션의 채팅창에 표시한다.
채팅 어플리케이션과 연계됨으로써 채팅창에서 다른 언어로 대화를 하는 경우에도 실시간으로 본 실시예에 따른 번역 서비스를 제공할 수 있다. 따라서 채팅중 서로 다른 언어로 대화를 나눌 때에도 번역의 정확도를 보다 높일 수 있는 것이다.
이에 따라 사용자는 실시간으로 채팅창을 통해 번역된 내용을 대화를 할 수 있고, 번역되는 상태를 확인하여 보다 정확하게 자신의 생각이나 의도가 전달되도록 원문 메시지를 수정함으로써 서로 다른 언어를 사용하더라도 실감나는 대화를 할 수 있다.
또 다른 실시예에 있어서 번역 서비스 제공 장치는 인공지능(AI) 프레임 워크를 더 포함할 수 있다. 인공지능 프레임 워크는 인공지능/기계학습(AI/ML) 모듈과, 어플리케이션들과의 통신들을 취급하는 어플리케이션 매니저(Application Manager)와, 빅데이터 저장부(50)에 데이터의 저장 및 취급을 관리하는 스토리지 매니저(Storage Manager)와, 인공지능/기계학습(AI/ML) 모듈의 동작을 통하여 어느 행위를 취해야 하는지 결정하는 액션 매니저(Action Manager)와, 사용자 인터페이스에게 변화들을 지시하여 사용자 인터페이스의 모습과 기능을 관리하는 사용자 인터페이스 매니저(UI Manager), 및 번역 서비스 제공 장치의 상태와 가상세계의 상태 및 그 두 상태 사이의 관계를 결정하는 장치 세계 매퍼(DeviceWorldMapper)를 포함한다.
즉, 번역 서비스 제공 장치는 인공지능 프레임워크를 통해 사용자가 직접 수행하는 문맥 중심의 번역 수정 사항을 학습하고 향후 번역 과정을 보다 진화된 형태로 수행하는 것이 가능하다.
본 실시예에 있어서, 인공지능 프레임워크는 번역부(10)에서 번역 과정을 통해 원문과 번역문에 대응되는 단어를 자가 학습으로 용어집으로 구축하여 빅데이터 저장부(50)에 추가 저장하고, 각 단어 별로 사용되는 의미와 품사 정보를 빅데이터 저장부(50)의 형태소 사전에 저장한다.
도 2는 본 발명의 일 실시예에 따른 번역 서비스 제공방법의 흐름을 도시한 흐름도이다.
먼저, 번역 요청이 있으면(S200), 번역 요청하는 원문 메시지를 입력받는다(S210).
그리고 입력받은 원문 메시지를 번역하여 번역 메시지를 생성한다(S2020). 이때 번역 메시지를 생성하는 것은 입력된 원문 메시지의 띄어쓰기 구조에 따라 원문 메시지에 포함된 단어의 형태소와 문장구조 및 구문을 분석하고, 원문의 문장 성분을 번역문의 문장성분으로 변환하고, 문장 패턴 사전 및 코퍼스 데이터를 기반으로 번역문을 생성한다.
이 후에 번역 메시지를 원문 메시지 언어로 다시 번역하여 재번역 메시지를 생성 한다(S2030).
그리고 입력받은 원문 메시지와 생성된 번역 메시지, 원문 메시지 언어로 재번역된 재번역 메시지를 동시에 하나의 화면에 표시한다(S2040).
본 발명의 이같은 양상에 따르면 최초 입력된 원문 메시지와, 번역되었다가 다시 원문 메시지의 언어로 재번역된 내용을 동시에 확인함으로써 번역이 제대로 원하는 뜻대로 이루어졌는지를 확인하는 것이 가능하다.
도 3은 본 발명의 일 실시예에 따라 원문 메시지와 번역 메시지, 원문 메시지 언어로 재번역된 재번역 메시지를 동시에 하나의 화면에 표시한 예시도이다.
도 3 에 도시된 바와 같이, 원문 메시지, 번역 메시지, 그리고 재번역 메시지를 하나의 화면에 표시함으로써 사용자는 자신이 의도한 내용대로 번역이 이루어졌는지를 확인하는 것이 가능하다.
그리고 자신이 의도한 내용과 상이하게 해석되거나 오역된 부분이 있으면 자신이 입력한 원문메시지 상에서 다른 단어나 문맥으로 수정함으로써 자신의 생각이 보다 정확하게 전달되도록 할 수 있다.
보다 상세하게, 원문 메시지①를 입력하고, 번역 언어를 설정하면, 설정된 언어로 번역한 번역 메시지②가 출력된다. 그리고 이와 함께 원문 메시지의 언어로 재번역된 재번역 메시지③가 표시된다.
이후에 원문 메시지①, 번역 메시지②, 그리고 재번역 메시③지가 표시된 화면(before)상에서 원문 메시지의 수정 요청이 있으면(S2050), 사용자로부터 원문 메시지 내에서 단어나 문장의 수정사항을 입력받는다.
그리고 입력되는 수정 사항을 분석하고 반영하여 다시 번역을 수행한다(S2060). 즉, 원문 메시지의 수정에 따라 번역 메시지와, 재번역 메시지를 보정 생성한다.
이 후에 보정 생성된 번역 메시지와 재번역 메시지를 동시에 하나의 화면에 표시한다(S2070).
도 3에서 원문메시지①에 기반하여 사용자가 번역 오류에 대한 수정 요청을 하면 수정된 원문 메시지④가 표시된다. 그리고 수정된 원문 메시지에 대한 번역 메시지⑤, 수정된 번역메시지⑤를 원문 메시지의 언어로 재번역한 수정된 재번역 메시지⑥가 하나의 화면(after) 상에 표시된다.
이때, 인공지능/기계학습(AI/ML) 모듈이 최초의 원문 메시지①과 수정된 번역 메시지⑤를 비교하여 분석함으로써, 학습하도록 구현된다.
그리고 번역 메시지를 보정 생성한 이후에, 원문 메시지와 수정 사항을 형태소 단위로 매핑하여 형태소 사전과 문법 사전의 내용을 추가로 더 구축한다.
이때 수정 사항을 분석하는 것은, 원문 메시지와 수정 사항을 형태소 단위로 매핑하여 비교함으로써, 원문 메시지의 어떤 형태소나 구분이 수정 사항으로 입력되었는지 여부를 파악한다. 다의어인 경우에 사용자로부터 수정사항으로 하나의 뜻이 입력되면 해당 정보를 추가 저장할 수 있다.
나아가 번역 메시지와 수정 사항을 형태소 단위로 매핑하여 내용을 형태소 사전과 문법 사전의 내용을 추가 구축할 수도 있다.
즉, 사용자가 입력한 원문 메시지에 의해 번역된 번역 메시지와, 번역 메시지가 출력된 이후에 사용자로부터 입력되는 수정 사항을 형태소 단위로 매핑하여 비교함으로써 수정사항의 분석을 수행할 수 있다.
본 발명의 추가적인 양상에 따라 입력되는 수정 사항을 분석하여 빅데이터로 저장한다(S2080). 이때 번역 메시지를 생성하는 것은 빅데이터로 저장된 내용을 참조하여 번역 메시지를 생성하는 것일 수 있다.
본 발명의 또 다른 양상에 따라, 채팅 어플리케이션 실행 중에 채팅창에 입력되는 메시지들의 번역을 수행할 수 있다(S2500). 일 실시예에 있어서 실행중인 채팅 어플리케이션의 채팅창으로부터 원문 메시지를 입력받는다(S2510).
이때 원문 메시지를 입력받는 것은 채팅 어플리케이션 실행 중 팝업 창을 통해 입력받을 수도 있고, 상대방으로부터 입력된 대화창 상의 대화를 클릭하거나 선택하는 것으로 구현될 수 있다.
그리고 채팅 어플리케이션의 채팅창으로부터 입력받은 원문 메시지를 번역하여 번역 메시지를 생성한다(S2520).
이때 번역 메시지를 원문 메시지 언어로 다시 번역한 재번역 메시지를 생성한다(S2530).
그리고 원문 메시지, 번역 메시지, 재번역 메시지를 하나의 화면에 출력한다(S2540).
일 실시예에 있어서 번역서비스 제공방법은 특정 웹사이트에 접속하거나, 사용자 단말에 설치되고 구동되는 번역 서비스 전용 어플리케이션을 실행시키는 것으로 구현될 수 있다.
채팅 어플리케이션과 연계됨으로써 채팅창에서 다른 언어로 대화를 하는 경우에도 실시간으로 본 실시예에 따른 번역 서비스를 제공할 수 있다. 따라서 채팅중 서로 다른 언어로 대화를 나눌 때에도 번역의 정확도를 보다 높일 수 있는 것이다.
이후에 원문 메시지, 번역 메시지, 그리고 재번역 메시지가 표시된 화면상에서 원문 메시지의 수정 요청이 있으면(S2550), 입력되는 수정 사항을 분석하고 반영하여 다시 번역을 수행한다(S2560). 즉, 원문 메시지의 수정에 따라 번역 메시지와, 재번역 메시지를 보정 생성한다.
이때 원문 메시지를 수정하는 것은 채팅 어플리케이션이 실행되는 중에 팝업 창으로 표시하거나, 본 실시예에 따른 번역 서비스 전용 어플리케이션을 실행시킨상태 화면으로 연결시켜 수행되는 것일 수 있다. 원문 메시지를 수정하기위한 인터페이스를 제공하는 방식은 다양한 변형예들을 포괄하도록 해석된다.
그리고 번역 메시지나 수정에 따른 보정 생성된 번역메시지를 실행중인 채팅 어플리케이션의 채팅창에 입력한다(S2570).
이에 따라 사용자는 실시간으로 채팅창을 통해 번역된 내용을 대화를 할 수 있고, 번역되는 상태를 확인하여 보다 정확하게 자신의 생각이나 의도가 전달되도록 원문 메시지를 수정함으로써 서로 다른 언어를 사용하더라도 실감나는 대화를 할 수 있다.
도 4는 본 발명의 일 실시예에 따라 번역 과정을 보다 상세히 도시한 흐름도이다.
먼저 입력된 원문 메시지의 띄어쓰기 구조에 따라 원문 메시지에 포함된 단어의 형태소와 문장구조 및 구문을 분석한다(S400, S410). 예컨데 사람이 번역한 대량의 양방향 코퍼스(약 100만 문장 이상)를 대상으로 각각의 원문과 번역문에 대한 형태소 분석(명사, 동사, 형용사 등의 품사) 및 구문분석(주어, 서술, 목적어, 보어 등)을 수행할 수 있다.
그리고 형태소 분석 및 구문분석 결과를 기반으로 원문의 문장 성분을 번역문의 문장성분으로 변환하고(S420), 문장 패턴 사전 및 코퍼스 데이터를 기반으로 번역문을 생성한다(S430). 예컨대, 원문 메시지상의 형태소와 번역문 메시지의 형태소 단위로 사전을 참조하여 대역을 연결한다.
이때 대용량으로 구축된 고품질 병렬 코퍼스에 대해서 각 문장 별로 형태소 및 구문분석을 수행하여 구(phrase) 사전과 문장 생성 사전을 더 구축하여 번역시 활용함으로써 정확도를 높이고, 번역 품질을 향상시킬 수 있다.
이 후에 번역문(번역 메시지)이 생성되어 출력되고, 번역문을 원문의 언어로 다시 번역한 재번역 메시지를 생성한다. 그리고 원문 메시지와, 번역문 메시지, 재번역 메시지를 하나의 화면에 출력한다.
그리고 출력된 화면 상에서 원문 메시지에 수정 사항이 입력되면, 입력되는 수정사항을 분석한다(S440). 그리고 분석된 내용에 기반하여 형태소 사전과 문법 사전에 추가 저장한다(S450).
이때 수정 사항을 분석하는 것은, 원문 메시지와 수정 사항을 형태소 단위로 매핑하여 비교함으로써, 원문 메시지의 어떤 형태소나 구분이 수정 사항으로 입력되었는지 여부를 파악한다. 다의어인 경우에 사용자로부터 수정사항으로 하나의 뜻이 입력되면 해당 정보를 추가 저장할 수 있다.
일 예로 원문 메시지에 '동해물과 백두산이 마르고 닳도록'이 입력된 경우에, 이전에 사용자가 '동해물이 마르고, 백두산이 닳도록'으로 수정한 이력을 참조하여 번역을 수행할 수 있다.
나아가 인공지능으로 물이 마르는것(건조한것), 산이 닳는 것(마모되는것)에 대한 각각 문구의 인식을 통해, 해당 문구가 입력될 경우에 기 학습한 내용에 기반하여 번역을 수행함으로써, 변역기능이 진화될 수 있다.
번역 과정을 수행할수록 형태소 사전과 문법 사전의 내용 및 번역에 필요한 분석 내용을 추가로 저장한다.
다른 양상에 따르면 번역 메시지와 수정 사항을 형태소 단위로 매핑하여 내용을 형태소 사전과 문법 사전의 내용을 추가 구축할 수도 있다.
사용자가 입력한 원문 메시지에 의해 번역된 번역 메시지와, 번역 메시지가 출력된 이후에 사용자로부터 입력되는 수정 사항을 형태소 단위로 매핑하여 비교함으로써 수정사항 분석을 수행할 수 있다.
10 : 번역부 20 : 화면 표시부
30 : 수정사항 입력부 40 : 보정부
50 : 빅데이터 저장부

Claims (8)

  1. 번역 요청하는 원문 메시지를 입력받는 단계;
    상기 입력받은 원문 메시지를 번역하여 번역 메시지를 생성하는 단계;
    상기 번역 메시지를 상기 원문 메시지 언어로 재번역하는 단계;
    상기 입력받은 원문 메시지와 상기 생성된 번역 메시지, 상기 원문 메시지 언어로 재번역된 재번역 메시지를 동시에 하나의 화면에 표시하는 단계;
    상기 표시된 화면상에서 상기 원문 메시지의 수정 사항을 입력받는 단계;
    상기 입력되는 수정 사항을 반영하여 상기 번역 메시지와, 재번역 메시지를 보정 생성하는 단계; 및
    상기 보정 생성된 번역 메시지와 재번역 메시지를 동시에 하나의 화면에 표시하는 단계;를 포함하는 것을 특징으로 하는 번역 서비스 제공 방법.
  2. 제 1 항에 있어서,
    상기 입력되는 수정 사항을 반영하여 빅데이터로 저장하는 단계;를 더 포함하고,
    상기 번역 메시지를 생성하는 단계는 상기 빅데이터로 저장된 내용을 참조하여 번역 메시지를 생성하는 것을 특징으로 하는 번역 서비스 제공 방법.
  3. 제 2 항에 있어서,
    상기 번역 메시지를 생성하는 단계는,
    기 구축된 형태소 사전을 기반으로 상기 입력되는 원문 메시지의 형태소를 분석하는 단계,
    기 구축된 문법 사전을 기반으로 구문 분석을 수행하는 단계 및
    상기 분석 결과에 따라 원문 메시지를 번역하여 번역 메시지를 생성하는 단계를 포함하고,
    상기 빅 데이터로 저장하는 단계는,
    상기 원문 메시지와 수정 사항을 형태소 단위로 매핑하여 상기 형태소 사전과 상기 문법 사전의 내용을 추가로 구축하는 것임을 특징으로 하는 자동 번역 방법.
  4. 제 2 항에 있어서,
    번역 메시지를 생성하는 단계는,
    기 구축된 형태소 사전을 기반으로 상기 입력되는 원문 메시지의 형태소를 분석하는 단계,
    기 구축된 문법 사전을 기반으로 구문 분석을 수행하는 단계 및
    상기 분석 결과에 따라 원문 메시지를 번역하여 번역 메시지를 생성하는 단계를 포함하고,
    상기 빅 데이터로 저장하는 단계는,
    상기 번역 메시지와 수정 사항을 형태소 단위로 매핑하여 내용을 상기 형태소 사전과 상기 문법 사전의 내용을 추가 구축하는 것임을 특징으로 하는 자동 번역 방법.
  5. 제 1 항에 있어서,
    상기 원문 메시지를 입력받는 단계는 실행중인 채팅 어플리케이션의 채팅창을 통해 원문 메시지를 입력받고, 상기 방법이,
    상기 보정 생성된 번역 메시지를 실행중인 채팅 어플리케이션의 채팅창에 입력하는 단계;를 더 포함하는 것을 특징으로 하는 번역 서비스 제공 방법.
  6. 번역 요청하는 원문 메시지를 입력받아 상기 원문 메시지를 분석하고, 번역하여 번역 메시지를 생성하고, 상기 생성된 번역 메시지를 상기 원문 메시지 언어로 재번역하는 번역부;
    상기 입력받은 원문 메시지와 상기 번역부에서 생성된 번역 메시지와 상기 재번역된 재번역 메시지를 동시에 하나의 화면에 표시하는 화면 표시부;
    상기 화면 표시부에 표시된 화면상에서 상기 원문 메시지의 수정 사항을 입력받는 수정사항 입력부; 및
    상기 수정사항 입력부로 입력되는 수정 사항을 반영하여 상기 번역 메시지와, 재번역 메시지를 보정 생성하는 보정부;를 포함하고,
    상기 화면 표시부는 상기 보정부에서 보정 생성된 번역 메시지와 상기 재번역 메시지를 동시에 하나의 화면에 표시하는 것을 특징으로 하는 번역 서비스 제공 장치.
  7. 제 6 항에 있어서,
    기 구축된 형태소 사전과 문법 사전을 저장하는 빅데이터 저장부;를 더 포함하고,
    상기 번역부는 상기 빅데이터 저장부에 저장된 형태소 사전과 문법 사전을 기반으로 원문의 형태소와 구문 분석을 수행하고, 상기 분석 결과에 따라 원문 메시지를 번역하여 번역 메시지를 생성하며,
    상기 빅데이터 저장부는 상기 원문 메시지와 수정 사항을 형태소 단위로 매핑하여 상기 형태소 사전과 상기 문법 사전의 내용을 추가로 구축하는 것을 특징으로 하는 번역 서비스 제공 장치.
  8. 제 7 항에 있어서,
    상기 번역부는 번역 요청하는 원문 메시지를 실행중인 채팅 어플리케이션의 채팅창으로부터 입력받고, 상기 번역 메시지 또는 상기 보정 생성된 번역 메시지를 상기 실행중인 채팅 어플리케이션의 채팅창에 표시하는 것을 특징으로 하는 번역 서비스 제공 장치.
KR1020180089921A 2018-08-01 2018-08-01 번역 서비스 제공 장치 및 방법 KR20200017600A (ko)

Priority Applications (2)

Application Number Priority Date Filing Date Title
KR1020180089921A KR20200017600A (ko) 2018-08-01 2018-08-01 번역 서비스 제공 장치 및 방법
KR1020200065331A KR102437008B1 (ko) 2018-08-01 2020-05-29 번역 서비스 제공 장치 및 방법

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020180089921A KR20200017600A (ko) 2018-08-01 2018-08-01 번역 서비스 제공 장치 및 방법

Related Child Applications (1)

Application Number Title Priority Date Filing Date
KR1020200065331A Division KR102437008B1 (ko) 2018-08-01 2020-05-29 번역 서비스 제공 장치 및 방법

Publications (1)

Publication Number Publication Date
KR20200017600A true KR20200017600A (ko) 2020-02-19

Family

ID=69670316

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020180089921A KR20200017600A (ko) 2018-08-01 2018-08-01 번역 서비스 제공 장치 및 방법

Country Status (1)

Country Link
KR (1) KR20200017600A (ko)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR102185090B1 (ko) * 2020-06-16 2020-12-01 (주)켐녹 딥러닝 기반의 번역 모델을 이용한 웹사이트 관리 장치 및 이의 작동 방법
KR102306344B1 (ko) * 2021-03-17 2021-09-28 남지원 삼중말뭉치를 이용한 딥러닝 트랜스포머 번역 시스템
KR20230025228A (ko) * 2021-08-13 2023-02-21 주식회사 애니챗 실시간 다국어 채팅 방법

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR102185090B1 (ko) * 2020-06-16 2020-12-01 (주)켐녹 딥러닝 기반의 번역 모델을 이용한 웹사이트 관리 장치 및 이의 작동 방법
KR102306344B1 (ko) * 2021-03-17 2021-09-28 남지원 삼중말뭉치를 이용한 딥러닝 트랜스포머 번역 시스템
WO2022196956A1 (ko) * 2021-03-17 2022-09-22 주식회사 인사이트베슬 삼중말뭉치를 이용한 딥러닝 트랜스포머 번역 시스템
KR20230025228A (ko) * 2021-08-13 2023-02-21 주식회사 애니챗 실시간 다국어 채팅 방법

Similar Documents

Publication Publication Date Title
Wang et al. Progress in machine translation
US10497366B2 (en) Hybrid learning system for natural language understanding
US11403468B2 (en) Method and apparatus for generating vector representation of text, and related computer device
KR102368519B1 (ko) 기계 학습 작업의 암시적 브리징
US11520992B2 (en) Hybrid learning system for natural language understanding
KR20220027198A (ko) 자연어 이해(nlu) 프레임워크에서 검색 키들 및 검색 공간들의 확장을 위한 아티팩트들의 피닝
US9552354B1 (en) Method and apparatus for cross-lingual communication
US20220092252A1 (en) Method for generating summary, electronic device and storage medium thereof
JPH06325080A (ja) 自動言語間翻訳システム
Way et al. On the Role of Translations in State‐of‐the‐Art Statistical Machine Translation
US11288460B2 (en) Translation support system, etc
KR20220010436A (ko) 다국어 시멘틱 표현 모델의 훈련 방법, 장치, 전자 기기 및 기록 매체
KR20200017600A (ko) 번역 서비스 제공 장치 및 방법
US20220238103A1 (en) Domain-aware vector encoding (dave) system for a natural language understanding (nlu) framework
CN113360751A (zh) 意图识别方法、装置、设备和介质
Sitender et al. A Sanskrit-to-English machine translation using hybridization of direct and rule-based approach
CN113160822A (zh) 语音识别处理方法、装置、电子设备以及存储介质
Mo Design and Implementation of an Interactive English Translation System Based on the Information‐Assisted Processing Function of the Internet of Things
CN110889295B (zh) 机器翻译模型、伪专业平行语料的确定方法、系统及设备
Kang Spoken language to sign language translation system based on HamNoSys
KR102437008B1 (ko) 번역 서비스 제공 장치 및 방법
Mai et al. Deep learning based optical network transmission application in Chinese English translation system in cloud computing environment
JPH0261763A (ja) 機械翻訳装置
JP7268113B2 (ja) 音声認識方法、装置、電子機器及び記憶媒体
US20210312144A1 (en) Translation device, translation method, and program

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
AMND Amendment
E601 Decision to refuse application
AMND Amendment
X601 Decision of rejection after re-examination
J201 Request for trial against refusal decision