KR102118322B1 - 원문과 번역문 파일을 개별적으로 생성하는 문서 번역 서버 및 번역 방법 - Google Patents

원문과 번역문 파일을 개별적으로 생성하는 문서 번역 서버 및 번역 방법 Download PDF

Info

Publication number
KR102118322B1
KR102118322B1 KR1020170111113A KR20170111113A KR102118322B1 KR 102118322 B1 KR102118322 B1 KR 102118322B1 KR 1020170111113 A KR1020170111113 A KR 1020170111113A KR 20170111113 A KR20170111113 A KR 20170111113A KR 102118322 B1 KR102118322 B1 KR 102118322B1
Authority
KR
South Korea
Prior art keywords
translation
translated
file
document
text
Prior art date
Application number
KR1020170111113A
Other languages
English (en)
Other versions
KR20190025188A (ko
Inventor
이청호
Original Assignee
주식회사 에버트란
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 주식회사 에버트란 filed Critical 주식회사 에버트란
Priority to KR1020170111113A priority Critical patent/KR102118322B1/ko
Publication of KR20190025188A publication Critical patent/KR20190025188A/ko
Application granted granted Critical
Publication of KR102118322B1 publication Critical patent/KR102118322B1/ko

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/40Processing or translation of natural language
    • G06F40/42Data-driven translation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/232Orthographic correction, e.g. spell checking or vowelisation

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Machine Translation (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)

Abstract

원문과 번역문 파일을 개별적으로 생성하는 문서 번역 서버 및 방법을 개시한다. 번역서버는 번역해야 할 문서파일에 포함된 객체를 추출하고, 상기 추출된 객체에서 번역 해야 할 텍스트인 번역 단위 리스트를 수집하는 텍스트수집모듈; 수집된 번역단위 리스트를 차례대로 정렬시키고, 기계번역 또는 번역 메모리로부터 번역단위 리스트에 대한 번역문을 전달 받거나, 사용자에 의한 번역문을 입력 받아 저장하는 번역작업모듈; 원문과 번역문을 비교하기 위해 번역작업모듈에 저장되는 번역문과 번역단위 리스트를 모두 포함한 병합파일을 생성하는 원문/번역문 병합파일 생성모듈; 및 병합파일에 번역단위 리스트에 대한 번역문 입력이 완료되는 경우, 번역작업이 완료된 병합파일에서 번역문을 추출하여 번역해야 할 문서파일에 대한 번역문 파일을 생성하는 번역문 파일 생성모듈; 을 포함한다.

Description

원문과 번역문 파일을 개별적으로 생성하는 문서 번역 서버 및 번역 방법{DOCUMENT TRANSLATION SERVER AND TRANSLATION METHOD FOR GENERATING ORIGINAL AND TRANSLATION FILES INDIVIDUALLY}
문서번역 서버 및 번역 방법에 관한 것으로 구체적으로 원문과 번역문 파일을 개별적으로 생성하는 문서 번역서버 및 방법에 관한 것이다.
본 명세서에서 달리 표시되지 않는 한, 이 섹션에 설명되는 내용들은 이 출원의 청구항들에 대한 종래 기술이 아니며, 이 섹션에 포함된다고 하여 종래 기술이라고 인정되는 것은 아니다.
번역지원프로그램(Computer Aided Translation: CAT) 소프트웨어는 전세계에 10여종이 개발되어 판매되고 있는 상용 소프트웨어이다. 번역지원프로그램은 번역업무를 수행하고자 하는 사용자가 이를 활용함으로써, 번역 업무의 효율성을 증대시키고, 번역메모리 기술을 이용하여 한번 번역했던 문장을 별도로 저장하여 재활용을 가능케 하는 소프트웨어이다. 번역지원프로그램에 있어서 가장 중요한 기술 중 하나는 원문과 번역문을 쌍으로 하나의 문서 파일 내에 저장하는 기술이다.
마이크로소프트 오피스 프로그램의 파워포인트 문서는 슬라이드 단위로 글 상자와 도형, 차트 등 다양한 오브젝트에 텍스트를 입력하여 문서를 작성한다.
이 문서를 번역하려면 원문 파일의 글 상자, 도형, 차트 등을 마우스로 선택하여, 이 내부에 들어 있는 텍스트를 지정하고, 해당 텍스트를 번역하는 절차로 번역 작업이 수행된다. 따라서 번역을 하게 되면 원문 문서 파일과 번역문 문서 파일이 항상 서로 다른 문서 파일로 2개가 존재하게 된다. 이처럼 원문과 번역문 파일이 다르게 되면, 번역을 수행할 때 2개의 파일을 열어 놓고 작업을 해야 함에 따라서 번역업무의 효율성이 매우 떨어진다.
특히, 마이크로소프트 오피스 프로그램의 엑셀 문서는 셀 단위로 텍스트를 입력하거나 도형을 그려 도형 내에 텍스트를 입력하여 문서를 작성한다. 이 또한 앞서 설명한 대로 각 셀의 원문 텍스트를 번역하게 되면 원문의 내용이 없어지기 때문에, 원문 문서 파일과 번역문 문서 파일이 항상 서로 다른 문서 파일로 2개가 존재하게 되어 번역업무의 효율성이 매우 떨어진다.
또한 번역문은 원문 개체의 텍스트 영역에 들어가게 되어 원문의 텍스트는 해당 개체에서 번역문으로 대체되기 때문에 원문 텍스트에 대한 정보가 사라져 작업 후 원문을 복원해야 하는 문제가 발생한다.
1. 한국 등록특허 제10-1769981 (2017.08.14) 2. 한국 등록특허 제10-1751942 (2017.06.22)
본 개시는 마이크로소프트의 오피스 프로그램인 파워포인트와 엑셀에 플러그인 되어 파워포인트나 엑셀의 원문 문서 파일에서 텍스트 상자, 각종 도형, 차트 등을 포함하는 객체(Object)를 추출하고, 객체에서 번역을 해야 할 텍스트 정보를 수집하여 번역단위(Translation Unit: TU) 리스트로 정리한다. 이후, 번역단위리스트를 번역한 번역문과 원문파일이 모두 포함된 병합파일을 생성하고, 번역 완료 이후 병합 파일에서 번역문만을 추출하여 원문파일에 대응하는 번역문 파일을 생성하는 문서 번역 서버 및 번역 방법을 제공한다.
실시예에 따른 원문과 번역문 파일을 개별적으로 생성하는 문서 번역 서버는 번역해야 할 문서파일에 포함된 객체를 추출하고, 추출된 객체에서 번역 해야 할 텍스트인 번역 단위 리스트를 수집하는 텍스트수집모듈; 수집된 번역단위 리스트를 차례대로 정렬시키고, 기계번역 또는 번역 메모리로부터 번역단위 리스트에 대한 번역문을 전달 받거나, 사용자에 의한 번역문을 입력 받아 저장하는 번역작업모듈; 원문과 번역문을 비교하기 위해 번역작업모듈에 저장되는 번역문과 번역단위 리스트를 모두 포함한 병합파일을 생성하는 원문/번역문 병합파일 생성모듈; 및 병합파일에 번역단위 리스트에 대한 번역문 입력이 완료되는 경우, 번역작업이 완료된 상기 병합파일에서 번역문을 추출하여 상기 번역해야 할 문서파일에 대한 번역문 파일을 생성하는 번역문 파일 생성모듈; 을 포함한다.
다른 실시예에 따른 원문과 번역문 파일을 개별적으로 생성하는 문서 번역 서버에서의 번역방법은 (A) 텍스트 수집모듈에서 번역해야 할 문서파일에 포함된 객체를 추출하고, 추출된 객체에서 번역 해야 할 텍스트인 번역 단위 리스트를 수집하는 단계; (B) 번역작업모듈에서 수집된 번역단위 리스트를 차례대로 정렬시키고, 기계번역 또는 번역 메모리로부터 번역단위 리스트의 번역문을 전달 받거나, 사용자에 의해 번역문을 입력 받아 저장하는 단계; (C) 병합파일 생성모듈에서 원문과 번역문을 비교하기 위해 번역작업모듈에 저장되는 번역문과 상기 번역단위 리스트를 모두 포함한 병합파일을 생성하는 단계; 및 (D) 번역문파일 생성모듈에서 병합파일에 번역단위 리스트에 대한 번역문 입력이 완료되는 경우, 병합파일에서 번역문만을 추출하여 번역해야 할 문서파일의 번역문 파일을 생성하는 단계; 를 포함한다.
본 개시는 마이크로소프트의 오피스 프로그램 중 파워포인트와 엑셀 문서를 번역함에 있어서 파워포인트와 엑셀 파일에 원문과 번역문을 동시에 저장하여, 번역업무의 효율성을 향상시킨다.
또한 오피스 파일 내에 원문과 번역문을 동시에 저장함으로써, 종래 번역을 수행하면 원문이 사라져 번역 후 원문과 대조할 경우에 원문 오피스 파일(워드, 엑셀, 파워포인트)을 다시 열고 해당 위치로 이동하는 불편함을 없앨 수 있다.
또한 본 개시에 따른 번역 방법을 번역하는 경우 생성되는 프로젝트 파일(VT_원문파일명, 워드, 엑셀, 파워포인트)에는 원문과 번역문이 함께 저장되어 있어서, 번역이 완료된 이후에 번역문을 수정할 경우, 프로젝트 파일만을 열어서 번역문을 수정할 수 있어 매우 편리하다.
본 발명의 효과는 상기한 효과로 한정되는 것은 아니며, 본 발명의 상세한 설명 또는 특허청구범위에 기재된 발명의 구성으로부터 추론 가능한 모든 효과를 포함하는 것으로 이해되어야 한다.
도 1은 실시예에 따른 원문과 번역문 파일을 개별적으로 생성하는 문서 번역 서버의 대략적인 구성을 나타내는 블록도
도 2는 실시예에 따른 번역 서버의 보다 구체적인 구성을 나타낸 블록도
도 3a 내지 도 3e는 원문과 번역문 파일을 개별적으로 생성하는 문서 번역 프로그램의 디스플레이 실시예를 나타내는 도면
도 3b는 번역 단위 리스트를 생성하는 디스플레이 실시예를 나타내는 도면
도 3c는 번역 작업 디스플레이 실시예를 나타낸 도면
도 3d 및 도 3e는 다른 번역엔진과 연결되는 기능 및 번역용어를 등록하는 기능에 대한 디스플레이 실시예
도 4는 실시예에 따른 원문과 번역문 파일을 개별적으로 생성하는 번역 방법에서의 데이터 처리과정을 나타낸 도면
도 5a 및 도 5b는 실시예에 따른 번역 프로그램에서 번역문 검토 기능을 제공하는 디스플레이 예
도 5c는 번역문 파일 생성기능을 제공하기 위한 디스플레이 실시예
도 5d는 원문과 번역문이 병합된 디스플레이 실시예를 나타낸 도면
본 발명의 이점 및 특징, 그리고 그것들을 달성하는 방법은 첨부되는 도면과 함께 상세하게 후술되어 있는 실시 예들을 참조하면 명확해질 것이다. 그러나 본 발명은 이하에서 개시되는 실시 예들에 한정되는 것이 아니라 서로 다른 다양한 형태로 구현될 수 있으며, 단지 본 실시 예들은 본 발명의 개시가 완전하도록 하고, 본 발명이 속하는 기술분야에서 통상의 지식을 가진 자에게 발명의 범주를 완전하게 알려주기 위해 제공되는 것이며, 본 발명은 청구항의 범주에 의해 정의될 뿐이다. 명세서 전체에 걸쳐 동일 도면부호는 동일 구성 요소를 지칭한다.
본 발명의 실시 예들을 설명함에 있어서 공지 기능 또는 구성에 대한 구체적인 설명이 본 발명의 요지를 불필요하게 흐릴 수 있다고 판단되는 경우에는 그 상세한 설명을 생략할 것이다. 그리고 후술되는 용어들은 본 발명의 실시 예에서의 기능을 고려하여 정의된 용어들로서 이는 사용자, 운용자의 의도 또는 관례 등에 따라 달라질 수 있다. 그러므로 그 정의는 본 명세서 전반에 걸친 내용을 토대로 내려져야 할 것이다.
도 1은 실시예에 따른 원문과 번역문 파일을 개별적으로 생성하는 문서 번역 서버의 대략적인 구성을 나타내는 블록도이다.
도 1을 참조하면, 번역서버는 텍스트 수집모듈(110), 번역 작업모듈(130), 원문/번역문 병합파일 생성모듈(150) 및 번역문 파일 생성모듈을 포함하여 구성될 수 있다. 본 명세서에서 사용되는 '모듈' 이라는 용어는 용어가 사용된 문맥에 따라서, 소프트웨어, 하드웨어 또는 그 조합을 포함할 수 있는 것으로 해석되어야 한다. 예를 들어, 소프트웨어는 기계어, 펌웨어(firmware), 임베디드코드(embedded code), 및 애플리케이션 소프트웨어일 수 있다. 또 다른 예로, 하드웨어는 회로, 프로세서, 컴퓨터, 집적 회로, 집적 회로 코어, 센서, 멤스(MEMS; Micro-Electro-Mechanical System), 수동 디바이스, 또는 그 조합일 수 있다.
텍스트 수집모듈(110)은 번역해야 할 문서파일에 포함된 객체를 추출하고, 추출된 객체에서 번역 해야 할 텍스트인 번역 단위(Translate Unit) 리스트를 수집한다. 실시예에서 문서파일은 마이크로오피스의 파워포인트, 엑셀과 같이 말 풍선, 각종 도형, 차트 등의 객체(Object) 생성이 가능한 문서파일을 포함한다.
번역작업모듈(130)은 수집된 번역단위 리스트를 차례대로 정렬시키고, 기계번역 또는 번역 메모리로부터 번역단위 리스트에 대한 번역문을 전달 받거나, 사용자에 의한 번역문을 입력 받아 저장하는 저장한다.
병합파일 생성모듈(150)은 원문과 번역문을 비교하며 번역작업을 수행하도록 하기 위해 번역작업모듈(130)에 저장되는 번역문과 번역단위 리스트를 모두 포함한 병합파일을 생성한다.
번역문 파일 생성모듈(170)은 병합파일에 번역단위 리스트에 대한 번역문 입력이 완료되는 경우, 번역작업이 완료된 상기 병합파일에서 번역문만을 추출하여 번역해야 할 문서파일에 대한 번역문 파일을 생성한다.
도 2는 실시예에 따른 번역 서버의 보다 구체적인 구성을 나타낸 블록도이다.
도 2를 참조하면, 텍스트 수집모듈(110)은 객체 추출부(111) 및 번역단위 리스트 생성부(113)을 포함하여 구성될 수 있고 번역작업모듈(130)은 번역엔진 연결부(131) 및 번역부(133)을 포함하여 구성될 수 있고, 원문/번역문 병합파일 생성모듈(150)은 원문 디스플레이부(151), 원문 분석부(152), 번역문 디스플레이부(153), 번역문 분석부(154), 연산부(155) 및 검토부(156)을 포함하여 구성될 수 있고, 번역문 파일 생성모듈(170)은 위치산출부(171) 및 비교부(173)을 포함하여 구성될 수 있다.
텍스트 추출모듈의 객체 추출부(111)는 번역을 해야 하는 파워포인트, 액셀 등의 문서에서 텍스트가 포함될 수 있는 말풍선, 도형, 텍스트 상자 등의 객체를 추출한다. 이후 번역 단위 리스트 생성부(113)은 추출된 객체 정보를 전달 받아 상기 객체에 포함된 텍스트를 수집하여 번역 단위 리스트를 생성한다.
번역 작업 모듈(130)의 번역엔진 연결부(131)는 번역단위 리스트가 자동으로 기계 번역되도록 번역 엔진과 연결한다. 실시예에서 연결되는 번역엔진은 구글번역기, 파파고 등 공개된 번역 엔진뿐만 아니라, 유료 번역 엔진과도 연결되어 번역 단위 리스트를 자동으로 번역할 수 있다. 아울러, 번역부(133)은 사용자로부터 번역단위 리스트에 대한 번역문을 입력 받을 수 있다. 실시예에 있어서 번역부(133)는 번역 단위리스트의 번역문이 입력되면, 원문과 번역문을 함께 보며 번역 작업을 수행할 수 있는 병합파일의 생성 여부를 사용자로부터 확인한다. 사용자가 병합파일을 생성하는 경우, 원문/번역문 병합파일 생성모듈(150)은 병합파일을 생성한다.
이를 위해, 원문/번역문 병합파일 생성모듈(150)의 원문 디스플레이부(151)는 수집된 번역 단위 리스트를 일련번호로 나열한다. 또한, 원문 디스플레이부(151)는 번역 해야 하는 문서에 포함된 객체의 위치화 크기를 그대로 유지하며 번역 단위 리스트를 나열할 수 있다.
원문 분석부(152)는 원문에 포함된 메모, 반복문장, 동일문장, 유사문장을 파악하고, 나열된 번역 단위리스트의 단어 및 문장구조를 분석한다.
번역문 디스플레이부(153)는 번역단위 리스트에 대한 번역문을 입력 받고, 자동번역, 번역 안함을 포함하는 번역단위 리스트의 번역작업정보를 디스플레이한다. 아울러, 번역문 디스플레이부(153)는 원문 바로 아래에 번역문이 디스플레이 되도록 할 수 있다. 또한, 번역 단위리스트의 아래 또는 측면에 번역문이 디스플레이 되도록 동작할 수 있다.
번역문 분석부(154)는 사용자에 의한 번역 또는 기계번역에 의한 번역문의 어휘, 문장구조, 문체, 통일성 등을 분석한다. 실시예에서 번역문 분석부(154)는 언어 함의 인식 알고리즘을 이용해 어휘나 문장구조를 분석할 수 있고, 원문이 동일한 경우 동일한 어휘로 번역되었는지 파악하여 번역문의 통일성을 판단할 수 있다.
또한 번역문 분석부(154)는 병합파일에서 번역하고자 하는 번역단위 리스트로 이동할 때, 미리 번역했던 리스트를 번역메모리로 저장해 놓은 경우, 번역 해야 할 문장인 번역단위리스트의 유사도에 따라서 저장된 번역문을 표시하고, 상기 번역단위리스트와 관련된 용어를 표시할 수 있다.
연산부(155)는 번역 단위 리스트의 전체 수 및 번역이 완료된 리스트 수를 파악하여 번역작업 진행률을 산출한다. 또한, 연산부(155)는 병합파일의 전체 워드 수 및 번역이 완료된 워드 수를 파악하여 번역작업 진행률을 산출할 수 있다.
검토부(156)는 번역완료 이후, 번역단위리스트와 번역문을 비교하여 번역문 전체의 통일성을 검증하고, 동일한 번역단위리스트가 번역문에 등록된 용어로 번역되어 있지 않은 검토단어를 추출하여 볼드 및 색깔로 디스플레이한다. 또한, 검토부(156)는 번역 작업 완료 이후 번역문의 오역을 검토하고, 번역문의 띄어쓰기, 맞춤법, 스펠링을 포함하는 언어별 문법검사를 수행한다.
번역문 파일 생성모듈(170)의 위치 산출부(171)는 병합파일에서 번역문만을 추출하고 원문 파일객체의 위치 정보에 대응하는 위치로 번역문이 디스플레이 되도록 번역문이 문서 안에 포함될 위치를 산출한다. 예컨대, 위치 산출부(171)는 번역문의 위치가 원문의 위치에서 일정수준이상 벗어나지 않도록 번역 완료된 텍스트의 길이, 자간 행간을 고려하여 번역문이 디스플레이 될 위치를 산출한다.
비교부(173)는 번역문이 문서에 모두 디스플레이 되면, 원문과 번역문의 텍스트 위치를 비교한다. 비교부(173) 는 번역문을 포함한 객체가 원문의 위치에서 일정 범위이상 벗어나지 않도록 번역문이 포함된 객체의 크기와 위치를 조정할 수 있다.
도 3a 내지 도 3e는 원문과 번역문 파일을 개별적으로 생성하는 문서 번역 프로그램의 디스플레이 실시예를 나타내는 도면이다.
도 3a는 마이크로소프트 오피스프로그램에서 플러그인 된 번역 프로그램의 디스플레이 실시예이다.
도 3a 에 도시된 바와 같이, 실시예에 따른 번역 프로그램인 비주얼 트란메이트 프로그램은 마이크로 소프트사의 오피스에 플러그인 된 비주얼 트란(VisualTran) 리본 메뉴에서 VisualTran Mate 실행 버튼을 클릭하면 우측에는 비주얼트란메이트 프로그램의 화면이 디스플레이 된다.
도 3b는 번역 단위 리스트를 생성하는 디스플레이 실시예를 나타내는 도면이다.
도 3b에 도시된 바와 같이, 도 3b의 우측에 위치한 번역 단위 리스트는 문서 전체의 번역리스트를 일련 번호로 나열하고 문서 내에서의 메모, 반복문장, 100% 일치문장, 유사문장, (기계)자동번역, 번역안함 등 총 6가지로 상태를 표시해 주는 작업 창이다. 또한 하단에는 전체 워드 수/문자 수 중에서 진행율을 표시해 주는 막대 그래프를 디스플레이 한다. 번역할 오피스 문서(워드, 엑셀, 파워포인트)에서 객체에 포함된 텍스트를 번역 단위로 추출하여 리스트로 정렬시켜 준 것을 TU리스트라고 한다. TU리스트에서 TU를 이동하면 좌측에 오피스 문서에서 해당 위치로 바로 이동할 수 있다. TU리스트에는 해당 TU에 주석을 넣거나 상태 변경 기능을 이용하여 TU의 상태를 바꿀 수 있어, 번역 중 발생하는 문제를 번역이 완료된 상태에서 점검할 수 있도록 한다.
도 3c는 번역 작업 디스플레이 실시예를 나타낸 도면이다.
도 3c에 도시된 바와 같이, 오피스 문서에서 번역할 내용이 TU 리스트에 표시되고 난 후에 엔터키를 클릭하면 해당 문장을 번역하기 위한 번역팔레트로 이동한다. 도 3c는 번역팔레트로서, 번역문을 직접 입력하거나 기계번역 또는 번역메모리 검색 등을 수행하여 번역문란에 번역문을 입력한다. 번역팔레트에는 번역하고자 하는 문장으로 이동 시에 이전에 번역했던 문장을 번역메모리로 저장해 놓은 경우에는 유사도에 따라서 번역메모리를 표시해 주고, 해당 문장과 관련된 용어를 표시할 수 있다.
도 3d 및 도 3e는 다른 번역엔진과 연결되는 기능 및 번역용어를 등록하는 기능에 대한 디스플레이 실시예이다.
도 3d 및 도 3e에 도시된 바와 같이, 기계번역탭에는 필요한 경우 구글 및 파파고 기계번역 결과를 표시하여 번역에 이용할 수 있도록 한다. 또한 번역용어의 등록을 손쉽게 하여, 문서 내에서 용어의 번역에 통일성을 기할 수 있도록 한다. 번역문에 등록된 용어로 번역이 되어 있지 않다면 해당 용어를 빨간색으로 표시해 주어서 번역하는 사람이 용어에 일관성을 유지할 수 있도록 한다.
이하에서는 실시예에 따른 원문과 번역문 파일을 개별적으로 생성하는 문서 번역 방법에 대해서 차례로 설명한다. 번역 방법의 작용(기능)은 번역 서버의 기능과 본질적으로 같은 것이므로 도 1 내지 도 3e와 중복되는 설명은 생략하도록 한다.
도 4는 실시예에 따른 원문과 번역문 파일을 개별적으로 생성하는 번역 방법에서의 데이터 처리과정을 나타낸 도면이다.
S10 단계에서는 텍스트 수집모듈에서 번역해야 할 문서파일에 포함된 객체를 추출하고, 추출된 객체에서 번역 해야 할 텍스트인 번역 단위 리스트를 수집한다.
S20 단계에서는 번역작업모듈에서 수집된 번역단위 리스트를 차례대로 정렬시키고, 기계번역 또는 번역 메모리로부터 번역단위 리스트의 번역문을 전달 받거나, 사용자에 의해 번역문을 입력 받아 저장한다. 실시예에 따른 S20 단계는 수집된 번역 단위 리스트를 일련번호로 나열하고 원문에 포함된 메모, 반복문장, 동일문장, 유사문장을 파악하여 원문을 분석하는 단계; 및 번역단위 리스트에 대한 번역문을 입력 받고, 자동번역, 번역안함을 포함하는 번역단위 리스트의 번역작업정보를 디스플레이하는 단계; 를 포함할 수 있다.
실시예에 따른 S20 단계에서는 번역하고자 하는 번역단위 리스트로 이동할 때, 미리 번역했던 리스트를 번역메모리로 저장해 놓은 경우, 번역 해야 할 문장인 번역단위리스트의 유사도에 따라서 저장된 번역문을 표시하고, 상기 번역단위리스트와 관련된 용어를 표시할 수 있다.
S30 단계에서는 병합파일 생성모듈에서 원문과 번역문을 비교하기 위해 번역작업모듈에 저장되는 번역문과 번역단위 리스트를 모두 포함한 병합파일을 생성한다. S30 단계에서는 번역 단위 리스트의 전체 수 및 번역이 완료된 리스트 수를 파악하여 번역작업 진행률을 산출할 수 있다. 이때, 진행률은 병합파일의 전체 워드 수 및 번역이 완료된 워드 수를 파악하여 산출될 수 있다.
또한, S30 단계에서는 번역완료 이후, 번역단위리스트와 번역문을 비교하여 번역문 전체의 통일성을 검증하고, 동일한 번역단위리스트가 번역문에 등록된 용어로 번역되어 있지 않은 검토단어를 추출하여 볼드 및 색깔로 디스플레이한다.
이후, S30 단계에서는 번역 작업 완료 이후 번역문의 오역을 검토하고, 번역문의 띄어쓰기, 맞춤법, 스펠링을 포함하는 문법검사를 수행한다.
S40 단계에서는 번역문파일 생성모듈에서 병합파일에 번역단위 리스트에 대한 번역문 입력이 완료되는 경우, 병합파일에서 번역문만을 추출하여 번역해야 할 문서파일의 번역문 파일을 생성한다.
도 5a 내지 도 5d는 번역문 검토 및 번역문 파일을 생성하는 기능의 디스플레이 실시예를 나타낸 도면이다.
도 5a 및 도 5b는 실시예에 따른 번역 프로그램에서 번역문 검토 기능을 제공하는 디스플레이 예이다.
도 5a 및 도 5b에 도시된 바와 같이, 번역 기능에 있어서 주요한 기능 중에 하나는 번역이 완료된 이후에 번역문을 전체를 검증, 검토하는 기능이다. 번역을 완료한 이후에 번역에 오류가 있는지를 확인하는 작업은 번역의 품질 향상에 매우 중요한 요소인 만큼 실시예에 따른 비주얼트란은 번역이 완료된 이후에 번역문에 대한 검증을 위하여 다음과 같이 9가지의 기능을 제공한다. 특히, 오류가 있는 번역문에 대해서 우측에 점검 항목별로 해당 오류가 있는 TU를 표시해 주고, 해당 TU로 이동하여 해당 오류를 팔레트를 통해서 손쉽게 수정할 수 있도록 한다.
도 5c는 번역문 파일 생성기능을 제공하기 위한 디스플레이 실시예이다.
도 5c에 도시된 바와 같이, 실시예에서는 번역이 완료되면 최종으로 번역문 파일을 생성하게 하는데, 이 기능이 파일-TR파일 저장기능이다. 파일-TR파일 저장기능은 비주얼트란으로 모든 번역 작업을 종료 한 후에 최종 번역 결과 문서를 생성하는 [문서 클린업] 기능이다. 실시예에서는 모든 원문 TU를 제거하고 번역문만 남는 일반문서 파일로 생성시킨다. 이때 최종 번역 결과 문서명 앞에는 “TR_”라는 접두어가 문서명에 붙어서 지정한 위치에 문서가 생성된다. 그리고 [원문 제거하지 않음] 기능은 원문 바로 밑의 번역문을 같이 병기 표시해 줌으로써 문장 단위로 원문과 번역문을 쉽게 확인할 수 있도록 표시할 수 있다. 상기 기능을 체크하게 되면 [원문 색상]을 지정한 새로운 병기 표시용 문서가 생성되어 원문을 쉽게 구분할 수 있도록 지정 색상으로 표시해 준다. 이때 생성되는 문서명 앞에는 "TS_" 라는 접두어가 문서명에 붙어서 지정한 위치에 문서가 생성된다.
도 5d는 원문과 번역문이 병합된 디스플레이 실시예를 나타낸 도면이다.
도 5d에는 원문과 번역문의 텍스트만이 병합된 디스플레이 실시예를 나타내지만, 본 개시에서는 객체이미지 내에서도 원문과 번역문의 텍스트 파일을 병합하여 디스플레이 할 수 있도록 한다.
실시예에 따른 문서 번역 서버 및 방법은 마이크로소프트의 오피스 프로그램 중 파워포인트와 엑셀 문서를 번역함에 있어서 파워포인트와 엑셀 파일에 원문과 번역문을 동시에 저장하여, 번역업무의 효율성을 향상시킨다. 또한 오피스 파일 내에 원문과 번역문을 동시에 저장함으로써, 종래 번역을 수행하면 원문이 사라져 번역 후 원문과 대조할 경우에 원문 오피스 파일(워드, 엑셀, 파워포인트)을 다시 열고 해당 위치로 이동하는 불편함을 없앨 수 있다. 또한 본 개시에 따른 번역 방법을 번역하는 경우 생성되는 프로젝트 파일(VT_원문파일명, 워드, 엑셀, 파워포인트)에는 원문과 번역문이 함께 저장되어 있어서, 번역이 완료된 이후에 번역문을 수정할 경우, 프로젝트 파일만을 열어서 번역문을 수정할 수 있어 매우 편리하다.
개시된 내용은 예시에 불과하며, 특허청구범위에서 청구하는 청구의 요지를 벗어나지 않고 당해 기술분야에서 통상의 지식을 가진 자에 의하여 다양하게 변경 실시될 수 있으므로, 개시된 내용의 보호범위는 상술한 특정의 실시예에 한정되지 않는다.
110: 텍스트 수집모듈
130: 번역 작업모듈
150: 원문/번역문 병합파일 생성모듈
170: 번역문 파일 생성모듈

Claims (14)

  1. 원문과 번역문 파일을 개별적으로 생성하는 문서 번역 서버에 있어서,
    번역해야 할 문서파일에 포함된 객체를 추출하고, 상기 추출된 객체에서 번역 해야 할 텍스트인 번역 단위 리스트를 수집하는 텍스트수집모듈;
    상기 수집된 번역단위 리스트를 차례대로 정렬시키고, 기계번역 또는 번역 메모리로부터 상기 번역단위 리스트에 대한 번역문을 전달 받거나, 사용자에 의한 번역문을 입력 받아 저장하는 번역작업모듈;
    원문과 번역문을 비교하기 위해 상기 번역작업모듈에 저장되는 번역문과 상기 번역단위 리스트를 모두 포함한 병합파일을 생성하는 원문/번역문 병합파일 생성모듈; 및
    상기 병합파일에 번역단위 리스트에 대한 번역문 입력이 완료되는 경우, 번역작업이 완료된 상기 병합파일에서 번역문을 추출하여 상기 번역해야 할 문서파일에 대한 번역문 파일을 생성하는 번역문 파일 생성모듈; 을 포함하고,
    상기 병합파일 생성모듈은
    상기 수집된 번역 단위 리스트를 일련번호로 나열하는 원문디스플레이부;
    원문에 포함된 메모, 반복문장, 동일문장, 유사문장을 파악하는 원문 분석부; 및
    번역단위 리스트에 대한 번역문을 입력 받고, '자동번역', '번역안함'을 포함하는 번역단위 리스트의 번역작업정보를 디스플레이하는 번역문 디스플레이부; 를 포함하는 문서번역서버.
  2. 삭제
  3. 제 1항에 있어서, 상기 병합파일 생성모듈은
    상기 번역 단위 리스트의 전체 수 및 번역이 완료된 리스트 수를 파악하여 번역작업 진행률을 산출하는 연산부;를 더 포함하는 것을 특징으로 하는 문서번역서버.
  4. 제 3항에 있어서, 상기 연산부; 는
    상기 병합파일의 전체 워드 수 및 번역이 완료된 워드 수를 파악하여 번역작업 진행률을 산출하는 것을 특징으로 하는 문서번역서버.
  5. 제 1항에 있어서, 상기 병합파일생성모듈; 은
    번역완료 이후, 번역단위리스트와 번역문을 비교하여 상기 번역문 전체의 통일성을 검증하고, 동일한 번역단위리스트가 번역문에 등록된 용어로 번역되어 있지 않은 검토단어를 추출하여 볼드 및 색깔로 디스플레이하는 검토부; 를 더 포함하는 것을 특징으로 하는 문서번역서버.
  6. 제 1항 또는 제 5항에 있어서, 상기 병합파일생성모듈; 은
    상기 병합파일에서 번역하고자 하는 번역단위 리스트로 이동할 때, 미리 번역했던 리스트를 번역메모리로 저장해 놓은 경우, 번역 해야 할 문장인 번역단위리스트의 유사도에 따라서 저장된 번역문을 표시하고, 상기 번역단위리스트와 관련된 용어를 표시하는 번역문 분석부; 를 더 포함하는 것을 특징으로 하는 문서번역서버.
  7. 제 5항에 있어서, 상기 검토부는
    번역 작업 완료 이후 번역문의 오역을 검토하고, 번역문의 띄어쓰기, 맞춤법, 스펠링을 포함하는 문법검사를 수행하는 것을 특징으로 하는 문서번역서버.
  8. 원문과 번역문 파일을 개별적으로 생성하는 문서 번역 서버에서의 번역방법에 있어서,
    (A) 텍스트 수집모듈에서 번역해야 할 문서파일에 포함된 객체를 추출하고, 상기 추출된 객체에서 번역 해야 할 텍스트인 번역 단위 리스트를 수집하는 단계;
    (B) 번역작업모듈에서 상기 수집된 번역단위 리스트를 차례대로 정렬시키고, 기계번역 또는 번역 메모리로부터 상기 번역단위 리스트의 번역문을 전달 받거나, 사용자에 의해 번역문을 입력 받아 저장하는 단계;
    (C) 병합파일 생성모듈에서 원문과 번역문을 비교하기 위해 상기 번역작업모듈에 저장되는 번역문과 상기 번역단위 리스트를 모두 포함한 병합파일을 생성하는 단계; 및
    (D) 번역문파일 생성모듈에서 상기 병합파일에 번역단위 리스트에 대한 번역문 입력이 완료되는 경우, 상기 병합파일에서 번역문만을 추출하여 상기 번역해야 할 문서파일의 번역문 파일을 생성하는 단계; 를 포함하고,
    상기 (B) 번역문을 입력 받아 저장하는 단계; 는
    상기 수집된 번역 단위 리스트를 일련번호로 나열하는 단계;
    원문에 포함된 메모, 반복문장, 동일문장, 유사문장을 파악하여 원문을 분석하는 단계; 및
    번역단위 리스트에 대한 번역문을 입력 받고, 자동번역, 번역안함을 포함하는 번역단위 리스트의 번역작업정보를 디스플레이하는 단계; 를 포함하는 문서번역방법.
  9. 삭제
  10. 제 8항에 있어서, 상기 (C) 번역단위 리스트를 모두 포함한 병합파일을 생성하는 단계; 는
    상기 번역 단위 리스트의 전체 수 및 번역이 완료된 리스트 수를 파악하여 번역작업 진행률을 산출하는 단계; 를 포함하는 것을 특징으로 하는 문서번역방법.
  11. 제 10항에 있어서, 상기 번역작업 진행률을 산출하는 단계; 는
    상기 병합파일의 전체 워드 수 및 번역이 완료된 워드 수를 파악하여 번역작업 진행률을 산출하는 것을 특징으로 하는 문서번역방법.
  12. 제 8항에 있어서, 상기 (C) 번역단위 리스트를 모두 포함한 병합파일을 생성하는 단계; 는
    번역완료 이후, 번역단위리스트와 번역문을 비교하여 상기 번역문 전체의 통일성을 검증하고, 동일한 번역단위리스트가 번역문에 등록된 용어로 번역되어 있지 않은 검토단어를 추출하여 볼드 및 색깔로 디스플레이하는 단계; 를 포함하는 것을 특징으로 하는 문서번역방법.
  13. 제 8항에 있어서, 상기 (B) 번역문을 입력 받아 저장하는 단계; 는
    번역하고자 하는 번역단위 리스트로 이동할 때, 미리 번역했던 리스트를 번역메모리로 저장해 놓은 경우, 번역 해야 할 문장인 번역단위리스트의 유사도에 따라서 저장된 번역문을 표시하고, 상기 번역단위리스트와 관련된 용어를 표시하는 단계; 를 더 포함하는 것을 특징으로 하는 문서번역방법.
  14. 제 12항에 있어서, 상기 (C) 번역단위 리스트를 모두 포함한 병합파일을 생성하는 단계; 는
    번역 작업 완료 이후 번역문의 오역을 검토하고, 번역문의 띄어쓰기, 맞춤법, 스펠링을 포함하는 문법검사를 수행하는 단계;를 포함하는 것을 특징으로 하는 문서번역방법.
KR1020170111113A 2017-08-31 2017-08-31 원문과 번역문 파일을 개별적으로 생성하는 문서 번역 서버 및 번역 방법 KR102118322B1 (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020170111113A KR102118322B1 (ko) 2017-08-31 2017-08-31 원문과 번역문 파일을 개별적으로 생성하는 문서 번역 서버 및 번역 방법

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020170111113A KR102118322B1 (ko) 2017-08-31 2017-08-31 원문과 번역문 파일을 개별적으로 생성하는 문서 번역 서버 및 번역 방법

Publications (2)

Publication Number Publication Date
KR20190025188A KR20190025188A (ko) 2019-03-11
KR102118322B1 true KR102118322B1 (ko) 2020-06-04

Family

ID=65758729

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020170111113A KR102118322B1 (ko) 2017-08-31 2017-08-31 원문과 번역문 파일을 개별적으로 생성하는 문서 번역 서버 및 번역 방법

Country Status (1)

Country Link
KR (1) KR102118322B1 (ko)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2023158133A1 (ko) * 2022-02-18 2023-08-24 에이아이링고 주식회사 번역된 콘텐츠의 편집 인터페이스 제공 방법 및 컴퓨터 프로그램

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20020020406A (ko) * 2000-09-08 2002-03-15 정규석 문서분할에 의한 병렬처리가 가능한 기계번역장치
KR20030059678A (ko) * 2002-01-04 2003-07-10 정현진 웹기반 번역장치 및 방법
KR20040016198A (ko) * 2002-08-16 2004-02-21 (주) 클릭큐 원문 문서의 레이아웃 유지가 가능한 번역문 문서 생성 방법
KR101751942B1 (ko) 2010-12-31 2017-07-11 에스케이플래닛 주식회사 자동 번역 시스템에서 중국어 문장의 단어의 뜻을 제공하는 방법, 번역 장치 및 단말기, 그리고 이 방법을 실행시키기 위한 프로그램을 저장한 기록매체
KR102316473B1 (ko) * 2014-11-26 2021-10-21 네이버웹툰 유한회사 만화 참여번역 장치 및 이를 이용한 만화 참여번역 방법
KR101769981B1 (ko) 2016-03-29 2017-08-22 네이버 주식회사 이미지를 이용한 번역문 제공 방법, 사용자 단말, 서버, 시스템 및 컴퓨터 프로그램

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2023158133A1 (ko) * 2022-02-18 2023-08-24 에이아이링고 주식회사 번역된 콘텐츠의 편집 인터페이스 제공 방법 및 컴퓨터 프로그램

Also Published As

Publication number Publication date
KR20190025188A (ko) 2019-03-11

Similar Documents

Publication Publication Date Title
CN108052577B (zh) 一种通用文本内容挖掘方法、装置、服务器及存储介质
CN110956026B (zh) 法律文书生成方法、生成装置和电子设备
CN104503998B (zh) 针对用户查询句的类型识别方法及装置
CN108829682B (zh) 计算机可读存储介质、智能问答方法及智能问答装置
JP2002297588A (ja) 訳例辞書の自動生成方法およびプログラムおよび装置
CN106372053B (zh) 句法分析的方法和装置
CN112699645B (zh) 语料标注方法、装置及设备
CN111090641A (zh) 数据处理方法及装置、电子设备、存储介质
CN111767334A (zh) 信息抽取方法、装置、电子设备及存储介质
CN114239588A (zh) 文章处理方法、装置、电子设备及介质
Elhoseiny et al. Automatic annotation of structured facts in images
KR102118322B1 (ko) 원문과 번역문 파일을 개별적으로 생성하는 문서 번역 서버 및 번역 방법
CN108932225A (zh) 用于将自然语言需求转换成为语义建模语言语句的方法和系统
CN111158973B (zh) 一种web应用动态演化监测方法
CN112487334A (zh) 用于前端页面语言翻译的方法、装置、计算机设备和介质
CN114528851B (zh) 回复语句确定方法、装置、电子设备和存储介质
CN116360794A (zh) 数据库语言解析方法、装置、计算机设备及存储介质
CN113050933B (zh) 脑图数据处理方法、装置、设备及存储介质
CN111310457B (zh) 词语搭配不当识别方法、装置、电子设备和存储介质
CN114528218A (zh) 测试程序的生成方法、装置、存储介质以及电子设备
CN102955842A (zh) 一种多特征融合识别中文机构名的控制方法
CN113407676A (zh) 题目批改方法和系统、电子设备和计算机可读介质
CN112307195A (zh) 一种专利信息展示方法、装置、设备及存储介质
CN111611779A (zh) 辅助文本标注方法、装置、设备及其存储介质
KR100831037B1 (ko) 병렬 말뭉치를 이용한 신조어의 대역어 자동 선정 방법 및장치

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant