WO2016043539A1 - 소번역메모리를 포함하는 번역 메모리, 그를 이용한 역방향 번역메모리 및 이들을 기록한 컴퓨터 판독가능한 저장매체 - Google Patents

소번역메모리를 포함하는 번역 메모리, 그를 이용한 역방향 번역메모리 및 이들을 기록한 컴퓨터 판독가능한 저장매체 Download PDF

Info

Publication number
WO2016043539A1
WO2016043539A1 PCT/KR2015/009779 KR2015009779W WO2016043539A1 WO 2016043539 A1 WO2016043539 A1 WO 2016043539A1 KR 2015009779 W KR2015009779 W KR 2015009779W WO 2016043539 A1 WO2016043539 A1 WO 2016043539A1
Authority
WO
WIPO (PCT)
Prior art keywords
translation
small
memory
unit
translation memory
Prior art date
Application number
PCT/KR2015/009779
Other languages
English (en)
French (fr)
Inventor
이시용
Original Assignee
특허법인 남앤드남
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 특허법인 남앤드남 filed Critical 특허법인 남앤드남
Publication of WO2016043539A1 publication Critical patent/WO2016043539A1/ko

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F12/00Accessing, addressing or allocating within memory systems or architectures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/40Processing or translation of natural language

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Machine Translation (AREA)

Abstract

본 발명의 일 양태에 따른, 원문언어로 된 원문 문장 및 목표언어로 된 번역 문장의 쌍을 포함하며 소단위 번역메모리(이하, "소번역메모리"라고 함)를 포함하는 번역 메모리는, 상기 소번역메모리는 상기 원문 문장을 번역 소단위로 세분화한 소번역단위 및 상기 소번역단위에 대응하는 번역 문장 내의 번역 부분인 소번역문의 쌍을 포함하되, 상기 번역 메모리는 상기 번역 메모리 내에서 상기 소번역메모리를 특정하는 소단위 대응관계지시자를 포함하고, 상기 소단위 대응관계지시자에 의해 상기 번역 메모리 내에서 상기 소번역메모리의 소번역단위 및 소번역문 쌍의 대응 관계가 표시된다. 본 발명의 일 양태에서, 본 발명에 따른 소번역메모리를 포함하는 번역 메모리는 컴퓨터 판독가능한 저장 매체에 기록된다.단위 및 소번역문 쌍의 대응 관계가 표시된다.

Description

소번역메모리를 포함하는 번역 메모리, 그를 이용한 역방향 번역메모리 및 이들을 기록한 컴퓨터 판독가능한 저장매체
본 발명은 원문언어(source language)로 된 원문문장을 목표언어(target language)로 된 번역문장으로 번역할 때 이용되는 새로운 번역 메모리(translation memory, TM)에 관한 것이며, 새로운 번역 메모리를 생성하기 위한 방법, 상기 번역 메모리를 이용하는 번역 방법, 및 이들이 이용되는 컴퓨터 보조 번역(CAT) 프로그램(컴퓨터 번역 지원 프로그램)에 관한 것이다.
번역 메모리(영어: translation memory, TM)는 인간의 번역을 돕기 위한 문장, 단락 또는 이전에 번역된 문장과 같은 단위들인 "세그먼트"들을 저장하는 데이터베이스이다. 번역 메모리는 원본 텍스트의 원문문장을 저장하고 "번역단위(translation units)"로 불리는 언어 쌍에 해당하는 번역을 저장한다. 개별 단어들은 번역 메모리의 도메인 내부에서 있지 않고, 용어 기반들에 의해 처리된다.
도 1에 도시된 바와 같이, 종래의 번역 메모리의 국제 표준 포맷(TMX)은 번역단위 및 이에 대한 번역부분인 번역 메모리로만 구성되어 있으므로, 번역단위 내의 원문 문장들이 번역 문장으로 어떻게 세부적으로 대응되는지 알 수 없었다. TMX(Translation Memory eXchange)는 CAT(Computer Aided Translation) 및 로컬라이제이션 도구로 만들어진 번역 메모리 데이터의 교환을 위한 공급업체 중립 공개 XML 표준이다. TMX의 목적은 프로세스에서 중요한 데이터 손실을 최소화하면서 도구와 번역 업체 간 번역 메모리 데이터의 교환을 더욱 쉽게 만드는 것이다.
종래에 번역 메모리의 "번역 단위"는 문장, 단락 등 문장 이상의 번역문을 저장하였기 때문에, 종래의 원문문장 단위 번역 메모리는 원문문장이 100% 일치하는 경우에 새로 번역되는 원문문장에 사용되었다. 또한, 원문과 번역문 간 세부 대응관계를 표시하지 않았기 때문에, 만약 새로 번역되는 원문문장이 저장된 번역 메모리의 원문 문장과 일치율이 80% 내지 90%인 경우에는 참고할 수 있도록 번역자에게 표시할 뿐이고, 일치율이 더 떨어지면 번역 메모리를 호출한다고 하더라도 실제 번역자에게 번역 정확도와 번역 시간 단축의 측면에서 큰 도움이 되지 못했다. 종전 번역 메모리는 원문문장이 100%일치하는 경우는 정확도를 유지하나 80% 내지 90% 일치하여 참고할 수 있도록 표시되는 경우는 번역자가 새로 번역될 원문문장과 다른 부분을 비교하여 원문문장을 수정하게 되고. 번역에서 원문문장이 번역 메모리의 원문 문장과 100% 일치하는 경우는 확률상 매우 드문 일이어서 실제로 번역 메모리가 번역자에게 큰 도움을 주지 못하였다.
또한, 일반적으로 판매되고 있는 번역 프로그램 및 CAT는 교착어 간의 번역인 일본어와 한국어의 번역에서 최대 95%의 기계 번역 정확도를 자랑하고, 굴절어 간의 번역인 영어와 독일어 번역 역시 높은 정확도를 자랑하나, 굴절어와 교착어 간의 번역은 어순의 차이로 인해 정확도가 상대적으로 매우 낮다.
종래에 기계번역은 기계번역 알고리즘에 의해 번역을 수행하고 아무리 복잡한 원문문장이라도 알고리즘에 따라 번역하기 때문에 원문언어 원문문장이 목표언어 번역문장의 어느 부분으로 번역되는지 대응관계를 알 수 있었다. 그러나, 기존의 번역 메모리는 번역자에 의해 번역되기 때문에 목표언어로 번역된 원문문장에서 서로 대응관계를 알 수 없다. 간단한 원문문장은 알고리즘 등을 사용하여 원문언어 원문문장과 목표언어 원문문장의 대응관계를 알아낼 수 있으나 원문문장의 길이가 길어지고 접속사가 여러 개 있는 원문문장에서는 원문언어 원문문장과 목표언어 원문문장의 대응관계를 알고리즘만으로 알아내기 어렵고 매칭 프로그램을 사용한다고 하더라도 오류가 나타나게 된다. 특히, 원문언어 원문문장 내에 동일한 원문언어 단어들이 반복되거나 원문언어 단어들은 다르나 원문언어들이 동의어 관계에 있어서 원문문장 내에서 동일한 목표언어로 번역되는 경우 매칭 알고리즘에 의해 원문문장과 번역문장 사이에서 정확한 단어들의 대응관계를 알아 내지 못하고 오류가 많이 발생하며 인간이 직접 매칭관계를 알고자 하더라도 원문문장과 번역문장 사이에서 단어들을 일일이 대조하여야 하므로 긴 문장일수록 시간이 오래 걸린다.
기존의 번역 프로그램들 및 컴퓨터 보조 번역(CAT) 프로그램들은 한 번 번역된 문장은 다시 번역하지 않기 위해 번역 메모리를 사용하거나, 번역 품질 및 용어 통일을 위해 용어집 및 등록상용어구를 이용하고 있다. 그러나, 이러한 부분일치 번역 메모리, 용어집 및 등록상용어구는 문장 내의 해당 단어들만 치환하는 것이기 때문에 번역자가 번역 문장을 완성하기 위해서는 일일이 상용어구나 용어를 다시 정렬하여 번역해야만 한다. 이러한 작업은 용어집이나 상용어구의 사용 없이 번역하는 시간보다 오히려 더 많은 시간이 걸리게 되어 숙련된 번역가의 입장에서는 이러한 용어집이나 등록 상용어구를 이용하지 않게 된다.
종래 번역메모리는 문장단위로 번역메모리 저장하기 때문에 번역메모리 재사용률이 현저히 낮은 문제점이 있었다. 또한, 원문문장이 번역문장으로 적절하게 번역됐는지 오류를 검증하는 기존 검증 프로그램은 문장 단위 검증이 이루어지기 때문에 문장 내에 중복 단어가 있거나, 문장 길이가 길수록 성능이 떨어지는 문제점이 있었다.
이에 본 발명이 해결하고자 하는 과제는 매칭율이 낮은 번역메모리들이라도 번역메모리들의 매칭되는 부분을 번역하고자 하는 원문문장의 번역에 최대한 이용하는 방법을 찾아서, 번역메모리의 재사용율을 높이고, 문장 내 중복 단어가 있거나 문장 길이가 길어도 번역 오류를 탐지하는 검증 성능을 유지하도록 하는 것이다. 본 발명은 종래의 기술에 따른 번역 메모리의 단점을 보완하여 번역 메모리의 활용을 높이기 위해 새로운 번역 메모리 저장 포맷을 정의하고 이를 이용하여 번역하는 방법을 제공한다. 이를 통해 번역자는 번역 내용의 번역 정확도, 번역 내용 오류 체크 등의 검수 및 번역 시간 측면에서 보다 정확하고 빠르게 번역할 수 있게 된다.
본 발명이 해결하고자 하는 다른 과제는 굴절어와 교착어 간의 번역에서 어순의 차이를 극복하고 교착어 간의 번역 정확도에 근접하는 번역 정확도를 갖는 자동번역 프로그램 및 CAT 프로그램에 이용될 수 있는 새로운 번역 메모리 및 그를 이용한 번역 방법을 제공하는 것이다.
본 발명은 원문문장을 번역문장으로 번역하는 번역 속도를 해치지 않으면서, 원문문장인 번역단위(Translation Units, TU)를 세분화한 소번역단위(sub-TU), 및 번역단위에 대한 번역 메모리(TM) 내에 상기 소번역단위에 대한 번역 부분인 소번역문(sub-Translation)의 쌍을 갖는 소번역메모리(sub-TM)를 정의하고 소번역단위 및 소번역문을 포함하는 각 소번역메모리에 대해서 소단위 대응관계지시자가 지정된다. 사용자가 번역과 동시에 번역 메모리를 구축하고 한번 번역했던 소번역단위는 이에 대한 번역부분인 소번역문을 불러와 대체 또는 수정함으로써 타이핑 시간을 줄임으로써 소번역메모리 자료가 축적됨에 따라 번역자가 정확하면서도 빠른 번역을 할 수 있도록 하는 소번역메모리를 포함하는 번역메모리 이용 방법을 제시한다.
본 발명의 일 양태에 따른 번역 메모리는 원문언어로 된 원문 문장을 목표언어로 된 번역 문장으로 번역하기 위해 사용된다. 번역 메모리는 원문 문장 및 그에 대응하는 번역 문장을 저장하고, 원문 문장을 번역 소단위로 세분화한 각각의 소번역단위에 대하여 소번역메모리가 형성되고, 소번역단위 및 소번역문에는, 각각의 소번역단위와 각각의 소번역문 간의 대응 관계를 나타내는, 소단위 대응관계지시자가 지정된다.
본 발명의 일 양태에서, 소번역단위의 원문 문장 내 정렬위치를 가리키는 정보인 소번역단위위치정보와 번역 문장 내 소번역문의 정렬위치를 가리키는 정보인 소번역문위치정보를 포함한다.
본 발명의 일 양태에서, 소번역단위위치정보는 소번역단위들 간의 원문문장 내 순서를 지정할 수 있는 숫자를 포함하고, 소번역문위치정보는 소번역문들 간의 번역 문장 내 순서를 지정할 수 있는 숫자를 포함하지 아니한다.
본 발명의 일 양태에서, 소번역단위위치정보는 소번역단위들 간의 원문문장 내 순서를 지정할 수 있는 숫자를 포함하고, 소번역문위치정보는 소번역문들 간의 번역 문장 내 순서를 지정할 수 있는 숫자를 포함한다.
본 발명의 일 양태에서, 소번역단위위치정보는 원문 문장 내에서 해당 소번역단위까지의 단어 또는 하나 이상의 단어들이 속하는 어절의 누적개수를 나타내고, 소번역문위치정보는 번역 문장 내에서 해당 소번역문까지의 단어 또는 하나 이상의 단어들이 속하는 어절의 누적개수를 나타낸다.
본 발명의 일 양태에서, 각각의 소번역단위는, 각각이 하나 이상의 단어들 또는 단어가 속하는 어절들의 집합체인, 하나 이상의 파싱 단위로 구성되고, 각각의 파싱 단위는 각각의 파싱 단위는 원문 문장 내에서 형태소 분석을 통해서 구성되는 하나 이상의 단어의 배열이다.
본 발명의 일 양태에서, 각각의 소번역단위는, 순차적인 복수 개의 파싱 단위들로서 소번역문들을 번역 문장 내 순서에 따라서 정렬할 때 각각의 소번역단위를 구성하는 복수 개의 파싱 단위들의 재정렬을 요하지 아니하도록 하는, 순차적인 복수 개의 파싱 단위들로 구성된다.
본 발명의 일 양태에서, 원문 문장은, 원문 문장이 포함하고 있는 단어 또는 단어들의 품사를 기준으로 복수 개의 파싱 단위들로 분할된다.
본 발명의 일 양태에서, 원문 문장의 맨 앞에서부터 순차적으로, 품사가 접속사인 단어 또는 단어들이 속하는 형태소의 앞에서 및 뒤에서 그리고 품사가 명사 또는 대명사인 단어 또는 단어들이 속하는 형태소의 뒤에서, 원문 문장이 복수 개의 파싱 단위들로 분할된다.
본 발명의 일 양태에서, 원문 문장의 맨 앞에서부터 순차적으로, 품사가 전치사인 단어 또는 단어들이 속하는 형태소의 앞에서, 원문 문장이 복수 개의 파싱 단위들로 추가적으로 분할된다.
본 발명의 일 양태에서, 원문 문장의 맨 앞에서부터 순차적으로, 품사가 명사, 대명사, 동사, 형용사, 부사, 전치사, 접속사 또는 감탄사인 단어 또는 단어들이 속하는 형태소의 앞에서 및 뒤에서, 원문 문장이 복수 개의 파싱 단위들로 분할된다.
본 발명의 일 양태에 따른, 원문언어로 된 원문 문장을 목표언어로 된 번역문장으로 번역하기 위해 사용되는 번역 메모리를 상용구로 저장하는 방법은, 번역 메모리에, 원문 문장 및 그에 대응하는 번역 문장을 저장하고, 원문 문장을 번역 소단위로 세분화한 각각의 소번역단위에 대하여 소번역문을 포함하는 소번역메모리를 형성하고, 소번역단위 및 소번역문에, 각각의 소번역단위와 각각의 소번역문 간의 대응 관계를 나타내는, 소단위 대응관계지시자를 지정하고, 그리고 소번역단위 및 소번역단위에 대응하는 소번역문을 각각 등록상용구의 원문언어 및 목표언어로 저장하는, 번역 메모리를 상용구로 저장하는 방법을 포함한다.
본 발명의 일 양태에 따른, 원문언어로 된 원문 문장을 목표언어로 된 번역문장으로 번역하기 위해 사용되는 번역 메모리를 역방향 번역에 적용하는 방법은, 번역 메모리에 원문 문장 및 그에 대응하는 번역 문장을 저장하고, 원문문장을 번역 소단위로 세분화한 각각의 소번역단위에 대하여 소번역문을 형성하고, 소번역단위 및 소번역문에, 각각의 소번역단위와 각각의 소번역문 간의 대응 관계를 나타내는, 소단위 대응관계지시자를 지정하고, 그리고 목표언어로 된 원문 문장을 원문언어로 된 번역 문장으로 번역하기 위해 소단위 대응관계지시자로부터 역방향 소단위 대응관계지시자를 추출하는, 번역 메모리를 역방향 번역에 적용하는 방법을 포함한다.
본 발명에 따른 일 양태에서, 원문언어로 된 원문 문장을 목표언어로 된 번역 문장으로 번역하기 위해 사용되는 번역 메모리를, 목표언어가 원문 원어가 되고 원문언어가 목표언어가 되는 역방향 번역에 적용하기 위한 소번역메모리를 포함하는 역방향 번역메모리는
원문언어로 된 원문 문장을 목표언어로 된 번역 문장으로 번역하기 위해 사용되는, 소단위 대응관계를 갖는 번역 메모리로서,
상기 번역 메모리는 원문 문장 및 그에 대응하는 번역 문장을 저장하고,
상기 원문 문장을 번역 소단위로 세분화한 각각의 소번역단위에 대하여 번역문인 소번역문을 포함하는 소번역메모리가 형성되고,
소번역단위 및 소번역문에, 각각의 소번역단위와 각각의 소번역문 간의 대응 관계를 나타내는, 소단위 대응관계지시자가 지정되는,
번역 메모리에 있어서,
상기 번역 메모리의 소번역단위에 대응하는 소번역문을 역방향 번역메모리의 소번역단위이고,
상기 번역 메모리의 소번역단위가 역방향 번역메모리의 소번역문이며,
상기 소번역메모리를 포함하는 번역메모리의 소번역문위치정보가 역방향 번역메모리의 소번역단위위치정보가 되고, 소번역메모리를 포함하는 번역메모리의 소번역단위위치정보가 역방향 번역메모리의 소번역문위치정보가 되는, 역방향 소단위 대응관계지시자를 포함한다.
본 발명에 따른 다른 양태에서, 원문언어로 된 원문 문장을 목표언어로 된 번역 문장으로 번역하기 위해 사용되는 번역 메모리를, 목표언어가 원문 원어가 되고 원문언어가 목표언어가 되는 역방향 번역에 적용하기 위한 소번역메모리를 포함하는 역방향 번역메모리 형성 방법은
원문언어로 된 원문 문장을 목표언어로 된 번역 문장으로 번역하기 위해 사용되는, 소단위 대응관계를 갖는 번역 메모리로서,
상기 번역 메모리는 원문 문장 및 그에 대응하는 번역 문장을 저장하고,
상기 원문 문장을 번역 소단위로 세분화한 각각의 소번역단위에 대하여 번역문인 소번역문을 포함하는 소번역메모리가 형성되고,
소번역단위 및 소번역문에, 각각의 소번역단위와 각각의 소번역문 간의 대응 관계를 나타내는, 소단위 대응관계지시자가 지정되는,
번역 메모리를 형성하고,
상기 목표언어가 원문 문장이고 원문 언어가 번역 문장인 역방향 번역에 이용하기 위해, 번역 메모리의 소번역단위에 대응하는 소번역문이 역방향 번역메모리의 소번역단위가 되고, 번역 메모리의 소번역단위가 역방향 번역메모리의 소번역문 부분이 되며,
상기 소번역메모리를 포함하는 번역메모리의 소번역문위치정보가 역방향 번역메모리의 소번역단위위치정보가 되고, 소번역메모리를 포함하는 번역메모리의 소번역단위위치정보가 역방향 번역메모리의 소번역문위치정보가 되는,
소번역메모리를 포함하는 역방향 번역메모리 형성 방법을 포함한다.
본 발명의 일 양태에서 따른, 원문언어로 된 원문 문장을 목표언어로 된 번역 문장으로 번역하기 위해 사용되는, 번역 메모리를 생성하는 방법은, 번역 메모리에 원문 문장 및 그에 대응하는 번역 문장을 저장하되, 원문 문장을 번역 소단위로 세분화한 각각의 소번역단위에 대하여 소번역단위를 번역한 번역문인 소번역문을 형성하고 정렬하여 번역 문장을 저장하고, 그리고 소번역단위 및 소번역문에, 각각의 소번역단위와 각각의 소번역문 간의 대응 관계를 나타내는, 소단위 대응관계지시자를 지정한다.
본 발명의 일 양태에 따른, 원문언어로 된 원문문장을 세분한 소번역단위에 대해 목표언어로 번역한 소번역메모리를 포함하는 번역 메모리 적용 장치는,
a) 새로 번역될 새로운 원문문장을 입력하는 사용자 인터페이스 유닛;
b) 불러온 번역될 원문문장을 구성하는 단어들의 형태소를 분석하는 형태소 분석 유닛;
c) 형태소 분석된 단어들 중, 문장의 맨 앞 단어부터 순차적으로, 품사가 명사, 대명사 및 접속사인 단어 뒤까지, 그리고 접속사인 단어 앞까지 세분되는, 하나 이상의 원문문장의 단어들로 구성된 하나 이상의 파싱 단위(parsing unit)들을 형성하는 문장 파싱 유닛;
d) 번역될 맨 앞의 하나의 파싱 단위부터 순차적으로 소번역단위를 결정하는 소번역단위 결정 유닛 및 소번역문을 생성하고 정렬하여 번역메모리를 생성하는 소번역메모리를 포함하는 번역 메모리 생성 유닛]로서,
번역될 맨 앞의 하나의 파싱 단위부터 순차적으로 다음 파싱단위를 시작 파싱단위로 하고, 번역될 원문문장의 끝에 위치한 파싱 단위부터 순차적으로 하나 씩 제외하면서 역순으로 종료 파싱단위를 지정하여, 시작 파싱단위를 포함하는 번역될 하나 이상의 파싱 단위들을 시작 파싱단위부터 종료 파상단위까지 소번역메모리 DB와 비교하는 비교 유닛을 포함하고,
i) 비교 유닛은 번역될 원문문장을 구성하는 순차적인 파싱단위들이 소번역메모리 DB의 원문문장 내의 하나 이상의 소번역단위와 일치하는지 여부를 비교하여, 소번역메모리 DB의 원문문장 내의 하나 이상의 소번역단위와 일치하는 가장 긴 순차적인 파싱단위들을 하나의 소번역단위로 결정하고,
ii) 비교결과 소번역메모리 DB의 원문문장 내의 하나 이상의 소번역단위와 일치하는 순차적인 파싱단위들이 존재하지 않는 경우, 확장 소번역메모리 형성 유닛]에 의해 형성된 확장 소번역메모리와 비교하여 일치하는 파싱 단위들을 하나의 소번역단위로 결정하고, 확장 소번역메모리는 소번역메모리 DB의 소번역메모리들을 기초로 소번역단위의 품사 및 문장성분을 분석하여 공통되는 동사 및 명사를 갖는 소번역메모리들의 번역 패턴으로부터 확장된 번역 메모리이고,
iii) 비교결과 소번역메모리 DB의 원문문장 내의 하나 이상의 소번역단위와 일치하는 순차적인 파싱단위들이 존재하지 않는 경우, 번역될 파싱단위들을 사용자에게 표시하고 사용자입력 모드로 전환하여 사용자 인터페이스부 사용자가 소번역단위를 결정하게 하는,
번역될 맨 앞의 하나 이상의 파싱 단위부터 순차적으로 소번역단위를 결정하고 소번역메모리를 생성하는 단계; 및
f) 결정된 생성된 번역 메모리에 소단위 대응관계지시자를 지정하는 단계로서,
상기 d)에서 순차적으로 하나의 소번역단위가 결정될 때마다 소번역단위를 번역하여 새로운 소번역메모리를 생성하고 소단위 대응관계지시자를 지정하거나, d)에서 순차적으로 원문문장의 소번역단위들이 모두 결정된 후 소번역단위들을 번역하여 새로운 소번역문들을 생성하고, 새로운 소번역문들에 일괄적으로 소단위 대응관계지시자를 지정하는,
상기 생성된 번역 메모리에 소단위 대응관계지시자를 지정하는 단계;를 포함한다.
본 발명의 일 양태에 따른, 원문언어로 된 원문문장을 세분한 소번역단위에 대해 목표언어로 번역한 소번역메모리를 포함하는 번역 메모리 적용 프로그램은,
a) 새로 번역될 새로운 원문문장을 입력하는 기본번역메모리 매칭유닛(20);
b) 불러온 번역될 원문문장을 구성하는 단어들의 형태소를 분석하는 형태소 분석 유닛(40);
c) 형태소 분석된 단어들 중, 문장의 맨 앞 단어부터 순차적으로, 품사가 명사 및 대명사인 단어 뒤까지, 그리고 접속사인 단어 앞 및 귀까지 세분되는, 하나 이상의 원문문장의 단어들로 구성된 하나 이상의 파싱 단위(parsing unit)들을 형성하는 문장 파싱 유닛(50);
d) 번역될 맨 앞의 하나의 파싱 단위부터 순차적으로 다음 파싱단위를 시작 파싱단위로 하고, 번역될 원문문장의 끝에 위치한 파싱 단위부터 순차적으로 하나 씩 제외하면서 역순으로 종료 파싱단위를 지정하여, 시작 파싱단위부터 종료 파싱단위까지 연속되는 파싱단위들을 소번역메모리 DB)와 비교하는, 비교유닛(60);
상기 비교 유닛(60)에서 번역될 원문문장을 구성하는 순차적인 파싱단위들이 소번역메모리 DB의 원문문장 내의 하나 이상의 소번역단위와 일치하는지 여부를 비교하여, 번역될 맨 앞의 하나의 파싱 단위부터 순차적으로, 소번역메모리 DB의 원문문장 내의 하나 이상의 소번역단위와 전체적으로 또는 부분적으로 일치하는 가장 긴 순차적인 파싱단위들을 하나의 소번역단위로 결정하는, 소번역단위 결정 유닛(70);
상기 소번역단위결정 유닛(70)에서 결정된 소번역단위와 전체적으로 일치하는 소번역메모리 DB의 원문문장 내의 하나 이상의 소번역단위에 대응되는 하나 이상의 소번역메모리를, 번역될 소번역단위의 새로운 소번역메모리로 치환하여 번역될 소번역단위에 대한 소번역메모리를 생성하고, 소번역단위결정 유닛(70)에서 결정된 소번역단위와 부분적으로 일치하는 소번역메모리 DB의 원문문장 내의 하나 이상의 소번역단위에 대응되는 하나 이상의 소번역메모리를, 소번역메모리 DB의 소번역메모리와 비교하고, 일치하지 않는 부분을 번역 엔진의 번역으로 치환하여, 번역될 소번역단위의 새로운 소번역메모리를 생성하는, 번역 메모리 생성 유닛(90); 및
상기 원문 문장 내에서의 소번역단위의 소번역단위 위치정보를 나타내는 소번역단위의 소번역단위위치정보를 결정하고, 결정된 소번역단위로부터 소번역메모리를 생성하고 소번역메모리의 소번역문위치정보를 결정하는 소단위 대응관계지시자 생성유닛(80);을 포함한다.
본 발명의 일 양태에 따른, 원문언어로 된 원문 문장 및 목표언어로 된 번역 문장의 쌍을 포함하며 소단위 번역메모리(이하, "소번역메모리"라고 함)를 포함하는 번역 메모리는, 소번역메모리는 원문 문장을 번역 소단위로 세분화한 소번역단위 및 소번역단위에 대응하는 번역 문장 내의 번역 부분인 소번역문의 쌍을 포함하되, 번역 메모리는 번역 메모리 내에서 소번역메모리를 특정하는 소단위 대응관계지시자를 포함하고, 소단위 대응관계지시자에 의해 번역 메모리 내에서 소번역메모리의 소번역단위 및 소번역문 쌍의 대응 관계가 표시된다.
본 발명의 일 양태에서, 소단위 대응관계지시자는 소번역단위의 원문 문장 내 위치를 나타내는 정보인 소번역단위위치정보(8'), 및 소번역문의 번역 문장 내 위치를 나타내는 정보인 소번역문위치정보(8")를 포함한다.
본 발명의 일 양태에서, 번역 메모리의 원문 문장은 복수 개의 소번역단위들로 구성되고, 번역메모리의 번역 문장은 복수 개의 소번역단위들에 대응하는 소번역문들로 구성되고, 소번역단위들 각각에 대한 소번역문들의 대응관계가 소단위 대응관계표시자들에 의해 표시되고, 소단위 대응관계표시자들의 소번역단위위치정보들은 소번역단위들 각각의 원문 문장 내 소단위로 세분화된 위치를 지시할 수 있는 숫자들을 포함하고, 소단위 대응관계표시자들의 소번역문위치정보들은 소번역문들 각각의 번역 문장 내 위치를 지시할 수 있는 숫자들을 포함한다.
본 발명의 일 양태에서, 소번역단위들 각각의 원문 문장 내 소단위로 세분화된 위치를 지시할 수 있는 숫자들은 소번역단위들 각각의 첫 문자의 시작위치, 및 소번역단위들 각각의 마지막 문자의 종료위치 중 하나 이상을 지시하고, 소번역문들 각각의 번역 문장 내 위치를 지시할 수 있는 숫자들은 소번역문들 각각의 첫 문자의 시작위치, 및 소번역문들 각각의 마지막 문자의 종료위치 중 하나 이상을 지시한다.
본 발명의 일 양태에서, 소번역문들 각각의 번역 문장 내 위치를 지시할 수 있는 숫자들은 번역 문장 내에서 소번역문들 각각의 정렬 순서를 나타내는 위치를 더 지시한다.
본 발명의 일 양태에서, 정렬 순서에 의해 소번역메모리들의 소번역문들을 정렬할 때 인접하는 두 개의 소번역문들 중 앞쪽에 위치한 소번역문(이하 "피삽입 소번역문"이라고 함)은 피삽입 소번역문 내로 뒷쪽에 위치한 소번역문(이하 "삽입 소번역문"이라고 함)이 삽입되는 위치를 지시하는 삽입위치지시자를 포함할 수 있다.
본 발명의 일 양태에서, 피삽입 소번역문은 삽입위치지시자에 의해 피삽입 소번역문이 삽입위치지시자의 위치를 기준으로 전반부 및 후반부로 특정되며, 피삽입 소번역문의 번역 문장 내 위치를 지시할 수 있는 숫자들은 피삽입 소번역문의 전반부의 첫 문자의 시작위치 및 전반부의 마지막 문자의 종료위치 중 하나 이상, 그리고 후반부의 첫 문자의 시작위치 및 후반부의 마지막 문자의 종료위치 중 하나 이상을 지시한다.
본 발명의 일 양태에서, 번역 메모리의 원문 문장은 복수 개의 소번역단위들로 구성되고, 복수 개의 소번역단위들 중 일부에 대응하는 소번역문들이 형성되고, 일부 소번역단위와 일부 소번역단위에 대한 소번역문 간의 대응관계가 소단위 대응관계표시자에 의해 표시되고, 소단위 대응관계표시자의 소번역단위위치정보는 일부 소번역단위의 원문 문장 내 소단위로 세분화된 위치를 지시할 수 있는 숫자들을 포함하고, 소단위 대응관계표시자의 소번역문위치정보는 소번역문의 번역 문장 내 위치를 지시할 수 있는 숫자들을 포함한다.
본 발명의 일 양태에서, 본 발명에 따른 소번역메모리를 포함하는 번역 메모리는 컴퓨터 판독가능한 저장 매체에 기록된다.
본 발명의 일 양태에 따른, 소번역메모리를 포함하는 번역 메모리를 형성한 후, 소번역메모리를 포함하는 번역 메모리로부터, 목표언어가 원문 원어가 되고 원문언어가 목표언어가 되는 역방향 번역에 적용하기 위한 소번역메모리를 포함하는 역방향 번역메모리는 목표언어가 원문 문장이고 원문 언어가 번역 문장인 역방향 번역에 이용하기 위해, 번역 메모리의 소번역단위에 대응하는 소번역문이 역방향 번역메모리의 소번역단위가 되고, 번역 메모리의 소번역단위가 역방향 번역메모리의 소번역문이 되며, 소번역메모리를 포함하는 번역메모리의 소번역문위치정보가 역방향 번역메모리의 소번역단위위치정보가 되고, 소번역메모리를 포함하는 번역메모리의 소번역단위위치정보가 역방향 번역메모리의 소번역문위치정보가 된다.
본 발명의 일 양태에 따른, 소번역메모리를 포함하는 역방향 번역 메모리는 컴퓨터 판독가능한 저장 매체에 저장된다.
본 발명의 일 양태에 따른, 원문언어로 된 원문 문장 및 목표언어로 된 번역 문장의 쌍을 포함하며 소단위 번역메모리(이하, " 1차 소번역메모리"라고 함)를 포함하는 번역 메모리는 1차 소번역메모리는 원문 문장을 번역 소단위로 세분화한 1차 소번역단위 및 1차 소번역단위에 대응하는 번역 문장 내의 번역 부분인 1차 소번역문의 쌍을 포함하되, 번역 메모리는 번역 메모리 내에서 1차 소번역메모리를 특정하는 1차 소단위 대응관계지시자를 포함하고, 1차 소단위 대응관계지시자에 의해 번역 메모리 내에서 1차 소번역메모리의 1차 소번역단위 및 1차 소번역문 쌍의 대응 관계가 표시되고, 1차 소번역메모리는 1차 소번역메모리를 추가로 세분화한 추가적인 소번역메모리인 2차 소번역메모리를 포함할 수 있으며, 2차 소번역메모리를 포함하는 경우, 1차 소번역메모리의 1차 소번역단위를 추가로 세분화한 번역 소단위인 2차 소번역단위 및 2차 소번역단위에 대응하는 번역 부분인 2차 소번역문의 쌍을 포함하되, 2차 소번역메모리는 2차 소번역메모리를 특정하는 2차 소단위 대응관계지시자를 포함하고, 2차 소단위 대응관계지시자는 2차 소번역메모리의 2차 소번역단위 및 2차 소번역문 쌍의 대응 관계를 나타낸다.
본 발명의 일 실시예에서, 2차 소단위 대응관계지시자)는 2차 소번역단위의 1차 소번역단위 내 위치를 나타내는 정보인 2차 소번역단위위치정보와 2차 소번역문의 1차 소번역문 내 위치를 나타내는 정보인 2차 소번역문위치정보를 포함한다.
본 발명의 일 양태에서, 1차 소번역메모리의 1차 소번역단위는 복수 개의 2차 소번역단위들로 구성되고, 1차 번역메모리의 1차 소번역문은 복수 개의 2차 소번역단위들에 대응하는 2차 소번역문들로 구성되고, 2차 소번역단위들과 2차 소번역문들 간의 대응관계가 2차 소단위 대응관계표시자들에 의해 표시되고, 2차 소단위 대응관계표시자들의 소번역단위위치정보들은 2차 소번역단위들 각각의 1차 소번역단위 내 소단위로 세분화된 위치를 지시할 수 있는 숫자들을 포함하고, 2차 소단위 대응관계표시자들의 소번역문위치정보들은 2차 소번역문들 각각의 1차 소번역문 내 위치를 지시할 수 있는 숫자들을 포함한다.
본 발명의 일 양태에서, 2차 소번역단위들 각각의 1차 소번역단위 내 소단위로 세분화된 위치를 지시할 수 있는 숫자들은 2차 소번역단위들 각각의 첫 문자의 시작위치, 및 2차 소번역단위들 각각의 마지막 문자의 종료위치 중 하나 이상을 지시하고, 2차 소번역문들 각각의 1차 소번역문 내 위치를 지시할 수 있는 숫자들은 2차 소번역문들 각각의 첫 문자의 시작위치, 및 2차 소번역문들 각각의 마지막 문자의 종료위치 중 하나 이상을 지시한다.
본 발명의 일 양태에서, 2차 소번역문들 각각의 1차 소번역문 내 위치를 지시할 수 있는 숫자들은 1차 소번역문 내에서 2차 소번역문들 각각의 정렬 순서를 나타내는 위치를 더 지시한다.
본 발명의 일 양태에서, 정렬 순서에 의해 2차 소번역메모리들의 2차 소번역문들을 정렬할 때 인접하는 두 개의 2차 소번역문들 중 앞쪽에 위치한 2차 소번역문(이하 "피삽입 2차 소번역문"이라고 함)은 피삽입 2차 소번역문 내로 뒷쪽에 위치한 2차 소번역문(이하 "삽입 2차 소번역문"이라고 함)이 삽입되는 위치를 지시하는 삽입위치지시자를 포함한다.
본 발명의 일 양태에서, 피삽입 2차 소번역문은 삽입위치지시자를 포함하는 경우, 삽입위치지시자에 의해 피삽입 2차 소번역문이 삽입위치지시자의 위치를 기준으로 전반부 및 후반부로 특정되며, 피삽입 2차 소번역문의 1차 소번역문 내 위치를 지시할 수 있는 숫자들은 피삽입 2차 소번역문의 전반부의 첫 문자의 시작위치 및 전반부의 마지막 문자의 종료위치 중 하나 이상, 그리고 후반부의 첫 문자의 시작위치 및 후반부의 마지막 문자의 종료위치 중 하나 이상를 지시한다.
본 발명의 일 양태에서, 1차 소번역메모리의 1차 소번역단위는 복수 개의 2차 소번역단위들로 구성되고, 복수 개의 2차 소번역단위들 중 일부에 대응하는 2차 소번역문이 형성되고, 일부 2차 소번역단위와 일부 2차 소번역단위에 대한 2차 소번역문 간의 대응관계가 2차 소단위 대응관계표시자에 의해 표시되고, 2차 소단위 대응관계표시자의 소번역단위위치정보는 일부 2차 소번역단위의 1차 소번역단위 내 소단위로 세분화된 위치를 지시할 수 있는 숫자들을 포함한다.
본 발명의 일 양태에 따른, 1차 소번역메모리 및 2차 소번역메모리를 포함하는 번역 메모리는 컴퓨터 판독가능한 저장 매체에 기록된다.
본 발명의 일 양태에 따른, 1차 소번역메모리 및 2차 소번역메모리를 포함하는 번역 메모리를 형성한 후, 1차 소번역메모리 및 2차 소번역메모리를 포함하는 번역 메모리로부터, 목표언어가 원문 원어가 되고 원문언어가 목표언어가 되는 역방향 번역에 적용하기 위한 소번역메모리를 포함하는 역방향 번역메모리는 목표언어가 원문 문장이고 원문 언어가 번역 문장인 역방향 번역에 이용하기 위해, 번역 메모리의 1차 소번역단위 및 2차 소번역단위에 대응하는 1차 소번역문 및 2차 소번역문이 역방향 번역메모리의 1차 소번역단위 및 2차 소번역단위가 되고, 번역 메모리의 1차 소번역단위 및 2차 소번역단위가 역방향 번역메모리의 1차 소번역문 및 2차 소번역문이 되며, 1차 소번역메모리를 포함하는 번역메모리의 1차 소번역문위치정보가 역방향 번역메모리의 1차 소번역단위위치정보가 되고, 1차 소번역메모리를 포함하는 번역메모리의 1차 소번역단위위치정보가 역방향 번역메모리의 1차 소번역문위치정보가 되며, 2차 소번역메모리를 포함하는 번역메모리의 2차 소번역문위치정보가 역방향 번역메모리의 2차 소번역단위위치정보가 되고, 2차 소번역메모리를 포함하는 번역메모리의 2차 소번역단위위치정보가 역방향 번역메모리의 2차 소번역문위치정보가 된다.
본 발명의 일 양태에 따른, 소번역메모리를 포함하는 역방향 번역 메모리는 컴퓨터 판독가능한 저장 매체에 기록된다.
본 발명은 기존의 원문언어와 목표언어로 된 번역메모리를 개선하여 번역메모리 내에 소번역단위로 세분된 소번역단위를 번역한 소번역문을 포함하고, 소번역문이 번역문장을 완성하기 위해 정렬될 때의 정렬위치 정보를 갖는 소단위 대응관계지시자를 갖도록 구성된다. 이러한 지시자를 포함하는 소번역문은 원문언어를 번역할 때 비록 번역할 원문언어의 원문문장이 번역 메모리에 저장된, 이전에 번역된 원문문장과 100% 일치하지 않는다고 하더라도, 원문문장 내에서 일치하는 부분에 대한 소번역메모리를 이용하여 원문문장의 일부에 대해서도 번역 메모리를 이용가능하게 함으로써 번역의 정확성을 높이고 번역 시간을 단축시킬 수 있다.
원문문장이 100% 일치하지 않더라도 원문문장 내 소번역단위가 일치하면, 일치된 소번역단위에 해당하는 소번역단위 번역 메모리를 이용할 수 있으므로, 번역메모리의 활용 빈도를 높여서 번역 시간을 단축할 수 있다.
원문문장 대 번역문장 단위로 오류 체크를 할 때보다 원문문장을 더 세분화 한 소번역단위 대 번역문장을 세분화한 소번역단위(번역메모리로 저장된 경우 소번역메모리 단위)로 오류 체크할 수 있으므로, 컴퓨터에 의한 자동 오류 체크가 정확해지고 빨라져서, 번역이 제대로 되었는지 확인하는 리뷰 시간이 단축된다. 구체적으로, 원문문장 대 번역문장으로 단어를 1:1 매칭할 때보다 소번역단위와 번역단위 내의 단어들의 1:1 매칭율이 매우 높아지기 때문에 프로그램을 통한 용어 추출이 정확해지고, 또한 소번역단위가 원문문장을 구성하는 구절을 이루는 일부분이기 때문에 소번역단위에 대해 기계번역을 하더라도 소번역단위 내에서의 번역 정확도가 높아진다. 예를 들어, 기존의 원문 문장 대 번역 문장 오류 체크 프로그램은 원문 문장 내 동일한 단어 또는 숫자가 2회 이상 존재하는 경우 원문 문장 내 동일한 단어 또는 숫자의 위치를 정확하게 구분하지 못하여 오류 체크를 하지 못하는 문제점이 있었지만, 본 발명의 소번역단위 대 소번역문 단위의 오류 체크는 동일한 단어가 소번역단위 내에 존재할 확률이 원문 문장 내 동일한 단어 또는 숫자가 존재할 확률보다 현저하게 줄어들게 되어 오류 체크 프로그램의 성능을 크게 향상시킬 수 있다. 또한, 본 발명의 소번역단위 대 소번역문 단위의 오류 체크를 기존의 원문 문장 대 번역 문장에 대한 오류 체크와 병행하여 성능을 향상시킬 수 있다.
소번역메모리 DB에 저장된 원문문장 내의 단어 또는 단어를 포함하는 어절들(영어는 단어와 어절이 일치함)로 구성된, 원문문장에 대한 세분된 소번역단위에 대한 소번역문을 포함하여서, 소번역문의 문장성분 분석을 통하여, 원문문장에 대한 문장 성분 분석이 정확해지며(예를 들어, 번역문의 주격 조사, 목적격 조사, 보격 조사 분석을 통해 원문의 소번역단위의 문장성분을 추정할 수 있음), 원문문장에 있는 단어들의 대응 소번역문을 정확하게 추출할 수 있게 되므로, 번역 메모리에 대한 활용도가 높아진다. 이는 번역메모리 저장단계에서 소번역메모리들로 분할하여 저장하기 때문에, 원문과 번역문을 포함하는 번역메모리들을 통계적인 방법을 이용하여 번역 소단위들로 분할하고 번역 규칙을 찾는 통계 기반의 분할방법보다 정확도가 훨씬 높고, 통계 기반 자동번역에서 데이터 통계분석의 정확성을 높이기 위해 많은 번역메모리 데이터를 수집할 필요도 없다.
본 발명의 삽입정렬에 의한 정렬 방식은 언어학적으로 어순이 상이한 굴절어와 교착어 사이의 번역에서 원문의 대상 언어를 형태소 분석에 따라 소번역단위들로 분할하고 이에 대응하는 소번역문 및 소번역메모리를 형성한 후, 소번역문들을 목표 언어의 번역문장으로 빠르게 정렬할 수 있게 하므로, 굴절어와 교착어 간의 번역에 필요한 소번역메모리를 빠르고 정확하게 구축할 수 있게 한다.
소번역메모리를 포함하는 번역메모리가 쌓일수록 새로운 원문문장에 적용할 소번역메모리들이 많아지기 때문에 사용자는 직접 소번역단위들을 번역하지 않고 CAT 프로그램을 이용하여 직접 타이핑하는 시간을 줄일 수 있으므로, 번역 속도가 빨라지게 된다.
도 1a 및 도 1b는 종래의 번역메모리를 도시한다.
도 2a는 본 발명에 따른 소번역메모리를 포함하는 번역메모리로 저장하기 위해 만들어지는 중간단계 소번역메모리를 생성하는 유저 인터페이스 유닛의 입력 유닛 및 표시 유닛의 실시예이다.
도 2b는 본 발명에 따른 소번역메모리를 생성하기 위한 유저 인터페이스 유닛의 입력 유닛 및 표시 유닛의 다른 실시예이다.
도 2c 및 도 2cc는 본 발명에 따른 1차 소번역메모리를 생성하기 위한 1차 소번역메모리 입력 유닛 및 2차 소번역메모리를 생성하기 위한 2차 소번역메모리 입력 유닛의 실시예이다.
도 2d는 본 발명에 따른 소번역메모리를 생성하기 위한 유저 인터페이스 유닛의 입력 유닛에서 인접한 두 개의 소번역메모리의 소번역문에 대한 삽입정렬의 실시예이다.
도 3a 내지 도 3l는 본 발명에 따른 소번역메모리를 포함하는 번역메모리의 실시예이다.
도 4은 본 발명의 일 실시예에 따른 소번역메모리를 포함하는 번역 메모리 적용 장치에 대한 블록 구성도이다.
도 5a 내지 도 5d는 본 발명에 따른 소번역메모리를 포함하는 번역메모리를 이용한 역방향 번역메모리의 실시예이다.
도 6은 본 발명에 따른 소번역메모리를 포함하는 번역메모리 이용 방법의 일 실시예에 대한 순서도이다.
도 7은 본 발명에 따른 소번역메모리를 포함하는 번역메모리 이용 방법의 다른 실시예에 대한 순서도이다.
도 8a는 원문 언어가 영어이고 목표언어가 일본어인 소번역메모리를 포함하는, 도 3d에 대응하는 번역 메모리의 실시예를 도시하고, 도 8b는 원문 언어가 영어이고 목표언어가 일본어인 소번역메모리를 포함하는, 도 3e에 대응하는 번역 메모리의 실시예를 도시한다.
도 8c는 원문 언어가 영어이고 목표언어가 중국어인 소번역메모리를 포함하는, 도 3d에 대응하는 번역 메모리의 실시예를 도시하고, 도 8d는 원문 언어가 영어이고 목표언어가 중국어인 소번역메모리를 포함하는, 도 3e에 대응하는 번역 메모리의 실시예를 도시한다.
본 발명은 영어를 원문 문장으로 한국어를 번역 문장으로 하여 기술된다. 이외에도, 본 발명은 굴절어를 교착어로 번역하여 구축되는 번역 메모리, 또는 교착어를 굴절어로 번역하여 구축되는 번역 메모리에 이용 또는 응용될 수 있다.
본 발명에서 발명자가 정의한 용어의 정의는 다음과 같다(정의된 용어들은 본 발명에서만 적용되며 자연어 처리에 관해 통용되는 용어들과 일치하지 않을 수도 있다):
원문문장(1): 원문언어로 된 번역될 문장의 번역 단위(Traslation Units). 번역 단위는 단락 원문문장 또는 원문문장보다 작은 단위로 지정될 수 있으나, 본 발명에서는 특별히 다르게 언급되는 것을 제외하고 번역이 이루어져 번역 메모리로 저장되는 원문 문장을 번역단위로 한다.
번역문장(6): 원문언어로 된 번역될 원문 문장을 목표언어로 번역한 번역 문장으로, 번역 단위(TU)가 되는 원문과 짝을 이루어 번역 메모리가 된다.
파싱 단위(Parsing Unit): 컴퓨터가 번역 단위(TU)인 원문 문장 내에서 형태소 분석을 통해서 소번역단위가 될 수 있는 단위로서, 기계적인 분할 규칙에 의해 분할된 원문문장 내의 단어 또는 하나 이상의 단어들의 집합체이다.
소번역단위(2), 소번역문(7) 및 소번역메모리(9): 소번역단위는 번역문장으로 번역되는 번역단위(TU)를 여러 개의 소단위로 세분화한 단위로서, 하나 이상의 파싱 단위들로서 구성될 수 있다.
소번역문은 번역 메모리의 원문의 소번역단위에 대응하는, 번역문장 내의 부분번역문으로 정의된다. 소번역문은 소번역단위에 대한 번역부분이고 소번역단위들에 대한 소번역문들을 정렬하면 번역문장이 된다. 번역 메모리의 원문 문장은 복수 개의 소번역단위들로 구성되고, 번역메모리의 번역 문장은 복수 개의 소번역단위들에 대응하는 소번역문들로 구성되며, 복수 개의 소번역단위들에 대응하는 소번역문들을 정렬하면 번역 문장이 완성될 수 있다.
소번역메모리는 소번역단위 및 이에 대응하는 번역문인 소번역문의 쌍을 포함하고, 본 발명에서 번역 메모리는 소번역메모리들을 포함한다. 따라서, 소번역메모리를 포함하는 번역메모리는 소번역단위(2)를 포함하는 번역 단위인 원문 문장(1), 및 소번역단위(2)에 대한 번역 부분인 소번역문(7)을 포함하는 번역문장(6), 그리고 소번역단위(2)와 소번역문(7) 간의 대응관계를 나타내는 소단위 대응관계지시자(8)를 포함한다. 소번역메모리는 소번역단위와 소번역문의 쌍이기 때문에, 소번역단위에 대한 번역문인 소번역문이 생성되면 동시에 소번역메모리도 완성될 수 있다.
본 발명에서 원문 문장이 번역단위가 되면, 이러한 원문 문장이 번역단위(TU)를 여러개의 소번역단위로 세분화할 수 있고, 소번역단위는 이미 저장된 소번역메모리의 소번역단위이 존재하는 경우 이러한 저장된 소번역메모리의 소번역단위 및 이미 저장된 분할패턴에 의해 결정될 수도 있다.
또한, 소번역메모리는 그 자신도 다시 세분화되어 2차 소번역단위(202), 2차 소번역문(207) 및 2차 소단위 대응관계 지시자(208)를 포함하는 2차 소번역메모리를 가질 수 있다. 2차 소번역메모리를 갖는 소번역메모리를 1차 소번역메모리라고 한다.
소단위 대응관계지시자(8): 원문문장(1)의 소번역단위(2)와 번역문장의 소번역문(7) 간의 소단위(sub-unit) 대응 관계를 나타내는 지시자로서, 번역메모리를 구성하는 소번역메모리는 번역메모리 내에서 소단위 대응관계지시자에 의해 특정되기 때문에, 소번역메모리의 갯수는 소단위 대응관계지시자의 갯수와 일치한다. 소단위 대응관계지시자(8)는 소번역단위의 원문 문장 내 정렬위치를 가리키는 정보인 소번역단위위치정보(8')와 소번역문의 번역 문장 내 정렬위치를 가리키는 정보인 소번역문위치정보(8")를 포함한다. 소번역문위치정보(8")는 하나의 번역문장을 이루는 소번역문들 간의 정렬 위치를 지정한다. 소번역문은 번역메모리를 구성하는 원문의 소번역단위(2)에 대한 번역부분으로서, 소번역단위(2)를 번역하여 생성한 소번역메모리의 번역문 부분이고, 이러한 소번역문들을 소단위 대응관계지시자의 소번역문위치정보(8")에 따라 정렬하면 번역메모리의 번역문장이 된다.
중간단계 소단위 대응관계지시자(4): 소번역단위(2)들을 순차적으로 번역하고 정렬하는 과정에서 소번역단위(2)와 소번역단위(2)에 대한 소번역문의 대응관계를 나타낸다. 소단위 대응관계지시자(6)로 저장되기 전 소번역단위(2)의 번역부분들의 순번을 포함함. 중간단계 소번역단위의 원문 문장 내 정렬위치를 가리키는 정보인 소번역단위위치정보(4')와 중간단계 소번역문의 번역 문장 내 정렬위치를 가리키는 정보인 소번역문위치정보(4")를 포함할 수 있다. 중간단계 소단위 대응관계지시자(4)를 포함하는 번역메모리로 본 발명의 소번역메모리를 포함하는 번역메모리를 표시할 수도 있다(도 2a 및 도 2b).
삽입위치지시자(5): 인접하는 두개의 소번역문들 중 앞쪽에 위치하는 소번역문 내로 뒷쪽에 위치된 인접하는 소번역문의 삽입을 지시하는, 소번역문위치정보에 포함된 지시자로서, 소번역문들을 완성한 후 번역문장을 완성하기 위해 이를 정렬할 때, 정렬 순서에 따라 인접하는 두개의 소번역문들 중 하나의 소번역문이 다른 하나의 소번역문 내로 삽입되는 위치를 지시하는 표시이다.
역방향 소단위 대응관계지시자: 소번역메모리를 포함하는 번역메모리에서 추출된 소단위 대응관계지시자를 원문언어와 목표언어가 반대가 되는 역방향 소번역 메모리를 생성할 때 역방향 소번역메모리의 소번역단위와 소번역문 간에 지정된 소단위 대응관계지시자(144)이다.
어절: 문장을 이루는 도막도막의 마디. 문장 성분의 최소 단위로서 띄어쓰기의 단위가 됨.국문 문장인 경우를 예를 들어, "나는 집에 가고 있다." 는 "나는/집에/가고/있다." 와 같이 네 개의 어절로 구성되는 것으로 정의되고, 영문 문장인 경우를 예를 들어, "I am going home" 은 "I/am/going/home." 과 같이 네 개의 어절로 구성되는 것으로 정의된다.
단어: 자립성(自立性)과 분리성(分離性)을 가진 말의 최소 단위. 최소한 1개 이상의 형태소로 이루어지고, 일정한 뜻을 가짐. 영어는 단어와 어절이 일치하고, 한국어는 단어에 조사 등이 붙어 어절이 된다.
도 4는 본 발명의 일 실시예에 따른 소번역메모리를 포함하는 번역 메모리 적용 장치에 대한 블록 구성도이다. 사용자 인터페이스 유닛(10), 기본 번역 메모 매칭 유닛(20), 형태소 분석 유닛(40), 문장 파싱 유닛(50), 비교유닛(60), 소번역단위 결정 유닛(70), 소단위 대응관계지시자 생성 유닛(80), 소번역메모리를 포함하는 번역 메모리 생성 유닛(90), 소번역메모리를 포함하는 번역메모리 데이터 베이스(100, 이하 "소번역메모리 DB"라고 한다), 소번역메모리 생성 유닛(110) 및 확장된 소번역메모리를 포함하는 번역메모리 DB(120)(이하, "확장 소번역메모리 DB"라고 함)를 포함할 수 있다.
사용자 인터페이스 유닛(10)은 중간소번역메모리 입력 유닛(11) 및 표시 유닛(12)을 포함한다. 사용자는 중간소번역메모리 입력 유닛(11)을 통해 원문문장의 소번역단위로부터 소번역문을 포함하는 소번역메모리를 생성할 때 일반적으로 원문문장을 번역할 때 걸리는 시간을 초과하지 않으면서 원문문장을 소번역메모리 단위로 저장할 수 있도록 소번역단위의 결정 및 결정된 소번역단위가 순차번역을 제공할 수 있게 한다. 필요한 경우, 사용자는 중간소번역메모리 입력 유닛(11)을 통해, 사용자는 소번역메모리를 포함하는 번역 메모리 적용 장치를 위해 세분된 소번역단위의 길이(단어들의 수)를 조정할 수 있고, 중간단계 소번역메모리 생성 유닛으로부터 표시된 중간단계 소번역메모리를 수정할 수 있다. 표시 유닛(12)은 소번역메모리를 포함하는 번역메모리 DB(100)와 원문문장이 매칭되면 기본 번역 메모리 매칭 유닛(20)을 통해 사용자에게 표시하고, 비매칭되면 형태소 분석을 위해 비매칭된 원문문장을 출력한다.
기본 번역 메모리 매칭 유닛(20)은 종래의 번역 메모리와 동일한 방법으로 소번역 메모리를 포함하는 번역 메모리와 원문문장 전체가 매칭되는지를 판단할 수 있다. 기본 번역 메모리 매칭 유닛(20)으로부터 기본 번역 메모리DB와 원문문장이 매칭되는지를 판단하여 매칭되면 번역 메모리 DB의 번역문장을 표시 유닛(12)에 표시하고 소번역메모리를 포함하는 번역메모리 DB에 저장하며, 매칭되지 않으면 형태소분석유닛(40)이 원문문장을 형태소 분석을 한다.
문장 파싱 유닛(50)은 형태소 분석된 단어들 중, 문장의 맨 앞 단어부터 순차적으로, 품사가 적어도 명사인 단어 뒤를 파싱(parsing)한다. 이러한 파싱 단위는 컴퓨터 또는 사용자가 원문문장에서 번역하는 최소한의 번역 단위가 될 수 있다.
비교 유닛(60)은 문장 파싱 유닛(50)에서 파싱된 파싱 단위가 소번역메모리 DB(100) 내의 원문문장의 소번역단위와 일치하는지 여부를 판단한다. 또한, 문장 파싱 유닛(50)에서 파싱된 파싱 단위를 확장 소번역메모리 DB(120) 내의 원문문장의 소번역단위와 일치하는지 여부를 판단하고 그 결과를 출력한다. 소번역단위 결정 유닛(70)은 비교 유닛(60)으로부터의 비교 결과에 따라 소번역단위를 결정하고 표시 유닛(12)에 표시하며, 사용자는 번역될 소번역단위를 직접 수정할 수 있다.
소번역메모리를 포함하는 번역 메모리 생성 유닛(90)은 중간단계 소번역메모리 생성 유닛(91)과 번역 엔진 유닛(92)을 포함한다. 소번역단위가 결정되면 중간단계 소번역메모리 생성 유닛(91)은 소번역메모리를 포함하는 번역메모리 DB 및 확장 소번역메모리 DB 내의 소번역단위에 대응하는 소번역문 및 확장 소번역메모리로부터 번역될 소번역단위에 대한 소번역메모리를 호출하고 표시 유닛(12)에 표시한다. 번역 엔진 유닛(92)은 소번역메모리를 포함하는 번역메모리 DB 및 확장 소번역메모리 DB 내의 소번역단위에 대응하는 소번역문을 포함하는 소번역메모리 및 확장 소번역메모리의 소번역단위와 번역될 소번역단위가 100%일치하지 않는 경우 ,예를 들어 동사의 시제의 불일치, 동사의 목적어의 불일치, 명사의 수의 불일치, 등의 경우에, 소번역메모리를 포함하는 번역메모리 DB 또는 확장 소번역메모리 DB 내의 소번역단위에 대응하는 소번역문을 포함하는 소번역메모리 및 확장 소번역메모리의 소번역단위와, 결정된 소번역단위를 비교하여 불일치 부분을 번역 엔진을 통해 번역한다. 이후 불일치 부분을 번역 엔진의 번역으로 치환하여, 소번역메모리를 포함하는 번역메모리 DB 또는 확장 소번역메모리 DB 내의 소번역단위에 대응하는 소번역문을 포함하는 소번역메모리 또는 확장 소번역메모리의 소번역단위를 수정한다. 이러한 번역 엔진을 통한 번역은 문장 전체에 대한 기계번역이 아니라, 번역단위인 원문문장을 세분한 하나의 소번역단위에 대한 기계번역이므로, 문장 전체에 대한 기계 번역들보다 훨씬 높은 정확도를 가질 수 있다. 단문의 기계번역은 번역 정확도가 일정 수준으로 담보됨을 고려한 것이다.
소단위 대응관계지시자 생성 유닛(80)는 소번역단위 결정 유닛(70)으로부터 원문문장의 소번역단위가 결정되면 원문문장에서 소번역단위의 원문 문장 내 정렬위치를 가리키는 정보인 소번역단위위치정보(4', 8')를 생성하고, 이에 대응관계에 있는, 소번역메모리를 포함하는 번역메모리 생성 유닛(90)으로부터 소번역문의 번역 문장 내 정렬위치를 가리키는 정보인, 소번역문위치정보(4", 8")를 생성한다.
소번역메모리를 포함하는 번역메모리 DB(100)는 소번역메모리를 포함하는 번역메모리 생성 유닛(90)으로부터 생성된 소번역메모리를 포함하는 번역메모리를 저장해 놓은 데이터베이스이다.
확장소번역메모리 생성 유닛(110)은 문장성분 및 형식분석유닛(111) 및 소번역메모리분석유닛(112)을 포함한다. 본 발명의 번역메모리는 원문문장 내의 단어 또는 단어를 포함하는 어절들로 구성된, 원문문장에 대한 세분된 소번역단위에 대한 소번역문을 포함하여서, 원문문장에 대한 문장 성분 분석이 정확해지며, 원문문장에 있는 단어들의 대응 번역부분을 정확하게 추출할 수 있게 되므로, 번역메모리에 대한 활용도가 높아진다. 예를 들어 소번역문와 소번역단위의 대응관계에 관한 정보로부터 소번역문이 한국어인 경우 한국어는 조사에 의해 정확하게 문장성분의 파악이 가능하므로, 소번역문들을 분석하여 원문문장에서 동일한 원문 단어에 대한 공통된 소번역문의 번역을 분석하여 소번역문의 번역 패턴('번역 태그'라고도 함, 공통된 부분을 품사로 인자로 저장한 부분)을 추출하여, 문장 전체가 아닌 소번역문에 대한 확장 소번역메모리 구축을 가능하게 한다. 이러한 확장 소번역메모리는 종래의 문장 단위 번역메모리의 확장 메모리보다 세분되어 문장 내의 소번역단위에 대해 구축되기 때문에 월등하게 정확하고 활용도가 높게 된다. 문장성분 및 형식분석유닛(111)은 상기 번역메모리 DB(100)에 저장된 소번역메모리를 포함하는 번역메모리의 문장 성분 및 문장 형식등을 분석하여 중간단계 소번역메모리생성유닛(91)에서 유사한 문장 성분 및 형식을 갖는 소번역단위의 번역에 이용되도록 한다. 소번역메모리분석유닛(122)은 번역메모리 DB(100)의 소번역메모리들을 기초로 소번역단위의 형태소 및 문장성분을 분석하여 공통되는 동사, 명사 등을 갖는 소번역메모리들의 번역 패턴으로부터 번역메모리 DB를 확장한다.
본 발명의 일 실시예에서, 원문언어로 된 원문문장을 세분한 소번역단위에 대해 목표언어로 번역한 소번역메모리를 포함하는 번역 메모리 적용 프로그램은
a) 새로 번역될 새로운 원문문장을 입력하는 기본번역메모리 매칭유닛(20);
*b) 불러온 번역될 원문문장을 구성하는 단어들의 형태소를 분석하는 형태소 분석 유닛(40);
c) 형태소 분석된 단어들 중, 문장의 맨 앞 단어부터 순차적으로, 품사가 명사 및 대명사인 단어 뒤까지, 그리고 접속사인 단어 앞 및 귀까지 세분되는, 하나 이상의 원문문장의 단어들로 구성된 하나 이상의 파싱 단위(parsing unit)들을 형성하는 문장 파싱 유닛(50);
d) 번역될 맨 앞의 하나의 파싱 단위부터 순차적으로 다음 파싱단위를 시작 파싱단위로 하고, 번역될 원문문장의 끝에 위치한 파싱 단위부터 순차적으로 하나 씩 제외하면서 역순으로 종료 파싱단위를 지정하여, 상기 시작 파싱단위부터 상기 종료 파싱단위까지 연속되는 파싱단위들을 소번역메모리 DB)와 비교하는, 비교유닛(60);
상기 비교 유닛(60)에서 번역될 원문문장을 구성하는 상기 순차적인 파싱단위들이 소번역메모리 DB의 원문문장 내의 하나 이상의 소번역단위와 일치하는지 여부를 비교하여, 번역될 맨 앞의 하나의 파싱 단위부터 순차적으로, 소번역메모리 DB의 원문문장 내의 하나 이상의 소번역단위와 전체적으로 또는 부분적으로 일치하는 가장 긴 순차적인 파싱단위들을 하나의 소번역단위로 결정하는, 소번역단위 결정 유닛(70);
상기 소번역단위결정 유닛(70)에서 결정된 소번역단위와 전체적으로 일치하는 소번역메모리 DB의 원문문장 내의 하나 이상의 소번역단위에 대응되는 하나 이상의 소번역문을, 번역될 소번역단위의 새로운 소번역문으로 치환하여 번역될 소번역단위에 대한 소번역문을 생성하고, 상기 소번역단위결정 유닛(70)에서 결정된 소번역단위와 부분적으로 일치하는 소번역메모리 DB의 원문문장 내의 하나 이상의 소번역단위에 대응되는 하나 이상의 소번역문을, 소번역메모리 DB의 소번역문와 비교하고, 일치하지 않는 부분을 번역 엔진의 번역으로 치환하여, 번역될 소번역단위의 새로운 소번역문을 생성하는, 번역 메모리 생성 유닛(90); 및
상기 원문 문장 내에서의 상기 소번역단위의 소번역단위 위치정보를 나타내는 소번역단위의 소번역단위위치정보를 결정하고, 상기 결정된 소번역단위로부터 소번역문을 생성하고 소번역문의 소번역문위치정보를 결정하는 소단위 대응관계지시자 생성유닛(80);을 포함한다.
도 2a는 본 발명에 따른 소번역메모리를 포함하는 번역메모리로 저장하기 위해 만들어지는 중간단계 소번역메모리의 실시예이며, 도 3a 내지 도 3l는 본 발명에 따른 소번역메모리를 포함하는 번역메모리의 실시예이다.
원문언어로 된 원문 문장 및 목표언어로 된 번역 문장의 쌍을 포함하며 소단위 번역메모리(9)를 포함하는 번역 메모리는 소번역메모리는 원문 문장을 번역 소단위로 세분화한 소번역단위(2) 및 소번역단위에 대응하는 번역 문장 내의 번역 부분인 소번역문(7)의 쌍을 포함하되, 번역 메모리는 번역 메모리 내에서 소번역메모리를 특정하는 소단위 대응관계지시자(8)를 포함하고, 소단위 대응관계지시자에 의해 상기 번역 메모리 내에서 상기 소번역메모리의 소번역단위 및 소번역문 쌍의 대응 관계가 표시된다.
영어 원문과 한국어 번역문의 예시를 들어 본 발명을 설명하면, 원문문장 원문에 대해 번역 메모리는 다음과 같다
원문문장 A second operating BZ2 state can be a operating state at which a very small amount of fuel (in contrast to operating state BZ1) is metered, especiallly for catalyst heating.
중간단계 소번역메모리 입력유닛(11) A second operating BZ2 state[제 2 작동 BZ2 상태는 ]5-1/ can be a operating state[작동 상태일 수 있다.]10-7/ at which a very small amount[매우 작은 양의 ]16-3/of fuel[연료가 ]18-4/ (in contrast to operating state BZ1)[(작동 상태 BZ1와 대조적으로) ]24-2/is metered,[계량되는 ]26-6/ especiallly for catalyst heating[특히 촉매 가열을 위해 ]30-5/
표시유닛(12) - 대응관계지시자에 따라 []안의 내용이 표시부에 표시됨 제 2 작동 BZ2 상태는 (작동 상태 BZ1와 대조적으로) 매우 작은 양의 연료가 특히 촉매 가열을 위해 계량되는 작동 상태일 수 있다.
[원문]
A second operating BZ2 state can be a operating state at which a very small amount of fuel (in contrast to operating state BZ1) is metered, especiallly for catalyst heating.
[번역문]
제 2 작동 BZ2 상태는 (동작 상태 BZ1와 대조적으로) 매우 작은 양의 연료가, 특히 촉매 변환기 가열을 위해 계량되는 작동 상태일 수 있다.
기존 번역 메모리는 문장 단위로 번역 메모리를 불러오기 때문에 원문에 대한 번역 메모리는 '//'로 구분하여 원문과 번역문을 저장한다.
A second operating BZ2 state can be a operating state at which a very small amount of fuel (in contrast to operating state BZ1) is metered, especiallly for catalyst heating.//제 2 작동 BZ2 상태는 (동작 상태 BZ1와 대조적으로) 매우 작은 양의 연료가, 특히 촉매 변환기 가열을 위해 계량되는 작동 상태일 수 있다.
그러나, 기존 번역 메모리는 원문문장 내 단어들이 번역문장에서 어떻게 번역되었는지에 관한 대응관계 정보를 포함하고 있지 않다. 양 언어의 형태소 분석 등을 통해 양 단어들의 대응관계를 추론할 수 있을 뿐이다.
다음은 본 발명에 따른 원문문장 내 단어들이 번역문장에서 어떻게 번역되었는지 알 수 있는 각각의 소번역단위에 대한 소번역문을 포함하는 소번역메모리를 갖는 번역 메모리의 실시예이다(도 3e).
A second operating BZ2 state can be a operating state at which a very small amount of fuel (in contrast to operating state BZ1) is metered, especiallly for catalyst heating.// 제 2 작동 BZ2 상태는 4/(작동 상태 BZ1와 대조적으로) 매우 작은 양의 연료가 특히 촉매 가열을 위해 계량되는 작동 상태일 수 있다. [5-5,24-9,16-12,18-13,30-17,26-18,10-22]
여기서, 소단위 대응관계지시자(8)들인 [5-5,24-9,16-12,18-13,30-17,26-18,10-22]는 소번역메모리 각각에 대한 소단위 대응관계지시자(8)이며, 차례로, 5-5는 제1 소번역단위에 대한 제1 소번역메모리에 지정된 소단위 대응관계지시자를 나타내며, 제2 소번역단위에 대한 제2 소번역메모리에 지정된 소단위 대응관계지시자는 24-9이 되며, 마지막 10-21은 제7 소번역단위에 대한 제7 소번역메모리에 지정된 소단위 대응관계지시자이다.
소단위 대응관계지시자의 소번역단위위치정보(8')는 원문문장의 소번역단위들의 위치를 나타내며, 소번역문위치정보(8")는 번역문장의 소번역메모리에 대한 위치 및 해당 소번역문의 정렬 위치를 나타내고 소번역단위위치정보와 소번역문위치정보 사이의 "-"는 소번역단위에 대응하는 소번역메모리 사이의 대응관계를 나타낸다.
따라서, 소단위 대응관계지시자는 '소번역단위의 소단위 대응관계지시자,' '-,' 및 '소번역메모리의 소단위 대응관계지시자'의 순서로 표시된다. 상기 실시예의 소단위 대응관계지시자인 [5-5,24-9,16-12,18-13,30-17,26-18,10-22]는 각각 [1∼5-1∼5,19∼24-5∼9,11∼16-9∼12,18-13,27∼30-13∼17,19∼26-18,6∼10-18∼22]의 소번역단위에 대응하는 소번역메모리의 대응 관계를 시작단어(또는 어절)과 끝단어(또는 어절)로 표현한 것이다. 즉 제1 소번역단위는 1∼5까지의 어절이며 제1 소번역메모리는 1∼4까지의 어절이며, 제2 소번역단위는 19∼24까지의 어절이며, 제2 소번역메모리는 5∼8까지의 어절이고, 또한, 제7 소번역단위는 6∼10까지의 어절이며, 제7 소번역메모리는 18∼21까지의 어절이다.
결국, 종래의 번역 메모리와 가장 근접한 포멧의 최종적인 소단위 대응관계지시자 [5-5,24-9,16-12,18-13,30-17,26-18,10-22]는 소번역단위에 대응하는 소번역메모리의 대응 관계를 시작 위치를 생략하고 끝어절 중심으로 표시한 것임을 알 수 있다.
도 3e는 번역문장의 순서에 의한 소단위 대응관계지시자를 표시한 것이고, 도 3f의 소단위 대응관계지시자인 [5-5, 10-22, 16-12, 18-13, 24-9, 26-18, 30-17]는 도 3e의 소번역메모리를 포함하는 번역메모리를 원문 문장의 순서에 따라 소단위 대응관계지시자를 표시한 것이다.
도 3g는 도 3f를 소단위 대응관계지시자를 커서가 이동하는 단위를 기준으로 소단위 대응관계지시자를 표시한 것이다. 도 3f와 차이점은 도 3f의 원문 문장에서의 소번역단위 at which a very small amount/ of fuel를 병합하여 하나의 소번역단위 at which a very small amount of fuel로 결정한 것이다. 따라서, 원문의 소번역단위와 이에 대응하는 소번역문을 생성하고 소단위 대응관계지시자를 생성하는 과정은 아래와 같이 나타난다.
A second operating BZ2 state [제 2 작동 BZ2 상태는]5-/ can be a operating state[작동 상태일 수 있다.]10-/ at which a very small amount of fuel[매우 작은 양의 연료가]18-/ (in contrast to operating state BZ1)[(작동 상태 BZ1와 대조적으로)]24-/ is metered,[계량되는]26-/ especiallly for catalyst heating.[특히 촉매 가열을 위해]30-/
A second operating BZ2 state can be a operating state at which a very small amount of fuel (in contrast to operating state BZ1) is metered, especiallly for catalyst heating.
제 2 작동 BZ2 상태는/ (작동 상태 BZ1와 대조적으로)/ 매우 작은 양의 연료가/ 특히 촉매 가열을 위해/ 계량되는/ 작동 상태일 수 있다.[5-5, 10-22, 18-13, 24-9, 26-18, 30-17]
A second operating BZ2 state can be a operating state at which a very small amount of fuel (in contrast to operating state BZ1) is metered, especiallly for catalyst heating.
제 2 작동 BZ2 상태는 (작동 상태 BZ1와 대조적으로) 매우 작은 양의 연료가 특히 촉매 가열을 위해 계량되는 작동 상태일 수 있다.[5-5, 10-22, 18-13, 24-9, 26-18, 30-17]
다른 실시예에서, 소단위 대응관계지시자는 어절 단위가 아닌 커서가 이동하는 단위(일반 문자는 1 바이트, 특수문자는 2바이트)로 표시될 수 있다. 어절이 아닌 커서가 이동하는 단위로 소단위 대응관계지시자를 표시하면 다음과 같다.
A second operating BZ2 state can be a operating state at which a very small amount of fuel (in contrast to operating state BZ1) is metered, especiallly for catalyst heating.
제 2 작동 BZ2 상태는 (작동 상태 BZ1와 대조적으로) 매우 작은 양의 연료가 특히 촉매 가열을 위해 계량되는 작동 상태일 수 있다.[ 0-28|0-14|0, 29-24|65-11|5, 54-36|34-12|2, 91-36|15-18|1, 128-11|60-4|4, 140-32|47-12|3 ]
여기서 [ 0-28|0-14|0, 29-24|65-11|5, 54-36|34-12|2, 91-36|15-18|1, 128-11|60-4|4, 140-32|47-12|3 ]는 각각[5-5, 10-22, 18-13, 24-9, 26-18, 30-17]에 대응한다. 소단위 대응관계표시자의 포멧은 '소번역단위위치정보|소번역문위치정보|소번역문정렬순서'이다. 예를 들어, 소번역메모리"A second operating BZ2 state 제 2 작동 BZ2 상태는"를 표시하는 소단위 대응관계지시자 "0-28|0-14|0"를 살펴보면, 소단위 대응관계지시자 0-28|0-14|0에서 소번역단위위치정보는 0-28이고 소번역문위치정보는 0-14 및 정렬정보인 마지막의 0이다.
소단위 대응관계지시자의 소번역단위위치정보(0-28)는 원문 문장 내에서 원문 문장의 첫 문자(A)으로부터 해당 소번역단위의 첫 문자(A) 및 원문 문장의 첫 문자로부터 마지막 문자('state'의 마지막 문자 e)까지 카운트한 위치(0-28)를 포함하고, 소단위 대응관계지시자의 소번역문위치정보(0-14|0)는 번역문 문장 내에서 번역문 문장의 첫 문자('제'자)로부터 해당 소번역문의 첫 문자(제) 및 번역문 문장의 첫 문자로부터 마지막 문자('상태는'의 마지막 문자 '는')까지 카운트한 위치(0-14), 및 번역 문장 내에서 해당 소번역문의 정렬 순서(0)를 나타내는 위치를 포함한다. 소번역문 '제 2 작동 BZ2 상태는'의 번역문장 내에서 정렬 위치는 맨앞이므로 0이다. 두번째 소번역메모리의 소번역문 '작동 상태일 수 있다.'의 정렬 순서는 '29-24|65-11|5'의 '|'기호로 구분된 정렬 순서 부분인 맨 마지막 부분이며 맨 마지막이므로 5이다.
일 실시예에서, 정렬 순서에 의해 정렬된 소번역메모리들의 소번역문들을 정렬할 때, 인접하는 두 개의 소번역문들 중 앞쪽에 위치한 소번역문(이하 "피삽입 소번역문"이라고 함) 내로 뒷쪽에 위치한 소번역문(이하 "삽입 소번역문"이라고 함)이 삽입되는 위치를 지시하는 삽입위치지시자를 포함할 수 있고, 상기 삽입위치지시자에 의해 상기 피삽입 소번역문이 삽입위치지시자의 위치를 기준으로 전반부(8a) 및 후반부(8b)로 특정되며, 상기 피삽입 소번역문의 번역 문장 내 위치를 지시할 수 있는 숫자들은 번역문 문장의 첫 문자에 대한 상기 피삽입 소번역문의 전반부(8a)의 첫 문자의 시작위치 및 전반부(8a)의 마지막 문자의 종료위치, 그리고 상기 번역문 문장의 첫 문자에 대한 후반부(8b)의 첫 문자의 시작위치 및 후반부(8b)의 마지막 문자의 종료위치를 지시한다.
도 2d는 인접하는 2개의 소번역문들에서 뒷쪽에 정렬된 소번역메모리의 소번역문이 앞쪽에 정렬된 소번역문 내 '\'위치에 삽입되는 소번역메모리를 생성하는 입력 유닛(111)을 도시하고, 도 3j, 도 3k 및 도 3l는 이러한 삽입정렬에 의해 생성된 소번역메모리의 예이다.
도 2d에 도시된 바와 같이, 영어 어순과 한글 어순이 다르기 때문에, 삽입정렬의 방법을 이용하면, 정렬만의 방법으로 번역문장을 완성할 때보다 소번역메모리의 수를 줄이면서 더 긴 소번역메모리의 생성이 가능해진다.
도 3j, 도 3k 및 도 3l에서 소단위 대응관계표시자의 소번역문위치정보의 삽입위치지시자 '/'(도면번호 5)는 정렬된 인접하는 두개의 소번역문들 중 뒷쪽에 정렬된 삽입 소번역문이 삽입되는 앞쪽의 피삽입 소번역문 '\'위치(\은 소번역문에서의 뒤의 소번역문의 삽입위치를 나타내는 소번역문 삽입위치지시자임)에 삽입되는 것을 지시한다.
도 2d에서 원문문장은 관계사 앞에서 두개의 단문으로 분할될 수 있으므로, 원문은 2개의 소번역단위로 분할될 수 있다. 이 경우 소번역단위위치정보 및 소번역문을 다음과 같다.
A second operating BZ2 state can be a operating state[제 2 작동 BZ2 상태는 작동 상태일 수 있다.]10-/
at which a very small amount of fuel (in contrast to operating state BZ1) is metered, especiallly for catalyst heating.[(작동 상태 BZ1와 대조적으로) 매우 작은 양의 연료가 특히 촉매 가열을 위해 계량되는]22-/
이를 정렬하여 완성된 문장을 만들기 위해서는 앞쪽 소번역문의 '작동 상태'앞인 '\'위치에 뒤쪽 소번역문이 삽입되어야 한다.
A second operating BZ2 state can be a operating state[제 2 작동 BZ2 상태는 \작동 상태일 수 있다.]10-/
at which a very small amount of fuel (in contrast to operating state BZ1) is metered, especiallly for catalyst heating.[(작동 상태 BZ1와 대조적으로) 매우 작은 양의 연료가 특히 촉매 가열을 위해 계량되는]30-/
\ 자리에 뒷쪽 소번역문을 삽입하여 번역문장을 완성하면 소번역문위치정보는 다음과 같이 생성될 수 있다.
A second operatingBZ2 state can be a operating state[제 2 작동 BZ2 상태는 \작동 상태일 수 있다.]10-5/22
at which a very small amount of fuel (in contrast to operating state BZ1) is metered, especiallly for catalyst heating.[(작동 상태 BZ1와 대조적으로) 매우 작은 양의 연료가 특히 촉매 가열을 위해 계량되는]30-18
따라서, 도 2d의 삽입정렬에 의해 생성된 소번역메모리의 소단위 대응관계지시자는 도 3j와 같이 [10-5/22, 30-18]로 나타난다. '\'는 삽입지시자이고, 소번역문 [제 2 작동 BZ2 상태는 \작동 상태일 수 있다.]에서 '\'의 위치를 고려한 소단위 대응관계지시자 10-5/22의 소번역문위치정보는 5/22이다. 여기서, 10은 첫번째 소번역메모리의 소번역단위위치정보이고, 5/22는 첫번째 소번역메모리의 소번역문의 삽입위치를 나타낸다. 첫번째 소번역문의 '\' 앞쪽의 '제 2 작동 BZ2 상태는'의 완성된 번역문장에서 소번역문위치정보는 5이고 '\' 뒷쪽의 '작동 상태일 수 있다.'의 완성된 번역문장에서 소번역문위치정보는 22이므로, 5/22로 첫번째 소번역메모리의 소단위 대응관계지시자의 소번역문위치정보가 생성된다.
도 3k는 커서가 이동하는 하나의 문자단위로 카운트하여 삽입정렬의 방법으로 생성된 소번역메모리이다. 도3k와 같이, 소번역단위 및 소번역문의 앞 문자와 끝문자를 표시하는 방법에서, 첫번째 소번역메모리의 소단위 대응관계지시자 "0-53|0-14/65-11|0"의 '0-53'은 소번역단위 "A second operatingBZ2 state can be a operating state"의 '첫문자위치-끝문자까지의 갯수'를 나타내고, '0-14/65-11'은 소번역문 "제 2 작동 BZ2 상태는 \작동 상태일 수 있다."의 완성된 번역문장에서 "제 2 작동 BZ2 상태는"의 '첫문자위치-\전까지의 문자갯수인 0-14과, "\작동 상태일 수 있다."의 \뒤의 첫문자위치-끝문자까지의 갯수'인 65-11을 지시한다. 소단위 대응관계지시자에 '/'기호는 '/'를 포함하는 앞쪽의 피삽입 소번역문과 뒷쪽의 삽입 소번역문이 삽입정렬로 완성된 것을 나타내며, '/'를 포함하는 피삽입 소번역문에 뒷쪽에 있는 삽입 소번역문이 삽입됨을 지시한다.
도 3k에서 정렬 순서에 의해 정렬된 소번역메모리들의 소번역문들을 정렬할 때, 인접하는 두 개의 소번역문["제 2 작동 BZ2 상태는 \작동 상태일 수 있다." 및 "(작동 상태 BZ1와 대조적으로) 매우 작은 양의 연료가 특히 촉매 가열을 위해 계량되는"] 중 앞쪽에 위치한 소번역문 내로("제 2 작동 BZ2 상태는 \작동 상태일 수 있다."의 \의 위치) 뒷쪽에 위치한 소번역문("(작동 상태 BZ1와 대조적으로) 매우 작은 양의 연료가 특히 촉매 가열을 위해 계량되는")이 삽입되는 위치를 지시하는 삽입위치지시자('/')를 포함할 수 있고, 상기 삽입위치지시자에 의해 상기 피삽입 소번역문이 삽입위치지시자의 위치를 기준으로 전반부(8a)("제 2 작동 BZ2 상태는") 및 후반부(8b)("작동 상태일 수 있다.")로 특정되며, 상기 피삽입 소번역문의 번역 문장 내 위치를 지시할 수 있는 숫자들은 예를 들어 번역문 문장의 첫 문자에 대한 상기 피삽입 소번역문의 전반부(8a)의 첫 문자의 시작위치('0-14' 중 '0') 및 상기 시작위치로부터 전반부(8a)의 마지막 문자의 종료위치('0-14' 중 '14') 중 하나 이상, 그리고 상기 번역문 문장의 첫 문자에 대한 후반부(8b)의 첫 문자의 시작위치('65-11' 중 '65') 및 상기 시작위치부터 후반부(8b)의 마지막 문자의 종료위치('65-11' 중 '11') 중 하나 이상을 지시한다. 시작위치 및 종료위치 중 하나만을 지시하는 경우에는 다른 소번역문의 시작위치들 또는 종료위치들로부터 후속 처리를 통해 해당 소번역문의 나머지 하나의 시작위치 또는 종료위치를 알아낼 수 있다.
도 3l과 같은 하나의 문자마다 카운트하여 삽입위치지시자를 포함하는 소단위 대응관계지시자는 도 3j와 비교하여 어절 단위가 아닌 하나의 문자마다 카운트된 위치를 기록하기 때문에, 대상 언어가 한국어와 같이 삽입위치지시자가 명사와 조사 사이에 삽입되는 경우에도(통신들\에 관한 것이다) 표시가 가능하다. 예를 들어 원문 문장이 "Various embodiments are directed to device to device communications, and more particularly to controlling device to device communications." 이고, 삽입위치지시자를 포함하는 소번역메모리 및 상기 소번역메모리를 포함하는 번역메모리는 다음과 같다.
"Various embodiments are directed to device to device communications,[다양한 실시예들은 장치 대 장치 통신들에 관한 것이다.]0-68||"
"and more particularly to controlling device to device communications.[그리고 더 세부적으로는 장치 대 장치 통신들을 제어하는 것]69-69||", 여기서 69-69는 두번째 소번역메모리의 소번역단위가 원문의 69번째 문자 앞부터 시작하고 두번째 소번역단위의 길이가 69문자로 이루어짐을 나타낸다.
위의 소번역문들을 정렬하면 [다양한 실시예들은 장치 대 장치 통신들에 관한 것 그리고 더 세부적으로는 장치 대 장치 통신들을 제어하는 것이다.]가 되며, 이는 본 발명에서 설명한 정렬만으로는 완성번역문을 만들 수 없다. 위의 인접하는 두개의 소번역문들을 삽입정렬에 의해 문장을 완성하려면 두번째 소번역메모리의 소번역문은 첫번째 소번역문의 '통신들'과 '에 관한 것이다'사이에 다음가 같은 "\"의 삽입위치지시자 위치에 두번째 소번역문이 삽입되어야 한다. [다양한 실시예들은 장치 대 장치 통신들\에 관한 것이다.]
"Various embodiments are directed to device to device communications,68 and more particularly to controlling device to device communications. (원문의 아래 첨자 표시 68은 첫번째 소번역메모리의 소번역문 길이를 나타낸다.)
다양한 실시예들은 장치 대 장치 통신들21 그리고 더 세부적으로는 장치 대 장치 통신들을 제어하는 것54에 관한 것이다.[0-68|0-21/54-9|0, 69-69|22-32|1]" 여기서, 그리고 번역문의 아래첨자들 21, 54은 각각, 두번째 소번역메모리의 소번역문(삽입 소번역문)이 첫번재 소번역문(피삽입 소번역문) 내로 삽입정렬되었을 때 완성 번역문장에 대해서, 첫번째 소번역메모리의 소번역문에서의 '\'위치의 앞뒤에 대한 첫번째 소번역문(피삽입 소번역문)의 삽입으로 인한 분할된 위치들인, 피삽입 소번역문의 전반부의 종료위치(아래첨자 21) 및 후반부의 시작위치(아래 첨자 54)를 카운트한다. 완성된 소번역메모리를 포함하는 번역메모리는 다음과 같다.
"Various embodiments are directed to device to device communications, and more particularly to controlling device to device communications.
다양한 실시예들은 장치 대 장치 통신들 그리고 더 세부적으로는 장치 대 장치 통신들을 제어하는 것에 관한 것이다.[0-68|0-21/54-9|0, 69-69|22-32|1]"
도 3l과 같이, 하나의 문자로 소단위 대응관계지시자를 표시할 경우에는, 하나의 문자마다 카운팅하기 때문에, 어절과 어절 사이 뿐만 아니라 어절 내 삽입위치에 대해서도 정확하게 카운팅할 수 있는 장점이 있다. 이러한 삽입정렬은 대상 언어와 목표 언어 사이에 어순이 다른 경우(예를 들어, 대상 언어:굴절어, 목표 언어: 교착어), 즉, 소번역단위들의 어순과 소번역문들의 어순이 달라서 소번역문들의 정렬만으로 번역문장을 완성할 수 없게 분할된 경우에도(위와 같이, "다양한 실시예들은 장치 대 장치 통신들\에 관한 것이다." 및 "그리고 더 세부적으로는 장치 대 장치 통신들을 제어하는 것"), 소번역메모리들을 생성하고 소번역메모리들의 소번역문들을 조립(여기서 조립은 정렬 및 삽입정렬의 의미임)하여 번역문장을 완성할 수 있게 해준다.
다른 실시예에서, 2개 이상의 삽입위치지시자를 갖는 소번역메모리를 포함하는 번역메모리는 다음과 같다.
A second operating BZ2 state can be a operating state at which a very small amount of fuel (in contrast to operating state BZ1) is metered, especiallly for catalyst heating and idling.
제 2 작동 BZ2 상태는 (작동 상태 BZ1와 대조적으로) 매우 작은 양의 연료가 특히 촉매 가열 및 아이들링을 위해 계량되는 작동 상태일 수 있다.
[ 0-53|0-14/71-11|0, 54-118|15-40/62-9|1, 173-11|56-6|2]
상기 번역메모리에는 2개의 삽입위치지시자가 포함되어 있다.
위의 번역메모리는 다음의 소번역메모리들을 삽입위치지시자\에 의해 삽입정렬로 번역문장을 완성한 결과이다.
A second operating BZ2 state can be a operating state[제 2 작동 BZ2 상태는 \작동 상태일 수 있다.]/ at which a very small amount of fuel (in contrast to operating state BZ1) is metered, especiallly for catalyst heating[(작동 상태 BZ1와 대조적으로) 매우 작은 양의 연료가 특히 촉매 가열\을 위해 계량되는]/ and idling[및 아이들링].
첫번째 소번역문의 전반부("제 2 작동 BZ2 상태는")의 길이는 14이고 후반부("작동 상태일 수 있다")의 길이는 11이며, 두번째 소번역문의 전반부["(작동 상태 BZ1와 대조적으로) 매우 작은 양의 연료가 특히 촉매 가열"]의 길이는 40이고 후반부의 길이("을 위해 계량되는")는 9이다. 또한, 번역문장의 맨앞 첫어절에 대한 \의 위치를 표시하면 다음과 같다.
제 2 작동 BZ2 상태는14 15(작동 상태 BZ1와 대조적으로) 매우 작은 양의 연료가 특히 촉매 가열 56및 아이들링62을 위해 계량되는 71작동 상태일 수 있다.
따라서, 본 실시예의 번역메모리의 소단위 대응관계지시자는 다음과 같다.
제 2 작동 BZ2 상태는 (작동 상태 BZ1와 대조적으로) 매우 작은 양의 연료가 특히 촉매 가열 및 아이들링을 위해 계량되는 작동 상태일 수 있다.
[ 0-53|0-14/71-11|0, 54-118|15-40/62-9|1, 173-11|56-6|2]
또 다른 실시예에서, "A includes B and C" 이고 번역문장이 "A는 B 및 C를 포함한다"인 경우, 인접하는 소번역문들 "A includes B[A는 B를 포함한다]/" "and C[및 C]"로 생성하고, 소번역문들을 조립하여 완성 번역문장을 생성하면 다음가 같다.
A includes B and C.
A는 B 및 C를 포함한다.[0-12|0-4/9-7|0, 13-6|5-3|1]
여기서, 소단위 대응관계지시자는 두번째 소번역문에서 첫번째 소번역문 내의 [A는 B\를 포함한다]의 목적어 'B'와 조사 '를' 사이의 \ 위치에 삽입된 것을 나타낸다.
일 실시예에서, 소단위 대응관계표시자들의 소번역문위치정보는 소번역문들 각각의 번역 문장 내 위치를 지시할 수 있는 숫자들을 포함할 수 있고, 소번역문들 각각의 번역 문장 내 위치를 지시할 수 있는 숫자들은 번역 문장 내에서 소번역문들 각각의 정렬 순서를 나타내는 위치만을 포함할 수도 있다. 그러나, 결국 소번역문들의 정렬은 정렬 순서로 정렬되는 소번역문들을 각각 앞쪽에 위치된 소번역문 문미에 삽입하는 것과 동일한 기능을 수행할 수 있으므로, 번역메모리에 포함된 소번역메모리들 중 일부는 인접하는 두 개의 소번역문들에서 하나의 소번역문이 다른 하나의 소번역문 내로 삽입되는 위치를 지시하는 위치를 더 포함할 수도 있다(도 3j, 도 3k 및 도 3l의 첫번째 소단위 대응관계지시자들).
예를 들어, 도 3g의 소번역메모리를 포함하는 번역메모리는 정렬위치를 지시하는 소단위 대응관계지시자로 표시되었지만, 다음과 같이, 삽입위치지시자로 표시될 수도 있다.
A second operating BZ2 state can be a operating state at which a very small amount of fuel (in contrast to operating state BZ1) is metered, especiallly for catalyst heating.
제 2 작동 BZ2 상태는 (작동 상태 BZ1와 대조적으로) 매우 작은 양의 연료가 특히 촉매 가열을 위해 계량되는 작동 상태일 수 있다.[ 0-28|0-14/14-0|0, 29-24|65-11|5, 54-36|34-12/46-0|2, 91-36|15-18/33-0|1, 128-11|60-4/64-0|4, 140-32|47-12/59-0|3 ]
여기서, 정렬은 정렬 순서로 정렬되는 소번역문들을 각각 앞쪽에 위치된 소번역문 문미에 삽입하는 것과 동일한 기능을 수행할 수 있으므로 정렬 순서에 의해 인접하는 소번역문들은 각각 정렬 순서상으로 앞에 정렬되는 소번역문의 문미에 삽입되게 된다. 첫번째 소번역메모리의 소번역문(제 2 작동 BZ2 상태는 )에 대한 소번역문위치정보(0-14/14-0|0)는 다음에 정렬되는 4번째 소번역메모리의 소번역문[(작동 상태 BZ1와 대조적으로)]이 첫번재 소번역문의 문미(14-0/14-0에서 후반부의 시작위치 14다음에 0은 "제 2 작동 상태BZ2는\"의 위치를 표시한 것으로 \후반부의 길이가 0, 즉 아무것도 없음을 나타냄)에 삽입되는 것은 첫번째 소번역문이 4번째 소번역문 다음에 정렬되는 것과 같은 의미이다. 첫번째 소번역문위치정보가 첫번째 소번역문의 삽입위치지시자 '/'뒤에 특정되는 후반부(8b)에 "-0"을 갖는 것(후반부에 어떠한 소번역문도 갖지 않는 것을 의미)은 뒤에 정렬되는 삽입 소번역문이 피삽입 소번역문 문미에 삽입됨을 의미한다. 삽입 정렬에서 정렬 순서상 번역문장 마지막에 위치되는 소번역문은 뒷쪽에 삽입 소번역문을 가지지 않기 때문에 삽입위치지시자를 가지지 않는다. 이와 같이, 원문의 소번역단위들이 서로 인접하고 있지 않더라도, 정렬에 의해 소번역문들이 인접하는 경우에는 삽입 정렬이 이루어지도록 소번역문위치정보를 구성할 수 있다. 따라서, 번역문장의 맨뒤에 정렬되는 소번역문에 대한 소단위 대응관계지시자를 제외하고, 모든 소단위 대응관계지시자가 삽입위치지시자를 기본적으로 가지게 소단위 대응관계지시자의 포멧을 구성할 수 있음을 알 수 있고, 소단위 대응관계지시자에 삽입위치지시자가 없다면 이를 특정하는 소번역메모리의 소번역문이 번역문장의 맨 마지막 소번역문임을 알 수 있게 된다.
일 실시예에서, 소번역문들 각각의 번역 문장 내 위치를 지시할 수 있는 숫자들은 번역 문장 내에서 소번역문들 각각의 정렬 순서를 나타내는 위치 및 인접하는 하나의 소번역문이 다른 하나의 소번역문 내로 삽입되는 위치 모두를 포함할 수도 있다(도 3j, 도 3k 및 도 3l).
이와 같은 삽입정렬에 의한 정렬 방식은 어순이 하나의 소번역문이 다른 소번역문의 앞뒤 뿐만 아니라 다른 소번역문의 중간에도 자유로운 삽입이 가능하기 때문에, 소번역문 앞과 뒤로만 정렬하는 일반적인 기본 정렬 방식보다 빠른 정렬을 가능하게 한다. 기본 정렬 방식 및 삽입 정렬 방식을 혼용하여 번역문장을 빠르게 완성시킬 수 있다. 이러한 삽입정렬에 의한 정렬 방식은 언어학적으로 어순이 상이한 굴절어와 교착어 사이의 번역에서 원문의 대상 언어의 형태소 분석에 따라 소번역단위들을 분할 하여 이에 대응하는 소번역문 및 소번역메모리를 형성한 후, 소번역문들을 목표 언어의 번역문장으로 빠르게 조립하여 굴절어와 교착어 간에 소번역메모리를 빠르고 정확하게 구축할 수 있게 한다.
도 3d에서와 같이, 소단위 대응관계지시자는 소번역단위의 원문 문장 내 정렬위치를 가리키는 정보인 소번역단위위치정보를 포함하지만, 소번역메모리의 번역문장 내 정렬위치를 가리키는 정보인 소번역문위치정보를 포함하지 아니할 수 있다. 또 3d에서 소번역문위치정보는 숫자를 포함하는 대신, 번역문장 내 '/'로 표시되고 이로부터 얻어질 수 있다.
다음은 원문문장을 번역문장으로 번역하면서 소번역단위의 결정과 소번역단위의 소단위 대응관계지시자 지정 및 소번역메모리의 소단위 대응관계지시자가 지정되는 중간단계 소번역메모리의 정렬 정보는 다음과 같다.
본원 발명에 따른 번역메모리의 실시예에서 중간단계 소번역메모리는 '/'로 구분되어 있고 소번역메모리에 대한 소단위 대응관계지시자는 번역메모리 뒤에 '[]'로 구분되어 있다. 중간단계 소번역메모리의 소단위 대응관계지시자는 원문문장의 단어 또는 단어를 포함하는 어절들을 맨 앞 어절부터 순서대로 순번을 붙였을 때 소번역메모리와 각각 대응하는 단어까지의 순번이다. 예를 들어 소번역메모리 "매우 작은 양의"에 해당하는 대응 소번역단위는, 3번째 소번역메모리의 소단위 대응관계지시자가 16이므로, 11번째 어절에서 16번째 단어까지인 'at11 which12 a13 very14 small15 amount16'가 된다.
본 발명의 따른 번역 메모리의 생성 과정은 다음과 같다.
1. 원문문장 파싱
본 발명에서 '파싱(parsing)'은 원문 문장을 기계적 분할 규칙에 의해 분할하는 것을 말한다. 파싱은 원문 문장에 대한 형태소 분석이 이루어진 후에 분석된 형태소의 품사를 기준으로 이루어질 수 있다. '파싱 단위'는 원문문장을 컴퓨터에 저장되어 번역하기 위해 프로세싱되는 문장 단어들의 최소한의 집합으로서, 하나 이상의 단어들로 구성된다.
[원문문장을 명사, 대명사 뒤 및 전치사 앞까지 파싱한 예시]
A second operating/ BZ2/ state/ can be a operating state/ at which/ a very small amount/of fuel/(in contrast/ to operating state/ BZ1/)/ is metered,/ especially/ for catalyst/ heating./
원문인 원문문장을 형태소 분석된 어절들 중, 문장의 맨 앞부터 순차적으로, 품사를 기준으로 기계적 분할 규칙에 의해 파싱할 수 있다. 품사가 적어도 명사인 어절(또는 단어) 뒤까지 그리고 접속사인 어절의 앞 및 뒤까지 세분하여 파싱하는 것을 기본으로 할 수 있다. 명사는 표현의 주체이고 동사, 형용사의 의미상의 주어가 되며, 문장 내의 명사들의 성상 이동 등을 기술함으로써 문장이 완성되고, 문장성분을 분석할 때 주어, 목적어, 보어 및 각종 구의 성분이 되므로, 본 발명 전체에서 파싱단위를 세분하는 기본 단위가 된다. BZ2는 형태소 분석을 통해 그 품사를 알 수 없으므로, 앞뒤로 파싱된다.
본 발명에서 원문문장에서 명사를 기준으로 파싱하는 것은 원문문장을 더 많은 파싱 단위로 세분하여 피번역 단위로 순차번역할수록 번역 속도가 느려지기 때문에, 파싱 단위를 최소한도로 유지하면서 소번역메모리를 포함하는 번역메모리를 저장함으로써 통상의 번역 시간과 적어도 동일한 번역 속도를 유지할 수 있게 한다. 원문문장의 문장 분석을 통해 주어부에 순차적인 두 개 이상의 명사들이 파싱되는 경우 순차적으로 파싱했을 때 뒤의 명사를 포함하는 어절까지 파싱하는 것이 바람직하다. 원문문장을 언어에 따라 명사 자체가 어절이 되는 경우는 명사 뒤까지 파싱하며, 명사에 조사나 어미가 붙는 언어는 명사를 포함하는 어절까지 파싱한다. 각종 괄호, "," ";" 등의 문장 내 기호는 품사를 포함하는 어절 내에 포함되므로 독립적으로 파싱단위가 되는 경우를 제외하고 파싱하지 않는다.
번역자의 관점에서, 파싱단위는 원문문장을 세분하여 번역할 때 번역자가 먼저 원문문장을 읽지 않고도 세분하여 번역하는 끝 어절을 지시해준다. 따라서, 번역자는 원문문장의 앞어절부터 문장을 미리 읽어 어디까지 주어부인지 또는 술어부인지 문장 구조를 파악하지 않아도 된다. 번역자는 단지 파싱단위의 마지막 어절까지는 하나의 번역단위로 보고 번역하고 다음 파싱 단위에 동사가 나오면 현재 번역하는 파싱단위를 주어부에 맞게 번역하고, 현재 파싱단위에 본동사가 포함되어 있으면 술어부에 맞게 번역하게 된다. 따라서, 본 발명에서 원문문장의 형태소를 분석하고 파싱단위로 파싱하는 것은 번역자에게 미리 문장을 읽지 않고도 세분하여 번역할 수 있는 단위의 위치를 제공하므로, 번역 시간을 단축시켜 순차번역의 장점을 극대화할 수 있도록 한다.
컴퓨터의 소번역메모리 생성 관점에서, 파싱단위는 컴퓨터가 원문문장을 세분하여 소번역단위로 저장할 수 있는 단위가 된다. 즉, 본 발명에서 컴퓨터는 하나 이상의 파싱단위를 소번역단위로 하여 소번역메모리를 생성하므로, 둘 이상의 파싱단위가 하나의 소번역단위로 지정되어 번역되었을지라도, 추후가 번역자가 둘 이상의 파싱단위로 된 소번역단위를 더 세분하여 번역할 수 있다는 점에서 컴퓨터가 소번역메모리로 저장할 수 있는 단위가 된다.
영어를 한국어로 번역하는 바람직한 실시예에서 원문인 원문문장을 형태소 분석된 어절들 중, 문장의 맨 앞부터 순차적으로, 품사가 적어도 명사, 대명사인 어절 뒤까지, 그리고 접속사인 어절 앞뒤까지 세분하여 파싱하며, 원문문장의 하나 이상의 어절들을 포함하는 파싱 단위(parsing unit)들로 세분한다.
다른 바람직한 실시예에서 원문인 원문문장을 형태소 분석된 어절들 중, 문장의 맨 앞부터 순차적으로, 품사가 적어도 명사, 대명사인 어절 뒤까지, 접속사인 어절 앞뒤까지, 그리고 전치사를 포함하는 언어는 전치사 어절 앞까지 세분하여 파싱하며, 원문문장의 하나 이상의 어절들을 포함하는 파싱 단위들로 세분한다.
형태소 분석 후 파싱은 어절로 구분되는 경우에만 국한되지 않는다. 어절로 구분되지 않는 중국어나 일본어 등은 어절이 아닌 품사의 앞뒤에서 파싱되는 것과 같이 다른 규칙으로 파싱될 수도 있다.
어미와 조사가 발달한 언어(예를 들어 한국어)는 명사를 포함하는 어절 앞 또는 조사를 포함하는 어절의 뒤가 파싱단위가 될 수 있다.
다른 실시예에서, 원문인 원문문장을 형태소 분석된 어절들 중, 문장의 맨 앞부터 순차적으로, 품사가 적어도 명사, 대명사 및 접속사인 어절 뒤까지, 그리고 품사가 전치사 및 접속사인 어절 앞까지 세분되는, 원문문장의 하나 이상의 어절들을 포함하는 파싱 단위(parsing unit)들로 세분한다.
파싱 단위는 전술한 실시예에 국한되지 않고 원문의 원문문장을 올바르게 번역하기 위해 필요한 모든 품사들이 파싱 단위가 될 수 있음을 주의해야 한다. 다른 실시예에서, 원문인 원문문장을 형태소 분석된 어절들 중, 문장의 맨 앞부터 순차적으로, 모든 품사를 파싱 단위(parsing unit)들로 세분할 수 있다. 그러나, 원문 문장의 번역단위의 파싱은 번역 속도를 유지하면서 번역을 하기 위해, 비교되는 소번역메모리를 포함하는 번역메모리 DB의 소번역단위와 일치되도록 하여 자동적으로 소번역단위가 정해지도록 하는 것이 바람직하다.
2. 소번역단위의 결정
[소번역단위 결정]
소번역단위는 번역원문언어와 번역언어 사이의 두 언어간 어순이 동일한 하나 이상의 파싱 단위 또는 문장 정렬만으로 두언어 문장 간에 의미가 실질적으로 일치되는 하나 이상의 파싱단위까지로 결정한다. 또한, 원문 문장의 적어도 일부와 일치하는 이미 저장된 소번역메모리가 있는 경우 상기 소번역메모리의 소번역단위가 소번역단위로 결정될 수 있다. 이미 저장된 소번역단위가 있는 경우 이를 불러와 번역문을 생성할 수 있기 때문이다.
일 실시예에서, 소번역단위들은 원문문장을 형태소 분석하여 원문문장을 문장의 맨 앞 어절부터 순차적인 하나 이상의 단어로 세분한 하나 이상의 파싱 단위들로 구성되며, 상기 파싱 단위들이 번역 원문언어와 번역 목표언어 두 언어간 문장 내 의미가 실질적으로 동일하고 소번역단위들 내에서는 의미를 동일하게 하기 위해 더 이상 파싱단위들의 재정렬이 필요없는 순차적인 하나 이상의 파싱 단위까지로 결정된다. 여기서 "실질적으로 동일"의 의미는 언어간 번역의 차이로 인하여 완전 동일하게 번역하는 것이 불가능할 수 있으므로, 두 언어를 모두 구사할 수 있는 사람이 봤을 때 완전 동일하지는 않지만 거의 동일한 정도로 의미를 전달하는 경우를 포함한다.
소번역단위의 결정은 번역속도와 밀접한 관계가 있다. 소번역단위로 정해진 파싱단위의 수가 적을수록 파싱 단위 번역의 정확도는 높아지나 그만큼 소번역메모리 및 소번역메모리의 소단위 대응관계지시자의 수가 늘어나게 되어 번역 속도가 떨어지고, 반대로 소번역단위로 정해지는 파싱단위의 수가 많을수록 번역 속도는 향상되나 번역 정확도가 떨어질 확률이 커지고, 이후 번역에서 이용 가능한 소번역메모리의 일치 확률이 떨어지게 되므로, 번역 정확도 및 번역 속도를 고려하여 적절하게 소번역단위를 결정해야 한다. 바람직하게는, 문장 성분을 분석했을 때 명사는 주어 또는 목적어를 이루는 품사이므로, 명사를 포함하는 어절까지를 소번역단위로 한다. 예를 들어 복합명사나 전치사로 연결된 2개의 명사가 2개 이상 있는 구절("명사+명사"의 복합명사 또는 "명사 of 명사")를 하나의 소번역단위로 결정하는 것이 바람직하다.
다음은 줄바꿈으로 구분된 소번역단위를 보여준다.
A second operating/ BZ2/ state []5/ 제1 소번역단위
can be a operating state []10/ 제2 소번역단위
at which/ a very small amount []16/ 제3 소번역단위
of fuel []l8/ 제4 소번역단위
(in contrast/ to operating state/ BZ1/)[]24/ 제5 소번역단위
is metered,[]26/ 제6 소번역단위
especially/ for catalyst/ heating.[]30/ 제7 소번역단위
여기서, []기호 다음 숫자는 소번역단위에 해당하는 어절의 소단위 대응관계지시자이다. 이러한 []기호 및 소번역단위 지정 숫자는 줄바꿈 엔터키가 들어가면 자동적으로 생성되도록 프로그램될 수 있다. 이러한 소번역단위는 사용자 인터페이스의 표시 유닛에 표시되고, 바람직하게 사용자가 번역 속도를 빠르게 하기 위해 수정될 수 있다. 예를 들어, 사용자는 제3 소번역단위 "at which/ a very small amount []16/"와 제4 소번역단위 "of fuel []18/"를 병합하여서 제3 소번역단위로 할 수 있다.
소번역단위의 결정은 이미 저장된 소번역메모리DB를 이용하여 이루어질 수 있다. 이미 저장된 소번역메모리DB를 이용한 소번역단위의 결정은 비교유닛(60)에서 번역될 번역단위를 파싱한 파싱 단위들과 소번역메모리를 포함하는 번역메모리 DB(100)의 소번역단위를 비교한 결과, 전체적으로 일치하거나 부분적으로 일치하는 상기 번역메모리 DB의 하나 이상의 소번역단위들 중 가장 긴 파싱 단위로 우선적으로 결정될 수 있다.
소번역단위가 결정되면, 원문 문장 내에서의 소번역단위의 위치가 결정된다. 따라서, 소단위 대응관계지시자의 소번역단위위치정보를 결정할 수 있다. 상기 소번역단위위치정보는 소번역단위가 결정된 후 결정되고, 사용자가 추후 소번역단위를 번역의 필요에 따라 앞뒤 소번역단위들과 병합하거나 소번역단위를 분할한 경우 변경된다. 따라서, 소단위 대응관계지시자의 소번역단위위치정보는 다른 실시예에서 소번역단위에 대한 번역문인 소번역문이 생성된 후에 소번역문위치정보와 일괄적으로 결정될 수도 있다.
이와같이 기존 번역메모리 DB에 존재하는 번역메모리의 소번역단위, 분할 규칙에 의해 기계적으로 분할된 파싱단위, 또는 이들 파싱단위들이 병합된 병합된 파싱단위, 사용자가 입력한 분할 패턴 등에 의해 소번역단위로 분할되어 소번역단위가 결정될 수 있다.
사용자가 입력한 분할 패턴은 프로그램이 사용자에게 기계적으로 분할된 파싱 단위를 표시하고, 사용자로부터 입력된 소번역단위가 있는 경우 이를 상기 표시한 파싱단위가 비교하여 차이가 있는 경우 사용자가 입력한 소번역단위의 형태소들의 배열을 분할 패턴으로 저장하게 되고, 이렇게 저장된 분할 패턴은 이후 문장 번역에서 기계적 분할 규칙보다 우선하여 소번역단위를 결정할 수 있다. 이는 기계적 파싱단위가 일률적으로 기계적 분할되는 단점을 보완하여 사용자가 입력한 소번역단위의 형태소 배열을 소번역단위 결정에 활용하는 일종의 학습기능이다.
상기 비교 유닛(60)은 번역될 원문문장을 구성하는 순차적인 파싱단위들이 소번역메모리 DB(100)의 원문문장 내의 하나 이상의 소번역단위와 일치하는지 여부를 비교하여, 소번역메모리 DB의 원문문장 내의 하나 이상의 소번역단위와 전체적으로 또는 부분적으로 일치하는 가장 긴 순차적인 파싱단위들을 하나의 소번역단위로 결정한다. 비교결과 소번역메모리 DB의 원문문장 내의 하나 이상의 소번역단위와 일치하는 순차적인 파싱단위들이 존재하지 않는 경우, 소번역메모리 분석 유닛(122)에 의해 형성된 확장 소번역메모리 DB(120)의 확장 소번역메모리와 비교하여 전체적으로 또는 부분적으로 일치하는 파싱 단위들을 하나의 소번역단위로 결정한다. 상기 확장 소번역메모리는 소번역메모리 DB의 소번역메모리들을 기초로 소번역단위의 형태소 및 문장성분을 분석하여 공통되는 동사 및 명사를 갖는 소번역메모리들의 번역 패턴으로부터 확장된 번역 메모리이다. 소번역메모리 분석유닛(122)은 소번역메모리 DB의 원문 문장 및 번역 문장, 그리고 소번역단위 및 소번역메모리로부터 공통되는 동사 및 명사를 추출하여 문장 성분 및 문장 내에서 동사 및 명사의 번역패턴을 확장 소번역메모리로 생성할 수 있다.
예를 들어, "to avoid the negative effects"에 대한 소번역문 "부정적인 효과를 피할 수 있도록" 및 "to avoid an accident"에 대한 소번역문 "손상을 피할 수 있도록"이 소번역메모리 DB에 저장되어 있다면, 소번역메모리분석유닛(122)은 소번역단위에 공통된 부정사 동사 "to avoid"에 대해 소번역문에 공통된 동사"을(를) 피할 수 있도록"을 추출하고 "to avoid N"에 대한 확장소번역메모리 "N을 피할 수 있도록"을 생성할 수 있다(N은 품사 명사를 지시함). 다시말해, 공통된 품사 명사를 인자(argument)한 것이다. 이러한 방식으로 태그화된 소번역메모리를 생성할 수 있다.
"to avoid the negative effects" "부정적인 효과를 피할 수 있도록"
"to avoid a damage" "손상을 피할 수 있도록"
->
"to avoid N" "N을(를) 피할 수 있도록"(N은 품사 명사를 지시함)
[명사 확장 예]
또한, 이러한 실시예는 특히, 명사를 기준으로 파싱단위를 결정하고 따라서, 동사와 목적어가 하나의 파싱단위를 이루기 때문에, 동사와 목적어로 이루어진 번역단위를 번역할 때 이용될 수 있다.
"avoided the negative effects" "부정적인 효과를 피하였다"
"can avoid a damage" "손상을 피할 수 있다"
->
"(avoid) N" "N을(를) 피하다"(괄호는 동사의 기본형을 지시하고, N은 품사 명사(명사의 일반화)를 지시함)
[일치하는 동사를 기준으로 한 명사의 일반화로 인한 확장 예]
유사하게, 일치하는 구동사를 기준으로 한 명사 확장이 가능하고(예, (give) up N), 일치하는 전치사를 기준으로 한 명사 확장도 또한 가능하다(예, in spite of N).
이러한 생성된 확장소번역메모리는 확장소번역포함 번역메모리 DB에 저장될 수 있다. 이러한 확장소번역메모리는 이미 저장된 소번역메모리를 포함하는 번역메모리 DB를 이용하여 새로 번역메모리 DB를 생성하지 않고도 번역 커버리지를 넓히는 효과가 있다. 이러한 확장소번역메모리는 종래의 문장단위 번역메모리에 적용되는 확장 번역메모리 기술을 소번역메모리에 동일하게 적용시킬 수 있으며, 원문언어와 목표언어의 단어간 정확한 1:1 매칭이 가능해질 수 있어서 종래의 확장번역메모리 기술보다 훨씬 큰 커버리지를 가질 수 있다. 예를 들어 번역될 번역단위의 원문 문장의 20%만 일치하는 번역 메모리라도, 소번역메모리를 갖는 번역메모리는 20%부분에 대응하는 부분의 소번역단위와 대응하는 소번역메모리부분을 분석하여 일치하는 20%의 번역 의미를 추출할 수 있으므로, 번역메모리의 커버리지를 넓힐 수 있다.
본 발명에서 원문 문장을 파싱하고 소번역단위 결정하는 과정을 종래의 번역 메모리 형성 과정에서 번역단위를 결정하는 것과 비교한다면, 종래의 번역 메모리 형성 과정과 동일하게 원문 문장 단위로 번역 단위(TU)를 결정하고, 컴퓨터가 행한 원문 단위 파싱이 잘못된 경우 사용자가 번역 단위를 병합하거나 분할하여 번역 단위를 수정하는 과정은 본 발명에서 종래와 같이, 원문 문장별로 번역단위가 결정되고, 사용자의 의도에 따라 번역단위의 분할 또는 병합의 과정이 그래도 이루어진다. 이에 덧붙여, 본 발명은 원문 문장별로 번역단위가 결정된후, 후속적인 과정을 더 포함한다. 번역단위인 원문 문장에 대해서 컴퓨터가 파싱 과정을 수행하여 원문을 파싱단위로 세분하고, 저장된 소번역메모리 DB를 검색하거나 사용자의 의도에 따라 파싱단위를 병합하여 소번역단위를 결정한다. 따라서, 본 발명에서 원문 문장내 파싱 단위 형성은 단락 내에서 문장단위로 번역단위를 형성하는 과정과 대응되지만, 본원 발명은 컴퓨터가 형태소 분석 후 품사에 따라 파싱 단위 결정과정을 수행하게 된다. 또한, 소번역단위의 결정은 번역단위들의 병합에 대응되지만, 사용자의 의도에 따라 파싱단위의 병합 분할이 이루어질 수 있지만, 소번역메모리DB에 이미 저장된 소번역메모리가 존재하는 경우 컴퓨터가 소번역단위를 결정할 수 있다.
비교결과 소번역메모리 DB 및 확장 소번역메모리 DB의 원문문장 내의 하나 이상의 소번역단위와 일치하는 순차적인 파싱단위들이 존재하지 않는 경우, 번역될 파싱단위들을 사용자에게 표시하고 사용자입력 모드로 전환하여 사용자가 소번역단위를 결정하게 한다. 소번역메모리를 포함하는 번역메모리 DB(100)에 전체적으로 또는 부분적으로 일치하는 저장된 소번역단위가 없고, 확장 소번역메모리 DB에 전체적으로 또는 부분적으로 일치하는 저장된 소번역단위가 없다면, 사용자가 직접 새로운 소번역메모리를 입력하고 소단위 대응관계지시자를 생성하거나 소번역메모리에 대한 기계번역을 이용하여 소번역문을 생성하고 소단위 대응관계지시자를 생성할 수 있다. 컴퓨터 보조 번역(CAT) 프로그램은 번역메모리의 규모가 커질수록 번역의 속도 및 정확도가 올라가기 때문에 다른 의미를 갖도록 번역할 필요성이 없다면 한번 번역한 소번역단위는 번역자가 다시 직접 번역하지 않아도 된다.
3. 중간단계 소번역메모리 생성과 소단위 대응관계지시자
도 2a는 중간단계소번역메모리생성유닛(91)에서 본 발명에 따른 소번역메모리를 포함하는 번역메모리로 저장하기 위해 만들어지는 중간단계 소번역메모리이다. 소번역단위가 결정되면, 소번역메모리를 포함하는 번역메모리 생성유닛(90)에서 중간단계 소번역메모리를 생성하고 이를 변형하여 소번역메모리(도 3a 내지 도 3k)를 생성하게 된다.
도 2a의 중간단계 소번역메모리는 본 발명에 따른 소번역메모리를 포함하는 번역메모리를 생성하기 전에 거치는 중간단계 성격의 소번역메모리이다. 사용자는 소번역메모리 DB에 저장된 소번역단위를 매칭되는 소번역단위가 있는 경우 이를 불러올 수 있고, 이렇게 불러온 소번역메모리를 보고 수정할 필요가 있는 경우 사용자의 필요에 따라 번역자가 직접입력할 수 있는 유저 인터페이스에 의해 생성될 수 있다. 번역자가 직접 번역할 시에 신속하게 번역할 수 있도록 원문문장의 소번역단위, 번역 문장의 소번역문 및 소단위 대응관계지시자가 모두 표시된다. 중간단계 소번역문은 원문문장의 소번역단위를 정렬하기 위해 소단위 대응관계지시자의 소번역단위위치정보에 따라 오름차순정렬로 정렬된 포맷을 가질 수 있다. 최종적인 소번역메모리(도 3a 내지 도 3k)와 차이는 번역 메모리 부분에 소번역단위가 제거되지 않고 남아 있다는 것이다. 사용자는 소번역단위와 소번역문간 대응관계를 직접 확인할 수 있고, 소번역단위를 보면서 번역하게 된다.
중간단계 소번역메모리는, 소번역메모리 DB에 기록된 기존의 번역메모리와 비교하여 치환하거나 기계번역하거나, 등록 상용구를 활용하거나, 확장 소번역메모리를 이용하거나, 사용자가 사용자 전환모드에서 직접 번역함으로써 소번역단위에 대한 소번역메모리를 생성한다.
예를 들어 이러한 소번역메모리를 생성하기 위해 아래와 같은 중간단계 소번역메모리 포맷이 이용된다.
A second operating /BZ2/ state[제 2 작동 BZ2 상태는]5/
can be a operating state[작동 상태일 수 있다.]10/
at which / a very small amount[매우 작은 양의]16/
of fuel[연료가]18/
(in contrast/ to operating state BZ1)[(작동 상태 BZ1와 대조적으로)]24/
is metered,[계량되는]26/
especiallly for catalyst/ heating[특히 촉매 가열을 위해]30/
이러한 소번역단위의 결정은 이미 저장된 소번역메모리DB에서 원문문장의 번역인 소번역메모리를 불러올 수 있는 경우 소번역단위와 전체적 또는 부분적으로 매칭되는 파싱단위까지 소번역단위로 결정되고, 매칭되는 파싱단위가 없는 경우 사용자에 의해 직접 지정된다.
생성된 소번역메모리 간에 소번역문을 정렬하여 번역문장을 완성하기 위하여 소번역메모리에 지정되는 소단위 대응관계지시자를 삽입한다. 번역 메모리의 원문 문장은 복수 개의 소번역단위들로 구성되고, 번역메모리의 번역 문장은 상기 복수 개의 소번역단위들에 대응하는 소번역문들로 구성된다. 이때, 소번역단위들과 소번역문들 간의 대응관계가 소단위 대응관계표시자들에 의해 표시되고, 소단위 대응관계표시자들의 소번역단위위치정보들은 소번역단위들 각각의 원문 문장 내 소단위로 세분화된 위치를 지시할 수 있는 숫자들을 포함하고, 소단위 대응관계표시자들의 소번역문위치정보들은 상기 소번역문들 각각의 번역 문장 내 위치를 지시할 수 있는 숫자들을 포함한다.
일 실시예에서, 소번역메모리는 원문문장의 일부에 대해 생성될 수 있다. 원문문장을 세분화한 모든 소번역단위에 대해 소번역문을 생성하더라도 일부는 소번역메모리로서 가치가 없거나 번역메모리 DB에 이미 존재하여 중복된 소번역메모리가 존재할 수 있기 때문에, 일부에 소번역단위에 대하여 소번역문이 생성될 수 있고, 따라서, 이를 특정하는 소단위 대응관계지시자도 일부에 대해서만 생성될 수 있다. 이때, 일부 소번역단위(들)와 이에 대응하는 소번역문(들) 간의 대응관계가 소단위 대응관계표시자(들)에 의해 표시되고, 소단위 대응관계표시자(들)의 소번역단위위치정보(들)은 상기 일부의 소번역단위(들)의 원문 문장 내 소단위로 세분화된 위치를 지시할 수 있는 숫자들을 포함하고, 상기 일부 소단위 대응관계표시자(들)의 소번역문위치정보(들)은 상기 일부 소번역문(들)의 번역 문장 내 위치를 지시할 수 있는 숫자들을 포함한다.
소번역단위들 각각의 원문 문장 내 소단위로 세분화된 위치를 지시할 수 있는 숫자들은 원문 문장 내에서 원문 문장의 첫 문자에 대한 소번역단위들 각각의 첫 문자의 위치를 지시할 수 있다. 그리고 원문 문장의 첫 문자에 대한 소번역단위들 각각의 마지막 문자의 위치를 지시할 수 있다. 소번역문들 각각의 번역 문장 내 위치를 지시할 수 있는 숫자들은 번역문 문장 내에서 번역문 문장의 첫 문자에 대한 소번역문들 각각의 첫 문자의 위치를 지시할 수 있다. 번역문 문장의 첫 문자에 대한 소번역문들 각각의 마지막 문자의 위치 및 번역 문장 내에서 소번역문들 각각의 정렬 순서를 나타내는 위치 및 소번역문들 각각이 인접한 다른 소번역메모리의 소번역문 내로 삽입되는 위치를 지시하는 위치 중 하나 이상을 포함할 수 있다.
소번역메모리에 대한 소단위 대응관계지시자는 소번역문들을 일괄 번역하고 일괄 정렬 방식으로 할 수 있고, 소번역단위들을 원문문장의 맨앞 소번역단위부터 번역할때마다 순차적으로 순차 정렬 방식으로 지정할 수 있다(표 2 참조).
중간단계 소번역메모리 입력유닛(11) 표시유닛(12) - 대응관계지시자에 따라 []안의 내용이 표시부에 표시됨)
1-1 A second operating BZ2 state[제 2 작동 BZ2 상태는 ]5/ can be a operating state/ at which/ a very small amount/of fuel/(in contrast/ to operating state/ BZ1/)/ is metered,/ especially/ for catalyst/ heating./ 제 2 작동 BZ2 상태는
2-1 A second operating BZ2 state[제 2 작동 BZ2 상태는 ]5-1/ can be a operating state[작동 상태일 수 있다. ]10-2/ at which a very small amount/of fuel/ (in contrast to operating state BZ1)/is metered,/ especially/ for catalyst/ heating./ 제 2 작동 BZ2 상태는 작동 상태일 수 있다.
3-1 A second operating BZ2 state[제 2 작동 BZ2 상태는 ]5-1/ can be a operating state[작동 상태일 수 있다. ]10-2/at which a very small amount[매우 작은 양의 ]16/ of fuel/ (in contrast to operating state BZ1)/is metered,/ especially/ for catalyst/ heating./ 제 2 작동 BZ2 상태는 작동 상태일 수 있다. 매우 작은 양의
3-2 A second operating BZ2 state[제 2 작동 BZ2 상태는 ]5-1/ at which a very small amount[매우 작은 양의 ]16-2/can be a operating state[작동 상태일 수 있다. ]10-3/of fuel[]18/ (in contrast to operating state BZ1)[]24/is metered,[]26/ especially/ for catalyst/ heating.[]30/ 제 2 작동 BZ2 상태는 매우 작은 양의 작동 상태일 수 있다.
4-1 A second operating BZ2 state[제 2 작동 BZ2 상태는 ]5-1/ at which a very small amount[매우 작은 양의 ]16-2/can be a operating state[작동 상태일 수 있다. ]10-3/ of fuel[연료가]18/ (in contrast to operating state BZ1)/is metered,/ especially/ for catalyst/ heating./ 제 2 작동 BZ2 상태는 매우 작은 양의 작동 상태일 수 있다.연료가
4-2 A second operating BZ2 state[제 2 작동 BZ2 상태는 ]5-1/ at which a very small amount[매우 작은 양의 ]16-2/of fuel[연료가]18-3/ can be a operating state[작동 상태일 수 있다. ]10-4/ (in contrast to operating state BZ1)/ is metered,/ especially/ for catalyst/ heating./ 제 2 작동 BZ2 상태는 매우 작은 양의 연료가 작동 상태일 수 있다.
5-1 A second operating BZ2 state[제 2 작동 BZ2 상태는 ]5-1/ at which a very small amount[매우 작은 양의 ]16-2/of fuel[연료가]18-3/ can be a operating state[작동 상태일 수 있다. ]10-4/ (in contrast to operating state BZ1)[(작동 상태 BZ1와 대조적으로) ]24/ is metered,/ especially/ for catalyst/ heating./ 제 2 작동 BZ2 상태는 매우 작은 양의 연료가 작동 상태일 수 있다. (작동 상태 BZ1와 대조적으로)
5-2 A second operating BZ2 state[제 2 작동 BZ2 상태는 ]5-1/ (in contrast to operating state BZ1)[(작동 상태 BZ1와 대조적으로)]24-2/ at which a very small amount[매우 작은 양의 ]16-3/of fuel[연료가]18-4/ can be a operating state[작동 상태일 수 있다. ]10-5/ is metered,/ especially/ for catalyst/ heating./ 제 2 작동 BZ2 상태는 (작동 상태 BZ1와 대조적으로) 매우 작은 양의 연료가 작동 상태일 수 있다.
6-1 A second operating BZ2 state[제 2 작동 BZ2 상태는 ]5-1/ (in contrast to operating state BZ1)[(작동 상태 BZ1와 대조적으로)]24-2/at which a very small amount[매우 작은 양의 ]16-3/of fuel[연료가]18-4/ can be a operating state[작동 상태일 수 있다. ]10-5/ is metered,[계량되는 ]26/ especially/ for catalyst/ heating.[]30/ 제 2 작동 BZ2 상태는 (작동 상태 BZ1와 대조적으로) 매우 작은 양의 연료가 작동 상태일 수 있다. 계량되는
6-2 A second operating BZ2 state[제 2 작동 BZ2 상태는 ]5-1/ (in contrast to operating state BZ1)[(작동 상태 BZ1와 대조적으로)]24-2/at which a very small amount[매우 작은 양의 ]16-3/of fuel[연료가]18-4/ is metered,[계량되는 ]26-5/can be a operating state[작동 상태일 수 있다. ]10-6/ especially/ for catalyst/ heating./ 제 2 작동 BZ2 상태는 (작동 상태 BZ1와 대조적으로) 매우 작은 양의 연료가 계량되는 작동 상태일 수 있다.
7-1 A second operating BZ2 state[제 2 작동 BZ2 상태는 ]5-1/ (in contrast to operating state BZ1)[(작동 상태 BZ1와 대조적으로)]24-2/at which a very small amount[매우 작은 양의 ]16-3/of fuel[연료가]18-4/ is metered,[계량되는]26-5/ can be a operating state[작동 상태일 수 있다. ]10-6/ especially/ for catalyst/ heating.[특히 촉매 가열을 위해 ]30/ 제 2 작동 BZ2 상태는 (작동 상태 BZ1와 대조적으로) 매우 작은 양의 연료가 계량되는 작동 상태일 수 있다. 특히 촉매 가열을 위해
7-2 A second operating BZ2 state[제 2 작동 BZ2 상태는 ]5-1/ (in contrast to operating state BZ1)[(작동 상태 BZ1와 대조적으로)]24-2/at which a very small amount[매우 작은 양의 ]16-3/of fuel[연료가]18-4/ especially/ for catalyst/ heating.[ 특히 촉매 가열을 위해]30-5/ is metered,[계량되는]26-6/ can be a operating state[작동 상태일 수 있다. ]10-7/ 제 2 작동 BZ2 상태는 (작동 상태 BZ1와 대조적으로) 매우 작은 양의 연료가 특히 촉매 가열을 위해 계량되는 작동 상태일 수 있다.
전술한 바와 같이, 순차번역에 의한 소번역메모리를 생성하기 위해서는 중간단계 소번역메모리를 생성하게 되기 때문에, 이때 형성되는 소단위 대응관계지시자는 중간단계 정렬위치자로 구별되고, 이는 소번역단위위치정보(4') 및 소번역문위치정보(4")로 구성된다(예, ]5-1/). 중간단계 소번역메모리의 소단위 대응관계지시자는 원문문장의 소번역단위의 원문문장 내 정렬 위치를 나타내는 소단위 대응관계지시자로서 번역문장에서의 어절의 순번과 소번역문의 정렬위치를 나타내는 순번의 조합으로 구성될 수 있다. 예를 들어 '[제 2 작동 BZ2 상태는]5-1'에서 중간단계 소단위 대응관계지시자의 소번역단위위치정보'5'는 원문문장의 소번역단위가 되는 끝어절의 순번이고 중간단계 소단위 대응관계지시자의 소번역문위치정보'1'은 소번역문의 번역문장에서의 정렬 순서를 나타낸다. 번역단계에서 소번역문의 정렬 순서를 나타내는 1, 2, 3, 4, 5, 6, 7은 각각의 소번역문의 번역문장(번역메모리)에서의 위치를 나타내는 정보는 포함되어 있지 않다. 반면, 도 3c 및 도 3d의 소번역문위치정보인 5, 24, 16, 18, 30, 26, 10는 소번역문의 정렬순서 및 위치를 모두 포함한다.
중간단계 소번역메모리 생성 단계에서는 번역자의 일반적인 문장 번역 속도와 실질적으로 동일한 속도 또는 최소한 일반 번역 속도 보다 느리지 않으면서 소번역메모리의 생성 과정을 단축하기 위해 중간단계 소번역메모리의 소단위 대응관계지시자의 소번역문위치정보는 정렬 순서 정보만 갖는다. 즉, 중간단계 소번역메모리의 소단위 대응관계지시자의 소번역단위위치정보는 소번역단위를 지정하는 것과 더불어 원문인 원문문장을 구성하는 소번역단위의 정렬 위치 정보까지 포함하지만, 중간단계 소번역메모리의 소단위 대응관계지시자의 소번역문위치정보(4")는 정렬 순번에 대한 정보만 갖게 된다. 이러한 중간간계 정렬위치 지사자만으로도 본 발명의 소번역메모리를 포함하는 번역메모리를 표현할 수 있다(도 3a 및 도 3b).
다른 실시예에서, 소단위 대응관계지시자는 소번역단위 및 소번역문의 원문문장 및 번역문장에서의 각각의 정렬 순서 뿐만 아니라 도 3c에서와 같이, 소번역단위의 원문문장에서의 시작 단어 및 종료 단어의 순번 및 번역메모리인 번역문장에서의 소번역문의 시작 단어 및 종료 단어의 순번을 포함하는 정보를 포함하게 할 수 있다. 또한, 소단위 대응관계지시자들의 소번역단위위치정보 및 소번역문위치정보 중 하나가 오름차순으로 되어 있다면, 이를 이미 정렬 순서대로 정렬되어 있음을 의미한다. 예를 들어 도 2a의 각 소번역문 사이의 중간단계소번역메모리 소단위 대응관계지시자는 5-1,10-7,16-3, 18-4, 24-2, 26-6,30-5이고, 소번역단위위치정보가 오름차순으로 정렬(5-, 10-, 16-, 18-, 24-, 26-, 30-)되어 있으므로, 이미 정렬 순서대로 정렬되어 있음을 알 수 있고, 따라서, 소단위 대응관계지시자는 1∼5-, 6∼10-, 11∼16-, 17∼18-, 19∼24-, 25∼26-, 27∼30-의 어절 순번을 나타내는, 대응하는 소번역단위의 정렬 위치에 대한 정보가 더 중요해진다.
상기 예문을 원문문장으로 정렬하면 소단위 대응관계지시자의 소번역단위위치정보에 따라 오름차순정렬로 5-10-16-18-24-26-30가 되므로 중간단계 소번역메모리는 다음과 같다.
A second operating BZ2 state[제 2 작동 BZ2 상태는]5-1/
can be a operating state[작동 상태일 수 있다.]10-7/
at which a very small amount[매우 작은 양의]16-3/
of fuel[연료가]18-4/
(in contrast to operating state BZ1)[(작동 상태 BZ1와 대조적으로)]24-2/
is metered,[계량되는]26-6/
especiallly for catalyst heating[특히 촉매 가열을 위해]30-5/
이것을 번역문장으로 정렬하면, 소번역메모리의 중간단계소단위 대응관계지시자의 소번역문위치정보에 따라 오름차순 정렬로 1-2-3-4-5-6-7이 되므로 다음과 같이 된다.
A second operating BZ2 state[제 2 작동 BZ2 상태는]5-1/
(in contrast to operating state BZ1)[(작동 상태 BZ1와 대조적으로)]24-2/
at which a very small amount[매우 작은 양의]16-3/
of fuel[연료가]18-4/
especiallly for catalyst heating[특히 촉매 가열을 위해]30-5/
is metered,[계량되는]26-6/
can be a operating state[작동 상태일 수 있다.]10-7/
다른 실시예에서, 소번역문위치정보(4")는 정렬 순번에 대한 정보를 나타내기만 하면 되므로, 숫자이외에 정렬 순번을 나타내는 문자 및 기호로도 표시될 수 있다. 예를 들어, 소번역메모리의 바로 앞 소번역메모리와의 상대적인 위치를 지정함으로써 정렬 순번을 나타낼 수 있다(/1, /2, /3 ...). 기호와 문자 "/1", "/2", "/3"은 지정된 소번역메모리가 앞 소번역메모리의 첫번째 앞(/1), 두번째 앞(/2) 및 세번째 앞(/3)에 놓임을 나타낸다. 첫번째 앞(/1)은 더욱 간단하게 (/)로 나타내어 지정된 소번역단위 첫번째 앞에 위치하는 중간단계 소번역문위치정보로 활용할 수 있다. 또한, 등위 접속사가 있는 문장 구조를 갖는 경우, 주어, 목적어 및 서술어의 일반적인 우리말 어순을 고려하여, 주어, 목적어 및 서술어의 문자를 함께 표시할 수도 있다(/s1, /s2, /s3, ... /o1, /o2, /o3, ... /v1, /v2, /v3). 이러한 소번역문위치정보는 한국어의 경우 s1+o1+v1, s2+o2+v3, s3+o3+v3 ...의 정렬 순서를 갖는다.
A second operating BZ2 state[제 2 작동 BZ2 상태는//]5
can be a operating state[작동 상태일 수 있다./]10
at which a very small amount[매우 작은 양의/]16
of fuel[연료가/-]18
(in contrast to operating state BZ1)[(작동 상태 BZ1와 대조적으로)/2]24
is metered,[계량되는/2-]26
especiallly for catalyst heating[특히 촉매 가열을 위해/]30/
'//'(="/s1")는 번역문장 전체 주어표시이고, './'(="/v1")는 번역문장 전체 동사 표시이고, '/'는 첫번째 앞 소번역메모리에 위치됨을 나타내고, '/2'는 두번째 앞 소번역메모리에 위치됨을 나타내고, '/-'는 첫번째 앞, 즉 바로 앞 소번역메모리 뒤에 이어짐을 나타내고, '/2-'는 두번째 앞 소번역메모리 뒤에 이어짐을 나타냅니다. 이러한 앞 소번역메모리들과의 상대적 정렬위치를 나타내는 방법은 순차번역되는 소번역메모리를 번역과 동시에 번역되는 소번역메모리의 정렬 위치를 지정할 수 있게 되므로 번역자의 번역 속도를 높일 수 있습니다.
중간단계 소번역메모리는 사용자가 사용자 인터페이스를 통해 번역하면서 소번역단위와 소번역메모리간 대응관계 및 이들의 정렬위치를 포함하는 소단위 대응관계지시자를 지정하여 다음의 4.와 같이 생성될 수 있다.
4. 소번역단위의 순차 번역 및 소단위 대응관계지시자 지정에 의한 소번역메모리를 포함하는 중간단계 소번역메모리 생성 방법 및 유저 인터페이스 프로그램의 실시예
본 발명의 일 실시예에서, 소번역단위의 순차 번역 및 소단위 대응관계지시자 지정에 의한 소번역메모리를 포함하는 중간단계 소번역메모리 생성 방법 및 유저 인터페이스 프로그램이 구현된다. 유저 인터페이스 프로그램은 사용자가 파싱단위, 소번역단위 및 피번역 단위에 해당하는 번역 내용을 직접 입력할 수 있는 입력 유닛(11)과 사용자가 입력 유닛(11)을 통해 파싱단위, 소번역단위 및 피번역 단위에 해당하는 번역 내용을 직접 실시간으로 확인할 수 있는 표시 유닛(12)으로 구성된다. 표시 유닛(12)은 이밖에도 기본번역메모리 매칭 유닛(20)에서의 매칭의 결과 및 소번역단위 결정 유닛에서의 소번역단위 결정 결과를 표시할 수 있다.
맨앞 소번역단위부터 번역메모리DB 및 확장변역메모리DB를 검색하여 치환, 기계번역 또는 사용자 번역하고, 정렬한 다음 순차적으로 맨 뒤 소번역단위까지 번역 및 정렬의 단계를 반복하여 소단위 대응관계지시자를 삽입할 수 있다.
표 2는 중간단계 소번역메모리 생성 방법에 관한 구체적인 번역예를 도시한다. 블록으로 지정된 부분 중 글자가 흰색으로 반전된 블록(예, A second operating BZ2 state)은 순차적인 번역에서 번역될 부분으로 지정된 소번역단위를 나타내며 바로 뒤의 []표시부분(예, [제 2 작동 BZ2 상태는 ])은 지정된 소번역단위에 대해 맨앞 소번역단위부터 소번역메모리DB 및 확장 소번역메모리DB 검색을 통하여 치환되거나, 기계번역하거나, 사용자 번역됨으로써 중간단계 소번역메모리가 입력되는 부분을 나타낸다. 따라서, 사용자는 입력 유닛(11)을 통해 [] 내의 번역내용을 수정할 수 있다. 제1 소번역단위 번역 후 제2 소번역단위로 순차번역이 진행되면 이미 순차번역이 끝난 제1 소번역단위 부분은 블록으로 지정된 부분 중 회색 블록(예, A second operating BZ2 state)으로 표시된다. 기호"]"와 "/" 사이의 소단위 대응관계지시자(구체적으로는, 중간단계 소번역메모리 생성단계에서는 중간 소단위 대응관계지시자임)는 하나의 소번역단위가 순차번역될 때마다 생성될 수 있거나(도 7 참조), 사용자가 원문문장 내의 소번역단위들을 모두 번역한 후 다음 원문문장으로 넘어갈 때 일괄적으로 생성될 수 있다(도 6 참조). 사용자가 입력 유닛(11)을 통해 [] 내의 번역문과 마찬가지로 "]"와 "/"사이의 소단위 대응관계지시자의 정보(엄밀하게는, 중간단계 대응관계 지사자의 소번역문위치정보)를 수정할 수 있다.
사용자가 직접 순차 번역하여 소번역단위에 대해 소번역메모리를 생성하고 소번역메모리에 소단위 대응관계지시자를 삽입하는 표 2에 따른 실시예의 설명은 다음과 같다.
[1-1. 제1 소번역단위에 대해 번역메모리DB를 검색하여 전체적으로 일치하면 치환하고, 부분적으로 일치하는 경우 확장 소번역메모리 DB를 검색하여 저장된 확장 소번역메모리와 일치하면 확장 소번역메모리를 적용하여 번역하고, 확장 소번역메모리와 일치하지 않으면 일치하지 않는 부분을 기계번역하고, 추가로 사용자 번역으로 제1 소번역메모리 생성]
A second operating BZ2 state[제 2 작동 BZ2 상태는 ]5/ 제1 소번역단위 번역메모리DB 검색하여 치환, 확장 소번역메모리DB 검색하여 번역, 기계번역 또는 사용자 번역으로 제1 소번역메모리 생성
can be a operating state[]10/
at which/ a very small amount []16/
of fuel []18/
(in contrast/ to operating state/ BZ1/)[]24/
is metered,[]26/
especially/ for catalyst/ heating.[]30/
[1-2. 제1 소번역메모리 재정렬]
A second operating BZ2 state[제 2 작동 BZ2 상태는 ]5-1/ 제1 번역 메모리 재정렬(맨 앞 소번역단위가 주어이므로 실질적으로 정렬 위치 변화 없음)
can be a operating state[]10/
at which/ a very small amount []16/
of fuel []18/
(in contrast/ to operating state/ BZ1/)[]24/
is metered,[]26/
[2-1. 제2 소번역단위에 대해 번역메모리DB를 검색하여 전체적으로 일치하면 치환하고, 부분적으로 일치하는 경우 확장 소번역메모리 DB를 검색하여 저장된 확장 소번역메모리와 일치하면 확장 소번역메모리를 적용하여 번역하고, 확장 소번역메모리와 일치하지 않으면 일치하지 않는 부분을 기계번역하고, 추가로 사용자 번역으로 제2 소번역메모리 생성]
A second operating BZ2 state[제 2 작동 BZ2 상태는 ]5-1/
can be a operating state[작동 상태일 수 있다. ]10/ 제2 소번역단위 번역메모리DB 검색하여 치환, 확장 소번역메모리DB 검색하여 번역, 기계번역 또는 사용자 번역으로 제2 소번역메모리 생성
at which a very small amount[]16/
of fuel[]18/
(in contrast to operating state BZ1)[]24/
is metered,[]26/
especially/ for catalyst/ heating.[]30/
[2-2. 제2 소번역메모리 재정렬]
A second operating BZ2 state[제 2 작동 BZ2 상태는 ]5-1/
can be a operating state[작동 상태일 수 있다. ]10-2/ 제2 소번역메모리 재정렬(실질적으로 위치 변화 없음)
at which a very small amount[]16/
of fuel[]18/
(in contrast to operating state BZ1)[]24/
is metered,[]26/
especially/ for catalyst/ heating.[]30/
[3-1. 제3 소번역단위에 대해, 번역메모리DB를 검색하여 전체적으로 일치하면 치환하고, 부분적으로 일치하는 경우 확장 소번역메모리 DB를 검색하여 저장된 확장 소번역메모리와 일치하면 확장 소번역메모리를 적용하여 번역하고, 확장 소번역메모리와 일치하지 않으면 일치하지 않는 부분을 기계번역하고, 추가로 사용자번역으로 제3 소번역메모리 생성]
A second operating BZ2 state[제 2 작동 BZ2 상태는 ]5-1/
can be a operating state[작동 상태일 수 있다. ]10-2/
at which a very small amount[매우 작은 양의 ]16/ 제3 소번역단위 번역메모리DB 검색하여 치환, 확장 소번역메모리DB 검색하여 번역, 기계번역 또는 사용자번역으로 제3 소번역메모리 생성
of fuel[]18/
(in contrast to operating state BZ1)[]24/
is metered,[]26/
especially/ for catalyst/ heating.[]30/
[3-2. 제3 소번역메모리 재정렬]
A second operating BZ2 state[제 2 작동 BZ2 상태는 ]5-1/
at which a very small amount[매우 작은 양의 ]16-2/
can be a operating state[작동 상태일 수 있다. ]10-3/ 제3 소번역메모리 정렬위치 재정렬
of fuel[]18/
(in contrast to operating state BZ1)[]24/
is metered,[]26/
especially/ for catalyst/ heating.[]30/
[4-1. 제4 소번역단위에 대해 번역메모리DB를 검색하여 전체적으로 일치하면 치환하고, 부분적으로 일치하는 경우 확장 소번역메모리 DB를 검색하여 저장된 확장 소번역메모리와 일치하면 확장 소번역메모리를 적용하여 번역하고, 확장 소번역메모리와 일치하지 않으면 일치하지 않는 부분을 기계번역하고, 추가로 사용자 번역으로 제4 소번역메모리 생성]
A second operating BZ2 state[제 2 작동 BZ2 상태는 ]5-1/
at which a very small amount[매우 작은 양의 ]16-2/
can be a operating state[작동 상태일 수 있다. ]10-3/
of fuel[연료가]18/ 제4 소번역단위 번역메모리DB 검색하여 치환, 확장 소번역메모리DB 검색하여 번역, 기계번역 또는 사용자 번역으로 제4 소번역메모리 생성
(in contrast to operating state BZ1)[]24/
is metered,[]26/
especially/ for catalyst/ heating.[]30/
[4-2. 제4 소번역메모리 재정렬]
A second operating BZ2 state[제 2 작동 BZ2 상태는 ]5-1/
at which a very small amount[매우 작은 양의 ]16-2/
of fuel[연료가]18-3/ 제4 소번역메모리 재정렬
can be a operating state[작동 상태일 수 있다. ]10-4/
(in contrast to operating state BZ1)[]24/
is metered,[]26/
especially/ for catalyst/ heating.[]30/
[5-1. 제5 소번역단위에 대해 번역메모리DB를 검색하여 전체적으로 일치하면 치환하고, 부분적으로 일치하는 경우 확장 소번역메모리 DB를 검색하여 저장된 확장 소번역메모리와 일치하면 확장 소번역메모리를 적용하여 번역하고, 확장 소번역메모리와 일치하지 않으면 일치하지 않는 부분을 기계번역하고, 추가로 사용자 번역으로 제5 소번역메모리 생성]
A second operating BZ2 state[제 2 작동 BZ2 상태는 ]5-1/
at which a very small amount[매우 작은 양의 ]16-2/
*of fuel[연료가]18-3/
can be a operating state[작동 상태일 수 있다. ]10-4/
(in contrast to operating state BZ1)[(작동 상태 BZ1와 대조적으로) ]24/ 제5 소번역단위 번역메모리DB 검색하여 치환, 확장 소번역메모리DB 검색하여 번역, 기계번역 또는 사용자 번역으로 제5 소번역메모리 생성
is metered,[]26/
especially/ for catalyst/ heating.[]30/
[5-2. 제5 소번역메모리 재정렬]
A second operating BZ2 state[제 2 작동 BZ2 상태는 ]5-1/
(in contrast to operating state BZ1)[(작동 상태 BZ1와 대조적으로)]24-2/ 제5 소번역메모리 재정렬
at which a very small amount[매우 작은 양의 ]16-3/
of fuel[연료가]18-4/
can be a operating state[작동 상태일 수 있다. ]10-5/
is metered,[]26/
especially/ for catalyst/ heating.[]30/
[6-1. 제6 소번역단위에 대해 번역메모리DB를 검색하여 전체적으로 일치하면 치환하고, 부분적으로 일치하는 경우 확장 소번역메모리 DB를 검색하여 저장된 확장 소번역메모리와 일치하면 확장 소번역메모리를 적용하여 번역하고, 확장 소번역메모리와 일치하지 않으면 일치하지 않는 부분을 기계번역하고, 추가로 사용자 번역으로 제6 소번역메모리 생성]
A second operating BZ2 state[제 2 작동 BZ2 상태는 ]5-1/
(in contrast to operating state BZ1)[(작동 상태 BZ1와 대조적으로)]24-2/
at which a very small amount[매우 작은 양의 ]16-3/
of fuel[연료가]18-4/
can be a operating state[작동 상태일 수 있다. ]10-5/
is metered,[계량되는]26/ 제6 소번역단위 번역메모리DB 검색하여 치환, 확장 소번역메모리DB 검색하여 번역, 기계번역 또는 사용자 번역으로 제6 소번역메모리 생성
especially/ for catalyst/ heating.[]30/
[6-2. 제6 소번역메모리 재정렬]
A second operating BZ2 state[제 2 작동 BZ2 상태는 ]5-1/
(in contrast to operating state BZ1)[(작동 상태 BZ1와 대조적으로)]24-2/
at which a very small amount[매우 작은 양의 ]16-3/
of fuel[연료가]18-4/
is metered,[계량되는]26-5/ 제6 소번역메모리 재정렬
can be a operating state[작동 상태일 수 있다. ]10-6/
especially/ for catalyst/ heating.[]30/
[7-1. 제7 소번역단위에 대해 번역메모리DB를 검색하여 전체적으로 일치하면 치환하고, 부분적으로 일치하는 경우 확장 소번역메모리 DB를 검색하여 저장된 확장 소번역메모리와 일치하면 확장 소번역메모리를 적용하여 번역하고, 확장 소번역메모리와 일치하지 않으면 일치하지 않는 부분을 기계번역하고, 추가로 사용자 번역으로 제7 소번역메모리 생성]
A second operating BZ2 state[제 2 작동 BZ2 상태는 ]5-1/
(in contrast to operating state BZ1)[(작동 상태 BZ1와 대조적으로)]24-2/
at which a very small amount[매우 작은 양의 ]16-3/
of fuel[연료가]18-4/
is metered,[계량되는]26-5/
can be a operating state[작동 상태일 수 있다. ]10-6/
especially/ for catalyst/ heating.[ 특히 촉매 가열을 위해]30/ 제7 소번역단위 번역메모리DB 검색하여 치환, 확장 소번역메모리DB 검색하여 번역, 기계번역 또는 사용자 번역으로 제7 소번역메모리 생성
[7-2. 제7 소번역메모리 재정렬]
A second operating BZ2 state[제 2 작동 BZ2 상태는 ]5-1/
(in contrast to operating state BZ1)[(작동 상태 BZ1와 대조적으로)]24-2/
at which a very small amount[매우 작은 양의 ]16-3/
of fuel[연료가]18-4/
especially/ for catalyst/ heating.[ 특히 촉매 가열을 위해]30-5/ 제7 소번역메모리 재정렬
is metered,[계량되는]26-6/
can be a operating state[작동 상태일 수 있다. ]10-7/
이와 같이, 1-1에서 7-2까지의 순서로 원문문장의 소번역단위들이 처리되며, 소번역단위에 대해 번역메모리DB를 검색하여 전체적으로 일치하면 치환하고, 부분적으로 일치하는 경우 확장 소번역메모리 DB를 검색하여 저장된 확장 소번역메모리와 일치하면 확장 소번역메모리를 적용하여 번역하고, 확장 소번역메모리와 일치하지 않으면 일치하지 않는 부분을 기계번역하고, 추가로 사용자 번역으로 소번역메모리를 생성한다.
또한, 소번역메모리의 소번역단위들에 소단위 대응관계지시자들을 지정하면 중간단계 소번역메모리가 다음과 같이 생성된다.
[원문문장을 중심으로 순차적으로 정렬된 중간단계 소번역메모리]
A second operating BZ2 state[제 2 작동 BZ2 상태는]5-1/
can be a operating state[작동 상태일 수 있다.]10-7/
at which a very small amount[매우 작은 양의]16-3/
of fuel[연료가]18-4/
(in contrast to operating state BZ1)[(작동 상태 BZ1와 대조적으로)]24-2/
is metered,[계량되는]26-6/
especiallly for catalyst heating[특히 촉매 가열을 위해]30-5/
[번역문장을 중심으로 순차적으로 정렬된 중간단계 소번역메모리]
A second operating BZ2 state[제 2 작동 BZ2 상태는 ]5-1/
(in contrast to operating state BZ1)[(작동 상태 BZ1와 대조적으로)]24-2/
at which a very small amount[매우 작은 양의 ]16-3/
of fuel[연료가]18-4/
especially/ for catalyst/ heating.[ 특히 촉매 가열을 위해]30-5/
is metered,[계량되는]26-6/
can be a operating state[작동 상태일 수 있다. ]10-7/
다른 실시예에서, 일괄적으로 중간단계 소단위 대응관계지시자를 지정하는 방법이 이용될 수 있다.
구체적으로, [1-1]에서 [7-2]까지 각 소번역단위에 대한 소번역메모리마다 소단위 대응관계지시자 생성하지 않고 중간단계 소번역메모리를 입력하여 전체 번역문장을 완성(중간단계 소번역메모리를 번역문장에 따라 정렬)한다.
A second operating BZ2 state[제 2 작동 BZ2 상태는]5-/
(in contrast to operating state BZ1)[(작동 상태 BZ1와 대조적으로)]24-/
at which a very small amount[매우 작은 양의]16-/
of fuel[연료가]18-/
*especiallly for catalyst heating[특히 촉매 가열을 위해]30-/
is metered,[계량되는]26-/
can be a operating state[작동 상태일 수 있다.]10-/
그후, 다음과 같이 일괄적으로 소단위 대응관계지시자의 소번역문위치정보를 지정하는 방법이다.
A second operating BZ2 state[제 2 작동 BZ2 상태는]5-1/
(in contrast to operating state BZ1)[(작동 상태 BZ1와 대조적으로)]24-2/
at which a very small amount[매우 작은 양의]16-3/
of fuel[연료가]18-4/
especiallly for catalyst heating[특히 촉매 가열을 위해]30-5/
is metered,[계량되는]26-6/
can be a operating state[작동 상태일 수 있다.]10-7/
이러한 번역메모리 생성 방법은 초기에 소번역메모리를 구축하는 과정에서는 길이가 짧은 단순한 문장의 경우에 일반 번역시간보다 약간의 시간이 더 걸린다고 할지라도, 일단 한번 번역된 소번역단위는 소번역메모리로 저장되기만 하면 이후 번역부터 소번역메모리 이용이 가능해지고 확장 소번역메모리 DB를 구축하고 확장 소번역메모리 DB로부터 확장 소번역메모리 이용이 가능해진다. 소번역메모리를 포함하는 번역메모리가 쌓일수록 새로운 원문문장에 적용할 소번역메모리들이 많아지기 때문에 사용자는 직접 소번역단위들을 번역하지 않고 CAT 프로그램을 이용하여 직접 타이핑하는 시간을 줄일 수 있으므로, 번역 속도가 빨라지게 된다.
도 2b는 본 발명에 따른 소번역메모리를 생성하기 위한 유저 인터페이스 유닛(10)의 입력 유닛(11) 및 표시 유닛(12)의 다른 실시예이다.
번역문이 표시되는 창이 표시 유닛(12)이고 소번역메모리 생성 작업이 이루어지는 창이 입력 유닛(10)이다. 도 2b의 소번역메모리 입력 유닛(10)에 의해 생성된 소번역메모리는 도 3a 내지 도 3g일 수 있다.
도 2c 및 도 2cc는 본 발명에 따른 1차 소번역메모리를 생성하기 위한 1차 소번역메모리 입력 유닛(111) 및 2차 소번역메모리를 생성하기 위한 2차 소번역메모리 입력 유닛(211)의 또 다른 실시예이다.
1차 소번역메모리 생성 작업이 이루어지는 창이 1차 소번역메모리 입력 유닛(111)이고 1차 소번역메모리 생성 작업이 이루어지는 창이 2차 소번역메모리 입력 유닛(211)이다.
도 2c에서 2차 소번역메모리 입력 유닛(211)은 1차 소번역메모리 입력 유닛(111)의 노란색의 3번째 1차 소번역단위(102)를 세분화하여 파싱한 2차 소번역단위(202)를 도시한다.
도 2cc은 2차 소번역메모리 입력 유닛(211)에서 1차 소번역메모리 입력 유닛(111)의 3번째 1차 소번역단위(102)를 세분화하여 파싱한 2차 소번역단위(202)들에 대해 2차 소번역문(207)들을 생성하고 정렬하여 1차 소번역메모리 입력 유닛(111)에 3번째 1차 소번역문(107)을 생성한 것을 보여준다.
도 2cc의 1차 소번역메모리 입력 유닛(111) 및 2차 소번역메모리 입력 유닛(211)을 통해 생성한 소번역메모리는 도 3h 및 도 3i에 도시된다.
5. 원문문장에 대한 중간단계 소번역메모리의 최종 번역 메모리 형태로의 변
본 발명에 따르면, 소번역단위들에 대해 번역메모리DB를 검색하여 전체적으로 일치하면 치환하고, 부분적으로 일치하는 경우 확장 소번역메모리 DB를 검색하여 저장된 확장 소번역메모리와 일치하면 확장 소번역메모리를 적용하여 번역하고, 확장 소번역메모리와 일치하지 않으면 일치하지 않는 부분을 기계번역하고, 추가로 사용자 번역으로 소번역메모리 생성한 후, 소번역단위, 소번역메모리 및 소단위 대응관계지시자에 따라 정렬되기 전의 중간단계 소번역메모리는 다음과 같이 표현될 수 있다(도 2a).
A second operating BZ2 state can be a operating state at which a very small amount of fuel (in contrast to operating state BZ1) is metered, especiallly for catalyst heating.// A second operating BZ2 state[제 2 작동 BZ2 상태는]5 -1/ can be a operating state[작동 상태일 수 있다.]10 -7/ at which a very small amount[매우 작은 양의]16 -3/of fuel[연료가]18 -4/ (in contrast to operating state BZ1)[ (작동 상태 BZ1와 대조적으로)]24 -2/is metered, [계량되는]26-6/ especiallly for catalyst heating[특히 촉매 가열을 위해]30-5/
[소번역메모리를 포함하는 번역 메모리(도 3a)]
A second operating BZ2 state can be a operating state at which a very small amount of fuel (in contrast to operating state BZ1) is metered, especiallly for catalyst heating.// [ 제 2 작동 BZ2 상태는 ]5-1/[작동 상태일 수 있다. ]10-7/[매우 작은 양의 ]16-3/[연료가 ]18-4/[(작동 상태 BZ1와 대조적으로) ]24-2/[계량되는 ]26-6/ [특히 촉매 가열을 위해]30-5/
[완성된 최종 번역문장 순서대로 소번역메모리 재정렬된 번역메모리(도 3b)]
A second operating BZ2 state can be a operating state at which a very small amount of fuel (in contrast to operating state BZ1) is metered, especiallly for catalyst heating.// [ 제 2 작동 BZ2 상태는 ]5-1/[(작동 상태 BZ1와 대조적으로) ]24-2/[매우 작은 양의 ]16-3/[연료가 ]18-4/[특히 촉매 가열을 위해 ]30-5/[계량되는 ]26-6/[작동 상태일 수 있다.]10-7/
소번역메모리를 포함하는 번역메모리는 소번역메모리와 소단위 대응관계지시자를 분리하는 방식으로 다음과 같이 나타내는 것도 가능하다. 소번역메모리의 소단위 대응관계지시자는 각각의 소번역메모리 사이에 위치할 때는 각각의 소번역메모리의 정렬 순서를 표시하는 1부터 오름차순으로 증가하는 수로 표시되어 소번역문의 정렬 순서를 나타내었으나, 문미에 위치될 때에는 이미 소번역문이 번역 문장의 정렬 순서로 정렬되었으므로, 각 소번역문이 번역 문장에 차지하는 단어들의 위치를 지정하는 정보를 갖도록 변형될 수 있다. 이러한 예는 아래와 같다(도 3c).
[소번역문와 소단위 대응관계지시자를 분리]
A second operating BZ2 state can be a operating state at which a very small amount of fuel (in contrast to operating state BZ1) is metered, especiallly for catalyst heating.// 제 2 작동 BZ2 상태는 /(작동 상태 BZ1와 대조적으로) /매우 작은 양의 /연료가 /특히 촉매 가열을 위해 /계량되는 /작동 상태일 수 있다./[5-5,24-9,16-12,18-13,30-17,26-18,10-22]
소번역문이 번역문장의 순서로 이미 정렬되어 있으므로 소번역문에 대한 정렬 순서를 제거하고 소번역문의 원문문장 대응관계를 포함하는 소번역단위에 대한 소단위 대응관계지시자인 소번역단위위치정보만으로 표현하는 것도 가능하다(도 3d).
[소번역단위에 대한 소단위 대응관계지시자만으로 표현]
A second operating BZ2 state can be a operating state at which a very small amount of fuel (in contrast to operating state BZ1) is metered, especiallly for catalyst heating.// 제 2 작동 BZ2 상태는 /(작동 상태 BZ1와 대조적으로) /매우 작은 양의 /연료가 /특히 촉매 가열을 위해 /계량되는 /작동 상태일 수 있다./[5,24,16,18,30,26,10]
이러한 포맷에서 '/'는 소번역문을 지정하고, 소단위 대응관계지시자는 소번역문에 대응하는 소번역단위가 원문문장에서 차지하는 위치를 나타낸다. 예를 들어 소번역문 "연료가"에 지정된 소단위 대응관계지시자는 18이므로 대응하는 소번역단위는 시작 단어 17에서 끝 어절이 18번째 단어(또는 어절)까지인 'of fuel'이 된다.
그 후 변형을 거쳐, 소번역메모리 번역부를 구분하는 기호 '/'를 제거하고 종래와 같은 번역메모리의 원문 문장과 이에 상응하는 번역문 문장의 문장 쌍으로 변형하여서, 최종적으로 종래의 번역 메모리에 소번역단위와 소번역메모리의 소단위 대응관계지시자를 추가한 형태로 표현하면 다음과 같다(도 3e).
[종래의 번역 메모리에 소단위 대응관계지시자를 추가한 형태로 표현]
A second operating BZ2 state can be a operating state at which a very small amount of fuel (in contrast to operating state BZ1) is metered, especiallly for catalyst heating.// 제 2 작동 BZ2 상태는 (작동 상태 BZ1와 대조적으로) 매우 작은 양의 연료가 특히 촉매 가열을 위해 계량되는 작동 상태일 수 있다. [5-5,24-9,16-12,18-13,30-17,26-18,10-22]
이러한 소번역메모리를 갖는 번역 메모리 포맷은 종래의 번역 메모리와 동일한 형태를 유지하면서, 원문문장 내 소번역단위와 번역메모리 내 소번역메모리의 대응관계를 나타내는 정보까지 포함할 수 있다.
도 3e에 도시된 형태가 종래의 번역메모리 포맷과 가장 가까운 형태이지만, 도 3a 내지 도 3d에 도시된 형태들은 필요에 따라 번역 메모리 포맷으로 사용될 수 있다.
소번역메모리를 포함하는 번역메모리의 소단위 대응관계표시자는 번역메모리의 원문과 번역문 저장 영역과 다른 영역에 저장되어 저장 날짜 출처 등과 같이 사용자에게 보이지 않게 할 수 있다.
이러한 본 발명에 따른 소번역메모리를 포함하는 번역메모리 포맷은 기존의 번역메모리 포맷에 비해 여러가지 장점을 갖는다.
본 발명에 따른 번역메모리는 기존의 번역메모리와 비교하여 번역단위인 원문 문장이 세분된 소단위인 소번역단위에 대한 번역쌍인 소번역메모리를 추가로 표시하여, 소번역메모리가 정렬되어 번역문 문장을 형성하도록 소단위 대응관계지시자를 갖는다.
따라서, 첫째로, 본 발명에 따른 번역메모리는 소번역메모리를 포함함으로써 번역될 원문 문장이 시스템에 이미 존재하는 번역 메모리DB의 원문 문장과 100% 일치하지 않더라도 번역될 원문문장의 일부와 일치하는 소번역메모리(들)을 이용하여 번역될 원문문장의 일부라도 번역함으로써 번역의 정확성이 높아지고 번역 시간이 단축될 수 있다.
둘째로, 원문문장이 100% 일치하지 않더라도 문장 내 소번역단위가 일치하면, 일치된 소번역단위에 해당하는 소번역단위 번역 메모리를 이용할 수 있으므로, 기존의 번역 메모리보다 번역 메모리의 활용 빈도를 높일 수 있다.
셋째로, 본 발명에 따른 번역메모리는 소번역메모리를 포함함으로써 오류 체크가 문장 단위 별이 아닌 문장 소단위 별로 이루어지기 때문에, 오류 체크가 정확해지고 오류 체크 시간이 단축될 수 있다. 종래의 번역 검수 프로그램들은 문장 대 문장을 비교하기 때문에, 문장 내에 동일한 단어가 여러번 나오는 경우 원문 문장 내 단어 대 번역문 문장 내 단어의 매칭율이 떨어지는 단점이 있었다. 반면, 본 발명의 번역메모리는 각각의 문장 소단위에 대해 위치 정보를 포함하고 있기 때문에, 원문 문장의 소번역단위 단어들과 번역문장 내의 소번역문 단어들의 매칭율이 현저하게 높아진다.
넷째로, 원문문장에 대해 세분된 소번역단위에 대한 소번역문을 포함하기 때문에, 원문문장에 대한 문장 성분 분석이 정확해지며, 원문문장에 있는 단어들의 대응 번역부분을 정확하게 추출할 수 있게 되므로, 번역 메모리에 대한 활용도가 높아진다. 예를 들어 소번역문이 소번역단위의 대응관계에 관한 정보로부터 소번역문이 한국어인 경우 한국어는 조사에 의해 정확하게 문장성분의 파악이 가능하므로, 소번역문들을 분석하여 원문문장에서 동일한 원문 단어에 대한 공통된 소번역문의 번역을 분석하여 소번역문의 번역 패턴을 추출할 수 있다. 따라서, 문장 전체가 아닌 소번역문에 대한 확장 소번역메모리 구축을 가능하게 한다. 이러한 확장 소번역메모리는 종래의 문장 단위 번역메모리의 확장 메모리보다 세분되어 문장 내의 소번역단위에 대해 구축되기 때문에 월등하게 정확하고 활용도가 높게 된다.
다섯째로, 원문 문장의 소번역단위에 대한 소번역문이 구축되기 때문에, 일방향 번역메모리를 반대로 역방향 번역메모리로 구축할 수 있다. 예를 들어, 원문이 영어인 원문에 대해 목표 언어가 한국어인 소번역메모리를 포함하는 번역메모리 DB를 구축하였다면, 역으로, 한국어인 소번역문을 원문의 소번역단위로 하고 영어인 소번역단위를 번역문의 소번역문로 하는 역방향 번역메모리 DB를 구축하여 일방향 번역메모리 DB를 구축하는 것만으로도 역방향 번역메모리 DB를 구축할 수 있다. 따라서, 별도로, 한국어가 원문 언어이고 영어가 목표 언어인 번역메모리를 별도로 구축하여 데이터를 축적하지 않고도, 영어가 원문 언어이고 한국어가 목표 언어인 소번역메모리를 포함하는 번역메모리 DB의 구축만으로, 반대방향의 번역메모리를 구축하는 비용과 시간을 절약할 수 있다.
6. 번역메모리 내에 추가적으로 세분화된 소번역메모리(2차 소번역메모리)를 갖는 소번역메모리(1차 소번역메모리)
원문 문장에 대한 소번역단위 분할은 소번역단위의 갯수가 많을수록 많은 소번역메모리를 생성할 수 있지만, 정렬해야하는 소번역문의 갯수도 소번역단위의 갯수만큼 많아지기 때문에, 번역의 효율성을 높일 수 있는 적절한 갯수의 소번역단위 결정이 필요하다.
도 3h 및 도 3i는 도 2c 및 도 2cc의 1차 소번역메모리 입력 유닛(111) 및 2차 소번역메모리 입력 유닛(211)을 통해 생성되는 번역메모리로서, 원문언어로 된 원문 문장 및 목표언어로 된 번역 문장의 쌍을 포함하며 소단위 번역메모리인 1차 소번역메모리(109)가 1차 소번역메모리(109)를 추가로 세분화한 추가적인 소번역메모리인 2차 소번역메모리(209)를 포함하는 번역메모리를 도시한다.
원문 문장에 대한 소번역단위 분할은 소번역단위의 갯수가 많을수록 많은 소번역메모리를 생성할 수 있지만, 정렬해야하는 소번역문의 갯수도 소번역단위의 갯수만큼 많아지기 때문에, 번역의 효율성을 높일 수 있는 적절한 갯수의 소번역단위 결정이 필요하다.
원문 문장을 소번역단위들(102)로 분할하여 상기 소번역단위들(102) 각각에 대응하는 소번역문들(107)을 생성하고, 소번역단위들(102) 각각에 대한 소번역단위위치정보(108') 및 소번역문들 각각에 대한 소번역문위치정보(108")를 생성하여 형성된 소번역단위(102) 및 소번역문(107)의 쌍을 갖는 소번역메모리가 소단위대응관계지시자(108)에 의해 표시되는 소번역메모리를 포함하는 번역메모리의 포멧은 2차 소번역메모리(209)를 포함하는 1차 소번역메모리(109)의 포멧에도 적용될 수 있다.
즉, 원문언어로 된 원문 문장 및 목표언어로 된 번역 문장의 쌍을 포함하며 소단위 번역메모리(1차 소번역메모리)를 포함하는 번역 메모리는 상기 1차 소번역메모리(109)는 상기 원문 문장을 번역 소단위로 세분화한 1차 소번역단위(102) 및 상기 1차 소번역단위(102)에 대응하는 번역 문장 내의 번역 부분인 1차 소번역문(107)의 쌍을 포함한다. 여기서, 상기 번역 메모리는 상기 번역 메모리 내에서 상기 1차 소번역메모리(109)를 특정하는 1차 소단위 대응관계지시자(108)를 포함하고, 1차 소단위 대응관계지시자(108)는 1차 소번역단위위치정보(108') 및 1차 소번역문위치정보(108")을 포함한다. 1차 소단위 대응관계지시자(108)에 의해 상기 번역 메모리 내에서 1차 소번역메모리(109)의 1차 소번역단위(102) 및 1차 소번역문(107) 쌍의 대응 관계가 표시된다.
일 실시예에서, 1차 소번역메모리(109)는 1차 소번역메모리(109)를 추가로 세분화한 추가적인 소번역메모리인 2차 소번역메모리(209)를 포함할 수 있다. 2차 소번역메모리(209)는 2차 소번역메모리(209)로 추가로 세분화하기 전 1차 소번역메모리(109)의 1차 소번역단위(102)를 추가로 세분화한 번역 소단위인 2차 소번역단위(202) 및 2차 소번역단위(202)에 대응하는 번역 부분인 2차 소번역문(207)의 쌍을 포함하고, 1차 소번역메모리(109)는 2차 소번역메모리(209)를 특정하는 2차 소단위 대응관계지시자(208)를 포함하고, 2차 소단위 대응관계지시자(208)은 2차 소번역메모리(209)의 2차 소번역단위(202) 및 2차 소번역문(207) 쌍의 대응 관계를 나타낸다.
- A first operating state BZ1 can be a state of low load, and a second operating BZ2 state can be a operating state at which a very small amount of fuel (in contrast to operating state BZ1) is metered, especiallly for catalyst heating.
위 예문을 접속사의 앞 및 뒤에서 파싱하는 기계적 분할 규칙에 의해 분할한 후 생성한 소번역메모리를 포함하는 번역메모리로 저장하면 다음과 같다.
- A first operating state BZ1 can be a state of low load,[제 1 작동 상태 BZ1는 낮은 부하의 상태일 수 있고,]12-/ and[그리고]13-/ a second operating BZ2 state can be a operating state at which a very small amount of fuel (in contrast to operating state BZ1) is metered, especiallly for catalyst heating.[제 2 작동 BZ2 상태는 (작동 상태 BZ1와 대조적으로) 매우 작은 양의 연료가 특히 촉매 가열을 위해 계량되는 작동 상태일 수 있다.]43-/
- A first operating state BZ1 can be a state of low load, and a second operating BZ2 state can be a operating state at which a very small amount of fuel (in contrast to operating state BZ1) is metered, especiallly for catalyst heating.
제 1 작동 상태 BZ1는 낮은 부하의 상태일 수 있고,[12-10]/ 그리고[13-11]/ 제 2 작동 BZ2 상태는 (작동 상태 BZ1와 대조적으로) 매우 작은 양의 연료가 특히 촉매 가열을 위해 계량되는 작동 상태일 수 있다.[43-33]
- A first operating state BZ1 can be a state of low load, and a second operating BZ2 state can be a operating state at which a very small amount of fuel (in contrast to operating state BZ1) is metered, especiallly for catalyst heating. 제 1 작동 상태 BZ1는 낮은 부하의 상태일 수 있고, 그리고 제 2 작동 BZ2 상태는 (작동 상태 BZ1와 대조적으로) 매우 작은 양의 연료가 특히 촉매 가열을 위해 계량되는 작동 상태일 수 있다. [12-10, 13-11, 43-33]
2차 소번역메모리(209)는 1차 소번역메모리(109)를 더 세분화한 소번역메모리이다. 위의 예문의 번역메모리는 소단위 대응관계지시자[12-10, 13-11, 43-33]에 의해 지시되는, 3개의 소번역메모리를 포함한다([A first operating state BZ1 can be a state of low load /제 1 작동 상태 BZ1는 낮은 부하의 상태일 수 있고] , [and /그리고], [a second operating BZ2 state can be a operating state at which a very small amount of fuel (in contrast to operating state BZ1) is metered, especiallly for catalyst heating./ 제 2 작동 BZ2 상태는 (작동 상태 BZ1와 대조적으로) 매우 작은 양의 연료가 특히 촉매 가열을 위해 계량되는 작동 상태일 수 있다.]).
이러한 소번역메모리를 더 세분화한다면 세분화된 소번역메모리는 2차 소번역메모리(209)가 되고 2차로 세분화되기 전 소번역메모리는 1차 소번역메모리(109)이다. 예를 들어, 세번째 소번역메모리[a second operating BZ2 state can be a operating state at which a very small amount of fuel (in contrast to operating state BZ1) is metered, especiallly for catalyst heating./ 제 2 작동 BZ2 상태는 (작동 상태 BZ1와 대조적으로) 매우 작은 양의 연료가 특히 촉매 가열을 위해 계량되는 작동 상태일 수 있다.]를 더 세분화하여 단문 내에서 명사뒤 전치사앞을 파싱하는 기계적 분할 규칙에 의해 분할한 후 생성한 소번역메모리를 포함하는 번역메모리로 저장하면 세번째 소번역메모리인 [a second operating BZ2 state can be a operating state at which a very small amount of fuel (in contrast to operating state BZ1) is metered, especiallly for catalyst heating./ 제 2 작동 BZ2 상태는 (작동 상태 BZ1와 대조적으로) 매우 작은 양의 연료가 특히 촉매 가열을 위해 계량되는 작동 상태일 수 있다.]가 1차 소번역메모리(109)가 되고, 이를 세분화한 아래의 소번역메모리들이 2차 소번역메모리(209)가 된다.
a second operating BZ2 state[제 2 작동 상태 BZ2는]5-5/ can be a operating state[작동 상태일 수 있다.]10-22/ at which a very small amount of fuel[매우 작은 양의 연료가]18-13/ (in contrast to operating state BZ1)[(작동 상태 BZ1와 대조적으로)]24-9/ is metered,[계량되는] especiallly for catalyst heating.[특히 촉매 변환기 가열을 위해]30-17/
따라서, 2차 소번역메모리(209)를 갖는 1차 소번역메모리(109)를 포함하는 번역메모리는 도 3h 및 도 3i와 같이 표시될 수 있다. 2차 소번역메모리(209)를 갖는 번역메모리에서 2차 소번역메모리(209)와 구별하기 위해 2차로 세분화되기 전 1차 소번역메모리 입력 유닛(111)에서 생성된 소번역메모리를 1차 소번역메모리(109)로 지칭한다. 1차 소번역메모리(109)는 2차 소번역메모리(209)를 가질 수 있다. 1차 소번역메모리(109)의 소단위 대응관계지시자(108)는 소번역메모리의 소단위 대응관계지시자와 비교하여 1차 소번역메모리(109)의 소단위 대응관계지시자(108) 바로 뒤의 괄호 안에 2차 소단위 대응관계지시자(208)들을 더 가지고 있다.
A first operating state BZ1 can be a state of low load, and a second operating BZ2 state can be a operating state at which a very small amount of fuel (in contrast to operating state BZ1) is metered, especiallly for catalyst heating. 제 1 작동 상태 BZ1는 낮은 부하의 상태일 수 있고, 그리고 제 2 작동 BZ2 상태는 (작동 상태 BZ1와 대조적으로) 매우 작은 양의 연료가 특히 촉매 가열을 위해 계량되는 작동 상태일 수 있다.[ 0-55|0-31|0, 56-3|32-3|1, 60-172|36-76|2(0-28|0-14|0,29-24|65-11|5,54-36|34-12|2,91-36|15-18|1,128-11|60-4|4,140-32|47-12|3) ]
위에서 1차 소번역단위(102)를 표시하는 1차 소단위 대응관계지시자(108) "60-172|36-76|2"는 2차 소번역메모리(209)를 표시하는 2차 소단위 대응관계표시자(208) "0-28|0-14|0, 29-24|65-11|5, 54-36|34-12|2, 91-36|15-18|1, 128-11|60-4|4, 140-32|47-12|3"를 괄호 안에 포함한다.
이러한 2차 소번역메모리(209)를 갖는 1차 소번역메모리(109)를 구성요소로 가짐으로서 소번역메모리를 포함하는 번역메모리는 번역문장으로부터 소번역메모리를 생성하는 1차 소번역메모리 입력 유닛(111)에서 단문을 소번역단위로 하는 1차 소번역메모리(109)를 생성하고, 1차 소번역단위로부터 2차 소번역메모리를 생성하는 2차 소번역메모리 입력 유닛(211)에서 단문 내에 세분화된 문장성분들에 대한 소번역메모리인 2차 소번역메모리(209)를 가질 수 있다(도 2c 및 도 2cc 참조).
이러한 1차 소번역메모리 입력 유닛(111)과 2차 소번역메모리 입력 유닛(211)의 구성은 복문을 단문으로 분할한 뒤 소번역메모리(1차 소번역메모리)를 생성하고, 각각의 단문들을 더 세분화된 소번역단위로 분할하여 소번역메모리(2차 소번역메모리)를 생성할 수 있게 한다.
최근 단문에 대한 기계번역 성능이 높아짐에 따라, 복문의 경우 접속사 앞 및 뒤를 분할하는 기계적 분할 규칙에 의해 복문을 단문의 1차 소번역단위(102)로 분할하고 단문에 대해 기계번역을 적용하여 1차 소번역문(107)을 생성하여 1차 소번역메모리(109)를 생성하며, 복문을 이루는 단문 중 문장 길이가 긴 1차 소번역단위(102)가 기계번역으로 적용하여 번역문을 생성하면 부정확한 경우 문장 길이가 긴 1차 소번역단위(102)를 2차 소번역단위(202)들로 분할하여 2차 소번역문(207)들을 갖는 2차 소번역문(207)을 생성할 수 있다. 이러한 2차 소번역단위(202)를 갖는 번역메모리는 기계번역을 이용하여 번역메모리를 생성할 수 있는 장점이 있다. 또한, 이미 저장된 소번역메모리를 불러오는 작업에서도 여러 장점들을 가지게 된다. 1차 소번역메모리 입력 유닛(111)에서는 단문 위주의 소번역메모리를 검색하여 불러오고 2차 소번역메모리 입력 유닛(211)에서는 단문을 구성하는 문장 성분을 이루는 소번역메모리들을 불러와 정렬 또는 삽입함으로써 번역문장을 완성할 수 있다.
일 실시예에서, 2차 소단위 대응관계지시자(208)은 2차 소번역단위(202)의 소번역단위 내 위치를 나타내는 정보인 2차 소번역단위위치정보(208')와 소번역문의 번역 문장 내 위치를 나타내는 정보인 2차 소번역문위치정보(208")를 포함할 수 있고, 2차 소번역단위위치정보(208')들은 2차 소번역단위(202)들 각각의 원문 문장 내 소단위로 세분화된 위치를 지시할 수 있는 숫자를 포함하고, 2차 소번역문위치정보(208")들은 상기 2차 소번역문(207)들 각각의 번역 문장 내 위치를 지시할 수 있는 숫자를 포함할 수 있다.
일 실시예에서, 2차 소번역단위위치정보(208')들은 상기 2차 소번역단위(202)들 각각의 1차 소번역문(107) 내 소단위로 세분화된 위치를 지시할 수 있는 숫자를 포함하고, 2차 소번역문위치정보(208")들은 2차 소번역문(207)들 간의 1차 소번역문(107) 내 정렬 순서를 지시할 수 있는 숫자를 포함할 수 있다.
일 실시예에서, 2차 소번역단위위치정보(208')들은 1차 소번역단위(102) 내에서 1차 소번역단위(102)의 첫 문자에 대한 2차 소번역단위(202)들 각각의 첫 문자 및 마지막 문자의 위치를 포함하고, 2차 소번역문위치정보(208")는 1차 소번역문(107) 내에서 1차 소번역문(107)의 첫 문자에 대한 2차 소번역문(207)들 각각의 첫 문자, 및 1차 소번역문(107)의 첫 문자에 대한 2차 소번역문(207)들 각각의 마지막 문자의 위치, 및 2차 소번역문(207)들 각각이 인접한 다른 소번역문(207) 내로 삽입되는 위치를 지시하는 위치를 포함할 수 있다.
일실시예에서, 소번역단위들 각각의 원문 문장 내 소단위로 세분화된 위치를 지시할 수 있는 숫자들은 원문 문장 내에서 원문 문장의 첫 문자에 대한 소번역단위들 각각의 마지막 문자의 위치를 지시할 수 있고, 소번역문들 각각의 번역 문장 내 위치를 지시할 수 있는 숫자들은 번역문 문장 내에서 번역문 문장의 첫 문자에 대한 소번역문들 각각의 마지막 문자의 위치를 지시할 수 있다.
일실시예에서, 소번역문들 각각의 번역 문장 내 위치를 지시할 수 있는 숫자들은 번역 문장 내에서 소번역문들 각각의 정렬 순서를 나타내는 위치 및 소번역문들 각각이 인접한 다른 소번역문 내로 삽입되는 위치 중 하나 이상을 더 포함할 수 있다.
소번역메모리 또는 1차 소번역메모리 및 2차 소번역메모리를 포함하는 번역 메모리는 컴퓨터 판독가능한 저장 매체에 기록되어 번역 등의 작업에서 활용될 수 있다.
이러한, 2차 소번역메모리로 더욱 세분화된 소번역메모리를 포함하는 번역메모리는 단문위주의 긴 소번역메모리는 1차 소번역메모리로 저장하고, 단문 내 문장 성분을 구별하는 소번역메모리를 2차 소번역메모리로 저장할 수 있기 때문에, 단문과 복문을 고려하고 더 세분화하여 단문 내 문장 성분을 고려한, 단계적인 번역 및 기계번역에 적용될 수 있는 장점이 있다.
7. 등록 관용구 저장 및 용어 추출
표 3는 본 발명에 따른 소번역메모리를 포함하는 번역메모리를 이용한 등록 관용구의 실시예이다.
원문언어부 목표언어부
A second operating BZ2 state 제 2 작동 BZ2 상태는
can be a operating state 작동 상태일 수 있다
at which a very small amount 매우 작은 양의
of fuel 연료가
in contrast to operating state BZ1 작동 상태 BZ1와 대조적으로
is metered 계량되는
especiallly for catalyst heating 특히 촉매 가열을 위해
본 발명에 따른 소번역메모리를 포함하는 번역메모리를 저장하는 과정에서 소번역단위에 대한 소번역메모리 생성과정은 등록 관용구 저장에 이용될 수 있다. 모든 소번역단위는 등록 관용구의 원문 언어부분이 되고 목표 언어부분에 해당하는 소번역부분은 소번역메모리로 저장되는 대신 등록 관용구로 저장될 수 있다.
또한, 소번역단위에 대한 등록 관용구는 원문언어의 의미가 반영되지 않은 "at which" 및 목표언어의 "는" "의" "가"의 조사부분을 삭제하는 후처리 과정을 통해 표 4에서와 같이, 조사부분을 삭제하고 저장될 수 있다.
원문언어부 목표언어부
A second operating BZ2 state 제 2 작동 BZ2 상태
can be a operating state 작동 상태일 수 있다
at which a very small amount 매우 작은 양
of fuel 연료
in contrast to operating state BZ1 작동 상태 BZ1와 대조적으로
is metered 계량되는
especiallly for catalyst heating 특히 촉매 가열을 위해
아래 표 5에서 보는 바와 같이, 명사 뒷부분을 분할하면 소번역단위에 하나의 명사만을 포함하게 되므로, 명사 이외의 문장성분을 제거하여 용어집을 만들 수 있다. 이 경우, 명사는 항상 소번역단위에서 끝부분에 위치하고 소번역문에서 명사는 주로 소번역문에서 앞부분에 위치하므로, 소번역단위에서 관사, 정관사 및 전치사까지의 단어를 제거하며 소번역문에서 명사 뒤의 조사 이후 단어들 및 품사가 부사인 단어를 제거함으로써 아래와 같이 용어를 추출할 수 있다.
원문언어부 목표언어부
second operating BZ2 state 제 2 작동 BZ2 상태
operating state 작동 상태
very small amount 매우 작은 양
fuel 연료
operating state BZ1 작동 상태 BZ1
catalyst heating 촉매 가열
원문언어로 된 원문 문장 및 목표언어로 된 번역 문장의 쌍을 포함하며 소번역메모리를 포함하는 번역 메모리에서 용어를 추출하는 방법은 소번역메모리들 중 원문 문장을 명사 뒤에서 기계적 분할한, 하나의 명사만 포함된, 소번역메모리들을 추출하고, 소번역단위에 관사+명사 또는 정관사+명사, 또는 전치사+명사가 포함된 소번역메모리들을 추출하고, 추출된 상기 소번역메모리의 소번역단위에서 맨 앞부터 관사 또는 정관사 및 전치사까지의 형태소를 제거하고, 소번역문에서 명사 이후의 형태소, 및 품사가 부사인 형태소를 제거하고, 상기 소번역단위에서 제거하고 남은 부분을 용어의 원문언어 부분으로 저장하고, 그리고 상기 소번역단위에 대응하는 소번역문에서 제거하고 남은 부분을 용어의 목표언어 부분으로 저장한다.
8. 역방향 소번역메모리
도 5a 내지 도 5d는 본 발명에 따른 소번역메모리를 포함하는 번역메모리를 이용한 역방향 번역메모리의 실시예이다. 역방향번역메모리는 원문언어(영어)의 원문문장과 번역언어(한국어)의 번역문장이 서로 바뀐 번역메모리(한국어->영어)로 형성된다.
번역 메모리는 원문 문장(예, 영어)에 대한 이전의 번역 문장(예, 한국어)을 저장한 DB이기 때문에, 전술한 본 발명의 소번역메모리를 포함하는 번역메모리의 원문 언어(예, 영어)의 원문 문장과 목표언어(예, 한국어)의 번역문장을 역으로 목표언어의 번역문장을 원문언어의 원문문장(140)(예, 한국어)로하고 원문언어의 원문문장을 목표언어의 번역문장(141)(예, 영어)으로 하고, 그리고 소단위 대응관계지시자(144)의 소번역단위위치정보(144')와 소번역문위치정보(144")를 서로 위치 교환함으로써, 역방향 소번역 메모리(한국어->영어)를 갖는 번역메모리를 구축할 수 있다(도 5a).
이러한 역방향 번역메모리는 번역언어에 대한 별도의 번역메모리(한국어->영어)를 번역을 통해 구축하지 않고도 원문언어에 대한 소번역메모리를 갖는 번역메모리(영어->한국어)를 구축한 것만으로도 역방향메모리 DB를 구축할 수 있다. 따라서, 일방향 소번역 메모리의 구축으로 역방향 소번역 메모리를 구축할 수 있으므로, 두 언어간 번역 메모리 구축 시간을 대폭 줄일 수 있다.
역방향 번역메모리는 도 3a 내지 도 3e의 소번역메모리를 포함하는 번역메모리와 같이, 소번역단위를 포함하는 원문문장, 소번역문을 포함하는 번역문장, 그리고 소번역단위와 소번역문 간의 대응관계를 표시하는 소단위 대응관계지시자를 포함할 수 있다. 예를 들어, 도 5a는 도 3e와 같은 형태, 도 5b는 도 3d와 같은 형태, 도 5c는 도 3c와 같은 형태의 역방향 소번역메모리를 갖는 소번역메모리를 포함하는 번역메모리를 구축할 수 있다.
일 실시예에서, 목표언어가 원문 문장이고 원문 언어가 번역 문장인 역방향 번역에 이용하기 위해, 번역 메모리의 소번역단위에 대응하는 소번역문이 역방향 번역메모리의 소번역단위가 되고, 번역 메모리의 소번역단위가 역방향 번역메모리의 소번역문이 되며, 소번역메모리를 포함하는 번역메모리의 소번역문위치정보가 역방향 번역메모리의 소번역단위위치정보가 되고, 소번역메모리를 포함하는 번역메모리의 소번역단위위치정보가 역방향 번역메모리의 소번역문위치정보가 된다.
다른 실시예에서, 1차 소번역메모리 및 2차 소번역메모리를 포함하는 번역 메모리를 형성한 후, 1차 소번역메모리 및 2차 소번역메모리를 포함하는 번역 메모리로부터, 목표언어가 원문 원어가 되고 원문언어가 목표언어가 되는 역방향 번역에 적용하기 위한 소번역메모리를 포함하는 역방향 번역메모리를 구축할 수 있다. 목표언어가 원문 문장이고 원문 언어가 번역 문장인 역방향 번역에 이용하기 위해, 번역 메모리의 1차 소번역단위 및 2차 소번역단위에 대응하는 1차 소번역문 및 2차 소번역문이 역방향 번역메모리의 1차 소번역단위 및 2차 소번역단위가 된다. 번역 메모리의 1차 소번역단위 및 2차 소번역단위가 역방향 번역메모리의 1차 소번역문 및 2차 소번역문이 된다. 1차 소번역메모리를 포함하는 번역메모리의 1차 소번역문위치정보가 역방향 번역메모리의 1차 소번역단위위치정보가 된다. 1차 소번역메모리를 포함하는 번역메모리의 1차 소번역단위위치정보가 역방향 번역메모리의 1차 소번역문위치정보가 되고, 2차 소번역메모리를 포함하는 번역메모리의 2차 소번역문위치정보가 역방향 번역메모리의 2차 소번역단위위치정보가 되고, 2차 소번역메모리를 포함하는 번역메모리의 2차 소번역단위위치정보가 역방향 번역메모리의 2차 소번역문위치정보가 된다.
이러한 소번역메모리를 포함하는 역방향 번역메모리는 컴퓨터 판독가능한 저장매체에 저장될 수 있다.
9. 사용 언어 형태의 제한 없이 응용
전술한 바와 같이, 본 발명에 따른 소단위 대응관계를 갖는 번역 메모리는 영어를 원문언어로 한국어를 목표언어로 하여 설명되었다. 그러나, 본 발명은 영어와 한국어에 한정되지 않고, 예를 들어 교착어와 교착어, 교착어와 굴절어, 굴절어와 굴절어 간의 다른 원문 언어와 목표 언어 사이에서도 활용될 수 있다.
도 8a는 원문 언어가 영어이고 목표언어가 일본어인 소번역메모리를 포함하는, 도 3d에 대응하는 번역 메모리의 실시예이고, 도 8b는 원문 언어가 영어이고 목표언어가 일본어인 소번역메모리를 포함하는, 도 3e에 대응하는 번역 메모리의 실시예이다.
도 8c는 원문 언어가 영어이고 목표언어가 중국어인 소번역메모리를 포함하는, 도 3d에 대응하는 번역 메모리의 실시예이고, 도 8d는 원문 언어가 영어이고 목표언어가 중국어인 소번역메모리를 포함하는, 도 3e에 대응하는 번역 메모리의 실시예이다.
한국어와, 일본어 및 중국어 사이의 파싱 단위를 생성하는데 있어서의 차이점은 띄어쓰기가 없기 때문에 한국어와 같이 어절단위로 소번역 메모리 위치정보를 지정하는 것이 아니라, 글자단위로 소번역문위치정보를 지정하여 소번역메모리를 포함하는 번역메모리를 지정해야 한다는 것이다.
이와 같이, 일본어 및 중국어 뿐만 아니라, 독일어, 스페인어 등 다른 언어들도 본 발명의 소번역메모리를 포함하는 번역 메모리를 적용시킬 수 있다.

Claims (20)

  1. 원문언어로 된 원문 문장 및 목표언어로 된 번역 문장의 쌍을 포함하며 소단위 번역메모리(9)(이하, "소번역메모리"라고 함)를 포함하는 번역 메모리로서,
    상기 소번역메모리는 상기 원문 문장을 번역 소단위로 세분화한 소번역단위(2) 및 상기 소번역단위에 대응하는 번역 문장 내의 번역 부분인 소번역문(7)의 쌍을 포함하되,
    상기 번역 메모리는 상기 번역 메모리 내에서 상기 소번역메모리를 특정하는 소단위 대응관계지시자(8)를 포함하고, 상기 소단위 대응관계지시자(8)에 의해 상기 번역 메모리 내에서 상기 소번역메모리의 소번역단위 및 소번역문 쌍의 대응 관계가 표시되는,
    소번역메모리를 포함하는 번역 메모리.
  2. 제1 항에 있어서,
    상기 소단위 대응관계지시자(8)는
    상기 소번역단위의 원문 문장 내 위치를 나타내는 정보인 소번역단위위치정보(8'), 및
    상기 소번역문의 번역 문장 내 위치를 나타내는 정보인 소번역문위치정보(8")를 포함하는,
    소번역메모리를 포함하는 번역 메모리.
  3. 제2 항에 있어서,
    상기 번역 메모리의 원문 문장은 복수 개의 소번역단위들로 구성되고, 상기 번역메모리의 번역 문장은 상기 복수 개의 소번역단위들에 대응하는 소번역문들로 구성되고,
    상기 소번역단위들 각각에 대한 소번역문들의 대응관계가 소단위 대응관계표시자들에 의해 표시되고,
    상기 소단위 대응관계표시자들의 소번역단위위치정보들은 상기 소번역단위들 각각의 원문 문장 내 소단위로 세분화된 위치를 지시할 수 있는 숫자들을 포함하고,
    상기 소단위 대응관계표시자들의 소번역문위치정보들은 상기 소번역문들 각각의 번역 문장 내 위치를 지시할 수 있는 숫자들을 포함하는,
    소번역메모리를 포함하는 번역 메모리.
  4. 제3 항에 있어서,
    상기 소번역단위들 각각의 원문 문장 내 소단위로 세분화된 위치를 지시할 수 있는 숫자들은 상기 소번역단위들 각각의 첫 문자의 시작위치, 및 상기 소번역단위들 각각의 마지막 문자의 종료위치 중 하나 이상을 지시하고,
    상기 소번역문들 각각의 번역 문장 내 위치를 지시할 수 있는 숫자들은 상기 소번역문들 각각의 첫 문자의 시작위치, 및 상기 소번역문들 각각의 마지막 문자의 종료위치 중 하나 이상을 지시하는,
    소번역메모리를 포함하는 번역 메모리.
  5. 제4 항에 있어서,
    상기 소번역문들 각각의 번역 문장 내 위치를 지시할 수 있는 숫자들은 번역 문장 내에서 소번역문들 각각의 정렬 순서를 나타내는 위치를 더 지시하는,
    소번역메모리를 포함하는 번역 메모리.
  6. 제5 항에 있어서,
    상기 소단위 대응관계표시자들의 소번역문위치정보들은 정렬 순서에 의해 상기 소번역메모리들의 소번역문들을 정렬할 때 인접하는 두 개의 소번역문들 중 앞쪽에 위치한 소번역문(이하 "피삽입 소번역문"이라고 함)에 상기 피삽입 소번역문 내로 뒷쪽에 위치한 소번역문(이하 "삽입 소번역문"이라고 함)이 삽입되는 위치를 지시하는 삽입위치지시자(5)를 포함하는,
    소번역메모리를 포함하는 번역 메모리.
  7. 제6 항에 있어서,
    상기 피삽입 소번역문은 상기 삽입위치지시자(5)에 의해 상기 피삽입 소번역문이 삽입위치지시자(5)의 위치를 기준으로 전반부(8a) 및 후반부(8b)로 특정되며, 상기 피삽입 소번역문의 번역 문장 내 위치를 지시할 수 있는 숫자들은 상기 피삽입 소번역문의 전반부(8a)의 첫 문자의 시작위치 및 상기 전반부(8a)의 마지막 문자의 종료위치 중 하나 이상, 그리고 상기 후반부(8b)의 첫 문자의 시작위치 및 상기 후반부(8b)의 마지막 문자의 종료위치 중 하나 이상을 지시하는,
    소번역메모리를 포함하는 번역 메모리.
  8. 제2 항에 있어서,
    상기 번역 메모리의 원문 문장은 복수 개의 소번역단위들로 구성되고,
    상기 복수 개의 소번역단위들 중 일부에 대응하는 소번역문들이 형성되고,
    상기 일부 소번역단위와 상기 일부 소번역단위에 대한 소번역문 간의 대응관계가 소단위 대응관계표시자에 의해 표시되고,
    상기 소단위 대응관계표시자의 소번역단위위치정보는 상기 일부 소번역단위의 원문 문장 내 소단위로 세분화된 위치를 지시할 수 있는 숫자들을 포함하고,
    상기 소단위 대응관계표시자의 소번역문위치정보는 상기 소번역문의 번역 문장 내 위치를 지시할 수 있는 숫자들을 포함하는,
    소번역메모리를 포함하는 번역 메모리.
  9. 제1 항 내지 제8항에 따른 소번역메모리를 포함하는 번역 메모리를 형성한 후, 상기 소번역메모리를 포함하는 번역 메모리로부터, 상기 목표언어가 원문 원어가 되고 상기 원문언어가 목표언어가 되는 역방향 번역에 적용하기 위한 소번역메모리를 포함하는 역방향 번역메모리으로서,
    상기 번역 메모리의 소번역단위에 대응하는 소번역문이 상기 역방향 번역메모리의 소번역단위가 되고, 상기 번역 메모리의 소번역단위가 상기 역방향 번역메모리의 소번역문이 되며,
    상기 소번역메모리를 포함하는 번역메모리의 소번역문위치정보가 역방향 번역메모리의 소번역단위위치정보가 되고, 상기 소번역메모리를 포함하는 번역메모리의 소번역단위위치정보가 상기 역방향 번역메모리의 소번역문위치정보가 되는,
    소번역메모리를 포함하는 역방향 번역메모리.
  10. 제1항 내지 제8항에 따른 소번역메모리를 포함하는 번역메모리 또는 제9 항에 따른 소번역메모리를 포함하는 역방향 번역 메모리를 기록한 컴퓨터 판독가능한 저장 매체.
  11. 원문언어로 된 원문 문장 및 목표언어로 된 번역 문장의 쌍을 포함하며 소단위 번역메모리(이하, " 1차 소번역메모리"라고 함)를 포함하는 번역 메모리로서,
    상기 1차 소번역메모리는 상기 원문 문장을 번역 소단위로 세분화한 1차 소번역단위(102) 및 상기 1차 소번역단위(102)에 대응하는 번역 문장 내의 번역 부분인 1차 소번역문(107)의 쌍을 포함하되,
    상기 번역 메모리는 상기 번역 메모리 내에서 상기 1차 소번역메모리를 특정하는 1차 소단위 대응관계지시자(108)를 포함하고, 상기 1차 소단위 대응관계지시자(108)에 의해 상기 번역 메모리 내에서 상기 1차 소번역메모리의 1차 소번역단위(102) 및 1차 소번역문(107) 쌍의 대응 관계가 표시되고,
    상기 1차 소번역메모리는 상기 1차 소번역메모리를 추가로 세분화한 추가적인 소번역메모리인 2차 소번역메모리를 포함할 수 있으며, 상기 2차 소번역메모리를 포함하는 경우, 상기 1차 소번역메모리의 1차 소번역단위(102)를 추가로 세분화한 번역 소단위인 2차 소번역단위(202) 및 상기 2차 소번역단위(202)에 대응하는 번역 부분인 2차 소번역문(207)의 쌍을 포함하되,
    상기 2차 소번역메모리는 상기 2차 소번역메모리를 특정하는 2차 소단위 대응관계지시자(208)를 포함하고, 상기 2차 소단위 대응관계지시자(208)는 상기 2차 소번역메모리의 2차 소번역단위(202) 및 2차 소번역문(207) 쌍의 대응 관계를 나타내는,
    소번역메모리를 포함하는 번역 메모리.
  12. 제11 항에 있어서,
    상기 2차 소단위 대응관계지시자(208)는
    상기 2차 소번역단위(202)의 1차 소번역단위(102) 내 위치를 나타내는 정보인 2차 소번역단위위치정보(208')와
    상기 2차 소번역문의 1차 소번역문 내 위치를 나타내는 정보인 2차 소번역문위치정보(208")를 포함하는,
    소번역메모리를 포함하는 번역 메모리.
  13. 제12 항에 있어서,
    상기 1차 소번역메모리의 1차 소번역단위(102)는 복수 개의 2차 소번역단위(202)들로 구성되고, 상기 1차 번역메모리의 1차 소번역문은 상기 복수 개의 2차 소번역단위(202)들에 대응하는 2차 소번역문들로 구성되고,
    상기 2차 소번역단위(202)들과 2차 소번역문들 간의 대응관계가 2차 소단위 대응관계표시자들에 의해 표시되고,
    상기 2차 소단위 대응관계표시자들의 소번역단위위치정보들은 상기 2차 소번역단위(202)들 각각의 1차 소번역단위(102) 내 소단위로 세분화된 위치를 지시할 수 있는 숫자들을 포함하고,
    상기 2차 소단위 대응관계표시자들의 소번역문위치정보들은 상기 2차 소번역문들 각각의 1차 소번역문 내 위치를 지시할 수 있는 숫자들을 포함하는,
    소번역메모리를 포함하는 번역 메모리.
  14. 제13 항에 있어서,
    상기 2차 소번역단위(202)들 각각의 1차 소번역단위(102) 내 소단위로 세분화된 위치를 지시할 수 있는 숫자들은 상기 2차 소번역단위(202)들 각각의 첫 문자의 시작위치, 및 상기 2차 소번역단위(202)들 각각의 마지막 문자의 종료위치 중 하나 이상을 지시하고,
    상기 2차 소번역문들 각각의 1차 소번역문 내 위치를 지시할 수 있는 숫자들은 상기 2차 소번역문들 각각의 첫 문자의 시작위치, 및 상기 2차 소번역문들 각각의 마지막 문자의 종료위치 중 하나 이상을 지시하는,
    소번역메모리를 포함하는 번역 메모리.
  15. 제14 항에 있어서,
    상기 2차 소번역문들 각각의 1차 소번역문 내 위치를 지시할 수 있는 숫자들은 상기 1차 소번역문 내에서 2차 소번역문들 각각의 정렬 순서를 나타내는 위치를 더 지시하는,
    소번역메모리를 포함하는 번역 메모리.
  16. 제15 항에 있어서,
    상기 2차 소단위 대응관계표시자들의 소번역문위치정보들은 정렬 순서에 의해 상기 2차 소번역메모리들의 2차 소번역문들을 정렬할 때 인접하는 두 개의 2차 소번역문들 중 앞쪽에 위치한 2차 소번역문(이하 "피삽입 2차 소번역문"이라고 함)은 상기 피삽입 2차 소번역문 내로 뒷쪽에 위치한 2차 소번역문(이하 "삽입 2차 소번역문"이라고 함)이 삽입되는 위치를 지시하는 삽입위치지시자(5)를 포함하는,
    소번역메모리를 포함하는 번역 메모리.
  17. 제16 항에 있어서,
    상기 피삽입 2차 소번역문은 상기 삽입위치지시자(5)에 의해 상기 피삽입 2차 소번역문이 삽입위치지시자(5)의 위치를 기준으로 전반부(8a) 및 후반부(8b)로 특정되며, 상기 피삽입 2차 소번역문의 1차 소번역문 내 위치를 지시할 수 있는 숫자들은 상기 피삽입 2차 소번역문의 전반부의 첫 문자의 시작위치 및 상기 전반부(8a)의 마지막 문자의 종료위치 중 하나 이상, 그리고 상기 후반부(8b)의 첫 문자의 시작위치 및 상기 후반부의 마지막 문자의 종료위치 중 하나 이상를 지시하는,
    소번역메모리를 포함하는 번역 메모리.
  18. 제12 항에 있어서,
    상기 1차 소번역메모리의 1차 소번역단위(102)는 복수 개의 2차 소번역단위(202)들로 구성되고, 상기 복수 개의 2차 소번역단위(202)들 중 일부에 대응하는 2차 소번역문이 형성되고,
    상기 일부 2차 소번역단위(202)와 상기 일부 2차 소번역단위(202)에 대한 2차 소번역문 간의 대응관계가 2차 소단위 대응관계표시자에 의해 표시되고,
    상기 2차 소단위 대응관계표시자의 소번역단위위치정보는 상기 일부 2차 소번역단위(202)의 1차 소번역단위(102) 내 소단위로 세분화된 위치를 지시할 수 있는 숫자들을 포함하는,
    소번역메모리를 포함하는 번역 메모리.
  19. 제11 항 내지 제18항에 따른 1차 소번역메모리 및 2차 소번역메모리를 포함하는 번역 메모리를 형성한 후, 상기 1차 소번역메모리 및 2차 소번역메모리를 포함하는 번역 메모리로부터, 상기 목표언어가 원문 원어가 되고 상기 원문언어가 목표언어가 되는 역방향 번역에 적용하기 위한 소번역메모리를 포함하는 역방향 번역메모리로서,
    상기 번역 메모리의 1차 소번역단위 및 2차 소번역단위에 대응하는 1차 소번역문 및 2차 소번역문이 상기 역방향 번역메모리의 1차 소번역단위 및 2차 소번역단위가 되고, 상기 번역 메모리의 1차 소번역단위 및 2차 소번역단위가 상기 역방향 번역메모리의 1차 소번역문 및 2차 소번역문이 되며,
    상기 1차 소번역메모리를 포함하는 번역메모리의 1차 소번역문위치정보가 역방향 번역메모리의 1차 소번역단위위치정보가 되고, 상기 1차 소번역메모리를 포함하는 번역메모리의 1차 소번역단위위치정보가 상기 역방향 번역메모리의 1차 소번역문위치정보가 되며,
    상기 2차 소번역메모리를 포함하는 번역메모리의 2차 소번역문위치정보가 역방향 번역메모리의 2차 소번역단위위치정보가 되고, 상기 2차 소번역메모리를 포함하는 번역메모리의 2차 소번역단위위치정보가 상기 역방향 번역메모리의 2차 소번역문위치정보가 되는,
    소번역메모리를 포함하는 역방향 번역메모리.
  20. 제11항 내지 제18항에 따른 1차 소번역메모리 및 2차 소번역메모리를 포함하는 번역 메모리 또는 제19 항에 따른 소번역메모리를 포함하는 역방향 번역 메모리를 기록한 컴퓨터 판독가능한 저장 매체.
PCT/KR2015/009779 2014-09-18 2015-09-17 소번역메모리를 포함하는 번역 메모리, 그를 이용한 역방향 번역메모리 및 이들을 기록한 컴퓨터 판독가능한 저장매체 WO2016043539A1 (ko)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
KR20140124238 2014-09-18
KR10-2014-0124238 2014-09-18

Publications (1)

Publication Number Publication Date
WO2016043539A1 true WO2016043539A1 (ko) 2016-03-24

Family

ID=55533507

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/KR2015/009779 WO2016043539A1 (ko) 2014-09-18 2015-09-17 소번역메모리를 포함하는 번역 메모리, 그를 이용한 역방향 번역메모리 및 이들을 기록한 컴퓨터 판독가능한 저장매체

Country Status (2)

Country Link
KR (1) KR20160033641A (ko)
WO (1) WO2016043539A1 (ko)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20160138837A (ko) * 2015-05-26 2016-12-06 주식회사 케이티 음성 인식 및 번역 시스템,방법 및 컴퓨터 프로그램

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20080015842A1 (en) * 2002-11-20 2008-01-17 Microsoft Corporation Statistical method and apparatus for learning translation relationships among phrases
KR20120018687A (ko) * 2010-08-23 2012-03-05 에스케이플래닛 주식회사 토큰 분리 및 번역 과정을 통합한 통합 디코딩 장치 및 그 방법
KR20120048139A (ko) * 2010-11-05 2012-05-15 한국전자통신연구원 자동 번역 장치 및 그 방법
KR20120048101A (ko) * 2010-11-05 2012-05-15 에스케이플래닛 주식회사 병렬 말뭉치를 이용한 동사구 번역 패턴 구축 장치 및 그 방법
US20120253785A1 (en) * 2011-04-03 2012-10-04 Microsoft Corporation Translation of multilingual embedded phrases

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20080015842A1 (en) * 2002-11-20 2008-01-17 Microsoft Corporation Statistical method and apparatus for learning translation relationships among phrases
KR20120018687A (ko) * 2010-08-23 2012-03-05 에스케이플래닛 주식회사 토큰 분리 및 번역 과정을 통합한 통합 디코딩 장치 및 그 방법
KR20120048139A (ko) * 2010-11-05 2012-05-15 한국전자통신연구원 자동 번역 장치 및 그 방법
KR20120048101A (ko) * 2010-11-05 2012-05-15 에스케이플래닛 주식회사 병렬 말뭉치를 이용한 동사구 번역 패턴 구축 장치 및 그 방법
US20120253785A1 (en) * 2011-04-03 2012-10-04 Microsoft Corporation Translation of multilingual embedded phrases

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20160138837A (ko) * 2015-05-26 2016-12-06 주식회사 케이티 음성 인식 및 번역 시스템,방법 및 컴퓨터 프로그램
KR102385851B1 (ko) 2015-05-26 2022-04-13 주식회사 케이티 음성 인식 및 번역 시스템,방법 및 컴퓨터 프로그램

Also Published As

Publication number Publication date
KR20160033641A (ko) 2016-03-28

Similar Documents

Publication Publication Date Title
WO2020044290A1 (ko) 특허 문서 작성 장치, 방법, 컴퓨터 프로그램, 컴퓨터로 판독 가능한 기록매체, 서버 및 시스템
WO2018034426A1 (ko) 커널 rdr을 이용한 태깅 말뭉치 오류 자동수정방법
WO2011025200A9 (ko) 확장키를 이용한 정보입력시스템 및 정보입력방법
WO2010036012A2 (ko) 인터넷을 이용한 의견 검색 시스템, 의견 검색 및 광고 서비스 시스템과 그 방법
WO2012074338A2 (ko) 자연어 및 수학식 처리 방법과 그를 위한 장치
WO2009096760A2 (ko) 단어예측 입력방법 및 그 방법이 구현되는 전자장치
WO2011122724A1 (ko) 아밥 소스코드의 코드 검사를 수행하는 코드검사 수행시스템
WO2021071012A1 (ko) 무매체 신원 확인을 통한 상품 구매 서비스 제공 장치 및 방법
WO2010068068A2 (ko) 사용자의 의도에 기반한 정보 검색방법 및 정보 제공방법
WO2020009297A1 (ko) 도메인 추출기반의 언어 이해 성능 향상장치및 성능 향상방법
WO2011137724A1 (zh) 基于语义逻辑的类自然语言人机对话装置
WO2020222539A1 (en) Hub device, multi-device system including the hub device and plurality of devices, and method of operating the same
WO2022065811A1 (en) Multimodal translation method, apparatus, electronic device and computer-readable storage medium
WO2013176365A1 (en) Method and electronic device for easily searching for voice record
WO2013176366A1 (en) Method and electronic device for easy search during voice record
WO2018101534A1 (ko) 전자 문서 컨버팅 방법 및 이를 수행하는 시스템
WO2019177182A1 (ko) 속성 정보 분석을 통한 멀티미디어 컨텐츠 검색장치 및 검색방법
WO2021029627A1 (en) Server that supports speech recognition of device, and operation method of the server
WO2016043539A1 (ko) 소번역메모리를 포함하는 번역 메모리, 그를 이용한 역방향 번역메모리 및 이들을 기록한 컴퓨터 판독가능한 저장매체
WO2017188749A9 (ko) Ic 칩 테스트 장치, ic 칩 테스트 방법, 및 ic 칩 테스트 시스템
WO2021162481A1 (en) Electronic device and control method thereof
WO2021086127A1 (en) Hub device, multi-device system including the hub device and plurality of devices, and operating method of the hub device and multi-device system
WO2017094967A1 (ko) 자연 언어 처리 스키마 및 그 지식 데이터베이스 구축 방법 및 시스템
WO2023158121A1 (ko) 글로벌 스마트 제조시스템 구축 및 국제 표준화를 위한 데이터 생성방법
WO2012115492A2 (ko) 확장키를 이용한 정보입력시스템 및 정보입력방법

Legal Events

Date Code Title Description
121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 15842418

Country of ref document: EP

Kind code of ref document: A1

NENP Non-entry into the national phase

Ref country code: DE

122 Ep: pct application non-entry in european phase

Ref document number: 15842418

Country of ref document: EP

Kind code of ref document: A1