KR20120035077A - Method and apparatus for providing hybrid automatic translation - Google Patents

Method and apparatus for providing hybrid automatic translation Download PDF

Info

Publication number
KR20120035077A
KR20120035077A KR1020100096572A KR20100096572A KR20120035077A KR 20120035077 A KR20120035077 A KR 20120035077A KR 1020100096572 A KR1020100096572 A KR 1020100096572A KR 20100096572 A KR20100096572 A KR 20100096572A KR 20120035077 A KR20120035077 A KR 20120035077A
Authority
KR
South Korea
Prior art keywords
translation
sentence
automatic translation
node
hybrid automatic
Prior art date
Application number
KR1020100096572A
Other languages
Korean (ko)
Inventor
양성일
김영길
김창현
권오욱
김운
박은진
서영애
노윤형
황금하
신종훈
최승권
이기영
박상규
Original Assignee
한국전자통신연구원
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 한국전자통신연구원 filed Critical 한국전자통신연구원
Priority to KR1020100096572A priority Critical patent/KR20120035077A/en
Publication of KR20120035077A publication Critical patent/KR20120035077A/en

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/40Processing or translation of natural language
    • G06F40/58Use of machine translation, e.g. for multi-lingual retrieval, for server-side translation for client devices or for real-time translation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/268Morphological analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/40Processing or translation of natural language
    • G06F40/42Data-driven translation
    • G06F40/47Machine-assisted translation, e.g. using translation memory

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Machine Translation (AREA)

Abstract

PURPOSE: An automatic hybrid translation method and an apparatus performing the same are provided to prevent undesired effect in an automatic translation environment which uses an automatic translation system. CONSTITUTION: A comparing unit(320) determines whether a sentient is an automatic hybrid translation object. A translation engine unit(330) performs automatic translation of a node part in a sentence through a translation engine. The translation engine unit generates an object language. An integration unit(340) integrates the reference translation data and the generated object language.

Description

하이브리드 자동 번역 방법 및 이를 수행하는 장치{METHOD AND APPARATUS FOR PROVIDING HYBRID AUTOMATIC TRANSLATION}Hybrid automatic translation method and device that performs it {METHOD AND APPARATUS FOR PROVIDING HYBRID AUTOMATIC TRANSLATION}

본 발명은 자동 번역 방법에 관한 것으로, 더욱 상세하게는 다양한 자동 번역 엔진을 적용한 자동 번역 장치의 번역 성능을 향상시킬 수 있는 하이브리드 자동 번역 방법 및 이를 수행하는 장치에 관한 것이다.The present invention relates to an automatic translation method, and more particularly, to a hybrid automatic translation method and an apparatus for performing the same that can improve the translation performance of the automatic translation device to which various automatic translation engines are applied.

자동 번역 기술은 컴퓨터 등의 정보처리 장치와 미리 구축된 번역 자원을 이용하여, 원시 언어로 작성된 문장을 동일한 의미를 가지는 다른 목표 언어로 자동으로 변환하는 기술을 의미한다.The automatic translation technique refers to a technique for automatically converting a sentence written in a source language into another target language having the same meaning by using an information processing device such as a computer and a pre-built translation resource.

자동 번역 기술은 그 특성과 분류에 따라 다양하게 발전되어 왔고, 각각의 자동 번역 기술은 서로 다른 방법에 따라 구현된 자동 번역 엔진의 특성에 따라 고유의 장점 및 단점을 가진다.Automatic translation techniques have been developed in various ways according to their characteristics and classification, and each automatic translation technique has its own advantages and disadvantages according to the characteristics of the automatic translation engine implemented according to different methods.

최근에는 각 자동 번역 기술의 장점을 강화하고 단점을 보완하기 위해 이종의 자동 번역 엔진을 서로 연결하여 사용하는 하이브리드 자동 번역 기술이 연구되고 있다.Recently, in order to reinforce the advantages and complement the disadvantages of each automatic translation technology, hybrid automatic translation technology using heterogeneous automatic translation engines connected to each other has been studied.

그러나, 상기한 바와 같이 이종의 자동 번역 엔진을 연결하여 사용하는 경우, 적용되는 자동 번역 엔진 사이에 서로 특성이 상충하는 현상이 발생하여 원하지 않는 주변 효과가 발생할 수 있고, 이종의 자동 번역 엔진이 연결되는 방법에 따라 번역 성능이 더 저하될 수 있는 문제가 있다. 또한, 이종의 자동 번역 엔진을 연결할 경우, 각 자동 번역 엔진으로부터 생성되는 번역 결과에 대해 선별할 수 있는 방법과 선별된 결과를 종합하여 최종 번역 결과로 생성하기 위한 방법을 추가적으로 마련해야 하는 단점이 있다.However, when the heterogeneous automatic translation engines are connected and used as described above, characteristics may be conflicted between the applied automatic translation engines, which may cause unwanted peripheral effects, and the heterogeneous automatic translation engines may be connected. There is a problem that the translation performance may be further reduced depending on how. In addition, in the case of connecting heterogeneous automatic translation engines, there is a disadvantage in that a method for selecting a translation result generated from each automatic translation engine and a method for synthesizing the selected result and generating the final translation result are additionally provided.

상기한 단점을 극복하기 위한 본 발명의 목적은 이종의 자동 번역 엔진을 사용하는 자동 번역 환경에서도 원하지 않는 주변 효과를 방지할 수 있고 자동 번역 성능을 향상 시킬 수 있는 하이브리드 자동 번역 방법을 제공하는 것이다.An object of the present invention for overcoming the above disadvantages is to provide a hybrid automatic translation method that can prevent unwanted peripheral effects and improve the automatic translation performance even in an automatic translation environment using a heterogeneous automatic translation engine.

또한, 본 발명의 다른 목적은 상기 하이브리드 자동 번역 방법을 실행하는 하이브리드 자동 번역 장치를 제공하는 것이다.In addition, another object of the present invention is to provide a hybrid automatic translation apparatus for executing the hybrid automatic translation method.

본 발명의 기술적 과제들은 이상에서 언급한 기술적 과제로 제한되지 않으며, 언급되지 않은 또 다른 기술적 과제들은 아래의 기재로부터 당업자에게 명확하게 이해될 수 있을 것이다. Technical problems of the present invention are not limited to the technical problems mentioned above, and other technical problems not mentioned will be clearly understood by those skilled in the art from the following description.

상술한 본 발명의 목적을 달성하기 위한 본 발명의 일 측면에 따른 하이브리드 자동 번역 방법은, 입력된 원시 언어 문장을 형태소 단위의 문장으로 변환하는 단계와, 변환된 형태소 단위의 문장을 노드가 포함된 문장으로 변환하는 단계와, 노드가 포함된 문장을 참조 번역 데이터와 비교하고, 비교 결과에 기초하여 하이브리드 자동번역 대상인가를 판단하는 단계와, 하이브리드 자동번역 대상인 경우 상기 노드가 포함된 문장에서 노드 부분을 번역 엔진을 사용하여 자동 번역을 수행하여 목표 언어를 생성하는 단계 및 생성된 상기 목표 언어와 상기 참조 번역 데이터를 통합하여 최종 목표 언어를 생성하는 단계를 포함한다.Hybrid automatic translation method according to an aspect of the present invention for achieving the above object of the present invention, the step of converting the input source language sentence to the sentence in the morpheme unit, and includes the node in the converted morpheme unit sentence Converting a sentence to a sentence, comparing a sentence including a node with reference translation data, determining whether to be a hybrid automatic translation target based on a comparison result, and, in the case of a hybrid automatic translation target, a node part in a sentence including the node Generating a target language by performing an automatic translation using a translation engine, and integrating the generated target language and the reference translation data to generate a final target language.

상술한 바와 같은 하이브리드 자동 번역 방법 및 이를 수행하는 장치에 따르면, 입력된 원시 언어 문장에 대해 형태소 분석 및 노드 포함 문장으로 변환한 후 번역 전문가가 수동 구축한 참조 번역패턴 데이터와 비교하여 참조 번역패턴 데이터가 존재하지 않는 경우에는 교환 가능한 일반적인 번역 엔진을 사용하여 자동 번역을 수행하고, 참조 번역패턴 데이터가 존재하는 경우에는 문장 중 노드 부분은 자동 번역을 수행하고 번역된 목표 언어와 상기 참조 번역패턴 데이터를 통합하여 최종적인 목표 언어를 생성하는 하이브리드 자동 번역 방식을 사용한다.According to the hybrid automatic translation method as described above and an apparatus for performing the same, the reference translation pattern data is compared with the reference translation pattern data manually constructed by a translation expert after converting the input source language sentence into a morphological analysis and a node-containing sentence. If is not present, the automatic translation is performed using a common translation engine that can be exchanged. If there is the reference translation pattern data, the node part of the sentence performs the automatic translation and translates the translated target language and the reference translation pattern data. Use a hybrid automatic translation method that integrates to create the final target language.

따라서, 자동 번역 엔진의 특성이나 분류에 상관없이 종래의 모든 번역 엔진을 교환형으로 치환 또는 선택하여 사용할 수 있고, 내부적으로 복수의 자동 번역 엔진을 사용하는 자동 번역 시스템에서도 단일 자동 번역 엔진처럼 사용할 수 있다.Therefore, all conventional translation engines can be replaced or selected interchangeably regardless of the characteristics or classification of the automatic translation engine, and can be used as a single automatic translation engine even in an automatic translation system using multiple automatic translation engines internally. have.

또한, 번역 오류 가능성이 높은 특정 문장에 대해서 번역 전문가에 의해 수동으로 구축된 참조 번역패턴 데이터를 참조하여 선별적으로 적용함으로써 번역 성능을 향상시킬 수 있고, 이기종의 자동 번역 엔진을 사용하는 종래의 하이브리드 자동 번역 방법에서 발생되는 예측할 수 없는 자동 번역 결과에 따른 성능 저하를 방지할 수 있다.In addition, a conventional hybrid using heterogeneous automatic translation engines can be improved by selectively applying reference translation pattern data manually constructed by a translation expert to a specific sentence having a high probability of translation error. The performance degradation caused by the unpredictable automatic translation result generated by the automatic translation method can be prevented.

도 1은 본 발명의 일 실시예에 따른 하이브리드 자동 번역 방법을 나타내는 흐름도이다.
도 2는 본 발명의 일 실시예에 따른 하이브리드 자동 번역 방법의 적용 예를 나타내는 개념도이다.
도 3은 본 발명의 일 실시예에 따른 하이브리드 자동 번역 장치의 구성을 나타내는 블록도이다.
1 is a flowchart illustrating a hybrid automatic translation method according to an embodiment of the present invention.
2 is a conceptual diagram illustrating an application example of a hybrid automatic translation method according to an embodiment of the present invention.
3 is a block diagram showing the configuration of a hybrid automatic translation apparatus according to an embodiment of the present invention.

본 발명은 다양한 변경을 가할 수 있고 여러 가지 실시예를 가질 수 있는 바, 특정 실시예들을 도면에 예시하고 상세하게 설명하고자 한다.As the present invention allows for various changes and numerous embodiments, particular embodiments will be illustrated in the drawings and described in detail in the written description.

그러나, 이는 본 발명을 특정한 실시 형태에 대해 한정하려는 것이 아니며, 본 발명의 사상 및 기술 범위에 포함되는 모든 변경, 균등물 내지 대체물을 포함하는 것으로 이해되어야 한다.However, this is not intended to limit the present invention to specific embodiments, it should be understood to include all modifications, equivalents, and substitutes included in the spirit and scope of the present invention.

본 출원에서 사용한 용어는 단지 특정한 실시예를 설명하기 위해 사용된 것으로, 본 발명을 한정하려는 의도가 아니다. 단수의 표현은 문맥상 명백하게 다르게 뜻하지 않는 한, 복수의 표현을 포함한다. 본 출원에서, "포함하다" 또는 "가지다" 등의 용어는 명세서상에 기재된 특징, 숫자, 단계, 동작, 구성요소, 부품 또는 이들을 조합한 것이 존재함을 지정하려는 것이지, 하나 또는 그 이상의 다른 특징들이나 숫자, 단계, 동작, 구성요소, 부품 또는 이들을 조합한 것들의 존재 또는 부가 가능성을 미리 배제하지 않는 것으로 이해되어야 한다.The terminology used herein is for the purpose of describing particular example embodiments only and is not intended to be limiting of the present invention. Singular expressions include plural expressions unless the context clearly indicates otherwise. In this application, the terms "comprise" or "have" are intended to indicate that there is a feature, number, step, operation, component, part, or combination thereof described in the specification, and one or more other features. It is to be understood that the present invention does not exclude the possibility of the presence or the addition of numbers, steps, operations, components, components, or a combination thereof.

다르게 정의되지 않는 한, 기술적이거나 과학적인 용어를 포함해서 여기서 사용되는 모든 용어들은 본 발명이 속하는 기술 분야에서 통상의 지식을 가진 자에 의해 일반적으로 이해되는 것과 동일한 의미를 가지고 있다. 일반적으로 사용되는 사전에 정의되어 있는 것과 같은 용어들은 관련 기술의 문맥 상 가지는 의미와 일치하는 의미를 가진 것으로 해석되어야 하며, 본 출원에서 명백하게 정의하지 않는 한, 이상적이거나 과도하게 형식적인 의미로 해석되지 않는다.Unless defined otherwise, all terms used herein, including technical or scientific terms, have the same meaning as commonly understood by one of ordinary skill in the art. Terms such as those defined in commonly used dictionaries should be interpreted as having a meaning consistent with the meaning in the context of the relevant art and are to be interpreted in an ideal or overly formal sense unless explicitly defined in the present application Do not.

이하, 첨부한 도면들을 참조하여, 본 발명의 바람직한 실시예를 보다 상세하게 설명하고자 한다. 본 발명을 설명함에 있어 전체적인 이해를 용이하게 하기 위하여 도면상의 동일한 구성요소에 대해서는 동일한 참조부호를 사용하고 동일한 구성요소에 대해서 중복된 설명은 생략한다.
Hereinafter, with reference to the accompanying drawings, it will be described in detail a preferred embodiment of the present invention. In describing the present invention, in order to facilitate the overall understanding, the same reference numerals are used for the same elements in the drawings, and redundant description of the same elements is omitted.

도 1은 본 발명의 일 실시예에 따른 하이브리드 자동 번역 방법을 나타내는 흐름도로서, 입력된 원시 언어 문장을 목표 언어 문장으로 자동 번역하는 하이브리드 자동 번역 장치에서 수행되는 방법을 예를 들어 도시하였다.1 is a flowchart illustrating a hybrid automatic translation method according to an embodiment of the present invention, and illustrates a method performed by a hybrid automatic translation apparatus for automatically translating an input source language sentence into a target language sentence.

도 1을 참조하면 하이브리드 자동 번역 장치는 먼저, 텍스트 형태의 원시 언어 문장을 입력받고(단계 110), 입력받은 원시 언어 문장에 대해 형태소 분석을 수행하여 상기 원시 언어 문장을 형태소 단위의 문장으로 변환한다(단계 120).Referring to FIG. 1, a hybrid automatic translation apparatus first receives a source language sentence in a text form (step 110), performs a morphological analysis on the input source language sentence, and converts the source language sentence into a sentence in a morpheme unit. (Step 120).

이후, 하이브리드 자동 번역 장치는 형태소 단위의 표현으로 변환된 문장에 대해 각 단어의 품사에 기초하여 숙어, 복합명사, 연어 등과 같은 고정 표현들을 인식하고, 인식 결과에 기초하여 노드가 포함된 문장으로 변환한다(단계 130). 여기서, 상기 노드는 형태소 단위로 표현된 문장에 대하여 구문 분석을 수행하여 얻은 구분적 성격을 포함하는 것으로 예를 들어, 명사구는 NP, 전치사구는 PP, 부사표현은 ADV로 표현할 수 있다.Subsequently, the hybrid automatic translation apparatus recognizes fixed expressions such as idioms, compound nouns, salmon, etc. based on the parts of speech of each word, and converts the sentences with the nodes based on the recognition result to the sentences converted into the morpheme representations. (Step 130). Here, the node includes a distinctive character obtained by parsing a sentence expressed in morpheme units. For example, the noun phrase may be expressed in NP, the prepositional phrase in PP, and the adverb expression in ADV.

이후, 하이브리드 자동 번역 장치는 생성된 노드 포함 문장을 참조 번역패턴 데이터와 비교하여(단계 140), 상기 노드 포함 문장이 하이브리드 자동번역 대상 문장인가를 판단한다(단계 150). 여기서, 상기 참조 번역패턴 데이터는 번역 전문가에 의해 수동으로 구축될 수 있고, 자동 번역을 수행하였을 때 번역 오류 발생률이 높은 문장들로 구성될 수 있다.Thereafter, the hybrid automatic translation apparatus compares the generated node containing sentence with reference translation pattern data (step 140), and determines whether the node containing sentence is a hybrid automatic translation target sentence (step 150). Here, the reference translation pattern data may be manually constructed by a translation expert, and may be composed of sentences having a high incidence of translation errors when automatic translation is performed.

단계 150에서 상기 노드 포함 문장이 하이브리드 자동번역 대상 문장에 해당되지 않는 것으로 판단되면, 하이브리드 자동 번역 장치는 단계 110에서 제공받은 원시 언어 문장 전체를 종래의 자동 번역 방법을 이용하여 번역함으로써 최종 목표 언어를 생성한다(단계 160). 여기서, 자동 번역에는 교환 가능한 복수의 이종 번역 엔진이 사용될 수 있다.If it is determined in step 150 that the node-containing sentence does not correspond to the hybrid automatic translation target sentence, the hybrid automatic translation apparatus translates the final target language by translating the entire source language sentence provided in step 110 using a conventional automatic translation method. Create (step 160). Here, a plurality of exchangeable heterogeneous translation engines may be used for the automatic translation.

또는, 단계 150에서 상기 생성된 노드 포함 문장에 대응되는 참조 번역패턴 데이터가 존재하는 것으로 판단되면, 하이브리드 자동 번역 장치는 상기 노드 포함 문장을 하이브리드 자동번역 대상 문장으로 판단하고, 상기 노드 포함 문장에 포함된 노드 부분만을 교환 가능한 복수의 이종 번역 엔진을 사용하여 자동 번역함으로써 노드 부분에 대한 목표 언어를 생성한다(단계 170).Alternatively, when it is determined in step 150 that there exists reference translation pattern data corresponding to the generated node containing sentence, the hybrid automatic translation apparatus determines the node containing sentence as a hybrid automatic translation target sentence, and includes it in the node containing sentence. A target language for the node portion is generated by automatically translating using a plurality of heterogeneous translation engines that can exchange only the portion of the node (step 170).

이후, 하이브리드 자동 번역 장치는 단계 170의 수행을 통해 생성된 목표 언어와 상기 노드 포함 문장과 대응되는 참조 번역패턴 데이터를 통합하여 최종 목표 언어를 생성한다(단계 180).
Thereafter, the hybrid automatic translation apparatus generates a final target language by integrating the target language generated through the operation of step 170 and the reference translation pattern data corresponding to the node containing sentence (step 180).

도 2는 본 발명의 일 실시예에 따른 하이브리드 자동 번역 방법의 적용 예를 나타내는 개념도로서, 오늘 오후 2시 30분에 식당을 예약하고 싶어요.라는 한국어 문장을 이에 상응하는 영어 문장으로 번역하는 예를 나타낸다.FIG. 2 is a conceptual diagram illustrating an application example of a hybrid automatic translation method according to an embodiment of the present invention. An example of translating a Korean sentence “I want to reserve a restaurant at 2:30 pm today” to a corresponding English sentence is provided. Indicates.

도 2를 참조하면, 먼저 하이브리드 자동 번역 장치에 원시 언어 문장으로 오늘 오후 2시 30분에 식당을 예약하고 싶어요.(201)라는 한국어 문장이 입력되면, 상기 문장(201)에 대해 형태소 분석을 수행하여 [오늘 오후 2시 30분]에 [식당]을 예약 하고 싶어요.(203)와 같은 형태소 단위의 문장으로 변환한다.Referring to FIG. 2, first, I would like to reserve a restaurant at 2:30 pm in a native language sentence on a hybrid automatic translation device. When a Korean sentence 201 is input, the sentence 201 is subjected to morphological analysis. I would like to make a reservation for [restaurant] at 2:30 pm today. (203).

이후, 하이브리드 자동 번역 장치는 형태소 단위로 표현된 문장(203)을 노드가 포함된 문장인 [T_ADV1]에 [NP1]을 예약 하고 싶어요.(205)로 변환하고, 변환된 상기 문장(205)를 참조 번역패턴 데이터(207)에서 검색하여 해당 번역패턴이 존재하는가를 판단하고, 도 2에 도시한 바와 같이 해당 번역패턴이 존재하는 경우 하이브리드 번역 대상 문장으로 판단하고, 상기 문장 205에서 노드 부분인 [T_ADV1] 및 [NP1]에 대해서는 교환 가능한 자동 번역 엔진을 사용하여 2:30 PM today(209) 및 a restaruant(211)로 각각 번역하고, 번역 결과를 참조 번역패턴 데이터의 해당 문장과 통합하여 최종적으로 I would like to make a reservation of a restaurant in 2:30 PM today.(213)라는 문장을 생성한다.
Subsequently, the hybrid automatic translation device wants to reserve [NP1] in the sentence [203] expressed in morpheme units in [T_ADV1], which is a sentence including a node. The reference translation pattern data 207 is searched to determine whether the corresponding translation pattern exists. If the translation pattern exists as shown in FIG. 2, the hybrid translation target sentence is determined. T_ADV1] and [NP1] are translated to 2:30 PM today (209) and a restaruant (211), respectively using interchangeable automatic translation engines, and finally the translation results are integrated with the corresponding sentences in the reference translation pattern data. I would like to make a reservation of a restaurant in 2:30 PM today.

도 3은 본 발명의 일 실시예에 따른 하이브리드 자동 번역 장치의 구성을 나타내는 블록도이다.3 is a block diagram showing the configuration of a hybrid automatic translation apparatus according to an embodiment of the present invention.

도 3을 참조하면, 본 발명의 일 실시예에 따른 하이브리드 자동 번역 장치는 문장 전처리부(310), 비교부(320), 번역 엔진부(330), 통합부(340), 데이터베이스(350)를 포함할 수 있다. Referring to FIG. 3, a hybrid automatic translation device according to an embodiment of the present invention may include a sentence preprocessor 310, a comparison unit 320, a translation engine unit 330, an integration unit 340, and a database 350. It may include.

문장 전처리부(310)는 텍스트 형태의 원시 언어 문장을 입력받고, 입력받은 원시 언어 문장에 대해 하이브리드 자동 번역을 수행할 수 있는 형태의 문장으로 변환하는 전처리를 수행한다. 이를 위해 문장 전처리부(310)는 형태소 분석 모듈(311) 및 노드 생성 모듈(313)을 포함할 수 있다.The sentence preprocessing unit 310 receives a primitive language sentence in a text form and performs preprocessing to convert the received primitive sentence into a sentence in a form capable of performing a hybrid automatic translation. To this end, the sentence preprocessor 310 may include a morpheme analysis module 311 and a node generation module 313.

구체적으로, 형태소 분석 모듈(311)은 입력받은 원시 언어 문장에 대해 형태소 분석을 수행하여 상기 원시 언어 문장을 형태소 단위의 문장으로 변환하고, 노드 생성 모듈(313)은 형태소 분석 모듈(311)로부터 제공된 형태소 단위의 표현으로 변환된 문장에 대해 노드가 포함된 문장으로 변환한다.Specifically, the morpheme analysis module 311 performs a morphological analysis on the input source language sentence to convert the source language sentence into a sentence of the morpheme unit, and the node generation module 313 is provided from the morpheme analysis module 311 The sentence converted to a morpheme unit is converted to a sentence including a node.

비교부(320)는 노드 생성 모듈(313)로부터 노드 포함 문장을 제공받고, 제공 받은 문장에 대응되는 문장을 데이터베이스(350)에서 검색하여, 상기 노드 포함 문장이 하이브리드 자동번역 대상 문장인가를 판단하고, 상기 노드 포함 문장이 하이브리드 자동번역 대상 문장에 해당되지 않는 것으로 판단되면, 상기 원시 언어 문장을 번역 엔진에 제공한다.The comparison unit 320 receives the node-containing sentence from the node generation module 313, searches the database 350 for a sentence corresponding to the provided sentence, and determines whether the node-containing sentence is a hybrid automatic translation target sentence. If it is determined that the sentence including the node does not correspond to the hybrid automatic translation target sentence, the source language sentence is provided to a translation engine.

또는, 비교부(320)는 상기 노드 포함 문장에 대응되는 참조 번역패턴 데이터가 상기 데이터베이스(350)에 존재하는 것으로 판단되면, 상기 노드 포함 문장에 포함된 노드 부분을 번역 엔진에 제공함으로써 상기 노드 부분이 자동 번역되도록 한다.Alternatively, when it is determined that the reference translation pattern data corresponding to the node containing sentence exists in the database 350, the comparing unit 320 provides the node portion included in the node containing sentence to the translation engine, thereby providing the node portion. To be automatically translated.

번역 엔진부(330)는 복수의 이종 번역 엔진으로 구성될 수 있고, 상기 복수의 이종 번역 엔진은 상황에 따라 특정 번역 엔진이 선택되거나, 교환될 수 있고, 이종 번역 엔진이 서로 연결되어 자동 번역을 수행할 수 있다.The translation engine unit 330 may be composed of a plurality of heterogeneous translation engines, and the plurality of heterogeneous translation engines may be selected or exchanged according to a situation, and the heterogeneous translation engines may be connected to each other to perform automatic translation. Can be done.

번역 엔진부(330)는 비교부(320)로부터 제공된 원시 언어 문장 전체 또는 노드 포함 문장의 노드 부분에 대한 자동 번역을 수행하여 목표 언어를 생성한 후 생성된 목표 언어를 통합부(340)에 제공한다.The translation engine unit 330 generates the target language by performing the automatic translation of the entire source language sentence or the node portion of the node including sentence provided from the comparing unit 320 and then provides the generated target language to the integrating unit 340. do.

통합부(340)는 번역 엔진부(330)로부터 자동 번역된 목표 언어를 제공받고 제공받은 목표 언어를 그대로 출력하거나 참조 번역패턴 데이터와 통합하여 최종 목표 언어를 생성한 후 출력한다. 여기서, 통합부(340)는 원시 언어 문장 전체가 자동 번역된 경우에는 번역 엔진부(330)로부터 제공된 목표 언어를 그대로 출력하고, 하이브리드 자동 번역이 수행된 경우에는 번역 엔진부(330)로부터 제공된 노드 부분에 대한 목표 언어와 데이터베이스(350)의 해당 참조 번역패턴 데이터를 통합하여 최종 목표 언어를 생성한 후 출력한다. The integration unit 340 receives the target language automatically translated from the translation engine unit 330 and outputs the target language as it is, or generates a final target language by integrating with the reference translation pattern data. Here, the integration unit 340 outputs the target language provided from the translation engine unit 330 as it is when the entire source language sentence is automatically translated, and the node provided from the translation engine unit 330 when the hybrid automatic translation is performed. The target language for the portion and the corresponding reference translation pattern data of the database 350 are integrated to generate and output the final target language.

데이터베이스(350)는 번역 전문가에 의해 수동으로 구축된 참조 번역패턴 데이터들로 구성될 수 있다.
The database 350 may be composed of reference translation pattern data manually constructed by a translation expert.

이상 실시예를 참조하여 설명하였지만, 해당 기술 분야의 숙련된 당업자는 하기의 특허 청구의 범위에 기재된 본 발명의 사상 및 영역으로부터 벗어나지 않는 범위 내에서 본 발명을 다양하게 수정 및 변경시킬 수 있음을 이해할 수 있을 것이다.Although described with reference to the embodiments above, those skilled in the art will understand that the present invention can be variously modified and changed without departing from the spirit and scope of the invention as set forth in the claims below. Could be.

310 : 문장 전처리부 311 : 형태소 분석 모듈
313 : 노드 생성 모듈 320 : 비교부
330 : 번역 엔진부 340 : 통합부
350 : 데이터베이스
310: sentence preprocessor 311: morphological analysis module
313: node generation module 320: comparison unit
330: translation engine unit 340: integration unit
350: database

Claims (1)

입력된 원시 언어 문장을 형태소 단위의 문장으로 변환하는 단계;
변환된 형태소 단위의 문장을 노드가 포함된 문장으로 변환하는 단계;
노드가 포함된 문장을 참조 번역 데이터와 비교하고, 비교 결과에 기초하여 하이브리드 자동번역 대상인가를 판단하는 단계;
하이브리드 자동번역 대상인 경우 상기 노드가 포함된 문장에서 노드 부분을 번역 엔진을 사용하여 자동 번역을 수행하여 목표 언어를 생성하는 단계; 및
생성된 상기 목표 언어와 상기 참조 번역 데이터를 통합하여 최종 목표 언어를 생성하는 단계를 포함하는 하이브리드 자동 번역 방법.
Converting an input source language sentence into a sentence of a morpheme unit;
Converting the sentence in the transformed morpheme unit into a sentence including a node;
Comparing a sentence including a node with reference translation data, and determining whether to be a hybrid automatic translation target based on the comparison result;
Generating a target language by performing an automatic translation using a translation engine on a node portion in a sentence including the node when the hybrid automatic translation target is included; And
And integrating the generated target language with the reference translation data to generate a final target language.
KR1020100096572A 2010-10-04 2010-10-04 Method and apparatus for providing hybrid automatic translation KR20120035077A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020100096572A KR20120035077A (en) 2010-10-04 2010-10-04 Method and apparatus for providing hybrid automatic translation

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020100096572A KR20120035077A (en) 2010-10-04 2010-10-04 Method and apparatus for providing hybrid automatic translation

Publications (1)

Publication Number Publication Date
KR20120035077A true KR20120035077A (en) 2012-04-13

Family

ID=46137127

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020100096572A KR20120035077A (en) 2010-10-04 2010-10-04 Method and apparatus for providing hybrid automatic translation

Country Status (1)

Country Link
KR (1) KR20120035077A (en)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101664258B1 (en) * 2015-06-22 2016-10-11 전자부품연구원 Text preprocessing method and preprocessing sytem performing the same
KR102569264B1 (en) * 2023-01-17 2023-08-23 주식회사 코딧 Artificial Intelligence-Based High-Speed Translation Methods and Systems using Cache Modules

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101664258B1 (en) * 2015-06-22 2016-10-11 전자부품연구원 Text preprocessing method and preprocessing sytem performing the same
WO2016208941A1 (en) * 2015-06-22 2016-12-29 전자부품연구원 Text preprocessing method and preprocessing system for performing same
KR102569264B1 (en) * 2023-01-17 2023-08-23 주식회사 코딧 Artificial Intelligence-Based High-Speed Translation Methods and Systems using Cache Modules

Similar Documents

Publication Publication Date Title
US9002695B2 (en) Machine translation device, method of processing data, and program
US20230394242A1 (en) Automated translation of subject matter specific documents
WO2003056450A1 (en) Syntax analysis method and apparatus
KR100530154B1 (en) Method and Apparatus for developing a transfer dictionary used in transfer-based machine translation system
JP2004355625A (en) Method and system for training machine translator
KR101709693B1 (en) Method for Web toon Language Automatic Translating Using Crowd Sourcing
Aasha et al. Machine translation from English to Malayalam using transfer approach
JPH0261763A (en) Mechanical translation equipment
Nair et al. Sanskrit stemmer design: A literature perspective
KR20120035077A (en) Method and apparatus for providing hybrid automatic translation
JP2008077512A (en) Document analysis device, document analysis method and computer program
Jayan et al. Difficulties in processing malayalam verbs for statistical machine translation
JP2006004366A (en) Machine translation system and computer program for it
Ariaratnam et al. A shallow parser for Tamil
Germann Making semantic interpretation parser-independent
JP2007133905A (en) Natural language processing system and natural language processing method, and computer program
JP6145011B2 (en) Sentence normalization system, sentence normalization method, and sentence normalization program
Rahman et al. An implementation of Apertium based Assamese morphological analyzer
KR101740331B1 (en) Apparatus and method for processing parenthetical expression in rule-based machine translation
JP2004318344A (en) System and method for machine translation and computer program
JP2008293302A (en) Document analysis system, document analysis method and computer program
JP4033088B2 (en) Natural language processing system, natural language processing method, and computer program
JP2009252143A (en) Machine translation device and program
Sathiyamurthy et al. Multilingual acquiring of e-content definition based on universal networking language
JP3267168B2 (en) Natural language conversion system

Legal Events

Date Code Title Description
WITN Withdrawal due to no request for examination