KR101092361B1 - Paginal translation adverb creation apparatus and its method - Google Patents

Paginal translation adverb creation apparatus and its method Download PDF

Info

Publication number
KR101092361B1
KR101092361B1 KR1020080131775A KR20080131775A KR101092361B1 KR 101092361 B1 KR101092361 B1 KR 101092361B1 KR 1020080131775 A KR1020080131775 A KR 1020080131775A KR 20080131775 A KR20080131775 A KR 20080131775A KR 101092361 B1 KR101092361 B1 KR 101092361B1
Authority
KR
South Korea
Prior art keywords
adverb
band
indefinite
generating
chinese
Prior art date
Application number
KR1020080131775A
Other languages
Korean (ko)
Other versions
KR20100073181A (en
Inventor
황금하
서영애
김창현
양성일
김운
윤창호
최승권
권오욱
노윤형
이기영
오영순
박은진
김영길
박상규
Original Assignee
한국전자통신연구원
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 한국전자통신연구원 filed Critical 한국전자통신연구원
Priority to KR1020080131775A priority Critical patent/KR101092361B1/en
Publication of KR20100073181A publication Critical patent/KR20100073181A/en
Application granted granted Critical
Publication of KR101092361B1 publication Critical patent/KR101092361B1/en

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/40Processing or translation of natural language
    • G06F40/53Processing of non-Latin text
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/279Recognition of textual entities
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/40Processing or translation of natural language
    • G06F40/58Use of machine translation, e.g. for multi-lingual retrieval, for server-side translation for client devices or for real-time translation

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Document Processing Apparatus (AREA)
  • Machine Translation (AREA)

Abstract

본 발명은 목표 언어가 중국어인 자동 번역 시스템에서의 대역어 생성 기법에 관한 것으로, 통계기반의 의미 모호성을 해소하거나 구문 변환으로는 정확한 번역이 어려운 상황에서, 중국어 부사 생성을 위하여 다중부사 변환 패턴, 부사-용언 변환 패턴, 중국어 부사 부정형 위치 사전 및 중국어 복합동사 사전과 같은 패턴과 지식 사전을 활용하여 부사의 생성 위치에 따른 대역어를 결정함으로써, 목표 언어가 중국어인 자동 번역 시스템에서 중국어 부사에 대응하는 대역어를 효과적으로 생성할 수 있는 것이다.The present invention relates to a band word generation technique in an automatic translation system in which a target language is Chinese. In order to solve statistics-based semantic ambiguity or to accurately translate a phrase, it is possible to generate a multi-adverb conversion pattern or an adverb. -Band words corresponding to Chinese adverbs in the automatic translation system whose target language is Chinese by determining the band words according to the position of adverbs using patterns and knowledge dictionaries such as verb conversion patterns, Chinese adverb indefinite position dictionaries, and Chinese compound verb dictionaries Can be effectively generated.

자동 번역 시스템, 중국어, 부사, 대역어 Automatic translation system, Chinese, adverb, bandword

Description

대역 부사 생성 장치 및 그 방법{PAGINAL TRANSLATION ADVERB CREATION APPARATUS AND ITS METHOD}Band adverb generating device and method therefor {PAGINAL TRANSLATION ADVERB CREATION APPARATUS AND ITS METHOD}

본 발명은 중국어를 목표 언어(target language)로 하는 자동 번역 시스템에서 대역어 생성 기법에 관한 것으로, 더욱 상세하게는 중국어를 목표 언어로 하는 자동 번역 시스템에서 용언구가 적어도 하나의 부사를 갖는 경우 부사의 위치와 대역어를 생성하는데 적합한 대역 부사 생성 장치 및 그 방법에 관한 것이다.The present invention relates to a bandword generation technique in an automatic translation system using Chinese as a target language, and more particularly, to an adverb in the case where a terminology has at least one adverb in an automatic translation system using a Chinese as a target language. An apparatus and method for generating band adverbs suitable for generating positions and band words.

본 발명은 지식경제부 및 정보통신연구진흥원의 IT 성장동력 핵심기술개발사업의 일환으로 수행한 연구로부터 도출된 것이다[과제관리번호: 2008-S-019-01, 과제명: 휴대형 한/영 자동통역 기술개발].The present invention is derived from research conducted as a part of the core technology development project of IT growth engine of the Ministry of Knowledge Economy and ICT. [Task management number: 2008-S-019-01, Task name: Portable Korean / English automatic interpretation] Technology development].

잘 알려진 바와 같이, 자동 번역 시스템의 성능 향상을 위해서는 시스템 각 모듈과 번역 지식에 대한 전반적 개선이 필요하다.As is well known, improving the performance of an automatic translation system requires an overall improvement of each module and translation knowledge of the system.

이러한 자동 번역 시스템에서는 자연스러운 번역이 필요하기 때문에, 언어 현상 별로 특성을 파악하고 특화된 지식을 이용한 성능 개선 작업이 필요하다. 그러나, 기존의 자동 번역 관련 기술에서는 대체적으로 이런 세부적 언어현상에 대한 파악과 특화 처리 없이 자동 번역 시스템의 전반적인 방법론 또는 구성에 치우쳐 있다.Since the automatic translation system requires a natural translation, it is necessary to identify the characteristics for each language phenomenon and to improve performance using specialized knowledge. However, in the existing automatic translation-related technology, the overall methodology or configuration of the automatic translation system is generally biased without understanding and detailing these detailed language phenomena.

한편, 목표 언어가 중국어인 자동 번역 시스템에서의 용언구 내 부사의 중국어 대역어 생성은 그 어순 및 대역어 선정에서 원언어(source language)의 부사 세부 유형과 사용 어휘의 영향을 받을 뿐만 아니라, 목표 언어인 중국어 대역어의 언어적 및 문법적 특성에 따라서도 다양한 생성 패턴이 가능하기에 중국어를 목표언어로 한 자동 번역에서 이에 대한 특화 처리가 없을 경우 번역 오류의 원인으로 되며, 자동번역의 질에 많은 영향을 끼치게 된다.On the other hand, the generation of the Chinese verbal adverbs in the yonggu phrase in the automatic translation system of which the target language is Chinese is not only influenced by the adverb detail type and the used vocabulary of the source language in the word order and the bandword selection. Depending on the linguistic and grammatical characteristics of the Chinese language, various generation patterns are possible. Therefore, if there is no special processing in the automatic translation of Chinese as the target language, it may cause translation errors and affect the quality of the automatic translation. do.

하지만, 상술한 바와 같은 중국어를 목표언어로 한 자동 번역에서는 이런 문제에 대한 해결을 특별히 시도하지 않고 있고, 중국어를 목표 언어로 한영중 등의 자동 번역에서도 중국어 부사의 문법적 특성에 대한 언어학 영역에서의 연구 성과를 적용하는 시도가 거의 없는 상황이다.However, the above-described automatic translation of Chinese as a target language does not attempt to solve this problem in particular, and a study in the linguistics area about the grammatical characteristics of Chinese adverbs in automatic translation such as Han Young-Jung as Chinese as a target language. There are few attempts to apply results.

이에 따라, 본 발명은 중국어를 목표 언어로 한 자동 번역에서 용언구 내 부사의 생성 위치를 결정하고, 결정된 위치에서의 대역어를 결정함으로써, 대역어의 의미 모호성을 해소할 수 있는 대역 부사 생성 장치 및 그 방법을 제공하고자 한다.Accordingly, the present invention provides a band adverb generating apparatus capable of solving semantic ambiguity of a band word by determining a generation position of an adverb in a idiom in an automatic translation using a Chinese as a target language, and determining a band word at the determined position. To provide a method.

그리고, 본 발명은 번역되는 부사와 그 어휘의 주변 공기정보를 이용하여 대 역어의 의미 모호성을 해결할 수 있는 대역 부사 생성 장치 및 그 방법을 제공하고자 한다.Another object of the present invention is to provide a band adverb generating apparatus and method for solving semantic ambiguity of a sub-word by using translated adverbs and surrounding air information of a vocabulary.

또한, 본 발명은 부사의 생성 위치에 있어 부사와 용언 사이의 위치 문제, 다중 부사의 위치 문제 및 부사의 부정형 위치 문제를 해결하여 부사의 대역어 생성 위치를 결정할 수 있는 대역 부사 생성 장치 및 그 방법을 제공하고자 한다.The present invention also provides a band adverb generating apparatus and method for determining the adverb's band word generation position by solving the position problem between the adverb and the verb in the adverb generation position, the problem of the position of the multiple adverbs, and the indefinite position problem of the adverbs. To provide.

일 관점에서 본 발명은, 입력된 용언구가 다중 부사를 포함할 경우 이를 인식하고, 다중 부사 변환 패턴 또는 중국어 복합 동사 사전을 적용하여 대역어를 생성하는 다중 부사 패턴 적용부와, 상기 입력된 용언구가 부정형을 포함함과 동시에 상기 부정형이 상기 다중 부사 패턴 적용부에 의해 변환되지 못한 경우 중국 부사 부정형 위치 사전에 따라 상기 부정형의 대역어를 생성하는 부정형 인식 생성부와, 상기 다중 부사 패턴 적용부와 상기 부정형 인식 생성부에서 변환되지 않은 부사가 상기 용언구에 존재하는 경우 부사-용언 변환 패턴을 부사 생성 위치를 결정하고, 그 대역 부사를 생성하는 부사-용언 패턴 적용부를 포함하는 대역 부사 생성 장치를 제공한다.In one aspect, the present invention, a multi-adverb pattern applying unit for recognizing when the input word phrase includes a multi-adverb, generating a band word by applying a multi-adverb conversion pattern or a Chinese compound verb dictionary, and the input word phrase Includes an indefinite form and an indeterminate recognition generator for generating the indefinite band word according to a Chinese adverb indefinite position dictionary when the indefinite form is not converted by the multi-adverb pattern applying unit, the multi-adverb pattern applying unit and the Provided as an adverb generating apparatus comprising an adverb-proverb pattern applying unit for determining an adverb generating position of an adverb-protocol conversion pattern and generating a band adverb when an adverb unconverted in the negation recognition generator is present in the terminology. do.

다른 관점에서 본 발명은, 입력된 용언구가 다중 부사를 포함할 경우 이를 인식하는 제 1 단계와, 상기 인식된 다중 부사에 다중 부사 변환 패턴 또는 중국어 복합 동사 사전을 적용하여 대역어를 생성하는 제 2 단계와, 상기 입력된 용언구가 부정형을 포함함과 동시에 상기 부정형이 상기 다중 부사 변환 패턴 또는 중국어 복합 동사 사전에 의해 처리되지 않은 경우 상기 입력된 용언구에서 상기 부정형의 부사를 인식하는 제 3 단계와, 상기 인식된 부정형의 부사에 중국어 부사 부정형 위치 사전을 적용하여 상기 부정형의 대역어를 생성하는 제 4 단계와, 상기 제 1 단계와 제 4 단계에서 변환되지 않은 부사가 상기 용언구에 존재하는 경우 부사-용언 변환 패턴을 부사 생성 위치를 결정하고, 그 대역 부사를 생성하는 제 5 단계를 포함하는 대역 부사 생성 방법을 제공한다.In another aspect, the present invention provides a first step of recognizing an input terminology including multiple adverbs, and generating a band word by applying a multiple adverb conversion pattern or a Chinese compound verb dictionary to the recognized multiple adverbs. And a third step of recognizing the adverb of the indefinite form in the input phrase when the input terminology includes an indefinite form and the indeterminate form is not processed by the multiple adverb conversion pattern or the Chinese compound verb dictionary. And a fourth step of applying the Chinese adverb indefinite position dictionary to the recognized indefinite adverbs to generate the indeterminate band word, and when the adverbs not converted in the first and fourth steps exist in the phrase. A band adverb generation comprising a fifth step of determining an adverb generation position of an adverb-to-verb conversion pattern and generating a band adverb There is provided a method.

본 발명은, 대역 부사 생성 장치에 부사를 포함하는 용언구가 입력되면, 다중 부사를 인식하여 다중 부사 변환 패턴에 따라 다중 부사 패턴을 적용하고, 중국어 복합 동사 사전에 따라 다중 부사 패턴을 적용한 후에, 부정형을 인식하고, 그에 대응하는 부정형 위치를 결정하며, 다음 문형 또는 시제에 다라 부정형 대역어를 변환한 후에 부사-용언 변환 패턴에 따라 대역 부사를 결정함으로써, 중국어를 목표 언어로 하는 번역에서 대역 부사를 생성하는데 있어 대역어의 의미 모호성을 해소할 수 있다.According to the present invention, when a terminology including an adverb is input to a band adverb generating apparatus, after recognizing the multiple adverbs and applying the multiple adverb pattern according to the multiple adverb conversion pattern and applying the multiple adverb pattern according to the Chinese compound verb dictionary, Recognize the indefinite form, determine the corresponding indefinite position, convert the indefinite band word according to the next sentence or tense, and then determine the band adverb according to the adverb-proverb conversion pattern, thereby eliminating the band adverb in the translation using Chinese as the target language. The semantic ambiguity of the bandword can be eliminated in generating.

먼저, 도 1a 내지 도 1g를 참조하여 중국어를 목표 언어로 하는 자동 번역에 있어 부사 대역어 및 위치 생성 모호성을 설명하면, 도 1a와 도 1b는 "부사+용언" 구조에서 부사 "쉽게"로 동사를 수식하는 용언구임에도 불구하고, 번역문에서는 대역어뿐만 아니라 어순까지 서로 다르게 생성되는 것을 나타내는데, 부사와 용언의 어순뿐만 아니라 한 용언구에 두 개 이상의 부사가 포함될 경우 두 부사의 어순과 대역어 생성에서도 모호성이 존재하는 것을 알 수 있다.First, referring to FIGS. 1A to 1G, the adverb band word and location generation ambiguity in the automatic translation using Chinese as the target language will be described with reference to FIGS. 1A and 1B. In spite of modifying idioms, the translation shows that not only band words but word orders are generated differently.In addition to the word order of adverbs and verbs, when two or more adverbs are included in one idiom, the ambiguity is also generated in the two adverbs. It can be seen that it exists.

그리고, 도 1c와 도 1d는 "정도 부사+상태 부사" 구조에 대한 번역을 예시한 것으로, 한 개의 용언구가 두 개 이상의 부사를 가지고 있을 경우 이런 부사간 생성 모호성은 부사-용언간 생성 모호성과 함께 나타나 더 복잡한 양상을 가지게 되며, 어순만 보더라도 한국어에서 "부사1+부사2+부사3" 어순이 중국어로 생성 후 "부사1+부사2(+조사: 地)+용언", "부사1+용언(+조사: 得/了)+부사2", "용언(+조사)+부사1+부사2", "부사2+부사1(+조사: 地)+용언", "용언(+조사: 得/了)+부사2+부사1" 등 다양한 어순으로의 생성이 가능하다.1C and 1D illustrate the translation of the structure of "definite adverb + state adverb", where one adjective has more than two adverbs, this adverb spacing ambiguity They appear together and have a more complex aspect, and even if you look at the word order, the adverb 1 + adverb 2 + adverb 3 is generated in Chinese, then "adverb 1 + adverb 2 (+ investigation: 地) + adverb", "adverb 1+ Proverb (+ Survey: 得 / 了) + Adverb 2 "," Proverb (+ Survey) + Adverb 1 + Adverb 2 "," Adverb 2 + Adverb 1 (+ Survey: 地) + Proverb "," Proverb (+ Survey: 생성 / 了) + adverb 2 + adverb 1 ”can be generated in various word order.

이러한 생성 어순은 의존 관계의 영향을 받을 뿐만 아니라 도 1c와 도 1d에 도시한 바와 같이 이와 무관하게 중국어 대역어의 문법적 특징과 많이 관련된다. The generated word order is not only influenced by the dependency relationship, but also highly related to the grammatical characteristics of the Chinese band language as shown in FIGS. 1C and 1D.

또한, 도 1e에 도시한 바와 같이 용언구가 부정 부사 또는 부정형 보조용언으로 부정적인 의미를 갖고 있을 경우에도 이런 모호성이 존재하는데, 특히 한국어와 같은 경우, 부정형 보조용언의 사용 시 구문 분석에서는 해당 부정형이 용언과 의존관계를 맺는 것으로 분석되지만, 실제 그 부정의 대상이 용언일 수도 있고, 용언 앞의 부사일 수도 있다. 예를 들면 "빨리 가지 않는다"에서 부정형의 의미는 "빠르지 않다"라는 뜻이지, "가다"에 대한 부정으로 "안 간다"라는 뜻이 아니다.Also, as shown in FIG. 1E, such ambiguity exists even when the terminology has a negative meaning as an indefinite adverb or an indefinite adjunct. In particular, in Korean, such a form is used in syntax analysis when using an indefinite adjective. It is analyzed that it depends on the verb, but the object of the negation may be the verb or adverb before the verb. For example, the meaning of indefinite in "do not go fast" means "not fast", not "not go" as a negation for "go".

이는 부정 부사로 나타내는 부정형에서도 마찬가지인데 도 1e에 도시된 문장을 부정 부사로 바꿀 경우 한국어에서는 "안 빨리 간다"로 표현하기보다는 "안 간다"로 표현하기에 한국어 구문 분석에서는 여전히 해당 부정형은 용언과 의존 구조를 가지는 것으로 나타난다. 한국어에서는 이런 모호성이 용인되면서도 그 의미가 제대로 전달되는 반면 중국어로 번역한 다음에는 해당 부정형은 그 의미대로 부사 를 수식해야 정확한 번역이 될 수 있다. The same is true of the indefinite form of indefinite adverbs. When the sentence shown in FIG. 1E is changed to indefinite adverb, the indefinite form of Korean parsing is still expressed as "not to go" rather than "not to go fast". It appears to have a dependency structure. In Korean, this ambiguity is tolerated, but the meaning is properly conveyed. After translation into Chinese, the indefinite form can be corrected only if the adverbs are modified according to the meaning.

도 1e에 도시한 바와 같이 부사를 가진 용언구에서 부정형의 생성 위치는 해당 부정형이 의미적으로 수식하는 성분과 관계될 뿐만 아니라, 용언구 내 부사의 중국어 대역어의 문법적 특성과도 관련되는데, 도 1f와 도 1g에 도시한 바와 같이 "상태 부사+용언"에 대한 부정형 구문에서 나타나는 부정형의 생성 위치를 보여주는데, 이런 부정형의 생성 위치는 용언구가 두 개 이상의 부사를 가지는 경우 모호성이 더 커질 수밖에 없다. As shown in FIG. 1E, the position of generation of an indeterminate form in an idiom with an adverb is not only related to the component that the indeterminate form is semantically modified, but also related to the grammatical characteristics of the Chinese verbal word of the adverb in the idiom. And as shown in Figure 1g shows the location of the formation of the negation form in the negation syntax for the "state adverb + verb", this morphological creation position is bound to be more ambiguity if the phrase has more than two adverbs.

이외에도 가장 전형적인 중국어 부정형 부사 "不"의 경우 과거형에는 "役"로, 명령문에서는 "別" 또는 "不要"로 생성되어야 하는 등, 부정형의 중국어 대역어는 시제 또는 문형의 영향도 받는다. In addition, the most typical Chinese indefinite adverb "不" should be generated as "役" in the past tense and "別" or "不 要" in the statement.

이에 따라, 본 발명에서는 한국어 용언구에서의 부사 생성에서 위치 및 대역어 모호성을 해결하기 위한 것으로, 부사 변환 패턴과 중국어 부사 부정형 위치 사전 등 언어 자원을 이용하여 부사 생성 오류를 줄임으로 보다 정확하고 자연스러운 자동 번역 결과를 획득할 수 있는 것이며, 이러한 기술적 수단을 통해 종래 기술에서의 문제점을 해결할 수 있다.Accordingly, the present invention is to solve the position and bandword ambiguity in the adverb generation in the Korean idiom, by using language resources such as adverb conversion patterns and Chinese adverb indefinite position dictionary to reduce the adverb generation error by more accurate and natural automatic It is possible to obtain a translation result, it is possible to solve the problems in the prior art through these technical means.

이하 첨부된 도면을 참조하여 본 발명의 실시 예에 대하여 상세하게 설명한다. 이하에서는 특별한 언급이 없는 한 모든 예시와 기술에서 원언어를 한국어로, 목표 언어를 중국어로 하여 설명한다.Hereinafter, embodiments of the present invention will be described in detail with reference to the accompanying drawings. In the following description, the original language is Korean and the target language is Chinese in all examples and techniques unless otherwise specified.

도 2는 본 발명의 실시 예에 따라 중국어를 목표 언어로 하는 번역에 있어 부사에 대한 중국어 대역어를 생성하는 대역 부사 생성 장치의 블록 구성도로서, 다중 부사 패턴 적용부(102), 중국어 복합 동사 사전 데이터베이스(104), 다중 부사 변환 패턴 데이터베이스(106), 부정형 인식 생성부(108), 중국어 부사 부정형 위치 사전 데이터베이스(110), 부사-용언 패턴 적용부(112), 부사-용언 변환 패턴 데이터베이스(114) 등을 포함할 수 있다.2 is a block diagram of a band adverb generating device for generating a Chinese band word for an adverb in a translation using Chinese as a target language, according to an embodiment of the present invention. Database 104, multiple adverb conversion pattern database 106, indefinite recognition generation unit 108, Chinese adverb indefinite position dictionary database 110, adverb-proverb pattern application unit 112, adverb-proverb conversion pattern database 114 ) May be included.

도 2를 참조하면, 다중 부사 패턴 적용부(102)는 도 1c와 도 1d에 도시한 바와 같은 두 개 이상의 부사 사이의 위치 및 대역어 변환 문제, 다중 부사와 용언과의 위치 문제 등을 해결하기 위해 다중 부사를 인식하고 그 변환 패턴을 적용하여 대역 다중 부사를 선택 생성하는 것으로, 구문 분석된 부사를 포함하는 용언구가 입력되면, 2개 이상의 부사를 포함하고 있는지 판단하여 다중 부사를 인식하고, 이러한 다중 부사에 대해 다중 부사 변환 패턴 데이터베이스(106)를 참조하여 다중 부사 변환 패턴을 적용한다. 여기에서, 다중 부사 패턴 적용부(102)에 입력되는 용언구는 미리 사전 및 단어 모호성을 해소하여 대역어가 생성된 상태이며, 용언구의 부사는 도 3에 도시한 바와 같이 부사 분류에 따라 품사가 태깅되어 있는 것으로, 정도 부사, 상태 부사, 의태 부사, 의성 부사, 지시 처소 부사, 지시 시간 부사, 부정 부사, 문장 양태 부사, 문장 접속 부사 등과 같이 세부적으로 분류될 수 있다.Referring to FIG. 2, the multi-adverb pattern applying unit 102 may solve a position and band word conversion problem between two or more adverbs as shown in FIGS. 1C and 1D, a location problem between multiple adverbs, and a verb. Recognizing multiple adverbs and applying the transformation pattern to generate band multiple adverbs. When a terminology including parsed adverbs is input, it is determined whether or not two or more adverbs are included and the multiple adverbs are recognized. For multiple adverbs, apply multiple adverb transform patterns with reference to multiple adverb transform pattern database 106. Here, the terminology input to the multi-adverb pattern applying unit 102 is a state in which a band word is generated by solving the dictionary and word ambiguity in advance, and the adverbs of the terminology are tagged with parts of speech according to the adverb classification as shown in FIG. 3. As it is, it can be classified into detail adverbs, state adverbs, false adverbs, pseudonym adverbs, instructional adverbs, instructional time adverbs, indefinite adverbs, sentence mode adverbs, sentence access adverbs, and the like.

예를 들면, 도 4는 본 발명의 실시 예에 따라 다중 부사 패턴을 적용하여 생성한 용언구를 예시한 도면으로, 번호 1, 2, 3은 "상태 부사+부정 부사+동사"의 구 조이고, 번호 5, 6은 "정도 부사+상태 부사+동사"의 구조로서, 상황에 따라 서로 다른 패턴이 적용될 수 있으며, 서로 다른 어순과 대역어로 생성될 수 있음을 나타내고 있다.For example, FIG. 4 is a diagram illustrating a phrase generated by applying a multi-adverb pattern according to an embodiment of the present invention. Numbers 1, 2, and 3 are structures of "state adverbs + negative adverbs + verbs." Numbers 5 and 6 are structures of "definite adverbs + state adverbs + verbs", and indicate that different patterns may be applied according to circumstances, and that different word orders and band words may be generated.

또한, 도 4에 도시한 바와 같이 입력문 "죽으면 안 되(번호 1)"과 "조용히 안 자(평서문 : 번호 2)"는 같은 구조이지만, 서로 다른 어순으로 생성되고 있고, "조용히 안 자(평서문 : 번호 2)"와 "조용히 안 하(명령문 : 번호 3)"은, 같은 구조에 같은 부사 "조용히 안"을 사용하고 있음에도 불구하고, 동사와 문형에 따라 다른 어순과 대역문을 갖는 것을 알 수 있다. In addition, as shown in FIG. 4, the input sentences "not to die (number 1)" and "quietly not character (comment text: number 2)" have the same structure, but are generated in different word orders, and the "quietly quiet character ( Declaration: No. 2) and No Quiet (Command: No. 3) use the same adverb "no quiet" in the same structure, but with different word order and band statements depending on the verb and sentence pattern. Can be.

도 2를 다시 참조하면, 다중 부사 패턴 적용부(102)는 다중 부사 변환 패턴에 따른 패턴 적용과 함께 중국어 복합동사 사전 데이터베이스(104)를 참조하여 다중 부사 패턴을 적용하여 대역 부정형 부사를 선택 생성하는데, 도 4에 도시한 번호 4의 "얼마나 자주 오"와 번호 5의 "얼마나 자주 목욕하"는 모두 같은 패턴이 적용되었지만, 용언의 중국어 대역어에서 번호 5의 대역어는 "동사+목적어" 구조를 가진 복합 동사 "洗

Figure 112008088115511-pat00001
"로서, 생성 시 이러한 복합 동사의 동사부인 "洗(씻다)"는 패턴에서의 "VS"자리에, 목적부인 "
Figure 112008088115511-pat00002
(목욕)"은 생성문의 맨 뒤로 생성되는 것을 알 수 있다.Referring to FIG. 2 again, the multi-adverb pattern application unit 102 generates and generates a band indefinite adverb by applying a multi-adverb pattern with reference to the Chinese compound-verb dictionary database 104 together with the pattern application according to the multi-adverb transformation pattern. The same pattern is applied to both "how often" and "how often" of the number 4 shown in FIG. 4, but the verbal number of the number 5 has a "verb + object" structure in the Chinese verbal language of the verb. Compound verb "洗
Figure 112008088115511-pat00001
As "", the verb part of this compound verb, "Wash", is created in place of the "VS" in the pattern, while the destination part "
Figure 112008088115511-pat00002
(Bath) "is generated at the end of the statement.

다음에, 부정형 인식 생성부(108)는 도 1e 내지 도 1g에 도시한 바와 같은 부사의 부정형 위치 및 대역어 변환 문제 등을 해결하기 위해 부정형 부사를 인식하고, 그에 대응하는 부정형 부사를 선택 생성하는 것으로, 다중 부사 패턴 적용 부(102)로부터 전달되는 용언구가 부정형이 있으면서 동시에 다중 부사 패턴을 적용하여 변환이 되지 않은 경우에만 부정형의 위치를 결정한 후, 다음 문형 또는 시제에 따라 부정형 대역어로 변환하여 부정형 부사를 생성한다. 여기에서, 전달되는 용언구가 부정형이 있으면서 동시에 다중 부사 패턴을 적용하여 변환이 되지 않은 경우가 아닌 경우 부사-용언 패턴 적용부(112)로 전달한다.Next, the indefinite recognition generating unit 108 recognizes the indefinite adverbs in order to solve the indefinite position of the adverbs, the problem of the bandword conversion, etc. as shown in FIGS. 1E to 1G, and selects and generates the indefinite adverbs corresponding thereto. After determining the position of the indefinite form only when the term used to be transmitted from the multi-adverb pattern applying unit 102 has an indefinite form and simultaneously applying the multi-adverb pattern, it is converted into an indeterminate band word according to the next sentence or tense. Generate adverbs Herein, if the term is delivered in an indefinite form and is not transformed by applying multiple adverb patterns at the same time, the term is transmitted to the adverb-verb pattern application unit 112.

여기에서, 도 5는 본 발명의 실시 예에 따라 부사 부정형 위치 결정 알고리즘을 예시한 도면으로, 부정형의 위치를 결정하기 위해서는 중국어 부사 부정형 위치 사전 데이터베이스(110)를 검색하고, 어느 중국어 부사의 앞에 부정형이 생성되어야 한다고 명시적으로 나오지 않는 한, 부정형을 가능한 용언 앞에 위치하도록 결정하며, 부정 부사의 경우 원 위치에 있을 수 있도록 결정할 수 있음을 알 수 있다.5 is a diagram illustrating an adverb indefinite positioning algorithm according to an embodiment of the present invention. In order to determine an indefinite position, the Chinese adverb indefinite position dictionary database 110 is searched and an indefinite form is placed before a Chinese adverb. As long as it is not explicitly stated that this should be generated, it can be determined that the indefinite form is placed in front of the verb as possible, and in the case of an indefinite adverb it can be determined to be in the original position.

또한, 다음 입력 용언구의 문형 및 시제에 따라 부정형의 대역어를 변환해 주어야 하는데, 우선 문형이 명령문인 경우 대표적인 중국어 부사 "不"를 "不要"로 변환하고, 다음 시제가 과거형인 경우 대표적인 중국어 부정 부사 "不" 또는 이로부터 파생된 부정형 부사 "不能"에서 부사의 "不"자를 "役"자로 변환해 주어야 한다. 예를 들면, "不"는 "役", "不能"은 "役能" 등으로 변환될 수 있다. In addition, it is necessary to convert an indeterminate band word according to the sentence and tense of the next input phrase. First, if the sentence is a statement, the representative Chinese adverb "不" is converted into "不 要", and if the next tense is a past tense, the representative Chinese negative adverb In "不" or an indefinite adverb "不 能" derived from it, the "不" adverb must be converted to "자로". For example, "不" may be converted into "役", "不 能" into "役 能", and the like.

일 예로서, 도 6a 및 도 6b는 본 발명의 실시 예에 따라 중국어 부사 부정형 위치 사전을 이용하여 부정형 용언구의 부정형 위치를 생성하는 것을 예시한 도면으로, 번호 1 내지 4는 부정형 용언구로 인식되었으며, 적용 가능한 다중 부사 패턴이 없는 경우이기 때문에 부정형 위치를 생성하게 되는데, 번호 1 내지 3은 앞의 도 1e 내지 도 1g에 대응하는 변환 과정을 나타낸다.6A and 6B illustrate examples of generating an indefinite position of an indefinite verb using a Chinese adverb indefinite position dictionary according to an embodiment of the present invention. Since there is no applicable multi-adverb pattern, an indefinite position is generated. Numbers 1 to 3 indicate a conversion process corresponding to the above FIGS. 1E to 1G.

여기에서, 번호 1에서의 용언구 "빨리 뛰+지않"의 대역어 생성 결과는 "快

Figure 112008088115511-pat00003
+不"이고, 중국어 부사 "快(빨리)"의 부정형 위치는 해당 부사의 앞이 될 수밖에 없다는 중국어 부사 부정형 위치 사전 데이터베이스(110)의 부사 부정형 위치 사전에 따라 부정형의 생성 위치를 부사 "快(빨리)"의 앞으로 생성하여 "不+快
Figure 112008088115511-pat00004
"로 할 수 있으며, 번호 2와 3에서도 동일한 과정을 수행함으로써, 부정형의 생성 위치를 결정하여 도 6a에 도시한 바와 같은 생성 결과를 나타냄을 알 수 있다.Here, the result of the bandword generation of the phrase "fast jump + not" in the number 1 is "快".
Figure 112008088115511-pat00003
+ Non ", the indefinite position of the Chinese adverb" 快 (fast) "must be in front of the adverb. Faster by generating "不 + 快")
Figure 112008088115511-pat00004
It can be seen that by performing the same process in the numbers 2 and 3, the position of formation of the indeterminate is determined to show the result of generation as shown in Fig. 6A.

또한, 번호 5의 경우는 3개의 부사를 가지고 있는데, 첫 번째 부사인 "再也(더이상/정도부사)"에 관한 사전 등록어가 없기 때문에 이의 세부 품사 정보인 "정도 부사"로 검색된 결과를 사용할 수 있음을 알 수 있으며, 시제가 과거형이기 때문에 부정형 "不"의 대역어가 "役"로 변환될 수 있음을 알 수 있다.In addition, the number 5 has three adverbs, and since there is no dictionary registered word for the first adverb "再也 (no longer / precision adverb)", the result retrieved by its detail part-of-speech information "precision adverb" can be used. It can be seen that, since the tense is past tense, the bandword of the indefinite "형" can be converted to "役".

도 2를 다시 참조하면, 부사-용언 패턴 적용부(112)는 도 1a와 도 1b에 도시한 바와 같은 부사와 용언 사이의 위치 문제, 대역어 문제 등을 해결하기 위해 부사-용언 변환 패턴을 이용하여 용언구에서 부사의 생성 위치를 결정하고 그 대역 부사를 선택 생성하는 것으로, 다중 부사 패턴을 적용하여 생성을 마친 부사구의 경우 더 이상 패턴을 적용하지 않으며, 다만 부정형 위치를 생성한 경우에는 부사-용언 패턴을 적용하는데, 한국어 부사에 대한 중국어 대역어는 부사-용언 패턴을 통해 선택한다. 여기에서, 부사-용언 패턴은 한국어 부사와 해당하는 중국어 기준(default) 대역어 및 그 기준 생성 위치를 포함하고, 기준 대역어를 취하지 않을 경우에 대응하는 주변 공기 정보, 대역어, 생성 위치 등을 포함한다.Referring back to FIG. 2, the adverb-proverb pattern applying unit 112 uses an adverb-proverb conversion pattern to solve a position problem, a bandword problem, and the like between the adverbs and the verbs as shown in FIGS. 1A and 1B. Determines the position of adverb generation in the phrase and selects the band adverbs. When the adverb phrase is completed by applying the multiple adverb pattern, the pattern is no longer applied. To apply a pattern, the Chinese verbal language for Korean adverbs is selected through an adverb-proverb pattern. Here, the adverb-verb pattern includes a Korean adverb and a corresponding Chinese reference band word and a reference generation location thereof, and includes surrounding air information, band word, generation location, and the like corresponding to the case where no reference band word is taken.

도 7은 본 발명의 실시 예에 따라 부사-용언 패턴을 적용하여 생성한 용언구를 예시한 도면으로, 세 번째 열(부사-용언 패턴열)로부터 입력된 용언구에 어떤 패턴이 적용되어 생성되었는지를 나타내고 있는데, 도 7에 도시한 번호 1과 2에서는 부사 "바로"가 용언과 결합하는 경우이지만, 서로 다른 대역어로 생성되고, 특히, 번호 1에서는 부사가 용언 앞에 있는 원 어순 그대로, 번호 2에서는 부사가 용언 뒤로 가면서 동사에 조사 "得"이 붙는 패턴으로 생성되는 것을 알 수 있다.FIG. 7 is a diagram illustrating a phrase generated by applying an adverb-verb pattern according to an embodiment of the present invention. FIG. 7 illustrates a pattern applied to a verb phrase input from a third column (adverb-verb pattern column). In the numbers 1 and 2 shown in FIG. 7, the adverbs "just" are combined with the verb, but are generated in different band words. In particular, in the number 1, the adverbs are in the original word order before the verb, We can see that adverbs are generated in a pattern where the verb "得" is attached to the verb.

또한, 번호 3과 4에서는 부사 "가득"이 용언과 결합하는 예이지만, 이러한 경우에서도 서로 다른 대역어로 생성되고, 특히, 번호 3에서는 용언에 조사 "得"이 부가됨과 동시에 역순으로 생성되지만, 번호 4에서는 조사 "得"이 부가되지 않고, 역순으로 생성되는 것을 알 수 있으며, 번호 5에서는 제2단계에서 이미 부정형이 생성된 경우로, 부사-용언 패턴이 적용된 후 "부정형+부사"가 함께 조사 "得"을 부가한 동사 뒤에 생성되는 것을 알 수 있다. In addition, the adverbs " full " are examples of combining verbs with numbers 3 and 4, but in this case, different adverbs are generated. In particular, the number 3 is generated in reverse order with the addition of the word “조사” to the verb. In Fig. 4, it is found that the search "得" is not added and is generated in the reverse order. In No. 5, the indefinite form is already generated in the second step. After the adverb-proverb pattern is applied, the "indefinite + adverb" is investigated together. You can see that it is generated after the verb with the addition of "得".

한편, 부사-용언 패턴 적용부(112)까지의 과정을 완료한 상태에서 어떠한 패턴도 적용되지 않은 경우, 입력되는 용언구의 부사는 입력된 대역어 그대로, 한국어에서의 원 어순 그대로 생성할 수 있다.On the other hand, when no pattern is applied in a state in which the process up to the adverb-proverb pattern applying unit 112 is completed, the adverb of the input verbal phrase may be generated as it is in the original language in Korean.

다음에, 상술한 바와 같은 구성을 갖는 대역 부사 생성 장치에 부사를 포함하는 용언구가 입력되면, 다중 부사를 인식하여 다중 부사 변환 패턴에 따라 다중 부사 패턴을 적용하고, 중국어 복합 동사 사전에 따라 다중 부사 패턴을 적용한 후에, 부정형을 인식하고, 그에 대응하는 부정형 위치를 결정하며, 다음 문형 또는 시제에 다라 부정형 대역어를 변환한 후에 부사-용언 변환 패턴에 따라 대역 부사를 결정하는 과정에 대해 설명한다.Next, when a terminology including an adverb is input to the band adverb generating device having the above-described configuration, the adverb including the adverb is recognized, the multiple adverb pattern is applied according to the multiple adverb transformation pattern, and the multiple adverb pattern is multiplied according to the Chinese compound verb dictionary. After applying the adverb pattern, the process of recognizing the indefinite form, determining the corresponding indefinite position, converting the indefinite band word according to the next sentence or tense, and determining the band adverb according to the adverb-to-verb conversion pattern will be described.

도 8은 본 발명의 일 실시 예에 따라 중국어를 목표 언어로 하는 번역에 있어 부사에 대한 중국어 대역어를 생성하는 과정을 도시한 플로우차트이다.8 is a flowchart illustrating a process of generating a Chinese verbal language for an adverb in a translation using Chinese as a target language according to an embodiment of the present invention.

도 8을 참조하면, 대역 부사 생성 장치에 구문 분석된 부사를 포함하는 용언구가 입력되면(단계802), 다중 부사 패턴 적용부(102)에서는 이러한 용언구에 대해 2개 이상(즉, 적어도 2개)의 부사를 포함하고 있는지 판단하여 다중 부사를 인식한다(804). 여기에서, 입력되는 용언구는 미리 사전 및 단어 모호성을 해소하여 대역어가 생성된 상태이며, 용언구의 부사는 부사 분류에 따라 품사가 태깅되어 있는 것으로, 정도 부사, 상태 부사, 의태 부사, 의성 부사, 지시 처소 부사, 지시 시간 부사, 부정 부사, 문장 양태 부사, 문장 접속 부사 등과 같이 세부적으로 분류될 수 있다.Referring to FIG. 8, when a phrase including a parsed adverb is input to the band adverb generating apparatus (step 802), the multi-adverb pattern applying unit 102 may have two or more (eg, at least two) words for such a phrase. The multi-adverb is recognized (804) by determining whether or not the adverb is included. Here, the input idiom is a state in which a band word is generated by solving the dictionary and word ambiguity in advance, and the adverbs of the idiom are tagged with parts of speech according to the adverb classification. The degree of adverb, state adverb, predicate adverb, right adverb adverb, and instruction The adverb adverb, the instruction time adverb, the negation adverb, the sentence aspect adverb, the sentence connection adverb, and the like can be classified in detail.

물론, 다중 부사 패턴 적용부(102)에서는 다중 부사가 아닌 용언구의 경우 부정형 인식 생성부(108)로 해당 용언구를 전달할 수 있다.Of course, the multiple adverb pattern applying unit 102 may transmit the phrase to the indefinite recognition generator 108 in the case of a verb that is not a multi-adverb.

그리고, 다중 부사 패턴 적용부(102)에서는 이러한 다중 부사에 대해 다중 부사 변환 패턴 데이터베이스(106)의 다중 부사 변환 패턴을 참조하여 다중 부사 패턴을 적용하고, 다중 부사에 대응하는 대역 다중 부사를 선택 생성한다(단계806). 여기에서, 다중 부사 패턴은 "상태 부사+부정 부사+동사", "정도 부사+상태 부사+동사" 등의 용언구 구조에 대응하는 다중 부사 변환 패턴에 따라 적용될 수 있다.In addition, the multi-adverb pattern application unit 102 applies the multi-adverb pattern to the multi-adverb by referring to the multi-adverb transformation pattern of the multi-adverb transformation pattern database 106, and selects and generates a band multi-adverb corresponding to the multi-adverb. (Step 806). Here, the multiple adverb pattern may be applied according to a multiple adverb conversion pattern corresponding to a phrase structure such as "state adverb + adverb adverb + verb", "degree adverb + state adverb + verb".

이와 함께, 다중 부사 패턴 적용부(102)에서는 중국어 복합 동사 사전 데이터베이스(104)의 중국어 복합 동사 사전을 참조하여 다중 부사 패턴을 적용하고, 이에 따른 대역 다중 부사를 선택 생성한다(단계808). 여기에서, 다중 부사 패턴은 "동사+목적어" 등의 구조를 가진 복합 동사에서 복합 동사의 동사부와 목적부의 사이에 생성되는 등의 방식으로 적용될 수 있다.In addition, the multi-adverb pattern application unit 102 applies the multi-adverb pattern with reference to the Chinese compound-verb dictionary of the Chinese compound-verb dictionary database 104 and selects and generates band multiple adverbs accordingly (step 808). Here, the multiple adverb pattern may be applied in a manner of being generated between the verb part and the object part of the compound verb in a compound verb having a structure such as "verb + object".

이러한 다중 부사 인식과 그 변환 패턴의 적용에 따라 두 개 이상의 부사 사이의 위치 및 대역어 변환 문제, 다중 부사와 용언과의 위치 문제 등을 해결할 수 있다.According to the recognition of the multiple adverbs and the application of the conversion pattern, the problem of position and band word conversion between two or more adverbs, and the problem of multiple adverbs and verbs can be solved.

다음에, 부정형 인식 생성부(108)에서는 다중 부사 패턴 적용부(102)로부터 전달되는 용언구가 부정형이 있으면서 동시에 다중 부사 패턴을 적용하여 변환이 되지 않은 경우에만 부정형의 위치를 결정한다(단계810). 물론, 부정형 인식 생성부(108)에서는 부정형 부사가 아닌 용언구의 경우 부사-용언 패턴 적용부(112)로 해당 용언구를 전달할 수 있다.Next, the indefinite recognition generating unit 108 determines the location of the indefinite form only when the term used to be transmitted from the multi-adverb pattern applying unit 102 has an indefinite form and simultaneously applies the multi-adverb pattern (not transformed) (step 810). ). Of course, in the case of non-negative adverbs, the indefinite recognition generator 108 may transmit the phrase to the adverb-proverb pattern applying unit 112.

또한, 부정형 인식 생성부(108)에서는 다음 문형 또는 시제에 따라 부정형 대역어를 변환하여 부정형 부사를 선택 생성한다(단계812). 여기에서, 전달되는 용언구가 부정형이 있으면서 동시에 다중 부사 패턴을 적용하여 변환이 되지 않은 경우가 아닌 경우 부사-용언 패턴 적용부(112)로 전달한다.In addition, the indeterminate recognition generator 108 selects and generates an indefinite adverb by converting the indefinite band word according to the next sentence or tense (step 812). Herein, if the term is delivered in an indefinite form and is not transformed by applying multiple adverb patterns at the same time, the term is transmitted to the adverb-verb pattern application unit 112.

이러한 부정형 인식과 그 변환 패턴의 적용에 따라 부사의 부정형 위치 및 대역어 변환 문제 등을 해결할 수 있다.By applying such a negation recognition and its conversion pattern, it is possible to solve the indefinite position and adverb translation problem of adverbs.

다음에, 부사-용언 패턴 적용부(112)에서는 부사-용언 변환 패턴 데이터베이 스(114)의 부사-용언 변환 패턴을 참조하여 용언구에서 부사의 생성 위치를 결정하고 그 대역 부사를 선택 생성한다(단계814). 여기에서, 다중 부사 패턴을 적용하여 생성을 마친 부사구의 경우 더 이상 패턴을 적용하지 않으며, 다만 부정형 위치를 생성한 경우에는 부사-용언 패턴을 적용할 수 있으며, 한국어 부사에 대한 중국어 대역어는 부사-용언 패턴을 통해 선택할 수 있다.Next, the adverb-pronunciation pattern applying unit 112 refers to the adverb-to-verb conversion pattern of the adverb-to-verb conversion pattern database 114 to determine the generation position of the adverb in the phrase and select and generate the band adverbs. (Step814). Here, in the case of an adverb phrase that is generated by applying a multi-adverb pattern, the pattern is no longer applied. However, when an indefinite position is generated, an adverb-proverb pattern can be applied. You can choose from the pattern of words.

이러한 부사-용언 변환 패턴의 적용에 따라 부사와 용언 사이의 위치 문제, 대역어 문제 등을 해결할 수 있다.According to the application of the adverb-to-verb conversion pattern, it is possible to solve a position problem between the adverb and the verb and a bandword problem.

따라서, 구문 분석된 부사를 포함하는 용언구가 입력되면, 다중 부사 인식 및 변환 패턴 적용, 부정형 부사 인식 및 변환 패턴 적용, 부사-용언 변환 패턴 적용을 선택적으로 수행함으로써, 중국어를 목표 언어로 하는 번역에서 대역 부사를 생성하는데 있어 대역어의 의미 모호성을 해소할 수 있다.Therefore, when a terminology including a parsed adverb is input, a translation using Chinese as a target language is selectively performed by applying multiple adverb recognition and transformation patterns, applying indefinite adverb recognition and transformation patterns, and applying adverb-proverb transformation patterns. Semantic ambiguity of band words can be eliminated in generating band adverbs in.

상술한 바와 같은 대역 부사 생성 장치 및 방법은 중국어를 목표 언어로 한 한중 번역기로 하여 설명하였으나, 중국어를 목표언어로 한 자동 번역기, 예를 들면 일중 번역기, 영중 번역기 등에서 모두 사용 가능하며, 한국어와 다른 영어를 원언어로 사용할 경우 영어에 대응하는 원언어 패턴을 참조하여 적용할 수 있음은 물론이다.The apparatus and method for generating a band adverb as described above has been described using a Chinese-Chinese translator as a target language, but it can be used in all Chinese as a target language, such as a Japanese-Chinese translator or an English-Chinese translator. If English is used as the original language, it can be applied by referring to the original language pattern corresponding to English.

이상의 설명에서는 본 발명의 다양한 실시 예들을 제시하여 설명하였으나 본 발명이 반드시 이에 한정되는 것은 아니며, 본 발명이 속하는 기술분야에서 통상의 지식을 가진 자라면 본 발명의 기술적 사상을 벗어나지 않는 범위 내에서 여러 가지 치환, 변형 및 변경이 가능함을 쉽게 알 수 있을 것이다.In the foregoing description, various embodiments of the present invention have been described and described. However, the present invention is not necessarily limited thereto, and a person having ordinary skill in the art to which the present invention pertains can make various changes without departing from the technical spirit of the present invention. It will be readily appreciated that branch substitutions, modifications and variations are possible.

도 1a 내지 도 1g는 중국어를 목표 언어로 하는 자동 번역에 있어 부사 대역 어 및 위치 생성 모호성을 설명하기 위한 도면,1A to 1G are diagrams for explaining adverb band words and location generation ambiguity in an automatic translation using Chinese as a target language;

도 2는 본 발명의 실시 예에 따라 중국어를 목표 언어로 하는 번역에 있어 부사에 대한 중국어 대역어를 생성하는 대역어 생성 장치의 블록 구성도,2 is a block diagram illustrating a band word generating apparatus for generating a Chinese band word for an adverb in a translation using Chinese as a target language according to an embodiment of the present invention;

도 3은 본 발명의 실시 예에 따라 성분 부사 및 문장 부사를 포함하는 부사 분류를 나타낸 도면,3 is a view showing adverb classification including component adverbs and sentence adverbs according to an embodiment of the present invention;

도 4는 본 발명의 실시 예에 따라 다중부사 패턴을 적용하여 생성한 용언구를 예시한 도면,4 is a diagram illustrating a phrase generated by applying a multi-adverb pattern according to an embodiment of the present invention,

도 5는 본 발명의 실시 예에 따라 부사 부정형 위치 결정 알고리즘을 예시한 도면,5 is a diagram illustrating an adverb indeterminate positioning algorithm according to an embodiment of the present invention;

도 6a 및 도 6b는 본 발명의 실시 예에 따라 중국어 부사 부정형 위치 사전을 이용하여 부정형 용언구의 부정형 위치를 생성하는 것을 예시한 도면,6A and 6B are views illustrating generating an indefinite position of an indefinite verb using a Chinese adverb indefinite position dictionary according to an embodiment of the present invention;

도 7은 본 발명의 실시 예에 따라 부사-용언 패턴을 적용하여 생성한 용언구를 예시한 도면,7 is a diagram illustrating a phrase generated by applying an adverb-verb pattern according to an embodiment of the present invention;

도 8은 본 발명의 일 실시 예에 따라 중국어를 목표 언어로 하는 번역에 있어 부사에 대한 중국어 대역어를 생성하는 과정을 도시한 플로우차트.8 is a flowchart illustrating a process of generating a Chinese verbal language for an adverb in a translation using Chinese as a target language according to an embodiment of the present invention.

<도면의 주요부분에 대한 부호의 설명><Description of the symbols for the main parts of the drawings>

102 : 다중 부사 패턴 적용부102: multi-adverb pattern applying unit

104 : 중국어 복합 동사 사전 데이터베이스104: Chinese Compound Verb Dictionary Database

106 : 다중 부사 변환 패턴 데이터베이스106: Multiple Adverb Transformation Pattern Database

108 : 부정형 인식 생성부108: negation recognition generator

110 : 중국어 부사 부정형 위치 사전 데이터베이스110: Chinese Adverb Infinite Location Dictionary Database

112 : 부사-용언 패턴 적용부112: adverb-verb pattern applying unit

114 : 부사-용언 변환 패턴 데이터베이스114: Adverb-Proverb Conversion Pattern Database

Claims (10)

입력된 용언구가 다중 부사를 포함할 경우 이를 인식하고, 다중 부사 변환 패턴 또는 중국어 복합 동사 사전을 적용하여 대역어를 생성하는 다중 부사 패턴 적용부와,A multi-adverb pattern application unit for recognizing the input terminology including a multi-adverb and generating a band word by applying a multi-adverb conversion pattern or a Chinese compound verb dictionary; 상기 입력된 용언구가 부정형을 포함함과 동시에 상기 부정형이 상기 다중 부사 패턴 적용부에 의해 변환되지 못한 경우 중국 부사 부정형 위치 사전에 따라 상기 부정형의 대역어를 생성하는 부정형 인식 생성부와,An indeterminate recognition generator for generating the indefinite band word according to a Chinese adverb indefinite position dictionary when the input terminology includes an indefinite form and the indefinite form is not converted by the multi-adverb pattern applying unit; 상기 다중 부사 패턴 적용부와 상기 부정형 인식 생성부에서 변환되지 않은 부사가 상기 용언구에 존재하는 경우 부사-용언 변환 패턴을 부사 생성 위치를 결정하고, 그 대역 부사를 생성하는 부사-용언 패턴 적용부An adverb-proverb pattern applying unit for determining an adverb generating position of an adverb-protocol conversion pattern and generating a band adverb when an adverb that is not transformed in the multi-adverb pattern applying unit and the indeterministic recognition generating unit exists in the terminology. 를 포함하는 대역 부사 생성 장치.Band adverb generating device comprising a. 제 1 항에 있어서,The method of claim 1, 상기 다중 부사 패턴 적용부는, 상기 인식된 다중 부사의 세부 분류에 대응하는 상기 다중 부사 변환 패턴에 따른 생성 위치에 또는 복합 동사가 있는 경우 상기 중국어 복합 동사 사전에 따라 동사부와 목적부의 사이에 상기 대역어를 생성하는 대역 부사 생성 장치.The multiple adverb pattern applying unit may be formed between the verb part and the object part according to the Chinese compound verb dictionary in the generation position according to the multiple adverb conversion pattern corresponding to the subdivision of the recognized multiple adverb or when there is a compound verb. Band adverb generating device for generating a. 제 1 항에 있어서,The method of claim 1, 상기 부정형 인식 생성부는, 상기 중국어 부사 부정형 위치 사전에 따라 부정형의 위치를 결정한 후, 다음 문형 또는 시제에 따라 상기 부정형의 대역어를 생성하는 대역 부사 생성 장치.And the negation recognition generating unit determines the position of the indefinite form according to the Chinese adverb indefinite position dictionary, and generates the indefinite band word according to the next sentence or tense. 제 1 항에 있어서,The method of claim 1, 상기 부사-용언 패턴 적용부는, 상기 부정형 인식 생성부에서 생성된 부정형의 대역어 경우에도 상기 부사-용언 변환 패턴을 이용하여 부사 생성 위치를 다시 결정하고, 그 대역 부사를 생성하는 대역 부사 생성 장치.The adverb-pronunciation pattern applying unit re-determines an adverb generation position using the adverb-pronunciation conversion pattern even in the case of an indefinite band word generated by the indeterminate recognition generator, and generates the band adverb. 제 1 항 내지 제 4 항 중 어느 한 항에 있어서,The method according to any one of claims 1 to 4, 상기 용언구는, 구문 분석된 부사에 대응하는 대역어가 생성된 상태이며, 이에 포함된 부사는 부사 분류에 따라 품사가 태깅되어 있는 대역 부사 생성 장치.The terminology is a state in which a band word corresponding to the parsed adverb is generated, the adverbs included therein are tagged parts of speech according to the adverb classification. 입력된 용언구가 다중 부사를 포함할 경우 이를 인식하는 제 1 단계와,A first step of recognizing the input terminology includes multiple adverbs, 상기 인식된 다중 부사에 다중 부사 변환 패턴 또는 중국어 복합 동사 사전을 적용하여 대역어를 생성하는 제 2 단계와,A second step of generating a band word by applying a multiple adverb conversion pattern or a Chinese compound verb dictionary to the recognized multiple adverbs; 상기 입력된 용언구가 부정형을 포함함과 동시에 상기 부정형이 상기 다중 부사 변환 패턴 또는 중국어 복합 동사 사전에 의해 처리되지 않은 경우 상기 입력된 용언구에서 상기 부정형의 부사를 인식하는 제 3 단계와,A third step of recognizing the adverb of the indefinite form in the input phrase when the input terminology includes an indefinite form and the indefinite form is not processed by the multiple adverb conversion pattern or the Chinese compound verb dictionary; 상기 인식된 부정형의 부사에 중국어 부사 부정형 위치 사전을 적용하여 상기 부정형의 대역어를 생성하는 제 4 단계와,A fourth step of applying the Chinese adverb indefinite position dictionary to the recognized indefinite adverb to generate the indefinite band word; 상기 제 1 단계와 제 4 단계에서 변환되지 않은 부사가 상기 용언구에 존재하는 경우 부사-용언 변환 패턴을 부사 생성 위치를 결정하고, 그 대역 부사를 생성하는 제 5 단계A fifth step of determining an adverb generating position of an adverb-protocol conversion pattern and generating a band adverb when an adverb not converted in the first and fourth steps exists in the verb 를 포함하는 대역 부사 생성 방법.Band adverb generation method comprising a. 제 6 항에 있어서,The method of claim 6, 상기 대역 부사 생성 방법은,The band adverb generating method, 상기 제 5 단계를 통해 변환되지 않은 부사가 상기 용언구에 존재하는 경우상기 입력된 용언구의 구문 분석된 부사에 대응하여 기 생성된 대역어를 대역 부사로 결정하는 단계If an adverb that is not converted through the fifth step is present in the phrase, determining a pre-generated band word corresponding to the parsed adverb of the input phrase as a band adverb. 를 포함하는 대역 부사 생성 방법.Band adverb generation method comprising a. 제 6 항 또는 제 7 항에 있어서,8. The method according to claim 6 or 7, 상기 제 2 단계는, 상기 입력된 용언구에 복합 동사가 있는 경우 동사부와 목적부의 사이에 상기 대역어를 생성하는 대역 부사 생성 방법.The second step is a band adverb generation method for generating the band word between a verb part and a target part when there is a compound verb in the input phrase. 제 6 항 또는 제 7 항에 있어서,8. The method according to claim 6 or 7, 상기 제 4 단계는, The fourth step, 상기 인식된 부정형의 부사에 대응하는 부정형의 위치를 결정하는 단계와,Determining a location of an indeterminate form corresponding to the recognized indefinite adverb; 문형 또는 시제에 따라 상기 결정된 위치에 상기 부정형의 부사에 대한 대역어를 생성하는 단계Generating a bandword for the indefinite adverb at the determined position according to sentence or tense 를 포함하는 대역 부사 생성 방법.Band adverb generation method comprising a. 제 6 항 또는 제 7 항에 있어서,8. The method according to claim 6 or 7, 상기 대역 부사 생성 방법은,The band adverb generating method, 상기 부정형의 대역어를 생성한 후 상기 부사-용언 변환 패턴을 이용하여 부사 생성 위치를 다시 결정하는 단계와,Determining the adverb generation position again using the adverb-to-verb conversion pattern after generating the irregular bandword; 상기 다시 결정된 위치에 대역 부사를 생성하는 단계Generating a band adverb at the re-determined position 를 더 포함하는 대역 부사 생성 방법.Band adverb generation method further comprising.
KR1020080131775A 2008-12-22 2008-12-22 Paginal translation adverb creation apparatus and its method KR101092361B1 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020080131775A KR101092361B1 (en) 2008-12-22 2008-12-22 Paginal translation adverb creation apparatus and its method

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020080131775A KR101092361B1 (en) 2008-12-22 2008-12-22 Paginal translation adverb creation apparatus and its method

Publications (2)

Publication Number Publication Date
KR20100073181A KR20100073181A (en) 2010-07-01
KR101092361B1 true KR101092361B1 (en) 2011-12-09

Family

ID=42636177

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020080131775A KR101092361B1 (en) 2008-12-22 2008-12-22 Paginal translation adverb creation apparatus and its method

Country Status (1)

Country Link
KR (1) KR101092361B1 (en)

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
"한중번역에서 부사어와 서술어의 관련성에 대한 연구," 차영란, 이중언어학, 제24호, pp.241-265 (2004.02.29.)

Also Published As

Publication number Publication date
KR20100073181A (en) 2010-07-01

Similar Documents

Publication Publication Date Title
KR100911621B1 (en) Method and apparatus for providing hybrid automatic translation
Orosz et al. PurePos 2.0: a hybrid tool for morphological disambiguation
JP2003196274A (en) Syntax analyzing method and device
WO2010046782A2 (en) Hybrid machine translation
Branco et al. A suite of shallow processing tools for portuguese: Lx-suite
Torjmen et al. Construction of morphological grammars for the Tunisian dialect
Nguyen et al. A tree-to-string phrase-based model for statistical machine translation
KR101092361B1 (en) Paginal translation adverb creation apparatus and its method
Ljunglöf et al. A bilingual treebank for the FraCaS test suite
Virk et al. Developing an interlingual translation lexicon using WordNets and Grammatical Framework
Atrey et al. Issues in parsing and POS tagging of hybrid language
Specia A hybrid model for word sense disambiguation in English-Portuguese machine translation
Shukla et al. A Framework of Translator from English Speech to Sanskrit Text
JP2632806B2 (en) Language analyzer
Desai et al. Automated paradigm selection for FSA based Konkani verb morphological analyzer
Gavhal et al. Sentence Compression Using Natural Language Processing
KR101559657B1 (en) Method for analysis of korean dependency relation by homograph disambiguation
Laki et al. Syntax-Based Reordering in Phrase-Base English-Hungarian Statistical Machine Translation.
Singh et al. Punjabi pos tagger: Rule based and HMM
KR101638442B1 (en) Method and apparatus for segmenting chinese sentence
Grazina Automatic Speech Translation
JP4812811B2 (en) Machine translation apparatus and machine translation program
KR100333681B1 (en) Automatic translation apparatus and method using verb-based sentence frame
Rikters K-Translate-Interactive Multi-system Machine Translation
JP2011175306A (en) Information processing device

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20151127

Year of fee payment: 5