KR100311224B1 - Apparatus for determining linking information of english verbal phrase and method using the same - Google Patents
Apparatus for determining linking information of english verbal phrase and method using the same Download PDFInfo
- Publication number
- KR100311224B1 KR100311224B1 KR1019990061885A KR19990061885A KR100311224B1 KR 100311224 B1 KR100311224 B1 KR 100311224B1 KR 1019990061885 A KR1019990061885 A KR 1019990061885A KR 19990061885 A KR19990061885 A KR 19990061885A KR 100311224 B1 KR100311224 B1 KR 100311224B1
- Authority
- KR
- South Korea
- Prior art keywords
- connection
- connection pattern
- information
- english
- korean
- Prior art date
Links
- 238000000034 method Methods 0.000 title claims abstract description 18
- 230000001755 vocal effect Effects 0.000 title description 2
- 230000006870 function Effects 0.000 claims description 28
- 238000004458 analytical method Methods 0.000 claims description 17
- 238000013519 translation Methods 0.000 claims description 16
- 230000000877 morphologic effect Effects 0.000 claims description 7
- 238000007670 refining Methods 0.000 claims description 4
- 238000012937 correction Methods 0.000 claims description 3
- 238000000605 extraction Methods 0.000 claims description 3
- 238000012916 structural analysis Methods 0.000 claims description 2
- 230000014616 translation Effects 0.000 description 12
- 238000010586 diagram Methods 0.000 description 4
- 238000007796 conventional method Methods 0.000 description 2
- 239000000284 extract Substances 0.000 description 2
- 238000012545 processing Methods 0.000 description 2
- 230000000694 effects Effects 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/40—Processing or translation of natural language
- G06F40/42—Data-driven translation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/268—Morphological analysis
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Artificial Intelligence (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Computational Linguistics (AREA)
- General Health & Medical Sciences (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Machine Translation (AREA)
Abstract
본 발명은 영어 용언구의 연결정보 결정 장치 및 그 방법에 관한 것으로, 한국어 문장의 구문구조 정보를 이용하여 모든 용언구의 조합들을 추출하는 제 1 단계; 상기 추출된 용언구의 연결관계 조합에 대하여 연결패턴 리스트를 추출하는 제 2 단계; 상기 추출된 연결패턴이 한국어 연결패턴 조건을 만족하는가를 판단하는 제 3 단계; 상기 제 3 단계의 판단결과에 따라, 상기 연결패턴 데이터베이스에서 기본 연결패턴을 선택하는 제 4 단계; 상기 제 3 단계의 판단결과에 따라, 해당 연결 패턴을 선택하는 제 5 단계; 상기 추출된 모든 연결관계 조합에 대하여 적용할 연결 패턴이 모두 선택되었는지를 판단하는 제 6 단계; 상기 제 6 단계의 판단결과에 따라, 연결패턴 집합 선택기가 선택된 연결 패턴들의 리스트 중에서 영어 접속 정보를 모두 제공할 수 있는 가장 적합한 연결 패턴의 집합을 결정하는 제 7 단계; 상기 제 6 단계의 판단결과에 따라, 상기 제 2 단계로 넘어가는 제 8 단계; 및 영어 생성정보 반영기에서 상기 연결 패턴 집합의 연결 정보를 이용하여 영어 용언구의 접속 정보 및 생성 정보를 제공하는 제 9 단계를 포함하며, 한영 자동번역 시스템 등에 이용됨.The present invention relates to an apparatus and method for determining connection information of English phrases, comprising: a first step of extracting combinations of all phrases using syntax structure information of a Korean sentence; A second step of extracting a connection pattern list for the connection relationship combination of the extracted terms; A third step of determining whether the extracted connection pattern satisfies a Korean connection pattern condition; A fourth step of selecting a basic connection pattern from the connection pattern database according to the determination result of the third step; A fifth step of selecting a corresponding connection pattern according to the determination result of the third step; A sixth step of determining whether all connection patterns to be applied are selected for all of the extracted connection relationship combinations; A seventh step of determining, based on the determination result of the sixth step, the connection pattern set selector to determine the most suitable connection pattern set capable of providing all of the English connection information from the list of selected connection patterns; An eighth step of moving to the second step according to the determination result of the sixth step; And a ninth step of providing connection information and generation information of an English terminology using the connection information of the connection pattern set in the English generation information reflector.
Description
본 발명은 한국어 문장을 영어 문장으로 번역하는 장치 및 그 방법에 관한 것으로, 특히 연결패턴을 이용하여 한국어 용언구를 연결하는 연결어미에 대응하는 영어 접속사를 선택하고, 한국어 용언구에 대응하여 번역될 영어 용언구들에 대한 순서정보 및 영어 생성정보를 제공하기 위한 영어 용언구의 연결정보 결정 장치 및 그 방법과 상기 방법을 실현시키기 위한 프로그램을 기록한 컴퓨터로 읽을 수 있는 기록매체에 관한 것이다.The present invention relates to an apparatus for translating a Korean sentence into an English sentence and a method thereof, and in particular, to select an English conjunction corresponding to a connecting ending connecting a Korean terminology using a connection pattern, and to be translated in correspondence with the Korean terminology. An apparatus for determining connection information of an English vocabulary for providing order information and English generating information about English phrases, and a method thereof and a computer-readable recording medium recording a program for realizing the method.
일반적으로, 하나의 문장은 구문구조 규칙에 의해 생성되며, 모든 모국어 화자(話者)는 접속사를 이용하여 문장을 확장하는 능력을 갖고 있다.In general, one sentence is generated by syntax rules, and all native speakers have the ability to extend sentences using conjunctions.
따라서, 한영 자동번영 시스템에서 번역하고자 하는 한국어 문장의 상당수는 용언구(verbal phrase)의 접속구조를 가지고 있다.Therefore, a large number of Korean sentences to be translated in the Han-Young auto-prosperity system have a connection structure of verbal phrases.
한국어는 굴절어의 특징을 가지고 있기 때문에, 용언의 연결어미를 이용하여 각 용언구가 연결된다. 따라서, 용언구 단위로 번역을 수행하는 한영 자동번역 시스템에서는 각 한국어 용언구에 대응하는 영어 용언구의 번역결과를 의미적으로 올바르게 연결하기 위하여 한국어의 연결어미에 대응하는 적절한 영어 접속사를 선택하여 이들을 연결하고, 용언구들간의 상대 순서를 결정하여, 영어 용언구 생성에 필요한 정보를 제공함으로써, 완전한 영어 문장을 생성하게 된다.Since Korean has the characteristics of refractions, each phrase is connected using the connecting ending of the word. Therefore, in the English-Korean automatic translation system that performs translations in the unit of phrases, in order to semantically correctly translate the translation results of the English phrases corresponding to each Korean phrase, a proper English conjunction corresponding to the Korean ending is connected. In addition, by determining the relative order between the phrases, by providing the information necessary to generate the English phrases, complete English sentences are generated.
또한, 한국어는 그 연결어미의 종류가 매우 다양할 뿐만 아니라, 하나의 연결어미는 하나 이상의 의미를 가지고 문장들을 연결하는 역할을 수행하므로, 용언구들간의 의미 파악이 제대로 이루어지지 않은 상황에서는 연결어미에 대응하는 적절한 영어 접속사의 선택이 불가능하다.In addition, Korean has not only a variety of connection endings, but a connection ending plays a role in connecting sentences with one or more meanings. The selection of the appropriate English conjunction is not possible.
종래의 영어 용언구 연결정보 결정 방법은, 하나의 한국어 연결어미가 가지는 다양한 쓰임에 대한 특별한 처리를 하지 않은 채, 일부 숙어적 표현에 한하여 한국어 연결어미에 대한 영어 접속사 정보를 결정하고, 그 외의 경우에는 각 연결어미에 대하여 가장 대표적인 영어 접속사를 번역정보로 이용하여 영어 용언구의 연결을 수행한다.In the conventional method of determining connection information of English idioms, the English connection information for Korean connection endings is determined only for some idioms, without special treatment for various uses of one Korean connection ending, and in other cases For each linking ending, the most common English conjunctions are used as translation information to carry out the connection of English phrases.
그러나, 상기한 바와 같은 종래의 영어 용언구 연결정보 결정 방법은, 한국어 연결어미가 대표적 쓰임이 아닌 경우로 사용되었을 경우, 적절치 못한 영어 접속사 선택 및 영어 용언구 생성정보를 제공하게 되어, 결국 영어 문장 번역에 실패하게 되는 문제가 있다.However, the conventional method of determining the connection of English idioms as described above, when the Korean connection ending is not used as the typical usage, provides an inappropriate English conjunction selection and English idiom generation information. There is a problem that the translation fails.
따라서, 본 발명은 상기와 같은 문제점을 해결하기 위해 안출된 것으로, 한국어 용언구를 연결하는 연결어미에 대하여 연결패턴 및 올바른 연결패턴을 결정하기 위한 한국어 격틀을 이용하여 영어 용언구 연결 및 생성에 관한 번역정보를 제공할 수 있는 영어 용언구의 연결정보 결정 장치 및 그 방법과 상기 방법을 실현시키기 위한 프로그램을 기록한 컴퓨터로 읽을 수 있는 기록매체를 제공하는데 그 목적이 있다.Accordingly, the present invention has been made to solve the above problems, and relates to the connection of English phrases and generation using the Korean language frame for determining the connection pattern and the correct connection pattern for the connection endings connecting the Korean language phrases. An object of the present invention is to provide an apparatus for determining connection information of an English terminology capable of providing translation information, and a method and a computer readable recording medium storing a program for realizing the method.
도 1 은 본 발명에 따른 영어 용언구의 연결정보 결정 장치의 일실시예 구성도.1 is a configuration diagram of an embodiment of a connection information determination device of the English vocabulary according to the present invention.
도 2 는 본 발명에 따른 부분 대역문 연결기의 일실시예 상세 구성도.Figure 2 is a detailed configuration diagram of an embodiment of a partial band door connector according to the present invention.
도 3 은 본 발명에 따른 영어 용언구의 연결정보 결정 방법에 대한 일실시예 처리 흐름도.3 is a flowchart illustrating an embodiment of a method for determining connection information of an English vocabulary according to the present invention.
* 도면의 주요 부분에 대한 부호의 설명* Explanation of symbols for the main parts of the drawings
100 : 연결정보 결정 장치 101 : 형태소 분석기100: connection information determination device 101: stemmer analyzer
102 : 구분 분석기 103 : 부분 대역문 연결기102: division analyzer 103: partial band door connector
104 : 부분 대역문 생성기 105 : 대역문 정련기104: partial band gate generator 105: band gate refiner
106 : 형태소 생성기 200 : 의존관계 추출기106: stemmer generator 200: dependency extractor
201 : 연결패턴 탐색기 202 : 연결패턴 집합 선택기201: Connection Pattern Explorer 202: Connection Pattern Set Selector
203 : 영어 생성정보 반영기 204 : 연결패턴 데이터베이스203: English generated information reflector 204: connection pattern database
205 : 한국어 격틀사전205: Korean Dictionary of War
상기 목적을 달성하기 위한 본 발명의 장치는, 한영번역시스템에 적용되는 영어 용언구의 연결정보 결정 장치에 있어서, 번역하고자 하는 한국어 문장의 형태소 분석을 수행하는 형태소 분석수단; 상기 형태소 분석수단의 분석된 정보를 이용하여 용언구 단위의 구조 분석을 수행하는 구문 분석수단; 상기 구문 분석수단으로부터 한국어 문장의 구문 구조 정보를 수신하여, 연결어미를 통하여 연결 가능한 모든 용언구의 조합을 추출하는 의존관계 추출수단; 한국어 용언구의 연결패턴 및 각 연결어미에 대한 가장 많은 빈도의 영어 번역정보를 가지는 기본 연결패턴을 저장하고 있는 연결패턴 저장수단; 상기 연결패턴 저장수단에서 번역하고자 하는 한국어 문장에 적용할 연결패턴을 판단하기 위한 한국어 격틀정보 저장수단; 상기 연결패턴 저장수단 및 상기 한국어 격틀정보 저장수단을 이용하여 상기 의존관계 추출수단에서 추출된 용언구의 의존 관계 조합에 대하여 적용 가능한 연결 패턴 리스트를 추출하는 연결패턴 탐색수단; 상기 연결패턴 탐색수단에서 탐색된 연결패턴들 중 번역하고자 하는 한국어 문장의 용언구들의 연결 관계에 대한 영어 접속 정보를 모두 제공할 수 있는 가장 적합한 연결 패턴의 집합을 결정하는 연결패턴 집합 선택수단; 상기 연결패턴 집합 선택수단에서 선택된 연결패턴 집합의 연결 정보를 이용하여 한국어 용언구에 대응하는 영어 용언구의 접속 정보 및 생성 정보를 제공하는 영어 생성정보 반영수단; 상기 영어 생성정보 반역수단으로부터 수신한 각 용언구에 대한 단문 단위의 영어 번역을 수행하는 부분 대역문 생성수단; 상기 부분 대역문 생성수단으로부터 단문단위로 번역된 각 용언구에 대해 영어 문장 생성을 위한 성, 수, 시제 일치 정보 및 주어 등의 생략 성분 복원 작업 및 스타일 교정 작업을 수행하는 대역문 정련수단 및 상기 대역문 정련수단으로부터 정련된 용언구를 수신하여 영어 형태소를 생성하는 형태소 생성수단을 포함한다.An apparatus of the present invention for achieving the above object, In the apparatus for determining the connection information of the English phrases applied to the Korean-English translation system, morpheme analysis means for performing a morphological analysis of the Korean sentence to be translated; Syntactic analysis means for performing structural analysis of a phrase unit using the analyzed information of the morpheme analysis means; Dependency relationship extraction means for receiving syntax structure information of a Korean sentence from the syntax analysis means and extracting a combination of all of the phrases connectable through a connection ending; Connection pattern storage means for storing a connection pattern of Korean idioms and basic connection patterns having the most frequent English translation information for each connection ending; Korean frame information storage means for determining a connection pattern to be applied to the Korean sentence to be translated in the connection pattern storage means; Connection pattern searching means for extracting a connection pattern list applicable to the dependency relationship combinations of the phrases extracted by the dependency relationship extracting means using the connection pattern storage means and the Korean language information storage means; Connection pattern set selection means for determining a most suitable connection pattern set that can provide all of the English connection information of connection terms of Korean sentences to be translated among the connection patterns searched by the connection pattern searching means; English generation information reflecting means for providing connection information and generation information of the English language phrases corresponding to the Korean language phrases using the connection information of the connection pattern set selected by the connection pattern set selection means; Partial band sentence generation means for performing an English translation of a short sentence unit for each phrase received from the English generation information rebel means; Band sentence refining means for performing skipped component restoration work and style correction for the English sentence generation, such as sex, number, tense match information and subject for each sentence translated from the partial band sentence generation means into short sentences; and It includes a morpheme generating means for receiving the refined phrases from the band sentence refining means to generate an English morpheme.
한편, 본 발명의 방법은, 영어 용언구의 연결정보 결정 장치에 적용되는 영어 용언구의 연결정보 결정 방법에 있어서, 한국어 문장의 구문구조 정보를 이용하여 모든 용언구의 조합들을 추출하는 제 1 단계; 상기 추출된 용언구의 연결관계 조합에 대하여 연결 패턴 데이타베이스에서연결패턴 리스트를 추출하는 제 2 단계; 상기 연결패턴 리스트에서 추출된 연결패턴이 한국어 연결패턴 조건을 만족하는가를 판단하는 제 3 단계; 상기 제 3 단계의 판단결과, 한국어 연결패턴 조건을 만족하지 않으면, 상기 연결패턴 데이터베이스에서 상기 추출된 용언구에 해당하는 기본 연결패턴을 선택하는 제 4 단계; 상기 제 3 단계의 판단결과, 한국어 연결패턴 조건을 만족하면, 해당 연결 패턴을 선택하는 제 5 단계; 상기 추출된 모든 용언구들의 연결관계 조합에 대하여 적용할 연결 패턴이 모두 선택되었는지를 판단하는 제 6 단계; 상기 제 6 단계의 판단결과, 모든 용언구들의 연결관계 조합에 대하여 적용할 연결 패턴이 모두 선택되었으면, 연결패턴 집합 선택기가 선택된 연결 패턴들의 리스트 중에서 번역하고자 하는 한국어 문장의 용언구들의 연결 관계에 대한 영어 접속 정보를 모두 제공할 수 있는 가장 적합한 연결 패턴의 집합을 결정하는 제 7 단계; 상기 제 6 단계의 판단결과, 모든 용언구들의 연결관계 조합에 대하여 적용할 연결패턴이 모두 선택되지 않았으면, 상기 제 2 단계로 넘어가는 제 8 단계; 및 영어 생성정보 반영기에서 상기 선택된 연결 패턴 집합의 연결 정보를 이용하여 한국어 용언구에 대응하는 영어 용언구의 접속 정보 및 생성 정보를 제공하는 제 9 단계를 포함한다.On the other hand, the method of the present invention, the method of determining the connection information of the English language phrases applied to the apparatus for determining the connection information of the English language phrases, comprising: a first step of extracting combinations of all the phrases using the syntax structure information of the Korean sentence; Extracting a connection pattern list from a connection pattern database with respect to the connection relationship combination of the extracted phrases; A third step of determining whether a connection pattern extracted from the connection pattern list satisfies a Korean connection pattern condition; A fourth step of selecting a basic connection pattern corresponding to the extracted terminology from the connection pattern database if the Korean connection pattern condition is not satisfied as a result of the determination in the third step; A fifth step of selecting a corresponding connection pattern if the Korean connection pattern condition is satisfied as a result of the determination in the third step; A sixth step of determining whether all of the connection patterns to be applied to the connection relationship combinations of all extracted terms are selected; As a result of the determination in the sixth step, when all of the connection patterns to be applied to the connection relationship combination of all the phrases are selected, the connection pattern set selector for the connection relationship of the phrases of the Korean sentence to be translated from the list of selected connection patterns A seventh step of determining the most suitable set of connection patterns capable of providing all of the English access information; An eighth step of skipping to the second step if the connection pattern to be applied to the connection relationship combination of all the phrases is not selected as the result of the sixth step; And a ninth step of providing, in the English generation information reflector, connection information and generation information of the English language phrase corresponding to the Korean language phrase using the connection information of the selected connection pattern set.
또한, 본 발명은, 마이크로 프로세서를 구비한 영어 용언구 연결정보 결정 장치에, 한국어 문장의 구문구조 정보를 이용하여 모든 용언구의 조합들을 추출하는 제 1 기능; 상기 추출된 용언구의 연결관계 조합에 대하여 연결 패턴 데이타베이스에서 연결패턴 리스트를 추출하는 제 2 기능; 상기 연결패턴 리스트에서 추출된 연결패턴이 한국어 연결패턴 조건을 만족하는가를 판단하는 제 3 기능; 상기 제 3 기능의 판단결과, 한국어 연결패턴 조건을 만족하지 않으면, 상기 연결패턴 데이터베이스에서 상기 추출된 용언구에 해당하는 기본 연결패턴을 선택하는 제 4 기능; 상기 제 3 기능의 판단결과, 한국어 연결패턴 조건을 만족하면, 해당 연결 패턴을 선택하는 제 5 기능; 상기 추출된 모든 용언구들의 연결관계 조합에 대하여 적용할 연결 패턴이 모두 선택되었는지를 판단하는 제 6 기능; 상기 제 6 기능의 판단결과, 모든 용언구들의 연결관계 조합에 대하여 적용할 연결 패턴이 모두 선택되었으면, 연결패턴 집합 선택기가 선택된 연결 패턴들의 리스트 중에서 번역하고자 하는 한국어 문장의 용언구들의 연결 관계에 대한 영어 접속 정보를 모두 제공할 수 있는 가장 적합한 연결 패턴의 집합을 결정하는 제 7 기능; 상기 제 6 기능의 판단결과, 모든 용언구들의 연결관계 조합에 대하여 적용할 연결패턴이 모두 선택되지 않았으면, 상기 제 2 기능으로 넘어가는 제 8 기능; 및 영어 생성정보 반영기에서 상기 선택된 연결 패턴 집합의 연결 정보를 이용하여 한국어 용언구에 대응하는 영어 용언구의 접속 정보 및 생성 정보를 제공하는 제 9 기능을 실현시키기위한 프로그램을 기록한 컴퓨터로 읽을 수 있는 기록매체를 제공한다.The present invention also provides an apparatus for determining English phrase connection information having a microprocessor, comprising: a first function of extracting combinations of all phrases using syntax structure information of a Korean sentence; A second function of extracting a connection pattern list from a connection pattern database with respect to the connection relationship combination of the extracted terms; A third function of determining whether a connection pattern extracted from the connection pattern list satisfies a Korean connection pattern condition; A fourth function of selecting a basic connection pattern corresponding to the extracted terminology from the connection pattern database if it is determined that the third function does not satisfy the Korean connection pattern condition; A fifth function of selecting a corresponding connection pattern if the Korean connection pattern condition is satisfied as a result of the determination of the third function; A sixth function of determining whether all of the connection patterns to be applied are selected for the connection relationship combinations of all extracted terms; As a result of the determination of the sixth function, if all of the connection patterns to be applied to the connection relationship combination of all the phrases are selected, the connection pattern set selector for the connection relationship of the phrases of the Korean sentence to be translated from the list of selected connection patterns A seventh function of determining a set of most suitable connection patterns capable of providing all of the English connection information; An eighth function of skipping to the second function if the connection pattern to be applied to the connection relationship combination of all the phrases is not selected as a result of the determination of the sixth function; And a program for realizing a ninth function of providing connection information and generation information of an English language phrase corresponding to a Korean language phrase using the connection information of the selected connection pattern set in the English generation information reflector. Provide a record carrier.
상술한 목적, 특징들 및 장점은 첨부된 도면과 관련한 다음의 상세한 설명을 통하여 보다 분명해 질 것이다. 이하, 첨부된 도면을 참조하여 본 발명에 따른 바람직한 일실시예를 상세히 설명한다.The above objects, features and advantages will become more apparent from the following detailed description taken in conjunction with the accompanying drawings. Hereinafter, exemplary embodiments of the present invention will be described in detail with reference to the accompanying drawings.
도 1 은 본 발명에 따른 영어 용언구의 연결정보 결정 장치의 일실시예 구성도이다.1 is a configuration diagram of an embodiment of the apparatus for determining connection information of an English vocabulary according to the present invention.
도면에 도시된 바와 같이, 본 발명에 따른 영어 용언구의 연결정보 결정 장치는, 번역하고자 하는 한국어 문장의 형태소 분석을 수행하는 형태소 분석기(101)와, 상기 형태소 분석기(100)의 분석된 정보를 이용하여 용언구 단위의 구조 분석을 수행하는 구문 분석기(102)와, 상기 분석된 한국어 구문 정보를 이용하여 각 용언구들간의 연결 관계를 결정하고 영어 접속사의 선택 및 번역될 용언구들간의 어순을 결정하며 생성 정보를 제공하는 부분 대역문 연결기(103)와, 각 용언구에 대한 단문 단위의 영어 번역을 수행하는 부분 대역문 생성기(104)와, 영어 문장 생성을 위한 성, 수, 시제 일치 정보 및 주어 등의 생략 성분 복원 작업 및 스타일 교정 작업을 수행하는 대역문 정련기(105)와, 영어 형태소를 생성하는 형태소 생성기(106)를 포함한다.As shown in the drawing, the apparatus for determining connection information of an English terminology according to the present invention uses a morpheme analyzer 101 for performing a morphological analysis of a Korean sentence to be translated and analyzed information of the morpheme analyzer 100. By using the parser 102 to analyze the structure of the phrase phrase unit, and using the analyzed Korean syntax information to determine the connection relationship between each phrase, the selection of English conjunctions and the word order between the phrases to be translated and generated A partial band sentence connector 103 for providing information, a partial band sentence generator 104 for translating a short sentence unit of English for each phrase, a gender, number, tense match information and subject for generating an English sentence, etc. A band sentence refiner 105 for performing an abbreviated component restoration operation and a style correction operation, and a morpheme generator 106 for generating an English morpheme.
첨부된 도 2 는 본 발명에 따른 부분 대역문 연결기(103)의 일실시예 상세 구성도이다.2 is a detailed block diagram of an embodiment of a partial band connector (103) according to the present invention.
도면에 도시된 바와 같이, 본 발명이 적용되는 부분 대역문 연결기(103)는, 한국어 문장의 구문 구조 정보로부터 연결패턴을 이용하여 연결 가능한 용언구들의의존 관계의 조합, 즉 연결어미를 통하여 연결 가능한 모든 용언구의 조합을 추출하는 의존관계 추출기(200)와, 연결패턴 데이터베이스(204)와 한국어 격틀사전(205)을 이용하여 상기 의존관계 추출기(200)에서 추출된 용언구의 의존 관계 조합에 대하여 적용 가능한 연결 패턴 리스트를 추출하는 연결패턴 탐색기(201)와, 상기 연결패턴 탐색기(201)에서 탐색된 연결패턴들 중 번역하고자 하는 한국어 문장의 용언구들의 연결 관계에 대한 영어 접속 정보를 모두 제공할 수 있는 가장 적합한 연결 패턴의 집합을 결정하는 연결패턴 집합 선택기(202)와, 상기 연결패턴 집합 선택기(202)에서 선택된 연결패턴 집합의 연결 정보를 이용하여 한국어 용언구에 대응하는 영어 용언구의 접속 정보 및 생성 정보를 제공하는 영어 생성 정보 반영기(203)와, 한국어 용언구의 연결패턴 및 각 연결어미에 대한 가장 많은 빈도의 영어 번역정보를 가지는 기본 연결패턴을 저장하고 있는 연결패턴 데이터베이스(204)와, 상기 연결패턴 데이터페이스(204)에서 번역하고자 하는 한국어 문장에 적용할 연결패턴을 판단하기 위한 한국어 격틀사전(205)을 포함한다.As shown in the drawings, the partial band sentence connector 103 to which the present invention is applied is a combination of dependency relations of idioms that can be connected using a connection pattern from syntax structure information of a Korean sentence, that is, connectable through a connection ending. Applicable to the dependency extractor 200 extracted from the dependency extractor 200 using the dependency extractor 200 that extracts a combination of all phrases, and the connection pattern database 204 and the Korean dictionary dictionary 205. The connection pattern explorer 201 extracting the connection pattern list and the English connection information for the connection relations of the phrases of the Korean sentence to be translated among the connection patterns found in the connection pattern explorer 201 can be provided. A connection pattern set selector 202 for determining a set of the most suitable connection patterns, and a connection pattern selected by the connection pattern set selector 202. English generation information reflector 203 which provides access information and generation information of English idioms corresponding to Korean idioms using a set of connection information, and a connection pattern of Korean idioms and the most frequent English for each connection ending. A connection pattern database 204 storing a basic connection pattern having translation information, and a Korean dictionary dictionary 205 for determining a connection pattern to be applied to a Korean sentence to be translated in the connection pattern database 204. do.
영어문장으로 번역하고자 하는 한국어 문장에서 각 용언구를 연결하는 연결어미에 대하여 해당 연결어미의 다양한 쓰임새 중 어떤 역할로 사용되었는지를 판단하기 위하여 연결어미로 연결된 다수의 용언구의 의미를 파악해야 한다.In order to determine which role is used among the various usages of the linking ending, the meaning of a plurality of linking endings should be understood.
예를 들어, '나는 그 소식을 듣고 매우 놀라고 슬펐다'라는 문장을 번역할 때, 상기 문장은 3개의 용언구로 구성되어 있으며, 연결어미 '고'로 연결되어 있다. 그러나, '듣고'의 '고'와 '놀라고'의 '고'는 동일한 형태의 연결어미 '고'로용언구가 연결되어 있으나, 그 쓰임은 서로 다르다. 즉, '듣고'의 '고'는 이유를 나타내는 연결어미로 사용되었으므로, 영어 문장에서 'to 부정사' 또는 'because'등을 사용하나, '놀라고'의 '고'는 대등 연결을 뜻하는 연결어미로 사용되어, 영어 문장에서 'and'와 같은 접속사로 연결되어야 한다.For example, when translating the sentence "I was very surprised and sad to hear the news," the sentence consists of three idioms, which are connected by the linking word 'Go'. However, the word 'go' in 'listening' and 'go' in 'to be surprised' are connected in the same form as the term 'go', but its usage is different. In other words, 'high' in 'listening' is used as a linking ending indicating a reason, so 'to infinitive' or 'because' is used in the English sentence, but 'high' in 'playing' is a connecting ending meaning equal connection. In conjunction with a conjunction such as 'and' in an English sentence.
이와 같이, 동일한 어형의 연결어미 '고'의 쓰임이 서로 다른 이유는, 해당 연결어미가 연결하는 문장의 의미가 어떻게 연결되어 있는지에 따라 결정된다.As such, the reason why the use of the link word 'Go' of the same word is different is determined by how the meanings of the sentences connected by the link word are connected.
연결패턴은, 연결어미로 연결된 둘 이상의 한국어 용언구에 대하여 각 용언구의 영어 대역문을 연결하는 접속사를 결정할 수 있는 범위내의 2개 이상의 용언구들을 대상으로 각 용언에 해당하는 격틀정보 및 영어 접속사 정보를 중심으로 기술되며, 용언의 연결에 사용된 영어 접속사 정보, 용언들간의 어순 정보 및 각 용언구의 영어 생성정보를 제공한다.The linking pattern is for the two or more idioms within the range that can determine the conjunctions connecting the English bands of each idiom for two or more Korean idioms connected by a connecting ending, and the information related to each verb and the English conjunction information It is described in terms of, and provides information on English conjunctions used in connection of words, word order information between words, and English generation information of each word phrase.
또한, 연결패턴은, 해당 연결패턴을 적용할 수 있는 조건을 기술하는 한국어 연결패턴 부분과 영어 번역정보를 제공하는 영어 연결패턴 부분으로 나뉘어진다.In addition, the connection pattern is divided into a Korean connection pattern portion describing the conditions under which the connection pattern can be applied, and an English connection pattern portion providing English translation information.
상기 한국어 연결패턴 부분은, 괄호를 이용하여 용언구들간의 의존 관계를 기술하며, 각 용언구에 대하여 용언구의 인덱스와 용언구에 대응하는 격틀의 인식자, 용언구의 연결어미 정보로 이루어진다.The Korean connection pattern portion describes dependency relations between idioms using parentheses, and includes indexes of idioms for each idiom, identifiers of the frames corresponding to the idioms, and connection ending information of idioms.
그리고, 상기 영어 연결패턴 부분은, 각 한국어 용언구에서 기술된 용언구의 인덱스로 대응하는 영어 용언구를 기술한다. 이 때, 영어 연결패턴 부분에는 괄호 정보로 용언구들간의 의존 관계를 기술하지 않으며, 영어 문장에서 영어 용언구가 나타나는 순서대로 영어 연결패턴에 나타난다.And, the English connection pattern portion describes the English idiom corresponding to the index of the idiom described in each Korean idiom. In this case, the dependency relationship between the phrases is not described in parentheses information in the English connection pattern portion, but appears in the English connection pattern in the order in which the English phrases appear in the English sentence.
연결패턴은 연결 어미에 대한 연결 정보 이외에도, 고정 표현을 기술하는 데도 동일한 방법으로 적용되어, 고정 표현의 처리와 연결어미의 처리를 동시에 수행할 수 있다.The connection pattern is applied in the same manner to describe the fixed expression in addition to the connection information on the connection mother, so that the processing of the fixed expression and the processing of the connection mother can be performed simultaneously.
'용언구1+연결어미1 용언구2'의 형태로 연결된 경우에, 연결어미1에 해당하는 올바른 접속사 선택을 위해 사용된 연결패턴의 형태는 다음과 같으며, 이는 n(2개 이상)개의 용언구로 확장될 수 있다.When connected in the form of 'phrase 1 + connective terminal 1 terminology 2', the form of the connection pattern used to select the correct conjunction corresponding to the connecting terminal 1 is as follows. Can be extended to verbs.
( (용언구1의 인덱스:격틀인덱스,연결어미정보) 용언구2의 인덱스:격틀인덱스)(Index of Phrase 1: Index Index, Linked End Information) Index of Phrase 2: Index Index)
=> [용언구1의 인덱스:생성정보] [접속사 정보] [용언구2의 인덱스:생성정보]=> [Index: generated information of phrase 1] [junk information] [index: generated information of phrase 2]
이제, 첨부된 도 3 을 참조하여 본 발명에 따른 영어 용언구의 연결정보 결정 방법에 대해 상세히 설명하면 다음과 같다.Now, with reference to the accompanying Figure 3 will be described in detail with respect to the method of determining the connection information of the English vocabulary according to the present invention.
첨부된 도 3 은 본 발명에 따른 영어 용언구의 연결정보 결정 방법에 대한 일실시예 처리 흐름도이다.3 is a flowchart illustrating an embodiment of a method for determining connection information of an English terminology according to the present invention.
먼저, 입력된 한국어 문장에 대해 형태소 분석 및 구문분석을 수행하고(300), 의존 관계 추출기(200)를 통하여 번역하고자 하는 한국어 문장의 구문 구조 정보로부터 연결패턴을 이용하여 연결 가능한 용언구들의 의존 관계의 조합, 즉 연결어미를 통하여 연결 가능한 모든 용언구의 조합을 추출한다(302).First, the morphological analysis and syntax analysis are performed on the input Korean sentence (300), and the dependency relations of the phrases that can be connected using the connection pattern from the syntax structure information of the Korean sentence to be translated through the dependency extractor 200. Combination of, that is, the combination of all the phrases that can be connected through the connection ending is extracted (302).
다음으로, 연결 패턴 탐색기(201)를 통하여 추출된 용언구의 의존 관계 조합에 대하여 적합한 연결 패턴이 연결패턴 데이터베이스(204)내에 있는지를 한국어 격틀사전(205)을 이용하여 조사하고, 적용가능한 연결패턴 리스트를 추출한 후(304), 연결패턴 리스트의 각 연결패턴에 대해 해당 연결패턴이 한국어 연결패턴조건을 만족하는지를 판단한다(306).Next, using the Korean dictionary dictionary 205, it is checked whether or not a suitable connection pattern exists in the connection pattern database 204 for the dependency combination of the phrases extracted through the connection pattern explorer 201, and the applicable connection pattern list After extraction (304), it is determined whether the corresponding connection pattern satisfies the Korean connection pattern condition for each connection pattern in the connection pattern list (306).
상기 판단결과(306), 한국어 연결패턴 조건을 만족하지 않으면, 상기 연결패턴 데이터베이스(204)에서 기본 연결 패턴을 선택하고(308), 한국어 연결패턴 조건을 만족하면, 해당 연결패턴을 선택한다(310).If the determination result 306 does not satisfy the Korean connection pattern condition, the basic connection pattern is selected from the connection pattern database 204 (308). If the Korean connection pattern condition is satisfied, the corresponding connection pattern is selected (310). ).
상기 추출된 모든 용언구들의 연결관계 조합에 대하여 적용할 연결 패턴이 모두 선택되었는지를 판단한다(312).In operation 312, it is determined whether all of the connection patterns to be applied to the connection relationship combinations of the extracted terms are selected.
상기 판단결과(312), 모든 용언구들의 연결관계 조합에 대하여 적용할 연결 패턴이 모두 선택되었으면, 연결패턴 집합 선택기(202)가 선택된 연결 패턴들의 리스트 중에서 번역하고자 하는 한국어 문장의 용언구들의 연결 관계에 대한 영어 접속 정보를 모두 제공할 수 있는 가장 적합한 연결 패턴의 집합을 결정한다(314).As a result of the determination 312, when all the connection patterns to be applied to the connection relationship combination of all the phrases are selected, the connection pattern set selector 202 connects the relationship of the phrases of the Korean sentence to be translated from the list of the selected connection patterns. A set of most suitable connection patterns capable of providing all of the English access information for is determined (314).
상기 판단결과(312), 모든 용언구들의 연결관계 조합에 대하여 적용할 연결패턴이 모두 선택되지 않았으면, 상기 적용가능한 연결패턴 리스트를 추출하는 과정(304)을 수행한다.As a result of the determination 312, if all the connection patterns to be applied to the connection relationship combination of all the phrases are not selected, the process of extracting the applicable connection pattern list 304 is performed.
마지막으로, 영어 생성정보 반영기(203)에서 선택된 연결 패턴 집합의 연결 정보를 이용하여 한국어 용언구에 대응하는 영어 용언구의 접속 정보 및 생성 정보를 제공한다(316). 이때, 번역할 한국어 문장이 둘 이상의 연결 패턴으로 연결되는 경우는 한국어 용언구의 의존 관계 정보와 문장에서 용언구의 상대 순서 정보 등을 이용하여 최종적인 영어 용언구들간의 생성 정보를 결정한다.Finally, the connection information and generation information of the English language phrase corresponding to the Korean language phrase is provided using the connection information of the connection pattern set selected by the English generation information reflector 203 (316). In this case, when the Korean sentences to be translated are connected by two or more connection patterns, final information about the final production of English phrases is determined by using dependency information of Korean phrases and relative order information of phrases in a sentence.
'나는 그 소식을 듣고 매우 놀라고 슬펐다'라는 예문에서 영어 용언구 연결 정보를 결정하기 위하여 사용되는 연결 패턴은,In the example sentence `` I was very surprised and sad to hear the news, '' the connection pattern used to determine the connection of English idioms,
( ( [VP1:격틀1] [고] ) [VP2:격틀2] ) => [VP1] [and:대등] [VP2](([VP1: Frame1] [High]) [VP2: Frame2]) => [VP1] [and: Equal] [VP2]
( ( [VP1:격틀2] [고] ) [VP2:격틀3] ) => [VP2] [to:이유] [VP2:INF]와 같고, 사용할 연결 패턴을 결정하기 위한 격틀 정보는,(([VP1: Frame2] [High]) [VP2: Frame3]) => [VP2] [to: Reason] Same as [VP2: INF], and the frame information for determining the connection pattern to use is
격틀1 ['듣다' : '사람'-주어 '소식'-목적어]Battle 1 ['Listen': 'People'-Give' News'-Objects]
격틀2 ['놀라다' : '사람'-주어]Battle 2 ['Amazing': 'People'-Giving]
격틀3 ['슬프다' : '사람'-주어]와 같다.Same as Battle 3 ['Sad': 'People')
상기 예문 '나는 그 소식을 듣고 매우 놀라고 슬펐다'에 대하여, 상기 구문 분석기(102)가 구문 분석을 통하여 용언구 단위의 구조 분석을 수행하여 '(나는 (그 소식을 듣고) (매우 놀라고) 슬펐다)'와 같은 형태의 의존 구조를 제공하면, 상기 부분 대역문 연결기(103)는 상기 구문구조 정보로부터 모두 가능한 용언구들간의 연결 관계의 조합을 추출한 후, 추출된 용언구 연결 관계의 후보와 상기 연결패턴 데이터베이스(204)내에 있는 연결패턴들 중 연결패턴의 한국어 용언구의 조건부가 일치하는 연결 패턴이 있는가를 조사하고, 일치하는 연결패턴들 중에서 한국어 문장 전체를 연결할 수 있는 최적의 연결패턴들을 선택한다.Regarding the example sentence 'I was very surprised and sad to hear the news', the parser 102 performed a syntax analysis of the phrase unit through the syntax analysis (' (I was very surprised and sad)). When the dependency structure of the form is provided, the partial band sentence connector 103 extracts a combination of connection relations among all possible phrases from the syntax structure information, and then the candidate of the extracted phrase connection relation and the connection pattern. Among the connection patterns in the database 204, it is checked whether there is a connection pattern that matches the conditional terms of the Korean terminology of the connection pattern, and selects the optimal connection patterns capable of connecting the entire Korean sentence among the matching connection patterns.
마지막으로, 각 연결패턴의 영어 생성 정보를 올바른 접속사를 선택하고, 영어 생성정보를 제공함으로써, 번역될 영어문장이 ' [나는 슬프다] and [놀라다] to [그 소식을 듣다]'의 형태가 됨을 결정하는 것이다.Finally, by selecting the correct conjunctions and providing the English generation information for each connection pattern, the English sentence to be translated becomes '[I'm sad] and [surprise] to [heard the news]'. To decide.
이상에서 설명한 본 발명은, 본 발명이 속하는 기술분야에서 통상의 지식을 가진 자에 있어 본 발명의 기술적 사상을 벗어나지 않는 범위 내에서 여러 가지 치환, 변형 및 변경이 가능하므로 전술한 실시예 및 첨부된 도면에 한정되는 것이 아니다.The present invention described above is capable of various substitutions, modifications, and changes without departing from the spirit of the present invention for those skilled in the art to which the present invention pertains. It is not limited to the drawing.
상기와 같은 본 발명은, 한국어 용언구를 연결하는 연결어미에 대하여 연결패턴 및 올바른 연결패턴을 결정하기 위한 한국어 격틀을 이용하여 영어 용언구 연결 및 생성에 관한 번역정보를 제공함으로써, 한국어 연결어미의 역할에 맞는 올바른 영어 접속사를 선택하여 올바른 용언구 단위 영어문장을 생성할 수 있는 효과가 있다.The present invention as described above, by providing the translation information about the connection and generation of English idioms using a Korean pattern for determining the connection pattern and the correct connection pattern for the connection endings connecting the Korean language phrases, By selecting the correct English conjunction for the role, it has the effect of generating the correct phrase-level English sentence.
Claims (6)
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1019990061885A KR100311224B1 (en) | 1999-12-24 | 1999-12-24 | Apparatus for determining linking information of english verbal phrase and method using the same |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1019990061885A KR100311224B1 (en) | 1999-12-24 | 1999-12-24 | Apparatus for determining linking information of english verbal phrase and method using the same |
Publications (2)
Publication Number | Publication Date |
---|---|
KR20010063791A KR20010063791A (en) | 2001-07-09 |
KR100311224B1 true KR100311224B1 (en) | 2001-10-12 |
Family
ID=19629448
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1019990061885A KR100311224B1 (en) | 1999-12-24 | 1999-12-24 | Apparatus for determining linking information of english verbal phrase and method using the same |
Country Status (1)
Country | Link |
---|---|
KR (1) | KR100311224B1 (en) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR101092363B1 (en) | 2008-12-22 | 2011-12-09 | 한국전자통신연구원 | Method for generating korean connectives in chinese-korean machine translation and its apparatus |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR100559473B1 (en) * | 2003-12-24 | 2006-03-10 | 한국전자통신연구원 | Style Translation Processing System and Method |
KR100725723B1 (en) * | 2005-12-09 | 2007-06-08 | 한국전자통신연구원 | Method and Device for Restoring Omitted Component of Korean Subject Using Constraints |
KR101117427B1 (en) * | 2009-02-26 | 2012-03-13 | 고려대학교 산학협력단 | Morphological Composition Device And Method Thereof |
-
1999
- 1999-12-24 KR KR1019990061885A patent/KR100311224B1/en not_active IP Right Cessation
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR101092363B1 (en) | 2008-12-22 | 2011-12-09 | 한국전자통신연구원 | Method for generating korean connectives in chinese-korean machine translation and its apparatus |
Also Published As
Publication number | Publication date |
---|---|
KR20010063791A (en) | 2001-07-09 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR100542755B1 (en) | Hybrid automatic translation device and method combining rule-based method and translation pattern method, and computer-readable recording medium recording the program | |
US5890103A (en) | Method and apparatus for improved tokenization of natural language text | |
JP4694121B2 (en) | Statistical method and apparatus for learning translation relationships between phrases | |
US6862566B2 (en) | Method and apparatus for converting an expression using key words | |
KR100530154B1 (en) | Method and Apparatus for developing a transfer dictionary used in transfer-based machine translation system | |
US20070233460A1 (en) | Computer-Implemented Method for Use in a Translation System | |
WO1997004405A9 (en) | Method and apparatus for automated search and retrieval processing | |
Ritchie et al. | How to find better index terms through citations | |
Schwenk et al. | Translation model adaptation for an Arabic/French news translation system by lightly-supervised training | |
Grishman | Iterative alignment of syntactic structures for a bilingual corpus | |
KR100311224B1 (en) | Apparatus for determining linking information of english verbal phrase and method using the same | |
US20090216522A1 (en) | Apparatus, method, and computer program product for determing parts-of-speech in chinese | |
Messiant | A subcategorization acquisition system for French verbs | |
KR101755437B1 (en) | Method for machine-translating Korean into other languages by using Lexico Semantic Pattern | |
JP4007413B2 (en) | Natural language processing system, natural language processing method, and computer program | |
JP3326646B2 (en) | Dictionary / rule learning device for machine translation system | |
KR101753708B1 (en) | Apparatus and method for extracting noun-phrase translation pairs of statistical machine translation | |
KR20010057763A (en) | Device and method for generating translated sentences based on partial translation patterns | |
KR100286649B1 (en) | Method for converting vocabulary based on collocational pattern | |
KR20200066009A (en) | Information processing system using Korean parcing | |
KR100204068B1 (en) | How to Automatically Correct the Syntax of Concept-Based Multilingual Translation System | |
KR100371135B1 (en) | Declinable-word morphology analyzing apparatus using a declinable-word derivative-dictionary and method therefor | |
JP3388393B2 (en) | Translation device for tense, aspect or modality using database | |
JPH02208775A (en) | Machine translation system | |
KR20130026717A (en) | Translation apparatus and method based on simultaneous processing pattern |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A201 | Request for examination | ||
PA0109 | Patent application |
Patent event code: PA01091R01D Comment text: Patent Application Patent event date: 19991224 |
|
PA0201 | Request for examination | ||
PG1501 | Laying open of application | ||
E701 | Decision to grant or registration of patent right | ||
PE0701 | Decision of registration |
Patent event code: PE07011S01D Comment text: Decision to Grant Registration Patent event date: 20010913 |
|
GRNT | Written decision to grant | ||
PR0701 | Registration of establishment |
Comment text: Registration of Establishment Patent event date: 20010924 Patent event code: PR07011E01D |
|
PR1002 | Payment of registration fee |
Payment date: 20010925 End annual number: 3 Start annual number: 1 |
|
PG1601 | Publication of registration | ||
PR1001 | Payment of annual fee |
Payment date: 20040831 Start annual number: 4 End annual number: 4 |
|
PR1001 | Payment of annual fee |
Payment date: 20050831 Start annual number: 5 End annual number: 5 |
|
PR1001 | Payment of annual fee |
Payment date: 20060830 Start annual number: 6 End annual number: 6 |
|
FPAY | Annual fee payment |
Payment date: 20070831 Year of fee payment: 7 |
|
PR1001 | Payment of annual fee |
Payment date: 20070831 Start annual number: 7 End annual number: 7 |
|
LAPS | Lapse due to unpaid annual fee | ||
PC1903 | Unpaid annual fee |