KR20010063791A - 영어 용언구의 연결정보 결정 장치 및 그 방법 - Google Patents
영어 용언구의 연결정보 결정 장치 및 그 방법 Download PDFInfo
- Publication number
- KR20010063791A KR20010063791A KR1019990061885A KR19990061885A KR20010063791A KR 20010063791 A KR20010063791 A KR 20010063791A KR 1019990061885 A KR1019990061885 A KR 1019990061885A KR 19990061885 A KR19990061885 A KR 19990061885A KR 20010063791 A KR20010063791 A KR 20010063791A
- Authority
- KR
- South Korea
- Prior art keywords
- connection
- information
- english
- connection pattern
- korean
- Prior art date
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/40—Processing or translation of natural language
- G06F40/42—Data-driven translation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/268—Morphological analysis
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Artificial Intelligence (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Computational Linguistics (AREA)
- General Health & Medical Sciences (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Machine Translation (AREA)
Abstract
본 발명은 영어 용언구의 연결정보 결정 장치 및 그 방법에 관한 것으로, 한국어 문장의 구문구조 정보를 이용하여 모든 용언구의 조합들을 추출하는 제 1 단계; 상기 추출된 용언구의 연결관계 조합에 대하여 연결패턴 리스트를 추출하는 제 2 단계; 상기 추출된 연결패턴이 한국어 연결패턴 조건을 만족하는가를 판단하는 제 3 단계; 상기 제 3 단계의 판단결과에 따라, 상기 연결패턴 데이터베이스에서 기본 연결패턴을 선택하는 제 4 단계; 상기 제 3 단계의 판단결과에 따라, 해당 연결 패턴을 선택하는 제 5 단계; 상기 추출된 모든 연결관계 조합에 대하여 적용할 연결 패턴이 모두 선택되었는지를 판단하는 제 6 단계; 상기 제 6 단계의 판단결과에 따라, 연결패턴 집합 선택기가 선택된 연결 패턴들의 리스트 중에서 영어 접속 정보를 모두 제공할 수 있는 가장 적합한 연결 패턴의 집합을 결정하는 제 7 단계; 상기 제 6 단계의 판단결과에 따라, 상기 제 2 단계로 넘어가는 제 8 단계; 및 영어 생성정보 반영기에서 상기 연결 패턴 집합의 연결 정보를 이용하여 영어 용언구의 접속 정보 및 생성 정보를 제공하는 제 9 단계를 포함하며, 한영 자동번역 시스템 등에 이용됨.
Description
본 발명은 한국어 문장을 영어 문장으로 번역하는 장치 및 그 방법에 관한 것으로, 특히 연결패턴을 이용하여 한국어 용언구를 연결하는 연결어미에 대응하는 영어 접속사를 선택하고, 한국어 용언구에 대응하여 번역될 영어 용언구들에 대한 순서정보 및 영어 생성정보를 제공하기 위한 영어 용언구의 연결정보 결정 장치 및 그 방법과 상기 방법을 실현시키기 위한 프로그램을 기록한 컴퓨터로 읽을 수 있는 기록매체에 관한 것이다.
일반적으로, 하나의 문장은 구문구조 규칙에 의해 생성되며, 모든 모국어 화자(話者)는 접속사를 이용하여 문장을 확장하는 능력을 갖고 있다.
따라서, 한영 자동번영 시스템에서 번역하고자 하는 한국어 문장의 상당수는 용언구(verbal phrase)의 접속구조를 가지고 있다.
한국어는 굴절어의 특징을 가지고 있기 때문에, 용언의 연결어미를 이용하여 각 용언구가 연결된다. 따라서, 용언구 단위로 번역을 수행하는 한영 자동번역 시스템에서는 각 한국어 용언구에 대응하는 영어 용언구의 번역결과를 의미적으로 올바르게 연결하기 위하여 한국어의 연결어미에 대응하는 적절한 영어 접속사를 선택하여 이들을 연결하고, 용언구들간의 상대 순서를 결정하여, 영어 용언구 생성에 필요한 정보를 제공함으로써, 완전한 영어 문장을 생성하게 된다.
또한, 한국어는 그 연결어미의 종류가 매우 다양할 뿐만 아니라, 하나의 연결어미는 하나 이상의 의미를 가지고 문장들을 연결하는 역할을 수행하므로, 용언구들간의 의미 파악이 제대로 이루어지지 않은 상황에서는 연결어미에 대응하는 적절한 영어 접속사의 선택이 불가능하다.
종래의 영어 용언구 연결정보 결정 방법은, 하나의 한국어 연결어미가 가지는 다양한 쓰임에 대한 특별한 처리를 하지 않은 채, 일부 숙어적 표현에 한하여 한국어 연결어미에 대한 영어 접속사 정보를 결정하고, 그 외의 경우에는 각 연결어미에 대하여 가장 대표적인 영어 접속사를 번역정보로 이용하여 영어 용언구의 연결을 수행한다.
그러나, 상기한 바와 같은 종래의 영어 용언구 연결정보 결정 방법은, 한국어 연결어미가 대표적 쓰임이 아닌 경우로 사용되었을 경우, 적절치 못한 영어 접속사 선택 및 영어 용언구 생성정보를 제공하게 되어, 결국 영어 문장 번역에 실패하게 되는 문제가 있다.
따라서, 본 발명은 상기와 같은 문제점을 해결하기 위해 안출된 것으로, 한국어 용언구를 연결하는 연결어미에 대하여 연결패턴 및 올바른 연결패턴을 결정하기 위한 한국어 격틀을 이용하여 영어 용언구 연결 및 생성에 관한 번역정보를 제공할 수 있는 영어 용언구의 연결정보 결정 장치 및 그 방법과 상기 방법을 실현시키기 위한 프로그램을 기록한 컴퓨터로 읽을 수 있는 기록매체를 제공하는데 그 목적이 있다.
도 1 은 본 발명에 따른 영어 용언구의 연결정보 결정 장치의 일실시예 구성도.
도 2 는 본 발명에 따른 부분 대역문 연결기의 일실시예 상세 구성도.
도 3 은 본 발명에 따른 영어 용언구의 연결정보 결정 방법에 대한 일실시예 처리 흐름도.
* 도면의 주요 부분에 대한 부호의 설명
100 : 연결정보 결정 장치 101 : 형태소 분석기
102 : 구분 분석기 103 : 부분 대역문 연결기
104 : 부분 대역문 생성기 105 : 대역문 정련기
106 : 형태소 생성기 200 : 의존관계 추출기
201 : 연결패턴 탐색기 202 : 연결패턴 집합 선택기
203 : 영어 생성정보 반영기 204 : 연결패턴 데이터베이스
205 : 한국어 격틀사전
상기 목적을 달성하기 위한 본 발명의 장치는, 한영번역시스템에 적용되는 영어 용언구의 연결정보 결정 장치에 있어서, 번역하고자 하는 한국어 문장의 형태소 분석을 수행하는 형태소 분석수단; 상기 형태소 분석수단의 분석된 정보를 이용하여 용언구 단위의 구조 분석을 수행하는 구문 분석수단; 상기 구문 분석수단으로부터 한국어 문장의 구문 구조 정보를 수신하여, 연결어미를 통하여 연결 가능한 모든 용언구의 조합을 추출하는 의존관계 추출수단; 한국어 용언구의 연결패턴 및 각 연결어미에 대한 가장 많은 빈도의 영어 번역정보를 가지는 기본 연결패턴을 저장하고 있는 연결패턴 저장수단; 상기 연결패턴 저장수단에서 번역하고자 하는 한국어 문장에 적용할 연결패턴을 판단하기 위한 한국어 격틀정보 저장수단; 상기 연결패턴 저장수단 및 상기 한국어 격틀정보 저장수단을 이용하여 상기 의존관계 추출수단에서 추출된 용언구의 의존 관계 조합에 대하여 적용 가능한 연결 패턴 리스트를 추출하는 연결패턴 탐색수단; 상기 연결패턴 탐색수단에서 탐색된 연결패턴들 중 번역하고자 하는 한국어 문장의 용언구들의 연결 관계에 대한 영어 접속 정보를 모두 제공할 수 있는 가장 적합한 연결 패턴의 집합을 결정하는 연결패턴 집합 선택수단; 상기 연결패턴 집합 선택수단에서 선택된 연결패턴 집합의 연결 정보를 이용하여 한국어 용언구에 대응하는 영어 용언구의 접속 정보 및 생성 정보를 제공하는 영어 생성정보 반영수단; 상기 영어 생성정보 반역수단으로부터 수신한 각 용언구에 대한 단문 단위의 영어 번역을 수행하는 부분 대역문 생성수단; 상기 부분 대역문 생성수단으로부터 단문단위로 번역된 각 용언구에 대해 영어 문장 생성을 위한 성, 수, 시제 일치 정보 및 주어 등의 생략 성분 복원 작업 및 스타일 교정 작업을 수행하는 대역문 정련수단 및 상기 대역문 정련수단으로부터 정련된 용언구를 수신하여 영어 형태소를 생성하는 형태소 생성수단을 포함한다.
한편, 본 발명의 방법은, 영어 용언구의 연결정보 결정 장치에 적용되는 영어 용언구의 연결정보 결정 방법에 있어서, 한국어 문장의 구문구조 정보를 이용하여 모든 용언구의 조합들을 추출하는 제 1 단계; 상기 추출된 용언구의 연결관계 조합에 대하여 연결 패턴 데이타베이스에서연결패턴 리스트를 추출하는 제 2 단계; 상기 연결패턴 리스트에서 추출된 연결패턴이 한국어 연결패턴 조건을 만족하는가를 판단하는 제 3 단계; 상기 제 3 단계의 판단결과, 한국어 연결패턴 조건을 만족하지 않으면, 상기 연결패턴 데이터베이스에서 상기 추출된 용언구에 해당하는 기본 연결패턴을 선택하는 제 4 단계; 상기 제 3 단계의 판단결과, 한국어 연결패턴 조건을 만족하면, 해당 연결 패턴을 선택하는 제 5 단계; 상기 추출된 모든 용언구들의 연결관계 조합에 대하여 적용할 연결 패턴이 모두 선택되었는지를 판단하는 제 6 단계; 상기 제 6 단계의 판단결과, 모든 용언구들의 연결관계 조합에 대하여 적용할 연결 패턴이 모두 선택되었으면, 연결패턴 집합 선택기가 선택된 연결 패턴들의 리스트 중에서 번역하고자 하는 한국어 문장의 용언구들의 연결 관계에 대한 영어 접속 정보를 모두 제공할 수 있는 가장 적합한 연결 패턴의 집합을 결정하는 제 7 단계; 상기 제 6 단계의 판단결과, 모든 용언구들의 연결관계 조합에 대하여 적용할 연결패턴이 모두 선택되지 않았으면, 상기 제 2 단계로 넘어가는 제 8 단계; 및 영어 생성정보 반영기에서 상기 선택된 연결 패턴 집합의 연결 정보를 이용하여 한국어 용언구에 대응하는 영어 용언구의 접속 정보 및 생성 정보를 제공하는 제 9 단계를 포함한다.
또한, 본 발명은, 마이크로 프로세서를 구비한 영어 용언구 연결정보 결정 장치에, 한국어 문장의 구문구조 정보를 이용하여 모든 용언구의 조합들을 추출하는 제 1 기능; 상기 추출된 용언구의 연결관계 조합에 대하여 연결 패턴 데이타베이스에서 연결패턴 리스트를 추출하는 제 2 기능; 상기 연결패턴 리스트에서 추출된 연결패턴이 한국어 연결패턴 조건을 만족하는가를 판단하는 제 3 기능; 상기 제 3 기능의 판단결과, 한국어 연결패턴 조건을 만족하지 않으면, 상기 연결패턴 데이터베이스에서 상기 추출된 용언구에 해당하는 기본 연결패턴을 선택하는 제 4 기능; 상기 제 3 기능의 판단결과, 한국어 연결패턴 조건을 만족하면, 해당 연결 패턴을 선택하는 제 5 기능; 상기 추출된 모든 용언구들의 연결관계 조합에 대하여 적용할 연결 패턴이 모두 선택되었는지를 판단하는 제 6 기능; 상기 제 6 기능의 판단결과, 모든 용언구들의 연결관계 조합에 대하여 적용할 연결 패턴이 모두 선택되었으면, 연결패턴 집합 선택기가 선택된 연결 패턴들의 리스트 중에서 번역하고자 하는 한국어 문장의 용언구들의 연결 관계에 대한 영어 접속 정보를 모두 제공할 수 있는 가장 적합한 연결 패턴의 집합을 결정하는 제 7 기능; 상기 제 6 기능의 판단결과, 모든 용언구들의 연결관계 조합에 대하여 적용할 연결패턴이 모두 선택되지 않았으면, 상기 제 2 기능으로 넘어가는 제 8 기능; 및 영어 생성정보 반영기에서 상기 선택된 연결 패턴 집합의 연결 정보를 이용하여 한국어 용언구에 대응하는 영어 용언구의 접속 정보 및 생성 정보를 제공하는 제 9 기능을 실현시키기위한 프로그램을 기록한 컴퓨터로 읽을 수 있는 기록매체를 제공한다.
상술한 목적, 특징들 및 장점은 첨부된 도면과 관련한 다음의 상세한 설명을 통하여 보다 분명해 질 것이다. 이하, 첨부된 도면을 참조하여 본 발명에 따른 바람직한 일실시예를 상세히 설명한다.
도 1 은 본 발명에 따른 영어 용언구의 연결정보 결정 장치의 일실시예 구성도이다.
도면에 도시된 바와 같이, 본 발명에 따른 영어 용언구의 연결정보 결정 장치는, 번역하고자 하는 한국어 문장의 형태소 분석을 수행하는 형태소 분석기(101)와, 상기 형태소 분석기(100)의 분석된 정보를 이용하여 용언구 단위의 구조 분석을 수행하는 구문 분석기(102)와, 상기 분석된 한국어 구문 정보를 이용하여 각 용언구들간의 연결 관계를 결정하고 영어 접속사의 선택 및 번역될 용언구들간의 어순을 결정하며 생성 정보를 제공하는 부분 대역문 연결기(103)와, 각 용언구에 대한 단문 단위의 영어 번역을 수행하는 부분 대역문 생성기(104)와, 영어 문장 생성을 위한 성, 수, 시제 일치 정보 및 주어 등의 생략 성분 복원 작업 및 스타일 교정 작업을 수행하는 대역문 정련기(105)와, 영어 형태소를 생성하는 형태소 생성기(106)를 포함한다.
첨부된 도 2 는 본 발명에 따른 부분 대역문 연결기(103)의 일실시예 상세 구성도이다.
도면에 도시된 바와 같이, 본 발명이 적용되는 부분 대역문 연결기(103)는, 한국어 문장의 구문 구조 정보로부터 연결패턴을 이용하여 연결 가능한 용언구들의의존 관계의 조합, 즉 연결어미를 통하여 연결 가능한 모든 용언구의 조합을 추출하는 의존관계 추출기(200)와, 연결패턴 데이터베이스(204)와 한국어 격틀사전(205)을 이용하여 상기 의존관계 추출기(200)에서 추출된 용언구의 의존 관계 조합에 대하여 적용 가능한 연결 패턴 리스트를 추출하는 연결패턴 탐색기(201)와, 상기 연결패턴 탐색기(201)에서 탐색된 연결패턴들 중 번역하고자 하는 한국어 문장의 용언구들의 연결 관계에 대한 영어 접속 정보를 모두 제공할 수 있는 가장 적합한 연결 패턴의 집합을 결정하는 연결패턴 집합 선택기(202)와, 상기 연결패턴 집합 선택기(202)에서 선택된 연결패턴 집합의 연결 정보를 이용하여 한국어 용언구에 대응하는 영어 용언구의 접속 정보 및 생성 정보를 제공하는 영어 생성 정보 반영기(203)와, 한국어 용언구의 연결패턴 및 각 연결어미에 대한 가장 많은 빈도의 영어 번역정보를 가지는 기본 연결패턴을 저장하고 있는 연결패턴 데이터베이스(204)와, 상기 연결패턴 데이터페이스(204)에서 번역하고자 하는 한국어 문장에 적용할 연결패턴을 판단하기 위한 한국어 격틀사전(205)을 포함한다.
영어문장으로 번역하고자 하는 한국어 문장에서 각 용언구를 연결하는 연결어미에 대하여 해당 연결어미의 다양한 쓰임새 중 어떤 역할로 사용되었는지를 판단하기 위하여 연결어미로 연결된 다수의 용언구의 의미를 파악해야 한다.
예를 들어, "나는 그 소식을 듣고 매우 놀라고 슬펐다"라는 문장을 번역할 때, 상기 문장은 3개의 용언구로 구성되어 있으며, 연결어미 '고'로 연결되어 있다. 그러나, '듣고'의 '고'와 '놀라고'의 '고'는 동일한 형태의 연결어미 '고'로용언구가 연결되어 있으나, 그 쓰임은 서로 다르다. 즉, '듣고'의 '고'는 이유를 나타내는 연결어미로 사용되었으므로, 영어 문장에서 'to 부정사' 또는 'because'등을 사용하나, '놀라고'의 '고'는 대등 연결을 뜻하는 연결어미로 사용되어, 영어 문장에서 'and'와 같은 접속사로 연결되어야 한다.
이와 같이, 동일한 어형의 연결어미 '고'의 쓰임이 서로 다른 이유는, 해당 연결어미가 연결하는 문장의 의미가 어떻게 연결되어 있는지에 따라 결정된다.
연결패턴은, 연결어미로 연결된 둘 이상의 한국어 용언구에 대하여 각 용언구의 영어 대역문을 연결하는 접속사를 결정할 수 있는 범위내의 2개 이상의 용언구들을 대상으로 각 용언에 해당하는 격틀정보 및 영어 접속사 정보를 중심으로 기술되며, 용언의 연결에 사용된 영어 접속사 정보, 용언들간의 어순 정보 및 각 용언구의 영어 생성정보를 제공한다.
또한, 연결패턴은, 해당 연결패턴을 적용할 수 있는 조건을 기술하는 한국어 연결패턴 부분과 영어 번역정보를 제공하는 영어 연결패턴 부분으로 나뉘어진다.
상기 한국어 연결패턴 부분은, 괄호를 이용하여 용언구들간의 의존 관계를 기술하며, 각 용언구에 대하여 용언구의 인덱스와 용언구에 대응하는 격틀의 인식자, 용언구의 연결어미 정보로 이루어진다.
그리고, 상기 영어 연결패턴 부분은, 각 한국어 용언구에서 기술된 용언구의 인덱스로 대응하는 영어 용언구를 기술한다. 이 때, 영어 연결패턴 부분에는 괄호 정보로 용언구들간의 의존 관계를 기술하지 않으며, 영어 문장에서 영어 용언구가 나타나는 순서대로 영어 연결패턴에 나타난다.
연결패턴은 연결 어미에 대한 연결 정보 이외에도, 고정 표현을 기술하는 데도 동일한 방법으로 적용되어, 고정 표현의 처리와 연결어미의 처리를 동시에 수행할 수 있다.
'용언구1+연결어미1 용언구2'의 형태로 연결된 경우에, 연결어미1에 해당하는 올바른 접속사 선택을 위해 사용된 연결패턴의 형태는 다음과 같으며, 이는 n(2개 이상)개의 용언구로 확장될 수 있다.
( (용언구1의 인덱스:격틀인덱스,연결어미정보) 용언구2의 인덱스:격틀인덱스)
=> [용언구1의 인덱스:생성정보] [접속사 정보] [용언구2의 인덱스:생성정보]
이제, 첨부된 도 3 을 참조하여 본 발명에 따른 영어 용언구의 연결정보 결정 방법에 대해 상세히 설명하면 다음과 같다.
첨부된 도 3 은 본 발명에 따른 영어 용언구의 연결정보 결정 방법에 대한 일실시예 처리 흐름도이다.
먼저, 입력된 한국어 문장에 대해 형태소 분석 및 구문분석을 수행하고(300), 의존 관계 추출기(200)를 통하여 번역하고자 하는 한국어 문장의 구문 구조 정보로부터 연결패턴을 이용하여 연결 가능한 용언구들의 의존 관계의 조합, 즉 연결어미를 통하여 연결 가능한 모든 용언구의 조합을 추출한다(302).
다음으로, 연결 패턴 탐색기(201)를 통하여 추출된 용언구의 의존 관계 조합에 대하여 적합한 연결 패턴이 연결패턴 데이터베이스(204)내에 있는지를 한국어 격틀사전(205)을 이용하여 조사하고, 적용가능한 연결패턴 리스트를 추출한 후(304), 연결패턴 리스트의 각 연결패턴에 대해 해당 연결패턴이 한국어 연결패턴조건을 만족하는지를 판단한다(306).
상기 판단결과(306), 한국어 연결패턴 조건을 만족하지 않으면, 상기 연결패턴 데이터베이스(204)에서 기본 연결 패턴을 선택하고(308), 한국어 연결패턴 조건을 만족하면, 해당 연결패턴을 선택한다(310).
상기 추출된 모든 용언구들의 연결관계 조합에 대하여 적용할 연결 패턴이 모두 선택되었는지를 판단한다(312).
상기 판단결과(312), 모든 용언구들의 연결관계 조합에 대하여 적용할 연결 패턴이 모두 선택되었으면, 연결패턴 집합 선택기(202)가 선택된 연결 패턴들의 리스트 중에서 번역하고자 하는 한국어 문장의 용언구들의 연결 관계에 대한 영어 접속 정보를 모두 제공할 수 있는 가장 적합한 연결 패턴의 집합을 결정한다(314).
상기 판단결과(312), 모든 용언구들의 연결관계 조합에 대하여 적용할 연결패턴이 모두 선택되지 않았으면, 상기 적용가능한 연결패턴 리스트를 추출하는 과정(304)을 수행한다.
마지막으로, 영어 생성정보 반영기(203)에서 선택된 연결 패턴 집합의 연결 정보를 이용하여 한국어 용언구에 대응하는 영어 용언구의 접속 정보 및 생성 정보를 제공한다(316). 이때, 번역할 한국어 문장이 둘 이상의 연결 패턴으로 연결되는 경우는 한국어 용언구의 의존 관계 정보와 문장에서 용언구의 상대 순서 정보 등을 이용하여 최종적인 영어 용언구들간의 생성 정보를 결정한다.
"나는 그 소식을 듣고 매우 놀라고 슬펐다"라는 예문에서 영어 용언구 연결 정보를 결정하기 위하여 사용되는 연결 패턴은,
( ( [VP1:격틀1] [고] ) [VP2:격틀2] ) => [VP1] [and:대등] [VP2]
( ( [VP1:격틀2] [고] ) [VP2:격틀3] ) => [VP2] [to:이유] [VP2:INF]와 같고, 사용할 연결 패턴을 결정하기 위한 격틀 정보는,
격틀1 ['듣다' : '사람'-주어 '소식'-목적어]
격틀2 ['놀라다' : '사람'-주어]
격틀3 ['슬프다' : '사람'-주어]와 같다.
상기 예문 "나는 그 소식을 듣고 매우 놀라고 슬펐다"에 대하여, 상기 구문 분석기(102)가 구문 분석을 통하여 용언구 단위의 구조 분석을 수행하여 "(나는 (그 소식을 듣고) (매우 놀라고) 슬펐다)"와 같은 형태의 의존 구조를 제공하면, 상기 부분 대역문 연결기(103)는 상기 구문구조 정보로부터 모두 가능한 용언구들간의 연결 관계의 조합을 추출한 후, 추출된 용언구 연결 관계의 후보와 상기 연결패턴 데이터베이스(204)내에 있는 연결패턴들 중 연결패턴의 한국어 용언구의 조건부가 일치하는 연결 패턴이 있는가를 조사하고, 일치하는 연결패턴들 중에서 한국어 문장 전체를 연결할 수 있는 최적의 연결패턴들을 선택한다.
마지막으로, 각 연결패턴의 영어 생성 정보를 올바른 접속사를 선택하고, 영어 생성정보를 제공함으로써, 번역될 영어문장이 " [나는 슬프다] and [놀라다] to [그 소식을 듣다]"의 형태가 됨을 결정하는 것이다.
이상에서 설명한 본 발명은, 본 발명이 속하는 기술분야에서 통상의 지식을 가진 자에 있어 본 발명의 기술적 사상을 벗어나지 않는 범위 내에서 여러 가지 치환, 변형 및 변경이 가능하므로 전술한 실시예 및 첨부된 도면에 한정되는 것이 아니다.
상기와 같은 본 발명은, 한국어 용언구를 연결하는 연결어미에 대하여 연결패턴 및 올바른 연결패턴을 결정하기 위한 한국어 격틀을 이용하여 영어 용언구 연결 및 생성에 관한 번역정보를 제공함으로써, 한국어 연결어미의 역할에 맞는 올바른 영어 접속사를 선택하여 올바른 용언구 단위 영어문장을 생성할 수 있는 효과가 있다.
Claims (6)
- 한영번역시스템에 적용되는 영어 용언구의 연결정보 결정 장치에 있어서,번역하고자 하는 한국어 문장의 형태소 분석을 수행하는 형태소 분석수단;상기 형태소 분석수단의 분석된 정보를 이용하여 용언구 단위의 구조 분석을 수행하는 구문 분석수단;상기 구문 분석수단으로부터 한국어 문장의 구문 구조 정보를 수신하여, 연결어미를 통하여 연결 가능한 모든 용언구의 조합을 추출하는 의존관계 추출수단;한국어 용언구의 연결패턴 및 각 연결어미에 대한 가장 많은 빈도의 영어 번역정보를 가지는 기본 연결패턴을 저장하고 있는 연결패턴 저장수단;상기 연결패턴 저장수단에서 번역하고자 하는 한국어 문장에 적용할 연결패턴을 판단하기 위한 한국어 격틀정보 저장수단;상기 연결패턴 저장수단 및 상기 한국어 격틀정보 저장수단을 이용하여 상기 의존관계 추출수단에서 추출된 용언구의 의존 관계 조합에 대하여 적용 가능한 연결 패턴 리스트를 추출하는 연결패턴 탐색수단;상기 연결패턴 탐색수단에서 탐색된 연결패턴들 중 번역하고자 하는 한국어 문장의 용언구들의 연결 관계에 대한 영어 접속 정보를 모두 제공할 수 있는 가장 적합한 연결 패턴의 집합을 결정하는 연결패턴 집합 선택수단;상기 연결패턴 집합 선택수단에서 선택된 연결패턴 집합의 연결 정보를 이용하여 한국어 용언구에 대응하는 영어 용언구의 접속 정보 및 생성 정보를 제공하는영어 생성정보 반영수단;상기 영어 생성정보 반역수단으로부터 수신한 각 용언구에 대한 단문 단위의 영어 번역을 수행하는 부분 대역문 생성수단;상기 부분 대역문 생성수단으로부터 단문단위로 번역된 각 용언구에 대해 영어 문장 생성을 위한 성, 수, 시제 일치 정보 및 주어 등의 생략 성분 복원 작업 및 스타일 교정 작업을 수행하는 대역문 정련수단 및상기 대역문 정련수단으로부터 정련된 용언구를 수신하여 영어 형태소를 생성하는 형태소 생성수단을 포함하는 영어 용언구의 연결정보 결정 장치.
- 영어 용언구의 연결정보 결정 장치에 적용되는 영어 용언구의 연결정보 결정 방법에 있어서,한국어 문장의 구문구조 정보를 이용하여 모든 용언구의 조합들을 추출하는 제 1 단계;상기 추출된 용언구의 연결관계 조합에 대하여 연결 패턴 데이타베이스에서 연결패턴 리스트를 추출하는 제 2 단계;상기 연결패턴 리스트에서 추출된 연결패턴이 한국어 연결패턴 조건을 만족하는가를 판단하는 제 3 단계;상기 제 3 단계의 판단결과, 한국어 연결패턴 조건을 만족하지 않으면, 상기연결패턴 데이터베이스에서 상기 추출된 용언구에 해당하는 기본 연결패턴을 선택하는 제 4 단계;상기 제 3 단계의 판단결과, 한국어 연결패턴 조건을 만족하면, 해당 연결 패턴을 선택하는 제 5 단계;상기 추출된 모든 용언구들의 연결관계 조합에 대하여 적용할 연결 패턴이 모두 선택되었는지를 판단하는 제 6 단계;상기 제 6 단계의 판단결과, 모든 용언구들의 연결관계 조합에 대하여 적용할 연결 패턴이 모두 선택되었으면, 연결패턴 집합 선택기가 선택된 연결 패턴들의 리스트 중에서 번역하고자 하는 한국어 문장의 용언구들의 연결 관계에 대한 영어 접속 정보를 모두 제공할 수 있는 가장 적합한 연결 패턴의 집합을 결정하는 제 7 단계;상기 제 6 단계의 판단결과, 모든 용언구들의 연결관계 조합에 대하여 적용할 연결패턴이 모두 선택되지 않았으면, 상기 제 2 단계로 넘어가는 제 8 단계; 및영어 생성정보 반영기에서 상기 선택된 연결 패턴 집합의 연결 정보를 이용하여 한국어 용언구에 대응하는 영어 용언구의 접속 정보 및 생성 정보를 제공하는 제 9 단계를 포함하는 영어 용언구의 연결정보 결정 방법.
- 제 2 항에 있어서,상기 제 1 단계는,입력된 한국어 문장에 대해 형태소 분석 및 구문분석을 수행하는 제 10 단계; 및번역하고자 하는 한국어 문장의 구문 구조 정보로부터 한국어 용언구들들간의 의존 관계 정보를 이용하여 연결 가능한 용언구들의 연결관계 조합을 추출하는 제 11 단계를 포함하는 영어 용언구의 연결정보 결정 방법.
- 제 2 항 또는 제 3 항에 있어서,상기 제 2 단계는,상기 추출된 용언구의 연결관계 조합에 대하여 적합한 연결 패턴이 연결패턴 데이터베이스내에 존재하는지를 한국어 격틀사전을 이용하여 조사하는 제 12 단계; 및상기 추출된 용언구의 연결관계 조합을 이용하여 연결패턴 리스트를 추출하는 제 13 단계를 포함하는 영어 용언구의 연결정보 결정 방법.
- 제 2 항에 있어서,상기 제 4 단계에서 상기 연결패턴 데이터베이스는,한국어 용언구의 연결패턴 및 각 연결어미에 대한 가장 많은 빈도의 영어 번역정보를 가지는 기본 연결패턴을 저장하고 있는 것을 특징으로 하는 영어 용언구 연결정보 결정 방법.
- 마이크로 프로세서를 구비한 영어 용언구 연결정보 결정 장치에,한국어 문장의 구문구조 정보를 이용하여 모든 용언구의 조합들을 추출하는 제 1 기능;상기 추출된 용언구의 연결관계 조합에 대하여 연결 패턴 데이타베이스에서 연결패턴 리스트를 추출하는 제 2 기능;상기 연결패턴 리스트에서 추출된 연결패턴이 한국어 연결패턴 조건을 만족하는가를 판단하는 제 3 기능;상기 제 3 기능의 판단결과, 한국어 연결패턴 조건을 만족하지 않으면, 상기 연결패턴 데이터베이스에서 상기 추출된 용언구에 해당하는 기본 연결패턴을 선택하는 제 4 기능;상기 제 3 기능의 판단결과, 한국어 연결패턴 조건을 만족하면, 해당 연결 패턴을 선택하는 제 5 기능;상기 추출된 모든 용언구들의 연결관계 조합에 대하여 적용할 연결 패턴이 모두 선택되었는지를 판단하는 제 6 기능;상기 제 6 기능의 판단결과, 모든 용언구들의 연결관계 조합에 대하여 적용할 연결 패턴이 모두 선택되었으면, 연결패턴 집합 선택기가 선택된 연결 패턴들의리스트 중에서 번역하고자 하는 한국어 문장의 용언구들의 연결 관계에 대한 영어 접속 정보를 모두 제공할 수 있는 가장 적합한 연결 패턴의 집합을 결정하는 제 7 기능;상기 제 6 기능의 판단결과, 모든 용언구들의 연결관계 조합에 대하여 적용할 연결패턴이 모두 선택되지 않았으면, 상기 제 2 기능으로 넘어가는 제 8 기능; 및영어 생성정보 반영기에서 상기 선택된 연결 패턴 집합의 연결 정보를 이용하여 한국어 용언구에 대응하는 영어 용언구의 접속 정보 및 생성 정보를 제공하는 제 9 기능을 실현시키기 위한 프로그램을 기록한 컴퓨터로 읽을 수 있는 기록매체.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1019990061885A KR100311224B1 (ko) | 1999-12-24 | 1999-12-24 | 영어 용언구의 연결정보 결정 장치 및 그 방법 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1019990061885A KR100311224B1 (ko) | 1999-12-24 | 1999-12-24 | 영어 용언구의 연결정보 결정 장치 및 그 방법 |
Publications (2)
Publication Number | Publication Date |
---|---|
KR20010063791A true KR20010063791A (ko) | 2001-07-09 |
KR100311224B1 KR100311224B1 (ko) | 2001-10-12 |
Family
ID=19629448
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1019990061885A KR100311224B1 (ko) | 1999-12-24 | 1999-12-24 | 영어 용언구의 연결정보 결정 장치 및 그 방법 |
Country Status (1)
Country | Link |
---|---|
KR (1) | KR100311224B1 (ko) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR100559473B1 (ko) * | 2003-12-24 | 2006-03-10 | 한국전자통신연구원 | 스타일 번역 처리시스템 및 방법 |
KR100725723B1 (ko) * | 2005-12-09 | 2007-06-08 | 한국전자통신연구원 | 연결어미 제약을 이용한 한국어 주어의 생략 성분 복원방법 및 장치 |
KR101117427B1 (ko) * | 2009-02-26 | 2012-03-13 | 고려대학교 산학협력단 | 형태소 합성 장치 및 방법 |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR101092363B1 (ko) | 2008-12-22 | 2011-12-09 | 한국전자통신연구원 | 중한자동번역을 위한 한국어 연결어미 생성 방법 및 그 장치 |
-
1999
- 1999-12-24 KR KR1019990061885A patent/KR100311224B1/ko not_active IP Right Cessation
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR100559473B1 (ko) * | 2003-12-24 | 2006-03-10 | 한국전자통신연구원 | 스타일 번역 처리시스템 및 방법 |
KR100725723B1 (ko) * | 2005-12-09 | 2007-06-08 | 한국전자통신연구원 | 연결어미 제약을 이용한 한국어 주어의 생략 성분 복원방법 및 장치 |
KR101117427B1 (ko) * | 2009-02-26 | 2012-03-13 | 고려대학교 산학협력단 | 형태소 합성 장치 및 방법 |
Also Published As
Publication number | Publication date |
---|---|
KR100311224B1 (ko) | 2001-10-12 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR100542755B1 (ko) | 규칙 기반 방식과 번역 패턴 방식을 혼합한 하이브리드자동 번역 장치 및 방법과 그 프로그램을 기록한 컴퓨터로읽을 수 있는 기록매체 | |
KR100530154B1 (ko) | 변환방식 기계번역시스템에서 사용되는 변환사전을생성하는 방법 및 장치 | |
US20070233460A1 (en) | Computer-Implemented Method for Use in a Translation System | |
EP0839357A1 (en) | Method and apparatus for automated search and retrieval processing | |
JP2006252382A (ja) | 質問応答システム、およびデータ検索方法、並びにコンピュータ・プログラム | |
WO2003083708A2 (en) | Machine translation | |
EP1525539A2 (en) | Machine translation | |
KR20100025885A (ko) | 다단계 용언구 패턴을 적용한 번역장치와 이를 위한적용방법 및 추출방법 | |
Schwenk et al. | Translation model adaptation for an Arabic/French news translation system by lightly-supervised training | |
Grishman | Iterative alignment of syntactic structures for a bilingual corpus | |
Messiant | A subcategorization acquisition system for French verbs | |
KR100311224B1 (ko) | 영어 용언구의 연결정보 결정 장치 및 그 방법 | |
JPH10312382A (ja) | 類似用例翻訳システム | |
KR101755437B1 (ko) | 어휘의미패턴을 이용한 한국어의 기계번역방법 | |
JP4007413B2 (ja) | 自然言語処理システム及び自然言語処理方法、並びにコンピュータ・プログラム | |
KR20200066009A (ko) | 한국어 구문 분석을 활용한 정보 처리 시스템 | |
Das et al. | Improving cross-lingual model transfer by chunking | |
KR20120060666A (ko) | 통계적 기계 번역에서 명사구 대역 쌍 추출 장치 및 방법 | |
KR100204068B1 (ko) | 개념기반 다국어 번역시스템의 문법 자동수정 방법 | |
KR20080029567A (ko) | 병렬 말뭉치를 이용한 신조어의 대역어 자동 선정 방법 및장치 | |
Yamada et al. | A Method for Automatically Adapting an MT System to Different Domains | |
KR100481453B1 (ko) | 동사구 패턴 기반 한중 자동 번역 시스템의 '하다' 동사의번역장치 및 방법 | |
JP2006190226A (ja) | 用言自動換言装置、用言換言方法及び用言換言処理プログラム | |
JP3388393B2 (ja) | データベースを利用したテンス、アスペクトあるいはモダリティに関する翻訳装置 | |
JPH02208775A (ja) | 機械翻訳方式 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A201 | Request for examination | ||
E701 | Decision to grant or registration of patent right | ||
GRNT | Written decision to grant | ||
FPAY | Annual fee payment |
Payment date: 20070831 Year of fee payment: 7 |
|
LAPS | Lapse due to unpaid annual fee |