KR20010063791A - 영어 용언구의 연결정보 결정 장치 및 그 방법 - Google Patents

영어 용언구의 연결정보 결정 장치 및 그 방법 Download PDF

Info

Publication number
KR20010063791A
KR20010063791A KR1019990061885A KR19990061885A KR20010063791A KR 20010063791 A KR20010063791 A KR 20010063791A KR 1019990061885 A KR1019990061885 A KR 1019990061885A KR 19990061885 A KR19990061885 A KR 19990061885A KR 20010063791 A KR20010063791 A KR 20010063791A
Authority
KR
South Korea
Prior art keywords
connection
information
english
connection pattern
korean
Prior art date
Application number
KR1019990061885A
Other languages
English (en)
Other versions
KR100311224B1 (ko
Inventor
서영애
김태완
김영길
서광준
심철민
여상화
정한민
최승권
박상규
박세영
Original Assignee
오길록
한국전자통신연구원
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 오길록, 한국전자통신연구원 filed Critical 오길록
Priority to KR1019990061885A priority Critical patent/KR100311224B1/ko
Publication of KR20010063791A publication Critical patent/KR20010063791A/ko
Application granted granted Critical
Publication of KR100311224B1 publication Critical patent/KR100311224B1/ko

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/40Processing or translation of natural language
    • G06F40/42Data-driven translation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/268Morphological analysis

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Machine Translation (AREA)

Abstract

본 발명은 영어 용언구의 연결정보 결정 장치 및 그 방법에 관한 것으로, 한국어 문장의 구문구조 정보를 이용하여 모든 용언구의 조합들을 추출하는 제 1 단계; 상기 추출된 용언구의 연결관계 조합에 대하여 연결패턴 리스트를 추출하는 제 2 단계; 상기 추출된 연결패턴이 한국어 연결패턴 조건을 만족하는가를 판단하는 제 3 단계; 상기 제 3 단계의 판단결과에 따라, 상기 연결패턴 데이터베이스에서 기본 연결패턴을 선택하는 제 4 단계; 상기 제 3 단계의 판단결과에 따라, 해당 연결 패턴을 선택하는 제 5 단계; 상기 추출된 모든 연결관계 조합에 대하여 적용할 연결 패턴이 모두 선택되었는지를 판단하는 제 6 단계; 상기 제 6 단계의 판단결과에 따라, 연결패턴 집합 선택기가 선택된 연결 패턴들의 리스트 중에서 영어 접속 정보를 모두 제공할 수 있는 가장 적합한 연결 패턴의 집합을 결정하는 제 7 단계; 상기 제 6 단계의 판단결과에 따라, 상기 제 2 단계로 넘어가는 제 8 단계; 및 영어 생성정보 반영기에서 상기 연결 패턴 집합의 연결 정보를 이용하여 영어 용언구의 접속 정보 및 생성 정보를 제공하는 제 9 단계를 포함하며, 한영 자동번역 시스템 등에 이용됨.

Description

영어 용언구의 연결정보 결정 장치 및 그 방법{APPARATUS FOR DETERMINING LINKING INFORMATION OF ENGLISH VERBAL PHRASE AND METHOD USING THE SAME}
본 발명은 한국어 문장을 영어 문장으로 번역하는 장치 및 그 방법에 관한 것으로, 특히 연결패턴을 이용하여 한국어 용언구를 연결하는 연결어미에 대응하는 영어 접속사를 선택하고, 한국어 용언구에 대응하여 번역될 영어 용언구들에 대한 순서정보 및 영어 생성정보를 제공하기 위한 영어 용언구의 연결정보 결정 장치 및 그 방법과 상기 방법을 실현시키기 위한 프로그램을 기록한 컴퓨터로 읽을 수 있는 기록매체에 관한 것이다.
일반적으로, 하나의 문장은 구문구조 규칙에 의해 생성되며, 모든 모국어 화자(話者)는 접속사를 이용하여 문장을 확장하는 능력을 갖고 있다.
따라서, 한영 자동번영 시스템에서 번역하고자 하는 한국어 문장의 상당수는 용언구(verbal phrase)의 접속구조를 가지고 있다.
한국어는 굴절어의 특징을 가지고 있기 때문에, 용언의 연결어미를 이용하여 각 용언구가 연결된다. 따라서, 용언구 단위로 번역을 수행하는 한영 자동번역 시스템에서는 각 한국어 용언구에 대응하는 영어 용언구의 번역결과를 의미적으로 올바르게 연결하기 위하여 한국어의 연결어미에 대응하는 적절한 영어 접속사를 선택하여 이들을 연결하고, 용언구들간의 상대 순서를 결정하여, 영어 용언구 생성에 필요한 정보를 제공함으로써, 완전한 영어 문장을 생성하게 된다.
또한, 한국어는 그 연결어미의 종류가 매우 다양할 뿐만 아니라, 하나의 연결어미는 하나 이상의 의미를 가지고 문장들을 연결하는 역할을 수행하므로, 용언구들간의 의미 파악이 제대로 이루어지지 않은 상황에서는 연결어미에 대응하는 적절한 영어 접속사의 선택이 불가능하다.
종래의 영어 용언구 연결정보 결정 방법은, 하나의 한국어 연결어미가 가지는 다양한 쓰임에 대한 특별한 처리를 하지 않은 채, 일부 숙어적 표현에 한하여 한국어 연결어미에 대한 영어 접속사 정보를 결정하고, 그 외의 경우에는 각 연결어미에 대하여 가장 대표적인 영어 접속사를 번역정보로 이용하여 영어 용언구의 연결을 수행한다.
그러나, 상기한 바와 같은 종래의 영어 용언구 연결정보 결정 방법은, 한국어 연결어미가 대표적 쓰임이 아닌 경우로 사용되었을 경우, 적절치 못한 영어 접속사 선택 및 영어 용언구 생성정보를 제공하게 되어, 결국 영어 문장 번역에 실패하게 되는 문제가 있다.
따라서, 본 발명은 상기와 같은 문제점을 해결하기 위해 안출된 것으로, 한국어 용언구를 연결하는 연결어미에 대하여 연결패턴 및 올바른 연결패턴을 결정하기 위한 한국어 격틀을 이용하여 영어 용언구 연결 및 생성에 관한 번역정보를 제공할 수 있는 영어 용언구의 연결정보 결정 장치 및 그 방법과 상기 방법을 실현시키기 위한 프로그램을 기록한 컴퓨터로 읽을 수 있는 기록매체를 제공하는데 그 목적이 있다.
도 1 은 본 발명에 따른 영어 용언구의 연결정보 결정 장치의 일실시예 구성도.
도 2 는 본 발명에 따른 부분 대역문 연결기의 일실시예 상세 구성도.
도 3 은 본 발명에 따른 영어 용언구의 연결정보 결정 방법에 대한 일실시예 처리 흐름도.
* 도면의 주요 부분에 대한 부호의 설명
100 : 연결정보 결정 장치 101 : 형태소 분석기
102 : 구분 분석기 103 : 부분 대역문 연결기
104 : 부분 대역문 생성기 105 : 대역문 정련기
106 : 형태소 생성기 200 : 의존관계 추출기
201 : 연결패턴 탐색기 202 : 연결패턴 집합 선택기
203 : 영어 생성정보 반영기 204 : 연결패턴 데이터베이스
205 : 한국어 격틀사전
상기 목적을 달성하기 위한 본 발명의 장치는, 한영번역시스템에 적용되는 영어 용언구의 연결정보 결정 장치에 있어서, 번역하고자 하는 한국어 문장의 형태소 분석을 수행하는 형태소 분석수단; 상기 형태소 분석수단의 분석된 정보를 이용하여 용언구 단위의 구조 분석을 수행하는 구문 분석수단; 상기 구문 분석수단으로부터 한국어 문장의 구문 구조 정보를 수신하여, 연결어미를 통하여 연결 가능한 모든 용언구의 조합을 추출하는 의존관계 추출수단; 한국어 용언구의 연결패턴 및 각 연결어미에 대한 가장 많은 빈도의 영어 번역정보를 가지는 기본 연결패턴을 저장하고 있는 연결패턴 저장수단; 상기 연결패턴 저장수단에서 번역하고자 하는 한국어 문장에 적용할 연결패턴을 판단하기 위한 한국어 격틀정보 저장수단; 상기 연결패턴 저장수단 및 상기 한국어 격틀정보 저장수단을 이용하여 상기 의존관계 추출수단에서 추출된 용언구의 의존 관계 조합에 대하여 적용 가능한 연결 패턴 리스트를 추출하는 연결패턴 탐색수단; 상기 연결패턴 탐색수단에서 탐색된 연결패턴들 중 번역하고자 하는 한국어 문장의 용언구들의 연결 관계에 대한 영어 접속 정보를 모두 제공할 수 있는 가장 적합한 연결 패턴의 집합을 결정하는 연결패턴 집합 선택수단; 상기 연결패턴 집합 선택수단에서 선택된 연결패턴 집합의 연결 정보를 이용하여 한국어 용언구에 대응하는 영어 용언구의 접속 정보 및 생성 정보를 제공하는 영어 생성정보 반영수단; 상기 영어 생성정보 반역수단으로부터 수신한 각 용언구에 대한 단문 단위의 영어 번역을 수행하는 부분 대역문 생성수단; 상기 부분 대역문 생성수단으로부터 단문단위로 번역된 각 용언구에 대해 영어 문장 생성을 위한 성, 수, 시제 일치 정보 및 주어 등의 생략 성분 복원 작업 및 스타일 교정 작업을 수행하는 대역문 정련수단 및 상기 대역문 정련수단으로부터 정련된 용언구를 수신하여 영어 형태소를 생성하는 형태소 생성수단을 포함한다.
한편, 본 발명의 방법은, 영어 용언구의 연결정보 결정 장치에 적용되는 영어 용언구의 연결정보 결정 방법에 있어서, 한국어 문장의 구문구조 정보를 이용하여 모든 용언구의 조합들을 추출하는 제 1 단계; 상기 추출된 용언구의 연결관계 조합에 대하여 연결 패턴 데이타베이스에서연결패턴 리스트를 추출하는 제 2 단계; 상기 연결패턴 리스트에서 추출된 연결패턴이 한국어 연결패턴 조건을 만족하는가를 판단하는 제 3 단계; 상기 제 3 단계의 판단결과, 한국어 연결패턴 조건을 만족하지 않으면, 상기 연결패턴 데이터베이스에서 상기 추출된 용언구에 해당하는 기본 연결패턴을 선택하는 제 4 단계; 상기 제 3 단계의 판단결과, 한국어 연결패턴 조건을 만족하면, 해당 연결 패턴을 선택하는 제 5 단계; 상기 추출된 모든 용언구들의 연결관계 조합에 대하여 적용할 연결 패턴이 모두 선택되었는지를 판단하는 제 6 단계; 상기 제 6 단계의 판단결과, 모든 용언구들의 연결관계 조합에 대하여 적용할 연결 패턴이 모두 선택되었으면, 연결패턴 집합 선택기가 선택된 연결 패턴들의 리스트 중에서 번역하고자 하는 한국어 문장의 용언구들의 연결 관계에 대한 영어 접속 정보를 모두 제공할 수 있는 가장 적합한 연결 패턴의 집합을 결정하는 제 7 단계; 상기 제 6 단계의 판단결과, 모든 용언구들의 연결관계 조합에 대하여 적용할 연결패턴이 모두 선택되지 않았으면, 상기 제 2 단계로 넘어가는 제 8 단계; 및 영어 생성정보 반영기에서 상기 선택된 연결 패턴 집합의 연결 정보를 이용하여 한국어 용언구에 대응하는 영어 용언구의 접속 정보 및 생성 정보를 제공하는 제 9 단계를 포함한다.
또한, 본 발명은, 마이크로 프로세서를 구비한 영어 용언구 연결정보 결정 장치에, 한국어 문장의 구문구조 정보를 이용하여 모든 용언구의 조합들을 추출하는 제 1 기능; 상기 추출된 용언구의 연결관계 조합에 대하여 연결 패턴 데이타베이스에서 연결패턴 리스트를 추출하는 제 2 기능; 상기 연결패턴 리스트에서 추출된 연결패턴이 한국어 연결패턴 조건을 만족하는가를 판단하는 제 3 기능; 상기 제 3 기능의 판단결과, 한국어 연결패턴 조건을 만족하지 않으면, 상기 연결패턴 데이터베이스에서 상기 추출된 용언구에 해당하는 기본 연결패턴을 선택하는 제 4 기능; 상기 제 3 기능의 판단결과, 한국어 연결패턴 조건을 만족하면, 해당 연결 패턴을 선택하는 제 5 기능; 상기 추출된 모든 용언구들의 연결관계 조합에 대하여 적용할 연결 패턴이 모두 선택되었는지를 판단하는 제 6 기능; 상기 제 6 기능의 판단결과, 모든 용언구들의 연결관계 조합에 대하여 적용할 연결 패턴이 모두 선택되었으면, 연결패턴 집합 선택기가 선택된 연결 패턴들의 리스트 중에서 번역하고자 하는 한국어 문장의 용언구들의 연결 관계에 대한 영어 접속 정보를 모두 제공할 수 있는 가장 적합한 연결 패턴의 집합을 결정하는 제 7 기능; 상기 제 6 기능의 판단결과, 모든 용언구들의 연결관계 조합에 대하여 적용할 연결패턴이 모두 선택되지 않았으면, 상기 제 2 기능으로 넘어가는 제 8 기능; 및 영어 생성정보 반영기에서 상기 선택된 연결 패턴 집합의 연결 정보를 이용하여 한국어 용언구에 대응하는 영어 용언구의 접속 정보 및 생성 정보를 제공하는 제 9 기능을 실현시키기위한 프로그램을 기록한 컴퓨터로 읽을 수 있는 기록매체를 제공한다.
상술한 목적, 특징들 및 장점은 첨부된 도면과 관련한 다음의 상세한 설명을 통하여 보다 분명해 질 것이다. 이하, 첨부된 도면을 참조하여 본 발명에 따른 바람직한 일실시예를 상세히 설명한다.
도 1 은 본 발명에 따른 영어 용언구의 연결정보 결정 장치의 일실시예 구성도이다.
도면에 도시된 바와 같이, 본 발명에 따른 영어 용언구의 연결정보 결정 장치는, 번역하고자 하는 한국어 문장의 형태소 분석을 수행하는 형태소 분석기(101)와, 상기 형태소 분석기(100)의 분석된 정보를 이용하여 용언구 단위의 구조 분석을 수행하는 구문 분석기(102)와, 상기 분석된 한국어 구문 정보를 이용하여 각 용언구들간의 연결 관계를 결정하고 영어 접속사의 선택 및 번역될 용언구들간의 어순을 결정하며 생성 정보를 제공하는 부분 대역문 연결기(103)와, 각 용언구에 대한 단문 단위의 영어 번역을 수행하는 부분 대역문 생성기(104)와, 영어 문장 생성을 위한 성, 수, 시제 일치 정보 및 주어 등의 생략 성분 복원 작업 및 스타일 교정 작업을 수행하는 대역문 정련기(105)와, 영어 형태소를 생성하는 형태소 생성기(106)를 포함한다.
첨부된 도 2 는 본 발명에 따른 부분 대역문 연결기(103)의 일실시예 상세 구성도이다.
도면에 도시된 바와 같이, 본 발명이 적용되는 부분 대역문 연결기(103)는, 한국어 문장의 구문 구조 정보로부터 연결패턴을 이용하여 연결 가능한 용언구들의의존 관계의 조합, 즉 연결어미를 통하여 연결 가능한 모든 용언구의 조합을 추출하는 의존관계 추출기(200)와, 연결패턴 데이터베이스(204)와 한국어 격틀사전(205)을 이용하여 상기 의존관계 추출기(200)에서 추출된 용언구의 의존 관계 조합에 대하여 적용 가능한 연결 패턴 리스트를 추출하는 연결패턴 탐색기(201)와, 상기 연결패턴 탐색기(201)에서 탐색된 연결패턴들 중 번역하고자 하는 한국어 문장의 용언구들의 연결 관계에 대한 영어 접속 정보를 모두 제공할 수 있는 가장 적합한 연결 패턴의 집합을 결정하는 연결패턴 집합 선택기(202)와, 상기 연결패턴 집합 선택기(202)에서 선택된 연결패턴 집합의 연결 정보를 이용하여 한국어 용언구에 대응하는 영어 용언구의 접속 정보 및 생성 정보를 제공하는 영어 생성 정보 반영기(203)와, 한국어 용언구의 연결패턴 및 각 연결어미에 대한 가장 많은 빈도의 영어 번역정보를 가지는 기본 연결패턴을 저장하고 있는 연결패턴 데이터베이스(204)와, 상기 연결패턴 데이터페이스(204)에서 번역하고자 하는 한국어 문장에 적용할 연결패턴을 판단하기 위한 한국어 격틀사전(205)을 포함한다.
영어문장으로 번역하고자 하는 한국어 문장에서 각 용언구를 연결하는 연결어미에 대하여 해당 연결어미의 다양한 쓰임새 중 어떤 역할로 사용되었는지를 판단하기 위하여 연결어미로 연결된 다수의 용언구의 의미를 파악해야 한다.
예를 들어, "나는 그 소식을 듣고 매우 놀라고 슬펐다"라는 문장을 번역할 때, 상기 문장은 3개의 용언구로 구성되어 있으며, 연결어미 '고'로 연결되어 있다. 그러나, '듣고'의 '고'와 '놀라고'의 '고'는 동일한 형태의 연결어미 '고'로용언구가 연결되어 있으나, 그 쓰임은 서로 다르다. 즉, '듣고'의 '고'는 이유를 나타내는 연결어미로 사용되었으므로, 영어 문장에서 'to 부정사' 또는 'because'등을 사용하나, '놀라고'의 '고'는 대등 연결을 뜻하는 연결어미로 사용되어, 영어 문장에서 'and'와 같은 접속사로 연결되어야 한다.
이와 같이, 동일한 어형의 연결어미 '고'의 쓰임이 서로 다른 이유는, 해당 연결어미가 연결하는 문장의 의미가 어떻게 연결되어 있는지에 따라 결정된다.
연결패턴은, 연결어미로 연결된 둘 이상의 한국어 용언구에 대하여 각 용언구의 영어 대역문을 연결하는 접속사를 결정할 수 있는 범위내의 2개 이상의 용언구들을 대상으로 각 용언에 해당하는 격틀정보 및 영어 접속사 정보를 중심으로 기술되며, 용언의 연결에 사용된 영어 접속사 정보, 용언들간의 어순 정보 및 각 용언구의 영어 생성정보를 제공한다.
또한, 연결패턴은, 해당 연결패턴을 적용할 수 있는 조건을 기술하는 한국어 연결패턴 부분과 영어 번역정보를 제공하는 영어 연결패턴 부분으로 나뉘어진다.
상기 한국어 연결패턴 부분은, 괄호를 이용하여 용언구들간의 의존 관계를 기술하며, 각 용언구에 대하여 용언구의 인덱스와 용언구에 대응하는 격틀의 인식자, 용언구의 연결어미 정보로 이루어진다.
그리고, 상기 영어 연결패턴 부분은, 각 한국어 용언구에서 기술된 용언구의 인덱스로 대응하는 영어 용언구를 기술한다. 이 때, 영어 연결패턴 부분에는 괄호 정보로 용언구들간의 의존 관계를 기술하지 않으며, 영어 문장에서 영어 용언구가 나타나는 순서대로 영어 연결패턴에 나타난다.
연결패턴은 연결 어미에 대한 연결 정보 이외에도, 고정 표현을 기술하는 데도 동일한 방법으로 적용되어, 고정 표현의 처리와 연결어미의 처리를 동시에 수행할 수 있다.
'용언구1+연결어미1 용언구2'의 형태로 연결된 경우에, 연결어미1에 해당하는 올바른 접속사 선택을 위해 사용된 연결패턴의 형태는 다음과 같으며, 이는 n(2개 이상)개의 용언구로 확장될 수 있다.
( (용언구1의 인덱스:격틀인덱스,연결어미정보) 용언구2의 인덱스:격틀인덱스)
=> [용언구1의 인덱스:생성정보] [접속사 정보] [용언구2의 인덱스:생성정보]
이제, 첨부된 도 3 을 참조하여 본 발명에 따른 영어 용언구의 연결정보 결정 방법에 대해 상세히 설명하면 다음과 같다.
첨부된 도 3 은 본 발명에 따른 영어 용언구의 연결정보 결정 방법에 대한 일실시예 처리 흐름도이다.
먼저, 입력된 한국어 문장에 대해 형태소 분석 및 구문분석을 수행하고(300), 의존 관계 추출기(200)를 통하여 번역하고자 하는 한국어 문장의 구문 구조 정보로부터 연결패턴을 이용하여 연결 가능한 용언구들의 의존 관계의 조합, 즉 연결어미를 통하여 연결 가능한 모든 용언구의 조합을 추출한다(302).
다음으로, 연결 패턴 탐색기(201)를 통하여 추출된 용언구의 의존 관계 조합에 대하여 적합한 연결 패턴이 연결패턴 데이터베이스(204)내에 있는지를 한국어 격틀사전(205)을 이용하여 조사하고, 적용가능한 연결패턴 리스트를 추출한 후(304), 연결패턴 리스트의 각 연결패턴에 대해 해당 연결패턴이 한국어 연결패턴조건을 만족하는지를 판단한다(306).
상기 판단결과(306), 한국어 연결패턴 조건을 만족하지 않으면, 상기 연결패턴 데이터베이스(204)에서 기본 연결 패턴을 선택하고(308), 한국어 연결패턴 조건을 만족하면, 해당 연결패턴을 선택한다(310).
상기 추출된 모든 용언구들의 연결관계 조합에 대하여 적용할 연결 패턴이 모두 선택되었는지를 판단한다(312).
상기 판단결과(312), 모든 용언구들의 연결관계 조합에 대하여 적용할 연결 패턴이 모두 선택되었으면, 연결패턴 집합 선택기(202)가 선택된 연결 패턴들의 리스트 중에서 번역하고자 하는 한국어 문장의 용언구들의 연결 관계에 대한 영어 접속 정보를 모두 제공할 수 있는 가장 적합한 연결 패턴의 집합을 결정한다(314).
상기 판단결과(312), 모든 용언구들의 연결관계 조합에 대하여 적용할 연결패턴이 모두 선택되지 않았으면, 상기 적용가능한 연결패턴 리스트를 추출하는 과정(304)을 수행한다.
마지막으로, 영어 생성정보 반영기(203)에서 선택된 연결 패턴 집합의 연결 정보를 이용하여 한국어 용언구에 대응하는 영어 용언구의 접속 정보 및 생성 정보를 제공한다(316). 이때, 번역할 한국어 문장이 둘 이상의 연결 패턴으로 연결되는 경우는 한국어 용언구의 의존 관계 정보와 문장에서 용언구의 상대 순서 정보 등을 이용하여 최종적인 영어 용언구들간의 생성 정보를 결정한다.
"나는 그 소식을 듣고 매우 놀라고 슬펐다"라는 예문에서 영어 용언구 연결 정보를 결정하기 위하여 사용되는 연결 패턴은,
( ( [VP1:격틀1] [고] ) [VP2:격틀2] ) => [VP1] [and:대등] [VP2]
( ( [VP1:격틀2] [고] ) [VP2:격틀3] ) => [VP2] [to:이유] [VP2:INF]와 같고, 사용할 연결 패턴을 결정하기 위한 격틀 정보는,
격틀1 ['듣다' : '사람'-주어 '소식'-목적어]
격틀2 ['놀라다' : '사람'-주어]
격틀3 ['슬프다' : '사람'-주어]와 같다.
상기 예문 "나는 그 소식을 듣고 매우 놀라고 슬펐다"에 대하여, 상기 구문 분석기(102)가 구문 분석을 통하여 용언구 단위의 구조 분석을 수행하여 "(나는 (그 소식을 듣고) (매우 놀라고) 슬펐다)"와 같은 형태의 의존 구조를 제공하면, 상기 부분 대역문 연결기(103)는 상기 구문구조 정보로부터 모두 가능한 용언구들간의 연결 관계의 조합을 추출한 후, 추출된 용언구 연결 관계의 후보와 상기 연결패턴 데이터베이스(204)내에 있는 연결패턴들 중 연결패턴의 한국어 용언구의 조건부가 일치하는 연결 패턴이 있는가를 조사하고, 일치하는 연결패턴들 중에서 한국어 문장 전체를 연결할 수 있는 최적의 연결패턴들을 선택한다.
마지막으로, 각 연결패턴의 영어 생성 정보를 올바른 접속사를 선택하고, 영어 생성정보를 제공함으로써, 번역될 영어문장이 " [나는 슬프다] and [놀라다] to [그 소식을 듣다]"의 형태가 됨을 결정하는 것이다.
이상에서 설명한 본 발명은, 본 발명이 속하는 기술분야에서 통상의 지식을 가진 자에 있어 본 발명의 기술적 사상을 벗어나지 않는 범위 내에서 여러 가지 치환, 변형 및 변경이 가능하므로 전술한 실시예 및 첨부된 도면에 한정되는 것이 아니다.
상기와 같은 본 발명은, 한국어 용언구를 연결하는 연결어미에 대하여 연결패턴 및 올바른 연결패턴을 결정하기 위한 한국어 격틀을 이용하여 영어 용언구 연결 및 생성에 관한 번역정보를 제공함으로써, 한국어 연결어미의 역할에 맞는 올바른 영어 접속사를 선택하여 올바른 용언구 단위 영어문장을 생성할 수 있는 효과가 있다.

Claims (6)

  1. 한영번역시스템에 적용되는 영어 용언구의 연결정보 결정 장치에 있어서,
    번역하고자 하는 한국어 문장의 형태소 분석을 수행하는 형태소 분석수단;
    상기 형태소 분석수단의 분석된 정보를 이용하여 용언구 단위의 구조 분석을 수행하는 구문 분석수단;
    상기 구문 분석수단으로부터 한국어 문장의 구문 구조 정보를 수신하여, 연결어미를 통하여 연결 가능한 모든 용언구의 조합을 추출하는 의존관계 추출수단;
    한국어 용언구의 연결패턴 및 각 연결어미에 대한 가장 많은 빈도의 영어 번역정보를 가지는 기본 연결패턴을 저장하고 있는 연결패턴 저장수단;
    상기 연결패턴 저장수단에서 번역하고자 하는 한국어 문장에 적용할 연결패턴을 판단하기 위한 한국어 격틀정보 저장수단;
    상기 연결패턴 저장수단 및 상기 한국어 격틀정보 저장수단을 이용하여 상기 의존관계 추출수단에서 추출된 용언구의 의존 관계 조합에 대하여 적용 가능한 연결 패턴 리스트를 추출하는 연결패턴 탐색수단;
    상기 연결패턴 탐색수단에서 탐색된 연결패턴들 중 번역하고자 하는 한국어 문장의 용언구들의 연결 관계에 대한 영어 접속 정보를 모두 제공할 수 있는 가장 적합한 연결 패턴의 집합을 결정하는 연결패턴 집합 선택수단;
    상기 연결패턴 집합 선택수단에서 선택된 연결패턴 집합의 연결 정보를 이용하여 한국어 용언구에 대응하는 영어 용언구의 접속 정보 및 생성 정보를 제공하는영어 생성정보 반영수단;
    상기 영어 생성정보 반역수단으로부터 수신한 각 용언구에 대한 단문 단위의 영어 번역을 수행하는 부분 대역문 생성수단;
    상기 부분 대역문 생성수단으로부터 단문단위로 번역된 각 용언구에 대해 영어 문장 생성을 위한 성, 수, 시제 일치 정보 및 주어 등의 생략 성분 복원 작업 및 스타일 교정 작업을 수행하는 대역문 정련수단 및
    상기 대역문 정련수단으로부터 정련된 용언구를 수신하여 영어 형태소를 생성하는 형태소 생성수단
    을 포함하는 영어 용언구의 연결정보 결정 장치.
  2. 영어 용언구의 연결정보 결정 장치에 적용되는 영어 용언구의 연결정보 결정 방법에 있어서,
    한국어 문장의 구문구조 정보를 이용하여 모든 용언구의 조합들을 추출하는 제 1 단계;
    상기 추출된 용언구의 연결관계 조합에 대하여 연결 패턴 데이타베이스에서 연결패턴 리스트를 추출하는 제 2 단계;
    상기 연결패턴 리스트에서 추출된 연결패턴이 한국어 연결패턴 조건을 만족하는가를 판단하는 제 3 단계;
    상기 제 3 단계의 판단결과, 한국어 연결패턴 조건을 만족하지 않으면, 상기연결패턴 데이터베이스에서 상기 추출된 용언구에 해당하는 기본 연결패턴을 선택하는 제 4 단계;
    상기 제 3 단계의 판단결과, 한국어 연결패턴 조건을 만족하면, 해당 연결 패턴을 선택하는 제 5 단계;
    상기 추출된 모든 용언구들의 연결관계 조합에 대하여 적용할 연결 패턴이 모두 선택되었는지를 판단하는 제 6 단계;
    상기 제 6 단계의 판단결과, 모든 용언구들의 연결관계 조합에 대하여 적용할 연결 패턴이 모두 선택되었으면, 연결패턴 집합 선택기가 선택된 연결 패턴들의 리스트 중에서 번역하고자 하는 한국어 문장의 용언구들의 연결 관계에 대한 영어 접속 정보를 모두 제공할 수 있는 가장 적합한 연결 패턴의 집합을 결정하는 제 7 단계;
    상기 제 6 단계의 판단결과, 모든 용언구들의 연결관계 조합에 대하여 적용할 연결패턴이 모두 선택되지 않았으면, 상기 제 2 단계로 넘어가는 제 8 단계; 및
    영어 생성정보 반영기에서 상기 선택된 연결 패턴 집합의 연결 정보를 이용하여 한국어 용언구에 대응하는 영어 용언구의 접속 정보 및 생성 정보를 제공하는 제 9 단계
    를 포함하는 영어 용언구의 연결정보 결정 방법.
  3. 제 2 항에 있어서,
    상기 제 1 단계는,
    입력된 한국어 문장에 대해 형태소 분석 및 구문분석을 수행하는 제 10 단계; 및
    번역하고자 하는 한국어 문장의 구문 구조 정보로부터 한국어 용언구들들간의 의존 관계 정보를 이용하여 연결 가능한 용언구들의 연결관계 조합을 추출하는 제 11 단계를 포함하는 영어 용언구의 연결정보 결정 방법.
  4. 제 2 항 또는 제 3 항에 있어서,
    상기 제 2 단계는,
    상기 추출된 용언구의 연결관계 조합에 대하여 적합한 연결 패턴이 연결패턴 데이터베이스내에 존재하는지를 한국어 격틀사전을 이용하여 조사하는 제 12 단계; 및
    상기 추출된 용언구의 연결관계 조합을 이용하여 연결패턴 리스트를 추출하는 제 13 단계를 포함하는 영어 용언구의 연결정보 결정 방법.
  5. 제 2 항에 있어서,
    상기 제 4 단계에서 상기 연결패턴 데이터베이스는,
    한국어 용언구의 연결패턴 및 각 연결어미에 대한 가장 많은 빈도의 영어 번역정보를 가지는 기본 연결패턴을 저장하고 있는 것을 특징으로 하는 영어 용언구 연결정보 결정 방법.
  6. 마이크로 프로세서를 구비한 영어 용언구 연결정보 결정 장치에,
    한국어 문장의 구문구조 정보를 이용하여 모든 용언구의 조합들을 추출하는 제 1 기능;
    상기 추출된 용언구의 연결관계 조합에 대하여 연결 패턴 데이타베이스에서 연결패턴 리스트를 추출하는 제 2 기능;
    상기 연결패턴 리스트에서 추출된 연결패턴이 한국어 연결패턴 조건을 만족하는가를 판단하는 제 3 기능;
    상기 제 3 기능의 판단결과, 한국어 연결패턴 조건을 만족하지 않으면, 상기 연결패턴 데이터베이스에서 상기 추출된 용언구에 해당하는 기본 연결패턴을 선택하는 제 4 기능;
    상기 제 3 기능의 판단결과, 한국어 연결패턴 조건을 만족하면, 해당 연결 패턴을 선택하는 제 5 기능;
    상기 추출된 모든 용언구들의 연결관계 조합에 대하여 적용할 연결 패턴이 모두 선택되었는지를 판단하는 제 6 기능;
    상기 제 6 기능의 판단결과, 모든 용언구들의 연결관계 조합에 대하여 적용할 연결 패턴이 모두 선택되었으면, 연결패턴 집합 선택기가 선택된 연결 패턴들의리스트 중에서 번역하고자 하는 한국어 문장의 용언구들의 연결 관계에 대한 영어 접속 정보를 모두 제공할 수 있는 가장 적합한 연결 패턴의 집합을 결정하는 제 7 기능;
    상기 제 6 기능의 판단결과, 모든 용언구들의 연결관계 조합에 대하여 적용할 연결패턴이 모두 선택되지 않았으면, 상기 제 2 기능으로 넘어가는 제 8 기능; 및
    영어 생성정보 반영기에서 상기 선택된 연결 패턴 집합의 연결 정보를 이용하여 한국어 용언구에 대응하는 영어 용언구의 접속 정보 및 생성 정보를 제공하는 제 9 기능
    을 실현시키기 위한 프로그램을 기록한 컴퓨터로 읽을 수 있는 기록매체.
KR1019990061885A 1999-12-24 1999-12-24 영어 용언구의 연결정보 결정 장치 및 그 방법 KR100311224B1 (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1019990061885A KR100311224B1 (ko) 1999-12-24 1999-12-24 영어 용언구의 연결정보 결정 장치 및 그 방법

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1019990061885A KR100311224B1 (ko) 1999-12-24 1999-12-24 영어 용언구의 연결정보 결정 장치 및 그 방법

Publications (2)

Publication Number Publication Date
KR20010063791A true KR20010063791A (ko) 2001-07-09
KR100311224B1 KR100311224B1 (ko) 2001-10-12

Family

ID=19629448

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1019990061885A KR100311224B1 (ko) 1999-12-24 1999-12-24 영어 용언구의 연결정보 결정 장치 및 그 방법

Country Status (1)

Country Link
KR (1) KR100311224B1 (ko)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100559473B1 (ko) * 2003-12-24 2006-03-10 한국전자통신연구원 스타일 번역 처리시스템 및 방법
KR100725723B1 (ko) * 2005-12-09 2007-06-08 한국전자통신연구원 연결어미 제약을 이용한 한국어 주어의 생략 성분 복원방법 및 장치
KR101117427B1 (ko) * 2009-02-26 2012-03-13 고려대학교 산학협력단 형태소 합성 장치 및 방법

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101092363B1 (ko) 2008-12-22 2011-12-09 한국전자통신연구원 중한자동번역을 위한 한국어 연결어미 생성 방법 및 그 장치

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100559473B1 (ko) * 2003-12-24 2006-03-10 한국전자통신연구원 스타일 번역 처리시스템 및 방법
KR100725723B1 (ko) * 2005-12-09 2007-06-08 한국전자통신연구원 연결어미 제약을 이용한 한국어 주어의 생략 성분 복원방법 및 장치
KR101117427B1 (ko) * 2009-02-26 2012-03-13 고려대학교 산학협력단 형태소 합성 장치 및 방법

Also Published As

Publication number Publication date
KR100311224B1 (ko) 2001-10-12

Similar Documents

Publication Publication Date Title
KR100542755B1 (ko) 규칙 기반 방식과 번역 패턴 방식을 혼합한 하이브리드자동 번역 장치 및 방법과 그 프로그램을 기록한 컴퓨터로읽을 수 있는 기록매체
KR100530154B1 (ko) 변환방식 기계번역시스템에서 사용되는 변환사전을생성하는 방법 및 장치
US20070233460A1 (en) Computer-Implemented Method for Use in a Translation System
EP0839357A1 (en) Method and apparatus for automated search and retrieval processing
JP2006252382A (ja) 質問応答システム、およびデータ検索方法、並びにコンピュータ・プログラム
WO2003083708A2 (en) Machine translation
EP1525539A2 (en) Machine translation
KR20100025885A (ko) 다단계 용언구 패턴을 적용한 번역장치와 이를 위한적용방법 및 추출방법
Schwenk et al. Translation model adaptation for an Arabic/French news translation system by lightly-supervised training
Grishman Iterative alignment of syntactic structures for a bilingual corpus
Messiant A subcategorization acquisition system for French verbs
KR100311224B1 (ko) 영어 용언구의 연결정보 결정 장치 및 그 방법
JPH10312382A (ja) 類似用例翻訳システム
KR101755437B1 (ko) 어휘의미패턴을 이용한 한국어의 기계번역방법
JP4007413B2 (ja) 自然言語処理システム及び自然言語処理方法、並びにコンピュータ・プログラム
KR20200066009A (ko) 한국어 구문 분석을 활용한 정보 처리 시스템
Das et al. Improving cross-lingual model transfer by chunking
KR20120060666A (ko) 통계적 기계 번역에서 명사구 대역 쌍 추출 장치 및 방법
KR100204068B1 (ko) 개념기반 다국어 번역시스템의 문법 자동수정 방법
KR20080029567A (ko) 병렬 말뭉치를 이용한 신조어의 대역어 자동 선정 방법 및장치
Yamada et al. A Method for Automatically Adapting an MT System to Different Domains
KR100481453B1 (ko) 동사구 패턴 기반 한중 자동 번역 시스템의 '하다' 동사의번역장치 및 방법
JP2006190226A (ja) 用言自動換言装置、用言換言方法及び用言換言処理プログラム
JP3388393B2 (ja) データベースを利用したテンス、アスペクトあるいはモダリティに関する翻訳装置
JPH02208775A (ja) 機械翻訳方式

Legal Events

Date Code Title Description
A201 Request for examination
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20070831

Year of fee payment: 7

LAPS Lapse due to unpaid annual fee