KR100333681B1 - 용언 중심 문틀을 이용한 자동 번역 장치 및 그 방법 - Google Patents

용언 중심 문틀을 이용한 자동 번역 장치 및 그 방법 Download PDF

Info

Publication number
KR100333681B1
KR100333681B1 KR1019990061935A KR19990061935A KR100333681B1 KR 100333681 B1 KR100333681 B1 KR 100333681B1 KR 1019990061935 A KR1019990061935 A KR 1019990061935A KR 19990061935 A KR19990061935 A KR 19990061935A KR 100333681 B1 KR100333681 B1 KR 100333681B1
Authority
KR
South Korea
Prior art keywords
door frame
word
band
sentence
language
Prior art date
Application number
KR1019990061935A
Other languages
English (en)
Other versions
KR20010063834A (ko
Inventor
김태완
심철민
여상화
김영길
정한민
최승권
서광준
서영애
박상규
박세영
Original Assignee
오길록
한국전자통신연구원
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 오길록, 한국전자통신연구원 filed Critical 오길록
Priority to KR1019990061935A priority Critical patent/KR100333681B1/ko
Publication of KR20010063834A publication Critical patent/KR20010063834A/ko
Application granted granted Critical
Publication of KR100333681B1 publication Critical patent/KR100333681B1/ko

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/40Processing or translation of natural language
    • G06F40/42Data-driven translation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/268Morphological analysis

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Machine Translation (AREA)

Abstract

본 발명은 용언 중심 문틀을 이용한 자동 번역 장치 및 그 방법과 상기 방법을 실현시키기 위한 프로그램을 기록한 컴퓨터로 읽을 수 있는 기록매체에 관한 것으로, 대량의 용언 문틀 및 상대 언어 대역 문틀을 실제 인간이 사용하는 문장을 대상으로 구축하여 번역 지식화하고 실제 번역시 번역 지식화된 자료를 이용하는 자동 번역 장치 및 그 방법과 상기 방법을 실현시키기 위한 프로그램을 기록한 컴퓨터로 읽을 수 있는 기록매체를 제공하고자 하며, 그를 위해, 용언 중심 문틀을 이용한 자동 번역 장치에 있어서, 번역하고자 하는 원문을 입력받아, 상기 원문의 형태소를 분석하고 각 단어의 품사를 결정하기 위한 원문 확인수단; 상기 원문 확인수단을 통해 형태소를 분석하고 각 단어의 품사가 결정된 상기 원문에 대해, 하나의 단어나 구처럼 취급되는 단어들을 묶어 연속된 고정 표현으로 인식하도록 하기 위한 고정 표현 인식수단; 상기 고정 표현 인식 수단을 통해 고정 표현을 인식한 상기 원문에 대해, 용언을 발견하고 상기 발견된 개별 용언들에 대한 미리 설정된 복수개 문틀을 입력 문장과 비교하여 각 용언의 최적 문틀을 결정하고 상기 원문의 최적 문틀에 대응하는 상대 언어 대역 문틀을 결정하기 위한 문틀 결정수단; 및 상기 문틀 결정수단을 통해 결정된 상대 언어 대역 문틀에 대해, 상기 문틀 결정수단에서 발견된 상기 원문의 각 용언별로 대응되는 상대 언어 대역 문틀을 조합하여 전체 대역 문장을 생성하고, 상기 상대 언어의 고유 특징을 감안한 형태소 단위의 번역을 통해 상대 언어 번역문을 완성시키기 위한 대역문 완성수단을 포함하며, 번역 시스템 등에 이용됨.

Description

용언 중심 문틀을 이용한 자동 번역 장치 및 그 방법{AUTOMATIC TRANSLATION APPARATUS AND METHOD USING VERB-BASED SENTENCE FRAME}
본 발명은 용언 중심 문틀을 이용한 자동 번역 장치 및 그 방법과 상기 방법을 실현시키기 위한 프로그램을 기록한 컴퓨터로 읽을 수 있는 기록매체에 관한 것으로, 특히 용언이 갖는 고유하고 다양한 문틀을 이용하여 원문으로부터 자연스러운 대역문을 만들어내는 자동 번역 장치 및 그 방법과 상기 방법을 실현시키기 위한 프로그램을 기록한 컴퓨터로 읽을 수 있는 기록매체에 관한 것이다.
기계 번역은 1950년대부터 연구되어 오면서 다양한 번역 기법을 선보여 왔다. 가장 보편적인 방법으로는 원문에 대해 어휘 분석, 구문 분석, 변환, 생성 과정을 거치는 것으로, 직관적이며 간단하기는 하나 실생활에 나타나는 언어 현상을 파악하지 못하고 문법적으로만 판단하여 모든 가능한 조합의 결과를 생성해냄으로써 수많은 애매성을 발생시키고 의미적으로 이해할 수 없는 대역문들을 만들어낸다는 문제점을 가진다. 이의 극복을 위해 위의 방법에 숙어 인식을 추가하거나, 구문 필터링/선택 기법을 도입하였으나, 이들 역시 문장 레벨의 구문 분석이 가지는 자유로운 언어 생성을 막지는 못했다.
이에 번역 메모리나 문장 예제를 이용하는 말뭉치 기반의 번역 방법들이 연구되어 이미 구축되어 있는 패턴들에 대해서는 어느 정도의 성능을 보장하였으나,현실적으로 이러한 패턴들을 모두 구축하는 것이 불가능하여 제한된 영역에서만 실험적으로 사용되는 문제점이 있었다. 그 외에도 학습된 분야에서만 일정한 성능을 발휘하는 통계학적 기반의 번역 방법론이 있으나, 학습 영역을 넓히기 힘들다는 문제점은 여전히 해결하지 못하였다.
본 발명은, 상기한 바와 같은 문제점을 해결하기 위하여 안출된 것으로, 대량의 용언 문틀 및 상대 언어 대역 문틀을 실제 인간이 사용하는 문장을 대상으로 구축하여 번역 지식화하고 실제 번역시 번역 지식화된 자료를 이용하는 자동 번역 장치 및 그 방법과 상기 방법을 실현시키기 위한 프로그램을 기록한 컴퓨터로 읽을 수 있는 기록매체를 제공하는데 그 목적이 있다.
도 1 은 본 발명에 따른 용언 중심 문틀을 이용한 자동 번역 장치에 대한 일실시예 구성도.
도 2 는 본 발명에 따른 용언 중심 문틀을 이용한 자동 번역 방법에 대한 일실시예 흐름도.
도 3a 및 도 3b 는 본 발명에 따른 용언 중심 문틀을 이용한 자동 번역 장치에 의한 자동 번역의 일실시예 설명도.
*도면의 주요 부분에 대한 부호의 설명
101 : 입력 장치 102 : 형태소 분석부
103 : 품사 결정부 104 : 고정 표현 인식부
105 : 용언 발견부 106 : 문틀 탐색부
107 : 문장 구조 결정부 108 : 대역 문틀 조합부
109 : 대역어 생성부 110 : 인쇄부
111 : 인쇄 장치 112 : 표시 제어부
113 : 표시 장치
상기 목적을 달성하기 위한 본 발명의 장치는, 용언 중심 문틀을 이용한 자동 번역 장치에 있어서, 번역하고자 하는 원문을 입력받아, 상기 원문의 형태소를 분석하고 각 단어의 품사를 결정하기 위한 원문 확인수단; 상기 원문 확인수단을 통해 형태소를 분석하고 각 단어의 품사가 결정된 상기 원문에 대해, 하나의 단어나 구처럼 취급되는 단어들을 묶어 연속된 고정 표현으로 인식하도록 하기 위한 고정 표현 인식수단; 상기 고정 표현 인식 수단을 통해 고정 표현을 인식한 상기 원문에 대해, 용언을 발견하고 상기 발견된 개별 용언들에 대한 미리 설정된 복수개 문틀을 입력 문장과 비교하여 각 용언의 최적 문틀을 결정하고 상기 원문의 최적 문틀에 대응하는 상대 언어 대역 문틀을 결정하기 위한 문틀 결정수단; 및 상기 문틀 결정수단을 통해 결정된 상대 언어 대역 문틀에 대해, 상기 문틀 결정수단에서 발견된 상기 원문의 각 용언별로 대응되는 상대 언어 대역 문틀을 조합하여 전체 대역 문장을 생성하고, 상기 상대 언어의 고유 특징을 감안한 형태소 단위의 번역을 통해 상대 언어 번역문을 완성시키기 위한 대역문 완성수단을 포함하는 것을 특징으로 한다.
또한, 본 발명의 방법은, 용언 중심 문틀을 이용한 자동 번역 장치에 적용되는 자동 번역 방법에 있어서, 번역하고자 하는 원문을 입력받아, 상기 원문의 형태소를 분석하고 각 단어의 품사를 결정하는 제 1 단계; 하나의 단어나 구처럼 취급되는 단어들을 묶어 연속된 고정 표현으로 인식하는 제 2 단계; 상기 형태소 분석 및 고정 표현 인식을 통하여 분석된 상기 원문에서 용언을 발견하는 제 3 단계; 상기 발견된 개별 용언들에 대해 미리 설정된 복수개의 문틀을 상기 입력된 원문과 비교하여, 상기 발견된 각각의 용언별 최적 문틀과 그에 대응되는 용언별 상대 언어 대역 문틀을 결정하는 제 4 단계; 및 상기 결정된 용언별 상대 언어 대역 문들에 대해, 상기 용언별 상대 언어 대역 문틀을 조합하여 어순, 문법에 따른 전체 대역 문장을 생성하고, 상기 상대 언어의 형태소별 고유 특징을 감안한 번역문을 완성하는 제 5 단계를 포함하는 것을 특징으로 한다.
또한, 본 발명은, 프로세서를 구비한 용언 중심 문틀을 이용한 자동 번역 장치에, 번역하고자 하는 원문을 입력받아, 상기 원문의 형태소를 분석하고 각 단어의 품사를 결정하는 제 1 기능; 하나의 단어나 구처럼 취급되는 단어들을 묶어 연속된 고정 표현으로 인식하는 제 2 기능; 상기 형태소 분석 및 고정 표현 인식을 통하여 분석된 상기 원문에서 용언을 발견하는 제 3 기능; 상기 발견된 개별 용언들에 대해 미리 설정된 복수개의 문틀을 상기 입력된 원문과 비교하여, 상기 발견된 각각의 용언별 최적 문틀과 그에 대응되는 용언별 상대 언어 대역 문틀을 결정하는 제 4 기능; 및 상기 결정된 용언별 상대 언어 대역 문들에 대해, 상기 용언별 상대 언어 대역 문틀을 조합하여 어순, 문법에 따른 전체 대역 문장을 생성하고, 상기 상대 언어의 형태소별 고유 특징을 감안한 번역문을 완성하는 제 5 기능을 실현시키기 위한 프로그램을 기록한 컴퓨터로 읽을 수 있는 기록매체를 제공한다.
본 발명은, 자동 번역에서 문제시되고 있는 문장 분석, 구조 변환 및 어휘 변환을 수행하는 자동 번역 방식의 문제점을 해결하기 위한 것으로, 입력된 문장의 구조를 파악하기 위하여 문장 구조를 결정하는 중요한 요소인 용언을 탐지한 후, 탐지된 각 용언이 가질 수 있는 다양한 문틀의 조합과 입력 문장을 비교, 대조하여 최적의 문장 구조를 결정하고, 이를 바탕으로 대역문의 용언 단위 문틀을 결정한 후, 형태소 분석을 통한 용언 단위 대역 문틀의 조합에 의해 대역 문장을 생성해 냄으로써 기존의 자동 번역에서 구문 분석으로 인해 발생하는 구조적 모호성 및 분석 결과의 폭발, 구조 변환의 애매성 문제를 극복하고자 한다.
즉, 본 발명은, 용언이 갖는 다양한 문틀을 데이터베이스화 한 후, 원문을 구성하는 어휘들 중에서 용언들을 발견하고 각 용언들이 가질 수 있는 문틀과 원문의 구성을 대조하여 최적 문장 구조를 선택하고 해당 용언 문틀에 대한 상대 언어 용언 문틀을 추출한 후, 원문틀의 격 인수들에 해당하는 단어들의 대역을 상대 언어 용언 문틀의 격인수로 할당함으로써 자연스러운 대역문을 만들어낼 수 있는 고품질과 고속 번역을 위한 수단 및 그 방법에 관한 것이다.
본 발명은, 고품질과 고속의 자동 번역을 요구하는 다양한 번역 응용 분야에 적응할 수 있도록 기존의 기계 번역 방법에서 문제가 되었던 상향식의 구문 분석이 가지는 애매성 폭발 및 대역 구문의 무제한 생성, 패턴 기반의 하향식 방법이 가지는 패턴 기술의 어려움 및 커버리지를 보완하는 절충적인 형태를 취한다.
이를 위해 용언 중심 문틀을 이용하는 본 방법을 제안하여 구문 분석의 범위를 제한하여 애매성의 증가를 막으며, 문장을 구성하는 용언들이 갖는 다양하고 고유한 문틀의 조합으로부터 최적인 전체 문틀을 발견하는 방법을 취함으로써 원문 분석의 폭발성, 대역 구문의 무제한 생성 및 패턴의 커버리지를 크게 향상시킨다.
본 발명에서 설명하는 용언 중심 문틀을 이용한 기계번역 방식에 있어서 문틀이라 함은 용언이 가질 수 있는 문형을 이야기 하며, 이때 문형은 실제 인간에 의해 사용된 표층 문장에서 나타난 그대로의 격표지와 그것을 통제하는 용언이 나타난 형태를 말한다.
따라서, 지금까지 하나의 용언에 대해서 항상 나타나야만 하는 격과 격표지, 임의로 나타날 수 있는 격과 격표지 등으로 가능한 한 문형을 범용화하여 표현하였던 것과는 달리, 본 기계 번역 방식에서는 문장에 나타난 표층 형태가 다를 경우에는 각각을 모두 다른 문형으로 본다.
또한, 각 용언의 문형들에 대해 그에 해당하는 상대 언어 문형을 쌍으로 하여 번역 지식화한다.
상술한 목적, 특징들 및 장점은 첨부된 도면과 관련한 다음의 상세한 설명을 통하여 보다 분명해 질 것이다. 이하, 첨부된 도면을 참조하여 본 발명에 따른 바람직한 일실시예를 상세히 설명한다.
도 1 은 본 발명에 따른 용언 중심 문틀을 이용한 자동 번역 장치에 대한 일실시예 구성도이다.
도 1 은 용언 중심 문틀을 이용한 자동 번역 수단의 개념을 설명하기 위해 도시한 구성도이다.
입력 장치(101)를 통해 들어온 원문은 형태소 분석부(102)를 거쳐 각각의 단어에 대해 형태소 분석되며, 품사 결정부(103)에서 그 단어들의 품사가 결정된다.
고정 표현 인식부(104)에서는 숙어, 복합 명사, 연어 등과 같이 하나의 단어나 구처럼 취급되는 단어들을 묶고 그에 해당하는 새로운 품사를 부착한다. 고정표현을 인식함으로써 구문 분석이나 문틀의 설정을 보다 단순화시킬 수 있다.
용언 발견부(105)는 문장에서 나타난 용언들을 발견하여 문틀 탐색의 중심으로 삼는다.
문틀 탐색부(106)는 발견된 용언을 탐색키로 하여 각 용언에 대해 지금까지 구축된 번역 지식으로부터 해당하는 용언이 갖는 모든 표층 형태의 문틀을 탐색한다.
문장 구조 결정부(107)는 입력 문장에서 나타난 용언들이 가질 수 있는 각각의 모든 문틀과 실제 입력 문장에서 나타난 모든 격 표지와의 조합을 생성한 후, 격틀과 상호 정보 등 각 용언과 그 격틀에 올 수 있는 체언과의 의미 유사도, 공기 확률 등을 이용하여 가장 최적인 입력 문장의 구조를 결정한다. 이렇게 입력 문장의 구조가 결정되면 입력 문장에서 나타난 용언들이 가질 수 있는 복수개의 문틀 중에서 해당 입력 문장에서 사용된 문틀이 일의적으로 결정된다.
따라서, 그 문틀에 쌍으로 구축되어 있던 상대 언어 대역 문틀 또한 일의적으로 결정된다. 이렇게 얻어진 대역 문틀은 입력 문장을 구성하는 개별 용언에 대한 대역 문틀이므로, 이것만으로는 상대 언어의 자연스러운 표층문을 생성할 수 없다.
이러한 용언 단위 대역 문틀을 상대 언어의 어순, 문법에 맞도록 하면서 전체 문장 범위의 대역문을 생성하는 역할을 대역 문틀 조합부(108)에서 담당한다. 여기서는 단위 용언 문틀을 컴포지셔날(Compositional)하게 조합하여 전체 문장을 만들어 내기 위한 단위 대역 문틀 연결 패턴 및 관계절 처리 규칙이 필요하다.
대역 문틀 조합부(108)에서 만들어진 전체 입력 문장 범위의 대역 문장은 구 또는 절 수준에서의 전체적인 어순 및 문법만을 반영한 결과로서 상대 언어 고유의 활용 규칙, 수의 일치 등 형태소 수준의 처리는 미흡한 상태이다. 이러한 형태소 수준에서의 문법 처리를 수행함으로써 하나의 완전한 상대 언어 대역문을 만들어 내는 것은 대역어 생성부(109)에서 처리한다. 입력 문장에 대응하여 만들어진 대역 문장은 인쇄 장치(111)나 표시 장치(113)로 출력된다.
도 2 는 본 발명에 따른 용언 중심 문틀을 이용한 자동 번역 방법에 대한 일실시예 흐름도이다.
우선, 원문을 입력받아(201), 형태소 분석 및 품사 결정을 수행하고(202), 숙어, 복합 명사, 연어 등과 같이 하나의 단어나 구로 취급되는 고정 표현을 인식한다(203).
입력된 문장에서 나타나는 용언을 발견하여 문틀 탐색의 중심으로 삼아(204), 모든 표층 형태의 문틀을 탐색하고 최적의 입력 문장의 구조를 결정한다(205).
결정된 문장 구조에 따라 사용되는 문틀이 일의적으로 결정되며 그 문틀에 쌍으로 구축되어 있던 상대 언어 대역 문틀 또한 일의적으로 결정되어 단위 대역문을 생성한다(206).
대역 문틀 조합부(108)에서 구 또는 절 수준에서 전체적인 어순 및 문법만을 반영하여 대역 문틀을 조합하고(207), 번역될 상대 언어 고유의 활용 규칙, 수의 일치 등의 형태소 수준의 처리를 대역문 생성부에서 처리하여 입력 문장에 대응하여 번역된 대역 문장을 생성한다(208).
도 3a 및 도 3b 는 본 발명에 따른 용언 중심 문틀을 이용한 자동 번역 장치에 의한 자동 번역의 일실시예 설명도이다.
도 3a 및 도 3b 에서는 본 발명에 따른 용언 중심 문틀을 이용한 자동 번역의 개념을 설명하기 위해 도시한 실시예로서 한영 번역을 예로 들어, 한국어 입력 문장 '러시아 세관 당국은 방사능 물질을 몰래 싣고 북한으로 들어가던 러시아 기관차 2대를 적발한 뒤에 열흘째 억류한 채 수사를 계속하고 있습니다'에 대해 형태소 분석 및 품사 결정, 고정 표현 인식, 용언 발견, 문틀 탐색, 문장 구조 결정, 대역문틀 조합, 그리고 대역어 생성 과정을 거쳐 'After they found two_Russian locomotives which loaded the radioactive substances secretly and entered to North Korea, the customs authorities of Russia have been investigating with detaining ten_days.'라는 영어 문장을 생성하는 예를 보여준다.
이상에서 설명한 본 발명은 전술한 실시예 및 첨부된 도면에 의해 한정되는 것이 아니고, 본 발명의 기술적 사상을 벗어나지 않는 범위 내에서 여러 가지 치환, 변형 및 변경이 가능하다는 것이 본 발명이 속하는 기술분야에서 통상의 지식을 가진 자에게 있어 명백할 것이다.
상기한 바와 같은 본 발명은, 용언 중심 문틀을 이용하여 자동 번역을 수행함으로써 분야에 관계없이 원문으로부터 고품질의 자연스러운 대역문을 고속으로만들어낼 수 있어, 자연어 처리의 전 분야에서 번역 기능을 제공할 수 있는 효과가 있다.

Claims (8)

  1. 용언 중심 문틀을 이용한 자동 번역 장치에 있어서,
    번역하고자 하는 원문을 입력받아, 상기 원문의 형태소를 분석하고 각 단어의 품사를 결정하기 위한 원문 확인수단;
    상기 원문 확인수단을 통해 형태소를 분석하고 각 단어의 품사가 결정된 상기 원문에 대해, 하나의 단어나 구처럼 취급되는 단어들을 묶어 연속된 고정 표현으로 인식하도록 하기 위한 고정 표현 인식수단;
    상기 고정 표현 인식 수단을 통해 고정 표현을 인식한 상기 원문에 대해, 용언을 발견하고 상기 발견된 개별 용언들에 대한 미리 설정된 복수개 문틀을 입력 문장과 비교하여 각 용언의 최적 문틀을 결정하고 상기 원문의 최적 문틀에 대응하는 상대 언어 대역 문틀을 결정하기 위한 문틀 결정수단; 및
    상기 문틀 결정수단을 통해 결정된 상대 언어 대역 문틀에 대해, 상기 문틀 결정수단에서 발견된 상기 원문의 각 용언별로 대응되는 상대 언어 대역 문틀을 조합하여 전체 대역 문장을 생성하고, 상기 상대 언어의 고유 특징을 감안한 형태소 단위의 번역을 통해 상대 언어 번역문을 완성시키기 위한 대역문 완성수단
    을 포함하는 용언 중심 문틀을 이용한 자동 번역 장치.
  2. 제 1 항에 있어서,
    상기 문틀 결정수단은,
    입력 문장 품사 결정 목록으로부터 상기 입력된 원문에 출현하는 용언들을 발견하고 상기 발견된 각 용언별로 미리 입력된 복수개 문틀과 상기 입력된 원문과 조합 대조하여 각 용언들에 대해 최적인 용언 문틀을 결정하는 것을 특징으로 하는 용언 중심 문틀을 이용한 자동 번역 장치.
  3. 삭제
  4. 삭제
  5. 제 1 항 또는 제 2 항에 있어서,
    상기 대역문 완성수단은,
    용언 단위로 생성된 대역 문틀을 상대 언어의 어순, 문법에 맞도록 하면서 전체 문장 범위의 대역문을 생성하기 위한 대역 문틀 조합수단; 및
    상대 언어 고유의 활용 규칙, 수의 일치를 포함하는 형태소 수준에서의 상대 언어의 고유 특징을 감안한, 완성된 대역문을 만들어 내기 위한 대역어 생성수단
    을 포함하는 용언 중심 문틀을 이용한 자동 번역 장치.
  6. 용언 중심 문틀을 이용한 자동 번역 장치에 적용되는 자동 번역 방법에 있어서,
    번역하고자 하는 원문을 입력받아, 상기 원문의 형태소를 분석하고 각 단어의 품사를 결정하는 제 1 단계;
    하나의 단어나 구처럼 취급되는 단어들을 묶어 연속된 고정 표현으로 인식하는 제 2 단계;
    상기 형태소 분석 및 고정 표현 인식을 통하여 분석된 상기 원문에서 용언을 발견하는 제 3 단계;
    상기 발견된 개별 용언들에 대해 미리 설정된 복수개의 문틀을 상기 입력된 원문과 비교하여, 상기 발견된 각각의 용언별 최적 문틀과 그에 대응되는 용언별 상대 언어 대역 문틀을 결정하는 제 4 단계; 및
    상기 결정된 용언별 상대 언어 대역 문들에 대해, 상기 용언별 상대 언어 대역 문틀을 조합하여 어순, 문법에 따른 전체 대역 문장을 생성하고, 상기 상대 언어의 형태소별 고유 특징을 감안한 번역문을 완성하는 제 5 단계
    를 포함하는 용언 중심 문틀을 이용한 자동 번역 방법.
  7. 제 6 항에 있어서,
    상기 제 5 단계는,
    용언 단어의 생성된 대역 문틀을 상대 언어의 어순, 문법에 맞도록 하면서 전체 문장 범위의 대역문을 생성하는 제 6 단계; 및
    상대 언어 고유의 활용 규칙, 수의 일치를 포함하는 형태소 수준에서의 상대 언어의 고유 특징을 감안한 번역문을 완성하는 제 7 단계
    를 포함하는 용언 중심 문틀을 이용한 자동 번역 방법.
  8. 프로세서를 구비한 용언 중심 문틀을 이용한 자동 번역 장치에,
    번역하고자 하는 원문을 입력받아, 상기 원문의 형태소를 분석하고 각 단어의 품사를 결정하는 제 1 기능;
    하나의 단어나 구처럼 취급되는 단어들을 묶어 연속된 고정 표현으로 인식하는 제 2 기능;
    상기 형태소 분석 및 고정 표현 인식을 통하여 분석된 상기 원문에서 용언을 발견하는 제 3 기능;
    상기 발견된 개별 용언들에 대해 미리 설정된 복수개의 문틀을 상기 입력된 원문과 비교하여, 상기 발견된 각각의 용언별 최적 문틀과 그에 대응되는 용언별 상대 언어 대역 문틀을 결정하는 제 4 기능; 및
    상기 결정된 용언별 상대 언어 대역 문들에 대해, 상기 용언별 상대 언어 대역 문틀을 조합하여 어순, 문법에 따른 전체 대역 문장을 생성하고, 상기 상대 언어의 형태소별 고유 특징을 감안한 번역문을 완성하는 제 5 기능
    을 실현시키기 위한 프로그램을 기록한 컴퓨터로 읽을 수 있는 기록매체.
KR1019990061935A 1999-12-24 1999-12-24 용언 중심 문틀을 이용한 자동 번역 장치 및 그 방법 KR100333681B1 (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1019990061935A KR100333681B1 (ko) 1999-12-24 1999-12-24 용언 중심 문틀을 이용한 자동 번역 장치 및 그 방법

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1019990061935A KR100333681B1 (ko) 1999-12-24 1999-12-24 용언 중심 문틀을 이용한 자동 번역 장치 및 그 방법

Publications (2)

Publication Number Publication Date
KR20010063834A KR20010063834A (ko) 2001-07-09
KR100333681B1 true KR100333681B1 (ko) 2002-04-22

Family

ID=19629495

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1019990061935A KR100333681B1 (ko) 1999-12-24 1999-12-24 용언 중심 문틀을 이용한 자동 번역 장치 및 그 방법

Country Status (1)

Country Link
KR (1) KR100333681B1 (ko)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100480345B1 (ko) * 2002-03-27 2005-04-06 서호일 언어코드를 사용한 언어 학습/번역 서비스 시스템 및 그방법

Also Published As

Publication number Publication date
KR20010063834A (ko) 2001-07-09

Similar Documents

Publication Publication Date Title
KR100911621B1 (ko) 한영 자동번역 방법 및 장치
US6223150B1 (en) Method and apparatus for parsing in a spoken language translation system
US6243669B1 (en) Method and apparatus for providing syntactic analysis and data structure for translation knowledge in example-based language translation
US6356865B1 (en) Method and apparatus for performing spoken language translation
US6910004B2 (en) Method and computer system for part-of-speech tagging of incomplete sentences
US6282507B1 (en) Method and apparatus for interactive source language expression recognition and alternative hypothesis presentation and selection
US6278968B1 (en) Method and apparatus for adaptive speech recognition hypothesis construction and selection in a spoken language translation system
US5146406A (en) Computer method for identifying predicate-argument structures in natural language text
US20150081277A1 (en) System and Method for Automatically Classifying Text using Discourse Analysis
US20070011132A1 (en) Named entity translation
KR20030044949A (ko) 모빌적 형상 개념을 기초로 한 구문 분석방법 및 이를이용한 자연어 검색 방법
JP2003016061A (ja) 自動自然言語翻訳
Comas et al. Sibyl, a factoid question-answering system for spoken documents
Mara English-Wolaytta Machine Translation using Statistical Approach
KR100333681B1 (ko) 용언 중심 문틀을 이용한 자동 번역 장치 및 그 방법
Bahadur et al. Machine translation—A journey
Shukla et al. A Framework of Translator from English Speech to Sanskrit Text
KR100420474B1 (ko) 부분문틀을 이용한 장문 번역 장치 및 그 방법
Sankaravelayuthan et al. A Comprehensive Study of Shallow Parsing and Machine Translation in Malaylam
Neme An arabic language resource for computational morphology based on the semitic model
Patkar et al. A Neural Network Based Machine Translation model For English To Ahirani Language
Bayer et al. Theoretical and computational linguistics: toward a mutual understanding
Nolan et al. UniArab: RRG Arabic-to-English machine translation
Villavicencio et al. Part-of-speech tagging for portuguese texts
Phyue Unknown word detection via syntax analyzer

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20100401

Year of fee payment: 9

LAPS Lapse due to unpaid annual fee