KR100204068B1 - 개념기반 다국어 번역시스템의 문법 자동수정 방법 - Google Patents

개념기반 다국어 번역시스템의 문법 자동수정 방법 Download PDF

Info

Publication number
KR100204068B1
KR100204068B1 KR1019960054591A KR19960054591A KR100204068B1 KR 100204068 B1 KR100204068 B1 KR 100204068B1 KR 1019960054591 A KR1019960054591 A KR 1019960054591A KR 19960054591 A KR19960054591 A KR 19960054591A KR 100204068 B1 KR100204068 B1 KR 100204068B1
Authority
KR
South Korea
Prior art keywords
grammar
file
word
concept
reference word
Prior art date
Application number
KR1019960054591A
Other languages
English (en)
Other versions
KR19980036108A (ko
Inventor
최운천
Original Assignee
정선종
한국전자통신연구원
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 정선종, 한국전자통신연구원 filed Critical 정선종
Priority to KR1019960054591A priority Critical patent/KR100204068B1/ko
Publication of KR19980036108A publication Critical patent/KR19980036108A/ko
Application granted granted Critical
Publication of KR100204068B1 publication Critical patent/KR100204068B1/ko

Links

Abstract

1. 청구 범위에 기재된 발명이 속한 기술분야
개념기반 다국어 번역시스템에서의 문법 자동수정 방법
2. 발명이 해결하려고 하는 기술적 과제
모든 문법파일을 하나씩 열어서 문법파일내에 기술된 문법을 기준단어 사전과 비교한 후에 수정이 필요한 문법을 기준단어에 따라 분리해 주는 문법 자동수정 방법을 제공하고자 함.
3. 발명의 해결방법의 요지
하나의 문법 파일을 여는 제 1 단계; 오픈한 파일내에서 한 문장을 읽어오는 제 2 단계; 읽어온 문장내의 모든 단어에 대하여 단어의 종류를 판단하여 단어의 종류가 한글이 아닌 경우에는 추출한 단어를 그대로 남겨두고, 단어의 종류가 한글이면 기준단어 사전을 이용하여 모든 기준단어를 검색하여 기준단어에 의해 토큰을 분리한 다음에 토큰 리스트를 출력하는 제 3 단계; 파일내의 모든 문장에 대하여 상기 제 2 단계부터 반복 수행하는 제 4 단계; 및 지정된 모든 문법파일에 대하여 상기 제 1 단계부터 반복 수행하는 제 5 단계를 포함한다.
4. 발명의 중요한 용도
개념기반 다국어 번역시스템의 문법 자동수정에 이용됨.

Description

개념기반 다국어 번역시스템의 문법 자동수정 방법
본 발명은 한국어를 해석하여 다국어로 번역하여 주는 개념기반 다국어 번역시스템에서 기준단어 사전이 변경될 때마다 해석문법과 다국어 생성문법을 자동으로 수정하는 문법 자동수정 방법에 관한 것이다.
다국어 번역시스템은 컴퓨터를 이용하여 동시에 여러 나라 언어로 번역을 해주는 시스템이다. 예를들면 한국어를 영어나 일어, 독일어 등으로 번역해주고, 영어를 한국어, 일어, 독일어 등으로 번역해 주는 시스템이다.
개념기반 번역시스템은 개념을 이용하여 문장을 해석하고 번역해 주는 시스템이다. 개념기반 번역시스템은 언어학적 지식에 중심을 두고 형태소 해석, 구문해석과 같이 각 단계별로 번역을 하는 방식이 아닌, 의미에 바탕을 둔 개념구조를 이용하여 한번에 번역을 하는 방식이다. 이 방법은 비문법적인 요소가 많은 대화체 문장을 처리하는데 아주 유리한 방법이다.
개념기반 번역시스템은 한국어 처리를 위해 기준단어 사전과 토큰 분리기를 사용한다. 모든 입력문은 해석되기 전에 토큰 분리기를 통하여 기준단어에 따라 분리되게 된다. 이렇게 분리된 입력은 해석문법과 비교되어 개념구조를 만들고, 그 개념구조는 생성문법에 따라 목적언어로 번역되게 된다.
개념기반 번역시스템에서의 개념은 필요에 따라 수정될 수도 있고, 같은 개념내에 새로운 표현이나 단어가 추가될 수 있다. 교착어인 한국어 처리를 위해 개념을 나타내는 데에 중요한 역할을 하는 단어가 기준단어이다. 기준단어를 이용하여 토큰을 분리하므로써 해석문법과 생성문법 작성이 수월해지고, 문법의 크기도 대폭 줄일 수 있어 기준단어의 이용은 매우 유용하다.
그러나, 기준단어는 입력된 문장에 대한 토큰 분리에만 사용되는 것이 아니라 해석문법과 생성문법에도 그대로 반영되어야 한다. 그래서, 기준단어 사전이 수정될 때마다 해당되는 해석문법 파일과 생성문법 파일도 같이 수정되어야 한다. 하나의 개념은 하나의 파일로 나타낸다. 그 개념은 해석과 생성을 위해 따로따로 존재하여야 한다. 즉, 한 개념은 하나의 해석문법 파일과 목적언어 수만큼의 생성문법 파일을 필요로 한다. 만약, 번역시스템에서 사용하는 개념의 수가 200개이면서, 기준단어 사전이 수정되면 적어도 200개의 파일을 수정해야 한다. 실제로는 해석파일과 각 언어에 대한 생성문법이 따로따로 존재하기 때문에 더 많은 수의 파일을 수정해야 한다. 예를 들면 한국어를 해석하여 영어, 일어, 한국어로 생성할 경우라면 최대 800개(200x4)의 파일을 수정해야 한다.
그런데, 종래에는 이렇게 많는 파일을 일일이 수작업으로 검색하고 수정하였기 때문에 시간과 노력이 많이 들고, 실수할 가능성도 높은 문제점이 있었다.
상기 문제점을 해결하기 위하여 안출된 본 발명은, 개념기반 다국어 번역시스템에서 기준단어 사전이 수정되었을 때 관련된 모든 문법파일을 자동으로 수정하기 위하여 모든 문법파일(해석문법, 생성되는 다국어 각각의 생성문법)을 하나씩 열어서 문법파일내에 기술된 문법을 기준단어 사전과 비교한 후에 수정이 필요한 문법을 기준단어에 따라 분리해 주므로써 자동으로 문법파일을 수정하는 문법 자동수정 방법을 제공하는데 그 목적이 있다.
도 1 은 본 발명이 적용되는 하드웨어의 기본 구성도,
도 2 는 본 발명이 적용되는 개념기반 다국어 번역시스템의 구성도,
도 3 은 본 발명에 따른 문법 자동수정 방법의 개념도,
도 4 는 본 발명에 따른 문법 자동수정 방법에 대한 처리 흐름도,
도 5A 및 5B 는 본 발명에 따른 문법 자동수정 방법의 일예시도.
* 도면의 주요 부분에 대한 부호의 설명
11 : 문자 입력 장치 12 : 중앙 처리 장치
13 : 기준단어 사전 14 : 문자 출력 장치
22 : 토큰 분리기 25 : 개념기반 해석기
26 : 개념기반 생성기 33 : 문법 자동수정기
상기 목적을 달성하기 위하여 본 발명은, 개념기반 다국어 번역시스템에 적용되는 문법 자동수정 방법에 있어서, 하나의 문법 파일을 여는 제 1 단계; 오픈한 파일내에서 한 문장을 읽어오는 제 2 단계; 읽어온 문장내의 모든 단어에 대하여 한 단어씩 추출한 후에 추출한 단어의 종류를 판단하여 단어의 종류가 한글이 아닌 경우에는 추출한 단어를 그대로 남겨두고, 단어의 종류가 한글이면 기준단어 사전을 이용하여 모든 기준단어를 검색하여 기준단어에 의해 토큰을 분리한 다음에 토큰 리스트를 출력하는 제 3 단계; 파일내의 모든 문장에 대하여 상기 제 2 단계부터 반복 수행하는 제 4 단계; 및 지정된 모든 문법파일에 대하여 상기 제 1 단계부터 반복 수행하는 제 5 단계를 포함한다.
이하, 첨부된 도면을 참조하여 본 발명에 따른 일실시예를 상세히 설명한다.
도 1 은 본 발명이 적용되는 하드웨어의 기본 구성도로서, 도면에서 11은 문자 입력 장치, 12는 중앙 처리 장치, 13은 기준단어 사전, 14는 문자 출력 장치를 각각 나타낸다.
다국어 번역시스템이 적용되는 하드웨어는 다국어 문자를 입력받는 문자 입력 장치(11), 다국어 문자를 출력하는 문자 출력 장치(14), 개념 표현에 중요한 역할을 하는 단어들의 모임이 데이타베이스로 구성된 기준단어 사전(13), 본 발명이 탑재되어 기준단어 사전(13)을 이용하여 문법을 자동으로 수정하는 중앙 처리 장치(12)를 구비한다.
도 2 는 본 발명이 적용되는 개념기반 다국어 번역시스템의 구성도로서, 도면에서 21은 한국어 문장 및 텍스트, 22는 토큰 분리기, 23은 기준단어 사전, 24는 한국어 해석문법, 25는 개념기반 해석기, 26은 개념기반 생성기, 27은 목적언어 생성문법, 28은 목적언어 문장을 각각 나타낸다.
한국어 문장이 입력되면(21) 기준단어를 이용하는 토큰 분리기(22)가 기준단어 사전(23)을 검색하여 토큰을 분리한다. 개념기반 해석기(25)는 한국어 해석문법(24)을 이용하여 입력된 토큰 리스트들을 개념구조로 변환하여 개념기반 생성기(26)로 넘겨준다. 개념기반 생성기(26)는 목적언어의 생성문법(27)에 의해 목적언어 문장(번역문)(28)을 생성하게 된다. 생성된 문장은 곧바로 출력된다. 목적언어는 영어, 일본어, 한국어 등 어느 언어든지 가능하다.
도 3 은 본 발명에 따른 문법 자동수정 방법의 개념도로서, 31은 문법이 자동수정되기 전의 한국어 해석문법 및 목적언어 생성문법, 32는 기준단어 사전, 33은 문법 자동수정기, 34는 문법이 자동수정된 후의 한국어 해석문법 및 한국어 생성문법을 각각 나타낸다.
그 동작을 살펴보면, 변동된 기준단어 사전(32)에 의해 수정이 필요한 한국어 해석문법 파일을 비롯한 여러 목적언어들의 생성문법 파일(31)들은 문법 자동수정기(33)에 의해 기준단어 사전(32)에 따라 자동으로 수정된 후에 한국어 해석문법 파일과 목적언어 생성문법 파일(34)과 같이 같은 이름의 파일로 저장된다.
도 4 는 본 발명에 따른 문법 자동수정 방법에 대한 처리 흐름도로서, 문법 자동수정기는 주어진 모든 파일을 하나씩 차례로 열어서 문법을 수정한다.
먼저, 하나의 문법 파일을 연다(41). 이후, 오픈한 파일내에서 한 문장을 읽어 온다(42).
이후, 읽어온 문장에서 한 단어를 추출한 후에(43) 추출한 단어의 종류를 판단하여(44) 그 단어가 한글로 된 단어이면 기준단어 사전을 이용하여 기준단어를 검색한다(45). 이후, 기준단어가 있는지를 판단하여(46) 있는 경우에는 기준단어에 의해 토큰을 분리한 다음에 분리되고 남은 단어를 가지고 기준단어 검색 과정(45)부터 반복 수행하고(47), 기준단어가 없는 경우에는 모든 단어가 처리되었는지를 판단한다(48). 한편, 단어의 종류가 한글이 아닌 경우에는 추출한 단어를 그대로 남겨두고 바로 모든 단어가 처리되었는지를 판단한다(48). 모든 단어가 처리되지 않은 경우에는 다음의 한 단어를 추출하는 과정(43)부터 반복 수행하고, 한 문장내의 모든 단어가 처리되었으면 그 처리 결과인 토큰 리스트를 출력한다(49).
이후, 파일내의 모든 문장이 처리되었는지를 판단하여(50) 하나의 문장이라도 처리되지 않은 경우에는 파일내의 다음 한 문장을 읽어오는 과정(42)부터 반복 수행하고, 모든 문장이 처리된 경우에는 지정된 모든 문법파일이 처리되었는지를 판단하여(51) 하나의 문법파일이라도 처리되지 않은 경우에는 문법파일 열기 과정(41)부터 반복 수행하고, 모든 문법파일이 처리된 경우에는 종료한다.
이처럼, 파일내의 모든 문장이 처리될 때까지 반복한 후에 한 파일에 대한 처리가 끝나면 다음 파일로 넘어가서 주어진 모든 파일에 대한 처리가 끝날때까지 반복한다.
한국어 해석문법 파일인 accommodation.gra를 예를 들어 설명해 보면, 도 5A와 같은 입력파일의 내용이 문법 자동수정기를 거친 결과는 도 5B와 같다. 이때, 기준단어 사전에는 숙박, 시설, 이가 들어 있다.
위의 예에서 보면 기준단어 숙박, 시설, 이를 기준으로 입력된 문법이 모드 띄어쓰기가 된 상태로 출력됨을 알 수 있다. 이렇게 기준단어 사전을 이용하여 문법파일을 자동으로 수정한다.
이상에서 설명한 본 발명은, 본 발명이 속하는 기술분야에서 통상의 지식을 가진 자에 있어 본 발명의 기술적 사상을 벗어나지 않는 범위내에서 여러 가지 치환, 변형 및 변경이 가능하므로 전술한 실시예 및 첨부된 도면에 한정되는 것이 아니다.
상기와 같은 본 발명은, 많은 수의 문법파일을 자동으로 수정해 주기 때문에 시간과 노력이 절약되고, 수작업으로 인해 야기될 수 있는 실수를 방지하기 때문에 편하게 문법을 수정할 수 있어 문법수정의 정확성과 편리성을 증진시킬 수 있는 효과가 있다.

Claims (1)

  1. 개념기반 다국어 번역시스템에 적용되는 문법 자동수정 방법에 있어서,
    하나의 문법 파일을 여는 제 1 단계;
    오픈한 파일내에서 한 문장을 읽어오는 제 2 단계;
    읽어온 문장내의 모든 단어에 대하여 한 단어씩 추출한 후에 추출한 단어의 종류를 판단하여 단어의 종류가 한글이 아닌 경우에는 추출한 단어를 그대로 남겨두고, 단어의 종류가 한글이면 기준단어 사전을 이용하여 모든 기준단어를 검색하여 기준단어에 의해 토큰을 분리한 다음에 토큰 리스트를 출력하는 제 3 단계;
    파일내의 모든 문장에 대하여 상기 제 2 단계부터 반복 수행하는 제 4 단계; 및
    지정된 모든 문법파일에 대하여 상기 제 1 단계부터 반복 수행하는 제 5 단계를 포함하여 이루어진 개념기반 다국어 번역시스템의 문법 자동수정 방법.
KR1019960054591A 1996-11-15 1996-11-15 개념기반 다국어 번역시스템의 문법 자동수정 방법 KR100204068B1 (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1019960054591A KR100204068B1 (ko) 1996-11-15 1996-11-15 개념기반 다국어 번역시스템의 문법 자동수정 방법

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1019960054591A KR100204068B1 (ko) 1996-11-15 1996-11-15 개념기반 다국어 번역시스템의 문법 자동수정 방법

Publications (2)

Publication Number Publication Date
KR19980036108A KR19980036108A (ko) 1998-08-05
KR100204068B1 true KR100204068B1 (ko) 1999-06-15

Family

ID=19482130

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1019960054591A KR100204068B1 (ko) 1996-11-15 1996-11-15 개념기반 다국어 번역시스템의 문법 자동수정 방법

Country Status (1)

Country Link
KR (1) KR100204068B1 (ko)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20130135442A (ko) * 2012-06-01 2013-12-11 한국전자통신연구원 자동번역 장치 및 방법

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100984293B1 (ko) * 2010-02-05 2010-09-30 김정중 세계 공용어를 위한 한아글 체계와 한아글 변환 장치 및 변환 방법

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20130135442A (ko) * 2012-06-01 2013-12-11 한국전자통신연구원 자동번역 장치 및 방법
KR101995057B1 (ko) 2012-06-01 2019-07-03 한국전자통신연구원 자동번역 장치 및 방법

Also Published As

Publication number Publication date
KR19980036108A (ko) 1998-08-05

Similar Documents

Publication Publication Date Title
EP0399533B1 (en) Machine translation system and method of machine translation
EP0262938B1 (en) Language translation system
KR20030094632A (ko) 변환방식 기계번역시스템에서 사용되는 변환사전을생성하는 방법 및 장치
US5075851A (en) System for translating a source language word with a prefix into a target language word with multiple forms
JPH0351022B2 (ko)
KR100204068B1 (ko) 개념기반 다국어 번역시스템의 문법 자동수정 방법
KR940022311A (ko) 기계번역장치 및 방법
KR100198959B1 (ko) 토큰 분리기를 이용한 원시언어 번역방법
KR100194798B1 (ko) 개념 구조를 이용한 다국어 번역시스템에서 단일의미단어 통합 처리 방법
JP2000250913A (ja) 実例型自然言語翻訳方法、対訳用例集作成方法および装置とそのプログラムを記録した記録媒体
JPH0561902A (ja) 機械翻訳システム
JP3236027B2 (ja) 機械翻訳装置
JPH03260764A (ja) 翻訳用辞書登録方式
JP2715875B2 (ja) 多言語要約生成装置
JPH0778166A (ja) 翻訳方法及び機械翻訳装置
JP2994539B2 (ja) 機械翻訳装置
JP2752025B2 (ja) 機械翻訳装置
JPH05225232A (ja) テキスト自動前編集装置
JPH04282764A (ja) 非文訳出装置
JPH02208775A (ja) 機械翻訳方式
JPH02110771A (ja) 電訳機
JPH04321178A (ja) 機械翻訳システム
JPS58217081A (ja) 日英機械翻訳処理方式
JPH01112368A (ja) 機械翻訳装置
JPS63106075A (ja) 縮約語処理装置

Legal Events

Date Code Title Description
A201 Request for examination
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20080307

Year of fee payment: 10

LAPS Lapse due to unpaid annual fee