KR940022311A - 기계번역장치 및 방법 - Google Patents

기계번역장치 및 방법 Download PDF

Info

Publication number
KR940022311A
KR940022311A KR1019930003921A KR930003921A KR940022311A KR 940022311 A KR940022311 A KR 940022311A KR 1019930003921 A KR1019930003921 A KR 1019930003921A KR 930003921 A KR930003921 A KR 930003921A KR 940022311 A KR940022311 A KR 940022311A
Authority
KR
South Korea
Prior art keywords
idiom
analysis
information
language
conversion
Prior art date
Application number
KR1019930003921A
Other languages
English (en)
Other versions
KR950013128B1 (ko
Inventor
김영택
강승식
이하규
양재형
서병락
김나리
임을규
옥철형
Original Assignee
김영택
강승식
이하규
양재형
서병락
김나리
임을규
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 김영택, 강승식, 이하규, 양재형, 서병락, 김나리, 임을규 filed Critical 김영택
Priority to KR1019930003921A priority Critical patent/KR950013128B1/ko
Publication of KR940022311A publication Critical patent/KR940022311A/ko
Application granted granted Critical
Publication of KR950013128B1 publication Critical patent/KR950013128B1/ko

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F17/00Digital computing or data processing equipment or methods, specially adapted for specific functions

Abstract

본 발명은 제1언러로 기술된 자연언어(원문)를 번역처리하여 제2언러로기술된 자연언어(번역문)로 출력하도록 하는 기계번역장치 및 그 방법에 관한 것으로, 특히 숙어와 언어에 의한 문장의 분석과 변환과정을 이용한 기계번역장치 및 그 방법에 관한 것으로 원시언어의 분석에 필요한 문법정보를 포함하는 분석사전 ; 입력된 원시언어 문장을 분석사전을 참조하여 각 어휘에 대하여 분리가능한 모든 형태소를 분리하고 음절단위의 분석을 통하여 원형을 복원하여 가능한 분석후보(토큰리스트)를 선택하흔 형태소분석부 ; 숙어 인식 및 변환에 필요한 원시언어와 목표언어 사이의 대응정보를 포함하는 변환자료부 ; 변환자료부에 기록 되어 있는 정보를 이용하여 형태소분석부에 의하여 분석된 토큰리스트로부터 숙어를 인식하여 해당 검색된 숙어정보중 선택된 토큰리스트만을 추출하는 숙어인식수단 ; 구문분석을 위하여 원시언어의 문법규칙을 저장하는 분석규칙부 ; 숙어인식수단으로부터의 숙어정보와 선택된 토큰리스트로부터 분석규칙부에 기록되어 있는 분석규칙에 따라 구문분석을 행하여 구문구조를 출력하기 위한 구문분석수단 ; 숙어인식부로부터의 숙어정보와 변환자료부의 정보를 이용하여 목표언어의 대역어를 찾아 이를 변환시켜 구문분석수단으로부터의 구문구조에 부가하는 변환수단 ; 목표언어의 생성에 필요한 정보(품사, 수, 불규칙변형, 동사활용형 및 명사정보 등)를 포함하는 생성사전 ; 원시언어로부터 목표언어를 생성하는데 필요한 규칙(구조변형규칙, 어순규칙, 형태소생성규칙)을 포함하는 생성규칙부 ; 및 변환수단으로부터의 구문구조로부터 생성사전 및 생성규칙부로부터의 정보에 따라 목표언어를 생성하는 목표언어 생성수단을 포함한다.

Description

기계번역장치 및 방법
본 내용은 요부공개 건이므로 전문내용을 수록하지 않았음
제2도는 본 발명에 따른 기계번역장치의 블럭도,
제3도는 제2도의 기계번역장치의 상세블럭도,
제4도는 본 발명에서 사용되는 변환사전에 기록된 엔트리의 일예를 도시한 도이다.

Claims (12)

  1. 원시언어로 작성된 입력문장을 목표언어로 번역하여 출력하는 기계번역장치에 있어서, 상기 장치가 원시언어의 분석에 필요한 문법정보를 포함하는 분석사진 ; 입력된 원시언어 문장을 분석사전을 참조하여 각 어휘에 대하여 분리가능한 모든 형태소를 분리하고 음절단위의 분석을 통하여 원형을 복원하여 가능한 분석후보(토큰리스트)를 선택하는 형태소분석수단 ; 숙어인식 및 변환에 필요한 원시언어와 목표언어 사이의 대응정보를 포함하는 변환자료부 ; 상기 변환자료부에 기록되어 있는 정보를 이용하여 상기 형태소분석 수단에 의하여 분석된 토큰리스트로부터 숙어를 인식하여 해당 검색된 숙어정보중 선택된 토큰리스트만을 추출하는 숙어인식수단 ; 구문분석을 위하여 원시언어의 문법규칙을 저장하는 분석규칙부 ; 상기 숙어인식 수단으로부터의 숙어정보와 선택된 토큰리스트로부터 상기 분석규칙부에 기록되어 있는 분석규칙에 따라 구문분석을 행하여 구문구조를 출력하기 위한 구문분석수단 ; 상기 숙어인식부로부터의 숙어정보와 변환자료부의 정보를 이용하여 목표언어의 대역어를 찾아 이를 변환시켜 상기 구문분석수단으로부터의 구문구조에 부가하는 변환수단 ; 목표언어의 생성에 필요한 정보(품사, 수, 불규칙변형, 동사활용형 및 명사정보)를 포함하는 생성사진 ; 및 상기 변환수단으로부터의 구문구조로부터 상기 생성사전 및 생성규칙부로부터의 정보에 따라 목표언어를 생성하는 목표언어 생성수단을 포함하는 것을 특징으로 하는 기계번역장치.
  2. 제1항에 있어서, 원시언어가 한국어이고 목표언어가 영어인 것을 특징으로 하는 기계번역장치.
  3. 제2항에 있어서, 상기 구문분석수단은 구문분석을 위하여 이진챠트 방식을 사용하는 것을 특징으로 하는 기계번역장치.
  4. 제1항 내지 제3항중 어느 한 항에 있어서, 상기 변환자료부는 원시언어의 단어에 대한 목표언어로의 변환에 사용되는 어휘자료를 포함하는 변환사진과, 원시언어의 다양한 어형변화로 인한 접사의 변환현상에 대한 자료를 포함하는 접삭일치표를 포함하는 것을 특징으로 하는 기계번역장치.
  5. 제4항에 있어서, 상기 변환사전은 각 단어에 대하여 숙어구, 언어상 및 기본형(디폴트)에 대한 정보를 포함하는 것을 특징으로 하는 기계번역장치.
  6. 원시언어 입력문장을 목표언어로 번역하기 위하여 원시언어에 대한 어휘정보를 포함하는 분석사전, 원시언어를 목표언어로의 대역어로 변환시키기 위한 변환자전 등의 변환자료를 포함하는 변환자료부, 입력 문장의 구문을 분석하기 위한 규칙을 포함하는 분석규칙부 및 목표언어를 생성하기 위한 생성사진 및 생성 규칙부를 포함하여 원시언어를 목표언어로 번역하는 기계번역방법에 있어서, 상기 번역방법이 입력된 원시언어 문장을 상기 분석사전을 참조하여 각 어휘에 대하여 분리가능한 모든 형태소를 분리하고 음절단위의 분석에 의하여 원형을 복원하여 가능한 분석후보(토큰리스트)를 선택하는 형태소분석단계 ; 상기 변환자료부에 기록되어 있는 변환정보를 이용하여 상기 형태소분석단계에서 분석된 토큰리스트로부터 숙어를 인식하여 해당 검색된 숙어정보중 선택된 토큰리스트만을 추출하는 숙어인식단계 ; 상기 숙어인식단계에서 인식된 숙어정보와 상기 형태소분석단계에서 선택된 토큰리스트로부터 상기 분서규칙부에 기록되어 있는 분석규칙에 따라 구문분석을 행하여 구문구조를 출력하기 위한 구문분석단계 ; 상기 숙어인식단계로부터의 숙어정보와 상기 변환자료부의 정보를 이용하여 목표언어의 대역어를 찾아 이를 변환시켜 상기 구문분석단계에서 얻어진 구문구조에 부가하는 변환단계 ; 및 상기 변환단계에서의 구문구조로부터 상기 생서사전 및 생성규칙부로부터의 정보에 따라 목표언어를 생성하는 목표언어 생성단계를 포함하는 것을 특징으로 하는 기계번역 방법.
  7. 제8항에 있어서, 원시언어가 한국어이고 목표언어가 영어인 것을 특징으로 하는 기계번역방법.
  8. 제6항 또는 제7항에 있어서, 상기 숙어인식단계는 상기 형태소분석단계에서 분석된 토큰리스트중 각 토큰에 대하여 상기 변환자료부를 이용하여 해당 토큰이 가질 수 있는 숙어의 형태를 추출하는 숙어추출단계, 추출된 숙어를 이루는 토큰의 기본형과 토큰리스트중의 토큰의 기본형을 비교하여 일치하는 숙어를 선택하는 기본형일치단계 ; 기본형이 일치되어 선택된 숙어의 접사에 대하여 상기 변환자료부에 기록되어 있는 접사와의 일치여부를 판단하여 상기 토큰간의 의존관계를 파악하기 위한 접사일치단계 ; 상기 접사일치단계에서 추출된 각 숙어에 대한 의존관계에 따라 개별숙어의 일치여부를 검사하기 위한 숙어검사단계 ; 및 상기의 과정을 통하여 일치된 숙어들로부터 소정의 우선순위에 따라 높은 우선순위를 가지는 숙어를 선택하는 숙어선택단계를 포함하는 것을 특징으로 하는 기계번역방법.
  9. 제8항에 있어서, 상기 숙어선택단계는 우선순위에 따라 선택되는 숙어가 이미 선택된 숙어들과 모순되지 않도록 선택하는 단계를 더 포함하는 것을 특징으로 하는 기계번역방법.
  10. 제8항에 있어서, 상기 기본형일치단계는 숙어를 이루는 토큰의 어간이 특정한 값을 갖지 않으므로 모든 토큰의 기본형과 일치하는 경우(메타베이스일치)와 특정 단어의 어간만이 숙어로 일치되는 경우(이그잭트베이스일치)에만 해당 숙어를 선택하는 것을 특징으로 하는 기계번역방법.
  11. 제6항에 있어서, 상기 구문분석단계는 분석시에 모호성이 발생하는 경우 모호성을 가지는 분석구조중 가장 가능성이 높은 분석구조를 선택하기 위한 모호성 해결과정을 더 포함하는 것을 특징으로 하는 기계 번역방법.
  12. 제6항에 있어서, 상기 구문분석단계는 구문분석을 위하여 챠트방식의 파싱알고리즘을 사용하여 분석중 각 단계의 중간구조를 저장하기 위한 자료구조로 테이블형태의 자료구조를 사용하는 것을 특징으로 하는 기계번역방법.
    ※ 참고사항 : 최초출원 내용에 의하여 공개하는 것임.
KR1019930003921A 1993-03-15 1993-03-15 기계번역장치 및 방법 KR950013128B1 (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1019930003921A KR950013128B1 (ko) 1993-03-15 1993-03-15 기계번역장치 및 방법

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1019930003921A KR950013128B1 (ko) 1993-03-15 1993-03-15 기계번역장치 및 방법

Publications (2)

Publication Number Publication Date
KR940022311A true KR940022311A (ko) 1994-10-20
KR950013128B1 KR950013128B1 (ko) 1995-10-25

Family

ID=19352199

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1019930003921A KR950013128B1 (ko) 1993-03-15 1993-03-15 기계번역장치 및 방법

Country Status (1)

Country Link
KR (1) KR950013128B1 (ko)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR19980066877A (ko) * 1997-01-29 1998-10-15 김광호 미등록어의 유형에 근거한 형태소 해석 방법
KR20020046558A (ko) * 2000-12-15 2002-06-21 이천우 문서정보를 이용한 지능형 실시간 시장관계분석 장치 및그 방법
KR100397602B1 (ko) * 1996-10-30 2003-10-17 삼성전자주식회사 좌우 파싱법에서의 애매성 해결 방법

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20010108586A (ko) * 2000-05-29 2001-12-08 우요섭 의미정보를 이용한 이단계 단문 분할 장치
KR102140342B1 (ko) * 2016-02-02 2020-07-31 한국전자통신연구원 어절 단위 변수화 패턴에 기반한 문장 재구성 장치 및 방법
KR102143158B1 (ko) * 2018-11-30 2020-08-11 주식회사 솔트룩스 한국어 구문 분석을 활용한 정보 처리 시스템

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100397602B1 (ko) * 1996-10-30 2003-10-17 삼성전자주식회사 좌우 파싱법에서의 애매성 해결 방법
KR19980066877A (ko) * 1997-01-29 1998-10-15 김광호 미등록어의 유형에 근거한 형태소 해석 방법
KR20020046558A (ko) * 2000-12-15 2002-06-21 이천우 문서정보를 이용한 지능형 실시간 시장관계분석 장치 및그 방법

Also Published As

Publication number Publication date
KR950013128B1 (ko) 1995-10-25

Similar Documents

Publication Publication Date Title
US6223150B1 (en) Method and apparatus for parsing in a spoken language translation system
US6278968B1 (en) Method and apparatus for adaptive speech recognition hypothesis construction and selection in a spoken language translation system
US6282507B1 (en) Method and apparatus for interactive source language expression recognition and alternative hypothesis presentation and selection
US6442524B1 (en) Analyzing inflectional morphology in a spoken language translation system
US6243669B1 (en) Method and apparatus for providing syntactic analysis and data structure for translation knowledge in example-based language translation
US6356865B1 (en) Method and apparatus for performing spoken language translation
US6266642B1 (en) Method and portable apparatus for performing spoken language translation
Altintas et al. A machine translation system between a pair of closely related languages
US6374224B1 (en) Method and apparatus for style control in natural language generation
EP0262938B1 (en) Language translation system
Dien et al. Vietnamese Word Segmentation.
WO2001029697A9 (en) A method and system for reducing lexical ambiguity
KR100481598B1 (ko) 복합 형태소 분석 장치 및 방법
Schubert The architecture of DLT| Interlingual or double direct
KR940022311A (ko) 기계번역장치 및 방법
Singh et al. An efficient Romanization of Gurmukhi Punjabi proper nouns for pattern matching
KR19990015131A (ko) 영한 자동번역 시스템의 숙어 번역 방법
KR940022312A (ko) 기계번역장치 및 방법
KR100204068B1 (ko) 개념기반 다국어 번역시스템의 문법 자동수정 방법
Raza et al. Saraiki Language Word Prediction And Spell Correction Framework
Samir et al. Training and evaluation of TreeTagger on Amazigh corpus
JP2002269085A (ja) 機械翻訳装置及び方法
Ferri et al. A complete linguistic analysis for an Italian text-to-speech system
KR100333681B1 (ko) 용언 중심 문틀을 이용한 자동 번역 장치 및 그 방법
JP2715875B2 (ja) 多言語要約生成装置

Legal Events

Date Code Title Description
A201 Request for examination
G160 Decision to publish patent application
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
LAPS Lapse due to unpaid annual fee