KR940022311A - 기계번역장치 및 방법 - Google Patents
기계번역장치 및 방법 Download PDFInfo
- Publication number
- KR940022311A KR940022311A KR1019930003921A KR930003921A KR940022311A KR 940022311 A KR940022311 A KR 940022311A KR 1019930003921 A KR1019930003921 A KR 1019930003921A KR 930003921 A KR930003921 A KR 930003921A KR 940022311 A KR940022311 A KR 940022311A
- Authority
- KR
- South Korea
- Prior art keywords
- idiom
- analysis
- information
- language
- conversion
- Prior art date
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F17/00—Digital computing or data processing equipment or methods, specially adapted for specific functions
Abstract
본 발명은 제1언러로 기술된 자연언어(원문)를 번역처리하여 제2언러로기술된 자연언어(번역문)로 출력하도록 하는 기계번역장치 및 그 방법에 관한 것으로, 특히 숙어와 언어에 의한 문장의 분석과 변환과정을 이용한 기계번역장치 및 그 방법에 관한 것으로 원시언어의 분석에 필요한 문법정보를 포함하는 분석사전 ; 입력된 원시언어 문장을 분석사전을 참조하여 각 어휘에 대하여 분리가능한 모든 형태소를 분리하고 음절단위의 분석을 통하여 원형을 복원하여 가능한 분석후보(토큰리스트)를 선택하흔 형태소분석부 ; 숙어 인식 및 변환에 필요한 원시언어와 목표언어 사이의 대응정보를 포함하는 변환자료부 ; 변환자료부에 기록 되어 있는 정보를 이용하여 형태소분석부에 의하여 분석된 토큰리스트로부터 숙어를 인식하여 해당 검색된 숙어정보중 선택된 토큰리스트만을 추출하는 숙어인식수단 ; 구문분석을 위하여 원시언어의 문법규칙을 저장하는 분석규칙부 ; 숙어인식수단으로부터의 숙어정보와 선택된 토큰리스트로부터 분석규칙부에 기록되어 있는 분석규칙에 따라 구문분석을 행하여 구문구조를 출력하기 위한 구문분석수단 ; 숙어인식부로부터의 숙어정보와 변환자료부의 정보를 이용하여 목표언어의 대역어를 찾아 이를 변환시켜 구문분석수단으로부터의 구문구조에 부가하는 변환수단 ; 목표언어의 생성에 필요한 정보(품사, 수, 불규칙변형, 동사활용형 및 명사정보 등)를 포함하는 생성사전 ; 원시언어로부터 목표언어를 생성하는데 필요한 규칙(구조변형규칙, 어순규칙, 형태소생성규칙)을 포함하는 생성규칙부 ; 및 변환수단으로부터의 구문구조로부터 생성사전 및 생성규칙부로부터의 정보에 따라 목표언어를 생성하는 목표언어 생성수단을 포함한다.
Description
본 내용은 요부공개 건이므로 전문내용을 수록하지 않았음
제2도는 본 발명에 따른 기계번역장치의 블럭도,
제3도는 제2도의 기계번역장치의 상세블럭도,
제4도는 본 발명에서 사용되는 변환사전에 기록된 엔트리의 일예를 도시한 도이다.
Claims (12)
- 원시언어로 작성된 입력문장을 목표언어로 번역하여 출력하는 기계번역장치에 있어서, 상기 장치가 원시언어의 분석에 필요한 문법정보를 포함하는 분석사진 ; 입력된 원시언어 문장을 분석사전을 참조하여 각 어휘에 대하여 분리가능한 모든 형태소를 분리하고 음절단위의 분석을 통하여 원형을 복원하여 가능한 분석후보(토큰리스트)를 선택하는 형태소분석수단 ; 숙어인식 및 변환에 필요한 원시언어와 목표언어 사이의 대응정보를 포함하는 변환자료부 ; 상기 변환자료부에 기록되어 있는 정보를 이용하여 상기 형태소분석 수단에 의하여 분석된 토큰리스트로부터 숙어를 인식하여 해당 검색된 숙어정보중 선택된 토큰리스트만을 추출하는 숙어인식수단 ; 구문분석을 위하여 원시언어의 문법규칙을 저장하는 분석규칙부 ; 상기 숙어인식 수단으로부터의 숙어정보와 선택된 토큰리스트로부터 상기 분석규칙부에 기록되어 있는 분석규칙에 따라 구문분석을 행하여 구문구조를 출력하기 위한 구문분석수단 ; 상기 숙어인식부로부터의 숙어정보와 변환자료부의 정보를 이용하여 목표언어의 대역어를 찾아 이를 변환시켜 상기 구문분석수단으로부터의 구문구조에 부가하는 변환수단 ; 목표언어의 생성에 필요한 정보(품사, 수, 불규칙변형, 동사활용형 및 명사정보)를 포함하는 생성사진 ; 및 상기 변환수단으로부터의 구문구조로부터 상기 생성사전 및 생성규칙부로부터의 정보에 따라 목표언어를 생성하는 목표언어 생성수단을 포함하는 것을 특징으로 하는 기계번역장치.
- 제1항에 있어서, 원시언어가 한국어이고 목표언어가 영어인 것을 특징으로 하는 기계번역장치.
- 제2항에 있어서, 상기 구문분석수단은 구문분석을 위하여 이진챠트 방식을 사용하는 것을 특징으로 하는 기계번역장치.
- 제1항 내지 제3항중 어느 한 항에 있어서, 상기 변환자료부는 원시언어의 단어에 대한 목표언어로의 변환에 사용되는 어휘자료를 포함하는 변환사진과, 원시언어의 다양한 어형변화로 인한 접사의 변환현상에 대한 자료를 포함하는 접삭일치표를 포함하는 것을 특징으로 하는 기계번역장치.
- 제4항에 있어서, 상기 변환사전은 각 단어에 대하여 숙어구, 언어상 및 기본형(디폴트)에 대한 정보를 포함하는 것을 특징으로 하는 기계번역장치.
- 원시언어 입력문장을 목표언어로 번역하기 위하여 원시언어에 대한 어휘정보를 포함하는 분석사전, 원시언어를 목표언어로의 대역어로 변환시키기 위한 변환자전 등의 변환자료를 포함하는 변환자료부, 입력 문장의 구문을 분석하기 위한 규칙을 포함하는 분석규칙부 및 목표언어를 생성하기 위한 생성사진 및 생성 규칙부를 포함하여 원시언어를 목표언어로 번역하는 기계번역방법에 있어서, 상기 번역방법이 입력된 원시언어 문장을 상기 분석사전을 참조하여 각 어휘에 대하여 분리가능한 모든 형태소를 분리하고 음절단위의 분석에 의하여 원형을 복원하여 가능한 분석후보(토큰리스트)를 선택하는 형태소분석단계 ; 상기 변환자료부에 기록되어 있는 변환정보를 이용하여 상기 형태소분석단계에서 분석된 토큰리스트로부터 숙어를 인식하여 해당 검색된 숙어정보중 선택된 토큰리스트만을 추출하는 숙어인식단계 ; 상기 숙어인식단계에서 인식된 숙어정보와 상기 형태소분석단계에서 선택된 토큰리스트로부터 상기 분서규칙부에 기록되어 있는 분석규칙에 따라 구문분석을 행하여 구문구조를 출력하기 위한 구문분석단계 ; 상기 숙어인식단계로부터의 숙어정보와 상기 변환자료부의 정보를 이용하여 목표언어의 대역어를 찾아 이를 변환시켜 상기 구문분석단계에서 얻어진 구문구조에 부가하는 변환단계 ; 및 상기 변환단계에서의 구문구조로부터 상기 생서사전 및 생성규칙부로부터의 정보에 따라 목표언어를 생성하는 목표언어 생성단계를 포함하는 것을 특징으로 하는 기계번역 방법.
- 제8항에 있어서, 원시언어가 한국어이고 목표언어가 영어인 것을 특징으로 하는 기계번역방법.
- 제6항 또는 제7항에 있어서, 상기 숙어인식단계는 상기 형태소분석단계에서 분석된 토큰리스트중 각 토큰에 대하여 상기 변환자료부를 이용하여 해당 토큰이 가질 수 있는 숙어의 형태를 추출하는 숙어추출단계, 추출된 숙어를 이루는 토큰의 기본형과 토큰리스트중의 토큰의 기본형을 비교하여 일치하는 숙어를 선택하는 기본형일치단계 ; 기본형이 일치되어 선택된 숙어의 접사에 대하여 상기 변환자료부에 기록되어 있는 접사와의 일치여부를 판단하여 상기 토큰간의 의존관계를 파악하기 위한 접사일치단계 ; 상기 접사일치단계에서 추출된 각 숙어에 대한 의존관계에 따라 개별숙어의 일치여부를 검사하기 위한 숙어검사단계 ; 및 상기의 과정을 통하여 일치된 숙어들로부터 소정의 우선순위에 따라 높은 우선순위를 가지는 숙어를 선택하는 숙어선택단계를 포함하는 것을 특징으로 하는 기계번역방법.
- 제8항에 있어서, 상기 숙어선택단계는 우선순위에 따라 선택되는 숙어가 이미 선택된 숙어들과 모순되지 않도록 선택하는 단계를 더 포함하는 것을 특징으로 하는 기계번역방법.
- 제8항에 있어서, 상기 기본형일치단계는 숙어를 이루는 토큰의 어간이 특정한 값을 갖지 않으므로 모든 토큰의 기본형과 일치하는 경우(메타베이스일치)와 특정 단어의 어간만이 숙어로 일치되는 경우(이그잭트베이스일치)에만 해당 숙어를 선택하는 것을 특징으로 하는 기계번역방법.
- 제6항에 있어서, 상기 구문분석단계는 분석시에 모호성이 발생하는 경우 모호성을 가지는 분석구조중 가장 가능성이 높은 분석구조를 선택하기 위한 모호성 해결과정을 더 포함하는 것을 특징으로 하는 기계 번역방법.
- 제6항에 있어서, 상기 구문분석단계는 구문분석을 위하여 챠트방식의 파싱알고리즘을 사용하여 분석중 각 단계의 중간구조를 저장하기 위한 자료구조로 테이블형태의 자료구조를 사용하는 것을 특징으로 하는 기계번역방법.※ 참고사항 : 최초출원 내용에 의하여 공개하는 것임.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1019930003921A KR950013128B1 (ko) | 1993-03-15 | 1993-03-15 | 기계번역장치 및 방법 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1019930003921A KR950013128B1 (ko) | 1993-03-15 | 1993-03-15 | 기계번역장치 및 방법 |
Publications (2)
Publication Number | Publication Date |
---|---|
KR940022311A true KR940022311A (ko) | 1994-10-20 |
KR950013128B1 KR950013128B1 (ko) | 1995-10-25 |
Family
ID=19352199
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1019930003921A KR950013128B1 (ko) | 1993-03-15 | 1993-03-15 | 기계번역장치 및 방법 |
Country Status (1)
Country | Link |
---|---|
KR (1) | KR950013128B1 (ko) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR19980066877A (ko) * | 1997-01-29 | 1998-10-15 | 김광호 | 미등록어의 유형에 근거한 형태소 해석 방법 |
KR20020046558A (ko) * | 2000-12-15 | 2002-06-21 | 이천우 | 문서정보를 이용한 지능형 실시간 시장관계분석 장치 및그 방법 |
KR100397602B1 (ko) * | 1996-10-30 | 2003-10-17 | 삼성전자주식회사 | 좌우 파싱법에서의 애매성 해결 방법 |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20010108586A (ko) * | 2000-05-29 | 2001-12-08 | 우요섭 | 의미정보를 이용한 이단계 단문 분할 장치 |
KR102140342B1 (ko) * | 2016-02-02 | 2020-07-31 | 한국전자통신연구원 | 어절 단위 변수화 패턴에 기반한 문장 재구성 장치 및 방법 |
KR102143158B1 (ko) * | 2018-11-30 | 2020-08-11 | 주식회사 솔트룩스 | 한국어 구문 분석을 활용한 정보 처리 시스템 |
-
1993
- 1993-03-15 KR KR1019930003921A patent/KR950013128B1/ko not_active IP Right Cessation
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR100397602B1 (ko) * | 1996-10-30 | 2003-10-17 | 삼성전자주식회사 | 좌우 파싱법에서의 애매성 해결 방법 |
KR19980066877A (ko) * | 1997-01-29 | 1998-10-15 | 김광호 | 미등록어의 유형에 근거한 형태소 해석 방법 |
KR20020046558A (ko) * | 2000-12-15 | 2002-06-21 | 이천우 | 문서정보를 이용한 지능형 실시간 시장관계분석 장치 및그 방법 |
Also Published As
Publication number | Publication date |
---|---|
KR950013128B1 (ko) | 1995-10-25 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US6223150B1 (en) | Method and apparatus for parsing in a spoken language translation system | |
US6278968B1 (en) | Method and apparatus for adaptive speech recognition hypothesis construction and selection in a spoken language translation system | |
US6282507B1 (en) | Method and apparatus for interactive source language expression recognition and alternative hypothesis presentation and selection | |
US6442524B1 (en) | Analyzing inflectional morphology in a spoken language translation system | |
US6243669B1 (en) | Method and apparatus for providing syntactic analysis and data structure for translation knowledge in example-based language translation | |
US6356865B1 (en) | Method and apparatus for performing spoken language translation | |
US6266642B1 (en) | Method and portable apparatus for performing spoken language translation | |
Altintas et al. | A machine translation system between a pair of closely related languages | |
US6374224B1 (en) | Method and apparatus for style control in natural language generation | |
EP0262938B1 (en) | Language translation system | |
Dien et al. | Vietnamese Word Segmentation. | |
WO2001029697A9 (en) | A method and system for reducing lexical ambiguity | |
KR100481598B1 (ko) | 복합 형태소 분석 장치 및 방법 | |
Schubert | The architecture of DLT| Interlingual or double direct | |
KR940022311A (ko) | 기계번역장치 및 방법 | |
Singh et al. | An efficient Romanization of Gurmukhi Punjabi proper nouns for pattern matching | |
KR19990015131A (ko) | 영한 자동번역 시스템의 숙어 번역 방법 | |
KR940022312A (ko) | 기계번역장치 및 방법 | |
KR100204068B1 (ko) | 개념기반 다국어 번역시스템의 문법 자동수정 방법 | |
Raza et al. | Saraiki Language Word Prediction And Spell Correction Framework | |
Samir et al. | Training and evaluation of TreeTagger on Amazigh corpus | |
JP2002269085A (ja) | 機械翻訳装置及び方法 | |
Ferri et al. | A complete linguistic analysis for an Italian text-to-speech system | |
KR100333681B1 (ko) | 용언 중심 문틀을 이용한 자동 번역 장치 및 그 방법 | |
JP2715875B2 (ja) | 多言語要約生成装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A201 | Request for examination | ||
G160 | Decision to publish patent application | ||
E701 | Decision to grant or registration of patent right | ||
GRNT | Written decision to grant | ||
LAPS | Lapse due to unpaid annual fee |