KR100397602B1 - 좌우 파싱법에서의 애매성 해결 방법 - Google Patents

좌우 파싱법에서의 애매성 해결 방법 Download PDF

Info

Publication number
KR100397602B1
KR100397602B1 KR1019960050472A KR19960050472A KR100397602B1 KR 100397602 B1 KR100397602 B1 KR 100397602B1 KR 1019960050472 A KR1019960050472 A KR 1019960050472A KR 19960050472 A KR19960050472 A KR 19960050472A KR 100397602 B1 KR100397602 B1 KR 100397602B1
Authority
KR
South Korea
Prior art keywords
tri
gram
parsing
action
stack
Prior art date
Application number
KR1019960050472A
Other languages
English (en)
Other versions
KR19980030985A (ko
Inventor
권철중
오기은
하남규
Original Assignee
삼성전자주식회사
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 삼성전자주식회사 filed Critical 삼성전자주식회사
Priority to KR1019960050472A priority Critical patent/KR100397602B1/ko
Publication of KR19980030985A publication Critical patent/KR19980030985A/ko
Application granted granted Critical
Publication of KR100397602B1 publication Critical patent/KR100397602B1/ko

Links

Abstract

Tri-gram을 이용하여 구문 해석의 애매성과 구문 해석 문법의 과생성(overgeneration)으로 인한 구문 해석 과정의 과부하를 줄이는 구문 해석기에 관한 것이다.
본 발명에 따른 구문 해석기는 구문해석된 자료로부터 Tri-gram 및 이에 상응하는 action들을 추출하는 Tri-gram추출기; 적어도 하나 이상의 Tri-gram 및 이에 상응하는 action들에 관한 정보를 가지는 Tri-gram 관련 정보 테이블; 상기 상태 관리기가 상기 파싱 테이블을 참조할 때 상기 Tri-gram 관련 정보 테이블에 등록된 action만을 선택하여 상기 상태 관리기로 넘겨주는 Tri-gram테이블 참조 및 action선택기를 포함한다.
본 발명에 따른 구문 해석기에서는 주어진 Tri-gram하에서 가능한 action만을 수행하도록 하기 때문에 불필요한 중간 구조가 만들어지는 것을 방지한다. 따라서, 구문 해석의 애매성 및 구문 해석 과정의 과부하를 줄이는 효과를 가진다.

Description

좌우 파싱법에서의 애매성 해결 방법
본 발명은 일반화된 좌우 구문 해석법(Generalized Left to Right parsing method)에 의한 구문 해석기에 관한 것으로서 더욱 상세하게는 Tri-gram을 이용하여 구문 해석의 애매성과 구문 해석 문법의 과생성(overgeneration)으로 인한 구문 해석 과정의 과부하를 줄이는 구문 해석기에 관한 것이다.
일반적으로 구문 해석을 위하여 사용하는 문법은 계산학적인 이득 때문에 문맥 자유 문법(context-free grammar)이다. 그러나, 자연 언어는 문맥 의존적인 많은 현상들이 있기 때문에 문맥 자유 문법으로 자연 언어를 모델링하는 데는 한계가 있다. 따라서, 현재의 많은 방법들은 문맥 자유 문법의 문제점을 보완하기 위해 여러 가지 방법들을 도입하여 사용하고 있다. 그 중에 대표적인 것이 품사의 열을 사용하는 방법이다.
연이은 3개의 품사열(Tri-gram)을 이용하여 구문 해석의 애매성을 해결하고, 구문 해석 과정의 과부하를 줄이기 위한 방법들은 주로 차트 파싱(chart parsing)에서 도입되었다. 차트 파싱은 다음과 같은 과정을 통하여 수행된다.
1) 입력 문장을 a1, ,,, an이라고 하면, 입력 문장의 앞뒤에 공란(blank)를 의미하는 두 개의 품사(여기서는 #로 표시함)를 넣어 준다. 그러면 입력 문장은 #a1, ,,, an#이 된다.
2) a1에서 an까지 다음과 같은 과정을 반복한다.
2-1) ai-1, ai, ai+1을 현재 시점에서의 Tri-gram이라 한다.
2-2) 현재 파싱 과정에서 적용 가능한 규칙들 중, 구문해석된 자료로부터 Tri-gram ai-1, ai, ai+1의 상황에서 적용 가능했던 규칙들 만을 적용하여 파싱을 계속한다.
한편, 일반화된 좌우 구문 해석법(이하 GLR파싱이라 함)은 실험적으로 자연 언어의 구문 해석에 있어서 가장 효율적인 알고리즘으로 알려져 있다.
그러나, 차트 파싱에 도입된 바와 같은 Tri-gram을 GLR파싱에 그대로 이용하기에는 다음과 같은 제약 조건이 있다.
1) GLR파싱에서는 규칙의 적용 시작 시점을 차트 파싱에서와 같이 알 수가 없다.
2) GLR파싱에서 나타나는 애매하거나 혹은 과생성의 현상은 규칙들의 개별적인 적용과 비적용의 형태로 나타나는 것이 아니라 파싱 테이블에서 shift 및 reduce action들이 동시에 존재하는 형태로 나타난다.
따라서, 평균 계산 시간이 가장 좋은 GLR 파싱에 의한 구문 해석기에 구문 해석의 애매성 및 구문 해석 과정의 과부하를 줄이기 위한 Tri-gram을 접목하기 위해서는 Tri-gram을 구하는 방법 및 이를 적용하는 방법이 필요하다.
본 발명은 상기의 요구에 부응하기 위하여 안출된 것으로서 Tri-gram을 이용하여 구문 해석의 애매성을 줄이는 GLR파싱에 의한 구문해석기를 제공하는 것을 그 목적으로 한다.
도 1은 종래의 구문 해석기의 구성을 보이는 블록도이다.
도 2는 구문 해석된 자료에 있는 트리의 일예를 보이는 것이다.
도 3은 구문 해석시 사용된 구문 규칙의 일례를 보이는 것이다.
도 4는 Tri-gram하에서 가능한 action들의 일례를 보이는 것이다.
도 5는 본 발명에 따른 구문 해석기의 구성을 보이는 블록도이다.
상기의 목적을 달성하는 본 발명에 따른 구문 해석기는 소정의 문법 규칙에 상응하는 action 테이블 및 goto 테이블을 저장하는 파싱 테이블; 구문 해석의 중간 결과로서 발생되는 상태 노드 및 기호 노드를 저장하는 그래프 구조의 스택; 구문 해석의 중간 및 최종 결과를 저장하는 파스 집합 스택; 품사열이 부가된 입력 문장 및 상기 파싱 테이블을 참조하여 reduce, action, goto 동작을 수행하며, 구문 해석 과정에서 발생되는 상태 노드 및 기호 노드를 상기 그래프 구조의 스택에 저장하고, 구문 해석의 중간 및 최종 결과를 상기 파스 집합 스택에 저장하는 상태 관리기; 구문 해석된 자료로부터 Tri-gram 및 이에 상응하는 action들을 추출하는 Tri-gram추출기; 적어도 하나 이상의 Tri-gram 및 이에 상응하는 action들에 관한 정보를 가지는 Tri-gram 관련 정보 테이블; 상기 상태 관리기가 상기 파싱 테이블을 참조할 때 상기 Tri-gram 관련 정보 테이블에 등록된 action만을 선택하여 상기 상태 관리기로 넘겨주는 Tri-gram테이블 참조 및 action선택기; 및 상기 파스 집합 스택으로부터 구문 해석된 결과를 트리 형태로 출력하는 트리 추출기를 포함함을 특징으로 한다. 이하 첨부된 도면을 참조하여 본 발명을 상세히 설명한다.
GLR 파싱에 있어서 파싱 테이블(parsing table)은 action 테이블과 goto 테이블로 구성되어 있다. action 테이블은 각각의 상태(state)에서 다음에 오는 단어의 품사에 따라서 어떠한 action을 취할 것인 지에 대한 정보를 가지고 있다. 즉, 현재의 상태와 다음의 단어가 주어지면 취해야할 action을 action 테이블에서 찾아 올 수 있다.
그런데, 자연 언어 처리를 위한 파싱 테이블의 경우에는 하나의 상태와 다음 단어에 의해 하나가 아닌 여러 개의 action들이 존재한다. 이를 구문 해석의 애매성이라고 하는 데 이는 문법이 불완전하지 못한 때문이기도 하고, 문맥 자유 문법으로는 불가피한 결과이기도 하다.
도 1은 종래의 구문 해석기의 구성을 보이는 블록도이다. 형태소 해석기(102)는 구문 해석의 대상이 되는 입력 문장에 품사를 첨부한 결과를 출력한다.
구문 해석기의 중앙 관리기라고 할 수 있는 상태 관리기(104)는 품사열이 부가된 입력 문장 품사열을 입력으로 하여 파싱 테이블(107)을 참조하여 shift, reduce 그리고 goto 동작을 수행하는 과정을 반복한다. 여기서, shift, reduce, goto 동작은 각각 쉬프터(110), 리듀서(111), goto actor(112)에 의해 수행된다.
이 과정에서 상태 관리기(104)는 그래프 구조의 스택(109)을 파싱 상태의 관리를 위하여 사용하고 구문 해석의 중간 및 최종 결과들이 파스 집합 스택(113)에 저장되게 된다.
파싱 테이블(107)에는 시스템에서 사용하는 문법 규칙에 상응하는 action 테이블 및 goto 테이블이 저장되어 있고, 테이블 참조기(108)는 상태 관리기(104)가 shift, reduce, goto 동작을 위하여 파싱 테이블(107)을 참조할 때 사용된다.
그래프 구조의 스택(109)에는 구문 해석의 중간 결과로서 발생되는 상태 노드 및 기호 노드가 저장되고, 파스 집합 스택(113)에는 구문 해석의 중간 및 최종 결과가 저장된다.
또한, 트리 추출기(114)는 파스 집합 스택(113)으로부터 구문 해석된 결과를 트리 형태로 출력한다.
도 2는 구문 해석된 자료의 일예를 보인다. 즉, 구문 해석된 자료는 도 2에 도시된 바와 같은 트리들의 집합으로 볼 수 있다.
도 3은 GLR파싱이 적용되는 구문 규칙의 일례를 보이는 것이다.
도 4는 구문 해석된 트리로부터 추출된 Tri-gram과 주어진 Tri-gram 하에서 수행될 수 있는 action들의 리스트를 보인다. 여기서, Tri-gram의 시점은 규칙의 도입부가 아닌 reduce나 shift이다. 이는 Tri-gram을 GLR파싱에 적용하기 위한 것이다.
도 5는 본 발명에 따른 구문 해석기의 구성을 보이는 블록도로서 도 1에 도시된 장치와 동일한 기능을 수행하는 구성 요소에 대하여는 동일한 참조 부호가 붙여져 있다.
도 1에 도시된 장치와 비교할 때 도 5에 도시된 장치는 Tri-gram추출기(502), Tri-gram 관련 정보 테이블(504) 그리고 테이블 참조 및 action 선택기(506)를 포함한다.
Tri-gram추출기(502)는 구문해석된 자료로부터 Tri-gram 및 이에 상응하는 action들을 추출한다.
Tri-gram 관련 정보 테이블(504)에는 적어도 하나 이상의 Tri-gram 및 이에 상응하는 action들에 관한 정보들이 등록되어 있다.
Tri-gram테이블 참조 및 action선택기(506)는 상태 관리기(104)가 파싱 테이블(107)을 참조할 때 Tri-gram 관련 정보 테이블(504)을 참조하여 현재 주어진 Tri-gram에서 가능한 action들만을 선택하여 상기 상태 관리기로 넘겨준다.
즉, 상태 관리기(104)가 주어진 Tri-gram하에서 가능한 action들만을 수행하게 되므로 구문 해석 과정의 과부하가 줄어들게 된다.
상술한 바와 같이 본 발명에 따른 구문 해석기에서는 Tri-gram추출기(502), Tri-gram 관련 정보 테이블(504) 그리고 테이블 참조 및 action 선택기(506)를 통하여 주어진 Tri-gram하에서 가능한 action만을 상태 관리기(104)가 수행하도록 하기 때문에 불필요한 중간 구조가 만들어지는 것을 방지한다. 따라서, 구문 해석의 애매성 및 구문 해석 과정의 과부하를 줄이는 효과를 가진다.

Claims (1)

  1. 일반화된 LR파싱방법에 의한 구문 해석기에 있어서,
    소정의 문법 규칙에 상응하는 action 테이블 및 goto 테이블을 저장하는 파싱 테이블;
    구문 해석의 중간 결과로서 발생되는 상태 노드 및 기호 노드를 저장하는 그래프 구조의 스택;
    구문 해석의 중간 및 최종 결과를 저장하는 파스 집합 스택;
    품사열이 부가된 입력 문장 및 상기 파싱 테이블을 참조하여 reduce, action, goto 동작을 수행하며, 구문 해석 과정에서 발생되는 상태 노드 및 기호 노드를 상기 그래프 구조의 스택에 저장하고, 구문 해석의 중간 및 최종 결과를 상기 파스 집합 스택에 저장하는 상태 관리기;
    구문해석된 자료로부터 Tri-gram 및 이에 상응하는 액션들을 추출하는 Tri-gram추출기;
    적어도 하나 이상의 Tri-gram 및 이에 상응하는 action들에 관한 정보를 가지는 Tri-gram 관련 정보 테이블;
    상기 상태 관리기가 상기 파싱 테이블을 참조할 때 상기 Tri-gram 관련 정보 테이블에 등록된 action만을 선택하여 상기 상태 관리기로 넘겨주는 Tri-gram테이블 참조 및 action선택기; 및
    상기 파스 집합 스택으로부터 구문 해석된 결과를 트리 형태로 출력하는 트리 추출기를 포함하는 구문 해석기.
KR1019960050472A 1996-10-30 1996-10-30 좌우 파싱법에서의 애매성 해결 방법 KR100397602B1 (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1019960050472A KR100397602B1 (ko) 1996-10-30 1996-10-30 좌우 파싱법에서의 애매성 해결 방법

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1019960050472A KR100397602B1 (ko) 1996-10-30 1996-10-30 좌우 파싱법에서의 애매성 해결 방법

Publications (2)

Publication Number Publication Date
KR19980030985A KR19980030985A (ko) 1998-07-25
KR100397602B1 true KR100397602B1 (ko) 2003-10-17

Family

ID=37422185

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1019960050472A KR100397602B1 (ko) 1996-10-30 1996-10-30 좌우 파싱법에서의 애매성 해결 방법

Country Status (1)

Country Link
KR (1) KR100397602B1 (ko)

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4942526A (en) * 1985-10-25 1990-07-17 Hitachi, Ltd. Method and system for generating lexicon of cooccurrence relations in natural language
JPH0486946A (ja) * 1990-07-31 1992-03-19 Toshiba Corp 拡張lrパーザによる文認識方式
KR930006566A (ko) * 1991-09-19 1993-04-21 이헌조 백 프로파케이션 신경망을 이용한 텍스트 파싱 방법
KR940018737A (ko) * 1993-01-21 1994-08-18 이헌조 음성합성시스템의 운율제어용 구문분석장치의 방법
KR940022311A (ko) * 1993-03-15 1994-10-20 김영택 기계번역장치 및 방법
US5475588A (en) * 1993-06-18 1995-12-12 Mitsubishi Electric Research Laboratories, Inc. System for decreasing the time required to parse a sentence

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4942526A (en) * 1985-10-25 1990-07-17 Hitachi, Ltd. Method and system for generating lexicon of cooccurrence relations in natural language
JPH0486946A (ja) * 1990-07-31 1992-03-19 Toshiba Corp 拡張lrパーザによる文認識方式
KR930006566A (ko) * 1991-09-19 1993-04-21 이헌조 백 프로파케이션 신경망을 이용한 텍스트 파싱 방법
KR940018737A (ko) * 1993-01-21 1994-08-18 이헌조 음성합성시스템의 운율제어용 구문분석장치의 방법
KR940022311A (ko) * 1993-03-15 1994-10-20 김영택 기계번역장치 및 방법
US5475588A (en) * 1993-06-18 1995-12-12 Mitsubishi Electric Research Laboratories, Inc. System for decreasing the time required to parse a sentence

Also Published As

Publication number Publication date
KR19980030985A (ko) 1998-07-25

Similar Documents

Publication Publication Date Title
US6516461B1 (en) Source code translating method, recording medium containing source code translator program, and source code translator device
US6336214B1 (en) System and method for automatically generating browsable language grammars
US5649215A (en) Language parsing device and method for same
US5960382A (en) Translation of an initially-unknown message
US20070136698A1 (en) Method, system and apparatus for a parser for use in the processing of structured documents
Nozohoor-Farshi GLR Parsing for ε-Grammers
US20020035580A1 (en) Computer readable medium containing HTML document generation program
CN111639501A (zh) 基于amsl的电网业务微服务组合方法
Kempe et al. Parallel replacement in finite state calculus
KR100397602B1 (ko) 좌우 파싱법에서의 애매성 해결 방법
JP2879099B1 (ja) 抽象構文木処理方法、抽象構文木処理プログラムを記録したコンピュータ読み取り可能な記録媒体、抽象構文木データを記録したコンピュータ読み取り可能な記録媒体、及び、抽象構文木処理装置
Nozohoor-Farshi Handling of ill-designed grammars in Tomita’s parsing algorithm
WO1996017310A1 (en) System and process for creating structured documents
Barthélemy et al. Shared forests can guide parsing
Li A simple and efficient incremental LL (1) parsing
Lancel et al. A grammar used for parsing and generation
Kempe et al. The Parallel Replacement Operation in Finite State Calculus
JPH0287273A (ja) 自動翻訳装置
JP2000112769A (ja) 多段トランスレータ
JPS63136260A (ja) 機械翻訳システムにおける文生成処理方式
JP3995186B2 (ja) 構文解析装置
JPH02133824A (ja) トランスレータ
JP2861630B2 (ja) 接続構造解析器
EP0676111A1 (en) Method and arrangement for testing services in a telecommunications system
JP3141945B2 (ja) コンパイル装置

Legal Events

Date Code Title Description
A201 Request for examination
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20120716

Year of fee payment: 10

FPAY Annual fee payment

Payment date: 20130724

Year of fee payment: 11

LAPS Lapse due to unpaid annual fee