KR100617318B1 - 2단계 구문분석을 통한 자동 번역 장치 및 방법 - Google Patents

2단계 구문분석을 통한 자동 번역 장치 및 방법 Download PDF

Info

Publication number
KR100617318B1
KR100617318B1 KR1020050015006A KR20050015006A KR100617318B1 KR 100617318 B1 KR100617318 B1 KR 100617318B1 KR 1020050015006 A KR1020050015006 A KR 1020050015006A KR 20050015006 A KR20050015006 A KR 20050015006A KR 100617318 B1 KR100617318 B1 KR 100617318B1
Authority
KR
South Korea
Prior art keywords
sentence
parsing
input
phrase
syntax
Prior art date
Application number
KR1020050015006A
Other languages
English (en)
Other versions
KR20060064443A (ko
Inventor
노윤형
최승권
이기영
류철
권오욱
박상규
김영길
김창현
홍문표
서영애
양성일
Original Assignee
한국전자통신연구원
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 한국전자통신연구원 filed Critical 한국전자통신연구원
Publication of KR20060064443A publication Critical patent/KR20060064443A/ko
Application granted granted Critical
Publication of KR100617318B1 publication Critical patent/KR100617318B1/ko

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/40Processing or translation of natural language
    • G06F40/42Data-driven translation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/268Morphological analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/279Recognition of textual entities
    • G06F40/289Phrasal analysis, e.g. finite state techniques or chunking

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Machine Translation (AREA)

Abstract

본 발명에 의한 2단계 구문분석을 통한 자동 번역 장치 및 그 방법은 입력문에 대해 형태소를 분석하는 형태소 분석부; 상기 각 형태소에 대해 품사 후보를 결정하는 태깅부; 태깅된 상기 입력문에 대하여 동사구를 중심으로 구문분석을 수행한 후 상기 입력문 전체문장에 대한 구문분석을 수행하는 구문분석부; 및 상기 구문분석 결과 생성되는 구문 트리를 기초로 하여 상기 입력문의 번역문을 생성하는 변환생성부;를 포함하는 것을 특징으로 하며, 구문분석 모호성중에서 태깅 모호성 및 명사구 청킹 모호성과 병렬 및 부착 모호성을 분리하여, 1단계에서 태깅 모호성 및 명사구 청킹 모호성을 해결하고, 2단계 병렬 및 부착 모호성을 해결함으로써 성능의 큰 저하 없이 분석 효율성을 올릴 수 있다.
자동번역, 구문분석, 문장분할, 기본 명사구, 동사구 분석

Description

2단계 구문분석을 통한 자동 번역 장치 및 방법{Apparatus for automatic translation through 2-step syntactic analysis and method thereof}
도 1은 본 발명에 의한 2단계 구문분석을 통한 자동 번역 장치의 구성을 보여주는 블럭도이다.
도 2는 도 1의 구문 분석부의 상세 기능 블럭도이다.
도 3은 본 발명에 의한 2단계 구문분석을 통한 자동 번역 방법의 과정을 보여주는 흐름도이다.
도 4는 도 3의 구문 분석단계를 보다 상세하게 보여주는 흐름도이다.
<도면의 주요부분에 대한 부호의 설명>
110: 형태소 분석부 120: 태깅부
130: 구문분석부 140: 변환생성부
본 발명은 자동 번역 장치 및 방법과 그 기록매체에 관한 것이며, 보다 자세하게는 입력 원문에 대해 동사구 분석 단계 및 전체 문장 분석 단계의 2단계로 이루어지는 구문 분석을 통하여 최종 번역문을 생성하기 위한 자동 번역 장치 및 그 방법 그리고 그 방법을 실현시키기 위한 프로그램을 기록한 컴퓨터로 읽을 수 있는 기록매체에 관한 것이다.
종래의 규칙 기반 자동 번역 방법에서는, 구문 분석이 가지는 모호성 및 대역 구문의 무제한 생성에 의해 속도 및 번역 성능이 저하되는 문제가 있었다. 모호 성 문제는 특히 문장이 길어짐에 따라 폭발적으로 커지는데, 이를 해결하기 위한 방법으로 구문 분석을 하기 전에 문장을 분할하여 더 작은 단위로 나누어 처리하는 문장분할 방법이 있다.
하지만 문장분할은 구조분석 이전에 제한된 정보를 가지고 이루어지기 때문에 넓은 범위의 문맥을 봐야하는 경우에 대해 잘못된 결과를 낼수 있는 가능성이 높고 성능의 한계가 있다. 그리고 만일 문장분할에서 실패하는 경우 전체 구문분석이 실패하게 되고, 전체 번역이 실패하게 되어 큰 부작용을 낳게 되는 문제점들이 있다.
본 발명이 이루고자 하는 기술적 과제는 상기의 문제점들을 해결하기 위하여 안출된 것으로서, 구문분석 과정을 동사구 분석 단계와 전체 문장 분석 단계로 분리하여 문장분할에 의한 부작용을 최소화하고, 또한 병렬 및 수식구 부착에 의한 모호성을 감소시켜 분석 효율성을 올림으로써 높은 분석 정확성과 효율성을 갖는 자동 번역 장치 및 방법과 그 방법을 실현시키기 위한 프로그램을 기록한 컴퓨터로 읽을 수 있는 기록매체를 제공하는데 있다.
상기의 기술적 과제를 이루기 위하여 본 발명에 의한 2단계 구문분석을 통한 자동 번역 장치는 입력문에 대해 형태소를 분석하는 형태소 분석부; 상기 각 형태소에 대해 품사 후보를 결정하는 태깅부; 태깅된 상기 입력문에 대하여 동사구를 중심으로 구문분석을 수행한 후 상기 입력문 전체문장에 대한 구문분석을 수행하는 구문분석부; 및 상기 구문분석 결과 생성되는 구문 트리를 기초로 하여 상기 입력문의 번역문을 생성하는 변환생성부;를 포함하는 것을 특징으로 한다.
상기의 기술적 과제를 이루기 위하여 본 발명에 의한 2단계 구문분석을 통한 자동 번역 방법은 입력문에 대해 형태소를 분석한 후 형태소별 품사 후보를 결정하는 단계; 태깅된 입력문의 문장분할을 수행한 후 분할문에 대해 동사구를 중심으로 구문분석을 수행하여 부분 트리 리스트를 생성하는 단계; 상기 부분 트리 리스트에서 품사 리스트 및 기본 명사구를 인식한 후 전체문장에 대한 구문분석을 수행하는 단계; 및 상기 전체문장에 대한 구문 분석 결과 생성되는 구문 트리를 기초로 하여 상기 입력문의 번역문을 생성하는 단계;를 포함하는 것을 특징으로 한다.
상기의 기술적 과제를 이루기 위하여 본 발명에 의한 2단계 구문분석을 통한 자동 번역 방법을 컴퓨터에서 실행시킬 수 있는 프로그램을 기록한 컴퓨터가 읽을 수 있는 기록매체는 입력문에 대해 형태소를 분석한 후 형태소별 품사 후보를 결정하는 단계; 태깅된 입력문의 문장분할을 수행한 후 분할문에 대해 동사구를 중심으로 구문분석을 수행하여 부분 트리 리스트를 생성하는 단계; 상기 부분 트리 리스트에서 품사 리스트 및 기본 명사구를 인식한 후 전체문장에 대한 구문분석을 수행하는 단계; 및 상기 전체문장에 대한 구문 분석 결과 생성되는 구문 트리를 기초로 하여 상기 입력문의 번역문을 생성하는 단계;를 포함하는 것을 특징으로 한다.
이하, 첨부한 도면을 참조하면서 본 발명에 따른 바람직한 일 실시예를 상세히 설명하기로 한다. 설명의 편의를 위하여 장치 및 방법을 동시에 서술하도록 한다.
도 1은 본 발명에 의한 2단계 구문분석을 통한 자동 번역 장치의 구성을 보여주는 블럭도이고, 도 2는 도 1의 구문 분석부(130)의 상세 기능 블럭도이다. 그리고 도 3은 본 발명에 의한 2단계 구문분석을 통한 자동 번역 방법의 과정을 보여주는 흐름도이고, 4는 도 3의 구문 분석단계를 보다 상세하게 보여주는 흐름도이다.
도 1과 도 3을 참조하면서, 본 발명에 의한 2단계 구문분석을 통한 자동번역 장치의 전체적인 흐름을 살펴보면, 형태소분석부(110)는 입력문장에 대해 형태소 분석을 수행하고, 태깅부(120)는 각 형태소에 대하여 품사 후보를 결정하는 태깅을 수행한다(S310단계). 구문분석부(130)는 태깅된 입력 문장에 대하여 동사구를 중심으로 하여 구문분석을 수행한 후 입력문장 전체에 대하여 구문분석을 수행한다(S320 내지 S350단계). 좀 더 상술하면 태깅 결과로 들어온 입력 문장에 대하여 문장 분할을 수행한다(S320단계). 그리고, 각 분할문에 대해서 동사구 중심의 구문 분석을 수행하고 그 결과로 나오는 최적의 구문트리에서 기본명사구(Base NP)를 인식한다(S340단계). 여기서 기본명사구라 함은 자신의 하위에 명사구나 동사구를 포함하지 않는 명사구를 의미한다. 기본명사구가 인식되면, 2차적으로 인식된 결과에 대해 전체문장 구문분석을 수행한다(S350단계). 변환생성부(140)는 구문분석부(130)의 최종 작업 결과 생성되는 구문 트리를 기초로 하여 입력문의 번역문을 생성하여 최종적으로 번역문을 출력하게 된다(S360단계).
도 2와 도4를 참조하면서 2단계 구문분석과정에 대해 좀 더 상세히 살펴보도록 한다. 먼저 문장분할부(210)에서는 태깅된 문장을 입력받아 문장분할점을 생성 한다(S410단계). 그러면 1차구문분석부(220)는 문장분할점을 경계로 구문분석을 수행하는데 각 형태소에 대해 최적 N(N은 자연수)품사 후보를 입력으로 받는다. 즉 태깅 모호성을 가지고 구문분석을 수행하여, 구문분석 결과를 반영하여 품사 태그를 결정함으로써 태깅 성능을 올리도록 한다. 이때 구문분석을 수행하는 과정에서 병렬 및 수식구에 대해 가장 가까운 부착가능한 노드에 부착되도록 제약을 가한다. 이는 병렬 및 수식구 부착이 품사 및 기본 명사구 청킹에는 거의 영향을 미치지 않기 때문에 구문분석에서 많은 모호성의 요인이 되는 병렬 및 부착 모호성을 제거함으로써 분석 효율성을 올리기 위함이다. 이러한 동사구 구문 분석은 주로 올바른 동사구 단위 구문 분석을 수행하는데 목표가 있다. 따라서 문장 분할이 이루어지더라도 하나의 동사구에 대한 분석에 필요한 정보는 전체문장에 비해 국소적이기 때문에 비교적 정확한 분석을 수행할수 있다(이상 S420단계).
기본명사구 인식부(230)는 위와 같이 동사구 단위 구문분석을 수행한 결과로서 나타나는 기본명사구를 출력하며, 문장분할부(210)에서 입력문에 대한 문장 분할이 이루어진 상태에서 구문분석이 이루어졌기 때문에 구문분석 결과는 전체 문장에 대한 구문트리가 아닌 부분트리 리스트의 형태로 나타나며 비터비(viterbi) 알고리즘을 통해 최적의 부분 분석트리 리스트가 결정된다(S340단계).
최적의 부분트리 리스트가 생성되면, 2차구문분석부(240)는 품사 리스트 및 기본 명사구를 인식하여, 다시 전체 문장 분석을 수행한다. 이때는 문장분할점, 병렬 및 수식구 부착 제약을 제거하고 전체 문장에 대한 구문분석을 수행한다. 이때는 품사 태그가 하나로 결정되고, 기본 명사구 청킹이 이루어진 상태이기 때문에 입력 챠트의 개수가 축소되고, 모호성이 줄어서 전체문장에 대한 구문분석이 가능해진다. 또한 문장 분할 오류가 있었다 하더라도 문장 분할 오류가 동사구 내부를 분할하여 동사구 분석 오류를 야기하지 않는 이상은 오류에 영향을 미치지 않는다(이상 S440단계).
이제 아래와 같은 예문을 본 발명에 의한 2단계 구문 분석 방식을 적용하여 분석하는 실제 예를 제시한다.
1. 입력문: Former Gov. Stratton commuted her term to 75 years, making her eligible for parole, as one of his last acts in office.
2. 태깅 결과: 위에서 N=2라고 하면
Former/JJ/NNP Gov./NN Stratton/NNP commuted/VBN/VBD her/DT/PRP term/NN/VBP to/TO 75/CD years/NNS/NN, making/VBG/JJ her/DT/PRP eligible/JJ/NN for/IN parole/NN/JJ, as/IN one/PRP/CD of/IN his/DT/PRP last/JJ/VB acts/NNS/VBZ in/IN office/NN/NNP.
3. 문장 분할 결과: <Former/JJ/NNP Gov./NN Stratton/NNP commuted/VBN/VBD her/DT/PRP term/NN/VBP to/TO 75/CD years/NNS/NN>, <making/VBG/JJ her/DT/PRP eligible/JJ/NN for/IN parole/NN/JJ, as/IN one/PRP/CD of/IN his/DT/PRP last/JJ/VB acts/NNS/VBZ in/IN office/NN/NNP>
4. 1차 구문 분석 수행:
(S (NP Former/JJ Gov./NN Stratton/NNP)
(VP commuted/VBD
(NP her/DT term/NN)
(PP to/TO (NP 75/CD years/NNS))))
,
(VP making/VBG
(NP her/PRP)
(ADJP eligible/JJ)
(PP for/IN parole/NN))
,
(PP as/IN
(NP (NP one/PRP)
(PP of/IN
(NP (NP his/DT last/JJ acts/NNS)
(PP in/IN (NP office/NN))))))
5. 품사 및 기본명사구 인식
(NP Former Gov Stratton) commuted/VBD (NP her term) to/TO (NP 75 years) , making/VBG (NP her) eligible/JJ for/IN (NP parole/NN) , as/IN (NP one) of/IN (NP his last acts) in/IN (NP office)
위에서 보면, 2차 구문분석의 입력은 품사 모호성이 제거되고 전체 문장 길이가 줄어든 상태이다.
6. 전체 문장 구문분석
(S (NP Former Gov Stratton)
(VP commuted
(NP her term)
(PP to (NP 75 years))
(PRN ,
(VP making
(NP her)
(ADJP eligible)
(PP for
(NP parole)))
,)
(PP as
(NP (NP one)
(PP of
(NP his last acts)
(PP in
(NP office)))))))
원래의 문장 분할 결과는 (Former Gov. Stratton commuted her term to 75 years), (making her eligible for parole, as one of his last acts in office)와 같이 as 전치사구가 making에 부착하도록 오류가 있었지만, 전체 문장 구문분석 과 정에서 삽입구를 인식하여 올바른 구문분석 결과를 내도록 하고 있다. 위 분석결과는 목적언어로의 변환 및 생성을 통해 최종 번역문이 생성된다.
본 발명에 의한 2단계 구문분석을 통한 자동 번역 방법은 또한 컴퓨터로 읽을 수 있는 기록매체에 컴퓨터가 읽을 수 있는 코드로서 구현하는 것이 가능하다. 컴퓨터가 읽을 수 있는 기록매체는 컴퓨터 시스템에 의하여 읽혀질 수 있는 데이터가 저장되는 모든 종류의 기록장치를 포함한다. 컴퓨터가 읽을 수 있는 기록매체의 예로는 ROM, RAM, CD-ROM, 자기 테이프, 플라피디스크, 광데이터 저장장치 등이 있으며, 또한 캐리어 웨이브(예를 들어 인터넷을 통한 전송)의 형태로 구현되는 것도 포함한다. 또한 컴퓨터가 읽을 수 있는 기록매체는 네트워크로 연결된 컴퓨터 시스템에 분산되어, 분산방식으로 컴퓨터가 읽을 수 있는 코드가 저장되고 실행될 수 있다.
이상에서 설명한 것은 본 발명에 의한 2단계 구문분석을 통한 자동 번역 방법 및 그 장치를 실시하기 위한 하나의 실시예에 불과한 것으로서, 본 발명은 상기한 실시예에 한정되지 않고, 이하의 특허청구의 범위에서 청구하는 본 발명의 요지를 벗어남이 없이 당해 발명이 속하는 분야에서 통상의 지식을 가진 자라면 누구든지 다양한 변경 실시가 가능한 범위까지 본 발명의 기술적 정신이 있다고 할 것이다.
상술한 바와 같이 본 발명에 의한 2단계 구문 분석을 통한 자동 번역 장치 및 그 방법에 의하면, 구문분석 모호성중에서 태깅 모호성 및 명사구 청킹 모호성 과 병렬 및 부착 모호성을 분리하여, 1단계에서 태깅 모호성 및 명사구 청킹 모호성을 해결하고, 2단계 병렬 및 부착 모호성을 해결함으로써 성능의 큰 저하 없이 분석 효율성을 올리는 효과가 있다. 이것은 실제로 병렬 및 부착 모호성이 품사 태그 및 기본 명사구를 결정하는데는 거의 영향을 미치지 않기 때문에 이를 독립적으로 수행함으로써 가능하게 된다.

Claims (9)

  1. 입력문에 대해 형태소를 분석하는 형태소 분석부;
    상기 각 형태소에 대해 품사 후보를 결정하는 태깅부;
    태깅된 상기 입력문에 대하여 동사구를 중심으로 구문분석을 수행한 후 상기 입력문 전체문장에 대한 구문분석을 수행하는 구문분석부; 및
    상기 구문분석 결과 생성되는 구문 트리를 기초로 하여 상기 입력문의 번역문을 생성하는 변환생성부;를 포함하는 것을 특징으로 하는 2단계 구문분석을 통한 자동 번역 장치.
  2. 제1항에 있어서, 상기 구문분석부는
    상기 태깅된 입력문에 대해 문장분할을 수행하는 문장분할부;
    분할된 각 분할문에 대해 동사구 중심의 구문 분석을 수행하고 최적 부분 트리 리스트를 선택하는 1차 구문분석부;
    상기 1차 구문분석부의 구문 분석 결과에서 기본 명사구를 인식하는 기본 명 사구 인식부;
    상기 최적 부분 트리 리스트의 품사 태그 및 상기 인식된 기본 명사구를 기초로 전체 구문분석을 수행하는 2차 구문분석부; 및
    구문 트리에 따라 변환을 수행한 후 최종 번역문을 생성하는 변환생성부;를 포함하는 것을 특징으로 하는 2단계 구문분석을 통한 자동 번역 장치.
  3. 제2항에 있어서, 상기 1차 구문분석부는
    최적 N(N은 자연수)품사 후보의 태깅 모호성을 가지고, 병렬 및 수식구 부착을 제한하여 상기 분할문의 구문을 분석한 후 최적 부분트리 리스트를 선택하는 것을 특징으로 하는 2단계 구문분석을 통한 자동 번역 장치.
  4. 제2항에 있어서, 상기 2차 구문분석부는
    상기 최적 부분트리 리스트의 품사 태그 및 기본 명사구 인식된 결과를 입력으로 병렬 및 부착 제약을 제거하고 전체 문장을 구문분석하는 것을 특징으로 하는 2단계 구문분석을 통한 자동 번역 장치.
  5. (a) 입력문에 대해 형태소를 분석한 후 형태소별 품사 후보를 결정하는 단계;
    (b) 태깅된 입력문의 문장분할을 수행한 후 분할문에 대해 동사구를 중심으로 구문분석을 수행하여 부분 트리 리스트를 생성하는 단계;
    (c) 상기 부분 트리 리스트에서 품사 리스트 및 기본 명사구를 인식한 후 전체문장에 대한 구문분석을 수행하는 단계; 및
    (d) 상기 (c)단계의 수행 결과 생성되는 구문 트리를 기초로 하여 상기 입력문의 번역문을 생성하는 단계;를 포함하는 것을 특징으로 하는 2단계 구문분석을 통한 자동 번역 방법.
  6. 제5항에 있어서, 상기 (b)단계는
    (b1) 상기 입력문에 대하여 문장분할점을 생성하는 단계;
    (b2) 상기 형태소별로 최적 N품사 후보를 입력으로 수신하고 상기 문할점을 경계로 구문분석을 수행하는 단계; 및
    (b3) 상기 (b2)단계의 구문분석 결과를 기초로 최적의 부분 트리 리스트를 생성하는 단계;를 포함하는 것을 특징으로 하는 2단계 구문분석을 통한 자동 번역 방법.
  7. 제6항에 있어서, 상기 (b3)단계는
    (b31) 최적 N(N은 자연수)품사 후보의 태깅 모호성을 가지고, 병렬 및 수식구 부착을 제한하여 상기 분할문의 구문을 분석한 후 최적 부분트리 리스트를 선택하는 단계;를 포함하는 것을 특징으로 하는 2단계 구문분석을 통한 자동 번역 방법.
  8. 제5항에 있어서, 상기 (c)단계는
    문장분할점, 병렬 및 수식구 부착 제약을 제거하고 전체문장에 대한 구문분석을 수행하는 단계;를 포함하는 것을 특징으로 하는 2단계 구문분석을 통한 자동 번역 방법.
  9. (a) 입력문에 대해 형태소를 분석한 후 형태소별 품사 후보를 결정하는 단계;
    (b) 태깅된 입력문의 문장분할을 수행한 후 분할문에 대해 동사구를 중심으로 구문분석을 수행하여 부분 트리 리스트를 생성하는 단계;
    (c) 상기 부분 트리 리스트에서 품사 리스트 및 기본 명사구를 인식한 후 전체문장에 대한 구문분석을 수행하는 단계; 및
    (d) 상기 (c)단계의 수행 결과 생성되는 구문 트리를 기초로 하여 상기 입력문의 번역문을 생성하는 단계;를 컴퓨터에서 실행시키기 위한 프로그램을 기록한 컴퓨터로 읽을 수 있는 기록매체.
KR1020050015006A 2004-12-08 2005-02-23 2단계 구문분석을 통한 자동 번역 장치 및 방법 KR100617318B1 (ko)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
KR1020040102960 2004-12-08
KR20040102960 2004-12-08

Publications (2)

Publication Number Publication Date
KR20060064443A KR20060064443A (ko) 2006-06-13
KR100617318B1 true KR100617318B1 (ko) 2006-08-30

Family

ID=37160002

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020050015006A KR100617318B1 (ko) 2004-12-08 2005-02-23 2단계 구문분석을 통한 자동 번역 장치 및 방법

Country Status (1)

Country Link
KR (1) KR100617318B1 (ko)

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7747427B2 (en) 2005-12-05 2010-06-29 Electronics And Telecommunications Research Institute Apparatus and method for automatic translation customized for documents in restrictive domain
KR100792204B1 (ko) * 2005-12-05 2008-01-08 한국전자통신연구원 제한적인 도메인의 문서를 대상으로 특화된 자동 번역 장치및 방법
KR100836159B1 (ko) * 2006-10-13 2008-06-09 에스케이 텔레콤주식회사 반자동 번역 서비스 제공 시스템 및 방법
KR101012504B1 (ko) * 2008-10-29 2011-02-08 한국과학기술원 의존 문법 구문 트리의 탐색을 통한 자동 관계 트리플 추출방법
KR101023210B1 (ko) * 2008-12-16 2011-03-18 한국전자통신연구원 구문 분석 방법 및 그 장치
KR102013230B1 (ko) 2012-10-31 2019-08-23 십일번가 주식회사 구문 전처리 기반의 구문 분석 장치 및 그 방법

Also Published As

Publication number Publication date
KR20060064443A (ko) 2006-06-13

Similar Documents

Publication Publication Date Title
KR100912502B1 (ko) Pdf 파일을 대상으로 하는 자동 번역 방법
US6862566B2 (en) Method and apparatus for converting an expression using key words
Can et al. Lattice indexing for spoken term detection
Rashwan et al. A stochastic Arabic diacritizer based on a hybrid of factorized and unfactorized textual features
JP3971373B2 (ja) ルールベース方式と翻訳パターン方式とを混合したハイブリッド自動翻訳装置
KR101762866B1 (ko) 구문 구조 변환 모델과 어휘 변환 모델을 결합한 기계 번역 장치 및 기계 번역 방법
KR101259558B1 (ko) 문장경계 인식 장치 및 방법
KR102013230B1 (ko) 구문 전처리 기반의 구문 분석 장치 및 그 방법
JP2004038976A (ja) 用例ベースの機械翻訳システム
KR100617318B1 (ko) 2단계 구문분석을 통한 자동 번역 장치 및 방법
Wu et al. Efficient disfluency detection with transition-based parsing
Sang Transforming a Chunker to a Parser
KR101757222B1 (ko) 한글 문장에 대한 의역 문장 생성 방법
WO2009113289A1 (ja) 新規事例生成装置、新規事例生成方法及び新規事例生成用プログラム
JP4476609B2 (ja) 中国語解析装置、中国語解析方法および中国語解析プログラム
JPWO2012131822A1 (ja) 音声認識結果整形装置、音声認識結果整形方法及びプログラム
JP4088171B2 (ja) テキスト解析装置、方法、プログラム及びそのプログラムを記録した記録媒体
KR100420474B1 (ko) 부분문틀을 이용한 장문 번역 장치 및 그 방법
KR101092355B1 (ko) 대용어 복원 방법
Germann Making semantic interpretation parser-independent
JP2632806B2 (ja) 言語解析装置
JP2006127405A (ja) バイリンガルパラレルテキストをアライメントする方法及びそのためのコンピュータで実行可能なプログラム
KR19990015131A (ko) 영한 자동번역 시스템의 숙어 번역 방법
Adams Dependency parsing and dialogue systems: an investigation of dependency parsing for commercial application
JP4039205B2 (ja) 自然言語処理システム及び自然言語処理方法、並びにコンピュータ・プログラム

Legal Events

Date Code Title Description
A201 Request for examination
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20120730

Year of fee payment: 7

FPAY Annual fee payment

Payment date: 20130729

Year of fee payment: 8

LAPS Lapse due to unpaid annual fee