KR20100025885A - 다단계 용언구 패턴을 적용한 번역장치와 이를 위한적용방법 및 추출방법 - Google Patents

다단계 용언구 패턴을 적용한 번역장치와 이를 위한적용방법 및 추출방법 Download PDF

Info

Publication number
KR20100025885A
KR20100025885A KR1020080084626A KR20080084626A KR20100025885A KR 20100025885 A KR20100025885 A KR 20100025885A KR 1020080084626 A KR1020080084626 A KR 1020080084626A KR 20080084626 A KR20080084626 A KR 20080084626A KR 20100025885 A KR20100025885 A KR 20100025885A
Authority
KR
South Korea
Prior art keywords
phrase
pattern
default
matching
word
Prior art date
Application number
KR1020080084626A
Other languages
English (en)
Other versions
KR100956794B1 (ko
Inventor
윤창호
김창현
서영애
양성일
박은진
김운
최승권
이기영
권오욱
노윤형
오영순
김영길
박상규
Original Assignee
한국전자통신연구원
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 한국전자통신연구원 filed Critical 한국전자통신연구원
Priority to KR1020080084626A priority Critical patent/KR100956794B1/ko
Priority to US12/464,121 priority patent/US8335681B2/en
Publication of KR20100025885A publication Critical patent/KR20100025885A/ko
Application granted granted Critical
Publication of KR100956794B1 publication Critical patent/KR100956794B1/ko

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/40Processing or translation of natural language
    • G06F40/42Data-driven translation
    • G06F40/45Example-based machine translation; Alignment
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/279Recognition of textual entities
    • G06F40/289Phrasal analysis, e.g. finite state techniques or chunking

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Machine Translation (AREA)

Abstract

본 발명은 다단계 용언구 패턴을 적용한 번역장치와 이를 위한 적용방법 및 추출방법에 관한 것으로, 다단계 용언구 패턴 매칭 기법을 적용하여 번역성능을 향상시키고, 번역장치를 위한 용언구 패턴을 다단계로 적용하며, 다단계 용언구 패턴을 자동으로 추출함으로써 고성능의 기계번역장치를 구축할 수 있다. 또한, 본 발명은 다단계 용언구 패턴을 적용한 번역장치와 이를 위한 적용방법 및 추출방법을 제공함으로써 원시언어에서 목적언어로 변환하는 데 사용되며 어휘적인 측면과 어순 등 언어 구조적인 측면에서 이종 언어간에 발생하는 중의성을 해소할 수 있다.
Figure P1020080084626
용언구 패턴, 다단계, 매칭, 적용

Description

다단계 용언구 패턴을 적용한 번역장치와 이를 위한 적용방법 및 추출방법{TRANSLATION APPARATUS BY USING MULTI-LEVEL VERB PATTERN, AND APPLICATION AND EXTRACTION METHOD THEREOF}
본 발명은 다단계 용언구 패턴 매칭 기법을 적용하여 번역성능을 향상시킨 번역장치와 이 번역장치를 위한 용언구 패턴의 다단계 적용방법 및 다단계 용언구 패턴을 자동으로 추출하는 방법에 관한 것이다.
본 발명은 정보통신부 및 정보통신연구진흥원의 IT성장동력기술개발사업의 일환으로 수행한 연구로부터 도출된 것이다[과제관리번호: 2006-S-037-03, 과제명: 응용 특화 한중영 자동번역 기술개발].
주지된 바와 같이, 패턴 기반의 번역장치에서 가장 핵심적인 데이터는 용언구 패턴이다. 용언구 패턴은 원시언어에서 목적언어로 변환하는데 사용되고 어휘적인 측면과 어순 등 언어 구조적인 측면에서 이종 언어간에 발생하는 중의성을 해소하고자 한다.
상술한 바와 같은 용언구 패턴 중 기존 의미기반의 용언구 패턴은 각 격 성 분을 의미정보로 변환함으로써 패턴 매칭의 정확성을 높이고 해당 용언을 정확한 대역어로 변환시킬 수 있다. 즉, 용언구 패턴이 번역장치에서 담당하는 역할은 첫째로 어휘적인 중의성 해소로서, 입력 단문에서 사용된 동사, 부사격 조사, 목적격 조사 등 어휘를 해당 목적언어로 정확하게 변환해야 하는 것이고, 둘째로 언어 구조적인 측면에서 원시 언어의 각 성분들의 구조가 완전히 다른 목적언어로 변환될 때 정확하게 어순을 재조정해야 하는 것이다.
이런 이유로 패턴 기반의 번역장치에서 용언구 패턴의 매칭 성능은 전반 시스템의 성능에 큰 영향을 미치기 때문에 번역장치의 성능을 향상시키기 위해서는 대량의 양질 용언구 패턴이 필요하다.
기존의 의미기반 용언구 패턴 적용 장치는 패턴의 모든 격 성분의 의미코드를 모두 참조하기에, 비록 정확성은 높지만, 재현율이 너무 낮다. 실제 패턴 적용 사례를 분석한 결과 대부분 동사에서 주격의 의미정보는 용언의 대역어 변환과 어순에 거의 영향을 미치지 않는다. 따라서 대량 패턴 구축 시 주격에 의미코드를 부착하고 감수하는 작업은 비효율적인 방법이다.
다시 말하여, 한국어에서 70% 좌우의 용언은 한자어 용언이며, 한국어-중국어 용언구 패턴을 기존의 용언구 패턴 체계로 구축을 한다면 불필요한 중복 구축을 하게 된다. 예컨대, 같은 격 성분 구조를 가지는 패턴을 구축 시, 단순 의미기반의 용언구 패턴에서는 의미에 따라서 패턴이 결정되기 때문에 패턴의 목적격에 해당하는 의미코드 별로 모두 구축해야 한다.
그러나, 상기한 바와 같이 실제 분야에서 사용되는 패턴을 분석해보면, 대부분 한자어 용언은 목적격 성분의 의미정보와 상관없이 대역어와 어순이 고정되었음을 알 수 있다. 즉, 각 격 성분 구조에 따라 한 개의 용언구 패턴을 구축하면 충분한 용언에 대해서 수십, 수백개의 중복된 패턴을 구축하게 되고, 용언구 패턴을 구축함에 있어서, 한국어 용언의 의미 다양성에 따라서 선별 구축을 하지 않을 경우 구축해야 할 용언구 패턴이 기하급수적으로 늘어남에 따라 번역장치의 성능을 향상시킴에 있어서 한계에 부딪치게 되는 문제점이 있다.
이에, 본 발명의 기술적 과제는 상술한 문제점을 해결하기 위해 안출한 것으로서, 다단계 용언구 패턴 매칭 기법을 적용하여 번역성능을 향상시키고, 번역장치를 위한 용언구 패턴을 다단계로 적용하며, 다단계 용언구 패턴을 자동으로 추출할 수 있도록 하는 다단계 용언구 패턴을 적용한 번역장치와 이를 위한 적용방법 및 추출방법을 제공한다.
본 발명의 일 관점에 따른 다단계 용언구 패턴을 적용한 번역장치는, 입력문을 목적언어로 변환하기 위한 용언구 패턴 구조의 단문 단위로 구성하는 용언구 패턴 매칭을 위한 단문 생성부와, 단문 단위로 구성된 입력 단문과 기 구축된 용언구 패턴 중 각 격 성분의 의미코드 성분이 모두 매칭되도록 기본 용언구 패턴 DB를 통 해 기본 용언구 패턴에 적용하여 매칭을 진행하는 기본 용언구 패턴 매칭부와, 기본 용언구 패턴의 매칭이 비매칭될 경우 어순 및 대역어 중의성을 해소하기 위해 디폴트 용언구 패턴 DB를 통해 디폴트 용언구 패턴에 적용하여 매칭을 진행하는 디폴트 용언구 패턴 매칭부와, 디폴트 용언구 패턴의 매칭이 비매칭될 경우 디폴트 어순 용언구 패턴 DB를 통해 디폴트 어순 용언구 패턴에 적용하여 매칭을 진행하는 디폴트 어순 매칭부와, 디폴트 어순 용언구 패턴의 매칭이 비매칭될 경우 격 성분의 조사 중의성을 해소하기 위하여 디폴트 조사 DB를 통해 디폴트 조사 패턴에 적용하여 디폴트 생성을 진행시킨 대역문을 출력하는 디폴트 조사 매칭부를 포함하는 것을 특징으로 한다.
또한, 본 발명의 다른 관점에 따른 번역장치를 위한 적용방법은, 원시언어의 입력문의 형태소를 분석하는 단계와, 형태소가 분석된 입력문의 구조를 분석하는 단계와, 구조가 분석된 입력문을 목적언어로 변환하기 위한 용언구 패턴 구조의 단문 단위로 구성하는 단계와, 단문 단위로 구성된 입력 단문과 기 구축된 용언구 패턴 중 각 격 성분의 의미코드 성분이 모두 매칭되도록 기본 용언구 패턴 DB를 통해 기본 용언구 패턴에 적용하여 매칭을 진행하는 단계와, 기본 용언구 패턴의 매칭이 비매칭될 경우 어순 및 대역어 중의성을 해소하기 위해 디폴트 용언구 패턴 DB를 통해 디폴트 용언구 패턴에 적용하여 매칭을 진행하는 단계와, 디폴트 용언구 패턴의 매칭이 비매칭될 경우 디폴트 어순 용언구 패턴 DB를 통해 디폴트 어순 용언구 패턴에 적용하여 매칭을 진행하는 단계와, 디폴트 어순 용언구 패턴의 매칭이 비매칭될 경우 격 성분의 조사 중의성을 해소하기 위하여 디폴트 조사 DB를 통해 디폴 트 조사 패턴에 적용하여 디폴트 생성을 진행시킨 대역문을 출력하는 단계를 포함하는 것을 특징으로 한다.
또한, 본 발명의 또 다른 관점에 따른 다단계 용언구 패턴을 적용한 번역장치를 위한 추출방법은, 선별 구축된 용언구 패턴들을 저장하는 단계와, 선별 구축된 용언구 패턴을 각 용언 별로 정렬하고, 각 용언 당 구축된 격성분의 구조에 따라 다시 정렬을 진행하는 단계와, 선별 구축된 용언구 패턴 중 디폴트 용언구 패턴으로 정렬된 디폴트 어순 용언구 패턴을 추출하는 단계와, 선별 구축된 용언구 패턴에서 조사 대역어를 빈도 순으로 추출하는 단계와, 선별 구축된 용언구 패턴에서 각 동사별로 고빈도 대역어를 추출하는 단계를 포함하는 것을 특징으로 한다.
본 발명은 다단계 용언구 패턴 매칭 기법을 적용하여 번역성능을 향상시키고, 번역장치를 위한 용언구 패턴을 다단계로 적용하며, 다단계 용언구 패턴을 자동으로 추출함으로써, 고성능의 기계번역장치를 구축할 수 있다.
또한, 본 발명은 다단계 용언구 패턴을 적용한 번역장치와 이를 위한 적용방법 및 추출방법을 제공함으로써, 원시언어에서 목적언어로 변환하는 데 사용되며, 어휘적인 측면과 어순 등 언어 구조적인 측면에서 이종 언어간에 발생하는 중의성을 해소할 수 있는 잇점이 있다.
이하, 첨부된 도면을 참조하여 본 발명의 동작 원리를 상세히 설명한다. 하기에서 본 발명을 설명함에 있어서 공지 기능 또는 구성에 대한 구체적인 설명이 본 발명의 요지를 불필요하게 흐릴 수 있다고 판단되는 경우에는 그 상세한 설명을 생략할 것이다. 그리고 후술되는 용어들은 본 발명에서의 기능을 고려하여 정의된 용어들로서 이는 사용자, 운용자의 의도 또는 관례 등에 따라 달라질 수 있다. 그러므로 그 정의는 본 명세서 전반에 걸친 내용을 토대로 내려져야 할 것이다.
도 1은 본 발명의 바람직한 실시예에 따른 다단계 용언구 패턴을 적용한 번역장치를 위한 블록 구성도로서, 형태소 분석부(100)와 구조 분석부(200)와 용언구 패턴 다단계 적용부(300)와 선별기준에 따른 용언구 패턴 추가 구축부(400)와 기본 용언구 패턴 데이터베이스(DataBase, 이하, DB라 함)(450)와 디폴트 패턴 자동추출부(500)를 포함한다.
형태소 분석부(100)는 원시언어로 된 입력문(S1)의 형태소를 분석하여 구조 분석부(200)에 제공한다.
구조 분석부(200)는 형태소 분석부(100)에 의해 형태소가 분석된 입력문의 구조를 분석하여 용언구 패턴 다단계 적용부(300)에 제공한다.
용언구 패턴 다단계 적용부(300)는 용언구 패턴 매칭을 위한 단문 생성부(301)와 기본 용언구 패턴 매칭부(303)와 디폴트 용언구 패턴 매칭부(305)와 디폴트 어순 매칭부(307)와 디폴트 조사 매칭부(309)와 기본 용언구 패턴 DB(311)와 디폴트 용언구 패턴 DB(313)와 디폴트 어순 용언구 패턴 DB(315)와 디폴트 조사 DB(317)와 특정 도메인 적용 디폴트 용언 DB(319)를 포함한다.
용언구 패턴 매칭을 위한 단문 생성부(301)는 구조 분석부(200)에 의해 구조가 분석된 입력문을 목적언어로 변환하기 위한 용언구 패턴 구조의 단문 단위로 재 구성하여 기본 용언구 패턴 매칭부(303)에 제공한다.
기본 용언구 패턴 매칭부(303)는 용언구 패턴 매칭을 위한 단문 생성부(301)로부터 입력된 단문 단위로 재구성된 입력 단문에 대하여 의미기반 매칭을 진행할 경우 입력 단문과 기 구축된 용언구 패턴 중 각 격 성분의 의미코드 성분이 모두 매칭되도록 기본 용언구 패턴 DB(311)를 통해 기본 용언구 패턴에 적용하여 매칭을 진행하고 그 기본 용언구 매칭이 진행된 패턴을 디폴트 용언구 패턴 매칭부(305)에 제공한다.
디폴트 용언구 패턴 매칭부(305)는 기본 용언구 패턴 매칭부(303)에 의해 기본 용언구 패턴의 매칭이 완전 매칭되었거나 대부분 격 성분이 의미코드로 매칭되는 경우 기본 용언구 매칭이 진행된 패턴을 사용하는데 반하여, 격 성분의 의미코드가 전혀 매칭되지 않거나 매칭 점수가 기설정된 임계값에 포함되지 않는 경우(예컨대, 한국어에서 한자어 용언의 대부분 목적격 성분의 의미에 상관없이 고정된 문장 구조와 대역어를 갖기 때문에 의미코드 기반의 기본 용언구 패턴 매칭부(303)에 의해 비매칭됨) 같은 격조사와 같은 길이를 가진 해당 용언의 디폴트 패턴에 적용하여 어순 및 대역어 중의성을 해소하도록 하기 위해 디폴트 용언구 패턴 DB(313)를 통해 디폴트 용언구 패턴에 적용하여 매칭을 진행하고 그 디폴트 용언구 매칭이 진행된 패턴을 디폴트 어순 매칭부(307)에 제공한다.
디폴트 어순 매칭부(307)는 디폴트 용언구 패턴 매칭부(305)에 의해 디폴트 용언구 패턴의 매칭이 완전하게 매칭되지 못한 경우, 디폴트 어순 용언구 패턴 DB(315)를 통해 디폴트 어순 용언구 패턴에 적용하여 매칭을 진행하고 그 디폴트 어순 매칭이 진행된 패턴을 디폴트 조사 매칭부(309)에 제공한다.
디폴트 조사 매칭부(309)는 디폴트 어순 매칭부(307)에 의해 디폴트 어순 용언구 패턴의 매칭이 완전하게 매칭되지 못한 경우, 각 격 성분의 조사 중의성을 해소하기 위하여 디폴트 조사 DB(317)를 통해 디폴트 조사 패턴에 적용하면서 디폴트 생성(규칙에 기반)을 진행하고, 더불어 입력문(S1)이 특허문서 혹은 기술 논문인 경우 일부 용언들이 그 분야에 특화되어, 어휘적인 측면에서 대역어가 고정되는 경우를 위해 특정 도메인 적용 디폴트 용언 DB(319)에 적용하여 매칭을 진행함으로써, 최종적인 용언구 패턴의 적용을 완성시킨 대역문(S2)을 출력한다.
기본 용언구 패턴 DB(311)는 선별기준에 따른 용언구 패턴 추가 구축부(400)로부터 입력되는 선별 구축된 기본 용언구 패턴들을 저장한다.
디폴트 용언구 패턴 DB(313)는 디폴트 용언구 패턴 DB 자동 추출부(501)에 의해 자동 추출 및 각 용언 별로 정렬되어 선별 구축된 디폴트 용언구 패턴과 각 용언 당 구축된 격성분의 구조에 따라 다시 정렬된 디폴트 용언구 패턴을 저장한다.
디폴트 어순 용언구 패턴 DB(315)는 디폴트 어순 용언구 패턴 DB 자동 추출부(503)에 의해 자동 추출되어 정렬된 디폴트 어순 용언구 패턴을 저장한다.
디폴트 조사 DB(317)는 디폴트 조사 DB 자동 추출부(505)에 의해 빈도순으로 추출되어 정렬된 디폴트 조사 패턴을 저장한다.
특정 도메인 적용 디폴트 용언 DB(319)는 디폴트 용언 DB 후보 자동 추출부(507)에 의해 추출된 동사별 고빈도 대역어를 저장한다.
선별기준에 따른 용언구 패턴 추가 구축부(400)는 용언별 대역어 다양성에 따른 선별 구축부(401)와 패턴 길이에 따른 선별 구축부(403)를 포함한다.
용언별 대역어 다양성에 따른 선별 구축부(401)는 원시언어의 의미 다양성에 따라 선별 구축을 진행함에 있어서, ‘개발하다’와 같은 한자어 동사는 중국어로 변환시 일대일 변환으로 어휘적인 중의성이 없기에 각 구조당 1개의 패턴만 구축하고, 동사의 다양성 분류는 기존에 구축된 기본 용언구 패턴 DB를 자동 정렬하여 추출한다. 즉 동사가 실제 기 구축된 패턴에서 쓰이는 대역어 특성에 따라 여러가지 대역어 중 가장 빈도가 높은 대역어가 전체 대역어에서 사용되는 비중을 계산하며, 이 비중이 일정 임계값을 초과하는 단어들에 대해서는 대량 구축을 진행 하지 않고, 이 비중이 낮은 단어, 다시 말하여 다양한 대역어로 고루 쓰이는 용언에 대해서 집중 구축한다. 여기서, 한자어 용언(개발하다, 발명하다 등등)들은 주로 제1대역어의 비중이 매우 높고, 순 우리말 용언(뜨다, 올리다, 열다)들은 제1대역어의 비중이 매우 낮다.
패턴 길이에 따른 선별 구축부(403)는 제1대역어의 비중에 따라 비중이 낮은 용언에 대해서는 용언 자체의 대역어 중의성이 있기 때문에 집중 구축해야 하고, 제1대역어의 비중이 매우 높아, 용언의 어휘적 중의성이 없는 용언에 대해서는 패 턴 길이에 근거하여 선별 구축을 진행하고, 선별 구축된 용언구 패턴들을 기본 용언구 패턴 DB(450)에 제공한다.
기본 용언구 패턴 DB(450)는 선별기준에 따른 용언구 패턴 추가 구축부(400)로부터 입력되는 선별 구축된 용언구 패턴들은 저장한다.
디폴트 패턴 자동 추출부(500)는 디폴트 용언구 패턴 DB 자동 추출부(501)와 디폴트 어순 용언구 패턴 DB 자동 추출부(503)와 디폴트 조사 DB 자동 추출부(505)와 디폴트 용언 DB 후보 자동 추출부(507)를 포함한다.
디폴트 용언구 패턴 DB 자동 추출부(501)는 기본 용언구 패턴 DB(450)에 저장된 선별 구축되어 있는 용언구 패턴을 각 용언 별로 정렬하고, 각 용언 당 구축된 격성분의 구조에 따라 다시 정렬을 진행하여 디폴트 용언구 패턴 DB(313)에 저장한다.
디폴트 어순 용언구 패턴 DB 자동 추출부(503)는 기본 용언구 패턴 DB(450)에 저장된 선별 구축되어 있는 용언구 패턴 중 자동 추출되는 디폴트 용언구 패턴인 ‘*가 *을 개발하다 > *(디폴트) 開發 *(디폴트)’그리고 ‘*가 *을 발명하다 > *(디폴트) 發明 *(디폴트)’등을 ‘*가 *을 DFLTVERB > *(디폴트) DFLTVERB *(디폴트)’로 정렬한 디폴트 어순 용언구 패턴을 디폴트 어순 용언구 패턴 DB(315)에 저장한다.
디폴트 조사 DB 자동 추출부(505)는 기본 용언구 패턴 DB(450)에 저장된 선별 구축되어 있는 용언구 패턴인 “A : 국내(위치)에서 개발하다 > 在(에서) 國內(국내) 開發(개발하다)”에서 조사 패턴의 “위치에서 개발하다 > 在”와 같이 조 사 ‘에서’에 대해서 동사의 ‘개발하다’와 격 성분의 의미코드의 ‘위치’등 문맥에 대응하는 조사 대역어 ‘在’를 빈도 순으로 추출하고 정렬을 진행하여 디폴트 조사 DB(317)에 저장한다.
디폴트 용언 DB 후보 자동 추출부(507)는 기본 용언구 패턴 DB(450)에 저장된 선별 구축되어 있는 용언구 패턴에서 각 동사별로 고빈도 대역어를 추출하여 디폴트 용언 대역어 후보로 사용하기 위해 특정 도메인 적용 디폴트 용언 DB(319)에 저장한다.
따라서, 본 발명은 다단계 용언구 패턴 매칭 기법을 적용하여 번역성능을 향상시키고, 번역장치를 위한 용언구 패턴을 다단계로 적용하며, 다단계 용언구 패턴을 자동으로 추출함으로써, 고성능의 기계번역장치를 구축할 수 있다.
다음에, 상술한 바와 같은 구성을 갖는 본 실시 예에서 다단계 용언구 패턴을 적용한 번역장치의 동작 과정에 대하여 설명한다.
도 2는 본 발명의 바람직한 실시 예에 따른 번역장치를 위한 적용방법에 대하여 상세하게 설명한 흐름도이다.
먼저, 원시언어로 된 입력문(S1)에 대하여 형태소 분석부(100)를 통해 형태소가 분석(S201)되어 구조 분석부(200)에 제공되고, 형태소 분석부(100)에 의해 형태소가 분석된 입력문에 대하여 구조 분석부(200)를 통해 구조가 분석(S203)되어 용언구 패턴 다단계 적용부(300)내 용언구 패턴 매칭을 위한 단문 생성부(301)에 제공된다.
구조 분석부(200)에 의해 구조가 분석된 입력문에 대하여 용언구 패턴 매칭 을 위한 단문 생성부(301)를 통해 목적언어로 변환하기 위한 용언구 패턴 구조의 단문 단위로 재 구성(S205)되어 기본 용언구 패턴 매칭부(303)에 제공된다.
용언구 패턴 매칭을 위한 단문 생성부(301)로부터 입력된 단문 단위로 재구성된 입력 단문에 대하여 기본 용언구 패턴 매칭부(303)에서는 의미기반 매칭을 진행할 경우 입력 단문과 기 구축된 용언구 패턴 중 각 격 성분의 의미코드 성분이 모두 매칭되도록 기본 용언구 패턴 DB(311)를 통해 기본 용언구 패턴에 적용하여 매칭을 진행(S207)하고 그 기본 용언구 매칭이 진행된 패턴을 디폴트 용언구 패턴 매칭부(305)에 제공한다.
여기서, 용언구 패턴의 매칭 성능을 향상시키기 위해 주격은 의미 기반의 용언구 패턴에서 '*' 디폴트 개념을 도입하여 주격의 가중치를 하향 조정하고, 상대적으로 주격 이외의 격으로서 부사격 또는 목적격을 포함하는 다른 격 성분의 가중치를 상향 조정하여 패턴 매칭 성능을 높일 수 있다.
디폴트 용언구 패턴 매칭부(305)에서는 기본 용언구 패턴 매칭부(303)에 의해 기본 용언구 패턴의 매칭이 완전 매칭되었거나 혹은 대부분 격 성분이 의미코드로 매칭되는지를 판단(S209)한다.
상기 판단(S209)결과, 완전 매칭 혹은 의미코드로 매칭될 경우, 기본 용언구 매칭이 진행된 패턴을 사용(S211)한다.
반면에, 상기 판단(S209)결과, 완전 매칭 혹은 의미코드로 매칭되지 않아 격 성분의 의미코드가 전혀 매칭되지 않거나 매칭 점수가 기설정된 임계값에 포함되지 않는 경우(예컨대, 한국어에서 한자어 용언의 대부분 목적격 성분의 의미에 상관없 이 고정된 문장 구조와 대역어를 갖기 때문에 의미코드 기반의 기본 용언구 패턴 매칭부(303)에 의해 비매칭됨), 디폴트 용언구 패턴 매칭부(305)에서는 같은 격조사와 같은 길이를 가진 해당 용언의 디폴트 패턴에 적용하여 어순 및 대역어 중의성을 해소하도록 하기 위해 디폴트 용언구 패턴 DB(313)를 통해 디폴트 용언구 패턴에 적용하여 매칭을 진행(S213)하고 그 디폴트 용언구 매칭이 진행된 패턴을 디폴트 어순 매칭부(307)에 제공한다.
예컨대, “A : 회사(조직)가 신약(의약품)을 개발하다 > 公司(회사) 開發(개발하다) 新葯品(신약품)”의 A라는 패턴이 입력문이고, 기존에 구축된 기본 용언구 패턴 DB에는 “B : 회사(조직)가 신기술(지식)을 개발하다 > 公司(회사) 開發(개발하다) 新技術(신기술)”의 B라는 패턴밖에 없을 경우, 목적격의 의미코드(의약품 != 지식)가 서로 다르기에 매칭 실패가 발생한다. 이런 경우에는 굳이 A라는 패턴을 새로 구축할 필요 없이 B 패턴을 이용한 “C : *가 *를 개발하다 > *(디폴트) 開發(개발하다) *(디폴트)”라는 디폴트 C 패턴을 디폴트 용언구 패턴 DB를 통해 자동 추출하여 적용하면 ‘개발하다’와 같이 어순 구조적인 중의성은 존재하지만, 어휘적인 중의성이 낮은 한자어 용언에 대해 효율적이고 효과적인 매칭을 할 수 있다.
디폴트 어순 매칭부(307)에서는 디폴트 용언구 패턴 매칭부(305)에 의해 디폴트 용언구 패턴의 매칭이 완전하게 매칭되는지를 판단(S215)한다.
상기 판단(S215)결과, 완전하게 매칭될 경우 디폴트 용언구 매칭이 진행된 패턴을 사용(S217)한다.
반면에, 상기 판단(S215)결과, 완전하게 매칭되지 못한 경우, 디폴트 어순 매칭부(307)에서는 디폴트 어순 용언구 패턴 DB(315)를 통해 디폴트 어순 용언구 패턴에 적용하여 매칭을 진행(S219)하고 그 디폴트 어순 매칭이 진행된 패턴을 디폴트 조사 매칭부(309)에 제공한다.
예컨대, “A : *가 *에서 *를통해 *를 개발하다 > *(디폴트) 在(에서) *(디폴트) 通邂(를통해) *(디폴트) 開發(개발하다) *(디폴트)”라는 패턴이 입력문으로 들어 올 경우, 디폴트 용언구 패턴 DB에는 A 패턴은 없고 “B : *가 *에서 *를통해 *를 발명하다 > *(디폴트) 在(에서) *(디폴트) 通邂(를통해) *(디폴트) 發明(발명하다) *(디폴트)”라는 B 패턴 밖에 없다면, 디폴트 용언구 패턴 매칭부(305)에 의해 완전하게 매칭되지 못하여 매칭 실패가 발생한다.
이러한 매칭 실패의 문제를 해결하기 위해서는 용언 ‘발명하다’에 대해서 패턴 A와 같은 격 구조를 가지는 디폴트 패턴을 추가 구축해야 하지만, 모든 동사의 모든 격 구조를 가지는 패턴에 대해서 디폴트 패턴을 구축하기가 어렵기에 디폴트 어순 용언구 패턴 개념을 도입하였다. 즉, “C : *가 *에서 *를통해 *를 DFLTVERB > *(디폴트) 在(에서) *(디폴트) 通邂(를통해) *(디폴트) DFLTVERB(디폴트용언) *(디폴트)”의 패턴 C는 구체적인 용언을 명시하지 않고 ‘DFLTVERB’를 사용함으로써, 해당 격 성분 구조를 가지는 패턴은 용언에 상관없이 C 패턴에 명시한 어순으로 목적어를 변환할 수 있도록 하고, 이 디폴트 어순 용언구 패턴에는 용언의 대역어가 없기에, 용언의 대역어는 기본 용언구 패턴 매칭부에서 추출하여 사용하거나, 디폴트 용언구 패턴 매칭부에서 추출하여 사용한다.
디폴트 조사 매칭부(309)에서는 디폴트 어순 매칭부(307)에 의해 디폴트 어순 용언구 패턴의 매칭이 완전하게 매칭되는지를 판단(S221)한다.
상기 판단(S221)결과, 완전하게 매칭될 경우 디폴트 어순 용언구 패턴의 각 성분의 어순만 표기한 패턴이기에, 동사의 대역어가 존재하지 않고, 또 격조사에 대한 대역어가 표기되어 있기는 하나 바로 사용하지 않음에 따라 어순에 대하여 디폴트 어순 용언구 패턴의 순서대로 정하고, 동사의 대역어에 대하여 기본 용언구 패턴 매칭으로 부분 매칭하여 동사 대역어를 결정하며, 격조사에 대한 대역어에 대하여 디폴트 조사 패턴을 참조하여 생성(S223)하도록 한다.
반면에, 상기 판단(S221)결과, 완전하게 매칭되지 못한 경우, 디폴트 조사 매칭부(309)에서는 각 격 성분의 조사 중의성을 해소하기 위하여 디폴트 조사 DB(317)를 통해 디폴트 조사 패턴에 적용하면서 디폴트 생성(규칙에 기반)을 진행(S225)하고, 더불어 입력문(S1)이 특허문서 혹은 기술 논문인 경우 일부 용언들이 그 분야에 특화되어, 어휘적인 측면에서 대역어가 고정되는 경우를 위해 특정 도메인 적용 디폴트 용언 DB(319)에 적용하여 매칭을 진행함으로써, 최종적인 용언구 패턴의 적용을 완성시킨 대역문(S2)을 출력(S227)한다.
예컨대, "A : 국내(위치)에서 개발하다 > 在(에서) 國內(국내) 開發(개발하다)”가 저장된 디폴트 조사 DB에 적용하여 매칭을 진행할 경우, 이 조사 중의성 해소 패턴 A 는 부사격 조사의 ‘에서’에 대해서 동사의 ‘개발하다’격성분의 의미코드의 ‘위치’등 문맥에 대응하는 대역어 ‘在’를 명시하는 방법으로 격조사 중의성을 해소할 수 있다. 또한, ‘개발하다’라는 동사는 한-중 기술분야에서는 패턴의 길이와 격 성분에 상관없이 ‘開發’로 변환이 되어도 문제가 발생하지 않는다.
따라서, 본 발명은 다단계 용언구 패턴을 적용한 번역장치와 이를 위한 적용방법 및 추출방법을 제공함으로써, 원시언어에서 목적언어로 변환하는 데 사용되며, 어휘적인 측면과 어순 등 언어 구조적인 측면에서 이종 언어간에 발생하는 중의성을 해소할 수 있다.
도 3은 본 발명의 바람직한 실시 예에 따른 기본 용언구 패턴에서 디폴트 패턴을 자동으로 추출하는 방법에 대하여 상세하게 설명한 흐름도이다.
먼저, 선별기준에 따른 용언구 패턴 추가 구축부(400)로부터 입력되는 선별 구축된 용언구 패턴들이 기본 용언구 패턴 DB(450)에 저장(S301)되어 있다.
상술한 바와 같이 기본 용언구 패턴 DB(450)에 저장된 선별 구축되어 있는 용언구 패턴에 대하여 디폴트 용언구 패턴 DB 자동 추출부(501)에서는 패턴을 각 용언 별로 정렬하고, 각 용언 당 구축된 격성분의 구조에 따라 다시 정렬을 진행(S303)하여 디폴트 용언구 패턴 DB(313)에 저장(S304)한다.
여기서, 기본 용언구 패턴인 “A : 회사(조직)가 신약(의약품)을 개발하다 > 公司(회사) 開發(개발하다) 新藥品(신약품)”그리고 “B : 회사(조직)가 신기술(지식)을 개발하다 > 公司(회사) 開發(개발하다) 新技術(신기술)”등은 동사 ‘개발하다’의 ‘*가 *을 개발하다 > *(디폴트) 開發 *(디폴트)’로 정렬 압축이 되며, 각 구조별로 정렬 및 디폴트 변환을 진행하며, 동사 대역어는 최다 빈도의 대역어를 사용하며, 대역어의 빈도가 같을 경우에는 조사의 빈도순으로 추출하고 정렬을 진 행하여 디폴트 용언구 패턴 DB(313)에 저장되는 것이다.
다음으로, 기본 용언구 패턴 DB(450)에 저장된 선별 구축되어 있는 용언구 패턴에 대하여 디폴트 어순 용언구 패턴 DB 자동 추출부(503)에서는 이 패턴중 디폴트 용언구 패턴인 ‘*가 *을 개발하다 > *(디폴트) 開發 *(디폴트)’그리고 ‘*가 *을 발명하다 > *(디폴트) 發明 *(디폴트)’등을 ‘*가 *을 DFLTVERB > *(디폴트) DFLTVERB *(디폴트)’의 디폴트 어순 용언구 패턴을 추출(S305) 및 정렬하여 디폴트 어순 용언구 패턴 DB(315)에 저장(S306)한다.
다음에, 기본 용언구 패턴 DB(450)에 저장된 선별 구축되어 있는 용언구 패턴에 대하여 디폴트 조사 DB 자동 추출부(505)에서는 이 패턴인 “A : 국내(위치)에서 개발하다 > 在(에서) 國內(국내) 開發(개발하다)”에서 조사 패턴의 “위치에서 개발하다 > 在”와 같이 조사의 ‘에서’에 대해서 동사의 ‘개발하다’와 격 성분의 의미코드의 ‘위치’등 문맥에 대응하는 조사 대역어 ‘在’를 빈도 순으로 추출(S307)하고 정렬을 진행하여 디폴트 조사 DB(317)에 저장(S308)한다.
마지막으로, 기본 용언구 패턴 DB(450)에 저장된 선별 구축되어 있는 용언구 패턴에 대하여 디폴트 용언 DB 후보 자동 추출부(507)에서는 패턴에서 각 동사별로 고빈도 대역어를 추출(S309)하여 디폴트 용언 대역어 후보로 사용하기 위해 특정 도메인 적용 디폴트 용언 DB(319)에 저장(S310)한다. 여기서, 특화된 도메인을 대상으로 구축된 용언구 패턴에서 추출한 고빈도 용언 대역어 중에서 수동으로 검증을 거친 후 사용할 수 있다.
따라서, 본 발명은 다단계 용언구 패턴 매칭 기법을 적용하여 번역성능을 향 상시키고, 번역장치를 위한 용언구 패턴을 다단계로 적용하며, 다단계 용언구 패턴을 자동으로 추출함으로써, 고성능의 기계번역장치를 구축할 수 있으며, 다단계 용언구 패턴을 적용한 번역장치와 이를 위한 적용방법 및 추출방법을 제공함으로써, 원시언어에서 목적언어로 변환하는 데 사용되며, 어휘적인 측면과 어순 등 언어 구조적인 측면에서 이종 언어간에 발생하는 중의성을 해소할 수 있다.
한편, 본 발명의 상세한 설명에서는 구체적인 실시예에 관해 설명하였으나, 본 발명의 범위에서 벗어나지 않는 한도 내에서 여러 가지 변형이 가능함은 물론이다. 그러므로 본 발명의 범위는 설명된 실시예에 국한되지 않으며, 후술되는 특허청구의 범위뿐만 아니라 이 특허청구의 범위와 균등한 것들에 의해 정해져야 한다.
도 1은 본 발명의 바람직한 실시예에 따른 다단계 용언구 패턴을 적용한 번역장치를 위한 블록 구성도,
도 2는 본 발명의 바람직한 실시 예에 따른 번역장치를 위한 적용방법에 대하여 상세하게 설명한 흐름도,
도 3은 본 발명의 바람직한 실시 예에 따른 기본 용언구 패턴에서 디폴트 패턴을 자동으로 추출하는 방법에 대하여 상세하게 설명한 흐름도.
<도면의 주요부분에 대한 부호의 설명>
100 : 형태소 분석부 200 : 구조 분석부
300 : 용언구 패턴 다단계 적용부
400 : 선별기준에 따른 용언구 패턴 추가 구축부
450 : 기본 용언구 패턴 DB 500 : 디폴트 패턴 자동추출부

Claims (12)

  1. 입력문을 목적언어로 변환하기 위한 용언구 패턴 구조의 단문 단위로 구성하는 용언구 패턴 매칭을 위한 단문 생성부와,
    상기 단문 단위로 구성된 입력 단문과 기 구축된 용언구 패턴 중 각 격 성분의 의미코드 성분이 모두 매칭되도록 기본 용언구 패턴 DB를 통해 기본 용언구 패턴에 적용하여 매칭을 진행하는 기본 용언구 패턴 매칭부와,
    상기 기본 용언구 패턴의 매칭이 비매칭될 경우 어순 및 대역어 중의성을 해소하기 위해 디폴트 용언구 패턴 DB를 통해 디폴트 용언구 패턴에 적용하여 매칭을 진행하는 디폴트 용언구 패턴 매칭부와,
    상기 디폴트 용언구 패턴의 매칭이 비매칭될 경우 디폴트 어순 용언구 패턴 DB를 통해 디폴트 어순 용언구 패턴에 적용하여 매칭을 진행하는 디폴트 어순 매칭부와,
    상기 디폴트 어순 용언구 패턴의 매칭이 비매칭될 경우 격 성분의 조사 중의성을 해소하기 위하여 디폴트 조사 DB를 통해 디폴트 조사 패턴에 적용하여 디폴트 생성을 진행시킨 대역문을 출력하는 디폴트 조사 매칭부
    를 포함하는 다단계 용언구 패턴을 적용한 번역장치.
  2. 제 1 항에 있어서,
    상기 기본 용언구 패턴 DB에는, 선별 구축된 기본 용언구 패턴들이 저장되어 있는 것을 특징으로 하는 다단계 용언구 패턴을 적용한 번역장치.
  3. 제 1 항에 있어서,
    상기 디폴트 용언구 패턴 DB에는, 디폴트 용언구 패턴 DB 자동 추출부에 의해 자동 추출 및 각 용언 별로 정렬되어 선별 구축된 디폴트 용언구 패턴과 각 용언 당 구축된 격성분의 구조에 따라 다시 정렬된 디폴트 용언구 패턴이 저장되어 있는 것을 특징으로 하는 다단계 용언구 패턴을 적용한 번역장치.
  4. 제 1 항에 있어서,
    상기 디폴트 어순 용언구 패턴 DB에는, 디폴트 어순 용언구 패턴 DB 자동 추출부에 의해 자동 추출되어 정렬된 디폴트 어순 용언구 패턴이 저장되어 있는 것을 특징으로 하는 다단계 용언구 패턴을 적용한 번역장치.
  5. 제 1 항에 있어서,
    상기 디폴트 조사 DB에는, 디폴트 조사 DB 자동 추출부에 의해 빈도순으로 추출되어 정렬된 디폴트 조사 패턴이 저장되어 있는 것을 특징으로 하는 다단계 용 언구 패턴을 적용한 번역장치.
  6. 제 1 항에 있어서,
    상기 디폴트 조사 매칭부는,
    상기 입력문이 특허문서 혹은 기술 논문인 경우 디폴트 용언 DB 후보 자동 추출부에 의해 추출된 동사별 고빈도 대역어가 저장되어 있는 특정 도메인 적용 디폴트 용언 DB에 적용하여 매칭시킨 대역문을 출력하는 것을 특징으로 하는 다단계 용언구 패턴을 적용한 번역장치.
  7. 제 1 항에 있어서,
    상기 디폴트 용언구 패턴 매칭부는, 의미 기반의 용언구 패턴에서 '*' 디폴트 개념을 이용하여 주격의 가중치를 하향 조정하고, 주격 이외의 격으로서 부사격 또는 목적격을 포함하는 다른 격 성분의 가중치를 상향 조정하는 것을 특징으로 하는 다단계 용언구 패턴을 적용한 번역장치.
  8. 원시언어의 입력문의 형태소를 분석하는 단계와,
    상기 형태소가 분석된 입력문의 구조를 분석하는 단계와,
    상기 구조가 분석된 입력문을 목적언어로 변환하기 위한 용언구 패턴 구조의 단문 단위로 구성하는 단계와,
    상기 단문 단위로 구성된 입력 단문과 기 구축된 용언구 패턴 중 각 격 성분의 의미코드 성분이 모두 매칭되도록 기본 용언구 패턴 DB를 통해 기본 용언구 패턴에 적용하여 매칭을 진행하는 단계와,
    상기 기본 용언구 패턴의 매칭이 비매칭될 경우 어순 및 대역어 중의성을 해소하기 위해 디폴트 용언구 패턴 DB를 통해 디폴트 용언구 패턴에 적용하여 매칭을 진행하는 단계와,
    상기 디폴트 용언구 패턴의 매칭이 비매칭될 경우 디폴트 어순 용언구 패턴 DB를 통해 디폴트 어순 용언구 패턴에 적용하여 매칭을 진행하는 단계와,
    상기 디폴트 어순 용언구 패턴의 매칭이 비매칭될 경우 격 성분의 조사 중의성을 해소하기 위하여 디폴트 조사 DB를 통해 디폴트 조사 패턴에 적용하여 디폴트 생성을 진행시킨 대역문을 출력하는 단계
    를 포함하는 번역장치를 위한 적용방법.
  9. 제 8 항에 있어서,
    상기 기본 용언구 패턴이 매칭될 경우, 기본 용언구 매칭이 진행된 패턴을 사용하는 것을 특징으로 하는 번역장치를 위한 적용방법.
  10. 제 8 항에 있어서,
    상기 디폴트 용언구 패턴이 매칭될 경우, 디폴트 용언구 매칭이 진행된 패턴을 사용하는 것을 특징으로 하는 번역장치를 위한 적용방법.
  11. 제 8 항에 있어서,
    상기 디폴트 어순 용언구 패턴이 매칭될 경우, 어순과 동사의 대역어와 격조사에 대한 대역어를 생성하는 것을 특징으로 하는 번역장치를 위한 적용방법.
  12. 선별 구축된 용언구 패턴들을 저장하는 단계와,
    상기 선별 구축된 용언구 패턴을 각 용언 별로 정렬하고, 각 용언 당 구축된 격성분의 구조에 따라 다시 정렬을 진행하는 단계와,
    상기 선별 구축된 용언구 패턴 중 디폴트 용언구 패턴으로 정렬된 디폴트 어순 용언구 패턴을 추출하는 단계와,
    상기 선별 구축된 용언구 패턴에서 조사 대역어를 빈도 순으로 추출하는 단계와,
    상기 선별 구축된 용언구 패턴에서 각 동사별로 고빈도 대역어를 추출하는 단계
    를 포함하는 다단계 용언구 패턴을 적용한 번역장치를 위한 추출방법.
KR1020080084626A 2008-08-28 2008-08-28 다단계 용언구 패턴을 적용한 번역장치와 이를 위한적용방법 및 추출방법 KR100956794B1 (ko)

Priority Applications (2)

Application Number Priority Date Filing Date Title
KR1020080084626A KR100956794B1 (ko) 2008-08-28 2008-08-28 다단계 용언구 패턴을 적용한 번역장치와 이를 위한적용방법 및 추출방법
US12/464,121 US8335681B2 (en) 2008-08-28 2009-05-12 Machine-translation apparatus using multi-stage verbal-phrase patterns, methods for applying and extracting multi-stage verbal-phrase patterns

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020080084626A KR100956794B1 (ko) 2008-08-28 2008-08-28 다단계 용언구 패턴을 적용한 번역장치와 이를 위한적용방법 및 추출방법

Publications (2)

Publication Number Publication Date
KR20100025885A true KR20100025885A (ko) 2010-03-10
KR100956794B1 KR100956794B1 (ko) 2010-05-11

Family

ID=41726646

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020080084626A KR100956794B1 (ko) 2008-08-28 2008-08-28 다단계 용언구 패턴을 적용한 번역장치와 이를 위한적용방법 및 추출방법

Country Status (2)

Country Link
US (1) US8335681B2 (ko)
KR (1) KR100956794B1 (ko)

Families Citing this family (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9201871B2 (en) 2010-06-11 2015-12-01 Microsoft Technology Licensing, Llc Joint optimization for machine translation system combination
KR101356417B1 (ko) * 2010-11-05 2014-01-28 고려대학교 산학협력단 병렬 말뭉치를 이용한 동사구 번역 패턴 구축 장치 및 그 방법
WO2012079245A1 (zh) * 2010-12-17 2012-06-21 北京交通大学 知识获取装置及方法
WO2015063536A1 (en) * 2013-10-28 2015-05-07 Translation Management Systems Ltd. Networked language translation system and method
US11017172B2 (en) 2018-08-01 2021-05-25 Signals Analytics Ltd. Proposition identification in natural language and usage thereof for search and retrieval
CN110750989B (zh) * 2019-10-28 2023-09-19 北京金山数字娱乐科技有限公司 一种语句分析的方法及装置
CN110991196B (zh) * 2019-12-18 2021-10-26 北京百度网讯科技有限公司 多义词的翻译方法、装置、电子设备及介质

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100574887B1 (ko) 1999-12-31 2006-04-27 주식회사 케이티 기계번역 시스템에서의 어휘 중의성 해소 장치 및 그 방법
US7254531B2 (en) * 2000-09-05 2007-08-07 Nir Einat H In-context analysis and automatic translation
KR100561227B1 (ko) 2003-12-19 2006-03-15 한국전자통신연구원 한-중 기계번역시스템의 용언구 패턴 자동 확장 및 검증장치 및 방법
KR100617319B1 (ko) 2004-12-14 2006-08-30 한국전자통신연구원 영한 자동번역을 위하여 동사구 패턴 및 의미 벡터를 사용하는 동사/명사 대역어 선택 장치 및 그 방법

Also Published As

Publication number Publication date
KR100956794B1 (ko) 2010-05-11
US20100057437A1 (en) 2010-03-04
US8335681B2 (en) 2012-12-18

Similar Documents

Publication Publication Date Title
KR100956794B1 (ko) 다단계 용언구 패턴을 적용한 번역장치와 이를 위한적용방법 및 추출방법
KR100853173B1 (ko) 통계적 자동 번역 방식에 기반한 음성 자동 통역 시스템 및그에 적용되는 번역 처리 방법 및 그 훈련방법
Feely et al. Controlling Japanese honorifics in English-to-Japanese neural machine translation
Tennage et al. Neural machine translation for sinhala and tamil languages
KR20080052282A (ko) 통계적 기계번역 시스템에서 단어 및 구문들간의 번역관계를 자율적으로 학습하기 위한 장치 및 그 방법
Hardmeier A neural model for part-of-speech tagging in historical texts
Barman et al. Assamese WordNet based quality enhancement of bilingual machine translation system
Grishman Iterative alignment of syntactic structures for a bilingual corpus
Leidig et al. Automatic detection of anglicisms for the pronunciation dictionary generation: a case study on our German IT corpus.
Upadhyay et al. Transish: translator from Sanskrit to English-a rule based machine translation
Pramodya et al. A comparison of transformer, recurrent neural networks and SMT in Tamil to Sinhala MT
KR100513161B1 (ko) 기계번역 대역어 선정을 위한 한국어 복합명사 의미결정장치 및 방법
Shukla et al. A Framework of Translator from English Speech to Sanskrit Text
Ariaratnam et al. A shallow parser for Tamil
Vogel-Fernandez et al. esT5s: A Spanish Model for Text Summarization
KR100831037B1 (ko) 병렬 말뭉치를 이용한 신조어의 대역어 자동 선정 방법 및장치
KR20160085100A (ko) 하이브리드 번역 장치 및 그 방법
Kirchhoff et al. Morphological modeling for machine translation of english-iraqi arabic spoken dialogs
Och et al. What can machine translation learn from speech recognition?
Kanojia et al. That’ll do fine!: A coarse lexical resource for english-hindi mt, using polylingual topic models
Pham et al. Adaptation in Statistical Machine Translation for Low-resource Domains in English-Vietnamese Language
Mansour et al. Automatic dialect classification for statistical machine translation
Williams et al. Tools and resources for speech synthesis arising from a Welsh TTS project.
Dyer The University of Maryland translation system for IWSLT 2007
Sawaf et al. Hybrid Machine Translation Applied to Media Monitoring

Legal Events

Date Code Title Description
A201 Request for examination
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20130325

Year of fee payment: 4

FPAY Annual fee payment

Payment date: 20140403

Year of fee payment: 5

FPAY Annual fee payment

Payment date: 20150423

Year of fee payment: 6

FPAY Annual fee payment

Payment date: 20160408

Year of fee payment: 7

FPAY Annual fee payment

Payment date: 20170417

Year of fee payment: 8

FPAY Annual fee payment

Payment date: 20180102

Year of fee payment: 9

FPAY Annual fee payment

Payment date: 20190102

Year of fee payment: 10