KR20130026717A - 동시 처리 패턴에 기반한 번역장치 및 방법 - Google Patents
동시 처리 패턴에 기반한 번역장치 및 방법 Download PDFInfo
- Publication number
- KR20130026717A KR20130026717A KR1020110090047A KR20110090047A KR20130026717A KR 20130026717 A KR20130026717 A KR 20130026717A KR 1020110090047 A KR1020110090047 A KR 1020110090047A KR 20110090047 A KR20110090047 A KR 20110090047A KR 20130026717 A KR20130026717 A KR 20130026717A
- Authority
- KR
- South Korea
- Prior art keywords
- simultaneous processing
- analysis
- translation
- unit
- morpheme
- Prior art date
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/40—Processing or translation of natural language
- G06F40/42—Data-driven translation
- G06F40/47—Machine-assisted translation, e.g. using translation memory
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/205—Parsing
- G06F40/211—Syntactic parsing, e.g. based on context-free grammar [CFG] or unification grammars
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/268—Morphological analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/40—Processing or translation of natural language
- G06F40/55—Rule-based translation
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Artificial Intelligence (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Computational Linguistics (AREA)
- General Health & Medical Sciences (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Machine Translation (AREA)
Abstract
병렬 코퍼스(PARALLEL CORPUS)로부터 분석 및 생성 지식을 추출하여 분석 및 생성을 동시에 처리할 수 있는 번역지식을 생성하고, 분석 및 생성을 동시에 처리할 수 있는 번역 지식을 이용하여 입력문에 대한 자동 번역을 수행하는 기술이 개시된다. 병렬 코퍼스(PARALLEL CORPUS)에 기반하여 입력문으로부터 동시 처리 패턴을 추출하는 형태소 분석기와 동시 처리 패턴에 기반하여 입력문의 구문을 분석하는 구문 분석기 및 구문 분석기에 의한 구문 분석결과에 기반하여 번역문을 생성하는 대역문 생성기를 포함하는 동시 처리 패턴에 기반한 번역장치를 제공한다. 따라서, 동시 처리 패턴에 기반한 번역장치 및 방법에 따르면, 변환 방식의 자동번역장치에 있어서, 분석과 생성의 모호성 해소를 위해 동시 처리 패턴을 사용함으로써, 지식 구축에 따른 비용을 절약하며, 분석 단계에서의 모호성과 생성 단계에서의 모호성 해소를 동시에 처리할 수 있다.
Description
본 발명은 자동 번역 기술에 관한 것으로, 더욱 상세하게는 병렬 코퍼스를 이용한 동시 처리 패턴에 기반하는 번역장치 및 방법에 관한 것이다.
컴퓨터의 발명과 그 발전의 역사만큼이나 기계를 통해 언어의 장벽을 해소하고자 하는 오랜 노력이 있었고, 현재도 자동 번역 기술은 꾸준히 발전되고 있다. 인터넷의 활성화와 더욱 가속화되는 세계화는 폭발적인 다국어 콘텐츠를 생산해 내고 있으며, 자동 번역에 대한 수요는 사람에 의한 수동 번역의 생산성을 뛰어 넘고 있다. 자동 번역 기술은 인터넷 콘텐츠 번역, 고급 문서번역 등 다양한 부문에서 중요한 요소 기술로 인식되고 있다.
자동 번역은 하나의 언어로 기술된 문장을 다른 언어의 문장으로 자동으로 번역하기 위한 제반의 기술로, 일반적으로 전체 번역 과정이 사람의 관여 없이 진행 가능한 기계 번역 기술을 의미한다.
기계 번역 기술의 유형에는 직접 방식, 변환 방식, 중간 언어 방식, 통계 기반 방식 등이 있다. 이 중 변환 방식 기계 번역(transfer-based machine translation)은 규칙 기반 기계 번역(rule based machine translation)으로도 불리운다. 변환 방식 기계 번역기술은 번역 대상 원문에 대해 형태소 분석, 품사 태깅과 함께 구문 분석을 수행하고, 분석된 원문의 구문 구조를 변환 규칙(transfer rules)에 기반해 목적 언어의 구문 구조로 변환한 후에 목적 언어로 구성된 문장을 생성하는 방식으로 자동 번역을 수행한다.
종래의 변환 방식에 기반한 자동 번역기술은 원시언어의 분석 후, 목적 언어의 생성을 수행하는 형태로 이루어진다. 따라서, 변환 방식에 기반한 자동 번역이 수행되기 위해서는 형태소 분석과 구문 분석을 수행하는 분석단계를 거친 후, 분석 정보에 기반하여 생성이 이루어지는 생성단계를 거치게 된다. 즉, 분석단계 또는 생성단계 중 어느 한 단계에서 오류가 발생되면, 잘못된 번역이 수행되게 된다.
예컨대, 아래의 예문1에서, ‘여기’는 형태소 분석을 통해 부사로 분석된 후, 구문 분석을 통해 ‘주세요’를 수식하는 관계에 있는 것으로 분석되어야, 생성단계에서 ‘here’가 대역어로 생성되어 올바르게 번역이 수행될 수 있다.
예문1
)
여기
콜라 한잔 주세요.
Give
me
a
glass
of
coke
here
,
please
.
‘여기’와 같이 명사와 부사로 모두 쓰일 수 있는 단어의 경우, 분석의 애매성이 높아 분석단계에서 오류가 발생하여 잘못된 번역이 수행되기 쉽다. 만약 위의 예문1에서 ‘여기’가 명사로 잘못 분석되거나, ‘콜라’를 수식하는 것으로 구문 분석이 이루어지면, 아래의 예문2와 같은 잘못된 번역이 수행될 수 있다.
예문2
)
여기
콜라 한잔 주세요.
Give
me
a
glass
of
coke
of
here
,
please
.
또한, 분석이 올바르게 수행되더라도, 별도의 생성 정보가 있어야 올바른 대역문의 생성이 가능하므로, 분석단계를 위한 지식과 생성단계를 위한 지식을 별도로 구축하여야 하는 문제점이 있다.
상기와 같은 문제점을 해결하기 위한 본 발명의 목적은, 변환 방식의 자동번역장치에 있어서, 분석과 생성의 모호성 해소를 위해 동시 처리 패턴을 사용함으로써, 지식 구축에 따른 비용을 절약하며, 분석 단계에서의 모호성과 생성 단계에서의 모호성 해소를 동시에 처리함으로써, 분석 단계에서의 모호성 실패로 인한 번역 오류로 인해 생성 결과까지 잘못되는 문제점을 해결함으로써 번역 품질을 개선하는 동시 처리 패턴에 기반한 번역장치 및 방법을 제공하는데 있다.
상기 목적을 달성하기 위한 본 발명은, 병렬 코퍼스에 기반하여 입력문으로부터 동시 처리 패턴을 추출하는 형태소 분석기와 동시 처리 패턴에 기반하여 입력문의 구문을 분석하는 구문 분석기 및 구문 분석기에 의한 구문 분석결과에 기반하여 번역문을 생성하는 대역문 생성기를 포함하는 동시 처리 패턴에 기반한 번역장치를 제공한다.
상기와 같은 본 발명에 따른 동시 처리 패턴에 기반한 번역장치를 이용할 경우에는 분석 단계에서의 모호성과 생성 단계에서의 모호성 해소를 동시에 처리할 수 있다.
또한, 본 발명에 따른 동시 처리 패턴에 기반한 번역장치는 동시 처리 패턴을 사용함으로써 지식 구축에 따른 비용을 절감할 수 있는 장점이 있다.
본 발명의 효과들은 이상에서 언급한 효과들로 제한되지 않으며, 언급되지 않은 또 다른 효과들은 청구범위의 기재로부터 당업자에게 명확하게 이해될 수 있을 것이다.
도 1은 본 발명의 실시예에 따른 동시 처리 패턴에 기반한 번역장치의 블록구성도이다.
도 2는 본 발명의 실시예에 따른 동시 처리 패턴에 기반한 번역방법의 절차도이다.
도 2는 본 발명의 실시예에 따른 동시 처리 패턴에 기반한 번역방법의 절차도이다.
본 발명은 다양한 변경을 가할 수 있고 여러 가지 실시예를 가질 수 있는 바, 특정 실시예들을 도면에 예시하고 상세한 설명에 상세하게 설명하고자 한다. 그러나, 이는 본 발명을 특정한 실시 형태에 대해 한정하려는 것이 아니며, 본 발명의 사상 및 기술 범위에 포함되는 모든 변경, 균등물 내지 대체물을 포함하는 것으로 이해되어야 한다. 각 도면을 설명하면서 유사한 참조부호를 유사한 구성요소에 대해 사용하였다.
어떤 구성요소가 다른 구성요소에 "연결되어" 있다거나 "접속되어" 있다고 언급된 때에는, 그 다른 구성요소에 직접적으로 연결되어 있거나 또는 접속되어 있을 수도 있지만, 중간에 다른 구성요소가 존재할 수도 있다고 이해되어야 할 것이다. 반면에, 어떤 구성요소가 다른 구성요소에 "직접 연결되어" 있다거나 "직접 접속되어" 있다고 언급된 때에는, 중간에 다른 구성요소가 존재하지 않는 것으로 이해되어야 할 것이다.
본 출원에서 사용한 용어는 단지 특정한 실시예를 설명하기 위해 사용된 것으로, 본 발명을 한정하려는 의도가 아니다. 단수의 표현은 문맥상 명백하게 다르게 뜻하지 않는 한, 복수의 표현을 포함한다. 본 출원에서, "포함하다" 또는 "가지다" 등의 용어는 명세서상에 기재된 특징, 숫자, 단계, 동작, 구성요소, 부품 또는 이들을 조합한 것이 존재함을 지정하려는 것이지, 하나 또는 그 이상의 다른 특징들이나 숫자, 단계, 동작, 구성요소, 부품 또는 이들을 조합한 것들의 존재 또는 부가 가능성을 미리 배제하지 않는 것으로 이해되어야 한다.
다르게 정의되지 않는 한, 기술적이거나 과학적인 용어를 포함해서 여기서 사용되는 모든 용어들은 본 발명이 속하는 기술 분야에서 통상의 지식을 가진 자에 의해 일반적으로 이해되는 것과 동일한 의미를 가지고 있다. 일반적으로 사용되는 사전에 정의되어 있는 것과 같은 용어들은 관련 기술의 문맥 상 가지는 의미와 일치하는 의미를 가지는 것으로 해석되어야 하며, 본 출원에서 명백하게 정의하지 않는 한, 이상적이거나 과도하게 형식적인 의미로 해석되지 않는다.
이하, 본 발명에 따른 바람직한 실시예를 첨부된 도면을 참조하여 상세하게 설명한다.
도 1은 본 발명의 실시예에 따른 동시 처리 패턴에 기반한 번역장치의 블록구성도이다.
도 1을 참조하면, 본 발명에 따른 동시 처리 패턴에 기반한 번역장치(100)는 형태소 분석기(110), 구문 분석기(120) 및 대역문 생성기(130)를 포함하여 구성될 수 있다. 즉, 본 발명은 병렬 코퍼스(PARALLEL CORPUS)에 기반하여 입력문으로부터 동시 처리 패턴을 추출하는 형태소 분석기(110)와 동시 처리 패턴에 기반하여 입력문의 구문을 분석하는 구문 분석기(120) 및 구문 분석기에 의한 구문 분석결과에 기반하여 번역문을 생성하는 대역문 생성기(130)를 포함하는 동시 처리 패턴에 기반한 번역장치를 제공한다.
형태소 분석기(110)는 입력문을 구성하는 형태소를 분석하여 이를 출력하는 기능을 한다. 즉, 형태소 분석기(110)는 입력문의 형태소를 분석하여 구문 분석기(120)가 입력문의 구문 구조를 용이하게 분석할 수 있도록 한다. 또한, 대역문 생성기(130)는 구문 분석기(120)에 통하여 분석된 구문 구조에 기반하여 번역문을 생성한다.
특히, 본 발명은 변환 방식 자동 번역장치에 관한 것으로, 병렬 코퍼스(PARALLEL CORPUS)로부터 분석 및 생성 지식을 추출하여 분석 및 생성을 동시에 처리할 수 있는 번역지식을 생성하고, 분석 및 생성을 동시에 처리할 수 있는 번역 지식을 이용하여 입력문에 대한 자동 번역을 수행할 수 있다. 분석 및 생성의 양 단계는 높은 모호성을 가지며, 사용되는 지식이 중복되는 특성을 가지고 있다. 따라서 분석과 생성의 단계를 동시에 처리함으로써 번역 성능을 향상시키고, 처리에 필요한 지식의 양을 감소시킬 수 있다. 또한, 이러한 처리에 필요한 번역 지식을 병렬 코퍼스에서 추출함으로써 번역의 효율을 향상시킬 수 있다.
따라서, 분석과 생성을 동시에 처리할 수 있도록, 동시 처리 패턴을 추출하여 활용하는 것이 필요하다.
이에, 본 발명에 있어, 형태소 분석기(110)는 입력문의 형태소를 분석하여 출력하는 형태소 분석부(111)와 동시 처리 대상 단어를 인식하는 동시 처리 대상 인식부(112)와 동시 처리 대상에 기초하여 유사도가 높은 패턴을 추출하고 분석하는 분석 동시 처리부(113) 및 유사도가 높은 패턴에 기반하여 형태소를 태깅하는 형태소 태깅부(114)를 포함하는 것을 특징으로 할 수 있다. 여기서 동시 처리 대상 단어는 명사 또는 부사로 모두 쓰일 수 있는 단어와 같이 분석의 애매성이 높아 오류를 자주 발생시키는 단어를 의미한다. 또한 동시 처리 패턴으로부터 유사도가 높은 패턴을 추출하여 활용할 수 있다.
즉, 입력문은 형태소 분석부(111)로 입력되어 가능한 모든 형태소 분석이 수행되어 형태소 분석 결과가 출력된다. 형태소 분석 결과는 동시 처리 대상 인식부(112) 및 형태소 태깅부(114)로 입력될 수 있다. 동시 처리 대상 인식부(112)는 동시 처리 단어 리스트(141)에 기반하여 입력문에 동시 처리 대상 단어가 존재하는지 판별한다. 동시 처리 대상 단어의 경우 분석 동시 처리부(113)를 통해 형태소 분석 결과를 확정한 후, 이를 형태소 태깅부(112)로 전달한다. 동시 처리 대상 단어가 아닌 경우에는 분석 동시 처리부(113)를 거치지 않고 형태소 분석부(111)와 형태소 태깅부(114)를 통하여 분석된다. 여기서 형태소 태깅부(114)는 형태소 분석의 애매성을 처리하여 형태소의 품사 등을 정확히 확정할 수 있다.
특히, 동시 처리부는 분석 동시 처리부(112)와 생성 동시 처리부(131)로 구성되는 것을 특징으로 할 수 있다. 동시 처리부는 동시 처리 패턴에 기반하여 분석 및 생성을 수행하는 기능을 한다. 즉, 본 발명은 병렬 코퍼스로부터 분석 및 생성 지식을 추출하여 분석 및 생성을 동시에 처리할 수 있는 번역지식을 생성을 하는데 있어서, 동시 처리 패턴을 활용한다.
예컨대, 동시 처리부는 동시 처리 대상 단어의 처리를 위하여 동시 처리 패턴들 중에서 입력문과 유사도가 높은 패턴(원시언어부)을 선택한다. 즉, 동시 처리 패턴으로부터 입력문과 유사도가 높은 패턴을 선택하여 분석에 활용할 수 있다. 패턴이 선택되면 선택된 패턴의 목적언어부의 생성 정보를 이용하여 분석과 생성을 동시에 수행하게 된다. 분석 동시 처리부(113)는 입력문과의 유사도를 계산하여 패턴을 선택하여 분석하고, 생성 동시 처리부(131)는 분석 동시 처리부(131)가 선택한 패턴으로부터 생성 정보를 처리하는 기능을 수행한다. 이를 통하여, 분석 및 생성 지식(정보)을 추출하여 분석 및 생성이 동시에 처리될 수 있다.
또한, 분석 동시 처리부(113)로부터 출력된 분석결과는 구문 분석기(120)와 생성 동시 처리부(131)로 입력될 수 있으며, 대역문 생성부(132)를 거쳐 최종적으로 번역문을 생성할 수 있다. 다만, 분석 동시 처리부(113)를 거치지 않는 경우(동시 처리 대상 단어가 아닌 경우)는 형태소 태깅부(114), 구문 분석기(120) 및 대역문 생성부(132)를 거쳐 번역문이 생성될 수 있다.
이에, 본 발명은 대역문 생성기(130)는 형태소 분석기(110)의 분석 동시 처리부(113)에 의해 추출된 동시 처리 패턴에 기반하여 생성 정보를 산출하는 생성 동시 처리부(131) 및 구문 분석결과와 생성 정보에 기반하여 번역문을 생성하는 대역문 생성부(132)를 포함하는 것을 특징으로 할 수 있다.
또한, 동시 처리 대상 인식부(112)는 동시 처리 단어 리스트(141)를 기반으로 하여 동시 처리 대상 단어를 추출할 수 있으며, 상기 분석 동시 처리부(113)는 동시 처리 패턴 데이터베이스(DB)(142)로부터 동시 처리 패턴을 추출할 수 있다. 또한, 병렬 코퍼스(PARALLEL CORPUS)는 동시 처리 패턴DB(142) 또는 별도의 저장 매체에 저장될 수 있다.
실시예
아래의 입력문이 들어온 경우를 예를 들어 설명하면 다음과 같다.
입력문)
여기 바지도 파나요?
동시 처리 대상 인식부(112)는 동시 처리 단어 리스트(141)를 기반으로 하여 ‘여기’가 동시 처리 대상 단어임을 인식하고, 입력문을 분석 동시 처리부(113)로 보낸다. 분석 동시 처리부(113)는 ‘여기’를 키워드로 하여 동시 처리 패턴 데이터베이스(DB)(142) 로부터 아래와 같은 동시 처리 패턴을 추출한다.
동시 처리 패턴)
여기 옷[의류]!가 바지[의류]!뿐이+
ㅂ니까
?
> (옷[의류]
in
here[명사])
여기 콜라[음료] 한[수량] 잔[단위] 주+세요
> (here[부사])
입력문과 추출된 위의 동시 처리 패턴의 원시언어부(밑줄 부분)의 유사도를 측정한 결과, 첫 번째 패턴이 더 높은 유사도를 보이는 것으로 판단된다. 따라서, 첫 번째 패턴을 선택하고, 선택된 패턴의 목적언어부(괄호 부분)에서 동시 처리 대상 단어 ‘여기’의 품사 정보가 [명사]이며 ‘in here’의 형태로 생성되어야 한다는 정보(생성 정보)를 알 수 있다. 즉, 분석 동시 처리부(113)는 동시 처리 패턴을 추출하여 유사도가 높은 패턴을 선택하고, 생성 동시 처리부(131)는 분석 동시 처리부(113)로부터 추출된 동시 처리 패턴에 대한 정보를 기반으로 생성 정보를 추출하여 대역문 생성부로 전달한다.
도 2는 본 발명의 실시예에 따른 동시 처리 패턴에 기반한 번역방법의 절차도 이다.
도 2를 참조하면, 형태소 분석부(111)는 입력문을 대상으로 형태소의 분석을 수행하고(210), 동시 처리 대상 인식부(112)는 동시 처리 단어 리스트(141)를 기반으로 하여 동시 처리 대상 단어를 인식한다(220). 분석 동시 처리부(113)는 입력문에 동시 처리 대상 단어가 존재하는 경우, 동시 처리 대상 단어를 키워드로 하여 동시 처리 패턴을 동시 처리 패턴DB(142)로부터 추출하고, 입력문과 유사도가 높은 패턴을 동시 처리 패턴으로부터 선택하여 분석한다(230). 또한, 생성 동시 처리부(131)는 동시 처리 패턴에 기반한 생성 정보를 산출하여 이를 대역문 생성부(132)로 전달한다(260).
형태소 태깅부(114)는 형태소 분석부(111)에 의한 형태소 분석 결과 또는/및 분석 동시 처리부(113)에 의해 선택된 패턴을 분석한 결과를 참조하여 형태소를 태깅(Morpheme Tagging)할 수 있다(240).
또한, 구문 분석기(120)는 형태소 분석부(111)에 의한 형태소 분석 결과 또는/및 분석 동시 처리부(113)에 의해 선택된 패턴을 분석한 결과를 참조하여 입력문의 구문의 분석을 수행할 수 있다(250).
대역문 생성부(132)는 구문 분석기(120)에 의한 구문 분석 결과 또는/및 생성 동시 처리부(131)에 의해 산출된 생성 정보를 기반으로 하여 번역문을 생성할 수 있다(270). 즉, 대역문 생성부(132)는 동시 처리 대상 단어에 의해 산출된 생성 정보와 동시 처리 대상 단어를 제외한 나머지 문장에 대한 대역어를 결합하여 번역문을 생성할 수 있다.
즉, 본 발명은 병렬 코퍼스에 기반하여 입력문으로부터 동시 처리 패턴을 추출하는 형태소 분석과정과 동시 처리 패턴에 기반하여 입력문의 구문을 분석하는 구문 분석과정(250) 및 구문 분석과정에 의한 구문 분석결과에 기반하여 번역문을 생성하는 대역문 생성과정를 포함하는 동시 처리 패턴에 기반한 번역방법을 제공한다.
여기서, 형태소 분석과정은 입력문을 대상으로 형태소 분석을 수행하는 형태소 분석단계(210)와 동시 처리 대상 단어를 인식하는 동시 처리 대상 인식단계(220)와 동시 처리 대상 단어를 인식하면, 상기 동시 처리 대상 단어에 기반하여 동시 처리 패턴을 추출하고, 입력문과 유사도가 높은 패턴을 선택하여 분석하는 분석 동시 처리단계(230) 및 유사도가 높은 패턴에 기반하여 형태소를 태깅하는 형태소 태깅단계(240)를 포함하는 것을 특징으로 한다.
또한, 대역문 생성과정은 형태소 분석과정에 의해 추출된 동시 처리 패턴에 기반하여 생성 정보를 산출하는 생성 동시 처리단계(260) 및 구문 분석결과와 생성 정보에 기반하여 번역문을 생성하는 대역문 생성단계(270)를 포함할 수 있다.
상술한 바와 같이, 본 발명에 따른 동시 처리 패턴에 기반한 번역장치 및 방법에 따르면, 변환 방식의 자동번역장치에 있어서, 분석과 생성의 모호성 해소를 위해 동시 처리 패턴을 사용함으로써, 지식 구축에 따른 비용을 절약하며, 분석 단계에서의 모호성과 생성 단계에서의 모호성 해소를 동시에 처리함으로써, 분석 단계에서의 모호성 실패로 인한 번역 오류로 인해 생성 결과까지 잘못되는 문제점을 해결함으로써 번역 품질을 개선하는 효과를 가져 올 수 있다
상기에서는 본 발명의 바람직한 실시예를 참조하여 설명하였지만, 해당 기술 분야의 숙련된 당업자는 하기의 특허 청구의 범위에 기재된 본 발명의 사상 및 영역으로부터 벗어나지 않는 범위 내에서 본 발명을 다양하게 수정 및 변경시킬 수 있음을 이해할 수 있을 것이다.
100: 번역 장치 110: 형태소 분석기
111: 형태소 분석부 112: 동시 처리 대상 인식부
113: 분석 동시 처리부 114: 형태소 태깅부
120: 구문 분석기 130: 대역문 생성기
131: 생성 동시 처리부 132: 대역문 생성부
141: 동시 처리 단어 리스트 142: 동시 처리 패턴 DB
111: 형태소 분석부 112: 동시 처리 대상 인식부
113: 분석 동시 처리부 114: 형태소 태깅부
120: 구문 분석기 130: 대역문 생성기
131: 생성 동시 처리부 132: 대역문 생성부
141: 동시 처리 단어 리스트 142: 동시 처리 패턴 DB
Claims (1)
- 병렬 코퍼스(PARALLEL CORPUS)에 기반하여 입력문으로부터 동시 처리 패턴을 추출하는 형태소 분석기;
상기 동시 처리 패턴에 기반하여 상기 입력문의 구문을 분석하는 구문 분석기; 및
상기 구문 분석기에 의한 구문 분석결과에 기반하여 번역문을 생성하는 대역문 생성기를 포함하는 동시 처리 패턴에 기반한 번역장치.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020110090047A KR20130026717A (ko) | 2011-09-06 | 2011-09-06 | 동시 처리 패턴에 기반한 번역장치 및 방법 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020110090047A KR20130026717A (ko) | 2011-09-06 | 2011-09-06 | 동시 처리 패턴에 기반한 번역장치 및 방법 |
Publications (1)
Publication Number | Publication Date |
---|---|
KR20130026717A true KR20130026717A (ko) | 2013-03-14 |
Family
ID=48177887
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020110090047A KR20130026717A (ko) | 2011-09-06 | 2011-09-06 | 동시 처리 패턴에 기반한 번역장치 및 방법 |
Country Status (1)
Country | Link |
---|---|
KR (1) | KR20130026717A (ko) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20190141891A (ko) | 2018-06-15 | 2019-12-26 | 부산외국어대학교 산학협력단 | 단어 의미분석 및 단어 번역지식을 기반으로한 문장 번역 방법 및 장치 |
-
2011
- 2011-09-06 KR KR1020110090047A patent/KR20130026717A/ko not_active Application Discontinuation
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20190141891A (ko) | 2018-06-15 | 2019-12-26 | 부산외국어대학교 산학협력단 | 단어 의미분석 및 단어 번역지식을 기반으로한 문장 번역 방법 및 장치 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Nguyen et al. | Building a large syntactically-annotated corpus of Vietnamese | |
Weese et al. | Joshua 3.0: Syntax-based machine translation with the Thrax grammar extractor | |
KR20030094632A (ko) | 변환방식 기계번역시스템에서 사용되는 변환사전을생성하는 방법 및 장치 | |
Alqudsi et al. | A hybrid rules and statistical method for Arabic to English machine translation | |
KR20090061158A (ko) | 번역 시스템에서 오류 보정 패턴을 이용한 번역 오류 수정방법 및 장치 | |
Mishra et al. | Exploring the effects of sentence simplification on Hindi to English machine translation system | |
Nakov | Improved statistical machine translation using monolingual paraphrases | |
Van Der Goot et al. | Lexical normalization for code-switched data and its effect on POS-tagging | |
JP2016164707A (ja) | 自動翻訳装置及び翻訳用モデル学習装置 | |
CN111985232A (zh) | 基于nlp的机载显控系统需求的领域模型提取方法 | |
Johannessen et al. | Obt+ stat: Evaluation of a combined cg and statistical tagger | |
Zhai et al. | Handling ambiguities of bilingual predicate-argument structures for statistical machine translation | |
KR20130026717A (ko) | 동시 처리 패턴에 기반한 번역장치 및 방법 | |
Setiawan et al. | Topological ordering of function words in hierarchical phrase-based translation | |
KR102571435B1 (ko) | 자연어 텍스트의 시간적 문맥 정보 추출 장치 및 방법 | |
Wang et al. | Linguistically-augmented bulgarian-to-english statistical machine translation model | |
Chen et al. | A structure-based model for Chinese organization name translation | |
Ramisch et al. | A survey of MWE identification experiments: the devil is in the details | |
Specia | A hybrid model for word sense disambiguation in English-Portuguese machine translation | |
KR20160050652A (ko) | 신규 언어의 트리뱅크를 구축하는 방법 | |
Zhang et al. | Measure word generation for English-Chinese SMT systems | |
Kulick | Exploiting separation of closed-class categories for Arabic tokenization and part-of-speech tagging | |
Phodong et al. | Improving Thai-English word alignment for interrogative sentences in SMT by grammatical knowledge | |
Zhechev | Automatic generation of parallel treebanks: an efficient unsupervised system | |
Das et al. | Improving cross-lingual model transfer by chunking |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
WITN | Withdrawal due to no request for examination |