KR20120046414A - 중간 번역처리 결과 제공 장치 및 그 방법 - Google Patents

중간 번역처리 결과 제공 장치 및 그 방법 Download PDF

Info

Publication number
KR20120046414A
KR20120046414A KR1020100108043A KR20100108043A KR20120046414A KR 20120046414 A KR20120046414 A KR 20120046414A KR 1020100108043 A KR1020100108043 A KR 1020100108043A KR 20100108043 A KR20100108043 A KR 20100108043A KR 20120046414 A KR20120046414 A KR 20120046414A
Authority
KR
South Korea
Prior art keywords
result
translation processing
translation
unit
input
Prior art date
Application number
KR1020100108043A
Other languages
English (en)
Inventor
서나미
Original Assignee
에스케이플래닛 주식회사
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 에스케이플래닛 주식회사 filed Critical 에스케이플래닛 주식회사
Priority to KR1020100108043A priority Critical patent/KR20120046414A/ko
Publication of KR20120046414A publication Critical patent/KR20120046414A/ko

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/40Processing or translation of natural language
    • G06F40/58Use of machine translation, e.g. for multi-lingual retrieval, for server-side translation for client devices or for real-time translation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/205Parsing
    • G06F40/211Syntactic parsing, e.g. based on context-free grammar [CFG] or unification grammars
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/268Morphological analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/40Processing or translation of natural language
    • G06F40/51Translation evaluation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/40Processing or translation of natural language
    • G06F40/53Processing of non-Latin text

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Machine Translation (AREA)

Abstract

본 발명은 중간 번역처리 결과 제공 장치 및 그 방법에 관한 것으로서, 상세하게는 번역 대상이 되는 입력 원문 및 입력 원문을 번역처리하기 위한 번역처리 타입을 사용자로부터 입력받고, 번역처리 과정에서 생성된 중간 번역처리 결과(예컨대, 형태소 분석 결과, 품사 태깅 결과, 구문 분석 결과, 구조 변환 결과 및 번역문) 중에서 입력된 번역처리 타입에 대응하는 번역처리 결과를 사용자에게 표시함으로써, 불완전한 번역 결과물을 보완하면서도 다양한 사용자별 만족도를 증가시킬 수 있다.

Description

중간 번역처리 결과 제공 장치 및 그 방법{APPARATUS AND METHOD FOR PROVIDING RESULT OF MID-TRANSLATION PROCESSING}
본 발명은 중간 번역처리 결과 제공 장치 및 그 방법에 관한 것으로서, 상세하게는 번역 대상이 되는 입력 원문 및 입력 원문을 번역처리하기 위한 번역처리 타입을 사용자로부터 입력받고, 번역처리 과정에서 생성된 중간 번역처리 결과(예컨대, 형태소 분석 결과, 품사 태깅 결과, 구문 분석 결과, 구조 변환 결과 및 번역문) 중에서 입력된 번역처리 타입에 대응하는 번역처리 결과를 사용자에게 표시함으로써, 불완전한 번역 결과물을 보완하면서도 다양한 사용자별 만족도를 증가시킬 수 있는, 중간 번역처리 결과 제공 장치 및 그 방법에 관한 것이다.
인터넷이 등장한 이후, 인터넷상에 존재하는 다양한 정보에 대한 사용자의 요구가 증대되고 있다. 인터넷의 특성상, 사람들은 자신이 사용하는 언어와는 다른 언어로 이루어진 많은 정보를 접할 수 있게 되었는데, 이때 사용자가 얻고자하는 정보가 타국의 언어인 경우, 사용자는 해당 언어에 능통하거나 어느 정도의 지식이 있지 않다면 해당 정보에 대한 열람이 불가능하다는 문제점이 있었다.
따라서, 타 언어권 정보의 정확한 이해와 효과적인 이용을 위한 번역 서비스에 대한 필요성이 야기되었다.
이러한 번역 서비스는 컴퓨터 기술의 발전에 힘입어 기계 번역을 중심으로 본격적인 연구가 진행되어 왔는데, 최근 인터넷의 사용이 전 세계적으로 보편화됨에 따라 실용적 성능을 보장할 수 있는 일반 사용자들의 요구가 더욱 높아지고, 동시에 대규모의 말뭉치 등 활용 가능한 정보의 형태도 더욱 다양해짐으로써 높은 성능의 언어 처리 시스템을 구현할 수 있는 가능성이 매우 높아지고 있다.
그러나 극히 제한된 형태의 정보 검색 등을 제외하면 기계 번역이나 기계 이해 및 사용자 인터페이스 측면에서 비교적 복잡도가 높은 문제를 다루는 경우에는 아직까지 실생활에서의 활용 가치를 인정받지 못하고 있다.
예로써 종래의 번역 서비스 방식은 사용자로부터 자연 언어를 입력으로 받아, 전자 사전(MRD : Machine Readable Dictionary)이나 말뭉치(corpus) 등을 기반으로 형태소 분석 및 구문 분석을 통해 단어 및 문장의 중의성을 해소하고, 이를 바탕으로 하나의 언어에서 다른 언어로 자동 번역하는 형태로 구성되어 왔다.
그러나 이러한 방법은 자동으로 언어의 중의성을 해소하고자 하였지만, 단어 자체가 가지는 중의성 및 구문 또는 문장이 가지는 중의성의 문제점을 해소하지 못하여 실제로 그 정확도가 상당히 낮은 편이었다.
현재, 제공되고 있는 번역 서비스의 경우, 문장 구조가 단순한 경우는 읽을 만한 수준의 결과물을 제공하고 있지만 뉴스처럼 문장 구조가 복잡한 경우에는 거의 내용을 이해할 수 없을 정도로 번역의 오류가 많은 것이 사실이다. 실제로, 명사를 동사로 인식해 문장을 제대로 해석하지 못하거나 전치사 등을 폭넓게 해석하지 못함으로써 번역하고자 하는 문장의 내용을 전혀 이해할 수 없게 되는 번역의 한계점을 노출하고 있다.
따라서, 종래의 번역 서비스는 전문 번역가가 번역한 품질 수준에 대응되는 실력으로의 번역보다는 인간의 능력과 지능을 보조해주는 수단으로서의 보조 도구로서 활용되고 있다.
현시점에서 종래의 자동 번역 시스템은 완벽한 번역 결과물을 만들지 못하고 있다. 그리고 자동 번역 시스템을 활용하는 사용자의 언어 실력이 천차만별이다. 하지만, 현재 자동 번역 시스템은 원문을 입력받고, 결과물로서 자동번역 문장만을 보여 주고 있다. 여기서, 자동 번역 문장은 자동번역 시스템의 오류로 사용자가 이해하기 힘든 자동 번역문일 수 있다. 단순한 대역어의 변환 오류뿐만 아니라 복잡한 어순이나 복잡한 구문 구조의 오류로 인해, 일반적인 사용자가 이해하기 힘들 정도로 자동 번역문에 오류가 많을 수 있다. 어느 정도의 번역 능력이 있는 사용자라면, 문장 전체의 의미보다 한두 군데의 애매함을 해소해주는 자동 번역 시스템이 더욱 필요할 수 있다.
본 발명은 상기의 문제점을 해결하기 위해 창안된 것으로서, 번역 대상이 되는 입력 원문 및 입력 원문을 번역처리하기 위한 번역처리 타입을 사용자로부터 입력받고, 번역처리 과정에서 생성된 중간 번역처리 결과(예컨대, 형태소 분석 결과, 품사 태깅 결과, 구문 분석 결과, 구조 변환 결과 및 번역문) 중에서 입력된 번역처리 타입에 대응하는 번역처리 결과를 사용자에게 표시함으로써, 불완전한 번역 결과물을 보완하면서도 다양한 사용자별 만족도를 증가시킬 수 있는, 중간 번역처리 결과 제공 장치 및 그 방법을 제공하는 것을 목적으로 한다.
이를 위하여, 본 발명의 제1 측면에 따른 장치는, 번역 대상이 되는 입력 원문을 입력받고, 상기 입력 원문을 번역처리하기 위한 번역처리 타입을 사용자로부터 입력받는 입력부; 상기 입력 원문을 번역처리하여 형태소 분석 결과, 품사 태깅 결과, 구문 분석 결과, 구조 변환 결과 및 번역문 중에서 적어도 하나가 포함된 번역처리 결과를 생성하는 번역처리부; 및 상기 입력된 번역처리 타입에 대응하는 상기 생성된 번역처리 결과를 상기 사용자에게 표시하는 표시부를 포함하는 것을 특징으로 한다.
상기 장치는, 상기 입력 원문의 단어에 대한 대역어가 포함된 단어 사전을 저장하는 단어 사전 DB를 더 포함하는 것을 특징으로 한다.
상기 번역처리부는, 상기 입력 원문의 형태소를 분석하여 형태소 분석 결과를 생성하는 형태소 분석부; 상기 분석된 형태소에 대해서 품사를 태깅하여 태깅 결과를 생성하는 태깅부; 상기 태깅된 입력 원문의 구문을 분석하여 구문 분석 결과를 생성하는 구문 분석부; 상기 구문 분석된 입력 원문의 구조를 번역문의 구조로 변환하여 구조 변환 결과를 생성하는 변환부; 및 상기 변환된 입력 원문의 단어를 해당 대역어로 변환하여 번역문을 생성하는 번역문 생성부를 포함하는 것을 특징으로 한다.
상기 번역처리부는, 상기 생성된 형태소 분석 결과, 태깅 결과, 구문 분석 결과, 구조 변환 결과 및 번역문을 저장하는 번역처리 결과 저장부를 더 포함하는 것을 특징으로 한다.
상기 형태소 분석부, 상기 태깅부, 상기 구문 분석부, 상기 변환부 및 상기 번역문 생성부는, 상기 형태소 분석 결과, 상기 품사 태깅 결과, 상기 구문 분석 결과, 상기 구조 변환 결과 및 상기 번역문을 서로 독립적으로 생성하는 것을 특징으로 한다.
상기 표시부는, 상기 번역처리 결과 저장부에 번역처리 타입이 사용자별로 미리 설정되어 저장된 경우, 상기 미리 설정된 사용자별 번역처리 타입에 대응하는 번역처리 결과를 표시하는 것을 특징으로 한다.
상기 표시부는, 상기 입력 원문이 중국어 또는 일본어인 경우, 상기 입력 원문의 형태소를 분석하여 단어 분리 결과를 표시하는 것을 특징으로 한다.
상기 표시부는, 상기 태깅된 입력 원문의 구문을 분석하여 단문, 중문 및 복문 중 어느 하나인지, 명사절, 형용사절 및 부사절 중 어느 하나인지, 주절 및 종속절, 관계대명사절 중 어느 하나인지를 표시하는 것을 특징으로 한다.
상기 표시부는, 상기 구문 분석된 입력 원문의 어순을 번역문의 어순으로 변환하고, 상기 변환된 번역문의 어순에 조사 및 어미를 표시하는 것을 특징으로 한다.
한편, 본 발명의 제2 측면에 따른 방법은, 번역 대상이 되는 입력 원문을 입력받고, 상기 입력 원문을 번역처리하기 위한 번역처리 타입을 사용자로부터 입력받는 입력 단계; 상기 입력 원문을 번역처리하여 형태소 분석 결과, 품사 태깅 결과, 구문 분석 결과, 구조 변환 결과 및 번역문 중에서 적어도 하나가 포함된 번역처리 결과를 생성하는 번역처리 단계; 및 상기 입력된 번역처리 타입에 대응하는 상기 생성된 번역처리 결과를 상기 사용자에게 표시하는 표시 단계를 포함하는 것을 특징으로 한다.
상기 번역처리 단계는, 상기 입력 원문의 형태소를 분석하여 형태소 분석 결과를 생성하는 형태소 분석 단계; 상기 분석된 형태소에 대해서 품사를 태깅하여 태깅 결과를 생성하는 태깅 단계; 상기 태깅된 입력 원문의 구문을 분석하여 구문 분석 결과를 생성하는 구문 분석 단계; 상기 구문 분석된 입력 원문의 구조를 번역문의 구조로 변환하여 구조 변환 결과를 생성하는 변환 단계; 및 상기 변환된 입력 원문의 단어를 해당 대역어로 변환하여 번역문을 생성하는 번역문 생성 단계를 포함하는 것을 특징으로 한다.
상기 표시 단계는, 번역처리 타입이 사용자별로 미리 설정된 경우, 상기 미리 설정된 사용자별 번역처리 타입에 대응하는 번역처리 결과를 표시하는 것을 특징으로 한다.
상기 표시 단계는, 상기 입력 원문이 중국어 또는 일본어인 경우, 상기 입력 원문의 형태소를 분석하여 단어 분리 결과를 표시하는 것을 특징으로 한다.
상기 표시 단계는, 상기 태깅된 입력 원문의 구문을 분석하여 단문, 중문 및 복문 중 어느 하나인지, 명사절, 형용사절 및 부사절 중 어느 하나인지, 주절 및 종속절, 관계대명사절 중 어느 하나인지를 표시하는 것을 특징으로 한다.
상기 표시 단계는, 상기 구문 분석된 입력 원문의 어순을 번역문의 어순으로 변환하고, 상기 변환된 번역문의 어순에 조사 및 어미를 표시하는 것을 특징으로 한다.
본 발명은 번역 대상이 되는 입력 원문 및 입력 원문을 번역처리하기 위한 번역처리 타입을 사용자로부터 입력받고, 번역처리 과정에서 생성된 중간 번역처리 결과(예컨대, 형태소 분석 결과, 품사 태깅 결과, 구문 분석 결과, 구조 변환 결과 및 번역문) 중에서 입력된 번역처리 타입에 대응하는 번역처리 결과를 사용자에게 표시함으로써, 불완전한 번역 결과물을 보완하면서도 다양한 사용자별 만족도를 증가시킬 수 있는 효과가 있다.
즉, 본 발명은 문장 전체의 번역문보다 각 번역처리 과정에서 생성된 중간 번역처리 결과를 이용하려는 사용자에게 좀더 효용성 있는 번역 결과물을 제공할 수 있는 효과가 있다. 또한, 본 발명은 입력 원문이 불완전하게 자동 번역되는 것을 보완할 수 있으며, 번역이 매끄럽지 못한 것을 개선하여 사용자가 요구하는 번역 결과물을 통해 번역 만족도를 높일 수 있는 효과가 있다.
도 1 은 본 발명에 따른 중간 번역처리 결과 제공 장치의 일실시예 구성도,
도 2 는 본 발명에 따른 도 1의 표시부를 통해 표시된 중간 번역처리 결과에 대한 일실시예 예시도,
도 3 은 본 발명에 따른 중간 번역처리 결과 제공 방법에 대한 일실시예 흐름도이다.
이하, 첨부된 도면을 참조하여 본 발명에 따른 실시 예를 상세하게 설명한다. 본 발명의 구성 및 그에 따른 작용 효과는 이하의 상세한 설명을 통해 명확하게 이해될 것이다. 본 발명의 상세한 설명에 앞서, 동일한 구성요소에 대해서는 다른 도면 상에 표시되더라도 가능한 동일한 부호로 표시하며, 공지된 구성에 대해서는 본 발명의 요지를 흐릴 수 있다고 판단되는 경우 구체적인 설명은 생략하기로 함에 유의한다.
도 1 은 본 발명에 따른 중간 번역처리 결과 제공 장치의 일실시예 구성도이다.
도 1에 도시된 바와 같이, 본 발명의 일실시예에 따른 중간 번역처리 결과 제공 장치(100)는 입력부(110), 번역처리부(120) 및 표시부(130)를 포함한다. 여기서, 본 발명의 일측에 따른 중간 번역처리 결과 제공 장치(100)는 단어 사전 DB(140)를 더 포함할 수 있다. 또한, 번역처리부(120)는 형태소 분석부(121), 태깅부(122), 구문 분석부(123), 변환부(124) 및 번역문 생성부(125)를 포함할 수 있다. 또한, 번역처리부(120)는 번역처리 결과 저장부(126)를 더 포함할 수 있다.
이하, 본 발명에 따른 중간 번역처리 결과 제공 장치(100)의 구성요소 각각에 대하여 살펴보기로 한다.
입력부(110)는 번역 대상이 되는 입력 원문을 입력받는다. 그리고 입력부(110)는 입력 원문을 번역처리하기 위한 번역처리 타입을 사용자로부터 입력받는다. 번역처리 타입은 중간 번역처리 결과 중에서 사용자가 원하는 번역처리 타입을 의미한다. 예를 들어, 번역처리 타입에는 단어 분리, 단어 뜻 보기 또는 문장 구조 분석 등이 있다. 사용자는 중간 번역처리 결과 제공 장치(100)의 화면을 통해 표시된 번역처리 타입 중에서 어느 하나를 선택할 수도 있고, 복수의 번역처리 타입을 선택할 수 있다. 그러면, 입력부(110)는 입력 원문을 번역처리부(120)로 전달하고, 번역처리 타입을 표시부(130)로 전달한다.
그리고 번역처리부(120)는 입력부(110)에서 입력된 입력 원문을 번역처리하여 형태소 분석 결과, 품사 태깅 결과, 구문 분석 결과, 구조 변환 결과 및 번역문 중에서 적어도 하나가 포함된 번역처리 결과를 생성한다. 번역처리부(120)는 번역처리 단계별로 형태소 분석 결과, 품사 태깅 결과, 구문 분석 결과, 구조 변환 결과 및 번역문을 서로 독립적으로 생성한다. 번역처리부(120)는 하나의 번역처리 과정을 수행하고 해당 번역처리 결과를 생성한 후, 다음 번역처리 과정을 처리하는 방식으로 수행한다. 예를 들어, 번역처리부(120)는 각 번역처리 과정에서 생성된 형태소 분석 결과 또는 품사 태깅 결과만을 표시부(130)로 전달할 수 있다.
이후, 표시부(130)는 구비된 화면을 통해 입력부(110)에서 입력된 번역처리 타입에 대응하는 번역처리 결과를 번역처리부(120)로부터 전달받아 사용자에게 표시한다. 예를 들어, 표시부(130)는 입력부(110)에서 입력된 번역처리 타입이 형태소 분석이면, 번역처리부(120)에서 생성된 입력 원문의 단어 분리 결과만을 사용자에게 표시할 수 있다.
단어 사전 DB(140)는 입력 원문의 단어에 대한 대역어가 포함된 단어 사전을 저장한다. 즉, 단어 사전 DB(140)는 일반적인 분야를 대상으로 만들어진 단어 사전을 저장한다.
한편, 번역처리부(120)를 구체적으로 살펴보면, 형태소 분석부(121)는 번역 대상이 되는 입력 원문의 형태소를 분석한다. 여기서, 형태소 분석이란 문자열을 분석하여 자연 언어 분석의 기본 단위인 형태소로 분해하는 것을 말한다.
태깅부(122)는 형태소 분석부(121)에서 분석된 형태소에 대해서 품사를 태깅한다. 여기서, 태깅이란 형태소에 해당되는 정확한 문법 정보를 제시하는 것을 말한다. 예를 들어, "love"라는 단어는 사전에 "love: 동사, 사랑하다" 또는 "love: 명사, 사랑"으로 등록되어 있는데, "I love you"라는 문장에서 "love"는 명사가 아니라 동사의 품사를 가진다. 이러한 경우, 태깅부(122)는 "love"라는 단어에 동사를 식별할 수 있는 식별자를 태깅한다.
구문 분석부(123)는 태깅부(122)에서 태깅된 입력 원문의 구문을 분석한다. 즉, 구문 분석부(123)는 태깅부(122)에서 태깅된 태그를 근거로 구문을 분석한다. 구문 분석 결과는 형태소 단위로 분석된 형태소와 형태소 간의 품사, 의미, 전후 관계에 의한 변화 등에 의하여 다양하게 구문 분석될 수 있다.
변환부(124)는 구문 분석부(123)에서 분석된 구문 분석 결과를 이용하여 구문 분석된 입력 원문의 구조를 번역문의 구조로 변환한다. 즉, 변환부(124)는 구문 분석부(123)를 통해 분석된 구문 분석 결과를 이용하여 입력 원문의 어순을 번역문의 어순에 맞게 변환한다. 예를 들면, 영어 문장을 한글 문장으로 번역하는 경우에 영어와 한글의 어순은 반대가 된다. 따라서, 입력 원문의 영어 문장 "I love you"를 구문 분석한 트리 "I-love-you"로부터, 한글 문장에 맞게 어순을 변경하면 "I-you-love"가 될 수 있다.
번역문 생성부(125)는 변환부(124)에서 변환된 입력 원문의 단어를 해당 대역어로 변환한다. 즉, 번역문 생성부(125)는 변환부(124)를 거친 결과에서 각 형태소와 대응되는 대역어를 단어 사전 DB(140)에 기저장된 번역 사전으로부터 추출하고, 이 대역어에 조사나 어미를 생성하여 자연스러운 번역문을 생성한다.
번역처리 결과 저장부(126)는 형태소 분석부(121), 태깅부(122), 구문 분석부(123), 변환부(124) 및 번역문 생성부(125)에서 각각 생성된 형태소 분석 결과, 태깅 결과, 구문 분석 결과, 구조 변환 결과 및 번역문을 저장한다. 각 번역처리 과정별로 생성된 중간 번역처리 결과가 번역처리 결과 저장부(126)에 저장된 후, 표시부(130)는 번역처리 결과 저장부(126)에 저장된 번역처리 결과를 사용자에게 표시할 수 있다.
또한, 번역처리 결과 저장부(126)는 사용자별로 번역처리 타입을 사용자로부터 미리 설정받고, 그 설정된 사용자별 번역처리 타입을 저장할 수 있다. 여기서, 표시부(130)는 번역처리 결과 저장부(126)에 미리 설정된 사용자별 번역처리 타입에 대응하는 번역처리 결과를 사용자의 입력 없이 표시할 수 있다.
표시부(130)에서 표시될 수 있는 중간 번역처리 결과를 상세하게 살펴보면, 표시부(130)는 태깅부(122)에서 태깅된 입력 원문의 구문을 분석하여 단문, 중문 및 복문 중 어느 하나인지, 명사절, 형용사절 및 부사절 중 어느 하나인지, 주절 및 종속절, 관계대명사절 중 어느 하나인지를 표시할 수 있다.
또한, 입력 원문이 중국어 또는 일본어와 같이 단어 분리가 되지 않은 경우, 표시부(130)는 입력 원문의 형태소를 분석하여 단어 분리 결과만을 표시할 수 있다.
또한, 표시부(130)는 구문 분석부(123)에서 구문 분석된 입력 원문의 어순을 번역문의 어순으로 변환하고, 그 변환된 번역문의 어순에 조사 및 어미를 표시할 수 있다.
도 2 는 본 발명에 따른 도 1의 표시부를 통해 표시된 중간 번역처리 결과에 대한 일실시예 예시도이다.
도 2에 도시된 바와 같이, 입력부(110)는 입력 원문 입력창(201)을 사용자에게 표시하여 입력 원문을 사용자로부터 입력받는다. 또한, 입력부(110)는 사용자의 언어 실력에 따라 사용자가 원하는 중간 번역처리 타입(211)을 전체 번역처리 타입(210) 중에서 입력받는다. 번역처리 타입에는 전체 문장번역, 단어분리(중국), 단어 뜻 보기, 문장 구조 분석 등이 있다.
사용자가 중간 번역처리 결과 제공 장치(100)의 화면을 통해 표시된 번역처리 타입 중에서 어느 하나를 입력부(110)를 통해 선택하는 경우, 표시부(130)는 번역처리부(120)로부터 해당 번역처리 타입에 대응하는 번역처리 결과를 전달받아 사용자에게 표시한다. 또한, 사용자로부터 복수의 번역처리 타입이 입력된 경우, 표시부(130)는 번역처리부(120)로부터 복수의 번역처리 타입 각각에 대응하는 번역처리 결과들을 전달받아 사용자에게 표시한다. 여기서, 번역처리부(120)가 번역처리 결과 저장부(126)에 각 번역처리 과정에서 생성된 번역처리 결과들을 저장하면, 표시부(130)는 복수의 번역처리 결과들을 가져와서 사용자에게 표시할 수 있다.
예컨대, 도 2에는 입력부(110)가 전체 번역처리 타입(210) 중에서 전체 문장번역(211)이 입력된 경우가 나타나 있다. 여기서, 사용자로부터 입력된 전체 문장번역(211)은 다른 단어 분리, 단어 뜻 보기, 문장 구조 분석 등이 될 수 있다.
도 3 은 본 발명에 따른 중간 번역처리 결과 제공 방법에 대한 일실시예 흐름도이다.
입력부(110)는 번역 대상이 되는 입력 원문을 입력받는다(S302)
그리고 입력부(110)는 입력 원문을 번역처리하기 위한 번역처리 타입을 사용자로부터 입력받는다(S304). 여기서, 입력부(110)는 전체 번역처리 타입 중에서 복수의 번역처리 타입을 입력받을 수 있다.
그리고 형태소 분석부(121)는 번역 대상이 되는 입력 원문의 형태소를 분석한다(S306).
이어서, 태깅부(122)는 형태소 분석부(121)에서 분석된 형태소에 대해서 품사를 태깅한다(S308).
이후, 구문 분석부(123)는 태깅부(122)에서 태깅된 입력 원문의 구문을 분석한다(S310).
그리고 변환부(124)는 구문 분석부(123)에서 분석된 구문 분석 결과를 이용하여 구문 분석된 입력 원문의 구조를 번역문의 구조로 변환한다(S312).
이어서, 번역문 생성부(125)는 변환부(124)에서 변환된 입력 원문의 단어를 해당 대역어로 변환한다(S314).
이후, 표시부(130)는 입력부(110)에서 입력된 번역처리 타입에 대응하는 번역처리 결과를 사용자에게 표시한다(S316). 표시부(130)는 "S308" 과정에서 태깅된 입력 원문의 구문을 분석하여 단문, 중문 및 복문 중 어느 하나인지, 명사절, 형용사절 및 부사절 중 어느 하나인지, 주절 및 종속절, 관계대명사절 중 어느 하나인지를 표시할 수 있다. 또한, 표시부(130)는 "S310" 과정에서 구문 분석된 입력 원문의 어순을 번역문의 어순으로 변환하고, 그 변환된 번역문의 어순에 조사 및 어미를 표시할 수 있다.
한편, 본 발명은 이상에서 설명한 중간 번역처리 결과 제공 방법을 소프트웨어적인 프로그램으로 구현하여 컴퓨터로 읽을 수 있는 소정 기록 매체에 기록해 둠으로써 다양한 재생 장치에 적용할 수 있다.
다양한 재생 장치는 PC, 노트북, 휴대용 단말 등일 수 있다.
예컨대, 기록 매체는 각 재생 장치의 내장형으로 하드 디스크, 플래시 메모리, RAM, ROM 등이거나, 외장형으로 CD-R, CD-RW와 같은 광디스크, 콤팩트 플래시 카드, 스마트 미디어, 메모리 스틱, 멀티미디어 카드일 수 있다.
이 경우, 컴퓨터로 읽을 수 있는 기록 매체에 기록한 프로그램은, 앞서 설명한 바와 같이, 번역 대상이 되는 입력 원문을 입력받고, 상기 입력 원문을 번역처리하기 위한 번역처리 타입을 사용자로부터 입력받는 입력 과정과, 상기 입력 원문을 번역처리하여 형태소 분석 결과, 품사 태깅 결과, 구문 분석 결과, 구조 변환 결과 및 번역문 중에서 적어도 하나가 포함된 번역처리 결과를 생성하는 번역처리 과정과, 상기 입력된 번역처리 타입에 대응하는 상기 생성된 번역처리 결과를 상기 사용자에게 표시하는 표시 과정을 포함하여 실행될 수 있다.
이상의 설명은 본 발명을 예시적으로 설명한 것에 불과하며, 본 발명이 속하는 기술 분야에서 통상의 지식을 가진 자에 의해 본 발명의 기술적 사상에서 벗어나지 않는 범위에서 다양한 변형이 가능할 것이다. 따라서 본 발명의 명세서에 개시된 실시 예들은 본 발명을 한정하는 것이 아니다. 본 발명의 범위는 아래의 특허청구범위에 의해 해석되어야 하며, 그와 균등한 범위 내에 있는 모든 기술도 본 발명의 범위에 포함되는 것으로 해석해야 할 것이다.
본 발명은 번역 대상이 되는 입력 원문 및 입력 원문을 번역처리하기 위한 번역처리 타입을 사용자로부터 입력받고, 번역처리 과정에서 생성된 중간 번역처리 결과(예컨대, 형태소 분석 결과, 품사 태깅 결과, 구문 분석 결과, 구조 변환 결과 및 번역문) 중에서 입력된 번역처리 타입에 대응하는 번역처리 결과를 사용자에게 표시함으로써, 불완전한 번역 결과물을 보완하면서도 다양한 사용자별 만족도를 증가시킬 수 있다.
100: 중간 번역처리 결과 장치 110: 입력부
120: 번역처리부 121; 형태소 분석부
122: 태깅부 123: 구문 분석부
124: 변환부 125: 번역문 생성부
126: 번역처리 결과 저장부 130: 표시부
140: 단어 사전 DB

Claims (15)

  1. 번역 대상이 되는 입력 원문을 입력받고, 상기 입력 원문을 번역처리하기 위한 번역처리 타입을 사용자로부터 입력받는 입력부;
    상기 입력 원문을 번역처리하여 형태소 분석 결과, 품사 태깅 결과, 구문 분석 결과, 구조 변환 결과 및 번역문 중에서 적어도 하나가 포함된 번역처리 결과를 생성하는 번역처리부; 및
    상기 입력된 번역처리 타입에 대응하는 상기 생성된 번역처리 결과를 상기 사용자에게 표시하는 표시부
    를 포함하는 중간 번역처리 결과 제공 장치.
  2. 제 1 항에 있어서,
    상기 입력 원문의 단어에 대한 대역어가 포함된 단어 사전을 저장하는 단어 사전 DB
    를 더 포함하는 중간 번역처리 결과 제공 장치.
  3. 제 1 항에 있어서,
    상기 번역처리부는,
    상기 입력 원문의 형태소를 분석하여 형태소 분석 결과를 생성하는 형태소 분석부;
    상기 분석된 형태소에 대해서 품사를 태깅하여 태깅 결과를 생성하는 태깅부;
    상기 태깅된 입력 원문의 구문을 분석하여 구문 분석 결과를 생성하는 구문 분석부;
    상기 구문 분석된 입력 원문의 구조를 번역문의 구조로 변환하여 구조 변환 결과를 생성하는 변환부; 및
    상기 변환된 입력 원문의 단어를 해당 대역어로 변환하여 번역문을 생성하는 번역문 생성부
    를 포함하는 중간 번역처리 결과 제공 장치.
  4. 제 3 항에 있어서,
    상기 번역처리부는,
    상기 생성된 형태소 분석 결과, 태깅 결과, 구문 분석 결과, 구조 변환 결과 및 번역문을 저장하는 번역처리 결과 저장부
    를 더 포함하는 중간 번역처리 결과 제공 장치.
  5. 제 3 항에 있어서,
    상기 형태소 분석부, 상기 태깅부, 상기 구문 분석부, 상기 변환부 및 상기 번역문 생성부는,
    상기 형태소 분석 결과, 상기 품사 태깅 결과, 상기 구문 분석 결과, 상기 구조 변환 결과 및 상기 번역문을 서로 독립적으로 생성하는 중간 번역처리 결과 제공 장치.
  6. 제 3 항에 있어서,
    상기 표시부는,
    상기 번역처리 결과 저장부에 번역처리 타입이 사용자별로 미리 설정되어 저장된 경우, 상기 미리 설정된 사용자별 번역처리 타입에 대응하는 번역처리 결과를 표시하는 중간 번역처리 결과 제공 장치.
  7. 제 3 항에 있어서,
    상기 표시부는,
    상기 입력 원문이 중국어 또는 일본어인 경우, 상기 입력 원문의 형태소를 분석하여 단어 분리 결과를 표시하는 중간 번역처리 결과 제공 장치.
  8. 제 3 항에 있어서,
    상기 표시부는,
    상기 태깅된 입력 원문의 구문을 분석하여 단문, 중문 및 복문 중 어느 하나인지, 명사절, 형용사절 및 부사절 중 어느 하나인지, 주절 및 종속절, 관계대명사절 중 어느 하나인지를 표시하는 중간 번역처리 결과 제공 장치.
  9. 제 3 항에 있어서,
    상기 표시부는,
    상기 구문 분석된 입력 원문의 어순을 번역문의 어순으로 변환하고, 상기 변환된 번역문의 어순에 조사 및 어미를 표시하는 중간 번역처리 결과 제공 장치.
  10. 번역 대상이 되는 입력 원문을 입력받고, 상기 입력 원문을 번역처리하기 위한 번역처리 타입을 사용자로부터 입력받는 입력 단계;
    상기 입력 원문을 번역처리하여 형태소 분석 결과, 품사 태깅 결과, 구문 분석 결과, 구조 변환 결과 및 번역문 중에서 적어도 하나가 포함된 번역처리 결과를 생성하는 번역처리 단계; 및
    상기 입력된 번역처리 타입에 대응하는 상기 생성된 번역처리 결과를 상기 사용자에게 표시하는 표시 단계
    를 포함하는 중간 번역처리 결과 제공 방법.
  11. 제 10 항에 있어서,
    상기 번역처리 단계는,
    상기 입력 원문의 형태소를 분석하여 형태소 분석 결과를 생성하는 형태소 분석 단계;
    상기 분석된 형태소에 대해서 품사를 태깅하여 태깅 결과를 생성하는 태깅 단계;
    상기 태깅된 입력 원문의 구문을 분석하여 구문 분석 결과를 생성하는 구문 분석 단계;
    상기 구문 분석된 입력 원문의 구조를 번역문의 구조로 변환하여 구조 변환 결과를 생성하는 변환 단계; 및
    상기 변환된 입력 원문의 단어를 해당 대역어로 변환하여 번역문을 생성하는 번역문 생성 단계
    를 포함하는 중간 번역처리 결과 제공 방법.
  12. 제 11 항에 있어서,
    상기 표시 단계는,
    번역처리 타입이 사용자별로 미리 설정된 경우, 상기 미리 설정된 사용자별 번역처리 타입에 대응하는 번역처리 결과를 표시하는 중간 번역처리 결과 제공 방법.
  13. 제 11 항에 있어서,
    상기 표시 단계는,
    상기 입력 원문이 중국어 또는 일본어인 경우, 상기 입력 원문의 형태소를 분석하여 단어 분리 결과를 표시하는 중간 번역처리 결과 제공 방법.
  14. 제 11 항에 있어서,
    상기 표시 단계는,
    상기 태깅된 입력 원문의 구문을 분석하여 단문, 중문 및 복문 중 어느 하나인지, 명사절, 형용사절 및 부사절 중 어느 하나인지, 주절 및 종속절, 관계대명사절 중 어느 하나인지를 표시하는 중간 번역처리 결과 제공 방법.
  15. 제 11 항에 있어서,
    상기 표시 단계는,
    상기 구문 분석된 입력 원문의 어순을 번역문의 어순으로 변환하고, 상기 변환된 번역문의 어순에 조사 및 어미를 표시하는 중간 번역처리 결과 제공 방법.
KR1020100108043A 2010-11-02 2010-11-02 중간 번역처리 결과 제공 장치 및 그 방법 KR20120046414A (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020100108043A KR20120046414A (ko) 2010-11-02 2010-11-02 중간 번역처리 결과 제공 장치 및 그 방법

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020100108043A KR20120046414A (ko) 2010-11-02 2010-11-02 중간 번역처리 결과 제공 장치 및 그 방법

Publications (1)

Publication Number Publication Date
KR20120046414A true KR20120046414A (ko) 2012-05-10

Family

ID=46265505

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020100108043A KR20120046414A (ko) 2010-11-02 2010-11-02 중간 번역처리 결과 제공 장치 및 그 방법

Country Status (1)

Country Link
KR (1) KR20120046414A (ko)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2017159906A1 (ko) * 2016-03-16 2017-09-21 이시용 원문의 번역어순을 결정하는 데이터 구조, 상기 구조를 생성하는 프로그램 및 이를 저장하는 컴퓨터 판독가능 저장매체
CN111738024A (zh) * 2020-07-29 2020-10-02 腾讯科技(深圳)有限公司 实体名词标注方法和装置、计算设备和可读存储介质

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2017159906A1 (ko) * 2016-03-16 2017-09-21 이시용 원문의 번역어순을 결정하는 데이터 구조, 상기 구조를 생성하는 프로그램 및 이를 저장하는 컴퓨터 판독가능 저장매체
CN111738024A (zh) * 2020-07-29 2020-10-02 腾讯科技(深圳)有限公司 实体名词标注方法和装置、计算设备和可读存储介质
CN111738024B (zh) * 2020-07-29 2023-10-27 腾讯科技(深圳)有限公司 实体名词标注方法和装置、计算设备和可读存储介质

Similar Documents

Publication Publication Date Title
Bernardini et al. Building interpreting and intermodal corpora: A how-to for a formidable task
US20070255570A1 (en) Multi-platform visual pronunciation dictionary
Mendes et al. The COPLE2 corpus: a learner corpus for Portuguese
Bernardini et al. Corpus linguistics, translation and interpreting
Wehrmeyer A corpus for signed language<? br?> interpreting research
Valentini Phrasal verbs in Italian dubbed dialogues: a multimedia corpus-based study
KR20210138311A (ko) 언어 및 수어의 병렬 말뭉치 데이터의 생성 장치 및 방법
KR101541170B1 (ko) 텍스트 요약 장치 및 방법
Wang et al. Corpus-based interpreting studies in China: Overview and prospects
KR20120046414A (ko) 중간 번역처리 결과 제공 장치 및 그 방법
Pinnis et al. Tilde MT platform for developing client specific MT solutions
KR20120077794A (ko) 자동 번역 시스템에서 중국어 문장의 단어의 뜻을 제공하는 방법, 번역 장치 및 단말기, 그리고 이 방법을 실행시키기 위한 프로그램을 저장한 기록매체
Islam et al. Polygot: An approach towards reliable translation by name identification and memory optimization using semantic analysis
KR101498456B1 (ko) 백과사전을 이용한 번역 서비스 장치 및 그 방법
Jian et al. TANGO: Bilingual collocational concordancer
KR101501459B1 (ko) 자동 번역 기술을 이용한 작문 시스템 및 방법
JP2019053262A (ja) 学習システム
JP4007413B2 (ja) 自然言語処理システム及び自然言語処理方法、並びにコンピュータ・プログラム
KR20110137961A (ko) 원문 및 번역문 오버레이를 이용한 번역 서비스 장치 및 그 방법
KR20120046409A (ko) 번역 분야별 단어를 이용한 번역 장치 및 그 방법
Mustafa et al. Translation techniques used in translating a smartphone user manual
KR100836159B1 (ko) 반자동 번역 서비스 제공 시스템 및 방법
JP2005250525A (ja) 漢文解析支援装置及び異言語文処理装置及び翻訳プログラム
Elenius et al. Language Resources and Tools for Swedish: A Survey.
KR20190141891A (ko) 단어 의미분석 및 단어 번역지식을 기반으로한 문장 번역 방법 및 장치

Legal Events

Date Code Title Description
N231 Notification of change of applicant
WITN Withdrawal due to no request for examination