KR20200041113A - 외국어 문장을 한국어로 번역하는 장치 및 방법 - Google Patents

외국어 문장을 한국어로 번역하는 장치 및 방법 Download PDF

Info

Publication number
KR20200041113A
KR20200041113A KR1020180121154A KR20180121154A KR20200041113A KR 20200041113 A KR20200041113 A KR 20200041113A KR 1020180121154 A KR1020180121154 A KR 1020180121154A KR 20180121154 A KR20180121154 A KR 20180121154A KR 20200041113 A KR20200041113 A KR 20200041113A
Authority
KR
South Korea
Prior art keywords
terminology
foreign language
korean
sentence
translation
Prior art date
Application number
KR1020180121154A
Other languages
English (en)
Inventor
신태영
Original Assignee
한림대학교 산학협력단
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 한림대학교 산학협력단 filed Critical 한림대학교 산학협력단
Priority to KR1020180121154A priority Critical patent/KR20200041113A/ko
Publication of KR20200041113A publication Critical patent/KR20200041113A/ko

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/40Processing or translation of natural language
    • G06F40/42Data-driven translation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/205Parsing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/40Processing or translation of natural language
    • G06F40/58Use of machine translation, e.g. for multi-lingual retrieval, for server-side translation for client devices or for real-time translation

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Machine Translation (AREA)

Abstract

외국어 문장을 한국어로 번역하는 장치 및 방법이 제공된다. 본 발명의 일 실시예에 따른 외국어 문장을 한국어로 번역하는 장치는, 외국어 문장을 입력받는 입력부, 상기 외국어 문장에서 명사를 추출하는 추출부, 외국어 전문용어가 저장되어 있는 전문용어 저장부, 상기 명사가 상기 전문용어 저장부에 저장되어 있는지 식별하는 전문용어 식별부, 및 상기 외국어 문장을 한국어로 번역하여 번역된 문장을 출력하는 번역부를 포함하되, 상기 번역부에서, 상기 전문용어 저장부에 저장되어 있는 상기 명사는 외국어를 유지하여 번역한다.

Description

외국어 문장을 한국어로 번역하는 장치 및 방법{Apparatus and Method for translating a foreign sentence into a korean sentence}
본 발명은 전문용어를 포함하고 있는 외국어 문장을 한국어로 번역함에 있어서, 전문가들의 언어습관을 반영하여, 전문가들이 보다 이해하기 편하도록 번역하는 장치 및 방법에 관한 것이다.
최근에, 외국어를 한국어로 번역하는 시스템이 많이 개발되고 있다. 그 예로서, 구글 번역기나 네이버 파파고 등이 있으며, 해당 번역기에 외국어 문장들을 입력하면 자동으로 한국어로 번역된다.
한편, 의료, 법률, 특허 등 전문분야에서는 외국 자료를 참조할 일이 잦기 때문에, 외국 자료들을 위와 같은 번역 시스템을 이용하여 번역하는 경우가 있다. 그런데 위와 같은 기존 번역 시스템의 경우, 외국 자료의 모든 텍스트를 한국어로 변환하기 때문에, 해당 분야의 전문가들이 이해하기 어렵도록 번역된다.
예를 들어, 의료계에서는 '부신 땀샘'이라는 한국어 대신 'adrenal gland'라는 영어를 사용한다. 그런데, 기존 번역 시스템은 이와 같은 해당 분야의 언어습관을 반영하지 않고, 일괄적으로 한국어로 번역하기 때문에, 전문가들에게 익숙하지 않도록 번역을 한다는 문제가 있었다.
본 발명에서는, 전문용어를 포함하고 있는 외국어 문장을 한국어로 번역함에 있어서, 해당 전문가들의 언어습관을 반영하여 전문가들이 보다 이해하기 쉽도록 번역하는 것을 과제로 한다.
상기 언급된 기술적 과제들을 해결하기 위한, 본 발명의 일 실시예에 따른 외국어 문장을 한국어로 번역하는 장치는, 외국어 문장을 입력받는 입력부, 상기 외국어 문장에서 명사를 추출하는 추출부, 외국어 전문용어가 저장되어 있는 전문용어 저장부, 상기 명사가 상기 전문용어 저장부에 저장되어 있는지 식별하는 전문용어 식별부, 및 상기 외국어 문장을 한국어로 번역하여 번역된 문장을 출력하는 번역부를 포함하되, 상기 번역부에서, 상기 전문용어 저장부에 저장되어 있는 상기 명사는 외국어를 유지하여 번역한다.
상기 추출부는 상기 외국어 문장에서 동사를 추출하며, 상기 전문용어 식별부는 상기 동사가 상기 전문용어 저장부에 저장되어 있는지 식별하고, 상기 번역부에서, 상기 전문용어 저장부에 저장되어 있는 상기 동사는 외국어로 유지하거나 외국어의 진행형으로 변환한 후, 그 뒤에 '하다'의 의미를 부가할 수 있다.
상기 추출부는, 상기 외국어 문장을 복수의 어절들로 나누고, 상기 어절들 중에서 조사, 관사, 및 전치사 중 어느 하나 이상을 제외함으로써 명사 또는 동사를 추출할 수 있다.
사용자로부터 상기 번역된 문장 중 특정 명사 또는 특정 동사를 선택하는 입력을 수신하고, 선택된 상기 특정 명사 또는 특정 동사에 대한 번역수정지시를 입력받아, 상기 번역된 문장에 상기 번역수정지시를 일괄적으로 적용하는 번역수정부를 더 포함할 수 있다.
상기 전문용어 저장부는, 상기 번역수정지시를 반영하여, 새로운 외국어 전문용어를 추가하거나, 기존에 저장되어 있던 외국어 전문용어를 수정할 수 있다.
본 발명의 다른 실시예에 따른 외국어 문장을 한국어로 번역하는 장치는, 상기 외국어 문장을 입력받는 입력부, 외국어 전문용어와 상기 외국어 전문용어에 대응하는 한국어 전문용어가 쌍을 이루어 저장되어 있는 전문용어 저장부, 상기 외국어 문장을 한국어 문장으로 번역하는 번역부, 상기 한국어 문장에서 명사를 추출하는 추출부, 상기 명사가 상기 전문용어 저장부에 상기 한국어 전문용어로 저장되어 있는지 식별하는 전문용어 식별부, 및 상기 한국어 문장에서, 상기 전문용어 저장부에 상기 한국어 전문용어로 저장되어 있는 상기 명사를 상기 한국어 전문용어와 쌍을 이루는 상기 외국어 전문용어로 변환하여 결과 문장을 출력하는 전문용어 변환부를 포함한다.
상기 추출부는 상기 한국어 문장에서 동사를 추출하며, 상기 전문용어 식별부는 상기 동사가 상기 전문용어 저장부에 상기 한국어 전문용어로 저장되어 있는지 식별하고, 상기 전문용어 변환부에서, 상기 전문용어 저장부에 상기 한국어 전문용어로 저장되어 있는 상기 동사는 상기 한국어 전문용어와 쌍을 이루는 상기 외국어 전문용어로 변환하거나 상기 외국어 전문용어의 진행형으로 변환한 후, 그 뒤에 '하다'의 의미를 부가할 수 있다.
상기 추출부는, 상기 한국어 문장을 복수의 어절들로 나누고, 상기 어절들에서 동사와 명사를 추출하며, 조사가 포함되어 있는 어절에서는 조사를 제외함으로써 명사를 추출할 수 있다.
사용자로부터 상기 결과 문장 중 특정 명사 또는 특정 동사를 선택하는 입력을 수신하고, 선택된 상기 특정 명사 또는 특정 동사에 대한 번역수정지시를 입력받아, 상기 결과 문장에 상기 번역수정지시를 일괄적으로 적용하는 번역수정부를 더 포함할 수 있다.
상기 전문용어 저장부는, 상기 번역수정지시를 반영하여, 새로운 외국어 전문용어와 한국어 전문용어의 쌍을 추가하거나, 기존에 저장되어 있던 외국어 전문용어와 한국어 전문용어의 쌍을 수정할 수 있다.
본 발명의 다른 실시예에 따른, 외국어 문장을 한국어로 번역하며, 전문용어가 저장되어 있는 장치에 의해 수행되는, 번역 방법은, 상기 외국어 문장을 입력받는 입력단계, 상기 외국어 문장에서 명사를 추출하는 추출단계, 상기 명사가 상기 장치에 전문용어로 저장되어있는지 식별하는 식별단계, 및 상기 외국어 문장을 한국어로 번역하는 번역단계를 포함하되, 상기 번역단계에서, 상기 장치에 전문용어로 저장되어 있는 상기 명사는 외국어를 유지하여 번역한다.
상기 추출단계는 상기 외국어 문장에서 동사를 추출하며, 상기 식별단계는 상기 동사가 상기 장치에 저장되어 있는지 식별하고, 상기 번역단계에서, 상기 장치에 저장되어 있는 상기 동사는 외국어로 유지하거나 외국어의 진행형으로 변환한 후, 그 뒤에 '하다'의 의미를 부가할 수 있다.
상기 추출단계는, 상기 외국어 문장을 복수의 어절들로 나누고, 상기 어절들 중에서 조사, 관사, 및 전치사 중 어느 하나 이상을 제외함으로써 명사 또는 동사를 추출할 수 있다.
상기 번역단계 이후에, 사용자로부터 상기 번역단계에서 번역된 문장 중 특정 명사 또는 특정 동사를 선택하는 입력을 수신하고, 선택된 상기 특정 명사 또는 특정 동사에 대한 번역수정지시를 입력받아, 상기 번역된 문장에 상기 번역수정지시를 일괄적으로 적용하는 번역수정단계를 더 포함할 수 있다.
상기 번역수정단계 이후에, 상기 번역수정지시를 반영하여, 상기 장치에 새로운 외국어 전문용어를 추가하거나, 기존에 저장되어 있던 외국어 전문용어를 수정하는 전문용어수정단계를 더 포함할 수 있다.
본 발명의 다른 실시예에 따른, 외국어 문장을 한국어로 번역하며, 외국어 전문용어와 상기 외국어 전문용어에 대응하는 한국어 전문용어가 쌍을 이루어 저장되어 있는 장치에 의해 수행되는, 번역 방법은, 상기 외국어 문장을 입력받는 입력단계, 상기 외국어 문장을 한국어 문장으로 번역하는 번역단계, 상기 한국어 문장에서 명사를 추출하는 추출단계, 상기 명사가 상기 장치에 상기 한국어 전문용어로 저장되어 있는지 식별하는 식별단계, 및 상기 한국어 문장에서, 상기 장치에 상기 한국어 전문용어로 저장되어 있는 상기 명사를 상기 한국어 전문용어와 쌍을 이루는 상기 외국어 전문용어로 변환하여 결과 문장을 출력하는 전문용어 변환단계를 포함한다.
상기 추출단계는 상기 한국어 문장에서 동사를 추출하며, 상기 식별단계는 상기 동사가 상기 장치에 상기 한국어 전문용어로 저장되어 있는지 식별하고, 상기 전문용어 변환단계에서, 상기 장치에 상기 한국어 전문용어로 저장되어 있는 상기 동사는 상기 한국어 전문용어와 쌍을 이루는 상기 외국어 전문용어로 변환하거나 상기 외국어 전문용어의 진행형으로 변환한 후, 그 뒤에 '하다'의 의미를 부가할 수 있다.
상기 추출단계는, 상기 한국어 문장을 복수의 어절들로 나누고, 상기 어절들에서 동사와 명사를 추출하며, 조사가 포함되어 있는 어절에서는 조사를 제외함으로써 명사를 추출할 수 있다.
상기 전문용어 변환단계 이후에, 사용자로부터 상기 결과 문장 중 특정 명사 또는 특정 동사를 선택하는 입력을 수신하고, 선택된 상기 특정 명사 또는 특정 동사에 대한 번역수정지시를 입력받아, 상기 결과 문장에 상기 번역수정지시를 일괄적으로 적용하는 번역수정단계를 더 포함할 수 있다.
상기 번역수정단계 이후에, 상기 번역수정지시를 반영하여, 상기 장치에 새로운 외국어 전문용어와 한국어 전문용어의 쌍을 추가하거나, 기존에 저장되어 있던 외국어 전문용어와 한국어 전문용어의 쌍을 수정하는 전문용어수정단계를 더 포함할 수 있다.
본 발명의 다른 실시예에 따른 프로그램을 기록한 컴퓨터 판독 가능 저장 매체는, 상기 번역 방법들을 수행할 수 있다.
상기와 같은 본 발명에 따르면, 전문용어를 포함하고 있는 외국어 문장을 해당 전문가들의 언어습관을 반영하여 한국어로 번역함으로써, 전문가들이 보다 이해하기 쉽도록 번역할 수 있다.
도 1은 전문용어를 포함하는 외국어 문장을 한국어로 번역하는 장치의 일 실시예를 나타낸 도면이다.
도 2는 전문용어를 포함하는 외국어 문장을 한국어로 번역하는 방법의 일 실시예를 나타낸 도면이다.
도 3은 전문용어를 포함하는 외국어 문장을 한국어로 번역하는 방법의 다른 실시예를 나타낸 도면이다.
이하, 첨부된 도면을 참조하여 본 발명의 바람직한 실시예를 상세히 설명한다. 본 발명의 이점 및 특징, 그리고 그것들을 달성하는 방법은 첨부되는 도면과 함께 상세하게 후술되어 있는 실시예들을 참조하면 명확해질 것이다. 그러나 본 발명은 이하에서 게시되는 실시예들에 한정되는 것이 아니라 서로 다른 다양한 형태로 구현될 수 있으며, 단지 본 실시예들은 본 발명의 게시가 완전하도록 하고, 본 발명이 속하는 기술분야에서 통상의 지식을 가진 자에게 발명의 범주를 완전하게 알려주기 위해 제공되는 것이며, 본 발명은 청구항의 범주에 의해 정의될 뿐이다. 명세서 전체에 걸쳐 동일 참조 부호는 동일 구성 요소를 지칭한다.
다른 정의가 없다면, 본 명세서에서 사용되는 모든 용어(기술 및 과학적 용어를 포함)는 본 발명이 속하는 기술분야에서 통상의 지식을 가진 자에게 공통적으로 이해될 수 있는 의미로 사용될 수 있을 것이다. 또 일반적으로 사용되는 사전에 정의되어 있는 용어들은 명백하게 특별히 정의되어 있지 않는 한 이상적으로 또는 과도하게 해석되지 않는다.
본 명세서에서 사용된 용어는 실시예들을 설명하기 위한 것이며 본 발명을 제한하고자 하는 것은 아니다. 본 명세서에서, 단수형은 문구에서 특별히 언급하지 않는 한 복수형도 포함한다. 명세서에서 사용되는 "포함한다" 및/또는 "포함하는"은 언급된 구성요소 외에 하나 이상의 다른 구성요소의 존재 또는 추가를 배제하지 않는다.
이하, 도면을 참조하여 본 발명의 실시예들에 따른 외국어 문장을 한국어로 번역하는 장치 및 방법에 대해 설명하기로 한다.
도 1을 참조하면, 본 발명의 일 실시예에 따른 외국어 문장을 한국어로 번역하는 장치 (100) 는, 상기 외국어 문장을 입력받는 입력부 (110), 상기 외국어 문장에서 명사를 추출하는 추출부 (120), 외국어 전문용어가 저장되어 있는 전문용어 저장부 (130), 상기 명사가 상기 전문용어 저장부 (130) 에 저장되어 있는지 식별하는 전문용어 식별부 (140), 및 상기 외국어 문장을 한국어로 번역하여 번역된 문장을 출력하는 번역부 (150) 를 포함하되, 상기 번역부 (150) 에서, 상기 전문용어 저장부 (130) 에 저장되어 있는 상기 명사는 외국어를 유지하여 번역한다.
입력부 (110) 는 외국어 문장을 입력받는다. 이때, 외국어 문장은 영어 문장, 일본어 문장, 스페인어 문장 등일 수 있으며, 구체적인 종류를 제한하지는 않는다. 상기 입력부 (110) 는 문서 파일을 입력받거나, URL의 입력을 통해 해당 사이트 내의 문장을 입력받을 수도 있고, 사용자로부터 직접 타이핑을 통해 문장을 입력받을 수도 있으며, 구체적인 입력방식을 제한하지는 않는다.
추출부 (120) 는 상기 외국어 문장에서 명사를 추출한다. 또한, 일 실시예에 따라, 상기 추출부 (120) 는 동사, 형용사, 또는 부사도 추출할 수 있다. 상기 추출부 (120) 는, 상기 외국어 문장을 복수의 어절들로 나누고, 상기 어절들 중에서 조사, 관사, 및 전치사 중 어느 하나 이상을 제외함으로써 명사, 동사, 형용사, 또는 부사를 추출할 수 있다. 예를 들어, "They lie superior to the upper pole of the kidneys."라는 영어 문장을 they, lie, superior, to, the, upper, pole, of, the, 및 kidneys 의 어절들로 나누고, 전치사인 to, of 와 관사인 the 를 제외하여, 명사인 they, superior, pole, kidneys 와, 동사인 lie, 형용사인 upper 를 추출할 수 있다.
한편, 형용사는 인접한 명사와 결합되어 하나의 명사로 취급될 수도 있다. 상기 예에서는, upper pole 이 하나의 명사처럼 취급될 수 있다. 이와 유사하게, 인접한 복수의 명사가 하나의 결합된 명사로 취급될 수도 있다. 예를 들어, adrenal 과 gland 가 인접하고 있을 때, 이를 각각의 명사로 취급할 수도 있으며, adrenal gland 를 하나의 명사로 취급할 수도 있다. 이와 같은 형용사와 명사의 결합 또는 복수의 명사들의 결합을 판단함에 있어서, 웹 상의 전문용어 사전이나, 전문용어 저장부 (130) 에 저장되어 있는 전문용어 등을 참조할 수 있다. 또한, 위와 같은 결합에 대한 판단없이, 결합이 되었을 때 또는 결합이 안되었을 때 모두를 고려할 수 있다. 예를 들어, adrenal 과 gland 가 인접하고 있을 때, adrenal, gland, 및 adrenal gland 를 각각 하나의 명사로 취급할 수도 있다.
또한, kidneys 와 같이 명사가 복수형인 경우 이를 단수형으로 변환하여 추출할 수 있다. 상기 예에서는 kidneys 가 kidney 로 추출될 수도 있다. 이와 유사하게, 동사가 과거형, 과거 분사형, 진행형, 또는 단수형 등의 변형된 형태인 경우, 상기 동사의 원형으로 변환하여 추출할 수 있다. 예를 들어, lay, lain, lying, 또는 lies 가 그 원형인 lie 로 추출될 수 있다.
전문용어 저장부 (130) 에는 외국어 전문용어가 저장되어 있다. 이때, 전문용어라 함은 상기 전문용어 저장부 (130) 에 전문용어로 저장되어 있는 용어들을 통칭하며, 외국어 전문용어는 외국어로된 전문용어를 의미하고, 한국어 전문용어는 한국어로된 전문용어를 의미한다. 상기 전문용어는 사용자의 입력에 의해 정의될 수도 있고, 상기 전문용어 저장부 (130) 의 크롤링, 딥러닝 등을 통해 자체적으로 수집될 수도 있다. 또한, 상기 전문용어 저장부 (130) 에는 전문용어들이 해당 전문분야 별로 분류되어 저장되어 있을 수 있다. 예를 들어, adrenal gland, crus, 또는 kidney 등은 '의료'분야의 전문용어로 저장되고, court, judge, 또는 juror 등은 '법률'분야의 전문용어로 저장될 수 있다.
또한, 전문용어 저장부 (130) 에는 전문용어의 원형뿐만 아니라, 복수형, 과거형 등 변형된 형태도 저장되어 있을 수 있으며, 상기 원형과 변형된 형태는 쌍을 이루어 저장되어 있을 수 있다. 예를 들어, kidney 뿐만 아니라, kidneys 도 저장되어 있을 수 있으며, 이때 원형인 kidney 와 변형된 형태인 kidneys 는 쌍을 이루어 저장되어 있을 수 있다.
전문용어 식별부 (140) 는 추출부 (120) 에서 추출된 명사, 동사, 형용사, 또는 부사가 전문용어 저장부 (130) 에 전문용어로 저장되어 있는지 식별한다. 예를 들어, 추출된 명사가 kidney 일때, 전문용어 저장부 (130) 에 저장되어 있는 전문용어들을 조회하여, kidney 가 전문용어로 저장되어 있는지 식별할 수 있다. 한편, 추출부 (120) 에서 추출된 명사, 동사, 형용사 또는 부사와 전문용어 저장부 (130) 에 저장되어 있는 전문용어를 비교함에 있어서, 원형의 변형된 형태도 고려할 수 있다. 예를 들어, 추출부 (120) 에서 추출된 명사가 복수형인 kidneys 이고, 전문용어 저장부 (130) 에 저장되어 있는 전문용어가 단수형인 kidney 일때에도, 상기 복수형인 kidneys 도 전문용어로 식별될 수 있다. 또한, 추출부 (120) 에서 추출된 동사가 과거형인 lay 이고, 전문용어 저장부 (130) 에 저장되어 있는 전문용어가 원형인 sue 일 때에도, 상기 과거형인 sued 도 전문용어로 식별될 수 있다.
번역부 (150) 는 입력부 (110) 에서 입력받은 외국어 문장을 한국어로 번역하여 번역된 문장을 출력하되, 상기 외국어 문장에 포함되어 있는 명사 중에서 전문용어 저장부 (130) 에 저장되어 있는 것으로 식별된 명사는 외국어를 유지한다. 예를 들어, 도 1에서, 'they' 라는 명사는 '그들'로 번역되었지만, 전문용어 저장부 (130) 에 'kidney'가 전문용어로 저장되어 있는 경우, 외국어 문장에 포함된 'kidneys' 는 외국어인 'kidneys'를 유지할 수 있다. 또한, 이 과정에서 명사, 동사, 형용사 또는 부사의 원형과 변형된 형태의 관계를 고려하여, 변형된 형태를 원형으로 변환할 수도 있다. 예를 들어, 상기 예에서 외국어 문장에 포함된 'kidneys' 는 'kidney'로 변환 될 수 있다.
또한, 번역부 (150) 는 상기 외국어 문장에 포함되어 있는 동사 중에서 전문용어 저장부 (130) 에 저장되어 있는 것으로 식별된 동사는 외국어로 유지하거나 외국어의 진행형으로 변환한 후, 그 뒤에 '하다'의 의미를 부가할 수 있다. 예를 들어, 'I am going to sue you.'라는 외국어 문장의 경우, 상기 'sue'가 전문용어 저장부 (130) 에 전문용어로 저장되어 있다면, 상기 'sue'는 'sue'의 형태를 유지하거나, 그 진행형인 'suing'으로 변환된 후, 뒤에 '하다'의 의미가 부가되어, '나는 너를 sue 할 거야.' 또는 '나는 너를 suing 할 거야.'로 번역될 수 있다.
이때, 외국어 또는 외국어의 진행형의 뒤에 '하다'의 의미가 부가된다는 것은, 문맥 또는 문법에 맞게 '하다'가 변형되어 결합된다는 의미이다. 예를 들어, 'play'는 'play 한다', 'play 했다', 'play 하도록', 'play 하는 것' 등과 같이, 문맥 또는 문법에 맞게 '하다'가 변형되어 뒤에 결합될 수 있고, 'playing 하다', 'playing 했다', 'playing 하도록', 'playing 하는 것'등과 같이 '하다'의 의미가 외국어의 진행형 뒤에 부가될 수도 있다.
또한, 번역부 (150) 는 상기 외국어 문장에 포함되어 있는 형용사 중에서 전문용어 저장부 (130) 에 저장되어 있는 것으로 식별된 형용사는 외국어로 유지한 후, 그 뒤에 '한' 또는 '하는'을 부가할 수 있다. 예를 들어, 'This is a luxury item.'라는 외국어 문장에서, 만약 'luxury'가 전문용어 저장부 (130) 에 전문용어로 저장되어 있다면, 상기 'luxury'는 'luxury'의 형태를 유지한 후, 뒤에 '한'이 부가되어, '이것은 luxury한 물건이다.'로 번역될 수 있다.
이와 유사하게, 번역부 (150) 는 상기 외국어 문장에 포함되어 있는 부사 중에서 전문용어 저장부 (130) 에 저장되어 있는 것으로 식별된 부사는 외국어로 유지한 후, 그 뒤에 '하게'를 부가할 수 있다.
본 발명의 일 실시예에 따른, 외국어 문장을 한국어로 번역하는 장치 (100) 는 번역수정부 (160) 를 더 포함할 수 있다. 상기 번역수정부 (160) 는, 사용자로부터 번역부 (150) 에서 번역된 문장 중 특정 명사, 특정 동사, 특정 형용사, 또는 특정 부사를 선택하는 입력을 수신하고, 선택된 상기 특정 명사, 특정 동사, 특정 형용사, 또는 특정 부사에 대한 번역수정지시를 입력받아, 상기 번역된 문장에 상기 번역수정지시를 일괄적으로 적용할 수 있다. 예를 들어, 'They lie superior to the upper pole of the kidneys.'의 외국어 문장이 번역부 (150) 에서 '그들은 kidney의 upper pole의 superior에 위치한다.'로 번역되었을 때, 사용자가 상기 번역된 문장 중 '그들'이라는 특정 명사를 클릭한 후 'they'로 번역수정하라는 지시를 내리는 경우, 번역수정부 (160) 는 상기 번역된 문장에 포함되어 있는 모든 '그들'을 모두 'they'로 수정할 수 있다. 또한, 만약 사용자가 'kidney'라는 특정 명사를 클릭한 후 '신장'으로 번역수정하라는 지시를 내리는 경우, 번역수정부 (160) 는 상기 번역된 문장에 포함되어 있는 모든 'kidney'를 모두 '신장'으로 수정할 수 있다.
한편, 전문용어 저장부 (130) 는, 상기 번역수정지시를 반영하여, 새로운 외국어 전문용어를 추가하거나, 기존에 저장되어 있던 외국어 전문용어를 수정할 수 있다. 예를 들어, 상기 예에서 사용자가 'kidney'라는 특정 명사를 클릭한 후 '신장'으로 번역수정하라는 지시를 내리는 경우, 전문용어 저장부 (130) 는 이를 반영하여, 'kidney'를 전문용어에서 삭제할 수 있다.
도 2에서는, 앞서 설명한 번역 장치 (100) 에 의해 수행되는 번역 방법이 개시되어 있다. 구체적으로, 상기 번역 방법은 외국어 문장을 입력받는 입력단계 (S11), 상기 외국어 문장에서 명사를 추출하는 추출단계 (S12), 상기 명사가 상기 장치 (100) 에 전문용어로 저장되어있는지 식별하는 식별단계 (S13), 및 상기 외국어 문장을 한국어로 번역하는 번역단계 (S14) 를 포함하되, 상기 번역단계 (S14) 에서, 상기 장치 (100) 에 전문용어로 저장되어 있는 상기 명사는 외국어를 유지하여 번역한다.
한편, 본원 발명의 다른 실시예에 따를 때, 외국어 문장을 먼저 한국어 문장으로 번역한 후, 상기 한국어 문장에서 명사를 추출하여 전문용어인지 식별할 수도 있다. 이와 같은 실시예에 따를 때, 외국어 문장을 한국어로 번역하는 장치 (100) 는, 입력부 (110), 추출부 (120), 전문용어 저장부 (130), 및 전문용어 식별부 (140) 와 더불어 전문용어 변환부를 더 포함할 수 있다.
이와 같은 실시예에 따를 때, 전문용어 저장부 (130) 에는 외국어 전문용어와 상기 외국어 전문용어에 대응하는 한국어 전문용어가 쌍을 이루어 저장되어 있을 수 있다. 예를 들어, 'kidney'와 '신장'이 쌍을 이루어 저장되어 있을 수 있다.
그리고, 번역부 (150) 에서는 입력부 (110) 에서 입력받은 외국어 문장을 한국어 문장으로 번역하고, 추출부 (120) 에서는 상기 한국어 문장에서 명사, 동사, 형용사, 또는 부사를 추출할 수 있다. 또한, 추출부 (120) 는 상기 한국어 문장을 복수의 어절들로 나누고, 상기 어절들에서 명사, 동사, 형용사, 또는 부사를 추출하며, 조사가 포함되어 있는 어절에서는 조사를 제외함으로써 명사를 추출할 수 있다.
그 후, 전문용어 식별부 (140) 에서는, 상기 추출된 명사, 동사, 형용사, 또는 부사가 전문용어 저장부 (130) 에 한국어 전문용어로 저장되어 있는지 식별할 수 있다.
그 후, 전문용어 변환부에서는, 상기 한국어 문장에서, 상기 전문용어 저장부에 상기 한국어 전문용어로 저장되어 있는 상기 명사를 상기 한국어 전문용어와 쌍을 이루는 상기 외국어 전문용어로 변환하여 결과 문장을 출력할 수 있다. 예를 들어, 번역부 (150) 에서 번역된 한국어 문장이 '그들은 신장의 상부 극의 우월에 위치한다.'이고, 전문용어 저장부에 'kidney-신장', 'upper pole-상부 극', 및 'superior-우월'의 전문용어 쌍들이 저장되어 있을 때, '신장', '상부 극', 및 '우월'을 각각 'kidney', 'upper pole', 및 'superior'로 변환하여, 결과 문장인 '그들은 kidney의 upper pole의 superior에 위치한다.'를 출력할 수 있다.
또한, 상기 전문용어 변환부에서는, 상기 한국어 문장에서, 상기 전문용어 저장부에 상기 한국어 전문용어로 저장되어 있는 동사, 형용사, 또는 부사를 상기 한국어 전문용어와 쌍을 이루는 상기 외국어 전문용어로 변환하여 결과 문장을 출력하되, 동사의 경우 상기 한국어 전문용어와 쌍을 이루는 상기 외국어 전문용어로 변환하거나 상기 외국어 전문용어의 진행형으로 변환한 후, 그 뒤에 '하다'의 의미를 부가할 수 있고, 형용사의 경우 상기 한국어 전문용어와 쌍을 이루는 상기 외국어 전문용어로 변환한 후 '한' 또는 '하는'의 기재를 부가할 수 있고, 부사의 경우 상기 한국어 전문용어와 쌍을 이루는 상기 외국어 전문용어로 변환한 후 '하게'의 기재를 부가할 수 있다.
또한, 번역 수정부 (160) 는 사용자로부터 상기 결과 문장 중 특정 명사, 특정 동사, 특정 형용사, 또는 특정 부사를 선택하는 입력을 수신하고, 선택된 상기 특정 명사, 특정 동사, 특정 형용사, 또는 특정 부사에 대한 번역수정지시를 입력받아, 상기 결과 문장에 상기 번역수정지시를 일괄적으로 적용할 수 있다.
또한, 상기 전문용어 저장부 (130) 는, 상기 번역수정지시를 반영하여, 새로운 외국어 전문용어와 한국어 전문용어의 쌍을 추가하거나, 기존에 저장되어 있던 외국어 전문용어와 한국어 전문용어의 쌍을 수정할 수 있다.
이처럼, 외국어 문장을 먼저 한국어 문장으로 번역한 후, 상기 한국어 문장에서 명사, 동사, 형용사, 또는 부사를 추출하여 전문용어인지 식별한 후, 해당 용어를 외국어로 변환하는 번역 방법에 대해서, 도 3에 개시되어 있다. 구체적으로, 상기 번역 방법은 외국어 문장을 입력받는 입력단계 (S21), 상기 외국어 문장을 한국어 문장으로 번역하는 번역단계 (S22), 상기 한국어 문장에서 명사를 추출하는 추출단계 (S23), 상기 명사가 상기 장치 (100) 에 상기 한국어 전문용어로 저장되어있는지 식별하는 식별단계 (S24), 및 상기 한국어 문장에서, 상기 장치에 상기 한국어 전문용어로 저장되어 있는 상기 명사를 상기 한국어 전문용어와 쌍을 이루는 상기 외국어 전문용어로 변환하여 결과 문장을 출력하는 전문용어 변환단계 (S25) 를 포함한다.
이러한 외국어 문장을 한국어로 번역하는 방법들은 프로그램을 기록한 컴퓨터 판독 가능 저장 매체에서 수행될 수 있다.
컴퓨터 판독 가능 저장 매체는 범용 또는 특수 목적 컴퓨터에 의해 액세스될 수 있는 임의의 가용 매체일 수도 있다. 비제한적인 예로서, 컴퓨터 판독 가능 매체들은 RAM, ROM, EEPROM, CD-ROM 또는 다른 광디스크 스토리지, 자기디스크 스토리지 또는 다른 자기 저장 디바이스들, 또는 원하는 프로그램 코드 수단을 명령들 또는 데이터 구조들의 형태로 저장하는데 사용될 수 있으며 범용 또는 특수-목적 컴퓨터, 또는 범용 또는 특수-목적 프로세서에 의해 액세스될 수 있는 임의의 다른 매체를 포함할 수 있다. 디스크 (disk) 및 디스크 (disc) 는, 본원에서 사용할 때, 컴팩트 디스크 (CD), 레이저 디스크, 광 디스크, 디지털 다기능 디스크 (DVD), 플로피 디스크 및 Blu-ray 디스크를 포함하며, 디스크들 (disks) 은 데이터를 자기적으로 보통 재생하지만, 디스크들 (discs) 은 레이저로 데이터를 광학적으로 재생한다. 앞에서 언급한 것들의 조합들이 또한 컴퓨터 판독 가능 저장 매체의 범위 내에 포함되어야 한다.
이상 첨부된 도면을 참조하여 본 발명의 실시예들을 설명하였지만, 본 발명이 속하는 기술분야에서 통상의 지식을 가진 자는 본 발명이 그 기술적 사상이나 필수적인 특징을 변경하지 않고서 다른 구체적인 형태로 실시될 수 있다는 것을 이해할 수 있을 것이다. 그러므로 이상에서 기술한 실시예들은 모든 면에서 예시적인 것이며 한정적이 아닌 것으로 이해해야만 한다.
100: 외국어 문장을 한국어로 번역하는 장치
110: 입력부
120: 추출부
130: 전문용어 저장부
140: 전문용어 식별부
150: 번역부
160: 번역수정부

Claims (21)

  1. 외국어 문장을 한국어로 번역하는 장치에 있어서,
    상기 외국어 문장을 입력받는 입력부;
    상기 외국어 문장에서 명사를 추출하는 추출부;
    외국어 전문용어가 저장되어 있는 전문용어 저장부;
    상기 명사가 상기 전문용어 저장부에 저장되어 있는지 식별하는 전문용어 식별부; 및
    상기 외국어 문장을 한국어로 번역하여 번역된 문장을 출력하는 번역부를 포함하되,
    상기 번역부에서, 상기 전문용어 저장부에 저장되어 있는 상기 명사는 외국어를 유지하여 번역하는, 외국어 문장을 한국어로 번역하는 장치.
  2. 제 1 항에 있어서,
    상기 추출부는 상기 외국어 문장에서 동사를 추출하며,
    상기 전문용어 식별부는 상기 동사가 상기 전문용어 저장부에 저장되어 있는지 식별하고,
    상기 번역부에서, 상기 전문용어 저장부에 저장되어 있는 상기 동사는 외국어로 유지하거나 외국어의 진행형으로 변환한 후, 그 뒤에 '하다'의 의미를 부가하는, 외국어 문장을 한국어로 번역하는 장치.
  3. 제 2 항에 있어서,
    상기 추출부는, 상기 외국어 문장을 복수의 어절들로 나누고, 상기 어절들 중에서 조사, 관사, 및 전치사 중 어느 하나 이상을 제외함으로써 명사 또는 동사를 추출하는, 외국어 문장을 한국어로 번역하는 장치.
  4. 제 2 항에 있어서,
    사용자로부터 상기 번역된 문장 중 특정 명사 또는 특정 동사를 선택하는 입력을 수신하고, 선택된 상기 특정 명사 또는 특정 동사에 대한 번역수정지시를 입력받아, 상기 번역된 문장에 상기 번역수정지시를 일괄적으로 적용하는 번역수정부를 더 포함하는, 외국어 문장을 한국어로 번역하는 장치.
  5. 제 4 항에 있어서,
    상기 전문용어 저장부는, 상기 번역수정지시를 반영하여, 새로운 외국어 전문용어를 추가하거나, 기존에 저장되어 있던 외국어 전문용어를 수정하는, 외국어 문장을 한국어로 번역하는 장치.
  6. 외국어 문장을 한국어로 번역하는 장치에 있어서,
    상기 외국어 문장을 입력받는 입력부;
    외국어 전문용어와 상기 외국어 전문용어에 대응하는 한국어 전문용어가 쌍을 이루어 저장되어 있는 전문용어 저장부;
    상기 외국어 문장을 한국어 문장으로 번역하는 번역부;
    상기 한국어 문장에서 명사를 추출하는 추출부;
    상기 명사가 상기 전문용어 저장부에 상기 한국어 전문용어로 저장되어 있는지 식별하는 전문용어 식별부; 및
    상기 한국어 문장에서, 상기 전문용어 저장부에 상기 한국어 전문용어로 저장되어 있는 상기 명사를 상기 한국어 전문용어와 쌍을 이루는 상기 외국어 전문용어로 변환하여 결과 문장을 출력하는 전문용어 변환부를 포함하는, 외국어 문장을 한국어로 번역하는 장치.
  7. 제 6 항에 있어서,
    상기 추출부는 상기 한국어 문장에서 동사를 추출하며,
    상기 전문용어 식별부는 상기 동사가 상기 전문용어 저장부에 상기 한국어 전문용어로 저장되어 있는지 식별하고,
    상기 전문용어 변환부에서, 상기 전문용어 저장부에 상기 한국어 전문용어로 저장되어 있는 상기 동사는 상기 한국어 전문용어와 쌍을 이루는 상기 외국어 전문용어로 변환하거나 상기 외국어 전문용어의 진행형으로 변환한 후, 그 뒤에 '하다'의 의미를 부가하는, 외국어 문장을 한국어로 번역하는 장치.
  8. 제 7 항에 있어서,
    상기 추출부는, 상기 한국어 문장을 복수의 어절들로 나누고, 상기 어절들에서 동사와 명사를 추출하며, 조사가 포함되어 있는 어절에서는 조사를 제외함으로써 명사를 추출하는, 외국어 문장을 한국어로 번역하는 장치.
  9. 제 7 항에 있어서,
    사용자로부터 상기 결과 문장 중 특정 명사 또는 특정 동사를 선택하는 입력을 수신하고, 선택된 상기 특정 명사 또는 특정 동사에 대한 번역수정지시를 입력받아, 상기 결과 문장에 상기 번역수정지시를 일괄적으로 적용하는 번역수정부를 더 포함하는, 외국어 문장을 한국어로 번역하는 장치.
  10. 제 9 항에 있어서,
    상기 전문용어 저장부는, 상기 번역수정지시를 반영하여, 새로운 외국어 전문용어와 한국어 전문용어의 쌍을 추가하거나, 기존에 저장되어 있던 외국어 전문용어와 한국어 전문용어의 쌍을 수정하는, 외국어 문장을 한국어로 번역하는 장치.
  11. 외국어 문장을 한국어로 번역하며, 전문용어가 저장되어 있는 장치에 의해 수행되는, 번역 방법에 있어서,
    상기 외국어 문장을 입력받는 입력단계;
    상기 외국어 문장에서 명사를 추출하는 추출단계;
    상기 명사가 상기 장치에 전문용어로 저장되어있는지 식별하는 식별단계; 및
    상기 외국어 문장을 한국어로 번역하는 번역단계를 포함하되,
    상기 번역단계에서, 상기 장치에 전문용어로 저장되어 있는 상기 명사는 외국어를 유지하여 번역하는, 번역 방법.
  12. 제 11 항에 있어서,
    상기 추출단계는 상기 외국어 문장에서 동사를 추출하며,
    상기 식별단계는 상기 동사가 상기 장치에 저장되어 있는지 식별하고,
    상기 번역단계에서, 상기 장치에 저장되어 있는 상기 동사는 외국어로 유지하거나 외국어의 진행형으로 변환한 후, 그 뒤에 '하다'의 의미를 부가하는, 번역 방법.
  13. 제 12 항에 있어서,
    상기 추출단계는, 상기 외국어 문장을 복수의 어절들로 나누고, 상기 어절들 중에서 조사, 관사, 및 전치사 중 어느 하나 이상을 제외함으로써 명사 또는 동사를 추출하는, 번역 방법.
  14. 제 12 항에 있어서,
    상기 번역단계 이후에, 사용자로부터 상기 번역단계에서 번역된 문장 중 특정 명사 또는 특정 동사를 선택하는 입력을 수신하고, 선택된 상기 특정 명사 또는 특정 동사에 대한 번역수정지시를 입력받아, 상기 번역된 문장에 상기 번역수정지시를 일괄적으로 적용하는 번역수정단계를 더 포함하는, 번역 방법.
  15. 제 14 항에 있어서,
    상기 번역수정단계 이후에, 상기 번역수정지시를 반영하여, 상기 장치에 새로운 외국어 전문용어를 추가하거나, 기존에 저장되어 있던 외국어 전문용어를 수정하는 전문용어수정단계를 더 포함하는, 번역 방법.
  16. 외국어 문장을 한국어로 번역하며, 외국어 전문용어와 상기 외국어 전문용어에 대응하는 한국어 전문용어가 쌍을 이루어 저장되어 있는 장치에 의해 수행되는, 번역 방법에 있어서,
    상기 외국어 문장을 입력받는 입력단계;
    상기 외국어 문장을 한국어 문장으로 번역하는 번역단계;
    상기 한국어 문장에서 명사를 추출하는 추출단계;
    상기 명사가 상기 장치에 상기 한국어 전문용어로 저장되어 있는지 식별하는 식별단계; 및
    상기 한국어 문장에서, 상기 장치에 상기 한국어 전문용어로 저장되어 있는 상기 명사를 상기 한국어 전문용어와 쌍을 이루는 상기 외국어 전문용어로 변환하여 결과 문장을 출력하는 전문용어 변환단계를 포함하는, 번역 방법.
  17. 제 16 항에 있어서,
    상기 추출단계는 상기 한국어 문장에서 동사를 추출하며,
    상기 식별단계는 상기 동사가 상기 장치에 상기 한국어 전문용어로 저장되어 있는지 식별하고,
    상기 전문용어 변환단계에서, 상기 장치에 상기 한국어 전문용어로 저장되어 있는 상기 동사는 상기 한국어 전문용어와 쌍을 이루는 상기 외국어 전문용어로 변환하거나 상기 외국어 전문용어의 진행형으로 변환한 후, 그 뒤에 '하다'의 의미를 부가하는, 번역 방법.
  18. 제 17 항에 있어서,
    상기 추출단계는, 상기 한국어 문장을 복수의 어절들로 나누고, 상기 어절들에서 동사와 명사를 추출하며, 조사가 포함되어 있는 어절에서는 조사를 제외함으로써 명사를 추출하는, 번역 방법.
  19. 제 17 항에 있어서,
    상기 전문용어 변환단계 이후에, 사용자로부터 상기 결과 문장 중 특정 명사 또는 특정 동사를 선택하는 입력을 수신하고, 선택된 상기 특정 명사 또는 특정 동사에 대한 번역수정지시를 입력받아, 상기 결과 문장에 상기 번역수정지시를 일괄적으로 적용하는 번역수정단계를 더 포함하는, 번역 방법.
  20. 제 19 항에 있어서,
    상기 번역수정단계 이후에, 상기 번역수정지시를 반영하여, 상기 장치에 새로운 외국어 전문용어와 한국어 전문용어의 쌍을 추가하거나, 기존에 저장되어 있던 외국어 전문용어와 한국어 전문용어의 쌍을 수정하는 전문용어수정단계를 더 포함하는, 번역 방법.
  21. 제 11 항 내지 제 20 항 중 어느 한 항의 방법을 수행하는 프로그램을 기록한 컴퓨터 판독 가능 저장 매체.
KR1020180121154A 2018-10-11 2018-10-11 외국어 문장을 한국어로 번역하는 장치 및 방법 KR20200041113A (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020180121154A KR20200041113A (ko) 2018-10-11 2018-10-11 외국어 문장을 한국어로 번역하는 장치 및 방법

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020180121154A KR20200041113A (ko) 2018-10-11 2018-10-11 외국어 문장을 한국어로 번역하는 장치 및 방법

Publications (1)

Publication Number Publication Date
KR20200041113A true KR20200041113A (ko) 2020-04-21

Family

ID=70456408

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020180121154A KR20200041113A (ko) 2018-10-11 2018-10-11 외국어 문장을 한국어로 번역하는 장치 및 방법

Country Status (1)

Country Link
KR (1) KR20200041113A (ko)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR102203074B1 (ko) * 2020-07-30 2021-01-14 정재윤 영어 학습 방법 및 디바이스

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR102203074B1 (ko) * 2020-07-30 2021-01-14 정재윤 영어 학습 방법 및 디바이스

Similar Documents

Publication Publication Date Title
Woodsend et al. Learning to simplify sentences with quasi-synchronous grammar and integer programming
JP4635659B2 (ja) 質問応答システム、およびデータ検索方法、並びにコンピュータ・プログラム
KR101762866B1 (ko) 구문 구조 변환 모델과 어휘 변환 모델을 결합한 기계 번역 장치 및 기계 번역 방법
US8600728B2 (en) Training for a text-to-text application which uses string to tree conversion for training and decoding
Chakravarthi et al. WordNet gloss translation for under-resourced languages using multilingual neural machine translation
JP4439431B2 (ja) コミュニケーション支援装置、コミュニケーション支援方法およびコミュニケーション支援プログラム
US8924195B2 (en) Apparatus and method for machine translation
JP4319860B2 (ja) 転移ベースの機械翻訳システムで使用される転移辞書を開発するための方法および装置
JP2006309346A (ja) 日中機械翻訳装置、日中機械翻訳方法および日中機械翻訳プログラム
Othman et al. English-asl gloss parallel corpus 2012: Aslg-pc12
Plank et al. DaN+: Danish nested named entities and lexical normalization
Wang et al. Source language adaptation approaches for resource-poor machine translation
Kim et al. Korean FrameNet expansion based on projection of Japanese FrameNet
KR20200041113A (ko) 외국어 문장을 한국어로 번역하는 장치 및 방법
JP5342760B2 (ja) 訳語学習のためのデータを作成する装置、方法、およびプログラム
WO2020012813A1 (ja) 情報処理装置、および情報処理方法、並びにプログラム
JP4476609B2 (ja) 中国語解析装置、中国語解析方法および中国語解析プログラム
JP4940606B2 (ja) 翻訳システム、翻訳装置、翻訳方法及びプログラム
JP2009157888A (ja) 音訳モデル作成装置、音訳装置、及びそれらのためのコンピュータプログラム
Devi et al. Steps of pre-processing for english to mizo smt system
WO2009144890A1 (ja) 翻訳前換言規則生成システム
JP4203102B2 (ja) 中国語解析装置、中国語解析方法および中国語解析プログラム
Bloodgood et al. Acquisition of translation lexicons for historically unwritten languages via bridging loanwords
KR100322743B1 (ko) 음성합성기의 문서해석기에서 사용되는 형태소 해석방법 및 그 장치
JP3707506B2 (ja) 文書検索装置及び文書検索方法

Legal Events

Date Code Title Description
E601 Decision to refuse application
J201 Request for trial against refusal decision
J301 Trial decision

Free format text: TRIAL NUMBER: 2020101001865; TRIAL DECISION FOR APPEAL AGAINST DECISION TO DECLINE REFUSAL REQUESTED 20200723

Effective date: 20210318