KR20220045797A - 축약형 번역 제공 방법 및 장치 - Google Patents

축약형 번역 제공 방법 및 장치 Download PDF

Info

Publication number
KR20220045797A
KR20220045797A KR1020200128869A KR20200128869A KR20220045797A KR 20220045797 A KR20220045797 A KR 20220045797A KR 1020200128869 A KR1020200128869 A KR 1020200128869A KR 20200128869 A KR20200128869 A KR 20200128869A KR 20220045797 A KR20220045797 A KR 20220045797A
Authority
KR
South Korea
Prior art keywords
text
translation
abbreviated
user
present
Prior art date
Application number
KR1020200128869A
Other languages
English (en)
Inventor
이요한
김영길
Original Assignee
한국전자통신연구원
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 한국전자통신연구원 filed Critical 한국전자통신연구원
Priority to KR1020200128869A priority Critical patent/KR20220045797A/ko
Publication of KR20220045797A publication Critical patent/KR20220045797A/ko

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/40Processing or translation of natural language
    • G06F40/58Use of machine translation, e.g. for multi-lingual retrieval, for server-side translation for client devices or for real-time translation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/258Heading extraction; Automatic titling; Numbering

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Machine Translation (AREA)

Abstract

본 발명의 일 실시예에 따른 축약형 번역 제공 방법은, 원시 언어 텍스트를 수신하는 단계; 상기 원시 언어 텍스트로부터 하나 이상의 핵심 어절을 추출하는 단계; 요약 정도 및 상기 추출된 하나 이상의 핵심 어절에 기초하여 상기 원시 언어에 대한 요약 텍스트를 생성하는 단계; 및 상기 요약 텍스트에 대한 번역을 수행하여 상기 원시 언어 텍스트에 대한 축약형 번역 텍스트를 출력하는 단계를 포함할 수 있으며, 상기 요약 정도는 사용자에 의해 선택에 따라 결정될 수 있다.

Description

축약형 번역 제공 방법 및 장치{APPARATUS AND METHOD FOR PROVIDING SUMMARIZED TRANSLATION TEXT}
본 발명은 축약형 번역 제공 방법 및 장치에 관한 것으로, 더욱 상세하게는 원시 언어의 요약 텍스트에 대한 축약형 번역을 제공하는 방법 및 장치에 관한 것이다.
비대면 어플리케이션에 대한 수요가 증가함에 따라 다양한 환경에서의 통역 및 번역에 대한 수요도 급격히 증가하고 있다. 기존의 짧은 문장에 대한 번역을 지원하는 서비스를 넘어 구글의 픽셀 버드, 마이크로소프트의 스카이프 트랜스레이터 등 해외 대기업에서는 실시간 통번역 서비스를 제공하고 있는 추세이다.
종래의 번역 인터페이스는 원문에 등장하는 모든 단어에 대응하는 번역문을 제공한다. 이러한 번역 인터페이스는 사용자가 원문의 내용을 빠르고 간결하게 이해해야 하는 상황이나 요구에 적합하지 않다. 예를 들어, 발화가 빠르게 이어지는 실시간 번역 환경에서 사용자는 다음 발화가 끝나기 전에 이전 발화의 내용을 이해해야 하지만 길게 이어지는 발화의 경우 이에 대응하는 번역문 또한 길어지기 때문에 내용 이해에 어려움을 겪는다. 또는 사용자가 여러 문장으로 이루어진 문서의 핵심 내용을 파악하기 원하는 경우 모든 문장의 번역문을 제공하는 것만으로는 사용자의 요구를 충족시키기 어렵다.
상기와 같은 문제점을 해결하기 위한 본 발명의 목적은, 긴 발화나 문서의 핵심 내용을 요약하여 가독성 있는 번역문을 도출하는 축약형 번역 제공 방법을 제공하는 데 있다.
상기와 같은 문제점을 해결하기 위한 본 발명의 다른 목적은 상기 축약형 번역 제공 방법을 이용하는 장치를 제공하는 데 있다.
상기 목적을 달성하기 위한 본 발명의 일 실시예에 따른 축약형 번역 제공 방법은, 원시 언어 텍스트를 수신하는 단계; 상기 원시 언어 텍스트로부터 하나 이상의 핵심 어절을 추출하는 단계; 요약 정도 및 상기 추출된 하나 이상의 핵심 어절에 기초하여 상기 원시 언어에 대한 요약 텍스트를 생성하는 단계; 및 상기 요약 텍스트에 대한 번역을 수행하여 상기 원시 언어 텍스트에 대한 축약형 번역 텍스트를 출력하는 단계를 포함할 수 있다.
여기서, 요약 정도는 사용자에 의해 설정되는 요약문 길이 선택 스크롤을 통해 결정될 수 있다.
또한, 원시 언어에 대한 요약 텍스트는, 입력 텍스트, 핵심 어절, 및 출력 텍스트를 포함하는 원시 언어 말뭉치를 이용해 학습된 신경망을 활용하여 생성될 수 있다.
한편, 축약형 번역 텍스트는, 원시 언어 텍스트, 목표 언어 텍스트를 포함하는 병렬 말뭉치를 이용해 학습된 신경망을 활용하여 생성될 수 있다.
상기 다른 목적을 달성하기 위한 본 발명의 일 실시예에 따른 축약형 번역 제공 장치는, 적어도 하나의 프로세서 및 상기 프로세서를 통해 실행되는 적어도 하나의 명령을 저장하는 메모리를 포함할 수 있다.
상기 적어도 하나의 명령은 상기 적어도 하나의 프로세서(410)로 하여금 상기 원시 언어 텍스트로부터 하나 이상의 핵심 어절을 추출하도록 하는 명령, 요약 정도 및 상기 추출된 하나 이상의 핵심 어절에 기초하여 상기 원시 언어에 대한 요약 텍스트를 생성하도록 하는 명령, 상기 요약 텍스트에 대한 번역을 수행하여 상기 원시 언어 텍스트에 대한 축약형 번역 텍스트를 출력하도록 하는 명령을 포함할 수 있다.
여기서, 요약 정도는 사용자에 의해 설정되는 요약문 길이 선택 스크롤을 통해 결정될 수 있다.
또한, 원시 언어에 대한 요약 텍스트는, 입력 텍스트, 핵심 어절, 및 출력 텍스트를 포함하는 원시 언어 말뭉치를 이용해 학습된 신경망을 활용하여 생성될 수 있다.
한편, 축약형 번역 텍스트는, 원시 언어 텍스트, 목표 언어 텍스트를 포함하는 병렬 말뭉치를 이용해 학습된 신경망을 활용하여 생성될 수 있다.
상기와 같은 본 발명의 실시예들에 따르면, 원시 텍스트의 내용을 축약한 번역문을 사용자에게 제공하므로 사용자가 원시 텍스트의 내용을 빠르고 간결하게 이해하도록 하는 효과가 있다.
또한, 사용자가 축약에 필요한 핵심 어절의 개수를 설정할 수 있으므로 사용 환경에 따라 내용의 추상화가 가능하며, 원시 언어를 어느 정도 알고 있는 사용자의 경우, 입력 텍스트의 하이라이트된 핵심 어절을 통해 내용의 직관적인 이해가 가능하다.
도 1은 본 발명의 일 실시예에 따른 축약형 번역 제공 장치의 블록 구성도이다.
도 2는 본 발명의 실시예들에 따라 사용자에게 축약형 번역을 제공하는 화면 예를 나타낸다.
도 3은 본 발명의 일 실시예에 따른 축약형 번역 제공 방법의 순서도이다.
도 4는 본 발명의 다른 실시예에 따른 축약형 번역 제공 장치의 블록 구성도이다.
본 발명은 다양한 변경을 가할 수 있고 여러 가지 실시예를 가질 수 있는 바, 특정 실시예들을 도면에 예시하고 상세한 설명에 상세하게 설명하고자 한다. 그러나, 이는 본 발명을 특정한 실시 형태에 대해 한정하려는 것이 아니며, 본 발명의 사상 및 기술 범위에 포함되는 모든 변경, 균등물 내지 대체물을 포함하는 것으로 이해되어야 한다. 각 도면을 설명하면서 유사한 참조부호를 유사한 구성요소에 대해 사용하였다.
제1, 제2, A, B 등의 용어는 다양한 구성요소들을 설명하는 데 사용될 수 있지만, 상기 구성요소들은 상기 용어들에 의해 한정되어서는 안 된다. 상기 용어들은 하나의 구성요소를 다른 구성요소로부터 구별하는 목적으로만 사용된다. 예를 들어, 본 발명의 권리 범위를 벗어나지 않으면서 제1 구성요소는 제2 구성요소로 명명될 수 있고, 유사하게 제2 구성요소도 제1 구성요소로 명명될 수 있다. "및/또는"이라는 용어는 복수의 관련된 기재된 항목들의 조합 또는 복수의 관련된 기재된 항목들 중의 어느 항목을 포함한다.
어떤 구성요소가 다른 구성요소에 "연결되어" 있다거나 "접속되어" 있다고 언급된 때에는, 그 다른 구성요소에 직접적으로 연결되어 있거나 또는 접속되어 있을 수도 있지만, 중간에 다른 구성요소가 존재할 수도 있다고 이해되어야 할 것이다. 반면에, 어떤 구성요소가 다른 구성요소에 "직접 연결되어" 있다거나 "직접 접속되어" 있다고 언급된 때에는, 중간에 다른 구성요소가 존재하지 않는 것으로 이해되어야 할 것이다.
본 출원에서 사용한 용어는 단지 특정한 실시예를 설명하기 위해 사용된 것으로, 본 발명을 한정하려는 의도가 아니다. 단수의 표현은 문맥상 명백하게 다르게 뜻하지 않는 한, 복수의 표현을 포함한다. 본 출원에서, "포함하다" 또는 "가지다" 등의 용어는 명세서상에 기재된 특징, 숫자, 단계, 동작, 구성요소, 부품 또는 이들을 조합한 것이 존재함을 지정하려는 것이지, 하나 또는 그 이상의 다른 특징들이나 숫자, 단계, 동작, 구성요소, 부품 또는 이들을 조합한 것들의 존재 또는 부가 가능성을 미리 배제하지 않는 것으로 이해되어야 한다.
다르게 정의되지 않는 한, 기술적이거나 과학적인 용어를 포함해서 여기서 사용되는 모든 용어들은 본 발명이 속하는 기술 분야에서 통상의 지식을 가진 자에 의해 일반적으로 이해되는 것과 동일한 의미를 가지고 있다. 일반적으로 사용되는 사전에 정의되어 있는 것과 같은 용어들은 관련 기술의 문맥 상 가지는 의미와 일치하는 의미를 가지는 것으로 해석되어야 하며, 본 출원에서 명백하게 정의하지 않는 한, 이상적이거나 과도하게 형식적인 의미로 해석되지 않는다.
본 발명은, 긴 발화나 문서의 핵심 내용을 요약하여 사용자에게 가독성 있는 번역문을 제공할 수 있는 축약형 번역 제공 장치 및 방법에 관한 것이다.
이하, 본 발명에 따른 바람직한 실시예를 첨부된 도면을 참조하여 상세하게 설명한다.
도 1은 본 발명의 일 실시예에 따른 축약형 번역 제공 장치의 블록 구성도이다.
본 발명의 일 실시예에 따른 축약형 번역 제공 장치(100)는, 사용자가 번역을 요청하는 원문을 수신하는 텍스트 입력부(110), 입력된 텍스트의 핵심 어절을 추출하여 요약문을 생성하는 요약부(120), 및 원시 언어 요약문에 대한 번역문을 생성하는 번역부(130), 및 목적 언어로 번역된 요약문을 출력하는 텍스트 출력부(140)를 포함할 수 있다.
본 발명에 따른 축약형 번역 제공 장치(100)는, 웹 페이지, PC/모바일 어플리케이션 등 컴퓨터 하드웨어 및 소프트웨어 중 적어도 하나로 구현될 수 있다. 축약형 번역 제공 장치는, 사용자의 발화를 인식하기 위한 음성인식 장치와 연동할 수 있다. 축약형 번역 제공 장치는 또한, 요약 및 번역 등의 필요에 따라 번역 엔진을 포함하는 서버 등과 통신할 수 있고 해당 기능이 단말에 탑재되는 형태로 제공될 수도 있다. 아래 설명하는 본 발명의 실시예들에서는 원문의 언어를 원시 언어, 번역문의 언어를 목표 언어라 칭하고 설명한다.
텍스트 입력부(110)는 문장 단위의 원시 언어 음성 인식 결과나 사용자가 입력하는 원시 언어 문서를 수신한다. 텍스트 입력부(110)는 입력된 텍스트를 디스플레이하여 사용자에게 제공할 수 있다.
요약부(120)는 텍스트 입력부(110)를 통해 입력되는 텍스트를 요약하여 번역부(130)로 제공한다. 이때, 요약부(120)는 요약 정도를 설정할 수 있는 요약문 길이 선택 스크롤을 사용자에게 제공할 수 있다. 요약문 길이 선택 스크롤은 예를 들어, 0.0부터 1.0까지의 값을 가질 수 있고, 선택된 값이 클수록 원문의 내용을 보다 상세히 포함하는 요약문을 생성하도록 설정될 수 있다.
요약부(120)는 입력 텍스트의 길이와 사용자가 설정한 요약 비율(r)에 따라 추출할 입력 텍스트의 핵심 어절 개수(K)를 결정한다. 여기서, 어절은 기본적으로 띄어쓰기 단위이나 형태소 분석이나 BPE(Byte Pair Encoding) 알고리즘을 활용하여 계산한 서브워드(Subword) 단위일 수 있다.
하나의 단어가 더 작은 단위의 의미있는 여러 서브워드들의 조합으로 구성된 경우, 하나의 단어를 여러 서브워드로 분리해서 단어를 인코딩 및 임베딩하는 것이 서브워드 분리 작업으로, 서브워드 분리 작업을 통해 OOV(Out-Of-Vocabulary), 희귀 단어, 신조어와 같은 문제를 완화시킬 수 있다.
가장 대표적인 서브워드 분리 알고리즘으로 BPE(Byte Pair Encoding) 알고리즘을 들 수 있다. BPE는 기본적으로는 데이터 압축 알고리즘이나 후에 자연어 처리의 서브워드 분리 알고리즘으로 응용되고 있다.
BPE는 기본적으로 연속적으로 가장 많이 등장한 글자의 쌍을 찾아서 하나의 글자로 병합하는 방식으로 동작한다. 보다 구체적으로, BPE는 글자(charcter) 단위에서 점차적으로 단어 집합(vocabulary)을 생성하는 Bottom up 방식의 접근을 사용하며, 훈련 데이터에 있는 단어들을 모든 글자(chracters) 또는 유니코드(unicode) 단위로 단어 집합(vocabulary)을 만들고, 가장 많이 등장하는 유니그램을 하나의 유니그램으로 통합하는 방식을 활용한다.
아래 수학식 1에 따라 본 발명의 일 실시예에 따른 핵심 어절 개수를 산출할 수 있다.
Figure pat00001
상기 수학식에서
Figure pat00002
는 원문의 어절 개수를 나타낸다. 따라서 추출할 핵심 어절 개수는 원문의 어절 개수보다 작거나 같다.
본 발명에 따른 핵심 어절은 시스템이 산출한 중요도 순으로 결정될 수 있다. 요약부(120)는 디스플레이된 입력 텍스트에서 해당 어절을 하이라이트하여 사용자에게 직관적인 요약 정보를 제공할 수도 있다. 하이라이트 정도 또는 색상 등은 어절의 중요도에 따라 달라질 수 있다.
핵심 어절과 그에 대한 중요도는 TF-IDF(Term Frequency-Inverse Document Frequency), SVM(Support Vector Machine)과 같은 통계적 분석 기법을 활용하거나 요약문 생성을 신경망 기반의 주의집중 메커니즘(Attention Mechanism)을 이용하여 산출할 수 있다.
여기서, TF-IDF(Term Frequency-Inverse Document Frequency)는 정보 검색과 텍스트 마이닝에서 이용하는 가중치로, 여러 문서로 이루어진 문서군이 있을 때 어떤 단어가 특정 문서 내에서 얼마나 중요한 것인지를 나타내는 통계적 수치이다. 즉, TF-IDF는 문서의 핵심어를 추출하거나, 검색 엔진에서 검색 결과의 순위를 결정하거나, 문서들 사이의 비슷한 정도를 구하는 등의 용도로 사용할 수 있다.
또한, SVM(support vector machine)은 기계 학습의 분야 중 하나로 패턴 인식, 자료 분석을 위한 지도 학습 모델이며, 주로 분류와 회귀 분석을 위해 사용한다. 두 카테고리 중 어느 하나에 속한 데이터의 집합이 주어졌을 때, SVM 알고리즘은 주어진 데이터 집합을 바탕으로 하여 새로운 데이터가 어느 카테고리에 속할지 판단하는 비확률적 이진 선형 분류 모델을 만든다. 만들어진 분류 모델은 데이터가 사상된 공간에서 경계로 표현되는데 SVM 알고리즘은 그 중 가장 큰 폭을 가진 경계를 찾는 알고리즘이다.
또한, 주의집중 메커니즘(attention mechanism)은 인간의 시각적 집중(visual attension) 현상을 모방한 변형 seq2seq 모델이다. 주의집중 메커니즘은 주로 NMT(Neural Machine Translation) 문제에 활용되며 디코더의 출력이 인코더의 어느 부분에 집중(attention) 하였는지를 판단할 수 있는 구조를 도입한다.
요약부(120)은 추출한 핵심 어절과 입력 텍스트를 기반으로 원시 언어 요약문을 생성한다. 이때, 요약부(120)는 요약 엔진을 포함할 수도 있고, 요약 엔진을 포함하는 서버 또는 시스템과 연동하는 방식으로 동작할 수도 있다.
이때, 요약 엔진은, 입력 텍스트, 핵심 어절과 출력 텍스트로 구성된 원시 언어 말뭉치로 학습한 신경망 네트워크를 활용하여 구성될 수 있다. 생성된 요약문은 핵심 어절이나 관련 어절로 치환된(paraphrasing) 어절을 포함할 수 있고, 요약문의 길이는 추출된 핵심 어절의 개수에 비례한다.
요약부(120)에 의해 요약된 요약문은 번역부(130)로 제공되고, 번역부(130)는 원시 언어 요약문에 대한 번역문을 생성한다. 이때, 번역부(130)는 번역 엔진을 포함할 수도 있고, 번역 엔진을 포함하는 서버 또는 시스템과 연동하는 방식으로 동작할 수도 있다. 여기서, 번역 엔진은 원시 언어 텍스트, 목표 언어 텍스트로 구성된 병렬 말뭉치를 학습한 신경망 네트워크를 이용하여 구성될 수 있다.
텍스트 출력부(140)는 번역부(130)로부터 축약형 번역 결과를 수신하여 디스플레이함으로써 사용자에게 번역문을 제공한다. 또한, 사용자의 전체적인 문맥 이해를 돕기 위해 요약문과 번역문은 이전의 요약/번역 히스토리를 누적하여 사용자에게 제공될 수 있다.
도 2는 본 발명의 실시예들에 따라 사용자에게 축약형 번역을 제공하는 화면 예를 나타낸다.
도 2를 참조하면, 본 발명의 일 실시예에 다른 축약형 번역 제공 장치는, 입력인 원시 언어(210)를 해당 원시 언어로 요약한 요약 텍스트(220), 및 요약 텍스트를 번역한 번역 텍스트(230)를 사용자에게 디스플레이하여 제공할 수 있다.
사용자는 원시 언어 유형와 목적 언어 유형 선택할 수 있으며, 원시 언어의 음성 인식 결과 또는 사용자의 입력 텍스트가 입력 창에 디스플레이된다. 본 발명에 따른 요약부는 사용자가 스크롤(221)을 이용해 설정한 요약 비율에 따라 입력 텍스트의 핵심 어절을 추출하고, 중요도에 따라 해당 어절을 하이라이트하여 디스플레이할 수 있다.
입력된 전체 텍스트와 핵심 어절로부터 생성된 요약문은 이전 요약 히스토리를 포함하여 요약 텍스트 창에 디스플레이될 수 있다. 본 발명에 따른 번역부는 요약문을 사용자가 설정한 목표 언어로 번역하고, 번역 결과를 이전 번역 히스토리와 함께 번역 텍스트 창을 통해 디스플레이한다.
도 3은 본 발명의 일 실시예에 따른 축약형 번역 제공 방법의 순서도이다.
도 3에 도시된 축약형 번역 제공 방법은, 앞서 실시예들을 통해 설명된 축약형 번역 제공 장치에 의해 수행될 수 있다.
본 발명의 일 실시예에 따른 축약형 번역 제공 방법에서는, 입력되는 원시 언어 텍스트를 수신하고(S310), 원시 언어 텍스트로부터 하나 이상의 핵심 어절을 추출한다(S320). 여기서, 입력되는 원시 언어 텍스트는 문서 형태로 입력될 수도 있고 음성 인식의 결과로 추출된 텍스트일 수도 있다. 또한, 핵심 어절의 개수는 사용자에 의해 설정될 수 있다.
핵심 어절이 추출되면 핵심 어절을 이용해 요약 텍스트가 생성된다(S330). 요약 텍스트 생성시 핵심 어절뿐 아니라 요약 정도를 고려하게 되는데, 여기서 요약 정도는 사용자에 의해 설정되는 요약문 길이 선택 스크롤을 통해 결정될 수 있다. 이때, 원시 언어에 대한 요약 텍스트는, 입력 텍스트, 핵심 어절, 및 출력 텍스트를 포함하는 원시 언어 말뭉치를 이용해 학습된 신경망을 활용하여 생성될 수 있다.
요약 텍스트가 생성되면 이에 대한 번역을 수행하여 원시 언어 텍스트에 대한 축약형 번역 텍스트를 사용자에게 제공한다(S340). 여기서, 축약형 번역 텍스트는, 원시 언어 텍스트, 목표 언어 텍스트를 포함하는 병렬 말뭉치를 이용해 학습된 신경망을 활용하여 생성될 수 있다.
도 4는 본 발명의 다른 실시예에 따른 축약형 번역 제공 장치의 블록 구성도이다.
도 4를 참조하면, 본 발명의 일 실시예에 따른 축약형 번역 제공 장치는, 적어도 하나의 프로세서(410), 상기 프로세서를 통해 실행되는 적어도 하나의 명령을 저장하는 메모리(420) 및 네트워크와 연결되어 통신을 수행하는 송수신 장치(430)를 포함할 수 있다.
상기 적어도 하나의 명령은 상기 적어도 하나의 프로세서(410)로 하여금 상기 원시 언어 텍스트로부터 하나 이상의 핵심 어절을 추출하도록 하는 명령, 요약 정도 및 상기 추출된 하나 이상의 핵심 어절에 기초하여 상기 원시 언어에 대한 요약 텍스트를 생성하도록 하는 명령, 상기 요약 텍스트에 대한 번역을 수행하여 상기 원시 언어 텍스트에 대한 축약형 번역 텍스트를 출력하도록 하는 명령을 포함할 수 있다.
여기서, 요약 정도는 사용자에 의해 설정되는 요약문 길이 선택 스크롤을 통해 결정될 수 있다.
또한, 원시 언어에 대한 요약 텍스트는, 입력 텍스트, 핵심 어절, 및 출력 텍스트를 포함하는 원시 언어 말뭉치를 이용해 학습된 신경망을 활용하여 생성될 수 있다.
한편, 축약형 번역 텍스트는, 원시 언어 텍스트, 목표 언어 텍스트를 포함하는 병렬 말뭉치를 이용해 학습된 신경망을 활용하여 생성될 수 있다.
축약형 번역 제공 장치(400)는 또한, 입력 인터페이스 장치(440), 출력 인터페이스 장치(450), 저장 장치(460) 등을 더 포함할 수 있다. 신체치수 측정 장치(400)에 포함된 각각의 구성 요소들은 버스(bus)(470)에 의해 연결되어 서로 통신을 수행할 수 있다.
프로세서(410)는 메모리(420) 및 저장 장치(460) 중에서 적어도 하나에 저장된 프로그램 명령(program command)을 실행할 수 있다. 프로세서(410)는 중앙 처리 장치(central processing unit, CPU), 그래픽 처리 장치(graphics processing unit, GPU), 또는 본 발명의 실시예들에 따른 방법들이 수행되는 전용의 프로세서를 포함할 수 있다. 메모리(420) 및 저장 장치(460) 각각은 휘발성 저장 매체 및 비휘발성 저장 매체 중 적어도 하나로 구성될 수 있다. 예를 들어, 메모리는 읽기 전용 메모리(read only memory, ROM) 및 랜덤 액세스 메모리(random access memory, RAM) 중에서 적어도 하나로 구성될 수 있다.
이상 실시예들을 통해 살펴본 본 발명은 실시간 통번역, 문서 번역 등 많은 내용을 포함하는 텍스트를 사용자가 간결하고 직관적으로 이해하기 위해선 주제와 상관없거나 불필요한 내용을 모두 번역하기 보다는 핵심 내용을 요약하여 번역하는 것이 더욱 효과적이다. 이러한 이유로 축약형 번역에 대한 수요가 증가하고 있고 본 발명이 해당 수요를 충족시킬 수 있을 것으로 기대된다.
본 발명의 실시예에 따른 방법의 동작은 컴퓨터로 읽을 수 있는 기록매체에 컴퓨터가 읽을 수 있는 프로그램 또는 코드로서 구현하는 것이 가능하다. 컴퓨터가 읽을 수 있는 기록매체는 컴퓨터 시스템에 의해 읽혀질 수 있는 데이터가 저장되는 모든 종류의 기록장치를 포함한다. 또한 컴퓨터가 읽을 수 있는 기록매체는 네트워크로 연결된 컴퓨터 시스템에 분산되어 분산 방식으로 컴퓨터로 읽을 수 있는 프로그램 또는 코드가 저장되고 실행될 수 있다.
또한, 컴퓨터가 읽을 수 있는 기록매체는 롬(rom), 램(ram), 플래시 메모리(flash memory) 등과 같이 프로그램 명령을 저장하고 수행하도록 특별히 구성된 하드웨어 장치를 포함할 수 있다. 프로그램 명령은 컴파일러(compiler)에 의해 만들어지는 것과 같은 기계어 코드뿐만 아니라 인터프리터(interpreter) 등을 사용해서 컴퓨터에 의해 실행될 수 있는 고급 언어 코드를 포함할 수 있다.
본 발명의 일부 측면들은 장치의 문맥에서 설명되었으나, 그것은 상응하는 방법에 따른 설명 또한 나타낼 수 있고, 여기서 블록 또는 장치는 방법 단계 또는 방법 단계의 특징에 상응한다. 유사하게, 방법의 문맥에서 설명된 측면들은 또한 상응하는 블록 또는 아이템 또는 상응하는 장치의 특징으로 나타낼 수 있다. 방법 단계들의 몇몇 또는 전부는 예를 들어, 마이크로프로세서, 프로그램 가능한 컴퓨터 또는 전자 회로와 같은 하드웨어 장치에 의해(또는 이용하여) 수행될 수 있다. 몇몇의 실시예에서, 가장 중요한 방법 단계들의 하나 이상은 이와 같은 장치에 의해 수행될 수 있다.
실시예들에서, 프로그램 가능한 로직 장치(예를 들어, 필드 프로그머블 게이트 어레이)가 여기서 설명된 방법들의 기능의 일부 또는 전부를 수행하기 위해 사용될 수 있다. 실시예들에서, 필드 프로그머블 게이트 어레이는 여기서 설명된 방법들 중 하나를 수행하기 위한 마이크로프로세서와 함께 작동할 수 있다. 일반적으로, 방법들은 어떤 하드웨어 장치에 의해 수행되는 것이 바람직하다.
이상 본 발명의 바람직한 실시예를 참조하여 설명하였지만, 해당 기술 분야의 숙련된 당업자는 하기의 특허 청구의 범위에 기재된 본 발명의 사상 및 영역으로부터 벗어나지 않는 범위 내에서 본 발명을 다양하게 수정 및 변경시킬 수 있음을 이해할 수 있을 것이다.

Claims (1)

  1. 원시 언어 텍스트를 수신하는 단계;
    상기 원시 언어 텍스트로부터 하나 이상의 핵심 어절을 추출하는 단계;
    요약 정도 및 상기 추출된 하나 이상의 핵심 어절에 기초하여 상기 원시 언어에 대한 요약 텍스트를 생성하는 단계; 및
    상기 요약 텍스트에 대한 번역을 수행하여 상기 원시 언어 텍스트에 대한 축약형 번역 텍스트를 출력하는 단계를 포함하고,
    상기 요약 정도는 사용자에 의해 선택에 따라 결정되는, 축약형 번역 제공 방법.
KR1020200128869A 2020-10-06 2020-10-06 축약형 번역 제공 방법 및 장치 KR20220045797A (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020200128869A KR20220045797A (ko) 2020-10-06 2020-10-06 축약형 번역 제공 방법 및 장치

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020200128869A KR20220045797A (ko) 2020-10-06 2020-10-06 축약형 번역 제공 방법 및 장치

Publications (1)

Publication Number Publication Date
KR20220045797A true KR20220045797A (ko) 2022-04-13

Family

ID=81214989

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020200128869A KR20220045797A (ko) 2020-10-06 2020-10-06 축약형 번역 제공 방법 및 장치

Country Status (1)

Country Link
KR (1) KR20220045797A (ko)

Similar Documents

Publication Publication Date Title
CN108089974B (zh) 利用定义的输入格式来测试应用
CN110287278B (zh) 评论生成方法、装置、服务器及存储介质
JP5901001B1 (ja) 音響言語モデルトレーニングのための方法およびデバイス
JP6462970B1 (ja) 分類装置、分類方法、生成方法、分類プログラム及び生成プログラム
JP5809381B1 (ja) 自然言語処理システム、自然言語処理方法、および自然言語処理プログラム
US20140380169A1 (en) Language input method editor to disambiguate ambiguous phrases via diacriticization
CN110866098A (zh) 基于transformer和lstm的机器阅读方法、装置及可读存储介质
CN109359308B (zh) 机器翻译方法、装置及可读存储介质
US20220139386A1 (en) System and method for chinese punctuation restoration using sub-character information
CN113656763B (zh) 确定小程序特征向量的方法、装置和电子设备
CN110888975A (zh) 文本可视化
CN112380337A (zh) 基于富文本的高亮方法及装置
JP7481999B2 (ja) 辞書編集装置、辞書編集方法及び辞書編集プログラム
CN112559725A (zh) 文本匹配方法、装置、终端和存储介质
US11893344B2 (en) Morpheme analysis learning device, morpheme analysis device, method, and program
US20230153550A1 (en) Machine Translation Method and Apparatus, Device and Storage Medium
KR20210060018A (ko) 전자 장치, 문서 요약문 생성 방법 및 저장 매체
KR20220045797A (ko) 축약형 번역 제공 방법 및 장치
KR102552811B1 (ko) 클라우드 기반 문법 교정 서비스 제공 시스템
US11797581B2 (en) Text processing method and text processing apparatus for generating statistical model
CN116685966A (zh) 调整查询生成模式
US10896296B2 (en) Non-transitory computer readable recording medium, specifying method, and information processing apparatus
CN110414013B (zh) 数据处理方法、装置及电子设备
CN114743012B (zh) 一种文本识别方法及装置
US20210142010A1 (en) Learning method, translation method, information processing apparatus, and recording medium