KR20230174141A - 논문에 대한 데이터베이스 기반의 분야별 전문 용어 번역 및 학습방법 및 시스템 - Google Patents

논문에 대한 데이터베이스 기반의 분야별 전문 용어 번역 및 학습방법 및 시스템 Download PDF

Info

Publication number
KR20230174141A
KR20230174141A KR1020230016673A KR20230016673A KR20230174141A KR 20230174141 A KR20230174141 A KR 20230174141A KR 1020230016673 A KR1020230016673 A KR 1020230016673A KR 20230016673 A KR20230016673 A KR 20230016673A KR 20230174141 A KR20230174141 A KR 20230174141A
Authority
KR
South Korea
Prior art keywords
word
translation
paper
extracted
words
Prior art date
Application number
KR1020230016673A
Other languages
English (en)
Inventor
유한별
김진우
유한길
Original Assignee
주식회사 하이빅데이터미디어
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 주식회사 하이빅데이터미디어 filed Critical 주식회사 하이빅데이터미디어
Publication of KR20230174141A publication Critical patent/KR20230174141A/ko

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/40Processing or translation of natural language
    • G06F40/58Use of machine translation, e.g. for multi-lingual retrieval, for server-side translation for client devices or for real-time translation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/70Information retrieval; Database structures therefor; File system structures therefor of video data
    • G06F16/73Querying
    • G06F16/732Query formulation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/70Information retrieval; Database structures therefor; File system structures therefor of video data
    • G06F16/73Querying
    • G06F16/738Presentation of query results
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/93Document management systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/237Lexical tools
    • G06F40/247Thesauruses; Synonyms
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/263Language identification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Data Mining & Analysis (AREA)
  • Artificial Intelligence (AREA)
  • Databases & Information Systems (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • General Health & Medical Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Mathematical Physics (AREA)
  • Multimedia (AREA)
  • Software Systems (AREA)
  • Business, Economics & Management (AREA)
  • General Business, Economics & Management (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Computation (AREA)
  • Medical Informatics (AREA)
  • Computing Systems (AREA)
  • Machine Translation (AREA)

Abstract

본 발명은 특정 분야 해외 논문 데이터베이스 기반 분야별 전문 용어 번역 및 학습 시스템에 관한 것으로, 일실시예에 따른 논문 데이터베이스 기반 분야별 전문 용어 번역 및 학습방법은 분야별로 적어도 하나 이상의 논문을 그룹핑하여 관리하는 단계, 검색어 및 분야정보를 입력받는 단계, 상기 입력된 검색어에 포함된 적어도 하나 이상의 단어를 추출하는 단계, 상기 입력된 분야정보로 적어도 하나 이상의 논문을 추출하는 단계, 및 상기 추출된 적어도 하나 이상의 논문에서, 상기 추출된 단어에 대응되는 번역 목표어를 선별하는 단계를 포함할 수 있다.

Description

논문에 대한 데이터베이스 기반의 분야별 전문 용어 번역 및 학습방법 및 시스템{Database-based technical terminology translation and learning methods and systems for overseas papers in specific fields}
본 발명은 특정 분야 해외 논문 데이터베이스 기반 분야별 전문 용어 번역 및 학습 시스템에 관한 것으로, 더욱 상세하게는 자연어 처리 기법을 통해 특정 분야 해외 논문들을 학습하여 논문 데이터베이스를 생성하고, 생성된 논문 데이터베이스와 기존 번역 시스템을 기반으로 논문에 사용하려는 한국어 전문 용어에 대응되는 적절한 번역 목표어로서, 영어, 일어, 중어 등을 추천해주고 해당 번역 목표어가 사용된 실제 예시 문장 및 논문 정보를 보여주고 논문 작성에 도움이 되는 학습 정보를 제공해주는 기술적 사상에 관한 것이다.
일반적으로 한국어 단어를 영어 단어로 번역하기 위해서는 영어 번역기 또는 영어 사전 검색을 사용하게 된다. 일반적인 영어 번역기에서 사용하는 단어들은 일상 회화 혹은 일반적인 문서를 번역하기 위한 용도로 일상에서 사용하는 일상용어를 기반으로 구성이 되어 있다.
영어 번역기의 경우 초기에는 영어 사전만을 기반으로 단순 단어 번역으로 번역이 이루어졌기 때문에 문장을 번역할 경우 어색하게 번역되는 경우가 있었지만 최근에는 일상에서 사용하는 문장 혹은 문구 자체를 번역 알고리즘에 학습시켜 최대한 전체 문장이 자연스럽게 번역이 이루어질 수 있게 알고리즘이 개선되고 있다. 이렇게 개선된 알고리즘에도 불구하고 논문과 같은 전문 용어를 주로 사용하는 문서를 번역함에 있어서는 올바르게 번역되지 않는 경우가 많다는 것이 현재 한영 번역 시스템의 문제라고 할 수 있다.
논문에 사용되는 용어는 전문 용어가 많아 문장에서 사용되는 위치나 방법이 일상 용어와 다른 경우가 존재한다. 이러한 경우 한국어 전문 용어를 적절한 용어로 번역했다고 하더라도 문장에 어떤 위치에 어떤 방식으로 사용되는지가 달라지기 때문에 적절하게 사용하기가 어렵다는 문제가 발생한다. 또한 동사나 형용사와 같이 전문 용어가 아니더라도 논문에서 자주 사용하고 사용하기를 추천하는 단어들이 정해져 있기 때문에 영어 번역기를 사용하게 되는 경우 번역된 문장 자체는 어색하지 않다고 하더라도 논문에 사용하기에는 적절하지 않은 단어로 번역되는 경우가 많다는 문제가 발생한다.
일반적으로 영어 학습 시스템의 경우 단순하게 단어 혹은 숙어를 학습할 수 있게 단어장과 같은 형태로 제공하거나 상시로 내가 가진 기기(PC 혹은 모바일)에 띄워두고 학습을 할 수 있는 위젯 형태로 제공하는 시스템과 영어 학습을 할 수 있는 강의형태의 동영상을 제공하여 원할 때 재생하여 학습할 수 있는 시스템, 이렇게 크게 2가지 형태의 시스템이 주로 사용된다.
영어 단어 혹은 숙어를 학습할 수 있게 단어장 형태로 제공되거나 위젯 형태로 상시로 학습할 수 있는 형태로 제공되는 시스템의 경우 사용자가 학습하고자 하는 단어 혹은 숙어를 언제든 쉽게 학습할 수 있지만 위젯 형태의 학습 방식은 매번 기기에 띄워져 있어 화면을 가리거나 기기 사용시 불편함을 느낄 수 있는 단점이 있고 단어장 형태의 제공 방식은 학습을 하고 싶을 때마다 앱 혹은 웹을 들어가 단어장을 실행해야하는 번거로움이 존재한다.
강의 동영상을 제공하는 학습 시스템의 경우 일반적으로 학습을 위해 앱 혹은 웹을 접속하여 학습하고자 하는 동영상을 선택하고 직접 실행해야 하는 번거로움이 존재하고 학습 영상의 길이가 길어 학습을 위해 투자해야 하는 시간이 길다는 단점이 있다.
한국등록특허 제1223987호 "동적 온톨로지를 이용한 관련어 제공 방법 및 시스템" 한국등록특허 제1769507호 "논문 교정 및 출판 편집 프로세스를 포함하는 논문 관리 방법 및 논문 관리 시스템"
본 발명은 각 분야별 해외 논문들을 직접 학습함으로써 논문에 사용하고자 하는 한국어 단어를 논문에서 자주 사용하는 적절한 번역 목표어로 번역하여 제공하고 해당 번역 목표어에 대한 학습 정보와 학습 동영상을 보다 편리하게 학습할 수 있는 시스템을 제공하는 것을 목적으로 한다.
일실시예에 따른 논문 데이터베이스 기반 분야별 전문 용어 번역 및 학습방법은 분야별로 적어도 하나 이상의 논문을 그룹핑하여 관리하는 단계, 검색어 및 분야정보를 입력받는 단계, 상기 입력된 검색어에 포함된 적어도 하나 이상의 단어를 추출하는 단계, 상기 입력된 분야정보로 적어도 하나 이상의 논문을 추출하는 단계, 및 상기 추출된 적어도 하나 이상의 논문에서, 상기 추출된 단어에 대응되는 번역 목표어를 선별하는 단계를 포함할 수 있다.
일실시예에 따른 상기 추출된 적어도 하나 이상의 논문에서, 상기 추출된 단어에 대응되는 번역 목표어를 선별하는 단계는, 상기 추출된 단어에 대응되는 번역 목표어가 있는지 여부를 판단하는 단계를 포함할 수 있다.
일실시예에 따른 논문 데이터베이스 기반 분야별 전문 용어 번역 및 학습방법은 상기 판단 결과, 상기 번역 목표어가 있는 경우에 상기 번역 목표어가 포함된 문장과, 해당 논문의 서지정보를 추출하여 제공하는 단계를 포함할 수 있다.
일실시예에 따른 논문 데이터베이스 기반 분야별 전문 용어 번역 및 학습방법은 상기 판단 결과, 상기 번역 목표어가 없는 경우에, 상기 추출된 단어에 대응되는 동의어를 선별하는 단계, 및 상기 추출된 적어도 하나 이상의 논문에서, 상기 선별된 동의어에 대응되는 번역 목표어를 선별하는 단계를 포함할 수 있다.
일실시예에 따른 상기 추출된 적어도 하나 이상의 논문에서, 상기 추출된 단어에 대응되는 번역 목표어를 선별하는 단계는, 상기 추출된 단어에 대응되는 상기 논문 상의 단어들 중에서, 유사도를 기준으로 임계값 이상의 유사도를 갖는 적어도 하나 이상의 단어를 상기 번역 목표어로 선별하는 단계를 포함할 수 있다.
일실시예에 따른 상기 추출된 적어도 하나 이상의 논문에서, 상기 추출된 단어에 대응되는 번역 목표어를 선별하는 단계는, 상기 추출된 단어에 대응되는 상기 논문 상의 단어들 중에서, 다른 사용자들에 의해 선택된 빈도를 기준으로 임계값 이상의 빈도를 갖는 적어도 하나 이상의 단어를 상기 번역 목표어로 선별하는 단계를 포함할 수 있다.
일실시예에 따른 상기 검색어 및 분야정보를 입력받는 단계는, 상기 검색어로서 문장을 입력받는 단계, 및 상기 문장에 포함된 복수의 단어들을 토큰별로 분리하는 단계를 포함하고, 상기 추출된 단어에 대응되는 번역 목표어를 선별하는 단계는, 상기 토큰별로 분리된 복수의 단어들을 이용하여, 분야별 논문 데이터베이스로부터 매칭되는 단어 개수를 카운팅하는 단계, 및 상기 카운팅된 개수를 고려하여, 논문 및 번역 목표어를 선별하는 단계를 포함할 수 있다.
일실시예에 따른 논문 데이터베이스 기반 분야별 전문 용어 번역 및 학습시스템은 분야별로 적어도 하나 이상의 논문을 그룹핑하여 관리하는 데이터베이스 관리부, 검색어 및 분야정보를 입력받는 입력부, 상기 입력된 검색어에 포함된 적어도 하나 이상의 단어를 추출하는 단어 추출부, 상기 입력된 분야정보로 적어도 하나 이상의 논문을 추출하는 논문 추출부, 및 상기 추출된 적어도 하나 이상의 논문에서, 상기 추출된 단어에 대응되는 번역 목표어를 선별하는 번역 목표어 선별처리부를 포함할 수 있다.
일실시예에 따른 번역 목표어 선별처리부는, 상기 추출된 단어에 대응되는 번역 목표어가 있는지 여부를 판단할 수 있다.
일실시예에 따른 상기 번역 목표어 선별처리부는, 상기 판단 결과, 상기 번역 목표어가 있는 경우에 상기 번역 목표어가 포함된 문장과, 해당 논문의 서지정보를 추출하여 제공하고, 상기 판단 결과, 상기 번역 목표어가 없는 경우에, 상기 추출된 단어에 대응되는 동의어를 선별하며, 상기 추출된 적어도 하나 이상의 논문에서, 상기 선별된 동의어에 대응되는 번역 목표어를 선별할 수 있다.
일실시예에 따른 상기 번역 목표어 선별처리부는, 상기 추출된 단어에 대응되는 상기 논문 상의 단어들 중에서, 유사도를 기준으로 임계값 이상의 유사도를 갖는 적어도 하나 이상의 단어를 상기 번역 목표어로 선별할 수 있다.
일실시예에 따른 상기 번역 목표어 선별처리부는, 상기 추출된 단어에 대응되는 상기 논문 상의 단어들 중에서, 다른 사용자들에 의해 선택된 빈도를 기준으로 임계값 이상의 빈도를 갖는 적어도 하나 이상의 단어를 상기 번역 목표어로 선별할 수 있다.
일실시예에 따른 상기 검색어 및 분야정보를 입력받는 입력부는, 상기 검색어로서 문장을 입력받고, 상기 문장에 포함된 복수의 단어들을 토큰별로 분리하며, 상기 번역 목표어 선별처리부는, 상기 토큰별로 분리된 복수의 단어들을 이용하여, 분야별 논문 데이터베이스로부터 매칭되는 단어 개수를 카운팅하고, 상기 카운팅된 개수를 고려하여, 논문 및 번역 목표어를 선별할 수 있다.
일실시예에 따르면, 대학의 연구자들이 논문의 전문 용어를 번역 목표어로 번역할 때 적절한 단어를 선택하는데 걸리는 시간이 단축시키고 논문 번역에서 발생하는 번역 오류를 최소화할 수 있다.
일실시예에 따르면, 해외 논문 작성에 도전하는 진입장벽이 낮아질 수 있다.
도 1은 특정 분야 해외 논문 데이터베이스 기반 분야별 전문 용어 번역 시스템 예시 화면을 설명하는 도면이다.
도 2는 특정 분야 해외 논문 데이터베이스 기반 분야별 전문 용어 번역 및 학습 시스템을 설명하는 도면이다.
도 3은 전문 용어 번역 시스템 프로세스를 설명하는 도면이다.
도 4는 분야별 논문 DB기반 번역 프로세스를 설명하는 도면이다.
도 5는 논문 데이터베이스 생성 시스템을 설명하는 도면이다.
도 6은 논문 데이터베이스 기반 분야별 전문 용어 번역 및 학습방법을 설명하는 도면이다.
도 7은 DB기반 번역의 세부 알고리즘 순서도를 설명하는 도면이다.
도 8은 DB기반 번역의 또 다른 세부 알고리즘 순서도를 설명하는 도면이다.
도 9는 동의어 검색 세부 알고리즘 순서도를 설명하는 도면이다.
도 10은 영상 학습을 기반으로 하는 넛지 기반 학습 시스템을 설명하는 도면이다.
도 11은 단어 학습을 기반으로 하는 넛지 기반 학습 시스템을 설명하는 도면이다.
도 12는 정확도 향상 프로세스를 설명하는 도면이다.
도 13은 논문 데이터베이스 기반 분야별 전문 용어 번역 및 학습시스템을 설명하는 도면이다.
본 명세서에 개시되어 있는 본 발명의 개념에 따른 실시예들에 대해서 특정한 구조적 또는 기능적 설명들은 단지 본 발명의 개념에 따른 실시예들을 설명하기 위한 목적으로 예시된 것으로서, 본 발명의 개념에 따른 실시예들은 다양한 형태로 실시될 수 있으며 본 명세서에 설명된 실시예들에 한정되지 않는다.
본 발명의 개념에 따른 실시예들은 다양한 변경들을 가할 수 있고 여러 가지 형태들을 가질 수 있으므로 실시예들을 도면에 예시하고 본 명세서에 상세하게 설명하고자 한다. 그러나, 이는 본 발명의 개념에 따른 실시예들을 특정한 개시형태들에 대해 한정하려는 것이 아니며, 본 발명의 사상 및 기술 범위에 포함되는 변경, 균등물, 또는 대체물을 포함한다.
제1 또는 제2 등의 용어를 다양한 구성요소들을 설명하는데 사용될 수 있지만, 상기 구성요소들은 상기 용어들에 의해 한정되어서는 안 된다. 상기 용어들은 하나의 구성요소를 다른 구성요소로부터 구별하는 목적으로만, 예를 들어 본 발명의 개념에 따른 권리 범위로부터 이탈되지 않은 채, 제1 구성요소는 제2 구성요소로 명명될 수 있고, 유사하게 제2 구성요소는 제1 구성요소로도 명명될 수 있다.
어떤 구성요소가 다른 구성요소에 "연결되어" 있다거나 "접속되어" 있다고 언급된 때에는, 그 다른 구성요소에 직접적으로 연결되어 있거나 또는 접속되어 있을 수도 있지만, 중간에 다른 구성요소가 존재할 수도 있다고 이해되어야 할 것이다. 반면에, 어떤 구성요소가 다른 구성요소에 "직접 연결되어" 있다거나 "직접 접속되어" 있다고 언급된 때에는, 중간에 다른 구성요소가 존재하지 않는 것으로 이해되어야 할 것이다. 구성요소들 간의 관계를 설명하는 표현들, 예를 들어 "~사이에"와 "바로~사이에" 또는 "~에 직접 이웃하는" 등도 마찬가지로 해석되어야 한다.
본 명세서에서 사용한 용어는 단지 특정한 실시예들을 설명하기 위해 사용된 것으로, 본 발명을 한정하려는 의도가 아니다. 단수의 표현은 문맥상 명백하게 다르게 뜻하지 않는 한, 복수의 표현을 포함한다. 본 명세서에서, "포함하다" 또는 "가지다" 등의 용어는 설시된 특징, 숫자, 단계, 동작, 구성요소, 부분품 또는 이들을 조합한 것이 존재함으로 지정하려는 것이지, 하나 또는 그 이상의 다른 특징들이나 숫자, 단계, 동작, 구성요소, 부분품 또는 이들을 조합한 것들의 존재 또는 부가 가능성을 미리 배제하지 않는 것으로 이해되어야 한다.
다르게 정의되지 않는 한, 기술적이거나 과학적인 용어를 포함해서 여기서 사용되는 모든 용어들은 본 발명이 속하는 기술 분야에서 통상의 지식을 가진 자에 의해 일반적으로 이해되는 것과 동일한 의미를 가진다. 일반적으로 사용되는 사전에 정의되어 있는 것과 같은 용어들은 관련 기술의 문맥상 가지는 의미와 일치하는 의미를 갖는 것으로 해석되어야 하며, 본 명세서에서 명백하게 정의하지 않는 한, 이상적이거나 과도하게 형식적인 의미로 해석되지 않는다.
이하, 실시예들을 첨부된 도면을 참조하여 상세하게 설명한다. 그러나, 특허출원의 범위가 이러한 실시예들에 의해 제한되거나 한정되는 것은 아니다. 각 도면에 제시된 동일한 참조 부호는 동일한 부재를 나타낸다.
도 1은 특정 분야 해외 논문 데이터베이스 기반 분야별 전문 용어 번역 시스템 예시 화면을 설명하는 도면(100)이다.
도 1은 특정 분야 해외 논문 데이터베이스 기반 분야별 전문 용어 번역 시스템의 실행 화면이다. 사용자가 번역하기 원하는 한국어 단어를 입력하면 전문 용어 번역 시스템을 통해 번역 목표어를 제공하고 번역 목표어 및 번역 목표어가 사용된 실제 문장 예시와 함께 관련된 논문 정보를 제공한다.
도 1에서는 "민영화"의 검색어를 입력하고, 해당 검색어와 입력된 분야정보에 대응되는 논문에 포함됨 번역 목표어가 "privatization"을 선별됨을 나타낸다.
또한, 번역 목표어가 포함된 논문의 서지사항과, 관련 문장들이 검색결과로 표시될 수 있다.
특정 분야 해외 논문 데이터베이스 기반 분야별 전문 용어 번역 시스템의 의사코드는 문장과 분야를 입력하면 번역기 함수가 작동하여 문장 번역이 이루어지고 토큰화 함수가 작동하여 번역된 문장을 단어별로 토큰화할 수 있다.
또한, 토큰화된 단어들은 반복문을 통해 각 단어별로 입력된 분야에 해당하는 DB에서 단어를 검색하는 DB검색함수가 작동한다.
검색을 통해 찾은 문장이 있는 경우 해당 문장과 사용된 논문의 서지정보를 추출한다. 검색 결과가 없는 경우 동의어 검색 함수가 작동하여 동의어를 찾아 해당 동의어를 다시 DB검색함수에 매개변수로 넣어 함수를 실행하여 결과를 추출한다. 반복이 종료된 후 최종적으로 추출한 단어, 단어별 검색횟수, 사용된 문장, 논문정보 등을 출력한다.
도 2는 전문 용어 번역 시스템 프로세스를 설명하는 도면(200)이다.
도 2는 특정 분야 해외 논문 데이터베이스 기반 분야별 전문 용어 번역 및 학습에 대한 전체 시스템 흐름도이다. 사용자가 번역 및 학습을 위한 입력값을 입력하면 해당 시스템에서 번역 목표어 및 학습 정보가 담긴 출력값을 사용자에게 제공한다.
도 3은 분야별 논문 DB기반 번역 프로세스를 설명하는 도면(300)이다.
도 3은 전문 용어 번역에 대한 전반적인 시스템 흐름도 이다. 사용자가 번역하기 원하는 한국어 단어 혹은 문장을 입력하고 번역하고자 하는 전문 분야를 선택하면 분야별 DB기반 번역 시스템 내부에서 프로세스가 작동하여 결과를 출력하는데 번역 목표어가 없다면 해당 한국어 단어는 논문에서 사용하지 않는 단어이거나 잘못된 단어로 결과 없음을 출력하며, 번역 목표어가 있다면 번역 목표어와 함께 번역 목표어가 사용된 문장, 사용 횟수, 사용된 논문 정보 등 관련 정보를 제공한다.
도 4는 논문 데이터베이스 생성 시스템을 설명하는 도면(400)이다.
도 4는 분야별 논문 DB기반 번역 시스템의 세부 흐름도이다. 문장 또는 단어가 입력이 되면 번역기를 통해 번역이 진행되고 번역된 결과를 텍스트 마이닝 기법을 통해 단어 토큰화를 진행하여 단어별로 분리하여 DB에 검색하게 된다. 각 단어들을 분야별 논문 데이터베이스에서 단어가 포함된 문장을 검색하여 DB내에서 검색된 단어의 사용 횟수와 단어가 사용된 문장 중 날짜 기준 가장 최근 논문의 문장 10개, 해당 문장이 사용된 논문의 서지 정보 등을 출력하게 되는데 만약 검색 결과가 없다면 동의어 검색 시스템을 통해 동의어를 검색하여 해당 동의어를 분야별 논문 데이터베이스에서 재검색하여 결과를 출력한다.
도 5는 분야별 논문 데이터베이스를 생성하는 시스템 흐름도(500)이다. 해외 분야별 학술지 및 각종 학회에서 얻을 수 있는 해외 논문 데이터를 학습하여 데이터베이스화에 용이하게 텍스트 전처리 과정을 거친 후 자연어 처리(텍스트 마이닝) 기법을 사용하여 문장 토큰화를 진행하여 해외 논문에 사용된 문장들을 데이터베이스로 만든다.
도 6은 논문 데이터베이스 기반 분야별 전문 용어 번역 및 학습방법을 설명하는 도면이다.
도 6은 전문 용어 번역 시스템의 알고리즘 순서도이다. 전문 용어 번역 시스템은 입력값에 따라 2가지 알고리즘으로 작동하게 된다.
검색어는 문장 또는 단어를 모두 포함하는 것으로서, 문장이나 단어가 각각 입력될 수 있다(601).
문장을 입력했을 경우 작동하는 알고리즘은 논문 번역 시스템이 시작되면 번역할 문장을 입력하고 분야를 선택하게 되면(602), DB기반 번역 알고리즘이 작동하게 되고(603) 해당 알고리즘을 통해 결과가 나오게 되면 단어(번역 목표어) 단어 사용횟수를 판단할 수 있다(604).
단어 사용횟수를 판단 결과, 사용 횟수에 따라 1개 이상 사용된 단어는 해당 단어와 사용 횟수, 단어가 사용된 최신 문장 10개와 논문 서지 정보를 제공하게 되고(605), 사용 횟수가 0개이면 검색 결과 없음(606)을 출력하면서 논문 번역 시스템이 종료된다.
단어를 입력했을 경우 작동하는 알고리즘의 경우 논문 번역 시스템이 시작되면 번역할 단어를 입력하고 분야를 선택하게 되면 DB기반 번역 알고리즘이 작동하게 되고 해당 알고리즘을 통해 결과가 나오게 되면 단어(번역 목표어) 사용 횟수에 따라 1개 이상 사용된 단어는 해당 단어와 사용 횟수, 단어가 사용된 최신 문장 10개와 논문 서지 정보를 제공하게 되고 사용 횟수가 0개이면 검색 결과 없음을 출력하면서 논문 번역 시스템이 종료된다.
논문 데이터베이스 기반 분야별 전문 용어 번역 및 학습방법은 분야별로 적어도 하나 이상의 논문을 그룹핑하여 관리할 수 있다.
또한, 검색어 및 분야정보를 입력받는 경우, 입력된 검색어에 포함된 적어도 하나 이상의 단어를 추출하고, 입력된 분야정보로 적어도 하나 이상의 논문을 추출할 수 있다.
또한, 논문 데이터베이스 기반 분야별 전문 용어 번역 및 학습방법은 추출된 적어도 하나 이상의 논문에서, 상기 추출된 단어에 대응되는 번역 목표어를 선별할 수 있다.
논문 데이터베이스 기반 분야별 전문 용어 번역 및 학습방법은 추출된 적어도 하나 이상의 논문에서, 상기 추출된 단어에 대응되는 번역 목표어를 선별하기 위해, 추출된 단어에 대응되는 번역 목표어가 있는지 여부를 판단할 수 있다.
논문 데이터베이스 기반 분야별 전문 용어 번역 및 학습방법은 상기 판단 결과, 상기 번역 목표어가 있는 경우에 상기 번역 목표어가 포함된 문장과, 해당 논문의 서지정보를 추출하여 제공할 수 있다.
또한, 논문 데이터베이스 기반 분야별 전문 용어 번역 및 학습방법은 판단 결과, 상기 번역 목표어가 없는 경우에, 상기 추출된 단어에 대응되는 동의어를 선별할 수 있다.
또한, 추출된 적어도 하나 이상의 논문에서, 상기 선별된 동의어에 대응되는 번역 목표어를 선별할 수 있다.
추출된 적어도 하나 이상의 논문에서, 상기 추출된 단어에 대응되는 번역 목표어를 선별하기 위해서는, 추출된 단어에 대응되는 상기 논문 상의 단어들 중에서, 유사도를 기준으로 임계값 이상의 유사도를 갖는 적어도 하나 이상의 단어를 상기 번역 목표어로 선별할 수 있다.
일실시예에 따르면, 추출된 적어도 하나 이상의 논문에서, 상기 추출된 단어에 대응되는 번역 목표어를 선별하기 위해서는, 추출된 단어에 대응되는 상기 논문 상의 단어들 중에서, 다른 사용자들에 의해 선택된 빈도를 기준으로 임계값 이상의 빈도를 갖는 적어도 하나 이상의 단어를 번역 목표어로 선별할 수 있다.
논문 데이터베이스 기반 분야별 전문 용어 번역 및 학습방법은 검색어 및 분야정보를 입력받기 위해, 검색어로서 문장을 입력받고, 문장에 포함된 복수의 단어들을 토큰별로 분리할 수 있다.
또한, 추출된 단어에 대응되는 번역 목표어를 선별하기 위해, 토큰별로 분리된 복수의 단어들을 이용하여, 분야별 논문 데이터베이스로부터 매칭되는 단어 개수를 카운팅하고, 카운팅된 개수를 고려하여, 논문 및 번역 목표어를 선별할 수 있다.
도 7은 DB기반 번역의 세부 알고리즘 순서도를 설명하는 도면이다.
도 7은 DB기반 번역 세부 알고리즘 순서도이다. 문장이 입력되게 되면 번역기를 통해 문장 번역이 실행된다(701).
이후, 번역 결과를 텍스트 마이닝 기법 중 단어 토큰화 기법을 통해 단어별로 분리한다(702).
해당 단어들을 각 단어별로 단어가 포함된 문장을 DB에서 검색할 수 있다(703).
이 과정에서, 검색여부를 판단할 수 있는데(704), 검색 여부에 따라 검색결과가 없으면 동의어 검색을 통해 동의어를 찾아 해당 동의어로 다시 DB에서 문장을 검색할 수 있다(706).
검색 여부에 따라 검색결과가 있으면 단어가 사용된 문장과 사용 횟수, 논문 서지정보 등을 최종결과로 출력하게 된다(705). 동의어 검색을 진행한 후에도 검색결과가 없으면 결과없음으로 최종 결과로 출력하게 된다(707).
도 8은 DB기반 번역의 또 다른 세부 알고리즘 순서도를 설명하는 도면이다.
도 8은 DB기반 번역 세부 알고리즘 순서도이다.
문장이 입력되게 되면 번역기를 통해 단어 번역이 실행된다(801).
번역되어 나온 단어가 포함된 문장을 DB에서 검색하게 되고(802), 검색 여부를 판단하여(803), 검색결과가 없으면 동의어 검색을 통해 동의어를 찾아 해당 동의어로 다시 DB에서 문장을 검색하여 단어가 사용된 문장과 사용 횟수, 논문 서지정보 등을 최종결과로 출력하게 된다(804). 동의어 검색을 진행한 후에도 검색결과가 없으면 결과없음으로 최종 결과로 출력하게 된다(805).
도 9는 동의어 검색 세부 알고리즘 순서도를 설명하는 도면이다.
도 9는 동의어 검색 세부 알고리즘 순서도이다.
DB기반 번역 프로세스에서 입력된 단어가 논문 데이터베이스에서 매칭이 되지 않는 경우 동의어 사전에서 동의어를 사전 검색할 수 있다(901).
이후, 동의어 사전 검색 진행여부에 대한 판단 후(902), 매칭되지 않은 입력 단어를 동의어 사전에서 검색하여 동의어를 추출하는데 이미 한번 동의어 사전 검색을 진행한 경우에는 검색결과 없음을 출력하고(903) 처음 동의어 사전 검색을 진행하는 경우에는 사전 검색 결과를 출력하게 된다(904).
도 10은 영상 학습을 기반으로 하는 넛지 기반 학습 시스템을 설명하는 도면(1000)이다.
도 10은 넛지 기반 학습 시스템 중 영상 학습에 대한 도식이다. 단어별 영상 학습 DB에서 전문 용어 번역 시스템을 통해 번역된 번역 목표어를 검색하여 해당 단어에 대한 학습 영상을 재생목록에 추가한다.
재생목록에 추가된 영상들은 두 가지 방식으로 학습할 수 있게 제공할 수 있다.
첫 번째 방식은 실행 중인 시스템에서 바로 실행하여 재생할 수 있는 바로 재생 방식이고 두 번째 방식은 실행하고 싶은 주기, 시간 등을 설정하여 설정한 시간동안 원하는 주기로 영상을 짧게 학습 할 수 있는 넛지 방식이다.
도 11은 단어 학습을 기반으로 하는 넛지 기반 학습 시스템을 설명하는 도면(1100)이다.
도면 12은 넛지 기반 학습 시스템 중 단어 학습에 대한 도식이다.
단어별 학습 정보 DB에서 전문용어 번역 시스템을 통해 번역된 번역 목표어를 검색하여 해당 단어에 대한 학습 정보를 학습하고 싶은 주기, 시간 등을 설정하여 설정된 시간동안 원하는 주기로 학습 정보를 볼 수 있는 넛지 방식으로 제공한다.
도 12는 정확도 향상 프로세스를 설명하는 도면(1200)이다.
도 12는 번역 정확도 향상을 위한 프로세스 도식이다.
최종 타겟 단어 리스트로 선정되어 출력된 단어들 중 사용자에 의하여 최종 선택된 단어의 선택 여부를 논문 데이터베이스에 반영하여 단어 선택 횟수를 추가하고 단어별 새로운 가중치를 부여한다. 기존 빈도수를 기반으로 생성한 가중치와 새로운 가중치를 결합하여 향상된 가중치를 생성한다.
이후 번역 시스템 작동 시 향상된 가중치를 반영하여 최종 타겟 단어 리스트의 정확도를 향상시킨다.
도 13은 논문 데이터베이스 기반 분야별 전문 용어 번역 및 학습시스템(1300)을 설명하는 도면이다.
일실시예에 따르면, 대학의 연구자들이 논문의 전문 용어를 번역 목표어로 번역할 때 적절한 단어를 선택하는데 걸리는 시간이 단축시키고 논문 번역에서 발생하는 번역 오류를 최소화할 수 있다. 또한, 해외 논문 작성에 도전하는 진입장벽이 낮아질 수 있다.
이를 위해, 논문 데이터베이스 기반 분야별 전문 용어 번역 및 학습시스템(1300)은 데이터베이스 관리부(1310), 입력부(1320), 단어 추출부 (1330), 논문 추출부 (1340), 번역 목표어 선별처리부 (1350), 및 제어부(1360)를 포함할 수 있다.
데이터베이스 관리부(1310)는 분야별로 적어도 하나 이상의 논문을 그룹핑하여 관리할 수 있다.
입력부(1320)는 검색어 및 분야정보를 입력받을 수 있다.
단어 추출부(1330)는 입력된 검색어에 포함된 적어도 하나 이상의 단어를 추출할 수 있다.
논문 추출부 (1340)는 입력된 분야정보로 적어도 하나 이상의 논문을 추출할 수 있다.
번역 목표어 선별처리부(1350)는 추출된 적어도 하나 이상의 논문에서, 상기 추출된 단어에 대응되는 번역 목표어를 선별할 수 있다.
특히, 입력부(1320)는 검색어로서 문장을 입력받고, 문장에 포함된 복수의 단어들을 토큰별로 분리할 수 있다.
이 경우에 번역 목표어 선별처리부(1350)는 토큰별로 분리된 복수의 단어들을 이용하여, 분야별 논문 데이터베이스로부터 매칭되는 단어 개수를 카운팅하고, 상기 카운팅된 개수를 고려하여, 논문 및 번역 목표어를 선별할 수 있다.
제어부(1360)는 각 구성요소들 간 데이터 또는 명령어를 송수신하거나, 명령어를 생성하여 각 구성요소들에 제공하는 컨트롤러 역할을 수행할 수 있다.
번역 목표어 선별처리부(1350)는 추출된 단어에 대응되는 번역 목표어가 있는지 여부를 판단할 수 있다.
또한, 판단 결과, 상기 번역 목표어가 있는 경우에 상기 번역 목표어가 포함된 문장과, 해당 논문의 서지정보를 추출하여 제공하고, 상기 판단 결과, 상기 번역 목표어가 없는 경우에, 상기 추출된 단어에 대응되는 동의어를 선별하며, 상기 추출된 적어도 하나 이상의 논문에서, 상기 선별된 동의어에 대응되는 번역 목표어를 선별할 수 있다.
또한, 번역 목표어 선별처리부(1350)는 추출된 단어에 대응되는 상기 논문 상의 단어들 중에서, 유사도를 기준으로 임계값 이상의 유사도를 갖는 적어도 하나 이상의 단어를 상기 번역 목표어로 선별할 수 있다.
번역 목표어 선별처리부(1350)는 추출된 단어에 대응되는 상기 논문 상의 단어들 중에서, 다른 사용자들에 의해 선택된 빈도를 기준으로 임계값 이상의 빈도를 갖는 적어도 하나 이상의 단어를 상기 번역 목표어로 선별할 수 있다.
이상에서 설명된 장치는 하드웨어 구성요소, 소프트웨어 구성요소, 및/또는 하드웨어 구성요소 및 소프트웨어 구성요소의 조합으로 구현될 수 있다. 예를 들어, 실시예들에서 설명된 장치 및 구성요소는, 예를 들어, 프로세서, 콘트롤러, ALU(arithmetic logic unit), 디지털 신호 프로세서(digital signal processor), 마이크로컴퓨터, FPA(field programmable array), PLU(programmable logic unit), 마이크로프로세서, 또는 명령(instruction)을 실행하고 응답할 수 있는 다른 어떠한 장치와 같이, 하나 이상의 범용 컴퓨터 또는 특수 목적 컴퓨터를 이용하여 구현될 수 있다. 처리 장치는 운영 체제(OS) 및 상기 운영 체제 상에서 수행되는 하나 이상의 소프트웨어 애플리케이션을 수행할 수 있다. 또한, 처리 장치는 소프트웨어의 실행에 응답하여, 데이터를 접근, 저장, 조작, 처리 및 생성할 수도 있다. 이해의 편의를 위하여, 처리 장치는 하나가 사용되는 것으로 설명된 경우도 있지만, 해당 기술분야에서 통상의 지식을 가진 자는, 처리 장치가 복수 개의 처리 요소(processing element) 및/또는 복수 유형의 처리 요소를 포함할 수 있음을 알 수 있다. 예를 들어, 처리 장치는 복수 개의 프로세서 또는 하나의 프로세서 및 하나의 콘트롤러를 포함할 수 있다. 또한, 병렬 프로세서(parallel processor)와 같은, 다른 처리 구성(processing configuration)도 가능하다.
소프트웨어는 컴퓨터 프로그램(computer program), 코드(code), 명령(instruction), 또는 이들 중 하나 이상의 조합을 포함할 수 있으며, 원하는 대로 동작하도록 처리 장치를 구성하거나 독립적으로 또는 결합적으로(collectively) 처리 장치를 명령할 수 있다. 소프트웨어 및/또는 데이터는, 처리 장치에 의하여 해석되거나 처리 장치에 명령 또는 데이터를 제공하기 위하여, 어떤 유형의 기계, 구성요소(component), 물리적 장치, 가상 장치(virtual equipment), 컴퓨터 저장 매체 또는 장치, 또는 전송되는 신호 파(signal wave)에 영구적으로, 또는 일시적으로 구체화(embody)될 수 있다. 소프트웨어는 네트워크로 연결된 컴퓨터 시스템 상에 분산되어서, 분산된 방법으로 저장되거나 실행될 수도 있다. 소프트웨어 및 데이터는 하나 이상의 컴퓨터 판독 가능 기록 매체에 저장될 수 있다.
실시예에 따른 방법은 다양한 컴퓨터 수단을 통하여 수행될 수 있는 프로그램 명령 형태로 구현되어 컴퓨터 판독 가능 매체에 기록될 수 있다. 상기 컴퓨터 판독 가능 매체는 프로그램 명령, 데이터 파일, 데이터 구조 등을 단독으로 또는 조합하여 포함할 수 있다. 상기 매체에 기록되는 프로그램 명령은 실시예를 위하여 특별히 설계되고 구성된 것들이거나 컴퓨터 소프트웨어 당업자에게 공지되어 사용 가능한 것일 수도 있다. 컴퓨터 판독 가능 기록 매체의 예에는 하드 디스크, 플로피 디스크 및 자기 테이프와 같은 자기 매체(magnetic media), CD-ROM, DVD와 같은 광기록 매체(optical media), 플롭티컬 디스크(floptical disk)와 같은 자기-광 매체(magneto-optical media), 및 롬(ROM), 램(RAM), 플래시 메모리 등과 같은 프로그램 명령을 저장하고 수행하도록 특별히 구성된 하드웨어 장치가 포함된다. 프로그램 명령의 예에는 컴파일러에 의해 만들어지는 것과 같은 기계어 코드뿐만 아니라 인터프리터 등을 사용해서 컴퓨터에 의해서 실행될 수 있는 고급 언어 코드를 포함한다. 상기된 하드웨어 장치는 실시예의 동작을 수행하기 위해 하나 이상의 소프트웨어 모듈로서 작동하도록 구성될 수 있으며, 그 역도 마찬가지이다.
이상과 같이 실시예들이 비록 한정된 도면에 의해 설명되었으나, 해당 기술분야에서 통상의 지식을 가진 자라면 상기의 기재로부터 다양한 수정 및 변형이 가능하다. 예를 들어, 설명된 기술들이 설명된 방법과 다른 순서로 수행되거나, 및/또는 설명된 시스템, 구조, 장치, 회로 등의 구성요소들이 설명된 방법과 다른 형태로 결합 또는 조합되거나, 다른 구성요소 또는 균등물에 의하여 대치되거나 치환되더라도 적절한 결과가 달성될 수 있다.
그러므로, 다른 구현들, 다른 실시예들 및 특허청구범위와 균등한 것들도 후술하는 특허청구범위의 범위에 속한다.

Claims (13)

  1. 분야별로 적어도 하나 이상의 논문을 그룹핑하여 관리하는 단계;
    검색어 및 분야정보를 입력받는 단계;
    상기 입력된 검색어에 포함된 적어도 하나 이상의 단어를 추출하는 단계;
    상기 입력된 분야정보로 적어도 하나 이상의 논문을 추출하는 단계; 및
    상기 추출된 적어도 하나 이상의 논문에서, 상기 추출된 단어에 대응되는 번역 목표어를 선별하는 단계
    를 포함하는 논문 데이터베이스 기반 분야별 전문 용어 번역 및 학습방법.
  2. 제1항에 있어서,
    상기 추출된 적어도 하나 이상의 논문에서, 상기 추출된 단어에 대응되는 번역 목표어를 선별하는 단계는,
    상기 추출된 단어에 대응되는 번역 목표어가 있는지 여부를 판단하는 단계
    를 포함하는 논문 데이터베이스 기반 분야별 전문 용어 번역 및 학습방법.
  3. 제2항에 있어서,
    상기 판단 결과, 상기 번역 목표어가 있는 경우에 상기 번역 목표어가 포함된 문장과, 해당 논문의 서지정보를 추출하여 제공하는 단계
    를 포함하는 논문 데이터베이스 기반 분야별 전문 용어 번역 및 학습방법.
  4. 제1항에 있어서,
    상기 판단 결과, 상기 번역 목표어가 없는 경우에, 상기 추출된 단어에 대응되는 동의어를 선별하는 단계; 및
    상기 추출된 적어도 하나 이상의 논문에서, 상기 선별된 동의어에 대응되는 번역 목표어를 선별하는 단계
    를 포함하는 논문 데이터베이스 기반 분야별 전문 용어 번역 및 학습방법.
  5. 제1항에 있어서,
    상기 추출된 적어도 하나 이상의 논문에서, 상기 추출된 단어에 대응되는 번역 목표어를 선별하는 단계는,
    상기 추출된 단어에 대응되는 상기 논문 상의 단어들 중에서, 유사도를 기준으로 임계값 이상의 유사도를 갖는 적어도 하나 이상의 단어를 상기 번역 목표어로 선별하는 단계
    를 포함하는 것을 특징으로 하는 논문 데이터베이스 기반 분야별 전문 용어 번역 및 학습방법.
  6. 제1항에 있어서,
    상기 추출된 적어도 하나 이상의 논문에서, 상기 추출된 단어에 대응되는 번역 목표어를 선별하는 단계는,
    상기 추출된 단어에 대응되는 상기 논문 상의 단어들 중에서, 다른 사용자들에 의해 선택된 빈도를 기준으로 임계값 이상의 빈도를 갖는 적어도 하나 이상의 단어를 상기 번역 목표어로 선별하는 단계
    를 포함하는 것을 특징으로 하는 논문 데이터베이스 기반 분야별 전문 용어 번역 및 학습방법.
  7. 제1항에 있어서,
    상기 검색어 및 분야정보를 입력받는 단계는,
    상기 검색어로서 문장을 입력받는 단계;
    상기 문장에 포함된 복수의 단어들을 토큰별로 분리하는 단계
    를 포함하고,
    상기 추출된 단어에 대응되는 번역 목표어를 선별하는 단계는,
    상기 토큰별로 분리된 복수의 단어들을 이용하여, 분야별 논문 데이터베이스로부터 매칭되는 단어 개수를 카운팅하는 단계; 및
    상기 카운팅된 개수를 고려하여, 논문 및 번역 목표어를 선별하는 단계
    를 포함하는 논문 데이터베이스 기반 분야별 전문 용어 번역 및 학습방법.
  8. 분야별로 적어도 하나 이상의 논문을 그룹핑하여 관리하는 데이터베이스 관리부;
    검색어 및 분야정보를 입력받는 입력부;
    상기 입력된 검색어에 포함된 적어도 하나 이상의 단어를 추출하는 단어 추출부;
    상기 입력된 분야정보로 적어도 하나 이상의 논문을 추출하는 논문 추출부; 및
    상기 추출된 적어도 하나 이상의 논문에서, 상기 추출된 단어에 대응되는 번역 목표어를 선별하는 번역 목표어 선별처리부
    를 포함하는 논문 데이터베이스 기반 분야별 전문 용어 번역 및 학습시스템.
  9. 제8항에 있어서,
    상기 추출된 적어도 하나 이상의 논문에서, 상기 추출된 단어에 대응되는 번역 목표어를 선별하는 번역 목표어 선별처리부는,
    상기 추출된 단어에 대응되는 번역 목표어가 있는지 여부를 판단하는 것을 특징으로 하는 논문 데이터베이스 기반 분야별 전문 용어 번역 및 학습시스템.
  10. 제9항에 있어서,
    상기 번역 목표어 선별처리부는,
    상기 판단 결과, 상기 번역 목표어가 있는 경우에 상기 번역 목표어가 포함된 문장과, 해당 논문의 서지정보를 추출하여 제공하고,
    상기 판단 결과, 상기 번역 목표어가 없는 경우에, 상기 추출된 단어에 대응되는 동의어를 선별하며, 상기 추출된 적어도 하나 이상의 논문에서, 상기 선별된 동의어에 대응되는 번역 목표어를 선별하는 것을 특징으로 하는 논문 데이터베이스 기반 분야별 전문 용어 번역 및 학습시스템.
  11. 제8항에 있어서,
    상기 번역 목표어 선별처리부는,
    상기 추출된 단어에 대응되는 상기 논문 상의 단어들 중에서, 유사도를 기준으로 임계값 이상의 유사도를 갖는 적어도 하나 이상의 단어를 상기 번역 목표어로 선별하는 것을 특징으로 하는 논문 데이터베이스 기반 분야별 전문 용어 번역 및 학습시스템.
  12. 제8항에 있어서,
    상기 번역 목표어 선별처리부는,
    상기 추출된 단어에 대응되는 상기 논문 상의 단어들 중에서, 다른 사용자들에 의해 선택된 빈도를 기준으로 임계값 이상의 빈도를 갖는 적어도 하나 이상의 단어를 상기 번역 목표어로 선별하는 것을 특징으로 하는 논문 데이터베이스 기반 분야별 전문 용어 번역 및 학습시스템.
  13. 제8항에 있어서,
    상기 검색어 및 분야정보를 입력받는 입력부는,
    상기 검색어로서 문장을 입력받고,
    상기 문장에 포함된 복수의 단어들을 토큰별로 분리하며,
    상기 번역 목표어 선별처리부는,
    상기 토큰별로 분리된 복수의 단어들을 이용하여, 분야별 논문 데이터베이스로부터 매칭되는 단어 개수를 카운팅하고, 상기 카운팅된 개수를 고려하여, 논문 및 번역 목표어를 선별하는 것을 특징으로 하는 논문 데이터베이스 기반 분야별 전문 용어 번역 및 학습시스템.
KR1020230016673A 2022-06-20 2023-02-08 논문에 대한 데이터베이스 기반의 분야별 전문 용어 번역 및 학습방법 및 시스템 KR20230174141A (ko)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
KR20220074676 2022-06-20
KR1020220074676 2022-06-20

Publications (1)

Publication Number Publication Date
KR20230174141A true KR20230174141A (ko) 2023-12-27

Family

ID=89378232

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020230016673A KR20230174141A (ko) 2022-06-20 2023-02-08 논문에 대한 데이터베이스 기반의 분야별 전문 용어 번역 및 학습방법 및 시스템

Country Status (1)

Country Link
KR (1) KR20230174141A (ko)

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101223987B1 (ko) 2010-08-31 2013-01-24 대한민국 동적 온톨로지를 이용한 관련어 제공 방법 및 시스템

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101223987B1 (ko) 2010-08-31 2013-01-24 대한민국 동적 온톨로지를 이용한 관련어 제공 방법 및 시스템

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
한국등록특허 제1769507호 "논문 교정 및 출판 편집 프로세스를 포함하는 논문 관리 방법 및 논문 관리 시스템"

Similar Documents

Publication Publication Date Title
Xiao et al. Corpus-based studies of translational Chinese in English-Chinese translation
McEnery et al. Corpus linguistics: Method, theory and practice
RU2579699C2 (ru) Разрешение семантической неоднозначности при помощи не зависящей от языка семантической структуры
JP2013502643A (ja) 構造化データ翻訳装置、システム及び方法
US9600469B2 (en) Method for detecting grammatical errors, error detection device for same and computer-readable recording medium having method recorded thereon
Chouigui et al. An arabic multi-source news corpus: Experimenting on single-document extractive summarization
Mutuvi et al. Evaluating the impact of OCR errors on topic modeling
Chen et al. A study of language modeling for Chinese spelling check
Sameen et al. Measuring short text reuse for the Urdu language
Abdallah et al. Multi-domain evaluation framework for named entity recognition tools
JP2018147238A (ja) 発想支援装置及び発想支援方法
Marton Distributional phrasal paraphrase generation for statistical machine translation
Pinnis Latvian and Lithuanian named entity recognition with TildeNER
KR20230174141A (ko) 논문에 대한 데이터베이스 기반의 분야별 전문 용어 번역 및 학습방법 및 시스템
Malik et al. Urdu to English machine translation using bilingual evaluation understudy
US8965750B2 (en) Acquiring accurate machine translation
Singh et al. Query relational databases in Punjabi language
Rofiq Indonesian news extractive text summarization using latent semantic analysis
Rabinovich et al. A parallel corpus of translationese
Dandashi et al. Arabic named entity recognition—a survey and analysis
Baldwin et al. Restoring punctuation and casing in English text
Ak et al. Unsupervised morphological analysis using tries
Babhulgaonkar et al. Experimenting with factored language model and generalized back-off for Hindi
JP6451151B2 (ja) 質問応答装置、質問応答方法、プログラム
Jang et al. Improving document clustering by eliminating unnatural language