KR102390009B1 - Ai기반 구문분석 연구노트 생성 시스템 - Google Patents

Ai기반 구문분석 연구노트 생성 시스템 Download PDF

Info

Publication number
KR102390009B1
KR102390009B1 KR1020200187789A KR20200187789A KR102390009B1 KR 102390009 B1 KR102390009 B1 KR 102390009B1 KR 1020200187789 A KR1020200187789 A KR 1020200187789A KR 20200187789 A KR20200187789 A KR 20200187789A KR 102390009 B1 KR102390009 B1 KR 102390009B1
Authority
KR
South Korea
Prior art keywords
data
research
note
user
unit
Prior art date
Application number
KR1020200187789A
Other languages
English (en)
Inventor
추철민
황혜진
차기벽
안진범
권승훈
Original Assignee
추철민
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 추철민 filed Critical 추철민
Priority to KR1020200187789A priority Critical patent/KR102390009B1/ko
Application granted granted Critical
Publication of KR102390009B1 publication Critical patent/KR102390009B1/ko

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/166Editing, e.g. inserting or deleting
    • G06F40/174Form filling; Merging
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/31Indexing; Data structures therefor; Storage structures
    • G06F16/316Indexing structures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/35Clustering; Classification
    • G06F16/353Clustering; Classification into predefined classes
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/103Formatting, i.e. changing of presentation of documents
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/12Use of codes for handling textual entities
    • G06F40/151Transformation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/205Parsing
    • G06F40/211Syntactic parsing, e.g. based on context-free grammar [CFG] or unification grammars
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/237Lexical tools
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/268Morphological analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/279Recognition of textual entities
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Artificial Intelligence (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Software Systems (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Evolutionary Computation (AREA)
  • Biophysics (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Biomedical Technology (AREA)
  • Machine Translation (AREA)

Abstract

본 발명의 일 실시례에 따른 AI기반 구문분석 연구노트 생성 시스템은, 사용자가 수집한 논문, 문헌, 문서, 기사, 연구 정보, 기초 자료 중 적어도 하나를 포함하는 기초자료 데이터를 입력하는 데이터 입력부, 데이터 입력부에서 수집된 기초자료 데이터로부터 가공에 필요한 정보를 추출하여 데이터베이스 서버에 저장하는 데이터 저장부, 데이터 저장부에서 가공에 필요한 데이터를 수신하여 기설정된 항목에 따라 데이터를 분류하는 데이터 가공부 및 데이터 가공부로부터 받은 데이터를 기설정된 연구노트 형식으로 변환하여 사용자에게 제공하는 연구노트 변환부를 포함할 수 있다.

Description

AI기반 구문분석 연구노트 생성 시스템{AI-BASED SYNTAX ANALYSIS RESEARCH NOTE SYSTEM}
본 발명은 사용자가 수집한 다양한 형태의 연구 자료를 입력하면, 사용자가 입력한 데이터를 기반으로 필요한 정보로 재가공하여 하나의 통일된 연구노트 형식으로 사용자에게 제공할 수 있는 AI기반 구문분석 연구노트 생성 시스템에 관한 것이다.
특정의 연구과제를 선정하여 수행하는 경우에는 과제수행 과정에서 얻어지는 결과를 기록하거나, 수집한 연구 자료들을 정리하기 위한 연구노트가 필요하게 된다.
기술분야 별로 연구노트에 대한 활용성이 조금씩 다르고, 외국에 비해 연구노트 작성의 중요성에 대한 인식이 부족하여 연구노트 작성이 크게 활성화되어 있는 상황은 아니지만, 점점 연구노트 활성화를 위한 정부의 정책과 규정의 확대로 연구노트 작성은 더욱 늘어날 전망이다.
연구노트는 서면을 통해 수기로 작성하는 서면연구노트와 컴퓨터와 같은 전자 시스템을 이용하여 작성하는 전자연구노트로 구분될 수 있고, 연구노트 관리에 대한 편의성 측면에서 전자연구노트의 비중이 점차 늘어나고 있는 추세이다.
연구노트는 일반적인 문서와 달리 연구의 진실성을 증명할 수 있는 자료로 사용될 수 있기 때문에, 전자연구노트는 연구기록 입력일과 시간을 자동적으로 기록하는 기능, 기록자와 점검자가 서명 인증을 하는 기능, 위변조여부를 검증할 수 있는 기능이 구비되어야 한다. 또한, 연구원이 연구 내용을 다양한 자료와 방법을 이용하여 자유롭게 작성할 수 있어야 하므로 연구노트를 편리하게 작성할 수 있는 기능을 제공해야 한다.
종래의 전자연구노트 시스템은 전자연구노트 작성을 위한 에디터를 제공하고 있지만, 마이크로소프트사의 워드, 한글과컴퓨터의 한글과 같은 일반적인 문서편집도구와 유사한 에디터를 제공할 뿐이다. 이러한 일반적인 문서편집도구와 유사한 에디터로 작성하는 전자연구노트 시스템은 연구노트가 장 또는 쪽 단위로 작성되기 때문에 참고자료, 로우 데이터(raw data) 등의 자료 및 데이터를 용이하게 활용하여 연구노트를 작성하기가 쉽지 않다.
또한, 종래의 전자연구노트 시스템은 작성된 연구노트의 필요한 내용만 추출하여 다른 문서를 생성할 수 있는 기능이 없어 연구노트의 활용도가 떨어지는 문제점이 있었다.
한국등록특허 제10-0536658호
본 발명의 목적은, 사용자로부터 다양한 형태의 연구자료를 입력받아 가공에 필요한 데이터를 추출하고 기설정된 항목에 따라 상기 데이터를 분류하고 변환하여 하나의 통일된 연구노트 형식으로 출력하여 사용자에게 제공하는 것이다.
본 발명의 일 실시례에 따른 AI기반 구문분석 연구노트 생성 시스템은, 사용자가 수집한 논문, 문헌, 문서, 기사, 연구 정보, 기초 자료 중 적어도 하나를 포함하는 기초자료 데이터를 입력하는 데이터 입력부, 상기 데이터 입력부에서 수집된 상기 기초자료 데이터로부터 가공에 필요한 정보를 추출하여 데이터베이스 서버에 저장하는 데이터 저장부, 상기 데이터 저장부에서 가공에 필요한 데이터를 수신하여 기설정된 항목에 따라 데이터를 분류하는 데이터 가공부 및 상기 데이터 가공부로부터 받은 데이터를 기설정된 연구노트 형식으로 변환하여 사용자에게 제공하는 연구노트 변환부를 포함할 수 있다.
본 발명의 일 실시례에 따른 AI기반 구문분석 연구노트 생성 시스템의 데이터 가공부는, 사용자 입력에 따라 수신된 데이터를 AI기반으로 형태소 분석, 어휘의미 분석, 개체명 인식, 구문분석을 통하여 분석하여 날짜, 저자, 소속, 초록, 키워드, 내용, 그림, 표 중 적어도 하나 이상의 항목으로 데이터를 분류될 수 있다.
본 발명의 일 실시례에 따른 AI기반 구문분석 연구노트 생성 시스템의 연구노트 변환부는, 상기 연구노트 생성 시, 사용자로부터 추가로 입력 받은 정보를 기설정된 연구노트 형식에 맞추어 추가하고, 상기 데이터 가공부로부터 수신된 상기 데이터와 조합하여 상기 연구노트를 생성할 수 있다.
본 발명의 일 실시례에 따른 AI기반 구문분석 연구노트 생성 시스템은, 상기 연구노트 생성 시 필요한 목차항목을 사용자가 선택할 수 있는 구성을 마련하고, 사용자가 선택한 항목에 대응하여 상기 연구노트를 생성할 수 있다.
본 발명의 일 실시례에 따른 AI기반 구문분석 연구노트 생성 시스템은, 상기 연구노트 변환부에서 생성된 연구노트를 저장하고, 상기 연구노트에 대한 사용자의 내용 변경이 있는 경우, 그 변경된 내용으로 상기 연구노트를 재저장하는 연구노트 관리부를 더 포함할 수 있다.
본 발명에 의하면, 사용자로부터 다양한 형태의 연구자료를 입력받아 가공에 필요한 데이터를 추출하고 기설정된 항목에 따라 상기 데이터를 분류하고 변환하여 하나의 통일된 연구노트 형식으로 출력하여 사용자에게 제공함으로써, 사용자가 보다 용이하게 자료 관리 및 연구 정보를 파악할 수 있는 효과가 있다.
도 1은 본 발명의 일 실시례에 따른 AI기반 구문분석 연구노트 생성 시스템 구성을 도시한 블럭도이다.
도 2는 본 발명의 일 실시례에 따라 기초자료 데이터에서 구문 분석을 통해 빈도수가 높은 구문을 추출해내는 예시이다.
도 3은 본 발명의 일 실시례에 따라 본 연구노트와 유사한 주제의 타 연구노트에서 빈도수가 높은 구문을 추출해내는 예시이다.
도 4는 본 발명의 일 실시례에 따라 빈도수가 높은 구문들을 조합하여 사용자에게 추천 주제문 제공 예시이다.
이하에서는 도면을 참조하여 본 발명의 구체적인 실시례를 상세하게 설명한다. 다만, 본 발명의 사상은 제시되는 실시례에 제한되지 아니하고, 본 발명의 사상을 이해하는 당업자는 동일한 사상의 범위 내에서 다른 구성요소를 추가, 변경, 삭제 등을 통하여, 퇴보적인 다른 발명이나 본 발명 사상의 범위 내에 포함되는 다른 실시례를 용이하게 제안할 수 있을 것이나, 이 또한 본원 발명 사상 범위 내에 포함된다고 할 것이다.
또한, 각 실시례의 도면에 나타나는 동일한 사상의 범위 내의 기능이 동일한 구성요소는 동일한 참조부호를 사용하여 설명한다.
도 1은 본 발명의 일 실시례에 따른 AI기반 구문분석 연구노트 생성 시스템 구성을 도시한 블럭도이다.
본 발명의 일 실시례에 따른 AI기반 구문분석 연구노트 생성 시스템(100)은 웹 기반으로 구축되어, 사용자가 웹을 통해 로그인함으로써 본 발명의 일 실시례에 따른 AI기반 구문분석 연구노트 생성 시스템(100)을 이용할 수 있다.
도 1을 참고하면, 본 발명의 일 실시례에 따른 AI기반 구문분석 연구노트 생성 시스템(100)은 데이터 입력부(110), 데이터 저장부(120), 데이터 가공부(130), 연구노트 변환부(140)를 포함할 수 있다.
상기 데이터 입력부(110)는, 사용자가 수집한 다양한 형태의 연구 자료, 연구과정 및 연구성과를 포함하는 기초자료 데이터를 입력 받을 수 있다.
상기 기초자료 데이터는 예를 들면, 논문, 문헌, 문서, 기사, 연구 정보, 기초 자료 등을 포함하는 자료일 수 있다.
일례로, 상기 논문, 문헌, 문서, 기사, 연구 정보, 기초 자료 등의 기초자료가 전자파일 형태로 입력되는 경우, 상기 전자파일 내에 존재하는 텍스트, 이미지 등을 자동 추출하여 기설정된 양식의 연구노트에 맞추어 편집 저장할 수 있다.
다른 일례로, 이러한 다양한 문서 내에 존재하는 연구 내용에 관한 텍스트 정보를 구조화되게 입력 할 수 있는 웹 입력 페이지 상의 텍스트 입력칸을 통해 사용자가 문단 단위로 입력할 수 있다. 이때, 상기 데이터 입력부(110)는 입력화면에서 텍스트 정보를 문단 단위로 구분하여 수작업 입력 및 구축을 위한 웹페이지를 제공할 수 있다.
따라서, 상기 자동 추출하는 경우는 보다 편리하고 빠른 시간 내에 연구노트를 생성할 수 있으나, 상기 기초자료의 속성에 따라 자동 추출의 정확도가 높지 않은 경우, 웹페이지 상의 텍스트 입력칸에 사용자가 문단 단위로 입력하여 연구노트 생성의 정확도를 향상시킬 수 있도록 양자의 입력방식을 선택적으로 사용할 수 있다.
상기 데이터 저장부(120)는, 상기 데이터 입력부(110)에서 수집된 상기 기초자료 데이터로부터 가공에 필요한 정보를 추출하여 데이터베이스 서버에 저장할 수 있다.
상기 문헌이나 문서들의 각종 자료들은 상기 데이터 입력부(110)의 문서분류서버로 입력되며, 상기 문서분류서버의 파일변환수단에서는 각종 자료들을 데이터 또는 파일로 변환될 수 있다.
데이터 또는 파일로 변환된 문헌이나 문서에서 가공에 필요한 단어, 문장들만을 추출하여 데이터베이스 서버에 저장하여 변환할 수 있다.
상기 데이터 가공부(130)는, 상기 데이터 저장부(120)에서 가공에 필요한 데이터를 수신하여 기설정된 항목에 따라 데이터를 분류할 수 있다. 그리고 사용자 입력에 따라 수신된 데이터를 AI기반으로 형태소 분석, 어휘의미 분석(동음이의어 분석, 다의어 분석), 개체명 인식, 구문분석 등을 할 수 있다.
상기 형태소 분석은 문장에서 의미를 가진 최소 단위인 형태소(명사, 동사, 형용사, 부사, 조사, 어미 등)를 분류하고 분석하여 제공할 수 있다.
상기 어휘의미 분석(동음이의어 분석, 다의어 분석)은 어휘의 형태는 동일하지만 의미가 다른 어휘에 대해서 의미를 분석하여 주변 문맥을 고려해서 가장 적합한 의미를 찾아 표준국어대사전을 기반으로 한 단어의 의미 분석 결과를 제공할 수 있다.
개체명 인식은 인명, 지명, 기관명 등과 같은 개체명을 인식하여 제공할 수 있다.
구문분석은 문장의 구조를 분석하여 문장 내 각 어절에 대해서 지배소 어절을 인식하고, 주격, 목적격과 같은 세부 의존관계 유형을 인식하여 제공할 수 있다.
이러한 분석을 통하여 날짜, 저자, 소속, 초록, 키워드, 내용, 그림, 표 중 적어도 하나 이상의 항목으로 상기 사용자 입력에 따라 수신된 데이터를 분류할 수 있다.
상기 연구노트 변환부(140)는 상기 데이터 가공부(130)로부터 받은 데이터를 하나의 통일된 연구노트 형식으로 변환하여 사용자에게 제공할 수 있다.
상기 연구노트는 하나의 양식에 사용자가 입력한 연구 자료의 정보를 재가공하여 변환함으로써, 사용자가 연구 자료와 정보를 용이하게 파악하고 관리할 수 있다.
그리고, 상기 연구노트 생성 시 삽입할 정보를 사용자에게 추가로 요청할 수 있다.
상기 요청에 따라 사용자로부터 추가로 입력 받은 정보를 기설정된 연구노트 형식에 맞추어 추가하고, 상기 데이터 가공부(130)로부터 수신된 상기 데이터와 조합하여 상기 연구노트를 생성할 수 있다.
또한, 상기 연구노트 생성 시 필요한 목차항목을 사용자가 선택할 수 있는 구성을 마련할 수 있다. 사용자가 선택한 항목에 대응하여 상기 연구노트를 생성하여 사용자가 가공되어 보여질 데이터의 가공 형태를 설정할 수 있다.
또한, 상기 연구노트 변환부(140)에서 생성된 연구노트를 저장하고, 상기 연구노트에 대한 사용자의 내용 변경이 있는 경우, 그 변경된 내용으로 상기 연구노트를 재저장하는 연구노트 관리부(150)를 더 포함할 수 있다.
상기 연구노트 관리부(150)는 상기 연구노트의 내용을 삭제, 복사, 이동시키거나 내용을 편집하는 기능을 제공할 수 있을 뿐만 아니라, 연구노트 편집도구를 이용하여 글씨 크기, 글자 정렬, 문단 조절, 사진 삽입 등의 편집기능을 사용할 수 있다.
사용자는 작성한 연구노트의 내용을 선택적으로 삭제, 복사, 이동시킬 수 있어 연구노트를 더 편리하게 작성할 수 있다.
또한, 사용자는 상기 연구노트의 내용 중 필요한 내용을 담고 있는 부분만을 추출하여, 새로운 문서를 생성하거나 해당 내용을 열람할 수 있다.
또한, 본 연구노트 생성 시스템은 입력된 상기 기초자료 데이터 또는 사용자 추가 구문을 구문 분석하여 다른 사용자의 연구노트에 포함되는 내용이 존재하는 경우, 실시간으로 중복내용을 알려주고, 중복 내용을 포함한 연구노트가 몇 건인지 알려줄 수 있다.
도 2는 본 발명의 일 실시례에 따라 기초자료 데이터에서 구문 분석을 통해 빈도수가 높은 구문을 추출해내는 예시이다.
도 2를 참고하면, 데이터 입력부(110)에서 입력 받은 기초자료 데이터인 논문과 연구정보 문헌에 다수 중복되어 나타나는 '코로나', '백신' 및 '접종'이라는 단어를 빈도수가 높은 단어(이하 '중복단어'라고 함)으로 인식하여 따로 추출해낼 수 있다.
이때, 추출되는 다수의 단어들간의 배열은 일례로 기준 문서에서 상기 다수의 단어가 작성된 순서에 따라 나열할 수 있다. 즉, 논문을 기준문서로 설정하는 경우, 상기 논문에서 코로나, 백신, 접종 순으로 단어가 작성되었으므로, 도출되는 단어의 순서도 코로나, 백신, 접종 순으로 나열할 수 있다.
다른 일례로, 각 문서 내의 단어가 작성된 순서를 스코어링하여 스코어링된 결과에 따라 상기 단어들을 나열할 수 있다. 즉, 논문에서는 가장 먼저 출현하는 '코로나'가 첫번째 순서이므로 3점을 부여('백신'은 2점 부여, '접종'은 1점 부여)하고, 연구정보에서는 세번째 순서이므로 1점을 부여('백신'은 3점 부여, '접종'은 2점 부여)하는 방식으로 스코어를 할당하여 전체 스코어 합산 점수에 따라 나열되는 순서를 결정할 수 있다. 상기 스코어링 과정을 일반화하면, 아래와 같다.
중복단어의 개수가 n개인 경우, 각 문서에서 첫번째로 출현하는 중복 단어의 스코어는 n을 할당하고, 두번째로 출현하는 단어는 n-1을 할당하는 방식으로 스코어링할 수 있다.
도 3은 본 발명의 일 실시례에 따라 본 연구노트와 유사한 주제의 타 연구노트에서 빈도수가 높은 구문을 추출해내는 예시이다.
즉, 본 연구노트 생성 시스템은 분석된 본 연구노트의 다수의 단어 또는 구문과 유사도가 높은 타 연구노트를 추출한다. 그리고, 유사도가 높은순으로 타 연구노트 내에 포함된 다수의 구문들을 추출하여, 유사도, 중복 가능성, 상기 본 연구노트의 구문 내에 포함되지 않았으나 타 연구노트에서는 사용빈도가 높은 단어들(또는 구문들)을 추출하고, 상기 사용빈도 높은 단어들을 그대로 제시하거나, 상기 단어들을 포함하는 구문들을 조합하여 생성되는 주제문 등을 사용자에게 제시할 수 있다.
도 3을 참고하면, 코로나에 관한 본 연구노트와 유사한 주제를 가진 다수의타 연구노트를 추출해낼 수 있다. 그리고 상기 타 연구노트에서 사용빈도가 높은 '화이자', '변종' 및 '확진자' 단어들을 추출해낼 수 있다.
또한, 본 연구노트 생성 시스템은 본 연구노트나, 타 연구노트에서 빈도수가 높은 구문들을 조합하여 사용자에게 추천 주제문을 제공할 수 있다.
도 4는 본 발명의 일 실시례에 따라 빈도수가 높은 구문들을 조합하여 사용자에게 추천 주제문 제공 예시이다.
도 4를 참고하면, 본 연구노트나, 타 연구노트를 구문 분석했을 때, '코로나', '백신' 및 '접종'이라는 단어들의 빈도수가 높게 나오면 '코로나 백신 접종 주의사항', '코로나 백신 접종 순서' 등의 주제문을 사용자에게 추천할 수 있다.
또한, 상기 코로나, 백신 및 접종이라는 단어들이 타 연구노트에 기설정된 횟수 이상 사용되는 경우, 중복 가능성에 대한 점수를 제시하여 중복 가능성을 경고할 수 있다.
또한, 본 연구노트에서는 코로나, 백신 및 접종이라는 단어들의 빈도수가 높은 반면 타 연구노트에서는 화이자, 변종, 확진자, 대응이라는 단어들의 빈도수가 높은 경우, '화이자에서 개발한 백신은 변종 코로나에는 대응할 수 없어 확진자가 증가하고 있으므로 이에 대한 대응방안은?' 이라는 주제문을 사용자에게 추천할 수 있다.
또한, 상기 연구노트 생성 시스템은 완성된 연구노트를 구문 분석하여 자동으로 특허 출원명세서를 작성할 수 있다.
즉, 상기 연구노트 생성 시스템은 상기 논문 등의 기초자료 데이터로부터 형식 변환된 연구노트에서 구문 분석을 통해 목적, 구성, 효과를 각각 추출하고, 연구노트에 포함된 도면을 동시에 도출할 수 있다.
그리고 기초자료 데이터 중 연구노트의 주제기술과 관련이 있는 시장현황, 제품현황, 기술현황 자료를 추출하여 배경기술 데이터를 구성할 수 있고, 상기 연구노트 내의 다수의 실시례를 구성하는 부분 중 공통 부분을 중심으로 청구항 제1 항을 자동으로 생성할 수 있다.
자동 특허 출원명세서 기능을 사용하는 경우, 사용자는 특허 출원을 위한 명세서의 초안을 자동으로 제공받을 수 있어, 출원에 소요되는 시간을 절약할 수 있는 효과가 있다.
일례로, '나라별 코로나 백신 접종을 할 수 있는 예상 시기'를 예측하는 시스템이 본 연구노트의 핵심 내용인 경우, 상기 예측 시스템의 목적은 백신 접종 예상 시기를 효과적으로 추측할 수 있는 것이며, 상기 예측 시스템의 효과는 백신 접종 예상 시기를 효과적으로 추측할 수 있는 것으로 추출할 수 있다.
또한, 연구노트의 백신 접종 예상 시기를 추측하기 위한 다양한 방법(ex. 수식 등)을 구성으로 정리하고 상기 추측 방법의 다양한 실시례 중 공통 적용되는 방법적 구성을 독립항인 청구항 1항에 나열하여 청구항 1항을 완성하고, 상기 실시례마다 부가 구성을 갖는 기술요소들은 종속항으로 완성하여 청구항의 기초를 작성할 수 있다.
또한, 본 발명의 일실시례에 따른, AI기반 구문분석 연구노트 생성 방법은 다양한 컴퓨터로 구현되는 동작을 수행하기 위한 프로그램 명령을 포함하는 컴퓨터 판독 가능 매체에 기록될 수 있다. 상기 컴퓨터 판독 가능 매체는 프로그램 명령, 데이터 파일, 데이터 구조 등을 단독으로 또는 조합하여 포함할 수 있다. 상기 매체는 프로그램 명령은 본 발명을 위하여 특별히 설계되고 구성된 것들이거나 컴퓨터 소프트웨어 당업자에게 공지되어 사용 가능한 것일 수도 있다. 컴퓨터 판독 가능 기록 매체의 예에는 하드 디스크, 플로피 디스크 및 자기 테이프와 같은 자기 매체(magnetic media), CD-ROM, DVD와 같은 광기록 매체(optical media), 플롭티컬 디스크(floptical disk)와 같은 자기-광 매체(magneto-optical media), 및 롬(ROM), 램(RAM), 플래시 메모리 등과 같은 프로그램 명령을 저장하고 수행하도록 특별히 구성된 하드웨어 장치가 포함된다. 프로그램 명령의 예에는 컴파일러에 의해 만들어지는 것과 같은 기계어 코드뿐만 아니라 인터프리터 등을 사용해서 컴퓨터에 의해서 실행될 수 있는 고급 언어 코드를 포함한다.
상기에서는 본 발명에 따른 실시례를 기준으로 본 발명의 구성과 특징을 설명하였으나 본 발명은 이에 한정되지 않으며, 본 발명의 사상과 범위 내에서 다양하게 변경 또는 변형할 수 있음은 본 발명이 속하는 기술분야의 당업자에게 명백한 것이며, 따라서 이와 같은 변경 또는 변형은 첨부된 특허청구범위에 속함을 밝혀둔다.
100: AI기반 구문분석 연구노트 생성 시스템
110: 데이터 입력부
120: 데이터 저장부
130: 데이터 가공부
140: 연구노트 변환부
150: 연구노트 관리부

Claims (5)

  1. 사용자가 수집한 논문, 문헌, 문서, 기사, 연구 정보, 기초 자료 중 적어도 하나를 포함하는 기초자료 데이터를 입력하는 데이터 입력부(110);
    상기 데이터 입력부(110)에서 수집된 상기 기초자료 데이터로부터 텍스트 정보 및 이미지 정보를 포함하는 가공 데이터를 추출하여 데이터베이스 서버에 저장하는 데이터 저장부(120);
    상기 데이터 저장부(120)에서 추출된 상기 가공 데이터를 수신하여 기설정된 항목에 따라 데이터를 분류하는 데이터 가공부(130); 및
    상기 데이터 가공부(130)로부터 받은 데이터를 기설정된 연구노트 형식으로 변환하여 사용자에게 제공하는 연구노트 변환부(140);를 포함하고,

    상기 데이터 저장부(120)는,
    상기 데이터 입력부(110)에 입력된 데이터에서 상기 가공 데이터를 자동으로 추출하는 자동 추출 방식 및 상기 데이터 입력부(110)에서 문단 단위로 입력된 상기 가공 데이터의 텍스트 정보만을 추출하는 수동 추출 방식 중 적어도 어느 하나의 방식에 기초하여 상기 가공 데이터를 추출하며,

    상기 데이터 가공부(130)는,
    사용자 입력에 따라 수신된 데이터를 AI기반으로 형태소 분석, 어휘의미 분석, 개체명 인식, 구문분석을 통하여 분석하여 날짜, 저자, 소속, 초록, 키워드, 내용, 그림, 표 중 적어도 하나 이상의 항목으로 데이터를 분류하되,
    상기 형태소 분석은 상기 수신된 데이터에 포함된 문장에서 의미를 가진 최소 단위인 형태소를 분류하고 분석하여 제공하고,
    상기 어휘의미 분석은 상기 수신된 데이터에 어휘 형태는 동일하지만 의미가 다른 어휘가 존재하는 경우, 상기 어휘의 전후 문맥을 분석하여 가장 적합한 의미를 표준국어대사전을 기반으로 검색하여 결정하고, 상기 어휘의 의미 분석 결과를 제공하며,
    상기 개체명 인식은 상기 수신된 데이터에서 인식된 개체명에 대응되는 인명, 지명 및 기관명을 제공하고,
    상기 구문분석은 상기 수신된 데이터에 포함된 문장의 구조를 분석하여 문장 내 각 어절에 대한 지배소 어절을 인식하고, 주격 및 목적격의 의존관계 유형을 인식하여 제공하며,

    상기 연구노트 변환부(140)는,
    연구노트 생성 시, 사용자로부터 추가로 입력받은 정보를 기설정된 연구노트 형식에 맞추어 추가하고, 상기 데이터 가공부(130)로부터 수신된 상기 데이터와 조합하여 상기 연구노트를 생성하고,

    상기 연구노트 생성 시 필요한 목차항목을 사용자가 선택할 수 있는 구성을 마련하고, 사용자가 선택한 항목에 대응하여 상기 연구노트를 생성하며,

    상기 연구노트 변환부(140)에서 생성된 연구노트를 저장하고, 상기 연구노트에 대한 사용자의 내용 변경이 있는 경우, 그 변경된 내용으로 상기 연구노트를 재저장하는 연구노트 관리부(150); 및
    상기 연구노트 변환부(140)에서 생성된 연구노트를 분석하여, 상기 연구노트와 타 사용자의 연구노트 간의 유사도 산출하고, 상기 타 사용자의 연구노트와 중복되는 내용을 추출하여 상기 사용자에게 제공하는 연구노트 분석부;를 더 포함하며,

    상기 연구노트 분석부는,
    상기 연구노트의 분석 내용에 포함된 최다 노출 키워드 및 상기 연구노트와 비교된 상기 타 사용자의 연구노트에 포함된 최다 노출 키워드로 구성된 추가연구 주제문을 추천하고,
    상기 연구노트의 분석 내용에서 목적, 구성 및 효과에 대응되는 구문을 추출하고 상기 추출된 구문을 기설정된 특허 출원명세서 양식으로 변환하여 특허 출원명세서 초안을 생성하는 것을 특징으로 하는 AI기반 구문분석 연구노트 생성 시스템.
  2. 삭제
  3. 삭제
  4. 삭제
  5. 삭제
KR1020200187789A 2020-12-30 2020-12-30 Ai기반 구문분석 연구노트 생성 시스템 KR102390009B1 (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020200187789A KR102390009B1 (ko) 2020-12-30 2020-12-30 Ai기반 구문분석 연구노트 생성 시스템

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020200187789A KR102390009B1 (ko) 2020-12-30 2020-12-30 Ai기반 구문분석 연구노트 생성 시스템

Publications (1)

Publication Number Publication Date
KR102390009B1 true KR102390009B1 (ko) 2022-04-22

Family

ID=81452549

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020200187789A KR102390009B1 (ko) 2020-12-30 2020-12-30 Ai기반 구문분석 연구노트 생성 시스템

Country Status (1)

Country Link
KR (1) KR102390009B1 (ko)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR102496620B1 (ko) 2022-10-26 2023-02-06 김정열 Ai 기반 검색 기능을 가지는 ocr 전자연구노트 관리 시스템

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100536658B1 (ko) 2001-12-24 2005-12-14 한국전자통신연구원 웹 기반에서 통계적인 자료분석과 가공 자료를 제공하는시스템 및 방법
KR20120039830A (ko) * 2010-10-18 2012-04-26 주식회사 나노엔텍 실험 노트 작성 시스템, 서버 및 방법
KR101499571B1 (ko) * 2014-04-08 2015-03-10 숭실대학교산학협력단 일반문서의 자동계층 분류를 통한 의미적 문서로의 변환 방법, 이를 수행하기 위한 기록 매체 및 장치
KR101637504B1 (ko) * 2015-01-16 2016-07-07 주식회사 솔트룩스 비정형 데이터 처리 시스템 및 방법

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100536658B1 (ko) 2001-12-24 2005-12-14 한국전자통신연구원 웹 기반에서 통계적인 자료분석과 가공 자료를 제공하는시스템 및 방법
KR20120039830A (ko) * 2010-10-18 2012-04-26 주식회사 나노엔텍 실험 노트 작성 시스템, 서버 및 방법
KR101499571B1 (ko) * 2014-04-08 2015-03-10 숭실대학교산학협력단 일반문서의 자동계층 분류를 통한 의미적 문서로의 변환 방법, 이를 수행하기 위한 기록 매체 및 장치
KR101637504B1 (ko) * 2015-01-16 2016-07-07 주식회사 솔트룩스 비정형 데이터 처리 시스템 및 방법

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR102496620B1 (ko) 2022-10-26 2023-02-06 김정열 Ai 기반 검색 기능을 가지는 ocr 전자연구노트 관리 시스템

Similar Documents

Publication Publication Date Title
McEnery et al. Corpus linguistics: Method, theory and practice
US7788084B2 (en) Labeling of work of art titles in text for natural language processing
US8799776B2 (en) Semantic processor for recognition of whole-part relations in natural language documents
US9239826B2 (en) Method and system for generating new entries in natural language dictionary
Wynne Searching and concordancing
Bjarnadóttir et al. DIM: The database of Icelandic morphology
KR102390009B1 (ko) Ai기반 구문분석 연구노트 생성 시스템
Dipper et al. German treebanks: Tiger and tüba-d/z
Yeshambel et al. Evaluation of corpora, resources and tools for Amharic information retrieval
JP6144133B2 (ja) 検索システム
US20220121666A1 (en) Creating a trained database
Fairon et al. I’m like,“Hey, it works!”: Using GlossaNet to find attestations of the quotative (be) like in English-language newspapers
Outahajala et al. Using confidence and informativeness criteria to improve POS-tagging in amazigh
Sankaravelayuthan et al. English to tamil machine translation system using parallel corpus
Fonseca et al. Representation of structured data of the text genre as a technique for automatic text processing
JP2004334382A (ja) 構造化文書要約装置、プログラムおよび記録媒体
Karanikolas et al. Towards a unified exploitation of electronic dialectal corpora: Problems and perspectives
US20230087132A1 (en) Creating action-trigger phrase sets
JP4397221B2 (ja) テキスト文から抽出した情報を利用したリンク設定装置およびその方法
Aparecida Fonseca et al. Representation of structured data of the text genre as a technique for automatic text processing.
JP2001034630A (ja) 文書ベース検索システム、およびその方法
Vasuki et al. English to Tamil machine translation system using parallel corpus
Bouhyaoui et al. Specification of semantic information of Arabic provisions
JP2000339342A (ja) 文書検索方法および文書検索装置
Sainin et al. Corpus Analysis: A Case Study on Kadazandusun Newspaper Archive

Legal Events

Date Code Title Description
GRNT Written decision to grant