KR20220060699A - 논문의 요약과 본문 매칭에 기반한 학술 정보 제공 방법 및 장치 - Google Patents

논문의 요약과 본문 매칭에 기반한 학술 정보 제공 방법 및 장치 Download PDF

Info

Publication number
KR20220060699A
KR20220060699A KR1020200146584A KR20200146584A KR20220060699A KR 20220060699 A KR20220060699 A KR 20220060699A KR 1020200146584 A KR1020200146584 A KR 1020200146584A KR 20200146584 A KR20200146584 A KR 20200146584A KR 20220060699 A KR20220060699 A KR 20220060699A
Authority
KR
South Korea
Prior art keywords
sentence
information
academic
academic information
category
Prior art date
Application number
KR1020200146584A
Other languages
English (en)
Other versions
KR102546895B1 (ko
Inventor
이태석
선충녕
최희석
신동구
최현진
Original Assignee
한국과학기술정보연구원
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 한국과학기술정보연구원 filed Critical 한국과학기술정보연구원
Priority to KR1020200146584A priority Critical patent/KR102546895B1/ko
Publication of KR20220060699A publication Critical patent/KR20220060699A/ko
Application granted granted Critical
Publication of KR102546895B1 publication Critical patent/KR102546895B1/ko

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/34Browsing; Visualisation therefor
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/3331Query processing
    • G06F16/334Query execution
    • G06F16/3347Query execution using vector based model
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/35Clustering; Classification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/103Formatting, i.e. changing of presentation of documents
    • G06F40/109Font handling; Temporal or kinetic typography
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/12Use of codes for handling textual entities
    • G06F40/131Fragmentation of text files, e.g. creating reusable text-blocks; Linking to fragments, e.g. using XInclude; Namespaces
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/12Use of codes for handling textual entities
    • G06F40/134Hyperlinking
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/189Automatic justification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/205Parsing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/30Semantic analysis

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • General Health & Medical Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • User Interface Of Digital Computer (AREA)

Abstract

본 발명은 학술 정보 제공 방법 및 장치에 관한 것으로서, 보다 자세하게는, 상기 사용자 단말로 제공된 상기 요약 문장 중에서 상기 사용자 단말에 의해 선택된 문장의 선택 정보를 얻는 단계, 및 상기 선택 정보에 해당되는 문장을 상기 학술 정보의 본문에 포함된 본문 문장에 매칭시키는 단계, 및 상기 학술 정보의 본문에서 상기 선택 정보에 해당되는 문장과 매칭된 본문 문장을 하이라이트 표시하고, 상기 하이라이트 표시된 본문 문장의 카테고리 정보가 포함된 학술 정보를 상기 사용자 단말에 제공하는 단계를 포함할 수 있다.

Description

논문의 요약과 본문 매칭에 기반한 학술 정보 제공 방법 및 장치{method and apparatus for providing academic information based on the summary and text matching of thesis}
본 발명은 시스템 성능 데이터의 학술 정보 제공 방법 및 장치에 관한 것이다. 보다 자세하게는, 학술 정보의 요약 문장의 구체적인 내용을 본문에서 쉽게 식별할 수 있도록 학술 정보의 요약 문장에 해당되는 본문 문장에 하이라이트 표시를 하고, 요약 문장과 본문 문장 간의 문장 관계를 보여줌으로써 요약과 본문내용을 함께 이해할 수 있는 정보를 제공할 수 있는 논문의 요약과 본문 매칭에 기반한 학술 정보 제공 방법 및 장치에 관한 것이다.
종래의 학술 정보 검색 시스템은 단순히 논문의 제목, 초록, 저자 키워드와 같은 정형화된 메타정보에 따라 검색되고 관리되었다. 그러나, 학술 정보의 경우 논문의 일반화된 논증적 의미 구조로 제시된 3개 요소인 연구주제, 연구방법 및 연구결과로 이루어져 있는데, 이러한 구조를 중심으로 논문을 검색하고 조회할 수 있는 시스템이 존재하지 않았기 때문에 사용자가 학술 정보를 전체적으로 직접 읽어보고 정리해야만 했다.
또한, 학술 정보를 검색하는 사용자들은 학술 정보의 첫 페이지에 표시되는 요약을 기초로 학술 정보의 전체적인 내용을 파악하고 있는데, 요약의 내용을 파악한 뒤 요약 문장의 상세한 내용이 기재되어 있는 본문의 해당 위치로 이동하기 위해서는 학술 정보를 필수적으로 전부 읽어봐야 하는 문제점이 존재하였다. 이러한 과정은 불필요한 시간 소모를 발생시켰다.
이에, 학술 정보에 기재된 요약을 기초로 해당 요약 문장에 관련된 내용이 기재되어 있는 본문 내용을 용이하게 식별할 수 있는 기술이 필요한 실정이다.
등록특허공보 KR 10-1850600 B1 (2018.04.13 등록)
본 발명이 해결하고자 하는 기술적 과제는, 본 발명의 일 실시예에 따른 학술 정보 제공 시스템은 요약 문장과 학술 정보의 본문내용의 문장 관계를 보여줌으로써 요약과 본문내용을 함께 이해할 수 있는 정보를 제공할 수 있는 학술 정보 제공 방법 및 장치를 제공하기 위함이다.
또한, 본 실시예에 따른 학술 정보 제공 시스템은 요약 문장을 제공할 때 본문의 카테고리 정보가 함께 표시되기 때문에 사용자가 요약만 보고도 해당 내용이 기재된 위치로 쉽게 이동할 수 있는 학술 정보를 제공할 수 있으며, 학술 정보 제공 방법 및 장치를 제공하기 위함이다.
본 발명의 기술적 과제들은 이상에서 언급한 기술적 과제들로 제한되지 않으며, 언급되지 않은 또 다른 기술적 과제들은 아래의 기재로부터 본 발명의 기술분야에서의 통상의 기술자에게 명확하게 이해 될 수 있을 것이다.
상기의 문제점을 해결하기 위한 본 발명의 일 실시예에 따른 학술 정보 제공 방법은 컴퓨팅 장치에 의해 수행되는 방법에 있어서, 학술 정보의 요약 카테고리에 포함된 요약 문장을 추출하여 상기 요약 문장과, 상기 학술 정보의 연구주제, 연구방법 또는 연구결과의 카테고리 정보 중에서 상기 요약 문장이 해당되는 카테고리 정보를 사용자 단말로 제공하는 단계, 상기 사용자 단말로 제공된 상기 요약 문장 중에서 상기 사용자 단말에 의해 선택된 문장의 선택 정보를 얻는 단계, 및 상기 선택 정보에 해당되는 문장을 상기 학술 정보의 본문에 포함된 본문 문장에 매칭시키는 단계, 및 상기 학술 정보의 본문에서 상기 선택 정보에 해당되는 문장과 매칭된 본문 문장을 하이라이트 표시하고, 상기 하이라이트 표시된 본문 문장의 카테고리 정보가 포함된 학술 정보를 상기 사용자 단말에 제공하는 단계를 포함할 수 있다.
상기의 문제점을 해결하기 위한 본 발명의 다른 실시예에 따른 학술 정보 제공 방법은 컴퓨팅 장치에 의해 수행되는 방법에 있어서, 학술 정보의 요약 문장과, 상기 학술 정보의 연구주제, 연구방법 또는 연구결과의 카테고리 정보 중에서 상기 요약 문장이 해당되는 카테고리 정보를 디스플레이하는 단계, 상기 요약 문장 중에서 문장의 선택을 입력 받는 단계, 및 상기 매칭된 본문 문장의 카테고리 정보가 포함된 학술 정보를 디스플레이하되, 상기 학술 정보의 본문에서 상기 선택 정보에 해당되는 문장과 매칭된 본문 문장을 하이라이트 표시하는 단계를 포함할 수 있다.
다른 실시예에서, 프로세서, 네트워크 인터페이스, 상기 프로세서에 의해 실행되어 컴퓨터 프로그램을 로드(load)하는 메모리, 및 상기 컴퓨터 프로그램을 저장하는 스토리지를 포함하되, 상기 컴퓨터 프로그램은, 학술 정보의 요약 카테고리에 포함된 요약 문장을 추출하여 상기 요약 문장과, 상기 학술 정보의 연구주제, 연구장치 또는 연구결과의 카테고리 정보 중에서 상기 요약 문장이 해당되는 카테고리 정보를 사용자 단말로 제공하는 인스트럭션(instruction), 상기 사용자 단말로 제공된 상기 요약 카테고리에 포함된 문장 중에서 상기 사용자 단말에 의해 선택된 문장의 선택 정보를 얻는 인스트럭션, 및 상기 선택 정보에 해당되는 문장을 상기 학술 정보의 본문에 포함된 본문 문장에 매칭시키는 인스트럭션, 및 상기 학술 정보의 본문에서 상기 선택 정보에 해당되는 문장과 매칭된 본문 문장을 하이라이트 표시하고, 상기 하이라이트 표시된 본문 문장의 카테고리 정보가 포함된 학술 정보를 상기 사용자 단말에 제공하는 인스트럭션을 포함할 수 있다.
다른 실시예에서, 프로세서, 네트워크 인터페이스, 상기 프로세서에 의해 실행되어 컴퓨터 프로그램을 로드(load)하는 메모리, 및 상기 컴퓨터 프로그램을 저장하는 스토리지를 포함하되, 상기 컴퓨터 프로그램은, 학술 정보의 요약 문장과, 상기 학술 정보의 연구주제, 연구장치 또는 연구결과의 카테고리 정보 중에서 상기 요약 문장이 해당되는 카테고리 정보를 디스플레이하는 인스트럭션(instruction), 상기 요약 문장 중에서 문장의 선택을 입력 받는 인스트럭션, 및 상기 매칭된 본문 문장의 카테고리 정보가 포함된 학술 정보를 디스플레이하되, 상기 학술 정보의 본문에서 상기 선택 정보에 해당되는 문장과 매칭된 본문 문장을 하이라이트 표시하는 인스트럭션을 포함할 수 있다.
도 1은 본 발명의 몇몇 실시예에 따른 학술 정보 제공 시스템의 예시도이다.
도 2는 본 발명의 몇몇 실시예에 따른 학술 정보 제공 방법의 순서도이다.
도 3은 도 2의 단계 S100를 참조하여 설명하기 위한 도면이다.
도 4는 학술 정보로부터 요약 문장을 추출하고, 요약 문장에 대한 카테고리 정보를 제공하는 예시를 설명하기 위한 도면이다.
도 5는 도 3의 단계 S110에서 수행될 수 있는 일 실시예를 설명하기 위한 도면이다.
도 6은 학술 정보에서 문장을 추출할 때 행 전환이 이루어진 단어를 처리하는 동작을 나타내는 예시이다.
도 7은 도 3의 단계 S110에서 수행될 수 있는 다른 실시예를 설명하기 위한 도면이다.
도 8은 사용자 단말로 제공된 요약 문장 중에서 사용자 단말에 의해 선택된 문장을 설명하기 위한 도면이다.
도 9는 요약 문장의 의미 분석을 통해 각각의 문장의 카테고리 정보가 표시되는 예시를 나타내는 도면이다.
도 10은 사용자에 의해 선택된 문장이 본문에서 하이라이트 표시된 학술 정보의 예시를 나타내는 도면이다.
도 11은 본 발명의 다른 실시예에 따른 학술 정보 제공 시스템의 예시도이다.
도 12은 본 발명의 또 다른 실시예에 따른 학술 정보 제공 시스템의 순서도이다.
도 13은 본 발명의 또 다른 실시예에 따른 학술 정보 제공 장치의 하드웨어 구성도이다.
이하, 첨부된 도면을 참조하여 다양한 실시예들을 상세히 설명한다. 본 발명의 일 실시예에 따른의 이점 및 특징, 그리고 그것들을 달성하는 방법은 첨부되는 도면과 함께 상세하게 후술되어 있는 실시 예들을 참조하면 명확해질 것이다. 그러나 본 발명은 이하에서 게시되는 실시예들에 한정되는 것이 아니라 서로 다른 다양한 형태로 구현될 수 있으며, 단지 본 실시예들은 본 발명의 게시가 완전하도록 하고, 본 발명의 일 실시예에 따른이 속하는 기술분야에서 통상의 지식을 가진 자에게 발명의 범주를 완전하게 알려주기 위해 제공되는 것이며, 본 발명은 청구항의 범주에 의해 정의될 뿐이다. 명세서 전체에 걸쳐 동일 참조 부호는 동일 구성 요소를 지칭한다.
다른 정의가 없다면, 본 명세서에서 사용되는 모든 용어(기술 및 과학적 용어를 포함)는 본 발명의 일 실시예에 따른이 속하는 기술분야에서 통상의 지식을 가진 자에게 공통적으로 이해될 수 있는 의미로 사용될 수 있다. 또 일반적으로 사용되는 사전에 정의되어 있는 용어들은 명백하게 특별히 정의되어 있지 않는 한 이상적으로 또는 과도하게 해석되지 않는다. 본 명세서에서 사용된 용어는 실시예들을 설명하기 위한 것이며 본 발명을 제한하고자 하는 것은 아니다. 본 명세서에서, 단수형은 문구에서 특별히 언급하지 않는 한 복수형도 포함한다.
이하, 도면들을 참조하여 몇몇 실시예들을 설명한다.
도 1은 본 발명의 몇몇 실시예에 따른 학술 정보 제공 시스템의 예시도이다.
도 1을 참조하면, 본 실시예에 따른 학술 정보 제공 시스템은 학술 정보 제공 장치(100) 및 사용자 단말(200)을 포함할 수 있다.
학술 정보 제공 장치(100)는 학술 정보의 요약 카테고리에 기재된 문장을 추출하여 사용자 단말(200)로 제공하고, 사용자 단말(200)로부터 선택된 문장을 학술 정보의 본문에서 하이라이트 표시하여 하이라이트 표시된 학술 정보를 사용자 단말(200)에 제공하는 장치이다.
본 명세서에서 학술 정보란 논문, 저널, 기술 설명서, 특허 문헌 등의 문헌을 의미하지만 이에 한정되지 않고, 요약 카테고리와 요약 카테고리 외의 본문 카테고리로 분류된 다양한 문헌을 의미할 수 있다. 또한, 학술 정보의 데이터 형식은 한정되지 않으나, 일 실시예에서 학술 정보의 데이터 형식은 PDF 파일 형식일 수 있다.
요약 카테고리는 '요약'이라는 명칭에 한정되지 않고, '초록', 'abstract', 또는 'summury' 등의 문헌 내용을 축약한 카테고리를 의미할 수 있다.
하이라이트 표시란, 형광 표시, 색상 변경, 음영 변경, 투명도 변경 등 문헌 상에 식별이 가능하도록 표시된 다양한 표시 방법을 의미할 수 있다.
사용자 단말(200)은 학술 정보를 검색하고 학술 정보를 디스플레이 하며, 사용자로부터 문장의 선택을 입력받는 장치이다. 본 명세서에서 사용자 단말(200)은 학술 정보 제공 장치(100)와 분리된 별개의 구성으로 표현되었으나, 실시예에 따라 학술 정보 제공 장치(100) 자체에 디스플레이가 포함될 수 있고, 학술 정보 제공 장치(100)에서 문장의 선택이 입력될 수도 있다.
학술 정보 제공 장치(100)는 학술 정보 DB(20)를 이용하여 필요한 학술 정보를 탐색할 수 있다. 학술 정보 제공 장치(100)는 학술 정보 문장 추출 모델(30)을 이용하여 학술 정보에 포함된 문장들을 추출할 수 있다. 학술 정보 제공 장치(100)는 요약 카테고리에 포함된 문장들을 추출하여 사용자 단말(200)에 제공할 수 있다.
학술 정보 제공 장치(100)는 사용자 단말(200)로부터 요약 문장에 대한 선택을 수신하고, 선택된 문장에 대응되는 본문 문장의 위치에 하이라이트 표시를 하여 사용자 단말(200)로 제공할 수 있다. 이때, 학술 정보 제공 장치(100)는 하이라이트 표시가 된 PDF 문서를 생성하여 제공할 수도 있다.
본 발명의 일 실시예에 따른 학술 정보 제공 시스템은 요약 문장과 학술 정보의 본문내용의 문장 관계를 보여줌으로써 요약과 본문내용을 함께 이해할 수 있는 정보를 제공할 수 있다.
또한, 본 실시예에 따른 학술 정보 제공 시스템은 요약 문장을 제공할 때 본문의 카테고리 정보가 함께 표시되기 때문에 사용자가 요약만 보고도 해당 내용이 기재된 위치로 쉽게 이동할 수 있는 학술 정보를 제공할 수 있으며, 이에 따라 사용자가 학술 정보의 본문 내에서 연구주제, 연구방법 또는 연구결과를 찾기 위해 별도의 탐색과정을 거치는 번거로움을 해소할 수 있다.
지금까지 도 1을 참조하여 본 발명의 일 실시예에 따른 학술 정보 제공 시스템의 구성을 개략적으로 설명하였다. 이하, 본 발명의 일 실시예에 따른 학술 정보 제공 방법의 동작을 도 2 내지 도 4를 참조하여 설명한다. 본 실시예는 컴퓨팅 장치에 의하여 수행될 수 있다. 예를 들어, 상기 컴퓨팅 장치는 도 1를 참조하여 설명한 결측 데이터 예측 서버(100)일 수 있다. 본 실시예를 설명함에 있어서, 몇몇 동작의 수행 주체에 대한 기재가 생략될 수 있다. 이 때, 상기 수행 주체는 상기 컴퓨팅 장치이다.
도 2는 본 발명의 몇몇 실시예에 따른 학술 정보 제공 방법의 순서도이다.
도 2의 단계 S100에서 학술 정보의 요약 문장과 요약 문장에 대한 카테고리 정보가 제공될 수 있다. 즉, 학술 정보의 요약 문장이 제공되면서 요약 문장에 대한 카테고리 정보가 함께 제공될 수 있다. 학술 정보의 카테고리 정보는 요약, 연구주제, 연구방법 또는 연구결과로 분류될 수 있으나, 이에 한정되는 것은 아니다. 다만, 학술 정보의 경우에는 연구주제, 연구방법 또는 연구결과의 논리적 흐름으로 서술되는 것이 일반적이다. 따라서, 본 명세서 내에서 학술 정보의 카테고리 정보가 연구주제, 연구방법 및 연구결과로 설명되었더라도 이러한 명칭에 구속되는 것은 아니고, 문헌의 논리적 흐름에 따라 서론, 본론 및 결론 등으로 분류될 수도 있다. 또한, 학술 정보마다 각각의 카테고리는 상이한 명칭으로 기재될 수 있는데, 상이한 명칭으로 기재되어 있다고 하더라도 그 명칭에 구속되는 것은 아니고 해당 카테고리에 포함된 내용에 따라서 카테고리가 분류될 수 있다.
학술 정보의 요약 문장에는 학술 정보의 본문 문장에 대한 전체적인 내용이 함축되어 기재되어 있는데, 요약 문장에는 연구주제, 연구방법 또는 연구결과에 해당되는 내용의 문장이 포함될 수 있다. 또한, 요약 문장에는 상기 연구주제, 연구방법 또는 연구결과에 해당되는 내용의 문장 외에도 다른 카테고리의 내용이 기재된 추가 문장이 포함될 수 있다.
본 단계에서는 요약 문장을 각각 분리하여 각각의 문장이 연구 주제, 연구방법, 또는 연구결과 중에서 어떠한 카테고리에 대응되는지 판단하여 요약 문장 각각에 해당되는 카테고리 정보가 제공될 수 있다.
단계 S200에서 상기 사용자 단말로 제공된 상기 요약 문장 중에서 상기 사용자 단말에 의해 요약 문장이 선택될 수 있다. 이때, 사용자 단말에 의해 선택된 문장이 포함된 선택 정보가 획득될 수 있다. 본 단계에서 사용자 단말에 의해 요약 문장 중에서 적어도 하나의 문장이 선택될 수 있다. 선택 정보는 선택된 문장에 하이라이트 표시를 요청하는 정보일 수 있다. 또한, 선택 정보는 선택된 문장의 위치에 대한 정보를 요청하는 정보일 수 있다.
단계 S300에서 선택 정보에 해당되는 문장이 상기 학술 정보의 본문에 포함된 본문 문장에 매칭될 수 있다. 이때, 요약 문장의 본문 문장에 해당되는 위치는 단계 S100에서 탐색되었기 때문에, 본 단계에서는 이미 탐색된 결과를 통해 요약 문장이 본문 문장에 매칭될 수 있다.
단계 S400에서 하이라이트 표시가 된 학술 정보가 사용자 단말에 제공될 수 있다. 이때, 학술 정보에는 하이라이트 표시와 함께 하이라이트 표시된 내용의 본문 내용에 해당되는 카테고리 정보가 함께 제공될 수 있다. 또한, 본 단계에서는 새로운 PDF 파일 형식의 학술 정보를 생성하여 사용자 단말에 제공될 수 있다.
도 3은 도 2의 단계 S100를 참조하여 설명하기 위한 도면이고, 도 4는 학술 정보로부터 요약 문장을 추출하고, 요약 문장에 대한 카테고리 정보를 제공하는 예시를 설명하기 위한 도면이다.
도 3을 참조하면, 단계 S100에서 요약 문장이 사용자 단말에 제공될 때 단계 S110 및 단계 S130이 수행될 수 있다. 단계 S110에서 요약 문장이 학술 정보의 본문에 포함된 본문 문장에 대응될 수 있다.
구체적으로 본 단계에서 학술 정보로부터 문장을 추출할 수 있는 문장 추출 model을 이용하여 학술 정보에 포함된 문장들이 추출될 수 있다. 추출된 문장은 요약에서 추출된 문장일 수도 있고, 본문에서 추출된 문장일 수도 있다.
요약에서 추출된 요약 문장은 본문에서 추출된 본문 문장에 대응될 수 있다. 예를 들어 요약 문장과 본문 문장 각각의 내용에 대한 유사도를 비교하고, 가장 유사도가 높은 문장에 대응될 수 있다. 이에 대한 구체적인 내용은 후술하도록 한다.
단계 S130에서 각각의 본문 문장은 의미 분석을 통해 연구주제, 연구방법 또는 연구결과로 카테고리 정보가 분류될 수 있다. 구체적으로
구체적으로, 각각의 본문 문장은 연구주제, 연구방법, 연구결과, 또는 기타 추가문장으로 분류될 수 있는데, 본문 문장이 속해 있는 목차, 본문 문장의 위치, 본문 문장의 전후 문장 간의 의미 관계를 통해 본문 문장이 연구주제, 연구방법, 연구결과, 또는 기타 추가문장 중에 어느 하나의 카테고리로 분류될 수 있다.
도 4와 같이 상측에 도시된 학술 정보의 요약은 '초록'이라는 카테고리에 기재되어 있으며, 문단의 첫째 줄에 연구주제가 기재되어 있고, 마지막 끝에서 세번째 줄에 연구방법이 기재되어 있으며, 마지막 끝에서 두번째 줄에 연구결과가 기재되어 있다. 이처럼 학술 정보의 요약에는 연구주제, 연구방법 및 연구결과가 모두 기재되어 있는 것이 일반적이다.
다만, 요약 문장 만으로는 어떤 문장이 어떤 카테고리에 해당되는지 알 수 없기 때문에, 요약 문장과 본문 문장의 비교를 통해 유사도를 판단하고, 가장 유사한 본문 문장이 대응될 수 있다. 대응된 본문 문장의 의미 분석 또는 기계 독해를 통해 해당 본문 문장이 연구주제에 해당되는지, 연구방법에 해당되는지, 또는 연구결과, 또는 기타 추가문장에 해당되는지 분류될 수 있다. 해당 본문 문장이 연구주제에 해당되는 경우 해당 요약 문장의 카테고리 정보가 연구주제로 결정될 수 있다.
해당 본문 문장이 연구방법에 해당되는 경우 해당 요약 문장의 카테고리 정보가 연구방법으로 결정될 수 있다. 마찬가지로, 해당 본문 문장이 연구결과에 해당되는 경우 해당 요약 문장의 카테고리 정보가 연구결과로 결정될 수 있다. 만약 해당 본문 문장이 연구주제, 연구방법 또는 연구결과 어디에서 해당되지 않는 경우에는 추가문장으로 결정될 수 있다.
도 4와 같이 상측의 요약에 포함된 문장들은 하측의 요약 문장으로 분류될 수 있다. 분류된 1 내지 6번 요약 문장들 각각은 대응되는 본문 문장의 의미 분석을 이용하여 연구주제, 연구방법 또는 연구결과의 카테고리 중에서 해당되는 카테고리로 분류될 수 있다. 1번 문장은 '네트워크 공격을 탐지하기'라는 문구에 따라 본문에서 탐색되어 연구주제로 분류될 수 있고, 5번 문장은 'seqGAN를 이용하여' 라는 문구에 따라 본문에서 탐색되어 연구방법으로 분류될 수 있으며, 6번 문장은 '정밀도가 향상되는' 이라는 문구에 따라 본문에서 탐색되어 연구결과 분류될 수 있다.
2번 문장, 3번 문장, 및 4번 문장은 의미 분석을 통해 연구주제, 연구방법 또는 연구결과의 카테고리로 분류되지 않을 수 있는데, 이 경우에는 연구주제, 연구방법 또는 연구결과의 카테고리 정보가 표시되지 않을 수 있다. 도시되지는 않았으나 2번 문장, 3번 문장, 및 4번 문장은 "기타문장" 또는 "추가지정"과 같이 카테고리 정보가 표시되지 않았다는 정보가 표시될 수 있다. 예를 들어, 2번 문장, 3번 문장, 및 4번 문장은 옆에 "추가지정" 이라는 버튼이 표시되고, 이 버튼을 누르면, 연구주제, 연구방법 또는 연구결과의 카테고리로 수동으로 분류하는 버튼이 표시되거나, 관심사항, 핵심사항 또는 직접입력의 카테고리로 설정하는 버튼이 표시될 수 있다.
다른 실시예에서, "추가지정"버튼을 통해 입력된 정보를 이용하여 해당 문장에 대한 의미 분석 모델이 학습될 수 있고, 이에 따라 요약 문장의 의미를 분석하는 모델의 성능이 향상될 수도 있다.
본 단계에서는 상기와 같은 요약 문장과 요약 문장의 카테고리 정보가 사용자 단말에 제공될 수 있다.
도 5는 도 3의 단계 S110에서 수행될 수 있는 일 실시예를 설명하기 위한 도면이며, 도 6은 학술 정보에서 문장을 추출할 때 행 전환이 이루어진 단어를 처리하는 동작을 나타내는 예시이다.
단계 S110에서 학술 정보로부터 문장이 추출될 때 행 전환이 이루어진 단어를 통합하거나 분류하는 동작이 수행될 수 있다. 구체적으로, 단계 S111에서 요약 문장 중에서 행 전환이 이루어진 단어가 식별될 수 있다. 이후, 단계 S112에서 행 전환이 이루어진 단어를 통합하여 분리된 문장이 연결될 수 있다.
단계 S113에서 요약 카테고리의 문단 폭의 뒤쪽 경계에 위치한 단어와 다음 행의 앞쪽 경계에 위치한 단어가 통합될 수 있다. 문단 폭이란 각 문장의 양 끝에 위치한 단어를 의미할 수 있다. 본 단계에서는 하나의 단어가 행 전환에 의해 강제로 다음 행으로 넘어가서 분리된 단어가 임의로 통합될 수 있다.
단계 S114에서 통합된 단어의 품사가 문장의 어법에 부합되는 품사인지 판단될 수 있다. 만약, 통합된 단어의 품사가 문장의 어법에 부합되는 경우 단계 S115에서 통합된 단어를 이용하여 문장이 완성될 수 있다. 만약 통합된 단어의 품사가 문장의 어법에 부합되지 않는 경우 단계 S116과 같이 요약 카테고리의 문단 폭의 뒤쪽 경계에 위치한 단어와 다음 행의 앞쪽 경계에 위치한 단어를 분리하여 문장이 완성될 수 있다.
도 6과 같이 문장 추출 model을 이용하여 학술 정보의 원문(20)에서 문장을 추출하는 경우 추출된 문장(21)과 같이 학술 정보에 기재된 문장의 기재 방식이 그대로 반영된 문장이 추출될 수 있다. 구체적으로 추출된 문장(21)에서는 첫째줄에 '네트워크'라는 하나의 단어가 행전환에 의해 '네트워'와 '크' 두 개의 단어로 분리되어 있고, 중단부에 '방법'이라는 하나의 단어가 행전환에 의해 '방'과' '법' 두 개의 단어로 분리되어 있으며, 후단부에 '이것은'이라는 하나의 단어가 행전환에 의해 '이것'과' '은' 두 개의 단어로 분리되어 있다. 이러한 분리된 단어들이 통합된 뒤에 문장 의미 분석으로 통해 통합된 단어의 품사가 문장의 어법에 부합되는 경우 통합된 단어로 문장이 추출될 수 있다.
도 7은 도 3의 단계 S110에서 수행될 수 있는 다른 실시예를 설명하기 위한 도면이다.
단계 S110에서 요약 문장을 학술 정보의 본문에 포함된 본문 문장에 대응시키는 단계 수행될 때, 도 7와 같이 단계 S117에서 요약 문장과 본문 문장 벡터 값으로 변환될 수 있다. 이때 요약 문장과 본문 문장은 기계독해를 통해 문장의 의미에 따른 값을 가지는 벡터 값으로 변환될 수 있다.
단계 S118에서 요약 문장의 벡터 값과 본문 문장의 벡터 값의 유사도가 결정되고, 단계 S119에서 유사도를 기초로 요약 문장과 관련이 있는 본문 문장이 매칭될 수 있다.
일 실시예에서, 요약 문장이 학술 정보의 본문에 포함된 본문 문장에 대응될 때, 학술 정보의 전단부에 포함된 텍스트에서 상기 연구주제의 카테고리 정보가 식별될 수 있고, 학술 정보의 중단부에 포함된 텍스트에서 상기 연구방법의 카테고리 정보가 식별될 수 있으며, 학술 정보의 후단부에 포함된 텍스트에서 연구결과의 카테고리 정보가 식별될 수 있다.
도 8은 사용자 단말로 제공된 요약 문장 중에서 상기 사용자 단말에 의해 선택된 문장을 설명하기 위한 도면이다.
도 2의 단계 S200이 수행될 때 도 8과 같이 사용자 단말에 제공된 요약 문장은 사용자 단말에 의해 선택되고, 이러한 선택에 따라서 선택 정보가 획득될 수 있다. 이때, 사용자 단말에 제공된 복수의 요약 문장 중에서 적어도 하나의 문장이 선택된 선택 정보가 획득될 수 있다.
도 8과 같이 요약 문장(2)은 각각의 요약 문장(2)의 카테고리 정보와 함께 사용자 단말에 제공될 수 있다. 즉, 도 4에서 설명한 바와 같이 카테고리가 분류된 요약 문장의 경우 카테고리 정보와 함께 표시되고, 카테고리가 분류되지 않은 요약 문장의 경우 카테고리 정보가 표시되지 않거나, 또는 추가문장 버튼이 함께 표시될 수 있다. 도 8의 예시와 같이 사용자 단말에 의해 요약 문장(2) 중에서 1, 4, 5, 6번 문장이 클릭으로 선택될 수 있고 이에 따라 선택된 문장에 대한 정보(21)가 선택 정보에 포함될 수 있다. 이때, 사용자 단말에 의해 추가적으로 요약 문장이 선택될 수 있으며, 추가로 선택된 요약 문장에 대한 선택 정보가 획득될 수 있다.
선택된 요약 문장(3)에 대해서는 각각의 문장에 대해 카테고리 정보가 표시될 수 있다. 1번 문장의 경우 연구주제의 카테고리 정보가 표시되고, 5번 문장의 경우 연구방법의 카테고리 정보가 표시되며, 6번 문장의 경우 연구결과의 카테고리 정보가 표시될 수 있다. 4번 문장의 경우 해당되는 카테고리가 없기 때문에 추가문장이라는 정보가로 표시될 수 있다.
또한, 이미 선택된 문장 중에서 문장의 선택을 취소하는 입력을 수신받을 수도 있으며, 추가된 문장이 사용자에 의해 클릭되는 경우 문장 선택 취소(31) 정보가 포함된 선택 정보가 획득될 수 있다.
도 9는 요약 문장의 의미 분석을 통해 각각의 문장의 카테고리 정보가 표시되는 예시를 나타내는 도면이고, 도 10은 사용자에 의해 선택된 문장이 본문에서 하이라이트 표시된 학술 정보의 예시를 나타내는 도면이다.
도 2의 단계 S400에서 하이라이트 표시된 본문 문장의 카테고리 정보가 포함된 학술 정보가 사용자 단말에 제공될 수 있다. 구체적으로 도 9와 같이 각각의 카테고리 정보에 대한 문장을 표시하여 사용자 단말에 제공하거나, 도 10과 같이 학술 정보(10)의 파일을 제공할 수도 있다. 도 10과 같이 학술 정보(10)에는 요약 정보에 매칭된 본문 문장이 하이라이트 표시(10 및 11)될 수 있다. 또한, 이러한 학술 정보(10)는 PDF 파일 형식으로 생성되어 사용자 단말에 제공될 수 있다. 하이라이트 표시(10 및 11)는 연구주제, 연구방법 및 연구결과가 서로 구분되어 표시될 수 있다. 예를 들어, 하이라이트 표시(10 및 11)는 연구주제, 연구방법 및 연구결과가 서로 다른 색상으로 표시되거나, 또는 서로 다른 형태의 하이라이트로 표시될 수 있다.
이때, 요약 문장에 매칭되는 본문 문장의 위치로 이동하는 링크 또는 북마크가 제공될 수 있으며, 이와 함께 해당 페이지 정보가 표시될 수 있다. 이에 따라 사용자는 요약 문장의 클릭만으로 해당 본문으로 손쉽게 이동할 수 있는 장점이 있다.
도 9와 같이 내용 독해 결과에 따라 요약 전체(41)카테고리, 연구주제(42) 카테고리, 연구방법(43) 카테고리, 연구결과(44) 카테고리 및 추가문장(45) 카테고리로 분류될 수 있다. 요약 전체(41)에 대한 요약 문장 각각(411 내지 414)에 대해 411 문장은 연구주제(421)에 해당되고 1P에 위치한다는 정보가 표시되고, 412 문장도 연구주제(422)에 해당되고 2P에 위치한다는 정보가 표시될 수 있다. 또한, 413 문장은 연구방법(423)에 해당되고 2P에 위치한다는 정보가 표시되고, 414 문장은 연구결과(424)에 해당되고 3P에 위치한다는 정보가 표시될 수 있다.
또한, 본 발명의 다른 실시예에 따른 학술 정보 제공 방법은 사용자 단말의 주체 의해 수행되는 방법으로서, 학술 정보의 요약 문장과, 학술 정보의 연구주제, 연구방법 또는 연구결과의 카테고리 정보 중에서 요약 문장이 해당되는 카테고리 정보를 디스플레이되고, 요약 문장 중에서 문장의 선택을 입력 받을 수 있다. 매칭된 본문 문장의 카테고리 정보가 포함된 학술 정보를 디스플레이될 수 있는데, 학술 정보의 본문에서 상기 선택 정보에 해당되는 문장과 매칭된 본문 문장을 하이라이트 표시될 수 있다.
도 11은 본 발명의 다른 실시예에 따른 학술 정보 제공 시스템의 예시도이다.
본 실시예에 따른 학술 정보 제공 시스템은 학술 정보 제공 장치가 PDF 논문에서 텍스트를 추출하고 문장단위로 자동 추출하는 구성(110), 요약 문장을 읽고 연구주제, 연구방법, 연구결과 문장을 독해하는 구성(120) 및 요약 문장과 비교하여 PDF 본문내용을 하이라이트하여 가독성을 높여주는 구성(130)으로 분류될 수 있다.
구성(110)은 PDF 파일이 입력되면 Text 형식으로 변환되는 동작이 수행되어 문장을 추출할 수 있고, 요약에 포함된 문장을 DB에 저장하여 관리할 수 있다. 구성(120)은 요약에 대한 문장을 입력 받으면, 문장 추출 모델을 통해 본문과 비교하여 유사도를 통해 해당 문장에 대한 카테고리 정보를 판단할 수 있다. 구성(130)은 PDF 파일 내에서 사용자로부터 선택된 문장을 하이라이트 표시할 수 있다.
도 12은 본 발명의 또 다른 실시예에 따른 학술 정보 제공 시스템의 순서도이다.
사용자 단말(200)은 논문 검색을 요청하고, 논문이 선택하여 학술 정보 제공 장치(100)로 논문의 요약 독해 서비스를 요청할 수 있다. 학술 정보 제공 장치(100)는 논문의 요약에 대한 독해를 수행하고 이에 대한 결과를 사용자 단말(200)로 제공할 수 있다.
학술 정보 제공 장치(100)는 학술 정보의 본문에서 텍스트를 추출하고, 이후 사용자로부터 요약 문장이 선택되면, 해당되는 문장을 매칭하여 하이라이트 표시된 PDF를 생성하여 사용자 단말(200)로 제공할 수 있다.
지금까지 도 1 내지 도 12을 참조하여 본 명세서에 기재된 학술 정보 제공 방법을 설명하였다.
도 13는 컴퓨팅 장치(500)를 나타내는 예시적인 하드웨어 구성도이다.
도 13에 도시된 바와 같이, 컴퓨팅 장치(500)는 하나 이상의 프로세서(510), 버스(550), 통신 인터페이스(570), 프로세서(510)에 의하여 수행되는 컴퓨터 프로그램(591)을 로드(load)하는 메모리(530)와, 컴퓨터 프로그램(591)를 저장하는 스토리지(590)를 포함할 수 있다. 다만, 도 13에는 본 발명의 일 실시예에 따른과 관련 있는 구성요소들 만이 도시되어 있다. 따라서, 본 발명의 일 실시예에 따른이 속한 기술분야의 통상의 기술자라면 도 13에 도시된 구성요소들 외에 다른 범용적인 구성 요소들이 더 포함될 수 있음을 알 수 있다.
프로세서(510)는 컴퓨팅 장치(500)의 각 구성의 전반적인 동작을 제어한다. 프로세서(510)는 CPU(Central Processing Unit), MPU(Micro Processor Unit), MCU(Micro Controller Unit), GPU(Graphic Processing Unit) 또는 본 발명의 일 실시예에 따른의 기술 분야에 잘 알려진 임의의 형태의 프로세서 중 적어도 하나를 포함하여 구성될 수 있다. 또한, 프로세서(510)는 본 명세서에 기재된 다양한 실시예들에 따른 방법/동작을 실행하기 위한 적어도 하나의 애플리케이션 또는 프로그램에 대한 연산을 수행할 수 있다. 컴퓨팅 장치(500)는 하나 이상의 프로세서를 구비할 수 있다.
메모리(530)는 각종 데이터, 명령 및/또는 정보를 저장한다. 메모리(530)는 본 명세서에 기재된 다양한 실시예들에 따른 방법/동작들을 실행하기 위하여 스토리지(590)로부터 하나 이상의 프로그램(591)을 로드(load) 할 수 있다. 메모리(530)의 예시는 RAM이 될 수 있으나, 이에 한정되는 것은 아니다.
버스(550)는 컴퓨팅 장치(500)의 구성 요소 간 통신 기능을 제공한다. 버스(550)는 주소 버스(Address Bus), 데이터 버스(Data Bus) 및 제어 버스(Control Bus) 등 다양한 형태의 버스로 구현될 수 있다.
통신 인터페이스(570)는 컴퓨팅 장치(500)의 유무선 인터넷 통신을 지원한다. 통신 인터페이스(570)는 인터넷 통신 외의 다양한 통신 방식을 지원할 수도 있다. 이를 위해, 통신 인터페이스(570)는 본 발명의 일 실시예에 따른의 기술 분야에 잘 알려진 통신 모듈을 포함하여 구성될 수 있다.
스토리지(590)는 하나 이상의 컴퓨터 프로그램(591)을 비임시적으로 저장할 수 있다. 스토리지(590)는 ROM(Read Only Memory), EPROM(Erasable Programmable ROM), EEPROM(Electrically Erasable Programmable ROM), 플래시 메모리 등과 같은 비휘발성 메모리, 하드 디스크, 착탈형 디스크, 또는 본 발명의 일 실시예에 따른이 속하는 기술 분야에서 잘 알려진 임의의 형태의 컴퓨터로 읽을 수 있는 기록 매체를 포함하여 구성될 수 있다.
컴퓨터 프로그램(591)은 본 명세서에 기재된 다양한 실시예들에 따른 방법/동작들이 구현된 하나 이상의 인스트럭션들을 포함할 수 있다. 컴퓨터 프로그램(591)이 메모리(530)에 로드 되면, 프로세서(510)는 상기 하나 이상의 인스트럭션들을 실행시킴으로써 본 명세서에 기재된 다양한 실시예들에 따른 방법/동작들을 수행할 수 있다.
일 실시예에서, 상기 컴퓨터 프로그램(591)은 프로세서, 네트워크 인터페이스, 상기 프로세서에 의해 실행되어 컴퓨터 프로그램을 로드(load)하는 메모리, 및 상기 컴퓨터 프로그램을 저장하는 스토리지를 포함하되, 상기 컴퓨터 프로그램은, 학술 정보의 요약 카테고리에 포함된 요약 문장을 추출하여 상기 요약 문장과, 상기 학술 정보의 연구주제, 연구장치 또는 연구결과의 카테고리 정보 중에서 상기 요약 문장이 해당되는 카테고리 정보를 사용자 단말로 제공하는 인스트럭션(instruction), 상기 사용자 단말로 제공된 상기 요약 카테고리에 포함된 문장 중에서 상기 사용자 단말에 의해 선택된 문장의 선택 정보를 얻는 인스트럭션, 및 상기 선택 정보에 해당되는 문장을 상기 학술 정보의 본문에 포함된 본문 문장에 매칭시키는 인스트럭션, 및 상기 학술 정보의 본문에서 상기 선택 정보에 해당되는 문장과 매칭된 본문 문장을 하이라이트 표시하고, 상기 하이라이트 표시된 본문 문장의 카테고리 정보가 포함된 학술 정보를 상기 사용자 단말에 제공하는 인스트럭션을 포함할 수 있다.
다른 실시예에서, 프로세서, 네트워크 인터페이스, 상기 프로세서에 의해 실행되어 컴퓨터 프로그램을 로드(load)하는 메모리, 및 상기 컴퓨터 프로그램을 저장하는 스토리지를 포함하되, 상기 컴퓨터 프로그램은, 학술 정보의 요약 문장과, 상기 학술 정보의 연구주제, 연구장치 또는 연구결과의 카테고리 정보 중에서 상기 요약 문장이 해당되는 카테고리 정보를 디스플레이하는 인스트럭션(instruction), 상기 요약 문장 중에서 문장의 선택을 입력 받는 인스트럭션, 및 상기 매칭된 본문 문장의 카테고리 정보가 포함된 학술 정보를 디스플레이하되, 상기 학술 정보의 본문에서 상기 선택 정보에 해당되는 문장과 매칭된 본문 문장을 하이라이트 표시하는 인스트럭션을 포함할 수 있다.
지금까지 설명된 실시예들에 따른 방법들은 컴퓨터가 읽을 수 있는 코드로 구현된 컴퓨터프로그램의 실행에 의하여 수행될 수 있다. 상기 컴퓨터프로그램은 인터넷 등의 네트워크를 통하여 제1 컴퓨팅 장치로부터 제2 컴퓨팅 장치에 전송되어 상기 제2 컴퓨팅 장치에 설치될 수 있고, 이로써 상기 제2 컴퓨팅 장치에서 사용될 수 있다. 상기 제1 컴퓨팅 장치 및 상기 제2 컴퓨팅 장치는, 서버 장치, 클라우드 서비스를 위한 서버 풀에 속한 물리 서버, 데스크탑 피씨와 같은 고정식 컴퓨팅 장치를 모두 포함한다.
상기 컴퓨터프로그램은 DVD-ROM, 플래시 메모리 장치 등의 기록매체에 저장된 것일 수도 있다.
이상 첨부된 도면을 참조하여 실시예들을 설명하였지만, 본 발명의 일 실시예에 따른이 속하는 기술분야에서 통상의 지식을 가진 자는 본 발명의 일 실시예에 따른들이 그 기술적 사상이나 필수적인 특징을 변경하지 않고서 다른 구체적인 형태로 실시될 수 있다는 것을 이해할 수 있다. 그러므로 이상에서 기술한 실시예들은 모든 면에서 예시적인 것이며 한정적인 것이 아닌 것으로 이해해야만 한다.

Claims (25)

  1. 컴퓨팅 장치에 의해 수행되는 방법에 있어서,
    학술 정보의 요약 카테고리에 포함된 요약 문장을 추출하여 상기 요약 문장과, 상기 학술 정보의 연구주제, 연구방법 또는 연구결과의 카테고리 정보 중에서 상기 요약 문장이 해당되는 카테고리 정보를 사용자 단말로 제공하는 단계;
    상기 사용자 단말로 제공된 상기 요약 문장 중에서 상기 사용자 단말에 의해 선택된 문장의 선택 정보를 얻는 단계; 및
    상기 선택 정보에 해당되는 문장을 상기 학술 정보의 본문에 포함된 본문 문장에 매칭시키는 단계; 및
    상기 학술 정보의 본문에서 상기 선택 정보에 해당되는 문장과 매칭된 본문 문장을 하이라이트 표시하고, 상기 하이라이트 표시된 본문 문장의 카테고리 정보가 포함된 학술 정보를 상기 사용자 단말에 제공하는 단계를 포함하는,
    학술 정보 제공 방법.
  2. 제1항에 있어서,
    상기 요약 문장과, 상기 연구주제, 연구방법 또는 연구결과의 카테고리 정보 중에서 상기 요약 문장이 해당되는 카테고리 정보를 사용자 단말로 제공하는 단계는,
    상기 요약 문장을 상기 학술 정보의 본문에 포함된 본문 문장에 대응시키는 단계; 및
    상기 요약 문장과 대응되는 본문 문장의 의미 분석을 이용하여 상기 연구주제, 연구방법 또는 연구결과의 카테고리 중에서 상기 요약 문장이 해당되는 카테고리 정보를 분류하는 단계를 포함하는,
    학술 정보 제공 방법.
  3. 제2항에 있어서,
    상기 요약 문장을 상기 학술 정보의 본문에 포함된 본문 문장에 대응시키는 단계는,
    상기 요약 문장 중에서 행 전환이 이루어진 단어를 식별하는 단계; 및
    상기 행 전환이 이루어진 단어를 통합하여 분리된 문장을 연결하는 단계를 포함하는,
    학술 정보 제공 방법.
  4. 제3항에 있어서,
    상기 요약 문장을 상기 학술 정보의 본문에 포함된 본문 문장에 대응시키는 단계는,
    상기 요약 카테고리의 문단 폭의 뒤쪽 경계에 위치한 단어와 상기 문단 폭의 경계에 위치한 단어의 다음 행의 앞쪽 경계에 위치한 단어를 통합하는 단계;
    상기 통합된 단어의 품사가 문장의 어법에 부합되는 품사에 해당하는지 판단하는 단계; 및
    상기 통합된 단어의 품사가 문장의 어법에 부합되는 경우 상기 통합된 단어를 이용하여 문장을 완성하고, 상기 통합된 단어의 품사가 문장의 어법에 부합되지 않는 경우 상기 요약 카테고리의 문단 폭의 뒤쪽 경계에 위치한 단어와 상기 문단 폭의 경계에 위치한 단어의 다음 행의 앞쪽 경계에 위치한 단어를 분리하여 문장을 완성하는 단계를 더 포함하는,
    학술 정보 제공 방법.
  5. 제2항에 있어서,
    상기 요약 문장을 상기 학술 정보의 본문에 포함된 본문 문장에 대응시키는 단계는,
    상기 요약 문장과 상기 본문 문장을 벡터 값으로 변환하는 단계; 및
    상기 요약 문장의 벡터 값과 상기 본문 문장의 벡터 값의 유사도를 결정하는 단계;
    상기 유사도를 기초로 상기 요약 문장과 관련이 있는 상기 본문 문장을 매칭하는 단계를 포함하는,
    학술 정보 제공 방법.
  6. 제2항에 있어서,
    상기 요약 문장과 대응되는 본문 문장의 의미 분석을 이용하여 상기 연구주제, 연구방법 또는 연구결과의 카테고리 중에서 상기 요약 문장이 해당되는 카테고리 정보를 분류하는 단계는,
    상기 학술 정보의 전단부에 포함된 텍스트에서 상기 연구주제의 카테고리 정보를 식별하는 단계를 포함하는,
    학술 정보 제공 방법.
  7. 제2항에 있어서,
    상기 요약 문장과 대응되는 본문 문장의 의미 분석을 이용하여 상기 연구주제, 연구방법 또는 연구결과의 카테고리 중에서 상기 요약 문장이 해당되는 카테고리 정보를 분류하는 단계는,
    상기 학술 정보의 중단부에 포함된 텍스트에서 상기 연구방법의 카테고리 정보를 식별하는 단계를 포함하는,
    학술 정보 제공 방법.
  8. 제2항에 있어서,
    상기 요약 문장과 대응되는 본문 문장의 의미 분석을 이용하여 상기 연구주제, 연구방법 또는 연구결과의 카테고리 중에서 상기 요약 문장이 해당되는 카테고리 정보를 분류하는 단계는,
    상기 학술 정보의 후단부에 포함된 텍스트에서 상기 연구결과의 카테고리 정보를 식별하는 단계를 포함하는,
    학술 정보 제공 방법.
  9. 제1항에 있어서,
    상기 요약 문장과, 상기 연구주제, 연구방법 또는 연구결과의 카테고리 정보 중에서 상기 요약 문장이 해당되는 카테고리 정보를 사용자 단말로 제공하는 단계는,
    상기 사용자 단말에 상기 문장 단위로 분리되어 표시되는 요약 문장을 제공하는 단계를 포함하는,
    학술 정보 제공 방법.
  10. 제1항에 있어서,
    상기 사용자 단말로 제공된 상기 요약 카테고리에 포함된 문장 중에서 상기 사용자 단말에 의해 선택된 문장의 선택 정보를 얻는 단계는,
    상기 사용자 단말에 제공된 복수의 요약 문장 중에서 적어도 하나의 문장이 선택된 선택 정보를 수신하는 단계를 포함하는,
    학술 정보 제공 방법.
  11. 제9항에 있어서,
    상기 사용자 단말로 제공된 상기 요약 카테고리에 포함된 문장 중에서 상기 사용자 단말에 의해 선택된 문장의 선택 정보를 얻는 단계는,
    상기 요약 문장 중에서 문장이 추가로 선택된 선택 정보를 상기 사용자 단말로부터 수신하는 단계를 더 포함하는,
    학술 정보 제공 방법.
  12. 제9항에 있어서,
    상기 사용자 단말로 제공된 상기 요약 카테고리에 포함된 문장 중에서 상기 사용자 단말에 의해 선택된 문장의 선택 정보를 얻는 단계는,
    이미 선택된 문장 중에서 문장의 선택을 취소하는 입력을 수신받는 단계를 더 포함하는,
    학술 정보 제공 방법.
  13. 제1항에 있어서,
    상기 하이라이트 표시된 본문 문장의 카테고리 정보가 포함된 학술 정보를 상기 사용자 단말에 제공하는 단계는,
    상기 매칭된 본문 문장이 하이라이트 표시된 학술 정보를 생성하는 단계를 포함하는,
    학술 정보 제공 방법.
  14. 제13항에 있어서,
    상기 하이라이트 표시된 본문 문장의 카테고리 정보가 포함된 학술 정보를 상기 사용자 단말에 제공하는 단계는,
    상기 요약 문장에 매칭되는 본문 문장의 위치로 이동하는 링크를 제공하는 단계를 포함하는,
    학술 정보 제공 방법.
  15. 제13항에 있어서,
    상기 하이라이트 표시된 본문 문장의 카테고리 정보가 포함된 학술 정보를 상기 사용자 단말에 제공하는 단계는,
    상기 요약 문장에 매칭되는 본문 문장의 위치에 대한 정보를 제공하는 단계를 포함하는,
    학술 정보 제공 방법.
  16. 컴퓨팅 장치에 의해 수행되는 방법에 있어서,
    학술 정보의 요약 문장과, 상기 학술 정보의 연구주제, 연구방법 또는 연구결과의 카테고리 정보 중에서 상기 요약 문장이 해당되는 카테고리 정보를 디스플레이하는 단계;
    상기 요약 문장 중에서 문장의 선택을 입력 받는 단계; 및
    상기 매칭된 본문 문장의 카테고리 정보가 포함된 학술 정보를 디스플레이하되, 상기 학술 정보의 본문에서 상기 선택 정보에 해당되는 문장과 매칭된 본문 문장을 하이라이트 표시하는 단계를 포함하는,
    학술 정보 제공 방법.
  17. 제16항에 있어서,
    상기 요약 문장이 해당되는 카테고리 정보를 디스플레이하는 단계는,
    상기 요약 문장을 문장 단위로 분리하여 표시하는 단계를 포함하는,
    학술 정보 제공 방법.
  18. 제16항에 있어서,
    상기 매칭된 본문 문장의 카테고리 정보가 포함된 학술 정보를 디스플레이하되, 상기 학술 정보의 본문에서 상기 선택 정보에 해당되는 문장과 매칭된 본문 문장을 하이라이트 표시하는 단계는,
    상기 선택을 입력 받은 문장과 매칭된 문장이 하이라이트된 학술 정보를 생성하는 단계를 포함하는,
    학술 정보 제공 방법.
  19. 제18항에 있어서,
    상기 매칭된 본문 문장의 카테고리 정보가 포함된 학술 정보를 디스플레이하되, 상기 학술 정보의 본문에서 상기 선택 정보에 해당되는 문장과 매칭된 본문 문장을 하이라이트 표시하는 단계는,
    상기 요약 문장에 매칭되는 본문 문장의 위치로 이동하는 링크를 표시하는 단계를 포함하는,
    학술 정보 제공 방법.
  20. 제18항에 있어서,
    상기 매칭된 본문 문장의 카테고리 정보가 포함된 학술 정보를 디스플레이하되, 상기 학술 정보의 본문에서 상기 선택 정보에 해당되는 문장과 매칭된 본문 문장을 하이라이트 표시하는 단계는,
    상기 요약 문장에 매칭되는 본문 문장의 위치에 대한 정보를 표시하는 단계를 포함하는,
    학술 정보 제공 방법.
  21. 프로세서;
    네트워크 인터페이스;
    상기 프로세서에 의해 실행되어 컴퓨터 프로그램을 로드(load)하는 메모리; 및
    상기 컴퓨터 프로그램을 저장하는 스토리지를 포함하되,
    상기 컴퓨터 프로그램은,
    학술 정보의 요약 카테고리에 포함된 요약 문장을 추출하여 상기 요약 문장과, 상기 학술 정보의 연구주제, 연구장치 또는 연구결과의 카테고리 정보 중에서 상기 요약 문장이 해당되는 카테고리 정보를 사용자 단말로 제공하는 인스트럭션(instruction);
    상기 사용자 단말로 제공된 상기 요약 카테고리에 포함된 문장 중에서 상기 사용자 단말에 의해 선택된 문장의 선택 정보를 얻는 인스트럭션; 및
    상기 선택 정보에 해당되는 문장을 상기 학술 정보의 본문에 포함된 본문 문장에 매칭시키는 인스트럭션; 및
    상기 학술 정보의 본문에서 상기 선택 정보에 해당되는 문장과 매칭된 본문 문장을 하이라이트 표시하고, 상기 하이라이트 표시된 본문 문장의 카테고리 정보가 포함된 학술 정보를 상기 사용자 단말에 제공하는 인스트럭션을 포함하는,
    학술 정보 제공 장치.
  22. 제21항에 있어서,
    상기 학술 정보의 본문에서 상기 선택 정보에 해당되는 문장과 매칭된 본문 문장을 하이라이트 표시하고, 상기 하이라이트 표시된 본문 문장의 카테고리 정보가 포함된 학술 정보를 상기 사용자 단말에 제공하는 인스트럭션은,
    상기 요약 문장을 상기 학술 정보의 본문에 포함된 본문 문장에 대응시키는 인스트럭션; 및
    상기 요약 문장과 대응되는 본문 문장의 의미 분석을 이용하여 상기 연구주제, 연구장치 또는 연구결과의 카테고리 중에서 상기 요약 문장이 해당되는 카테고리 정보를 분류하는 인스트럭션을 포함하는,
    학술 정보 제공 장치.
  23. 프로세서;
    네트워크 인터페이스;
    상기 프로세서에 의해 실행되어 컴퓨터 프로그램을 로드(load)하는 메모리; 및
    상기 컴퓨터 프로그램을 저장하는 스토리지를 포함하되,
    상기 컴퓨터 프로그램은,
    학술 정보의 요약 문장과, 상기 학술 정보의 연구주제, 연구장치 또는 연구결과의 카테고리 정보 중에서 상기 요약 문장이 해당되는 카테고리 정보를 디스플레이하는 인스트럭션(instruction);
    상기 요약 문장 중에서 문장의 선택을 입력 받는 인스트럭션; 및
    상기 매칭된 본문 문장의 카테고리 정보가 포함된 학술 정보를 디스플레이하되, 상기 학술 정보의 본문에서 상기 선택 정보에 해당되는 문장과 매칭된 본문 문장을 하이라이트 표시하는 인스트럭션을 포함하는,
    학술 정보 제공 장치.
  24. 제23항에 있어서,
    상기 매칭된 본문 문장의 카테고리 정보가 포함된 학술 정보를 디스플레이하되, 상기 학술 정보의 본문에서 상기 선택 정보에 해당되는 문장과 매칭된 본문 문장을 하이라이트 표시하는 인스트럭션은,
    상기 요약 문장에 매칭되는 본문 문장의 위치로 이동하는 링크를 표시하는 인스트럭션을 포함하는,
    학술 정보 제공 장치.
  25. 제23항에 있어서,
    상기 매칭된 본문 문장의 카테고리 정보가 포함된 학술 정보를 디스플레이하되, 상기 학술 정보의 본문에서 상기 선택 정보에 해당되는 문장과 매칭된 본문 문장을 하이라이트 표시하는 인스트럭션은,
    상기 요약 문장에 매칭되는 본문 문장의 위치에 대한 정보를 표시하는 인스트럭션을 포함하는,
    학술 정보 제공 장치.
KR1020200146584A 2020-11-05 2020-11-05 논문의 요약과 본문 매칭에 기반한 학술 정보 제공 방법 및 장치 KR102546895B1 (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020200146584A KR102546895B1 (ko) 2020-11-05 2020-11-05 논문의 요약과 본문 매칭에 기반한 학술 정보 제공 방법 및 장치

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020200146584A KR102546895B1 (ko) 2020-11-05 2020-11-05 논문의 요약과 본문 매칭에 기반한 학술 정보 제공 방법 및 장치

Publications (2)

Publication Number Publication Date
KR20220060699A true KR20220060699A (ko) 2022-05-12
KR102546895B1 KR102546895B1 (ko) 2023-06-23

Family

ID=81590679

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020200146584A KR102546895B1 (ko) 2020-11-05 2020-11-05 논문의 요약과 본문 매칭에 기반한 학술 정보 제공 방법 및 장치

Country Status (1)

Country Link
KR (1) KR102546895B1 (ko)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115186665A (zh) * 2022-09-15 2022-10-14 北京智谱华章科技有限公司 一种基于语义的无监督学术关键词提取方法及设备
KR102650202B1 (ko) * 2024-01-24 2024-03-21 (주)누리미디어 인공지능 기반의 투고 저널 추천 서버, 방법 및 프로그램
KR102650206B1 (ko) * 2024-01-24 2024-03-21 (주)누리미디어 논문 유사도가 높은 투고 저널을 추천하는 서버, 방법 및 프로그램
KR102650207B1 (ko) * 2024-01-24 2024-03-21 (주)누리미디어 시각적 효과를 제공하는 투고 저널 추천 서버, 방법 및 프로그램
KR102650209B1 (ko) * 2024-01-24 2024-03-21 (주)누리미디어 뷰어 기능을 제공하는 투고 저널 추천 서버, 방법 및 프로그램

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH07160705A (ja) * 1993-10-26 1995-06-23 Microsoft Corp ユーザが選択した文章を自動書式化する装置及び方法
JP2002063171A (ja) * 2000-08-17 2002-02-28 Kokon Shoin:Kk 文献検索システム
KR20070008991A (ko) * 2005-07-14 2007-01-18 주식회사 케이티 텍스트의 카테고리 분류 장치 및 그 방법
JP2017068757A (ja) * 2015-10-01 2017-04-06 富士通株式会社 文献表示方法及び文献表示装置
KR101850600B1 (ko) 2016-04-14 2018-05-31 조성구 온라인 상에서의 연구논문 투고, 심사, 발간 및 인용지수 산출 방법 및 시스템
KR20180058569A (ko) * 2016-11-24 2018-06-01 한양대학교 에리카산학협력단 카테고리 생성 시스템 및 방법

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH07160705A (ja) * 1993-10-26 1995-06-23 Microsoft Corp ユーザが選択した文章を自動書式化する装置及び方法
JP2002063171A (ja) * 2000-08-17 2002-02-28 Kokon Shoin:Kk 文献検索システム
KR20070008991A (ko) * 2005-07-14 2007-01-18 주식회사 케이티 텍스트의 카테고리 분류 장치 및 그 방법
JP2017068757A (ja) * 2015-10-01 2017-04-06 富士通株式会社 文献表示方法及び文献表示装置
KR101850600B1 (ko) 2016-04-14 2018-05-31 조성구 온라인 상에서의 연구논문 투고, 심사, 발간 및 인용지수 산출 방법 및 시스템
KR20180058569A (ko) * 2016-11-24 2018-06-01 한양대학교 에리카산학협력단 카테고리 생성 시스템 및 방법

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
Doctorate Support Group, "Scholarcy demo with Emma Jones - the co Founder of Scholarcy.com." [YouTube], [URL: https://youtu.be/V-HUeUyKhIY], (2020.06.05.)* *

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115186665A (zh) * 2022-09-15 2022-10-14 北京智谱华章科技有限公司 一种基于语义的无监督学术关键词提取方法及设备
KR102650202B1 (ko) * 2024-01-24 2024-03-21 (주)누리미디어 인공지능 기반의 투고 저널 추천 서버, 방법 및 프로그램
KR102650206B1 (ko) * 2024-01-24 2024-03-21 (주)누리미디어 논문 유사도가 높은 투고 저널을 추천하는 서버, 방법 및 프로그램
KR102650207B1 (ko) * 2024-01-24 2024-03-21 (주)누리미디어 시각적 효과를 제공하는 투고 저널 추천 서버, 방법 및 프로그램
KR102650209B1 (ko) * 2024-01-24 2024-03-21 (주)누리미디어 뷰어 기능을 제공하는 투고 저널 추천 서버, 방법 및 프로그램

Also Published As

Publication number Publication date
KR102546895B1 (ko) 2023-06-23

Similar Documents

Publication Publication Date Title
KR102546895B1 (ko) 논문의 요약과 본문 매칭에 기반한 학술 정보 제공 방법 및 장치
US11449767B2 (en) Method of building a sorting model, and application method and apparatus based on the model
CN108334490B (zh) 关键词提取方法以及关键词提取装置
US9075873B2 (en) Generation of context-informative co-citation graphs
US10552467B2 (en) System and method for language sensitive contextual searching
RU2643467C1 (ru) Сопоставление разметки для похожих документов
US9483460B2 (en) Automated formation of specialized dictionaries
US9817821B2 (en) Translation and dictionary selection by context
US11436282B2 (en) Methods, devices and media for providing search suggestions
US11243971B2 (en) System and method of database creation through form design
US20130124515A1 (en) Method for document search and analysis
US10936667B2 (en) Indication of search result
US20080162115A1 (en) Computer program, apparatus, and method for searching translation memory and displaying search result
US20110320459A1 (en) Term identification method and apparatus
US10621252B2 (en) Method for searching in a database
CN113918686A (zh) 智能问答模型构建方法、装置、计算机设备及存储介质
CN111563212A (zh) 一种内链添加方法及装置
WO2010103916A1 (ja) 文書の特徴語提示装置及び特徴語の優先度付与プログラム
CN112735465B (zh) 无效信息确定方法、装置、计算机设备及存储介质
Teixeira Lopes et al. Assisting health consumers while searching the web through medical annotations
JP2005202924A (ja) 対訳判断装置、方法及びプログラム
KR102196547B1 (ko) 검사문서 내 특정정보의 블라인드 처리 방법 및 장치
JP2006227914A (ja) 情報検索装置、情報検索方法、プログラム、記憶媒体
JP5916666B2 (ja) テキストによる視覚表現を含む文書を分析する装置、方法およびプログラム
KR101440385B1 (ko) 인디케이터를 이용한 정보 관리 장치

Legal Events

Date Code Title Description
E902 Notification of reason for refusal
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant