KR102428046B1 - 유사 발명 기술 문서를 통합한 가상 복합 기술문서를 이용한 발명 기술 검색 시스템 및 방법 - Google Patents

유사 발명 기술 문서를 통합한 가상 복합 기술문서를 이용한 발명 기술 검색 시스템 및 방법 Download PDF

Info

Publication number
KR102428046B1
KR102428046B1 KR1020200002587A KR20200002587A KR102428046B1 KR 102428046 B1 KR102428046 B1 KR 102428046B1 KR 1020200002587 A KR1020200002587 A KR 1020200002587A KR 20200002587 A KR20200002587 A KR 20200002587A KR 102428046 B1 KR102428046 B1 KR 102428046B1
Authority
KR
South Korea
Prior art keywords
document
technical
virtual composite
technical document
original
Prior art date
Application number
KR1020200002587A
Other languages
English (en)
Other versions
KR20210089429A (ko
Inventor
김민호
김현기
배용진
김현
류지희
배경만
임수종
임준호
장명길
허정
Original Assignee
한국전자통신연구원
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 한국전자통신연구원 filed Critical 한국전자통신연구원
Priority to KR1020200002587A priority Critical patent/KR102428046B1/ko
Publication of KR20210089429A publication Critical patent/KR20210089429A/ko
Application granted granted Critical
Publication of KR102428046B1 publication Critical patent/KR102428046B1/ko

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/93Document management systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/3331Query processing

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Business, Economics & Management (AREA)
  • General Business, Economics & Management (AREA)
  • Computational Linguistics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

본 발명은 유사 발명 기술 문서를 통합한 가상 복합 기술문서를 이용한 발명 기술 검색 방법 및 시스템에 관한 것으로, 원기술문서 데이터베이스에서 가상 복합 기술문서 대상에 해당하는 원기술문서를 선택하는 단계; 선택된 원기술문서들을 이용하여 가상 복합 기술문서를 생성하고, 생성된 가상 복합 기술문서로 가상 복합 기술문서 데이터베이스에 저장하는 단계; 생성된 가상 복합 기술문서의 색인을 검출하는 단계; 및 검출된 가상 복합 기술문서의 색인정보를 가상 복합 기술문서 색인 데이터베이스에 저장하는 단계를 포함한다.

Description

유사 발명 기술 문서를 통합한 가상 복합 기술문서를 이용한 발명 기술 검색 시스템 및 방법{Invention technology retrieval system and method using virtual composite technology document incorporating similar invention technology document}
본 발명은 유사 발명 기술 문서를 통합한 가상 복합 기술문서를 이용한 발명 기술 검색 방법 및 시스템에 관한 것으로, 더욱 상세하게는 발명 기술의 신규성 및 진보성을 검토를 위한 선행기술 검색 및 분석 분야에 관한 것이다.
일반적으로, 신규 발명 기술을 작성하거나 기술의 특허성을 심사할 때 기술의 신규성 및 진보성 검토는 필수 과정이다. 신규성 및 진보성 검토를 위해서는 유사한 선행기술 기술을 조사하게 된다. 유사한 선행 기술 조사는 검색에서 시작된다.
이러한 선행 기술 조사를 위한, 종래 특허 “특허문헌 검색 서비스 제공 방법(출원번호:10-2016-0125186)” 에서는 웹 폴더에 저장된 특허 문헌들을 이용하여 사용자 맞춤형의 특허 검색을 게시하고 있다.
또한, 종래 특허 “특허 검색 방법 및 시스템”(출원번호: 10-2017-0026838)은 검색식을 입력할 필요 없이 자동으로 전자문서를 파싱하고, 검색식을 생성하여 손쉽게 특허를 검색할 수 있는 기술을 게시하고 있다.
그리고 종래 특허 “특허 검색을 위한 최적 검색식 자동 추천 시스템 및 방법”(출원번호: 10-2017-0039105)에서는 목표 데이터셋을 결과로 검색하되 랜덤의 공통 데이터셋이 최소의 빈도로 나타나도록 하는 검색식을 자동으로 생성하는 기술을 게시하고 있다.
이와 같이, 발명 기술의 신규성을 판단함에 있어, 하나의 문서로 신규성 위배를 판단할 수 있을 정도의 선행 특허가 존재하는 경우에는 위에서 제시한 종래 특허의 기술들로도 비교적 좋은 품질의 검색 결과를 얻을 수 있다.
그런데, 신규로 발명되는 기술들은 종종 2개 이상의 기술들이 혼합되어 만들어지는 경우가 종종 있다.
이와 같은 경우는 위의 종래 기술들로는 쉽게 찾을 수 없는 문제점이 있다.
만약, 찾는다 하더라도 일일이 청구항 별로 여러 문서에 흩어져 있는 유사 청구항들을 연계하여 수동 분석 작업을 거쳐야만 신규성 및 진보성을 평가할 수 있는 문제를 내포한다.
이러한 기술은 특히 특허의 신규성 분석에서 필수적인 과정이지만, 사람에 의해서 수동으로 이뤄지는 고된 작업이 필요한 문제점이 있다.
본 발명은 종래 문제점을 해결하기 위해 안출된 것으로, 신규 발명 기술이 2개 이상의 종래 기술들을 혼합하여 구성된 기술인지를 효과적으로 판단할 수 있는 유사 발명 기술 문서를 통합한 가상 복합 기술문서를 이용한 발명 기술 검색 방법 및 시스템을 제공하고자 한다.
본 발명의 목적은 이상에서 언급한 목적으로 제한되지 않으며, 언급되지 않은 또 다른 목적들은 아래의 기재로부터 당업자에게 명확하게 이해될 수 있을 것이다.
상기 목적을 달성하기 위한 본 발명의 일 실시예에 따른 유사 발명 기술 문서를 통합한 가상 복합 기술문서를 이용한 발명 기술 검색 시스템은 원기술문서가 저장되는 원저장문서 데이터베이스에서 기술분야가 유사한 원기술문서 중 구성요소 또는 기능요소를 공유하는 원기술문서들을 선택하고, 선택된 원기술문서들을 이용하여 하나의 가상 복합 기술문서를 생성하여 가상 복합 기술문서 데이터베이스에 저장하고, 생성된 가상 복합 기술문서에서 색인을 추출하여 별도의 가상 복합문서 색인 데이터베이스에 저장하는 가상 복합 기술문서 생성기; 및 신규 발명 기술의 특허성을 심사하기 위해 신규 발명 기술문서가 입력되면, 신규 발명 기술문서의 키워드를 추출한다. 이렇게 추출된 키워드를 검색 쿼리로 생성하고, 생성된 검색 쿼리를 이용하여 가상 복합 기술문서 색인 데이터베이스에 쿼리를 수행하여 가상 복합 기술문서를 검출한 후, 가상 복합 기술문서 데이터베이스에서 가상 복합 기술문서를 검출하고, 검색된 가상 복합 기술문서를 이루는 원기술문서들을 원기술문서 데이터베이스에서 검색하여 가져오는 기술문서 검색기를 포함한다.
상기 가상 복합 기술문서는, 기술분류가 유사한 원기술문서로 이루어진다.
상기 가상 복합 기술문서는, 2개 이상의 원기술문서에서 추출한 키워드 집합으로 생성된다.
상기 가상 복합 기술문서는, 2개 이상의 원기술문서에서 추출한 의미소 집합으로 생성된다.
그리고 본 발명의 일 실시예에 따른 유사 발명 기술 문서를 통합한 가상 복합 기술문서를 이용한 발명 기술 검색 방법은 원기술문서 데이터베이스에서 가상 복합 기술문서 대상에 해당하는 원기술문서를 선택하는 단계; 선택된 원기술문서들을 이용하여 가상 복합 기술문서를 생성하고, 생성된 가상 복합 기술문서로 가상 복합 기술문서 데이터베이스에 저장하는 단계; 생성된 가상 복합 기술문서의 색인을 검출하는 단계; 및 검출된 가상 복합 기술문서의 색인정보를 가상 복합 기술문서 색인 데이터베이스에 저장하는 단계를 포함한다.
가상 복합 기술문서 대상에 해당하는 원기술문서를 선택하는 단계는, 기술분류가 유사한 원기술문서를 선택한다.
상기 가상 복합 기술문서는, 2개 이상의 원기술문서에서 추출한 키워드 집합으로 생성된다.
상기 가상 복합 기술문서는, 2개 이상의 원기술문서에서 추출한 의미소 집합으로 생성된다.
본 발명의 다른 실시예에 따른 유사 발명 기술 문서를 통합한 가상 복합 기술문서를 이용한 발명 기술 검색 방법은 선행 자료 검색을 위한 질의 기술문서를 분석하여 키워드를 추출하는 단계; 추출된 키워드에 대한 검색 쿼리를 생성하는 단계; 가상 복합 기술문서 색인 데이터베이스에 생성된 검색 쿼리를 수행하여 기저장된 가상 복합 기술문서를 검색하는 단계; 및 검색된 가상 복합 기술문서에 해당하는 원기술문서를 원기술문서 데이터베이스에서 검색한 후 해당하는 원기술문서들을 가져오는 단계를 포함한다.
따라서, 본 발명의 일 실시예에 따른 가상 복합 기술문서 검색 및 분석 방법에 따르면, 2개 이상의 기술이 혼합되어 발명된 기술을 검색하는데 있어서 기존의 단일 문서를 검색할 때 보다 효과적인 검색이 가능한 장점이 있다.
즉, 단일 문서를 검색할 때에는 질의 기술의 일부만을 포함하는 문서를 검색할 수 있으나, 본 발명은 질의 기술을 모두 또는 더 많은 요소를 포함하는 복합 기술문서를 찾을 수 있는 효과가 있다.
도 1은 본 발명의 일 실시예에 따른 유사 발명 기술 문서를 통합한 가상 복합 기술문서를 이용한 발명 기술 검색 시스템을 설명하기 위한 기능블럭도.
도 2는 본 발명의 일 실시예에 따른 유사 발명 기술 문서를 통합한 가상 복합 기술문서를 이용한 발명 기술 검색 방법을 설명하기 위한 순서도.
도 3은 도 2의 가상 복합 기술문서를 생성하는 단계를 설명하기 위한 일 실시를 설명하기 위한 순서도.
도 4는 도 2의 가상 복합 기술문서를 생성하는 단계를 설명하기 위한 다른 실시를 설명하기 위한 순서도.
도 5는 도 2의 가상 복합 기술문서를 생성하는 단계를 설명하기 위한 또 다른 실시를 설명하기 위한 순서도.
도 6은 본 발명의 다른 실시예에 따른 유사 발명 기술 문서를 통합한 가상 복합 기술문서를 이용한 발명 기술 검색 방법을 설명하기 위한 기능블럭도.
도 7은 도 6의 가상 복합 기술문서 분석 단계를 설명하기 위한 순서도이다.
본 발명의 이점 및 특징, 그리고 그것들을 달성하는 방법은 첨부되는 도면과 함께 상세하게 후술되어 있는 실시예들을 참조하면 명확해질 것이다. 그러나 본 발명은 이하에서 개시되는 실시예들에 한정되는 것이 아니라 서로 다른 다양한 형태로 구현될 것이며, 단지 본 실시예들은 본 발명의 개시가 완전하도록 하며, 본 발명이 속하는 기술분야에서 통상의 지식을 가진 자에게 발명의 범주를 완전하게 알려주기 위해 제공되는 것이며, 본 발명은 청구항의 범주에 의해 정의될 뿐이다. 한편, 본 명세서에서 사용된 용어는 실시예들을 설명하기 위한 것이며 본 발명을 제한하고자 하는 것은 아니다. 본 명세서에서, 단수형은 문구에서 특별히 언급하지 않는 한 복수형도 포함한다. 명세서에서 사용되는 "포함한다(comprises)" 및/또는 "포함하는(comprising)"은 언급된 구성소자, 단계, 동작 및/또는 소자는 하나 이상의 다른 구성소자, 단계, 동작 및/또는 소자의 존재 또는 추가를 배제하지 않는다.
도 1은 본 발명의 일 실시예에 따른 유사 발명 기술 문서를 통합한 가상 복합 기술문서를 이용한 발명 기술 검색 시스템을 설명하기 위한 기능블럭도이다.
도 1에 도시된 바와 같이, 본 발명의 일 실시예에 따른 유사 발명 기술 문서를 통합한 가상 복합 기술문서를 이용한 발명 기술 검색 시스템은 가상 복합 기술문서 생성기(100), 기술문서 검색기(200), 원기술문서 데이터베이스(300), 가상 복합 기술문서 데이터베이스(400) 및 가상 복합문서 색인 데이터베이스(500)를 포함한다.
가상 복합 기술문서 생성기(100)는 원기술문서가 저장되는 원저장문서 데이터베이스에서 기술분야가 유사한 원기술문서 중 구성요소 또는 기능요소를 공유하는 원기술문서들을 선택하고, 선택된 원기술문서들을 이용하여 하나의 가상 복합 기술문서를 생성하여 가상 복합 기술문서 데이터베이스(400)에 저장하고, 생성된 가상 복합 기술문서에서 색인을 추출하여 별도의 가상 복합문서 색인 데이터베이스에 저장한다.
기술문서 검색기(200)는 신규 발명 기술의 특허성을 심사하기 위해 신규 발명 기술문서가 입력되면, 신규 발명 기술문서의 키워드를 추출한다. 이렇게 추출된 키워드를 검색 쿼리로 생성하고, 생성된 검색 쿼리를 이용하여 가상 복합 기술문서 색인 데이터베이스에 쿼리를 수행하여 가상 복합 기술문서를 검출한다.
이렇게 가상 복합 기술문서가 검색되면, 기술문서 검색기(200)는 가상 복합 기술문서 데이터베이스(400)에서 가상 복합 기술문서를 검출하고, 검색된 가상 복합 기술문서를 이루는 원기술문서들을 원기술문서 데이터베이스(300)에서 검색하여 가져온다.
따라서 본 발명의 일 실시예에 따르면, 2개 이상의 기술이 혼합되어 발명된 기술을 검색하는데 있어서 기존의 단일 문서를 검색할 때 보다 효과적인 검색이 가능한 장점이 있다.
즉, 단일 문서를 검색할 때에는 질의 기술의 일부만을 포함하는 문서를 검색할 수 있으나, 본 발명은 질의 기술을 모두 또는 더 많은 요소를 포함하는 복합 기술문서를 찾을 수 있는 효과가 있다.
도 2는 본 발명의 일 실시예에 따른 유사 발명 기술 문서를 통합한 가상 복합 기술문서를 이용한 발명 기술 검색 방법을 설명하기 위한 순서도이다.
이하, 하기에서는 본 발명의 일 실시예에 따른 유사 발명 기술 문서를 통합한 가상 복합 기술문서를 이용한 발명 기술 검색 방법에 대하여 도 2를 참조하여 설명하기로 한다.
먼저, 원기술문서가 저장된 원기술문서 데이터베이스(300)에서 가상 복합 기술문서의 대상이 되는 원기술문서들을 선정한다(S110). 여기서 가상 복합 기술문서의 대상이 되는 원기술문서들을 선정하는 단계(S110)는 기술분류를 기준으로 선정되고, 하나 이상의 구성요소와 기능요소 중 하나의 기준으로 선정될 수 있다. 여기서, 상기 구성요소는 원기술문서의 도면상에 블록들에 나타난 구성일 수 있다. 그리고 상기 기능요소는 상기 구성요소가 가지는 기능적 행위나 구성요소들 사이와의 관계를 포함한다.
[표 1]은 구성요소, 기능요소에 대한 예시
보행 센서 장치로부터 가속도 데이터를 수신하는 무선 통신부;
상기 가속도 데이터를 이용하여, 보행자의 11자 보행 여부를 판단하는 11자 보행 감지부; 및
상기 11자 보행 여부에 대한 정보를 보행자에게 제공하는 디스플레이부를 포함하는 데이터 처리 장치.
위의 예에서 '보행 센서 장치', '무선 통신부', '11자 보행 감지부', '디스플레이부', '데이터 처리 장치'가 "구성요소"이다. '가속도 데이터를 수신하는', '가속도 데이터를 이용하여', 보행자의 11자 보행 여부를 판단하는', '정보를 보행자에게 제공하는'은 해당 구성요소에 대한 "기능요소"이다.
구성요소는 대개의 경우 연속된 명사를 연결한 명사구를 추출함으로써 검색할 수 있다. 이때, '의'에 의해 연결된 명사들은 명사 연결로 인정할 수 있다. 예를 들면 '보행자의 11자 보행 여부'를 '보행자 11자 보행 여부'로서 추출할 수 있다.
기능요소는 용언을 단위로 분리하여 추출한다. 예를 들어 '수신하는'이라는 용언 기준으로 '가속도 데이터를 수신하는'을 추출할 수 있다. 이때 용언 중에서 '대하다(~에 대한), 위하다(~을/를 위한)'와 같은 용어들은 그 대상에서 제외한다.
한편, 가상 복합 기술문서의 대상이 되는 원기술문서들을 선정하는 단계(S110)는, 기설정된 공통되는 구성요소 또는 기능요소(이하에서는 공통용어로써 '기술요소'로 표기한다)가 상기 선정된 원기술문서들에 존재하는지의 여부를 판단하여 선정할 수 있다.
상기 선정된 원기술문서를 이용하여 가상 복합 기술문서를 생성하는 단계는 2개 이상의 원기술문서를 통합하는 것이 바람직하다.
이와 같이, 상기 원기술문서의 통합한 가상 복합 기술문서의 생성은 원기술문서들의 물리적 통합을 통해 이루어질 수 있다.
일 예로, 상기 물리적인 원기술문서들의 통합은 통합된 가상 복합 기술문서에서 추출된 색인어를 이용하여 색인 DB 구축한다. 이때, 색인어는 일반적으로 불용어가 제거된 의미소 집합을 기반으로 생성되는 것이 바람직하다.
여기서 색인(색인DB 구축)은 색인어와 색인어를 담고 있는 각 문서와의 관련성(relevance)을 수치화하여 생성할 수 있다. 이를 위해, TF-IDF(Term Frequency-Inverse Document Frequency)나 BM25(Best Match 25)와 같은 방법이 이용될 수 있다.
본 발명의 다른 실시예에 따른 유사 발명 기술 문서를 통합한 가상 복합 기술문서를 이용한 발명 기술 검색 방법에 대하여 도 2를 참조하여 설명하기로 한다.
상기 원기술문서의 통합하여 가상 복합 기술문서를 생성은, 키워드를 통해 통합된 문서에 대해서는 키워드 그 자체가 색인어의 대상이 될 수 있다. 이들을 기반으로 색인어를 생성하여 색인할 수 있다.
이어서, 선정된 원기술문서를 이용하여 가상 복합 기술문서를 생성한다(S120).
이렇게 생성된 가상 복합 기술문서로 가상 복합 기술문서 데이터베이스(400)를 구축한다(S130).
그리고, 가상 복합 기술문서에 대한 색인 정보를 추출하여 가상 복합문서 색인 데이터베이스(500)를 구축한다(S140).
이하, 하기에서는 본 발명의 일 실시예에서의 가상 복합 기술문서를 생성하는 단계 중 키워드를 통한 가상 복합 기술문서 생성 방법에 대하여 도 3을 참조하여 설명하기로 한다.
먼저, 각 원기술문서들에서 각 키워드를 추출한다(S310).
각 원기술문서들에서 추출된 키워드들 중 중복되는 키워드를 검출하고 그 검출된 키워드를 제거한다(S320).
추출된 나머지 키워드를 집합하여 가상 복합 기술문서를 생성한다(S330).
이하, 하기에서는 본 발명의 일 실시예에서의 가상 복합 기술문서를 생성하는 단계 중 의미소를 통한 가상 복합 기술문서 생성 방법에 대하여 도 4를 참조하여 설명하기로 한다.
여기서, 상기 키워드는 문서를 대표하는 어휘, 단순히 문장에서 의미를 가지는 의미소 중 하나일 수 있다. 의미소는 형태소의 입장에서는 명사류, 수사류, 외국어, 동사, 형용사 등의 실질적인 의미를 가지는 실질 형태소가 될 수 있다.
먼저, 각 원기술문서들에서 각 키워드 중 의미소를 추출(S410)한 후 각 원기술문서들에서 추출된 의미소에서 불용어를 제거한다(S420).
이어서, 추출된 의미소로 이루어진 가상 문서를 생성하고(S430), 생성된 가상 문서를 연결한다(S440).
이하, 하기에서는 본 발명의 또 다른 실시예에서 키워드를 통한 원기술문서 통합 방법에 대하여 도 5를 참조하여 설명하기로 한다.
각 원기술문서로부터 기능요소를 추출한다(S510).
원기술문서를 통해 추출된 기능요소간 동일 여부 판별한다(S520).
그리고 선택된 원기술문서들간 기능요소를 통합하여 집합을 생성한다(S530).
이후, 원기술문서에서 기능요소를 포함하는 문장(문단) 추출하여 개별 가상문서 생성한다(S540).
각각 생성된 개별 가상 문서를 연결하여 임시 가상 복합 기술문서 생성한다(S550).
도 3 및 도 4에서와 같은 방법을 이용하여 통합 키워드 집합 기반 또는 의미소 기반 가상 복합 기술문서 생성하는 방법을 이용할 수 있고, 상기 방법 중 중요한 내용을 포함하는 의미소들을 좀 더 정밀하게 추출할 수 있도록 해줄 수 있다.
이러한 본 발명의 일 실시예에 따르면, 복합 기술문서에서 키워드나 의미소만을 추출하여 가상문서를 생성하는 이유는 실제 가상문서의 용도가 색인 데이터베이스의 구축에 있으며, 이를 효율적으로 생성할 수 있게 하는 장점이 있다.
본 발명의 일 실시예에 따른 가상 복합 기술문서 검색 및 분석 방법에 대하여 도 6을 참조하여 설명하기로 한다.
선행 자료 검색을 위한 질의 기술문서를 분석하여 키워드를 추출한다(S610).
이어서, 추출된 키워드에 대한 검색 쿼리를 생성한다(S620). 여기서, 가상 복합 기술문서 DB에서 질의 기술문서와 유사한 문서를 검색하기 위해 생성된 검색식인 추출된 키워드들을 조합할 수 있다.
가상 복합 기술문서 색인 데이터베이스에 생성된 검색 쿼리를 수행하여 기저장된 가상 복합 기술문서를 검색한다(S630).
이어서, 검색된 가상 복합 기술문서에 해당하는 원기술문서를 원기술문서 데이터베이스에서 검색한 후 해당하는 원기술문서들을 가져온다(S640). 즉, 상기 가상 복합 기술문서의 원기술문서 가져오는 단계(S640)는 상기 얻어진 각각의 유사 가상 복합 기술문서에 대해 해당 가상 복합 기술문서가 생성되기 위해 이용된 2개 이상의 원기술문서들을 '원기술문서 데이터베이스'로부터 가져온다.
결론적으로는 각각의 유사 가상 복합 기술문서에 대해 {가상 복합 기술문서, 원기술문서1, 원기술문서2, …} 리스트를 생성한다.
[표 2]는 리스트 생성을 위한 예시
(예시1)
SELECT * FROM tablename WHERE who="me";
:: who 필드에서 "me"와 일치하는 값을 가진 데이터를 검색

(예시2)
SELECT * FROM tablename WHERE who LIKE "%me%";
:: who 필드에서 me를 포함하는 값을 가진 데이터 검색
이후, 가져온 가상 복합 기술문서를 분석한다(S650).
이하, 하기에서는 가져온 가상 복합 기술문서를 분석하는 단계(S650)에 대하여 도 7을 참조하여 설명하기로 한다.
먼저, 질의 기술문서의 개별 기능요소에 대한 원기술문서의 포함여부를 판단한다(S651).
이어서, 원기술문서에 질의 기술문서의 기능요소가 포함된 비율을 계산한다(S652).
그리고 각각의 검색된 가상 복합 기술문서가 질의 기술문서의 기능요소를 포함하는 비율을 계산한다(S653). 예를 들어, 질의 기술문서를 구성하는 기능요소가 총 10개이고 이중에서 7개가 원기술문서1에, 4개가 원기술문서2에 포함되었다고 가정한다. 이 경우 원기술문서1은 질의 기술문서를 구성하는 기능요소의 70%를 포함하였다고 할 수 있고, 원기술문서2는 질의 기술문서의 기능요소의 40%를 포함하였다고 할 수 있다.
이후, 기능요소가 포함되었다고 판별된 요소들의 정보를 이용해 각각의 가상 복합 기술문서가 질의 기술문서의 기능요소를 포함하고 있는 비율을 계산한다(S654). 예를 들어 질의문서 구성하는 기능요소가 총 10개이고 이중에서 7개가 원기술문서1에, 4개가 원기술문서2에 포함되었지만, 2개의 기능요소가 원기술문서1과 원기술문서 2에 중복이 된다고 가정한 경우, 가상 복합 기술문서 입장에서는 9개의 기능요소를 포함하고 있다고 가정해 볼 수 있다.
이 경우 가상 복합 기술문서가 질의 기술문서의 기능요소를 포함하고 있는 비율은 90%이다.
이와 같이 분석된 내용들은 검색 결과 문서와 함께 제공한다.
따라서, 본 발명의 일 실시예에 따른 가상 복합 기술문서 검색 및 분석 방법에 따르면, 2개 이상의 기술이 혼합되어 발명된 기술을 검색하는데 있어서 기존의 단일 문서를 검색할 때 보다 효과적인 검색이 가능한 장점이 있다.
즉, 단일 문서를 검색할 때에는 질의 기술의 일부만을 포함하는 문서를 검색할 수 있으나, 본 발명은 질의 기술을 모두 또는 더 많은 요소를 포함하는 복합 기술문서를 찾을 수 있는 효과가 있다.
또한, 본 발명은 검색의 결과에서 단순히 검색된 개별 문서만을 제공하는 것이 아니라, 가상 복합 기술문서와 그 문서를 구성하는 원기술문서들을 제공하고, 검색 결과 분석을 통해서, 가상 복합 기술문서의 기능요소들이 질의 기술문서의 기능요소들에 대한 포함 비율, 각각의 구성 원기술문서의 기능요소들이 질의 기술문서의 기능요소들을 포함하고 있는 비율을 제공 받을 수 있는 장점이 있다.
이상, 본 발명의 구성에 대하여 첨부 도면을 참조하여 상세히 설명하였으나, 이는 예시에 불과한 것으로서, 본 발명이 속하는 기술분야에 통상의 지식을 가진자라면 본 발명의 기술적 사상의 범위 내에서 다양한 변형과 변경이 가능함은 물론이다. 따라서 본 발명의 보호 범위는 전술한 실시예에 국한되어서는 아니되며 이하의 특허청구범위의 기재에 의하여 정해져야 할 것이다.

Claims (9)

  1. 원기술문서 데이터베이스에서 가상 복합 기술문서 대상에 해당하는 원기술문서를 선택하는 단계; 선택된 원기술문서들을 이용하여 2개 이상의 원기술문서에서 추출한 키워드 집합으로 생성된 가상 복합 기술문서를 생성하고, 생성된 가상 복합 기술문서로 가상 복합 기술문서 데이터베이스에 저장하는 단계;
    생성된 가상 복합 기술문서의 색인을 검출하는 단계; 및
    검출된 가상 복합 기술문서의 색인정보를 가상 복합 기술문서 색인 데이터베이스에 저장하는 단계를 포함하는 유사 발명 기술 문서를 통합한 가상 복합 기술문서를 이용한 발명 기술 검색 방법.
  2. 제 1항에 있어서,
    상기 가상 복합 기술문서 대상에 해당하는 원기술문서를 선택하는 단계는,
    기술분류가 유사한 원기술문서를 선택하는 유사 발명 기술 문서를 통합한 가상 복합 기술문서를 이용한 발명 기술 검색 방법.
  3. 삭제
  4. 제 1항에 있어서,
    상기 가상 복합 기술문서는,
    2개 이상의 원기술문서에서 추출한 의미소 집합으로 생성된 유사 발명 기술 문서를 통합한 가상 복합 기술문서를 이용한 발명 기술 검색 방법.
  5. 원기술문서가 저장되는 원저장문서 데이터베이스에서 기술분야가 유사한 원기술문서 중 구성요소 또는 기능요소를 공유하는 원기술문서들을 선택하고, 선택된 원기술문서들을 이용하여 2개 이상의 원기술문서에서 추출한 의미소 집합으로 생성된 가상 복합 기술문서를 생성하여 가상 복합 기술문서 데이터베이스에 저장하고, 생성된 가상 복합 기술문서에서 색인을 추출하여 별도의 가상 복합문서 색인 데이터베이스에 저장하는 가상 복합 기술문서 생성기; 및
    신규 발명 기술의 특허성을 심사하기 위해 신규 발명 기술문서가 입력되면, 신규 발명 기술문서의 키워드를 추출한 후 추출된 키워드를 검색 쿼리로 생성하고, 생성된 검색 쿼리를 이용하여 가상 복합 기술문서 색인 데이터베이스에 쿼리를 수행하여 가상 복합 기술문서를 검출한 후, 가상 복합 기술문서 데이터베이스에서 가상 복합 기술문서를 검출하고, 검색된 가상 복합 기술문서를 이루는 원기술문서들을 원기술문서 데이터베이스에서 검색하여 가져오는 기술문서 검색기를 포함하는 유사 발명 기술 문서를 통합한 가상 복합 기술문서를 이용한 발명 기술 검색 장치.
  6. 제 5항에 있어서,
    상기 가상 복합 기술문서는,
    기술분류가 유사한 원기술문서로 이루어진 유사 발명 기술 문서를 통합한 가상 복합 기술문서를 이용한 발명 기술 검색 장치.
  7. 제 5항에 있어서,
    상기 가상 복합 기술문서는,
    2개 이상의 원기술문서에서 추출한 키워드 집합으로 생성된 유사 발명 기술 문서를 통합한 가상 복합 기술문서를 이용한 발명 기술 검색 장치.
  8. 삭제
  9. 선행 자료 검색을 위한 질의 기술문서를 분석하여 키워드를 추출하는 단계;
    추출된 키워드에 대한 검색 쿼리를 생성하는 단계;
    가상 복합 기술문서 색인 데이터베이스에 생성된 검색 쿼리를 수행하여 기저장된 기술분류가 유사한 원기술문서로 이루어진 유사 발명 기술 문서를 통합한 가상 복합 기술문서를 검색하는 단계; 및
    검색된 가상 복합 기술문서에 해당하는 원기술문서를 원기술문서 데이터베이스에서 검색한 후 해당하는 원기술문서들을 가져오는 단계를 유사 발명 기술 문서를 통합한 가상 복합 기술문서를 이용한 발명 기술 검색 방법.
KR1020200002587A 2020-01-08 2020-01-08 유사 발명 기술 문서를 통합한 가상 복합 기술문서를 이용한 발명 기술 검색 시스템 및 방법 KR102428046B1 (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020200002587A KR102428046B1 (ko) 2020-01-08 2020-01-08 유사 발명 기술 문서를 통합한 가상 복합 기술문서를 이용한 발명 기술 검색 시스템 및 방법

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020200002587A KR102428046B1 (ko) 2020-01-08 2020-01-08 유사 발명 기술 문서를 통합한 가상 복합 기술문서를 이용한 발명 기술 검색 시스템 및 방법

Publications (2)

Publication Number Publication Date
KR20210089429A KR20210089429A (ko) 2021-07-16
KR102428046B1 true KR102428046B1 (ko) 2022-08-02

Family

ID=77150883

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020200002587A KR102428046B1 (ko) 2020-01-08 2020-01-08 유사 발명 기술 문서를 통합한 가상 복합 기술문서를 이용한 발명 기술 검색 시스템 및 방법

Country Status (1)

Country Link
KR (1) KR102428046B1 (ko)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR102540944B1 (ko) * 2022-12-16 2023-06-07 (주)유알피 메타데이터를 활용한 인공지능 기반 문서관리 및 통합 검색 지원 디지털 콘텐츠 시스템

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2008156507A1 (en) 2007-06-15 2008-12-24 Patentcafe System and method for analyzing patent value

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2008156507A1 (en) 2007-06-15 2008-12-24 Patentcafe System and method for analyzing patent value

Also Published As

Publication number Publication date
KR20210089429A (ko) 2021-07-16

Similar Documents

Publication Publication Date Title
US8983977B2 (en) Question answering device, question answering method, and question answering program
US5963965A (en) Text processing and retrieval system and method
KR101040119B1 (ko) 콘텐츠 검색 장치 및 방법
US20020184204A1 (en) Information retrieval apparatus and information retrieval method
Zhang et al. Narrative text classification for automatic key phrase extraction in web document corpora
CA2556023A1 (en) Intelligent search and retrieval system and method
KR100396826B1 (ko) 정보검색에서 질의어 처리를 위한 단어 클러스터 관리장치 및 그 방법
JP3918374B2 (ja) 文書検索装置および方法
JP2010118021A (ja) トピックグラフを利用したドキュメント検索サーバ及び方法
KR20000054268A (ko) 문서 자동 요약을 이용한 문서 분류 검색 방법 및 문서분류 검색 시스템
WO2010150910A1 (ja) 情報検索装置、情報検索方法、情報検索プログラム、および、情報検索プログラムを記録した記録媒体
CN116738065A (zh) 一种企业搜索方法、装置、设备及存储介质
KR102428046B1 (ko) 유사 발명 기술 문서를 통합한 가상 복합 기술문서를 이용한 발명 기술 검색 시스템 및 방법
KR101928074B1 (ko) 문맥 정보에 기반한 콘텐츠 제공 서버 및 방법
Sharma et al. Phrase-based text representation for managing the web documents
Chen et al. Adding new concepts on the domain ontology based on semantic similarity
Wondergem et al. Matching index expressions for information retrieval
JP2008077252A (ja) 文書ランキング方法、文書検索方法、文書ランキング装置、文書検索装置、及び記録媒体
CN113806491B (zh) 一种信息处理的方法、装置、设备和介质
KR101037091B1 (ko) 자동 언어 번역을 통한 다국어의 전거 표목에 대한 온톨로지 기반 의미 검색 시스템 및 방법
Tannebaum et al. Analyzing query logs of uspto examiners to identify useful query terms in patent documents for query expansion in patent searching: a preliminary study
JP2005234772A (ja) 文書管理装置および方法
Zhang et al. Topic level disambiguation for weak queries
Barman et al. Ad-hoc information retrieval focused on wikipedia based query expansion and entropy based ranking
JP2000207414A (ja) インタ―ネット情報検索方法及びインタ―ネット情報検索プログラムを格納した記憶媒体

Legal Events

Date Code Title Description
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant