KR101823463B1 - 연구자 검색 서비스 제공 장치 및 그 방법 - Google Patents

연구자 검색 서비스 제공 장치 및 그 방법 Download PDF

Info

Publication number
KR101823463B1
KR101823463B1 KR1020170063581A KR20170063581A KR101823463B1 KR 101823463 B1 KR101823463 B1 KR 101823463B1 KR 1020170063581 A KR1020170063581 A KR 1020170063581A KR 20170063581 A KR20170063581 A KR 20170063581A KR 101823463 B1 KR101823463 B1 KR 101823463B1
Authority
KR
South Korea
Prior art keywords
researcher
statistical information
authority
document
document metadata
Prior art date
Application number
KR1020170063581A
Other languages
English (en)
Inventor
이혜진
이석형
설재욱
정서영
김광영
윤정선
김재수
Original Assignee
한국과학기술정보연구원
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 한국과학기술정보연구원 filed Critical 한국과학기술정보연구원
Priority to KR1020170063581A priority Critical patent/KR101823463B1/ko
Application granted granted Critical
Publication of KR101823463B1 publication Critical patent/KR101823463B1/ko

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F17/30386
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/22Indexing; Data structures therefor; Storage structures
    • G06F17/30312

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Software Systems (AREA)
  • Computational Linguistics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

관심 연구자에 대한 학술 정보 및 통계 정보를 제공하는 연구자 검색 서비스 제공 장치가 제공된다. 본 발명의 일 실시예에 따른 연구자 검색 서비스 제공 장치는, 학술 논문, 특허 문헌 및 연구 보고서 중 적어도 하나의 문헌 유형에 관한 문헌 데이터를 획득하는 문헌 데이터 획득부, 상기 문헌 데이터로부터 문헌 메타데이터를 추출하고, 상기 문헌 메타데이터로부터 연구자 식별 자질을 추출하며, 상기 연구자 식별 자질을 이용하여 식별된 동일 연구자 기준으로 연구자 전거 DB를 구축하는 전거 DB 구축부, 적어도 하나의 검색 클라이언트 단말로부터 관심 연구자에 대한 검색 요청을 수신하고, 상기 관심 연구자에 관한 학술 정보 및 상기 관심 연구자에 관한 통계 정보를 송신하는 인터페이스부, 상기 검색 요청에 응답하여, 상기 연구자 전거 DB에서 상기 관심 연구자의 학술 정보를 검색하는 검색부 및 상기 관심 연구자에 관한 학술 정보를 기초로, 상기 관심 연구자에 관한 통계 정보를 제공하는 분석부를 포함할 수 있다.

Description

연구자 검색 서비스 제공 장치 및 그 방법{Apparatus for providing researcher searching service and method thereof}
본 발명은 연구자 검색 서비스 제공 방법 및 장치에 관한 것이다. 보다 자세하게는, 학술 논문, 특허 문헌, 연구 보고서 등의 문헌 데이터를 토대로 연구자 전거 DB를 구축하고, 상기 연구자 전거 DB를 이용하여 사용자에게 연구자의 학술 정보 검색 서비스를 제공하는 장치 및 그 방법에 관한 것이다.
국내외에서 공개되는 학술 논문, 특허 문헌, 연구 보고서 등은 학문적, 기술적인 발전을 위해 연구자들이 연구 개발을 위해 가장 많이 활용하고 있는 문헌이다. 이들 문헌의 편리한 이용을 위해서 국내 대부분의 도서관 시스템, 국가과학기술정보센터(NDSL, National Digital Science Library) 등의 학술 정보 검색 시스템은 학술 문헌의 서지 정보(e.g. 제목, 초록, 키워드, 발행 연도, 학술지명 등)와 함께 관심 연구자를 질의어로 하는 검색 서비스를 제공하고 있다.
하지만, 연구자를 질의어로 사용할 경우, 동일한 이름을 갖는 다수의 연구자가 존재하기도 하며, 동일 연구자의 이름 표기가 같지 않을 수도 있기 때문에 검색 결과의 정확도가 떨어지는 문제가 발생한다. 이는 연구자를 식별 기준으로 하는 연구자 전거 데이터가 구축되어 있지 않거나, 연구자 전거 데이터 구축 과정에서 연구자에 대한 식별 과정을 거치지 않아서 발생할 수 있다.
현재, 국립중앙도서관이 소장하는 일부 도서 목록에 대해서는 연구자 전거 데이터가 구축된 사례도 있으나, 개별 논문 및 특허 문헌 단위까지 연구자 전거 데이터가 구축되어 있지 않은 실정이다. 이는, 연구자 전거 데이터를 구축하기 위해서는 많은 시간과 인력이 투입되어야 하고, 일부 문헌에 연구자명이 부정확하게 기재되어 있거나, 정확한 연구자명 식별 정보가 존재하지 않기 때문이다.
아울러, 현재 대부분의 학술 정보 검색 시스템은 연구자의 학술 정보에 대한 단편적인 검색 서비스만을 제공할 뿐, 연구자의 연구 주제, 성향, 협업 연구자와의 관계 등에 관한 통계 분석 정보를 제공하지는 않는다. 따라서, 기존의 학술 정보 검색 시스템은 관심 연구자에 대한 단편적인 학술 정보만을 제공할 뿐, 유용하고 가치 있는 통계 분석 정보를 제공하는 데에는 한계가 있었다.
따라서, 학술 논문, 특허 문헌 등의 문헌 데이터에서 정확하게 문헌의 저자를 식별하고, 식별된 저자를 기초로 연구자 전거 데이터를 구축하며, 상기 연구자 전거 데이터를 토대로 다양한 통계 분석 정보를 제공할 수 있는 연구자 검색 서비스 제공 장치 및 방법이 요구된다.
(특허 문헌 0001) 한국공개특허 제2017-0027576호 (2017.03.10 공개)
본 발명이 해결하고자 하는 기술적 과제는, 연구자 전거 DB를 기초로 연구자에 대한 다양한 통계 분석 정보를 제공하는 연구자 검색 서비스 제공 장치 및 그 방법을 제공하는 것이다.
본 발명이 해결하고자 하는 다른 기술적 과제는, 학술 논문, 특허 문헌 연구 보고서 등의 문헌 데이터를 기초로 정확하게 동일 연구자를 식별하고, 식별된 저자를 기초로 정확도 높은 연구자 전거 DB를 구축하는 장치 및 그 방법을 제공하는 것이다.
본 발명의 기술적 과제들은 이상에서 언급한 기술적 과제들로 제한되지 않으며, 언급되지 않은 또 다른 기술적 과제들은 아래의 기재로부터 본 발명의 기술분야에서의 통상의 기술자에게 명확하게 이해 될 수 있을 것이다.
상술한 기술적 과제를 해결하기 위한 본 발명의 일 실시예에 따른 연구자 검색 서비스 제공 장치는, 학술 논문, 특허 문헌 및 연구 보고서 중 적어도 하나의 문헌 유형에 관한 문헌 데이터를 획득하는 문헌 데이터 획득부, 상기 문헌 데이터로부터 문헌 메타데이터를 추출하고, 상기 문헌 메타데이터로부터 연구자 식별 자질을 추출하며, 상기 연구자 식별 자질을 이용하여 식별된 동일 연구자 기준으로 연구자 전거 DB를 구축하는 전거 DB 구축부, 적어도 하나의 검색 클라이언트 단말로부터 관심 연구자에 대한 검색 요청을 수신하고, 상기 관심 연구자에 관한 학술 정보 및 상기 관심 연구자에 관한 통계 정보를 송신하는 인터페이스부, 상기 검색 요청에 응답하여, 상기 연구자 전거 DB에서 상기 관심 연구자의 학술 정보를 검색하는 검색부 및 상기 관심 연구자에 관한 학술 정보를 기초로, 상기 관심 연구자에 관한 통계 정보를 제공하는 분석부를 포함할 수 있다.
상기 기술적 과제를 해결하기 위한, 본 발명의 다른 실시예에 따른 연구자 검색 서비스 제공 방법은, 연구자 검색 서비스 제공 장치에 의해 수행되는 연구자 검색 서비스 제공 방법에 있어서, 학술 논문, 특허 문헌 및 연구 보고서 중 적어도 하나의 문헌 유형에 관한 문헌 데이터를 획득하는 단계, 상기 문헌 데이터에서 추출된 연구자 식별 자질을 이용하여 동일 연구자를 식별하고, 상기 식별된 동일 연구자를 기준으로 연구자 전거 DB를 구축하는 단계, 적어도 하나의 검색 클라이언트 단말로부터 수신된 관심 연구자에 대한 검색 요청에 응답하여, 상기 연구자 전거 DB에서 검색된 상기 관심 연구자에 관한 학술 정보를 제공하는 단계 및 상기 관심 연구자에 관한 학술 정보를 기초로, 상기 관심 연구자에 관한 통계 정보를 제공하는 단계를 포함할 수 있다.
상술한 기술적 과제를 해결하기 위한 본 발명의 또 다른 실시예에 따른 컴퓨터 프로그램은, 학술 논문, 특허 문헌 및 연구 보고서 중 적어도 하나의 문헌 유형에 관한 문헌 데이터를 획득하는 단계, 상기 문헌 데이터에서 추출된 연구자 식별 자질을 이용하여 동일 연구자를 식별하고, 상기 식별된 동일 연구자를 기준으로 연구자 전거 DB를 구축하는 단계, 적어도 하나의 검색 클라이언트 단말로부터 수신된 관심 연구자에 대한 검색 요청에 응답하여, 상기 연구자 전거 DB에서 검색된 상기 관심 연구자에 관한 학술 정보를 제공하는 단계 및 상기 관심 연구자에 관한 학술 정보를 기초로, 상기 관심 연구자에 관한 통계 정보를 제공하는 단계를 실행시키기 위해 기록 매체에 저장될 수 있다.
상술한 기술적 과제를 해결하기 위한 본 발명의 또 다른 실시예에 따른 연구자 전거 DB 구축 방법은, 연구자 전거 DB 구축 장치에 의해 수행되는 연구자 전거 DB의 구축 방법에 있어서, 학술 논문, 특허 문헌 및 연구 보고서 중 적어도 하나의 문헌이 포함된 문헌 데이터를 획득하는 단계, 상기 문헌 데이터에서 문헌의 서지 정보를 가리키는 문헌 메타데이터를 추출하는 단계, 연구자명을 기준으로 상기 문헌 메타데이터를 그룹핑하여 동명 인물 클러스터를 구축하는 단계, 상기 문헌 메타데이터에서 기 지정된 연구자 식별 자질을 추출하는 단계, 상기 연구자 식별 자질을 이용하여, 상기 동명 인물 클러스터로부터 동일 인물 클러스터를 구축하는 단계 및 상기 동일 인물 클러스터에 포함된 문헌 메타데이터를 연계하여, 상기 연구자 전거 DB를 구축하는 단계를 포함할 수 있다.
상술한 기술적 과제를 해결하기 위한 본 발명의 또 다른 실시예에 따른 연구자 전거 DB 구축 장치는, 하나 이상의 프로세서, 네트워크 인터페이스, 상기 프로세서에 의하여 수행되는 컴퓨터 프로그램을 로드(Load)하는 메모리 및 복수의 문헌 데이터 및 상기 컴퓨터 프로그램을 저장하는 스토리지를 포함하되, 상기 컴퓨터 프로그램은, 학술 논문, 특허 문헌 및 연구 보고서 중 적어도 하나의 문헌이 포함된 문헌 데이터를 획득하는 오퍼레이션, 상기 문헌 데이터에서 문헌의 서지 정보를 가리키는 문헌 메타데이터를 추출하는 오퍼레이션, 연구자명을 기준으로 상기 문헌 메타데이터를 그룹핑하여 동명 인물 클러스터를 구축하는 오퍼레이션, 상기 문헌 메타데이터에서 기 지정된 연구자 식별 자질을 추출하는 오퍼레이션, 상기 연구자 식별 자질을 이용하여, 상기 동명 인물 클러스터로부터 동일 인물 클러스터를 구축하는 오퍼레이션 및 상기 동일 인물 클러스터에 포함된 문헌 메타데이터를 연계하여, 상기 연구자 전거 DB를 구축하는 오퍼레이션을 포함할 수 있다.
상술한 기술적 과제를 해결하기 위한 본 발명의 또 다른 실시예에 따른 컴퓨터 프로그램은, 연구자 전거 DB 구축 장치에 의해 수행되는 연구자 전거 DB의 구축 방법에 있어서, 학술 논문, 특허 문헌 및 연구 보고서 중 적어도 하나의 문헌이 포함된 문헌 데이터를 획득하는 단계, 상기 문헌 데이터에서 문헌의 서지 정보를 가리키는 문헌 메타데이터를 추출하는 단계, 연구자명을 기준으로 상기 문헌 메타데이터를 그룹핑하여 동명 인물 클러스터를 구축하는 단계, 상기 문헌 메타데이터에서 기 지정된 연구자 식별 자질을 추출하는 단계, 상기 연구자 식별 자질을 이용하여, 상기 동명 인물 클러스터로부터 동일 인물 클러스터를 구축하는 단계 및 상기 동일 인물 클러스터에 포함된 문헌 메타데이터를 연계하여, 상기 연구자 전거 DB를 구축하는 단계를 실행시키기 위하여 기록 매체에 저장될 수 있다.
상술한 본 발명에 따르면, 문헌 메타데이터에 포함된 이메일 정보, 공동 저자의 이름 등의 정보를 연구자 식별 자질(feature)로 이용하여 동일 연구자를 식별하고, 식별된 연구자에 대한 문헌 메타데이터를 연계하여 정확도 높은 연구자 전거 DB가 구축될 수 있다. 이에 따라, 관심 연구자에 관한 학술 정보를 제공하는 검색 서비스에 있어서, 검색 결과의 정확도가 향상될 수 있다는 효과가 있다.
또한, 상기와 같은 연구자 전거 DB는 DB 관리자의 개입 없이 자동으로 구축될 수 있다. 이에 따라, 연구자 전거 DB를 구축하기 위해 소요되는 시간 비용 및 인적 비용이 크게 절감될 수 있다.
또한, 식별된 동일 연구자에 대한 문헌 메타데이터로 구성된 동일 인물 클러스터에 관하여, 클러스터의 유사도를 측정하고, 상기 유사도가 임계 값 이상인 동일 인물 클러스터만을 이용하여 연구자 전거 DB가 구축될 수 있다. 이에 따라, DB 관리자의 개입 없이도 정확도 높은 연구자 전거 DB가 구축되는 효과가 있다.
또한, 상기 연구자 전거 DB에서, 연구자의 성향, 협력도, 생산성, 지속성 등의 분석 지표에 따른 연구자 별 통계 정보, 연구 주제 별 통계 정보, 연구자와 협업 연구자 간의 연구 네트워크 등에 관한 다양한 통계 정보가 제공될 수 있다. 이에 따라, 본 발명의 실시예에 따른 검색 서비스를 이용하는 연구자에게 협업 연구의 기회를 부여하는 등 다양한 측면에서 연구자의 연구 활동을 촉진할 수 있다는 효과가 있다.
또한, 상기와 같은 통계 정보를 통해, 상기 검색 서비스를 이용하는 사용자는 특정 연구 분야에 대한 전문가에 대한 정보, 시간에 따른 연구 트렌드의 변화, 최신 연구 동향 등의 가치 있는 정보를 제공 받을 수 있다는 효과가 있다.
또한, 상기와 같은 통계 정보는 시각화된 형태로 가공되어 제공될 수 있다. 예를 들어, 연구자와 협업 연구자 간의 연구 네트워크가 방사형 네트워크의 형태로 가공되어 제공될 수 있다. 이에 따라, 상기 검색 서비스를 이용하는 사용자들이 집약된 정보를 한눈에 파악할 수 있을 것인 바, 정보의 표현성 및 전달성이 향상되는 효과가 있다.
본 발명의 효과들은 이상에서 언급한 효과들로 제한되지 않으며, 언급되지 않은 또 다른 효과들은 아래의 기재로부터 통상의 기술자에게 명확하게 이해될 수 있을 것이다.
도 1은 본 발명의 일 실시예에 따른 연구자 검색 서비스 시스템의 구성도이다.
도 2 내지 도 4는 본 발명의 다른 실시예에 따른 연구자 검색 서비스 제공 장치의 기능 블록도이다.
도 5 내지 도 12는 본 발명의 일 구현예에 따른 사용자 인터페이스와 검색 결과로 제공되는 관심 연구자의 학술 정보 및 통계 정보를 설명하기 위한 도면이다.
도 13은 본 발명의 또 다른 실시예에 따른 연구자 검색 서비스 제공 방법의 하드웨어 구성도이다.
도 14은 본 발명의 또 다른 실시예에 따른 연구자 검색 서비스 제공 방법의 흐름도이다.
도 15는 도 14에 도시된 연구자 전거 DB 구축 단계의 상세 흐름도이다.
도 16은 본 발명의 몇몇 실시예에서 참조될 수 있는 동명 인물 클러스터의 예시도이다.
도 17은 도 15에 도시된 동일 인물 클러스터 구축 단계의 상세 흐름도이다.
이하, 첨부된 도면을 참조하여 본 발명의 바람직한 실시예들을 상세히 설명한다. 본 발명의 이점 및 특징, 그리고 그것들을 달성하는 방법은 첨부되는 도면과 함께 상세하게 후술되어 있는 실시예들을 참조하면 명확해질 것이다. 그러나 본 발명은 이하에서 개시되는 실시예들에 한정되는 것이 아니라 서로 다른 다양한 형태로 구현될 수 있으며, 단지 본 실시예들은 본 발명의 개시가 완전하도록 하고, 본 발명이 속하는 기술분야에서 통상의 지식을 가진 자에게 발명의 범주를 완전하게 알려주기 위해 제공되는 것이며, 본 발명은 청구항의 범주에 의해 정의될 뿐이다. 명세서 전체에 걸쳐 동일 참조 부호는 동일 구성 요소를 지칭한다.
다른 정의가 없다면, 본 명세서에서 사용되는 모든 용어(기술 및 과학적 용어를 포함)는 본 발명이 속하는 기술분야에서 통상의 지식을 가진 자에게 공통적으로 이해될 수 있는 의미로 사용될 수 있다. 또 일반적으로 사용되는 사전에 정의되어 있는 용어들은 명백하게 특별히 정의되어 있지 않는 한 이상적으로 또는 과도하게 해석되지 않는다. 본 명세서에서 사용된 용어는 실시예들을 설명하기 위한 것이며 본 발명을 제한하고자 하는 것은 아니다. 본 명세서에서, 단수형은 문구에서 특별히 언급하지 않는 한 복수형도 포함한다.
명세서에서 사용되는 "포함한다 (comprises)" 또는 "포함하는 (comprising)"은 언급된 구성 요소, 단계, 동작 또는 소자는 하나 이상의 다른 구성 요소, 단계, 동작 또는 소자의 존재 또는 추가를 배제하지 않는다.
이하, 도면들을 참조하여 본 발명의 몇몇 실시예들을 설명한다.
도 1은 본 발명의 일 실시예에 따른 연구자 검색 서비스 제공 시스템(10)의 구성도이다.
도 1을 참조하면, 본 발명의 일 실시예에 따른 연구자 검색 서비스 제공 시스템(10)은 적어도 하나의 검색 클라이언트 단말(200)과 검색 서비스 제공 장치(100)를 포함할 수 있다. 단, 이는 본 발명의 목적을 달성하기 위한 바람직한 실시예일뿐이며, 필요에 따라 일부 구성 요소가 추가되거나 삭제될 수 있음은 물론이다. 도 1에서는 연구자 검색 서비스 제공 시스템(10)에 복수의 검색 클라이언트 단말(200)이 포함되는 경우를 예로써 도시하였다.
검색 클라이언트 단말(200)은 관심 연구자에 대한 검색 요청을 연구자 검색 서비스 제공 장치(100)로 송신하고, 상기 관심 연구자에 관한 학술 정보(e.g. 소속 기관, 연구 분야, 발행 논문 등)를 검색 결과로 수신하는 컴퓨팅 장치이다. 여기서, 상기 컴퓨팅 장치는, 노트북, 데스크톱(desktop), 랩탑(laptop), 스마트폰(Smart Phone) 등이 될 수 있으나, 이에 국한되는 것은 아니며 연산 수단 및 통신 수단이 구비된 모든 종류의 장치를 포함할 수 있다.
본 실시예에서, 검색 클라이언트 단말(200)은 관심 연구자 외에도 연구 주제, 소속 기관, 학술지명, 특정 연도 등을 검색어로 하여 검색을 요청하고, 상기 요청에 따른 검색 결과를 수신할 수 있다. 또한, 검색 클라이언트 단말(200)은 검색 연산자(e.g. AND, OR 등)와 복수의 검색어로 구성된 검색식을 이용하여 검색을 요청할 수도 있다.
본 실시예에서, 검색 클라이언트 단말(200)은 관심 연구자의 성향, 협력도 등의 분석 지표에 따른 연구자 별 통계 정보, 연구 주제 별 통계 정보, 관심 연구자의 연구 성과에 관한 통계 정보, 관심 연구자와 협업 연구자 간의 연구 네트워크에 관한 통계 정보 등의 다양한 통계 정보를 요청하고, 제공 받을 수 있다.
연구자 검색 서비스 제공 장치(100)는 검색 클라이언트 단말(200)의 검색 요청에 응답하여, 학술 정보 검색 서비스를 제공하는 컴퓨팅 장치이다. 여기서, 상기 컴퓨팅 장치는, 노트북, 데스크톱(desktop), 랩탑(laptop) 등이 될 수 있으나, 고성능의 서버 장치로 구현되는 것이 바람직할 수 있다. 단, 이에 국한되는 것은 아니며, 상기 컴퓨팅 장치는 연산 수단 및 통신 수단이 구비된 모든 종류의 장치를 포함할 수 있다.
본 실시예에서, 연구자 검색 서비스 제공 장치(100)는 적어도 하나의 데이터 소스로부터 학술 논문, 특허 문헌, 연구 보고서 등의 문헌 데이터를 획득할 수 있다. 이하에서는, 이해의 편의를 위해 다른 언급이 없는 한 상기 문헌 데이터는 학술 논문인 것을 예로 들어 설명하도록 한다. 단, 본 발명의 기술적 사상은 문헌 데이터의 유형에 국한되지 않음에 유의한다.
상기 데이터 소스는 외부의 저장소를 가리킬 수도 있고, 연구자 검색 서비스 제공 장치(100) 내부에 위치한 로컬 저장소를 가리킬 수도 있다. 실시예에 따라, 검색 서비스 제공 장치(100)는 웹 크롤링(crawling) 기술을 이용하여 인터넷 상의 복수의 데이터 소스로부터 문헌 데이터를 획득할 수도 있다.
본 실시예에서, 연구자 검색 서비스 제공 장치(100)는 문헌 데이터로부터 동일 연구자를 식별하고, 식별된 동일 연구자를 기준으로 연구자 전거 DB를 구축할 수 있다. 이와 같은 실시예에 한하여, 연구자 검색 서비스 제공 장치(100)는 연구자 전거 DB 구축 장치(100)로 명명될 수도 있다. 본 실시예에서, 동일 연구자를 정확하게 식별하기 위해, 이메일, 공동 저자, 소속 기관 등의 정보가 연구자 식별 자질(feature)로 이용될 수 있다. 상기 연구자 식별 자질을 이용하여 저자를 식별하고 전거 DB를 구축하는 방법에 대한 자세한 설명은 도 15 내지 도 17을 참조하여 후술하도록 한다.
본 실시예에서, 연구자 검색 서비스 제공 장치(100)는 검색 클라이언트 단말(200)로부터 수신된 검색어 또는 검색식에 따라 기 구축된 연구자 전거 DB에서 검색을 수행하고, 검색된 학술 정보를 제공할 수 있다. 상기 검색어는 상술한 바와 같이 연구자, 소속 기관, 연구 분야, 연구 주제 등을 포함할 수 있다. 참고로, 본 명세서에서 연구 주제는 동일한 연구 분야에 속한 세부 연구 분야를 가리키는 것으로 이해될 수 있다.
또한, 연구자 검색 서비스 제공 장치(100)는 검색된 학술 정보 외에도 다양한 기준에 따라 분석된 통계 정보를 검색 클라이언트 단말(200)로 제공할 수 있다. 예를 들어, 연구자 검색 서비스 제공 장치(100)는 연구자의 성향, 협력도, 생산성, 지속성 등의 기 설정된 분석 지표에 따른 연구자 별 통계 정보, 연구 주제 별 통계 정보, 연구자와 협업 연구자 간의 연구 네트워크에 관한 통계 정보 등의 통계 정보를 제공할 수 있다. 또한, 상기 통계 정보는 그래프, 네트워크 등의 형태로 시각화되어 제공될 수 있다. 이에 대한 자세한 설명은 도 8 내지 도 10에 도시된 예를 참조하여 후술하도록 한다.
본 발명의 일 실시예에 따른 연구자 검색 서비스 제공 시스템(10)에서, 검색 클라이언트 단말(200)과 검색 서비스 제공 장치(100)는 네트워크를 통해 통신할 수 있다. 여기서, 상기 네트워크는 근거리 통신망(Local Area Network; LAN), 광역 통신망(Wide Area Network; WAN), 이동 통신망(mobile radio communication network), Wibro(Wireless Broadband Internet) 등과 같은 모든 종류의 유/무선 네트워크로 구현될 수 있다.
지금까지 도 1을 참조하여 본 발명의 일 실시예에 따른 연구자 검색 서비스 시스템(10)에 대하여 설명하였다. 다음으로, 본 발명의 다른 실시예에 따른 연구자 검색 서비스 제공 장치(100)의 구성 및 동작에 대하여 도 2 내지 도 4를 참조하여 설명한다.
도 2는 본 발명의 또 다른 실시예에 따른 연구자 검색 서비스 제공 장치(100)의 블록도이다.
도 2는 참조하면, 연구자 검색 서비스 제공 장치(100)는 인터페이스부(110), 문헌 데이터 획득부(120), 전거 DB 구축부(130), 전거 DB(140), 검색부(150), 분석부(160) 및 시각화부(170)를 포함할 수 있다. 다만, 도 2에는 본 발명의 실시예와 관련 있는 구성요소들만이 도시되어 있다. 따라서, 본 발명이 속한 기술분야의 통상의 기술자라면 도 2에 도시된 구성요소들 외에 다른 범용적인 구성 요소들이 더 포함될 수 있음을 알 수 있다.
각 구성 요소를 살펴보면, 인터페이스부(110)는 연구자 검색 서비스 제공 장치(100)와 다른 장치 간의 인터페이스 기능을 제공한다. 예를 들어, 인터페이스부(110)는 외부에 위치한 데이터 소스로부터 문헌 데이터를 수신할 수 있다. 이를 위해, 인터페이스부(110)는 네트워크 인터페이스부(미도시)를 포함하도록 구성될 수 있다. 또한, 상기 네트워크 인터페이스부(미도시)는 데이터를 송수신 하기 위한 유선 인터넷 모듈, 이동통신 모듈 또는 무선통신 모듈을 구비할 수 있다.
본 실시예에서, 인터페이스부(110)는 적어도 하나의 검색 클라이언트 단말(200)로부터 검색 요청 또는 분석 요청을 수신하고, 검색부(150) 또는 분석부(160)가 제공하는 검색 결과 또는 분석 결과를 검색 클라이언트 단말(200)로 전송할 수 있다. 이를 위해, 인터페이스부(110)는 다양한 형태의 사용자 인터페이스를 제공하는 사용자 인터페이스부(미도시)를 포함하도록 구성될 수 있다. 예를 들어, 상기 사용자 인터페이스부(미도시)는 웹 인터페이스를 제공할 수 있다.
본 실시예에서, 사용자 인터페이스부(미도시)에 의해 제공되는 검색 결과 또는 분석 결과는 시각화부(170)에 의해 가공된 정보일 수 있다. 이에 대한 자세한 설명은 도 8 내지 도 10에 도시된 예시를 참조하여 후술하도록 한다.
문헌 데이터 획득부(120)는 내부 또는 외부의 데이터 소스로부터 다양한 유형의 문헌 데이터를 획득한다. 전술한 바와 같이, 상기 문헌 데이터는 학술 논문, 특허 문헌 및 연구 보고서 등을 포함할 수 있으나 이에 국한되는 것은 아니다. 실시예에 따라, 문헌 데이터 획득부(120)는 웹 크롤링 기술을 이용하여 인터넷 상의 복수의 데이터 소스로부터 문헌 데이터를 획득할 수도 있다.
전거 DB 구축부(130)는 획득된 문헌 데이터를 토대로 연구자 전거 DB(140)를 구축한다. 이를 위해, 전거 DB 구축부(130)는 도 3에 도시된 바와 같이 문헌 메타데이터 추출부(131), 동명 인물 클러스터 구축부(132), 식별 자질 추출부(134), 동일 인물 클러스터 구축부(135), 클러스터 검증부(137) 및 전거 레코드 생성부(138)를 포함하도록 구성될 수 있다. 이하에서는, 중복된 설명을 배제하기 위해, 전거 DB 구축부(130)의 각 기능 블록에 대하여 간략하게 설명하고, 전거 DB 구축부(130)가 수행하는 연구자 전거 DB 구축 방법에 대한 자세한 설명은 도 15 내지 도 17을 참조하여 후술하도록 한다.
도 3을 참조하면, 문헌 메타데이터 추출부(131)는 획득된 문헌 데이터에서 문헌 메타데이터를 추출한다. 여기서, 상기 문헌 메타데이터는 예를 들어 문헌의 서지 정보를 의미할 수 있고, 상기 서지 정보에는 문헌의 저자에 관한 인적 정보 및 문헌 자체에 관한 문헌 정보가 포함될 수 있다. 또한, 상기 인적 정보에는 예를 들어 주저자 또는 공동 저자의 연구자명, 이메일, 소속 기관, 전화 번호 등이 포함될 수 있고, 상기 문헌 정보에는 문헌 제목, 발행일자, 학술지명, 학회명, 연구 분야, 연구 주제, 주요 키워드 등이 포함될 수 있다. 참고로, 상기 문헌 메타데이터로 추출된 각 정보는 연구자 전거 레코드의 세부 항목을 구성하는 데 이용될 수 있으며, 상기 연구자 전거 레코드의 세부 항목은 실시예에 따라 달라질 수 있을 것이다.
동명 인물 클러스터 구축부(132)는 문헌 메타데이터에서 연구자명을 추출하고, 동일 또는 유사한 연구자명이 포함된 문헌 메타데이터를 그룹핑하여 동명 인물 클러스터(133)를 구축한다.
식별 자질 추출부(134)는 문헌 메타데이터에서 동일 연구자 식별을 위해 이용되는 연구자 식별 자질을 추출한다. 상기 연구자 식별 자질은 인적 정보뿐만 아니라 문헌 정보에서도 추출될 수 있다. 문헌의 유형이 학술 논문인 경우, 상기 연구자 식별 자질은 예를 들어 주저자의 이메일 주소, 공동 저자의 이름, 주저자의 소속 기관, 주저자의 학술지명 등을 포함할 수 있다. 여기서, 문헌의 유형이 특허 문헌인 경우, 상기 주저자는 예를 들어 발명자 또는 출원인을 포함할 수 있고, 상기 공동 저자는 예를 들어 공동 발명자를 포함할 수 있으며, 상기 소속 기관은 발명자 또는 출원인이 소속된 소속 기관을 포함할 수 있다. 또한, 문헌의 유형이 연구보고서인 경우, 상기 공동 저자는 예를 들어 연구 참여자를 포함할 수 있으며, 상기 소속 기관은 주관 연구기관을 포함할 수 있다.
동일 인물 클러스터 구축부(135)는 적어도 하나의 연구자 식별 자질로 구성된 식별 규칙을 이용하여 동명 인물 클러스터(133)에서 동일 연구자를 식별하고, 상기 동일 연구자가 포함된 문헌 메타데이터를 그룹핑하여 동일 인물 클러스터(136)를 구축한다.
클러스터 검증부(137)는 동일 인물 클러스터(136)에 포함된 문헌 메타데이터 간의 유사도를 산출하고, 상기 유사도 기반으로 동일 인물 클러스터(136)의 정확도를 검증한다. 본 실시예에서, 정확도가 검증된 동일 인물 클러스터를 이용하여 전거 레코드가 생성될 수 있다.
전거 레코드 생성부(138)는 동일 인물 클러스터(136)에 포함된 문헌 메타데이터의 각 정보를 연계하여 연구자 전거 레코드를 생성한다. 예를 들어, 전거 레코드 생성부(138)는 동일 인물로 식별된 저자와 문헌 메타데이터에 포함된 해당 저자의 소속 기관, 학술지, 연구 분야, 공동 저자 등의 정보를 연계하여 연구자 전거 레코드를 생성할 수 있다.
다시 도 2를 참조하면, 전거 DB(140)는 상기 연구자 전거 레코드가 축적되어 구축된 연구자 전거 DB를 의미한다.
검색부(150)는 검색 요청에 포함된 검색어 또는 검색식에 따라 전거 DB(140)에서 검색을 수행하고, 검색 결과를 제공한다. 예를 들어, 검색어가 연구자의 이름인 경우, 상기 연구자에 관한 학술 정보가 검색 결과로 제공될 수 있다. 또 다른 예를 들어, 검색어가 연구 주제를 가리키는 키워드인 경우, 상기 연구 주제와 관련된 연구자들의 리스트, 상기 관심 연구 주제와 관련된 문헌 등이 연구 결과로 제공될 수 있다.
분석부(160)는 전거 DB(140)에 저장된 연구자의 학술 정보를 분석하여 다양한 통계 정보를 제공한다. 이를 위해, 분석부(160)는 도 4에 도시된 바와 같이 연구 성과 분석부(141), 연구 지표 분석부(142) 및 연구자 관계 분석부(143)를 포함하도록 구성될 수 있다.
도 4를 참조하면, 연구 성과 분석부(141)는 다양한 기준에 따라 연구 성과에 관한 통계 정보를 제공한다. 예를 들어, 연구 성과 분석부(141)는 연구자별 발행 문헌의 건수, 연도별 발행 문헌의 건수, 연구 주제별 발행 문헌의 건수, 특정 연구자의 연도별 연평균 발행 문헌의 건수 등의 정보를 제공할 수 있다. 이때, 상기 발행 문헌의 수는 문헌의 유형(e.g. 학술 논문, 특허 문헌, 연구 보고서 등)에 따라 별도의 통계치가 제공될 수도 있다.
연구 지표 분석부(142)는 연구 성과 분석부(141)에 의해 제공된 연구 성과 정보를 기 설정된 분석 지표에 따라 분석하고, 상기 분석 지표에 따른 통계 정보를 제공한다. 상기 분석 지표는 예를 들어 하기 표 1에 표시된 분석 지표를 포함할 수 있다.
분석 지표 내용
성향 해당 연구자의 전체 발행 문헌 대비 학술 논문, 특허 문헌 및 연구 보고서의 비율(%)
협력도 연구 분야별(또는 주제별)로 해당 연구자가 협업 연구자와 공동으로 발행한 문헌의 건수
생산성 해당 연구자가 발행한 연구 분야별(또는 주제별) 문헌의 건수
지속성 해당 연구자의 연도별 연평균 발행 문헌의 건수
다양성 해당 연구자의 발행 문헌과 관련된 연구 주제(또는 분야)의 수
포지션 소속 기관에서 발행된 연구 분야별(또는 주제별) 발행 문헌 건수 대비 해당 연구자의 발행 문헌 건수
참고로, 상기 표 1에서 '문헌의 건수'로 기재된 분석 지표는 실시예에 따라 '문헌의 평균 건수'로 분석될 수도 있고, 각 분석 지표는 문헌의 유형(e.g. 학술 논문, 특허 문헌, 연구 보고서)별, 연구 분야별, 연구 주제별로 별도의 통계 정보로 제공될 수 도 있다.
본 발명의 실시예에 따르면, 연구 지표 분석부(142)는 전체 연구자에 관한 학술 정보를 상기 표 1에 표시된 분석 지표에 따라 분석하여 함께 제공할 수도 있다. 여기서, 상기 전체 연구자는 특정 연구 분야(또는 주제)에 한정된 전체 연구자를 의미하는 것일 수도 있다. 예를 들어, 연구 지표 분석부(142)는 상기 분석 지표에 따라 분석된 개별 연구자의 통계 정보와 해당 연구자가 속한 연구 분야의 전체 연구자에 대한 평균 통계 정보를 함께 제공할 수 있다. 본 실시예에 따르면, 비교 대상에 대한 통계 정보가 함께 제공되는 바, 정보 전달성이 향상되는 효과가 있다.
연구자 관계 분석부(143)는 해당 연구자와 협업 연구자와의 연구 관계, 해당 연구자가 소속된 소속 기관과 협업 기관과의 연구 관계 등에 대한 분석 정보를 제공한다. 예를 들어, 연구자 관계 분석부(143)는 특정 연구 분야에서 공동 연구를 수행한 연구자들의 정보, 공동 연구의 수행 빈도수 등에 관한 통계 정보를 제공할 수 있다.
다시, 도 2를 참조하면, 시각화부(170)는 검색부(150) 또는 분석부(160)에 의해 제공되는 학술 정보를 소정의 형태로 시각화하여 제공할 수 있다. 예를 들어, 시각화부(170)는 분석부(160)에 의해 제공되는 각종 분석 지표에 따른 통계 정보를 막대 그래프, 파이 그래프 등의 형태로 시각화하여 제공할 수 있다. 또 다른 예를 들어, 시각화부(170)는 분석부(160)에 의해 제공되는 연구자와 협업 연구자 간의 연구 관계에 관한 통계 정보를 방사형 네트워크로 시각화하여 제공할 수 있다. 이에 대한 자세한 설명은 도 8 내지 도 10에 도시된 예시를 참고하여 후술하도록 한다.
도 2 내지 도 4의 각 구성 요소는 소프트웨어(Software) 또는, FPGA(Field Programmable Gate Array)나 ASIC(Application-Specific Integrated Circuit)과 같은 하드웨어(Hardware)를 의미할 수 있다. 그렇지만, 상기 구성 요소들은 소프트웨어 또는 하드웨어에 한정되는 의미는 아니며, 어드레싱(Addressing)할 수 있는 저장 매체에 있도록 구성될 수도 있고, 하나 또는 그 이상의 프로세서들을 실행시키도록 구성될 수도 있다. 상기 구성 요소들 안에서 제공되는 기능은 더 세분화된 구성 요소에 의하여 구현될 수 있으며, 복수의 구성 요소들을 합하여 특정한 기능을 수행하는 하나의 구성 요소로 구현될 수도 있다.
보다 이해의 편의를 제공하기 위해, 도 5 내지 도 12를 참조하여, 본 발명의 일 구현예에 따른 사용자 인터페이스와 검색 결과로 제공되는 관심 연구자의 학술 정보 및 통계 정보를 예를 들어 설명하도록 한다.
도 5는 본 발명의 일 구현예에서 검색 결과가 제공되는 사용자 인터페이스의 예를 도시한다. 예를 들어, 도 5에 도시된 사용자 인터페이스는 인터페이스부(110)가 제공하는 웹 인터페이스일 수 있다.
도 5를 참조하면, 검색 클라이언트 단말(200)의 사용자가 검색 인터페이스(301)에 관심 연구 주제를 가리키는 검색어 "생분해성"을 입력하는 경우, 연구자 검색 서비스 제공 장치(100)에 의해 "생분해성"에 관련된 연구자 리스트(302, 303, …)가 검색 결과로 제공될 수 있다. 또한, 연구자 리스트(302, 303, …)에 포함된 연구자의 인적 정보(e.g. 연구자의 이름, 소속 기관)가 같이 제공될 수 있다.
도 5에 도시된 연구자 리스트(302, 303, …)에서 어느 하나의 관심 연구자에 대한 선택 입력이 수신되면 도 6에 도시된 사용자 인터페이스가 제공될 수 있다.
도 6을 참조하면, 본 발명의 일 구현예에서, 연구자 검색 서비스 제공 장치(100)는 도 6에 도시된 사용자 인터페이스를 통해 상기 관심 연구자에 관한 학술 정보 및 통계 정보를 제공할 수 있다. 사용자 편의를 위해 상기 관심 연구자에 관한 학술 정보 및 통계 정보는 복수의 서브 페이지(310, 320, 330, 340, 350)로 나눠서 제공될 수 있다. 예를 들어, 복수의 서브 페이지(310, 320, 330, 340, 350)는 관심 연구자의 학술 정보 및 통계 정보에 관한 전반적인 요약 정보를 제공하는 제1 서브 페이지(310), 기 설정된 분석 지표에 따라 분석된 관심 연구자의 통계 정보를 제공하는 제2 서브 페이지(320), 관심 연구자와 협업 관계자와의 연구 관계에 관한 통계 정보를 제공하는 제3 서브 페이지(330), 관심 연구자의 연구 주제별 통계 정보를 제공하는 제4 서브 페이지(340) 및 관심 연구자가 발행한 문헌에 관한 정보를 제공하는 제5 서브 페이지(350)로 구성될 수 있다.
구체적으로, 제1 서브 페이지(310)에서, 관심 연구자의 관심 연구 분야(311), 주요 연구 주제(312), 연평균 성과물 건수(313), 최근 발행된 문헌 정보(314) 및 관심 연구자의 주요 협업 연구자, 주요 협업 연구 기관, 주요 학술지(315) 등에 관한 정보가 제공될 수 있다. 도 6 및 도 7에서 관심 연구자의 발행 문헌 건수를 기준으로 상위 5개의 연구 주제가 주요 연구 주제(312)로 제공되고, 공동 연구 빈도수를 기준으로 상위 3명의 협업 연구자가 주요 협업 연구자로 제공되는 것을 예로 도시되었다.
다음으로, 도 8 및 도 9를 참조하면, 제2 서브 페이지(320)에서, 관심 연구자의 연도별 발행 문헌 건수(321), 분석 지표에 따른 관심 연구자의 통계 정보(322 내지 327) 등이 제공될 수 있다. 도 8 및 도 9에서, 효과적인 정보 전달을 위해 상술한 통계 정보(321 내지 327)들이 막대 그래프, 파이 그래프 등의 형태로 시각화되어 제공되는 것을 예로 도시하였다. 단, 그래프의 형태는 실시예에 따라 얼마든지 달라질 수 있을 것이다.
제2 서브 페이지(320)에서, 연도별 발행 문헌 건수(321)는 문헌의 유형 별로 제공될 수 있다. 또한, 분석 지표에 따른 관심 연구자의 통계 정보(322 내지 327)는 전체 연구자에 관한 평균 통계와 함께 제공될 수 있다.
구체적으로, 제2 서브 페이지(320)에서, 연도별 발행 문헌 건수(321)를 통해 시간에 따른 관심 연구자의 연구 활동 정보가 제공될 수 있다. 또한, 연구 성향에 관한 통계 정보(322)를 통해 관심 연구자의 연구 성향이 대략적으로 파악될 수 있다. 예를 들어, 학술 논문의 비율이 높은 경우, 해당 연구자는 학술적인 연구를 주로 수행한다는 것을 알 수 있고, 특허 문헌의 비율이 높은 경우, 실용적인 연구를 주로 수행한다는 것을 알 수 있다.
협력도에 관한 통계 정보(323)를 통해 특정 연구 분야의 평균 대비 관심 연구자가 다른 연구자와 협업하는 정도에 관한 정보가 제공될 수 있고, 생산성에 관한 통계 정보(324)를 통해 특정 연구 분야에서 관심 연구자의 연구 성과가 명확하게 전달될 수 있다. 이외에도, 지속성, 다양성 및 포지션(325 내지 327)에 관한 통계 정보를 통해 다각도로 분석된 관심 연구자의 연구 성향 정보가 제공될 수 있다.
다음으로, 도 10을 참조하면, 제3 서브 페이지(330)에서, 관심 연구자와 협업 연구자 간의 연구 관계에 관한 통계 정보(331, 이하 '공동 연구자 네트워크'로 명명함), 협업 연구 기관 간의 관계에 관한 통계 정보(332, 이하 '공저자 기반 협업 기관'으로 명명함) 등이 제공될 수 있다. 공동 연구자 네트워크(331)는 도 10에 도시된 바와 같이 방사형 네트워크의 형태로 시각화되어 제공될 수 있다. 상기 방사형 네트워크에서, 중심 노드(331a)는 상기 관심 연구자에 대응되고, 주변 노드(331c)는 각각의 협업 연구자와 대응되며, 중심 노드와 주변 노드 간의 거리(33b)는 공동 연구의 빈도수에 기초하여 결정될 수 있다. 예를 들어, 거리(33b)는 공동 연구의 수행 빈도수에 반비례하도록 시각화될 수 있고, 상기 공동 연구의 빈도수는 공저자로 포함된 발행 문헌의 건수를 이용하여 산출될 수 있다.
실시예에 따라, 중심 노드의 크기는 관심 연구자의 협력도에 비례 또는 반비례하도록 표시될 수 있고, 주변 노드의 크기는 대응되는 협력 연구자의 협력도에 비례 또는 반비례 하도록 시각화될 수도 있다. 상기와 같은 예시에 따르면, 사용자들이 집약된 정보를 한눈에 파악할 수 있을 것인 바, 정보의 표현성 및 전달성이 향상되는 효과가 있다.
다음으로, 도 11을 참조하면, 공저자 기반 협업 기관(332)에서, 협업 연구자가 소속된 연구 기관을 가리키는 협업 연구 기관에 관한 정보가 제공될 수 있다. 위 정보를 토대로, 사용자는 다학제적인 융합 연구가 진행되었는지 여부를 판단할 수 있고, 타 연구 기관과의 협력 기회를 모색할 수도 있을 것이다.
다음으로, 도 12를 참조하면, 제4 서브 페이지(340)에서, 관심 연구자의 연도별 연구 분야 또는 연구 주제에 관한 통계 정보(341, 342)가 제공될 수 있다. 통계 정보(341, 342)는 도 12를 통해 직관적으로 파악이 가능한 바, 이에 대한 설명은 생략하도록 한다.
본 발명의 실시예에 따르면, 관심 연구자뿐만 아니라 전체 연구자의 연도별 연구 분야 또는 연구 주제에 관한 통계 정보가 제공될 수도 있다. 본 실시예에 따르면, 사용자는 연구 트렌드의 흐름 또는 최근 연구 동향 등의 가치 있는 정보를 제공 받을 수 있다.
지금까지, 도 5 내지 도 12를 참조하여, 본 발명의 일 구현예에 따라 다양한 학술 정보 및 통계 정보가 제공되는 예에 대하여 설명하였다. 다음으로, 도 13을 참조하여, 본 발명의 또 다른 실시예에 따른 연구자 검색 서비스 제공 장치(100)에 대하여 설명하도록 한다.
도 13은 본 발명의 또 다른 실시예에 따른 연구자 검색 서비스 제공 장치(100)의 하드웨어 구성도이다.
도 13을 참조하면, 연구자 검색 서비스 제공 장치(100)는 하나 이상의 프로세서(101), 버스(105), 네트워크 인터페이스(107), 프로세서(101)에 의하여 수행되는 컴퓨터 프로그램을 로드(load)하는 메모리(103)와, 연구자 검색 서비스 소프트웨어(109a)를 저장하는 스토리지(109)를 포함할 수 있다. 다만, 도 13에는 본 발명의 실시예와 관련 있는 구성요소들만이 도시되어 있다. 따라서, 본 발명이 속한 기술분야의 통상의 기술자라면 도 13에 도시된 구성요소들 외에 다른 범용적인 구성 요소들이 더 포함될 수 있음을 알 수 있다.
프로세서(101)는 연구자 검색 서비스 제공 장치(100)의 각 구성의 전반적인 동작을 제어한다. 프로세서(101)는 CPU(Central Processing Unit), MPU(Micro Processor Unit), MCU(Micro Controller Unit), GPU(Graphic Processing Unit) 또는 본 발명의 기술 분야에 잘 알려진 임의의 형태의 프로세서를 포함하여 구성될 수 있다. 또한, 프로세서(101)는 본 발명의 실시예들에 따른 방법을 실행하기 위한 적어도 하나의 애플리케이션 또는 프로그램에 대한 연산을 수행할 수 있다. 연구자 검색 서비스 제공 장치(100)는 하나 이상의 프로세서를 구비할 수 있다.
메모리(103)는 각종 데이터, 명령 또는 정보를 저장한다. 메모리(103)는 본 발명의 실시예들에 따른 연구자 검색 서비스 제공 방법을 실행하기 위하여 스토리지(109)로부터 하나 이상의 프로그램(109a)을 로드할 수 있다. 도 6에서 메모리(103)의 예시로 RAM이 도시되었다.
버스(105)는 연구자 검색 서비스 제공 장치(100)의 구성 요소 간 통신 기능을 제공한다. 버스(105)는 주소 버스(Address Bus), 데이터 버스(Data Bus) 및 제어 버스(Control Bus) 등 다양한 형태의 버스로 구현될 수 있다.
네트워크 인터페이스(107)는 연구자 검색 서비스 제공 장치(100)의 유무선 인터넷 통신을 지원한다. 또한, 네트워크 인터페이스(107)는 인터넷 통신 외의 다양한 통신 방식을 지원할 수도 있다. 이를 위해, 네트워크 인터페이스(107)는 본 발명의 기술 분야에 잘 알려진 통신 모듈을 포함하여 구성될 수 있다.
스토리지(109)는 연구자 전거 데이터(109b) 및 하나 이상의 프로그램(109a)을 비임시적으로 저장할 수 있다. 도 13에서 상기 하나 이상의 프로그램(109a)의 예시로 연구자 검색 서비스 소프트웨어(109a)가 도시되었다.
스토리지(109)는 ROM(Read Only Memory), EPROM(Erasable Programmable ROM), EEPROM(Electrically Erasable Programmable ROM), 플래시 메모리 등과 같은 비휘발성 메모리, 하드 디스크, 착탈형 디스크, 또는 본 발명이 속하는 기술 분야에서 잘 알려진 임의의 형태의 컴퓨터로 읽을 수 있는 기록 매체를 포함하여 구성될 수 있다.
연구자 검색 서비스 소프트웨어(109a)는 본 발명의 실시예에 따라 연구자 검색 서비스 제공 방법을 수행할 수 있다. 예를 들어, 연구자 검색 서비스 소프트웨어(109a)는 획득된 문헌 데이터를 기초로 연구자 전거 DB를 구축하고, 검색 요청에 응답하여 상기 연구자 전거 DB의 검색 결과를 제공할 수 있다.
구체적으로, 연구자 검색 서비스 소프트웨어(109a)는 메모리(103)에 로드되어, 하나 이상의 프로세서(101)에 의해, 학술 논문, 특허 문헌 및 연구 보고서 중 적어도 하나의 문헌 유형에 관한 문헌 데이터를 획득하는 오퍼레이션, 상기 문헌 데이터에서 추출된 연구자 식별 자질을 이용하여 동일 연구자를 식별하고, 상기 식별된 동일 연구자를 기준으로 연구자 전거 DB를 구축하는 오퍼레이션, 적어도 하나의 검색 클라이언트 단말로부터 수신된 관심 연구자에 대한 검색 요청에 응답하여, 상기 연구자 전거 DB에서 검색된 상기 관심 연구자에 관한 학술 정보를 제공하는 오퍼레이션 및 상기 관심 연구자에 관한 학술 정보를 기초로, 상기 관심 연구자에 관한 통계 정보를 제공하는 오퍼레이션을 실행할 수 있다.
한편, 본 발명의 실시예에 따르면, 문헌 데이터로부터 연구자 전거 DB를 구축하는 연구자 전거 DB 구축 장치(100)가 제공될 수도 있다. 연구자 전거 DB 구축 장치(100)는, 하나 이상의 프로세서(101), 네트워크 인터페이스(107), 상기 프로세서(101)에 의하여 수행되는 컴퓨터 프로그램을 로드(Load)하는 메모리 및 복수의 문헌 데이터 및 상기 컴퓨터 프로그램을 저장하는 스토리지를 포함하되, 상기 컴퓨터 프로그램은, 학술 논문, 특허 문헌 및 연구 보고서 중 적어도 하나의 문헌이 포함된 문헌 데이터를 획득하는 오퍼레이션, 상기 문헌 데이터에서 문헌의 서지 정보를 가리키는 문헌 메타데이터를 추출하는 오퍼레이션, 연구자명을 기준으로 상기 문헌 메타데이터를 그룹핑하여 동명 인물 클러스터를 구축하는 오퍼레이션, 상기 문헌 메타데이터에서 기 지정된 연구자 식별 자질을 추출하는 오퍼레이션, 상기 연구자 식별 자질을 이용하여, 상기 동명 인물 클러스터로부터 동일 인물 클러스터를 구축하는 오퍼레이션 및 상기 동일 인물 클러스터에 포함된 문헌 메타데이터를 연계하여, 상기 연구자 전거 DB를 구축하는 오퍼레이션을 포함할 수 있다.
이하에서는, 도 14 내지 도 17을 참조하여 본 발명의 또 다른 실시예에 따른 연구자 검색 서비스 제공 방법에 대하여 상세하게 설명한다.
이하, 본 발명의 실시예에 따른 연구자 검색 서비스 제공 방법의 각 단계는, 컴퓨팅 장치에 의해 수행될 수 있다. 예를 들어, 상기 컴퓨팅 장치는 본 발명의 실시예에 따른 연구자 검색 서비스 제공 장치(100) 또는 연구자 전거 DB 구축 장치(100)일 수 있다. 단, 설명의 편의를 위해, 상기 연구자 검색 서비스 제공 방법에 포함된 각 단계를 수행하는 주체는 그 기재가 생략될 수 있다. 한편, 상기 연구자 검색 서비스 제공 방법의 각 단계는 연구자 검색 서비스 소프트웨어(109a)가 프로세서(101)에 의해 실행됨으로써, 연구자 검색 서비스 제공 장치(100) 또는 연구자 전거 DB 구축 장치(100)에 의해 수행되는 오퍼레이션일 수 있다.
도 14는 본 발명의 실시예에 따른 연구자 검색 서비스 제공 방법의 흐름도다. 단, 이는 본 발명의 목적을 달성하기 위한 바람직한 실시예일뿐이며, 필요에 따라 일부 단계가 추가되거나 삭제될 수 있음은 물론이다.
도 14를 참조하면, 연구자 검색 서비스 제공 장치(100)는 학술 논문, 특허 문헌 및 연구 보고서 등의 문헌 데이터를 기 지정된 데이터 소스에서 획득한다(S100). 전술한 바와 같이, 상기 데이터 소스는 외부의 저장소에 위치할 수 있고, 장치(100)의 로컬 저장소에 위치할 수도 있다. 또한, 연구자 검색 서비스 제공 장치(100)는 외부의 데이터 소스로부터 상기 문헌 데이터를 획득하기 위해 웹 크롤링 기법을 이용할 수도 있다.
문헌 데이터가 획득되면, 연구자 검색 서비스 제공 장치(100)는 문헌 데이터에서 문헌 메타데이터를 추출하고, 상기 문헌 메타데이터에서 동일 연구자를 식별한 뒤, 상기 동일 연구자를 기준으로 연구자 전거 DB 구축한다(S200). 본 단계(S200)에 대한 보다 상세한 설명은 도 15를 참조하여 후술하도록 한다.
연구자 전거 DB가 구축되면, 연구자 검색 서비스 제공 장치(100)는 검색 클라이언트 단말(200)의 사용자에게 연구자 검색 서비스를 제공할 수 있다. 상기 연구자 검색 서비스는 예를 들어 요청 및 응답 방식으로 제공될 수 있다. 보다 자세하게는, 연구자 검색 서비스 제공 장치(100)는 검색 클라이언트 단말(200)로부터 관심 연구자에 대한 검색 요청을 수신하고, 상기 검색 요청에 응답하여, 관심 연구자에 관한 학술 정보를 검색 결과로 제공할 수 있다(S300, S400).
본 발명의 몇몇 실시예에서, 연구자 검색 서비스 제공 장치(100)는 상기 관심 연구자에 관한 통계 정보를 더 제공할 수 있다. 상기 통계 정보는 전술한 바와 같은 바 이에 대한 설명은 생략하도록 한다.
지금까지, 도 14를 참조하여 본 발명의 실시예에 따른 연구자 검색 서비스 제공 방법에 대하여 설명하였다. 다음으로, 도 15 내지 도 17을 참조하여 연구자 전거 DB 구축 단계(S200)에 대하여 설명하도록 한다.
도 15는 연구자 전거 DB 구축 단계(S200)의 상세 흐름도다. 단, 이는 본 발명의 목적을 달성하기 위한 바람직한 실시예일뿐이며, 필요에 따라 일부 단계가 추가되거나 삭제될 수 있음은 물론이다.
도 15를 참조하면, 연구자 전거 DB를 구축하기 위해, 연구자 전거 DB 구축 장치(100)는 문헌 데이터로부터 문헌 메타데이터를 추출한다(S210). 다음으로, 연구자 전거 DB 구축 장치(100)는 연구자명 기준으로 상기 문헌 메타데이터를 그룹핑하여 동명 인물 클러스터를 생성한다(S220).
일 실시예에서, 연구자 전거 DB 구축 장치(100)는 한글 연구자명이 일치하는 문헌 메타데이터를 그룹핑하여 동명 인물 클러스터를 생성할 수 있다. 본 실시예에서, 문헌 메타데이터에 영문 연구자명만이 존재하는 경우에는, 영문 연구자명을 한글 연구자명으로 변환한 뒤, 연구자명의 일치 여부가 판정될 수 있다. 본 실시예에 따르면, 한글 연구자명을 가리키는 문자열 간의 완전 매칭(exact matching)을 통해 손쉽게 동명 인물 클러스터가 구축되는 바, 간이한 구현이 가능하다는 장점이 있다.
다른 실시예에서, 연구자 전거 DB 구축 장치(100)는 한글 또는 영문 연구자명 중 어느 하나의 연구자명이 일치하는 문헌 메타데이터를 그룹핑하여 동명 인물 클러스터를 생성할 수 있다. 본 실시예에 따르면, 한글 또는 영문 연구자명에 일부 오기가 존재하더라도 효과적으로 동명 인물 클러스터가 구축될 수 있다.
또 다른 실시예에서, 연구자 전거 DB 구축 장치(100)는 자소 단위의 문자열 유사도를 기초로 문헌 메타데이터를 그룹핑할 수 있다. 예를 들어, 한글 또는 영문 연구자명을 자소 단위로 분할하고, 일치하는 자소의 개수를 기초로 문자열 유사도를 산출한 뒤, 상기 문자열 유사도가 임계 값 이상인 문헌 메타데이터를 그룹핑하여 동명 인물 클러스터가 구축될 수 있다. 본 실시예에 따라 생성된 동명 인물 클러스터의 예시는 도 16에 도시되어 있다. 도 16을 참조하면, 연구자명이 "홍길동", "홍기동", "홍길도"에 해당하는 문헌 메타데이터가 동일한 동명 인물 클러스터에 포함된 것을 볼 수 있다. 본 실시예에 따르면, 한글 또는 영문 연구자명에 일부 오기가 존재하는 경우에도 효과적으로 동명 인물 클러스터가 구축될 수 있다.
참고로, 상술한 몇몇 실시예들에서, 하나의 문헌 메타데이터는 복수의 동명 인물 클러스터에 속할 수도 있음에 유의해야 한다. 예를 들어, 연구자명이 "홍기동"인 제1 문헌 메타데이터는, 대표 연구자명이 "홍길동"인 제1 동명 인물 클러스터에 속하고, 동시에 대표 연구자명이 "홍기동"인 제2 동명 인물 클러스터에 속할 수도 있다. 다만, 후술할 동일 인물 클러스터 생성 단계(S230)에서 동일 연구자가 식별되면 상기 제1 문헌 메타데이터는 하나의 동일 인물 클러스터에 속하게 될 것이다.
동명 인물 클러스터가 구축되면, 연구자 전거 DB 구축 장치(100)는 상기 동명 인물 클러스터에 포함된 문헌 메타데이터에서 기 지정된 연구자 식별 자질을 추출하고, 상기 연구자 식별 자질을 이용하여 동일 인물 클러스터를 구축한다(S230). 동일 인물 클러스터 구축 단계(S230)에 대한 보다 상세한 설명은 도 17을 참조하여 후술하도록 한다.
동일 인물 클러스터가 구축되면, 연구자 전거 DB 구축 장치(100)는 연구자 전거 데이터의 정확도를 보장하기 위해 각각의 동일 인물 클러스터에 대한 검증을 수행한다. 자세하게는, 상기 검증 단계에서, 각각의 동일 인물 클러스터 별로 클러스터에 속한 문헌 메타데이터 간의 유사도가 측정되고, 상기 유사도와 기 설정된 임계 값의 비교가 수행된다(S240, S250).
일 실시예에서, 상기 유사도는 클러스터 중심(centroid)과 클러스터에 속한 문한 메타데이터 사이의 평균 유클리드 거리(euclidian distance)에 기초하여 측정될 수 있다. 예를 들어, 문헌 메타데이터를 n차원(단, n은 문헌 메타데이터를 구성하는 세부 항목의 개수)의 좌표 공간에 매핑하고, 클러스터 중심과 각 문헌 메타데이터가 매핑된 좌표 사이의 유클리드 거리를 평균하여 평균 유클리드 거리가 측정될 수 있다.
단, 다른 실시예에서, 상기 유사도는 당해 기술 분야에서 잘 알려진 클러스터 유사도 측정 알고리즘을 이용하여 측정될 수도 있으며, 이는 어떠한 방식으로 측정되어도 무방하다.
상기 유사도가 임계 값 이상인 경우, 연구자 전거 DB 구축 장치(100)는 동일 인물 클러스터에 속한 문헌 메타데이터를 연계하여 연구자 전거 레코드를 생성한다(S260). 여기서, 상기 연구자 전거 레코드가 축적되어 연구자 전거 DB가 구축될 수 있다.
몇몇 실시예에서, 문헌 메타데이터를 구성하는 세부 항목 (e.g. 소속 기관, 학술지명, 연구 분야, 공동 저자 등) 별로 별도의 DB 테이블이 생성될 수 있고, 각 세부 항목에 식별자(e.g. 기본 키)가 부여될 수 있다. 이와 같은 경우, 상기 연구자 전거 레코드는 실제 정보 대신에 각 세부 항목을 참조하기 위한 참조 식별자(e.g. 외래 키)를 포함하는 형태로 생성될 수 있고, 생성된 연구자 전거 레코드에는 전거 식별자가 부여될 수 있다. 본 실시예에 따르면, 데이터의 중복이 최소화될 수 있고, DB 관리의 편의성이 증대될 수 있다.
지금까지, 도 15 및 도 16을 참조하여 연구자 전거 DB 구축 단계(S200)에 대하여 설명하였다. 다음으로, 동일 인물 클러스터 구축 단계(S230)에 대하여 설명하도록 한다.
전술한 바와 같이, 연구자 전거 DB 구축 장치(100)는 동명 인물 클러스터에 포함된 문헌 메타데이터에서 동일 연구자의 문헌 메타데이터를 식별하기 위해 적어도 하나의 연구자 식별 자질을 이용한다. 보다 자세하게는, 동명 인물 클러스터에 포함된 문헌 메타데이터에 적어도 하나의 연구자 식별 자질로 구성된 식별 규칙이 적용되고, 상기 식별 규칙을 만족하는 문헌 메타데이터를 그룹핑하여 동일 인물 클러스터가 구축될 수 있다. 여기서, 상기 식별 규칙은 동명 연구자에서 동일 연구자를 식별하기 위한 규칙을 말하며, 동일 인물 클러스터를 구축하기 위해 이용되는 식별 규칙의 개수, 식별 규칙의 적용 순서 등은 실시예에 따라 얼마든지 달라질 수 있다. 단, 이해의 편의를 제공하기 위해 복수의 식별 규칙을 이용하여 동일 인물 클러스터를 구축하는 단계(S230)의 예시를 도 17을 참조하여 설명하도록 한다.
이해의 편의를 제공하기 위해, 연구자 전거 DB 구축 장치(100)가 동명 인물 클러스터에 속한 어느 하나의 문헌 메타데이터를 기준 문헌 메타데이터로 선정하고, 상기 동명 인물 클러스터에서 비교 대상 문헌 메타데이터를 변경해가며 도 17에 도시된 식별 규칙을 적용한다고 가정한다. 이때, 상기 기준 문헌 메타데이터와 상기 비교 대상 문헌 메타데이터를 선정하는 방법은 어떠한 방식이 되더라도 무방할 것이다.
도 17을 참조하면, 먼저 제1 식별 규칙에 따라 기준 문헌 메타데이터와 비교 대상 문헌 메타데이터 간의 이메일 매칭 여부가 판정될 수 있다(S231). 본 실시예에서, 어느 하나의 식별 규칙이 만족되는 경우, 더 이상의 식별 규칙을 적용하지 않고, 비교 대상 문헌 메타데이터를 기준 문헌 메타데이터와 같은 동일 인물 클러스터로 그룹핑한다고 가정하였다. 단, 다른 실시예에 따르면, 복수의 식별 규칙을 모두 만족하는 문헌 메타데이터 또는 기 설정된 개수 이상의 식별 규칙을 만족하는 문헌 메타데이터를 그룹핑하여 동일 인물 클러스터가 구축될 수도 있다
상기 제1 식별 규칙이 만족되지 않는 경우, 제2 식별 규칙에 따라 공동 저자 2명의 이름이 매칭되는지가 판정될 수 있다(S232). 또한, 상기 제2 식별 규칙이 만족되지 않는 경우, 제3 식별 규칙에 따라 공동 저자 1명의 이름과 소속 기관의 명칭이 매칭되는지가 판정될 수 있다(S233). 또한, 상기 제3 식별 규칙이 만족되지 않는 경우, 제4 식별 규칙에 따라 1명 이상의 공동 저자명과 학술지명이 매칭되는지가 판정될 수 있다(S234). 또한, 상기 제4 식별 규칙이 만족되지 않는 경우, 제5 식별 규칙에 따라 소속 기관의 명칭과 학술지명이 매칭되는지가 판정될 수 있다(S235). 상기 제5 식별 규칙에도 만족되지 않는 경우, 상기 비교 대상 문헌 메타데이터의 저자는 상기 기준 문헌 메타데이터의 저자와 다른 연구자로 식별되는 것으로 이해될 수 있다.
본 실시예와 같이, 어느 하나의 식별 규칙을 만족하면 동일 인물 클러스터로 그룹핑되는 경우, 복수의 식별 규칙들 사이에 적용 순서가 존재할 수 있다. 예를 들어, 이메일 주소는 공동 저자 또는 소속 기관보다 식별 능력이 강하기 때문에, 이메일 주소가 포함된 식별 규칙을 먼저 적용하는 것이 효율적일 수 있다. 따라서, 본 발명의 일 실시예에서는, 도 17에 도시된 순서대로 식별 규칙이 적용될 수 있다. 다만, 본 발명의 다른 실시예에 따르면, 도 17에 도시된 바와 다른 순서로 식별 규칙이 적용될 수도 있다. 참고로, 상기 식별 능력이 강하다는 의미는 식별 자질이 일치하는 경우 동일인으로 식별될 확률이 높다는 것을 의미한다.
본 발명의 다른 실시예에 따르면, 다음과 같은 식별 규칙이 이용될 수도 있다. 예를 들어, 이메일 주소가 매칭되는 경우, 동일 연구자로 식별하는 제1 식별 규칙, 적어도 한 명의 공동 저자 이름이 매칭되는 경우, 동일 연구자로 식별하는 제2 식별 규칙, 주저자의 소속 기관이 매칭되는 경우, 동일 연구자로 식별하는 제3 식별 규칙 및 학술지명이 매칭되는 경우, 동일 연구자로 식별하는 제4 식별 규칙이 동일 연구자를 식별하기 위해 이용될 수 있다.
한편, 본 발명의 몇몇 실시예에 따르면, 만족되는 식별 규칙에 따라 각 문헌 메타데이터에 차등적인 가중치 점수가 부여될 수 있다. 예를 들어, 제1 식별 규칙을 만족하는 경우 제1 점수가 부여되고, 제2 식별 규칙을 만족하는 경우 제2 점수가 부여될 수 있다. 본 실시예에서, 상기 가중치 점수는 식별 규칙에 활용된 식별 자질의 식별 능력에 따라 설정될 수 있다. 예를 들어, 제1 식별 규칙에 활용된 식별 자질의 식별 능력이 더 높은 경우, 제1 점수는 제2 점수보다 더 높은 점수로 설정될 수 있다.
본 실시예에 따라 부여된 점수는 다양하게 활용될 수 있다. 예를 들어, 동일 인물 클러스터의 검증 단계(S250)에서 클러스터의 유사도가 임계 값 이하인 경우에 상기 부여된 점수가 활용될 수 있다. 구체적으로, 연구자 전거 DB 구축 장치(100)가 동일 인물 클러스터에서 부여된 점수가 임계 값 이하인 일부 문헌 메타데이터를 제외하고, 다시 클러스터의 유사도를 산출하도록 상기 부여된 점수가 활용될 수 있다. 본 실시예에서, 클러스터의 유사도가 재산출됨에 따라, 동일 인물 클러스터를 재구축하지 않고, 기 구축된 동일 인물 클러스터가 연구자 전거 DB를 구축하는데 이용될 가능성이 증가될 것인 바, 연구자 전거 DB를 구축하는데 소요되는 시간 비용 및 컴퓨팅 비용이 절감될 수 있다.
지금까지 도 14 내지 도 17을 참조하여 본 발명의 실시예에 따른 연구자 검색 서비스 제공 방법에 대하여 설명하였다. 상술한 바에 따르면, 문헌 메타데이터에 포함된 이메일 정보, 공동 저자의 이름 등의 정보를 연구자 식별 자질로 이용하여 동일 연구자를 식별하고, 식별된 저자에 대한 문헌 메타데이터를 연계하여 정확도 높은 연구자 전거 DB가 구축될 수 있다. 이에 따라, 관심 연구자에 관한 학술 정보를 제공하는 검색 서비스에 있어서, 제공하는 검색 결과의 정확도가 향상될 수 있다는 효과가 있다. 또한, 상기와 같은 연구자 전거 DB는 DB 관리자의 개입 없이 자동으로 구축될 수 있다. 이에 따라, 연구자 전거 DB를 구축하기 위해 소요되는 시간 비용 및 인적 비용이 크게 절감될 수 있다. 또한, 식별된 동일 연구자에 대한 문헌 메타데이터로 구성된 동일 인물 클러스터에 관하여, 클러스터의 유사도를 측정하고, 상기 유사도가 임계 값 이상인 동일 인물 클러스터만을 이용하여 연구자 전거 DB가 구축될 수 있다. 이에 따라, DB 관리자의 개입 없이도 정확도 높은 연구자 전거 DB가 구축되는 효과가 있다.
지금까지 도 1 내지 도 17을 참조하여 설명된 본 발명의 개념은 컴퓨터가 읽을 수 있는 매체 상에 컴퓨터가 읽을 수 있는 코드로 구현될 수 있다. 상기 컴퓨터로 읽을 수 있는 기록 매체는, 예를 들어 이동형 기록 매체(CD, DVD, 블루레이 디스크, USB 저장 장치, 이동식 하드 디스크)이거나, 고정식 기록 매체(ROM, RAM, 컴퓨터 구비 형 하드 디스크)일 수 있다. 상기 컴퓨터로 읽을 수 있는 기록 매체에 기록된 상기 컴퓨터 프로그램은 인터넷 등의 네트워크를 통하여 다른 컴퓨팅 장치에 전송되어 상기 다른 컴퓨팅 장치에 설치될 수 있고, 이로써 상기 다른 컴퓨팅 장치에서 사용될 수 있다.
도면에서 동작들이 특정한 순서로 도시되어 있지만, 반드시 동작들이 도시된 특정한 순서로 또는 순차적 순서로 실행되어야만 하거나 또는 모든 도시 된 동작들이 실행되어야만 원하는 결과를 얻을 수 있는 것으로 이해되어서는 안 된다. 특정 상황에서는, 멀티태스킹 및 병렬 처리가 유리할 수도 있다. 더욱이, 위에 설명한 실시예들에서 다양한 구성들의 분리는 그러한 분리가 반드시 필요한 것으로 이해되어서는 안 되고, 설명된 프로그램 컴포넌트들 및 시스템들은 일반적으로 단일 소프트웨어 제품으로 함께 통합되거나 다수의 소프트웨어 제품으로 패키지 될 수 있음을 이해하여야 한다.
이상 첨부된 도면을 참조하여 본 발명의 실시예들을 설명하였지만, 본 발명이 속하는 기술분야에서 통상의 지식을 가진 자는 본 발명이 그 기술적 사상이나 필수적인 특징을 변경하지 않고서 다른 구체적인 형태로 실시될 수 있다는 것을 이해할 수 있다. 그러므로 이상에서 기술한 실시예들은 모든 면에서 예시적인 것이며 한정적인 것이 아닌 것으로 이해해야만 한다.

Claims (27)

  1. 학술 논문, 특허 문헌 및 연구 보고서 중 적어도 하나의 문헌 유형에 관한 문헌 데이터를 획득하는 문헌 데이터 획득부;
    상기 문헌 데이터로부터 문헌 메타데이터를 추출하고, 상기 문헌 메타데이터로부터 연구자 식별 자질을 추출하며, 상기 연구자 식별 자질을 이용하여 식별된 동일 연구자 기준으로 연구자 전거 DB를 구축하는 전거 DB 구축부;
    적어도 하나의 검색 클라이언트 단말로부터 관심 연구자에 대한 검색 요청을 수신하고, 상기 관심 연구자에 관한 학술 정보 및 상기 관심 연구자에 관한 통계 정보를 송신하는 인터페이스부;
    상기 검색 요청에 응답하여, 상기 연구자 전거 DB에서 상기 관심 연구자의 학술 정보를 검색하는 검색부; 및
    상기 관심 연구자에 관한 학술 정보를 기초로, 상기 관심 연구자에 관한 통계 정보를 제공하는 분석부를 포함하되,
    상기 전거 DB 구축부는,
    상기 식별된 동일 연구자의 문헌 메타데이터를 그룹핑하여 동일 인물 클러스터를 구축하는 동일 인물 클러스터 구축부;
    상기 동일 인물 클러스터 내에 포함된 문헌 메타데이터 간의 유사도가 임계 값 이상인지 여부를 판정하는 클러스터 검증부를 포함하고,
    상기 전거 DB 구축부는,
    상기 유사도가 상기 임계 값 이상인 동일 인물 클러스터를 이용하여 상기 연구자 전거 DB를 구축하는 것을 특징으로 하는,
    연구자 검색 서비스 제공 장치.
  2. 제1 항에 있어서,
    상기 연구자 식별 자질은,
    주저자의 이메일 주소, 공동 저자의 이름, 상기 주저자의 소속 기관 및 학술지명 중 적어도 하나를 포함하되,
    상기 공동 저자는 공동 발명자 및 연구 참여자를 포함하고, 상기 소속 기관은 출원인 및 주관 연구기관을 포함하는 것을 특징으로 하는,
    연구자 검색 서비스 제공 장치.
  3. 제1 항에 있어서,
    상기 전거 DB 구축부는,
    연구자명을 기준으로 상기 문헌 메타데이터를 그룹핑하여 동명 인물 클러스터를 구축하는 동명 인물 클러스터 구축부; 및
    상기 문헌 메타데이터로부터 상기 연구자 식별 자질을 추출하는 식별 자질 추출부를 포함하되,
    상기 동일 인물 클러스터 구축부는,
    상기 동명 인물 클러스터에 포함된 문헌 메타데이터 중에서, 상기 연구자 식별 자질을 이용하여 식별된 동일 연구자의 문헌 메타데이터를 그룹핑하여 상기 동일 인물 클러스터를 구축하는 것을 특징으로 하는,
    연구자 검색 서비스 제공 장치.
  4. 제3 항에 있어서,
    상기 동명 인물 클러스터 구축부는,
    한글 연구자명 및 영어 연구자명 중 적어도 하나의 연구자명이 매칭되는 문헌 메타데이터를 그룹핑하여 상기 동명 인물 클러스터를 구축하는 것을 특징으로 하는,
    연구자 검색 서비스 제공 장치.
  5. 제3 항에 있어서,
    상기 동명 인물 클러스터 구축부는,
    자소 단위로 연구자명 간의 문자열 유사도를 측정하고, 상기 문자열 유사도가 임계 값 이상인 문헌 메타데이터를 그룹핑하여 상기 동명 인물 클러스터를 구축하는 것을 특징으로 하는,
    연구자 검색 서비스 제공 장치.
  6. 제3 항에 있어서,
    상기 동일 인물 클러스터 구축부는,
    상기 동명 인물 클러스터에 포함된 문헌 메타데이터 중에서, 기 설정된 식별 규칙 중 어느 하나의 식별 규칙을 만족하는 문헌 메타데이터를 그룹핑하여 상기 동일 인물 클러스터를 구축하되,
    상기 기 설정된 식별 규칙은,
    이메일 주소가 매칭되는 경우, 동일 연구자로 식별하는 제1 식별 규칙;
    적어도 한 명의 공동 저자 이름이 매칭되는 경우, 동일 연구자로 식별하는 제2 식별 규칙;
    주저자의 소속 기관이 매칭되는 경우, 동일 연구자로 식별하는 제3 식별 규칙; 및
    학술지명이 매칭되는 경우, 동일 연구자로 식별하는 제4 식별 규칙을 포함하는 것을 특징으로 하는,
    연구자 검색 서비스 제공 장치.
  7. 제6 항에 있어서,
    상기 제1 식별 규칙을 만족하는 문헌 메타데이터에 제1 점수를 부여하고,
    상기 제2 식별 규칙을 만족하는 문헌 메타데이터에 상기 제1 점수보다 낮은 제2 점수를 부여하며,
    상기 제3 식별 규칙을 만족하는 문헌 메타데이터에 상기 제2 점수보다 낮은 제3 점수를 부여하고,
    상기 제4 식별 규칙을 만족하는 문헌 메타데이터에 상기 제3 점수보다 낮은 제4 점수를 부여하되,
    상기 전거 DB 구축부는,
    상기 동일 인물 클러스터 내에 포함된 문헌 메타데이터의 유사도가 제1 임계 값 미만인 경우,
    상기 동일 인물 클러스터 내에 포함된 문헌 메타데이터 중에서, 부여된 점수가 제2 임계 값 이하인 문헌 메타데이터를 제외하고 상기 유사도를 다시 산출하는 것을 특징으로 하는,
    연구자 검색 서비스 제공 장치.
  8. 제1 항에 있어서,
    상기 유사도는,
    상기 동일 인물 클러스터의 중심과 상기 동일 인물 클러스터에 포함된 문헌 메타데이터 사이의 평균 유클리드 거리를 기초로 결정되는 것을 특징으로 하는,
    연구자 검색 서비스 제공 장치.
  9. 제1 항에 있어서,
    상기 관심 연구자에 관한 통계 정보는,
    상기 관심 연구자의 성향에 관한 제1 통계 정보, 상기 관심 연구자의 협력도에 관한 제2 통계 정보 및 상기 관심 연구자의 다양성에 관한 제3 통계 정보 중 적어도 하나의 통계 정보를 포함하되,
    상기 제1 통계 정보는, 상기 관심 연구자의 전체 발행 문헌 중에서 학술 논문, 특허 문헌 및 연구 보고서 각각이 차지하는 비율을 가리키고,
    상기 제2 통계 정보는, 특정 연구 분야에 대한 문헌 중에서 상기 관심 연구자가 다른 연구자와 함께 저자로 포함된 문헌의 발행 건수를 가리키며,
    상기 제3 통계 정보는, 상기 관심 연구자가 발행한 문헌이 속하는 연구 분야의 수를 가리키는 것을 특징으로 하는,
    연구자 검색 서비스 제공 장치.
  10. 제1 항에 있어서,
    상기 관심 연구자에 관한 통계 정보는,
    상기 관심 연구자의 생산성에 관한 제1 통계 정보, 상기 관심 연구자의 지속성에 관한 제2 통계 정보, 상기 관심 연구자의 포지션에 관한 제3 통계 정보를 포함하되,
    상기 제1 통계 정보는, 상기 관심 연구자의 연구 분야별 발행 문헌의 건수를 가리키고,
    상기 제2 통계 정보는, 상기 관심 연구자의 연도별 연평균 발행 문헌의 건수를 가리키며,
    상기 제3 통계 정보는, 상기 관심 연구자의 소속 기관이 발행한 전체 문헌의 건수 대비 상기 관심 연구자가 발행한 문헌의 건수의 비율을 가리키는 것을 특징으로 하는,
    연구자 검색 서비스 제공 장치.
  11. 제1 항에 있어서,
    상기 관심 연구자에 관한 통계 정보는,
    상기 관심 연구자와 공동 연구를 수행한 협업 연구자와의 관계에 관한 통계 정보를 포함하되,
    상기 관계에 관한 통계 정보는 상기 관심 연구자의 이름, 상기 협업 연구자의 이름 및 상기 관심 연구자와 상기 협업 연구자가 함께 수행한 공동 연구의 빈도수를 포함하는 것을 특징으로 하는,
    연구자 검색 서비스 제공 장치.
  12. 제11 항에 있어서,
    상기 관심 연구자에 관한 통계 정보를 시각화된 형태의 정보로 제공하는 시각화부를 더 포함하고,
    상기 시각화부는,
    상기 관계에 관한 통계 정보를 방사형 네트워크로 시각화하여 제공하되,
    상기 방사형 네트워크의 중심 노드는 상기 관심 연구자에 대응되고, 상기 방사형 네트워크의 주변 노드는 상기 협업 연구자에 대응되며, 상기 방사형 네트워크에서 상기 중심 노드와 상기 주변 노드 간의 거리는 상기 빈도수에 기초하여 결정되는 것을 특징으로 하는,
    연구자 검색 서비스 제공 장치.
  13. 제12 항에 있어서,
    상기 방사형 네트워크에서,
    상기 중심 노드의 크기는 상기 관심 연구자와 상기 협업 연구자가 함께 발행한 전체 문헌의 건수에 비례하고,
    상기 주변 노드 각각의 크기는 상기 관심 연구자와 각각의 주변 노드에 대응되는 협업 연구자가 함께 발행한 문헌의 건수에 비례하되,
    상기 주변 노드의 크기는 상기 방사형 네트워크를 구성하는 다른 주변 노드의 크기 대비 상대적인 크기로 표시되는 것을 특징으로 하는,
    연구자 검색 서비스 제공 장치.
  14. 연구자 검색 서비스 제공 장치에 의해 수행되는 연구자 검색 서비스 제공 방법에 있어서,
    학술 논문, 특허 문헌 및 연구 보고서 중 적어도 하나의 문헌 유형에 관한 문헌 데이터를 획득하는 단계;
    상기 문헌 데이터에서 추출된 연구자 식별 자질을 이용하여 동일 연구자를 식별하고, 상기 식별된 동일 연구자를 기준으로 연구자 전거 DB를 구축하는 단계;
    적어도 하나의 검색 클라이언트 단말로부터 수신된 관심 연구자에 대한 검색 요청에 응답하여, 상기 연구자 전거 DB에서 검색된 상기 관심 연구자에 관한 학술 정보를 제공하는 단계; 및
    상기 관심 연구자에 관한 학술 정보를 기초로, 상기 관심 연구자에 관한 통계 정보를 제공하는 단계를 포함하되,
    상기 연구자 전거 DB를 구축하는 단계는,
    상기 식별된 동일 연구자의 문헌 메타데이터를 그룹핑하여 동일 인물 클러스터를 구축하는 단계;
    상기 동일 인물 클러스터 내에 포함된 문헌 메타데이터 간의 유사도가 임계 값 이상인지 여부를 판정하는 단계; 및
    상기 유사도가 상기 임계 값 이상인 동일 인물 클러스터에 포함된 문헌 메타데이터의 세부 항목을 연계하여 상기 연구자 전거 DB를 구축하는 단계를 포함하는 것을 특징으로 하는,
    연구자 검색 서비스 제공 방법.
  15. 제14 항에 있어서,
    상기 연구자 식별 자질은,
    주저자의 이메일 주소, 공동 저자의 이름, 상기 주저자의 소속 기관 및 학술지명 중 적어도 하나를 포함하되,
    상기 공동 저자는 공동 발명자 및 연구 참여자를 포함하고, 상기 소속 기관은 출원인 및 주관 연구기관을 포함하는 것을 특징으로 하는,
    연구자 검색 서비스 제공 방법.
  16. 제14 항에 있어서,
    상기 연구자 전거 DB를 구축하는 단계는,
    상기 문헌 데이터에서 각 문헌의 서지 정보가 포함된 문헌 메타데이터를 추출하는 단계; 및
    상기 문헌 메타데이터에서 추출된 연구자명을 기준으로, 상기 문헌 메타데이터를 그룹핑하여 동명 인물 클러스터를 구축하는 단계를 더 포함하되,
    상기 동일 인물 클러스터를 구축하는 단계는,
    상기 문헌 메타데이터에서, 상기 연구자 식별 자질을 추출하는 단계;
    상기 연구자 식별 자질을 이용하여, 상기 동명 인물 클러스터에 포함된 동명 연구자 중에서 동일 연구자를 식별하는 단계; 및
    상기 식별된 동일 연구자의 문헌 메타데이터를 그룹핑하여 상기 동일 인물 클러스터를 구축하는 단계를 포함하는 것을 특징으로 하는,
    연구자 검색 서비스 제공 방법.
  17. 제14 항에 있어서,
    상기 관심 연구자에 관한 통계 정보는,
    상기 관심 연구자의 성향에 관한 제1 통계 정보, 상기 관심 연구자의 협력도에 관한 제2 통계 정보 및 상기 관심 연구자의 다양성에 관한 제3 통계 정보 중 적어도 하나의 통계 정보를 포함하되,
    상기 제1 통계 정보는, 상기 관심 연구자의 전체 발행 문헌 중에서 학술 논문, 특허 문헌 및 연구 보고서 각각이 차지하는 비율을 가리키고,
    상기 제2 통계 정보는, 특정 연구 분야에 대한 문헌 중에서 상기 관심 연구자가 다른 연구자와 함께 저자로 포함된 문헌의 발행 건수를 가리키며,
    상기 제3 통계 정보는, 상기 관심 연구자가 발행한 문헌이 속하는 연구 분야의 수를 가리키는 것을 특징으로 하는,
    연구자 검색 서비스 제공 방법.
  18. 제14 항에 있어서,
    상기 관심 연구자에 관한 통계 정보는,
    상기 관심 연구자의 생산성에 관한 제1 통계 정보, 상기 관심 연구자의 지속성에 관한 제2 통계 정보, 상기 관심 연구자의 포지션에 관한 제3 통계 정보를 포함하되,
    상기 제1 통계 정보는, 상기 관심 연구자의 연구 분야별 발행 문헌의 건수를 가리키고,
    상기 제2 통계 정보는, 상기 관심 연구자의 연도별 연평균 발행 문헌의 건수를 가리키며,
    상기 제3 통계 정보는, 상기 관심 연구자의 소속 기관이 발행한 전체 문헌의 건수 대비 상기 관심 연구자가 발행한 문헌의 건수의 비율을 가리키는 것을 특징으로 하는,
    연구자 검색 서비스 제공 방법.
  19. 제14 항에 있어서,
    상기 관심 연구자에 관한 통계 정보는,
    상기 관심 연구자와 공동 연구를 수행한 협업 연구자와의 관계에 관한 통계 정보를 포함하고,
    상기 관심 연구자에 관한 통계 정보를 제공하는 단계는,
    상기 관계에 관한 통계 정보를 시각화된 형태의 정보로 제공하는 단계를 포함하되,
    상기 관계에 관한 통계 정보는 방사형 네트워크로 시각화되고, 상기 방사형 네트워크의 중심 노드는 상기 관심 연구자에 대응되며, 상기 방사형 네트워크의 주변 노드는 상기 협업 연구자에 대응되고, 상기 방사형 네트워크에서 상기 중심 노드와 상기 주변 노드 간의 거리는 상기 관심 연구자와 상기 협업 연구자가 함께 수행한 공동 연구의 빈도수에 기초하여 결정되는 것을 특징으로 하는,
    연구자 검색 서비스 제공 방법.
  20. 연구자 전거 DB 구축 장치에 의해 수행되는 연구자 전거 DB의 구축 방법에 있어서,
    학술 논문, 특허 문헌 및 연구 보고서 중 적어도 하나의 문헌이 포함된 문헌 데이터를 획득하는 단계;
    상기 문헌 데이터에서 문헌의 서지 정보를 가리키는 문헌 메타데이터를 추출하는 단계;
    연구자명을 기준으로 상기 문헌 메타데이터를 그룹핑하여 동명 인물 클러스터를 구축하는 단계;
    상기 문헌 메타데이터에서 기 지정된 연구자 식별 자질을 추출하는 단계;
    상기 연구자 식별 자질을 이용하여, 상기 동명 인물 클러스터로부터 동일 인물 클러스터를 구축하는 단계;
    상기 동일 인물 클러스터 내에 포함된 문헌 메타데이터 간의 유사도가 임계 값 이상인지 여부를 판정하는 단계; 및
    상기 유사도가 상기 임계 값 이상인 동일 인물 클러스터에 포함된 문헌 메타데이터를 연계하여, 상기 연구자 전거 DB를 구축하는 단계를 포함하는 것을 특징으로 하는,
    연구자 전거 DB 구축 방법.
  21. 제20 항에 있어서,
    상기 동명 인물 클러스터를 구축하는 단계는,
    한글 연구자명 및 영어 연구자명 중 적어도 하나의 연구자명이 매칭되는 문헌 메타데이터를 그룹핑하여 상기 동명 인물 클러스터를 구축하는 단계를 포함하는 것을 특징으로 하는,
    연구자 전거 DB 구축 방법.
  22. 제20 항에 있어서,
    동명 인물 클러스터를 구축하는 단계는,
    자소 단위로 연구자명 간의 문자열 유사도를 측정하고, 상기 문자열 유사도가 임계 값 이상인 문헌 메타데이터를 그룹핑하여 상기 동명 인물 클러스터를 구축하는 단계를 포함하는 것을 특징으로 하는,
    연구자 전거 DB 구축 방법.
  23. 제20 항에 있어서,
    동일 인물 클러스터를 구축하는 단계는,
    상기 동명 인물 클러스터에 포함된 문헌 메타데이터 중에서, 기 설정된 식별 규칙 중 어느 하나의 식별 규칙을 만족하는 문헌 메타데이터를 그룹핑하여 상기 동일 인물 클러스터를 구축하는 단계를 포함하되,
    상기 기 설정된 식별 규칙은,
    이메일 주소가 매칭되는 경우, 동일 연구자로 식별하는 제1 식별 규칙;
    적어도 두 명의 공동 저자 이름이 매칭되는 경우, 동일 연구자로 식별하는 제2 식별 규칙;
    적어도 한 명의 공동 저자 이름이 매칭되고, 주저자의 소속 기관이 매칭되는 경우, 동일 연구자로 식별하는 제3 식별 규칙;
    적어도 한 명의 공동 저자 이름이 매칭되고, 학술지명이 매칭되는 경우, 동일 연구자로 식별하는 제4 식별 규칙; 및
    주저자의 소속 기관이 매칭되고, 학술지명이 매칭되는 경우, 동일 연구자로 식별하는 제5 식별 규칙을 포함하는 것을 특징으로 하는,
    연구자 전거 DB 구축 방법.
  24. 제20 항에 있어서,
    동일 인물 클러스터를 구축하는 단계는,
    상기 동명 인물 클러스터에 포함된 문헌 메타데이터 중에서, 기 설정된 식별 규칙 중 어느 하나의 식별 규칙을 만족하는 문헌 메타데이터를 그룹핑하여 상기 동일 인물 클러스터를 구축하는 단계를 포함하되,
    상기 기 설정된 식별 규칙은,
    이메일 주소가 매칭되는 경우, 동일 연구자로 식별하는 제1 식별 규칙;
    적어도 한 명의 공동 저자 이름이 매칭되는 경우, 동일 연구자로 식별하는 제2 식별 규칙;
    주저자의 소속 기관이 매칭되는 경우, 동일 연구자로 식별하는 제3 식별 규칙; 및
    학술지명이 매칭되는 경우, 동일 연구자로 식별하는 제4 식별 규칙을 포함하는 것을 특징으로 하는,
    연구자 전거 DB 구축 방법.
  25. 제24 항에 있어서,
    상기 동일 인물 클러스터 내에 포함된 문헌 메타데이터 간의 유사도가 제1 임계 값 이상인지 여부를 판정하는 단계; 및
    상기 유사도가 상기 제1 임계 값 미만인 경우, 상기 동일 인물 클러스터 내에 포함된 문헌 메타데이터 중에서, 부여된 점수가 제2 임계 값 이하인 문헌 메타데이터를 제외하고 상기 유사도를 다시 산출하는 단계를 더 포함하되,
    상기 제1 식별 규칙을 만족하는 문헌 메타데이터에 제1 점수가 부여되고,
    상기 제2 식별 규칙을 만족하는 문헌 메타데이터에 상기 제1 점수보다 낮은 제2 점수가 부여되며,
    상기 제3 식별 규칙을 만족하는 문헌 메타데이터에 상기 제2 점수보다 낮은 제3 점수가 부여되고,
    상기 제4 식별 규칙을 만족하는 문헌 메타데이터에 상기 제3 점수보다 낮은 제4 점수가 부여되는 것을 특징으로 하는,
    연구자 전거 DB 구축 방법.
  26. 제20 항에 있어서,
    상기 유사도는,
    상기 동일 인물 클러스터의 중심과 상기 동일 인물 클러스터에 포함된 문헌 메타데이터 사이의 평균 유클리드 거리를 기초로 결정되는 것을 특징으로 하는,
    연구자 전거 DB 구축 방법.
  27. 컴퓨팅 장치와 결합되어,
    제14항 내지 제26항 중 어느 한 항에 기재된 방법을 실행시키기 위하여 기록 매체에 저장된,
    컴퓨터 프로그램.
KR1020170063581A 2017-05-23 2017-05-23 연구자 검색 서비스 제공 장치 및 그 방법 KR101823463B1 (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020170063581A KR101823463B1 (ko) 2017-05-23 2017-05-23 연구자 검색 서비스 제공 장치 및 그 방법

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020170063581A KR101823463B1 (ko) 2017-05-23 2017-05-23 연구자 검색 서비스 제공 장치 및 그 방법

Publications (1)

Publication Number Publication Date
KR101823463B1 true KR101823463B1 (ko) 2018-01-31

Family

ID=61083438

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020170063581A KR101823463B1 (ko) 2017-05-23 2017-05-23 연구자 검색 서비스 제공 장치 및 그 방법

Country Status (1)

Country Link
KR (1) KR101823463B1 (ko)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20210150103A (ko) * 2020-06-03 2021-12-10 위인터랙트(주) 사용자 정보 기반 협업 파트너 추천 시스템 및 그 방법
CN114780571A (zh) * 2022-03-03 2022-07-22 清华大学 临床研究管理系统及方法
CN115098710A (zh) * 2022-06-23 2022-09-23 抖音视界(北京)有限公司 一种多媒体资源作者相似度的识别方法、装置及设备
KR20220134695A (ko) 2021-03-25 2022-10-05 (주)지플러스 인공지능 학습 모델을 이용한 저자 식별 시스템 및 그 방법
JP7545605B1 (ja) 2024-03-27 2024-09-04 虎三 池田 情報処理システム、情報処理方法及びプログラム

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20050097123A1 (en) 2003-10-31 2005-05-05 International Business Machines Corporation Research data repository system and method
KR100882582B1 (ko) * 2006-12-20 2009-02-12 한국과학기술정보연구원 시맨틱 웹 기반 연구정보 서비스 시스템 및 그 방법
KR101064981B1 (ko) * 2010-10-07 2011-09-15 한국과학기술정보연구원 다중 자원을 통합한 지식베이스를 이용하여 연구 주체간의 상관관계가 표시된 자원검색 정보 제공 장치 및 방법
KR101073385B1 (ko) * 2009-11-24 2011-10-17 한국과학기술정보연구원 연구자의 연구정보 분석 장치 및 그 방법 그리고 방법에 관한 컴퓨터가 실행할 수 있는 프로그램을 기록한 컴퓨터로 읽을 수 있는 기록매체
US20160259841A1 (en) 2015-03-04 2016-09-08 Tegu LLC Research Analysis System

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20050097123A1 (en) 2003-10-31 2005-05-05 International Business Machines Corporation Research data repository system and method
KR100882582B1 (ko) * 2006-12-20 2009-02-12 한국과학기술정보연구원 시맨틱 웹 기반 연구정보 서비스 시스템 및 그 방법
KR101073385B1 (ko) * 2009-11-24 2011-10-17 한국과학기술정보연구원 연구자의 연구정보 분석 장치 및 그 방법 그리고 방법에 관한 컴퓨터가 실행할 수 있는 프로그램을 기록한 컴퓨터로 읽을 수 있는 기록매체
KR101064981B1 (ko) * 2010-10-07 2011-09-15 한국과학기술정보연구원 다중 자원을 통합한 지식베이스를 이용하여 연구 주체간의 상관관계가 표시된 자원검색 정보 제공 장치 및 방법
US20160259841A1 (en) 2015-03-04 2016-09-08 Tegu LLC Research Analysis System

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20210150103A (ko) * 2020-06-03 2021-12-10 위인터랙트(주) 사용자 정보 기반 협업 파트너 추천 시스템 및 그 방법
KR102454261B1 (ko) * 2020-06-03 2022-10-14 위인터랙트(주) 사용자 정보 기반 협업 파트너 추천 시스템 및 그 방법
KR20220134695A (ko) 2021-03-25 2022-10-05 (주)지플러스 인공지능 학습 모델을 이용한 저자 식별 시스템 및 그 방법
CN114780571A (zh) * 2022-03-03 2022-07-22 清华大学 临床研究管理系统及方法
CN115098710A (zh) * 2022-06-23 2022-09-23 抖音视界(北京)有限公司 一种多媒体资源作者相似度的识别方法、装置及设备
JP7545605B1 (ja) 2024-03-27 2024-09-04 虎三 池田 情報処理システム、情報処理方法及びプログラム

Similar Documents

Publication Publication Date Title
KR101823463B1 (ko) 연구자 검색 서비스 제공 장치 및 그 방법
US9569506B2 (en) Uniform search, navigation and combination of heterogeneous data
US10565273B2 (en) Tenantization of search result ranking
CN108304444B (zh) 信息查询方法及装置
AU2022201654A1 (en) System and engine for seeded clustering of news events
US7849104B2 (en) Searching heterogeneous interrelated entities
US8862566B2 (en) Systems and methods for intelligent parallel searching
US20150310097A1 (en) Systems and methods for analyzing and clustering search queries
AU2011239618B2 (en) Ascribing actionable attributes to data that describes a personal identity
US20110264651A1 (en) Large scale entity-specific resource classification
US20090043767A1 (en) Approach For Application-Specific Duplicate Detection
US20100313258A1 (en) Identifying synonyms of entities using a document collection
Hansmann et al. Big data-characterizing an emerging research field using topic models
JP2013531289A (ja) 検索におけるモデル情報群の使用
US20100106719A1 (en) Context-sensitive search
CN106095738B (zh) 推荐表单片段
US9971828B2 (en) Document tagging and retrieval using per-subject dictionaries including subject-determining-power scores for entries
CN102918532A (zh) 在搜索结果排序中对垃圾的检测
US20100042610A1 (en) Rank documents based on popularity of key metadata
US20120239657A1 (en) Category classification processing device and method
CA2906767A1 (en) Non-deterministic disambiguation and matching of business locale data
CN110546633A (zh) 文档的基于命名实体的类别标签添加
Good et al. Social tagging in the life sciences: characterizing a new metadata resource for bioinformatics
Drăgan et al. Linking semantic desktop data to the web of data
JP2009230296A (ja) 文書検索システム

Legal Events

Date Code Title Description
E701 Decision to grant or registration of patent right
GRNT Written decision to grant