KR101055363B1 - 다중 자원 기반 검색정보 제공 장치 및 방법 - Google Patents

다중 자원 기반 검색정보 제공 장치 및 방법 Download PDF

Info

Publication number
KR101055363B1
KR101055363B1 KR1020100097796A KR20100097796A KR101055363B1 KR 101055363 B1 KR101055363 B1 KR 101055363B1 KR 1020100097796 A KR1020100097796 A KR 1020100097796A KR 20100097796 A KR20100097796 A KR 20100097796A KR 101055363 B1 KR101055363 B1 KR 101055363B1
Authority
KR
South Korea
Prior art keywords
search
resource
information
entity
providing
Prior art date
Application number
KR1020100097796A
Other languages
English (en)
Inventor
정한민
김평
이승우
이미경
서동민
성원경
Original Assignee
한국과학기술정보연구원
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 한국과학기술정보연구원 filed Critical 한국과학기술정보연구원
Priority to KR1020100097796A priority Critical patent/KR101055363B1/ko
Priority to PCT/KR2010/007239 priority patent/WO2012046904A1/ko
Application granted granted Critical
Publication of KR101055363B1 publication Critical patent/KR101055363B1/ko

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2458Special types of queries, e.g. statistical queries, fuzzy queries or distributed queries
    • G06F16/2471Distributed queries

Abstract

본 발명은 다중 자원 기반 검색정보 제공 장치 및 방법에 관한 것으로서, 개체명 사전 및 문맥 패턴 정보가 저장된 데이터베이스, 각 자원별로 상기 개체명 사전을 이용하여 입력 문서의 개체를 인식하고, 상기 문맥 패턴 정보를 이용하여 상기 인식된 개체간의 관계를 생성하는 개체 인식 및 관계 생성 모듈, 서로 다른 다중 자원에서 상기 인식된 개체와 개체간의 관계를 통합 온톨로지로 매핑하여 저장하고, 상기 통합 온톨로지에 대한 추론을 수행하여 통합 지식베이스를 확장하는 지식베이스 구축 모듈, 사용자에 의해 검색어가 입력된 경우, 상기 통합 지식베이스를 검색하여 상기 검색어에 해당하는 검색정보를 자원별로 획득하는 검색 모듈, 상기 획득된 검색정보에 각 자원의 비율에 따른 가중치를 부여하여 연산하고, 그 연산된 결과를 정렬한 검색결과정보를 제공하는 검색 결과 제공 모듈을 포함한다.
따라서, 본 발명에 따르면, 사용자에 의해 입력된 검색어에 대해 다중 자원을 융합한 검색 정보를 제공하고, 각 자원들의 비율이 입력된 경우 자원들의 비율에 따라 가중치를 연산한 검색 결과의 제공이 가능하므로, 사용자의 요구에 따라 다양한 관점에서의 정보 서비스가 가능하다.

Description

다중 자원 기반 검색정보 제공 장치 및 방법{Apparatus and Method for Providing search information based on multiple resource}
본 발명은 다중 자원 기반 검색정보 제공 장치 및 방법에 관한 것으로, 더욱 상세하게는 각 자원별로 개체명 사전을 이용하여 입력 문서의 개체를 인식하고, 문맥 패턴 정보를 이용하여 상기 인식된 개체간의 관계를 생성하며, 서로 다른 다중 자원에서 상기 인식된 개체와 개체간의 관계를 통합 온톨로지로 매핑하여 저장하고, 상기 통합 온톨로지에 대한 추론을 수행하여 통합 지식베이스를 확장한 후, 사용자에 의해 검색어가 입력된 경우, 상기 통합 지식베이스를 검색하여 상기 검색어에 해당하는 검색정보를 자원별로 획득하고, 상기 획득된 검색정보에 각 자원의 비율에 따른 가중치를 부여 및 연산하여 그 연산된 결과를 정렬한 검색결과정보를 제공하는 다중 자원 기반 검색정보 제공 장치 및 방법에 관한 것이다.
일반적으로 검색 정보 제공 장치는 정보를 수집/분류/축적하여 필요에 따라 추출할 수 있도록 하는 장치이다.
정보화 사회에 있어서 인간의 지적 활동에 필요 불가결한 행위의 하나는 첨단과학기술에 의존한 정보의 수집과 축적 및 검색과 이용이라고 할 수 있다. 개인적으로는 필요한 정보나 데이터를 보다 신속, 정확하게 입수하여 연구개발이나 의사결정에 활용할 수 있는 방법을 모색하고, 사회적으로는 사회 각 부문에서의 다양한 정보요구를 충족시킬 수 있는 방법이 필요하다. 그러므로, 정보검색으로 충족시킬 수 있는 검색 정보 제공 장치를 어떻게 구축, 유지, 운영하느냐가 중요하다.
그래서 검색 정보 제공 장치는 정보 수요자가 필요하다고 예측되는 정보나 데이터를 미리 수집, 가공, 처리하여 찾기 쉬운 형태로 축적해 놓은 데이터베이스로부터 요구에 적합한 정보를 신속하게 찾아내어 정보 요구자에게 제공하는 장치를 말한다. 이러한 형태에는 검색 정보 제공 장치에서 출력된 검색결과를 전화로 알려주거나 팩스로 전송하는 경우가 있고, 인터넷을 통해 컴퓨터를 보유하고 있는 요구자의 가정이나 사무실에 온라인으로 검색결과를 전송해 줄 수 있다.
그리고 데이터베이스에 축적되어 있는 정보의 종류에 따라 참조검색/사실검색/전문(full-text)검색으로 구분된다. 참조검색은 요구자가 알고자 하는 주제를 핵심적으로 다루고 있는 문헌의 서지사항을 검색하는 것이다. 사실검색은 일반데이터나 수치데이터 및 사실데이터를 검색할 수 있는 것이다. 전문검색은 문헌의 전문을 축적해 놓은 데이터베이스로부터 서지적 데이터뿐만 아니라 해당문장이나 원문 전부를 필요에 따라 검색해서 볼 수 있는 것이다.
그러나 종래의 검색 정보 제공 장치는 논문, 연구보고서, 특허 등의 서로 다른 자원을 독립적으로 그 자체만 제시할 뿐 과학기술과 관련된 이들 각각의 정보들을 융합하여 제시하지는 못하는 한계가 있었다.
따라서 정보의 홍수 속에서 서로 다른 다중 자원을 융합한 검색 정보를 사용자의 요구에 따라 기술분야별로 분류하여 제공함으로써 해당 기술분야에 대한 연구개발과 연구동향 파악에 필요한 기술분야별 융합 정보를 서비스하여 시기적절하게 과학기술을 활용할 수 있도록 할 필요성이 대두되었다.
본 발명은 상기와 같은 종래의 제반 문제점을 해결하기 위해 제안된 것으로, 본 발명의 목적은 사용자에 의해 입력된 검색어에 대해 다중 자원을 융합한 검색 정보를 제공하고, 각 자원들의 비율이 입력된 경우 자원들의 비율에 따라 가중치를 연산한 검색 결과를 제공할 수 있는 다중 자원 기반 검색정보 제공 장치 및 방법을 제공하는데 있다.
본 발명의 다른 목적은 서로 다른 다중 자원을 융합하여 사용자의 요구에 따라 다양한 관점에서의 정보 서비스를 가능하게 하는 다중 자원 기반 검색정보 제공 장치 및 방법을 제공하는데 있다.
본 발명의 한 측면에 따르면, 개체명 사전 및 문맥 패턴 정보가 저장된 데이터베이스, 각 자원별로 상기 개체명 사전을 이용하여 입력 문서의 개체를 인식하고, 상기 문맥 패턴 정보를 이용하여 상기 인식된 개체간의 관계를 생성하는 개체 인식 및 관계 생성 모듈, 서로 다른 다중 자원에서 상기 인식된 개체와 개체간의 관계를 통합 온톨로지로 매핑하여 저장하고, 상기 통합 온톨로지에 대한 추론을 수행하여 통합 지식베이스를 확장하는 지식베이스 구축 모듈, 사용자에 의해 검색어가 입력된 경우, 상기 통합 지식베이스를 검색하여 상기 검색어에 해당하는 검색정보를 자원별로 획득하는 검색 모듈, 상기 획득된 검색정보에 각 자원의 비율에 따른 가중치를 부여하여 연산하고, 그 연산된 결과를 정렬한 검색결과정보를 제공하는 검색 결과 제공 모듈을 포함하는 다중 자원 기반 검색정보 제공 장치가 제공된다.
상기 데이터베이스는 하나 이상의 범주, 각 범주에 속하는 개체명, 각 개체명의 식별자가 매핑된 개체명 사전이 저장된 개체명 사전 데이터베이스, 개체 사이의 문맥에 대한 패턴 정보가 저장된 문맥 패턴 정보 데이터베이스, 문맥을 정규화하기 위한 정규화 사전 데이터베이스를 포함한다.
상기 개체 인식 및 관계 생성 모듈은 상기 입력 문서에 대해 형태소 분석, 구문 분석, 의미 분석을 수행하여 용어를 인식하고, 상기 인식된 용어가 상기 개체명 사전에 등록된 경우, 개체로 인식하는 개체 인식부, 상기 개체 인식부에서 2개 이상의 개체가 인식된 경우, 상기 문맥 패턴 정보를 근거로 상기 인식된 개체 사이의 문맥을 추출하고, 상기 정규화 사전 데이터베이스를 근거로 상기 추출된 문맥을 정규화하는 방식으로 개체간의 관계를 생성하는 관계 생성부를 포함한다.
상기 개체 인식부는 상기 인식된 각 개체에 범주 및 식별자를 부여한다.
상기 관계 생성부는 상기 추출된 개체와 상기 생성된 개체간의 관계를 주체(Subject), 관계명(Predicate), 객체(Object)로 표현한다.
상기 지식베이스 구축 모듈은 상기 서로 다른 다중 자원에서 생성된 개체간의 관계 또는 각 자원의 메타 데이터를 다중 자원간의 연결관계를 표현한 통합 온톨로지로 저장한다.
상기 검색 결과 제공 모듈은 상기 자원별로 획득된 검색정보를 연구주체별로 분류하고, 연구주체별 각 자원의 검색 건수에 사용자에 의해 입력된 각 자원의 비율에 따른 가중치를 적용하여 연산한 후, 그 연산된 결과가 높은 연구주체 순으로 랭킹하여 제공한다.
또한, 상기 검색 결과 제공 모듈은 상기 연산된 결과를 미리 정의된 또는 사용자에 의해 요청된 순서대로 정렬하여 제공한다.
본 발명의 다른 측면에 따르면, 검색 정보 제공 장치가 다중 자원을 기반으로 검색 정보를 제공하는 방법에 있어서, (a) 각 자원별로 개체명 사전을 이용하여 입력 문서의 개체를 인식하고, 문맥 패턴 정보를 이용하여 상기 인식된 개체간의 관계를 생성하는 단계, (b) 서로 다른 다중 자원에서 상기 인식된 개체와 개체간의 관계를 통합 온톨로지로 매핑하여 저장하고, 상기 통합 온톨로지에 대한 추론을 수행하여 통합 지식베이스를 확장하는 단계, (c) 사용자에 의해 검색어가 입력된 경우, 상기 통합 지식베이스를 검색하여 상기 검색어에 해당하는 검색정보를 자원별로 획득하는 단계, (d) 상기 획득된 검색정보에 각 자원의 비율에 따른 가중치를 부여하여 연산하고, 그 연산된 결과를 정렬한 검색결과정보를 제공하는 단계를 포함하는다중 자원 기반 검색정보 제공 방법이 제공된다.
상기 (a) 단계는 상기 입력 문서에 대해 형태소 분석, 구문 분석, 의미 분석을 수행하여 용어를 인식하고, 상기 인식된 용어가 상기 개체명 사전에 등록된 경우, 개체로 인식하는 단계, 상기 인식된 개체가 2개 이상인 경우, 상기 문맥 패턴 정보를 근거로 상기 인식된 개체 사이의 문맥을 추출하는 단계, 기 저장된 정규화 사전을 근거로 상기 추출된 문맥을 정규화하는 방식으로 개체간의 관계를 생성하는 단계를 포함한다.
상기 (c) 단계는 상기 사용자에 의해 검색이 요청된 경우, 검색어 입력 화면을 제공하는 단계, 상기 검색어 입력 화면을 통해 검색어 및 그 검색어에 대한 자원과 자원별 비율을 입력받는 단계, 상기 통합 지식베이스를 검색하여 상기 입력된 검색어에 해당하는 검색정보를 자원별로 획득하는 단계를 포함한다.
상기 (d) 단계는 상기 자원별로 획득된 검색정보를 연구주체별로 분류하는 단계, 상기 연구주체별 각 자원의 검색 건수에 각 자원의 비율에 따른 가중치를 적용하여 연산하는 단계, 상기 연산된 결과가 높은 연구주체 순으로 랭킹하여 제공하는 단계를 포함한다.
상기 검색결과정보는 미리 정의된 또는 사용자에 의해 요청된 순서대로 정렬하여 제공한다.
본 발명의 또 다른 측면에 따르면, 다중 관점 기반 검색정보 제공 방법을 실행시키기 위한 프로그램을 기록한 컴퓨터로 읽을 수 있는 기록매체가 제공된다.
본 발명에 따르면, 서로 다른 다중 자원을 융합하여 사용자의 요구에 따라 다양한 관점에서의 정보 서비스가 가능하고, 의사 결정을 지원하기 위한 여러 서비스들을 제공함으로써 단편적 지식에 의한 의사 결정 오류를 방지하고 정확한 결정이 가능한 효과가 있다.
또한, 사용자에 의해 입력된 검색어에 대해 다중 자원을 융합한 검색 정보를 제공하고, 각 자원들의 비율이 입력된 경우 자원들의 비율에 따라 가중치를 연산한 검색 결과의 제공이 가능하므로, 사용자의 요구에 따라 다양한 관점에서의 정보 서비스가 가능하다.
도 1은 본 발명의 실시예에 따른 다중 자원 기반 검색정보 제공 장치의 구성을 개략적으로 나타낸 블럭도.
도 2는 본 발명의 실시예에 따른 검색 정보 제공 장치가 다중 자원을 기반으로 검색 정보를 제공하는 방법을 나타낸 흐름도.
도 3은 본 발명에 따른 검색어 입력 화면의 예시도.
도 4는 본 발명에 따른 검색 결과 정보 제공 화면을 나타낸 예시도.
본 발명의 전술한 목적과 기술적 구성 및 그에 따른 작용 효과에 관한 자세한 사항은 본 발명의 명세서에 첨부된 도면에 의거한 이하 상세한 설명에 의해 보다 명확하게 이해될 것이다.
도 1은 본 발명의 실시예에 따른 다중 자원 기반 검색정보 제공 장치의 구성을 개략적으로 나타낸 블럭도이다.
도 1을 참조하면, 다중 자원 기반 검색정보 제공 장치(이하, 검색 정보 제공 장치로 칭함)(100)는 데이터베이스(110), 개체 인식 및 관계 생성 모듈(120), 지식베이스 구축 모듈(130), 검색 모듈(150), 검색결과 제공 모듈(160)을 포함한다.
상기 데이터베이스(110)는 하나 이상의 범주, 각 범주에 속하는 개체명, 각 개체명의 식별자가 매핑된 개체명 사전이 저장된 개체명 사전 데이터베이스(112), 개체 사이의 문맥에 대한 패턴 정보가 저장된 문맥 패턴 정보 데이터베이스(114), 문맥을 정규화하기 위한 정규화 사전 데이터베이스(116)를 포함한다.
상기 개체 인식 및 관계 생성 모듈(120)은 각 자원별로 상기 개체명 사전을 이용하여 입력 문서의 개체를 인식하고, 상기 문맥 패턴 정보를 이용하여 상기 인식된 개체간의 관계를 생성한다.
상기와 같은 개체 인식 및 관계 생성 모듈(120)은 개체 인식부(122)와 관계 생성부(124)로 구성된다.
상기 개체 인식부(122)는 상기 입력 문서에 대해 형태소 분석, 구문 분석, 의미 분석을 수행하여 용어를 인식하고, 상기 인식된 용어가 상기 개체명 사전에 등록된 경우, 개체로 인식한다. 이때, 상기 개체 인식부(122)는 상기 인식된 각 개체에 범주 및 식별자를 부여한다.
상기 관계 생성부(124)는 상기 개체 인식부(122)에서 2개 이상의 개체가 인식된 경우, 상기 문맥 패턴 정보를 근거로 상기 인식된 개체 사이의 문맥을 추출하고, 상기 정규화 사전 데이터베이스(116)를 근거로 상기 추출된 문맥을 정규화하는 방식으로 개체간의 관계를 생성한다.
예를 들어, "notebook consists of monitor, SSD, and mobile processor" 문장의 경우, 상기 개체 인식부(122)는 상기 문장에서 notebook, monitor, SSD, mobile processor의 개체를 인식하게 된다.
이때, 2개 이상의 개체가 인식되었으므로, 상기 관계 생성부(124)는 기 저장된 문맥 패턴 정보 예를 들면, "Be동사 + 과거분사형 + 전치사"에 부합하는 문맥만을 추출한다.
그런 다음 상기 관계 생성부(124)는 상기 정규화 사전을 근거로 해당 문맥의 시제 예를 들면 "was"를 "be"로 통일하고, 유사표현 예를 들면, “similar to"와 "similar with"를 "similar to"로 통일하는 등의 문맥 정규화를 수행하여 개체간의 관계를 생성한다.
상기 관계 생성부(124)는 상기 추출된 개체와 상기 생성된 개체간의 관계를 주체(Subject), 관계명(Predicate), 객체(Object)로 표현한다.
상기 개체 인식 및 관계 생성 모듈(120)이 개체 인식 및 관계를 생성하는 방법은 자원별로 이루어지고, 여기서 자원은 특허, 논문, 보고서, 학술자료, 표준, 통계, 전자 문서 등을 말한다.
상기 지식베이스 구축 모듈(130)은 서로 다른 다중 자원에서 각각 인식된 개체와 개체간의 관계를 통합 온톨로지로 매핑하여 저장하고, 상기 통합 온톨로지에 대한 추론을 수행하여 통합 지식베이스를 확장한다.
이때, 상기 지식베이스 구축 모듈(130)은 상기 서로 다른 다중 자원에서 각각 생성된 개체간의 관계 또는 각 자원의 메타 데이터를 다중 자원간의 연결관계로 표현한 통합 온톨로지로 저장한다.
상기 지식 베이스 구축 모듈(130)에 의해 생성된 통합 지식베이스는 지식 베이스 DB(140)에 저장된다.
상기 검색 모듈(150)은 사용자에 의해 검색어가 입력된 경우, 상기 통합 지식베이스를 검색하여 상기 검색어에 해당하는 검색정보를 자원별로 획득한다.
예들 들면, 상기 사용자에 의해 "스마트카드"라는 검색어가 입력된 경우, 상기 검색 모듈(150)은 상기 통합 지식베이스를 검색하여 스마트카드에 대한 검색정보를 특허, 논문, 보고서, 학술자료, 표준, 통계, 전자 문서 등의 자원별로 획득한다.
상기 검색결과 제공 모듈(160)은 상기 검색 모듈(150)에서 획득된 검색정보에 각 자원의 비율에 따른 가중치를 부여하여 연산하고, 그 연산된 결과를 정렬한 검색결과정보를 제공한다.
즉, 상기 검색 결과 제공 모듈(160)은 상기 자원별로 획득된 검색정보를 연구주체별로 분류하고, 연구주체별 각 자원의 검색 건수에 사용자에 의해 입력된 각 자원의 비율에 따른 가중치를 적용하여 연산한 후, 그 연산된 결과가 높은 연구주체 순으로 랭킹하여 제공한다.
이때, 상기 검색 결과 제공 모듈(160)은 상기 연산된 결과를 미리 정의된 또는 사용자에 의해 요청된 순서대로 정렬하여 제공할 수 있다.
예를 들어, 사용자가 "스마트 카드"를 검색어로 입력하고, 논문 50%, 특허 30%, 보고서 20%로 각 자원의 비율을 입력한 경우에 대하여 설명하기로 한다.
상기 자원별로 획득된 검색정보를 연구주체별로 분류한 결과 A기업은 논문 2건, 특허 3건, 보고서 5건이고, B 기업은 논문 5건, 특허 5건, 보고서 1건, C기업은 논문 3건, 특허 10건, 보고서 1건인 경우, 상기 검색 결과 제공 모듈은 각 검색 건수에 해당 자원 비율을 곱하여 연산한다.
즉, A기업의 경우 2*0.5 + 3*0.3 + 5*0.2 = 2.9, B기업의 경우 5*0.5 + 5*0.3 + 1*0.2 = 4.2, C기업의 경우 3*0.5 + 10*0.3 + 1*0.2 = 4.5의 연산결과를 갖게 된다.
그러면, 상기 검색결과 제공 모듈(160)은 상기 연산 결과를 연구주체별로 랭킹하여 C기업 4.5, B기업 4.2, A기업 2.9의 순으로 검색결과를 제공하게 된다.
이때, 상기 검색 결과 제공 모듈(160)은 상기 연산된 결과를 미리 정의된 또는 사용자에 의해 요청된 순서대로 정렬하여 제공할 수도 있다.
상기와 같이 구성된 검색 정보 제공 장치(100)는 논문, 특허, 보고서 등 다중 자원 내에서 텍스트 마이닝을 통해 내적 정보(Implicit Information)를 추출하여 메타데이터와 같은 외형적 정보(Explicit Information)와 융합하고, 이를 시맨틱 웹 기술 기반의 서비스 플랫폼에 올려 다양한 관점에서의 정보 서비스를 가능하게 한다.
도 2는 본 발명의 실시예에 따른 검색 정보 제공 장치가 다중 자원을 기반으로 검색 정보를 제공하는 방법을 나타낸 흐름도, 도 3은 본 발명에 따른 검색어 입력 화면의 예시도, 도 4는 본 발명에 따른 검색 결과 정보 제공 화면을 나타낸 예시도이다.
도 2를 참조하면, 검색 정보 제공 장치는 각 자원별로 개체명 사전을 이용하여 입력 문서의 개체를 인식하고(S200), 문맥 패턴 정보를 이용하여 상기 인식된 개체간의 관계를 생성한다(S202).
즉, 상기 검색 정보 제공 장치는 상기 입력 문서에 대해 형태소 분석, 구문 분석, 의미 분석을 수행하여 용어를 인식하고, 상기 인식된 용어가 상기 개체명 사전에 등록된 경우, 개체로 인식한다.
그런 다음 상기 검색 정보제공 장치는 상기 인식된 개체가 2개 이상인 경우, 상기 문맥 패턴 정보를 근거로 상기 인식된 개체 사이의 문맥을 추출하고, 기 저장된 정규화 사전을 근거로 상기 추출된 문맥을 정규화하는 방식으로 개체간의 관계를 생성한다.
상기 S202의 수행 후 상기 검색 정보제공 장치는 서로 다른 다중 자원에서 각각 인식된 개체와 개체간의 관계를 통합 온톨로지로 매핑하여 저장하고(S206), 상기 통합 온톨로지에 대한 추론을 수행하여 통합 지식베이스를 확장한다(S208). 즉, 상기 검색 정보 제공 장치는 논문, 특허, 보고서 등 다중 자원 내에서 텍스트 마이닝을 통해 내적 정보를 추출하여 메타데이터와 같은 외형적 정보와 융합하고, 이를 시맨틱 웹 기술 기반의 서비스 플랫폼에 올려 다양한 관점에서의 정보 서비스를 가능하게 한다.
상기 S208의 수행 후, 사용자에 의해 검색어가 입력되면(S210), 상기 검색 정보 제공 장치는 상기 통합 지식베이스를 검색하여 상기 검색어에 해당하는 검색정보를 자원별로 획득한다(S212).
즉, 상기 사용자에 의해 검색이 요청되면, 상기 검색 정보 제공 장치는 도 3과 같은 검색어 입력 화면을 제공한다. 상기 검색어 입력 화면에 대해 도 3을 참조하면, 검색어 입력 화면(300)에는 검색어를 입력하기 위한 검색어 입력 영역(310), 자원 및 그 자원에 대한 비율을 선택하기 위한 자원선택 영역(320)을 포함한다.
상기 사용자는 상기 검색어 입력영역(310)에서 검색을 원하는 검색어를 입력하고, 상기 자원선택 영역(320)에서 특허, 논문, 보고서, 학술자료, 표준, 통계, 전자 문서 중 적어도 하나의 자원을 선택한다. 이때, 상기 사용자는 상기 선택된 자원에 대한 비율을 함께 입력할 수 있다.
여기에서는 자원선택 영역(320)을 2개의 자원을 선택할 수 있는 슬라이드 바 형식으로 구성하였으나, 3개, 4개 등의 다수개의 자원을 선택할 수 있는 다양한 형태로 할 수 있음은 당연하다.
부가적으로 상기 검색어 입력 화면(300)은 연도범위를 지정하기 위한 연도 범위 지정 영역을 더 포함할 수 있다.
상기 사용자가 상기 검색어 입력 화면(300)을 통해 검색어 및 그 검색어에 대한 자원과 자원별 비율을 입력하면, 상기 검색 정보 제공 장치는 상기 통합 지식베이스를 검색하여 상기 입력된 검색어에 해당하는 검색정보를 자원별로 획득한다.
상기 S212의 수행 후, 상기 검색 정보 제공 장치는 상기 획득된 검색정보에 각 자원의 비율에 따른 가중치를 부여하여 연산하고(S214), 그 연산된 결과를 정렬한 검색결과정보를 제공한다(S216).
즉, 상기 검색 정보 제공 장치는 상기 자원별로 획득된 검색정보를 연구주체별로 분류하고, 상기 연구주체별 각 자원의 검색 건수에 각 자원의 비율에 따른 가중치를 적용하여 연산한다. 그런 다음 상기 검색 정보 제공 장치는 상기 연산된 결과가 높은 연구주체 순으로 랭킹하여 제공한다. 이때, 상기 검색 정보 제공 장치는 미리 정의된 또는 사용자에 의해 요청된 순서대로 상기 연산된 결과를 정렬하여 제공한다.
상기 검색 정보 제공 장치가 제공하는 검색결과 정보 제공 화면은 도 4와 같다. 도 4를 참조하여 검색결과 정보 제공 화면(400)에 대해 설명하면, 검색결과 정보 제공 화면(400)은 검색어 제공 영역(410), 자원 제공영역(420), 검색결과 제공 영역(430)을 포함한다.
상기 검색어 제공 영역(410)은 사용자에 의해 입력된 검색어가 표시되고, 상기 자원 제공 영역(420)에는 사용자에 의해 선택된 자원과 그 자원의 비율이 표시된다.
상기 검색결과 제공영역(430)은 연구주체별 각 자원의 검색 건수에 해당 자원 비율에 따른 가중치를 적용하여 연산한 결과가 제공되는 영역으로, 여기에서는 연산결과가 높은 연구주체 순으로 랭킹하여 제공된 형태이다.
예를 들면, 상기 검색결과 제공 영역(430)에는 A기업 10, B기업 8, C기업 7의 순으로 연산된 결과가 높은 연구주체 순으로 랭킹하여 검색결과가 제공된다.
사용자는 상기 자원 제공 영역(420)의 슬라이드 바를 이용하여 자원 또는 자원 비율을 변경할 수도 있다. 그러면, 상기 검색결과 제공 영역(430)에는 상기 변경된 자원 또는 자원비율을 반영한 검색결과가 제공된다.
이와 같이, 본 발명이 속하는 기술분야의 당업자는 본 발명이 그 기술적 사상이나 필수적 특징을 변경하지 않고서 다른 구체적인 형태로 실시될 수 있다는 것을 이해할 수 있을 것이다. 그러므로 이상에서 기술한 실시예들은 모든 면에서 예시적인 것이며 한정적인 것이 아닌 것으로서 이해해야만 한다. 본 발명의 범위는 상기 상세한 설명보다는 후술하는 특허청구범위에 의하여 나타내어지며, 특허청구범위의 의미 및 범위 그리고 그 등가개념으로부터 도출되는 모든 변경 또는 변형된 형태가 본 발명의 범위에 포함되는 것으로 해석되어야 한다.
이상과 같이 본 발명의 다중 자원 기반 검색정보 제공 장치 및 방법은 사용자에 의해 입력된 검색어에 대해 다중 자원을 융합한 검색 정보를 제공하고, 각 자원들의 비율이 입력된 경우 자원들의 비율에 따라 가중치를 연산한 검색 결과를 제공하여 사용자의 요구에 따라 다양한 관점에서의 정보 서비스 제공 필요성이 높은 것에 적합하다.
100 : 검색 정보 제공 장치 110 : 데이터베이스
120 : 개체 인식 및 관계 생성 모듈
130 : 지식 베이스 구축 모듈 140 : 지식베이스 DB
150 : 검색 모듈 160 : 검색 결과 제공 모듈

Claims (14)

  1. 개체명 사전 및 문맥 패턴 정보가 저장된 데이터베이스;
    각 자원별로 상기 개체명 사전을 이용하여 입력 문서의 개체를 인식하고, 상기 문맥 패턴 정보를 이용하여 상기 인식된 개체간의 관계를 생성하는 개체 인식 및 관계 생성 모듈;
    서로 다른 다중 자원에서 각각 인식된 개체와 개체간의 관계를 통합 온톨로지로 매핑하여 저장하고, 상기 통합 온톨로지에 대한 추론을 수행하여 통합 지식베이스를 확장하는 지식베이스 구축 모듈;
    사용자에 의해 검색어가 입력된 경우, 상기 통합 지식베이스를 검색하여 상기 검색어에 해당하는 검색정보를 자원별로 획득하는 검색 모듈; 및
    상기 획득된 검색정보에 각 자원의 비율에 따른 가중치를 부여하여 연산하고, 그 연산된 결과를 정렬한 검색결과정보를 제공하는 검색 결과 제공 모듈;
    을 포함하는 다중 자원 기반 검색정보 제공 장치.
  2. 제1항에 있어서,
    상기 데이터베이스는,
    하나 이상의 범주, 각 범주에 속하는 개체명, 각 개체명의 식별자가 매핑된 개체명 사전이 저장된 개체명 사전 데이터베이스;
    개체 사이의 문맥에 대한 패턴 정보가 저장된 문맥 패턴 정보 데이터베이스; 및
    문맥을 정규화하기 위한 정규화 사전 데이터베이스를 포함하는 것을 특징으로 하는 다중 자원 기반 검색정보 제공 장치.
  3. 제1항에 있어서,
    상기 개체 인식 및 관계 생성 모듈은,
    상기 입력 문서에 대해 형태소 분석, 구문 분석, 의미 분석을 수행하여 용어를 인식하고, 상기 인식된 용어가 상기 개체명 사전에 등록된 경우, 개체로 인식하는 개체 인식부; 및
    상기 개체 인식부에서 2개 이상의 개체가 인식된 경우, 상기 문맥 패턴 정보를 근거로 상기 인식된 개체 사이의 문맥을 추출하고, 정규화 사전 데이터베이스를 근거로 상기 추출된 문맥을 정규화하는 방식으로 개체간의 관계를 생성하는 관계 생성부를 포함하는 것을 특징으로 하는 다중 자원 기반 검색정보 제공 장치.
  4. 제3항에 있어서,
    상기 개체 인식부는 상기 인식된 각 개체에 범주 및 식별자를 부여하는 것을 특징으로 하는 다중 자원 기반 검색정보 제공 장치.
  5. 제3항에 있어서,
    상기 관계 생성부는 상기 추출된 개체와 상기 생성된 개체간의 관계를 주체(Subject), 관계명(Predicate), 객체(Object)로 표현하는 것을 특징으로 하는 다중 자원 기반 검색정보 제공 장치.
  6. 제1항에 있어서,
    상기 지식베이스 구축 모듈은 상기 서로 다른 다중 자원에서 생성된 개체간의 관계 또는 각 자원의 메타 데이터를 다중 자원간의 연결관계로 표현한 통합 온톨로지로 저장하는 것을 특징으로 하는 다중 자원 기반 검색정보 제공 장치.
  7. 제1항에 있어서,
    상기 검색 결과 제공 모듈은 상기 자원별로 획득된 검색정보를 연구주체별로 분류하고, 연구주체별 각 자원의 검색 건수에 사용자에 의해 입력된 각 자원의 비율에 따른 가중치를 적용하여 연산한 후, 그 연산된 결과가 높은 연구주체 순으로 랭킹하여 제공하는 것을 특징으로 하는 다중 자원을 통합한 지식베이스를 이용한 다중 관점 기반 검색정보 제공 장치.
  8. 제1항에 있어서,
    상기 검색 결과 제공 모듈은 상기 연산된 결과를 미리 정의된 또는 사용자에 의해 요청된 순서대로 정렬하여 제공하는 것을 특징으로 하는 다중 자원을 통합한 지식베이스를 이용한 다중 관점 기반 검색정보 제공 장치.
  9. 검색 정보 제공 장치가 다중 자원을 기반으로 검색 정보를 제공하는 방법에 있어서,
    (a) 각 자원별로 개체명 사전을 이용하여 입력 문서의 개체를 인식하고, 문맥 패턴 정보를 이용하여 상기 인식된 개체간의 관계를 생성하는 단계;
    (b) 서로 다른 다중 자원에서 각각 인식된 개체와 개체간의 관계를 통합 온톨로지로 매핑하여 저장하고, 상기 통합 온톨로지에 대한 추론을 수행하여 통합 지식베이스를 확장하는 단계;
    (c) 사용자에 의해 검색어가 입력된 경우, 상기 통합 지식베이스를 검색하여 상기 검색어에 해당하는 검색정보를 자원별로 획득하는 단계; 및
    (d) 상기 획득된 검색정보에 각 자원의 비율에 따른 가중치를 부여하여 연산하고, 그 연산된 결과를 정렬한 검색결과정보를 제공하는 단계;
    를 포함하는 다중 관점 기반 검색정보 제공 방법.
  10. 제9항에 있어서,
    상기 (a) 단계는,
    상기 입력 문서에 대해 형태소 분석, 구문 분석, 의미 분석을 수행하여 용어를 인식하고, 상기 인식된 용어가 상기 개체명 사전에 등록된 경우, 개체로 인식하는 단계;
    상기 인식된 개체가 2개 이상인 경우, 상기 문맥 패턴 정보를 근거로 상기 인식된 개체 사이의 문맥을 추출하는 단계; 및
    기 저장된 정규화 사전을 근거로 상기 추출된 문맥을 정규화하는 방식으로 개체간의 관계를 생성하는 단계를 포함하는 것을 특징으로 하는 다중 관점 기반 검색정보 제공 방법.
  11. 제9항에 있어서,
    상기 (c) 단계는,
    상기 사용자에 의해 검색이 요청된 경우, 검색어 입력 화면을 제공하는 단계;
    상기 검색어 입력 화면을 통해 검색어 및 그 검색어에 대한 자원과 자원별 비율을 입력받는 단계; 및
    상기 통합 지식베이스를 검색하여 상기 입력된 검색어에 해당하는 검색정보를 자원별로 획득하는 단계를 포함하는 것을 특징으로 하는 다중 관점 기반 검색정보 제공 방법.
  12. 제9항에 있어서,
    상기 (d) 단계는,
    상기 자원별로 획득된 검색정보를 연구주체별로 분류하는 단계;
    상기 연구주체별 각 자원의 검색 건수에 각 자원의 비율에 따른 가중치를 적용하여 연산하는 단계;
    상기 연산된 결과가 높은 연구주체 순으로 랭킹하여 제공하는 단계를 포함하는 것을 특징으로 하는 다중 관점 기반 검색정보 제공 방법.
  13. 제9항에 있어서,
    상기 검색결과정보는 미리 정의된 또는 사용자에 의해 요청된 순서대로 정렬하여 제공하는 것을 특징으로 하는 다중 관점 기반 검색정보 제공 방법.
  14. 삭제
KR1020100097796A 2010-10-07 2010-10-07 다중 자원 기반 검색정보 제공 장치 및 방법 KR101055363B1 (ko)

Priority Applications (2)

Application Number Priority Date Filing Date Title
KR1020100097796A KR101055363B1 (ko) 2010-10-07 2010-10-07 다중 자원 기반 검색정보 제공 장치 및 방법
PCT/KR2010/007239 WO2012046904A1 (ko) 2010-10-07 2010-10-21 다중 자원 기반 검색정보 제공 장치 및 방법

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020100097796A KR101055363B1 (ko) 2010-10-07 2010-10-07 다중 자원 기반 검색정보 제공 장치 및 방법

Publications (1)

Publication Number Publication Date
KR101055363B1 true KR101055363B1 (ko) 2011-08-08

Family

ID=44933035

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020100097796A KR101055363B1 (ko) 2010-10-07 2010-10-07 다중 자원 기반 검색정보 제공 장치 및 방법

Country Status (2)

Country Link
KR (1) KR101055363B1 (ko)
WO (1) WO2012046904A1 (ko)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101724398B1 (ko) * 2016-01-07 2017-04-18 서강대학교산학협력단 지식베이스를 이용한 개체명 인식 코퍼스 생성 시스템 및 방법

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106407208B (zh) * 2015-07-29 2019-06-18 清华大学 一种城市管理本体知识库的构建方法及系统
CN107203618A (zh) * 2017-05-24 2017-09-26 苏州唯亚信息科技股份有限公司 适用于研发企业的数据归类方法
CN112819171B (zh) * 2021-02-04 2024-04-09 深圳市永达电子信息股份有限公司 一种基于表函数的数据搜索方法、系统及计算机存储介质
CN114547253A (zh) * 2022-03-03 2022-05-27 北京伽睿智能科技集团有限公司 一种基于知识库应用的语义搜索方法

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100421091B1 (ko) * 2000-05-31 2004-03-10 노영희 의미망 지식베이스를 이용한 개념기반 정보검색시스템
JP2005078245A (ja) * 2003-08-29 2005-03-24 Victor Co Of Japan Ltd デンドログラムを用いたコンテンツ検索装置
KR20090114779A (ko) * 2008-04-30 2009-11-04 한국과학기술정보연구원 대용량 데이터베이스의 의미기반 기술용어 발굴 방법
KR20100054587A (ko) * 2008-11-14 2010-05-25 한국과학기술정보연구원 동사기반패턴을 이용한 대용량 문헌정보 내에서의 기술용어간 관계추출 시스템

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100421091B1 (ko) * 2000-05-31 2004-03-10 노영희 의미망 지식베이스를 이용한 개념기반 정보검색시스템
JP2005078245A (ja) * 2003-08-29 2005-03-24 Victor Co Of Japan Ltd デンドログラムを用いたコンテンツ検索装置
KR20090114779A (ko) * 2008-04-30 2009-11-04 한국과학기술정보연구원 대용량 데이터베이스의 의미기반 기술용어 발굴 방법
KR20100054587A (ko) * 2008-11-14 2010-05-25 한국과학기술정보연구원 동사기반패턴을 이용한 대용량 문헌정보 내에서의 기술용어간 관계추출 시스템

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101724398B1 (ko) * 2016-01-07 2017-04-18 서강대학교산학협력단 지식베이스를 이용한 개체명 인식 코퍼스 생성 시스템 및 방법

Also Published As

Publication number Publication date
WO2012046904A1 (ko) 2012-04-12

Similar Documents

Publication Publication Date Title
Nagwani Summarizing large text collection using topic modeling and clustering based on MapReduce framework
US20180032930A1 (en) System and method to Generate Queries for a Business Database
US10019442B2 (en) Method and system for peer detection
KR20190015797A (ko) 인공지능(ai)을 통한 딥러닝훈련모듈과, 순위화프레임워크모듈을 활용하여, 법률전문가에게 최적화된 모범답안을 제시하는 한편, 법률정보를 의미 벡터로 변환하여, 데이터베이스에 저장하고, 이에 대한 문자열 사전모듈을 활용한 온라인 법률정보사전을 제공하는 시스템 및 그 방법
TW201805839A (zh) 資料處理方法、設備及系統
Dumani et al. A framework for argument retrieval: Ranking argument clusters by frequency and specificity
US8812504B2 (en) Keyword presentation apparatus and method
KR101064981B1 (ko) 다중 자원을 통합한 지식베이스를 이용하여 연구 주체간의 상관관계가 표시된 자원검색 정보 제공 장치 및 방법
KR101055363B1 (ko) 다중 자원 기반 검색정보 제공 장치 및 방법
Chatzichristofis et al. Mean Normalized Retrieval Order (MNRO): a new content-based image retrieval performance measure
Thushara et al. A model for auto-tagging of research papers based on keyphrase extraction methods
CN115563313A (zh) 基于知识图谱的文献书籍语义检索系统
JP2009110508A (ja) オブジェクト間の競合指標計算方法およびシステム
KR20180129001A (ko) 다언어 특질 투영된 개체 공간 기반 개체 요약본 생성 방법 및 시스템
Nashipudimath et al. An efficient integration and indexing method based on feature patterns and semantic analysis for big data
JP5324677B2 (ja) 類似文書検索支援装置及び類似文書検索支援プログラム
Hernández-Gracidas et al. Improving image retrieval by using spatial relations
KR20160120583A (ko) 지식 관리 시스템 및 이의 지식 구조 기반의 자료 관리 방법
Abramowicz et al. Supporting topic map creation using data mining techniques
KR101067830B1 (ko) 다중 자원의 통합에 의한 자원 검색 장치 및 방법
Park et al. Extracting search intentions from web search logs
Khan et al. Semantic search revisited
Chehreghani et al. Density link-based methods for clustering web pages
KR20160136014A (ko) 빅데이터 토픽 클러스터링 방법 및 그 장치
Tao et al. A knowledge-based model using ontologies for personalized web information gathering

Legal Events

Date Code Title Description
A201 Request for examination
A302 Request for accelerated examination
E902 Notification of reason for refusal
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20140718

Year of fee payment: 4

FPAY Annual fee payment

Payment date: 20150803

Year of fee payment: 5

FPAY Annual fee payment

Payment date: 20160630

Year of fee payment: 6

FPAY Annual fee payment

Payment date: 20170703

Year of fee payment: 7

FPAY Annual fee payment

Payment date: 20180809

Year of fee payment: 8

FPAY Annual fee payment

Payment date: 20190701

Year of fee payment: 9