KR20170067918A - 마인드맵 기반 키워드 검색 방법 및 이를 위한 장치 - Google Patents

마인드맵 기반 키워드 검색 방법 및 이를 위한 장치 Download PDF

Info

Publication number
KR20170067918A
KR20170067918A KR1020150173784A KR20150173784A KR20170067918A KR 20170067918 A KR20170067918 A KR 20170067918A KR 1020150173784 A KR1020150173784 A KR 1020150173784A KR 20150173784 A KR20150173784 A KR 20150173784A KR 20170067918 A KR20170067918 A KR 20170067918A
Authority
KR
South Korea
Prior art keywords
keyword
keywords
mind map
relationship information
extended
Prior art date
Application number
KR1020150173784A
Other languages
English (en)
Inventor
신사임
장달원
김경원
이종설
Original Assignee
전자부품연구원
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 전자부품연구원 filed Critical 전자부품연구원
Priority to KR1020150173784A priority Critical patent/KR20170067918A/ko
Priority to PCT/KR2016/014249 priority patent/WO2017099454A1/ko
Publication of KR20170067918A publication Critical patent/KR20170067918A/ko

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F17/3064
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F17/271
    • G06F17/2755
    • G06F17/278
    • G06F17/3053

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Databases & Information Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

본 발명은 키워드 마인드맵 검색 방법 및 이를 위한 장치에 관한 것으로서, 더욱 상세하게는 하나 이상의 도메인 코퍼스를 분석하여 하나 이상의 키워드를 추출하고, 추출한 각 키워드 간의 관계정보를 생성하여 저장하고, 저장된 관계정보를 기반으로 사용자가 입력한 특정 키워드와 연관된 확장 키워드 및 연관 컨텐츠를 추출하여 사용자에게 제공함으로써, 비정형 데이터의 확보만으로 특정 분야의 검색 시스템을 구축할 수 있으며, 이러한 검색 시스템을 구축하는데 필요한 구축 비용을 낮추고 양질의 트렌디한 확장 키워드를 제공할 수 있다.

Description

마인드맵 기반 키워드 검색 방법 및 이를 위한 장치{Keyword Mind Map Searching Method, and Apparatus Therefor}
본 발명은 키워드 마인드맵 검색 방법 및 이를 위한 장치에 관한 것으로서, 더욱 상세하게는 대용량의 도메인 텍스트를 자동으로 분석하여 구축한 키워드 마인드 맵을 바탕으로 다양한 컨텐츠를 빠르고 효율적으로 검색하기 위한 방법 및 장치에 관한 것이다.
이 부분에 기술된 내용은 단순히 본 실시 예에 대한 배경 정보를 제공할 뿐 종래기술을 구성하는 것은 아니다.
키워드는 기록의 내용을 표현하기 위해 제목이나 글의 내용에서 추출한 단어나 구절로서 기록을 검색할 때, 접근점으로 쓰이는 단어를 의미하고, 키워드 검색은 브라우저상에 검색 엔진 등이 갖춰져, 상기의 키워드를 입력하여 원하는 정보를 얻어내는 기술을 말한다.
이러한 키워드 검색 방법은 검색 서비스 시스템이 제공하는 가장 일반적인 검색 서비스 방식으로써, 사용자가 상기 검색 서비스 시스템에 키워드를 입력하면 상기 키워드를 포함하는 검색결과를 상기 검색 서비스 시스템이 사용자에게 제공한다.
이러한 검색 서비스를 제공하기 위하여 검색 서비스 제공자는 자동으로 키워드 인덱싱을 실행할 수 있는 키워드 인덱싱 엔진을 구축하여, 키워드 인덱싱을 통해 키워드 검색을 제공하였으나, 이러한 키워드 인덱싱 검색 기술은 키워드 검색의 정확도가 떨어져, 사용자가 검색하고자 하는 컨텐츠가 검색되지 않는 경우가 있었으며, 수동으로 지식베이스를 구축하는 경우에는 지나치게 높은 구축 비용이 필요하여, 서비스를 확장하는데 한계가 있었다.
한국등록특허 제10-0452086호(명칭: 카테고리 별 키워드의 입력 순위를 제공하기 위한 검색서비스 시스템 및 그 방법, 2004.09.30)
상술한 문제점을 해결하기 위하여 본 발명은 도메인 코퍼스의 형태소를 분석하고, 개체명을 인식하여, 하나 이상의 키워드를 추출하고, 상기 추출된 키워드 간의 관계 정보를 생성하여 저장하고, 사용자가 특정 키워드를 입력하는 경우, 상기 저장된 관계 정보를 기반으로 특정 키워드와 연관된 확장 키워드 및 연관 컨텐츠를 추출함으로써, 비정형 텍스트 데이터를 기반으로 검색 기술 지식베이스를 구축하여 비용을 낮추고, 관계정보를 기반으로 양질의 트렌디한 확장 키워드를 제공하는 검색 방법 및 장치를 제공하고자 한다.
그러나, 이러한 본 발명의 목적은 상기의 목적으로 제한되지 않으며, 언급되지 않은 또 다른 목적들은 아래의 기재로부터 명확하게 이해될 수 있을 것이다.
상술한 바와 같은 목적을 달성하기 위한 본 발명에 따른 키워드 마인드맵 검색 방법은 마인드맵 검색 장치가 수집한 하나 이상의 도메인 코퍼스의 형태소를 분석하는 단계, 상기 분석된 형태소에 포함되어 있는 개체명을 인식하는 단계, 상기 개체명 인식 결과를 기반으로 하나 이상의 키워드를 추출하는 단계, 상기 추출된 하나 이상의 키워드 간 밀접도를 산출하는 단계, 상기 산출된 밀접도를 기반으로 상기 하나 이상의 키워드 간의 관계를 정의하여, 관계정보를 생성하는 단계, 상기 생성된 관계정보를 기반으로 각 키워드 간의 밀접도 및 출연빈도수를 매핑하여 저장하는 단계, 사용자가 입력한 특정 키워드를 입력받는 단계, 상기 저장된 관계정보 기반으로 상기 특정 키워드와 연관된 하나 이상의 확장 키워드를 추출하는 단계 및 상기 확장 키워드를 기반으로 하나 이상의 연관 컨텐츠를 추출하여, 출력하는 단계를 포함할 수 있다.
이 때, 상기 확장 키워드를 추출하는 단계는 상기 입력받은 특정 키워드와 상기 하나 이상의 확장 키워드의 밀접도 및 출연빈도수를 기반으로 가중치를 설정하는 단계, 상기 설정한 가중치에 따라 상기 특정 키워드 및 상기 하나 이상의 확장 키워드의 순위를 산출하는 단계 및 상기 산출된 순위를 기반으로 하나 이상의 키워드 및 상기 키워드에 연관된 컨텐츠 중 적어도 하나를 출력하는 단계를 포함할 수 있고, 상기 추출하는 단계는 상기 개체명 인식 단계에서 출연하는 빈도수가 기 설정된 빈도수를 초과하는 키워드를 추출할 수 있다.
또한, 상기 입력받은 특정 키워드가 포함된 관계정보를 상기 밀접도 및 출연빈도수를 기반으로 시각화하는 단계 및 상기 시각화된 관계정보를 출력하는 단계를 더 포함할 수 있고, 상기 개체명을 인식하는 단계 이전에, 상기 분석된 형태소 별 품사를 태깅하는 단계 및 상기 태깅된 품사를 기반으로 상기 도메인 코퍼스 각각의 구문을 분석하는 단계를 더 포함할 수 있다.
상술한 바와 같은 목적을 달성하기 위한 본 발명에 따른 키워드 마인드맵 검색 장치는 하나 이상의 도메인 코퍼스를 수집하여 상기 수집한 도메인 코퍼스 각각의 형태소를 분석하고, 상기 분석된 형태소에 포함되어 있는 개체명을 인식하는 문장 분석모듈, 상기 개체명 인식 결과를 기반으로 하나 이상의 키워드를 추출하여, 상기 추출된 키워드 간의 밀접도를 산출하고, 상기 산출된 밀접도를 기반으로 상기 키워드 간의 관계를 정의하여, 관계정보를 생성하며, 상기 생성된 관계정보를 기반으로 각 키워드 간의 밀접도 및 출연빈도수를 매핑하여 마인드맵 저장모듈에 저장하도록 제어하는 마인드맵 구성 모듈, 상기 마인드맵 구성 모듈이 생성하여 매핑한 상기 관계 정보를 저장하는 마인드맵 저장모듈 및 입력장치로부터 특정 키워드가 전달되면, 상기 저장된 관계정보를 기반으로 상기 특정 키워드와 연관된 하나 이상의 확장 키워드를 추출하고, 상기 확장 키워드를 기반으로 하나 이상의 연관 컨텐츠를 추출하는 키워드 검색 모듈을 포함할 수 있다.
본 발명에 따르면, 하나 이상의 도메인 코퍼스를 분석하여 하나 이상의 키워드를 추출하고, 추출한 각 키워드 간의 관계정보를 생성하여 저장하고, 저장된 관계정보를 기반으로 사용자가 입력한 특정 키워드와 연관된 확장 키워드 및 연관 컨텐츠를 추출하여 사용자에게 제공함으로써, 비정형 데이터의 확보만으로 특정 분야의 검색 시스템을 구축할 수 있으며, 이러한 검색 시스템을 구축하는데 필요한 구축 비용을 낮추고 양질의 트렌디한 확장 키워드를 제공할 수 있다.
아울러, 상술한 효과 이외의 다양한 효과들이 후술될 본 발명의 실시 예에 따른 상세한 설명에서 직접적 또는 암시적으로 개시될 수 있다.
도1은 본 발명의 실시 예에 따른 키워드 마인드맵 검색 시스템의 구성을 나타내는 도면이다.
도2는 본 발명에 따른 마인드맵 검색 장치의 구성을 나타내는 블록도이다.
도3 내지 도5는 본 발명에 따른 마인드맵 구축 과정의 실시 예를 설명하기 위한 예시도 이다.
도6은 본 발명의 실시 예에 따른 키워드 마인드맵 구축과정을 설명하기 위한 흐름도이다.
도7은 본 발명의 실시 예에 따른 키워드 마인드맵을 통해 키워드 검색과정을 설명하기 위한 흐름도이다.
본 발명의 과제 해결 수단의 특징 및 이점을 보다 명확히 하기 위하여, 첨부된 도면에 도시된 본 발명의 특정 실시 예를 참조하여 본 발명을 더 상세하게 설명한다.
다만, 하기의 설명 및 첨부된 도면에서 본 발명의 요지를 흐릴 수 있는 공지 기능 또는 구성에 대한 상세한 설명은 생략한다. 또한, 도면 전체에 걸쳐 동일한 구성 요소들은 가능한 한 동일한 도면 부호로 나타내고 있음에 유의하여야 한다.
이하의 설명 및 도면에서 사용된 용어나 단어는 통상적이거나 사전적인 의미로 한정해서 해석되어서는 아니 되며, 발명자는 그 자신의 발명을 가장 최선의 방법으로 설명하기 위한 용어의 개념으로 적절하게 정의할 수 있다는 원칙에 입각하여 본 발명의 기술적 사상에 부합하는 의미와 개념으로 해석되어야만 한다.
따라서 본 명세서에 기재된 실시 예와 도면에 도시된 구성은 본 발명의 가장 바람직한 일 실시 예에 불과할 뿐이고, 본 발명의 기술적 사상을 모두 대변하는 것은 아니므로, 본 출원시점에 있어서 이들을 대체할 수 있는 다양한 균등물과 변형 예들이 있을 수 있음을 이해하여야 한다.
또한, 제1, 제2 등과 같이 서수를 포함하는 용어는 다양한 구성요소들을 설명하기 위해 사용하는 것으로, 하나의 구성요소를 다른 구성요소로부터 구별하는 목적으로만 사용될 뿐, 상기 구성요소들을 한정하기 위해 사용되지 않는다.
예를 들어, 본 발명의 권리 범위를 벗어나지 않으면서 제2 구성요소는 제1 구성요소로 명명될 수 있고, 유사하게 제1 구성요소도 제2 구성요소로 명명될 수 있다.
또한, 본 명세서에서 사용한 용어는 단지 특정한 실시 예를 설명하기 위해 사용된 것으로, 본 발명을 한정하려는 의도가 아니다.
단수의 표현은 문맥상 명백하게 다르게 뜻하지 않는 한, 복수의 표현을 포함한다. 또한, 본 명세서에서 기술되는 "포함 한다" 또는 "가지다" 등의 용어는 명세서상에 기재된 특징, 숫자, 단계, 동작, 구성요소, 부품 또는 이들을 조합한 것이 존재함을 지정하려는 것이지, 하나 또는 그 이상의 다른 특징들이나 숫자, 단계, 동작, 구성요소, 부품 또는 이들을 조합한 것들의 존재 또는 부가 가능성을 미리 배제하지 않는 것으로 이해되어야 한다.
또한, 명세서에 기재된 "부", "기", "모듈" 등의 용어는 적어도 하나의 기능이나 동작을 처리하는 단위를 의미하며, 이는 하드웨어나 소프트웨어 또는 하드웨어 및 소프트웨어의 결합으로 구현될 수 있다.
또한, "일(a 또는 an)", "하나(one)", "그(the)" 및 유사 관련어는 본 발명을 기술하는 문맥에 있어서(특히, 이하의 청구항의 문맥에서) 본 명세서에 달리 지시되거나 문맥에 의해 분명하게 반박되지 않는 한, 단수 및 복수 모두를 포함하는 의미로 사용될 수 있다.
상술한 용어들 이외에, 이하의 설명에서 사용되는 특정 용어들은 본 발명의 이해를 돕기 위해서 제공된 것이며, 이러한 특정 용어의 사용은 본 발명의 기술적 사상을 벗어나지 않는 범위에서 다른 형태로 변경될 수 있다.
아울러, 본 발명의 범위 내의 실시 예들은 컴퓨터 실행가능 명령어 또는 컴퓨터 판독가능 매체에 저장된 데이터 구조를 가지거나 전달하는 컴퓨터 판독가능 매체를 포함한다.
이러한 컴퓨터 판독가능 매체는, 범용 또는 특수 목적의 컴퓨터 시스템에 의해 액세스 가능한 임의의 이용 가능한 매체일 수 있다. 예로서, 이러한 컴퓨터 판독가능 매체는 RAM, ROM, EPROM, CD-ROM 또는 기타 광 디스크 저장장치, 자기 디스크 저장장치 또는 기타 자기 저장장치, 또는 컴퓨터 실행가능 명령어, 컴퓨터 판독가능 명령어 또는 데이터 구조의 형태로 된 소정의 프로그램 코드 수단을 저장하거나 전달하는 데에 이용될 수 있고, 범용 또는 특수 목적 컴퓨터 시스템에 의해 액세스 될 수 있는 임의의 기타 매체와 같은 물리적 저장 매체를 포함할 수 있지만, 이에 한정되지 않는다.
아울러, 본 발명은 퍼스널 컴퓨터, 랩탑 컴퓨터, 핸드헬드 장치, 멀티프로세서 시스템, 마이크로프로세서-기반 또는 프로그램 가능한 가전제품(programmable consumer electronics), 네트워크 PC, 미니컴퓨터, 메인프레임 컴퓨터, 모바일 전화, PDA, 페이저(pager) 등을 포함하는 다양한 유형의 컴퓨터 시스템 구성을 가지는 네트워크 컴퓨팅 환경에서 실시될 수 있다.
본 발명은 또한 네트워크를 통해 유선 데이터 링크, 무선 데이터 링크, 또는 유선 및 무선 데이터 링크의 조합으로 링크된 로컬 및 원격 컴퓨터 시스템 모두가 태스크를 수행하는 분산형 시스템 환경에서 실행될 수 있다. 분산형 시스템 환경에서, 프로그램 모듈은 로컬 및 원격 메모리 저장 장치에 위치될 수 있다.
그러면 이제, 본 발명의 실시 예에 따른 키워드 마인드맵 검색 시스템에서의 키워드 검색을 위한 장치에 대하여 도면을 참조하여 상세하게 설명하도록 한다.
도1은 본 발명의 실시 예에 따른 키워드 마인드맵 검색 시스템의 구조를 개략적으로 설명하기 위한 도면이다.
도1을 참조하면, 본 발명의 실시 예에 따른 키워드 마인드맵 검색 시스템은 입력장치(100), 출력장치(200), 도메인코퍼스(300) 및 마인드맵 검색 장치(400)를 포함하여 구성될 수 있다.
그러면 도1을 참조하여 각 구성요소에 대해 개략적으로 설명하도록 한다.
입력장치(100)는 사용자의 터치 또는 조작에 따른 입력 신호를 발생하는 키패드와 터치패드 중 적어도 하나를 포함하여 구성될 수 있다. 이때, 입력 장치(100)은 출력장치(200)와 함께 하나의 터치패널(또는 터치스크린(touch screen))의 형태로 구성되어 입력과 표시 기능을 동시에 수행할 수 있다. 또한, 입력장치(100)은 키보드, 키패드, 마우스, 조이스틱 등과 같은 입력 장치 외에도 향후 개발될 수 있는 모든 형태의 입력 수단이 사용될 수 있다.
특히, 본 발명에 따른 입력장치(100)는 사용자가 검색하고자 하는 컨텐츠에 관련한 키워드를 입력받아 마인드맵 검색장치(400)에 전달한다.
상기 입력장치(100)로부터 키워드를 전달받은 마인드맵 검색장치(400)는 상기 전달받은 키워드 및 상기 키워드를 기반으로 확장시킨 확장 키워드와 연관된 연관 컨텐츠를 추출하여 사용자에게 제공할 수 있다.
출력장치(200)는 마인드맵 검색 장치(400)의 기능 수행 중에 발생하는 일련의 동작상태 및 동작결과 등에 대한 정보를 표시한다.
여기서, 출력장치(200)는 액정표시장치(LCD, Liquid Crystal Display), 초박막 액정표시장치(TFT-LCD, Thin Film Transistor LCD), 발광다이오드(LED, Light Emitting Diode), 유기 발광다이오드(OLED, Organic LED), 능동형 유기발광다이오드(AMOLED, Active Matrix OLED), 레티나 디스플레이(Retina Display), 플렉시블 디스플레이(Flexible display) 및 3차원(3 Dimension) 디스플레이 등으로 구성될 수 있다.
이때, 출력장치(200)이 터치스크린(Touch screen) 형태로 구성된 경우, 출력장치(200)은 입력장치(100)의 기능 중 일부 또는 전부를 수행할 수 있다.
특히, 본 발명에서 출력장치(200)는 마인드맵 검색 장치(400)가 입력장치(100)로부터 전달받은 키워드를 기반으로 검색한 검색 결과를 전달받아 출력할 수 있다.
이 때, 상기 검색 결과는 입력받은 특정 키워드 및 이와 관련된 확장 키워드와 연관된 연관 컨텐츠일 수 있는데, 이러한 연관 컨텐츠는 텍스트, 영상, 그림, URL(Uniform Resource Locator) 주소 등 다양한 형태로 출력장치(200)를 통해 사용자에게 제공될 수 있다.
도메인 코퍼스(300)는 구조를 이루고 있는 도메인 텍스트의 집합으로서, 예를 들면, 포털 검색 사이트 등의 도메인에서 제공하는 뉴스 기사 등과 같은 텍스트 컨텐츠의 집합이 될 수 있다.
이러한 도메인 코퍼스(300)는 마인드맵 검색 장치(400)가 키워드를 추출하여 추출한 키워드 간의 관계정보를 구축하기 위한 하나의 자료가 된다.
마인드맵 검색 장치(400)는 도메인 코퍼스(300)로부터 전달받은 텍스트로 이루어진 도메인 코퍼스를 분석하여, 키워드를 추출하고, 상기 키워드를 기반으로 관계 정보를 생성하는 장치이다.
구체적으로 살펴보면, 마인드맵 검색 장치(400)는 도메인 코퍼스(300)로부터 하나 이상의 도메인코퍼스를 수집하여, 수집한 도메인 코퍼스의 형태소를 분석하고, 분석된 형태소 별 품사를 태깅하여 도메인 코퍼스 각각의 구문을 분석한다.
그리고, 상기 분석된 결과를 바탕으로 상기 도메인코퍼스에 포함되어 있는 개체명을 인식하고, 상기 인식된 개체명에 따라 하나 이상의 키워드를 추출한다.
이 때, 상기 추출되는 키워드는 일정 이상의 빈도수를 초과하는 빈도수를 가지는 키워드만을 선별하여 추출할 수 있는데, 즉, 특정 키워드가 하나 이상의 도메인 코퍼스에서 기 설정된 빈도수 이상의 횟수로 나타난다면, 상기 특정 키워드를 추출하고, 기 설정된 빈도수 미만으로 나타나는 키워드는 추출하지 않는다.
하나 이상의 키워드를 추출하면, 추출된 하나 이상의 키워드 간의 밀접도를 산출하게 되는데, 여기서, 밀접도란, 각 키워드가 얼마나 많은 연관성을 가지고 있느냐를 나타내는 수치이다.
이러한 밀접도는 두 개의 키워드가 같이 언급된 도메인 코퍼스의 수와 하나의 도메인 코퍼스에 두 개의 키워드가 언급되어 있는 수, 하나의 도메인 코퍼스 안에서 두 개의 키워드가 떨어져 있는 거리 등으로 상기 밀접도를 측정할 수 있다.
밀접도가 클수록, 상기 키워드 간의 연관성이 많은 것으로 보고, 관계정보에서 두 키워드 간의 관계를 상위 관계로 설정할 수 있다.
즉, 산출된 밀접도를 기반으로 하나 이상의 키워드 간의 관계를 정의하고, 관계 정보를 생성하며, 이렇게 생성된 관계정보를 기반으로 각 키워드 간의 밀접도 및 각 키워드의 출연빈도수를 매핑하여 저장하게 된다.
상기와 같은 방법으로 관계정보를 구축한 마인드맵 검색 장치(400)는 입력장치(100)로부터 특정 키워드를 입력받게 되고, 상기 저장된 관계정보를 기반으로 상기 특정 키워드와 연관된 하나 이상의 확장 키워드를 추출하고, 상기 확장 키워드를 기반으로 하나 이상의 연관 컨텐츠를 추출하여 출력장치(200)를 통해 출력할 수 있다.
이 때, 특정 키워드와 하나 이상의 확장 키워드의 밀접도 및 출연빈도수를 기반으로 가중치를 설정하고, 설정한 가중치에 따라 특정 키워드와 확장 키워드 간의 순위를 산출하여, 상기 순위를 기반으로 연관 컨텐츠를 출력할 수 있다.
즉, 특정 키워드와 연관성이 높은 확장 키워드일수록 높은 순위를 가지도록 설정하여, 특정 키워드와 하나 이상의 확장 키워드 간의 순위를 산정하고, 산정된 결과에 따라 높은 순위의 키워드와 관련한 연관 컨텐츠부터 사용자에게 제공하도록 함으로써, 양질의 컨텐츠 제공이 가능한 것이다.
또한, 특정 키워드의 관계 정보를 활용하여, 특정 키워드와 하나 이상의 확장 키워드 간의 밀접도 및 출연빈도수를 기반으로 상기의 특정 키워드와 하나 이상의 확장 키워드 간의 관계정보를 시각화하고, 상기 시각화된 관계 정보를 출력할 수도 있다.
이러한, 실시 예에 대해서는 도4를 참조하여 후술하도록 한다.
이상으로 본 발명의 실시 예에 따른 키워드 마인드맵 검색 시스템 구조에 대해 개략적으로 설명하였다.
이하, 상기 시스템의 구성 중, 본 발명에 따른 마인드맵 검색 장치(400)의 구성에 대해 설명하도록 한다.
도2는 마인드맵 검색 장치(400)의 주요 구성을 도시하는 블록도이고, 도3 내지 도5는 본 발명에 따른 마인드맵 검색 장치(400)가 관계정보를 구축하고, 키워드를 검색하는 실시 예를 설명하기 위한 도면이다.
먼저 도2를 참조하면, 본 발명에 따른 마인드맵 검색 장치(400)는 문장 분석모듈(410), 마인드맵 구성모듈(430), 마인드맵 저장모듈(450), 키워드 검색모듈(470) 및 순위설정 모듈(490)을 포함하여 구성될 수 있다.
문장 분석모듈(410)은 수집한 하나 이상의 도메인 코퍼스의 텍스트를 분석하는 장치로서, 도메인 코퍼스(300)로부터 하나 이상의 도메인 코퍼스를 수집하여, 도메인코퍼스 각각의 형태소를 분석하고, 형태소 별 품사를 태깅하여, 태깅된 품사를 기반으로 도메인 코퍼스 각각의 구문을 분석한다.
그리고 상기 분석된 구문을 바탕으로 도메인 코퍼스에 포함되어 있는 개체명을 인식하고, 개체명을 인식하면, 인식한 개체명을 마인드맵 구성 모듈(430)로 전달한다.
이 때, 개체명이란, 개체 또는 단독개념(한정된 속성으로 단독의 사물을 나타내는 개념)을 나타낸 단어로, 명사, 인명, 지명 등을 포함할 수 있다.
마인드맵 구성모듈(430)은 상기 문장분석 모듈(410)로부터 입력받은 개체명을 기반으로 하나 이상의 키워드를 추출하는데, 이 때, 마인드맵 구성모듈(430)은 출연하는 빈도수가 일정 이상을 초과하는 개체명을 키워드로써 추출할 수 있다.
즉, 하나 이상의 도메인 코퍼스에 기 설정된 빈도수를 초과하여 언급되는 키워드만을 추출하고, 기 설정된 빈도수 이하의 키워드는 추출하지 않을 수 있다.
이에 대해, 도3을 참조하여 설명하면, 도 3은 2015년 7월에 생성된 도메인 코퍼스에서 추출된 키워드를 나타낸 것으로서, '타자'라는 개체명이 1123번 문장문석모듈(410)에 의해 인식되어 '타자'라는 단어를 키워드로 추출하였고, 상기 키워드의 타입을 '야구용어'로 지정한 것이다.
마찬가지로, '홈런'이라는 개체명이 문장분석모듈(410)에 의해 943번 인식되어 키워드로 추출하였고, 상기 키워드의 타입은 '야구용어'이다.
한편, 도3의 경우에는 빈도수를 설정하지 않거나, 빈도수가 700이하인 경우를 나타낸 것이고, 만약 기 설정된 빈도수가 1000이라면, '타자' 이외의 '홈’', '한O', '양OO' 등은 키워드로써 추출되지 않을 것이다.
하나 이상의 키워드를 추출한 마인드맵 구성모듈(430)은 상기 키워드 간의 밀접도를 산출하게 되는데, 밀접도는 두 개의 키워드 간의 연관성이 얼마나 큰지를 측정한 척도로서, 두 개의 키워드가 함께 언급된 도메인 코퍼스의 수, 하나의 도메인 코퍼스에서 두 개의 키워드가 함께 언급된 수, 하나의 도메인 코퍼스 안에서 두 개의 키워드 간의 거리 등을 통해 산출할 수 있다.
그리고 상기 산출된 밀접도를 기반으로 키워드 간의 관계를 정의하고, 이를 관계정보로 생성하여, 마인드맵 저장모듈(450)에 저장한다.
이 때, 마인드맵 구성 모듈(430)은 생성된 관계정보를 기반으로 각 키워드 간의 밀접도 및 각 키워드의 출연빈도수를 매핑하여 마인드맵 저장모듈(450)에 저장할 수 있다.
마인드맵 저장모듈(450)은 상기 마인드맵 구성 모듈(430)이 생성하여 매핑한 상기 관계 정보를 저장하는 장치이다.
상기 마인드맵 저장모듈(450)은 마인드맵 구성 모듈(430)이 생성한 관계 정보를 저장하고 있다가, 키워드 검색 모듈(470)의 요청이 있는 경우, 상기 관계 정보를 키워드 검색모듈(470)로 출력한다.
상기 마인드맵 저장모듈(450)에 관계 정보가 저장되는 형태에 관한 실시 예는 도4를 통하여 설명할 수 있는데, 도4를 살펴보면, 마인드맵에 각 키워드와 연관된 컨텐츠를 매핑하여 고속 검색을 지원하기 위하여 1차원부터 다차원 인덱싱 형태로 표현될 수 있다.
즉, 마인드맵 저장모듈(450)은 관계정보를 다차원적으로 저장할 수 있도록 다차원 저장공간을 마련하고, 상기 다차원 저장공간에 키워드를 관계정보에 기반하여 하나 이상의 저장공간에 매핑정보와 함께 저장될 수 있다.
키워드 검색 모듈(470)은 입력장치(100)로부터 특정 키워드가 전달되면, 마인드맵 저장모듈(450)로부터 상기 특정 키워드가 포함된 관계정보를 입력받아, 상기 특정 키워드와 연관된 하나 이상의 확장 키워드를 추출하고, 상기 특정 키워드 및 확장 키워드와 연관된 연관 컨텐츠를 추출하여 출력장치(200)를 통해 출력하는 장치이다.
이러한 키워드 검색 모듈(470)은 입력받은 특정 키워드가 포함된 관계 정보를 상기 밀접도 및 출연빈도수를 기반으로 시각화할 수 있는데, 이에 대하여 도5를 참조하여 자세히 살펴본다.
도5를 보면, 도메인 코퍼스로부터 키워드로 추출된 '이O엽'에 대한 관계정보를 시각화하여 나타난 것인데, '이O엽'의 관계 정보로부터 확장키워드가 '홈런', '삼O', '안타', '국민타자', '400호' 등으로 추출되었고, 이러한 확장 키워드와 특정 키워드인 '이O엽'의 밀접도 및 출연빈도수를 고려하여, 관계정보를 시각화하는데, 즉, 밀접도 측면에서는 '이O엽'과 밀접한 확장 키워드 일수록 '이O엽'과 가까이 위치하도록 시각화 하고, 출연빈도수가 클수록 각 확장키워드가 들어간 동그라미를 크게 그려 시각화할 수 있다.
즉, 출연빈도수를 따지면, '400호'-'삼O'-'국민타자'-'홈런'-'안타' 순이 되는 것이다.
순위 설정 모듈(490)은 입력된 특정 키워드와 이와 관련된 확장 키워드 간의 순위를 설정하고, 상기 순위에 따라 연관 컨텐츠를 사용자에게 제공하기 위한 장치이다.
이러한 순위 설정 모듈(490)은 입력받은 특정 키워드와 하나 이상의 확장 키워드 간의 밀접도 및 출연빈도수를 기반으로 가중치를 설정하고, 상기 가중치에 따라 특정 키워드 및 확장 키워드의 순위를 산출하여, 산출된 순위를 기반으로 연관된 컨텐츠를 출력장치(200)를 통해 출력한다.
예를 들어, 특정 키워드의 경우, 사용자가 직접 입력한 키워드이므로, 가중치를 가장 높게 설정하고, 상기 특정 키워드와 밀접도가 크고, 출연빈도수가 많은 확장 키워드일수록 가중치를 높게 설정하여 순위를 산출하고, 높은 순위를 가진 키워드와 연관된 연관 컨텐츠를 우선적으로 사용자에게 제공할 수 있다.
이상, 상기 시스템의 구성 중, 본 발명에 따른 마인드맵 검색 장치(400)의 구성에 대해 설명하였다.
이하, 본 발명에 따른 키워드 마인드맵 검색 시스템의 동작 과정에 대해서 설명하도록 한다.
도6은 본 발명에 따른 키워드 마인드맵 검색 시스템에서 관계정보를 구축하는 과정을 설명하기 위한 흐름도이고, 도7은 본 발명에 따른 키워드 마인드맵 검색 시스템에서 컨텐츠를 검색하는 과정을 설명하기 위한 흐름도이다.
우선, 도6을 참조하여, 관계정보를 구축하는 과정을 살펴보면, 마인드맵 검색 장치(400)가 도메인코퍼스(300)로부터 코퍼스 데이터를 수집하고(S101), 수집한 코퍼스 데이터의 형태소를 분석한다(S103).
그리고 상기 분석된 형태소 별로 품사를 태깅하고(S105), 품사 태깅을 바탕으로 구문을 분석한 후, 상기 코퍼스 데이터에 포함되어 있는 개체명을 인식한다(S107).
상기 인식된 개체명을 바탕으로 하나 이상의 키워드를 추출하는데, 이 때, 마인드맵 검색 장치(400)는 기 설정된 빈도수를 초과하여 등장하는 키워드를 추출하고, 기 설정된 빈도수 이하의 키워드는 추출하지 않을 수 있다(S109).
그리고 상기 추출된 하나 이상의 키워드 간의 밀접도를 산출하게 되는데, 이러한 밀접도는 두 개의 키워드가 언급된 코퍼스 데이터의 개수 및 두 개의 키워드가 언급된 횟수, 하나의 코퍼스 데이터 내에서 두 개의 키워드가 언급된 부부 간의 거리 등으로 산출할 수 있다(S111).
이렇게 산출된 밀접도를 기반으로 키워드 간의 관계를 정의하여 관계정보를 생성하고, 상기 생성된 관계 정보를 기반으로 각 키워드 간의 밀접도, 각 키워드의 출연빈도수를 매핑하여 저장하게 된다(S115).
한편, 마인드맵 검색 장치(400)는 상기 생성된 관계정보를 기반으로 특정 키워드에 대한 관계정보를 시각화하여 출력할 수 있는데, 상기 산출된 밀접도 및 출연빈도수를 기반으로 키워드 간 밀접도를 시각화하여 출력할 수 있다(S113).
이러한 실시 예에 대하여는 앞서 도5를 참조하여 설명하였다.
이제, 도7을 참조하여, 키워드 마인드맵 검색 시스템에서의 컨텐츠를 검색하는 과정을 살펴보면, 사용자가 입력장치(100)를 통해 특정 키워드를 입력하면(S201), 마인드맵 검색 장치(400)는 저장된 관계정보를 기반으로 특정 키워드와 연관된 하나 이상의 확장 키워드를 추출하고(S203), 확장된 키워드를 기반으로 연관 컨텐츠를 추출한다(S205).
그리고 입력받은 특정 키워드와 상기 하나 이상의 확장 키워드의 밀접도 및 출연빈도수를 기반으로 가중치를 설정하는데, 여기서 가중치는 사용자가 입력한 특정 키워드에 가장 높은 가중치를 부여하고, 특정 키워드와 밀접도가 높으면서 출연빈도수가 많은 확장 키워드일수록 높은 가중치를 부여할 수 있다.
그리고 이렇게 설정한 가중치에 따라 특정 키워드 및 하나 이상의 확장 키워드의 순위를 산출한다(S207).
그 후, 산출된 키워드 순위를 기준으로 하나 이상의 키워드 및 상기 키워드에 연관된 컨텐츠 중 적어도 하나를 검색하여 그 검색결과를 사용자에게 출력한다(S209).
즉, 순위가 높은 컨텐츠를 우선적으로 사용자에게 제공하거나, 사용자가 우선 선택하도록 유도하기 위해 사용자의 눈에 가장 잘 띄는 위치에 상기 높은 순위의 컨텐츠를 선택하는 창을 배치할 수 있다.
이상, 본 발명에 따른 키워드 마인드맵 검색 시스템의 동작 과정에 대해서 설명하였다.
이상에서 설명한 바와 같이, 본 명세서는 다수의 특정한 구현물의 세부사항들을 포함하지만, 이들은 어떠한 발명이나 청구 가능한 것의 범위에 대해서도 제한적인 것으로서 이해되어서는 안되며, 오히려 특정한 발명의 특정한 실시형태에 특유할 수 있는 특징들에 대한 설명으로서 이해되어야 한다.
개별적인 실시형태의 문맥에서 본 명세서에 기술된 특정한 특징들은 단일 실시형태에서 조합하여 구현될 수도 있다.
반대로, 단일 실시형태의 문맥에서 기술한 다양한 특징들 역시 개별적으로 혹은 어떠한 적절한 하위 조합으로도 복수의 실시형태에서 구현 가능하다. 나아가, 특징들이 특정한 조합으로 동작하고 초기에 그와 같이 청구된 바와 같이 묘사될 수 있지만, 청구된 조합으로부터의 하나 이상의 특징들은 일부 경우에 그 조합으로부터 배제될 수 있으며, 그 청구된 조합은 하위 조합이나 하위 조합의 변형물로 변경될 수 있다.
마찬가지로, 특정한 순서로 도면에서 동작들을 묘사하고 있지만, 이는 바람직한 결과를 얻기 위하여 도시된 그 특정한 순서나 순차적인 순서대로 그러한 동작들을 수행하여야 한다거나 모든 도시된 동작들이 수행되어야 하는 것으로 이해되어서는 안 된다.
특정한 경우, 멀티태스킹과 병렬 프로세싱이 유리할 수 있다. 또한, 상술한 실시형태의 다양한 시스템 컴포넌트의 분리는 그러한 분리를 모든 실시형태에서 요구하는 것으로 이해되어서는 안되며, 설명한 프로그램 컴포넌트와 시스템들은 일반적으로 단일의 소프트웨어 제품으로 함께 통합되거나 다중 소프트웨어 제품에 패키징될 수 있다는 점을 이해하여야 한다.
본 명세서에서 설명한 주제의 특정한 실시형태를 설명하였다. 기타의 실시형태들은 이하의 청구항의 범위 내에 속한다. 예컨대, 청구항에서 인용된 동작들은 상이한 순서로 수행되면서도 여전히 바람직한 결과를 성취할 수 있다. 일 예로서, 첨부도면에 도시한 프로세스는 바람직한 결과를 얻기 위하여 반드시 그 특정한 도시된 순서나 순차적인 순서를 요구하지 않는다. 특정한 구현 예에서, 멀티태스킹과 병렬 프로세싱이 유리할 수 있다.
본 기술한 설명은 본 발명의 최상의 모드를 제시하고 있으며, 본 발명을 설명하기 위하여, 그리고 통상의 기술자가 본 발명을 제작 및 이용할 수 있도록 하기 위한 예를 제공하고 있다. 이렇게 작성된 명세서는 그 제시된 구체적인 용어에 본 발명을 제한하는 것이 아니다. 따라서, 상술한 예를 참조하여 본 발명을 상세하게 설명하였지만, 통상의 기술자라면 본 발명의 범위를 벗어나지 않으면서도 본 예들에 대한 개조, 변경 및 변형을 가할 수 있다.
따라서 본 발명의 범위는 설명된 실시 예에 의하여 정할 것이 아니고 특허청구범위에 의해 정하여져야 한다.
본 발명은 키워드 마인드맵 검색 방법 및 이를 위한 장치에 관한 것으로서, 더욱 상세하게는 대용량의 도메인 텍스트를 자동으로 분석하여 구축한 키워드 마인드 맵을 바탕으로 다양한 컨텐츠를 빠르고 효율적으로 검색하기 위한 방법 및 장치에 관한 것이다.
본 발명에 따르면, 하나 이상의 도메인 코퍼스를 분석하여 하나 이상의 키워드를 추출하고, 추출한 각 키워드 간의 관계정보를 생성하여 저장하고, 저장된 관계정보를 기반으로 사용자가 입력한 특정 키워드와 연관된 확장 키워드 및 연관 컨텐츠를 추출하여 사용자에게 제공함으로써, 비정형 데이터의 확보만으로 특정 분야의 검색 시스템을 구축할 수 있으며, 이러한 검색 시스템을 구축하는데 필요한 구축 비용을 낮추고 양질의 트렌디한 확장 키워드를 제공할 수 있다.
따라서 본 발명은 상기의 키워드 마인드맵 검색 방법을 통해 키워드 기반 컨텐츠 검색 산업 발전에 이바지 할 수 있으며, 시판 또는 영업의 가능성이 충분할 뿐만 아니라 현실적으로 명백하게 실시할 수 있는 정도이므로 산업상 이용가능성이 있다.
100: 입력장치 200: 출력장치 300: 도메인 코퍼스
400: 마인드맵 검색 장치

Claims (6)

  1. 마인드맵 검색 장치가 수집한 하나 이상의 도메인 코퍼스의 형태소를 분석하는 단계;
    상기 분석된 형태소에 포함되어 있는 개체명을 인식하는 단계;
    상기 개체명 인식 결과를 기반으로 하나 이상의 키워드를 추출하는 단계;
    상기 추출된 하나 이상의 키워드 간 밀접도를 산출하는 단계;
    상기 산출된 밀접도를 기반으로 상기 하나 이상의 키워드 간의 관계를 정의하여, 관계정보를 생성하는 단계;
    상기 생성된 관계정보를 기반으로 각 키워드 간의 밀접도 및 출연빈도수를 매핑하여 저장하는 단계;
    사용자가 입력한 특정 키워드를 입력받는 단계;
    상기 저장된 관계정보 기반으로 상기 특정 키워드와 연관된 하나 이상의 확장 키워드를 추출하는 단계; 및
    상기 확장 키워드를 기반으로 하나 이상의 연관 컨텐츠를 추출하여, 출력하는 단계;
    를 포함하는 키워드 마인드맵 검색 방법.
  2. 제1항에 있어서, 상기 확장 키워드를 추출하는 단계는
    상기 입력받은 특정 키워드와 상기 하나 이상의 확장 키워드의 밀접도 및 출연빈도수를 기반으로 가중치를 설정하는 단계;
    상기 설정한 가중치에 따라 상기 특정 키워드 및 상기 하나 이상의 확장 키워드의 순위를 산출하는 단계; 및
    상기 산출된 순위를 기반으로 하나 이상의 키워드 및 상기 키워드에 연관된 컨텐츠 중 적어도 하나를 출력하는 단계;
    를 포함하는 것을 특징으로 하는 키워드 마인드맵 검색 방법.
  3. 제1항에 있어서, 상기 추출하는 단계는
    상기 개체명 인식 단계에서 출연하는 빈도수가 기 설정된 빈도수를 초과하는 키워드를 추출하는 것을 특징으로 하는 키워드 마인드맵 검색 방법.
  4. 제1항에 있어서,
    상기 입력받은 특정 키워드가 포함된 관계정보를 상기 밀접도 및 출연빈도수를 기반으로 시각화하는 단계; 및
    상기 시각화된 관계정보를 출력하는 단계;
    를 더 포함하는 것을 특징으로 하는 키워드 마인드맵 검색 방법.
  5. 제1항에 있어서, 상기 개체명을 인식하는 단계 이전에,
    상기 분석된 형태소 별 품사를 태깅하는 단계; 및
    상기 태깅된 품사를 기반으로 상기 도메인 코퍼스 각각의 구문을 분석하는 단계;
    를 더 포함하는 것을 특징으로 하는 키워드 마인드맵 검색방법.
  6. 하나 이상의 도메인 코퍼스를 수집하여 상기 수집한 도메인 코퍼스 각각의 형태소를 분석하고, 상기 분석된 형태소에 포함되어 있는 개체명을 인식하는 문장 분석모듈;
    상기 개체명 인식 결과를 기반으로 하나 이상의 키워드를 추출하여, 상기 추출된 키워드 간의 밀접도를 산출하고, 상기 산출된 밀접도를 기반으로 상기 키워드 간의 관계를 정의하여, 관계정보를 생성하며, 상기 생성된 관계정보를 기반으로 각 키워드 간의 밀접도 및 출연빈도수를 매핑하여 마인드맵 저장모듈에 저장하도록 제어하는 마인드맵 구성 모듈;
    상기 마인드맵 구성 모듈이 생성하여 매핑한 상기 관계 정보를 저장하는 마인드맵 저장모듈; 및
    입력장치로부터 특정 키워드가 전달되면, 상기 저장된 관계정보를 기반으로 상기 특정 키워드와 연관된 하나 이상의 확장 키워드를 추출하고, 상기 확장 키워드를 기반으로 하나 이상의 연관 컨텐츠를 추출하는 키워드 검색 모듈;
    을 포함하는 마인드맵 검색 장치.
KR1020150173784A 2015-12-08 2015-12-08 마인드맵 기반 키워드 검색 방법 및 이를 위한 장치 KR20170067918A (ko)

Priority Applications (2)

Application Number Priority Date Filing Date Title
KR1020150173784A KR20170067918A (ko) 2015-12-08 2015-12-08 마인드맵 기반 키워드 검색 방법 및 이를 위한 장치
PCT/KR2016/014249 WO2017099454A1 (ko) 2015-12-08 2016-12-06 마인드맵 기반 키워드 검색 방법 및 이를 위한 장치

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020150173784A KR20170067918A (ko) 2015-12-08 2015-12-08 마인드맵 기반 키워드 검색 방법 및 이를 위한 장치

Publications (1)

Publication Number Publication Date
KR20170067918A true KR20170067918A (ko) 2017-06-19

Family

ID=59014395

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020150173784A KR20170067918A (ko) 2015-12-08 2015-12-08 마인드맵 기반 키워드 검색 방법 및 이를 위한 장치

Country Status (2)

Country Link
KR (1) KR20170067918A (ko)
WO (1) WO2017099454A1 (ko)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101934240B1 (ko) * 2018-08-13 2019-04-05 주식회사 아발론교육 키워드를 표시하는 방법 및 그 장치
KR102345818B1 (ko) * 2021-06-23 2021-12-31 주식회사 아티피셜 소사이어티 텍스트 데이터로부터 타겟팅 된 품사의 단어를 통해 사고구조 마인드맵을 생성하는 방법 및 시스템

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108763272B (zh) * 2018-04-08 2019-09-17 平安科技(深圳)有限公司 一种事件信息分析方法、计算机可读存储介质及终端设备
CN113488180B (zh) * 2021-07-28 2023-07-18 中国医学科学院医学信息研究所 一种临床指南知识建模方法及系统
CN113935292A (zh) * 2021-10-20 2022-01-14 厦门合立道工程设计集团股份有限公司 一种基于思维导图逻辑拓展的设计方法

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100729184B1 (ko) * 2005-07-25 2007-06-19 주식회사 엠파스 연상 키워드를 이용한 관계 정보 검색 방법 및 장치
US8266162B2 (en) * 2005-10-31 2012-09-11 Lycos, Inc. Automatic identification of related search keywords
US7788131B2 (en) * 2005-12-15 2010-08-31 Microsoft Corporation Advertising keyword cross-selling
KR101001834B1 (ko) * 2008-08-28 2010-12-15 엔에이치엔비즈니스플랫폼 주식회사 확장 키워드 풀을 사용한 검색 방법 및 시스템
KR101818717B1 (ko) * 2011-09-27 2018-01-15 네이버 주식회사 컨셉 키워드 확장 데이터 셋을 이용한 검색방법, 장치 및 컴퓨터로 판독 가능한 기록매체

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101934240B1 (ko) * 2018-08-13 2019-04-05 주식회사 아발론교육 키워드를 표시하는 방법 및 그 장치
KR102345818B1 (ko) * 2021-06-23 2021-12-31 주식회사 아티피셜 소사이어티 텍스트 데이터로부터 타겟팅 된 품사의 단어를 통해 사고구조 마인드맵을 생성하는 방법 및 시스템

Also Published As

Publication number Publication date
WO2017099454A1 (ko) 2017-06-15

Similar Documents

Publication Publication Date Title
US9881037B2 (en) Method for systematic mass normalization of titles
US8229730B2 (en) Indexing role hierarchies for words in a search index
US9558263B2 (en) Identifying and displaying relationships between candidate answers
KR101060594B1 (ko) 문서 데이터의 키워드 추출 및 연관어 네트워크 구성 장치 및 방법
US8639708B2 (en) Fact-based indexing for natural language search
KR101538998B1 (ko) 지식 구조를 기반으로 한 검색 서비스 제공 방법 및 장치
US20090070322A1 (en) Browsing knowledge on the basis of semantic relations
KR20170067918A (ko) 마인드맵 기반 키워드 검색 방법 및 이를 위한 장치
WO2016100835A1 (en) Question answering from structured and unstructured data sources
WO2007035912A2 (en) Document processing
Stokes et al. An empirical study of the effects of NLP components on Geographic IR performance
US20120179709A1 (en) Apparatus, method and program product for searching document
Spitz et al. EVELIN: Exploration of event and entity links in implicit networks
Eisenberg et al. Using association metrics to help users navigate API documentation
Li et al. Infographics retrieval: A new methodology
JP2010211438A (ja) 文書検索装置及び文書検索方法
JP2012104051A (ja) 文書インデックス作成装置
JP2006139484A (ja) 情報検索方法及びそのシステム並びにコンピュータプログラム
Zhang et al. A semantics-based method for clustering of Chinese web search results
JP5187187B2 (ja) 体験情報検索システム
KR20150008566A (ko) 검색 서비스 제공 시스템 및 방법
Mohajeri et al. BubbleNet: An innovative exploratory search and summarization interface with applicability in health social media
EP2181403B1 (en) Indexing role hierarchies for words in a search index
Gega et al. On the general principles of human-computer information retrieval
Ravikumar et al. VARIOUS METRICS: A FOCUS ON GOOGLE SCHOLAR-A CASE STUDY