KR20110050823A - 지식노드 연결구조를 생성하기 위한 검색 데이터베이스 구축 장치 및 방법 - Google Patents

지식노드 연결구조를 생성하기 위한 검색 데이터베이스 구축 장치 및 방법 Download PDF

Info

Publication number
KR20110050823A
KR20110050823A KR1020090107356A KR20090107356A KR20110050823A KR 20110050823 A KR20110050823 A KR 20110050823A KR 1020090107356 A KR1020090107356 A KR 1020090107356A KR 20090107356 A KR20090107356 A KR 20090107356A KR 20110050823 A KR20110050823 A KR 20110050823A
Authority
KR
South Korea
Prior art keywords
search
content
information
word
link
Prior art date
Application number
KR1020090107356A
Other languages
English (en)
Other versions
KR101122737B1 (ko
Inventor
최진근
Original Assignee
최진근
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 최진근 filed Critical 최진근
Priority to KR1020090107356A priority Critical patent/KR101122737B1/ko
Publication of KR20110050823A publication Critical patent/KR20110050823A/ko
Application granted granted Critical
Publication of KR101122737B1 publication Critical patent/KR101122737B1/ko

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F17/00Digital computing or data processing equipment or methods, specially adapted for specific functions

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

본 발명은 그래픽 위상 구조의 지식노드 연결구조를 생성하기 위한 검색 데이터베이스를 구축하는 장치 및 방법을 개시한다. 본 발명에 따른 검색 데이터베이스 구축 장치는, 검색 키워드를 이용하여 검색 사이트를 통해 수신한 제1검색 결과에서 상위에 랭크된 복수의 제1콘텐츠 링크를 선별하는 제1콘텐츠 링크 선별 모듈; 각각의 제1콘텐츠 링크에 대응하는 제1콘텐츠 정보를 분석하여 모든 제1콘텐츠 정보에 걸쳐 등장 빈도수가 높은 복수의 제1관련 단어를 선정하는 제1관련 단어 선정 모듈; 상기 검색 키워드와 상기 제1관련 단어의 상호 조합을 검색 키워드로 하여 상기 검색 사이트로부터 수신한 제2검색 결과에서 상위에 랭크된 복수의 제2콘텐츠 링크를 선별하는 제2콘텐츠 링크 선별 모듈; 각 제2콘텐츠 링크에 대해 대응하는 제2콘텐츠 정보에서 등장 빈도수가 높은 복수의 제2관련 단어를 추출하는 제2관련 단어 추출 모듈; 하나 이상의 제2관련 단어를 검색 키워드로 한 멀티미디어 검색 결과에서 상위에 랭크된 하나 이상의 멀티미디어 정보 링크를 추출하는 멀티미디어 정보 링크 추출 모듈; 및 각 제2콘텐츠 정보에 대해 검색 키워드, 상기 제1관련 단어, 제2콘텐츠 링크의 URL 및 상기 멀티미디어 정보 링크를 데이터베이스에 저장하는 데이터베이스 저장 모듈;을 포함한다.
데이터베이스, 검색, 지식노드, 지식노드 연결구조

Description

지식노드 연결구조를 생성하기 위한 검색 데이터베이스 구축 장치 및 방법{Apparatus and method for establishing search database for knowledge node coupling structure}
본 발명은 검색 데이터베이스 구축 장치 및 그 방법에 관한 것으로, 더욱 상세하게는 서로 관련성 있는 단어들 간의 연관성을 정의한 그래픽 위상 구조의 지식노드 연결구조를 생성하기 위한 검색 데이터베이스를 구축하는 장치 및 방법에 관한 것이다.
현대 사회의 인터넷 이용 활성화로 인해, 많은 사람들에게 인터넷은 정보를 습득하는 경로로서 중요한 역할을 담당하고 있다. 이전에는 신문이나 TV, 책 등의 매체가 주요 정보 습득 경로로 이용되어 왔으나, 점차 인터넷이 중요한 역할을 차지하게 되어 많은 사람들은 신문이나 TV, 책보다는 인터넷을 통해 정보를 얻는 경우가 많다. 이는 얻을 수 있는 정보의 종류나 양, 또는 그 신속성 등에 있어서 다른 매체가 인터넷을 더 이상 따라올 수 없게 되어가고 있으며, 사람들 또한 그렇게 인식하고 있기 때문이다. 뿐만 아니라, 신문이나 TV, 책 등에 비해 인터넷을 접할 수 있는 시간이나 기회는 훨씬 많다. 대부분의 회사나 가정은 컴퓨터를 이용해 인 터넷을 사용하고 있으며, 외출한 경우에도 PC방 등을 통해 인터넷을 이용할 수 있다. 더욱이, 이동통신이나 와이브로와 같은 무선 인터넷의 보편화로 휴대용 노트북, PDA, 스마트폰과 같은 휴대 단말을 이용하여 시간과 장소에 구애받지 않고 인터넷을 이용할 수 있는 기회가 많아지게 되었다.
이와 같이, 많은 사람들은 인터넷을 통해 다양한 정보를 습득하고 있으며, 그 중 가장 많이 이용되고 있는 정보 습득 방법으로 검색 사이트를 들 수 있다. 즉, 다음, 네이버, 야후, 구글 등과 같은 각종 검색 사이트에서 제공되는 검색 서비스를 통해 사용자는 원하는 정보를 검색하고 관련 정보를 습득한다.
특히, 최근에는 보다 쉽고 흥미있는 정보를 얻을 수 있는 멀티미디어와 같은 시청각 정보에 대한 검색 요구가 폭발적으로 증가하고 있다. 예를 들어, 인터넷을 통해 TV의 실시간 또는 녹화된 프로그램, 가수의 뮤직 비디오, 영화 예고편 등의 동영상을 검색하여 시청한다. 또한, 이슈가 되는 연예인이나 스포츠 선수들의 얼굴을 보기 위해 이미지를 검색하고, 특정 장소로 떠나기 전, 이동 경로를 미리 알아보기 위해 웹지도를 검색한다. 특히, 최근에는 개인이 손쉽게 동영상 등의 UCC(User Created Contents)를 제작할 수 있으므로, 개인이 제작한 UCC가 사회적으로 큰 이슈를 만들기도 하며, 이 경우, 사용자들은 이러한 UCC를 즉시 검색하여 감상하고 싶어한다.
검색 사이트 등이 이용하는 기존의 검색시스템은 사용자로부터 전송받는 검색어로 검색 데이터베이스를 조회하여 조회된 데이터들을 제공하며, 경우에 따라서는 조회된 데이터들이 웹 문서, 동영상, 음악, 이미지 등의 카테고리별로 제공되기 도 한다.
예를 들어, 사용자가 특정 검색어를 입력하면, 텍스트 검색 결과 제시란에 '내용 중 해당 검색어를 포함하는 텍스트'를 검색하여 나열하고, 동영상 검색 결과 제시란에 '제목 중 해당 검색어를 포함하는 동영상'을 검색하여 나열하며, 이미지 검색 결과 제시란에 '제목 중 해당 검색어를 포함하는 이미지'를 검색하여 나열한다.
하지만, 기존의 검색시스템은 특정 검색어에 대한 깊이 탐색 위주로 설계되어 있어 검색 결과 정보를 단순 나열할 뿐이다. 즉, 검색서버가 사용자로부터 전송받는 검색어로 검색 데이터베이스를 조회하여 조회된 데이터들을 단순히 순서적으로 나열하여 제공한다. 비록, 기존의 검색 시스템이 조회된 데이터들을 여러 가지 카테고리별로 분류하여 제공하고 있다고는 하나, 이 또한 조회된 데이터에 대한 카테고리별 단순 나열에 불과하다.
이와 같은 기존의 검색 결과 제시 형태는, 검색 결과로서 조회된 데이터, 즉 조회된 콘텐츠 정보 각각을 분리하여 제시하고 있기 때문에, 조회된 콘텐츠 정보 간 연관성을 파악하는데 어려움이 있다. 또한, 각각의 콘텐츠 정보를 카테고리별로 단순히 병렬적으로 나열하고 있는 형태이므로 검색된 카테고리별 콘텐츠 정보 간 연관성을 파악하는데도 어려움이 있다.
따라서, 사용자는 검색 결과에 포함된 각 정보의 관련성을 자신의 지적 능력을 토대로 임의로 파악해야 하는 한계가 있다. 다시 말해, 사용자가 특정 검색 결과에 접근한 후 다른 검색 결과에 접근하기 위해서는 사용자가 스스로 특정 검색 결과를 선택해야 한다. 그러므로, 이러한 기존 검색시스템을 이용하여서는, 사용자가 응용성 있는 관련 지식으로 검색 결과를 확장해 나가기 어려우므로, 정보의 조립 및 조합을 통하여 신지식을 창출해 나가는데 부적합하다.
그런데, 이러한 문제점에도 불구하고, 검색된 콘텐츠 정보 간 관련성에 대한 정보를 제시하지 못하는 중요한 이유는, 콘텐츠 정보 간 유기적 연관성을 토대로 관련성이 있는 콘텐츠 정보를 함께 제공할 수 있도록 하는 검색 데이터베이스가 제대로 구축되어 있지 않기 때문이다. 즉, 기존의 검색 시스템은 콘텐츠 정보 간 유기적 연관성에 대한 판단 기준을 제대로 마련하고 있지 못하고, 또한 기준이 마련되어 있더라도 그러한 판단 기준에 따라 무한한 양의 콘텐츠 정보에 대한 관련성을 일일이 분석하여 이를 데이터베이스화하기가 매우 어렵다.
또한, 이러한 데이터베이스화를 위해서는 일반 사용자나 관리자에 의한 데이터가 축적되어야 하나, 이러한 검색 서비스가 제공되고 있지 않기 때문에, 사용자에 의한 데이터 축적이 없어 데이터베이스화가 제대로 이루어지기 어렵다. 따라서, 사용자의 입력 데이터가 축적될 때까지 기다리거나 관리자가 데이터를 입력하여야 하지만 이 경우 시간이 오래 걸리게 되는 단점이 있다. 뿐만 아니라, 이러한 경우 사용자나 관리자마다 콘텐츠 정보 간 관련성에 대한 기준이 다르므로 입력되는 정보에 대한 일관성이 없게 되어 정확한 정보에 의한 데이터베이스 구축이 어렵다는 문제점을 갖는다.
따라서, 본 발명은 상기와 같은 문제점을 해결하기 위하여 창안된 것으로서, 개별 데이터 간의 연관성 관계가 정의된 지식노드 연결구조를 생성할 수 있도록 검색 데이터베이스를 구축함으로써 통합적이고 입체적인 지식 습득이 가능하도록 하는 검색 데이터베이스 구축 장치 및 방법을 제공하는 것을 목적으로 한다.
본 발명의 다른 목적 및 장점들은 하기의 설명에 의해서 이해될 수 있으며, 본 발명의 실시예에 의해 보다 분명하게 알게 될 것이다. 또한, 본 발명의 목적 및 장점들은 특허 청구 범위에 나타낸 수단 및 그 조합에 의해 실현될 수 있음을 쉽게 알 수 있을 것이다.
상기와 같은 목적을 달성하기 위한 본 발명에 따른 검색 데이터베이스 구축 장치는, 검색 키워드를 이용하여 검색 사이트를 통해 수신한 제1검색 결과에서 상위에 랭크된 복수의 제1콘텐츠 링크를 선별하는 제1콘텐츠 링크 선별 모듈; 각각의 제1콘텐츠 링크에 대응하는 제1콘텐츠 정보를 분석하여 모든 제1콘텐츠 정보에 걸쳐 등장 빈도수가 높은 복수의 제1관련 단어를 선정하는 제1관련 단어 선정 모듈; 상기 검색 키워드와 상기 제1관련 단어의 상호 조합을 검색 키워드로 하여 상기 검색 사이트로부터 수신한 제2검색 결과에서 상위에 랭크된 복수의 제2콘텐츠 링크를 선별하는 제2콘텐츠 링크 선별 모듈; 각 제2콘텐츠 링크에 대해 대응하는 제2콘텐츠 정보에서 등장 빈도수가 높은 복수의 제2관련 단어를 추출하는 제2관련 단어 추 출 모듈; 하나 이상의 제2관련 단어를 검색 키워드로 한 멀티미디어 검색 결과에서 상위에 랭크된 하나 이상의 멀티미디어 정보 링크를 추출하는 멀티미디어 정보 링크 추출 모듈; 및 각 제2콘텐츠 정보에 대해 검색 키워드, 상기 제1관련 단어, 제2콘텐츠 링크의 URL 및 상기 멀티미디어 정보 링크를 데이터베이스에 저장하는 데이터베이스 저장 모듈;을 포함한다.
또한, 상기 목적을 달성하기 위한 본 발명에 따른 검색 데이터베이스 구축 방법은, (a) 검색 키워드를 이용하여 검색 사이트를 통해 수신한 제1검색 결과에서 상위에 랭크된 복수의 제1콘텐츠 링크를 선별하는 단계; (b) 각각의 제1콘텐츠 링크에 대응하는 제1콘텐츠 정보를 분석하여 모든 제1콘텐츠 정보에 걸쳐 등장 빈도수가 높은 복수의 제1관련 단어를 선정하는 단계; (c) 상기 검색 키워드와 상기 제1관련 단어의 상호 조합을 검색 키워드로 하여 상기 검색 사이트로부터 수신한 제2검색 결과에서 상위에 랭크된 복수의 제2콘텐츠 링크를 선별하는 단계; (d) 각 제2콘텐츠 링크에 대해 대응하는 제2콘텐츠 정보에서 등장 빈도수가 높은 복수의 제2관련 단어를 추출하는 단계; (e) 하나 이상의 제2관련 단어를 검색 키워드로 한 멀티미디어 검색 결과에서 상위에 랭크된 하나 이상의 멀티미디어 정보 링크를 추출하는 단계; 및 (f) 각 제2콘텐츠 정보에 대해 검색 키워드, 상기 제1관련 단어, 제2콘텐츠 링크의 URL 및 상기 멀티미디어 정보 링크를 데이터베이스에 저장하는 단계;를 포함한다.
본 발명에 따르면, 개별 콘텐츠 정보 간 관련성을 명확히 파악하고 그러한 관련성 정보를 함께 저장함으로써 입체적이고 통합적인 검색 서비스를 제공할 수 있도록 하는 검색 데이터베이스가 구축될 수 있다.
특히, 하나의 검색 키워드 입력으로 수많은 관련 콘텐츠 정보 및 시청각 정보가 자동으로 수집될 수 있으므로, 빠른 시간 안에 많은 양의 데이터 축적이 가능하게 되어 검색 데이터베이스 구축이 보다 신속하고 용이하게 이루어질 수 있다.
이와 같이 구축된 검색 데이터베이스는, 콘텐츠 정보에 담긴 무형의 지식을 핵심단어와 관련단어로 이루어진 지식노드 연결구조를 출력하는데 이용될 수 있다. 이러한 지식노드 연결구조는 그래픽 위상구조로 시각화될 수 있음은 물론, 관련 콘텐츠 정보와 시청각 정보를 통합적으로 연계시킴으로써, 지각, 청각 및 시각을 통한 입체적인 지식 습득이 가능하도록 한다.
따라서, 사용자는 검색 결과로 제공된 지식노드 연결구조를 통해 지식을 재생산할 수 있으며, 이를 통해 학문간 벽을 허물어 콘텐츠 정보와 시청각 정보가 유기적으로 접목되고 타 학문간의 지식이 하나의 지식 체계로 융합된 컨버젼스형 통합 지식 정보의 제공이 가능하다.
이하 첨부된 도면을 참조로 본 발명의 바람직한 실시예를 상세히 설명하기로 한다. 이에 앞서, 본 명세서 및 청구범위에 사용된 용어나 단어는 통상적이거나 사전적인 의미로 한정해서 해석되어서는 아니되며, 발명자는 그 자신의 발명을 가장 최선의 방법으로 설명하기 위해 용어의 개념을 적절하게 정의할 수 있다는 원칙에 입각하여 본 발명의 기술적 사상에 부합하는 의미와 개념으로 해석되어야만 한다.
따라서, 본 명세서에 기재된 실시예와 도면에 도시된 구성은 본 발명의 가장 바람직한 일 실시예에 불과할 뿐이고 본 발명의 기술적 사상을 모두 대변하는 것은 아니므로, 본 출원시점에 있어서 이들을 대체할 수 있는 다양한 균등물과 변형예들이 있을 수 있음을 이해하여야 한다.
본 발명에서 이용하는 지식노드 연결구조는 특정 단어를 핵심단어로 정의하고, 이 핵심단어로부터 연관성에 따라서 파생되는 적어도 하나 이상의 관련단어를 나열하여 핵심단어와 관련단어 각각을 하나의 지식노드로 대응하여 구성한 그래픽 위상구조의 노드 집합체를 의미한다.
여기서 그래픽 위상구조라 함은 하나의 지식을 여러 개의 단어로 규정하고, 각 단어의 중요도나 단어 사이의 연관 관계에 따라 단어 사이의 주종 관계를 도형과 선을 이용하여 기하학적 구조로 표시한 것을 말한다.
일 예로, 그래픽 위상구조는 도 1에 도시된 바와 같은 수평-수직 확장 구조를 가질 수 있다.
도 1을 참조하면, a1을 핵심단어로 정의할 때, a1으로부터 파생되는 관련단어는 a2, a3 및 a4이고, 이러한 a1, a2, a3 및 a4가 하나의 단위 지식노드 연결구조를 구성한다. 이러한 단위 지식노드 연결구조는 도 1에서 점선으로 표시하였다. 또한, a3은 a1의 관련단어이지만 새로운 핵심단어가 될 수 있으며, 도 1에서 a3을 핵심단어로 한 관련단어는 a5 및 a6이다. 따라서, a3, a5 및 a6이 다른 단위 지식노드 연결구조를 구성할 수 있다. 마찬가지로, a6을 핵심단어로 하는 관련단어는 a7이며, a6 및 a7이 또 다른 단위 지식노드 연결구조를 구성한다. 이러한 방식으 로 여러 개의 단위 지식노드 연결구조가 결합하여 수평-수직 확장 구조의 조합 지식노드 연결구조가 형성될 수 있다.
다른 예로, 그래픽 위상구조는 도 2에 도시된 바와 같은 동심원형 확장 구조를 가질 수 있다.
도 2를 참조하면, a1을 핵심단어로 정의할 때, 이로부터 파생되는 관련단어는 a2 및 a3이고, a1, a2 및 a3가 하나의 단위 지식노드 연결구조를 구성한다. 마찬가지로, a1을 핵심단어로 하고 a4 및 a5를 관련단어로 하는 단위 지식노드 연결구조, a1을 핵심단어로 하고 a6, a7 및 a8을 관련단어로 하는 단위 지식노드 연결구조 등 a1을 핵심단어로 하는 여러 단위 지식노드 연결구조들을 구성할 수 있다. 이러한 방식으로 여러 개의 단위 지식노드 연결구조가 결합하여 동심원형 확장 구조의 조합 지식노드 연결구조가 형성될 수 있다.
또 다른 예로, 그래픽 위상구조는 도 3에 도시된 바와 같은 가지 확장 구조를 가질 수 있다.
도 3을 참조하면, a1을 핵심단어로 하고 a2, a3 및 a4를 관련단어로 하여 하나의 단위 지식노드 연결구조가 구성될 수 있고, a2를 핵심단어로 하여 a5 및 a6를 관련단어로 하는 다른 단위 지식노드 연결구조가 구성될 수 있다. 또한, a1을 핵심단어로 하고 a7, a8 및 a9를 관련단어로 하여 또 다른 단위 지식노드 연결구조가 구성될 수 있다. 이러한 방식으로 여러 개의 단위 지식노드 연결구조가 결합하여 가지 확장 구조의 조합 지식노드 연결구조가 형성될 수 있다.
한편, 그래픽 위상구조에 대한 실시예는 상기한 실시예 이외에도 여러 가지 변형이 가능하다. 따라서 본 발명은 하나의 지식을 여러 개의 단어로 규정하고, 각 단어의 중요도나 단어 사이의 연관 관계에 따라 단어 사이의 주종 관계를 도형과 선을 이용하여 기하학적 구조로 표시한 것, 그리고 이렇게 표시된 복수의 기하학적 구조가 여러 가지 형태로 조립된 기하학적 구조를 그래픽 위상구조로 총칭하기로 한다.
본 발명에 따른 검색 데이터베이스 구축 장치 및 방법은, 이와 같이 서로 관련성 있는 단어들간의 연관성을 정의한 그래픽 위상 구조의 지식노드 연결구조를 생성할 수 있는 검색 데이터베이스를 구축한다.
도 4는, 본 발명의 일 실시예에 따른 검색 데이터베이스 구축 장치(100)의 기능적 구성을 개략적으로 도시한 블록도이다.
도 4를 참조하면, 본 발명의 검색 데이터베이스 구축 장치(100)는 입력 모듈(110), 제1콘텐츠 링크 선별 모듈(120), 제1관련 단어 선정 모듈(130), 제2콘텐츠 링크 선별 모듈(140), 제2관련 단어 추출 모듈(150), 멀티미디어 정보 링크 추출 모듈(160) 및 데이터베이스 저장 모듈(170)을 포함한다.
상기 입력 모듈(110)은, 검색 키워드를 입력받는다. 이때, 검색 키워드를 입력받는 방법으로는 다양한 방법이 이용될 수 있다.
우선, 상기 입력 모듈(110)은 사용자 단말(600)로부터 검색 키워드를 직접 입력받을 수 있다. 상기 사용자 단말(600)은 본 발명에 따른 검색 데이터베이스 구축 장치(100)에 직접 연결되거나 인터넷(400) 등의 유무선 통신망을 통해 장치에 접속되어 있다.
여기서, 사용자는 본 발명에 따라 구축된 검색 데이터베이스(200)를 이용하는 일반 사용자는 물론, 검색 데이터베이스 구축 장치(100)를 관리하는 관리자를 포함하는 개념이다. 따라서, 검색 데이터베이스 구축 장치(100)의 관리자 측에서 검색 키워드를 직접 입력하거나, 인터넷(400)을 이용하는 일반 사용자가 검색 키워드를 직접 입력할 수도 있다.
또한, 입력 모듈(110)이 사용자로부터 검색 키워드를 입력받을 때, 하나 이상의 검색 키워드가 포함된 특정 형식의 파일(예를 들면, 엑셀 파일)로 전송받을 수도 있다. 즉, 사용자가 하나 이상의 검색 키워드를 입력하여 특정 파일 형식으로 저장하고 인터넷(400)을 통해 검색 데이터베이스 구축 장치(100)로 전송하면, 상기 입력 모듈(110)이 그 파일을 전송받아 파일에 저장된 검색 키워드를 추출하는 형태로 검색 키워드가 입력될 수도 있다.
한편, 사용자 단말(600)이 검색 데이터베이스 구축 장치(100) 내에 포함된 경우 검색 키워드는 LAN과 같은 로컬 통신망을 통해 검색 데이터베이스 구축 장치(100)로 입력될 수 있다.
도 5는, 입력 모듈(110)로 검색 키워드를 입력하기 위한 사용자 단말(600)의 화면에 대한 일 실시예를 도시한다.
도 5(a)를 참조하면, 사용자 단말(600)에 검색 키워드를 입력할 수 있는 입력창이 마련되어 있고, 사용자가 '라디오 스타'와 같은 검색 키워드를 입력하여 '입력' 버튼을 클릭하면, 입력된 검색 키워드가 입력 모듈(110)로 전송된다.
도 5(b)를 참조하면, 미리 정해진 형식에 맞추어 '라디오 스타', '단풍 여 행', '한국 시리즈'와 같이 복수의 검색 키워드를 입력하고 '입력' 버튼을 클릭하면, 입력된 검색 키워드 리스트가 특정 파일 형식으로 저장된다. 따라서, 상기 입력 모듈(110)은 이러한 파일을 사용자 단말(600)로부터 전송받고 리스트에 포함된 '라디오 스타', '단풍 여행', '한국 시리즈'를 검색 키워드로 입력받는다.
또한, 상기 입력 모듈(110)은 검색 사이트(500)가 제공하는 웹문서로부터 검색 키워드를 추출하여 검색 키워드로 입력받을 수 있다.
이때, 검색 사이트(500)에서 제공하는 인기 검색어나 인기 태그를 자동으로 추출하여 검색 키워드로 입력받을 수 있다.
일반적으로 네이버, 다음, 야후와 같은 각종 검색 사이트(500)에서는, '급상승 검색어', '이슈 검색어', '트랜드 검색어'와 같이, 일정 시간당 검색어나 태그로 입력된 횟수가 많은 검색어와 태그를 인기 검색어와 인기 태그로 선별하여 일반 사용자에게 제공하고 있다. 따라서, 본 발명에 따른 입력 모듈(110)은 이와 같이 검색 사이트(500)에서 제공하는 인기 검색어나 인기 태그를 검색 키워드로 입력받을 수 있다. 이를 위해, 상기 입력 모듈(110)은 인기 검색어나 인기 태그가 개재되는 상기 검색 사이트(500)의 특정 URL에 해당하는 웹문서를 다운로드한 후 웹 스크랩핑 기술에 의해 웹문서 내의 코드를 분석하여 인기 검색어나 인기 태그를 추출할 수 있다. 상기 입력 모듈(110)은 사용자로부터 상기 특정 URL 정보를 입력받기 위한 인터페이스를 사용자 단말(600)을 통해 제공할 수 있다. 이와 같이 인기 검색어나 인기 태그를 이용하면, 현재 이슈가 되는 단어에 대하여 우선적으로 검색 데이터베이스를 구축할 수 있다는 점에서 장점을 갖는다.
이때, 상기 '인기 검색어'라는 명칭은 일 실시예에 불과하며, 상기한 급상승 검색어, 이슈 검색어, 트랜드 검색어와 같이 다양한 명칭을 모두 포함하는 개념이다.
한편, 상기와 같이 입력 모듈(110)로 입력된 검색 키워드는 지식노드 연결구조를 생성할 때 지식노드 구성 단어가 될 수 있다.
상기 제1콘텐츠 링크 선별 모듈(120)은, 상기 입력 모듈(110)에 입력된 검색 키워드를 포함하는 콘텐츠 정보의 링크를 인터넷(400)을 통해 검색한다. 예를 들어, 인터넷(400)에 연결된 검색 사이트(500)에 입력된 검색 키워드를 검색어로 입력하여 검색을 수행한다.
그리고, 그러한 결과로서 도출된 제1검색 결과에서 상위에 랭크된 복수의 제1콘텐츠 링크를 선별한다. 일반적으로, 검색 사이트(500)가 검색 결과로 제시하는 검색 결과 페이지에는 검색된 콘텐츠 정보의 링크가 포함되어 있고, 해당 링크를 클릭하면 해당 콘텐츠 정보로 연결된다. 또한, 검색 결과 페이지에는 검색된 다수의 콘텐츠 링크가 검색 키워드가 많이 포함된 순서 등과 같이 일정 기준에 따라 우선 순위가 부여되어 순서대로 나열된다. 상기 제1콘텐츠 링크 선별 모듈(120)은 이와 같이 검색 사이트(500)가 제시한 제1검색 결과 중 최상위 콘텐츠 링크부터 차례대로 미리 정해진 수만큼의 제1콘텐츠 링크를 선별한다.
본 발명에서, 상기 콘텐츠 정보는 텍스트를 기반으로 하는 웹 문서를 의미하며, 시청각 정보의 링크가 콘텐츠 내에 포함되는 것을 특별히 제한하지 않는다.
도 6은 본 발명의 일 실시예에 따라 제1콘텐츠 링크 선별 모듈(120)이 특정 검색 키워드를 통해 콘텐츠 링크를 검색하고 선별하는 과정을 개략적으로 도식화한 도면이다.
도 6에 도시된 바와 같이, 상기 제1콘텐츠 링크 선별 모듈(120)은 '라디오 스타'라는 검색 키워드를 이용하여 검색을 수행한다. 도 6에서는, 이러한 제1검색 결과로서 콘텐츠 링크 A1 내지 콘텐츠 링크 A300의 총 300개의 콘텐츠 링크가 검색된 것으로 도시하였다. 이때, 상기 제1콘텐츠 링크 선별 모듈(120)은 사용자가 미리 지정한 적어도 하나 이상의 검색 사이트(500)에서 상기 검색을 수행할 수 있다.
그리고 나서, 상기 제1콘텐츠 링크 선별 모듈(120)은 검색된 300개의 콘텐츠 링크에 대하여, 각각의 콘텐츠 링크에 대응하는 콘텐츠 정보의 제목, 태그, 본문 등에 '라디오 스타'라는 단어가 많이 포함되어 있는 순으로 상위 10개의 제1콘텐츠 링크(제1콘텐츠 링크 1 내지 제1콘텐츠 링크 10)를 선별한다. 이때, 10개라는 제1콘텐츠 링크의 선별 개수는 일 실시예에 불과하며 다양한 수가 지정될 수 있음은 당업자에게 자명한 사항이다.
상기 제1관련 단어 선정 모듈(130)은, 제1콘텐츠 링크 선별 모듈(120)에 의해 선별된 복수의 제1콘텐츠 링크에 대응하는 제1콘텐츠 정보 각각에 대하여, 식별 가능한 단어별로 빈도수를 분석한다. 즉, 각각의 제1콘텐츠 정보에 대하여 제목, 태그, 본문 등을 분석하여 식별 가능한 단어들의 리스트를 추출한 후 각 단어별로 빈도수를 분석한다. 여기서, 빈도수라 함은 단어가 제목, 태그, 본문 등에 등장하는 횟수를 의미한다.
여기서, 각각의 제1콘텐츠 정보에 대하여 단어별 빈도수를 분석하는 방법의 일 예로 형태소 분석 방법이 이용될 수 있다. 즉, 상용화된 형태소 분석 툴을 이용한 형태소 분석을 통해 각 단어별로 빈도수가 산정될 수 있다. 다른 예로, 국내공개 제2001-0055114호, 국내공개 제2004-0101678호, 국내공개 제2002-0054254호 등에 개시된 기술이 이용될 수 있다.
한편, 단어의 빈도수를 계산하는 과정에서, 단어가 등장하는 영역에 빈도수에 대한 가중치가 차별적으로 부여될 수 있다. 예를 들어, 특정 단어가 본문 중에 등장할 경우 빈도수를 1로 계산하고, 제목 중에 등장할 경우 빈도수를 2로 계산할 수 있다. 이는, 특정 단어가 본문 중에 위치하는 경우보다 제목과 같은 곳에 위치하는 경우, 해당 콘텐츠 정보에 대한 그 단어의 관련도가 상대적으로 높다고 판단할 수 있기 때문이다. 이러한 빈도수에 대한 가중치 부여 형태는 일 실시예에 불과하며 가중치를 부여하는 방식은 다양한 변형이 가능하다.
상기와 같이 각각의 제1콘텐츠 정보에 대하여 단어별 빈도수 분석이 완료되면, 상기 제1관련 단어 선정 모듈(130)은 빈도수가 높은 상위 빈도수 단어를 복수 개 추출한다. 즉, 각각의 제1콘텐츠 정보에 대하여 단어별 빈도수를 비교하고, 빈도수가 높은 단어를 일정 개수만큼 선정한다.
그리고나서, 상기 제1관련 단어 선정 모듈(130)은 이와 같이 추출된 단어에 대한 전체 빈도수를 비교하여, 전체 빈도수가 높은 제1관련 단어를 복수 개 선정한다. 여기서, 전체 빈도수란, 각 제1콘텐츠 정보로부터 분석된 각각의 상위 빈도수 단어에 대하여 각 제1콘텐츠 정보에서의 빈도수를 모두 합한 수를 말한다. 예를 들 어, 특정 단어 A가 제1콘텐츠 정보 A1에서 n1회, 제1콘텐츠 정보 A2에서 n2회, 제1콘텐츠 정보 A3에서 n3회, ..., 제1콘텐츠 정보 A300에서 n300회가 노출되었다면, 상기 특정 단어 A의 전체 빈도수는 n1+n2+n3+...+n300으로 계산된다. 이러한 전체 빈도수 계산 과정은 각 콘텐츠 정보로부터 추출된 상위 빈도수 단어들에 대해 반복된다.
도 7은, 본 발명의 일 실시예에 따라 상기 제1관련 단어 선정 모듈(130)이 복수의 제1콘텐츠 링크에 대하여 제1관련 단어를 선정하는 과정을 개략적으로 도식화한 도면이다.
도 7을 참조하면, 제1콘텐츠 링크 선별 모듈(120)이 선별한 10개의 콘텐츠 링크(제1콘텐츠 링크 1 내지 제1콘텐츠 링크 10)에 대하여, 제1관련 단어 선정 모듈(130)은 각 제1콘텐츠 링크에 대응하는 제1콘텐츠 정보 각각에 대하여 상위 빈도수 단어를 15개씩 추출한다. 따라서, 10개의 제1콘텐츠 정보 전체에 대하여 추출된 상위 빈도수 단어는 모두 150개가 된다.
그리고나서, 제1관련 단어 선정 모듈(130)은 추출된 전체 상위 빈도수 단어들로부터 중복을 제거한다. 본 실시예에서, 중복이 제거된 전체 상위 빈도수 단어들의 수는 80개라고 가정한다. 그런 후 제1관련 단어 선정 모듈(130)은 80개의 상위 빈도수 단어 각각에 대하여 제1콘텐츠 정보 1 내지 10에서의 빈도수를 모두 합산하여 전체 빈도수를 구한다. 예를 들어, 추출된 특정 단어의 빈도수가 제1콘텐츠 정보 1에서 5, 제1콘텐츠 정보 4에서 2, 제1콘텐츠 정보 7에서 3이라면, 해당 단어 의 전체 빈도수는 10이 된다. 이와 같은 방법으로, 80개의 추출된 단어에 대한 전체 빈도수가 계산되면, 전체 빈도수가 높은 단어 순으로 5개의 단어가 제1관련 단어로 선정된다.
이때, 도 6의 실시예와 마찬가지로, 15개라는 상기 상위 빈도수 단어의 추출 개수 및 5개라는 제1관련 단어의 선정 개수 등은 일 실시예에 불과하며, 본 발명은 이러한 특정 개수에 한정되지 않는다.
상기 제2콘텐츠 링크 선별 모듈(140)은, 상기 입력 모듈(110)에 입력된 검색 키워드와 상기 제1관련 단어 선정 모듈(130)에 의해 선정된 단어를 조합하고, 각 단어 조합을 검색 키워드로 사용하여 검색 사이트(500)에서 콘텐츠 링크를 검색하고 제2검색 결과를 전송받는다. 그런 다음, 이러한 제2검색 결과에서 상위에 랭크된 복수의 제2콘텐츠 링크를 선별한다. 여기서, 선별되는 제2콘텐츠 링크의 수는 사용자가 미리 지정할 수 있다.
도 8은, 본 발명의 일 실시예에 따라, 상기 제2콘텐츠 링크 선별 모듈(140)이 검색 키워드와 제1관련 단어의 조합을 이용하여 콘텐츠 링크를 검색하고 선별하는 과정을 개략적으로 도식화한 도면이다.
도 8을 참조하면, 도 6 및 도 7의 실시예와 같이, 검색 키워드로 '라디오 스타'가 입력되어 제1관련 단어로서 '박중훈', '안성기', '가수', '뮤지컬', '강원도'라는 5개 단어가 선정된 경우, '라디오 스타, 박중훈', '라디오 스타, 안성기', '라디오 스타, 가수', '라디오 스타, 뮤지컬', '라디오 스타, 강원도'와 같이 총 5개의 단어 조합이 만들어질 수 있다.
그리고 나서, 상기 제2콘텐츠 링크 선별 모듈(140)은 이러한 단어 조합 각각에 대하여 검색 사이트(500)를 통해 콘텐츠 링크를 검색하고 그 결과를 전송받아 검색 결과에서 일정 개수의 상위 콘텐츠 링크를 선별한다. 예를 들어, 도 8에 도시된 바와 같이 인터넷(400) 등을 통해 검색 사이트(500)에 접속하여 '라디오 스타, 박중훈'이라는 단어 조합을 포함하는 콘텐츠 링크를 검색하여 검색 결과 페이지를 전송받는다. 그리고, 전송받은 검색 결과 페이지에 포함된 콘텐츠 링크 중 상위에 랭크된 50개의 제2콘텐츠 링크(제2콘텐츠 링크 B1 내지 제2콘텐츠 링크 B50)를 선별한다.
비록, 도 8의 실시예에서는 '라디오 스타, 박중훈'이라는 하나의 단어 조합에 대해서만 제2콘텐츠 링크가 선별되는 것으로 도시되었으나, 나머지 단어 조합, 즉 '라디오 스타, 안성기', '라디오 스타, 가수', '라디오 스타, 뮤지컬', '라디오 스타, 강원도'의 단어 조합에 대해서도 이와 마찬가지로 콘텐츠 링크가 50개씩 선별될 수 있다. 그러므로, 상기 5개의 단어 조합에 대하여 상기 제2콘텐츠 링크 선별 모듈(140)에 의해 선별된 제2콘텐츠 링크의 총 개수는 250개가 된다.
상기 제2관련 단어 추출 모듈(150)은, 제2콘텐츠 링크에 대해 대응하는 제2콘텐츠 정보에서 등장 빈도수가 높은 복수의 제2관련 단어를 추출한다. 즉, 상기 제2관련 단어 추출 모듈(150)은 각각의 제2콘텐츠 링크를 이용하여 해당 콘텐츠 정보를 제공하는 서버로부터 제2콘텐츠 정보를 다운로드한 후 제2콘텐츠 정보의 제목, 태그, 본문 등을 분석하여 식별 가능한 단어들의 리스트를 추출한 후 각 단어에 대해 빈도수를 분석하여 미리 지정된 수의 제2관련 단어를 추출한다. 이러한 제 2관련 단어의 추출 및 각 단어별 빈도수 분석 과정은 상술한 제1관련 단어의 추출 및 단어별 빈도수 분석 과정과 실질적으로 동일하다. 따라서, 각 제2관련 단어의 빈도수 계산시 단어가 등장하는 영역에 따라 가중치가 빈도수에 반영될 수 있음은 당업자에게 자명하다.
상기 멀티미디어 정보 링크 추출 모듈(160)은, 하나 이상의 제2관련 단어를 검색 키워드로 한 멀티미디어 검색 결과에서 상위에 랭크된 하나 이상의 멀티미디어 정보 링크를 추출한다. 여기서, 상기 멀티미디어 정보 링크는, 동영상, 음악, 이미지 및 웹지도 중 어느 하나 이상의 멀티미디어 데이터에 대한 링크일 수 있다. 또한, 상기 멀티미디어 정보 링크의 추출 개수는 적절하게 조절 가능하다.
한편, 상기 멀티미디어 정보 링크 추출 모듈(160)은 제2관련 단어 중 등장 빈도수가 가장 높은 단어를 검색 키워드로 이용하여 검색 사이트(500)로부터 수집한 멀티미디어 검색 결과에서 상위에 랭크된 하나 이상의 멀티미디어 정보 링크를 추출할 수 있다. 예를 들어, 제2관련 단어로서 P, Q, R 세 단어가 존재하고, 세 단어 중 P의 빈도수가 가장 높은 경우, P에 대해서만 멀티미디어 검색을 수행하고, 그에 따른 검색 결과에서 멀티미디어 정보 링크를 추출할 수 있다.
또한, 상기 멀티미디어 정보 링크 추출 모듈(160)은 상기 제2관련 단어 중 2개 이상의 단어를 조합한 검색 키워드를 이용하여 검색 사이트(500)로부터 수집한 멀티미디어 검색 결과에서 상위에 랭크된 하나 이상의 멀티미디어 정보 링크를 추출할 수 있다. 예를 들어, 상기 실시예와 같이 제2관련 단어로서 P, Q, R이 존재하는 경우, P와 Q의 단어 조합, P와 R의 단어 조합 또는 P, Q 및 R의 단어 조합을 이 용하여 멀티미디어 검색을 수행하고, 그에 따른 검색 결과에서 멀티미디어 정보 링크를 추출할 수 있다.
이때, 상기 검색 키워드는 제2관련 단어 중 등장 빈도수가 높은 순서로 2개 이상의 단어를 조합하여 생성할 수 있다. 즉, 빈도수가 상대적으로 높은 제2관련 단어부터 이용하여 단어 조합을 구성하는 것이 좋다.
또한, 상기 멀티미디어 정보 링크 추출 모듈(160)은 추출하고자 하는 멀티미디어 정보 링크의 수를 n이라 할 때, 제2관련 단어 중 등장 빈도수가 많은 순서대로 관련 단어를 검색 키워드로 지정하면서, 추출된 멀티미디어 정보 링크의 수가 n이 될 때까지 관련 단어에 대응하는 멀티미디어 검색 결과를 수집할 수 있다. 예를 들어, 3개의 멀티미디어 정보 링크를 추출하기로 지정되어 있다면, 제2관련 단어 중 등장 빈도수가 가장 많은 제2관련 단어를 이용하여 추출된 멀티미디어 정보 링크의 수가 3개 이상이라면, 다른 제2관련 단어들에 대해서는 더 이상 멀티미디어 검색을 수행하지 않아도 된다. 그러나, 추출된 멀티미디어 정보 링크의 수가 3개 미만이라면, 그 다음으로 등장 빈도수가 많은 제2관련 단어를 이용하여 멀티미디어 검색을 수행하여 부족한 개수만큼 멀티미디어 정보 링크를 추출한다.
상기 데이터베이스 저장 모듈(170)은, 제2콘텐츠 정보에 대해 검색 키워드, 제1관련 단어, 제2콘텐츠 링크의 URL 및 상기 멀티미디어 정보 링크를 데이터베이스(200)에 저장한다.
바람직하게는, 상기 데이터베이스 저장 모듈(170)은 제2콘텐츠 정보 각각에 링크된 시청각 정보의 URL을 추출하여 이를 대응하는 제2콘텐츠 정보와 대응시켜 데이터베이스(200)에 저장한다. 여기서, 링크된 시청각 정보라 함은 제2콘텐츠 정보 내에 링크되어 있는 시청각 정보 또는 제2콘텐츠 정보에 첨부되어 있는 시청각 정보 등을 의미한다.
그리고, 상기 시청각 정보는, 시각이나 청각을 통해 습득될 수 있는 지식 정보로서, 바람직하게는 동영상, 이미지, 음악 및 웹지도 중 적어도 하나 이상을 말한다.
또한, 상기 데이터베이스 저장 모듈(170)은 상기 제2관련 단어를 대응하는 제2콘텐츠 정보와 대응시켜 데이터베이스(200)에 더 저장하는 것이 좋다. 이와 같이 데이터베이스(200)에 저장된 제2관련 단어는 지식노드 구성 단어로서 이용될 수 있다.
도 9는, 본 발명의 일 실시예에 따른 데이터베이스 저장 모듈(170)에 의해 각종 데이터가 저장된 데이터베이스(200)의 구조를 개념적으로 나타내는 도면이다.
도 9를 참조하면, 도 8의 실시예에서 '라디오 스타, 박중훈'이라는 단어 조합에 대하여 선별된 50개의 제2콘텐츠 링크(제2콘텐츠 링크 B1 내지 제2콘텐츠 링크 B50)에 대응하는 50개의 제2콘텐츠 정보에 대한 데이터베이스를 나타낸다. 예를 들어, 도 8의 제2콘텐츠 링크 B1에 대한 관련 데이터는 일련 번호 1번 섹터에 저장될 수 있다.
한편, 도 9에서는 2개의 제2콘텐츠 정보에 대해서만 데이터가 저장된 것으로 도시하였으나, 실질적으로는 50개의 제2콘텐츠 정보에 대한 데이터가 저장되어 있다.
도 9에 도시된 바와 같이, 데이터베이스(200)에는 제2콘텐츠 정보에 대한 검색 키워드, 제1관련 단어, 제2콘텐츠 링크 URL, 멀티미디어 정보 링크가 저장될 수 있다.
또한, 상기 데이터베이스 저장 모듈(170)은 제2콘텐츠 정보에 링크된 시청각 정보의 URL을 데이터베이스(200)에 더 저장할 수 있다. 비록, 도 9에서는 1번 콘텐츠 정보에 링크된 시청각 정보로서 하나의 URL만이 저장된 것으로 도시되었으나, 이는 일 실시예에 불과하며 복수의 동영상, 이미지, 음악 및 웹지도 등에 대한 URL이 저장될 수도 있음은 당업자에게 자명하다.
도 9의 실시예에서, 상기 멀티미디어 정보 링크 추출 모듈(160)은 일련번호 1번인 제2콘텐츠 정보에 대하여 '비와 당신', '최곤', '이준익'과 같은 제2관련 단어를 이용하여 동영상, 음악, 이미지 및 웹지도와 같은 멀티미디어 정보 링크를 검색 및 추출하고, 추출된 멀티미디어 정보 링크의 URL을 1번 제2콘텐츠 정보에 대한 관련 데이터로 저장할 수 있다. 비록, 도 9에서는 2개의 멀티미디어 정보 링크가 추출된 것으로 도시되었으나, 이는 일 실시예에 불과하며, 멀티미디어 정보 링크의 추출 개수는 다양하게 구성될 수 있다.
그리고, 멀티미디어 정보 링크의 추출 개수가 미리 정해진 경우, 상기 멀티미디어 정보 링크 추출 모듈(160)은 상기 데이터베이스(200)에 저장된 제2관련 단어 중 빈도수가 높은 단어부터 순차적으로 이용하여 상기 멀티미디어 정보 링크를 검색 및 선택할 수 있음은 상술한 바와 같다.
예를 들어, 도 9의 제2콘텐츠 정보 1번에 대한 제2관련 단어 중, 빈도수가 가장 높은 최상위 빈도수 단어가 '비와 당신'이고, 빈도수가 두 번째인 차상위 빈도수 단어가 '최곤'이며, 빈도수가 가장 낮은 제2관련 단어가 '이준익'이라 가정한다. 이 경우, 1번 콘텐츠 정보에 대하여 2개의 멀티미디어 정보 링크를 검색한다면, 먼저 최상위 빈도수 단어인 '비와 당신'을 검색어로 지정하여 검색 사이트(500)를 통해 멀티미디어 정보 링크를 검색하고, 검색 결과 페이지를 수신한다. 이때, 검색 결과 페이지에 포함된 멀티미디어 정보 링크 수가 2개 이상이라면, 빈도수가 상대적으로 낮은 '최곤'과 '이준익'을 이용해서는 멀티미디어 정보 링크를 검색하지 않고 검색 결과 페이지에 포함된 멀티미디어 정보 링크 중 상위에 랭크된 2개의 멀티미디어 정보에 대한 URL 정보를 추출하여 1번 콘텐츠 정보에 대응하는 멀티미디어 정보 링크로서 데이터베이스(200)에 저장한다. 그러나, 검색 결과 페이지에 포함된 멀티미디어 정보 링크의 수가 1개 이하라면, 차상위 빈도수 단어인 '최곤'을 검색어로 지정하여 검색 사이트(500)를 통해 멀티미디어 정보 링크의 검색을 요청하고 검색 결과 페이지를 수신한다. 그리고 검색 결과 페이지에서 랭크된 최상위 멀티미디어 정보를 부족했던 나머지 멀티미디어 정보로서 지정하고 지정된 멀티미디어 정보 링크의 URL을 추출하여 1번 콘텐츠 정보에 대응하는 멀티미디어 데이터로서 데이터베이스(200)에 저장한다. 만일 차상위 빈도수 단어에 의한 검색에서도 멀티미디어 정보가 검색되지 않는다면, 다음으로 빈도수가 가장 낮은 '이준익'을 검색어로 하여 상술한 과정을 반복하여 멀티미디어 정보 링크의 URL을 데이터베이스(200)에 저장한다.
이와 같이 멀티미디어 정보 링크 추출 모듈(160)이 멀티미디어 정보의 URL을 추출할 때에는, 기존의 유투브나 구글 등의 사이트에서 제공하는 공개 API를 이용할 수 있다. 이런 경우, 검색 사이트(500)는 유투브나 구글 등의 공지된 사이트가 된다. 공개 API는 구글 등이 제시하는 프로토콜에 따라 프로그램을 코딩하기만 하면 공개 API 제공 회사의 자체 데이터베이스를 검색할 수 있는 인터페이스를 말한다. 따라서, 일반 개인은 자유롭게 유투브나 구글 등의 데이터베이스를 조회하여 검색 결과에 포함된 멀티미디어 정보 링크의 URL을 추출할 수 있는 프로그램을 코딩할 수 있다. 이러한 점을 이용하여, 본 발명의 멀티미디어 정보 링크 추출 모듈(160)은 공개 API를 지원하는 다른 웹사이트의 멀티미디어 자원을 검색하여 해당 URL을 추출할 수 있다.
한편, 도 9에서는 '라디오 스타, 박중훈' 단어 조합에 대한 50개의 제2콘텐츠 정보에 대한 데이터베이스 구조를 도시하고 있으나, 도 8의 실시예를 참조하면 이와 같은 데이터가 '라디오 스타, 안성기', '라디오 스타, 가수', '라디오 스타, 뮤지컬' 및 '라디오 스타, 강원도'의 단어 조합에 대해서도 각각 50개의 제2콘텐츠 정보에 대한 데이터베이스가 도 9와 유사하게 구축될 수 있다. 따라서, '라디오 스타'라는 검색 키워드의 입력으로 관련성이 있는 250개의 제2콘텐츠 정보에 대한 데이터베이스가 구축될 수 있다. 즉, 하나의 검색 키워드 입력으로 수백 개의 관련 콘텐츠 정보에 대한 데이터베이스화가 가능해지는 것이다. 또한, 이러한 관련 콘텐츠 정보의 개수는 제1 및 제2관련 단어의 개수, 제1 및 제2콘텐츠 링크의 선별 개수 등에 따라 확장될 수 있으므로, 관련성 있는 콘텐츠 정보나 시청각 정보 등을 제공하기 위한 데이터베이스의 구축 및 확장이 용이하게 이루어질 수 있다.
또한, 상기 도 8 및 도 9의 실시예에서는 '라디오 스타, 박중훈', 또는 '라디오 스타, 안성기'와 같이 단어 조합이 두 개인 경우에 대해서만 설명하였다. 하지만, 조합되는 단어의 개수는 그 이상으로 얼마든지 확장이 가능하다. 즉, 검색 키워드와 2개 이상의 제1관련 단어를 조합하면 제2콘텐츠 정보의 검색시 사용되는 조합 단어의 수를 3개 이상으로 확장할 수 있다.
예를 들어, 도 9의 실시예에서 제2관련 단어 중 하나인 '비와 당신'이 추가되어 '라디오 스타, 박중훈, 비와 당신'이라는 단어 조합이 생성되었다면, 이러한 단어 조합에 대해 상기 제2콘텐츠 링크 선별 모듈(140)이 검색 사이트(500)를 통해 제2콘텐츠 정보에 대한 검색 결과 페이지를 수신하고, 그 중 상위에 랭크된 복수의 제2콘텐츠 링크를 선별한다. 이 경우, 데이터베이스(200)에는 '라디오 스타'가 검색 키워드로, '박중훈'이 제1관련 단어 1로, '비와 당신'이 제1관련 단어 2로 저장될 수 있다. 그러므로, 이러한 실시예에 의하면, 관련 단어 간 유기적 연결구조를 계속해서 확장시켜 나갈 수 있게 된다.
본 발명에 따르면, 상기 입력 모듈(110)은 데이터베이스(200)를 구축하는데 필요한 데이터 추출 정보를 사용자 단말(600)로부터 입력받을 수 있다.
여기서, 데이터 추출 정보란, 검색 데이터베이스(200)를 구축하기 위해 각종 데이터를 수집하고 추출하는 방법에 대한 정보를 말한다.
이때, 상기 데이터 추출 정보는, 제1 및 제2콘텐츠 링크의 수와 제1 및 제2관련 단어의 수를 포함할 수 있다.
또한, 상기 데이터 추출 정보는 검색 사이트(500)의 접속 정보, 멀티미디어 검색 결과를 수집할 검색 사이트 접속 정보, 추출할 멀티미디어 정보 링크의 수 중 적어도 하나 이상에 대한 정보를 더 포함할 수 있다.
도 10은, 본 발명의 일 실시예에 따라 입력 모듈(110)이 데이터 추출 정보를 입력받는 사용자 단말(600)의 인터페이스 화면을 도시하는 도면이다.
도 10을 참조하면, 상기 인터페이스 화면은, 검색 키워드 입력 방법, 검색 사이트(500)의 접속 정보, 멀티미디어 검색 결과를 수집할 검색 사이트(500) 접속 정보, 제1 및 제2콘텐츠 링크의 수, 제1 및 제2관련 단어의 수, 추출할 멀티미디어 정보 링크의 수를 입력할 수 있는 인터페이스를 구비한다.
상기 인터페이스 화면을 통해 데이터 추출 정보가 입력되면, 본 발명에 따른 검색 데이터베이스 구축 장치(100)는 입력된 데이터 추출 정보에 따라 상술한 동작을 수행한다.
예를 들어, 도 10에 도시된 바와 같이, 검색 키워드 입력방법으로 '직접 입력'이 입력되면 검색 키워드는 사용자 단말(600)로부터 직접 입력받게 된다. 또한, 검색 사이트(500)로 '네이버'가 입력되면, 상기 제1콘텐츠 링크 선별 모듈(120) 및 제2콘텐츠 링크 선별 모듈(140)은 '네이버' 사이트를 검색 사이트(500)로 지정하여 검색을 요청하고 검색 결과를 수신한다. 그리고, 멀티미디어 정보 검색 사이트로 '유투브'가 입력되면 멀티미디어 정보 링크 추출 모듈(160)은 유투브 사이트에서 멀티미디어 정보 링크를 검색하고 추출한다.
또한, 제1 및 제2콘텐츠 링크의 수로 '10' 및 '50'이 입력되면, 제1 및 제2콘텐츠 링크 선별 모듈(120, 140)은 제1콘텐츠 링크 및 제2콘텐츠 링크를 각각 10 개와 50개 선별한다. 그리고, 도면에 도시된 바와 같이 제1 및 제2관련 단어의 수로 '5'와 '3'이 입력되면 제1관련 단어 선정 모듈(130)은 제1관련 단어를 5개 선정하고, 제2관련 단어 추출 모듈(150)은 제2관련 단어를 3개 추출한다. 또한, 멀티미디어 정보 링크의 수를 '2'로 입력하면, 제2콘텐츠 정보에 대응하는 멀티미디어 정보 링크를 2개 추출한다.
비록, 도면에는 도시되지 않았으나, 데이터 추출 정보로서 웹페이지, 사이트, 지식인, 동영상, 이미지, 블로그 등과 같이 제1 및 제2콘텐츠 링크에 대하여 선별 카테고리를 입력받을 수도 있다. 이 경우, 입력된 카테고리에서 제1 및 제2콘텐츠 링크를 검색하고 선별한다.
한편, 상기 도 10에 도시된 데이터 추출 정보 입력 화면은 일 실시예에 불과하며, 다양한 형태로 구성이 가능하다는 것은 당업자에게 자명하다.
본 발명에 따른 검색 데이터베이스 구축 장치(100)는 지식노드 연결구조 출력 모듈(180)을 더 포함하는 것이 바람직하다.
상기 지식노드 연결구조 출력 모듈(180)은, 상기 데이터베이스(200)에 저장된 데이터를 이용하여 그래픽 위상 구조의 지식노드 연결구조를 생성하고, 이를 출력한다.
상기 지식노드 연결구조는, 상기 도 1 내지 도 3에서 도시된 바와 같이, 핵심단어 및 핵심단어로부터 파생된 적어도 하나 이상의 관련단어를 기반으로 도형과 선의 결합으로 이루어진 시각화된 지식의 함축적 표시 방법이다. 그리고 지식노드 연결구조에 포함된 각 지식노드를 구성하는 도형 위 또는 도형 주변에는 해당하는 핵심단어 또는 관련단어가 문자로 표시된다.
이때, 지식노드 구성 단어인 핵심단어와 관련단어로는, 상기 데이터베이스(200)에 저장된 제2콘텐츠 정보에 대응하는 검색 키워드 및 제1관련 단어가 사용될 수 있다. 예를 들면, 도 9의 실시예에서 검색 키워드인 '라디오스타'가 핵심단어로, 제1관련 단어인 '박중훈'이 관련단어로 지정되어 지식노드 구성단어로 이용될 수 있다.
여기서, 상기 제1관련 단어는 2개 이상일 수도 있다. 이 경우, 보다 확장된 지식노드 연결구조의 생성이 가능하다.
또한, 데이터베이스(200)에 제2콘텐츠 정보에 대응하는 제2관련 단어가 저장된 경우, 검색 키워드와 제2관련 단어가 각각 핵심 단어와 관련 단어로 지정되어 지식노드 구성단어로 이용될 수 있다. 예를 들어, 상기 도 9의 실시예에서, 검색 키워드인 '라디오스타'가 핵심단어로, 제2관련 단어 중 하나인 '비와 당신'이 관련단어가 될 수 있다. 그러므로, 이러한 실시예에 의하면 지식노드 연결구조의 무한한 확장이 가능해진다.
이와 같이, 검색 키워드와 제1 또는 제2관련 단어를 지식노드 구성 단어로 하는 지식노드 연결 구조가 생성되면, 상기 지식노드 연결구조 출력 모듈(180)은 상기 검색 키워드와 제1 또는 제2관련 단어에 대한 제2콘텐츠 링크의 URL을 해당 지식노드 연결 구조에 연계시킨다. 이를테면 도 9의 실시예에서, 1번부터 50번까지의 각각의 제2콘텐츠 링크에 대한 URL을, '라디오 스타'를 핵심단어로 하고 '박중훈'을 관련단어로 하는 지식노드 연결구조에 연계되도록 할 수 있다.
상기 지식노드 연결구조 출력 모듈(180)은 이와 같이 생성된 지식노드 연결구조를 그래픽 위상 구조로 사용자에게 출력한다. 이때, 출력되는 지식노드 연결구조는 단위 지식노드 연결구조이거나 조합 지식노드 연결구조일 수 있다. 단위 지식노드 연결구조란 상기 도 1 내지 도 3에서 점선으로 도시된 바와 같은 하나의 핵심 단어 및 하나 이상의 관련 단어를 기반으로 결합된 지식노드 연결 구조를 말하며, 조합 지식노드 연결구조는 도 1 내지 도 3에 예시된 바와 같이, 적어도 하나 이상의 단위 지식노드 연결구조가 결합된 구조를 말한다.
출력된 지식노드 연결구조는, 핵심단어 및 관련단어, 그 각각에 대응하는 복수의 지식노드 및 각 단어(지식노드)의 중요도나 단어 사이의 연관 관계에 따라 나타낸 선을 포함한다.
도 11은, 본 발명에 따른 지식노드 연결구조 출력 모듈(180)이 데이터베이스(200)에 저장된 데이터를 이용하여 생성한 지식노드 연결구조를 출력한 사용자 단말(600) 화면의 일례를 도시하는 도면이다.
도 11을 참조하면, 지식노드 연결구조 출력 모듈(180)은 핵심단어와 관련단어를 이용하여 지식노드 연결구조를 그래픽 위상 구조로 출력한다. 이때, 상기 지식노드 연결구조 출력 모듈(180)은 지식노드 연결구조의 그래픽 위상구조를 출력하면서 해당 지식노드 연결구조에 연계된 콘텐츠 정보나 멀티미디어 정보에 접근할 수 있도록 인터페이스를 제공한다. 예를 들어, 도 11에서 사용자가 '보기' 버튼을 누르면 해당 지식노드 연결구조에 연계된 콘텐츠 정보가 실행되도록 할 수 있다. 또한, 사용자가 '동영상', '음악', '이미지', 웹지도 등의 버튼을 누르면, 해당 멀 티미디어가 실행되도록 할 수 있다.
한편, 도 11과 같은 화면 구성이 다양한 형태로 변형될 수 있음은 당업자에게 자명한 사항이다.
도 12 및 도 13은, 지식노드 연결구조 출력 모듈(180)이 출력한 지식노드 연결구조의 응용예를 도시하는 도면이다.
도 12를 참조하면, 지식노드 연결구조 출력 모듈(180)은 도 8의 실시예에서의 5개의 단어 조합에 대한 지식노드 연결구조를 생성하여 출력한다. 즉, 핵심단어가 '라디오 스타'로 지정되고, 그에 연결된 관련단어가 각각 '박중훈', '안성기', '가수', '뮤지컬', '강원도'인 5개의 단위 지식노드 연결구조가 결합되어 동심원형의 조합 지식노드 연결구조를 이루고 있다.
그리고, 도면에는 도시되어 있지 않으나, 각각의 단위 지식노드 연결구조에는 데이터베이스(200)에 저장된 관련 제2콘텐츠 정보에 대한 데이터가 연계되어 저장될 수 있다. 예를 들어, '라디오 스타'를 핵심 단어로 하고 '박중훈'을 관련 단어로 하는 단위 지식노드 연결구조에는 도 9의 실시예에서와 같은 제2콘텐츠 링크의 URL, 시청각정보 링크의 URL, 멀티미디어 정보 링크의 URL 등이 연계되어 저장될 수 있다.
도 13을 참조하면, 도 9의 실시예에서 검색 키워드인 '라디오 스타'를 핵심 단어로 하고, 제1관련 단어인 '박중훈', 제2관련 단어인 '비와 당신', '최곤', '이준익'을 관련 단어로 하여 지식노드 연결구조가 생성된다. 이러한 실시예에 의하면, 하나 이상의 제2관련 단어를 지식노드 구성단어로 이용함으로써 지식노드 연결 구조의 무한한 확장이 가능해진다.
도 14는, 본 발명의 일 실시예에 따른 지식노드 연결구조를 생성하기 위한 검색 데이터베이스 구축 방법을 개략적으로 나타낸 흐름도이다. 이하의 설명에서 각 단계의 수행 주체는 상술한 본 발명에 따른 장치라는 점을 미리 밝혀둔다.
도 14에 도시된 바와 같이, 본 발명의 일 실시예에 따라 검색 데이터베이스를 구축하기 위해서는 먼저 검색 키워드를 입력받는다(S120). 이때, 검색 키워드는 직접 입력받거나 검색 키워드가 포함된 파일을 전송받아 추출될 수 있다. 또는 검색 사이트에서 제공하는 인기 검색어나 인기 태그를 검색 키워드로 입력받을 수 있다.
이와 같이 검색 키워드가 입력되면, 상기 입력된 검색 키워드를 이용하여 검색 사이트를 통해 콘텐츠 링크를 검색한다(S130). 즉, 상기 S130 단계에서는 검색 키워드를 이용하여 검색 사이트에 검색을 요청하고, 검색 사이트로부터 제1검색 결과 페이지를 수신한다.
다음으로, 제1검색 결과 페이지에 랭크된 콘텐츠 링크 중 상위에 랭크된 복수의 제1콘텐츠 링크를 선별한 다음(S140), 선별된 복수의 제1콘텐츠 링크에 대응하는 제1콘텐츠 정보 각각에 대하여, 단어별 빈도수를 분석하고 모든 제1콘텐츠 정보에 걸쳐 등장 빈도수가 높은 복수의 제1관련 단어를 선정한다(S150).
그리고 나서, 검색 키워드와 제1관련 단어의 상호 조합을 검색 키워드로 하여 검색 사이트를 통해 콘텐츠 링크를 검색하고(S160), 검색 사이트로부터 수신한 제2검색 결과 페이지에 랭크된 콘텐츠 링크 중 상위에 랭크된 복수의 제2콘텐츠 링 크를 선별한다(S170). 다음으로, 제2콘텐츠 링크 각각에 대응하는 제2콘텐츠 정보에서 등장 빈도수가 높은 복수의 제2관련 단어를 추출하고(S180), 하나 이상의 제2관련 단어를 검색 키워드로 한 멀티미디어 검색 결과에서 상위에 랭크된 하나 이상의 멀티미디어 정보 링크를 추출한다(S190).
그리고 나서, 제2콘텐츠 정보 각각에 대해 검색 키워드, 제1관련 단어, 제2콘텐츠 링크의 URL 및 멀티미디어 정보 링크를 데이터베이스에 저장한다(S200).
한편, 본 발명에 따른 검색 데이터베이스 구축 방법은 상기 검색 키워드 입력 단계(S120) 이전에 데이터 추출 정보를 입력받는 단계(S110)를 더 포함하는 것이 바람직하다.
이상과 같이, 본 발명은 비록 한정된 실시예와 도면에 의해 설명되었으나, 본 발명은 이것에 의해 한정되지 않으며 본 발명이 속하는 기술분야에서 통상의 지식을 가진 자에 의해 본 발명의 기술사상과 아래에 기재될 특허청구범위의 균등범위 내에서 다양한 수정 및 변형이 가능함은 물론이다.
한편, 본 명세서에서 사용된 '모듈'이라는 용어는 논리적인 구성 단위를 나타내는 것으로서 반드시 물리적으로 구분되는 구성 요소가 아니라는 점은 본 발명이 속하는 기술분야의 당업자에게 자명한 사항이다.
도 1은, 본 발명에 따른 조합 지식노드 연결구조의 그래픽 위상구조에 있어서, 수평-수직 확장 구조의 일실시예를 나타내는 도면이다.
도 2는, 본 발명에 따른 조합 지식노드 연결구조의 그래픽 위상구조에 있어서, 동심원형 확장 구조의 일실시예를 나타내는 도면이다.
도 3은, 본 발명에 따른 조합 지식노드 연결구조의 그래픽 위상구조에 있어서, 가지 확장 구조의 일실시예를 나타내는 도면이다.
도 4는, 본 발명의 일 실시예에 따른 검색 데이터베이스 구축 장치의 기능적 구성을 개략적으로 도시한 블록도이다.
도 5는, 입력 모듈로 검색 키워드를 입력하기 위한 사용자 단말의 화면에 대한 일 실시예를 도시한다.
도 6은, 본 발명의 일 실시예에 따라 제1콘텐츠 링크 선별 모듈이 특정 검색 키워드를 통해 콘텐츠 링크를 검색하고 선별하는 과정을 개략적으로 도식화한 도면이다.
도 7은, 본 발명의 일 실시예에 따라 상기 제1관련 단어 선정 모듈이 복수의 제1콘텐츠 링크에 대하여 제1관련 단어를 선정하는 과정을 개략적으로 도식화한 도면이다.
도 8은, 본 발명의 일 실시예에 따라, 상기 제2콘텐츠 링크 선별 모듈이 검색 키워드와 제1관련 단어의 조합을 이용하여 콘텐츠 링크를 검색하고 선별하는 과정을 개략적으로 도식화한 도면이다.
도 9는, 본 발명의 일 실시예에 따른 데이터베이스 저장 모듈에 의해 각종 데이터가 저장된 데이터베이스의 구조를 개념적으로 나타내는 도면이다.
도 10은, 본 발명의 일 실시예에 따라 입력 모듈이 데이터 추출 정보를 입력받는 사용자 단말의 인터페이스 화면을 도시하는 도면이다.
도 11은, 본 발명에 따른 지식노드 연결구조 출력 모듈이 데이터베이스에 저장된 데이터를 이용하여 생성한 지식노드 연결구조를 출력한 사용자 단말 화면의 일례를 도시하는 도면이다.
도 12 및 도 13은, 지식노드 연결구조 출력 모듈이 출력한 지식노드 연결구조의 응용예를 도시하는 도면이다.
도 14는, 본 발명의 일 실시예에 따른 지식노드 연결구조를 생성하기 위한 검색 데이터베이스 구축 방법을 개략적으로 나타낸 흐름도이다.

Claims (25)

  1. 검색 키워드를 이용하여 검색 사이트를 통해 수신한 제1검색 결과에서 상위에 랭크된 복수의 제1콘텐츠 링크를 선별하는 제1콘텐츠 링크 선별 모듈;
    각각의 제1콘텐츠 링크에 대응하는 제1콘텐츠 정보를 분석하여 모든 제1콘텐츠 정보에 걸쳐 등장 빈도수가 높은 복수의 제1관련 단어를 선정하는 제1관련 단어 선정 모듈;
    상기 검색 키워드와 상기 제1관련 단어의 상호 조합을 검색 키워드로 하여 상기 검색 사이트로부터 수신한 제2검색 결과에서 상위에 랭크된 복수의 제2콘텐츠 링크를 선별하는 제2콘텐츠 링크 선별 모듈;
    각 제2콘텐츠 링크에 대해 대응하는 제2콘텐츠 정보에서 등장 빈도수가 높은 복수의 제2관련 단어를 추출하는 제2관련 단어 추출 모듈;
    하나 이상의 제2관련 단어를 검색 키워드로 한 멀티미디어 검색 결과에서 상위에 랭크된 하나 이상의 멀티미디어 정보 링크를 추출하는 멀티미디어 정보 링크 추출 모듈; 및
    각 제2콘텐츠 정보에 대해 검색 키워드, 상기 제1관련 단어, 제2콘텐츠 링크의 URL 및 상기 멀티미디어 정보 링크를 데이터베이스에 저장하는 데이터베이스 저장 모듈;을 포함하는 것을 특징으로 하는 지식노드 연결구조를 생성하기 위한 검색 데이터베이스 구축 장치.
  2. 제1항에 있어서,
    상기 검색 키워드를 입력받는 입력 모듈;을 더 포함하는 것을 특징으로 하는 지식노드 연결구조를 생성하기 위한 검색 데이터베이스 구축 장치.
  3. 제2항에 있어서,
    상기 입력 모듈은 사용자 단말로부터 검색 키워드를 직접 입력받거나 또는 하나 이상의 검색 키워드가 포함된 파일을 전송받은 후 상기 파일로부터 검색 키워드를 추출하는 것을 특징으로 하는 지식노드 연결구조를 생성하기 위한 검색 데이터베이스 구축 장치.
  4. 제2항에 있어서,
    상기 입력 모듈은 검색 사이트가 제공하는 웹문서로부터 검색 키워드를 추출하는 것을 특징으로 하는 지식노드 연결구조를 생성하기 위한 검색 데이터베이스 구축 장치.
  5. 제4항에 있어서,
    상기 입력 모듈은 검색 사이트에서 제공하는 인기 검색어 또는 인기 태그로부터 검색 키워드를 추출하는 것을 특징으로 하는 지식노드 연결구조를 생성하기 위한 검색 데이터베이스 구축 장치.
  6. 제2항에 있어서,
    상기 입력 모듈은 상기 제1 및 제2콘텐츠 링크의 수와 상기 제1 및 제2관련 단어의 수를 포함하는 데이터 추출 정보를 사용자 단말로부터 입력받는 것을 특징으로 하는 지식노드 연결구조를 생성하기 위한 검색 데이터베이스 구축 장치.
  7. 제6항에 있어서,
    상기 데이터 추출 정보는 검색 사이트의 접속 정보를 더 포함하는 것을 특징으로 하는 지식노드 연결구조를 생성하기 위한 검색 데이터베이스 구축 장치.
  8. 제6항에 있어서,
    상기 데이터 추출 정보는 멀티미디어 검색 결과를 수집할 검색 사이트 접속 정보를 더 포함하는 것을 특징으로 하는 지식노드 연결구조를 생성하기 위한 검색 데이터베이스 구축 장치.
  9. 제6항에 있어서,
    상기 데이터 추출 정보는 추출할 멀티미디어 정보 링크의 수를 더 포함하는 것을 특징으로 하는 지식노드 연결구조를 생성하기 위한 검색 데이터베이스 구축 장치.
  10. 제1항에 있어서,
    제1 또는 제2관련 단어의 빈도수 계산시 단어가 등장된 영역에 따라 해당 단어에 대한 빈도수의 가중치를 차별적으로 부여하는 것을 특징으로 하는 지식노드 연결구조를 생성하기 위한 검색 데이터베이스 구축 장치.
  11. 제1항에 있어서,
    상기 데이터베이스 저장 모듈은 각 제2콘텐츠 정보에 링크된 시청각 정보의 URL을 추출하여 상기 시청각 정보의 URL을 대응하는 제2콘텐츠 정보와 대응시켜 데이터베이스에 더 저장하는 것을 특징으로 하는 지식노드 연결구조를 생성하기 위한 검색 데이터베이스 구축 장치.
  12. 제11항에 있어서,
    상기 시청각 정보는, 동영상, 이미지, 음악 및 웹지도 중 적어도 하나 이상임을 특징으로 하는 지식노드 연결구조를 생성하기 위한 검색 데이터베이스 구축 장치.
  13. 제1항에 있어서,
    상기 멀티미디어 정보 링크 추출 모듈은 상기 제2관련 단어 중 등장 빈도수가 가장 높은 단어를 검색 키워드로 이용하여 검색 사이트로부터 수집한 멀티미디어 검색 결과에서 상위에 랭크된 하나 이상의 멀티미디어 정보 링크를 추출하는 것을 특징으로 하는 지식노드 연결구조를 생성하기 위한 검색 데이터베이스 구축 장 치.
  14. 제1항에 있어서,
    상기 멀티미디어 정보 링크 추출 모듈은 상기 제2관련 단어 중 2개 이상의 단어를 조합한 검색 키워드를 이용하여 검색 사이트로부터 수집한 멀티미디어 검색 결과에서 상위에 랭크된 하나 이상의 멀티미디어 정보 링크를 추출하는 것을 특징으로 하는 지식노드 연결구조를 생성하기 위한 검색 데이터베이스 구축 장치.
  15. 제14항에 있어서,
    상기 검색 키워드는 제2관련 단어 중 등장 빈도수가 높은 순서로 2개 이상의 단어를 조합하여 생성한 것임을 특징으로 하는 지식노드 연결구조를 생성하기 위한 검색 데이터베이스 구축 장치.
  16. 제1항에 있어서,
    상기 멀티미디어 정보 링크 추출 모듈은 추출하고자 하는 멀티미디어 정보 링크의 수를 n이라 할 때, 제2관련 단어 중 등장 빈도수가 많은 순서대로 관련 단어를 검색 키워드로 지정하면서, 추출된 멀티미디어 정보 링크의 수가 n이 될 때까지 관련 단어에 대응하는 멀티미디어 검색 결과를 수집하는 것을 특징으로 하는 지식노드 연결구조를 생성하기 위한 검색 데이터베이스 구축 장치.
  17. 제1항에 있어서,
    상기 멀티미디어 정보 링크는, 동영상, 음악, 이미지 및 웹지도 중 어느 하나 이상의 멀티미디어 데이터에 대한 링크임을 특징으로 하는 지식노드 연결구조를 생성하기 위한 검색 데이터베이스 구축 장치.
  18. 제1항에 있어서,
    상기 데이터베이스 저장 모듈은 상기 제2관련 단어를 대응하는 제2콘텐츠 정보와 대응시켜 데이터베이스에 더 저장하는 것을 특징으로 하는 지식노드 연결구조를 생성하기 위한 검색 데이터베이스 구축 장치.
  19. 제1항에 있어서,
    상기 데이터베이스에 저장된 제2콘텐츠 정보에 대응하는 검색 키워드와 제1관련 단어를 각각 핵심 단어와 관련 단어로 지정하고, 핵심 단어와 관련 단어의 연결 관계를 그래픽 위상 구조로 표현한 지식노드 연결구조를 생성하여 출력하는 지식노드 연결구조 출력 모듈;을 더 포함하는 것을 특징으로 하는 지식노드 연결구조를 생성하기 위한 검색 데이터베이스 구축 장치.
  20. 제19항에 있어서,
    상기 제1관련 단어는 2개 이상인 것을 특징으로 하는 지식노드 연결구조를 생성하기 위한 검색 데이터베이스 구축 장치.
  21. 제18항에 있어서,
    상기 데이터베이스에 저장된 제2콘텐츠 정보에 대응하는 검색 키워드와 제2관련 단어를 각각 핵심 단어와 관련 단어로 지정하고, 핵심 단어와 관련 단어의 연결 관계를 그래픽 위상 구조로 표현한 지식노드 연결구조를 생성하여 출력하는 지식노드 연결구조 출력 모듈;을 더 포함하는 것을 특징으로 하는 지식노드 연결구조를 생성하기 위한 검색 데이터베이스 구축 장치.
  22. 제19항 또는 제21항에 있어서,
    상기 지식노드 연결구조 출력 모듈은 상기 데이터베이스로부터 상기 지식노드 연결구조에 대응되는 제2콘텐츠 정보의 링크 URL을 조회한 후, 링크 URL이 부여된 제1인터페이스를 상기 지식노드 연결구조와 함께 출력하는 것을 특징으로 하는 지식노드 연결구조를 생성하기 위한 검색 데이터베이스 구축 장치.
  23. 제19항 또는 제21항에 있어서,
    상기 지식노드 연결구조 출력 모듈은 상기 데이터베이스로부터 상기 지식노드 연결구조에 대응되는 제2콘텐츠 정보의 멀티미디어 정보 링크를 조회한 후, 멀티미디어 정보 링크가 부여된 제2인터페이스를 상기 지식노드 연결구조와 함께 출력하는 것을 특징으로 하는 지식노드 연결구조를 생성하기 위한 검색 데이터베이스 구축 장치.
  24. 제23항에 있어서,
    상기 제2인터페이스는 동영상, 음악, 이미지 및 웹지도 중 하나 이상의 멀티미디어 정보에 대한 링크가 부여되어 있는 것을 특징으로 하는 지식노드 연결구조를 생성하기 위한 검색 데이터베이스 구축 장치.
  25. (a) 검색 키워드를 이용하여 검색 사이트를 통해 수신한 제1검색 결과에서 상위에 랭크된 복수의 제1콘텐츠 링크를 선별하는 단계;
    (b) 각각의 제1콘텐츠 링크에 대응하는 제1콘텐츠 정보를 분석하여 모든 제1콘텐츠 정보에 걸쳐 등장 빈도수가 높은 복수의 제1관련 단어를 선정하는 단계;
    (c) 상기 검색 키워드와 상기 제1관련 단어의 상호 조합을 검색 키워드로 하여 상기 검색 사이트로부터 수신한 제2검색 결과에서 상위에 랭크된 복수의 제2콘텐츠 링크를 선별하는 단계;
    (d) 각 제2콘텐츠 링크에 대해 대응하는 제2콘텐츠 정보에서 등장 빈도수가 높은 복수의 제2관련 단어를 추출하는 단계;
    (e) 하나 이상의 제2관련 단어를 검색 키워드로 한 멀티미디어 검색 결과에서 상위에 랭크된 하나 이상의 멀티미디어 정보 링크를 추출하는 단계; 및
    (f) 각 제2콘텐츠 정보에 대해 검색 키워드, 상기 제1관련 단어, 제2콘텐츠 링크의 URL 및 상기 멀티미디어 정보 링크를 데이터베이스에 저장하는 단계;를 포함하는 것을 특징으로 하는 지식노드 연결구조를 생성하기 위한 검색 데이터베이스 구축 방법.
KR1020090107356A 2009-11-09 2009-11-09 지식노드 연결구조를 생성하기 위한 검색 데이터베이스 구축 장치 및 방법 KR101122737B1 (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020090107356A KR101122737B1 (ko) 2009-11-09 2009-11-09 지식노드 연결구조를 생성하기 위한 검색 데이터베이스 구축 장치 및 방법

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020090107356A KR101122737B1 (ko) 2009-11-09 2009-11-09 지식노드 연결구조를 생성하기 위한 검색 데이터베이스 구축 장치 및 방법

Publications (2)

Publication Number Publication Date
KR20110050823A true KR20110050823A (ko) 2011-05-17
KR101122737B1 KR101122737B1 (ko) 2012-03-23

Family

ID=44361294

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020090107356A KR101122737B1 (ko) 2009-11-09 2009-11-09 지식노드 연결구조를 생성하기 위한 검색 데이터베이스 구축 장치 및 방법

Country Status (1)

Country Link
KR (1) KR101122737B1 (ko)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104408189A (zh) * 2014-12-15 2015-03-11 北京国双科技有限公司 关键词排名的展示方法和装置
KR20160022408A (ko) * 2014-08-19 2016-03-02 주식회사 모브릭 미디어 릴레이 장치 및 방법
KR20160022839A (ko) * 2016-01-26 2016-03-02 주식회사 모브릭 미디어 릴레이 장치 및 방법
KR101683138B1 (ko) * 2016-06-14 2016-12-06 한국과학기술정보연구원 정보검색장치 및 그 동작 방법
CN113495984A (zh) * 2020-03-20 2021-10-12 华为技术有限公司 一种语句检索方法以及相关装置
KR20220048581A (ko) * 2020-10-13 2022-04-20 캣벨컴퍼니 주식회사 콘텐츠 모니터링 시스템 및 방법

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20080090223A (ko) * 2007-04-04 2008-10-08 한국방송공사 멀티미디어 데이터 검색 장치, 방법 및 이를 구현하기 위한프로그램을 기록한 기록매체
KR101111679B1 (ko) * 2008-04-11 2012-02-14 권혁성 검색시스템 및 그 방법

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20160022408A (ko) * 2014-08-19 2016-03-02 주식회사 모브릭 미디어 릴레이 장치 및 방법
CN104408189A (zh) * 2014-12-15 2015-03-11 北京国双科技有限公司 关键词排名的展示方法和装置
CN104408189B (zh) * 2014-12-15 2018-11-09 北京国双科技有限公司 关键词排名的展示方法和装置
KR20160022839A (ko) * 2016-01-26 2016-03-02 주식회사 모브릭 미디어 릴레이 장치 및 방법
KR101683138B1 (ko) * 2016-06-14 2016-12-06 한국과학기술정보연구원 정보검색장치 및 그 동작 방법
CN113495984A (zh) * 2020-03-20 2021-10-12 华为技术有限公司 一种语句检索方法以及相关装置
KR20220048581A (ko) * 2020-10-13 2022-04-20 캣벨컴퍼니 주식회사 콘텐츠 모니터링 시스템 및 방법

Also Published As

Publication number Publication date
KR101122737B1 (ko) 2012-03-23

Similar Documents

Publication Publication Date Title
US6256648B1 (en) System and method for selecting and displaying hyperlinked information resources
US9218414B2 (en) System, method, and user interface for a search engine based on multi-document summarization
JP6205270B2 (ja) ユーザカスタマイズ型コンテンツ提供方法およびシステム
US8452791B2 (en) Adding new instances to a structured presentation
JP5147947B2 (ja) クエリ別検索コレクション生成方法およびシステム
US20120011129A1 (en) Faceted exploration of media collections
CN101359332A (zh) 具有语义分类功能的可视化搜索界面的设计方法
JP2008204444A (ja) データ処理装置、データ処理方法及び検索装置
KR101122737B1 (ko) 지식노드 연결구조를 생성하기 위한 검색 데이터베이스 구축 장치 및 방법
US10783192B1 (en) System, method, and user interface for a search engine based on multi-document summarization
JP2002351916A (ja) Web情報検索装置、web情報検索方法及びその方法をコンピュータに実行させるプログラム
CN104503988A (zh) 搜索方法及装置
KR101011726B1 (ko) 스니펫 제공 장치 및 방법
CN107025261B (zh) 主题网络语料库
KR102195686B1 (ko) 지역 기반 아이템 추천 장치 및 방법
KR101248186B1 (ko) 검색 결과 페이지에서 개별 컨텐츠를 이용하여 블로그를 생성하는 검색 시스템 및 검색 방법
KR20010095215A (ko) 사이트 정보 데이터베이스 구축을 통한 인터넷 상에서의정보 검색 방법
CN103942204A (zh) 用于挖掘意图的方法和设备
KR101134073B1 (ko) 검색어와 검색 결과의 단어 연관성을 이용하는 검색 방법 및 검색 시스템
CN104866545A (zh) 在信息展示页面上检索关键字的方法
KR101132431B1 (ko) 관심 정보 제공 시스템 및 방법
KR102335408B1 (ko) 영화 속성 언어 관리 방법 및 장치
August et al. Mobile web searching
JP4464713B2 (ja) 支援サーバ、支援システム及び支援方法
KR100834536B1 (ko) 온톨로지 기반의 정보 표시 방법

Legal Events

Date Code Title Description
A107 Divisional application of patent
A201 Request for examination
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
LAPS Lapse due to unpaid annual fee