KR20090056273A - 키워드 검색 방법 - Google Patents
키워드 검색 방법 Download PDFInfo
- Publication number
- KR20090056273A KR20090056273A KR1020070123346A KR20070123346A KR20090056273A KR 20090056273 A KR20090056273 A KR 20090056273A KR 1020070123346 A KR1020070123346 A KR 1020070123346A KR 20070123346 A KR20070123346 A KR 20070123346A KR 20090056273 A KR20090056273 A KR 20090056273A
- Authority
- KR
- South Korea
- Prior art keywords
- web document
- keyword
- user
- search
- database
- Prior art date
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/31—Indexing; Data structures therefor; Storage structures
- G06F16/316—Indexing structures
- G06F16/319—Inverted lists
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/953—Querying, e.g. by the use of web search engines
- G06F16/9535—Search customisation based on user profiles and personalisation
Landscapes
- Engineering & Computer Science (AREA)
- Databases & Information Systems (AREA)
- Theoretical Computer Science (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Software Systems (AREA)
Abstract
본 발명은 검색 엔진에서 사용자의 집단지성을 이용하여 키워드를 검색하여 사용자의 검색 의도를 만족시키도록 한 키워드 검색 방법에 관한 것으로, 사용자가 입력한 키워드를 검색할 시에, 해당 검색할 키워드를 포함하고 있는 각 웹 문서를 검색하며, 검색할 키워드에 대응하는 추천 키워드들을 판독하고, 각 웹 문서 내에 해당 추천 키워드들을 포함하는지를 확인하며, 추천 키워드 포함 여부에 따라 각 웹 문서의 점수에 가중치를 적용시켜, 각 웹 문서의 순위 리스트를 재조정하며, 이에 재조정된 순위 리스트에 따라 각 웹 문서의 요약 정보를 생성시켜 사용자에게 제공하도록 함으로써, 사용자의 검색 의도를 만족시켜 줄 수 있는 검색 결과를 얻을 수 있다.
키워드 검색, 검색 의도, 검색 엔진, 집단지성
Description
본 발명은 키워드 검색 방법에 관한 것으로, 특히 검색 엔진에서 사용자의 집단지성을 이용하여 키워드를 검색하여 사용자의 검색 의도를 만족시키도록 한 키워드 검색 방법에 관한 것이다.
일반적으로, 사용자가 인터넷상에서 원하는 정보(예를 들어, 웹 사이트, 웹 문서 등)를 얻기 위해서는, 사용자는 자신의 단말기를 통해 검색 서비스를 제공하는 검색 사이트에 접속한 다음에, 해당 검색 사이트에서 제공하는 검색 창에 검색 키워드를 입력하고 검색을 실행시킴으로써, 해당 검색 사이트의 검색 엔진을 통해 해당 검색 키워드를 포함하는 웹 사이트 또는 웹 문서를 검색하고, 해당 검색 결과를 요약 정보로 제공해 주게 된다.
이때, 검색 사이트에서 제공하는 검색 창에 입력하는 검색 키워드로 사용자가 원하는 정보를 얻으려는 경우에, 사용자의 검색 의도를 충분히 만족시킬 수 있는 검색 키워드를 검색 창에 입력해야 함에도 불구하고, 우리말(즉, 한글) 단어의 중의성 및 형태소 분석 오류, 문서 작성자의 실수 등으로 인해 잘못된 검색 키워드를 입력함으로써, 입력된 검색 키워드가 사용자의 검색 의도를 충분히 반영시키지 못하는 문제점이 있다.
첫 번째 중의성에 의한 문제점을 예를 들어 보다 상세히 살펴보면 다음과 같다.
검색 엔진에서 '다음'이라는 키워드로 검색을 수행했을 경우, 실제 사용자는 '다음 커뮤니케이션'과 관련된 정보를 얻기 위한 의도로 '다음'이라는 키워드를 입력했음에도 불구하고, 기존의 검색 엔진에서는 단순히 사용자가 입력한 검색 키워드를 포함하고 있는지의 여부만으로 검색 결과를 제공하기 때문에, '이전'과 반대되는 의미의 '다음'이라는 키워드를 포함하는 문서들을 주로 검색 결과로 제공하고, '기업 및 인터넷 서비스' 의미의 '다음'은 일부 밖에 제공하지 않을 수 있다.
다시 말해서, 평소 '다음'으로 검색하는 사용자들이 '다음 커뮤니케이션'과 관련된 정보를 얻기 위한 의도로 입력하게 되는 다른 검색어는, '다음검색', '미디어다음', '다음카페' 등과 같이, 기업 또는 인터넷 서비스로서의 '다음'임에도 불구하고, 검색 엔진에서 '다음'이라는 키워드로 검색했을 때, 한글 문서에서 '다음'이라는 단어는 '이전'과 반대되는 의미로 더 많이 나타날 수 있다.
다른 예를 살펴보면, 검색 엔진에서 'LA'라는 키워드로 검색을 수행했을 경우, 실제 사용자는 '미국 도시'와 관련된 정보를 얻기 위한 의도로 'LA'라는 키워드를 입력했음에도 불구하고, 'la traviata' 등이 포함되어 있는 문서들을 주로 검색하게 되어 정확성이 떨어지는 경우가 발생한다.
두 번째 형태소 분석 및 문서 작성 오류에 의한 문제점을 예를 들어 보다 상세히 살펴보면 다음과 같다.
검색 엔진에서 '에도'라는 키워드로 검색을 수행했을 경우, 실제 사용자는 '일본'과 관련된 정보를 얻기 위한 의도로 '에도'라는 키워드를 입력했음에도 불구하고, 기존 검색 엔진의 형태소 분석기가 '에도'라는 낱말이 명사로 사용되었는지, 조사로 사용되었는지를 확률적으로 판단할 수도 있지만 '편파 판정 에도 좌절하기 않았다'와 같은 문장에서처럼 웹 문서에 존재하는 수많은 문서 작성의 오류 때문에, 조사로서의 '에도'라는 키워드를 포함하는 문서들을 주로 검색 결과로 제공하고, 명사로서의 '에도'는 일부 밖에 제공하지 않음으로써, 형태소 분석기가 정확한 검색 결과를 도출해 낼 수 없는 경우가 더 많다.
다시 말해서, 평소 '에도'로 검색하는 사용자들이 '일본'과 관련된 정보를 얻기 위한 의도로 입력하게 되는 다른 검색어는, '에도가와 란포', '에도시대' 등과 같이, 명사로서의 '에도'임에도 불구하고, 검색 엔진에서 '에도'라는 키워드로 검색했을 때, 한글 문서에서 '에도'라는 낱말이 조사로서 사용되는 경우가 더 많기 때문에, 키워드 검색 결과에서 '일본' 관련 문서를 찾기 어려운 문제점이 있다.
다른 예를 살펴보면, 검색 엔진에서 '가야'라는 키워드로 검색을 수행했을 경우, 실제 사용자는 '역사' 또는 '가야 CC'와 관련된 정보를 얻기 위한 의도로 '가야'라는 키워드를 입력했음에도 불구하고, 동사로서의 '가야'를 포함하고 있는 문서들, 예를 들어 '가야 할 길', '혼수는 얼마나 해 가야 하나요?'와 같은 문서들을 주로 검색하게 되는 경우가 발생한다.
이와 같이, 종래의 키워드 검색은 한글 단어의 중의성, 형태소 분석 및 문서 작성의 오류로 인하여 사용자의 검색 의도를 충분히 만족시키지 못 하는 문제점이 있었다.
본 발명이 이루고자 하는 기술적 과제는, 전술한 바와 같은 문제점을 해결하기 위한 것으로, 검색 엔진에서 사용자의 집단지성을 이용하여 키워드를 검색하여 사용자의 검색 의도를 만족시키도록 한 키워드 검색 방법을 제공하는 것이다.
또한, 본 발명은 검색 엔진에서 검색 서비스를 이용하는 사람의 집단지성을 활용하여 이용자의 검색 의도를 만족하는 키워드 검색을 수행함으로써, 검색 서비스 이용자의 검색 결과에 대한 정확도를 개선 또는 향상시키도록 하는데, 그 목적이 있다.
이러한 과제를 해결하기 위해, 본 발명에 따르면, 검색 엔진에서 사용자들의 검색 결과 값에 대한 정확도를 향상시키기 위해서, 검색 대상이 되는 웹 문서를 미리 분석하여 분석 값을 보관하고, 특정 키워드를 검색할 시에 사용자들이 입력하는 검색어에 대해서 사용자의 검색 의도를 잘 반영해 줄 수 있는 관련 키워드(즉, 추천 키워드)를 사용자의 집단지성을 이용해 분석하여 각 검색어들에 대한 추천 키워드들을 데이터베이스화하여 구성해 둔 후에, 실제 키워드 검색 시에 추천 키워드들을 웹 문서의 분석 값과 비교하여 관련성이 높은 문서들만 노출함으로써, 사용자가 진정으로 원하는 키워드들과 상관관계가 높은 웹 문서를 보여 줄 수 있도록 한다.
본 발명의 한 특징에 따르면, 사용자가 입력한 키워드를 검색하는 방법에 있어서, 사용자가 상기 키워드를 검색할 시에, 해당 검색할 키워드를 포함하고 있는 각 웹 문서를 검색하는 단계, 상기 검색할 키워드에 대응하는 추천 키워드들을 판독하고, 상기 각 웹 문서 내에 해당 추천 키워드들을 포함하는지를 확인하는 단계, 상기 추천 키워드 포함 여부에 따라 상기 각 웹 문서의 점수에 가중치를 적용시켜, 상기 각 웹 문서의 순위 리스트를 재조정하는 단계, 그리고 상기 재조정된 순위 리스트에 따라 상기 각 웹 문서의 요약 정보를 생성시켜 사용자에게 제공하는 단계를 포함하는 키워드 검색 방법을 제공한다.
그리고 이러한 키워드 검색 방법은, 사용자의 집단지성을 이용하여 상기 키워드에 대응하는 추천 키워드들을 설정하여 데이터베이스화하는 단계를 더 포함한다. 또한, 이러한 키워드 검색 방법은, 상기 키워드에 대응하는 웹 문서의 아이디(ID: Identifier)에 대한 정보를 설정하여 데이터베이스화하는 단계, 그리고 상기 웹 문서 아이디에 대응하는 웹 문서의 본문에 대한 정보를 설정하여 데이터베이스화하는 단계를 더 포함한다.
다르게는, 이러한 키워드 검색 방법은, 상기 키워드에 대응하는 추천 키워드들, 상기 키워드에 대응하는 웹 문서 아이디, 상기 웹 문서 아이디에 대응하는 웹 문서 본문에 대한 정보가 삭제, 변경, 또는 수정되는 경우, 해당 삭제, 변경 또는 수정된 정보를 업그레이드시켜 주는 단계를 더 포함한다. 또한 이러한 키워드 검색 방법은, 상기 키워드에 대응하는 추천 키워드들, 상기 키워드에 대응하는 웹 문서 아이디, 상기 웹 문서 아이디에 대응하는 웹 문서 본문에 대한 정보를 주기적으로 재설정하는 단계를 더 포함한다.
여기서, 상기 각 웹 문서를 검색하는 단계는, 사용자가 입력한 키워드를 포 함하고 있는 각 웹 문서의 아이디를 상기 데이터베이스로부터 검색하는 단계, 사용자가 입력한 키워드를 포함하고 있는 각 웹 문서에 대하여 사용자가 입력한 키워드와의 매칭 정도 또는 페이지 랭킹에 따라 점수화를 수행하는 단계, 그리고 상기 점수가 높은 순서대로 소정 개수의 웹 문서 아이디를 리스트로 생성하는 단계를 더 포함한다.
그리고 상기 추천 키워드들을 포함하는지를 확인하는 단계는, 사용자가 입력한 키워드에 대응하는 추천 키워드들을 상기 데이터베이스로부터 검색하는 단계, 상기 리스트의 각 웹 문서 아이디에 대응하는 웹 문서 본문을 상기 데이터베이스로부터 검색하는 단계, 그리고 상기 추천 키워드들이 상기 각 웹 문서 본문 내에 포함되어 있는지를 확인하는 단계를 더 포함한다.
그리고 상기 각 웹 문서의 순위 리스트를 재조정하는 단계는, 상기 추천 키워드들이 상기 각 웹 문서 본문 내에 포함되어 있는 경우, 상기 각 웹 문서의 점수에 가중치를 적용하는 단계, 그리고 상기 가중치가 적용된 점수가 높은 순서대로 상기 웹 문서 아이디 리스트를 재정렬하는 단계를 더 포함한다.
본 발명의 다른 특징에 따르면, 사용자가 입력한 키워드를 검색하는 방법에 있어서, 상기 키워드를 포함하고 있는 각 웹 문서의 아이디를 검색하는 단계, 상기 키워드를 포함하고 있는 각 웹 문서에 대하여 상기 키워드와의 매칭 정도 또는 페이지 랭킹에 따라 점수화를 수행하는 단계, 상기 점수가 높은 순서대로 상기 웹 문서 아이디를 소정 개수만큼 선택하여 리스트로 생성하는 단계, 상기 키워드에 대응하는 추천 키워드들을 검색하는 단계, 상기 리스트의 각 웹 문서 아이디에 대응하 는 웹 문서 본문을 검색하는 단계, 상기 추천 키워드들이 상기 각 웹 문서 본문 내에 포함되어 있는지를 확인하는 단계, 상기 추천 키워드들이 상기 각 웹 문서 본문 내에 포함되어 있는 경우, 상기 각 웹 문서의 점수에 가중치를 적용하는 단계, 상기 가중치가 적용된 점수가 높은 순서대로 상기 웹 문서 아이디 리스트를 재정렬하는 단계, 그리고 상기 재정렬된 웹 문서 아이디 리스트에 따라 상기 각 웹 문서의 요약 정보를 생성시켜 사용자에게 제공하는 단계를 포함하는 키워드 검색 방법을 제공한다.
그리고 이러한 키워드 검색 방법은, 상기 키워드에 대응하는 웹 문서 아이디에 대한 정보를 설정하여 데이터베이스화하는 단계, 사용자의 집단지성을 이용하여 상기 키워드에 대응하는 추천 키워드들을 설정하여 데이터베이스화하는 단계, 그리고 상기 웹 문서 아이디에 대응하는 웹 문서 본문에 대한 정보를 설정하여 데이터베이스화하는 단계를 더 포함한다.
이와 같이 본 발명에 의하면, 사용자의 검색어에 대해 사용자의 검색 의도를 반영한 추천 단어를 데이터베이스화한 후에, 특정 키워드를 검색할 시에 해당 데이터베이스를 이용하여 해당 키워드에 대응하는 추천 단어를 포함하는 웹 문서에 점수 가중치를 주어, 웹 문서 순위 리스트를 사용자가 원하는 키워드들과 상관관계가 높은 순서대로 재조정하여 사용자에게 제공함으로써, 사용자의 검색 의도를 만족시켜 줄 수 있는 검색 결과를 얻을 수 있다.
아래에서는 첨부한 도면을 참고로 하여 본 발명의 실시 예에 대하여 본 발명이 속하는 기술 분야에서 통상의 지식을 가진 자가 용이하게 실시할 수 있도록 상세히 설명한다. 그러나 본 발명은 여러 가지 상이한 형태로 구현될 수 있으며 여기에서 설명하는 실시 예에 한정되지 않는다. 그리고 도면에서 본 발명을 명확하게 설명하기 위해서 설명과 관계없는 부분은 생략하였으며, 명세서 전체를 통하여 유사한 부분에 대해서는 유사한 도면 부호를 붙였다.
명세서 전체에서, 어떤 부분이 어떤 구성요소를 "포함"한다고 할 때, 이는 특별히 반대되는 기재가 없는 한 다른 구성요소를 제외하는 것이 아니라 다른 구성요소를 더 포함할 수 있는 것을 의미한다. 또한, 명세서에 기재된 "…부", "…기", "…모듈" 등의 용어는 적어도 하나의 기능이나 동작을 처리하는 단위를 의미하며, 이는 하드웨어나 소프트웨어 또는 하드웨어 및 소프트웨어의 결합으로 구현될 수 있다.
이제 본 발명의 실시 예에 따른 키워드 검색 방법에 대하여 도면을 참고로 하여 상세하게 설명한다.
도 1은 본 발명의 실시 예에 따른 키워드 검색을 위한 시스템의 개략적인 개념도이다.
본 발명의 실시 예에 따른 키워드 검색을 위한 시스템은, 도 1에 도시된 바와 같이, 사용자 단말기(110), 유무선 통신망(120), 검색 엔진(130), 데이터베이스(140)를 포함한다.
사용자 단말기(110)는 사용자들이 특정 키워드를 검색하기 위한 검색어를 입 력하는 경우에 해당 입력된 검색어를 유무선 통신망(120)을 통해 검색 엔진(130)에 전달하며, 검색 엔진(130)으로부터 수신되는 검색 결과를 사용자에게 제공한다.
유무선 통신망(120)은 사용자 단말기(110)와 검색 엔진(130) 사이를 서로 연결하여 통신을 수행하도록 하는 역할을 수행한다.
검색 엔진(130)은 사용자 단말기(110)로부터 수신되는 검색어를 포함한 웹 문서를 검색(Search)하며, 해당 검색된 웹 문서에 대한 점수화하고 해당 점수화에 따른 웹 문서의 아이디(ID: Identifier) 리스트를 생성시키며, 사용자 단말기(110)로부터 수신되는 검색어에 대응하는 추천 키워드를 데이터베이스(140)에서 판독하며, 해당 검색 결과(즉, 검색된 웹 문서)에 대한 요약 정보 생성 시에 해당 웹 문서 내의 추천 키워드 유무에 따라 점수 가중치를 주어 아이디 리스트를 재조정한 후에 요약 정보를 생성하여 검색 결과로 유무선 통신망(120)을 통해 사용자 단말기(110)로 전송한다.
그리고 검색 엔진(130)은 쿼리 브로커(Query Broker)(131), 서처(Searcher)(132), 써머리(Summary)(133)를 포함한다.
쿼리 브로커(131)는 사용자 단말기(110)로부터 유무선 통신망(120)을 통해 사용자가 입력한 검색어를 수신받아 서처(132)로 인가한다. 쿼리 브로커(131)는 사용자가 입력한 검색어에 대응하는 사용자 검색 의도 반영용 추천 키워드에 대한 정보를 데이터베이스(140)에서 판독한 후에, 해당 판독한 사용자 검색 의도 반영용 추천 키워드에 대한 정보를 서처(132)로부터 인가되는 웹 문서 아이디의 리스트 및 점수에 대한 정보와 함께 써머리(133)에게 인가한다. 쿼리 브로커(131)는 써머 리(133)로부터 인가되는 각 웹 문서의 요약 정보를 검색 결과로 유무선 통신망(120)을 통해 사용자 단말기(110)로 전송한다.
서처(132)는 쿼리 브로커(131)로부터 인가되는 검색어를 포함하고 있는 웹 문서를 데이터베이스(140)에서 검색한 후에, 해당 검색된 웹 문서에 대한 점수화하고 해당 점수화에 따른 웹 문서의 아이디 리스트를 생성시켜 해당 생성된 웹 문서의 점수 및 리스트에 대한 정보를 쿼리 브로커(131)로 인가한다.
써머리(133)는 쿼리 브로커(131)로부터 웹 문서의 아이디 리스트 및 점수에 대한 정보와 사용자 검색 의도 반영용 추천 키워드에 대한 정보를 인가받고, 웹 문서 아이디 리스트의 각 웹 문서 아이디에 해당하는 웹 문서 내에 사용자 검색 의도 반영용 추천 키워드가 있는지의 여부에 따라 웹 문서의 점수에 가중치를 주어 웹 문서 아이디 리스트를 재조정한 후에, 해당 재조정된 웹 문서 아이디 리스트에 따라 각 웹 문서의 요약 정보를 생성하여 쿼리 브로커(131)에게 인가한다.
데이터베이스(140)는 사용자들의 각 검색어에 대응하는 웹 문서의 아이디에 대한 정보, 각 웹 문서 아이디에 대응하는 웹 문서 본문에 대한 정보, 사용자들의 각 검색어에 대응하는 사용자 검색 의도 반영용 추천 키워드에 대한 정보를 데이터베이스화시켜 저장한다. 이때, 데이터베이스(140)는 그 기능이나 역할에 따라 별도의 메모리로 구성될 수도 있음을 잘 이해해야 한다.
아래에서는 본 발명의 실시 예에 따른 키워드 검색 방법에 대해서 도 2의 순서도를 참조하여 상세하게 설명한다.
우선, 사용자가 특정 키워드를 검색하기 전에 미리 준비해 두어야 할 것이 다. 검색 대상이 되는 모든 웹 문서들을 특정 키워드에 대해 미리 분석하여 해당 분석한 데이터 값을 데이터베이스(140)에 보관한다.
다시 말해서, 검색 대상이 되는 모든 웹 문서들에서 키워드를 추출하여, 해당 키워드가 주어지는 경우에 해당 각 웹 문서의 아이디를 찾을 수 있도록 각 키워드에 대응하는 웹 문서 아이디에 대한 정보를 설정하여 데이터베이스화한 후에 이를 데이터베이스(140)(또는, 별도로 구비된 메모리)에 저장한다(S201). 이때, 각 키워드에 대응하는 웹 문서 아이디에 대한 데이터베이스(140)의 구조를 '역 인덱스 구조'라 한다. 또한, 해당 웹 문서 아이디가 주어지는 경우에 해당 각 웹 문서의 본문을 찾을 수 있도록 각 웹 문서 아이디에 대응하는 웹 문서 본문에 대한 정보를 설정하여 데이터베이스화한 후에 이를 데이터베이스(140)(또는, 별도로 구비된 메모리)에 저장한다(S202).
그리고 사용자의 검색어 입력 시에 사용자의 검색 의도를 보다 정확하게 파악하기 위한 관련 검색어 집합을 생성하여 데이터베이스(140)에 보관한다.
다시 말해서, 사용자가 검색을 위해 입력할 수 있는 키워드(이하, 쿼리(Query)라 함)에 대해서 사용자의 집단지성을 이용하여 사용자의 검색 의도를 보다 잘 반영해 줄 수 있는 관련 키워드(즉, 추천 키워드)를 분석하여, 각 쿼리에 대응하는 사용자 검색 의도 반영용 추천 키워드에 대한 정보를 설정하며, 해당 설정된 정보들을 데이터베이스화하여 데이터베이스(140)(또는, 별도로 구비된 메모리)에 저장한다(S203). 여기서, 쿼리는 다수 개의 텀(Term)으로 이루어질 수도 있다. 예를 들어, '다음커뮤니케이션'은 '다음'과 '커뮤니케이션'의 텀으로 이루어진다.
추후에, 사용자들의 각 검색어에 대응하는 웹 문서의 아이디에 대한 정보, 각 웹 문서 아이디에 대응하는 웹 문서 본문에 대한 정보, 사용자들의 각 검색어에 대응하는 사용자 검색 의도 반영용 추천 키워드에 대한 정보가 삭제, 변경, 또는 수정되는 경우, 해당 삭제, 변경 또는 수정된 정보를 데이터베이스(140)에 업그레이드시켜 준다. 다르게는, 주기적으로 상술한 단계들 S201에서부터 S203을 반복 수행하여 사용자들의 각 검색어에 대응하는 웹 문서의 아이디에 대한 정보, 각 웹 문서 아이디에 대응하는 웹 문서 본문에 대한 정보, 사용자들의 각 검색어에 대응하는 사용자 검색 의도 반영용 추천 키워드에 대한 정보를 재설정한 후에, 해당 재설정된 정보들을 데이터베이스(140)에 업그레이드시켜 줌으로써, 사용자의 검색 의도를 보다 잘 반영해 줄 수 있는 상태를 계속적으로 유지시켜 줄 수 있다.
상술한 바와 같은 데이터베이스(140)를 구성함으로써, 사용자의 검색 의도를 실시간적으로 파악할 수 있도록 동적 갱신이 자유로운 이점을 가지며, 또한 두 개 이상의 텀으로 구성된 쿼리에 대해서도 쉽게 검색할 수 있다는 이점도 있다.
그런 후에, 사용자가 실제로 특정 키워드에 대한 검색을 수행하기 위해서, 사용자 단말기(110)를 이용하여 유무선 통신망(120)을 통해 검색 사이트에 접속한 후에, 해당 검색 사이트에서 제공하는 검색 창에 특정 키워드를 검색하기 위한 쿼리를 입력하고 검색 명령을 선택하게 된다.
이에, 사용자 단말기(110)는 사용자의 검색 명령에 따라 사용자가 입력한 쿼리를 포함한 검색 명령 메시지를 생성시켜 유무선 통신망(120)을 통해 검색 사이트로 전송하게 된다.
이에 따라, 검색 사이트의 검색 엔진(130)은 사용자 단말기(110)로부터 유무선 통신망(120)을 통해 전달되는 검색 명령 메시지를 수신받는다. 이때, 검색 엔진(130)에 구비된 쿼리 브로커(131)는 사용자 단말기(110)로부터 유무선 통신망(120)을 통해 사용자가 입력한 쿼리를 수신받아(S204) 검색 엔진(130)에 구비된 서처(132)로 인가한다.
그러면, 서처(132)는 쿼리 브로커(131)로부터 사용자가 입력한 쿼리를 인가받아 사용자가 입력한 쿼리를 포함하고 있는 웹 문서들을 검색한 후에, 해당 검색된 각 웹 문서에 대한 점수화를 수행하고 해당 점수화에 따른 각 웹 문서의 아이디 리스트를 생성시켜 이에 대한 정보를 쿼리 브로커(131)에게 인가한다.
다시 말해서, 서처(132)는 쿼리 브로커(131)로부터 사용자가 입력한 쿼리를 인가받아 사용자가 입력한 쿼리를 포함하고 있는 각 웹 문서의 아이디(즉, 사용자가 입력한 쿼리에 대응하는 웹 문서 아이디)를 데이터베이스(140)에서 판독(즉, 검색)한다(S205).
그리고 서처(132)는 사용자가 입력한 쿼리를 포함하고 있는 각 웹 문서에 대해서 사용자가 입력한 쿼리와의 매칭 정도, 페이지 랭킹 등을 통해 해당 판독된 각 웹 문서 아이디에 대하여 점수화를 수행한다. 또는, 서처(132)는 해당 판독된 각 웹 문서 아이디에 대하여 순위를 매긴다(S206).
그런 다음에, 서처(132)는 점수가 높은 순서대로 소정 개수(예를 들어, 20,000개)의 웹 문서 아이디를 선택하여 리스트로 생성시켜 준다. 또는, 서처(132)는 상위 순위의 웹 문서 아이디를 소정 개수(예를 들어, 20,000개)만큼 선택하여 리스트로 생성시킨 후에(S207), 해당 웹 문서 아이디의 리스트 및 점수(또는, 순위)에 대한 정보를 쿼리 브로커(131)로 인가해 준다.
이에, 쿼리 브로커(131)는 서처(132)로부터 웹 문서 아이디의 리스트 및 점수(또는, 순위)에 대한 정보를 인가받아 사용자가 입력한 쿼리에 대응하는 사용자 검색 의도 반영용 추천 키워드에 대한 정보를 데이터베이스(140)에서 판독(즉, 검색)한 후에(S208), 서처(132)로부터 인가받은 웹 문서 아이디의 리스트 및 점수(또는, 순위)에 대한 정보와 데이터베이스(140)에서 검색한 사용자 검색 의도 반영용 추천 키워드에 대한 정보를 검색 엔진(130)에 구비된 써머리(133)에게 인가한다.
이에 따라, 써머리(133)는 쿼리 브로커(131)로부터 웹 문서 아이디의 리스트 및 점수(또는, 순위)에 대한 정보와 사용자 검색 의도 반영용 추천 키워드에 대한 정보를 인가받아 서처(132)의 검색 결과(즉, 검색된 각 웹 문서)에 대한 요약 정보를 생성한다. 이때, 써머리(133)는 사용자가 입력한 쿼리를 포함하고 있는 각 웹 문서 내에 사용자 검색 의도 반영용 추천 키워드가 있는지의 여부에 따라 각 웹 문서 아이디의 점수에 가중치를 주어 웹 문서 아이디 리스트를 재조정한 후에, 해당 재조정된 웹 문서 아이디 리스트에 따라 각 웹 문서의 요약 정보를 생성하여 쿼리 브로커(131)로 인가한다.
다시 말해서, 써머리(133)는 쿼리 브로커(131)로부터 웹 문서 아이디 리스트를 인가받고, 해당 인가받은 웹 문서 아이디 리스트의 각 웹 문서 아이디를 이용하여 데이터베이스(140)로부터 각 웹 문서 아이디에 대응하는 웹 문서의 본문에 대한 정보를 판독(즉, 검색)한다(S208).
그리고 써머리(133)는 상술한 단계 S208에서 판독한 각 웹 문서 본문이 사용자 검색 의도 반영용 추천 키워드를 포함하고 있는지의 여부를 확인한다(S209). 이때, 써머리(133)는 사용자 검색 의도 반영용 추천 키워드의 포함 여부에 따라 쿼리 브로커(131)로부터 인가받은 웹 문서 아이디 리스트의 각 웹 문서 아이디에 대한 점수(또는, 순위)에 가중치를 적용하여 각 웹 문서 아이디에 대한 점수(또는, 순위)를 재조정한다(S210).
그런 후에, 써머리(133)는 상술한 단계 S210에서 재조정된 점수(또는, 순위)의 상위 순서에 따라 쿼리 브로커(131)로부터 인가받은 웹 문서 아이디 리스트를 재정렬하며, 해당 재정렬된 웹 문서 아이디 리스트에 따라 사용자가 입력한 쿼리를 포함하고 있는 각 웹 문서의 요약 정보를 생성시켜 주며(S211), 해당 생성된 각 웹 문서의 요약 정보를 쿼리 브로커(131)로 인가해 준다.
그러면, 쿼리 브로커(131)는 써머리(133)로부터 각 웹 문서의 요약 정보를 인가받아 검색 결과로 유무선 통신망(120)을 통해 사용자 단말기(110)로 전송한다(S212). 이에, 사용자 단말기(110)는 검색 엔진(130)으로부터 수신되는 검색 결과를 사용자에게 제공해 줌으로써, 사용자가 진정으로 원하는 키워드들과 상관관계가 매우 높은 웹 문서들을 보여 줄 수 있다.
이상, 본 발명의 실시 예는 검색 엔진에서 사용자의 집단지성을 이용하여 사용자들이 입력하는 검색어에 대해서 사용자의 검색 의도를 잘 반영해 줄 수 있는 추천 키워드를 데이터베이스화한 후에, 검색어 입력 시에 검색어를 포함하고 있는 각 웹 문서 내의 추천 키워드 포함 여부에 따라 각 웹 문서의 점수에 가중치를 적 용시켜 사용자가 진정으로 원하는 키워드들과 상관관계가 높은 웹 문서를 보여 줄 수 있도록 한 키워드 검색 방법에 대해서 설명하였다.
그러나 본 발명의 실시 예는 이상에서 설명한 장치 및/또는 방법을 통해서만 구현이 되는 것은 아니며, 본 발명의 실시 예의 구성에 대응하는 기능을 실현하기 위한 프로그램, 그 프로그램이 기록된 기록 매체 등을 통해 구현될 수도 있으며, 이러한 구현은 앞서 설명한 실시 예의 기재로부터 본 발명이 속하는 기술 분야의 전문가라면 쉽게 구현할 수 있는 것이다.
이상에서 본 발명의 실시 예에 대하여 상세하게 설명하였지만 본 발명의 권리범위는 이에 한정되는 것은 아니고 다음의 청구범위에서 정의하고 있는 본 발명의 기본 개념을 이용한 당업자의 여러 변형 및 개량 형태 또한 본 발명의 권리범위에 속하는 것이다.
도 1은 본 발명의 실시 예에 따른 키워드 검색을 위한 시스템을 나타낸 개략적인 블록도이다.
도 2는 본 발명의 실시 예에 따른 키워드 검색 방법을 나타낸 순서도이다.
Claims (10)
- 사용자가 입력한 키워드를 검색하는 방법에 있어서,사용자가 상기 키워드를 검색할 시에, 해당 검색할 키워드를 포함하고 있는 각 웹 문서를 검색하는 단계,상기 검색할 키워드에 대응하는 추천 키워드들을 판독하고, 상기 각 웹 문서 내에 해당 추천 키워드들을 포함하는지를 확인하는 단계,상기 추천 키워드 포함 여부에 따라 상기 각 웹 문서의 점수에 가중치를 적용시켜, 상기 각 웹 문서의 순위 리스트를 재조정하는 단계, 그리고상기 재조정된 순위 리스트에 따라 상기 각 웹 문서의 요약 정보를 생성시켜 사용자에게 제공하는 단계를 포함하는 키워드 검색 방법.
- 제1항에 있어서,사용자의 집단지성을 이용하여 상기 키워드에 대응하는 추천 키워드들을 설정하여 데이터베이스화하는 단계를 더 포함하는 키워드 검색 방법.
- 제2항에 있어서,상기 키워드에 대응하는 웹 문서의 아이디에 대한 정보를 설정하여 데이터베이스화하는 단계, 그리고상기 웹 문서 아이디에 대응하는 웹 문서의 본문에 대한 정보를 설정하여 데이터베이스화하는 단계를 더 포함하는 키워드 검색 방법.
- 제3항에 있어서,상기 키워드에 대응하는 추천 키워드들, 상기 키워드에 대응하는 웹 문서 아이디, 상기 웹 문서 아이디에 대응하는 웹 문서 본문에 대한 정보가 삭제, 변경, 또는 수정되는 경우, 해당 삭제, 변경 또는 수정된 정보를 업그레이드시켜 주는 단계를 더 포함하는 키워드 검색 방법.
- 제3항에 있어서,상기 키워드에 대응하는 추천 키워드들, 상기 키워드에 대응하는 웹 문서 아이디, 상기 웹 문서 아이디에 대응하는 웹 문서 본문에 대한 정보를 주기적으로 재설정하는 단계를 더 포함하는 키워드 검색 방법.
- 제3항에 있어서,상기 각 웹 문서를 검색하는 단계는,사용자가 입력한 키워드를 포함하고 있는 각 웹 문서의 아이디를 상기 데이터베이스로부터 검색하는 단계,사용자가 입력한 키워드를 포함하고 있는 각 웹 문서에 대하여 사용자가 입 력한 키워드와의 매칭 정도 또는 페이지 랭킹에 따라 점수화를 수행하는 단계, 그리고상기 점수가 높은 순서대로 소정 개수의 웹 문서 아이디를 리스트로 생성하는 단계를 더 포함하는 키워드 검색 방법.
- 제6항에 있어서,상기 추천 키워드들을 포함하는지를 확인하는 단계는,사용자가 입력한 키워드에 대응하는 추천 키워드들을 상기 데이터베이스로부터 검색하는 단계,상기 리스트의 각 웹 문서 아이디에 대응하는 웹 문서 본문을 상기 데이터베이스로부터 검색하는 단계, 그리고상기 추천 키워드들이 상기 각 웹 문서 본문 내에 포함되어 있는지를 확인하는 단계를 더 포함하는 키워드 검색 방법.
- 제7항에 있어서,상기 각 웹 문서의 순위 리스트를 재조정하는 단계는,상기 추천 키워드들이 상기 각 웹 문서 본문 내에 포함되어 있는 경우, 상기 각 웹 문서의 점수에 가중치를 적용하는 단계, 그리고상기 가중치가 적용된 점수가 높은 순서대로 상기 웹 문서 아이디 리스트를 재정렬하는 단계를 더 포함하는 키워드 검색 방법.
- 사용자가 입력한 키워드를 검색하는 방법에 있어서,상기 키워드를 포함하고 있는 각 웹 문서의 아이디를 검색하는 단계,상기 키워드를 포함하고 있는 각 웹 문서에 대하여 상기 키워드와의 매칭 정도 또는 페이지 랭킹에 따라 점수화를 수행하는 단계,상기 점수가 높은 순서대로 상기 웹 문서 아이디를 소정 개수만큼 선택하여 리스트로 생성하는 단계,상기 키워드에 대응하는 추천 키워드들을 검색하는 단계,상기 리스트의 각 웹 문서 아이디에 대응하는 웹 문서 본문을 검색하는 단계,상기 추천 키워드들이 상기 각 웹 문서 본문 내에 포함되어 있는지를 확인하는 단계,상기 추천 키워드들이 상기 각 웹 문서 본문 내에 포함되어 있는 경우, 상기 각 웹 문서의 점수에 가중치를 적용하는 단계,상기 가중치가 적용된 점수가 높은 순서대로 상기 웹 문서 아이디 리스트를 재정렬하는 단계, 그리고상기 재정렬된 웹 문서 아이디 리스트에 따라 상기 각 웹 문서의 요약 정보 를 생성시켜 사용자에게 제공하는 단계를 포함하는 키워드 검색 방법.
- 제9항에 있어서,상기 키워드에 대응하는 웹 문서 아이디에 대한 정보를 설정하여 데이터베이스화하는 단계,사용자의 집단지성을 이용하여 상기 키워드에 대응하는 추천 키워드들을 설정하여 데이터베이스화하는 단계, 그리고상기 웹 문서 아이디에 대응하는 웹 문서 본문에 대한 정보를 설정하여 데이터베이스화하는 단계를 더 포함하는 키워드 검색 방법.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020070123346A KR100906809B1 (ko) | 2007-11-30 | 2007-11-30 | 키워드 검색 방법 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020070123346A KR100906809B1 (ko) | 2007-11-30 | 2007-11-30 | 키워드 검색 방법 |
Publications (2)
Publication Number | Publication Date |
---|---|
KR20090056273A true KR20090056273A (ko) | 2009-06-03 |
KR100906809B1 KR100906809B1 (ko) | 2009-07-09 |
Family
ID=40987696
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020070123346A KR100906809B1 (ko) | 2007-11-30 | 2007-11-30 | 키워드 검색 방법 |
Country Status (1)
Country | Link |
---|---|
KR (1) | KR100906809B1 (ko) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20150123517A (ko) * | 2014-04-25 | 2015-11-04 | 네이버 주식회사 | 검색 결과를 제공하기 위한 방법과 시스템, 기록 매체, 그리고 파일 배포 시스템 |
CN108763332A (zh) * | 2018-05-10 | 2018-11-06 | 北京奇艺世纪科技有限公司 | 一种搜索提示词的生成方法和装置 |
KR20230013498A (ko) | 2021-07-19 | 2023-01-26 | 주식회사 서르 | 재활용품을 선별하는 시스템 및 방법 |
Family Cites Families (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR0170198B1 (ko) * | 1995-09-04 | 1999-03-30 | 양승택 | 키워드망을 이용한 문서순위 결정방법 |
KR19990048714A (ko) * | 1997-12-10 | 1999-07-05 | 윤종용 | 인터넷 정보검색시 유사문서 우선순위 판별방법 |
KR100493688B1 (ko) * | 2003-01-08 | 2005-06-03 | 주식회사 옵투스 | 키워드확장장치 및 방법과 키워드확장장치를 이용한검색시스템 |
US7562068B2 (en) * | 2004-06-30 | 2009-07-14 | Microsoft Corporation | System and method for ranking search results based on tracked user preferences |
-
2007
- 2007-11-30 KR KR1020070123346A patent/KR100906809B1/ko not_active IP Right Cessation
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20150123517A (ko) * | 2014-04-25 | 2015-11-04 | 네이버 주식회사 | 검색 결과를 제공하기 위한 방법과 시스템, 기록 매체, 그리고 파일 배포 시스템 |
CN108763332A (zh) * | 2018-05-10 | 2018-11-06 | 北京奇艺世纪科技有限公司 | 一种搜索提示词的生成方法和装置 |
KR20230013498A (ko) | 2021-07-19 | 2023-01-26 | 주식회사 서르 | 재활용품을 선별하는 시스템 및 방법 |
Also Published As
Publication number | Publication date |
---|---|
KR100906809B1 (ko) | 2009-07-09 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR101323187B1 (ko) | 사용자에 의해 입력된 정보를 통합하여 검색하는 방법과시스템 | |
EP2181405B1 (en) | Automatic expanded language search | |
KR100754768B1 (ko) | 사용자별 맞춤 추천어를 제공하는 시스템, 방법 및 상기방법을 실행하기 위한 프로그램이 기록된 컴퓨터에서 판독가능한 기록 매체 | |
US20190108274A1 (en) | Automated concepts for interrogating a document storage database | |
JP7252914B2 (ja) | 検索提案を提供する方法、装置、機器及び媒体 | |
US8631097B1 (en) | Methods and systems for finding a mobile and non-mobile page pair | |
US20060248458A1 (en) | Method and apparatus for storing and retrieving data using ontologies | |
US20060020576A1 (en) | Search system reusing search condition and the related method | |
US9535892B1 (en) | Method and system for generating unique content based on business entity information received from a user | |
JP5221664B2 (ja) | 情報マップ管理システムおよび情報マップ管理方法 | |
JPH0744567A (ja) | 文書検索装置 | |
KR100906809B1 (ko) | 키워드 검색 방법 | |
KR20070082075A (ko) | 질의어 및 콘텐츠 분류 기반 템플릿을 이용한 검색결과제공방법 및 그 장치 | |
US20080256055A1 (en) | Word relationship driven search | |
KR100952196B1 (ko) | 한글의 초성, 중성 및 종성 중 적어도 하나에 기초하여지역 정보를 검색하는 시스템 및 그 방법 | |
KR100931693B1 (ko) | 키워드 검색 방법 | |
Gretzel et al. | Intelligent search support: Building search term associations for tourism-specific search engines | |
KR100906810B1 (ko) | 키워드 검색 방법 | |
JP5513929B2 (ja) | 経験情報の再利用性評価装置及び方法及びプログラム | |
JP5285491B2 (ja) | 情報検索システム、方法及びプログラム、索引作成システム、方法及びプログラム、 | |
KR101421819B1 (ko) | 온라인 환경에서의 벌룬을 이용한 키워드 검색 결과 제공 방법 | |
US7991787B2 (en) | Applying search engine technology to HCM employee searches | |
Sewell | Comparing four CAB abstracts platforms from a veterinary medicine perspective | |
JP5505207B2 (ja) | 情報検索装置、情報検索方法及び情報検索プログラム | |
US12026157B2 (en) | Narrowing synonym dictionary results using document attributes |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A201 | Request for examination | ||
E902 | Notification of reason for refusal | ||
E701 | Decision to grant or registration of patent right | ||
GRNT | Written decision to grant | ||
FPAY | Annual fee payment |
Payment date: 20120405 Year of fee payment: 4 |
|
FPAY | Annual fee payment |
Payment date: 20130701 Year of fee payment: 5 |
|
LAPS | Lapse due to unpaid annual fee |