KR20080026899A - 검색 대상과 연관된 단어를 추천하는 방법 및 상기 방법을수행하는 시스템 - Google Patents

검색 대상과 연관된 단어를 추천하는 방법 및 상기 방법을수행하는 시스템 Download PDF

Info

Publication number
KR20080026899A
KR20080026899A KR1020060092074A KR20060092074A KR20080026899A KR 20080026899 A KR20080026899 A KR 20080026899A KR 1020060092074 A KR1020060092074 A KR 1020060092074A KR 20060092074 A KR20060092074 A KR 20060092074A KR 20080026899 A KR20080026899 A KR 20080026899A
Authority
KR
South Korea
Prior art keywords
word
document
weight
documents
appearance
Prior art date
Application number
KR1020060092074A
Other languages
English (en)
Other versions
KR100828560B1 (ko
Inventor
최지훈
Original Assignee
엔에이치엔(주)
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 엔에이치엔(주) filed Critical 엔에이치엔(주)
Priority to KR1020060092074A priority Critical patent/KR100828560B1/ko
Publication of KR20080026899A publication Critical patent/KR20080026899A/ko
Application granted granted Critical
Publication of KR100828560B1 publication Critical patent/KR100828560B1/ko

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/332Query formulation
    • G06F16/3322Query formulation using system suggestions
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/951Indexing; Web crawling techniques

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Databases & Information Systems (AREA)
  • Data Mining & Analysis (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Mathematical Physics (AREA)
  • Computational Linguistics (AREA)

Abstract

본 발명은 검색 대상과 연관된 단어를 추천하는 방법 및 상기 방법을 수행하는 시스템에 관한 것이다. 본 발명에 따른 검색 대상과 연관된 단어를 추천하는 방법은, 검색 대상에 포함된 단어에 대한 추천 정보를 측정하는 단계, 상기 추천 정보에 기초하여 상기 단어에 대한 단어 가중치를 계산하는 단계 및 상기 단어 가중치에 기초하여 상기 단어를 상기 검색 대상에 대한 질의로서 추천하는 단계를 포함한다.
도서 검색, 단어, 단어 추천, 가중치

Description

검색 대상과 연관된 단어를 추천하는 방법 및 상기 방법을 수행하는 시스템{METHOD FOR RECOMMENDING WORDS ASSOCIATED WITH AN OBJECT OF SEARCH AND SYSTEM FOR EXECUTING THE METHOD}
도 1은 종래기술에 있어서 도서의 본문 내용을 검색하는 방법의 일례를 도시한 도면이다.
도 2는 본 발명의 일실시예에 있어서, 검색 대상과 연관된 단어를 추천하는 방법을 도시한 흐름도이다.
도 3은 본 발명의 일실시예에 있어서, 추천 정보를 측정하는 방법을 도시한 흐름도이다.
도 4는 본 발명의 일실시예에 있어서, 단어 가중치를 계산하는 방법을 도시한 흐름도이다.
도 5는 도서의 본문 내용이 포함하는 단어를 추천하는 웹 페이지의 일례이다.
도 6은 추천한 단어의 선택에 대해 제공되는 검색 결과 페이지의 일례이다.
도 7은 본 발명의 다른 실시예에 있어서, 단어 추천 시스템의 내부 구성을 설명하기 위한 블록도이다.
도 8은 본 발명의 다른 실시예에 있어서, 단어 가중치부의 내부 구성을 설명 하기 위한 블록도이다.
<도면의 주요 부분에 대한 부호의 설명>
700: 단어 추천 시스템
701: 추천 정보 측정부
702: 단어 가중치부
703: 단어 추천부
801: 제1 단어 가중치 생성부
802: 제2 단어 가중치 생성부
803: 단어 가중치 계산부
본 발명은 검색 대상과 연관된 단어를 추천하는 방법 및 상기 방법을 수행하는 시스템에 관한 것으로, 더욱 자세하게는 상기 검색 대상에 포함된 단어에 대해 상기 단어의 단어 출현 빈도, 상기 단어가 포함된 문서의 문서 길이 등을 이용하여 단어 가중치를 계산하고, 상기 단어 가중치에 기초하여 상기 검색 대상의 문서 별로 상기 단어를 추천하는 방법 및 상기 방법을 수행하는 시스템에 관한 것이다.
검색 엔진(search engine)은 인터넷상에서 자료를 쉽게 찾을 수 있게 도와주는 소프트웨어 또는 웹사이트를 말한다. 이때, 검색 엔진은 사용자의 질의에 대한 자료를 웹사이트를 통해 제공하는 역할을 수행한다.
이러한 검색 엔진을 이용한 도서 검색에 있어서, 종래기술은 원하는 도서에 대한 질의를 통해 도서 검색을 수행하여 원하는 도서를 찾고, 검색된 도서의 본문 내용을 다시 검색할 수 있는 기능을 제공한다. 도 1은 종래기술에 있어서 도서의 본문 내용을 검색하는 방법의 일례를 도시한 도면이다.
도면부호(100)는 검색된 도서의 본문 내용 내에서 다시 검색을 수행하는 웹 페이지를 나타내고 있다. 이러한 웹 페이지는 검색 필드(101)를 통해 입력된 사용자의 질의를 포함하는 본문 내용의 일부분(102)을 사용자에게 제공할 수 있다. 또한, 도서의 목차(103)에 목차(103)의 첫 페이지로의 링크를 설정하여 사용자가 본문 내용을 확인할 수 있게 하거나, 페이지 이동 버튼(104)을 이용하여 이전 페이지 또는 다음 페이지를 선택하기 위한 버튼(105)을 제공할 수 있다.
그러나 이러한 검색 엔진을 이용한 도서 검색에 있어서, 사용자들은 도서 내에 어떠한 단어가 있는지 모르기 때문에 한 권의 책을 대상으로 검색을 수행할 때, 검색에 대한 질의를 선택하는데 어려움을 겪을 수 있다. 즉, 상기 도서에 대한 정보를 얻기 위해 또는 상기 도서에서 원하는 정보를 찾기 위해 상기 도서의 본문 내용을 검색하고자 하는 경우, 어떠한 질의를 이용하여 검색을 수행해야 하는가에 대해 어려움을 느끼게 되는 문제점이 있다.
본 발명은 상기와 같은 종래기술의 문제점을 해결하기 위해, 검색 대상과 연관된 단어를 추천하는 방법 및 상기 방법을 수행하는 시스템에 관한 새로운 기술을 제안한다.
본 발명은 검색 대상 내에서 검색을 수행하는 경우, 상기 검색 대상에 포함된 단어를 사용자에게 추천함으로써 상기 검색 대상에 대한 검색을 수월하게 하는 것을 목적으로 한다.
본 발명의 다른 목적은 상기 검색 대상이 포함하는 문서 별로 상기 문서가 포함하는 단어에 대해 단어 가중치를 계산하여 상기 단어 가중치가 높은 순서로 상기 단어를 상기 사용자에게 추천하는 것이다.
본 발명의 또 다른 목적은 상기 단어의 출현 빈도, 상기 문서의 문서 길이 및 전체 문서에서 상기 단어가 출현한 문서의 수 등에 기초하여 상기 단어 가중치를 계산함으로써 상기 문서 길이에 따라 상기 출현 빈도가 높은 단어에 대해 더 높은 단어 가중치를 갖게 하는 것이다.
상기의 목적을 달성하고, 상술한 종래기술의 문제점을 해결하기 위하여, 본 발명의 일실시예에 따른 검색 대상과 연관된 단어를 추천하는 방법은, 검색 대상에 포함된 단어에 대한 추천 정보를 측정하는 단계, 상기 추천 정보에 기초하여 상기 단어에 대한 단어 가중치를 계산하는 단계 및 상기 단어 가중치에 기초하여 상기 단어를 상기 검색 대상에 대한 질의로서 추천하는 단계를 포함한다.
본 발명의 일측에 따르면, 상기 추천 정보는 (1) 상기 단어를 포함하는 문서의 문서 길이, (2) 상기 검색 대상에 해당하는 전체 문서에 대한 전체 문서 개수, (3) 상기 단어의 단어 출현 빈도, (4) 상기 단어가 출현한 문서의 개수인 단어 출현 문서 개수 또는 (5) 상기 전체 문서에 대한 문서 평균 길이를 포함할 수 있다.
본 발명의 다른 측면에 따르면, 검색 대상에 포함된 단어에 대한 추천 정보를 측정하는 상기 단계는, 상기 문서를 통해 상기 단어 출현 빈도, 상기 문서 길이 및 상기 단어 출현 문서 개수를 측정하는 단계, 상기 문서 별로 측정된 상기 문서 길이를 이용하여 전체 문서 길이를 계산하는 단계 및 상기 전체 문서 길이 및 상기 전체 문서 개수에 기초하여 상기 문서 평균 길이를 계산하는 단계를 포함할 수 있다.
본 발명의 또 다른 측면에 따르면, 상기 문서를 통해 상기 단어 출현 빈도, 상기 문서 길이 및 상기 단어 출현 문서 개수를 측정하는 상기 단계는, 상기 전체 문서 중 어느 하나의 문서에 대해 상기 문서 길이를 측정하는 제1 단계, 상기 문서에 포함된 단어 별로 상기 단어 출현 빈도를 측정하는 제2 단계, 상기 단어 별로 단어 출현 문서 개수를 갱신하는 제3 단계 및 상기 제1 단계 내지 상기 제3 단계를 상기 전체 문서에 대해 반복 수행하는 제4 단계를 포함할 수 있다.
본 발명의 다른 실시예에 있어서, 검색 대상과 연관된 단어를 추천하는 단어 추천 시스템은, 검색 대상에 포함된 단어에 대한 추천 정보를 측정하는 추천 정보 측정부, 상기 추천 정보에 기초하여 상기 단어에 대한 단어 가중치를 계산하는 단어 가중치부 및 상기 단어 가중치에 기초하여 상기 단어를 상기 검색 대상에 대한 질의로서 추천하는 단어 추천부를 포함한다.
이하 첨부된 도면을 참조하여 본 발명에 따른 다양한 실시예를 상세히 설명하기로 한다.
도 2는 본 발명의 일실시예에 있어서, 검색 대상과 연관된 단어를 추천하는 방법을 도시한 흐름도이다.
단계(S210)에서 검색 대상과 연관된 단어를 상기 검색 대상에 대한 질의로서 추천하는 단어 추천 시스템은 상기 검색 대상에 포함된 상기 단어에 대한 추천 정보를 측정한다. 이때, 상기 추천 정보는 (1) 상기 단어를 포함하는 문서의 문서 길이, (2) 상기 검색 대상에 해당하는 전체 문서에 대한 전체 문서 개수, (3) 상기 단어의 단어 출현 빈도, (4) 상기 단어가 출현한 문서의 개수인 단어 출현 문서 개수 또는 (5) 상기 전체 문서에 대한 문서 평균 길이를 포함할 수 있다.
또한, 상기 검색 대상은 복수의 문서로 이루어진 도서의 본문 내용을 포함할 수 있고, 상기 본문 내용은 상기 도서의 목차에 기초하여 상기 문서로 분류될 수 있다. 이에 더해, 상기 단어는 명사 추출기를 이용하여 상기 검색 대상에서 추출한 추출 결과를 포함할 수 있다.
이러한 상기 추천 정보를 측정하는 방법에 대해서는 도 3을 통해 더욱 자세히 설명한다.
단계(S220)에서 상기 단어 추천 시스템은 상기 추천 정보에 기초하여 상기 단어에 대한 단어 가중치를 계산한다. 즉, 상기 단어 추천 시스템은 상기 문서 길이, 상기 전체 문서 개수, 상기 단어 출현 빈도, 상기 단어 출현 문서 개수 또는 상기 문서 평균 길이를 이용하여 상기 단어 가중치를 계산할 수 있다. 이러한 추천 정보에 기초하여 상기 단어 가중치를 계산하는 단계(S220)에 대해서는 도 4를 통해 더욱 자세히 설명한다.
단계(S230)에서 상기 단어 추천 시스템은 상기 단어 가중치에 기초하여 상기 단어를 상기 검색 대상에 대한 질의로서 추천한다. 이때, 단계(S230)는 상기 검색 대상에 포함된 문서 별로 상기 문서가 포함하는 단어를 상기 단어 가중치에 기초하여 리스팅(listing)하는 단계(S231), 리스팅된 상기 단어 중에서 상기 단어 가중치가 높은 순서로 기선정된(predetermined) 개수만큼 상기 단어를 추출하는 단계(S232) 및 상기 단어 추천 시스템은 상기 문서가 검색 페이지에 노출되는 경우, 추출된 상기 단어를 상기 문서에 대한 질의로서 제공하는 단계(S233)를 포함할 수 있다.
즉, 상기 단어 추천 시스템은 상기 도서의 본문 내용에 대한 결과 내 검색을 위해 상기 본문 내용을 상기 목차를 통해 분류한 복수의 문서 각각에 대해 상기 추천 정보를 이용하여 상기 단어 별로 상기 단어 가중치를 계산하고 사용자가 선택한 상기 문서에 포함된 단어를 상기 단어 가중치에 따라 추천할 수 있다.
이와 같이 단어 추천 방법은 단계(S210) 내지 단계(S230)과 같은 과정을 통해 검색 대상 내에서 검색을 수행하는 경우, 상기 검색 대상에 포함된 단어를 사용자에게 추천함으로써 상기 검색 대상에 대한 검색을 수월하게 할 수 있다. 이러한 단어 추천 방법을 이용하여 단어를 추천하는 일례 및 추천된 단어를 통해 검색 결과를 제공하는 일례를 도 5 및 도 6를 통해 자세히 설명한다.
도 3은 본 발명의 일실시예에 있어서, 추천 정보를 측정하는 방법을 도시한 흐름도이다. 도 3에 도시된 바와 같이 단계(S310) 내지 단계(S330)는 도 2를 통해 설명한 단계(S210)에 포함되어 수행될 수 있다.
단계(S310)에서 상기 단어 추천 시스템은 상기 문서를 통해 상기 단어 출현 빈도, 상기 문서 길이 및 상기 단어 출현 문서 개수를 측정한다. 이때, 도 3에 도시된 바와 같이 단계(S310)는 단계(S311) 내지 단계(S316)을 포함할 수 있다.
단계(S311)에서 상기 단어 추천 시스템은 상기 전체 문서 중 어느 하나의 문서에 대해 상기 문서 길이를 측정한다. 이때, 상기 문서 길이는 상기 문서의 문자열에 대한 바이트 크기를 통해 측정할 수 있다. 이와 같은 문서 길이는 단계(S311) 내지 단계(S313)을 반복 수행하는 단계(S314)를 통해 반복적으로 누적되어 상기 전체 문서 길이를 측정하는데 이용될 수 있다.
단계(S312)에서 상기 단어 추천 시스템은 상기 문서에 포함된 단어 별로 상기 단어 출현 빈도를 측정한다. 즉, 상기 단어 별로 상기 문서에 포함된 횟수를 측정함으로써 상기 단어 출현 빈도를 측정할 수 있다.
단계(S313)에서 상기 단어 추천 시스템은 상기 단어 별로 단어 출현 문서 개수를 갱신한다. 이때, 상기 단어 출현 문서 개수는 상기 전체 문서에 포함된 단어 별로 상기 단어가 출현하는 문서의 개수를 포함할 수 있고, 상기 단어 별로 단어 출현 문서 개수를 갱신하는 단계(S313)는 상기 단어 별로 상기 문서의 개수를 카운팅하거나 또는 상기 단어가 출현하는 문서를 상기 단어와 연관된 문서리스트에 추가하는 단계일 수 있다.
이와 같은 단계(S311) 내지 단계(S313)는 도 2에서 설명한 명사 추출기를 이용하여 상기 문서에 포함된 상기 단어를 하나씩 추출하면서 추출된 상기 단어에 대한 상기 단어 출현 빈도를 측정할 수 있고, 상기 단어 출현 문서 개수를 갱신할 수 있다. 또한, 상기 문서 길이는 상기 문서의 생성 시 저장되어 있던 상기 문서의 문자열에 대한 바이트 크기를 확인하여 측정할 수 있다.
단계(S314)에서 상기 단어 추천 시스템은 단계(S311) 내지 단계(S313)를 상기 전체 문서에 대해 반복 수행하기 위해 상기 전체 문서에 대해 상기 문서 길이 및 상기 단어 출현 빈도를 측정하고, 상기 단어 출현 문서 개수를 갱신한다. 이때, 상기 단어 추천 시스템은 단계(S311) 내지 단계(S313)를 상기 전체 문서에 대해 수행한 후 단계(S315)를 수행한다.
단계(S315)에서 상기 단어 추천 시스템은 단계(S311) 내지 단계(S313)를 반복 수행한 횟수를 상기 전체 문서 개수로서 측정한다. 즉, 단계(S314)에서 단계(S311) 내지 단계(S313)가 반복될 때마다 반복 횟수를 측정하여 상기 전체 문서 개수를 측정할 수 있다.
단계(S316)에서 상기 단어 추천 시스템은 최종 갱신된 상기 단어 출현 문서 개수를 확인한다. 이러한 상기 단어 출현 문서 개수는 단계(S313)에서 설명된 바와 같이 상기 단어 별로 카운팅된 문서의 개수를 통해 확인하거나 또는 상기 단어와 연관된 문서리스트에 포함된 문서의 개수를 통해 확인할 수 있다.
단계(S320)에서 상기 단어 추천 시스템은 상기 문서 별로 측정된 상기 문서 길이를 이용하여 전체 문서 길이를 계산한다. 즉, 단계(S311)의 반복 수행을 통해 최종적으로 누적된 상기 문서 길이를 상기 전체 문서 길이로서 구하거나 또는 상기 문서 별로 각각 측정 및 저장된 상기 문서 길이를 합산하여 상기 전체 문서 길이를 계산할 수 있다.
단계(S330)에서 상기 단어 추천 시스템은 상기 전체 문서 길이 및 상기 전체 문서 개수에 기초하여 상기 문서 평균 길이를 계산한다. 보다 자세하게는, 상기 전체 문서 길이의 상기 전체 문서 개수에 대한 비율을 계산하여 상기 문서 평균 길이로서 측정할 수 있다.
이와 같이 단계(S310) 내지 단계(S330)를 통해 (1) 상기 단어를 포함하는 문서의 문서 길이, (2) 상기 검색 대상에 해당하는 전체 문서에 대한 전체 문서 개수, (3) 상기 단어의 단어 출현 빈도, (4) 상기 단어가 출현한 문서의 개수인 단어 출현 문서 개수 또는 (5) 상기 전체 문서에 대한 문서 평균 길이를 포함하는 상기 추천 정보를 측정할 수 있고, 이러한 상기 추천 정보를 이용하여 도 2를 통해 설명한 단어 가중치를 계산할 수 있다.
도 4는 본 발명의 일실시예에 있어서, 단어 가중치를 계산하는 방법을 도시한 흐름도이다. 도 4에 도시된 바와 같이 단계(S410) 내지 단계(S430)는 도 2에서 설명한 단계(S220)에 포함되어 수행될 수 있다.
단계(S410)에서 상기 단어 추천 시스템은 상기 문서에 대해 상기 단어 출현 빈도, 상기 문서의 문서 길이 및 전체 문서 개수에 기초하여 제1 단어 가중치를 생성한다. 이때, 상기 제1 단어 가중치를 생성하는 단계(S410)는 상기 문서 별로 상기 문서 길이의 상기 문서 평균 길이에 대한 비율을 계산하여 상기 단어 출현 빈도에 합산하는 단계(S411) 및 상기 단어 출현 빈도의 상기 합산된 단어 출현 빈도에 대한 비율을 상기 제1 단어 가중치로서 생성하는 단계(S412)를 포함할 수 있다. 이와 같은 상기 제1 단어 가중치는 다음 수학식 1과 같이 나타낼 수 있다.
Figure 112006068536435-PAT00001
단계(S420)에서 상기 단어 추천 시스템은 상기 문서에 대해 상기 단어 출현 문서 개수 및 상기 전체 문서 개수에 기초하여 제2 단어 가중치를 생성한다. 이때, 상기 단어 출현 문서 개수는 상기 전체 문서에 포함된 단어 별로 상기 단어가 출현하는 문서의 개수를 포함할 수 있고, 상기 제2 단어 가중치를 생성하는 단계(S420)는 상기 단어 출현 문서 개수의 상기 전체 문서 개수에 대한 비율을 상기 제2 단어 가중치로 생성하는 단계일 수 있다. 이와 같은 상기 제2 단어 가중치는 다음 수학식 2와 같이 나타낼 수 있다.
Figure 112006068536435-PAT00002
단계(S430)에서 상기 단어 추천 시스템은 상기 제1 단어 가중치 및 상기 제2 단어 가중치를 통해 상기 문서 별로 상기 단어 가중치를 계산한다. 이때, 상기 단어 추천 시스템은 상기 제1 단어 가중치 및 상기 제2 단어 가중치의 곱셈 연산을 통해 상기 단어 가중치를 계산할 수 있다. 즉, 상기 단어 가중치는 다음 수학식 3과 같다.
Figure 112006068536435-PAT00003
이와 같이, 상기 검색 대상이 포함하는 문서 별로 상기 문서가 포함하는 단어에 대해 단어 가중치를 계산하여 상기 단어 가중치가 높은 순서로 상기 단어를 상기 사용자에게 추천할 수 있다.
또한, 상기 단어의 출현 빈도, 상기 문서의 문서 길이 및 전체 문서에서 상기 단어가 출현한 문서의 수 등에 기초하여 상기 단어 가중치를 계산함으로써 상기 문서 길이에 따라 상기 출현 빈도가 높은 단어에 대해 더 높은 단어 가중치를 갖게 할 수 있다. 이러한 상기 단어 가중치를 정리하면 다음 수학식 4와 같이 나타낼 수 있다.
Figure 112006068536435-PAT00004
이와 같이 상기 전체 문서에 대해 각각의 문서 별로 상기 단어 가중치를 계산함으로써, 상기 문서에 포함된 단어에 대한 단어 가중치를 통해 사용자에게 상기 문서 별로 상기 단어를 추천할 수 있다.
도 5는 도서의 본문 내용이 포함하는 단어를 추천하는 웹 페이지의 일례이다.
도면부호(500)는 도서의 본문 내용을 검색 대상으로 하여 상기 본문 내용이 포함하는 단어를 추천하는 웹 페이지를 나타내고 있다. 도 2 내지 도 4를 통해 설명한 바와 같이 상기 웹 페이지는 상기 본문 내용 내 검색을 위한 검색 필드(501)를 포함할 수 있고, 사용자에게 이러한 상기 본문 내용 내 검색을 편리하게 제공하기 위해 상기 사용자에게 현재 상기 웹 페이지 상에 나타나는 문서(502)에 포함된 단어(503)를 단어 가중치를 이용하여 추출 및 제공할 수 있다.
즉, 상기 사용자는 이렇게 추천된 단어(503)들을 이용하여 문서(502)의 검색을 간편하게 수행할 수 있다. 이때, 이러한 문서(502)의 검색은 검색 필드(501)를 통해 단어(503)를 입력하거나 또는 추천된 단어(503)들 중에서 원하는 단어(504)를 선택함으로써 수행될 수 있다. 예를 들어, 상기 사용자는 단어(“수열”)(504)를 클릭함으로써, 단어(504)에 대한 검색 결과를 얻을 수 있다.
도 6은 추천한 단어의 선택에 대해 제공되는 검색 결과 페이지의 일례이다.
도면부호(600)는 도 5에서 설명한 단어(“수열”)(504)에 대한 검색 결과(601)를 사용자에게 제공하는 검색 결과 페이지를 나타내고 있다.
즉, 도서의 본문 내용을 상기 도서의 목차를 통해 복수의 문서로 분류하고, 상기 사용자에 의해 선택된 문서가 포함하는 단어를 단어 가중치를 통해 추천하여 상기 문서에서 선택된 단어(504)가 포함된 내용을 검색 결과(601)로서 제공할 수 있다. 또한, 상기 사용자는 복수의 검색 결과(601) 중에서 원하는 검색 결과(602)를 선택함으로써, 보다 편리하게 상기 본문 내용에서 원하는 검색 결과를 얻을 수 있다.
이와 같이 도 2 내지 도 6을 통해 설명한 도서 추천 방법을 통해 검색 대상 내에서 검색을 수행하는 경우, 상기 검색 대상에 포함된 단어를 사용자에게 추천함으로써 상기 검색 대상에 대한 검색을 수월하게 할 수 있고, 상기 검색 대상이 포함하는 문서 별로 상기 문서가 포함하는 단어에 대해 단어 가중치를 계산하여 상기 단어 가중치가 높은 순서로 상기 단어를 상기 사용자에게 추천할 수 있다.
또한, 상기 단어의 출현 빈도, 상기 문서의 문서 길이 및 전체 문서에서 상기 단어가 출현한 문서의 수 등에 기초하여 상기 단어 가중치를 계산함으로써 상기 문서 길이에 따라 상기 출현 빈도가 높은 단어에 대해 더 높은 단어 가중치를 갖게 할 수 있다.
도 7은 본 발명의 다른 실시예에 있어서, 단어 추천 시스템의 내부 구성을 설명하기 위한 블록도이다. 이때, 사용자에게 검색 대상에 대한 단어를 추천하는 단어 추천 시스템(700)은 추천 정보 측정부(701), 단어 가중치부(702) 및 단어 추천부(703)를 포함할 수 있다.
추천 정보 측정부(701)는 검색 대상에 포함된 단어에 대한 추천 정보를 측정한다. 이때, 상기 추천 정보는 (1) 상기 단어를 포함하는 문서의 문서 길이, (2) 상기 검색 대상에 해당하는 전체 문서에 대한 전체 문서 개수, (3) 상기 단어의 단어 출현 빈도, (4) 상기 단어가 출현한 문서의 개수인 단어 출현 문서 개수 또는 (5) 상기 전체 문서에 대한 문서 평균 길이를 포함할 수 있다.
또한, 상기 검색 대상은 복수의 문서로 이루어진 도서의 본문 내용을 포함할 수 있고, 상기 본문 내용은 상기 도서의 목차에 기초하여 상기 문서로 분류될 수 있다. 이에 더해, 상기 단어는 명사 추출기를 이용하여 상기 검색 대상에서 추출한 추출 결과를 포함할 수 있다. 즉, 추천 정보 측정부(701)는 상기 본문 내용을 상기 목차에 따라 분류한 복수의 문서 각각에 대해 상기 추천 정보를 측정할 수 있다.
이를 위해 추천 정보 측정부(701)는 상기 문서를 통해 상기 단어 출현 빈도, 상기 문서 길이 및 상기 단어 출현 문서 개수를 측정하여 상기 문서 별로 측정된 상기 문서 길이를 이용하여 전체 문서 길이를 계산한다. 또한, 상기 전체 문서 길이 및 상기 전체 문서 개수에 기초하여 상기 문서 평균 길이를 계산함으로써, 상기 추천 정보를 측정할 수 있다. 이때, 상기 단어 출현 빈도는 상기 복수의 문서를 하나씩 순차적으로 처리하면서 상기 문서에 포함된 단어 별로 측정할 수 있다.
또한, 상기 단어 출현 문서 개수는 상기 문서 별로 특정 단어에 대한 상기 문서의 개수를 카운팅하거나 또는 상기 단어가 출현하는 문서를 상기 단어와 연관된 문서리스트에 추가함으로써, 측정할 수 있다. 즉, 상기 전체 문서에 대해 위와 같은 과정을 반복 수행한 이후 상기 카운팅된 문서의 개수를 확인하거나 또는 상기 문서리스트에 포함된 상기 문서의 개수를 확인함으로써 상기 단어 출현 문서 개수를 확인할 수 있다. 이에 더해, 추천 정보 측정부(701)는 상기 반복 수행의 횟수를 측정하여 상기 전체 문서 개수로서 확인할 수 있다.
단어 가중치부(702)는 상기 추천 정보에 기초하여 상기 단어에 대한 단어 가중치를 계산한다. 즉, 추천 정보 측정부(701)에서 측정된 상기 추천 정보를 이용하여 상기 문서 별로 상기 단어 가중치를 계산하여 상기 문서에 대한 질의로서 단 어를 추천하기 위한 기준으로 이용할 수 있다. 이러한 단어 가중치를 계산하는 단어 가중치부(702)에 대해서는 도 8을 통해 더욱 자세히 설명한다.
단어 추천부(703)는 상기 단어 가중치에 기초하여 상기 단어를 상기 검색 대상에 대한 질의로서 추천한다. 이를 위해, 단어 추천부(703)는 상기 검색 대상에 포함된 문서 별로 상기 문서가 포함하는 단어를 상기 단어 가중치에 기초하여 리스팅(listing)하고, 리스팅된 상기 단어 중에서 상기 단어 가중치가 높은 순서로 기선정된 개수만큼 상기 단어를 추출하여 상기 문서가 검색 페이지에 노출되는 경우, 추출된 상기 단어를 상기 문서에 대한 질의로서 제공할 수 있다.
도 8은 본 발명의 다른 실시예에 있어서, 단어 가중치부의 내부 구성을 설명하기 위한 블록도이다. 도 8에 도시된 바와 같이 단어 가중치부(702)는 제1 단어 가중치 생성부(801), 제2 단어 가중치 생성부(802) 및 단어 가중치 계산부(803)를 포함할 수 있다.
제1 단어 가중치 생성부(801)는 상기 문서에 대해 상기 단어 출현 빈도, 상기 문서의 문서 길이 및 전체 문서 개수에 기초하여 제1 단어 가중치를 생성한다. 이와 같은 제1 단어 가중치를 생성하기 위해 제1 단어 가중치 생성부(801)는 상기 문서 별로 상기 문서 길이의 상기 문서 평균 길이에 대한 비율을 계산하여 상기 단어 출현 빈도에 합산하고, 상기 단어 출현 빈도의 상기 합산된 단어 출현 빈도에 대한 비율 계산하여 상기 제1 단어 가중치로서 생성할 수 있다.
제2 단어 가중치 생성부(802)는 상기 문서에 대해 상기 단어 출현 문서 개수 및 상기 전체 문서 개수에 기초하여 제2 단어 가중치를 생성한다. 이때, 상기 단 어 출현 문서 개수는 상기 전체 문서에 포함된 단어 별로 상기 단어가 출현하는 문서의 개수를 포함할 수 있고, 제2 단어 가중치 생성부(802)는 이러한 상기 단어 출현 문서 개수의 상기 전체 문서 개수에 대한 비율을 계산하여 상기 제2 단어 가중치로서 생성할 수 있다.
단어 가중치 계산부(803)는 이와 같이 제1 단어 가중치 생성부(801)를 통해 생성된 상기 제1 단어 가중치 및 제2 단어 가중치 생성부(802)를 통해 생성된 상기 제2 단어 가중치를 통해 상기 문서 별로 상기 단어 가중치를 계산할 수 있다. 즉, 단어 가중치 계산부(803)는 상기 제1 단어 가중치 및 상기 제2 단어 가중치의 곱셈 연산을 통해 상기 단어 가중치를 계산할 수 있다.
이와 같이 본 발명에 따른 단어 추천 시스템(700)을 통해 검색 대상 내에서 검색을 수행하는 경우, 상기 검색 대상에 포함된 단어를 사용자에게 추천함으로써 상기 검색 대상에 대한 검색을 수월하게 할 수 있고, 상기 검색 대상이 포함하는 문서 별로 상기 문서가 포함하는 단어에 대해 단어 가중치를 계산하여 상기 단어 가중치가 높은 순서로 상기 단어를 상기 사용자에게 추천할 수 있다. 또한, 상기 단어의 출현 빈도, 상기 문서의 문서 길이 및 전체 문서에서 상기 단어가 출현한 문서의 수 등에 기초하여 상기 단어 가중치를 계산함으로써 상기 문서 길이에 따라 상기 출현 빈도가 높은 단어에 대해 더 높은 단어 가중치를 갖게 할 수 있다.
본 발명에 따른 실시예들은 다양한 컴퓨터 수단을 통하여 수행될 수 있는 프로그램 명령 형태로 구현되어 컴퓨터 판독 가능 매체에 기록될 수 있다. 상기 컴퓨터 판독 가능 매체는 프로그램 명령, 데이터 파일, 데이터 구조 등을 단독으로 또는 조합하여 포함할 수 있다. 상기 매체에 기록되는 프로그램 명령은 본 발명을 위하여 특별히 설계되고 구성된 것들이거나 컴퓨터 소프트웨어 당업자에게 공지되어 사용 가능한 것일 수도 있다. 컴퓨터 판독 가능 기록 매체의 예에는 하드 디스크, 플로피 디스크 및 자기 테이프와 같은 자기 매체(magnetic media), CD-ROM, DVD와 같은 광기록 매체(optical media), 플롭티컬 디스크(Floptical disk)와 같은 자기-광 매체(magneto-optical media), 및 롬(ROM), 램(RAM), 플래시 메모리 등과 같은 프로그램 명령을 저장하고 수행하도록 특별히 구성된 하드웨어 장치가 포함된다. 프로그램 명령의 예에는 컴파일러에 의해 만들어지는 것과 같은 기계어 코드뿐만 아니라 인터프리터 등을 사용해서 컴퓨터에 의해서 실행될 수 있는 고급 언어 코드를 포함한다. 상기된 하드웨어 장치는 본 발명의 동작을 수행하기 위해 하나 이상의 소프트웨어 모듈로서 작동하도록 구성될 수 있으며, 그 역도 마찬가지이다.
이상과 같이 본 발명에서는 구체적인 구성 요소 등과 같은 특정 사항들과 한정된 실시예 및 도면에 의해 설명되었으나 이는 본 발명의 보다 전반적인 이해를 돕기 위해서 제공된 것일 뿐, 본 발명은 상기의 실시예에 한정되는 것은 아니며, 본 발명이 속하는 분야에서 통상적인 지식을 가진 자라면 이러한 기재로부터 다양한 수정 및 변형이 가능하다.
따라서, 본 발명의 사상은 설명된 실시예에 국한되어 정해져서는 아니되며, 후술하는 특허청구범위뿐 아니라 이 특허청구범위와 균등하거나 등가적 변형이 있는 모든 것들은 본 발명 사상의 범주에 속한다고 할 것이다.
본 발명에 따르면, 검색 대상 내에서 검색을 수행하는 경우, 상기 검색 대상에 포함된 단어를 사용자에게 추천함으로써 상기 검색 대상에 대한 검색을 수월하게 할 수 있다.
본 발명에 따르면, 상기 검색 대상이 포함하는 문서 별로 상기 문서가 포함하는 단어에 대해 단어 가중치를 계산하여 상기 단어 가중치가 높은 순서로 상기 단어를 상기 사용자에게 추천할 수 있다.
본 발명에 따르면, 상기 단어의 출현 빈도, 상기 문서의 문서 길이 및 전체 문서에서 상기 단어가 출현한 문서의 수 등에 기초하여 상기 단어 가중치를 계산함으로써 상기 문서 길이에 따라 상기 출현 빈도가 높은 단어에 대해 더 높은 단어 가중치를 갖게 할 수 있다.

Claims (20)

  1. 검색 대상과 연관된 단어를 추천하는 방법에 있어서,
    검색 대상에 포함된 단어에 대한 추천 정보를 측정하는 단계;
    상기 추천 정보에 기초하여 상기 단어에 대한 단어 가중치를 계산하는 단계; 및
    상기 단어 가중치에 기초하여 상기 단어를 상기 검색 대상에 대한 질의로서 추천하는 단계
    를 포함하는 것을 특징으로 하는 단어 추천 방법.
  2. 제1항에 있어서,
    상기 추천 정보는 (1) 상기 단어를 포함하는 문서의 문서 길이, (2) 상기 검색 대상에 해당하는 전체 문서에 대한 전체 문서 개수, (3) 상기 단어의 단어 출현 빈도, (4) 상기 단어가 출현한 문서의 개수인 단어 출현 문서 개수 또는 (5) 상기 전체 문서에 대한 문서 평균 길이를 포함하는 것을 특징으로 하는 단어 추천 방법.
  3. 제2항에 있어서,
    검색 대상에 포함된 단어에 대한 추천 정보를 측정하는 상기 단계는,
    상기 문서를 통해 상기 단어 출현 빈도, 상기 문서 길이 및 상기 단어 출현 문서 개수를 측정하는 단계;
    상기 문서 별로 측정된 상기 문서 길이를 이용하여 전체 문서 길이를 계산하는 단계; 및
    상기 전체 문서 길이 및 상기 전체 문서 개수에 기초하여 상기 문서 평균 길이를 계산하는 단계
    를 포함하는 것을 특징으로 하는 단어 추천 방법.
  4. 제3항에 있어서,
    상기 문서를 통해 상기 단어 출현 빈도, 상기 문서 길이 및 상기 단어 출현 문서 개수를 측정하는 상기 단계는,
    상기 전체 문서 중 어느 하나의 문서에 대해 상기 문서 길이를 측정하는 제1 단계;
    상기 문서에 포함된 단어 별로 상기 단어 출현 빈도를 측정하는 제2 단계;
    상기 단어 별로 단어 출현 문서 개수를 갱신하는 제3 단계; 및
    상기 제1 단계 내지 상기 제3 단계를 상기 전체 문서에 대해 반복 수행하는 제4 단계
    를 포함하는 것을 특징으로 하는 단어 추천 방법.
  5. 제4항에 있어서,
    상기 단어 출현 문서 개수는 상기 전체 문서에 포함된 단어 별로 상기 단어가 출현하는 문서의 개수를 포함하고,
    상기 제3 단계는,
    상기 단어 별로 상기 문서의 개수를 카운팅하거나 또는 상기 단어가 출현하는 문서를 상기 단어와 연관된 문서리스트에 추가하는 단계인 것을 특징으로 하는 단어 추천 방법.
  6. 제4항에 있어서,
    상기 문서를 통해 상기 단어 출현 빈도, 상기 문서 길이 및 상기 단어 출현 문서 개수를 측정하는 상기 단계는,
    상기 제1 단계 내지 상기 제3 단계를 반복 수행한 횟수를 상기 전체 문서 개수로서 측정하는 제5 단계
    를 더 포함하는 것을 특징으로 하는 단어 추천 방법.
  7. 제4항에 있어서,
    상기 문서를 통해 상기 단어 출현 빈도, 상기 문서 길이 및 상기 단어 출현 문서 개수를 측정하는 상기 단계는,
    최종 갱신된 상기 단어 출현 문서 개수를 확인하는 제5 단계
    를 더 포함하는 것을 특징으로 하는 단어 추천 방법.
  8. 제2항에 있어서,
    상기 추천 정보에 기초하여 상기 단어에 대한 단어 가중치를 계산하는 상기 단계는,
    상기 문서에 대해 상기 단어 출현 빈도, 상기 문서의 문서 길이 및 전체 문서 개수에 기초하여 제1 단어 가중치를 생성하는 단계;
    상기 문서에 대해 상기 단어 출현 문서 개수 및 상기 전체 문서 개수에 기초하여 제2 단어 가중치를 생성하는 단계; 및
    상기 제1 단어 가중치 및 상기 제2 단어 가중치를 통해 상기 문서 별로 상기 단어 가중치를 계산하는 단계
    를 포함하는 것을 특징으로 하는 단어 추천 방법.
  9. 제8항에 있어서,
    상기 단어 출현 빈도, 상기 문서의 문서 길이 및 전체 문서 개수에 기초하여 제1 단어 가중치를 생성하는 상기 단계는,
    상기 문서 별로 상기 문서 길이의 상기 문서 평균 길이에 대한 비율을 계산하여 상기 단어 출현 빈도에 합산하는 단계; 및
    상기 단어 출현 빈도의 상기 합산된 단어 출현 빈도에 대한 비율을 상기 제1 단어 가중치로서 생성하는 단계
    를 포함하는 것을 특징으로 하는 단어 추천 방법.
  10. 제8항에 있어서,
    상기 단어 출현 문서 개수는 상기 전체 문서에 포함된 단어 별로 상기 단어 가 출현하는 문서의 개수를 포함하고,
    상기 단어 출현 문서 개수 및 상기 전체 문서 개수에 기초하여 제2 단어 가중치를 생성하는 상기 단계는,
    상기 단어 출현 문서 개수의 상기 전체 문서 개수에 대한 비율을 상기 제2 단어 가중치로 생성하는 단계인 것을 특징으로 하는 단어 추천 방법.
  11. 제8항에 있어서,
    상기 제1 단어 가중치 및 상기 제2 단어 가중치를 통해 상기 문서 별로 상기 단어 가중치를 계산하는 상기 단계는,
    상기 제1 단어 가중치 및 상기 제2 단어 가중치의 곱셈 연산을 통해 상기 단어 가중치를 계산하는 단계인 것을 특징으로 하는 단어 추천 방법.
  12. 제1항에 있어서,
    상기 단어 가중치에 기초하여 상기 단어를 상기 검색 대상에 대한 질의로서 추천하는 상기 단계는,
    상기 검색 대상에 포함된 문서 별로 상기 문서가 포함하는 단어를 상기 단어 가중치에 기초하여 리스팅(listing)하는 단계;
    리스팅된 상기 단어 중에서 상기 단어 가중치가 높은 순서로 기선정된(predetermined) 개수만큼 상기 단어를 추출하는 단계; 및
    상기 문서가 검색 페이지에 노출되는 경우, 추출된 상기 단어를 상기 문서에 대한 질의로서 제공하는 단계
    를 포함하는 것을 특징으로 하는 단어 추천 방법.
  13. 제1항에 있어서,
    상기 검색 대상은 복수의 문서로 이루어진 도서의 본문 내용을 포함하고,
    상기 본문 내용은 상기 도서의 목차에 기초하여 상기 문서로 분류되는 것을 특징으로 하는 단어 추천 방법.
  14. 제1항에 있어서,
    상기 단어는 명사 추출기를 이용하여 상기 검색 대상에서 추출한 추출 결과를 포함하는 것을 특징으로 하는 단어 추천 방법.
  15. 제1항 내지 제14항 중 어느 한 항의 방법을 실행하기 위한 프로그램이 기록되어 있는 것을 특징으로 하는 컴퓨터에서 판독 가능한 기록 매체.
  16. 검색 대상과 연관된 단어를 추천하는 단어 추천 시스템에 있어서,
    검색 대상에 포함된 단어에 대한 추천 정보를 측정하는 추천 정보 측정부;
    상기 추천 정보에 기초하여 상기 단어에 대한 단어 가중치를 계산하는 단어 가중치부; 및
    상기 단어 가중치에 기초하여 상기 단어를 상기 검색 대상에 대한 질의로서 추천하는 단어 추천부
    를 포함하는 것을 특징으로 하는 단어 추천 시스템.
  17. 제16항에 있어서,
    상기 추천 정보는 (1) 상기 단어를 포함하는 문서의 문서 길이, (2) 상기 검색 대상에 해당하는 전체 문서에 대한 전체 문서 개수, (3) 상기 단어의 단어 출현 빈도, (4) 상기 단어가 출현한 문서의 개수인 단어 출현 문서 개수 또는 (5) 상기 전체 문서에 대한 문서 평균 길이를 포함하는 것을 특징으로 하는 단어 추천 시스템.
  18. 제17항에 있어서,
    상기 추천 정보 측정부는,
    상기 문서를 통해 상기 단어 출현 빈도, 상기 문서 길이 및 상기 단어 출현 문서 개수를 측정하는 측정부;
    상기 문서 별로 측정된 상기 문서 길이를 이용하여 전체 문서 길이를 계산하는 전체 문서 길이 계산부; 및
    상기 전체 문서 길이 및 상기 전체 문서 개수에 기초하여 상기 문서 평균 길이를 계산하는 문서 평균 길이 계산부
    를 포함하는 것을 특징으로 하는 단어 추천 시스템.
  19. 제17항에 있어서,
    상기 단어 가중치부는,
    상기 문서에 대해 상기 단어 출현 빈도, 상기 문서의 문서 길이 및 전체 문서 개수에 기초하여 제1 단어 가중치를 생성하는 제1 단어 가중치 생성부;
    상기 문서에 대해 상기 단어 출현 문서 개수 및 상기 전체 문서 개수에 기초하여 제2 단어 가중치를 생성하는 제2 단어 가중치 생성부; 및
    상기 제1 단어 가중치 및 상기 제2 단어 가중치를 통해 상기 문서 별로 상기 단어 가중치를 계산하는 단어 가중치 계산부
    를 포함하는 것을 특징으로 하는 단어 추천 시스템.
  20. 제16항에 있어서,
    상기 단어 추천부는,
    상기 검색 대상에 포함된 문서 별로 상기 문서가 포함하는 단어를 상기 단어 가중치에 기초하여 리스팅(listing)하는 리스팅부;
    리스팅된 상기 단어 중에서 상기 단어 가중치가 높은 순서로 기선정된 개수만큼 상기 단어를 추출하는 단어 추출부; 및
    상기 문서가 검색 페이지에 노출되는 경우, 추출된 상기 단어를 상기 문서에 대한 질의로서 제공하는 질의 제공부
    를 포함하는 것을 특징으로 하는 단어 추천 시스템.
KR1020060092074A 2006-09-22 2006-09-22 검색 대상과 연관된 단어를 추천하는 방법 및 상기 방법을수행하는 시스템 KR100828560B1 (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020060092074A KR100828560B1 (ko) 2006-09-22 2006-09-22 검색 대상과 연관된 단어를 추천하는 방법 및 상기 방법을수행하는 시스템

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020060092074A KR100828560B1 (ko) 2006-09-22 2006-09-22 검색 대상과 연관된 단어를 추천하는 방법 및 상기 방법을수행하는 시스템

Publications (2)

Publication Number Publication Date
KR20080026899A true KR20080026899A (ko) 2008-03-26
KR100828560B1 KR100828560B1 (ko) 2008-05-13

Family

ID=39414104

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020060092074A KR100828560B1 (ko) 2006-09-22 2006-09-22 검색 대상과 연관된 단어를 추천하는 방법 및 상기 방법을수행하는 시스템

Country Status (1)

Country Link
KR (1) KR100828560B1 (ko)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101416256B1 (ko) * 2013-02-01 2014-07-09 주식회사 베니페 웹 문서의 인기도를 고려하여 추천 단어를 제공하기 위한 시스템 및 그 방법
WO2016204391A1 (ko) * 2015-06-15 2016-12-22 네이버 주식회사 검색 서비스 제공 장치, 방법, 및 컴퓨터 프로그램

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101287158B1 (ko) 2013-04-24 2013-07-23 조문환 구매요청도서 마크 데이터 구축방법
KR101589705B1 (ko) * 2013-07-10 2016-01-29 조문환 구매요청도서 마크 데이터 구축방법

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001188678A (ja) 2000-01-05 2001-07-10 Mitsubishi Electric Corp 言語事例推論装置,言語事例推論方法及び言語事例推論プログラムが記述された記憶媒体
KR100393176B1 (ko) * 2000-05-29 2003-07-31 주식회사 엔아이비소프트 문서 자동 요약에 의한 인터넷 정보 검색 시스템 및 방법
KR100498574B1 (ko) * 2001-03-08 2005-07-01 주식회사 다이퀘스트 단락 단위의 실시간 응답 색인을 이용한 자연어 질의-응답검색시스템
KR20030006201A (ko) * 2001-07-12 2003-01-23 서정연 홈페이지 자동 검색을 위한 통합형 자연어 질의-응답시스템
KR100487740B1 (ko) * 2003-05-13 2005-05-06 엔에이치엔(주) 질문 답변 서비스 방법
US7689585B2 (en) 2004-04-15 2010-03-30 Microsoft Corporation Reinforced clustering of multi-type data objects for search term suggestion

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101416256B1 (ko) * 2013-02-01 2014-07-09 주식회사 베니페 웹 문서의 인기도를 고려하여 추천 단어를 제공하기 위한 시스템 및 그 방법
WO2016204391A1 (ko) * 2015-06-15 2016-12-22 네이버 주식회사 검색 서비스 제공 장치, 방법, 및 컴퓨터 프로그램

Also Published As

Publication number Publication date
KR100828560B1 (ko) 2008-05-13

Similar Documents

Publication Publication Date Title
US10824682B2 (en) Enhanced online user-interaction tracking and document rendition
CN106649818B (zh) 应用搜索意图的识别方法、装置、应用搜索方法和服务器
CN103026356B (zh) 语义内容搜索
TWI443529B (zh) 自動化領域名詞建置方法及系統,及其電腦程式產品
CN110852793A (zh) 文案推荐方法及装置、电子设备
JP2015062117A (ja) 実体のリンク付け方法及び実体のリンク付け装置
CN108090104B (zh) 用于获取网页信息的方法和装置
US8515986B2 (en) Query pattern generation for answers coverage expansion
KR20080066496A (ko) 검색 결과를 제공하는 방법 및 상기 방법을 수행하는시스템
JP2013522720A (ja) 単語情報エントロピの決定
KR101562279B1 (ko) 사용자 의도 추론에 기반한 휴대용 단말 장치 및 이를 이용한 컨텐츠 추천 방법
CN103559313B (zh) 搜索方法及装置
CN105897847A (zh) 一种信息推送方法及信息推送装置
KR100828560B1 (ko) 검색 대상과 연관된 단어를 추천하는 방법 및 상기 방법을수행하는 시스템
CN107943873A (zh) 知识图谱建立方法、装置、计算机设备及存储介质
JP5551025B2 (ja) 特許検索式生成装置、特許検索式生成方法、およびプログラム
JP5629976B2 (ja) 特許明細書評価・作成作業支援装置、方法及びプログラム
CN110069769A (zh) 应用标签生成方法、装置及存储设备
JP5919444B2 (ja) 情報処理装置、情報処理方法、及び情報処理プログラム
JP2020098596A (ja) ウェブページから情報を抽出する方法、装置及び記憶媒体
KR101542417B1 (ko) 사용자 선호도 학습 방법 및 장치
KR100867081B1 (ko) 도서 검색에 이용되는 문서 스코어를 생성하는 방법 및상기 방법을 수행하는 시스템
CN109033241A (zh) 新闻推荐方法、装置及电子设备
JP6748474B2 (ja) 意思決定支援システムおよび意思決定支援方法
Mrosek et al. Content-and Graph-based Tag Recommendation: Two Variations.

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20110414

Year of fee payment: 5

FPAY Annual fee payment

Payment date: 20130329

Year of fee payment: 6

FPAY Annual fee payment

Payment date: 20160329

Year of fee payment: 9

FPAY Annual fee payment

Payment date: 20170328

Year of fee payment: 10

FPAY Annual fee payment

Payment date: 20190401

Year of fee payment: 12