KR101098832B1 - 개인화 검색 장치 및 방법 - Google Patents

개인화 검색 장치 및 방법 Download PDF

Info

Publication number
KR101098832B1
KR101098832B1 KR1020080125049A KR20080125049A KR101098832B1 KR 101098832 B1 KR101098832 B1 KR 101098832B1 KR 1020080125049 A KR1020080125049 A KR 1020080125049A KR 20080125049 A KR20080125049 A KR 20080125049A KR 101098832 B1 KR101098832 B1 KR 101098832B1
Authority
KR
South Korea
Prior art keywords
user
search
file
personalized
directory
Prior art date
Application number
KR1020080125049A
Other languages
English (en)
Other versions
KR20100066651A (ko
Inventor
윤여찬
김현기
장명길
허정
황이규
이충희
임수종
오효정
이창기
최미란
Original Assignee
한국전자통신연구원
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 한국전자통신연구원 filed Critical 한국전자통신연구원
Priority to KR1020080125049A priority Critical patent/KR101098832B1/ko
Priority to US12/628,171 priority patent/US20100145922A1/en
Publication of KR20100066651A publication Critical patent/KR20100066651A/ko
Application granted granted Critical
Publication of KR101098832B1 publication Critical patent/KR101098832B1/ko

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9535Search customisation based on user profiles and personalisation

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

본 발명에 따른 개인화 검색 장치는, 사용자 단말에 저장된 디렉터리에 대한 디렉터리 분류 정보를 이용하여 사용자 관심 분야를 분석하여 관심 분야 분석 모델을 생성하고, 사용자로부터 질의가 입력됨에 따라 정보 검색 엔진을 이용하여 입력된 질의와 관련된 파일을 사용자 단말에서 검색한 후 이에 따른 검색 결과를 생성한 후 생성된 검색 결과를 관심 분야 분석 모델을 토대로 재순위화하여 개인화 검색 결과를 생성한다.
이와 같이, 본 발명은 사용자가 직접 저장, 분류한 디렉터리 정보 및 사용자의 행위 정보를 토대로 관심 분야 분석 모델을 생성하고, 이를 토대로 일반적인 검색 엔진에서 제공되는 검색 결과를 재순위화함으로써, 정보 검색 및 미디어 검색의 성능을 향상시킬 수 있을 뿐만 아니라 사용자의 의도를 명확하게 파악한 검색 결과를 제시할 수 있다
개인화, 검색, 관심 분야, 디렉터리

Description

개인화 검색 장치 및 방법{APPARATUS AND METHOD FOR A PERSONALIZED SEARCH}
본 발명은 사용자 질의에 따른 검색 방법에 관한 것으로, 더욱 상세하게는 사용자의 단말 내 디렉터리 분류 정보를 이용하여 사용자의 관심 분야를 분석한 후 이를 토대로 개인화 검색을 수행하는 개인화 검색 장치 및 방법에 관한 것이다.
본 발명은 지식경제부 및 정보통신연구진흥원의 IT신성장동력핵심기술개발사업의 일환으로 수행한 연구로부터 도출된 것이다[과제관리번호:2008-S-020-01, 과제명: 웹 QA 기술개발].
정보검색 시스템은 대용량의 문서, 미디어 등을 대상으로 원하는 정보가 담겨 있는 데이터를 쉽고 빠르게 검색할 수 있는 시스템을 말한다. 정보검색의 대상이 되는 문서는 일반적으로 웹 문서나, 기업 등에서 사용하는 대용량 문서이다.
데스크톱 미디어 검색 시스템은 정보검색 시스템이 대용량의 웹이나 기업 데이터망을 대상으로 검색을 수행하는 것과 달리, 개인의 데스크톱에 저장된 텍스트, 이미지, 오디오, 비디오 등의 데이터를 검색하여 원하는 데이터를 검색할 수 있는 검색 시스템을 말한다. 이러한 정보 검색, 데스크톱 미디어 검색 시스템은 사용자의 질의를 입력으로 받아 사용자가 원하는 정보를 담고 있는 데이터를 순위화 하여 보여 주는데, 사용자의 만족도를 높이기 위해선 실제 사용자가 찾는 정보와 관련성이 높은 데이터를 높은 순위로 보여주는 것이 중요하다.
정보검색 및 데스크톱 미디어 검색은 일반적으로 사용자의 질의를 입력으로 받아 질의와 유사성이 가장 높은 데이터를 찾아 주는 방법으로 사용자의 정보 검색 욕구를 만족 시킨다. 사용자의 질의는 보통 사용자의 정보 욕구를 대표 할 수 있는 1∼5개 사이의 단어로 구성된다. 하지만 적은 수의 단어를 사용하여 사용자의 정보욕구를 완벽하게 표현하기에는 무리가 있고, 따라서 사용자가 만족스러운 결과를 얻기에 어려움이 있다. 개인화 검색은 이 같은 점을 보완하고자, 사용자의 관심 분야를 미리 분석하여 검색결과로서 자동으로 관심분야의 데이터가 상위 순위에 오게 하고, 비 관심분야의 데이터를 하위 순위로 내림으로써 사용자의 검색 만족도를 높이게 하는 방법이다
개인화 검색을 위한 기존의 방법에서는 사용자의 관심 분야를 분석하기 위하여 사용자의 이전의 웹 이용 행태를 분석하였다. 사용자가 이전 검색 단계에서 도출한 검색 결과 중, 사용자가 클릭하여 접근을 시도한 데이터, 즉 검색 히스토리를 분석함으로써 사용자가 어떤 분야의 데이터에 관심을 가졌는지를 파악하였다. 또한 사용자의 관심 분야가 무엇인지 구체적으로 파악하고 검색 결과에 반영하기 위하여, 사전에 다수의 사용자의 관점에서 데이터 분류 체계를 구축해 놓았다.
기존 방법의 문제점은 크게 두 가지로 기술할 수 있다.
첫째, 사용자의 관심분야를 다수의 관점에서 구축한 분류체계를 이용하여 분류한 점이다. 이러한 관심분야 분류는 개개의 사용자의 관점에 맞춘 것이 아니기 때문에, 사용자가 원하는 구체적인 수준의 관심 분야 분석 및 이를 통한 개인화 검색을 수행하지 못한다. 가령 기존 시스템에서 사전에 구축한 분류 체계가 데이터를 게임, 경제, 정치로 분류 한다고 할 때, 특정 사용자는 이보다 더 구체적인 수준, 예를 들어 비디오 게임, 온라인 게임, 비게임으로 데이터를 분류하고, 실제 검색 시에 비디오 게임 문서가 검색 순위의 상위에 오르기를 바랄 수 있다. 하지만 기존 방법에서는 사용자의 관심분야를 단순히 게임으로 한정시키고 검색 결과 중, 게임에 관련된 모든 문서를 상위 순위화한다. 이와 같이 기존 시스템은 개개인의 선호에 따라 차별적인 관심 분야 분석을 하지 않는다.
둘째, 검색 히스토리를 이용한 방법에서는 사용자가 클릭, 접근한 정보를 사용자가 관심 있어 하는 정보로 가정하고 활용하여 사용자가 어떤 주제에 관심을 보이는 지를 분석한다.
종래 사용자의 관심 분야를 다수의 관점에서 구축한 분류체계를 이용한 검색 방법은 사용자의 관심 분야를 단순히 게임에 한정시키고, 검색 결과 중 게임에 관련된 모든 문서를 상위 순위화하기 때문에 개개인의 선호에 따라 차별적인 관심 분 야 분석을 하지 못하는 문제점이 있다.
종래의 검색 히스토리를 이용한 방법에서는 사용자가 잘 알지 못하는 미지의 데이터에 대하여 어떤 내용인지 확인하기 위하여 접근하는 경우를 포함하기에 실제 사용자가 관심 없어 하는 데이터가 관심 분야로 반영 될 수 있는 단점이 있다.
본 발명은 사용자 단말에 사용자가 직접 저장, 분류한 데이터를 이용하여 사용자의 관심 분야를 사용자의 관점에서 파악 및 분류하여 검색의 만족도를 향상시킨다.
본 발명에 따른 개인화 검색 장치는, 사용자 단말에 저장된 디렉터리에 대한 디렉터리 분류 정보를 이용하여 사용자 관심 분야를 분석하고, 상기 분석된 사용자 관심 분야를 토대로 관심 분야 분석 모델을 생성하는 모델 생성부와, 상기 사용자 단말에 설치된 정보 검색 엔진을 이용하여 입력된 질의와 관련된 파일을 상기 사용자 단말에서 검색한 후 이에 따른 검색 결과를 생성하는 검색 엔진부와, 상기 검색 엔진부에서 생성된 상기 검색 결과를 상기 관심 분야 분석 모델을 토대로 재순위화하여 개인화 검색 결과를 생성한 후 이를 출력하는 개인화 검색 엔진부를 포함한다.
또한, 본 발명에 따른 개인화 검색 방법은, 사용자 단말에 저장된 디렉터리에 대한 디렉터리 분류 정보를 이용하여 사용자 관심 분야를 분석하고, 상기 분석된 사용자 관심 분야를 이용하여 관심 분야 분석 모델을 생성하는 단계와, 상기 사 용자 단말로 입력되는 질의와 관련된 파일을 상기 사용자 단말에서 검색하여 검색 결과를 출력하는 단계와, 상기 관심 분야 분석 모델을 토대로 상기 검색 결과를 재순위화하여 개인화 검색 결과를 생성하는 단계를 포함한다.
본 발명은 사용자가 직접 저장, 분류한 디렉터리 정보 및 사용자의 행위 정보를 토대로 관심 분야 분석 모델을 생성하고, 이를 토대로 일반적인 검색 엔진에서 제공되는 검색 결과를 재순위화함으로써, 정보 검색 및 미디어 검색의 성능을 향상시킬 수 있을 뿐만 아니라 사용자의 의도를 명확하게 파악한 검색 결과를 제시할 수 있다.
이하, 본 발명의 바람직한 실시예를 첨부된 도면들을 참조하여 상세히 설명한다. 아울러 본 발명을 설명함에 있어, 관련된 공지 구성 또는 기능에 대한 구체적인 설명이 본 발명의 요지를 흐릴 수 있다고 판단되는 경우에는 그 상세한 설명을 생략한다.
도 1은 본 발명의 바람직한 실시 예에 따른 개인화 검색 장치를 도시한 블록도로서, 모델 생성부(100), 검색 엔진부(110) 및 개인화 검색 엔진부(120)를 포함한다.
모델 생성부(100)는 사용자 단말, 예컨대 데스크톱에 저장된 디렉터리에 대 한 정보, 즉 디렉터리 분류 정보와 사용자 행위 정보를 수집하여 이를 토대로 관심 분야 분석 모델(130)을 생성하고, 생성된 관심 분야 분석 모델(130)을 저장매체, 예컨대 메모리, 사용자 단말 내의 하드디스크에 저장하는 수단으로서, 이를 위해 관심 분야 추출부(102), 가중치 계산부(104)로 구성된다.
관심 분야 추출부(102)는 사용자 단말에 저장된 디렉터리들을 이용하여 디렉 분류 정보를 추출하는데, 여기서, 디렉터리 분류 정보는, 도 2에 도시된 바와 같이, 사용자 단말에서 사용자가 직접 분류, 저장한 디렉터리와 디렉터리에 속한 파일들의 정보를 의미한다. 즉, 관심 분야 추출부(102)는 사용자가 직접 분류한 디렉터리의 정보를 파악하여 사용자가 어떤 주제에 대한 관심을 가지고 데이터를 수집하였는지를 파악함으로써, 사용자의 관심 분야를 추출할 수 있다.
한편, 관심 분야 추출부(102)는 디렉터리에 속한 파일들을 색인하여 사용자 관심 분야를 얻을 수 있는데, 여기서 색인이란 각 문서에 나타난 대표적인 키워드를 추출하는 과정을 의미하며, 본 발명에서는 대표적인 키워드를 뽑기 위해서 파일의 제목 및 파일의 본문 내용, 파일이 포함된 디렉터리 이름 등을 활용한다.
또한, 본 발명에서는 MP3, AVI 등과 같은 멀티미디어 파일에 대한 도 3에 도시된 바와 같이, 노래 제목, 가수명 등의 미디어에 대한 부가 정보를 담고 있는 메타 데이터 파일 정보를 색인을 위해 이용한다. 모델 생성부(100)의 관심 분야 추출부(102)는 이러한 색인 과정을 통해 얻어진 사용자의 관심 분야를 대표 키워드로 하여 개인화 검색 엔진부(120)에 제공한다.
모델 생성부(100)는 각 사용자 관심 분야에 대한 가중치 부여를 위해 사용자 단말에 저장된 각 파일과 디렉터리에 대한 가중치를 계산하는데, 가중치 계산은 가중치 계산부(104)를 이용하여 사용자 행위 정보를 토대로 얻을 수 있다. 여기서, 사용자 행위 정보는 사용자의 파일 접근 횟수, 파일을 접근한 시간(문서라면 해당 문서를 열어 둔 채 작업을 한 시간)으로 구성된다. 즉, 모델 생성부(100)의 가중치 계산부(104)는 사용자 행위 정보를 이용하여 각 파일의 가중치를 아래의 수학식1을 이용하여 계산한다.
Figure 112008084918912-pat00001
또한, 모델 생성부(100)의 가중치 계산부(104)는 상기의 수학식1에서 산출된 각 파일의 가중치를 이용하여 해당 파일이 속한 디렉터리의 가중치를 아래의 수학식2를 이용하여 계산한다.
Figure 112008084918912-pat00002
위의 수학식2에 대해 설명하면, 가중치 계산부(104)는 임의의 디렉터리에 속한 각 파일(문서)에 대한 가중치 합을 파일 수(문서 수)로 나눔으로써, 디렉터리 가중치를 산출한다.
모델 생성부(100)는 관심 분야 추출부(102)에서 추출된 사용자 관심 분야와 가중치 계산부(104)에서 계산된 파일의 가중치 및 디렉터리의 가중치를 이용하여 관심 분야 분석 모델(130)을 생성한다.
검색 엔진부(110)는 사용자 단말에 설치된 정보 검색 엔진, 예컨대 벡터 스페이스 모델(Vector Space Model), "Okapi 모델" 등을 이용하여 입력된 질의에 관련된 파일(문서)을 검색하는데, 즉 사용, 질의에 출현한 단어와 검색 대상 문서와의 유사도를 계산하며, 계산된 유사도에 따라 문서를 순위화한 검색 결과를 출력한다.
개인화 검색 엔진부(120)는 검색 엔진부(110)에서 생성된 검색 결과를 모델 생성부(100)에서 생성된 관심 분야 분석 모델(130)을 토대로 재순위화하여 개인화 검색 결과를 생성한 후 이를 출력한다.
즉, 개인화 검색 엔진부(120)는 관심 분야 분석 모델(130)의 사용자 관심 분야를 대표 키워드로써 표현하여 검색 결과를 반영하는데, 즉 유사도만을 계산한 검색 결과를 사용자 관심 분야인 대표 키워드를 이용하여 재순위화한다. 즉, 사용자 관심 분야에 대한 관심도에 따라 가중치를 달리 두고, 검색 결과 내 데이터 중 가중치가 높은 관심 분야에 속한 데이터를 상위에 순위화되도록 한다. 이때, 관심 분야 분석 모델(130) 내의 가중치 정보를 이용하여 검색 결과 내 각 데이터에 대한 가중치를 추출하고, 추출된 가중치를 이용하여 가중치가 높은 디렉터리 또는 파일의 상위 순위화되도록 한다.
즉, 개인화 검색 엔진부(130)는 사용자 관심 분야 분석 모델(130)을 토대로 검색 엔진부(110)의 검색 결과와 사용자 관심 분야와의 유사도인 개인화 랭킹 스코어를 아래의 수학식3을 이용하여 계산하며, 높은 개인화 랭킹 스코어를 가진 검색 결과를 상위 순위화하여 개인화 검색 결과를 출력한다.
Figure 112008084918912-pat00003
본 발명의 바람직한 실시 예에 따르면, 사용자 단말에 저장, 분류한 디렉터리 정보를 이용하여 개인화 검색을 수행함으로써, 사용자의 의도를 명확하게 파악한 검색 결과를 도출할 수 있다.
본 발명의 바람직한 실시 예에 따른 개인화 검색 장치가 개인화 검색 결과를 생성하여 출력하는 과정에 대해 도 4를 참조하여 설명한다.
도 4는 본 발명의 바람직한 실시 예에 따른 개인화 검색 과정을 도시한 흐름도이다.
도 4를 참조하면, 먼저 모델 생성부(100)는 관심 분야 추출부(102) 및 가중치 계산부(104)를 이용하여 사용자 관심 분야 및 사용자 관심 분야별로 가중치를 부여함으로써, 관심 분야 분석 모델(130)을 생성한다(S400).
S400에 대해 설명하면, 먼저 모델 생성부(100)는 사용자가 직접 분류 및 저 장한 디렉터리의 주제를 파악하고, 디렉터리 내에 저장된 파일들의 색인을 통해 상기 사용자의 관심 분야를 분석하고, 분석된 사용자의 관심 분야 마다 가중치를 부여하기 위해 각 파일에 대한 접근 횟수 및 접근 시간(사용자 행위 정보)을 이용하여 파일별 가중치를 산출한 후 파일별 가중치를 이용하여 각 파일이 속한 각 디렉터리에 대한 가중치를 산출한다.
이후, 모델 생성부(100)는 산출된 각 파일 및 디렉터리에 대한 가중치를 이용하여 사용자의 관심 분야별로 서로 다른 가중치를 부여하여 관심 분야 분석 모델(130)을 생성한다.
이후, 사용자로부터 질의가 입력(S402)됨에 따라 검색 엔진부(110)는 사용자 단말에서 이용하는 검색 엔진, 예컨대 벡터 스페이스 모델(Vector Space Model), "Okapi 모델" 등을 이용하여 입력된 질의에 관련된 파일(문서)을 검색함으로써, 즉 사용, 질의에 출현한 단어와 검색 대상 문서와의 유사도를 계산하며, 계산된 유사도에 따라 문서를 순위화한 검색 결과를 개인화 검색 엔진부(120)에 출력(S404)한다.
그런 다음, 개인화 검색 엔진부(120)는 관심 분야 분석 모델(130)을 이용하여 검색 결과와 사용자의 관심 분야와의 유사도인 개인화 랭킹 스코어를 검색 결과 내의 각 파일별로 산출(S406)하고, 산출된 각 파일의 개인화 랭킹(ranking) 스코어를 토대로 검색 결과를 재순위화시켜 개인화 검색 결과를 생성한 후 이를 사용자 단말을 통해 디스플레이(S408)시킨다.
한편, 본 발명에 따른 관심 분야 분석 모델(130)은 모델 생성부(100)에 의해 수시로 모니터링되는 사용자 행위 정보, 즉 파일 접근 시간 및 횟수에 의거하여 업데이트 되어진다.
본 발명의 바람직한 실시 예에 따른 개인화 검색 장치는 또한 컴퓨터로 읽을 수 있는 기록매체에 컴퓨터가 읽을 수 있는 코드로서 구현되는 것이 가능하다. 컴퓨터가 읽을 수 있는 기록매체는 컴퓨터 시스템에 의하여 읽혀질 수 있는 데이터가 저장되는 모든 종류의 기록장치를 포함한다. 컴퓨터가 읽을 수 있는 기록매체의 예로는 ROM, RAM, CD-ROM, 자기 테이프, 하드 디스크, 플로피 디스크, 플래쉬 메모리, 광 데이타 저장장치 등이 있으며, 또한 캐리어 웨이브(예를 들면 인터넷을 통한 전송)의 형태로 구현되는 것도 포함된다. 또한, 컴퓨터가 읽을 수 있는 기록매체는 컴퓨터 통신망으로 연결된 컴퓨터 시스템에 분산되어, 분산방식으로 읽을 수 있는 코드로서 저장되고 실행될 수 있다. 본 발명에 의한 폰트 롬 데이터구조도 컴퓨터로 읽을 수 있는 ROM, RAM, CD-ROM, 자기 테이프, 하드 디스크, 플로피 디스크, 플래쉬 메모리, 광 데이타 저장 장치등과 같은 기록매체에 컴퓨터가 읽을 수 있는 코드로서 구현되는 것이 가능하다.
지금까지 본 발명의 바람직한 실시예에 국한하여 설명하였으나 본 발명의 기술이 당업자에 의하여 용이하게 변형 실시될 가능성이 자명하다. 이러한 변형된 실시 예들은 본 발명의 특허청구범위에 기재된 기술사상에 포함된다고 하여야 할 것이다.
도 1은 본 발명의 바람직한 실시 예에 따른 개인화 검색 장치를 도시한 블록도이며,
도 2는 일반적인 디렉터리 구조를 도시한 도면이며,
도 3은 미디어 파일 내의 메타 데이터 구조를 도시한 도면이며,
도 4는 본 발명의 바람직한 실시 예에 따른 개인화 검색 과정을 도시한 흐름도이다.
<도면의 주요부분에 대한 부호의 설명>
100 : 모델 생성부 110 : 검색 엔진부
120 : 개인화 검색 엔진부 130 : 관심 분야 분석 모델

Claims (10)

  1. 사용자 단말에 저장된 디렉터리에 대한 디렉터리 분류 정보를 이용하여 사용자 관심 분야를 분석하고, 상기 분석된 사용자 관심 분야를 토대로 관심 분야 분석 모델을 생성하는 모델 생성부와,
    상기 사용자 단말에 설치된 정보 검색 엔진을 이용하여 입력된 질의와 관련된 파일을 상기 사용자 단말에서 검색한 후 이에 따른 검색 결과를 생성하는 검색 엔진부와,
    상기 검색 엔진부에서 생성된 상기 검색 결과를 상기 관심 분야 분석 모델을 토대로 재순위화하여 개인화 검색 결과를 생성한 후 이를 출력하는 개인화 검색 엔진부
    를 포함하는 개인화 검색 장치.
  2. 제 1 항에 있어서,
    상기 모델 생성부는, 상기 사용자가 직접 분류 및 저장한 디렉터리의 주제를 파악하고, 상기 디렉터리 내에 저장된 파일들의 색인을 통해 상기 사용자의 관심 분야를 추출하여 상기 관심 분야 분석 모델을 생성하는 것을 특징으로 하는 개인화 검색 장치.
  3. 제 2 항에 있어서,
    상기 모델 생성부는, 상기 디렉터리에 저장된 파일이 멀티미디어 파일인 경우 상기 파일 내 메타 데이터 파일 정보를 이용하여 상기 파일의 색인을 실시하는 것을 특징으로 하는 개인화 검색 장치.
  4. 제 1 항에 있어서,
    상기 모델 생성부는, 상기 사용자 단말에 저장된 각 디렉터리 내 파일에 대한 접근 횟수 및 접근 시간을 이용하여 파일별 가중치를 산출하고, 상기 산출한 파일별 가중치를 이용하여 상기 사용자의 관심 분야별 가중치를 부여하는 것을 특징으로 하는 개인화 검색 장치.
  5. 제 4 항에 있어서,
    상기 파일별 가중치는, 아래의 수학식에 의해 산출되는 것을 특징으로 하는 개인화 검색 장치.
    Figure 112011016182981-pat00004
  6. 제 5 항에 있어서,
    상기 모델 생성부는, 상기 각 파일에 대한 가중치를 이용하여 해당 파일이 속한 디렉터리의 가중치를 아래의 수학식으로 산출하는 것을 특징으로 하는 개인화 검색 장치.
    Figure 112008084918912-pat00005
  7. 제 6 항에 있어서,
    상기 개인화 검색 엔진부는, 상기 관심 분야 분석 모델을 이용하여 상기 검색 엔진부의 검색 결과와 상기 사용자의 관심 분야와의 유사도인 개인화 랭킹 스코어를 아래의 수학식을 이용하여 산출하고, 상기 아래의 수학식을 이용하여 산출한 개인화 랭키 스코어를 토대로 상기 검색 결과를 재순위화시켜 상기 개인화 검색 결과를 출력하는 것을 특징으로 하는 개인화 검색 장치.
    Figure 112011016182981-pat00006
  8. 사용자 단말에 저장된 디렉터리에 대한 디렉터리 분류 정보를 이용하여 사용자 관심 분야를 분석하고, 상기 분석된 사용자 관심 분야를 이용하여 관심 분야 분 석 모델을 생성하는 단계와,
    상기 사용자 단말로 입력되는 질의와 관련된 파일을 상기 사용자 단말에서 검색하여 검색 결과를 출력하는 단계와,
    상기 관심 분야 분석 모델을 토대로 상기 검색 결과를 재순위화하여 개인화 검색 결과를 생성하는 단계
    를 포함하는 개인화 검색 방법.
  9. 제 8 항에 있어서,
    상기 관심 분야 분석 모델을 생성하는 단계는,
    상기 사용자가 직접 분류 및 저장한 디렉터리의 주제를 파악하고, 상기 디렉터리 내에 저장된 파일들의 색인을 통해 상기 사용자의 관심 분야를 분석하는 단계와,
    상기 디렉터리 내 각 파일에 대한 접근 횟수 및 접근 시간을 이용하여 파일별 가중치를 산출하는 단계와,
    상기 파일별 가중치를 이용하여 상기 각 파일이 속한 각 디렉터리에 대한 가중치를 추출하는 단계와,
    상기 추출된 상기 각 파일 및 디렉터리에 대한 가중치를 이용하여 상기 사용자의 관심 분야별로 서로 다른 가중치를 부여하여 상기 관심 분야 분석 모델을 생성하는 단계
    를 포함하는 개인화 검색 방법.
  10. 제 8 항에 있어서,
    상기 개인화 검색 결과를 생성하는 단계는,
    상기 관심 분야 분석 모델을 이용하여 상기 검색 결과와 상기 사용자의 관심 분야와의 유사도인 개인화 랭킹 스코어를 상기 검색 결과 내의 각 파일별로 산출하는 단계와,
    상기 산출된 각 파일의 개인화 랭킹 스코어를 토대로 상기 검색 결과를 재순위화시켜 상기 개인화 검색 결과를 생성하는 단계
    를 포함하는 개인화 검색 방법.
KR1020080125049A 2008-12-10 2008-12-10 개인화 검색 장치 및 방법 KR101098832B1 (ko)

Priority Applications (2)

Application Number Priority Date Filing Date Title
KR1020080125049A KR101098832B1 (ko) 2008-12-10 2008-12-10 개인화 검색 장치 및 방법
US12/628,171 US20100145922A1 (en) 2008-12-10 2009-11-30 Personalized search apparatus and method

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020080125049A KR101098832B1 (ko) 2008-12-10 2008-12-10 개인화 검색 장치 및 방법

Publications (2)

Publication Number Publication Date
KR20100066651A KR20100066651A (ko) 2010-06-18
KR101098832B1 true KR101098832B1 (ko) 2011-12-26

Family

ID=42232183

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020080125049A KR101098832B1 (ko) 2008-12-10 2008-12-10 개인화 검색 장치 및 방법

Country Status (2)

Country Link
US (1) US20100145922A1 (ko)
KR (1) KR101098832B1 (ko)

Families Citing this family (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8346749B2 (en) * 2008-06-27 2013-01-01 Microsoft Corporation Balancing the costs of sharing private data with the utility of enhanced personalization of online services
CN102737027B (zh) * 2011-04-01 2016-08-31 深圳市世纪光速信息技术有限公司 个性化搜索方法及系统
KR101955463B1 (ko) * 2011-11-29 2019-03-11 에스케이플래닛 주식회사 컨텐츠 분석에 따른 어플리케이션 추천 시스템 및 방법
KR101878937B1 (ko) * 2011-12-06 2018-08-20 에스케이플래닛 주식회사 개인화된 정보 제공 시스템, 방법 및 그에 대한 기록매체
US10977254B2 (en) * 2014-04-01 2021-04-13 Healthgrades Operating Company, Inc. Healthcare provider search based on experience
CN104111999B (zh) * 2014-07-02 2017-12-12 南京烽火星空通信发展有限公司 一种搜索引擎热点词分析算法
RU2580516C2 (ru) 2014-08-19 2016-04-10 Общество С Ограниченной Ответственностью "Яндекс" Способ формирования персонализированной модели ранжирования, способ формирования модели ранжирования, электронное устройство и сервер
US10337876B2 (en) 2016-05-10 2019-07-02 Microsoft Technology Licensing, Llc Constrained-transportation directions
US10386197B2 (en) 2016-05-17 2019-08-20 Microsoft Technology Licensing, Llc Calculating an optimal route based on specified intermediate stops
US10060752B2 (en) 2016-06-23 2018-08-28 Microsoft Technology Licensing, Llc Detecting deviation from planned public transit route

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7523096B2 (en) * 2003-12-03 2009-04-21 Google Inc. Methods and systems for personalized network searching
US7818315B2 (en) * 2006-03-13 2010-10-19 Microsoft Corporation Re-ranking search results based on query log
US9519715B2 (en) * 2006-11-02 2016-12-13 Excalibur Ip, Llc Personalized search

Also Published As

Publication number Publication date
US20100145922A1 (en) 2010-06-10
KR20100066651A (ko) 2010-06-18

Similar Documents

Publication Publication Date Title
KR101098832B1 (ko) 개인화 검색 장치 및 방법
CA2690947C (en) System and method for measuring the quality of document sets
JP5192475B2 (ja) オブジェクト分類方法およびオブジェクト分類システム
KR101078864B1 (ko) 질의/문서 주제 범주 변화 분석 시스템 및 그 방법과 이를 이용한 질의 확장 기반 정보 검색 시스템 및 그 방법
JP4726528B2 (ja) マルチセンスクエリについての関連語提案
CN108280114B (zh) 一种基于深度学习的用户文献阅读兴趣分析方法
JP7451747B2 (ja) コンテンツを検索する方法、装置、機器及びコンピュータ読み取り可能な記憶媒体
JP2013516022A (ja) 検索提案のクラスタ化及び提示
CN105045852A (zh) 一种教学资源的全文搜索引擎系统
US9971828B2 (en) Document tagging and retrieval using per-subject dictionaries including subject-determining-power scores for entries
CN112035723A (zh) 资源库的确定方法和装置、存储介质及电子装置
JP2013168177A (ja) 情報提供プログラム、情報提供装置および検索サービスの提供方法
JP5315726B2 (ja) 情報提供方法、情報提供装置、および情報提供プログラム
JP5903370B2 (ja) 情報検索装置、情報検索方法、及びプログラム
AU2021100441A4 (en) A method of text mining in ranking of web pages using machine learning
Yigit-Sert et al. Diversity-aware strategies for static index pruning
Leveling et al. DCU-TCD@ LogCLEF 2010: Re-ranking document collections and query performance estimation
CN114218473A (zh) 一种电子书内容推荐系统
KR20100035355A (ko) 개인화된 검색 정보 제공 장치 및 방법
KR20090058410A (ko) 도서 검색 방법 및 도서 검색 시스템

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
AMND Amendment
E601 Decision to refuse application
AMND Amendment
J201 Request for trial against refusal decision
B701 Decision to grant
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20151217

Year of fee payment: 5

FPAY Annual fee payment

Payment date: 20161213

Year of fee payment: 6

FPAY Annual fee payment

Payment date: 20171220

Year of fee payment: 7

FPAY Annual fee payment

Payment date: 20191220

Year of fee payment: 9