KR101137491B1 - 웹 페이지 검색에서 개인화된 태그 추천 모델 활용 시스템 및 방법 - Google Patents

웹 페이지 검색에서 개인화된 태그 추천 모델 활용 시스템 및 방법 Download PDF

Info

Publication number
KR101137491B1
KR101137491B1 KR1020100071650A KR20100071650A KR101137491B1 KR 101137491 B1 KR101137491 B1 KR 101137491B1 KR 1020100071650 A KR1020100071650 A KR 1020100071650A KR 20100071650 A KR20100071650 A KR 20100071650A KR 101137491 B1 KR101137491 B1 KR 101137491B1
Authority
KR
South Korea
Prior art keywords
tag
user
tags
module
web page
Prior art date
Application number
KR1020100071650A
Other languages
English (en)
Other versions
KR20110127052A (ko
Inventor
이병정
장도
김한준
Original Assignee
서울시립대학교 산학협력단
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 서울시립대학교 산학협력단 filed Critical 서울시립대학교 산학협력단
Publication of KR20110127052A publication Critical patent/KR20110127052A/ko
Application granted granted Critical
Publication of KR101137491B1 publication Critical patent/KR101137491B1/ko

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F17/00Digital computing or data processing equipment or methods, specially adapted for specific functions
    • G06F17/10Complex mathematical operations
    • G06F17/16Matrix or vector computation, e.g. matrix-matrix or matrix-vector multiplication, matrix factorization

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Mathematical Physics (AREA)
  • Pure & Applied Mathematics (AREA)
  • Mathematical Analysis (AREA)
  • Mathematical Optimization (AREA)
  • Computational Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Theoretical Computer Science (AREA)
  • Computing Systems (AREA)
  • Algebra (AREA)
  • Databases & Information Systems (AREA)
  • Software Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

본 발명은 웹 페이지 검색을 수행함에 있어서 태그가 없는 콘텐츠에 대해 개인화된 태그를 추천할 수 있도록 한 웹 페이지 검색에서 개인화된 태그 추천 모델 활용 시스템 및 방법에 관한 것으로, 사용자로부터 웹 검색을 위한 키워드와 태그 추천을 위한 피드백 데이터를 입력받아 처리하는 사용자 인터페이스; 사용자가 요청한 키워드들의 정보를 분류하고 관리 및 저장하는 쿼리 처리 모듈; 상기 사용자 인터페이스를 통해 키워드가 입력되면 태그 추천 알고리즘을 통해 상기 쿼리 처리 모듈의 의미적으로 분류된 키워드를 분석하고 분석결과에 따라 태그를 추천하는 의미분석과 태그 추천 모듈; 상기 의미분석과 태그 추천 모듈에서 추천한 상기 태그에 대한 사용자의 피드백 데이터를 입력받아 관리하는 사용자 피드백 모듈; 및 상기 의미분석과 태그 추천 모듈의 의미분석과 상기 사용자 피드백 모듈의 피드백 데이터를 태그 추천 결정 알고리즘에 반영하여 최종 태그들을 결정하여 추천하는 태그 추천 결정 모듈을 포함하는 것을 특징으로 한다.

Description

웹 페이지 검색에서 개인화된 태그 추천 모델 활용 시스템 및 방법{System and Method for Utilizing Personalized Tag Recommendation Model in Web Page Search}
본 발명은 웹 페이지 검색에서 개인화된 태그 추천 모델 활용 시스템 및 방법에 관한 것으로, 더 상세하게는 웹 페이지 검색을 수행함에 있어서 태그가 없는 콘텐츠에 대해 개인화된 태그를 추천할 수 있도록 한 웹 페이지 검색에서 개인화된 태그 추천 모델 활용 시스템 및 방법에 관한 것이다.
인터넷의 빠른 발전으로 정보 검색은 웹 기술의 중요한 부분이 되고 있다.
이로 인해 전세계 누구나 접근이 가능한 인터넷상의 데이터는 그 수를 다 헤아릴 수 없을 정도로 방대하다.
이러한 방대한 양의 멀티미디어 데이터 검색은 사용자가 특정영상을 검색하기 위해 질의어를 입력하면 몇몇 상용 검색 엔진들이 문자 기반의 검색을 수행한다.
상기한 기술구성은 본 발명의 이해를 돕기 위한 배경기술로서, 본 발명이 속하는 기술분야에서 널리 알려진 종래기술을 의미하는 것은 아니다.
본 발명은 웹 페이지 검색을 수행함에 있어서 태그가 없는 콘텐츠에 대해 개인화된 태그를 추천할 수 있도록 한 웹 페이지 검색에서 개인화된 태그 추천 모델 활용 시스템 및 방법을 제공하는데 그 목적이 있다.
본 발명에 의한 웹 페이지 검색에서 개인화된 태그 추천 모델 활용 시스템은, 사용자로부터 웹 검색을 위한 키워드와 태그 추천을 위한 피드백 데이터를 입력받아 처리하는 사용자 인터페이스; 사용자가 요청한 키워드들의 정보를 분류하고 관리 및 저장하는 쿼리 처리 모듈; 상기 사용자 인터페이스를 통해 키워드가 입력되면 태그 추천 알고리즘을 통해 상기 쿼리 처리 모듈의 의미적으로 분류된 키워드를 분석하고 분석결과에 따라 태그를 추천하는 의미분석과 태그 추천 모듈; 상기 의미분석과 태그 추천 모듈에서 추천한 상기 태그에 대한 사용자의 피드백 데이터를 입력받아 관리하는 사용자 피드백 모듈; 및 상기 의미분석과 태그 추천 모듈의 의미분석과 상기 사용자 피드백 모듈의 피드백 데이터를 태그 추천 결정 알고리즘에 반영하여 최종 태그들을 결정하여 추천하는 태그 추천 결정 모듈을 포함하는 것을 특징으로 한다.
본 발명에서, 태그들을 저장하는 태그 저장소; 및 태그화된 웹 페이지 문서를 저장하는 태그화된 문서 저장소를 더 포함하는 것을 특징으로 한다.
그리고, 본 발명에 의한 웹 페이지 검색에서 개인화된 태그 추천 모델 활용 방법은, 키워드를 입력받는 단계; 상기 키워드가 태그 저장소에 존재하는지 판단하는 단계; 상기 키워드가 태그 저장소에 존재하는지 여부에 따라 태그 추천 알고리즘을 통해 상기 키워드에 대한 의미 분석을 하여 태그들을 추천하는 단계; 추천된 상기 태그들에 대해 사용자의 피드백 데이터가 입력되면 피드백 알고리즘을 통해 상기 태그들에 대한 사용자 점수를 연산하는 단계; 상기 의미분석과 상기 사용자 점수를 추천 결정 알고리즘에 반영하여 최종 태그들을 결정하여 추천하는 단계를 포함하는 것을 특징으로 한다.
본 발명에서, 상기 태그 추천 알고리즘을 통해 상기 키워드에 대한 의미 분석을 하여 태그들을 추천하는 단계는 상기 키워드에 대한 빈도가 높은 후보 웹 페이지를 확인하는 단계; 상기 후보 웹 페이지와 모든 태그화된 웹 페이지 사이의 유사성을 비교하는 단계; 상기 비교결과 유사성이 임계값을 초과하는 웹 페이지와 연관된 태그를 태그 리스트에 포함시키는 단계; 및 상기 태그들을 사용자에게 추천하는 단계를 포함하는 것을 특징으로 한다.
본 발명에서, 상기 피드백 알고리즘을 통해 상기 태그들에 대한 사용자 점수를 연산하는 단계는 추천된 상기 태그들에 대해 사용자로부터 피드백 데이터를 입력받는 단계; 추천된 상기 태그들에 대해 사용자가 사용한 횟수를 카운트하는 단계; 상기 피드백 데이터와 상기 횟수를 반영하여 상기 사용자 점수를 연산하는 단계를 포함하는 것을 특징으로 한다.
본 발명에서, 상기 최종 태그들을 결정하여 추천하는 단계는 상기 의미 분석을 통해 추천한 태그에 상기 사용자 점수에 의한 가중치를 부여하여 최종 태그들을 결정하는 것을 특징으로 한다.
상술한 바와 같이, 본 발명은 웹 페이지 검색을 수행할 때 검색어의 의미 분석과 사용자의 의견을 반영한 태그를 추천함으로써 사용자가 원하는 데이터를 검색할 수 있도록 지원한다.
도 1은 본 발명의 일 실시예에 따른 웹 페이지 검색에서 개인화된 태그 추천 모델 활용 시스템의 구성을 설명하기 위한 블럭도이다.
도 2는 본 발명의 일 실시예에 따른 웹 페이지 검색 엔진의 알고리즘이다.
도 3은 본 발명의 일 실시예에 따른 웹 페이지 검색에서 개인화된 태그 추천 모델 활용 방법을 설명하기 위한 순서도이다.
도 4과 도 5와 도 6a와 도 6b는 본 발명의 일 실시예에 따른 웹 페이지 검색 엔진의 처리 화면을 예시한 도면이다.
도 7은 본 발명의 일 실시예에 따른 태그 추천 결정 알고리즘의 성능을 표시한 그래프이다.
이하, 실시예를 통하여 본 발명을 더욱 상세히 설명하기로 한다. 이들 실시예는 단지 본 발명을 예시하기 위한 것이며, 본 발명의 권리 보호 범위가 이들 실시예에 의해 제한되는 것은 아니다.
이 과정에서 도면에 도시된 선들의 두께나 구성요소의 크기 등은 설명의 명료성과 편의상 과장되게 도시되어 있을 수 있다. 또한, 후술되는 용어들은 본 발명에서의 기능을 고려하여 정의된 용어들로서 이는 사용자, 운용자의 의도 또는 관례에 따라 달라질 수 있다. 그러므로, 이러한 용어들에 대한 정의는 본 명세서 전반에 걸친 내용을 토대로 내려져야 할 것이다.
도 1은 본 발명의 일 실시예에 따른 웹 페이지 검색에서 개인화된 태그 추천 모델 활용 시스템의 구성을 설명하기 위한 블록도이고, 도 2는 본 발명의 일 실시예에 따른 웹 페이지 검색에서 개인화된 태그 추천 모델 활용 방법을 설명하기 위한 순서도이다.
도 1을 참고하면, 본 발명의 일 실시예에 따른 웹 페이지 검색에서 개인화된 태그 추천 모델 활용 시스템은 사용자 인터페이스(11)와 쿼리 처리 모듈(12)과 의미분석과 태그 추천 모듈(13)과 사용자 피드백 모듈(14)과 태그 추천 결정 모듈(15)을 포함하는 검색 엔진(1)과, 태그 저장소(2)와, 태그화된 문서 저장소(3)를 포함한다.
사용자 인터페이스(User Interface)(11)는 사용자가 키워드를 입력해서 웹 페이지를 가져오고, 태그 추천을 위해 피드백되는 데이터를 처리한다. 여기서, 사용자 인터페이스(11)는 물리적인 하드웨어와 논리적인 소프트웨어 요소를 포함한다.
쿼리 처리 모듈(Query Process Module)(12)은 사용자가 요청한 쿼리들의 정보를 분류하고 관리 및 저장한다.
의미분석과 태그 추천 모듈(Semantic Analysis and Tag Recommendation Module)(13)은 의미적으로 분류된 쿼리를 분석하고 의미 분석의 결과에 따라 적절한 태그를 추천한다.
사용자 피드백 모듈(User Feedback Module)(14)은 추천한 태그에 대한 사용자의 의견을 모으고 관리하는데 이용된다.
태그 추천 결정 모듈(15)은 최종 태그들을 결정하고 선택한다.
태그 저장소(2)는 태그들을 저장하고, 태그화 된 문서 저장소(3)는 태그화된 웹 페이지를 저장한다.
도 2를 참고하여, 웹 페이지 검색에서 개인화된 태그 추천 모델 활용 방법을 설명하면 다음과 같다.
먼저, 사용자들이 관련된 웹 페이지들을 검색하기 위해 키워드를 입력한다(S1).
그러면, 검색 엔진(1)은 사용자가 입력한 키워드가 태그 저장소(2)에 존재하는지 여부를 판단한다(S2).
이때, 사용자가 입력한 키워드가 태그 저장소(2)에 존재 하는 경우에는 태그와 연관된 웹 페이지를 사용자에게 제공하고(S3), 키워드가 태그 저장소에 존재하지 않는다면 의미 분석을 통해 태그들을 추천한다(S4).
그리고, 사용자가 검색 엔진(1)이 추천한 태그마다 점수를 주면(S5), 높은 점수를 받은 태그를 최종 결정하여 사용자에게 추천한다(S6).
이어서, 사용자가 최종 결정된 태그를 클릭하면 관련된 된 웹 페이지를 보여준다(S7).
이러한 웹 페이지 검색 시스템의 구성과 동작을 보다 상세히 설명하면 다음과 같다.
도 3는 본 발명의 일 실시예에 따른 웹 페이지 검색 엔진의 알고리즘이고, 도
도 3에서, N은 전체 웹 페이지의 수이고 M은 전체 카테고리의 숫자이다. 이 알고리즘을 사용함으로써, 웹 페이지들은 한 클러스터를 형성하고 가장 높은 빈도의 사용자 태그를 갖는 일반적인 태그를 갖는다. 그 다음 카테고리들은 계층적 클러스터링 알고리즘을 사용하여 좀 더 일반적인 카테고리를 형성한다.
태그화된 문서 저장소(3)는 튜플(웹 페이지, 사용자, 태그)의 형식으로 저장한다. 이 형식을 기반으로 웹 페이지 벡터를 표현하는
Figure 112010047824538-pat00001
(w1,w2,…wk)를 정의 한다. 웹 페이지의 유사성을 증명하기 위해 유명한 코사인 유사성 기법(popular cosine similarity method)을 사용한다.
Figure 112010047824538-pat00002
수학식 1에서 wki 는 웹 페이지 Pi에서 각 단어의 가중치를 의미한다.
Figure 112010047824538-pat00003
freq (wk,Pi)는 웹 페이지 Pi 에서 단어 w의 빈도를 나타내고, pf (wk)는 태그화된 문서 저장소에서 단어wk가 포함된 웹 페이지의 수를 의미한다.
여기서, "sim (ti , tj)"를 태그 ti 와 tj 의 유사성으로 정의한다. 이 태그들이 얼마나 유사한지를 측정하기 위해서 그 태그들이 매우 유사하다면 그 태그들은 공통의 값을 갖는다. 공통의 값을 정하기 위해서 두 태그의 인기에 대응하여 공통의 값으로 표준화하는 Jaccard index 를 사용한다.
Figure 112010047824538-pat00004
수학식 3에서 A는 태그 Ti 를 태그로 갖는 페이지 들의 집합이고, B는 태그 Tj 를 태그로 갖는 웹 페이지들의 집합이다. 태그들 사이의 유사성을 측정하는 기법처럼 공통의 행렬을 갖는 Jaccard index를 사용함으로써 웹 페이지의 사용을 요청하지 않고 직관적으로 유사성을 측정한다.
섹션 A의 내용처럼, 사용자가 태그가 없는 웹 페이지들을 얻는다면 이 시스템은 사용자에게 태그들을 추천할 것이다. 그 추천과정은 다음과 같다.
먼저, 웹 페이지에서 사용자가 입력한 키워드의 개수를 계산하여 후보 웹 페이지를 확인한다. 만약 웹 페이지에서 그 키워드의 빈도가 가장 높다면, 그 웹 페이지는 후보 자원으로 확인될 것이다. 목표를 달성하기 위해서 웹 페이지에서 키워드의 빈도를 F (Pi,w)로 정의한다.
다음으로, 수학식1을 사용하여 후보 페이지와 모든 태그화된 웹 페이지들 사이의 유사성을 비교한다.
여기서, 유사성의 임계 값이 초과되게 측정된다면 웹 페이지들과 연관된 태그를 후보 태그 리스트에 추가한다.
그리고, 수학식 4를 사용하여 검색 엔진(1)은 top-k 태그에서 적합한 태그들을 추천한다.
Figure 112010047824538-pat00005
sim(t, ti)은 후보 태그들과 카테고리의 주제 사이의 유사성 정도를 의미하고, sim(pcand, pi)는 후보 웹 페이지와 후보 태그와 관련된 웹 페이지들 사이의 유사성 정도를 의미한다.
수학식 4에서 후보 태그와 그 태그와 관련된 웹 페이지들 사이의 관련 정도를 나타내는 "rel(pi, t)"를 정의한다. "rel (pi, t)"의 값은 다음과 같은 TF-IDF에 의해 계산된다.
Figure 112010047824538-pat00006
Figure 112010047824538-pat00007
Figure 112010047824538-pat00008
이 수식에서 TF(p, t)는 페이지 P와 관련된 모든 태그에서 태그 t의 비율을 나타내고 IDF (t)는 태그 t의 희귀한 정도를 나타낸다. F (p, t)는 사용자들이 웹 페이지에 할당한 태그의 개수를 나타낸다.
정보검색을 강화하고 사용자의 관심을 반영하기 위해 검색 엔진(1)에 사용자 피드백 모듈(14)을 구비한다. 이 사용자 피드백 모듈(14)은 태그 추천을 위해 사용자의 의견을 반영도록 설계한다.
검색 엔진(1)이 사용자에게 태그를 추천한 후, 사용자는 1에서 10 사이의 점수를 각 태그에 준다. 검색 엔진(1)은 피드백 정보를 기록하고 추천된 태그를 사용자가 사용한 횟수를 셀 것이다.
사용자의 피드백 알고리즘은 수학식 8과 같다.
Figure 112010047824538-pat00009
수학식 8에서 Score (ui, t)은 사용자 인터페이스를 통해 사용자 u가 준 점수이고, F (ui, t)은 추천된 태그 t가 사용자에 의해 사용된 횟수이다. n은 전체 사용자들의 수이고, m은 추천된 태그들의 수이다.
검색 엔진(1)의 핵심은 태그 추천 결정 모듈(15)이다. 태그 추천 결정 모듈에서 태그 추천 알고리즘과 사용자의 피드백 알고리즘을 결합한 태그 추천 결정 알고리즘을 제안한다.
Figure 112010047824538-pat00010
α 는 의미 분석과 사용자 피드백에 의한 태그 추천의 가중치를 나타내는 댐핑 벡터(damping vector)를 의미한다. 시스템의 태그 추천과 사용자의 의견을 고려함으로써 사용자들은 더 좋은 추천 태그와 이 태그들과 관련된 웹 페이지들을 얻을 수 있다. 이러한 태그 추천 결정 알고리즘을 아래에서 설명할 실험에 의해 증명하면 다음과 같다.
도 4와 도 5와 도 6a와 도 6b는 본 발명의 일 실시예에 따른 검색 엔진의 처리 화면을 예시한 도면이다.
도 4은 사용자가 "movie"라는 키워드를 입력하고 이 키워드가 태그 저장소(2)의 한 태그와 일치하는지를 보여준다. 그래서 그 태그와 관련된 웹 페이지들을 즉시 보여주고 다른 관련된 태그를 보여준다.
도 5는 태그 저장소(2)에 있지 않은 키워드 검색을 처리하는 것을 보여준다. 만약 사용자가 "comedy"라는 키워드를 입력한다면 검색 엔진(1)은 8개 태그를 추천하고 사용자는 각 태그에 점수를 부여하면 최종 추천된 태그를 보여준다. 적절한 태그를 클릭하면 사용자에게 관련된 웹 페이지를 보여준다.
도 6a는 각각 점수를 가지고 있는 최종 추천된 태그들을 나타낸다. 도 6b는 "story"라는 태그를 가진 웹 페이지들을 보여준다.
실험의 두 번째 상황에서 태그 추천 결정 알고리즘은 사용자들에게 관련된 태그를 보여주는데 사용될 수 있다.
의미 분석과 사용자의 피드백에 의해 태그를 추천해주는 다른 태그 추천 방법과 비교하여 이 알고리즘의 성능을 측정한다.
이 실험을 수행하기 위해서, 우리는 Precision를 쿼리에 대한 태그 추천 알고리즘에 의해 만들어진 태그의 리스트로 정의하고, Recall은 어떤 주제에 대해 관련이 있는 인터넷 상의 모든 태그의 리스트로 정의한다.
두 가지 다른 알고리즘을 비교함으로써 우리는 추천 태그의 precision rate 와 recall rate를 평가한다. Precision과 recall의 값은 다음 수식에 의해 계산된다.
Figure 112010047824538-pat00011
Figure 112010047824538-pat00012
성능 측정 시 우리는 T (r)은 우리 시스템에 의해 추천된 태그의 집합으로 정의하고 tags(u, r)을 사용자 u가 무작위로 선택한 웹 페이지로부터 얻어진 자원인 r에서 사용자가 선택한 관련된 태그의 집합으로 정의했다.
이제 간략하게 다른 방법들의 기본 개념을 기술하면 다음과 같다.
Tag Co-occurrence는 두 태그들 사이의 co-occurrence 계수를 계산하는 태그 추천 알고리즘이다. 사용자가 입력한 태그와 시스템의 데이터베이스에 저장되어 있는 모든 태그들 사이의 co-occurrence 계수를 계산함으로써, 시스템은 사용자들에게 추천할 top-k태그를 선택한다.
Tag Feedback는 태그 피드백 모델을 활용해서 사용자들은 현재 시스템이 제안한 가장 높은 점수를 받은 태그들에게 피드백을 제공한다. 이 피드백을 기반으로 새롭게 추천된 태그들이 시스템에 의해 보여진다.
Term Feedback는 태그들에 피드백을 제공하는 대신에 사용자들은 가장 유사한 페이지의 컨텐츠에서 추출된 단어들을 피드백으로 제공한다.
Tag Co-location는 처음 태그를 추천한 후에 co-location점수를 계산함으로써 적절한 태그를 추천한다.
도 7은 본 발명의 일 실시예에 따른 태그 추천 결정 알고리즘의 성능을 표시한 그래프이다.
도 7을 참고하면, 맨 위의 곡선은 태그 추천 결정 알고리즘의 성능을 묘사하는데, 기본적으로 precision과 recall에서 다른 방법들보다 성능이 뛰어남을 보여 준다.
제안된 태그들의 수가 증가하면, tag co-location과 tag co-occurrence 의 precision은 더 나빠지고 recall은 더 좋아진다. 가장 상위에 랭크 된 태그에서 태그 추천 결정 알고리즘, tag feedback, term feedback의 정밀도는 좋지 않다. 하지만 추천된 태그들의 수가 증가하면 태그 추천 결정 알고리즘의 precision과 recall이 tag co-location과 tag co-occurrence 보다 더 좋다. tag co-location의 처음 추천된 태그와 두 번째 추천된 태그의 정밀도가 높을지라도, 정밀도가 태그 추천 결정 알고리즘보다 더 급격하게 줄어든다. 따라서, 본 실시예에 의한 태그 추천 결정 알고리즘은 사용자에게 관련된 태그를 추천하는 데에 적합한 방법이다.
이와 같이, 본 발명은 태그 추천과 정보 검색기능의 강화를 위해서 의미 분석과 사용자의 의견을 결합한 간단한 태그 추천 모델을 제안했다. 웹 페이지 검색 엔진에 이 태그 추천 결정 알고리즘을 추가함으로써 정보 검색과 태그 및 관련 웹 페이지 추천기능을 강화한다.
상술한 바와 같이 본 발명은 도면에 도시된 실시예를 참고로 하여 설명되었으나, 이는 예시적인 것에 불과하며, 당해 기술이 속하는 분야에서 통상의 지식을 가진 자라면 이로부터 다양한 변형 및 균등한 타 실시예가 가능하다는 점을 이해할 것이다. 따라서 본 발명의 진정한 기술적 보호범위는 아래의 특허청구범위에 의해서 정하여져야 할 것이다.
1 : 검색 엔진 2 : 태그 저장소
3 : 태그화된 문서 저장소 11 : 사용자 인터페이스
12 : 쿼리 처리 모듈 13 : 의미분석과 태그 추천 모듈
14 : 사용자 피드백 모듈 15 : 태그 추천 결정 모듈

Claims (6)

  1. 사용자로부터 웹 검색을 위한 키워드와 태그 추천을 위한 피드백 데이터를 입력받아 처리하는 사용자 인터페이스;
    사용자가 요청한 키워드들의 정보를 분류하고 관리 및 저장하는 쿼리 처리 모듈;
    상기 사용자 인터페이스를 통해 키워드가 입력되면 태그 추천 알고리즘을 통해 상기 쿼리 처리 모듈의 의미적으로 분류된 키워드를 분석하고 분석결과에 따라 태그를 추천하는 의미분석과 태그 추천 모듈;
    상기 의미분석과 태그 추천 모듈에서 추천한 상기 태그에 대한 사용자의 피드백 데이터를 입력받아 관리하는 사용자 피드백 모듈; 및
    상기 의미분석과 태그 추천 모듈의 의미분석과 상기 사용자 피드백 모듈의 피드백 데이터를 태그 추천 결정 알고리즘에 반영하여 최종 태그들을 결정하여 추천하는 태그 추천 결정 모듈을 포함하는 것을 특징으로 하는 웹 페이지 검색에서 개인화된 태그 추천 모델 활용 시스템.
  2. 제 1 항에 있어서,
    태그들을 저장하는 태그 저장소; 및
    태그화된 웹 페이지 문서를 저장하는 태그화된 문서 저장소를 더 포함하는 것을 특징으로 하는 웹 페이지 검색에서 개인화된 태그 추천 모델 활용 시스템.
  3. 키워드를 입력받는 단계;
    상기 키워드가 태그 저장소에 존재하는지 판단하는 단계;
    상기 키워드가 태그 저장소에 존재하는지 여부에 따라 태그 추천 알고리즘을 통해 상기 키워드에 대한 의미 분석을 하여 태그들을 추천하는 단계;
    추천된 상기 태그들에 대해 사용자의 피드백 데이터가 입력되면 피드백 알고리즘을 통해 상기 태그들에 대한 사용자 점수를 연산하는 단계;
    상기 의미분석과 상기 사용자 점수를 추천 결정 알고리즘에 반영하여 최종 태그들을 결정하여 추천하는 단계를 포함하는 것을 특징으로 하는 웹 페이지 검색에서 개인화된 태그 추천 모델 활용 방법.
  4. 제 3 항에 있어서,
    상기 태그 추천 알고리즘을 통해 상기 키워드에 대한 의미 분석을 하여 태그들을 추천하는 단계는
    상기 키워드에 대한 빈도가 높은 후보 웹 페이지를 확인하는 단계;
    상기 후보 웹 페이지와 모든 태그화된 웹 페이지 사이의 유사성을 비교하는 단계;
    상기 비교결과 유사성이 임계값을 초과하는 웹 페이지와 연관된 태그를 태그 리스트에 포함시키는 단계; 및
    상기 태그들을 사용자에게 추천하는 단계를 포함하는 것을 특징으로 하는 웹 페이지 검색에서 개인화된 태그 추천 모델 활용 방법.
  5. 제 3 항에 있어서,
    상기 피드백 알고리즘을 통해 상기 태그들에 대한 사용자 점수를 연산하는 단계는
    추천된 상기 태그들에 대해 사용자로부터 피드백 데이터를 입력받는 단계;
    추천된 상기 태그들에 대해 사용자가 사용한 횟수를 카운트하는 단계;
    상기 피드백 데이터와 상기 횟수를 반영하여 상기 사용자 점수를 연산하는 단계를 포함하는 것을 특징으로 하는 웹 페이지 검색에서 개인화된 태그 추천 모델 활용 방법.
  6. 제 3 항에 있어서,
    상기 최종 태그들을 결정하여 추천하는 단계는
    상기 의미 분석을 통해 추천한 태그에 상기 사용자 점수에 의한 가중치를 부여하여 최종 태그들을 결정하는 것을 특징으로 하는 웹 페이지 검색에서 개인화된 태그 추천 모델 활용 방법.
KR1020100071650A 2010-05-18 2010-07-23 웹 페이지 검색에서 개인화된 태그 추천 모델 활용 시스템 및 방법 KR101137491B1 (ko)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
KR20100046390 2010-05-18
KR1020100046390 2010-05-18

Publications (2)

Publication Number Publication Date
KR20110127052A KR20110127052A (ko) 2011-11-24
KR101137491B1 true KR101137491B1 (ko) 2012-04-20

Family

ID=45395906

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020100071650A KR101137491B1 (ko) 2010-05-18 2010-07-23 웹 페이지 검색에서 개인화된 태그 추천 모델 활용 시스템 및 방법

Country Status (1)

Country Link
KR (1) KR101137491B1 (ko)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR102615973B1 (ko) * 2023-09-25 2023-12-20 주식회사 텍스트웨이 개인 사전 구축 서비스 제공 시스템 및 방법

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20010019414A (ko) * 1999-08-27 2001-03-15 구자홍 멀티미디어 데이타의 키워드 자가 생성방법 및 멀티미디어 데이타구조
KR20030062585A (ko) * 2002-01-17 2003-07-28 엘지전자 주식회사 멀티미디어 객체의 특징 기술정보 생성방법
KR20090016329A (ko) * 2007-08-10 2009-02-13 엔에이치엔(주) 질의 분류 방법 및 그 시스템
KR20100080100A (ko) * 2008-12-31 2010-07-08 주식회사 솔트룩스 정보 검색 방법 및 이를 수행할 수 있는 프로그램이 수록된컴퓨터로 읽을 수 있는 기록 매체

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20010019414A (ko) * 1999-08-27 2001-03-15 구자홍 멀티미디어 데이타의 키워드 자가 생성방법 및 멀티미디어 데이타구조
KR20030062585A (ko) * 2002-01-17 2003-07-28 엘지전자 주식회사 멀티미디어 객체의 특징 기술정보 생성방법
KR20090016329A (ko) * 2007-08-10 2009-02-13 엔에이치엔(주) 질의 분류 방법 및 그 시스템
KR20100080100A (ko) * 2008-12-31 2010-07-08 주식회사 솔트룩스 정보 검색 방법 및 이를 수행할 수 있는 프로그램이 수록된컴퓨터로 읽을 수 있는 기록 매체

Also Published As

Publication number Publication date
KR20110127052A (ko) 2011-11-24

Similar Documents

Publication Publication Date Title
US20230205828A1 (en) Related entities
US8386469B2 (en) Method and system for determining relevant sources, querying and merging results from multiple content sources
US20170116200A1 (en) Trust propagation through both explicit and implicit social networks
Welch et al. Search result diversity for informational queries
US20110320441A1 (en) Adjusting search results based on user social profiles
US20130110839A1 (en) Constructing an analysis of a document
NO325864B1 (no) Fremgangsmåte ved beregning av sammendragsinformasjon og en søkemotor for å støtte og implementere fremgangsmåten
Kim et al. A framework for tag-aware recommender systems
US9916384B2 (en) Related entities
WO2018097872A1 (en) Animated snippets for search results
US20100042610A1 (en) Rank documents based on popularity of key metadata
US11392595B2 (en) Techniques for determining relevant electronic content in response to queries
KR101088710B1 (ko) 온라인 커뮤니티 사용자 간 상호작용 기반 온라인 커뮤니티 포스트 검색 방법, 장치 및 그 방법을 실행하는 프로그램이 기록된 컴퓨터로 읽을 수 있는 기록매체
Bracamonte et al. Extracting semantic knowledge from web context for multimedia IR: a taxonomy, survey and challenges
KR101137491B1 (ko) 웹 페이지 검색에서 개인화된 태그 추천 모델 활용 시스템 및 방법
US20130138480A1 (en) Method and apparatus for exploring and selecting data sources
Li et al. Research on hot news discovery model based on user interest and topic discovery
Gao et al. Real-time and personalized search over a microblogging system
Chen Mobile app marketplace mining: methods and applications

Legal Events

Date Code Title Description
A201 Request for examination
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20160302

Year of fee payment: 5

FPAY Annual fee payment

Payment date: 20170324

Year of fee payment: 6

FPAY Annual fee payment

Payment date: 20180323

Year of fee payment: 7

LAPS Lapse due to unpaid annual fee