KR20090006464A - 사용자 맞춤형 컨텐츠 제공 장치, 그 방법 및 기록매체 - Google Patents

사용자 맞춤형 컨텐츠 제공 장치, 그 방법 및 기록매체 Download PDF

Info

Publication number
KR20090006464A
KR20090006464A KR1020070069829A KR20070069829A KR20090006464A KR 20090006464 A KR20090006464 A KR 20090006464A KR 1020070069829 A KR1020070069829 A KR 1020070069829A KR 20070069829 A KR20070069829 A KR 20070069829A KR 20090006464 A KR20090006464 A KR 20090006464A
Authority
KR
South Korea
Prior art keywords
user
user terminal
tag
information
content
Prior art date
Application number
KR1020070069829A
Other languages
English (en)
Inventor
이승화
정민철
이은석
Original Assignee
성균관대학교산학협력단
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Family has litigation
First worldwide family litigation filed litigation Critical https://patents.darts-ip.com/?family=40253986&utm_source=google_patent&utm_medium=platform_link&utm_campaign=public_patent_search&patent=KR20090006464(A) "Global patent litigation dataset” by Darts-ip is licensed under a Creative Commons Attribution 4.0 International License.
Application filed by 성균관대학교산학협력단 filed Critical 성균관대학교산학협력단
Priority to KR1020070069829A priority Critical patent/KR20090006464A/ko
Priority to US12/040,746 priority patent/US8639687B2/en
Publication of KR20090006464A publication Critical patent/KR20090006464A/ko

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/335Filtering based on additional data, e.g. user or group profiles
    • G06F16/337Profile generation, learning or modification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2457Query processing with adaptation to user needs
    • G06F16/24578Query processing with adaptation to user needs using ranking
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/40Information retrieval; Database structures therefor; File system structures therefor of multimedia data, e.g. slideshows comprising image and additional audio data
    • G06F16/43Querying
    • G06F16/435Filtering based on additional data, e.g. user or group profiles
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/40Information retrieval; Database structures therefor; File system structures therefor of multimedia data, e.g. slideshows comprising image and additional audio data
    • G06F16/48Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Multimedia (AREA)
  • Library & Information Science (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Information Transfer Between Computers (AREA)

Abstract

사용자 맞춤형 컨텐츠 제공 장치, 그 방법 및 기록매체가 개시된다. 사용자 맞춤형 컨텐츠 제공 장치는 사용자의 검색 질의어와 관련된 컨텐츠 세트를 검색하는 컨텐츠 검색부; 상기 사용자 단말로 사용자 프로파일을 포함하는 사용자 취향정보를 요청하는 사용자 취향정보 요청부-상기 사용자 프로파일은 상기 사용자 단말에서 수집한 핵심어 및 핵심어 별로 부여된 가중치를 반영한 점수를 포함함-; 상기 사용자 단말로부터 사용자 취향정보를 제공 받는 사용자 취향정보 수집부; 상기 사용자 취향정보와의 관련성에 따라 상기 컨텐츠 세트의 순위를 결정하는 컨텐츠 순위 결정부; 및 상기 순위화된 컨텐츠 세트를 상기 사용자 단말로 제공하는 컨텐츠 제공부를 포함할 수 있다. 본 발명에 따르면 사용자 단말에 취합된 사용자 취향정보를 개인화된 정보제공에 반영함으로써 사용자 맞춤형 컨텐츠를 제공할 수 있는 효과가 있다.
태그, 프로파일, 가중치

Description

사용자 맞춤형 컨텐츠 제공 장치, 그 방법 및 기록매체{Device, method, recording medium for providing customized content}
본 발명은 사용자 맞춤형 컨텐츠 제공 장치, 그 방법 및 기록매체에 관한 것으로서, 좀 더 상세하게는 태그 정보를 이용하여 개인화된 사용자 취향정보에 따라 사용자 맞춤형 컨텐츠를 제공할 수 있는 기술에 관한 것이다.
최근 정보통신기술의 급속한 발전과 함께 인터넷 이용률은 나날이 증가하고 있으며, 인터넷 상에 존재하는 정보도 점차 방대해지고 있다. 그러나 이 중 사용자가 실제로 필요로 하는 정보는 극히 일부이다. 따라서 사용자의 요구에 맞는 맞춤형 정보를 제공하는 것은 매우 중요하다.
특히 전자상거래 분야에서 상거래를 활성화시키고 정보제공자(웹 상점)에 대한 만족도와 충성도를 높이기 위해, 사용자 취향을 기반으로 한 상품(정보)추천은 필수적으로 요구된다. 이러한 개인화를 위해 가장 중요한 것은 사용자의 취향을 빠르고 정확하게 분석하는 것이다.
이에 사용자의 관심정보를 분석하기 위한 다양한 기법들이 연구되고 있다. 이중 가장 보편적으로 사용되는 방법은 사용자가 해당 사이트에 최초로 방문했을 때 명시적으로 표현하는 취향정보를 기반으로 맞춤형 정보(웹 컨텐츠)를 제공하는 것이다. 그러나 이러한 방법은 사용자를 번거롭게 할 수 있으며, 동적으로 변화하는 사용자의 취향을 습득하기 어렵다는 문제가 있다.
또한 이를 해결하기 위해, 사용자의 행동을 통해 암시적으로 취향을 학습하는 기법들도 연구되고 있다. 대표적인 방법으로는 사용자가 선택하는 하이퍼링크와 연결된 문서의 전체 내용을 분석하여, 해당 문서에 등장하는 단어들의 등장 빈도를 통해 사용자의 취향을 분석하는 방법이 있다.
그러나 이러한 종래 기술에 따라 연결된 문서에 포함된 모든 단어를 분석하는 것은 많은 시간이 소요될 뿐 아니라, 웹 문서에는 다양한 형태의 불필요한 정보가 포함되어 있기 때문에 이러한 정보들이 사용자의 관심정보 분석의 정확도를 떨어뜨릴 수 있다. 실제로 많은 웹 문서들은 사이트내의 이동 버튼이나 광고, 회사 소개, 저작권 정보와 같이 불필요한 정보가 반복적으로 등장한다. 특히 최근에는 특정한 템플릿을 유지하면서 내부의 내용을 동적으로 생성하는 웹 프로그래밍 방법이 많이 사용되고 있기 때문에, 더더욱 불필요한 내용이 웹 문서에 반복적으로 등장하고 있는 문제점이 있다.
또한, 종래 사용자 취향 정보는 각각의 웹 서버에 분산 관리되었는데, 이 정보가 사용자 기기에 통합관리 되며 서버가 필요할 때 이를 사용자 기기로 요청할 수 있다면, 유사한 상품을 제공하는 상점의 경우, 다른 상점의 웹 사이트에서 사용 자가 관심을 보인 정보도 유용하게 활용할 수 있다.
따라서, 본 발명은 상술한 문제점을 해결하기 위해 안출된 것으로서, 사용자 단말에 취합된 사용자 취향정보를 개인화된 정보제공에 반영함으로써 사용자 맞춤형 컨텐츠를 제공하기 위한 것이다.
본 발명은 사용자 단말에 수집된 정보를 서버가 요청하여 활용함으로써, 사전에 구축된 사용자 정보가 없더라도 각 웹 서버에서 개인화 서비스가 가능하도록 하기 위한 것이다.
본 발명은 앵커 태그 및/또는 폼 태그 정보를 이용하여 빠르고 정확하게 분석할 수 있는 사용자 취향정보를 이용함으로써 사용자 맞춤형 컨텐츠를 제공을 제공하기 위한 것이다.
본 발명의 일 측면에 따르면, 사용자의 검색 질의어와 관련된 컨텐츠 세트를 검색하는 컨텐츠 검색부; 네트워크를 통해 사용자 단말로 사용자 프로파일, 태그 정보를 포함하는 사용자 취향정보를 요청하는 사용자 취향정보 요청부 -상기 사용자 프로파일은 상기 사용자 단말에서 수집한 핵심어 및 핵심어 별로 부여된 가중치를 반영한 점수를 포함함-; 상기 사용자 단말로부터 사용자 취향정보를 제공 받는 사용자 취향정보 수집부; 상기 사용자 취향정보와의 관련성에 따라 상기 컨텐츠 세트의 순위를 결정하는 컨텐츠 순위 결정부; 및 상기 순위화된 컨텐츠 세트를 상기 사용자 단말로 제공하는 컨텐츠 제공부를 포함하는 사용자 맞춤형 컨텐츠 제공 장치를 제공할 수 있다.
또한, 상기 핵심어는 상기 사용자 단말에 출력된 웹 문서에 포함된 앵커 태그(anchor tag), 폼 태그(form tag) 및 이들의 조합 중 하나 이상의 태그로부터 추출된 태그 정보를 이용하여 검출하는 것일 수 있다.
또한, 상기 태그 정보는 앵커 텍스트 및 그와 연결된 URL을 포함하는 앵커 태그 정보와 질의어 및 그와 연결된 URL을 포함하는 폼 태그 정보를 포함하는 것일 수 있다.
또한, 상기 핵심어는 웹 문서에 포함된 태그 정보의 전부 또는 일부를 기록한 매핑테이블에 포함된 단어들 및 질의어로부터 불용어를 제외시킴으로써 검출되는 것일 수 있다.
또한, 상기 가중치는 핵심어의 출현 빈도가 증가함에 따라 가산되는 것일 수 있다.
또한, 상기 가중치는 매핑테이블 또는 사용자 프로파일에 존재함에도 불구하고 사용자가 선택하지 않은 핵심어에 대하여 감산되는 것을 특징으로 하는 컨텐츠 제공 장치.
또한, 상기 사용자 프로파일에 포함되는 핵심어는 상기 가중치에 따른 점수에 상응하게 순위화되는 것일 수 있다.
또한, 상기 사용자 프로파일에 포함되는 핵심어는 N(N은 자연수) 순위까지로 제한되는 것일 수 있다.
또한, 상기 사용자 단말로부터 상기 검색 질의어를 수신하는 질의어 수신부를 더 포함할 수 있다.
본 발명의 다른 측면에 따르면, 사용자의 검색 질의어와 관련된 컨텐츠 세트를 검색하는 컨텐츠 검색부; 네트워크를 통해 사용자 단말로 웹 문서에 포함된 앵커 태그(anchor tag), 폼 태그(form tag) 및 이들의 조합 중 하나 이상의 태그로부터 추출된 태그 정보를 포함하는 사용자 취향정보를 요청하는 사용자 취향정보 요청부; 상기 사용자 단말로부터 사용자 취향정보를 제공 받는 사용자 취향정보 수집부; 상기 사용자 취향정보를 이용하여 사용자 프로파일을 생성하는 사용자 프로파일 생성부-상기 사용자 프로파일은 핵심어 및 핵심어 별로 부여된 가중치를 반영한 점수를 포함함-; 상기 사용자 프로파일을 포함하는 사용자 취향정보와의 관련성에 따라 상기 컨텐츠 세트의 순위를 결정하는 컨텐츠 순위 결정부; 및 상기 순위화된 컨텐츠 세트를 상기 사용자 단말로 제공하는 컨텐츠 제공부를 포함하는 사용자 맞춤형 컨텐츠 제공 장치를 제공할 수 있다.
또한, 상기 핵심어는 상기 사용자 단말에 출력된 웹 문서에 포함된 앵커 태그(anchor tag), 폼 태그(form tag) 및 이들의 조합 중 하나 이상의 태그로부터 추출된 태그 정보를 이용하여 검출하는 것일 수 있다.
본 발명의 또 다른 측면에 따르면, 사용자의 검색 질의어와 관련된 컨텐츠 세트를 검색하는 단계; 상기 사용자 단말로 사용자 프로파일을 포함하는 사용자 취 향정보를 요청하는 단계 -상기 사용자 프로파일은 상기 사용자 단말에서 수집한 핵심어 및 핵심어 별로 부여된 가중치를 반영한 점수를 포함함-; 상기 사용자 단말로부터 사용자 취향정보를 제공 받는 단계; 상기 사용자 취향정보에 따라 상기 컨텐츠 세트의 순위를 결정하는 단계; 및상기 순위화된 컨텐츠 세트를 상기 사용자 단말로 제공하는 단계;를 포함하는 사용자 맞춤형 컨텐츠 제공 방법을 제공할 수 있다.
또한, 상기 핵심어는 상기 사용자 단말에 출력된 웹 문서에 포함된 앵커 태그(anchor tag), 폼 태그(form tag) 및 이들의 조합 중 하나 이상의 태그로부터 추출된 태그 정보를 이용하여 검출하는 것일 수 있다.
또한, 상기 태그 정보는 앵커 텍스트 및 그와 연결된 URL을 포함하는 앵커 태그 정보와 질의어 및 그와 연결된 URL을 포함하는 폼 태그 정보를 포함하는 것일 수 있다.
또한, 상기 핵심어는 웹 문서에 포함된 태그 정보의 전부 또는 일부를 기록한 매핑테이블에 포함된 단어들 및 질의어로부터 불용어를 제외시킴으로써 검출되는 것일 수 있다.
또한, 상기 가중치는 핵심어의 출현 빈도가 증가함에 따라 가산되는 것일 수 있다.
또한, 상기 가중치는 매핑테이블 또는 사용자 프로파일에 존재함에도 불구하고 사용자가 선택하지 않은 핵심어에 대하여 감산되는 것일 수 있다.
또한, 상기 사용자 프로파일에 포함되는 핵심어는 상기 가중치에 따른 점수 에 상응하게 순위화되는 것일 수 있다.
또한, 상기 사용자 프로파일에 포함되는 핵심어는 N(N은 자연수) 순위까지로 제한되는 것일 수 있다.
본 발명의 또 다른 측면에 따르면, 사용자의 검색 질의어와 관련된 컨텐츠 세트를 검색하는 단계; 네트워크를 통해 사용자 단말로 웹 문서에 포함된 앵커 태그(anchor tag), 폼 태그(form tag) 및 이들의 조합 중 하나 이상의 태그로부터 추출된 태그 정보를 포함하는 사용자 취향정보를 요청하는 단계; 상기 사용자 단말로부터 사용자 취향정보를 제공 받는 단계; 상기 사용자 취향정보를 이용하여 사용자 프로파일을 생성하는 단계 -상기 사용자 프로파일은 핵심어 및 핵심어 별로 부여된 가중치를 반영한 점수를 포함함-; 상기 사용자 프로파일을 포함하는 사용자 취향정보와의 관련성에 따라 상기 컨텐츠 세트의 순위를 결정하는 단계; 및 상기 순위화된 컨텐츠 세트를 상기 사용자 단말로 제공하는 단계를 포함하는 사용자 맞춤형 컨텐츠 제공 방법을 제공할 수 있다.
또한, 상기 핵심어는 상기 사용자 단말에 출력된 웹 문서에 포함된 앵커 태그(anchor tag), 폼 태그(form tag) 및 이들의 조합 중 하나 이상의 태그로부터 추출된 태그 정보를 이용하여 검출하는 것일 수 있다.
본 발명의 또 다른 측면에 따르면, 제12항 내지 제21항 중 어느 한 항의 방법에 의하여 디지털 처리 장치에서 실행 가능한 명령어들이 구현되어 있으며 디지털 처리 장치에 의해 판독될 수 있는 프로그램이 기록된 기록 매체를 제공할 수 있다.
본 발명에 따르면, 사용자 단말에 취합된 사용자 취향정보를 개인화된 정보제공에 반영함으로써 사용자 맞춤형 컨텐츠를 제공할 수 있다.
또한, 본 발명은 사용자 단말에 수집된 정보를 서버가 요청하여 활용함으로써, 사전에 구축된 사용자 정보가 없더라도 각 웹 서버에서 개인화 서비스가 가능하도록 할 수 있다.
또한, 본 발명은 앵커 태그 및/또는 폼 태그 정보를 이용하여 빠르고 정확하게 분석할 수 있는 사용자 취향정보를 이용함으로써 사용자 맞춤형 컨텐츠를 제공을 제공할 수 있다.
본 발명은 다양한 변환을 가할 수 있고 여러 가지 실시예를 가질 수 있는 바, 특정 실시예들을 도면에 예시하고 상세한 설명에 상세하게 설명하고자 한다. 그러나, 이는 본 발명을 특정한 실시 형태에 대해 한정하려는 것이 아니며, 본 발명의 사상 및 기술 범위에 포함되는 모든 변환, 균등물 내지 대체물을 포함하는 것으로 이해되어야 한다. 본 발명을 설명함에 있어서 관련된 공지 기술에 대한 구체적인 설명이 본 발명의 요지를 흐릴 수 있다고 판단되는 경우 그 상세한 설명을 생략한다.
제1, 제2 등의 용어는 다양한 구성요소들을 설명하는데 사용될 수 있지만, 상기 구성요소들은 상기 용어들에 의해 한정되어서는 안 된다. 상기 용어들은 하나의 구성요소를 다른 구성요소로부터 구별하는 목적으로만 사용된다.
본 출원에서 사용한 용어는 단지 특정한 실시예를 설명하기 위해 사용된 것으로, 본 발명을 한정하려는 의도가 아니다. 단수의 표현은 문맥상 명백하게 다르게 뜻하지 않는 한, 복수의 표현을 포함한다. 본 출원에서, "포함하다" 또는 "가지다" 등의 용어는 명세서상에 기재된 특징, 숫자, 단계, 동작, 구성요소, 부품 또는 이들을 조합한 것이 존재함을 지정하려는 것이지, 하나 또는 그 이상의 다른 특징들이나 숫자, 단계, 동작, 구성요소, 부품 또는 이들을 조합한 것들의 존재 또는 부가 가능성을 미리 배제하지 않는 것으로 이해되어야 한다.
이하, 본 발명의 실시예를 첨부한 도면들을 참조하여 상세히 설명하기로 한다.
도 1은 본 발명의 일 실시예에 따른 사용자 맞춤형 컨텐츠를 제공하기 위한 전체 시스템을 개략적으로 나타낸 구성도이다.
도 1을 참조하면, 사용자 맞춤형 컨텐츠 제공 시스템은 네트워크(100), 사용자 단말(110), 컨텐츠 제공 장치(120) 및 온톨로지 서버(130)를 포함하여 구성될 수 있다.
네트워크(100)는 사용자 단말(110), 컨텐츠 제공 장치(120) 및 온톨로지 서버(130)를 연결하는 유선 또는 무선 통신망일 수 있다. 각 사용자 단말(110), 컨텐츠 제공 장치(120) 및 온톨로지 서버(130) 간의 정보 교환은 미리 정하여진 통신 규약에 의하여 이루어질 수 있고, 이들을 연결하는 네트워크(100)가 반드시 하나의 네트워크(100)일 필요는 없다.
또한, 네트워크(100)는 ADSL, VDSL, Wi-Fi, WIBRO 및 HSDPA 등의 기술에 의하여 LAN 및 WAN의 형태로 구성될 수 있고, 보안을 강화하기 위해 VPN등의 기술이 사용될 수 있다.
컨텐츠 제공 장치(120)는 사용자 맞춤형인 컨텐츠를 선별하고 순위화하여, 사용자 단말(110)로 제공할 수 있다. 본 발명의 일 실시예에 따르면, 컨텐츠 제공 장치(120)는 사용자 단말(110)에게 예컨대 웹 페이지나 그 일부분, 영상 등 웹 문서를 제공하는 일반적인 웹 서버일 수 있다.
또한, 본 발명의 다른 실시예에 따르면 컨텐츠 제공 장치(120)의 역할은 사용자 맞춤형 컨텐츠의 선별 및 순위화는 웹 서버에서 수행되고, 별도의 장치에서 컨텐츠를 선별한 후 이를 웹 서버에 제공하면 해당 컨텐츠를 웹 서버에서 사용자 단말로 전송하도록 이원화된 장치에서 수행될 수 있다.
여기서, "컨텐츠"는 웹 페이지, 영상, 멀티미디어 파일, 텍스트 문서 및 PDF 등을 포함하는 서치 엔진으로 색인화 및 검색될 수 있는 임의의 형식의 매체가 될 수 있다. 이러한 "컨텐츠"라는 용어의 사용이 본 발명의 범위를 제한하기 위한 것은 아니다. 컨텐츠 제공 장치(120)의 기능에 대한 상세한 설명은 도 2에서 후술하기로 한다.
사용자 단말(110)은 데스크탑, PDA, 핸드폰 등과 같은 네트워크(100) 기능을 갖는 정보통신 단말일 수 있다. 또는, 사용자 단말(110)은 네트워크(100)를 통해 컨텐츠 제공 장치(120)에 접속할 수 있는 임의의 전자 장치로 구현될 수 있다.
본 실시예에서 사용자 단말(110)은 유무선 네트워크(100)를 통하여 컨텐츠 제공 장치(120)에 접속하여 웹 문서에 해당하는 컨텐츠를 제공받을 수 있고, 온톨로지 서버(130)로부터 불용어를 제거하는 서비스를 제공받을 수 있다.
온톨로지 서버(130)는 웹 문서에 포함된 태그 정보로부터 검출되는 단어의 의미 분석과 불용어를 제거하는 역할을 수행할 수 있다. 온톨로지(onthology)는 단어와 관계들로 구성된 일종의 사전으로 생각할 수 있으며, 특정 도메인에 관련된 단어들이 계층적으로 표현될 수 있다.
여기서, 불용어란 한글의 조사나 영어에서 관사, 전치사와 같이 자주 등장하지만 중요하지 않고, 의미가 없는 단어를 의미한다. 예컨대, 한글의 "와/과", "을/를", 영어의 "a/an", "the" 등이 불용어로 취급될 수 있다.
본 발명의 다른 실시예에 따르면 불용어 제거 등의 동작이 사용자 단말(110)에 의해 수행될 수도 있다. 즉, 사용자 단말(110)은 온톨로지 서버(130)로부터 제공받은 정보(예를 들어, 불용어 리스트 등)를 이용하여 태그 정보에서 불필요한 단어를 제거하고, 필요한 핵심어들만을 정제할 수 있다.
도 2는 본 발명의 일 실시예에 따른 사용자 맞춤형 컨텐츠를 제공할 수 있는 컨텐츠 제공 장치(120)의 구성을 나타낸 도면이다.
도 2를 참조하면, 본 실시예에 따른 컨텐츠 제공 장치(120)는 질의어 수신부(210), 컨텐츠 검색부(220), 사용자 취향정보 요청부(230), 사용자 취향정보 수 집부(240), 컨텐츠 순위 결정부(250), 컨텐츠 제공부(260) 및 저장부(270)를 포함하여 구성될 수 있다.
질의어 수신부(210)는 사용자가 사용자 단말(110)에 입력하여 전송한 검색 질의어를 수신 및 저장하는 역할을 수행할 수 있다.
컨텐츠 검색부(220)는 검색 질의어에 관련된 컨텐츠를 검색하여 이들 컨텐츠 세트를 검색 결과로 보여준다. 본 발명의 일 실시예에 따르면 검색 결과에 해당하는 컨텐츠 세트는 이후, 개인별 사용자 취향정보를 기반으로 순위화될 수 있다. 또한, 본 발명의 다른 실시예에 따르면 처음부터 사용자 취향정보를 바탕으로 컨텐츠의 검색 범위를 제어하고, 각 컨텐츠의 중요도에 따라 컨텐츠들을 순위화할 수 있다.
사용자 취향정보 요청부(230)는 사용자 단말(110)내에 수집된 사용자 취향정보가 존재하는 경우, 이를 전송해 줄 것을 사용자 단말(110)에게 요청할 수 있다.
"사용자 취향정보"란 특정 사용자가 관심 있는 주제 또는 분야에 대한 정보를 포함하는 모든 정보일 수 있다. 본 실시예에서 사용자 취향정보는 앵커 태그(anchor tag), 폼 태그(form tag) 및 이들의 조합 중 하나 이상의 태그로부터 추출된 태그 정보, 또는 태그 정보를 이용하여 작성된 사용자 프로파일을 포함할 수 있다.
여기서, "사용자 프로파일"이란 사용자의 관심이 반영된 단어 및 상기 단어 별로 소정의 기준에 따른 가중치를 부여하여 책정한 점수를 함께 포함한 데이터일 수 있다. 이때, 사용자 프로파일의 점수는 사용자의 관심을 반영한 영향도, 즉 사 용자 별 단어의 중요도를 나타내는 지표일 수 있고, 또한 컨텐츠 세트를 순위화하는데 고려될 수 있는 사항이다.
한편, 사용자 프로파일은 사용자 단말(110)에서 생성하여 컨텐츠 제공 장치(120)로 제공할 수도 있고, 컨텐츠 제공 장치(120)에서 태그 정보만 수신한 경우에는 이를 바탕으로 사용자 프로파일 생성부(280)에서 사용자 프로파일을 생성할 수도 있다.
사용자 취향정보 수집부(240)는 사용자 단말(110)이 컨텐츠 제공 장치(120)의 요청에 따라 전송한 사용자 취향정보를 수신 받고 저장부(270)에 저장시키는 역할을 수행할 수 있다.
컨텐츠 순위 결정부(250)는 저장부(270)에 저장된 사용자 취향정보를 바탕으로 개인적 관심도를 반영하여 컨텐츠의 순위를 결정하는 역할을 수행할 수 있다. 컨텐츠의 순위는 사용자 취향정보, 예컨대 사용자 프로파일에 포함된 단어와 연관되는지와 각 단어의 중요도에 따라 제어할 수 있다.
컨텐츠 제공부(260)는 순위화된 컨텐츠 세트를 전송하여 제공하는 역할을 수행할 수 있다. 컨텐츠 세트의 각각의 컨텐츠는 그 페이지로의 링크와 함께 URL로 표시되고 사용자에게 컨텐츠에서 문맥의 일부를 나타내는 페이지 텍스트의 단편을 포함할 수 있다. 또한, 컨텐츠 세트는 예컨대, 순위가 높은 순서대로 컨텐츠를 웹 사이트의 위 자리에 배치되어 사용자 단말(110)의 출력부(도시되지 않음)에 출력될 수 있다.
저장부(270)는 컨텐츠 제공 장치(120)에서 수행되는 프로세스에 의한 각종 데이터를 저장할 수 있는 매체로서, 데이터베이스를 포함할 수 있다. 예컨대, 저장부(270)는 사용자 단말(110)로부터 수신된 질의어 및 사용자 취향정보를 저장할 수 있고, 사용자 취향정보를 이용하여 생성한 컨텐츠 세트 또한 저장부(270)에 저장될 수 있다.
사용자 프로파일 생성부(280)는 전술한 바와 같이, 사용자 단말(110)로부터 수신된 앵커 태그(anchor tag), 폼 태그(form tag) 및 이들의 조합 중 하나 이상의 태그로부터 추출된 태그 정보를 이용하여 사용자 프로파일을 생성하는 역할을 수행할 수 있다. 사용자 프로파일은 컨텐츠 세트를 사용자 기호에 부합하게 순위화하는데 도움이 되는 것이라면 다양한 방식으로 작성될 수 있으며, 이에 대한 일예를 도 3 내지 도 7에 나타내었으니 이에 대한 상세한 설명은 후술하기로 한다.
이하에서는 본 발명의 일 실시예에 따른 앵커 태그 및/또는 폼 태그를 이용하여 작성되는 사용자 취향정보에 대하여 설명하기로 한다.
도 3은 본 발명의 일 실시예에 따른 하이퍼링크를 포함하는 웹 문서를 나타낸도면이고, 도 4는 본 발명의 일 실시예에 따른 웹 문서의 HTML 소스를 나타낸 도면이며, 도 5는 본 발명의 일 실시예에 따른 웹 문서의 HTML 소스로부터 앵커 태그 정보를 추출하여 작성한 매핑테이블을 나타낸 도면이다.
도 3을 참조하면, 사용자 단말(110)에 출력된 웹 문서는 하나 이상의 하이퍼링크를 포함하여 구성될 수 있다. 도 3에 예시된 바와 같이, 하이퍼링크 된 텍스트 정보는 하이퍼링크를 통해 접속되는 웹 문서의 제목에 해당되는 텍스트 정보일 수 있다.
이렇게 웹 문서에 포함된 하이퍼링크는 도 4와 같이, 웹 문서의 HTML 소스에 포함되어 표시될 수 있다. 웹 문서의 HTML 소스에 포함된 앵커 태크는 아래와 같이 URL 및 해당 URL 주소를 가지는 웹 사이트를 대표하여 하이퍼링크 제목으로 설정된 앵커 텍스트를 포함할 수 있다.
<a href="URL"> 앵커 텍스트 </a>
여기서, 앵커 태그(anchor tag)란 하이퍼 텍스트를 만드는 마크업 언어(HTML) 중에서 하이퍼링크(hyperlink)를 생성하는 태그이다. 하이퍼링크는 그래픽 아이콘 또는 텍스트 줄로 구현되고, 사용자는 마우스 버튼을 클릭함으로써 하이퍼링크에 연결된 웹 문서로 이동할 수 있고, 웹 브라우저는 대개 하이퍼링크로 지정된 웹 페이지로 변환하여 디스플레이하는 동작을 수행할 수 있다. 다른 하이퍼링크의 동작으로는 다운로드 받는 동작과 비디오를 디스플레이하는 동작 등이 있다.
강조되어 있는 개체를 '앵커(anchor)'라고 부르는데 앵커와 그 개체가 합쳐져 하이퍼텍스트 링크를 구성하게 된다. HTML에서 앵커는 구절, 이미지 및 기타 다른 모든 정보 객체에 대해 선언할 수 있다.
도 4에 도시된 소스 중 일 예를 들면, 앵커 태그가 <a href="/2007/WORLD/asiapct/02/27/china_pigeon.reut/index.html"> Scientists command pigeons via remote control </a>인 경우, "Scientists command pigeons via remote control"을 제목으로 하는 하이퍼링크가 생성되고, 이를 사용자가 마우스 클릭하면 "/2007/WORLD/asiapct/02/27/china_pige on.reut/index.html" 주소에 해당하는 웹 사이트로 연결된다.
이중 URL과 그 URL이 연결된 하이퍼링크 제목에 상응하는 앵커 텍스트 등의 태그 정보를 추출하고 항목별로 나누어 테이블을 작성한 것이 도 5에 나타낸 매핑테이블이다.
앵커 태그 정보는 하이퍼링크(hyperlink)를 생성하는 앵커 태그에 포함되는 정보로서 태그에 연결된 문서의 URL(Uniform Resource Locator), 하이퍼텍스트의 문자열 등에 해당하는 정보인 앵커 텍스트를 포함할 수 있다.
도 5를 참조하면, 매핑테이블은 URL부와 하이퍼링크 제목에 해당하는 앵커 텍스트부로 나누어 설정될 수 있고, 이후 앵커 텍스트의 단어들은 불용어를 제거하는 과정을 거쳐 핵심어만을 추출하는 과정을 거칠 수 있다.
즉, 사용자 단말(110)는 매핑테이블에 출력된 웹 문서에 포함된 태그의 전부 또는 일부에 대한 상기 태그 정보를 기록하고, 다음에 이동한 웹 문서의 URL이 매핑테이블에 포함되어 있는지를 분석할 수 있다. 따라서 매핑테이블에 다음에 이동한 웹 문서의 URL이 포함되어 있다면, 사용자 단말(110)는 해당 URL에 연결된 앵커 텍스트를 파악할 수 있게 된다.
이와 같이 매핑테이블은 사용자가 선택하여 이동한 웹 문서의 하이퍼링크를 식별하거나 사용자 프로파일에 포함된 단어의 가중치를 계산하기 위하여 필요하며, 일시적으로만 저장함으로써 저장부(270)의 부담을 줄일 수 있다.
본 발명의 다른 실시예에 따르면 앵커 텍스트의 핵심어를 먼저 추출한 후, 이에 따라 매핑테이블의 앵커 텍스트부는 핵심어들로만 이루어지게 할 수도 있다. 즉, 핵심어 검출 과정은 매핑테이블 작성 전후 어느 시점에서나 수행될 수 있다.
한편 본 발명의 또 다른 실시예에 따르면, 매핑테이블에는 앵커 태그 정보 외에 폼 태그 정보가 포함될 수 있다. 즉, 사용자 단말(110)는 단말 기기에 출력된 웹 문서에 포함된 태그의 전부 또는 일부에 대한 상기 태그 정보를 매핑테이블에 기록할 수도 있다.
폼 태그 및 폼 태그 정보에 대한 상세한 설명은 이하의 도 6을 참조하여 후술하기로 한다.
도 6은 본 발명의 일 실시예에 따른 폼 태그 정보가 표시된 주소줄을 포함하는 웹 문서를 나타낸 도면이다.
폼 태그(form tag)란 ASP, PSP, JSP 등 웹 프로그래밍을 할 때 데이터를 입력 받고 서버 측으로 전송하는데 필요한 데이터를 넘기는 역할을 수행하는 태그이다. 폼 태그를 이용하여 입력창, 패스워드창, 체크박스 등을 만들 수 있는데, 일반적으로 문서를 검색하는 입력창이 인풋(input) 태그와 함께 폼 태그 내부에 구현된다. 본 실시예에서 폼 태그 정보는 사용자가 사용자 단말(110)에 웹 프로그래밍 언어를 이용한 명령 처리부(도면에 도시되어 있지 않음)에 질의한 문자열 등의 질의어 정보일 수 있다.
폼 태그의 속성으로 액션(action) 및 메소드(method)가 있는데, 액션은 폼 태그에서 전달될 파일 이름을 지정함으로써 폼 태그에서 데이터를 받아 전달할 곳을 정해주는 속성을 말하고, 메소드는 액션으로 데이터를 전달할 때 전달하는 방식 을 정해주는 속성을 의미한다. 예컨대 <form action="abc.php" method="get/post">인 경우, 폼 태그에 있는 데이터들이 abc.php라는 곳에 get/post 방식으로 전달된다.
get/post는 데이터의 전송 방식을 지정하는 태그로써, 메소드의 값이라고 할 수 있다. get 방식의 경우 브라우저의 주소 줄에 입력한 매개변수 값이 보이게 되는 것이고, post 방식은 get 방식과 달리 브라우저의 주소 줄에 매개변수 값이 보이지 않는 것이다.
도 6은 메소드가 get 방식인 폼 태그를 예시한 것이다. 사용자 단말(110)이 검색 엔진에서 목적하는 정보를 검색하기 위하여 입력 창(610)에 질의어인 "agent system"을 입력하면, 해당 질의어는 전달하려는 곳의 URL 뒤에 '?' 기호와 함께 추가되어 전달될 수 있다. 여기서, 질의어가 입력된 창은 폼 태그 안에서 사용되는 태그인 인풋(input) 태그에 해당할 수 있다.
사용자 단말(110)은 사용자가 다음에 이동하여 표시하도록 지정한 웹 문서의 URL이 폼 태그와 연결된 주소라면, 웹 문서의 주소줄로부터 해당 주소에 첨부된 사용자 질의어를 추출할 수 있다. 도 6에서는 사용자 단말(110)은 주소줄에 기재된 "agent*system(620)"으로부터 질의어로서 "agent"및 "system"을 추출할 수 있고, 이후 추출된 단어는 핵심어에 해당하는지를 판단 받으며, 핵심어로 판명된 경우 사용자 프로파일에 저장될 수 있다.
한편, 도시되어 있지는 않지만 사용자 단말(110)이 질의어를 post 방식으로 전송하는 경우, 질의어는 데이터 바디(body) 부분에 추가되어 전달되며, 전달하려 는 데이터가 내부에 있기 때문에 외부에 보이지 않게 된다.
따라서, 본 발명의 일 실시예에 따르면 질의어가 post 방식으로 전송되는 경우 사용자 단말(110)은 바로 질의어를 추출할 수 없다. 그러나, 이러한 경우라도 사용자 단말(110)은 컨텐츠 제공 장치(120)에 질의어를 문의하고 그 응답을 수신 받음으로써 질의어를 파악할 수 있다.
한편, 사용자 단말(110)의 액정 화면에 디스플레이 된 웹 문서에 폼 태그가 복수 개 포함되어 있는 경우라면, 앵커 태그와 같이 폼 태그 정보에 대한 매핑테이블을 작성할 수 있다.
즉, 사용자 단말(110)이 복수 개의 폼 태그 중 어느 폼 태그를 통하여 이동하였는지를 식별하기 위해, 질의어와 그에 연결된 URL 정보를 앵커 태그와 같이 저장해 놓을 수 있다.
도 7은 본 발명의 일 실시예에 따른 가중치 산정 방법을 이용하여 핵심어의 순위를 나타낸 사용자 프로파일을 나타낸 도면이다.
본 발명은 사용자 단말(110) 별로 개인화된 사용자 프로파일을 생성하고, 이를 바탕으로 사용자 별로 취향에 부합하는 정보를 제공하고자 하는 것이다. 특히, 사용자 단말(110)에서 태그 정보로부터 추출한 단어 별로 가중치를 부여하여 사용자의 관심 정도를 수치화하고, 이에 따라 순위를 정렬한다면 더욱 정확한 사용자 취향정보를 제공할 수 있을 것이다.
도 7을 참조하면, 사용자 프로파일은 태그 정보로부터 추출한 단어 및 이에 대한 가중치들을 이용하여 산정한 점수의 조합으로 구성되어 있다. 단어 별로 가중치 부여 및 단어 별 순위화는 다양한 형태로 사용자에게 제공될 수 있다.
예컨대, 단어의 출현 빈도가 높다는 의미는 해당 단어가 사용자에 의하여 다수 마우스 클릭되었다는 것이고, 따라서 해당 단어는 사용자의 관심이 높고 더 유용하다고 말할 수 있다. 반면에 단어의 출현 빈도가 낮다는 것은 사용자의 관심이 낮고 사용자에게는 유용하지 않다는 의미로 볼 수 있다. 그러므로, 단어의 출현 빈도가 높을수록 가중치를 부여하여, 출현 빈도가 더 낮은 단어에 비하여 더 높은 점수 및 순위를 매길 수 있다.
또한, 사용자 단말(110)은 사용자 단말(110)에 출력된 웹 문서에 포함되어 있었던 태그 정보이어서 매핑테이블에 포함되어 있음에도 불구하고, 사용자가 마우스 클릭하지 않은 하이퍼링크의 단어는 사용자가 인지하였음에도 선택하지 않았다는 점을 고려하여 오히려 가중치를 감소시킬 수도 있다.
예를 들어, 사용자 단말(110)은 사용자 단말(110)의 사용자 프로파일에 1회 포함된 단어를 0점으로 하면, 출현 빈도 수가 한 회씩 증가함에 따라 +K점을 추가할 수 있다. 또한, 사용자 단말(110)은 사용자 단말(110)에 일단 디스플레이 된 웹 문서에 기재되어 있어 매핑테이블에 포함되어 있는 단어임에도 불구하고, 사용자가 선택하여 이동한 URL과 연결된 하이퍼링크 제목에 포함되지 않은 단어는 -L점으로 점수를 감소시킬 수 있다.
이러한 경우, 한 단어의 점수는 다음과 같이 산정될 수 있다.
점수 = (a x K) - (b x L)
여기서, a는 특정 단어가 마우스 클릭된 회수를 나타내고, b는 특정 단어가 매핑테이블에 포함되어 있었음에도 마우스 클릭되지 않은 회수를 나타낸다. 또한, K는 L보다 크거나 같게 하여 사용자의 선택을 받은 단어를 더욱 가중치를 두도록 계산할 수도 있다.
본 발명의 다른 실시예에 따르면, 사용자 단말(110)은 사용자가 선택한 회수가 증가할수록 사용자의 관심의 정도가 매우 큰 것으로 의미를 두고, 다음과 같이 출현 빈도에 따라 기하급수적으로 점수가 커지도록 가중치를 산정할 수도 있다.
점수 = Ka - (b x L)
여기서, a, b는 전술한 바와 같다.
본 발명의 또 다른 실시예에 따르면, 사용자 단말(110)은 사용자 프로파일과 매핑테이블에 존재하지만 사용자가 이동하지 않은 URL에 포함되는 단어들에 대한 가중치를 감소시킴으로써 사용자의 취향 변화를 동적으로 반영시킬 수 있다.
본 발명의 또 다른 실시예에 따르면, 점수와 순위는 출현 빈도에 비례하게만 산정될 수도 있다.
또한, 도 7을 참조하면 사용자 프로파일에는 1 순위부터 N(N은 자연수) 순위까지의 단어를 포함하고 있을 수 있다. 즉, 사용자 프로파일에 포함되는 단어의 개수는 필요에 따라 사용자나 개발자가 임의로 지정하고, 임계치 이하의 단어는 사용자 프로파일에서 제거시킬 수 있다.
즉, 사용자 프로파일 순위가 실시간으로 재조정되는 경우이고, 사용자 프로 파일에 포함되는 단어의 개수가 n개로 한정되어 있다면, 예컨대 순위가 높은 순서대로 n개까지 사용자 프로파일부(730)에 포함되게 할 수 있다. 이러한 경우, 사용자 프로파일의 순위가 n 순위 이하인 단어들은 사용자 프로파일에서 제거되고, 새로이 n 순위 이상의 단어들만이 사용자 프로파일에 포함되게 될 것이다.
이때, 사용자 프로파일에서 제거된 단어도, 저장부(270)에서 삭제되지 않고 출현 빈도 등을 계산하는데 계속 이용될 수 있다. 예를 들어, 사용자 프로파일에서 관리되는 단어의 수가 10개인 경우, 순위 내에 들지 못하였던 단어도 출현 빈도 수를 계속 카운팅하고 있기 때문에 이후 10위 내에 들게 되어 사용자 프로파일에 포함될 수 있다.
이는 사용자 단말(110)에서 사용자의 취향정보를 실시간으로 분석하고, 이를 반영하여 순위를 재정렬함으로써 최근의 사용자 관심 분야를 정확하게 제공할 수 있다는 점에서 그 의의가 있다. 또한, 이렇게 사용자 프로파일에 저장되는 단어의 수를 한정함으로써, 저장부(270)의 부하를 감소시킨다는 것도 본 발명의 유리한 점에 해당한다.
도 8은 본 발명의 일 실시예에 따른 컨텐츠 제공 장치(120)가 사용자 단말(110)로부터 사용자 취향정보를 제공받는 방법을 나타낸 순서도이다.
도 8을 참조하면, 사용자 단말(110)은 단계 810에서 사용자에 의해 입력된 질의어에 대한 검색 정보를 컨텐츠 제공 장치(120)로 요청할 수 있다. 이후, 컨텐츠 제공 장치(120)는 단계 820에서 검색 요청된 질의어와 관련된 컨텐츠를 제공하 기 전에 사용자 취향정보를 사용자 단말(110)로 요청할 수 있다.
사용자 단말(110)에 사용자 취향정보가 존재한다면, 사용자 단말(110)은 단계 830에서 내장된 사용자 취향정보를 컨텐츠 제공 장치(120)로 전송할 수 있다. 여기서, 사용자 단말(110)이 전송할 사용자 취향정보는 사용자 프로파일일 수 있다. 이러한 경우 컨텐츠 제공 장치(120)는 단계 840을 바로 이행할 수 있을 것이다.
그러나, 만일 사용자 단말(110)에서 전송된 사용자 취향정보가 웹 문서에 포함된 앵커 태그(anchor tag), 폼 태그(form tag) 및 이들의 조합 중 하나 이상의 태그로부터 추출된 태그 정보인 경우에는 이를 바탕으로 사용자 프로파일을 생성하는 단계를 더 포함할 수 있다.
단계 840에서 컨텐츠 제공 장치(120)는 사용자 단말(110)이 전송한 사용자 취향정보(또는 미리 확보한 사용자 취향 정보)를 바탕으로 제공할 컨텐츠를 개인화하고, 이를 사용자 단말(110)에 전송할 수 있다. 여기서, 컨텐츠를 개인화한다는 것은 검색 요청된 질의어와 관련된 수 많은 컨텐츠를 사용자 취향정보에 부합하도록 순위를 정하여 개인마다 가장 관심 있는 정보를 위주로 제공한다는 것이다. 예를 들어, 사용자가 입력한 검색 키워드에 상응하는 검색 결과를 사용자 단말(110)로 제공함에 있어 사용자 취향정보에 부합하는 검색 결과 항목이 먼저 제시되도록 할 수 있을 것이다.
컨텐츠 제공 장치(120)는 미리 확보한 사용자 취향 정보를 이용하여 컨텐츠를 개인화하는 경우, 해당 사용자에 부합되는 사용자 취향 정보를 이용하기 위해 사용자 인증과정에서 제공받은 아이디/패스워드, 사용자 단말(110)의 맥 어드레스 등을 이용할 수 있을 것이며, 이외에도 사용자 식별을 위해 이용 가능한 정보는 다양할 수 있다.
사용자 단말(110)은 단계 850에서 컨텐츠 제공 장치(120)로부터 전송 받은 컨텐츠를 출력부(예를 들어, 액정 화면)에 출력할 수 있고, 이후 사용자 단말(110)의 사용자 취향정보 관리부(260)는 단계 860에서 사용자의 활동을 모니터링하며 사용자 취향정보를 갱신할 수 있다. 즉, 전술한 바와 같이 사용자의 웹 문서 이동을 반영하여 실시간으로 사용자 프로파일을 갱신할 수 있다.
만일 사용자 단말(110)에 사용자 취향정보가 존재하지 않는 경우라면, 컨텐츠 제공 장치(120)는 검색 요청된 질의어와 관련된 일반적인 컨텐츠를 사용자 단말(110)에 제공할 수 있다.
이하에서는 사용자 단말에서 사용자 취향정보를 추출하는 과정을 더욱 상세히 설명하기로 한다.
도 9는 본 발명의 일 실시예에 따른 사용자 단말(110)에서 사용자 취향정보를 제공하는 방법을 나타낸 순서도이다.
단계 910에서 사용자 단말(110)은 사용자 단말(110)의 출력부에 출력된 웹 문서의 HTML 소스를 분석한다. 단계 920에서 사용자 단말(110)은 단계 910에서 분석한 HTML 소스 중 앵커 태그 및/또는 폼 태그를 검색하여 추출할 수 있다.
단계 920에서 추출된 태그가 앵커 태그인지 폼 태그인지를 파악하고, 추출된 태그가 앵커 태그인 경우, 단계 930으로 진행하여 사용자 단말(110)은 앵커 태그 정보를 추출한다.
앵커 태그 정보는 앵커 태그와 연결된 URL과 하이퍼텍스트 문자열인 앵커 텍스트일 수 있다. 이후, 사용자 단말(110)은 단계 940에서 추출된 URL과 앵커 텍스트를 이용하여 매핑테이블을 작성할 수 있다.
한편, 단계 920에서 추출된 태그가 폼 태그인 경우, 단계 935로 진행하여 사용자 단말(110)은 폼 태그 정보를 추출할 수 있고, 이후 사용자 단말(110)은 단계 945에서 폼 태그 내부 질의어를 처리하는 URL을 추출할 수 있다.
단계 950에서 사용자 단말(110)이 다음에 이동하는 웹 문서의 URL을 분석할 수 있다. 이후, 사용자 단말(110)은 단계 960에서 이동한 웹 문서의 URL이 앵커 태그와 연결된 것인지 폼 태그와 연결된 것인지를 판단할 수 있다.
판단 결과 앵커 태그에 연결된 URL인 경우, 사용자 단말(110)은 단계 970에서 매핑테이블에 포함된 URL과 비교하고, 매핑테이블에 포함된 URL이라면 해당 URL과 연결된 하이퍼링크 제목인 앵커 텍스트를 추출 및 분석할 수 있다.
단계 960에서의 판단 결과 이동한 웹 문서의 URL이 폼 태그와 연결된 것이라면, 단계 975에서 사용자 단말(110)은 해당 URL과 연결된 질의어를 추출할 수 있다.
구체적으로, 질의어가 get 방식으로 전송된 것이라면 사용자 단말(110)은 출력부(예를 들어, 액정 화면)의 주소줄에 표시된 질의어를 스스로 추출할 수 있다. 그러나, 사용자 단말(110)은 질의어를 post 방식으로 전송한 것이라면, 도시되어 있지는 않지만 컨텐츠 제공 장치(120)로부터 이동한 웹 문서의 URL에 연결된 질의어에 대한 정보를 문의 및 응답 받는 단계를 더 포함할 수 있다.
이후, 사용자 단말(110)은 단계 980에서 추출된 문자 정보로부터 온톨로지 서버(130) 등의 불용어 사전을 이용해 불필요한 단어를 제거할 수 있다. 이렇게 함으로써, 앵커 태그 정보로부터 핵심어를 추출할 수 있게 된다.
단계 990에서 사용자 단말(110)은 상기 추출된 핵심어를 이용하여 사용자 프로파일을 생성할 수 있고, 이미 생성된 사용자 프로파일 정보를 갱신할 수 있다. 또한, 사용자 프로파일에는 추출된 핵심어를 출현 빈도 또는 가중치를 반영한 순위와 함께 기록할 수 있다.
상술한 바와 같은 본 발명의 방법은 프로그램으로 구현되어 컴퓨터로 읽을 수 있는 기록매체(씨디롬, 램, 롬, 플로피 디스크, 하드디스크, 광자기디스크 등)에 저장될 수 있다.
상기에서는 본 발명의 바람직한 실시예를 참조하여 설명하였지만, 해당 기술 분야에서 통상의 지식을 가진 자라면 하기의 특허 청구의 범위에 기재된 본 발명의 사상 및 영역으로부터 벗어나지 않는 범위 내에서 본 발명을 다양하게 수정 및 변경시킬 수 있음을 이해할 수 있을 것이다.
도 1은 본 발명의 일 실시예에 따른 사용자 맞춤형 컨텐츠를 제공하기 위한 전체 시스템을 개략적으로 나타낸 구성도.
도 2는 본 발명의 일 실시예에 따른 사용자 맞춤형 컨텐츠를 제공할 수 있는 컨텐츠 제공 장치의 구성을 나타낸 도면.
도 3은 본 발명의 일 실시예에 따른 하이퍼링크를 포함하는 웹 문서를 나타낸 도면.
도 4는 본 발명의 일 실시예에 따른 웹 문서의 HTML 소스를 나타낸 도면.
도 5는 본 발명의 일 실시예에 따른 웹 문서의 HTML 소스로부터 앵커 태그 정보를 추출하여 작성한 매핑테이블을 나타낸 도면.
도 6은 본 발명의 일 실시예에 따른 폼 태그 정보가 표시된 주소줄을 포함하는 웹 문서를 나타낸 도면.
도 7은 본 발명의 일 실시예에 따른 가중치 산정 방법을 이용하여 핵심어의 순위를 나타낸 사용자 프로파일을 나타낸 도면.
도 8은 본 발명의 일 실시예에 따른 컨텐츠 제공 장치가 사용자 단말로부터 사용자 취향정보를 제공받는 방법을 나타낸 순서도.
도 9는 본 발명의 일 실시예에 따른 사용자 단말에서 사용자 취향정보를 제공하는 방법을 나타낸 순서도.
<도면의 주요부분에 대한 부호의 설명>
100: 네트워크 110: 사용자 단말
120: 컨텐츠 제공 장치 130: 온톨로지 서버
210: 질의어 수신부 220: 컨텐츠 검색부
230: 사용자 취향정보 요청부 240: 사용자 취향정보 수집부
250: 컨텐츠 순위 결정부 260: 컨텐츠 제공부
270: 저장부

Claims (22)

  1. 사용자의 검색 질의어와 관련된 컨텐츠 세트를 검색하는 컨텐츠 검색부;
    네트워크를 통해 사용자 단말로 사용자 프로파일, 태그 정보를 포함하는 사용자 취향정보를 요청하는 사용자 취향정보 요청부 -상기 사용자 프로파일은 상기 사용자 단말에서 수집한 핵심어 및 핵심어 별로 부여된 가중치를 반영한 점수를 포함함-;
    상기 사용자 단말로부터 사용자 취향정보를 제공 받는 사용자 취향정보 수집부;
    상기 사용자 취향정보와의 관련성에 따라 상기 컨텐츠 세트의 순위를 결정하는 컨텐츠 순위 결정부; 및
    상기 순위화된 컨텐츠 세트를 상기 사용자 단말로 제공하는 컨텐츠 제공부를 포함하는 사용자 맞춤형 컨텐츠 제공 장치.
  2. 제1항에 있어서,
    상기 핵심어는 상기 사용자 단말에 출력된 웹 문서에 포함된 앵커 태그(anchor tag), 폼 태그(form tag) 및 이들의 조합 중 하나 이상의 태그로부터 추출된 태그 정보를 이용하여 검출하는 것을 특징으로 하는 컨텐츠 제공 장치.
  3. 제2항에 있어서,
    상기 태그 정보는
    앵커 텍스트 및 그와 연결된 URL을 포함하는 앵커 태그 정보와 질의어 및 그와 연결된 URL을 포함하는 폼 태그 정보를 포함하는 것을 특징으로 컨텐츠 제공 장치.
  4. 제2항에 있어서,
    상기 핵심어는 웹 문서에 포함된 태그 정보의 전부 또는 일부를 기록한 매핑테이블에 포함된 단어들 및 질의어로부터 불용어를 제외시킴으로써 검출되는 것을 특징으로 하는 컨텐츠 제공 장치.
  5. 제 1항에 있어서,
    상기 가중치는 핵심어의 출현 빈도가 증가함에 따라 가산되는 것을 특징으로 하는 컨텐츠 제공 장치.
  6. 제 4항에 있어서,
    상기 가중치는 매핑테이블 또는 사용자 프로파일에 존재함에도 불구하고 사용자가 선택하지 않은 핵심어에 대하여 감산되는 것을 특징으로 하는 컨텐츠 제공 장치.
  7. 제1항에 있어서,
    상기 사용자 프로파일에 포함되는 핵심어는 상기 가중치에 따른 점수에 상응하게 순위화되는 것을 특징으로 하는 컨텐츠 제공 장치.
  8. 제1항에 있어서,
    상기 사용자 프로파일에 포함되는 핵심어는 N(N은 자연수) 순위까지로 제한되는 것을 특징으로 하는 컨텐츠 제공 장치.
  9. 제1항에 있어서,
    상기 사용자 단말로부터 상기 검색 질의어를 수신하는 질의어 수신부를 더 포함하는 컨텐츠 제공 장치.
  10. 사용자의 검색 질의어와 관련된 컨텐츠 세트를 검색하는 컨텐츠 검색부;
    네트워크를 통해 사용자 단말로 웹 문서에 포함된 앵커 태그(anchor tag), 폼 태그(form tag) 및 이들의 조합 중 하나 이상의 태그로부터 추출된 태그 정보를 포함하는 사용자 취향정보를 요청하는 사용자 취향정보 요청부;
    상기 사용자 단말로부터 사용자 취향정보를 제공 받는 사용자 취향정보 수집부;
    상기 사용자 취향정보를 이용하여 사용자 프로파일을 생성하는 사용자 프로파일 생성부-상기 사용자 프로파일은 핵심어 및 핵심어 별로 부여된 가중치를 반영한 점수를 포함함-;
    상기 사용자 프로파일을 포함하는 사용자 취향정보와의 관련성에 따라 상기 컨텐츠 세트의 순위를 결정하는 컨텐츠 순위 결정부; 및
    상기 순위화된 컨텐츠 세트를 상기 사용자 단말로 제공하는 컨텐츠 제공부를 포함하는 사용자 맞춤형 컨텐츠 제공 장치.
  11. 제10항에 있어서,
    상기 핵심어는 상기 사용자 단말에 출력된 웹 문서에 포함된 앵커 태그(anchor tag), 폼 태그(form tag) 및 이들의 조합 중 하나 이상의 태그로부터 추출된 태그 정보를 이용하여 검출하는 것을 특징으로 하는 컨텐츠 제공 장치.
  12. 사용자의 검색 질의어와 관련된 컨텐츠 세트를 검색하는 단계;
    상기 사용자 단말로 사용자 프로파일을 포함하는 사용자 취향정보를 요청하는 단계 -상기 사용자 프로파일은 상기 사용자 단말에서 수집한 핵심어 및 핵심어 별로 부여된 가중치를 반영한 점수를 포함함-;
    상기 사용자 단말로부터 사용자 취향정보를 제공 받는 단계;
    상기 사용자 취향정보에 따라 상기 컨텐츠 세트의 순위를 결정하는 단계; 및
    상기 순위화된 컨텐츠 세트를 상기 사용자 단말로 제공하는 단계;를 포함하는 사용자 맞춤형 컨텐츠 제공 방법.
  13. 제12항에 있어서,
    상기 핵심어는 상기 사용자 단말에 출력된 웹 문서에 포함된 앵커 태그(anchor tag), 폼 태그(form tag) 및 이들의 조합 중 하나 이상의 태그로부터 추출된 태그 정보를 이용하여 검출하는 것을 특징으로 하는 컨텐츠 제공 방법.
  14. 제13항에 있어서,
    상기 태그 정보는
    앵커 텍스트 및 그와 연결된 URL을 포함하는 앵커 태그 정보와 질의어 및 그 와 연결된 URL을 포함하는 폼 태그 정보를 포함하는 것을 특징으로 하는 컨텐츠 제공 방법.
  15. 제13항에 있어서,
    상기 핵심어는 웹 문서에 포함된 태그 정보의 전부 또는 일부를 기록한 매핑테이블에 포함된 단어들 및 질의어로부터 불용어를 제외시킴으로써 검출되는 것을 특징으로 하는 컨텐츠 제공 방법.
  16. 제12항에 있어서,
    상기 가중치는 핵심어의 출현 빈도가 증가함에 따라 가산되는 것을 특징으로 하는 컨텐츠 제공 방법.
  17. 제15항에 있어서,
    상기 가중치는 매핑테이블 또는 사용자 프로파일에 존재함에도 불구하고 사용자가 선택하지 않은 핵심어에 대하여 감산되는 것을 특징으로 하는 컨텐츠 제공 방법.
  18. 제12항에 있어서,
    상기 사용자 프로파일에 포함되는 핵심어는 상기 가중치에 따른 점수에 상응하게 순위화되는 것을 특징으로 하는 컨텐츠 제공 방법.
  19. 제12항에 있어서,
    상기 사용자 프로파일에 포함되는 핵심어는 N(N은 자연수) 순위까지로 제한되는 것을 특징으로 하는 컨텐츠 제공 방법.
  20. 사용자의 검색 질의어와 관련된 컨텐츠 세트를 검색하는 단계;
    네트워크를 통해 사용자 단말로 웹 문서에 포함된 앵커 태그(anchor tag), 폼 태그(form tag) 및 이들의 조합 중 하나 이상의 태그로부터 추출된 태그 정보를 포함하는 사용자 취향정보를 요청하는 단계;
    상기 사용자 단말로부터 사용자 취향정보를 제공 받는 단계;
    상기 사용자 취향정보를 이용하여 사용자 프로파일을 생성하는 단계 -상기 사용자 프로파일은 핵심어 및 핵심어 별로 부여된 가중치를 반영한 점수를 포함함-;
    상기 사용자 프로파일을 포함하는 사용자 취향정보와의 관련성에 따라 상기 컨텐츠 세트의 순위를 결정하는 단계; 및
    상기 순위화된 컨텐츠 세트를 상기 사용자 단말로 제공하는 단계를 포함하는 사용자 맞춤형 컨텐츠 제공 방법.
  21. 제20항에 있어서,
    상기 핵심어는 상기 사용자 단말에 출력된 웹 문서에 포함된 앵커 태그(anchor tag), 폼 태그(form tag) 및 이들의 조합 중 하나 이상의 태그로부터 추출된 태그 정보를 이용하여 검출하는 것을 특징으로 하는 컨텐츠 제공 방법.
  22. 제12항 내지 제21항 중 어느 한 항의 방법에 의하여 디지털 처리 장치에서 실행 가능한 명령어들이 구현되어 있으며 디지털 처리 장치에 의해 판독될 수 있는 프로그램이 기록된 기록 매체.
KR1020070069829A 2007-07-11 2007-07-11 사용자 맞춤형 컨텐츠 제공 장치, 그 방법 및 기록매체 KR20090006464A (ko)

Priority Applications (2)

Application Number Priority Date Filing Date Title
KR1020070069829A KR20090006464A (ko) 2007-07-11 2007-07-11 사용자 맞춤형 컨텐츠 제공 장치, 그 방법 및 기록매체
US12/040,746 US8639687B2 (en) 2007-07-11 2008-02-29 User-customized content providing device, method and recorded medium

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020070069829A KR20090006464A (ko) 2007-07-11 2007-07-11 사용자 맞춤형 컨텐츠 제공 장치, 그 방법 및 기록매체

Publications (1)

Publication Number Publication Date
KR20090006464A true KR20090006464A (ko) 2009-01-15

Family

ID=40253986

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020070069829A KR20090006464A (ko) 2007-07-11 2007-07-11 사용자 맞춤형 컨텐츠 제공 장치, 그 방법 및 기록매체

Country Status (2)

Country Link
US (1) US8639687B2 (ko)
KR (1) KR20090006464A (ko)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2011052985A3 (en) * 2009-10-30 2011-09-29 Samsung Electronics Co., Ltd. Mobile device, content delivery apparatus, content providing apparatus and control method thereof
KR101308179B1 (ko) * 2010-05-13 2013-09-16 경희대학교 산학협력단 사용자 얼굴 인식을 통한 개인화 광고 방법

Families Citing this family (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100913902B1 (ko) * 2007-05-25 2009-08-26 삼성전자주식회사 지그비 개인영역 네트워크에서 이동통신 단말기를 이용하여데이터를 송수신하는 통신방법 및 그를 위한 통신 시스템
KR101063287B1 (ko) * 2008-06-10 2011-09-07 삼성전자주식회사 위치 정보를 이용한 서비스 정보 제공 방법 및 시스템
CN102473183A (zh) * 2009-07-14 2012-05-23 索尼公司 内容推荐系统、内容推荐方法、内容推荐设备以及信息存储介质
US9251524B2 (en) 2009-11-25 2016-02-02 Telefonaktiebolaget L M Ericsson (Publ) System and methods for updating user profiles and providing selected documents to users
US20120130969A1 (en) * 2010-11-18 2012-05-24 Microsoft Corporation Generating context information for a search session
CN102968417B (zh) * 2011-09-01 2016-09-28 阿里巴巴集团控股有限公司 一种应用于计算机网络中的搜索方法和系统
US9218417B2 (en) 2011-11-02 2015-12-22 Microsoft Technology Licensing, Llc Ad-hoc queries integrating usage analytics with search results
US9466065B2 (en) 2011-11-02 2016-10-11 Microsoft Technology Licensing, Llc Integrating usage information with operation of a system
US10402299B2 (en) 2011-11-02 2019-09-03 Microsoft Technology Licensing, Llc Configuring usage events that affect analytics of usage information
US20140129973A1 (en) * 2012-11-08 2014-05-08 Microsoft Corporation Interaction model for serving popular queries in search box
US8977698B2 (en) * 2012-11-30 2015-03-10 Cisco Technology, Inc. Tagging content within a networking environment based upon recipients receiving the content
US9965474B2 (en) * 2014-10-02 2018-05-08 Google Llc Dynamic summary generator
US10061818B2 (en) * 2015-11-02 2018-08-28 International Business Machines Corporation Rank-based calculation for keyword searches
CN105404680A (zh) * 2015-11-25 2016-03-16 百度在线网络技术(北京)有限公司 一种搜索推荐方法及装置

Family Cites Families (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7693827B2 (en) 2003-09-30 2010-04-06 Google Inc. Personalization of placed content ordering in search results
KR100645608B1 (ko) 2004-03-25 2006-11-13 (주)첫눈 사용자 방문 유알엘 로그를 이용한 정보 검색 서비스 제공 서버 및 그 방법
WO2007001247A2 (en) 2004-06-02 2007-01-04 Yahoo! Inc. Content-management system for user behavior targeting
US8078602B2 (en) * 2004-12-17 2011-12-13 Claria Innovations, Llc Search engine for a computer network
US7440968B1 (en) * 2004-11-30 2008-10-21 Google Inc. Query boosting based on classification
US20060253421A1 (en) * 2005-05-06 2006-11-09 Fang Chen Method and product for searching title metadata based on user preferences
US8442973B2 (en) * 2006-05-02 2013-05-14 Surf Canyon, Inc. Real time implicit user modeling for personalized search
US8392446B2 (en) * 2007-05-31 2013-03-05 Yahoo! Inc. System and method for providing vector terms related to a search query
US20090089278A1 (en) * 2007-09-27 2009-04-02 Krishna Leela Poola Techniques for keyword extraction from urls using statistical analysis

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2011052985A3 (en) * 2009-10-30 2011-09-29 Samsung Electronics Co., Ltd. Mobile device, content delivery apparatus, content providing apparatus and control method thereof
US9247421B2 (en) 2009-10-30 2016-01-26 Samsung Electronics Co., Ltd Mobile device, content delivery apparatus, content providing apparatus and control method thereof
KR101308179B1 (ko) * 2010-05-13 2013-09-16 경희대학교 산학협력단 사용자 얼굴 인식을 통한 개인화 광고 방법

Also Published As

Publication number Publication date
US20090019033A1 (en) 2009-01-15
US8639687B2 (en) 2014-01-28

Similar Documents

Publication Publication Date Title
KR20090006464A (ko) 사용자 맞춤형 컨텐츠 제공 장치, 그 방법 및 기록매체
KR101103766B1 (ko) 태그 정보를 이용하여 사용자 취향정보를 수집하는 단말기기, 그 방법 및 기록매체
JP5608286B2 (ja) 無限ブラウズ
US8650483B2 (en) Method and apparatus for improving the readability of an automatically machine-generated summary
US9367588B2 (en) Method and system for assessing relevant properties of work contexts for use by information services
JP5572596B2 (ja) 検索結果内におけるプレーストコンテンツの順序付けのパーソナライズ
US20050222989A1 (en) Results based personalization of advertisements in a search engine
JP5084858B2 (ja) サマリ作成装置、サマリ作成方法及びプログラム
JP4962945B2 (ja) ブックマーク・タグ設定装置
US20090313220A1 (en) Expansion of Search Result Information
KR100896614B1 (ko) 검색 시스템 및 방법
JP2008537810A (ja) 検索方法及び検索システム
JP2015525929A (ja) 検索品質を改善するための重みベースのステミング
KR101074578B1 (ko) 검색 데이터베이스 관리 방법 및 장치
KR100455439B1 (ko) 인터넷 자원의 도메인화와 확장 사이트맵을 이용한정보검색 및 브라우징방법
TWI399657B (zh) A provider, a method of providing information, a program, and an information recording medium
US20230061394A1 (en) Systems and methods for dynamic hyperlinking
AU2012202738A1 (en) Results based personalization of advertisements in a search engine
KR20080060462A (ko) 검색 시스템 및 방법
Jatowt et al. Browsing Assistant for Changing Pages

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E601 Decision to refuse application