KR20120026682A - 이동통신 단말기에서 인터넷 서비스 제공 방법 및 장치 - Google Patents

이동통신 단말기에서 인터넷 서비스 제공 방법 및 장치 Download PDF

Info

Publication number
KR20120026682A
KR20120026682A KR1020100088709A KR20100088709A KR20120026682A KR 20120026682 A KR20120026682 A KR 20120026682A KR 1020100088709 A KR1020100088709 A KR 1020100088709A KR 20100088709 A KR20100088709 A KR 20100088709A KR 20120026682 A KR20120026682 A KR 20120026682A
Authority
KR
South Korea
Prior art keywords
word vector
subject
text
service
determining
Prior art date
Application number
KR1020100088709A
Other languages
English (en)
Other versions
KR101712988B1 (ko
Inventor
이정수
이상근
하종우
이정현
심규선
Original Assignee
삼성전자주식회사
고려대학교 산학협력단
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 삼성전자주식회사, 고려대학교 산학협력단 filed Critical 삼성전자주식회사
Priority to KR1020100088709A priority Critical patent/KR101712988B1/ko
Priority to US13/229,022 priority patent/US9152723B2/en
Publication of KR20120026682A publication Critical patent/KR20120026682A/ko
Priority to US14/875,669 priority patent/US20160036928A1/en
Application granted granted Critical
Publication of KR101712988B1 publication Critical patent/KR101712988B1/ko

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/50Network services
    • H04L67/51Discovery or management thereof, e.g. service location protocol [SLP] or web services
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04WWIRELESS COMMUNICATION NETWORKS
    • H04W8/00Network data management
    • H04W8/18Processing of user or subscriber data, e.g. subscribed services, user preferences or user profiles; Transfer of user or subscriber data
    • H04W8/20Transfer of user or subscriber data
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/10Office automation; Time management
    • G06Q10/107Computer-aided management of electronic mailing [e-mailing]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9535Search customisation based on user profiles and personalisation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/01Protocols
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/50Network services
    • H04L67/535Tracking the activity of the user
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04WWIRELESS COMMUNICATION NETWORKS
    • H04W4/00Services specially adapted for wireless communication networks; Facilities therefor
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04WWIRELESS COMMUNICATION NETWORKS
    • H04W8/00Network data management
    • H04W8/18Processing of user or subscriber data, e.g. subscribed services, user preferences or user profiles; Transfer of user or subscriber data
    • H04W8/183Processing at user equipment or user record carrier

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Strategic Management (AREA)
  • Theoretical Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Human Resources & Organizations (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Accounting & Taxation (AREA)
  • Finance (AREA)
  • Development Economics (AREA)
  • Economics (AREA)
  • Marketing (AREA)
  • General Business, Economics & Management (AREA)
  • Data Mining & Analysis (AREA)
  • Signal Processing (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Computer Hardware Design (AREA)
  • General Engineering & Computer Science (AREA)
  • Tourism & Hospitality (AREA)
  • Operations Research (AREA)
  • Quality & Reliability (AREA)
  • Game Theory and Decision Science (AREA)
  • Information Transfer Between Computers (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

본 발명은 이동통신 단말기에서 인터넷 서비스 제공 방법 및 장치에 관한 것으로서, 이동통신 단말기에서 인터넷 서비스 제공 방법은, 상기 이동통신 단말기 내에 존재하는 사용자 데이터로부터 사용자 관심 주제를 결정하는 과정과, 네트워크 접속을 통해 서비스 항목을 수집하는 과정과, 상기 수집된 서비스 항목들 각각에 대한 주제를 결정하는 과정과, 상기 사용자 관심 주제와 상기 서비스 항목들 각각의 연관성을 결정하는 과정과, 상기 연관성에 따라 서비스 항목을 추천하는 과정을 포함하여, 사용자의 관심 주제에 대한 별도의 입력 없이도 상기 이동통신 단말기 내의 데이터를 기반으로 사용자 관심 주제를 분석하여 연관된 인터넷 서비스 항목을 추천할 수 있다.

Description

이동통신 단말기에서 인터넷 서비스 제공 방법 및 장치{METHOD AND APPARATUS PROVIDING FOR INTERNET SERVICE IN MOBILE COMMUNICATION TERMINAL}
본 발명은 이동통신 단말기에서 인터넷 서비스를 제공하는 방법 및 장치에 관한 것으로서, 특히 이동통신 단말기의 사용자 데이터를 분석하여 서비스를 추천하는 방법 및 장치에 관한 것이다.
이동통신 기술이 급격하게 발달함에 따라 이동통신 단말기를 통한 다양한 서비스가 제공되고 있다. 특히, 최근에는 이동통신 단말기에서 사용자의 관심 분야를 고려하여 해당 분야에 대한 정보를 제공하는 서비스 즉, 온 디맨드 방식의 개인화된 정보 서비스가 제공되고 있다.
도 1은 종래 기술에 따른 온 디맨드 방식의 개인화된 정보 서비스 제공 방식을 도시하고 있다. 상기 도 1에 도시된 바와 같이, 종래의 개인화된 정보 서비스는 이동통신 단말기(100)에서 사용자 정보 저장 서버(102)에 사용자 관심 분야를 등록하면(110단계), 상기 사용자 정보 서버(102)가 상기 등록된 사용자 관심 분야를 개인화된 정보 제공 서버(104)로 제공하여 상기 개인화된 정보 제공 서버(104)에서 상기 사용자 관심 분야에 해당하는 서비스 정보들을 검색한 후, 검색된 서비스 정보들을 상기 이동통신 단말기(100)로 제공하는(112단계) 방식으로 이루어진다.
상기와 같이, 종래의 개인화된 정보 서비스는 이동통신 단말기에서 사용자의 관심 분야를 서버에 미리 등록해야만 한다. 즉, 종래의 개인화된 정보 서비스는 상기 이동통신 단말기에서 해당 서버에 사용자의 관심 분야를 미리 등록하지 않은 경우, 원하는 정보를 제공받을 수 없는 단점이 있다. 또한, 상기 종래의 개인화된 정보 서비스는 사용자가 자신의 관심 분야가 변경될 때마다 상기 서버에 변경된 관심 분야를 직접 등록해야 하므로, 상기 사용자 입장에서 번거롭고 불편한 문제점이 있다.
본 발명은 상술한 바와 같은 문제점을 해결하기 위해 도출된 것으로서, 본 발명의 목적은 이동통신 단말기에서 사용자 데이터를 분석하여 인터넷 서비스를 추천하는 방법 및 장치를 제공함에 있다.
본 발명의 또 다른 목적은 이동통신 단말기에서 사용자 데이터로부터 사용자 관심 주제를 결정하고, 인터넷 서비스 항목을 수집하여 서비스 항목의 주제를 결정하여 상기 사용자 관심 주제에 대응하는 서비스 항목을 추천하는 방법 및 장치를 제공함에 있다.
본 발명의 또 다른 목적은 이동통신 단말기에서 사용자 데이터와 서비스 항목 각각으로부터 단어 벡터를 추출하여 각각의 단어 벡터 간의 구문론적 유사도를 결정하는 방법 및 장치를 제공함에 있다.
본 발명의 또 다른 목적은 이동통신 단말기에서 사용자 데이터와 서비스 항목 각각으로부터 주제를 추출하여 각각의 주제 간의 의미론적 유사도를 결정하는 방법 및 장치를 제공함에 있다.
본 발명의 또 다른 목적은 이동통신 단말기에서 사용자 관심 주제와 서비스 항목 주제 간의 유사도를 계산하고, 상기 유사도에 따라 서비스를 추천하는 방법 및 장치를 제공함에 있다.
본 발명의 또 다른 목적은 이동통신 단말기에서 주제 분류 트리의 각 카테고리에 대해 카테고리들 간의 계층적 구조의 특징을 반영하는 단어 벡터를 계산하는 방법 및 장치를 제공함에 있다.
본 발명의 또 다른 목적은 이동통신 단말기에서 주제 분류 트리의 각 카테고리에 대해 다른 카테고리들에 대한 연관성을 결정하고, 상기 연관성을 바탕으로 사용자 관심 주제에 대응하는 서비스를 추천하는 방법 및 장치를 제공함에 있다.
상술한 목적들을 달성하기 위한 본 발명의 제 1 견지에 따르면, 이동통신 단말기에서 인터넷 서비스 제공 방법은, 상기 이동통신 단말기 내에 존재하는 사용자 데이터로부터 사용자 관심 주제를 결정하는 과정과, 네트워크 접속을 통해 서비스 항목을 수집하는 과정과, 상기 수집된 서비스 항목들 각각에 대한 주제를 결정하는 과정과, 상기 사용자 관심 주제와 상기 서비스 항목들 각각의 연관성을 결정하는 과정과, 상기 연관성에 따라 서비스 항목을 추천하는 과정을 포함하는 것을 특징으로 한다.
상술한 목적들을 달성하기 위한 본 발명의 제 2 견지에 따르면, 이동통신 단말기에서 인터넷 서비스 제공 장치는, 상기 이동통신 단말기 내에 존재하는 사용자 데이터로부터 사용자 관심 주제를 결정하는 사용자 관심 주제 추출부와, 네트워크 접속을 통해 서비스 항목을 수집하고, 수집된 서비스 항목들 각각에 대한 주제를 결정하는 서비스 항목 수집 및 분류부와, 상기 사용자 관심 주제와 상기 서비스 항목들 각각의 연관성을 결정하는 서비스 항목 랭킹부와, 상기 연관성에 따라 서비스 항목을 추천하는 서비스 추천부를 포함하는 것을 특징으로 한다.
본 발명은 이동통신 단말기에서 사용자 데이터로부터 사용자 관심 주제를 결정하고 인터넷 서비스 항목을 수집하여 서비스 항목의 주제를 결정한 후, 사용자 관심 주제와 서비스 항목 주제 간의 유사도를 계산하여 상기 유사도에 따라 서비스를 추천함으로써, 상기 사용자의 관심 주제에 대한 별도의 입력 없이도 상기 이동통신 단말기 내의 데이터를 기반으로 사용자 관심 주제를 분석하여 연관된 인터넷 서비스 항목을 추천할 수 있는 효과가 있다. 또한, 상기 이동통신 단말기 내의 데이터를 기반으로 사용자 관심 주제를 분석하기 때문에, 시시각각 변경되는 사용자의 관심 주제에 적절하게 대응하여 적합한 인터넷 서비스 항목을 추천할 수 있는 효과가 있다. 또한, 상기 이동통신 단말기에서 사용자 개인의 정보를 네트워크를 통해 외부로 전송하거나 서버에 저장하지 않고 상기 이동통신 단말기 내의 데이터를 기반으로 사용자 관심 주제를 분석하여 적합한 인터넷 서비스 항목을 추천함으로써, 사용자 개인의 데이터를 보호할 수 있는 효과가 있다.
도 1은 종래 기술에 따른 온 디맨드 방식의 개인화된 정보 서비스 제공 방식을 도시하는 도면,
도 2는 본 발명에 따라 개인화된 정보 서비스를 제공하기 위한 이동통신 단말기의 블록 구성을 도시하는 도면,
도 3은 본 발명의 실시 예에 따른 이동통신 단말기에서 사용자 관심주제 결정부의 상세한 블록 구성을 도시하는 도면,
도 4는 본 발명의 실시 예에 따른 이동통신 단말기에서 서비스 항목 수집 및 분류부의 상세한 블록 구성을 도시하는 도면,
도 5는 본 발명의 실시 예에 따른 이동통신 단말기에서 서비스 항목 랭킹부의 상세한 블록 구성을 도시하는 도면,
도 6은 본 발명의 실시 예에 따른 이동통신 단말기에서 사용자 데이터를 도시하는 도면,
도 7은 본 발명의 실시 예에 따른 이동통신 단말기에서 생성한 XML 파일을 도시하는 도면,
도 8은 본 발명의 실시 예에 따른 이동통신 단말기에서 사용자 데이터를 기반으로 판단한 사용자 관심 주제를 도시하는 도면,
도 9는 본 발명의 실시 예에 따른 이동통신 단말기에서 수집하는 인터넷 서비스 항목의 예를 도시하는 도면,
도 10은 본 발명의 실시 예에 따른 이동통신 단말기에서 서비스 항목의 주제들 간의 유사도를 도시하는 도면,
도 11은 본 발명의 실시 예에서 두번 째 순회 패턴을 따를 때 상기 twij 값을 구하는 방법을 도시하는 도면,
도 12는 본 발명의 실시 예에 따른 이동통신 단말기에서 서비스 항목을 추천하는 화면 구성을 도시하는 도면, 및
도 13은 본 발명의 실시 예에 따른 이동통신 단말기에서 사용자 관심 주제에 따라 서비스 항목을 추천하는 절차를 도시하는 도면.
이하 본 발명의 바람직한 실시 예를 첨부된 도면을 참조하여 설명한다. 그리고, 본 발명을 설명함에 있어서, 관련된 공지기능 혹은 구성에 대한 구체적인 설명이 본 발명의 요지를 불필요하게 흐릴 수 있다고 판단된 경우 그 상세한 설명은 생략할 것이다. 또한, 후술되는 용어들은 본 발명에서의 기능을 고려하여 정의된 용어들로서 이는 사용자, 운용자의 의도 또는 관례 등에 따라 달라질 수 있다. 그러므로 그 정의는 본 명세서 전반에 걸친 내용을 토대로 내려져야 할 것이다.
이하 본 발명에서는 본 발명의 다른 목적은 이동통신 단말기에서 사용자 데이터를 분석하여 서비스를 추천하는 방법 및 장치에 관해 설명할 것이다.
도 2는 본 발명에 따라 개인화된 정보 서비스를 제공하기 위한 이동통신 단말기의 블록 구성을 도시하고 있다.
상기 도 2를 참조하면, 이동통신 단말기(200)는 사용자 관심 주제 결정부(210), 서비스 항목 수집 및 분류부(220), 서비스 항목 랭킹부(230) 및 개인화된 서비스 추천부(240)를 포함하여 구성된다.
상기 사용자 관심 주제 결정부(210)는 상기 이동통신 단말기 내에 존재하는 사용자 데이터를 분석하여 사용자 관심 주제를 결정한다. 여기서, 상기 사용자 데이터는 상기 이동통신 단말기 내에 존재하는 단문 메시지, 멀티미디어 메시지, 이메일, 파일, 스케줄, 메모 및 웹 사용 정보 등과 같은 데이터들을 의미한다. 즉, 상기 사용자 관심 주제 결정부(210)는 상기 이동통신 단말기 내에 존재하는 사용자 데이터로부터 텍스트를 추출하고, 텍스트를 분석하여 단어 벡터를 생성한 후, 상기 단어 벡터를 상기 이동통신 단말기에 임베디드된 주제 분류 트리에 따라 분류하여 사용자 관심 주제를 결정한다. 여기서, 상기 주제 분류 트리는 사용자의 관심 분야를 나타내기에 적합한 개념들을 주제별로 분류하여 트리 구조로 나타낸 것으로서, 종래에 잘 알려진 오픈 디렉토리 프로젝트(Open Directory Project)일 수 있다. 물론, 일반적인 오픈 디렉토리 프로젝트는 웹 디렉토리인 만큼 광범위하기 때문에, 상기 오픈 디렉토리 프로젝트에서 사용자 관심 분야를 나타내기에 적합한 일부 카테고리들만을 추출하여 사용할 수 있을 것이다. 상기 사용자 관심 주제 결정부(210)는 하기에서 도 3을 참조하여 상세히 설명하기로 한다.
상기 서비스 항목 수집 및 분류부(220)는 인터넷(202)에 접속하여 인터넷 서비스 항목을 수집하고, 수집한 서비스 항목들의 텍스트를 분석하여 단어 벡터를 생성한 후, 상기 단어 벡터를 상기 이동통신 단말기에 임베디드된 주제 분류 트리에 따라 분류하여 상기 수집된 서비스 항목들 각각의 주제를 결정한다. 상기 서비스 항목 수집 및 분류부(220)는 하기에서 도 4를 참조하여 상세히 설명하기로 한다.
상기 서비스 항목 랭킹부(230)는 상기 사용자 데이터에 대한 단어 벡터와 사용자 관심 주제 및 상기 서비스 항목에 대한 단어 벡터와 서비스 항목 주제들을 이용하여 구문론적 유사도와 의미론적 유사도를 결정하고, 상기 구문론적 유사도와 의미론적 유사도를 이용하여 상기 사용자 관심 주제와 서비스 항목 주제에 대한 전체 유사도를 결정하여 상기 사용자 관심 주제에 대한 서비스 항목 각각의 연관성 순위를 계산한다. 상기 서비스 항목 랭킹부(230)는 하기에서 도 5를 참조하여 상세히 설명하기로 한다.
상기 개인화된 서비스 추천부(240)는 서비스 항목 추천 이벤트가 발생될 시, 화면을 통해 추천 서비스 항목의 종류를 선택하는 창을 디스플레이하고, 서비스 항목의 종류가 선택되면, 상기 서비스 항목 랭킹부(230)에서 계산된 연관성 순위를 고려하여 상기 선택된 종류에 해당하는 서비스 항목들을 결정하고, 결정된 서비스 항목들을 포함하는 목록을 화면에 디스플레이하기 위한 기능을 제어한다. 또한, 상기 개인화된 서비스 추천부(240)는 추천한 서비스 항목들 중 어느 하나의 서비스 항목이 선택되는 경우, 해당 서비스 항목의 상세 내용을 화면에 디스플레이하기 위한 기능을 제어 및 처리한다. 예를 들어, 상기 개인화된 서비스 추천부(240)는 도 12에 도시된 바와 같이, 뉴스 혹은 모바일 앱 중에서 어떤 종류의 서비스 항목을 추천받을 것인지 선택하는 창을 디스플레이하고, 사용자로부터 모바일 앱이 선택되면 사용자 관심 주제와 연관성이 큰 모바일 앱 서비스들을 포함하는 목록을 디스플레이한 후, 사용자에 의해 선택된 모바일 앱 서비스에 대한 상세 정보를 화면에 디스플레이하기 위한 기능을 제어 및 처리한다.
그러면, 하기에서 도 3 내지 도 5를 참조하여 상기 이동통신 단말기의 상세한 구성에 대하여 살펴보기로 한다.
도 3은 본 발명의 실시 예에 따른 이동통신 단말기에서 사용자 관심주제 결정부의 상세한 블록 구성을 도시하고 있다.
상기 도 3을 참조하면, 상기 사용자 관심 주제 결정부(210)는 사용자 데이터 텍스트 추출부(310), 사용자 데이터 텍스트 분석부(320) 및 사용자 데이터 단어 벡터 분류부(330)를 포함하여 구성된다.
상기 사용자 데이터 텍스트 추출부(310)는 상기 이동통신 단말기 내에 존재하는 사용자 데이터로부터 사용자 관심 주제를 나타내는 텍스트를 추출한다. 예를 들어, 상기 사용자 데이터 텍스트 추출부(310)는 도 6에 도시된 바와 같이 이동통신 단말기 내에 저장된 단문 메시지, 멀티미디어 메시지, 이메일, 파일, 스케줄, 메모 및 웹 사용 정보 등으로부터 텍스트를 추출할 수 있다. 이때, 상기 사용자 데이터 텍스트 추출부(310)는 상기 추출된 텍스트에 대한 생성 시간, 생성 위치, 해당 어플리케이션의 메타 정보를 함께 추출하여 XML 형태로 저장한다. 여기서, 상기 어플리케이션의 메타 정보는 어플리케이션의 종류, 특징, 수정 시간, 생성 시간 및 문맥 정보 중 적어도 하나를 포함한다. 여기서, 상기 문맥 정보는 사용자 데이터 텍스트 분석부(320)에서 단어 벡터 생성 시에 가중치를 적용하기 위해 활용할 수 있다. 즉, 상기 사용자 데이터 텍스트 추출부(310)는 상기 도 6에 도시된 바와 같은 사용자 데이터로부터 텍스트를 추출하고, 이때 도 7에 도시된 바와 같은 XML 파일을 생성할 수 있다.
상기 사용자 데이터 텍스트 분석부(320)는 상기 사용자 데이터 텍스트 추출부(310)에서 추출된 텍스트 데이터를 분석하여 벡터 스페이스 모델(Vector Space Model)에 따른 단어 벡터(Term Vector)를 생성한다. 여기서, 상기 단어 벡터는 텍스트 데이터에 존재하는 개별적인 단어들로 이루어지며, 추출된 텍스트 내에서 각 단어들의 중요도에 따른 가중치를 반영하여 생성될 수 있다. 이때, 상기 각 단어들의 중요도에 따른 가중치는 추출된 텍스트 내에서의 빈도 수, 해당 텍스트의 생성 시간과 생성 위치를 고려하여 계산할 수 있다. 예를 들어, 상기 사용자 데이터 텍스트 분석부(320)는 상기 사용자 데이터 텍스트 추출부(310)로부터 제공된 텍스트들에서 특정 단어의 출현 빈도수가 높을 경우, 해당 단어를 사용자의 관심 주제를 표현하는 중요 단어로 판단하여 상기 해당 단어에 대한 가중치를 높게 설정할 수 있다. 또한, 상기 사용자 데이터 텍스트 분석부(320)는 종래에 알려진 TFIDF(Term Frequency Inverse Document Frequency) 가중치 할당 방식을 이용하여 각 단어들의 가중치를 설정할 수도 있고, 상기 사용자 데이터 텍스트 추출부(310)에서 생성된 XML 파일에 기록된 문맥 정보를 활용하여 가중치를 설정할 수 있다. 예를 들어, 상기 데이터 텍스트 분석부(320)는 상기 XML 파일에 기록된 문맥 정보 중에서 생성 시간을 바탕으로 최근에 생성된 단어들에 보다 높은 가중치를 설정할 수 있으며, 이를 통해 사용자의 최근 관심 주제를 반영할 수 있는 효과를 얻을 수 있다.
사용자 데이터 단어 벡터 분류부(330)는 상기 사용자 데이터 텍스트 분석부(320)에서 텍스트 내 단어들 각각에 대한 단어 벡터가 생성되면, 상기 이동통신 단말기에 임베디드된 주제 분류 트리(340)를 기반으로 상기 생성된 단어 벡터들을 분류하여 사용자 관심 주제를 결정한다. 여기서, 상기 주제 분류 트리(340)는 사용자의 관심 분야를 나타내기에 적합한 개념들을 주제별로 분류하여 트리 구조로 나타낸 것으로서, 종래에 사용되는 오픈 디렉토리 프로젝트(Open Directory Project)일 수 있다. 물론, 종래에 사용되는 일반적인 오픈 디렉토리 프로젝트는 웹 디렉토리인 만큼 광범위하기 때문에, 상기 오픈 디렉토리 프로젝트에서 사용자 관심 분야를 나타내기에 적합한 일부 카테고리들만을 추출하여 사용할 수 있을 것이다. 이때, 상기 주제 분류 트리(340)의 각 카테고리는 각 카테고리에 해당하는 웹 페이지들의 리스트를 포함할 수 있으며, 상기 웹 페이지들의 리스트는 해당 카테고리의 특성을 나타내는 단어들을 포함할 수 있을 것이다.
상기 사용자 데이터 단어 벡터 분류부(330)는 상기 주제 분류 트리(340)의 각 카테고리에 포함된 웹 페이지들의 리스트를 참조하여 단어 벡터 분류를 위한 기계학습을 수행할 수 있으며, 이때 기계학습 알고리즘으로는 종래에 잘 알려진 Rocchio, K-NN, NB, SVM 등을 이용할 수 있다. 예를 들어, 상기 사용자 데이터 단어 벡터 분류부(330)는 A 카테고리에 a,b,c 웹 페이지가 포함된 경우, a 웹 페이지에 해당하는 단어 벡터를 상기 A 카테고리로 분류하도록 학습될 것이다. 학습이 완료된 이후 사용자 데이터 단어 벡터가 입력되면, 상기 사용자 데이터 단어 벡터 분류부(330)는 상기 주제 분류 트리(340)를 참조하여 상기 사용자 데이터 단어 벡터가 해당하는 카테고리를 결정하여, 결정된 카테고리의 주제를 상기 사용자 데이터 단어 벡터에 대응되는 사용자 관심 주제로 결정할 수 있다. 예를 들어, 상기 사용자 데이터 단어 벡터 분류부(330)는 도 6에 도시된 바와 같은 사용자 데이터로부터 추출된 단어 벡터들을 분류하여 도 8에 도시된 바와 같이, 다섯 개의 카테고리로 분류하 사용자의 관심 주제로 결정할 수 있을 것이다.
도 4는 본 발명의 실시 예에 따른 이동통신 단말기에서 서비스 항목 수집 및 분류부의 상세한 블록 구성을 도시하고 있다.
상기 도 4를 참조하면, 상기 서비스 항목 수집 및 분류부(220)는 모바일 인터넷 서비스 항목 수집부(410), 서비스 항목 텍스트 분석부(420) 및 서비스 항목 단어 벡터 분류부(430)를 포함하여 구성된다.
상기 모바일 인터넷 서비스 항목 수집부(410)는 모바일 인터넷에 접속하여 사용자에게 추천 가능한 서비스 항목(예: 뉴스, 모바일 앱(Mobile APP))들을 수집한다. 예를 들어, 상기 모바일 인터넷 서비스 항목 수집부(410)는 도 9에 도시된 바와 같이 상기 이동통신 단말기의 운영환경에 적합한 모바일 앱 사이트에서 최신 모바일 앱 정보를 수집하고, 정보 수집이 가능한 뉴스 포털 사이트에서 최신 뉴스들을 수집한다. 이때, 상기 모바일 인터넷 서비스 항목 수집부(410)는 상기 사용자 관심 주제 결정부(210)에서 결정된 사용자 관심 주제를 이용하여 관련된 서비스 항목들을 수집할 수 있다.
상기 서비스 항목 텍스트 분석부(420)는 상기 모바일 인터넷 서비스 항목 수집부(410)에서 수집된 서비스 항목들로부터 텍스트를 추출하고, 추출된 텍스트를 분석하여 벡터 스페이스 모델에 따른 단어 벡터를 생성한다. 여기서, 상기 단어 벡터는 상기 수집된 서비스 항목들의 텍스트에 존재하는 개별적인 단어들로 이루어지며, 추출된 텍스트 내에서 각 단어들의 중요도에 따른 가중치를 반영한다. 이때, 상기 각 단어들의 중요도에 따른 가중치는 추출된 텍스트 내에서의 빈도 수, 해당 텍스트의 생성 시간과 생성 위치를 고려하여 계산할 수 있다. 즉, 상기 서비스 항목 텍스트 분석부(420)는 상기 사용자 데이터 텍스트 분석부(320)와 동일한 방식으로 상기 각 단어들의 중요도에 따른 가중치를 설정할 수 있을 것이다.
상기 서비스 항목 단어 벡터 분류부(430)는 상기 이동통신 단말기에 임베디드된 주제 분류 트리(440)를 기반으로 상기 서비스 항목 텍스트 분석부(420)에서 생성된 단어 벡터들을 분류하여 상기 수집된 서비스 항목들 각각의 주제를 결정한다. 여기서, 상기 서비스 항목 단어 벡터 분류부(430)는 상기 사용자 데이터 단어 벡터 분류부(330)와 동일한 방식으로 단어 벡터를 분류하여 해당 주제를 결정한다. 또한, 상기 서비스 항목 단어 벡터 분류부(430)에서 참조하는 주제 분류 트리(440)와 상기 사용자 데이터 단어 벡터 분류부(330)에서 참조되는 주제 분류 트리(340)는 동일한 주제 분류 트리이다.
도 5는 본 발명의 실시 예에 따른 이동통신 단말기에서 서비스 항목 랭킹부의 상세한 블록 구성을 도시하고 있다.
상기 도 5를 참조하면, 상기 서비스 항목 랭킹부(230)는 구문론적 매칭부(510)와 의미론적 매칭부(520) 및 통합 랭킹부(530)를 포함하여 구성된다.
상기 구문론적 매칭부(510)는 상기 사용자 데이터 텍스트 분석부(320)에서 생성된 단어 벡터와 상기 서비스 항목 텍스트 분석부(420)에서 생성된 단어 벡터들간의 구문론적 유사도를 계산한다. 상기 구문론적 매칭부(510)는 하기 수학식 1과 같이 벡터 스페이스 모델의 코사인 유사도를 계산함으로써, 사용자 데이터에 대한 단어 벡터와 서비스 항목에 대한 단어 벡터 간의 구문론적 유사도를 계산한다.
하기 수학식 1은 코사인 유사도 계산식을 나타낸다.
Figure pat00001
여기서,
Figure pat00002
는 사용자 데이터에 대한 단어 벡터를 나타내고, 는 서비스 항목에 대한 단어 벡터를 나타낸다.
상기 의미론적 매칭부(520)는 상기 사용자 데이터 단어 벡터 분류부(330)에서 추출된 사용자 관심 주제와 상기 서비스 항목 단어 벡터 분류부(430)에서 파악된 서비스 항목의 주제들 간의 의미론적 유사도를 계산한다. 상기 의미론적 매칭부(520)는 주제 분류 트리에서 각 카테고리들 간의 의미적 유사도를 나타내는 유사도 그래프(540)에 wPPR(weighted Personalized PageRank) 알고리즘을 적용하여 상기 사용자 관심 주제와 서비스 항목 주제들 간의 의미적 유사도를 계산한다. 여기서, 상기 유사도 그래프(540)는 상기 주제 분류 트리에서 각 카테고리들의 계층적 트리 구조를 카테고리들 사이의 의미적인 유사도에 따라 연결된 그래프 구조로 변환한 것으로서, 상기 유사도 그래프(540)의 각 노드는 상기 주제 분류 트리의 각 카테고리를 의미하며, 각 노드 간의 연결고리는 해당 카테고리 간에 의미론적 유사도가 존재함을 의미한다. 또한, 상기 wPPR 알고리즘은 종래에 잘 알려진 개인화된 페이지랭크(Personalized PageRank) 알고리즘에 가중치를 적용한 것으로서 하기에서 자세히 설명하기로 한다.
상기 유사도 그래프(540)의 각 노드들 간의 링크를 생성하는 방법은 하기와 같이 3 단계로 이루어진다. 상기 유사도 그래프(540)는 상기 의미론적 매칭부(520)에서 생성될 수도 있으며, 상기 이동통신 단말기의 다른 기능 블럭에서 생성될 수도 있을 것이다.
1 단계는 상기 주제 분류 트리의 각 카테고리에 대한 센트로이드 벡터(Centroid Vector)를 하기 수학식 2와 같이 계산하는 단계이다. 상기 센트로이드 벡터는 각 카테고리의 학습 데이터들을 대표하는 벡터로서, 학습 데이터들의 평균 단어 벡터이다. 여기서 상기 학습 데이터는 상기 사용자 데이터 단어 벡터 분류부(330) 혹은 서비스 항목 단어 벡터 분류부(430)의 기계학습 시에 사용된 오픈 디렉토리 프로젝트의 웹 페이지들 일 수 있다.
하기 수학식 2는 각 카테고리에 대한 센트로이드 벡터 계산식을 나타낸다.
Figure pat00004
여기서, 상기 c는 카테고리를 의미하며, 상기
Figure pat00005
는 카테코리 c의 센트로이드 벡터를 의미하고, Dc는 카테고리 c의 학습 데이터 집합을 의미하며,
Figure pat00006
는 학습 데이터 d에 대한 단어 벡터를 의미한다.
2 단계는 상기 주제 분류 트리의 각 카테고리에 대한 병합 센트로이드 벡터(Merge Centroid Vector)를 하기 수학식 3과 같이 계산하는 단계이다. 상기 병합 센트로이드 벡터는 상기 각 카테고리들의 센트로이드 벡터에 주제 분류 트리의 계층적 구조의 특징을 반영하여 나타낸다. 즉, 상기 센트로이드 벡터는 해당 카테고리에 대한 특징만을 포함하고 주제 분류 트리 내에서 카테고리들 간의 계층적 관계를 반영하지는 않으나, 상기 병합 센트로이드 벡터는 부모 카테고리가 자식 카테고리의 특징을 포함할 수 있도록 부모 카테고리의 센트로이드 벡터에 후손 카테고리의 센트로이드 벡터들의 특징을 포함시켜 나타낸다.
하기 수학식 3은 병합 센트로이드 벡터 계산식을 나타낸다.
Figure pat00007
여기서, 상기
Figure pat00008
는 카테고리 c에 대한 병합 센트로이드 벡터를 의미하고, child(c)는 카테고리 c의 자식 카테고리들의 집합을 의미하며,
Figure pat00009
는 카테고리 c에 대한 센트로이드 벡터를 의미한다.
3단계는 모든 카테고리들 간의 의미적 유사도를 계산하는 단계이다. 상기 카테고리들 간의 의미적 유사도는 상기 카테고리들에 대한 병합 센트로이드 벡터(Merge Centroid Vector)들 간의 코사인 유사도(Cosine Similarity)를 의미한다. 여기서 상기 의미론적 매칭부(520)는 상기 카테고리들 간의 의미적 유사도를 임계값과 비교하여 카테고리들 간의 의미적 유사도가 임계값 이상인 경우, 해당 카테고리들 간의 링크를 생성하여 유사도 그래프를 생성한다. 이때 상기 의미론적 매칭부(520)는 도 10에 도시된 바와 같이 상기 의미적 유사도를 생성된 링크에 대한 가중치로 설정한다. 여기서, 상기 링크에 대한 가중치는 병합 센트로이드 벡터들 간의 코사인 유사도로 계산되었으므로, 상기 주제 분류 트리의 계층적 구조의 특징을 나타낼 수 있다.
상기 의미론적 매칭부(520)는 본 발명에서 제안하는 wPPR 알고리즘에 따라 상기와 같이 생성된 유사도 그래프(540)에서 각 카테고리에 대한 다른 카테고리의 의미론적 유사도를 랭킹한다.
이를 위해, 상기 의미론적 매칭부(520)는 먼저 상기 유사도 그래프(540)의 링크 가중치에 기초하여 연관성 행렬(Relevance Matrix) R을 산출한다. 상기 연관성 행렬 R의 (i, j)성분인 rij 는 j번째 카테고리에 대한 i번째 카테고리의 의미론적 유사도를 의미한다. 즉, 상기 의미론적 매칭부(520)는 종래에 잘 알려진 마코브 랜덤 워크 모델(Markov Random Walk Model) 중 하나인 개인화된 페이지랭크(Personalized PageRank)를 활용하여 유사도 그래프를 순회하는 랜덤 서퍼(Random Surfer)가 각각의 카테고리를 방문할 확률을 계산한다. 좀더 자세히 말해, 상기 의미론적 매칭부(520)는 랜덤 서퍼가 j번째 카테고리에서 i번째 카테고리를 방문할 확률을 계산하고, 계산된 값을 두 카테고리 간의 의미론적 유사도로 결정하며, 상기 의미론적 유사도의 크기에 따라 상기 j번째 카테고리에 대한 다른 카테고리들의 의미론적 유사도를 랭킹할 수 있다.
여기서, 상기 랜덤 서퍼가 유사도 그래프를 순회하는 패턴은 두 가지의 경우로 정의할 수 있으며, 상기 랜덤 서퍼는 매 순간마다 (1-d)의 확률로 첫 번째 순회 패턴에 따라 유사도 그래프를 순회하며, d의 확률로 두 번째 순회 패턴에 따라 상기 유사도 그래프를 순회한다. 여기서, 상기 d는 댐핑 팩터(damping factor)로써 0에서 1 사이의 실수 값을 가지며 실험에 따라 경험적으로 최적의 값을 찾을 수 있다. 상기 랜덤 서퍼가 첫 번째 순회 패턴을 따를 경우, 상기 랜덤 서퍼가 방문하는 카테고리는 유사도 그래프 내 신뢰하는 카테고리, 즉 본 발명에서는 현재 방문한 j번째 카테고리가 되고, 상기 랜덤 서퍼가 두 번째 순회 패턴을 따를 경우, 상기 랜덤 서퍼는 현재 방문 중인 카테고리와 링크로 연결된 카테고리를 링크 가중치와 비례하는 확률로 방문하게 된다. 상기 랜덤 서퍼가 두 번째 순회 패턴을 따를 때 다음 카테고리로 이동할 확률은 하기 수학식 4와 같이 계산한다.
하기 수학식 4는 랜덤 서퍼의 이동 확률 계산식이다.
Figure pat00010
여기서, 상기 twij는 상기 랜덤 서퍼가 j번째 카테고리에서 i번째 카테고리로 이동할 확률을 나타내며, sim(ci, cj)는 상기 카테고리 간의 유사도 즉, 카테고리 간의 링크 가중치를 나타내고, 상기 N(cj)는 cj와 연결된 카테고리의 집합을 나타낸다.
도 11은 본 발명의 실시 예에서 두번 째 순회 패턴을 따를 때 상기 twij 값을 구하는 방법을 도시하고 있다. 상기 도 11을 참조하면, 분류 트리 내 카테고리들 간의 이동 확률(twij 값)은 도 10에 도시된 바와 같은 각 카테고리들 간의 링크 가중치에 기초하여 결정된다. 예를 들어, 현재 랜덤 서퍼가 sports(1001) 카테고리를 방문하고 있으며, d의 확률로 두 번째 순회 패턴에 따라 유사도 그래프를 순회한다고 가정하면, 상기 Sports(1001) 카테고리와 링크로 연결된 Soccer(1003), Baseball(1005) 및 Shopping(1007) 카테고리 각각으로의 이동 확률은 상기 Sports(1003) 카테고리와 연결된 전체 링크의 가중치 합(1.7 = 0.7(1013) + 0.7(1015) + 0.3(1017))과 해당 링크의 가중치의 비율에 따라 결정된다. 즉, 도 11에 도시된 바와 같이, 상기 Sports(1001) 카테고리에서 Soccer(1003) 카테고리로 랜덤 서퍼가 이동할 확률은 0.7/1.7(1113)이 되고, 상기 Sports(1001) 카테고리에서 Baseball(1005) 카테고리로 랜덤 서퍼가 이동할 확률은 0.7/1.7(1115)이 되며, 상기 Sports(1001) 카테고리에서 Shopping(1007) 카테고리로 랜덤 서퍼가 이동할 확률은 0.3/1.7(1117)이 된다.
상기 랜덤 서퍼의 두 가지 순회 패턴에 대한 정의를 바탕으로 하여 상기 rij는 하기 수학식 5와 같이 계산할 수 있다.
Figure pat00011
여기서, I(ci)는 ci에 대한 링크를 가지는 카테고리들의 집합을 나타내며, tij는 첫 번째 순회 패턴을 계산하기 위한 것으로, 현재 카테고리가 cj로 설정된 경우 ci의 신뢰도(trusted weight)를 나타낸다. 따라서, i가 j일 경우에는 1 나머지 경우에는 0으로 설정된다.
상기 수학식 5를 행렬 표기법으로 재정의하면, 하기 수학식 6과 같이 나타낼 수 있다.
Figure pat00012
여기서, 상기 R은 wPPR 알고리즘에 따라 계산하는 연관성 행렬을 나타내며, W는 변화 행렬(Transition Matrix)를 나타내는 것으로, (i, j)번째 성분은 상기 수학식 4의 twij와 동일하다. 상기 T는 신뢰 행렬로서 (i, j)번째 성분은 상기 수학식 4의 tij와 동일하므로, 상기 T는 단위 행렬이 된다.
즉, 상기 의미론적 매칭부(520)는 상기 수학식 6과 같이 연관성 행렬을 바탕으로 임의의 카테고리 간의 의미론적 유사도를 수치화할 수 있다. 이때, 상기 카테고리는 사용자 관심 주제 혹은 서비스 항목의 주제에 대응되는 카테고리일 수 있다. 따라서, 상기 의미론적 매칭부(520)는 상기 사용자 관심 주제가 카테고리(cj)로 결정된 경우, 상기 서비스 항목의 주제에 대응하는 카테고리(ci)와의 의미론적 유사도를 연관성 행렬의 (i, j) 성분 값으로 결정할 수 있다.
상기 통합 랭킹부(530)는 상기 구문론적 매칭부(510)와 의미론적 매칭부(520)에서 각각 계산된 구문론적 유사도와 의미론적 유사도를 선형 조합하여 하기 수학식 7과 같이 전체 유사도를 계산한다.
하기 수학식 7은 전체 유사도 계산식을 나타낸다.
Figure pat00013
여기서, 상기 uc는 사용자 데이터로부터 추출된 사용자 관심 주제에 대응되는 카테고리이고, 상기 sci는 서비스 항목의 주제에 대응되는 카테고리를 나타내며, λ는 선형 조합에서 의미론적 유사도에 대한 가중치를 나타내는 것으로 0~1.0의 값으로 실험을 통해 결정될 수 있다.
상기 통합 랭킹부(530)는 상기 수학식 7을 통해 계산된 전체 유사도를 바탕으로 사용자에게 추천할 서비스 항목들의 연관성 순위를 결정한다.
도 13은 본 발명의 실시 예에 따른 이동통신 단말기에서 사용자 관심 주제에 따라 서비스 항목을 추천하는 절차를 도시하고 있다.
상기 도 13을 참조하면, 상기 이동통신 단말기는 1301단계에서 미리 설정된 사용자 데이터 수집 주기인지 여부를 검사한다. 상기 사용자 데이터 수집 주기인 경우, 상기 이동통신 단말기는 1303단계로 진행하여 상기 이동통신 단말기 내에 존재하는 사용자 데이터로부터 텍스트를 추출한다. 여기서, 상기 이동통신 단말기는 단문 메시지, 멀티미디어 메시지, 이메일, 파일, 스케줄, 메모 및 웹 사용 정보 등과 같은 상기 사용자 데이터로부터 텍스트를 추출할 수 있다. 이후, 상기 이동통신 단말기는 1305단계에서 상기 추출된 사용자 데이터의 텍스트를 기반으로 단어 벡터를 생성하고, 1307단계로 진행하여 상기 이동통신 단말기에 임베디드된 주제 분류 트리에 따라 상기 단어 벡터를 분류하여 사용자 관심 주제를 결정한 후, 하기 1317단계로 진행한다.
반면, 상기 사용자 데이터 수집 주기가 아닌 경우 상기 이동통신 단말기는 1309단계로 진행하여 기 설정된 서비스 항목 수집 주기인지 여부를 검사한다. 상기 이동통신 단말기는 상기 서비스 항목 수집 주기가 아닐 경우, 상기 1301단계로 되돌아가 이하 단계를 재수행하는 반면 상기 서비스 항목 수집 주기일 경우, 1311단계로 진행하여 모바일 인터넷에 접속하여 인터넷 서비스 항목을 수집하고, 수집된 서비스 항목으로부터 텍스트를 추출한다. 이후, 상기 이동통신 단말기는 1313단계로 진행하여 상기 추출된 서비스 항목의 텍스트를 기반으로 단어 벡터를 생성하고, 1315단계로 진행하여 상기 주제 분류 트리에 따라 상기 단어 벡터를 분류하여 서비스 항목에 대한 주제를 결정한 후, 하기 1317단계로 진행한다.
상기 이동통신 단말기는 1317단계에서 사용자에 의해 서비스 항목 추천 이벤트가 발생되는지 여부를 검사한다. 상기 이동통신 단말기는 상기 서비스 항목 추천 이벤트가 발생되지 않을 시 상기 1301단계로 되돌아가 이하 단계를 재수행하는 반면, 상기 서비스 항목 추천 이벤트가 발생될 시 1319단계로 진행하여 상기 사용자 데이터의 단어 벡터와 상기 서비스 항목의 단어 벡터 간의 구문론적 유사도를 계산한다. 이때, 상기 이동통신 단말기는 상기 수학식 1을 이용하여 사용자 데이터의 단어 벡터와 상기 서비스 항목의 단어 벡터 간의 구문론적 유사도를 계산할 수 있다.
이후, 상기 이동통신 단말기는 1321단계에서 상기 사용자 관심 주제와 상기 서비스 항목에 대한 주제 간의 의미론적 유사도를 계산한다. 여기서, 상기 이동통신 단말기는 주제 분류 트리에서 각 카테고리들을 의미적인 유사도에 따라 연결하고, 각 카테고리들 간의 연결 링크에 대한 가중치를 계산한 후, 종래의 잘 알려진 일반화된 페이지랭크 알고리즘에 기초하여 랜덤 서퍼의 이동 확률을 계산하여 각 카테고리들 간의 의미론적 유사도를 결정함으로써, 상기 사용자 관심 주제와 서비스 항목에 대한 주제 간의 의미론적 유사도를 계산할 수 있다. 즉, 상기 이동통신 단말기는 상기 수학식 5를 이용하여 상기 사용자 관심 주제와 상기 서비스 항목에 대한 주제 간의 의미론적 유사도를 계산할 수 있다.
이후, 상기 이동통신 단말기는 1323단계에서 상기 계산된 구문론적 유사도와 의미론적 유사도를 바탕으로 사용자 관심 주제와 서비스 항목 주제 간의 전체 유사도를 나타내는 연관성 순위를 결정하고, 1325단계로 진행하여 상기 결정된 연관성 순위에 따라 서비스 항목을 추천한다. 여기서, 상기 이동통신 단말기는 상기 수학식 7을 이용하여 사용자 관심 주제와 서비스 항목 주제 간의 전체 유사도를 계산할 수 있으며, 사용자 관심 주제에 대한 전체 유사도 값이 큰 서비스 항목 주제일수록 높은 연관성 순위를 갖도록 결정할 수 있다.
이후, 상기 이동통신 단말기는 본 발명에 따른 알고리즘을 종료한다.
여기서는, 사용자 데이터 및 서비스 항목을 소정 주기마다 수집하는 것에 대해 설명하였으나, 사용자에 의해 서비스 항목 추천 이벤트가 발생되는 경우에만 상기 사용자 데이터 및 서비스 항목을 수집할 수도 있을 것이다.
한편 본 발명의 상세한 설명에서는 구체적인 실시 예에 관해 설명하였으나, 본 발명의 범위에서 벗어나지 않는 한도 내에서 여러 가지 변형이 가능하다. 그러므로 본 발명의 범위는 설명된 실시 예에 국한되어 정해져서는 아니 되며 후술하는 특허청구의 범위뿐만 아니라 이 특허청구의 범위와 균등한 것들에 의해 정해져야 한다.
210: 사용자 관심 주제 결정부
220: 서비스 항목 수집 및 분류부
230: 서비스 항목 랭킹부
240: 개인화된 서비스 추천부

Claims (22)

  1. 이동통신 단말기에서 인터넷 서비스 제공 방법에 있어서,
    상기 이동통신 단말기 내에 존재하는 사용자 데이터로부터 사용자 관심 주제를 결정하는 과정과,
    네트워크 접속을 통해 서비스 항목을 수집하는 과정과,
    상기 수집된 서비스 항목들 각각에 대한 주제를 결정하는 과정과,
    상기 사용자 관심 주제와 상기 서비스 항목들 각각의 연관성을 결정하는 과정과,
    상기 연관성에 따라 서비스 항목을 추천하는 과정을 포함하는 것을 특징으로 하는 방법.
  2. 제 1항에 있어서,
    상기 사용자 데이터는, 단문 메시지, 멀티미디어 메시지, 이메일, 파일, 스케줄, 메모 및 웹 사용 정보 중 적어도 하나를 포함하는 것을 특징으로 하는 방법.
  3. 제 1항에 있어서,
    상기 사용자 데이터로부터 사용자 관심 주제를 결정하는 과정은,
    상기 사용자 데이터로부터 텍스트를 추출하는 과정과,
    상기 텍스트를 분석하여 벡터 스페이스 모델에 따른 단어 벡터를 생성하는 과정과,
    상기 단어 벡터를 주제 분류 트리에 따라 분류하여 사용자 관심 주제를 결정하는 과정을 포함하는 것을 특징으로 하는 방법.
  4. 제 3항에 있어서,
    상기 추출된 텍스트에 대한 정보를 저장하는 과정을 더 포함하며,
    상기 추출된 텍스트에 대한 정보는, 상기 추출된 텍스트의 생성 시간, 텍스트 생성 위치 및 상기 어플리케이션의 종류, 어플리케이션 특징 어플리케이션 수정 시간, 어플리케이션 생성 시간, 어플리케이션 문맥 정보 중 적어도 하나를 포함하는 것을 특징으로 하는 방법.
  5. 제 3항에 있어서,
    상기 단어 벡터는, 상기 단어 벡터에 대응하는 텍스트 내에서 해당 단어의 중요도에 따른 가중치를 반영하는 것을 특징으로 하는 방법.
  6. 제 1항에 있어서,
    상기 수집된 서비스 항목들 각각에 대한 주제를 결정하는 과정은,
    상기 수집된 서비스 항목들로부터 텍스트를 추출하는 과정과,
    상기 텍스트를 분석하여 벡터 스페이스 모델에 따른 단어 벡터를 생성하는 과정과,
    상기 단어 벡터를 주제 분류 트리에 따라 분류하여 상기 수집된 서비스 항목 각각에 대한 주제를 결정하는 과정을 포함하는 것을 특징으로 하는 방법.
  7. 제 6항에 있어서,
    상기 추출된 텍스트에 대한 정보를 저장하는 과정을 더 포함하며,
    상기 추출된 텍스트에 대한 정보는, 상기 추출된 텍스트의 생성 시간, 텍스트 생성 위치 및 상기 어플리케이션의 종류, 어플리케이션 특징 어플리케이션 수정 시간, 어플리케이션 생성 시간, 어플리케이션 문맥 정보 중 적어도 하나를 포함하는 것을 특징으로 하는 방법.
  8. 제 6항에 있어서,
    상기 단어 벡터는, 상기 단어 벡터에 대응하는 텍스트 내에서 해당 단어의 중요도에 따른 가중치를 반영하는 것을 특징으로 하는 방법.
  9. 제 1항에 있어서,
    상기 사용자 관심 주제와 상기 서비스 항목들 각각의 연관성을 결정하는 과정은,
    사용자 데이터로부터 생성되는 단어 벡터와 서비스 항목으로부터 생성되는 단어 벡터 간의 구문론적 유사도를 결정하는 과정과,
    사용자 관심 주제와 서비스 항목 주제 간의 의미론적 유사도를 결정하는 과정과,
    상기 구문론적 유사도와 의미론적 유사도를 바탕으로 전체 유사도를 결정하는 과정을 포함하는 것을 특징으로 하는 방법.
  10. 제 9항에 있어서,
    상기 구문론적 유사도는, 상기 사용자 데이터로부터 생성되는 단어 벡터와 서비스 항목으로부터 생성되는 단어 벡터 간의 코사인 유사도인 것을 특징으로 하는 방법.
  11. 제 9항에 있어서,
    상기 의미론적 유사도를 결정하는 과정은,
    주제 분류 트리에서 각 카테고리에 대한 학습 데이터들의 평균 단어 벡터를 결정하는 과정과,
    상기 평균 단어 벡터를 이용하여 상기 각 카테고리의 계층적 관계를 반영한 병합 벡터를 결정하는 과정과,
    각 카테고리의 병합 벡터 간의 코사인 유사도를 이용하여 카테고리들 간의 링크 가중치를 결정하는 과정과,
    상기 링크 가중치를 바탕으로 각 카테고리들 간의 이동 확률을 결정하는 과정과,
    상기 각 카테고리들 간의 이동 확률을 이용하여 의미론적 유사도를 결정하는 과정을 포함하는 것을 특징으로 하는 방법.
  12. 이동통신 단말기에서 인터넷 서비스 제공 장치에 있어서,
    상기 이동통신 단말기 내에 존재하는 사용자 데이터로부터 사용자 관심 주제를 결정하는 사용자 관심 주제 추출부와,
    네트워크 접속을 통해 서비스 항목을 수집하고, 수집된 서비스 항목들 각각에 대한 주제를 결정하는 서비스 항목 수집 및 분류부와,
    상기 사용자 관심 주제와 상기 서비스 항목들 각각의 연관성을 결정하는 서비스 항목 랭킹부와,
    상기 연관성에 따라 서비스 항목을 추천하는 서비스 추천부를 포함하는 것을 특징으로 하는 장치.
  13. 제 12항에 있어서,
    상기 사용자 데이터는, 단문 메시지, 멀티미디어 메시지, 이메일, 파일, 스케줄, 메모 및 웹 사용 정보 중 적어도 하나를 포함하는 것을 특징으로 하는 장치.
  14. 제 12항에 있어서,
    상기 사용자 관심 주제 결정부는,
    상기 사용자 데이터로부터 텍스트를 추출하고, 추출된 텍스트를 분석하여 벡터 스페이스 모델에 따른 단어 벡터를 생성한 후, 생성된 단어 벡터를 주제 분류 트리에 따라 분류하여 사용자 관심 주제를 결정하는 것을 특징으로 하는 장치.
  15. 제 14항에 있어서,
    상기 사용자 관심 주제 결정부는, 상기 추출된 텍스트에 대한 정보를 저장하며,
    상기 추출된 텍스트에 대한 정보는, 상기 추출된 텍스트의 생성 시간, 텍스트 생성 위치 및 상기 어플리케이션의 종류, 어플리케이션 특징 어플리케이션 수정 시간, 어플리케이션 생성 시간, 어플리케이션 문맥 정보 중 적어도 하나를 포함하는 것을 특징으로 하는 장치.
  16. 제 14항에 있어서,
    상기 사용자 관심 주제 결정부는, 상기 단어 벡터에 대응하는 텍스트 내에서 해당 단어의 중요도에 따른 가중치를 반영하는 것을 특징으로 하는 장치.
  17. 제 12항에 있어서,
    상기 서비스 항목 수집 및 분류부는, 상기 수집된 서비스 항목들로부터 텍스트를 추출하고, 추출된 텍스트를 분석하여 벡터 스페이스 모델에 따른 단어 벡터를 생성한 후, 생성된 단어 벡터를 주제 분류 트리에 따라 분류하여 상기 수집된 서비스 항목 각각에 대한 주제를 결정하는 것을 특징으로 하는 장치.
  18. 제 17항에 있어서,
    상기 서비스 항목 수집 및 분류부는, 상기 추출된 텍스트에 대한 정보를 저장하며,
    상기 추출된 텍스트에 대한 정보는, 상기 추출된 텍스트의 생성 시간, 텍스트 생성 위치 및 상기 어플리케이션의 종류, 어플리케이션 특징 어플리케이션 수정 시간, 어플리케이션 생성 시간, 어플리케이션 문맥 정보 중 적어도 하나를 포함하는 것을 특징으로 하는 장치.
  19. 제 17항에 있어서,
    상기 서비스 항목 수집 및 분류부는, 상기 단어 벡터에 대응하는 텍스트 내에서 해당 단어의 중요도에 따른 가중치를 반영하는 것을 특징으로 하는 장치.
  20. 제 12항에 있어서,
    상기 서비스 항목 랭킹부는, 사용자 데이터로부터 생성되는 단어 벡터와 서비스 항목으로부터 생성되는 단어 벡터 간의 구문론적 유사도를 결정하고, 사용자 관심 주제와 서비스 항목 주제 간의 의미론적 유사도를 결정하여 상기 구문론적 유사도와 의미론적 유사도를 바탕으로 전체 유사도를 결정하는 것을 특징으로 하는 장치.
  21. 제 20항에 있어서,
    상기 구문론적 유사도는, 상기 사용자 데이터로부터 생성되는 단어 벡터와 서비스 항목으로부터 생성되는 단어 벡터 간의 코사인 유사도인 것을 특징으로 하는 장치.
  22. 제 20항에 있어서,
    상기 의미론적 유사도는, 주제 분류 트리에서 각 카테고리에 대한 학습 데이터들의 평균 단어 벡터를 결정하고, 상기 평균 단어 벡터를 이용하여 상기 각 카테고리의 계층적 관계를 반영한 병합 벡터를 결정한 후, 각 카테고리의 병합 벡터 간의 코사인 유사도를 이용하여 카테고리들 간의 링크 가중치를 결정하고, 상기 링크 가중치를 바탕으로 각 카테고리들 간의 이동 확률을 결정하여 의미론적 유사도를 결정하는 것을 특징으로 하는 장치.
KR1020100088709A 2010-09-10 2010-09-10 이동통신 단말기에서 인터넷 서비스 제공 방법 및 장치 KR101712988B1 (ko)

Priority Applications (3)

Application Number Priority Date Filing Date Title
KR1020100088709A KR101712988B1 (ko) 2010-09-10 2010-09-10 이동통신 단말기에서 인터넷 서비스 제공 방법 및 장치
US13/229,022 US9152723B2 (en) 2010-09-10 2011-09-09 Method and apparatus for providing internet service in mobile communication terminal
US14/875,669 US20160036928A1 (en) 2010-09-10 2015-10-05 Method and apparatus for providing internet service in mobile communication terminal

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020100088709A KR101712988B1 (ko) 2010-09-10 2010-09-10 이동통신 단말기에서 인터넷 서비스 제공 방법 및 장치

Related Child Applications (1)

Application Number Title Priority Date Filing Date
KR1020170026102A Division KR101827338B1 (ko) 2017-02-28 2017-02-28 이동통신 단말기에서 인터넷 서비스 제공 방법 및 장치

Publications (2)

Publication Number Publication Date
KR20120026682A true KR20120026682A (ko) 2012-03-20
KR101712988B1 KR101712988B1 (ko) 2017-03-07

Family

ID=45807698

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020100088709A KR101712988B1 (ko) 2010-09-10 2010-09-10 이동통신 단말기에서 인터넷 서비스 제공 방법 및 장치

Country Status (2)

Country Link
US (2) US9152723B2 (ko)
KR (1) KR101712988B1 (ko)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20190068826A (ko) * 2017-12-11 2019-06-19 고려대학교 산학협력단 사용자 관심사를 반영한 문맥 광고를 제공하는 모바일 기기 및 그 방법

Families Citing this family (19)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9836545B2 (en) 2012-04-27 2017-12-05 Yahoo Holdings, Inc. Systems and methods for personalized generalized content recommendations
US9785883B2 (en) 2012-04-27 2017-10-10 Excalibur Ip, Llc Avatars for use with personalized generalized content recommendations
US8996530B2 (en) * 2012-04-27 2015-03-31 Yahoo! Inc. User modeling for personalized generalized content recommendations
US20140095306A1 (en) * 2012-09-28 2014-04-03 Jose A. Avalos Digital sign advertisement selection based on mobile device activity
EP2763422B1 (en) 2013-01-31 2018-02-21 Samsung Electronics Co., Ltd Method and system for displaying object, and method and system for providing the object
US10771247B2 (en) 2013-03-15 2020-09-08 Commerce Signals, Inc. Key pair platform and system to manage federated trust networks in distributed advertising
US11222346B2 (en) 2013-03-15 2022-01-11 Commerce Signals, Inc. Method and systems for distributed signals for use with advertising
US10497025B1 (en) * 2014-05-15 2019-12-03 Groupon, Inc. Real-time predictive recommendation system using per-set optimization
US20150371277A1 (en) * 2014-06-19 2015-12-24 Facebook, Inc. Inferring an industry associated with a company based on job titles of company employees
CN104615620B (zh) * 2014-06-24 2018-07-24 腾讯科技(深圳)有限公司 地图搜索类型识别方法及装置、地图搜索方法及系统
CN106708883B (zh) * 2015-11-17 2020-09-29 阿里巴巴集团控股有限公司 推荐方法及装置
US11681942B2 (en) 2016-10-27 2023-06-20 Dropbox, Inc. Providing intelligent file name suggestions
US9852377B1 (en) * 2016-11-10 2017-12-26 Dropbox, Inc. Providing intelligent storage location suggestions
KR101928074B1 (ko) * 2017-01-09 2019-02-26 고려대학교 산학협력단 문맥 정보에 기반한 콘텐츠 제공 서버 및 방법
US11983200B2 (en) * 2017-07-31 2024-05-14 Rakuten Group, Inc. Processing system, processing device, processing method, program, and information storage medium
CN110335064A (zh) * 2019-06-05 2019-10-15 平安科技(深圳)有限公司 产品推送方法、装置、计算机设备和存储介质
KR20210070623A (ko) * 2019-12-05 2021-06-15 엘지전자 주식회사 사용자의 관심사를 추출하는 인공 지능 장치 및 그 방법
US11321527B1 (en) * 2021-01-21 2022-05-03 International Business Machines Corporation Effective classification of data based on curated features
US20220309100A1 (en) * 2021-03-26 2022-09-29 EMC IP Holding Company LLC Automatic Discovery of Related Data Records

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20030000808A (ko) * 2001-06-27 2003-01-06 (주) 엘지텔레콤 무선단말기로의 검색 정보 제공 장치 및 방법
KR20060043333A (ko) * 2004-03-01 2006-05-15 마이크로소프트 코포레이션 데이터의 의도를 판정하고 의도에 기초하여 데이터에 응답하는 시스템 및 방법
US20070061332A1 (en) * 2005-09-14 2007-03-15 Jorey Ramer User history influenced search results
KR20100041286A (ko) * 2008-10-14 2010-04-22 정용석 접속코드 방식의 모바일 기기(휴대폰)를 응답경로로 하는 시분할 광고 마케팅 시스템

Family Cites Families (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6704729B1 (en) * 2000-05-19 2004-03-09 Microsoft Corporation Retrieval of relevant information categories
US6810376B1 (en) * 2000-07-11 2004-10-26 Nusuara Technologies Sdn Bhd System and methods for determining semantic similarity of sentences
US7853485B2 (en) * 2005-11-22 2010-12-14 Nec Laboratories America, Inc. Methods and systems for utilizing content, dynamic patterns, and/or relational information for data analysis
JP2008257655A (ja) 2007-04-09 2008-10-23 Sony Corp 情報処理装置及び方法、並びにプログラム
KR101485147B1 (ko) 2008-06-19 2015-01-28 주식회사 케이티 맞춤광고 출력방법 및 그 이동통신단말, 맞춤광고 제공방법및 그 장치
KR20100041582A (ko) 2008-10-14 2010-04-22 주식회사 케이티 개인화 서비스 제공 시스템 및 그 방법
KR101040519B1 (ko) 2008-11-06 2011-06-16 주식회사 케이티 개인화된 서비스 제공 방법 및 그 시스템
US8396759B2 (en) * 2010-06-18 2013-03-12 Google Inc. Context-influenced application recommendations

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20030000808A (ko) * 2001-06-27 2003-01-06 (주) 엘지텔레콤 무선단말기로의 검색 정보 제공 장치 및 방법
KR20060043333A (ko) * 2004-03-01 2006-05-15 마이크로소프트 코포레이션 데이터의 의도를 판정하고 의도에 기초하여 데이터에 응답하는 시스템 및 방법
US20070061332A1 (en) * 2005-09-14 2007-03-15 Jorey Ramer User history influenced search results
KR20100041286A (ko) * 2008-10-14 2010-04-22 정용석 접속코드 방식의 모바일 기기(휴대폰)를 응답경로로 하는 시분할 광고 마케팅 시스템

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20190068826A (ko) * 2017-12-11 2019-06-19 고려대학교 산학협력단 사용자 관심사를 반영한 문맥 광고를 제공하는 모바일 기기 및 그 방법

Also Published As

Publication number Publication date
KR101712988B1 (ko) 2017-03-07
US20120066234A1 (en) 2012-03-15
US20160036928A1 (en) 2016-02-04
US9152723B2 (en) 2015-10-06

Similar Documents

Publication Publication Date Title
KR101712988B1 (ko) 이동통신 단말기에서 인터넷 서비스 제공 방법 및 장치
JP6799081B2 (ja) ユーザ興味の識別方法、装置およびコンピュータ読み取り可能な記憶媒体
CN106815297B (zh) 一种学术资源推荐服务系统与方法
Lu et al. Content-based collaborative filtering for news topic recommendation
US8051080B2 (en) Contextual ranking of keywords using click data
CN103955464B (zh) 一种基于情境融合感知的推荐方法
KR101532715B1 (ko) 서치 결과를 향상시키기 위해 사용자로부터의 피드백을 적용하는 서치 엔진
KR101754473B1 (ko) 문서를 이미지 기반 컨텐츠로 요약하여 제공하는 방법 및 시스템
CN109918555B (zh) 用于提供搜索建议的方法、装置、设备和介质
CN111753167B (zh) 搜索处理方法、装置、计算机设备和介质
CN104216881A (zh) 一种个性化标签的推荐方法及装置
CN107526718A (zh) 用于生成文本的方法和装置
CN115659008B (zh) 大数据信息反馈的信息推送系统、方法、电子设备及介质
Bohnert et al. Personalised viewing-time prediction in museums
JP4769151B2 (ja) 文書集合分析装置,文書集合分析方法,その方法を実装したプログラム及びそのプログラムを格納した記録媒体
KR20100023630A (ko) 카테고리 태그 정보를 이용한 웹 페이지 분류 방법, 그 시스템 및 이를 기록한 기록매체
Luo et al. Query ambiguity identification based on user behavior information
KR101827338B1 (ko) 이동통신 단말기에서 인터넷 서비스 제공 방법 및 장치
KR101955920B1 (ko) 속성 언어를 이용한 검색 방법 및 장치
JP5513929B2 (ja) 経験情報の再利用性評価装置及び方法及びプログラム
Zhang et al. Detecting bad information in mobile wireless networks based on the wireless application protocol
US20210103702A1 (en) System and method for link prediction with semantic analysis
Li et al. Research on hot news discovery model based on user interest and topic discovery
Wang English news text recommendation method based on hypergraph random walk label expansion
Khare et al. Url classification using non negative matrix factorization

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
FPAY Annual fee payment

Payment date: 20200130

Year of fee payment: 4