KR20110002929A - 텍스트 기반의 사용자 활동 분석을 통한 프로그램 개인화 방법 - Google Patents

텍스트 기반의 사용자 활동 분석을 통한 프로그램 개인화 방법 Download PDF

Info

Publication number
KR20110002929A
KR20110002929A KR1020090060465A KR20090060465A KR20110002929A KR 20110002929 A KR20110002929 A KR 20110002929A KR 1020090060465 A KR1020090060465 A KR 1020090060465A KR 20090060465 A KR20090060465 A KR 20090060465A KR 20110002929 A KR20110002929 A KR 20110002929A
Authority
KR
South Korea
Prior art keywords
words
word
user
meaningful
extracting
Prior art date
Application number
KR1020090060465A
Other languages
English (en)
Inventor
이재명
Original Assignee
주식회사 인프라웨어
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 주식회사 인프라웨어 filed Critical 주식회사 인프라웨어
Priority to KR1020090060465A priority Critical patent/KR20110002929A/ko
Publication of KR20110002929A publication Critical patent/KR20110002929A/ko

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis

Abstract

본 발명은 사용자의 사용정보를 분석하여 추천 검색어 제시 및 검색엔진으로 연결 기능을 갖춘 인터넷 프로그램에 관한 것으로, 텍스트 기반의 사용자별 활동 정보를 분석하여 프로그램을 개인화하는 방법을 제공한다.
인터넷, 개인화, 사용정보, 태그클라우드, 브라우저, 위젯

Description

텍스트 기반의 사용자 활동 분석을 통한 프로그램 개인화 방법{Method to individualize internet program by analyzing usage data}
본 발명은 소프트웨어에 관한 것으로, 더욱 자세하게는 사용자의 사용정보를 분석하여 추천 검색어 제시 및 검색엔진으로 연결 기능을 갖춘 인터넷 프로그램에 관한 것이다.
기존 인터넷 브라우저는 사용자가 방문한 웹 페이지 단위, 혹은 사용자가 능동적으로 등록한 웹페이지 및 정보에 대해서만 개인에게 추천 서비스로 활용하고 있다. 그 예로 Opera browser와 구글사의 Chrome 등의 browser를 보면 사용자의 방문 기록이나 즐겨찾기 등록에 근거하여 사용자에게 초기화면에서 사이트 연결 기능을 간편하게 제공한다.
사용자가 사용하는 웹 서비스는 대부분 다양한 데이터로 조합이 되어 있다. 기본적으로 텍스트(문자)가 가장 많으며 그 다음이 이미지, 동영상 등의 순이다. 그리고 각 멀티미디어 데이터(이미지와 동영상, 플래쉬 등)에는 TAG정보가 존재하는 경우도 있다. 브라우저나 어플리케이션을 사용하여 웹 서비스에 접근을 할 때 사용자는 관심 있는 정보에 초점을 맞추어 돌아다닌다. 이러한 ‘관심 있는 정보’에 대한 접근 방법은 크게 두 가지가 있다. 하나는 의식적으로 자신이 접근하는 방법이다. 예를 들어 사용자가 검색을 통해 원하는 정보를 찾거나, 메일링 서비스를 받거나, 각종 커뮤니티 서비스를 사용하여 정보 찾는 것 등이 그 예이다. 또 다른 하나는 무의식적으로 정보에 다가가게 되는 방법이다. 평소에 자신이 정해둔 방법이 아니더라도 서비스 제공자의 노출에 의해 정보에 접근하게 되는 경우로, 예를 들어 야후나 구글 뉴스에 새로운 뉴스가 올라왔는데 그것이 자신의 관심사 내 포함이 될 경우를 들 수 있다.
전자의 경우 본인의 의사로 즐겨찾기나 별도의 방법을 통해 프로그램/서비스의 초기화면에 추천을 받는 것이 가능하지만 후자의 경우 마찬가지로 유용한 정보일 확률이 높지만 단발성으로 끝나기 쉽다. 사용자가 무의식적으로 접근한 정보에 대해서는 현재와 같이 웹페이지 단위로 사용자의 기록을 남길 때 정보의 기록과 보여주는 방식에 한계가 있고, 사용자가 즐겨찾기에 별도로 기록하거나 메모하는 등, 무엇인가를 설정/저장하는 과정을 통하지 않는 한 제한적으로밖에 사용할 수 없다. 또한 사용자의 전체 서비스 이용 사이클을 분석하는데 각 서비스용 페이지에는 보통 너무 많은 정보가 내포되어 해당 페이지마다 대표성을 지니는 특징을 뽑아내기에는 한계가 있어, 진정으로 사용자가 원하는 정보나 서비스를 알아내기 어렵다.
이러한 불편한 점을 해결하기 위해서 본 발명에서는 텍스트 기반의 사용자별 활동 정보를 분석하여 프로그램을 개인화하는 방법을 제공한다.
본 발명에 의한 프로그램 개인화 방법은 인터넷 접속프로그램에서 인터넷을 접속하는 방법에 있어서, 사용자가 방문한 개별 웹 페이지의 텍스트, 이미지의 ALT 값, TAG, 기타 메타 데이터에서 단어를 추출하여 수집하는 단계; 상기 수집된 단어에서 무의미한 단어와 유의미한 단어를 구분하여 유의미한 단어만을 추출하는 단계; 상기 유의미한 단어를 데이터 베이스에 기록하고, 각각의 단어가 사용자가 방문한 개별 웹 페이지에서 사용된 회수를 누적 계산하여 기록하는 단계; 상기 데이터 베이스에 기록된 단어들 중에서 상기 기록회수가 높은 단어를 미리 정해진 개수 만큼 표 또는 태그 클라우드의 형식으로 화면에 표시하여 사용자에게 제시하는 단계; 사용자가 상기 표 또는 태그 플라우드의 형식으로 제시된 단어를 클릭하는 경우 해당 단어를 검색엔진 사이트에 접속하여 전송한 후 그 결과를 전송받는 단계; 를 포함하는 것을 특징으로 하는 것에 의하여 달성된다.
이 때 상기 수집된 단어에서 무의미한 단어와 유의미한 단어를 구분하여 유의미한 단어만을 추출하는 단계는 1)단어 없이 전체 단어에 대한 단순한 카운팅 후 사용자가 특정 단어를 제거할 수 있는 단계, 2)무의미한 단어들을(그래서, 그러나 등의 조사, 되었다, 그렇다 등의 어미와 이에 상응하는 각 언어의 단어들.) 추출, 제외하고 의미를 갖는 다양한 고유명사에 대해 수집, 노출하는 단계, 3)가상 수집 머신을 개발하여 선별적으로 입력되어 있는 단어만을 수집하게 하는 단계, 4) 검색엔진과의 연계를 통해 전체 데이터 중 트렌드에 맞는 단어만을 선별하는 단계 중의 하나를 포함하는 방법으로 구현될 수 있다.
본 발명을 이용하면, 사용자가 피싱을 통해 사용한 서비스(의도가 적거나 사용 계획이 없었으나 노출된 단어나 이미지에 의해 사용한 서비스)에 대해 분석이 가능하여 기업은 각 개인의 관심사에 대한 세부 정보를 활용할 수 있게 되고, 개별 사용자는 자신의 관심사에 대해 구체적인 분석을 할 수 있다. 또한 서비스 제공자는 텍스트 분석 툴을 이용하여 자사 서비스의 전체 구조를 분석할 수 있다.
또한, 각종 브라우저 및 위젯 등의 서비스에서 사용자의 즐겨찾기, 각종 브라우저 및 위젯 등의 서비스에서 사용자의 히스토리 부분을 강화하고, 각 서비스 제공자에 있어서 CMS (Customer Management System) 부분이나, 광고 시스템에 있어서 CRM (Customer Relationship Management) 부분에 응용이 가능하다. 또한 광고 시스템에 있어서 효과 분석 툴로써 응용이 가능하다.
본 발명을 도면과 함께 보다 상세하게 설명하면 다음과 같다. 이하 본 발명을 설명함에 있어서 관련된 공지 또는 구성에 대한 구체적인 설명이 본 발명의 요지를 불필요하게 흐릴 수 있다고 판단되는 경우에는 그 상세한 설명을 생략한다. 그리고 후술하는 용어는 본 발명에서의 기능을 고려하여 정의된 용어들로서, 이는 사용자, 운용자의 의도 또는 판례 등에 따라 달라질 수 있으며, 이에 따라 각 용어의 의미는 본 명세서 전반에 걸친 내용을 토대로 해석되어야 한다.
도1은 본 발명에 의한 프로그램 개인화 방법에 관한 순서도이다. 본 발명에 의한 인터넷 브라우저나 인터넷 접속 기능이 있는 위젯이 실행되면 사용자가 웹 페이지에 접속할 때마다 텍스트 기반의 각종 단어 자료를 수집한다. 각 단어고 추출되는 회수를 기록한 다음 그 순위별 목록을 사용자에게 제시한다. 사용자가 이 목록에 있는 단어를 클릭하면 검색엔진 사이트에 연결하여 단어를 전송함으로써 곧바로 검색결과를 받아볼 수 있도록 한다.
서비스를 가장 작게 구분할 수 있는 방법으로 방문한 개별 페이지 및 서비스에 있어서 Text 기반으로 데이터를 수집한다. 사용자가 방문한 개별 웹 페이지의 Text, image의 ALT 값, TAG 외의 메타데이터 등을 수집하며 이를 카운트하여 기록한다.
수집된 Text 기반의 단어 중 유의미한 정보를 추출하여 이 중 카운트가 가장 많이 된 정보를 활용하는 방법의 하나는, 도2와 같이 초기화면 혹은 별도 화면에 TAG cloud와 같이 보여준 후 검색엔진에 연결되도록 한다.
사용자가 방문한 각 페이지에서 등장한 단어들을 분석하여 무의미한 단어들을(그래서, 그러나 등의 조사, 되었다, 그렇다 등의 어미와 이에 상응하는 각 언어의 단어들.) 추출, 제외하고 의미를 갖는 다양한 고유명사에 대해 수집한다. 수집된 단어들에 대한 메타데이터(Metadata) 로 사용자의 전체 서비스 사용에 있어서 한 단어가 몇 번 기록이 되어있는지 계산하여 전체 단어에 대한 순위를 작성한다. 작성된 순위를 바탕으로 사용자가 볼 수 있도록 표(Table) 형식이나 태그 클라우드(Tag cloud, 그림) 형식으로 정보를 재구성하여 보여준다.
웹 브라우져의 즐겨찾기나 히스토리와 같이 관심 단어 분석을 기반으로 한 나의 관심사 탭 생성, 시작페이지 설정, 추천 페이지 노출 등을 할 수도 있다.
사용자의 사용 정보에 관한 텍스트를 분석하는 툴은 다양한 방법으로 제작될 수 있다. 예를 들어 제외하는 단어 없이 전체 단어에 대한 단순한 카운팅 후 사용자가 특정 단어를 제거할 수 있는 방법, 무의미한 단어들을(그래서, 그러나 등의 조사, 되었다, 그렇다 등의 어미와 이에 상응하는 각 언어의 단어들.) 추출, 제외하고 의미를 갖는 다양한 고유명사에 대해 수집, 노출하는 방법, 가상 수집 머신을 개발하여 선별적으로 입력되어 있는 단어만을 수집하게 하는 방법, 검색엔진과의 연계를 통해 전체 데이터 중 트렌드에 맞는 단어만을 선별하는 방법 등이 있다.
본 발명에 의한 프로그램 개인화 방법은 PC를 포함한 mobile device(PDA, phone, E-book, MP3P, 등), Digital TV 등에 응용될 수 있고, TEXT 기반으로 하는 다양한 화면 구성 방식을 사용할 수 있다. 예를 들어, 시간대를 축으로 잡아 2차원적으로 보여줄 수 있는 방법, 특정 웹사이트/세분화된 서비스 내 단어 활용 빈도에 대한 화면 구성, 타인과 순위 구성 공유를 통한 SNS(Social Networking Service)와 유사한 각종 구성 등이 가능하다.
이상에서 본 발명의 바람직한 실시예에 한정하여 설명하였으나, 본 발명은 이에 한정되지 않고 다양한 변화와 변경 및 균등물을 사용할 수 있다. 따라서 본 발명은 이들 실시예를 적절히 변형하여 응용할 수 있고, 이러한 응용도 특허청구범위에 기재된 기술적 사상을 바탕으로 하는 한 본 발명의 권리범위에 속하게 됨은 당연하다 할 것이다.
도1 : 본 발명에 의한 프로그램 개인화 방법에 관한 순서도
도2: 사용자 정보로 추출된 단어들을 사용자에게 제시하는 방법의 예

Claims (3)

  1. 인터넷 접속프로그램에서 인터넷을 접속하는 방법에 있어서,
    사용자가 방문한 개별 웹 페이지의 텍스트, 이미지의 ALT 값, TAG, 기타 메타 데이터에서 단어를 추출하여 수집하는 단계;
    상기 수집된 단어에서 무의미한 단어와 유의미한 단어를 구분하여 유의미한 단어만을 추출하는 단계;
    상기 유의미한 단어를 데이터 베이스에 기록하고, 각각의 단어가 사용자가 방문한 개별 웹 페이지에서 사용된 회수를 누적 계산하여 기록하는 단계;
    상기 데이터 베이스에 기록된 단어들 중에서 상기 기록회수가 미리 정해진 개수만큼 상위인 단어를 표 또는 태그 클라우드의 형식으로 화면에 표시하여 사용자에게 제시하는 단계;
    사용자가 상기 표 또는 태그 플라우드의 형식으로 제시된 단어를 클릭하는 경우 해당 단어를 검색엔진 사이트에 접속하여 전송한 후 그 결과를 전송받는 단계;
    를 포함하는 것을 특징으로 하는 인터넷 접속 프로그램 개인화 방법;
  2. 제1항에 있어서,
    상기 수집된 단어에서 무의미한 단어와 유의미한 단어를 구분하여 유의미한 단어만을 추출하는 단계는
    - 단어 없이 전체 단어에 대한 단순한 카운팅 후 사용자가 특정 단어를 제거할 수 있는 단계
    - 무의미한 단어들을(그래서, 그러나 등의 조사, 되었다, 그렇다 등의 어미와 이에 상응하는 각 언어의 단어들.) 추출, 제외하고 의미를 갖는 다양한 고유명사에 대해 수집, 노출하는 단계,
    - 가상 수집 머신을 개발하여 선별적으로 입력되어 있는 단어만을 수집하게 하는 단계
    - 검색엔진과의 연계를 통해 전체 데이터 중 트렌드에 맞는 단어만을 선별하는 단계
    중의 하나를 포함하는 것을 특징으로 하는 인터넷 접속 프로그램 개인화 방법
  3. 제1항 또는 제2항 중의 어느 하나의 항에 따른 방법을 구현하는 프로그램을 기록한 컴퓨터로 판독가능한 정보기록매체
KR1020090060465A 2009-07-03 2009-07-03 텍스트 기반의 사용자 활동 분석을 통한 프로그램 개인화 방법 KR20110002929A (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020090060465A KR20110002929A (ko) 2009-07-03 2009-07-03 텍스트 기반의 사용자 활동 분석을 통한 프로그램 개인화 방법

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020090060465A KR20110002929A (ko) 2009-07-03 2009-07-03 텍스트 기반의 사용자 활동 분석을 통한 프로그램 개인화 방법

Publications (1)

Publication Number Publication Date
KR20110002929A true KR20110002929A (ko) 2011-01-11

Family

ID=43610992

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020090060465A KR20110002929A (ko) 2009-07-03 2009-07-03 텍스트 기반의 사용자 활동 분석을 통한 프로그램 개인화 방법

Country Status (1)

Country Link
KR (1) KR20110002929A (ko)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10469412B2 (en) 2015-09-01 2019-11-05 Samsung Electronics Co., Ltd. Answer message recommendation method and device therefor

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10469412B2 (en) 2015-09-01 2019-11-05 Samsung Electronics Co., Ltd. Answer message recommendation method and device therefor
US11005787B2 (en) 2015-09-01 2021-05-11 Samsung Electronics Co., Ltd. Answer message recommendation method and device therefor

Similar Documents

Publication Publication Date Title
US11036744B2 (en) Personalization of news articles based on news sources
JP5538532B2 (ja) コミュニティ交流の意味解析を使用するアドバイザ・アシスタント
CN102708174B (zh) 一种浏览器中的富媒体信息的展示方法和装置
Kratz et al. Making data count
CN106383887A (zh) 一种环保新闻数据采集和推荐展示的方法及系统
JP6872258B2 (ja) インターネットコンテンツ提供サーバ及びその方法が具現化されたコンピュータで判読できる記録媒体
CN102037464A (zh) 具有最多点击的下一个对象的搜索结果
US20110246462A1 (en) Method and System for Prompting Changes of Electronic Document Content
US20100192055A1 (en) Apparatus, method and article to interact with source files in networked environment
US20110246277A1 (en) Multi-factor promotional offer suggestion
CN104090757A (zh) 针对浏览器的富媒体信息展示方法
CN104090923A (zh) 一种浏览器中的富媒体信息的展示方法和装置
Fu et al. Library log analysis and its implications for studying online information seeking behavior of cultural groups
CN105450460B (zh) 网络操作记录方法及系统
KR101850853B1 (ko) 빅데이터를 이용한 검색 방법 및 장치
CN101661471A (zh) 一种网页页面的显示方法和装置
Byrne Reviewing Football History through the UK web archive
JP5856010B2 (ja) 広告提供装置、広告提供方法、およびプログラム
KR20110002929A (ko) 텍스트 기반의 사용자 활동 분석을 통한 프로그램 개인화 방법
Chow “We know who you are and we know where you live”: a research agenda for web demographics
KR101440385B1 (ko) 인디케이터를 이용한 정보 관리 장치
JP2017151574A (ja) ユーザ情報処理サーバ及びユーザ情報の処理方法
KR20060132174A (ko) 웹기반 정보추출시스템 및 이를 이용한 광고방법
Sarker et al. Automatic Individual Information Aggregation Using Publicly Available Social Media Data
CN113901325A (zh) 用户行为分析装置及方法

Legal Events

Date Code Title Description
WITN Withdrawal due to no request for examination