KR20110002929A - 텍스트 기반의 사용자 활동 분석을 통한 프로그램 개인화 방법 - Google Patents
텍스트 기반의 사용자 활동 분석을 통한 프로그램 개인화 방법 Download PDFInfo
- Publication number
- KR20110002929A KR20110002929A KR1020090060465A KR20090060465A KR20110002929A KR 20110002929 A KR20110002929 A KR 20110002929A KR 1020090060465 A KR1020090060465 A KR 1020090060465A KR 20090060465 A KR20090060465 A KR 20090060465A KR 20110002929 A KR20110002929 A KR 20110002929A
- Authority
- KR
- South Korea
- Prior art keywords
- words
- word
- user
- meaningful
- extracting
- Prior art date
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
Abstract
본 발명은 사용자의 사용정보를 분석하여 추천 검색어 제시 및 검색엔진으로 연결 기능을 갖춘 인터넷 프로그램에 관한 것으로, 텍스트 기반의 사용자별 활동 정보를 분석하여 프로그램을 개인화하는 방법을 제공한다.
인터넷, 개인화, 사용정보, 태그클라우드, 브라우저, 위젯
Description
본 발명은 소프트웨어에 관한 것으로, 더욱 자세하게는 사용자의 사용정보를 분석하여 추천 검색어 제시 및 검색엔진으로 연결 기능을 갖춘 인터넷 프로그램에 관한 것이다.
기존 인터넷 브라우저는 사용자가 방문한 웹 페이지 단위, 혹은 사용자가 능동적으로 등록한 웹페이지 및 정보에 대해서만 개인에게 추천 서비스로 활용하고 있다. 그 예로 Opera browser와 구글사의 Chrome 등의 browser를 보면 사용자의 방문 기록이나 즐겨찾기 등록에 근거하여 사용자에게 초기화면에서 사이트 연결 기능을 간편하게 제공한다.
사용자가 사용하는 웹 서비스는 대부분 다양한 데이터로 조합이 되어 있다. 기본적으로 텍스트(문자)가 가장 많으며 그 다음이 이미지, 동영상 등의 순이다. 그리고 각 멀티미디어 데이터(이미지와 동영상, 플래쉬 등)에는 TAG정보가 존재하는 경우도 있다. 브라우저나 어플리케이션을 사용하여 웹 서비스에 접근을 할 때 사용자는 관심 있는 정보에 초점을 맞추어 돌아다닌다. 이러한 ‘관심 있는 정보’에 대한 접근 방법은 크게 두 가지가 있다. 하나는 의식적으로 자신이 접근하는 방법이다. 예를 들어 사용자가 검색을 통해 원하는 정보를 찾거나, 메일링 서비스를 받거나, 각종 커뮤니티 서비스를 사용하여 정보 찾는 것 등이 그 예이다. 또 다른 하나는 무의식적으로 정보에 다가가게 되는 방법이다. 평소에 자신이 정해둔 방법이 아니더라도 서비스 제공자의 노출에 의해 정보에 접근하게 되는 경우로, 예를 들어 야후나 구글 뉴스에 새로운 뉴스가 올라왔는데 그것이 자신의 관심사 내 포함이 될 경우를 들 수 있다.
전자의 경우 본인의 의사로 즐겨찾기나 별도의 방법을 통해 프로그램/서비스의 초기화면에 추천을 받는 것이 가능하지만 후자의 경우 마찬가지로 유용한 정보일 확률이 높지만 단발성으로 끝나기 쉽다. 사용자가 무의식적으로 접근한 정보에 대해서는 현재와 같이 웹페이지 단위로 사용자의 기록을 남길 때 정보의 기록과 보여주는 방식에 한계가 있고, 사용자가 즐겨찾기에 별도로 기록하거나 메모하는 등, 무엇인가를 설정/저장하는 과정을 통하지 않는 한 제한적으로밖에 사용할 수 없다. 또한 사용자의 전체 서비스 이용 사이클을 분석하는데 각 서비스용 페이지에는 보통 너무 많은 정보가 내포되어 해당 페이지마다 대표성을 지니는 특징을 뽑아내기에는 한계가 있어, 진정으로 사용자가 원하는 정보나 서비스를 알아내기 어렵다.
이러한 불편한 점을 해결하기 위해서 본 발명에서는 텍스트 기반의 사용자별 활동 정보를 분석하여 프로그램을 개인화하는 방법을 제공한다.
본 발명에 의한 프로그램 개인화 방법은 인터넷 접속프로그램에서 인터넷을 접속하는 방법에 있어서, 사용자가 방문한 개별 웹 페이지의 텍스트, 이미지의 ALT 값, TAG, 기타 메타 데이터에서 단어를 추출하여 수집하는 단계; 상기 수집된 단어에서 무의미한 단어와 유의미한 단어를 구분하여 유의미한 단어만을 추출하는 단계; 상기 유의미한 단어를 데이터 베이스에 기록하고, 각각의 단어가 사용자가 방문한 개별 웹 페이지에서 사용된 회수를 누적 계산하여 기록하는 단계; 상기 데이터 베이스에 기록된 단어들 중에서 상기 기록회수가 높은 단어를 미리 정해진 개수 만큼 표 또는 태그 클라우드의 형식으로 화면에 표시하여 사용자에게 제시하는 단계; 사용자가 상기 표 또는 태그 플라우드의 형식으로 제시된 단어를 클릭하는 경우 해당 단어를 검색엔진 사이트에 접속하여 전송한 후 그 결과를 전송받는 단계; 를 포함하는 것을 특징으로 하는 것에 의하여 달성된다.
이 때 상기 수집된 단어에서 무의미한 단어와 유의미한 단어를 구분하여 유의미한 단어만을 추출하는 단계는 1)단어 없이 전체 단어에 대한 단순한 카운팅 후 사용자가 특정 단어를 제거할 수 있는 단계, 2)무의미한 단어들을(그래서, 그러나 등의 조사, 되었다, 그렇다 등의 어미와 이에 상응하는 각 언어의 단어들.) 추출, 제외하고 의미를 갖는 다양한 고유명사에 대해 수집, 노출하는 단계, 3)가상 수집 머신을 개발하여 선별적으로 입력되어 있는 단어만을 수집하게 하는 단계, 4) 검색엔진과의 연계를 통해 전체 데이터 중 트렌드에 맞는 단어만을 선별하는 단계 중의 하나를 포함하는 방법으로 구현될 수 있다.
본 발명을 이용하면, 사용자가 피싱을 통해 사용한 서비스(의도가 적거나 사용 계획이 없었으나 노출된 단어나 이미지에 의해 사용한 서비스)에 대해 분석이 가능하여 기업은 각 개인의 관심사에 대한 세부 정보를 활용할 수 있게 되고, 개별 사용자는 자신의 관심사에 대해 구체적인 분석을 할 수 있다. 또한 서비스 제공자는 텍스트 분석 툴을 이용하여 자사 서비스의 전체 구조를 분석할 수 있다.
또한, 각종 브라우저 및 위젯 등의 서비스에서 사용자의 즐겨찾기, 각종 브라우저 및 위젯 등의 서비스에서 사용자의 히스토리 부분을 강화하고, 각 서비스 제공자에 있어서 CMS (Customer Management System) 부분이나, 광고 시스템에 있어서 CRM (Customer Relationship Management) 부분에 응용이 가능하다. 또한 광고 시스템에 있어서 효과 분석 툴로써 응용이 가능하다.
본 발명을 도면과 함께 보다 상세하게 설명하면 다음과 같다. 이하 본 발명을 설명함에 있어서 관련된 공지 또는 구성에 대한 구체적인 설명이 본 발명의 요지를 불필요하게 흐릴 수 있다고 판단되는 경우에는 그 상세한 설명을 생략한다. 그리고 후술하는 용어는 본 발명에서의 기능을 고려하여 정의된 용어들로서, 이는 사용자, 운용자의 의도 또는 판례 등에 따라 달라질 수 있으며, 이에 따라 각 용어의 의미는 본 명세서 전반에 걸친 내용을 토대로 해석되어야 한다.
도1은 본 발명에 의한 프로그램 개인화 방법에 관한 순서도이다. 본 발명에 의한 인터넷 브라우저나 인터넷 접속 기능이 있는 위젯이 실행되면 사용자가 웹 페이지에 접속할 때마다 텍스트 기반의 각종 단어 자료를 수집한다. 각 단어고 추출되는 회수를 기록한 다음 그 순위별 목록을 사용자에게 제시한다. 사용자가 이 목록에 있는 단어를 클릭하면 검색엔진 사이트에 연결하여 단어를 전송함으로써 곧바로 검색결과를 받아볼 수 있도록 한다.
서비스를 가장 작게 구분할 수 있는 방법으로 방문한 개별 페이지 및 서비스에 있어서 Text 기반으로 데이터를 수집한다. 사용자가 방문한 개별 웹 페이지의 Text, image의 ALT 값, TAG 외의 메타데이터 등을 수집하며 이를 카운트하여 기록한다.
수집된 Text 기반의 단어 중 유의미한 정보를 추출하여 이 중 카운트가 가장 많이 된 정보를 활용하는 방법의 하나는, 도2와 같이 초기화면 혹은 별도 화면에 TAG cloud와 같이 보여준 후 검색엔진에 연결되도록 한다.
사용자가 방문한 각 페이지에서 등장한 단어들을 분석하여 무의미한 단어들을(그래서, 그러나 등의 조사, 되었다, 그렇다 등의 어미와 이에 상응하는 각 언어의 단어들.) 추출, 제외하고 의미를 갖는 다양한 고유명사에 대해 수집한다. 수집된 단어들에 대한 메타데이터(Metadata) 로 사용자의 전체 서비스 사용에 있어서 한 단어가 몇 번 기록이 되어있는지 계산하여 전체 단어에 대한 순위를 작성한다. 작성된 순위를 바탕으로 사용자가 볼 수 있도록 표(Table) 형식이나 태그 클라우드(Tag cloud, 그림) 형식으로 정보를 재구성하여 보여준다.
웹 브라우져의 즐겨찾기나 히스토리와 같이 관심 단어 분석을 기반으로 한 나의 관심사 탭 생성, 시작페이지 설정, 추천 페이지 노출 등을 할 수도 있다.
사용자의 사용 정보에 관한 텍스트를 분석하는 툴은 다양한 방법으로 제작될 수 있다. 예를 들어 제외하는 단어 없이 전체 단어에 대한 단순한 카운팅 후 사용자가 특정 단어를 제거할 수 있는 방법, 무의미한 단어들을(그래서, 그러나 등의 조사, 되었다, 그렇다 등의 어미와 이에 상응하는 각 언어의 단어들.) 추출, 제외하고 의미를 갖는 다양한 고유명사에 대해 수집, 노출하는 방법, 가상 수집 머신을 개발하여 선별적으로 입력되어 있는 단어만을 수집하게 하는 방법, 검색엔진과의 연계를 통해 전체 데이터 중 트렌드에 맞는 단어만을 선별하는 방법 등이 있다.
본 발명에 의한 프로그램 개인화 방법은 PC를 포함한 mobile device(PDA, phone, E-book, MP3P, 등), Digital TV 등에 응용될 수 있고, TEXT 기반으로 하는 다양한 화면 구성 방식을 사용할 수 있다. 예를 들어, 시간대를 축으로 잡아 2차원적으로 보여줄 수 있는 방법, 특정 웹사이트/세분화된 서비스 내 단어 활용 빈도에 대한 화면 구성, 타인과 순위 구성 공유를 통한 SNS(Social Networking Service)와 유사한 각종 구성 등이 가능하다.
이상에서 본 발명의 바람직한 실시예에 한정하여 설명하였으나, 본 발명은 이에 한정되지 않고 다양한 변화와 변경 및 균등물을 사용할 수 있다. 따라서 본 발명은 이들 실시예를 적절히 변형하여 응용할 수 있고, 이러한 응용도 특허청구범위에 기재된 기술적 사상을 바탕으로 하는 한 본 발명의 권리범위에 속하게 됨은 당연하다 할 것이다.
도1 : 본 발명에 의한 프로그램 개인화 방법에 관한 순서도
도2: 사용자 정보로 추출된 단어들을 사용자에게 제시하는 방법의 예
Claims (3)
- 인터넷 접속프로그램에서 인터넷을 접속하는 방법에 있어서,사용자가 방문한 개별 웹 페이지의 텍스트, 이미지의 ALT 값, TAG, 기타 메타 데이터에서 단어를 추출하여 수집하는 단계;상기 수집된 단어에서 무의미한 단어와 유의미한 단어를 구분하여 유의미한 단어만을 추출하는 단계;상기 유의미한 단어를 데이터 베이스에 기록하고, 각각의 단어가 사용자가 방문한 개별 웹 페이지에서 사용된 회수를 누적 계산하여 기록하는 단계;상기 데이터 베이스에 기록된 단어들 중에서 상기 기록회수가 미리 정해진 개수만큼 상위인 단어를 표 또는 태그 클라우드의 형식으로 화면에 표시하여 사용자에게 제시하는 단계;사용자가 상기 표 또는 태그 플라우드의 형식으로 제시된 단어를 클릭하는 경우 해당 단어를 검색엔진 사이트에 접속하여 전송한 후 그 결과를 전송받는 단계;를 포함하는 것을 특징으로 하는 인터넷 접속 프로그램 개인화 방법;
- 제1항에 있어서,상기 수집된 단어에서 무의미한 단어와 유의미한 단어를 구분하여 유의미한 단어만을 추출하는 단계는- 단어 없이 전체 단어에 대한 단순한 카운팅 후 사용자가 특정 단어를 제거할 수 있는 단계- 무의미한 단어들을(그래서, 그러나 등의 조사, 되었다, 그렇다 등의 어미와 이에 상응하는 각 언어의 단어들.) 추출, 제외하고 의미를 갖는 다양한 고유명사에 대해 수집, 노출하는 단계,- 가상 수집 머신을 개발하여 선별적으로 입력되어 있는 단어만을 수집하게 하는 단계- 검색엔진과의 연계를 통해 전체 데이터 중 트렌드에 맞는 단어만을 선별하는 단계중의 하나를 포함하는 것을 특징으로 하는 인터넷 접속 프로그램 개인화 방법
- 제1항 또는 제2항 중의 어느 하나의 항에 따른 방법을 구현하는 프로그램을 기록한 컴퓨터로 판독가능한 정보기록매체
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020090060465A KR20110002929A (ko) | 2009-07-03 | 2009-07-03 | 텍스트 기반의 사용자 활동 분석을 통한 프로그램 개인화 방법 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020090060465A KR20110002929A (ko) | 2009-07-03 | 2009-07-03 | 텍스트 기반의 사용자 활동 분석을 통한 프로그램 개인화 방법 |
Publications (1)
Publication Number | Publication Date |
---|---|
KR20110002929A true KR20110002929A (ko) | 2011-01-11 |
Family
ID=43610992
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020090060465A KR20110002929A (ko) | 2009-07-03 | 2009-07-03 | 텍스트 기반의 사용자 활동 분석을 통한 프로그램 개인화 방법 |
Country Status (1)
Country | Link |
---|---|
KR (1) | KR20110002929A (ko) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US10469412B2 (en) | 2015-09-01 | 2019-11-05 | Samsung Electronics Co., Ltd. | Answer message recommendation method and device therefor |
-
2009
- 2009-07-03 KR KR1020090060465A patent/KR20110002929A/ko not_active Application Discontinuation
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US10469412B2 (en) | 2015-09-01 | 2019-11-05 | Samsung Electronics Co., Ltd. | Answer message recommendation method and device therefor |
US11005787B2 (en) | 2015-09-01 | 2021-05-11 | Samsung Electronics Co., Ltd. | Answer message recommendation method and device therefor |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11036744B2 (en) | Personalization of news articles based on news sources | |
JP5538532B2 (ja) | コミュニティ交流の意味解析を使用するアドバイザ・アシスタント | |
CN102708174B (zh) | 一种浏览器中的富媒体信息的展示方法和装置 | |
Kratz et al. | Making data count | |
CN106383887A (zh) | 一种环保新闻数据采集和推荐展示的方法及系统 | |
JP6872258B2 (ja) | インターネットコンテンツ提供サーバ及びその方法が具現化されたコンピュータで判読できる記録媒体 | |
CN102037464A (zh) | 具有最多点击的下一个对象的搜索结果 | |
US20110246462A1 (en) | Method and System for Prompting Changes of Electronic Document Content | |
US20100192055A1 (en) | Apparatus, method and article to interact with source files in networked environment | |
US20110246277A1 (en) | Multi-factor promotional offer suggestion | |
CN104090757A (zh) | 针对浏览器的富媒体信息展示方法 | |
CN104090923A (zh) | 一种浏览器中的富媒体信息的展示方法和装置 | |
Fu et al. | Library log analysis and its implications for studying online information seeking behavior of cultural groups | |
CN105450460B (zh) | 网络操作记录方法及系统 | |
KR101850853B1 (ko) | 빅데이터를 이용한 검색 방법 및 장치 | |
CN101661471A (zh) | 一种网页页面的显示方法和装置 | |
Byrne | Reviewing Football History through the UK web archive | |
JP5856010B2 (ja) | 広告提供装置、広告提供方法、およびプログラム | |
KR20110002929A (ko) | 텍스트 기반의 사용자 활동 분석을 통한 프로그램 개인화 방법 | |
Chow | “We know who you are and we know where you live”: a research agenda for web demographics | |
KR101440385B1 (ko) | 인디케이터를 이용한 정보 관리 장치 | |
JP2017151574A (ja) | ユーザ情報処理サーバ及びユーザ情報の処理方法 | |
KR20060132174A (ko) | 웹기반 정보추출시스템 및 이를 이용한 광고방법 | |
Sarker et al. | Automatic Individual Information Aggregation Using Publicly Available Social Media Data | |
CN113901325A (zh) | 用户行为分析装置及方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
WITN | Withdrawal due to no request for examination |