KR101067116B1 - 블로그 커뮤니티 추출 방법 및 시스템 - Google Patents
블로그 커뮤니티 추출 방법 및 시스템 Download PDFInfo
- Publication number
- KR101067116B1 KR101067116B1 KR1020080112145A KR20080112145A KR101067116B1 KR 101067116 B1 KR101067116 B1 KR 101067116B1 KR 1020080112145 A KR1020080112145 A KR 1020080112145A KR 20080112145 A KR20080112145 A KR 20080112145A KR 101067116 B1 KR101067116 B1 KR 101067116B1
- Authority
- KR
- South Korea
- Prior art keywords
- community
- post
- blog
- posts
- blogger
- Prior art date
Links
- 238000000034 method Methods 0.000 title claims description 49
- 238000000605 extraction Methods 0.000 claims abstract description 100
- 230000009471 action Effects 0.000 claims description 174
- 230000008569 process Effects 0.000 claims description 21
- 230000000977 initiatory effect Effects 0.000 claims description 20
- 239000000284 extract Substances 0.000 abstract description 8
- 238000010586 diagram Methods 0.000 description 6
- 230000008859 change Effects 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 238000007790 scraping Methods 0.000 description 2
- 230000007423 decrease Effects 0.000 description 1
- 230000006855 networking Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000005070 sampling Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/01—Social networking
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Databases & Information Systems (AREA)
- Physics & Mathematics (AREA)
- Business, Economics & Management (AREA)
- General Physics & Mathematics (AREA)
- Economics (AREA)
- Marketing (AREA)
- General Engineering & Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Data Mining & Analysis (AREA)
- General Health & Medical Sciences (AREA)
- Human Resources & Organizations (AREA)
- Computing Systems (AREA)
- Primary Health Care (AREA)
- Strategic Management (AREA)
- Tourism & Hospitality (AREA)
- General Business, Economics & Management (AREA)
- Information Transfer Between Computers (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
블로그 커뮤니티 추출 방법 및 시스템이 개시된다. 블로그 커뮤니티 추출 방법 및 시스템은 블로그 집단으로부터 특정 주제에 대한 포스트 및 블로거를 검색하여 커뮤니티 포스트 및 커뮤니티 멤버를 생성함으로써 블로그 집단에 포함된 잠재적인 블로그 커뮤니티를 추출할 수 있다. 특정 주제에 대한 관심으로 형성된 블로그 커뮤니티를 추출함으로써 특정 주제에 대한 유용한 정보를 획득할 수 있다.
블로그, 블로거, 포스트, 블로그 커뮤니티, 커뮤니티 포스트, 커뮤니티 멤버
Description
본 발명은 블로그 커뮤니티 추출 방법 및 시스템에 관한 것으로, 보다 자세하게는, 블로그 집단으로부터 특정 주제에 대한 블로거 및 포스트를 확장 단계별로 검색함으로써 커뮤니티 멤버 및 커뮤니티 포스트를 생성하는 블로그 커뮤니티 추출 방법 및 시스템에 관한 것이다.
커뮤니티는 사교성, 정보, 소속감, 사회적 정체성 등을 주는 사람 사이에 일어나는 유대에 대한 연결망을 의미한다. 이러한 커뮤니티는 온라인 상에서도 쉽게 발견할 수 있다. 관심사가 비슷한 사람들끼리 모여 운영되는 온라인 카페, 친구나 동창들을 서로 연결해주는 온라인 사회 연결망, 포털 사이트가 주제별로 운영하는 게시판, 마케팅이나 고객 관리의 차원에서 특정 상품을 주제로 운영되는 기업 사이트 등이 그 예이다.
대부분의 온라인 커뮤니티는 회원 가입이나 이웃 맺기 등을 통해 만들어지므로, 커뮤니티의 경계가 명시적으로 드러난다. 그러나, 특별히 커뮤니티에 참여 의사를 밝히지 않았다고 하더라도 특정 주제에 대해 흥미를 가지는 사람들을 별도 로 추출하여 별도의 커뮤니티로 관리할 필요가 있다.
다만, 상기 언급한 커뮤니티는 멤버쉽 형태로 운영되는 것이 아니기 때문에, 상기 커뮤니티에 속하는 멤버들을 찾거나 경계를 정하는데 어려움이 많다. 이렇게 특정 주제에 대한 관심으로 형성된 인맥과 문서들을 활용하면, 다양한 영역에서 타겟 마케팅을 수행하는 데 도움이 될 수 있다.
따라서, 온라인 상에 존재하는 인맥 정보와 문서들로부터 특정 주제에 대한 커뮤니티를 생성하는 방법이 필요하게 되었다. 또한, 온라인 상의 커뮤니티에서 특정 주제에 대한 잠재적인 커뮤니티를 빠르고 높은 정확도로 찾아내는 방법도 요구되고 있다.
본 발명은 블로그 집단으로부터 특정 주제와 관련한 포스트 또는 블로거를 검색함으로써 블로그 집단에 잠재적으로 존재하는 특정 주제에 대한 블로그 커뮤니티를 추출할 수 있는 블로그 커뮤니티 추출 방법 및 시스템을 제공한다.
본 발명은 블로그 집단에 존재하는 주제별 포스트의 수를 이용하여 초기 확장 단계의 초기 액션수 임계치를 조정함으로써, 정확도가 높은 블로그 커뮤니티를 결정할 수 있는 블로그 커뮤니티 추출 방법 및 시스템을 제공한다.
본 발명은 액션 순도 임계치를 적용하여 특정 주제에 대한 블로그 커뮤니티를 결정함으로써, 정확도가 높은 블로그 커뮤니티를 결정할 수 있는 블로그 커뮤니티 추출 방법 및 시스템을 제공한다.
본 발명은 블로거가 설정한 폴더에 기초하여 블로그 커뮤니티를 결정함으로써, 블로거가 복수의 블로그 커뮤니티에 속할 수 있는 블로그 커뮤니티 추출 방법 및 시스템을 제공한다.
본 발명은 주제와 무관하게 인기가 많아 액션수가 높은 인기 포스트를 커뮤니티 포스트에서 제외함으로써, 정확도가 높은 블로그 커뮤니티를 결정할 수 있는 블로그 커뮤니티 추출 방법 및 시스템을 제공한다.
본 발명의 일실시예에 따른 블로그 커뮤니티 추출 방법은 블로그 집단으로부터 특정 주제와 연관된 시드 포스트를 추출하는 단계, 상기 추출된 시드 포스트 를 기초로 상기 특정 주제와 연관된 포스트 및 블로거를 검색하여 커뮤니티 포스트 및 커뮤니티 멤버를 생성하는 단계 및 상기 커뮤니티 포스트 및 커뮤니티 멤버를 이용하여 상기 특정 주제에 대한 블로그 커뮤니티를 결정하는 단계를 포함할 수 있다.
본 발명의 일측면에 따르면, 상기 커뮤니티 포스트 및 커뮤니티 멤버를 생성하는 단계는 상기 시드 포스트에 액션을 적용한 블로거를 검색하여 커뮤니티 멤버로 선정하는 단계, 상기 커뮤니티 멤버로 선정된 블로거가 액션을 적용한 포스트를 검색하여 상기 커뮤니티 포스트로 선정하는 단계, 상기 커뮤니티 포스트에 액션을 적용한 블로거를 추가로 검색하여 상기 커뮤니티 멤버를 확장하는 단계 및 상기 커뮤니티 멤버가 액션을 적용한 포스트를 추가로 검색하여 상기 커뮤니티 포스트를 확장하는 단계를 포함할 수 있다.
본 발명의 일측면에 따르면, 상기 커뮤니티 포스트 및 커뮤니티 멤버를 생성하는 단계는 상기 특정 주제와 연관된 포스트 또는 블로거를 검색하기 위한 액션수 임계치를 설정할 수 있다.
본 발명의 일실시예에 따른 블로그 커뮤니티 추출 시스템은 블로그 집단으로부터 특정 주제와 연관된 시드 포스트를 추출하는 시드 포스트 추출부, 상기 추출된 시드 포스트를 기초로 상기 특정 주제와 연관된 포스트 및 블로거를 검색하여 커뮤니티 포스트 및 커뮤니티 멤버를 생성하는 포스트/블로거 검색부 및 상기 커뮤니티 포스트 및 커뮤니티 멤버를 이용하여 상기 특정 주제에 대한 블로그 커뮤니티를 결정하는 블로그 커뮤니티 결정부를 포함할 수 있다.
본 발명의 일실시예에 따르면, 블로그 집단으로부터 특정 주제와 관련한 포스트 또는 블로거를 검색함으로써 블로그 집단에 잠재적으로 존재하는 특정 주제에 대한 블로그 커뮤니티를 추출할 수 있는 블로그 커뮤니티 추출 방법 및 시스템이 제공된다.
본 발명의 일실시예에 따르면, 블로그 집단에 존재하는 주제별 포스트의 수를 이용하여 초기 확장 단계의 초기 액션수 임계치를 조정함으로써, 정확도가 높은 블로그 커뮤니티를 결정할 수 있는 블로그 커뮤니티 추출 방법 및 시스템이 제공된다.
본 발명의 일실시예에 따르면, 액션 순도 임계치를 적용하여 특정 주제에 대한 블로그 커뮤니티를 결정함으로써, 정확도가 높은 블로그 커뮤니티를 결정할 수 있는 블로그 커뮤니티 추출 방법 및 시스템이 제공된다.
본 발명의 일실시예에 따르면, 블로거가 설정한 폴더에 기초하여 블로그 커뮤니티를 결정함으로써, 블로거가 복수의 블로그 커뮤니티에 속할 수 있는 블로그 커뮤니티 추출 방법 및 시스템이 제공된다.
본 발명의 일실시예에 따르면, 주제와 무관하게 인기가 많아 액션수가 높은 인기 포스트를 커뮤니티 포스트에서 제외함으로써, 정확도가 높은 블로그 커뮤니티를 결정할 수 있는 블로그 커뮤니티 추출 방법 및 시스템이 제공된다.
이하, 첨부된 도면들에 기재된 내용들을 참조하여 본 발명에 따른 실시예를 상세하게 설명한다. 다만, 본 발명이 실시예들에 의해 제한되거나 한정되는 것은 아니다. 각 도면에 제시된 동일한 참조부호는 동일한 부재를 나타낸다. 본 발명의 일실시예에 따른 블로그 커뮤니티 추출 방법은 블로그 커뮤니티 추출 시스템에 의해 수행될 수 있다.
도 1은 본 발명의 일실시예에 따른 블로그 집단으로부터 블로그 커뮤니티를 추출하는 과정을 설명하기 위한 도면이다.
도 1을 참고하면, 블로그 집단(101)이 도시된다. 블로그 집단(101)은 블로거(102, 103, 104, 105)와 블로거에 포함된 포스트로 구성될 수 있다. 이 때, 블로거는 블로그의 주인, 운영자 또는 관리자를 의미할 수 있지만, 본 발명에서 블로그와 블로거는 동일한 것으로 정의하도록 한다.
블로그는 특정 주제에 대한 관심사에 따라 자유롭게 포스트를 게시할 수 있는 사이트를 의미할 수 있다. 블로그는 사이트의 외부적인 형태에 따라 결정되지 않고, 특정 주제에 대한 포스트가 게시된 다양한 형태의 사이트를 포함할 수 있다. 포스트는 특정 주제에 대한 컨텐츠(예를 들어, 텍스트, 영상, 이미지, 음성 또는 플래시 등을 포함하는 문서)를 의미할 수 있다. 본 발명의 일실시예에 따른 블로그 커뮤니티 추출 시스템은 온라인 상에 존재하는 복수의 컨텐츠와 복수의 유저 중 특정 주제에 대한 컨텐츠와 컨텐츠에 관심을 표현한 유저를 추출하는 것이므로, 컨텐츠를 게시하는 사이트의 형태는 제한이 없다.
블로그에 게시된 포스트는 적어도 하나일 수 있으며, 포스트를 게시한 블로거도 적어도 하나일 수 있다. 결국, 본 발명의 일실시예에 따르면, 블로그는 특정 주제에 대해 다양한 형태의 컨텐츠를 게시하고 온라인 상 일종의 사이트라고 정의될 수 있다.
그리고, 포스트는 특정 주제와 관련된 컨텐츠를 의미할 수 있다. 다시 말해서, 포스트는 블로그의 주인인 블로거가 특정 주제에 대한 문서, 이미지, 동영상, 음악, 플래시 등 다양한 형태의 데이터를 블로그에 게시한 것을 의미한다. 이 때, 블로그 집단(101)은 블로그와 블로그들 사이의 액션으로 구성된 연결망으로 표현될 수 있다.
도 1에서 화살표는 블로거가 다른 블로거가 게시한 포스트에 적용하는 액션을 의미한다. 이 때, 액션은 읽기(read), 쓰기(write), 덧글(reply), 트랙백(trackback) 또는 스크랩(scrap) 등 블로거가 포스트에 대해 관심을 표현하는 특정 행위를 의미할 수 있다.
이 때, 읽기는 블로거가 다른 블로거에 의해 게시된 임의의 포스트를 읽는 것을 의미한다. 그리고, 쓰기는 블로거가 자신의 블로그 또는 다른 블로거의 블로그에 새 포스트를 작성하는 것을 의미한다. 덧글은 블로거가 다른 블로거에 의해 게시된 포스트를 읽고 감상 또는 느낌 등을 작성하는 것을 의미한다. 트랙백은 다른 포스트를 참조하는 새 포스트를 작성하는 것을 의미한다. 스크랩은 다른 블로거의 포스트를 자신의 블로그에 폴더를 나누어 보관하는 것을 의미한다.
도 1을 통해, 블로거 2(103)는 블로거 1(102)이 게시한 포스트 a에 액션을 적용한 것을 알 수 있다. 또한, 블로거 2(103)는 블로거 3(103)이 게시한 포스트 f와 포스트 h에 액션을 적용한 것을 알 수 있다.
그리고, 블로거 3(104)은 블로거 2(103)이 게시한 포스트 d 및 블로거 4(105)가 게시한 포스트 j와 포스트 k에 액션을 적용한 것을 알 수 있다.
본 발명의 일실시예에 따른 블로그 커뮤니티 추출 방법은 다음의 2가지 가정에서 시작한다.
첫째, 블로그 집단(101)에서 임의의 포스트에 액션을 적용한 블로거는 상기 포스트와 관련된 주제에 관심이 있을 확률이 높다. 따라서, 동일한 주제와 연관된 복수의 포스트들에 대해 공통적으로 액션을 적용한 블로거는 그 포스트들과 관련된 주제에 관심이 있다고 할 수 있다. 예를 들어, "여행'과 관련된 포스트에 액션을 적용한 블로거는 "여행"에 관심이 있을 확률이 높다.
둘째, 동일한 주제에 관심을 가진 복수의 블로거들이 공통적으로 액션을 적용한 포스트는 상기 블로거들이 관심을 가진 주제와 연관된 포스트일 확률이 높다. 예를 들어, "여행"에 관심이 있는 블로거들이 액션을 적용한 포스트는 "여행"과 관련된 포스트일 수 있다.
본 발명의 일실시예에 따른 블로그 커뮤니티 추출 시스템은 특정 주제에 대한 블로거와 포스트들을 검색하여 각각 커뮤니티 멤버(107)와 커뮤니티 포스트(108)를 생성할 수 있다. 이 때, 블로그 커뮤니티 추출 시스템은 특정 주제와 관련도가 높은 시드 포스트를 기초로 확장 단계별 검색을 통해 단계에 따라 추가적으로 블로거와 포스트를 검색할 수 있다.
만약, 도 1에서 포스트 d와 포스트 h가 "여행"과 관련된 시드 포스트인 경우, 블로그 커뮤니티 추출 시스템은 포스트 d와 포스트 h에 액션을 적용한 블로거 2(103)와 블로거 3(104)을 검색하여 커뮤니티 멤버로 선정할 수 있다. 그리고, 블로그 커뮤니티 추출 시스템은 블로거 2(103)와 블로거 3(104)이 액션을 적용한 포스트 a, 포스트 f, 포스트 j, 포스트 k를 검색할 수 있다. 만약, 블로그 커뮤니티 추출 시스템은 포스트 d와 포스트 h뿐만 아니라, 포스트 a, 포스트 f, 포스트 j, 포스트 k에 액션을 적용한 블로거를 추가 검색할 수 있다. 이러한 검색 과정은 단계에 따라 반복될 수 있으며, 검색되는 블로거와 포스트는 계속해서 추가될 수 있다. 이하에서, 반복적으로 블로거와 포스트를 추가 검색하는 각각의 단계를 확장 단계로 정의한다. 즉, 블로그 커뮤니티 추출 시스템은 확장 단계별로 특정 주제와 관련된 블로거와 포스트를 검색할 수 있다.
그러면, 블로그 커뮤니티 추출 시스템은 블로거 2(103)와 블로거 3(104)을 커뮤니티 멤버(107)로 선정할 수 있다. 그리고, 블로그 커뮤니티 추출 시스템은 시드 포스트인 포스트 d와 포스트 h뿐만 아니라, 검색된 블로거 2(103)와 블로거 3(104)에 의해 액션이 적용된 포스트인 포스트 a, 포스트 f, 포스트 j, 포스트 k를 커뮤니티 포스트(108)로 선정할 수 있다. 결국, 블로그 커뮤니티(106)는 생성된 커뮤니티 멤버(107)와 커뮤니티 포스트(108)로 결정될 수 있다.
도 2는 본 발명의 일실시예에 따른 블로그 커뮤니티 추출 방법에 대한 전체 과정을 도시한 플로우차트이다.
단계(S201)에서, 블로그 커뮤니티 추출 시스템은 블로그 집단으로부터 특정 주제와 연관된 시드 포스트를 추출할 수 있다. 여기서, 블로그 집단은 복수의 블로거와 복수의 포스트, 두 종류의 객체로 이루어질 수 있다. 이 때, 블로그 집단 은 제1 블로거와 제2 블로거 사이에 액션으로 구성된 연결망으로 구성될 수 있다. 다시 말해, 블로그 집단은 특정 블로거가 다른 블로거가 게시한 포스트에 액션을 적용하는 연결망으로 구성될 수 있다.
그리고, 액션은 제1 블로거에 포함된 적어도 하나의 포스트에 대해 읽기, 쓰기, 덧글, 트랙백 또는 스크랩 등 제2 블로거가 포스트에 관심을 표현하는 행위를 의미할 수 있다.
본 발명의 일실시예에 따르면, 블로그 커뮤니티 추출 시스템은 주제와의 적합성, 포스트에 포함된 정보의 상태(양과 질) 또는 포스트의 인기도를 포함하는 기준에 따라 블로그 집단으로부터 시드 포스트를 추출할 수 있다. 일례로, 시드 포스트는 도메인 전문가를 통해 블로그 집단으로부터 추출될 수 있다. 그리고, 추출된 시드 포스트도 커뮤니티 포스트로 선정될 수 있다.
단계(S202)에서, 블로그 커뮤니티 추출 시스템은 추출된 시드 포스트를 기초로 특정 주제와 연관된 포스트 및 블로거를 확장 단계별로 검색하여 커뮤니티 포스트 및 커뮤니티 멤버를 생성할 수 있다. 이 때, 특정 주제와 연관된 포스트는 커뮤니티 포스트로 선정되고, 상기 특정 주제와 동일한 주제와 연관된 블로거는 커뮤니티 멤버로 선정될 수 있다. 확장 단계별로 블로거 및 포스트를 검색하여 커뮤니티 포스트 및 커뮤니티 멤버를 생성하는 구체적인 과정은 도 3 내지 도 5에서 설명된다.
일례로, 확장 단계마다 액션수 임계치가 적용될 수 있다. 이 때, 액션수 임계치는 확장 단계가 진행될 때마다 증가할 수 있다. 일례로, 확장 단계마다 적용 되는 액션수 임계치는 이전 확장 단계의 커뮤니티 멤버 또는 커뮤니티 포스트에 대한 액션 정보에 따라 조정될 수 있다.
일례로, 초기 확장 단계에 대한 초기 액션수 임계치는 특정 주제와 관련된 포스트의 개수에 따른 확장 종료 단계에 도달할 수 있는 지 여부를 피드백함으로써 결정될 수 있다.
그리고, 블로그 커뮤니티 추출 시스템은 특정 주제와 관련이 없는 노이즈에 해당하는 포스트 또는 블로거를 검색하는 것을 방지하기 위해 포스트 또는 블로거 각각에 대한 액션 순도 임계치를 설정할 수 있다. 따라서, 블로그 커뮤니티 추출 시스템은 확장 단계별로 액션 수 임계치와 액션 순도 임계치를 함께 고려하여 특정 주제와 연관된 포스트 및 블로거를 검색할 수 있다. 이에 따라, 특정 주제와 연관된 포스트 및 블로거를 추출하는 과정의 정확도는 향상될 수 있다.
일례로, 블로그 커뮤니티 추출 시스템은 블로그 집단에 포함된 포스트에 대한 액션수에 기초하여 인기 포스트를 결정하고, 확장 단계마다 커뮤니티 포스트에서 인기 포스트를 제외할 수 있다. 이 때, 블로그 커뮤니티 추출 시스템은 블로그 집단의 평균 액션수에 기초하여 인기 포스트를 결정할 수 있다. 예를 들어, 블로그 커뮤니티 추출 시스템은 블로그 집단의 평균 액션수보다 미리 설정한 기준치를 초과하는 액션수를 나타내는 블로그를 인기 포스트로 결정할 수 있다. 인기 포스트는 특정 주제와의 관련성과는 무관하게 단순히 대중적으로 인기가 많아 액션수가 높은 포스트를 의미할 수 있다. 결국, 인기 포스트로 인해 미리 설정한 특정 주제와 다른 주제에 대한 블로거와 포스트가 검색됨으로써 블로그 커뮤니티에 대한 정 확도가 감소될 수 있다.
따라서, 본 발명의 일실시예에 따르면, 블로그 커뮤니티 추출 시스템은 확장 단계마다 커뮤니티 포스트에서 인기 포스트는 제외함으로써, 특정 주제에 대해 보다 정확도와 관련성이 높은 포스트 및 블로거를 검색할 수 있다.
단계(S203)에서, 블로그 커뮤니티 추출 시스템은 커뮤니티 포스트 및 커뮤니티 멤버를 이용하여 상기 특정 주제에 대한 블로그 커뮤니티를 결정할 수 있다.
일례로, 블로거는 적어도 하나의 특정 주제별로 폴더를 설정하여 폴더마다 대응하는 포스트를 연결할 수 있다. 폴더는 블로거가 관심 분야에 따라 분류한 포스트 수집 공간을 의미할 수 있다. 따라서, 블로그 커뮤니티 추출 시스템은 설정된 폴더를 새로운 블로거로 간주하여 블로거가 설정한 폴더 각각에 대해 블로그 커뮤니티를 결정할 수 있다. 결국, 하나의 블로거는 적어도 하나의 주제와 관한 블로그 커뮤니티에 속할 수 있다.
도 3은 본 발명의 일실시예에 따른 확장 단계별로 특정 주제와 관련된 블로거와 포스트를 검색하는 과정을 도시한 플로우차트이다.
일례로, 블로그 커뮤니티 추출 시스템은 다음과 같은 확장 단계에 따라 특정 주제와 연관된 포스트 및 블로거를 검색하여 커뮤니티 포스트 및 커뮤니티 멤버를 생성할 수 있다.
단계(S301)에서, 블로그 커뮤니티 추출 시스템은 시드 포스트에 액션을 적용한 블로그를 검색하여 커뮤니티 멤버로 선정할 수 있다.
단계(S302)에서, 블로그 커뮤니티 추출 시스템은 커뮤니티 멤버로 선정된 블 로거에 의해 액션이 적용된 포스트를 검색하여 커뮤니티 포스트로 선정할 수 있다.
단계(S303)에서, 블로그 커뮤니티 추출 시스템은 커뮤니티 포스트에 액션을 적용한 블로거를 추가로 검색하여 커뮤니티 멤버를 확장할 수 있다.
단계(S304)에서, 블로그 커뮤니티 추출 시스템은 확장된 커뮤니티 멤버가 액션을 적용한 포스트를 추가로 검색하여 커뮤니티 포스트를 확장할 수 있다.
블로그 커뮤니티 추출 시스템은 미리 설정한 개수의 블로거와 포스트를 검색하여 커뮤니티 멤버와 커뮤니티 포스트를 생성할 때까지 확장 단계인 단계(S303)와 단계(S304)를 반복할 수 있다.
일례로, 블로그 커뮤니티 추출 시스템은 각각의 확장 단계마다 액션수 임계치를 설정할 수 있다. 즉, 단계(S301) 내지 단계(S304)에 각각 액션수 임계치가 설정될 수 있다. 구체적으로, 단계(S301)와 단계(S303)는 커뮤니티 멤버를 선정하기 위한 액션수 임계치가 설정될 수 있고, 단계(S302)와 단계(S304)는 커뮤니티 포스트를 선정하기 위한 액션수 임계치가 설정될 수 있다. 즉, 단계(S303)와 단계(S304)가 반복되는 경우, 해당 확장 단계에서의 액션수 임계치를 만족하지 못하면, 확장 단계는 종료할 수 있다. 액션수 임계치는 이전 확장 단계의 커뮤니티 멤버 또는 커뮤니티 포스트에 대한 액션 정보에 따라 조정될 수 있다.
그리고, 블로그 커뮤니티 추출 시스템은 각각의 확장 단계마다 액션 순도 임계치를 추가적으로 설정할 수 있다. 커뮤니티 멤버를 선정하는 경우, 액션 순도 임계치는 임의의 블로거가 특정 주제에 대해서만 관심을 나타내는 지 여부를 나타낸다. 그리고, 커뮤니티 포스트를 선정하는 경우, 액션 순도 임계치는 포스트가 해당 주제에 대해서만 관련이 있는 지 여부를 나타낸다.
이 때, 커뮤니티 멤버를 선정하기 위한 액션 순도 임계치와 커뮤니티 포스트를 선정하기 위한 액션 순도 임계치는 다음과 같이 정의될 수 있다. 액션 순도 임계치도 액션수 임계치와 마찬가지로 확장 단계마다 조정될 수 있다.
액션 순도 임계치(커뮤니티 멤버)=블로거가 커뮤니티 포스트에 적용한 액션수/블로거의 전체 액션수
액션 순도 임계치(커뮤니티 포스트)=포스트가 커뮤니티 멤버에 의해 적용된 액션수/포스트에 적용된 전체 액션수
도 4는 본 발명의 일실시예에 따른 확장 단계별로 블로그 집단으로부터 포스트 및 블로거를 검색하는 일례를 설명하기 위한 도면이다.
도 4를 참고하면, 블로그 커뮤니티 추출 시스템은 블로그 집단(401)로부터 특정 주제와 관련된 시드 포스트를 선출할 수 있다. 시드 포스트는 커뮤니티 포스트(402)로 선정될 수 있다. 선출된 시드 포스트로부터 특정 주제와 관련된 포스트 및 블로거를 검색하는 확장 단계가 진행된다. 도 4에서는 각각의 STEP이 확장 단계를 의미한다.
STEP1에서, 블로그 커뮤니티 추출 시스템은 시드 포스트에 액션을 적용한 블로거 1을 검색할 수 있다. 선정된 블로거 1은 커뮤니티 멤버(403)로 선정될 수 있다.
STEP 2에서, 블로그 커뮤니티 추출 시스템은 블로거 1이 액션을 적용한 포스트 1을 검색할 수 있다. 포스트 1은 커뮤니티 포스트(402)에 추가됨으로써, 커뮤 니티 포스트(402)는 확장할 수 있다.
STEP 3에서, 블로그 커뮤니티 추출 시스템은 시드 포스트 및 포스트 1에 액션을 적용한 블로거 2를 검색할 수 있다. 검색된 블로거 2는 커뮤니티 멤버(403)에 추가됨으로써, 커뮤니티 멤버(402)는 확장할 수 있다.
동일한 방법으로, STEP 4에서, 블로그 커뮤니티 추출 시스템은 블로거 1 및 블로거 2에 의해 액션이 적용된 포스트 2가 검색할 수 있다. 포스트 2는 커뮤니티 포스트(402)에 추가됨으로써, 커뮤니티 포스트(402)는 확장할 수 있다. 그리고, STEP 5에서, 블로그 커뮤니티 추출 시스템은 시드 포스트, 포스트 1, 포스트 2에 액션을 적용한 블로거 3을 검색할 수 있다. 블로거 3은 커뮤니티 멤버(403)에 추가됨으로써, 커뮤니티 멤버(403)는 확장할 수 있다.
이러한 과정은 미리 설정한 개수(n개)의 포스트 및 블로거가 검색될 때까지 반복할 수 있다. 도 4에서 확장 단계인 각각의 STEP 마다 액션수 임계치와 액션 순도 임계치가 적용될 수 있다. 결국, 각 확장 단계마다 설정된 임계치 이상의 액션이 적용되어야, 블로그 커뮤니티 추출 시스템은 블로거 또는 포스트를 검색할 수 있다.
액션수 임계치는 확장 단계에 따라 증가할 수 있다. 여기서, 액션수 임계치는 커뮤니티 멤버를 선정하기 위한 액션수 임계치 및 커뮤니티 포스트를 선정하기 위한 액션수 임계치로 구성될 수 있다. 초기 확장 단계의 경우, 초기 액션 임계치는 확장 단계에 따른 피드백을 통해 결정된다.
구체적으로, 현재 확장 단계의 커뮤니티 멤버를 선정하기 위한 액션수 임계 치는 이전 확장 단계의 커뮤니티 멤버를 선정하기 위한 액션수 임계치보다 클 수 있다. 또한, 현재 확장 단계의 커뮤니티 포스트를 선정하기 위한 액션수 임계치는 이전 확장 단계의 커뮤니티 포스트를 선정하기 위한 액션수 임계치보다 클 수 있다. 예를 들어, STEP 2의 커뮤니티 포스트를 선정하기 위한 액션수 임계치는 STEP 1의 커뮤니티 포스트를 선정하기 위한 액션수 임계치보다 클 수 있다. 그러나, STEP 2의 커뮤니티 멤버를 선정하기 위한 액션수 임계치는 STEP 1의 커뮤니티 멤버를 선정하기 위한 액션수 임계치와 동일할 수 있다.
다른 예로, STEP 3의 커뮤니티 멤버를 선정하기 위한 액션수 임계치는 STEP 2의 커뮤니티 멤버를 선정하기 위한 액션수 임계치보다 클 수 있다. 그러나, STEP 3의 커뮤니티 포스트를 선정하기 위한 액션수 임계치는 STEP 2의 커뮤니티 포스트를 선정하기 위한 액션수 임계치와 동일할 수 있다.
일례로, 블로그 커뮤니티의 정확도를 위해 현재 확장 단계에 설정된 액션수 임계치는 이전 확장 단계의 액션 정보에 따라 조정될 수 있다. 그리고, 확장 단계마다 액션 순도 임계치가 적용될 수 있다. 또한, 블로그 커뮤니티의 정확도를 위해 커뮤니티 포스트를 선정하기 위한 확장 단계에서 검색된 인기 포스트는 제외될 수 있다.
따라서, 블로그 커뮤니티 추출 시스템은 각 확장 단계마다 설정된 임계치 이상의 액션과 관련된 블로거나 포스트를 검색하여 커뮤니티 멤버 또는 커뮤니티 포스트를 생성할 수 있다.
도 5는 본 발명의 일실시예에 따른 블로그 커뮤니티를 추출하는 과정을 확장 단계별로 설명하는 일례를 도시한 도면이다.
도 5에서, 점선은 액션을 의미하고, 실선은 액션 중 커뮤니티 멤버 및 커뮤니티 포스트를 선정하기 위한 유효 액션을 의미한다.
이 때, 블로그 커뮤니티 추출 시스템은 시드 포스트 각각에 2 이상의 액션을 적용한 B2, B4, B7, B10을 검색할 수 있다. 따라서, 커뮤니티 포스트는 시드 포스트인 P6과 P10이 선정되고, 커뮤니티 멤버는 검색된 블로거인 B2, B4, B7, B10이 선정된다.
참조부호(502)에서, 커뮤니티 포스트를 선정하기 위한 액션수 임계치()는 참조부호(501)의 액션수 임계치보다 1 증가한 3으로 설정되어 있다. 확장 단계에 따라 증가하는 액션수 임계치는 시스템의 구성에 따라 변경될 수 있다. 특히, 본 발명의 일실시예에 따르면, 이전 확장 단계의 액션 정보에 따라 현재 확장 단계의 액션수 임계치가 조절될 수 있다.
이 때, 블로그 커뮤니티 추출 시스템은 커뮤니티 멤버에 의해 3이상의 액션이 적용된 P4과 P13을 추가로 검색할 수 있다. 따라서, 커뮤니티 포스트는 추가 검색된 P4, P13에 의해 확장되고, 커뮤니티 멤버는 그대로 유지된다.
이 때, 블로그 커뮤니티 추출 시스템은 커뮤니티 포스트에 3이상의 액션을 적용한 B12를 추가로 검색할 수 있다. 따라서, 커뮤니티 멤버는 추가 검색된 B12에 의해 확장되고, 커뮤니티 포스트는 그대로 유지된다.
참조부호(504)에서, 커뮤니티 포스트를 선정하기 위한 액션수 임계치()는 참조부호(503)의 액션수 임계치보다 1 증가한 4로 설정되어 있다. 이 때, 커뮤니티 멤버가 4이상의 액션을 적용한 포스트가 더 이상 검색되지 않는다. 따라서, 블로거 및 포스트를 검색하는 확장 단계는 종료한다.
그리고, 최종적으로 생성된 커뮤니티 멤버(B2, B4, B7, B10, B12)와 커뮤니티 포스트(P4, P6, P10, P13)는 블로그 커뮤니티로 결정된다. 다시 말해, 커뮤니티 멤버인 블로거들(B2, B4, B7, B10, B12)은 커뮤니티 포스트인 포스트(P4, P6, P10, P13)를 공유하여 블로그 커뮤니티를 구성하고 있음을 알 수 있다.
도 5에서는 액션 순도 임계치는 고려되지 않았다. 만약, 액션 순도 임계치가 적용되는 경우, 블로그 커뮤니티의 정확도는 보다 향상될 수 있다. 그리고, 확장 단계마다 적용된 액션수 임계치도 조정될 수 있다.
도 6은 본 발명의 일실시예에 따른 블로그 커뮤니티를 추출하기 위한 초기 액션수 임계치를 설정하는 과정을 도시한 플로우차트이다.
구체적으로, 도 6은 확장 단계를 통한 피드백 결과를 이용하여 초기 확장 단 계에 설정되는 초기 액션수 임계치를 자동으로 조정하는 과정을 나타낸다.
단계(S601)에서, 블로그 커뮤니티 추출 시스템은 초기 액션수 임계치를 A로 임의 설정할 수 있다. 일례로, 임의 설정된 초기 액션수 임계치는 시드 포스트의 개수일 수 있다.
그리고, 블로그 커뮤니티 추출 시스템은 임의로 설정된 초기 액션수 임계치(A)를 확장 단계별로 검색하는 단계(S608)에 입력한 후, 확장 종료 단계 부근에서 확장 종료 단계에 도달할 수 있는 여부를 피드백 받을 수 있다. 즉, 블로그 커뮤니티 추출 시스템은 피드백 결과를 통해 확장 종료 단계 부근에서 확장의 정도가 줄어드는 지 여부를 판단하여 확장 종료 단계에 도달할 수 있도록 피드백 과정을 반복할 수 있다.
이 때, 확장 종료 단계는 특정 주제와 관련된 예상 포스트의 개수와 실제 포스트의 개수가 유사해지는 단계를 의미한다. 예를 들어, 실제 포스트 개수의 90~100%에 해당하는 구간에 예상 포스트의 개수가 포함되는 단계에서 확장 단계가 종료할 수 있다. 즉, 특정 주제에 대해 관련되었다고 예상되는 예상 포스트의 개수와 동일한 주제에 대해 블로그 집단에 실제로 존재하는 실제 포스트의 개수가 유사해지면, 블로그 커뮤니티는 상기 특정 주제에 대해 관심을 가진 대부분의 블로거를 포함할 수 있다. 일례로, 예상 포스트는 블로그 집단에서 커뮤니티 멤버로부터 적어도 하나 이상의 액션이 적용된 모든 포스트를 의미할 수 있다. 다시 말해, 예상 포스트는 특정 주제에 관심이 있는 블로거들이 한 번 이상 관심을 표현한 포스트라고 할 수 있다. 그리고, 실제 포스트의 개수는 미리 결정된 개수일 수 있 다.
일례로, 만약 실제 포스트의 개수가 결정되지 않은 경우, 블로그 커뮤니티 추출 시스템은 랜덤 샘플링을 통해 전체 주제에 대해 특정 주제에 해당하는 포스트의 비율을 결정하고, 블로그 집단에 포함된 전체 포스트의 개수를 곱하여 추정할 수 있다.
블로그 커뮤니티 추출 시스템은 피드백 결과를 통해 확장 종료 단계 에 도달할 수 있는 지 여부를 판단할 수 있다(S602). 만약, 피드백 결과를 통해 확장 종료 단계 부근에서 확장 종료 단계에 도달할 수 있다고 결정되면, 블로그 커뮤니티 추출 시스템은 임의 설정한 A를 초기 액션수 임계치로 사용할 수 있다(S603). 반대로, 확장 종료 단계에 도달할 수 없는 경우, 블로그 커뮤니티 추출 시스템은 A를 B로 감소시킬 수 있다(S604). 예를 들어, 블로그 커뮤니티 추출 시스템은 초기 액션수 임계치인 A의 1/2에 해당하는 B로 변경시킬 수 있다.
블로그 커뮤니티 추출 시스템은 변경된 초기 액션수 임계치인 B를 확장 단계별로 검색하는 단계(S608)에 입력한 후, 확장 종료 단계 부근에서 확장 종료 단계에 도달할 수 있는 여부를 피드백 받을 수 있다. 이 때, 블로그 커뮤니티 추출 시스템은 피드백 결과를 통해 확장 종료 단계를 지나가는 지 여부를 판단할 수 있다(S605).
앞에서 언급했듯이, 특정 주제와 관련하여 미리 결정된 실제 포스트 개수의 일정 부분에 예상 포스트의 개수가 포함될 때의 단계를 확장 종료 단계라고 정의할 수 있다. 결국, 확장 종료 단계를 지나간다는 것은 확장 종료 단계 부근에서 예상 포스트의 개수가 급격히 증가하여 확장 종료 단계에 포함되지 못하고 초과하는 것을 의미할 수 있다.
만약, 변경된 초기 액션수 임계치 B에 의한 피드백 결과에 따라 확장 종료 단계를 지나가지 않고 포함된다고 판단한 경우, 블로그 커뮤니티 추출 시스템은 B를 그대로 사용할 수 있다(S606). 반대로, 초기 액션수 임계치 B에 의한 피드백 결과에 따라 확장 종료 단계를 지나간다고 판단한 경우, 블로그 커뮤니티 추출 시스템은 A를 C로 증가시킬 수 있다(S607). 예를 들어, C는 B에서 A와 B의 차이의 1/2만큼 감소시킨 값일 수 있다.
도 6에서는 단계(S606)과 단계(S607)까지 도시되었으나, 블로그 커뮤니티 추출 시스템은 피드백 결과에 따라 도 6의 과정을 반복하여 초기 액션수 임계치를 조정할 수 있다.
도 7은 본 발명의 일실시예에 따른 확장 단계별로 설정된 액션수 임계치를 조정하는 일례를 도시한 도면이다.
도 7을 참고하면, 참조번호(701)는 커뮤니티 멤버를 선정하기 위한 액션수 임계치를 조정하는 과정을 나타낸다. 그리고, 참조번호(702)는 커뮤니티 포스트를 선정하기 위한 액션수 임계치를 조정하는 과정을 나타낸다. i는 확장 단계의 횟수를 의미한다.
본 발명의 일실시예에 따른 블로그 커뮤니티 추출 시스템은 이전 확장 단계의 커뮤니티 멤버와 커뮤니티 포스트에 대한 액션 정보를 활용하여 현재 확장 단계의 액션수 임계치를 자동으로 조정할 수 있다. 구체적으로, 블로그 커뮤니티 추출 시스템은 이전 확장 단계의 커뮤니티 멤버에 의해 적용된 액션 정도를 이용하여 현재 확장 단계의 커뮤니티 포스트를 선정하기 위한 액션수 임계치를 조정할 수 있다. 그리고, 블로그 커뮤니티 추출 시스템은 이전 확장 단계의 커뮤니티 멤버가 적용한 액션 정도를 이용하여 현재 확장 단계의 커뮤니티 멤버를 선정하기 위한 액션수 임계치를 조정할 수 있다.
참조번호(701)에서, 블로그 커뮤니티 추출 시스템이 특정 주제와 관련된 블로거인 B(i)가 액션을 적용한 포스트인 P(i)를 검색한 상태를 가정한다. B(i)의 각 커뮤니티 멤버들은 적어도 2번 이상 P(i)의 커뮤니티 포스트에 액션을 적용한 것을 알 수 있다. 역으로, P(i)에서 B(i)로의 방향을 고려하면, B(i)의 각 커뮤니티 멤버들은 적어도 2번 이상 P(i)의 커뮤니티 포스트에게 액션을 적용한 것을 알 수 있다. 따라서, 는 2가 되고, 이에 따라, B(i+1)이 선정될 수 있다.
참조번호(702)는 B(i+1)를 이용하여 를 자동으로 설정하는 과정을 나타낸다. P(i)의 각 커뮤니티 포스트들은 B(i+1)의 커뮤니티 멤버로부터 적어도 3개 이상의 액션이 적용되었다. 따라서, 는 3이 된다.
도 8은 본 발명의 일실시예에 따른 블로그 커뮤니티 추출 시스템에 대한 전체 구성을 도시한 블록 다이어그램이다.
도 8을 참고하면, 블로그 커뮤니티 추출 시스템은 시드 포스트 추출부(801), 포스트/블로거 검색부(802) 및 블로그 커뮤니티 결정부(803)를 포함할 수 있다.
시드 포스트 추출부(801)는 블로그 집단으로부터 특정 주제와 연관된 시드 포스트를 추출할 수 있다. 블로그 집단은 제1 블로거와 제2 블로거 사이에 액션으로 구성된 연결망으로 구성될 수 있다. 여기서, 블로거는 블로그와 동일한 의미로 사용된다.
블로그는 특정 주제에 대한 관심사에 따라 자유롭게 포스트를 게시할 수 있는 사이트를 의미할 수 있다. 블로그는 사이트의 외부적인 형태에 따라 결정되지 않고, 특정 주제에 대한 포스트가 게시된 다양한 형태의 사이트를 포함할 수 있다.
블로그에 게시된 포스트는 적어도 하나일 수 있으며, 포스트를 게시한 블로거도 적어도 하나일 수 있다. 결국, 본 발명의 일실시예에 따르면, 블로그는 특정 주제에 대해 다양한 형태의 컨텐츠를 게시하고 일종의 온라인 상의 사이트라고 정의할 수 있다.
액션은 제1 블로거에 포함된 적어도 하나의 포스트에 대해 읽기, 쓰기, 덧글, 트랙백 또는 스크랩 등 제2 블로거가 포스트에 관심을 표현하는 것을 의미할 수 있다.
일례로, 시드 포스트 추출부(801)는 주제와의 적합성, 포스트에 포함된 정보의 상태 또는 포스트의 인기도를 포함하는 기준에 따라 블로그 집단으로부터 시드 포스트를 추출할 수 있다. 이 때, 추출된 시드 포스트는 커뮤니티 포스트로 선정될 수 있다. 일례로, 시드 포스트는 도메인 전문가를 통해 블로그 집단으로부터 추출될 수 있다.
포스트/블로거 검색부(802)는 추출된 시드 포스트를 기초로 상기 특정 주제와 연관된 포스트 및 블로거를 검색하여 커뮤니티 포스트 및 커뮤니티 멤버를 생성 할 수 있다.
일례로, 포스트/블로거 검색부(802)는 (1)시드 포스트에 액션을 적용한 블로거를 검색하여 커뮤니티 멤버로 선정하는 확장 단계, (2) 커뮤니티 멤버로 선정된 블로거가 액션을 적용한 포스트를 검색하여 상기 커뮤니티 포스트로 선정하는 확장 단계, (3) 상기 커뮤니티 포스트에 액션을 적용한 블로거를 추가로 검색하여 상기 커뮤니티 멤버를 확장하는 확장 단계 및 (4)상기 커뮤니티 멤버가 액션을 적용한 포스트를 추가로 검색하여 상기 커뮤니티 포스트를 확장하는 확장 단계에 따라 커뮤니티 포스트 및 커뮤니티 멤버를 생성할 수 있다. 포스트/블로거 검색부(802)는 미리 설정한 개수의 블로거와 포스트를 검색하여 커뮤니티 멤버와 커뮤니티 포스트를 생성할 때까지 (3)과 (4) 확장 단계를 반복하여 수행할 수 있다.
일례로, 포스트/블로거 검색부(802)는 확장 단계 각각에 확장 단계별로 증가하는 액션수 임계치를 설정하여 확장 단계마다 설정된 액션수 임계치를 만족하는 포스트 또는 블로거를 검색할 수 있다. 이 때, 포스트/블로거 검색부(802)는 확장 단계마다 설정된 액션수 임계치를 만족하는 포스트 또는 블로거가 검색되지 않는 경우, 상기 커뮤니티 포스트 또는 커뮤니티 멤버에 대한 확장 단계를 완료할 수 있다.
일례로, 포스트/블로거 검색부(802)는 임의로 설정한 최초 액션수 임계치에 따라 확장 단계별 검색 과정이 확장 종료 단계에 도달할 수 있는 지 여부를 피드백하여 최초 확장 단계에 대응하는 최초 액션수 임계치를 설정할 수 있다. 이 때, 확장 종료 단계는 상기 블로그 집단에 대해 상기 특정 주제와 관련된 예상 포스트 의 수와 실제 포스트의 수가 유사해지는 확장 단계를 의미할 수 있다.
일례로, 포스트/블로거 검색부(802)는 이전 확장 단계의 커뮤니티 멤버 또는 커뮤니티 포스트에 대한 액션 정보를 이용하여 현재 확장 단계의 액션수 임계치를 조정할 수 있다.
구체적으로, 포스트/블로거 검색부(802)는 이전 확장 단계의 커뮤니티 멤버에 의해 적용된 액션 정도를 이용하여 현재 확장 단계의 커뮤니티 포스트를 선정하기 위한 액션수 임계치를 조정할 수 있다. 그리고, 포스트/블로거 검색부(802)는 이전 확장 단계의 커뮤니티 멤버가 적용한 액션 정도를 이용하여 현재 확장 단계의 커뮤니티 멤버를 선정하기 위한 액션수 임계치를 조정할 수 있다.
일례로, 포스트/블로거 검색부(802)는 특정 주제와 관련이 없는 노이즈에 해당하는 포스트 또는 블로거를 검색하는 것을 방지하도록 포스트 또는 블로거 각각에 대한 액션 순도 임계치를 설정할 수 있다. 커뮤니티 멤버를 선정하는 경우, 액션 순도 임계치는 임의의 블로거가 특정 주제에 대해서만 관심을 나타내는 지 여부를 나타낸다. 그리고, 커뮤니티 포스트를 선정하는 경우, 액션 순도 임계치는 포스트가 해당 주제에 대해서만 관련이 있는 지 여부를 나타낸다.
일례로, 포스트/블로거 검색부(802)는 포스트에 대한 액션수에 기초하여 상기 블로그 집단에 존재하는 포스트 중 인기 포스트를 결정하고 상기 확장 단계마다 커뮤니티 포스트에서 인기 포스트를 제외할 수 있다. 인기 포스트는 특정 주제와의 관련성과는 무관하게 단순히 대중적으로 인기가 많아 액션수가 높은 포스트를 의미할 수 있다. 따라서, 포스트/블로거 검색부(802)는 확장 단계마다 커뮤니티 포스트 에서 인기 포스트는 제외함으로써, 특정 주제에 대해 보다 정확도와 관련성이 높은 포스트 및 블로거를 검색할 수 있다.
블로그 커뮤니티 결정부(803)는 커뮤니티 포스트 및 커뮤니티 멤버를 이용하여 특정 주제에 대한 블로그 커뮤니티를 결정할 수 있다. 블로거는 적어도 하나의 특정 주제별로 폴더를 설정하여 폴더마다 대응하는 포스트를 연결할 수 있다. 폴더는 블로거가 관심 분야에 따라 분류한 포스트 수집 공간을 의미할 수 있다. 따라서, 블로그 커뮤니티 결정부(803)는 설정된 폴더를 새로운 블로거로 간주하여 블로거가 설정한 폴더 각각에 대해 블로그 커뮤니티를 결정할 수 있다.
도 8에서 설명되지 않은 부분은 도 1 내지 도 7의 설명을 참고할 수 있다.
또한 본 발명의 일실시예에 따른 블로그 커뮤니티 추출 방법은 다양한 컴퓨터로 구현되는 동작을 수행하기 위한 프로그램 명령을 포함하는 컴퓨터 판독 가능 매체를 포함한다. 상기 컴퓨터 판독 가능 매체는 프로그램 명령, 데이터 파일, 데이터 구조 등을 단독으로 또는 조합하여 포함할 수 있다. 상기 매체는 프로그램 명령은 본 발명을 위하여 특별히 설계되고 구성된 것들이거나 컴퓨터 소프트웨어 당업자에게 공지되어 사용 가능한 것일 수도 있다. 컴퓨터 판독 가능 기록 매체의 예에는 하드 디스크, 플로피 디스크 및 자기 테이프와 같은 자기 매체(magnetic media), CD-ROM, DVD와 같은 광기록 매체(optical media), 플롭티컬 디스크(floptical disk)와 같은 자기-광 매체(magneto-optical media), 및 롬(ROM), 램(RAM), 플래시 메모리 등과 같은 프로그램 명령을 저장하고 수행하도록 특별히 구성된 하드웨어 장치가 포함된다. 프로그램 명령의 예에는 컴파일러에 의해 만들 어지는 것과 같은 기계어 코드뿐만 아니라 인터프리터 등을 사용해서 컴퓨터에 의해서 실행될 수 있는 고급 언어 코드를 포함한다.
이상과 같이 본 발명은 비록 한정된 실시예와 도면에 의해 설명되었으나, 본 발명은 상기의 실시예에 한정되는 것은 아니며, 이는 본 발명이 속하는 분야에서 통상의 지식을 가진 자라면 이러한 기재로부터 다양한 수정 및 변형이 가능하다. 따라서, 본 발명 사상은 아래에 기재된 특허청구범위에 의해서만 파악되어야 하고, 이의 균등 또는 등가적 변형 모두는 본 발명 사상의 범주에 속한다고 할 것이다.
도 1은 본 발명의 일실시예에 따른 블로그 집단으로부터 블로그 커뮤니티를 추출하는 과정을 설명하기 위한 도면이다.
도 2는 본 발명의 일실시예에 따른 블로그 커뮤니티 추출 방법에 대한 전체 과정을 도시한 플로우차트이다.
도 3은 본 발명의 일실시예에 따른 확장 단계별로 특정 주제와 관련된 블로거와 포스트를 검색하는 과정을 도시한 플로우차트이다.
도 4는 본 발명의 일실시예에 따른 확장 단계별로 블로그 집단으로부터 포스트 및 블로거를 검색하는 일례를 설명하기 위한 도면이다.
도 5는 본 발명의 일실시예에 따른 블로그 커뮤니티를 추출하는 과정을 확장 단계별로 설명하는 일례를 도시한 도면이다.
도 6은 본 발명의 일실시예에 따른 블로그 커뮤니티를 추출하기 위한 초기 액션수 임계치를 설정하는 과정을 도시한 플로우차트이다.
도 7은 본 발명의 일실시예에 따른 확장 단계별로 설정된 액션수 임계치를 조정하는 일례를 도시한 도면이다.
도 8은 본 발명의 일실시예에 따른 블로그 커뮤니티 추출 시스템에 대한 전체 구성을 도시한 블록 다이어그램이다.
<도면의 주요 부분에 대한 부호의 설명>
101: 블로그 집단
102~105: 블로거
106: 블로그 커뮤니티
107: 커뮤니티 멤버
108: 커뮤니티 포스트
Claims (29)
- 시드 포스트 추출부, 포스트/블로거 검색부 및 블로그 커뮤니티 결정부를 포함하는 블로그 커뮤니티 추출 시스템이 수행하는 블로그 커뮤니티 추출 방법에 있어서,상기 시드 포스트 추출부가 블로그 집단으로부터 특정 주제와 연관된 시드 포스트를 추출하는 단계;상기 포스트/블로거 검색부가 상기 특정 주제와 연관된 포스트 또는 블로그를 검색하기 위한 액션수 임계치를 고려하여 상기 추출된 시드 포스트를 기초로 상기 특정 주제와 연관된 포스트 및 블로거를 검색하여 커뮤니티 포스트 및 커뮤니티 멤버를 생성하는 단계; 및상기 블로그 커뮤니티 결정부가 상기 커뮤니티 포스트 및 커뮤니티 멤버를 이용하여 상기 특정 주제에 대한 블로그 커뮤니티를 결정하는 단계를 포함하고,상기 커뮤니티 포스트 및 커뮤니티 멤버를 생성하는 단계는,상기 시드 포스트에 액션을 적용한 블로거를 검색하여 커뮤니티 멤버로 선정하는 단계; 및상기 커뮤니티 멤버로 선정된 블로거가 액션을 적용한 포스트를 검색하여 상기 커뮤니티 포스트로 선정하는 단계를 포함하는 블로그 커뮤니티 추출 방법.
- 제1항에 있어서,상기 블로그 집단은 제1 블로거와 제2 블로거 사이에 액션으로 구성된 연결망으로 구성되고,상기 액션은 상기 제1 블로거에 포함된 적어도 하나의 포스트에 대해 읽기, 쓰기, 덧글, 트랙백 또는 스크랩 중 어느 하나를 상기 제2 블로거가 수행하는 것을 특징으로 하는 블로그 커뮤니티 추출 방법.
- 제1항에 있어서,상기 시드 포스트를 추출하는 단계는,상기 주제와의 적합성, 포스트에 포함된 정보의 상태 또는 포스트의 인기도를 포함하는 기준에 따라 상기 블로그 집단으로부터 시드 포스트를 추출하는 것을 특징으로 하는 블로그 커뮤니티 추출 방법.
- 제1항에 있어서,상기 추출된 시드 포스트는,상기 커뮤니티 포스트로 선정된 포스트인 것을 특징으로 하는 블로그 커뮤니티 추출 방법.
- 삭제
- 제1항에 있어서,상기 커뮤니티 포스트 및 커뮤니티 멤버를 생성하는 단계는,상기 커뮤니티 포스트에 액션을 적용한 블로거를 추가로 검색하여 상기 커뮤니티 멤버를 확장하는 단계; 및상기 커뮤니티 멤버가 액션을 적용한 포스트를 추가로 검색하여 상기 커뮤니티 포스트를 확장하는 단계를 더 포함하는 블로그 커뮤니티 추출 방법.
- 삭제
- 제1항에 있어서,상기 커뮤니티 포스트 및 커뮤니티 멤버를 생성하는 단계는,상기 액션수 임계치를 만족하는 포스트 또는 블로거가 검색되지 않는 경우, 상기 커뮤니티 포스트 또는 커뮤니티 멤버에 대한 확장 단계를 완료하는 것을 특징으로 하는 블로그 커뮤니티 추출 방법.
- 제1항에 있어서,상기 커뮤니티 포스트 및 커뮤니티 멤버를 생성하는 단계는,임의로 설정한 최초 액션수 임계치에 따라 확장 단계별 검색 과정이 확장 종료 단계에 도달할 수 있는 지 여부를 피드백하여 최초 확장 단계에 대응하는 최초 액션수 임계치를 설정하는 것을 특징으로 하는 블로그 커뮤니티 추출 방법.
- 제9항에 있어서,상기 확장 종료 단계는,상기 블로그 집단에 대해 상기 특정 주제와 관련된 예상 포스트의 수와 실제 포스트의 수가 유사해지는 확장 단계를 의미하는 것을 특징으로 하는 블로그 커뮤니티 추출 방법.
- 제1항에 있어서,상기 커뮤니티 포스트 및 커뮤니티 멤버를 생성하는 단계는,이전 확장 단계의 커뮤니티 멤버 또는 커뮤니티 포스트에 대한 액션 정보를 이용하여 현재 확장 단계의 액션수 임계치를 조정하는 것을 특징으로 하는 블로그 커뮤니티 추출 방법.
- 제1항에 있어서,상기 커뮤니티 포스트 및 커뮤니티 멤버를 생성하는 단계는,상기 특정 주제와 관련이 없는 노이즈에 해당하는 포스트 또는 블로거를 검색하는 것을 방지하도록 포스트 또는 블로거 각각에 대한 액션 순도 임계치를 설정하는 것을 특징으로 하는 블로그 커뮤니티 추출 방법.
- 제1항에 있어서,상기 블로거는,적어도 하나의 특정 주제별로 폴더를 설정하여 상기 폴더마다 대응하는 포스트를 연결하고,상기 특정 주제에 대한 블로그 커뮤니티를 결정하는 단계는,상기 블로거에 설정된 폴더 각각에 대해 블로그 커뮤니티를 결정하는 것을 특징으로 하는 블로그 커뮤니티 추출 방법.
- 제1항에 있어서,상기 커뮤니티 포스트 및 커뮤니티 멤버를 생성하는 단계는,상기 포스트에 대한 액션수에 기초하여 상기 블로그 집단에 존재하는 포스트 중 인기 포스트를 결정하고 상기 커뮤니티 포스트에서 인기 포스트를 제외하는 것을 특징으로 하는 블로그 커뮤니티 추출 방법.
- 제1항 내지 제4항, 제6항 및 제8항 내지 제14항 중 어느 한 항의 방법을 실행하기 위한 프로그램이 기록되어 있는 것을 특징으로 하는 컴퓨터에서 판독 가능한 기록 매체.
- 블로그 집단으로부터 특정 주제와 연관된 시드 포스트를 추출하는 시드 포스트 추출부;상기 특정 주제와 연관된 포스트 또는 블로그를 검색하기 위한 액션수 임계치를 고려하여 상기 추출된 시드 포스트를 기초로 상기 특정 주제와 연관된 포스트 및 블로거를 검색하여 커뮤니티 포스트 및 커뮤니티 멤버를 생성하는 포스트/블로거 검색부; 및상기 커뮤니티 포스트 및 커뮤니티 멤버를 이용하여 상기 특정 주제에 대한 블로그 커뮤니티를 결정하는 블로그 커뮤니티 결정부를 포함하고,상기 포스트/블로거 검색부는,상기 시드 포스트에 액션을 적용한 블로거를 검색하여 커뮤니티 멤버로 선정하고, 상기 커뮤니티 멤버로 선정된 블로거가 액션을 적용한 포스트를 검색하여 상기 커뮤니티 포스트로 선정하는 것을 특징으로 하는 블로그 커뮤니티 추출 시스템.
- 제16항에 있어서,상기 블로그 집단은 제1 블로거와 제2 블로거 사이에 액션으로 구성된 연결망으로 구성되고,상기 액션은 상기 제1 블로거에 포함된 적어도 하나의 포스트에 대해 읽기, 쓰기, 덧글, 트랙백 또는 스크랩 중 어느 하나를 상기 제2 블로거가 수행하는 것을 특징으로 하는 블로그 커뮤니티 추출 시스템.
- 제16항에 있어서,상기 시드 포스트 추출부는,상기 주제와의 적합성, 포스트에 포함된 정보의 상태 또는 포스트의 인기도를 포함하는 기준에 따라 상기 블로그 집단으로부터 시드 포스트를 추출하는 것을 특징으로 하는 블로그 커뮤니티 추출 시스템.
- 제16항에 있어서,상기 추출된 시드 포스트는,상기 커뮤니티 포스트로 선정된 포스트인 것을 특징으로 하는 블로그 커뮤 니티 추출 시스템.
- 삭제
- 제16항에 있어서,상기 포스트/블로거 검색부는,상기 커뮤니티 포스트에 액션을 적용한 블로거를 추가로 검색하여 상기 커뮤니티 멤버를 확장하는 단계; 및상기 커뮤니티 멤버가 액션을 적용한 포스트를 추가로 검색하여 상기 커뮤니티 포스트를 확장하는 단계를 더 수행하여 커뮤니티 포스트 및 커뮤니티 멤버를 확장 생성하는 것을 특징으로 하는 블로그 커뮤니티 추출 시스템.
- 삭제
- 제16항에 있어서,상기 포스트/블로거 검색부는,상기 액션수 임계치를 만족하는 포스트 또는 블로거가 검색되지 않는 경우, 상기 커뮤니티 포스트 또는 커뮤니티 멤버에 대한 확장 단계를 완료하는 것을 특징으로 하는 블로그 커뮤니티 추출 시스템.
- 제16항에 있어서,상기 포스트/블로거 검색부는,임의로 설정한 최초 액션수 임계치에 따라 확장 단계별 검색 과정이 확장 종료 단계에 도달할 수 있는 지 여부를 피드백하여 최초 확장 단계에 대응하는 최초 액션수 임계치를 설정하는 것을 특징으로 하는 블로그 커뮤니티 추출 시스템.
- 제24항에 있어서,상기 확장 종료 단계는,상기 블로그 집단에 대해 상기 특정 주제와 관련된 예상 포스트의 수와 실 제 포스트의 수가 유사해지는 확장 단계를 의미하는 것을 특징으로 하는 블로그 커뮤니티 추출 시스템.
- 제16항에 있어서,상기 포스트/블로거 검색부는,이전 확장 단계의 커뮤니티 멤버 또는 커뮤니티 포스트에 대한 액션 정보를 이용하여 현재 확장 단계의 액션수 임계치를 조정하는 것을 특징으로 하는 블로그 커뮤니티 추출 시스템.
- 제16항에 있어서,상기 포스트/블로거 검색부는,상기 특정 주제와 관련이 없는 노이즈에 해당하는 포스트 또는 블로거를 검색하는 것을 방지하도록 포스트 또는 블로거 각각에 대한 액션 순도 임계치를 설정하는 것을 특징으로 하는 블로그 커뮤니티 추출 시스템.
- 제16항에 있어서,상기 블로거는,적어도 하나의 특정 주제별로 폴더를 설정하여 상기 폴더마다 대응하는 포스트를 연결하고,상기 블로그 커뮤니티 결정부는,상기 블로거에 설정된 폴더 각각에 대해 블로그 커뮤니티를 결정하는 것을 특징으로 하는 블로그 커뮤니티 추출 시스템.
- 제16항에 있어서,상기 포스트/블로거 검색부는,상기 포스트에 대한 액션수에 기초하여 상기 블로그 집단에 존재하는 포스트 중 인기 포스트를 결정하고 상기 커뮤니티 포스트에서 인기 포스트를 제외하는 것을 특징으로 하는 블로그 커뮤니티 추출 시스템.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020080112145A KR101067116B1 (ko) | 2008-11-12 | 2008-11-12 | 블로그 커뮤니티 추출 방법 및 시스템 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020080112145A KR101067116B1 (ko) | 2008-11-12 | 2008-11-12 | 블로그 커뮤니티 추출 방법 및 시스템 |
Publications (2)
Publication Number | Publication Date |
---|---|
KR20100053152A KR20100053152A (ko) | 2010-05-20 |
KR101067116B1 true KR101067116B1 (ko) | 2011-09-22 |
Family
ID=42278311
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020080112145A KR101067116B1 (ko) | 2008-11-12 | 2008-11-12 | 블로그 커뮤니티 추출 방법 및 시스템 |
Country Status (1)
Country | Link |
---|---|
KR (1) | KR101067116B1 (ko) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US9177346B2 (en) | 2010-07-01 | 2015-11-03 | Facebook, Inc. | Facilitating interaction among users of a social network |
US8930456B2 (en) * | 2012-03-13 | 2015-01-06 | Google Inc. | Method and system of suggesting contacts through the display of public posts within a social networking service |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20020017622A (ko) * | 2000-08-31 | 2002-03-07 | 김종민 | 인터넷 환경에서의 접속자 커뮤니티 서비스 시스템 및 그제공 방법 |
KR100643480B1 (ko) * | 2005-06-25 | 2006-11-10 | (주)엑셀렌테크놀로지 | 개인 매칭 시스템 |
-
2008
- 2008-11-12 KR KR1020080112145A patent/KR101067116B1/ko active IP Right Grant
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20020017622A (ko) * | 2000-08-31 | 2002-03-07 | 김종민 | 인터넷 환경에서의 접속자 커뮤니티 서비스 시스템 및 그제공 방법 |
KR100643480B1 (ko) * | 2005-06-25 | 2006-11-10 | (주)엑셀렌테크놀로지 | 개인 매칭 시스템 |
Also Published As
Publication number | Publication date |
---|---|
KR20100053152A (ko) | 2010-05-20 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN104008138B (zh) | 一种基于社交网络的音乐推荐方法 | |
US20100082653A1 (en) | Event media search | |
JP5550669B2 (ja) | 検索装置、検索方法およびプログラム | |
US9584589B2 (en) | Friend recommendation method, apparatus and storage medium | |
KR101764696B1 (ko) | 사용자 영향력 및 시간 변화를 고려한 소셜 네트워크 핫 토픽 결정 방법 및 시스템 | |
KR101099908B1 (ko) | 문서 간 유사도 계산 시스템 및 방법 | |
CN102884528B (zh) | 减少活动记录中的重复和循环 | |
Carmel et al. | On the relationship between novelty and popularity of user-generated content | |
Daraghmi et al. | We are so close, less than 4 degrees separating you and me! | |
KR101607468B1 (ko) | 콘텐츠에 대한 키워드 태깅 방법 및 시스템 | |
KR20150067897A (ko) | 소셜 데이터의 인기도 예측 장치 및 방법 | |
Gorrell et al. | Using@ Twitter conventions to improve# LOD-based named entity disambiguation | |
CN103262079B (zh) | 检索装置及检索方法 | |
KR101067116B1 (ko) | 블로그 커뮤니티 추출 방법 및 시스템 | |
JP2010262638A (ja) | 代表者の信頼度を用いた検索結果順位化装置および方法 | |
JP5199768B2 (ja) | タグ付け支援方法とその装置、プログラム及び記録媒体 | |
Zhang et al. | A collaborative filtering tag recommendation system based on graph | |
Elmer et al. | Networked campaigns: Traffic tags and cross platform analysis on the web | |
KR101105798B1 (ko) | 키워드 정련 장치 및 방법과 그를 위한 컨텐츠 검색 시스템 및 그 방법 | |
Furini et al. | Towards tweet content suggestions for museum media managers | |
Amitay et al. | Serial Sharers: Detecting Split Identities of Web Authors. | |
Toivanen et al. | Epistemic integration of the European Research Area: The shifting geography of the knowledge base of Finnish research, 1995–2010 | |
US10742588B2 (en) | Representative media item selection for electronic posts | |
Barua et al. | Removing noise content from online news articles | |
WO2014102734A1 (en) | Systems and methods for collecting, sorting and posting information on a social media profile |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A201 | Request for examination | ||
E902 | Notification of reason for refusal | ||
E90F | Notification of reason for final refusal | ||
E701 | Decision to grant or registration of patent right | ||
GRNT | Written decision to grant | ||
FPAY | Annual fee payment |
Payment date: 20150722 Year of fee payment: 5 |
|
FPAY | Annual fee payment |
Payment date: 20160725 Year of fee payment: 6 |
|
FPAY | Annual fee payment |
Payment date: 20170704 Year of fee payment: 7 |
|
FPAY | Annual fee payment |
Payment date: 20190701 Year of fee payment: 9 |