KR20100053152A - 블로그 커뮤니티 추출 방법 및 시스템 - Google Patents

블로그 커뮤니티 추출 방법 및 시스템 Download PDF

Info

Publication number
KR20100053152A
KR20100053152A KR1020080112145A KR20080112145A KR20100053152A KR 20100053152 A KR20100053152 A KR 20100053152A KR 1020080112145 A KR1020080112145 A KR 1020080112145A KR 20080112145 A KR20080112145 A KR 20080112145A KR 20100053152 A KR20100053152 A KR 20100053152A
Authority
KR
South Korea
Prior art keywords
community
post
blog
posts
blogger
Prior art date
Application number
KR1020080112145A
Other languages
English (en)
Other versions
KR101067116B1 (ko
Inventor
김동진
이재범
김상욱
윤석호
신정환
Original Assignee
엔에이치엔(주)
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 엔에이치엔(주) filed Critical 엔에이치엔(주)
Priority to KR1020080112145A priority Critical patent/KR101067116B1/ko
Publication of KR20100053152A publication Critical patent/KR20100053152A/ko
Application granted granted Critical
Publication of KR101067116B1 publication Critical patent/KR101067116B1/ko

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/01Social networking

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • Business, Economics & Management (AREA)
  • General Physics & Mathematics (AREA)
  • Economics (AREA)
  • Marketing (AREA)
  • General Engineering & Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Data Mining & Analysis (AREA)
  • General Health & Medical Sciences (AREA)
  • Human Resources & Organizations (AREA)
  • Computing Systems (AREA)
  • Primary Health Care (AREA)
  • Strategic Management (AREA)
  • Tourism & Hospitality (AREA)
  • General Business, Economics & Management (AREA)
  • Information Transfer Between Computers (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

블로그 커뮤니티 추출 방법 및 시스템이 개시된다. 블로그 커뮤니티 추출 방법 및 시스템은 블로그 집단으로부터 특정 주제에 대한 포스트 및 블로거를 검색하여 커뮤니티 포스트 및 커뮤니티 멤버를 생성함으로써 블로그 집단에 포함된 잠재적인 블로그 커뮤니티를 추출할 수 있다. 특정 주제에 대한 관심으로 형성된 블로그 커뮤니티를 추출함으로써 특정 주제에 대한 유용한 정보를 획득할 수 있다.
블로그, 블로거, 포스트, 블로그 커뮤니티, 커뮤니티 포스트, 커뮤니티 멤버

Description

블로그 커뮤니티 추출 방법 및 시스템{METHOD AND SYSTEM FOR EXTRATION BLOG COMMUNITY}
본 발명은 블로그 커뮤니티 추출 방법 및 시스템에 관한 것으로, 보다 자세하게는, 블로그 집단으로부터 특정 주제에 대한 블로거 및 포스트를 확장 단계별로 검색함으로써 커뮤니티 멤버 및 커뮤니티 포스트를 생성하는 블로그 커뮤니티 추출 방법 및 시스템에 관한 것이다.
커뮤니티는 사교성, 정보, 소속감, 사회적 정체성 등을 주는 사람 사이에 일어나는 유대에 대한 연결망을 의미한다. 이러한 커뮤니티는 온라인 상에서도 쉽게 발견할 수 있다. 관심사가 비슷한 사람들끼리 모여 운영되는 온라인 카페, 친구나 동창들을 서로 연결해주는 온라인 사회 연결망, 포털 사이트가 주제별로 운영하는 게시판, 마케팅이나 고객 관리의 차원에서 특정 상품을 주제로 운영되는 기업 사이트 등이 그 예이다.
대부분의 온라인 커뮤니티는 회원 가입이나 이웃 맺기 등을 통해 만들어지므로, 커뮤니티의 경계가 명시적으로 드러난다. 그러나, 특별히 커뮤니티에 참여 의사를 밝히지 않았다고 하더라도 특정 주제에 대해 흥미를 가지는 사람들을 별도 로 추출하여 별도의 커뮤니티로 관리할 필요가 있다.
다만, 상기 언급한 커뮤니티는 멤버쉽 형태로 운영되는 것이 아니기 때문에, 상기 커뮤니티에 속하는 멤버들을 찾거나 경계를 정하는데 어려움이 많다. 이렇게 특정 주제에 대한 관심으로 형성된 인맥과 문서들을 활용하면, 다양한 영역에서 타겟 마케팅을 수행하는 데 도움이 될 수 있다.
따라서, 온라인 상에 존재하는 인맥 정보와 문서들로부터 특정 주제에 대한 커뮤니티를 생성하는 방법이 필요하게 되었다. 또한, 온라인 상의 커뮤니티에서 특정 주제에 대한 잠재적인 커뮤니티를 빠르고 높은 정확도로 찾아내는 방법도 요구되고 있다.
본 발명은 블로그 집단으로부터 특정 주제와 관련한 포스트 또는 블로거를 검색함으로써 블로그 집단에 잠재적으로 존재하는 특정 주제에 대한 블로그 커뮤니티를 추출할 수 있는 블로그 커뮤니티 추출 방법 및 시스템을 제공한다.
본 발명은 블로그 집단에 존재하는 주제별 포스트의 수를 이용하여 초기 확장 단계의 초기 액션수 임계치를 조정함으로써, 정확도가 높은 블로그 커뮤니티를 결정할 수 있는 블로그 커뮤니티 추출 방법 및 시스템을 제공한다.
본 발명은 액션 순도 임계치를 적용하여 특정 주제에 대한 블로그 커뮤니티를 결정함으로써, 정확도가 높은 블로그 커뮤니티를 결정할 수 있는 블로그 커뮤니티 추출 방법 및 시스템을 제공한다.
본 발명은 블로거가 설정한 폴더에 기초하여 블로그 커뮤니티를 결정함으로써, 블로거가 복수의 블로그 커뮤니티에 속할 수 있는 블로그 커뮤니티 추출 방법 및 시스템을 제공한다.
본 발명은 주제와 무관하게 인기가 많아 액션수가 높은 인기 포스트를 커뮤니티 포스트에서 제외함으로써, 정확도가 높은 블로그 커뮤니티를 결정할 수 있는 블로그 커뮤니티 추출 방법 및 시스템을 제공한다.
본 발명의 일실시예에 따른 블로그 커뮤니티 추출 방법은 블로그 집단으로부터 특정 주제와 연관된 시드 포스트를 추출하는 단계, 상기 추출된 시드 포스트 를 기초로 상기 특정 주제와 연관된 포스트 및 블로거를 검색하여 커뮤니티 포스트 및 커뮤니티 멤버를 생성하는 단계 및 상기 커뮤니티 포스트 및 커뮤니티 멤버를 이용하여 상기 특정 주제에 대한 블로그 커뮤니티를 결정하는 단계를 포함할 수 있다.
본 발명의 일측면에 따르면, 상기 커뮤니티 포스트 및 커뮤니티 멤버를 생성하는 단계는 상기 시드 포스트에 액션을 적용한 블로거를 검색하여 커뮤니티 멤버로 선정하는 단계, 상기 커뮤니티 멤버로 선정된 블로거가 액션을 적용한 포스트를 검색하여 상기 커뮤니티 포스트로 선정하는 단계, 상기 커뮤니티 포스트에 액션을 적용한 블로거를 추가로 검색하여 상기 커뮤니티 멤버를 확장하는 단계 및 상기 커뮤니티 멤버가 액션을 적용한 포스트를 추가로 검색하여 상기 커뮤니티 포스트를 확장하는 단계를 포함할 수 있다.
본 발명의 일측면에 따르면, 상기 커뮤니티 포스트 및 커뮤니티 멤버를 생성하는 단계는 상기 특정 주제와 연관된 포스트 또는 블로거를 검색하기 위한 액션수 임계치를 설정할 수 있다.
본 발명의 일실시예에 따른 블로그 커뮤니티 추출 시스템은 블로그 집단으로부터 특정 주제와 연관된 시드 포스트를 추출하는 시드 포스트 추출부, 상기 추출된 시드 포스트를 기초로 상기 특정 주제와 연관된 포스트 및 블로거를 검색하여 커뮤니티 포스트 및 커뮤니티 멤버를 생성하는 포스트/블로거 검색부 및 상기 커뮤니티 포스트 및 커뮤니티 멤버를 이용하여 상기 특정 주제에 대한 블로그 커뮤니티를 결정하는 블로그 커뮤니티 결정부를 포함할 수 있다.
본 발명의 일실시예에 따르면, 블로그 집단으로부터 특정 주제와 관련한 포스트 또는 블로거를 검색함으로써 블로그 집단에 잠재적으로 존재하는 특정 주제에 대한 블로그 커뮤니티를 추출할 수 있는 블로그 커뮤니티 추출 방법 및 시스템이 제공된다.
본 발명의 일실시예에 따르면, 블로그 집단에 존재하는 주제별 포스트의 수를 이용하여 초기 확장 단계의 초기 액션수 임계치를 조정함으로써, 정확도가 높은 블로그 커뮤니티를 결정할 수 있는 블로그 커뮤니티 추출 방법 및 시스템이 제공된다.
본 발명의 일실시예에 따르면, 액션 순도 임계치를 적용하여 특정 주제에 대한 블로그 커뮤니티를 결정함으로써, 정확도가 높은 블로그 커뮤니티를 결정할 수 있는 블로그 커뮤니티 추출 방법 및 시스템이 제공된다.
본 발명의 일실시예에 따르면, 블로거가 설정한 폴더에 기초하여 블로그 커뮤니티를 결정함으로써, 블로거가 복수의 블로그 커뮤니티에 속할 수 있는 블로그 커뮤니티 추출 방법 및 시스템이 제공된다.
본 발명의 일실시예에 따르면, 주제와 무관하게 인기가 많아 액션수가 높은 인기 포스트를 커뮤니티 포스트에서 제외함으로써, 정확도가 높은 블로그 커뮤니티를 결정할 수 있는 블로그 커뮤니티 추출 방법 및 시스템이 제공된다.
이하, 첨부된 도면들에 기재된 내용들을 참조하여 본 발명에 따른 실시예를 상세하게 설명한다. 다만, 본 발명이 실시예들에 의해 제한되거나 한정되는 것은 아니다. 각 도면에 제시된 동일한 참조부호는 동일한 부재를 나타낸다. 본 발명의 일실시예에 따른 블로그 커뮤니티 추출 방법은 블로그 커뮤니티 추출 시스템에 의해 수행될 수 있다.
도 1은 본 발명의 일실시예에 따른 블로그 집단으로부터 블로그 커뮤니티를 추출하는 과정을 설명하기 위한 도면이다.
도 1을 참고하면, 블로그 집단(101)이 도시된다. 블로그 집단(101)은 블로거(102, 103, 104, 105)와 블로거에 포함된 포스트로 구성될 수 있다. 이 때, 블로거는 블로그의 주인, 운영자 또는 관리자를 의미할 수 있지만, 본 발명에서 블로그와 블로거는 동일한 것으로 정의하도록 한다.
블로그는 특정 주제에 대한 관심사에 따라 자유롭게 포스트를 게시할 수 있는 사이트를 의미할 수 있다. 블로그는 사이트의 외부적인 형태에 따라 결정되지 않고, 특정 주제에 대한 포스트가 게시된 다양한 형태의 사이트를 포함할 수 있다. 포스트는 특정 주제에 대한 컨텐츠(예를 들어, 텍스트, 영상, 이미지, 음성 또는 플래시 등을 포함하는 문서)를 의미할 수 있다. 본 발명의 일실시예에 따른 블로그 커뮤니티 추출 시스템은 온라인 상에 존재하는 복수의 컨텐츠와 복수의 유저 중 특정 주제에 대한 컨텐츠와 컨텐츠에 관심을 표현한 유저를 추출하는 것이므로, 컨텐츠를 게시하는 사이트의 형태는 제한이 없다.
블로그에 게시된 포스트는 적어도 하나일 수 있으며, 포스트를 게시한 블로거도 적어도 하나일 수 있다. 결국, 본 발명의 일실시예에 따르면, 블로그는 특정 주제에 대해 다양한 형태의 컨텐츠를 게시하고 온라인 상 일종의 사이트라고 정의될 수 있다.
그리고, 포스트는 특정 주제와 관련된 컨텐츠를 의미할 수 있다. 다시 말해서, 포스트는 블로그의 주인인 블로거가 특정 주제에 대한 문서, 이미지, 동영상, 음악, 플래시 등 다양한 형태의 데이터를 블로그에 게시한 것을 의미한다. 이 때, 블로그 집단(101)은 블로그와 블로그들 사이의 액션으로 구성된 연결망으로 표현될 수 있다.
도 1에서 화살표는 블로거가 다른 블로거가 게시한 포스트에 적용하는 액션을 의미한다. 이 때, 액션은 읽기(read), 쓰기(write), 덧글(reply), 트랙백(trackback) 또는 스크랩(scrap) 등 블로거가 포스트에 대해 관심을 표현하는 특정 행위를 의미할 수 있다.
이 때, 읽기는 블로거가 다른 블로거에 의해 게시된 임의의 포스트를 읽는 것을 의미한다. 그리고, 쓰기는 블로거가 자신의 블로그 또는 다른 블로거의 블로그에 새 포스트를 작성하는 것을 의미한다. 덧글은 블로거가 다른 블로거에 의해 게시된 포스트를 읽고 감상 또는 느낌 등을 작성하는 것을 의미한다. 트랙백은 다른 포스트를 참조하는 새 포스트를 작성하는 것을 의미한다. 스크랩은 다른 블로거의 포스트를 자신의 블로그에 폴더를 나누어 보관하는 것을 의미한다.
도 1을 통해, 블로거 2(103)는 블로거 1(102)이 게시한 포스트 a에 액션을 적용한 것을 알 수 있다. 또한, 블로거 2(103)는 블로거 3(103)이 게시한 포스트 f와 포스트 h에 액션을 적용한 것을 알 수 있다.
그리고, 블로거 3(104)은 블로거 2(103)이 게시한 포스트 d 및 블로거 4(105)가 게시한 포스트 j와 포스트 k에 액션을 적용한 것을 알 수 있다.
본 발명의 일실시예에 따른 블로그 커뮤니티 추출 방법은 다음의 2가지 가정에서 시작한다.
첫째, 블로그 집단(101)에서 임의의 포스트에 액션을 적용한 블로거는 상기 포스트와 관련된 주제에 관심이 있을 확률이 높다. 따라서, 동일한 주제와 연관된 복수의 포스트들에 대해 공통적으로 액션을 적용한 블로거는 그 포스트들과 관련된 주제에 관심이 있다고 할 수 있다. 예를 들어, "여행'과 관련된 포스트에 액션을 적용한 블로거는 "여행"에 관심이 있을 확률이 높다.
둘째, 동일한 주제에 관심을 가진 복수의 블로거들이 공통적으로 액션을 적용한 포스트는 상기 블로거들이 관심을 가진 주제와 연관된 포스트일 확률이 높다. 예를 들어, "여행"에 관심이 있는 블로거들이 액션을 적용한 포스트는 "여행"과 관련된 포스트일 수 있다.
본 발명의 일실시예에 따른 블로그 커뮤니티 추출 시스템은 특정 주제에 대한 블로거와 포스트들을 검색하여 각각 커뮤니티 멤버(107)와 커뮤니티 포스트(108)를 생성할 수 있다. 이 때, 블로그 커뮤니티 추출 시스템은 특정 주제와 관련도가 높은 시드 포스트를 기초로 확장 단계별 검색을 통해 단계에 따라 추가적으로 블로거와 포스트를 검색할 수 있다.
만약, 도 1에서 포스트 d와 포스트 h가 "여행"과 관련된 시드 포스트인 경우, 블로그 커뮤니티 추출 시스템은 포스트 d와 포스트 h에 액션을 적용한 블로거 2(103)와 블로거 3(104)을 검색하여 커뮤니티 멤버로 선정할 수 있다. 그리고, 블로그 커뮤니티 추출 시스템은 블로거 2(103)와 블로거 3(104)이 액션을 적용한 포스트 a, 포스트 f, 포스트 j, 포스트 k를 검색할 수 있다. 만약, 블로그 커뮤니티 추출 시스템은 포스트 d와 포스트 h뿐만 아니라, 포스트 a, 포스트 f, 포스트 j, 포스트 k에 액션을 적용한 블로거를 추가 검색할 수 있다. 이러한 검색 과정은 단계에 따라 반복될 수 있으며, 검색되는 블로거와 포스트는 계속해서 추가될 수 있다. 이하에서, 반복적으로 블로거와 포스트를 추가 검색하는 각각의 단계를 확장 단계로 정의한다. 즉, 블로그 커뮤니티 추출 시스템은 확장 단계별로 특정 주제와 관련된 블로거와 포스트를 검색할 수 있다.
그러면, 블로그 커뮤니티 추출 시스템은 블로거 2(103)와 블로거 3(104)을 커뮤니티 멤버(107)로 선정할 수 있다. 그리고, 블로그 커뮤니티 추출 시스템은 시드 포스트인 포스트 d와 포스트 h뿐만 아니라, 검색된 블로거 2(103)와 블로거 3(104)에 의해 액션이 적용된 포스트인 포스트 a, 포스트 f, 포스트 j, 포스트 k를 커뮤니티 포스트(108)로 선정할 수 있다. 결국, 블로그 커뮤니티(106)는 생성된 커뮤니티 멤버(107)와 커뮤니티 포스트(108)로 결정될 수 있다.
도 2는 본 발명의 일실시예에 따른 블로그 커뮤니티 추출 방법에 대한 전체 과정을 도시한 플로우차트이다.
단계(S201)에서, 블로그 커뮤니티 추출 시스템은 블로그 집단으로부터 특정 주제와 연관된 시드 포스트를 추출할 수 있다. 여기서, 블로그 집단은 복수의 블로거와 복수의 포스트, 두 종류의 객체로 이루어질 수 있다. 이 때, 블로그 집단 은 제1 블로거와 제2 블로거 사이에 액션으로 구성된 연결망으로 구성될 수 있다. 다시 말해, 블로그 집단은 특정 블로거가 다른 블로거가 게시한 포스트에 액션을 적용하는 연결망으로 구성될 수 있다.
그리고, 액션은 제1 블로거에 포함된 적어도 하나의 포스트에 대해 읽기, 쓰기, 덧글, 트랙백 또는 스크랩 등 제2 블로거가 포스트에 관심을 표현하는 행위를 의미할 수 있다.
본 발명의 일실시예에 따르면, 블로그 커뮤니티 추출 시스템은 주제와의 적합성, 포스트에 포함된 정보의 상태(양과 질) 또는 포스트의 인기도를 포함하는 기준에 따라 블로그 집단으로부터 시드 포스트를 추출할 수 있다. 일례로, 시드 포스트는 도메인 전문가를 통해 블로그 집단으로부터 추출될 수 있다. 그리고, 추출된 시드 포스트도 커뮤니티 포스트로 선정될 수 있다.
단계(S202)에서, 블로그 커뮤니티 추출 시스템은 추출된 시드 포스트를 기초로 특정 주제와 연관된 포스트 및 블로거를 확장 단계별로 검색하여 커뮤니티 포스트 및 커뮤니티 멤버를 생성할 수 있다. 이 때, 특정 주제와 연관된 포스트는 커뮤니티 포스트로 선정되고, 상기 특정 주제와 동일한 주제와 연관된 블로거는 커뮤니티 멤버로 선정될 수 있다. 확장 단계별로 블로거 및 포스트를 검색하여 커뮤니티 포스트 및 커뮤니티 멤버를 생성하는 구체적인 과정은 도 3 내지 도 5에서 설명된다.
일례로, 확장 단계마다 액션수 임계치가 적용될 수 있다. 이 때, 액션수 임계치는 확장 단계가 진행될 때마다 증가할 수 있다. 일례로, 확장 단계마다 적용 되는 액션수 임계치는 이전 확장 단계의 커뮤니티 멤버 또는 커뮤니티 포스트에 대한 액션 정보에 따라 조정될 수 있다.
일례로, 초기 확장 단계에 대한 초기 액션수 임계치는 특정 주제와 관련된 포스트의 개수에 따른 확장 종료 단계에 도달할 수 있는 지 여부를 피드백함으로써 결정될 수 있다.
그리고, 블로그 커뮤니티 추출 시스템은 특정 주제와 관련이 없는 노이즈에 해당하는 포스트 또는 블로거를 검색하는 것을 방지하기 위해 포스트 또는 블로거 각각에 대한 액션 순도 임계치를 설정할 수 있다. 따라서, 블로그 커뮤니티 추출 시스템은 확장 단계별로 액션 수 임계치와 액션 순도 임계치를 함께 고려하여 특정 주제와 연관된 포스트 및 블로거를 검색할 수 있다. 이에 따라, 특정 주제와 연관된 포스트 및 블로거를 추출하는 과정의 정확도는 향상될 수 있다.
일례로, 블로그 커뮤니티 추출 시스템은 블로그 집단에 포함된 포스트에 대한 액션수에 기초하여 인기 포스트를 결정하고, 확장 단계마다 커뮤니티 포스트에서 인기 포스트를 제외할 수 있다. 이 때, 블로그 커뮤니티 추출 시스템은 블로그 집단의 평균 액션수에 기초하여 인기 포스트를 결정할 수 있다. 예를 들어, 블로그 커뮤니티 추출 시스템은 블로그 집단의 평균 액션수보다 미리 설정한 기준치를 초과하는 액션수를 나타내는 블로그를 인기 포스트로 결정할 수 있다. 인기 포스트는 특정 주제와의 관련성과는 무관하게 단순히 대중적으로 인기가 많아 액션수가 높은 포스트를 의미할 수 있다. 결국, 인기 포스트로 인해 미리 설정한 특정 주제와 다른 주제에 대한 블로거와 포스트가 검색됨으로써 블로그 커뮤니티에 대한 정 확도가 감소될 수 있다.
따라서, 본 발명의 일실시예에 따르면, 블로그 커뮤니티 추출 시스템은 확장 단계마다 커뮤니티 포스트에서 인기 포스트는 제외함으로써, 특정 주제에 대해 보다 정확도와 관련성이 높은 포스트 및 블로거를 검색할 수 있다.
단계(S203)에서, 블로그 커뮤니티 추출 시스템은 커뮤니티 포스트 및 커뮤니티 멤버를 이용하여 상기 특정 주제에 대한 블로그 커뮤니티를 결정할 수 있다.
일례로, 블로거는 적어도 하나의 특정 주제별로 폴더를 설정하여 폴더마다 대응하는 포스트를 연결할 수 있다. 폴더는 블로거가 관심 분야에 따라 분류한 포스트 수집 공간을 의미할 수 있다. 따라서, 블로그 커뮤니티 추출 시스템은 설정된 폴더를 새로운 블로거로 간주하여 블로거가 설정한 폴더 각각에 대해 블로그 커뮤니티를 결정할 수 있다. 결국, 하나의 블로거는 적어도 하나의 주제와 관한 블로그 커뮤니티에 속할 수 있다.
도 3은 본 발명의 일실시예에 따른 확장 단계별로 특정 주제와 관련된 블로거와 포스트를 검색하는 과정을 도시한 플로우차트이다.
일례로, 블로그 커뮤니티 추출 시스템은 다음과 같은 확장 단계에 따라 특정 주제와 연관된 포스트 및 블로거를 검색하여 커뮤니티 포스트 및 커뮤니티 멤버를 생성할 수 있다.
단계(S301)에서, 블로그 커뮤니티 추출 시스템은 시드 포스트에 액션을 적용한 블로그를 검색하여 커뮤니티 멤버로 선정할 수 있다.
단계(S302)에서, 블로그 커뮤니티 추출 시스템은 커뮤니티 멤버로 선정된 블 로거에 의해 액션이 적용된 포스트를 검색하여 커뮤니티 포스트로 선정할 수 있다.
단계(S303)에서, 블로그 커뮤니티 추출 시스템은 커뮤니티 포스트에 액션을 적용한 블로거를 추가로 검색하여 커뮤니티 멤버를 확장할 수 있다.
단계(S304)에서, 블로그 커뮤니티 추출 시스템은 확장된 커뮤니티 멤버가 액션을 적용한 포스트를 추가로 검색하여 커뮤니티 포스트를 확장할 수 있다.
블로그 커뮤니티 추출 시스템은 미리 설정한 개수의 블로거와 포스트를 검색하여 커뮤니티 멤버와 커뮤니티 포스트를 생성할 때까지 확장 단계인 단계(S303)와 단계(S304)를 반복할 수 있다.
일례로, 블로그 커뮤니티 추출 시스템은 각각의 확장 단계마다 액션수 임계치를 설정할 수 있다. 즉, 단계(S301) 내지 단계(S304)에 각각 액션수 임계치가 설정될 수 있다. 구체적으로, 단계(S301)와 단계(S303)는 커뮤니티 멤버를 선정하기 위한 액션수 임계치가 설정될 수 있고, 단계(S302)와 단계(S304)는 커뮤니티 포스트를 선정하기 위한 액션수 임계치가 설정될 수 있다. 즉, 단계(S303)와 단계(S304)가 반복되는 경우, 해당 확장 단계에서의 액션수 임계치를 만족하지 못하면, 확장 단계는 종료할 수 있다. 액션수 임계치는 이전 확장 단계의 커뮤니티 멤버 또는 커뮤니티 포스트에 대한 액션 정보에 따라 조정될 수 있다.
그리고, 블로그 커뮤니티 추출 시스템은 각각의 확장 단계마다 액션 순도 임계치를 추가적으로 설정할 수 있다. 커뮤니티 멤버를 선정하는 경우, 액션 순도 임계치는 임의의 블로거가 특정 주제에 대해서만 관심을 나타내는 지 여부를 나타낸다. 그리고, 커뮤니티 포스트를 선정하는 경우, 액션 순도 임계치는 포스트가 해당 주제에 대해서만 관련이 있는 지 여부를 나타낸다.
이 때, 커뮤니티 멤버를 선정하기 위한 액션 순도 임계치와 커뮤니티 포스트를 선정하기 위한 액션 순도 임계치는 다음과 같이 정의될 수 있다. 액션 순도 임계치도 액션수 임계치와 마찬가지로 확장 단계마다 조정될 수 있다.
액션 순도 임계치(커뮤니티 멤버)=블로거가 커뮤니티 포스트에 적용한 액션수/블로거의 전체 액션수
액션 순도 임계치(커뮤니티 포스트)=포스트가 커뮤니티 멤버에 의해 적용된 액션수/포스트에 적용된 전체 액션수
도 4는 본 발명의 일실시예에 따른 확장 단계별로 블로그 집단으로부터 포스트 및 블로거를 검색하는 일례를 설명하기 위한 도면이다.
도 4를 참고하면, 블로그 커뮤니티 추출 시스템은 블로그 집단(401)로부터 특정 주제와 관련된 시드 포스트를 선출할 수 있다. 시드 포스트는 커뮤니티 포스트(402)로 선정될 수 있다. 선출된 시드 포스트로부터 특정 주제와 관련된 포스트 및 블로거를 검색하는 확장 단계가 진행된다. 도 4에서는 각각의 STEP이 확장 단계를 의미한다.
STEP1에서, 블로그 커뮤니티 추출 시스템은 시드 포스트에 액션을 적용한 블로거 1을 검색할 수 있다. 선정된 블로거 1은 커뮤니티 멤버(403)로 선정될 수 있다.
STEP 2에서, 블로그 커뮤니티 추출 시스템은 블로거 1이 액션을 적용한 포스트 1을 검색할 수 있다. 포스트 1은 커뮤니티 포스트(402)에 추가됨으로써, 커뮤 니티 포스트(402)는 확장할 수 있다.
STEP 3에서, 블로그 커뮤니티 추출 시스템은 시드 포스트 및 포스트 1에 액션을 적용한 블로거 2를 검색할 수 있다. 검색된 블로거 2는 커뮤니티 멤버(403)에 추가됨으로써, 커뮤니티 멤버(402)는 확장할 수 있다.
동일한 방법으로, STEP 4에서, 블로그 커뮤니티 추출 시스템은 블로거 1 및 블로거 2에 의해 액션이 적용된 포스트 2가 검색할 수 있다. 포스트 2는 커뮤니티 포스트(402)에 추가됨으로써, 커뮤니티 포스트(402)는 확장할 수 있다. 그리고, STEP 5에서, 블로그 커뮤니티 추출 시스템은 시드 포스트, 포스트 1, 포스트 2에 액션을 적용한 블로거 3을 검색할 수 있다. 블로거 3은 커뮤니티 멤버(403)에 추가됨으로써, 커뮤니티 멤버(403)는 확장할 수 있다.
이러한 과정은 미리 설정한 개수(n개)의 포스트 및 블로거가 검색될 때까지 반복할 수 있다. 도 4에서 확장 단계인 각각의 STEP 마다 액션수 임계치와 액션 순도 임계치가 적용될 수 있다. 결국, 각 확장 단계마다 설정된 임계치 이상의 액션이 적용되어야, 블로그 커뮤니티 추출 시스템은 블로거 또는 포스트를 검색할 수 있다.
액션수 임계치는 확장 단계에 따라 증가할 수 있다. 여기서, 액션수 임계치는 커뮤니티 멤버를 선정하기 위한 액션수 임계치 및 커뮤니티 포스트를 선정하기 위한 액션수 임계치로 구성될 수 있다. 초기 확장 단계의 경우, 초기 액션 임계치는 확장 단계에 따른 피드백을 통해 결정된다.
구체적으로, 현재 확장 단계의 커뮤니티 멤버를 선정하기 위한 액션수 임계 치는 이전 확장 단계의 커뮤니티 멤버를 선정하기 위한 액션수 임계치보다 클 수 있다. 또한, 현재 확장 단계의 커뮤니티 포스트를 선정하기 위한 액션수 임계치는 이전 확장 단계의 커뮤니티 포스트를 선정하기 위한 액션수 임계치보다 클 수 있다. 예를 들어, STEP 2의 커뮤니티 포스트를 선정하기 위한 액션수 임계치는 STEP 1의 커뮤니티 포스트를 선정하기 위한 액션수 임계치보다 클 수 있다. 그러나, STEP 2의 커뮤니티 멤버를 선정하기 위한 액션수 임계치는 STEP 1의 커뮤니티 멤버를 선정하기 위한 액션수 임계치와 동일할 수 있다.
다른 예로, STEP 3의 커뮤니티 멤버를 선정하기 위한 액션수 임계치는 STEP 2의 커뮤니티 멤버를 선정하기 위한 액션수 임계치보다 클 수 있다. 그러나, STEP 3의 커뮤니티 포스트를 선정하기 위한 액션수 임계치는 STEP 2의 커뮤니티 포스트를 선정하기 위한 액션수 임계치와 동일할 수 있다.
일례로, 블로그 커뮤니티의 정확도를 위해 현재 확장 단계에 설정된 액션수 임계치는 이전 확장 단계의 액션 정보에 따라 조정될 수 있다. 그리고, 확장 단계마다 액션 순도 임계치가 적용될 수 있다. 또한, 블로그 커뮤니티의 정확도를 위해 커뮤니티 포스트를 선정하기 위한 확장 단계에서 검색된 인기 포스트는 제외될 수 있다.
따라서, 블로그 커뮤니티 추출 시스템은 각 확장 단계마다 설정된 임계치 이상의 액션과 관련된 블로거나 포스트를 검색하여 커뮤니티 멤버 또는 커뮤니티 포스트를 생성할 수 있다.
도 5는 본 발명의 일실시예에 따른 블로그 커뮤니티를 추출하는 과정을 확장 단계별로 설명하는 일례를 도시한 도면이다.
도 5에서, 점선은 액션을 의미하고, 실선은 액션 중 커뮤니티 멤버 및 커뮤니티 포스트를 선정하기 위한 유효 액션을 의미한다.
참조부호(501)에서, 포스트 P6과 P10은 시드 포스트를 의미한다. 그리고, 커뮤니티 멤버(
Figure 112008078211742-PAT00001
)와 커뮤니티 포스트(
Figure 112008078211742-PAT00002
)를 선정하기 위한 액션수 임계치는 각각 2로 설정되어 있다.
이 때, 블로그 커뮤니티 추출 시스템은 시드 포스트 각각에 2 이상의 액션을 적용한 B2, B4, B7, B10을 검색할 수 있다. 따라서, 커뮤니티 포스트는 시드 포스트인 P6과 P10이 선정되고, 커뮤니티 멤버는 검색된 블로거인 B2, B4, B7, B10이 선정된다.
참조부호(502)에서, 커뮤니티 포스트를 선정하기 위한 액션수 임계치(
Figure 112008078211742-PAT00003
)는 참조부호(501)의 액션수 임계치보다 1 증가한 3으로 설정되어 있다. 확장 단계에 따라 증가하는 액션수 임계치는 시스템의 구성에 따라 변경될 수 있다. 특히, 본 발명의 일실시예에 따르면, 이전 확장 단계의 액션 정보에 따라 현재 확장 단계의 액션수 임계치가 조절될 수 있다.
이 때, 블로그 커뮤니티 추출 시스템은 커뮤니티 멤버에 의해 3이상의 액션이 적용된 P4과 P13을 추가로 검색할 수 있다. 따라서, 커뮤니티 포스트는 추가 검색된 P4, P13에 의해 확장되고, 커뮤니티 멤버는 그대로 유지된다.
참조부호(503)에서, 커뮤니티 멤버를 선정하기 위한 액션수 임계치(
Figure 112008078211742-PAT00004
)는 참조부호(502)의 액션수 임계치보다 1 증가한 3으로 설정되어 있다.
이 때, 블로그 커뮤니티 추출 시스템은 커뮤니티 포스트에 3이상의 액션을 적용한 B12를 추가로 검색할 수 있다. 따라서, 커뮤니티 멤버는 추가 검색된 B12에 의해 확장되고, 커뮤니티 포스트는 그대로 유지된다.
참조부호(504)에서, 커뮤니티 포스트를 선정하기 위한 액션수 임계치(
Figure 112008078211742-PAT00005
)는 참조부호(503)의 액션수 임계치보다 1 증가한 4로 설정되어 있다. 이 때, 커뮤니티 멤버가 4이상의 액션을 적용한 포스트가 더 이상 검색되지 않는다. 따라서, 블로거 및 포스트를 검색하는 확장 단계는 종료한다.
그리고, 최종적으로 생성된 커뮤니티 멤버(B2, B4, B7, B10, B12)와 커뮤니티 포스트(P4, P6, P10, P13)는 블로그 커뮤니티로 결정된다. 다시 말해, 커뮤니티 멤버인 블로거들(B2, B4, B7, B10, B12)은 커뮤니티 포스트인 포스트(P4, P6, P10, P13)를 공유하여 블로그 커뮤니티를 구성하고 있음을 알 수 있다.
도 5에서는 액션 순도 임계치는 고려되지 않았다. 만약, 액션 순도 임계치가 적용되는 경우, 블로그 커뮤니티의 정확도는 보다 향상될 수 있다. 그리고, 확장 단계마다 적용된 액션수 임계치도 조정될 수 있다.
도 6은 본 발명의 일실시예에 따른 블로그 커뮤니티를 추출하기 위한 초기 액션수 임계치를 설정하는 과정을 도시한 플로우차트이다.
구체적으로, 도 6은 확장 단계를 통한 피드백 결과를 이용하여 초기 확장 단 계에 설정되는 초기 액션수 임계치를 자동으로 조정하는 과정을 나타낸다.
단계(S601)에서, 블로그 커뮤니티 추출 시스템은 초기 액션수 임계치를 A로 임의 설정할 수 있다. 일례로, 임의 설정된 초기 액션수 임계치는 시드 포스트의 개수일 수 있다.
그리고, 블로그 커뮤니티 추출 시스템은 임의로 설정된 초기 액션수 임계치(A)를 확장 단계별로 검색하는 단계(S608)에 입력한 후, 확장 종료 단계 부근에서 확장 종료 단계에 도달할 수 있는 여부를 피드백 받을 수 있다. 즉, 블로그 커뮤니티 추출 시스템은 피드백 결과를 통해 확장 종료 단계 부근에서 확장의 정도가 줄어드는 지 여부를 판단하여 확장 종료 단계에 도달할 수 있도록 피드백 과정을 반복할 수 있다.
이 때, 확장 종료 단계는 특정 주제와 관련된 예상 포스트의 개수와 실제 포스트의 개수가 유사해지는 단계를 의미한다. 예를 들어, 실제 포스트 개수의 90~100%에 해당하는 구간에 예상 포스트의 개수가 포함되는 단계에서 확장 단계가 종료할 수 있다. 즉, 특정 주제에 대해 관련되었다고 예상되는 예상 포스트의 개수와 동일한 주제에 대해 블로그 집단에 실제로 존재하는 실제 포스트의 개수가 유사해지면, 블로그 커뮤니티는 상기 특정 주제에 대해 관심을 가진 대부분의 블로거를 포함할 수 있다. 일례로, 예상 포스트는 블로그 집단에서 커뮤니티 멤버로부터 적어도 하나 이상의 액션이 적용된 모든 포스트를 의미할 수 있다. 다시 말해, 예상 포스트는 특정 주제에 관심이 있는 블로거들이 한 번 이상 관심을 표현한 포스트라고 할 수 있다. 그리고, 실제 포스트의 개수는 미리 결정된 개수일 수 있 다.
일례로, 만약 실제 포스트의 개수가 결정되지 않은 경우, 블로그 커뮤니티 추출 시스템은 랜덤 샘플링을 통해 전체 주제에 대해 특정 주제에 해당하는 포스트의 비율을 결정하고, 블로그 집단에 포함된 전체 포스트의 개수를 곱하여 추정할 수 있다.
블로그 커뮤니티 추출 시스템은 피드백 결과를 통해 확장 종료 단계 에 도달할 수 있는 지 여부를 판단할 수 있다(S602). 만약, 피드백 결과를 통해 확장 종료 단계 부근에서 확장 종료 단계에 도달할 수 있다고 결정되면, 블로그 커뮤니티 추출 시스템은 임의 설정한 A를 초기 액션수 임계치로 사용할 수 있다(S603). 반대로, 확장 종료 단계에 도달할 수 없는 경우, 블로그 커뮤니티 추출 시스템은 A를 B로 감소시킬 수 있다(S604). 예를 들어, 블로그 커뮤니티 추출 시스템은 초기 액션수 임계치인 A의 1/2에 해당하는 B로 변경시킬 수 있다.
블로그 커뮤니티 추출 시스템은 변경된 초기 액션수 임계치인 B를 확장 단계별로 검색하는 단계(S608)에 입력한 후, 확장 종료 단계 부근에서 확장 종료 단계에 도달할 수 있는 여부를 피드백 받을 수 있다. 이 때, 블로그 커뮤니티 추출 시스템은 피드백 결과를 통해 확장 종료 단계를 지나가는 지 여부를 판단할 수 있다(S605).
앞에서 언급했듯이, 특정 주제와 관련하여 미리 결정된 실제 포스트 개수의 일정 부분에 예상 포스트의 개수가 포함될 때의 단계를 확장 종료 단계라고 정의할 수 있다. 결국, 확장 종료 단계를 지나간다는 것은 확장 종료 단계 부근에서 예상 포스트의 개수가 급격히 증가하여 확장 종료 단계에 포함되지 못하고 초과하는 것을 의미할 수 있다.
만약, 변경된 초기 액션수 임계치 B에 의한 피드백 결과에 따라 확장 종료 단계를 지나가지 않고 포함된다고 판단한 경우, 블로그 커뮤니티 추출 시스템은 B를 그대로 사용할 수 있다(S606). 반대로, 초기 액션수 임계치 B에 의한 피드백 결과에 따라 확장 종료 단계를 지나간다고 판단한 경우, 블로그 커뮤니티 추출 시스템은 A를 C로 증가시킬 수 있다(S607). 예를 들어, C는 B에서 A와 B의 차이의 1/2만큼 감소시킨 값일 수 있다.
도 6에서는 단계(S606)과 단계(S607)까지 도시되었으나, 블로그 커뮤니티 추출 시스템은 피드백 결과에 따라 도 6의 과정을 반복하여 초기 액션수 임계치를 조정할 수 있다.
도 7은 본 발명의 일실시예에 따른 확장 단계별로 설정된 액션수 임계치를 조정하는 일례를 도시한 도면이다.
도 7을 참고하면, 참조번호(701)는 커뮤니티 멤버를 선정하기 위한 액션수 임계치를 조정하는 과정을 나타낸다. 그리고, 참조번호(702)는 커뮤니티 포스트를 선정하기 위한 액션수 임계치를 조정하는 과정을 나타낸다. i는 확장 단계의 횟수를 의미한다.
본 발명의 일실시예에 따른 블로그 커뮤니티 추출 시스템은 이전 확장 단계의 커뮤니티 멤버와 커뮤니티 포스트에 대한 액션 정보를 활용하여 현재 확장 단계의 액션수 임계치를 자동으로 조정할 수 있다. 구체적으로, 블로그 커뮤니티 추출 시스템은 이전 확장 단계의 커뮤니티 멤버에 의해 적용된 액션 정도를 이용하여 현재 확장 단계의 커뮤니티 포스트를 선정하기 위한 액션수 임계치를 조정할 수 있다. 그리고, 블로그 커뮤니티 추출 시스템은 이전 확장 단계의 커뮤니티 멤버가 적용한 액션 정도를 이용하여 현재 확장 단계의 커뮤니티 멤버를 선정하기 위한 액션수 임계치를 조정할 수 있다.
참조번호(701)에서, 블로그 커뮤니티 추출 시스템이 특정 주제와 관련된 블로거인 B(i)가 액션을 적용한 포스트인 P(i)를 검색한 상태를 가정한다. B(i)의 각 커뮤니티 멤버들은 적어도 2번 이상 P(i)의 커뮤니티 포스트에 액션을 적용한 것을 알 수 있다. 역으로, P(i)에서 B(i)로의 방향을 고려하면, B(i)의 각 커뮤니티 멤버들은 적어도 2번 이상 P(i)의 커뮤니티 포스트에게 액션을 적용한 것을 알 수 있다. 따라서,
Figure 112008078211742-PAT00006
는 2가 되고, 이에 따라, B(i+1)이 선정될 수 있다.
참조번호(702)는 B(i+1)를 이용하여
Figure 112008078211742-PAT00007
를 자동으로 설정하는 과정을 나타낸다. P(i)의 각 커뮤니티 포스트들은 B(i+1)의 커뮤니티 멤버로부터 적어도 3개 이상의 액션이 적용되었다. 따라서,
Figure 112008078211742-PAT00008
는 3이 된다.
도 8은 본 발명의 일실시예에 따른 블로그 커뮤니티 추출 시스템에 대한 전체 구성을 도시한 블록 다이어그램이다.
도 8을 참고하면, 블로그 커뮤니티 추출 시스템은 시드 포스트 추출부(801), 포스트/블로거 검색부(802) 및 블로그 커뮤니티 결정부(803)를 포함할 수 있다.
시드 포스트 추출부(801)는 블로그 집단으로부터 특정 주제와 연관된 시드 포스트를 추출할 수 있다. 블로그 집단은 제1 블로거와 제2 블로거 사이에 액션으로 구성된 연결망으로 구성될 수 있다. 여기서, 블로거는 블로그와 동일한 의미로 사용된다.
블로그는 특정 주제에 대한 관심사에 따라 자유롭게 포스트를 게시할 수 있는 사이트를 의미할 수 있다. 블로그는 사이트의 외부적인 형태에 따라 결정되지 않고, 특정 주제에 대한 포스트가 게시된 다양한 형태의 사이트를 포함할 수 있다.
블로그에 게시된 포스트는 적어도 하나일 수 있으며, 포스트를 게시한 블로거도 적어도 하나일 수 있다. 결국, 본 발명의 일실시예에 따르면, 블로그는 특정 주제에 대해 다양한 형태의 컨텐츠를 게시하고 일종의 온라인 상의 사이트라고 정의할 수 있다.
액션은 제1 블로거에 포함된 적어도 하나의 포스트에 대해 읽기, 쓰기, 덧글, 트랙백 또는 스크랩 등 제2 블로거가 포스트에 관심을 표현하는 것을 의미할 수 있다.
일례로, 시드 포스트 추출부(801)는 주제와의 적합성, 포스트에 포함된 정보의 상태 또는 포스트의 인기도를 포함하는 기준에 따라 블로그 집단으로부터 시드 포스트를 추출할 수 있다. 이 때, 추출된 시드 포스트는 커뮤니티 포스트로 선정될 수 있다. 일례로, 시드 포스트는 도메인 전문가를 통해 블로그 집단으로부터 추출될 수 있다.
포스트/블로거 검색부(802)는 추출된 시드 포스트를 기초로 상기 특정 주제와 연관된 포스트 및 블로거를 검색하여 커뮤니티 포스트 및 커뮤니티 멤버를 생성 할 수 있다.
일례로, 포스트/블로거 검색부(802)는 (1)시드 포스트에 액션을 적용한 블로거를 검색하여 커뮤니티 멤버로 선정하는 확장 단계, (2) 커뮤니티 멤버로 선정된 블로거가 액션을 적용한 포스트를 검색하여 상기 커뮤니티 포스트로 선정하는 확장 단계, (3) 상기 커뮤니티 포스트에 액션을 적용한 블로거를 추가로 검색하여 상기 커뮤니티 멤버를 확장하는 확장 단계 및 (4)상기 커뮤니티 멤버가 액션을 적용한 포스트를 추가로 검색하여 상기 커뮤니티 포스트를 확장하는 확장 단계에 따라 커뮤니티 포스트 및 커뮤니티 멤버를 생성할 수 있다. 포스트/블로거 검색부(802)는 미리 설정한 개수의 블로거와 포스트를 검색하여 커뮤니티 멤버와 커뮤니티 포스트를 생성할 때까지 (3)과 (4) 확장 단계를 반복하여 수행할 수 있다.
일례로, 포스트/블로거 검색부(802)는 확장 단계 각각에 확장 단계별로 증가하는 액션수 임계치를 설정하여 확장 단계마다 설정된 액션수 임계치를 만족하는 포스트 또는 블로거를 검색할 수 있다. 이 때, 포스트/블로거 검색부(802)는 확장 단계마다 설정된 액션수 임계치를 만족하는 포스트 또는 블로거가 검색되지 않는 경우, 상기 커뮤니티 포스트 또는 커뮤니티 멤버에 대한 확장 단계를 완료할 수 있다.
일례로, 포스트/블로거 검색부(802)는 임의로 설정한 최초 액션수 임계치에 따라 확장 단계별 검색 과정이 확장 종료 단계에 도달할 수 있는 지 여부를 피드백하여 최초 확장 단계에 대응하는 최초 액션수 임계치를 설정할 수 있다. 이 때, 확장 종료 단계는 상기 블로그 집단에 대해 상기 특정 주제와 관련된 예상 포스트 의 수와 실제 포스트의 수가 유사해지는 확장 단계를 의미할 수 있다.
일례로, 포스트/블로거 검색부(802)는 이전 확장 단계의 커뮤니티 멤버 또는 커뮤니티 포스트에 대한 액션 정보를 이용하여 현재 확장 단계의 액션수 임계치를 조정할 수 있다.
구체적으로, 포스트/블로거 검색부(802)는 이전 확장 단계의 커뮤니티 멤버에 의해 적용된 액션 정도를 이용하여 현재 확장 단계의 커뮤니티 포스트를 선정하기 위한 액션수 임계치를 조정할 수 있다. 그리고, 포스트/블로거 검색부(802)는 이전 확장 단계의 커뮤니티 멤버가 적용한 액션 정도를 이용하여 현재 확장 단계의 커뮤니티 멤버를 선정하기 위한 액션수 임계치를 조정할 수 있다.
일례로, 포스트/블로거 검색부(802)는 특정 주제와 관련이 없는 노이즈에 해당하는 포스트 또는 블로거를 검색하는 것을 방지하도록 포스트 또는 블로거 각각에 대한 액션 순도 임계치를 설정할 수 있다. 커뮤니티 멤버를 선정하는 경우, 액션 순도 임계치는 임의의 블로거가 특정 주제에 대해서만 관심을 나타내는 지 여부를 나타낸다. 그리고, 커뮤니티 포스트를 선정하는 경우, 액션 순도 임계치는 포스트가 해당 주제에 대해서만 관련이 있는 지 여부를 나타낸다.
일례로, 포스트/블로거 검색부(802)는 포스트에 대한 액션수에 기초하여 상기 블로그 집단에 존재하는 포스트 중 인기 포스트를 결정하고 상기 확장 단계마다 커뮤니티 포스트에서 인기 포스트를 제외할 수 있다. 인기 포스트는 특정 주제와의 관련성과는 무관하게 단순히 대중적으로 인기가 많아 액션수가 높은 포스트를 의미할 수 있다. 따라서, 포스트/블로거 검색부(802)는 확장 단계마다 커뮤니티 포스트 에서 인기 포스트는 제외함으로써, 특정 주제에 대해 보다 정확도와 관련성이 높은 포스트 및 블로거를 검색할 수 있다.
블로그 커뮤니티 결정부(803)는 커뮤니티 포스트 및 커뮤니티 멤버를 이용하여 특정 주제에 대한 블로그 커뮤니티를 결정할 수 있다. 블로거는 적어도 하나의 특정 주제별로 폴더를 설정하여 폴더마다 대응하는 포스트를 연결할 수 있다. 폴더는 블로거가 관심 분야에 따라 분류한 포스트 수집 공간을 의미할 수 있다. 따라서, 블로그 커뮤니티 결정부(803)는 설정된 폴더를 새로운 블로거로 간주하여 블로거가 설정한 폴더 각각에 대해 블로그 커뮤니티를 결정할 수 있다.
도 8에서 설명되지 않은 부분은 도 1 내지 도 7의 설명을 참고할 수 있다.
또한 본 발명의 일실시예에 따른 블로그 커뮤니티 추출 방법은 다양한 컴퓨터로 구현되는 동작을 수행하기 위한 프로그램 명령을 포함하는 컴퓨터 판독 가능 매체를 포함한다. 상기 컴퓨터 판독 가능 매체는 프로그램 명령, 데이터 파일, 데이터 구조 등을 단독으로 또는 조합하여 포함할 수 있다. 상기 매체는 프로그램 명령은 본 발명을 위하여 특별히 설계되고 구성된 것들이거나 컴퓨터 소프트웨어 당업자에게 공지되어 사용 가능한 것일 수도 있다. 컴퓨터 판독 가능 기록 매체의 예에는 하드 디스크, 플로피 디스크 및 자기 테이프와 같은 자기 매체(magnetic media), CD-ROM, DVD와 같은 광기록 매체(optical media), 플롭티컬 디스크(floptical disk)와 같은 자기-광 매체(magneto-optical media), 및 롬(ROM), 램(RAM), 플래시 메모리 등과 같은 프로그램 명령을 저장하고 수행하도록 특별히 구성된 하드웨어 장치가 포함된다. 프로그램 명령의 예에는 컴파일러에 의해 만들 어지는 것과 같은 기계어 코드뿐만 아니라 인터프리터 등을 사용해서 컴퓨터에 의해서 실행될 수 있는 고급 언어 코드를 포함한다.
이상과 같이 본 발명은 비록 한정된 실시예와 도면에 의해 설명되었으나, 본 발명은 상기의 실시예에 한정되는 것은 아니며, 이는 본 발명이 속하는 분야에서 통상의 지식을 가진 자라면 이러한 기재로부터 다양한 수정 및 변형이 가능하다. 따라서, 본 발명 사상은 아래에 기재된 특허청구범위에 의해서만 파악되어야 하고, 이의 균등 또는 등가적 변형 모두는 본 발명 사상의 범주에 속한다고 할 것이다.
도 1은 본 발명의 일실시예에 따른 블로그 집단으로부터 블로그 커뮤니티를 추출하는 과정을 설명하기 위한 도면이다.
도 2는 본 발명의 일실시예에 따른 블로그 커뮤니티 추출 방법에 대한 전체 과정을 도시한 플로우차트이다.
도 3은 본 발명의 일실시예에 따른 확장 단계별로 특정 주제와 관련된 블로거와 포스트를 검색하는 과정을 도시한 플로우차트이다.
도 4는 본 발명의 일실시예에 따른 확장 단계별로 블로그 집단으로부터 포스트 및 블로거를 검색하는 일례를 설명하기 위한 도면이다.
도 5는 본 발명의 일실시예에 따른 블로그 커뮤니티를 추출하는 과정을 확장 단계별로 설명하는 일례를 도시한 도면이다.
도 6은 본 발명의 일실시예에 따른 블로그 커뮤니티를 추출하기 위한 초기 액션수 임계치를 설정하는 과정을 도시한 플로우차트이다.
도 7은 본 발명의 일실시예에 따른 확장 단계별로 설정된 액션수 임계치를 조정하는 일례를 도시한 도면이다.
도 8은 본 발명의 일실시예에 따른 블로그 커뮤니티 추출 시스템에 대한 전체 구성을 도시한 블록 다이어그램이다.
<도면의 주요 부분에 대한 부호의 설명>
101: 블로그 집단
102~105: 블로거
106: 블로그 커뮤니티
107: 커뮤니티 멤버
108: 커뮤니티 포스트

Claims (29)

  1. 블로그 집단으로부터 특정 주제와 연관된 시드 포스트를 추출하는 단계;
    상기 추출된 시드 포스트를 기초로 상기 특정 주제와 연관된 포스트 및 블로거를 검색하여 커뮤니티 포스트 및 커뮤니티 멤버를 생성하는 단계; 및
    상기 커뮤니티 포스트 및 커뮤니티 멤버를 이용하여 상기 특정 주제에 대한 블로그 커뮤니티를 결정하는 단계
    를 포함하는 블로그 커뮤니티 추출 방법.
  2. 제1항에 있어서,
    상기 블로그 집단은 제1 블로거와 제2 블로거 사이에 액션으로 구성된 연결망으로 구성되고,
    상기 액션은 상기 제1 블로거에 포함된 적어도 하나의 포스트에 대해 읽기, 쓰기, 덧글, 트랙백 또는 스크랩 중 어느 하나를 상기 제2 블로거가 수행하는 것을 특징으로 하는 블로그 커뮤니티 추출 방법.
  3. 제1항에 있어서,
    상기 시드 포스트를 추출하는 단계는,
    상기 주제와의 적합성, 포스트에 포함된 정보의 상태 또는 포스트의 인기도를 포함하는 기준에 따라 상기 블로그 집단으로부터 시드 포스트를 추출하는 것을 특징으로 하는 블로그 커뮤니티 추출 방법.
  4. 제1항에 있어서,
    상기 추출된 시드 포스트는,
    상기 커뮤니티 포스트로 선정된 포스트인 것을 특징으로 하는 블로그 커뮤니티 추출 방법.
  5. 제1항에 있어서,
    상기 커뮤니티 포스트 및 커뮤니티 멤버를 생성하는 단계는,
    상기 시드 포스트에 액션을 적용한 블로거를 검색하여 커뮤니티 멤버로 선정하는 단계; 및
    상기 커뮤니티 멤버로 선정된 블로거가 액션을 적용한 포스트를 검색하여 상기 커뮤니티 포스트로 선정하는 단계
    를 포함하는 블로그 커뮤니티 추출 방법.
  6. 제5항에 있어서,
    상기 커뮤니티 포스트 및 커뮤니티 멤버를 생성하는 단계는,
    상기 커뮤니티 포스트에 액션을 적용한 블로거를 추가로 검색하여 상기 커뮤니티 멤버를 확장하는 단계; 및
    상기 커뮤니티 멤버가 액션을 적용한 포스트를 추가로 검색하여 상기 커뮤 니티 포스트를 확장하는 단계
    를 더 포함하는 블로그 커뮤니티 추출 방법.
  7. 제1항에 있어서,
    상기 커뮤니티 포스트 및 커뮤니티 멤버를 생성하는 단계는,
    상기 특정 주제와 연관된 포스트 또는 블로그를 검색하기 위한 액션수 임계치를 설정하는 것을 특징으로 하는 블로그 커뮤니티 추출 방법.
  8. 제7항에 있어서,
    상기 커뮤니티 포스트 및 커뮤니티 멤버를 생성하는 단계는,
    상기 설정된 액션수 임계치를 만족하는 포스트 또는 블로거가 검색되지 않는 경우, 상기 커뮤니티 포스트 또는 커뮤니티 멤버에 대한 확장 단계를 완료하는 것을 특징으로 하는 블로그 커뮤니티 추출 방법.
  9. 제7항에 있어서,
    상기 커뮤니티 포스트 및 커뮤니티 멤버를 생성하는 단계는,
    임의로 설정한 최초 액션수 임계치에 따라 확장 단계별 검색 과정이 확장 종료 단계에 도달할 수 있는 지 여부를 피드백하여 최초 확장 단계에 대응하는 최초 액션수 임계치를 설정하는 것을 특징으로 하는 블로그 커뮤니티 추출 방법.
  10. 제9항에 있어서,
    상기 확장 종료 단계는,
    상기 블로그 집단에 대해 상기 특정 주제와 관련된 예상 포스트의 수와 실제 포스트의 수가 유사해지는 확장 단계를 의미하는 것을 특징으로 하는 블로그 커뮤니티 추출 방법.
  11. 제7항에 있어서,
    상기 커뮤니티 포스트 및 커뮤니티 멤버를 생성하는 단계는,
    이전 확장 단계의 커뮤니티 멤버 또는 커뮤니티 포스트에 대한 액션 정보를 이용하여 현재 확장 단계의 액션수 임계치를 조정하는 것을 특징으로 하는 블로그 커뮤니티 추출 방법.
  12. 제1항에 있어서,
    상기 커뮤니티 포스트 및 커뮤니티 멤버를 생성하는 단계는,
    상기 특정 주제와 관련이 없는 노이즈에 해당하는 포스트 또는 블로거를 검색하는 것을 방지하도록 포스트 또는 블로거 각각에 대한 액션 순도 임계치를 설정하는 것을 특징으로 하는 블로그 커뮤니티 추출 방법.
  13. 제1항에 있어서,
    상기 블로거는,
    적어도 하나의 특정 주제별로 폴더를 설정하여 상기 폴더마다 대응하는 포스트를 연결하고,
    상기 특정 주제에 대한 블로그 커뮤니티를 결정하는 단계는,
    상기 블로거에 설정된 폴더 각각에 대해 블로그 커뮤니티를 결정하는 것을 특징으로 하는 블로그 커뮤니티 추출 방법.
  14. 제1항에 있어서,
    상기 커뮤니티 포스트 및 커뮤니티 멤버를 생성하는 단계는,
    상기 포스트에 대한 액션수에 기초하여 상기 블로그 집단에 존재하는 포스트 중 인기 포스트를 결정하고 상기 커뮤니티 포스트에서 인기 포스트를 제외하는 것을 특징으로 하는 블로그 커뮤니티 추출 방법.
  15. 제1항 내지 제14항 중 어느 한 항의 방법을 실행하기 위한 프로그램이 기록되어 있는 것을 특징으로 하는 컴퓨터에서 판독 가능한 기록 매체.
  16. 블로그 집단으로부터 특정 주제와 연관된 시드 포스트를 추출하는 시드 포스트 추출부;
    상기 추출된 시드 포스트를 기초로 상기 특정 주제와 연관된 포스트 및 블로거를 검색하여 커뮤니티 포스트 및 커뮤니티 멤버를 생성하는 포스트/블로거 검색부; 및
    상기 커뮤니티 포스트 및 커뮤니티 멤버를 이용하여 상기 특정 주제에 대한 블로그 커뮤니티를 결정하는 블로그 커뮤니티 결정부
    를 포함하는 블로그 커뮤니티 추출 시스템.
  17. 제16항에 있어서,
    상기 블로그 집단은 제1 블로거와 제2 블로거 사이에 액션으로 구성된 연결망으로 구성되고,
    상기 액션은 상기 제1 블로거에 포함된 적어도 하나의 포스트에 대해 읽기, 쓰기, 덧글, 트랙백 또는 스크랩 중 어느 하나를 상기 제2 블로거가 수행하는 것을 특징으로 하는 블로그 커뮤니티 추출 시스템.
  18. 제16항에 있어서,
    상기 시드 포스트 추출부는,
    상기 주제와의 적합성, 포스트에 포함된 정보의 상태 또는 포스트의 인기도를 포함하는 기준에 따라 상기 블로그 집단으로부터 시드 포스트를 추출하는 것을 특징으로 하는 블로그 커뮤니티 추출 시스템.
  19. 제16항에 있어서,
    상기 추출된 시드 포스트는,
    상기 커뮤니티 포스트로 선정된 포스트인 것을 특징으로 하는 블로그 커뮤 니티 추출 시스템.
  20. 제16항에 있어서,
    상기 포스트/블로거 검색부는,
    상기 시드 포스트에 액션을 적용한 블로거를 검색하여 커뮤니티 멤버로 선정하는 단계; 및
    상기 커뮤니티 멤버로 선정된 블로거가 액션을 적용한 포스트를 검색하여 상기 커뮤니티 포스트로 선정하는 단계
    를 수행하여 커뮤니티 포스트 및 커뮤니티 멤버를 생성하는 것을 특징으로 하는 블로그 커뮤니티 추출 시스템.
  21. 제20항에 있어서,
    상기 포스트/블로거 검색부는,
    상기 커뮤니티 포스트에 액션을 적용한 블로거를 추가로 검색하여 상기 커뮤니티 멤버를 확장하는 단계; 및
    상기 커뮤니티 멤버가 액션을 적용한 포스트를 추가로 검색하여 상기 커뮤니티 포스트를 확장하는 단계
    를 더 수행하여 커뮤니티 포스트 및 커뮤니티 멤버를 확장 생성하는 것을 특징으로 하는 블로그 커뮤니티 추출 시스템.
  22. 제16항에 있어서,
    상기 포스트/블로거 검색부는,
    상기 특정 주제와 연관된 포스트 또는 블로거를 검색하기 위한 액션수 임계치를 설정하는 것을 특징으로 하는 블로그 커뮤니티 추출 시스템.
  23. 제22항에 있어서,
    상기 포스트/블로거 검색부는,
    상기 설정된 액션수 임계치를 만족하는 포스트 또는 블로거가 검색되지 않는 경우, 상기 커뮤니티 포스트 또는 커뮤니티 멤버에 대한 확장 단계를 완료하는 것을 특징으로 하는 블로그 커뮤니티 추출 시스템.
  24. 제22항에 있어서,
    상기 포스트/블로거 검색부는,
    임의로 설정한 최초 액션수 임계치에 따라 확장 단계별 검색 과정이 확장 종료 단계에 도달할 수 있는 지 여부를 피드백하여 최초 확장 단계에 대응하는 최초 액션수 임계치를 설정하는 것을 특징으로 하는 블로그 커뮤니티 추출 시스템.
  25. 제24항에 있어서,
    상기 확장 종료 단계는,
    상기 블로그 집단에 대해 상기 특정 주제와 관련된 예상 포스트의 수와 실 제 포스트의 수가 유사해지는 확장 단계를 의미하는 것을 특징으로 하는 블로그 커뮤니티 추출 시스템.
  26. 제22항에 있어서,
    상기 포스트/블로거 검색부는,
    이전 확장 단계의 커뮤니티 멤버 또는 커뮤니티 포스트에 대한 액션 정보를 이용하여 현재 확장 단계의 액션수 임계치를 조정하는 것을 특징으로 하는 블로그 커뮤니티 추출 시스템.
  27. 제16항에 있어서,
    상기 포스트/블로거 검색부는,
    상기 특정 주제와 관련이 없는 노이즈에 해당하는 포스트 또는 블로거를 검색하는 것을 방지하도록 포스트 또는 블로거 각각에 대한 액션 순도 임계치를 설정하는 것을 특징으로 하는 블로그 커뮤니티 추출 시스템.
  28. 제16항에 있어서,
    상기 블로거는,
    적어도 하나의 특정 주제별로 폴더를 설정하여 상기 폴더마다 대응하는 포스트를 연결하고,
    상기 블로그 커뮤니티 결정부는,
    상기 블로거에 설정된 폴더 각각에 대해 블로그 커뮤니티를 결정하는 것을 특징으로 하는 블로그 커뮤니티 추출 시스템.
  29. 제16항에 있어서,
    상기 포스트/블로거 검색부는,
    상기 포스트에 대한 액션수에 기초하여 상기 블로그 집단에 존재하는 포스트 중 인기 포스트를 결정하고 상기 커뮤니티 포스트에서 인기 포스트를 제외하는 것을 특징으로 하는 블로그 커뮤니티 추출 시스템.
KR1020080112145A 2008-11-12 2008-11-12 블로그 커뮤니티 추출 방법 및 시스템 KR101067116B1 (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020080112145A KR101067116B1 (ko) 2008-11-12 2008-11-12 블로그 커뮤니티 추출 방법 및 시스템

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020080112145A KR101067116B1 (ko) 2008-11-12 2008-11-12 블로그 커뮤니티 추출 방법 및 시스템

Publications (2)

Publication Number Publication Date
KR20100053152A true KR20100053152A (ko) 2010-05-20
KR101067116B1 KR101067116B1 (ko) 2011-09-22

Family

ID=42278311

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020080112145A KR101067116B1 (ko) 2008-11-12 2008-11-12 블로그 커뮤니티 추출 방법 및 시스템

Country Status (1)

Country Link
KR (1) KR101067116B1 (ko)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2012003255A3 (en) * 2010-07-01 2012-04-12 Facebook Inc. Facilitating interaction among users of a social network
WO2013138448A3 (en) * 2012-03-13 2014-03-06 Google Inc. Method and system of suggesting contacts through the display of public posts within a social networking service

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20020017622A (ko) * 2000-08-31 2002-03-07 김종민 인터넷 환경에서의 접속자 커뮤니티 서비스 시스템 및 그제공 방법
KR100643480B1 (ko) * 2005-06-25 2006-11-10 (주)엑셀렌테크놀로지 개인 매칭 시스템

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2012003255A3 (en) * 2010-07-01 2012-04-12 Facebook Inc. Facilitating interaction among users of a social network
US9177346B2 (en) 2010-07-01 2015-11-03 Facebook, Inc. Facilitating interaction among users of a social network
WO2013138448A3 (en) * 2012-03-13 2014-03-06 Google Inc. Method and system of suggesting contacts through the display of public posts within a social networking service
US8930456B2 (en) 2012-03-13 2015-01-06 Google Inc. Method and system of suggesting contacts through the display of public posts within a social networking service
CN104285237A (zh) * 2012-03-13 2015-01-14 谷歌公司 通过公开帖子在社交网络服务内的显示来建议联系人的方法和系统
CN104285237B (zh) * 2012-03-13 2018-02-09 谷歌有限责任公司 通过公开帖子在社交网络服务内的显示来建议联系人的方法和系统

Also Published As

Publication number Publication date
KR101067116B1 (ko) 2011-09-22

Similar Documents

Publication Publication Date Title
Muhammod et al. PyFeat: a Python-based effective feature generation tool for DNA, RNA and protein sequences
CN104008138B (zh) 一种基于社交网络的音乐推荐方法
US9584589B2 (en) Friend recommendation method, apparatus and storage medium
KR101764696B1 (ko) 사용자 영향력 및 시간 변화를 고려한 소셜 네트워크 핫 토픽 결정 방법 및 시스템
US20100082653A1 (en) Event media search
Carmel et al. On the relationship between novelty and popularity of user-generated content
US20150262238A1 (en) Techniques for Topic Extraction Using Targeted Message Characteristics
Daraghmi et al. We are so close, less than 4 degrees separating you and me!
Alamsyah et al. Sentiment analysis based on appraisal theory for marketing intelligence in Indonesia's mobile phone market
Gorrell et al. Using@ Twitter conventions to improve# LOD-based named entity disambiguation
CN106462933A (zh) 使用内容结构来社交地连接用户
JP2010262638A (ja) 代表者の信頼度を用いた検索結果順位化装置および方法
KR101067116B1 (ko) 블로그 커뮤니티 추출 방법 및 시스템
Lakomy Mapping the online presence and activities of the Islamic State’s unofficial propaganda cell: Ahlut-Tawhid Publications
JP5199768B2 (ja) タグ付け支援方法とその装置、プログラム及び記録媒体
Zhang et al. A collaborative filtering tag recommendation system based on graph
KR101646855B1 (ko) 신규 컨텐츠에 대한 컨텐츠 선호도 예측 방법 및 장치
Furini et al. Towards tweet content suggestions for museum media managers
Amitay et al. Serial Sharers: Detecting Split Identities of Web Authors.
Toivanen et al. Epistemic integration of the European Research Area: The shifting geography of the knowledge base of Finnish research, 1995–2010
JP5781242B2 (ja) ウェブトラッキング防止
US20200099647A1 (en) Representative media item selection for electronic posts
WO2014102734A1 (en) Systems and methods for collecting, sorting and posting information on a social media profile
JP2010061195A (ja) 情報通知プログラム及び情報通知装置
Yoon et al. Subject-based extraction of a latent blog community

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E90F Notification of reason for final refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20150722

Year of fee payment: 5

FPAY Annual fee payment

Payment date: 20160725

Year of fee payment: 6

FPAY Annual fee payment

Payment date: 20170704

Year of fee payment: 7

FPAY Annual fee payment

Payment date: 20190701

Year of fee payment: 9