KR20140012750A

KR20140012750A - 마이크로 블로그 배열, 검색 및 표시 방법과 시스템

Info

Publication number: KR20140012750A
Application number: KR1020137031978A
Authority: KR
Inventors: 야오 마
Original assignee: 텐센트 테크놀로지(센젠) 컴퍼니 리미티드
Priority date: 2012-02-09
Filing date: 2013-02-04
Publication date: 2014-02-03
Also published as: US20140108388A1; EP2704040A4; AP2014007382A0; CN103246670A; US9785677B2; EP2704040A1; JP2014522540A; WO2013117147A1; CN103246670B

Abstract

마이크로 블로그 검색 방법이 개시되는바, 해당 방법에는 사용자에 의해 요청되는 마이크로 블로그 정보를 획득하는 단계; 상기 마이크로 블로그 정보 내의 마이크로 블로그 발표 사용자 정보와 내용 정보를 추출하여 상기 마이크로 블로그 정보에 대해 평점을 수행하는 단계; 상기 평점에 따라 상기 마이크로 블로그 정보에 대해 배열을 수행하는 단계; 및 상기 배열의 결과에 따라 상기 마이크로 블로그 정보를 표시하는 단계가 포함된다. 상기 마이크로 블로그 배열 방법에 의하면, 마이크로 블로그 정보 내의 마이크로 블로그 발표 사용자 정보와 내용 정보를 추출하여 마이크로 블로그에 대해 평점을 수행하고 평점에 따라 마이크로 블로그 정보에 대해 배열을 수행하며 사용자와 관련된 마이크로 블로그 정보를 앞쪽에 배열시킴으로써 사용자가 용이하게 마이크로 블로그 정보를 열람할 수 있도록 한다. 또한, 마이크로 블로그 배열 시스템 및 마이크로 블로그 검색, 표시 방법과 시스템이 더 개시된다.

Description

마이크로 블로그 배열, 검색 및 표시 방법과 시스템{METHOD AND SYSTEM FOR SEQUENCING, SEEKING, AND DISPLAYING MICRO-BLOG}

본 발명은 네트워크 기술에 관한 것으로서, 특히 마이크로 블로그 배열, 검색 및 표시 방법과 시스템에 관한 것이다.

네트워크 기술의 발전과 더불어, 마이크로 블로그는 사용자들 상호간 소통과 교류 및 사용자의 자아 표현을 위한 중요한 플랫폼으로 되었다. 사용자는 마이크로 블로그에 대한 검색을 통해 자신이 관심을 갖는 정보를 획득한다.

기존의 마이크로 블로그의 배열 방법에 의하면, 통상적으로 시간 선후 순서에 따라 마이크로 블로그가 배열되는바, 보다 새로운 마이크로 블로그가 보다 앞쪽으로 배열된다.

기존의 마이크로 블로그의 배열 방법에 의하면, 모든 사용자들의 마이크로 블로그가 함께 혼합되어 단지 시간 선후 순서에만 따라 배열되므로 많고 번잡한 마이크로 블로그들로부터 사용자가 자신이 관심을 갖고 자신과 관련된 마이크로 블로그를 찾는데 너무 많은 정력과 시간이 필요하게 된다.

이를 감안한 본 발명은 사용자의 열람을 용이하게 할 수 있는 마이크로 블로그 배열 방법 및 시스템을 제공하고자 한다.

또한, 본 발명은 사용자의 열람을 용이하게 할 수 있는 마이크로 블로그 검색 방법 및 시스템을 제공하고자 한다.

또한, 본 발명은 사용자의 열람을 용이하게 할 수 있는 마이크로 블로그 표시 방법 및 시스템을 제공하고자 한다.

본 발명에 따른 마이크로 블로그 배열 방법에는,

사용자에 의해 요청되는 마이크로 블로그 정보를 획득하는 단계;

상기 마이크로 블로그 정보 내의 마이크로 블로그 발표 사용자 정보와 내용 정보를 추출하여 상기 마이크로 블로그 정보에 대해 평점을 수행하는 단계;

상기 평점에 따라 상기 마이크로 블로그 정보에 대해 배열을 수행하는 단계; 및

상기 배열의 결과에 따라 상기 마이크로 블로그 정보를 표시하는 단계가 포함된다.

본 발명에 따른 마이크로 블로그 배열 시스템에는,

사용자에 의해 요청되는 마이크로 블로그 정보를 획득하도록 구성되는 마이크로 블로그 정보 획득 모듈;

상기 마이크로 블로그 정보 내의 마이크로 블로그 발표 사용자 정보를 추출하여 상기 마이크로 블로그 발표 사용자 정보에 따라 상기 마이크로 블로그 정보에 대해 평점을 수행하도록 구성되는 사용자 정보 평점 모듈과, 상기 마이크로 블로그 정보 내의 내용 정보를 추출하여 상기 내용 정보에 따라 상기 마이크로 블로그 정보에 대해 평점을 수행하도록 구성되는 내용 정보 평점 모듈을 포함하는 평점 모듈;

상기 평점에 따라 상기 마이크로 블로그 정보에 대해 배열을 수행하도록 구성되는 배열 모듈; 및

상기 배열의 결과에 따라 상기 마이크로 블로그 정보를 표시하도록 구성되는 표시 모듈이 포함된다.

본 발명에 따른 마이크로 블로그 검색 방법에 있어서, 상기 마이크로 블로그 배열 방법에 따라 마이크로 블로그 검색 결과에 대해 배열을 수행하며, 상기 사용자에 의해 요청되는 마이크로 블로그 정보를 획득하는 단계에는, 사용자에 의해 입력되는 키워드에 따라 검색을 수행하여 상기 사용자에 의해 요청되는 마이크로 블로그 정보를 획득하는 단계가 포함된다.

본 발명에 따른 마이크로 블로그 검색 시스템에는, 상기 마이크로 블로그 배열 시스템이 포함되며, 상기 마이크로 블로그 정보 획득 모듈은, 사용자에 의해 입력되는 키워드에 따라 검색을 수행하여 상기 사용자에 의해 요청되는 마이크로 블로그 정보를 획득하도록 구성된다.

본 발명에 따른 마이크로 블로그 표시 방법에 있어서, 상기 마이크로 블로그 배열 방법에 따라 마이크로 블로그 요청 결과에 대해 배열을 수행하며, 상기 사용자에 의해 요청되는 마이크로 블로그 정보를 획득하는 단계에는, 사용자 식별자에 대응되는 마이크로 블로그 요청 정보에 따라 상기 사용자에 의해 요청되는 마이크로 블로그 정보를 획득하는 단계가 포함된다.

본 발명에 따른 마이크로 블로그 표시 시스템에는, 상기 마이크로 블로그 배열 시스템이 포함되며, 상기 마이크로 블로그 정보 획득 모듈은 사용자 식별자에 대응되는 마이크로 블로그 요청 정보에 따라 상기 사용자에 의해 요청되는 블로그 정보를 획득하도록 구성된다.

상기 마이크로 블로그 배열, 검색 및 표시 방법과 시스템에 의하면, 마이크로 블로그 정보 내의 마이크로 블로그 발표 사용자 정보와 내용 정보를 추출하여 마이크로 블로그에 대해 평점을 수행하고 평점에 따라 마이크로 블로그 정보에 대해 배열을 수행하며 사용자와 관련된 마이크로 블로그 정보를 앞쪽에 배열시킴으로써 사용자가 용이하게 마이크로 블로그 정보를 열람할 수 있도록 한다.

도1은 일 실시예에 의한 마이크로 블로그 배열 방법의 흐름도이고,
도2는 일 실시예에 의한, 마이크로 블로그 정보 내의 마이크로 블로그 발표 사용자 정보를 추출하여 마이크로 블로그 정보에 대해 평점을 수행하는 흐름도이며,
도3은 다른 일 실시예에 의한, 마이크로 블로그 정보 내의 마이크로 블로그 발표 사용자 정보를 추출하여 마이크로 블로그 정보에 대해 평점을 수행하는 흐름도이며,
도4는 일 실시예에 의한, 마이크로 블로그 정보 내의 내용 정보를 추출하여 마이크로 블로그 정보에 대해 평점을 수행하는 흐름도이며,
도5는 일 실시예에 의한, 마이크로 블로그 주제별 카테고리의 특징을 훈련(training)하는 흐름도이며,
도6은 일 실시예에 의한, 마이크로 블로그 주제별 카테고리의 훈련 서브 집합을 획득하는 흐름도이며,
도7은 일 실시예에 의한, 과학 기술 네트워크 카테고리의 훈련 서브 집합의 예시도이며,
도8은 일 실시예에 의한, 마이크로 블로그 배열 방법의 원리 예시도이며,
도9는 일 실시예에 의한, 마이크로 블로그 배열 시스템의 구성 예시도이며,
도10은 일 실시예에 의한, 평점 모듈의 구성 예시도이며,
도11은 일 실시예에 의한, 사용자 정보 평점 모듈의 구성 예시도이며,
도12는 다른 일 실시예에 의한, 사용자 정보 평정 모듈의 구성 예시도이며,
도13은 일 실시예에 의한, 내용 정보 평점 모듈의 구성 예시도이며,
도14는 일 실시예에 의한, 분류 모델 훈련 모듈의 구성 예시도이다.

도1에 도시된 바와 같이, 일 실시예에 의한 마이크로 블로그 배열 방법에는 다음과 같은 단계가 포함된다.

단계 S101: 사용자에 의해 요청되는 마이크로 블로그 정보를 획득한다.

단계 S102: 마이크로 블로그 정보 내의 마이크로 블로그 발표 사용자 정보와 내용 정보를 추출하여 마이크로 블로그 정보에 대해 평점을 수행한다.

바람직하게, 마이크로 블로그 정보 내의 마이크로 블로그 발표 사용자 정보와 내용 정보가, 마이크로 블로그 요청 사용자와의 연관성이 높으면, 해당 마이크로 블로그 정보에 대한 평점도 높다.

단계 S103: 평점에 따라 마이크로 블로그 정보에 대해 배열을 수행한다.

바람직하게, 평점의 높고 낮음에 따라 마이크로 블로그 정보에 대해 배열을 수행하며 즉 마이크로 블로그 정보의 평점이 높을수록 보다 더 앞쪽으로 배열된다.

단계 S104: 배열 결과에 따라 마이크로 블로그 정보를 표시한다.

상기 마이크로 블로그 배열 방법에 있어서, 마이크로 블로그 정보 내의 마이크로 블로그 발표 사용자 정보와 내용 정보를 추출하여 마이크로 블로그에 대해 평점을 수행하고 평점에 따라 마이크로 블로그 정보에 대해 배열을 수행하여, 사용자와 관련된 마이크로 블로그 정보를 앞쪽으로 위치시킬 수 있으며 이로써 사용자가 용이하게 마이크로 블로그 정보를 열람할 수 있도록 한다.

도2에 도시된 바와 같이, 일 실시예에 의하면 단계 S102에서 마이크로 블로그 정보 내의 마이크로 블로그 발표 사용자 정보를 추출하여 마이크로 블로그 정보에 대해 평점을 수행하는 단계에는 다음과 같은 단계가 포함된다.

단계 S112: 마이크로 블로그 발표 사용자의 마이크로 블로그 운영 기록을 획득하여 마이크로 블로그 운영 기록에 따라 마이크로 블로그 발표 사용자의 활성도를 산출한다.

일 실시예에 있어서, 마이크로 블로그 발표 사용자의 ID에 따라, 사용자의 마이크로 블로그 운영 기록을 이미 저장한 데이터베이스 내에서 사용자의 ID에 대응되는 마이크로 블로그 운영 기록을 검색한다. 바람직하게, 마이크로 블로그 운영 기록에는 VIP 사용자 여부, 마이크로 블로그 업데이트 빈도, 마이크로 블로그 리포스팅(reposting) 비율, 마이크로 블로그 원작 비율, 마이크로 블로그 추천 평론 횟수, 마이크로 블로그 평균 글자수, 재미(funny) 점수값 등이 포함될 수 있다. 일 실시예에 있어서, 재미 점수는 마이크로 블로그 발표 사용자의 마이크로 블로그에 대한 기타 사용자의 재미 평점에 따라 얻을 수 있다.

마이크로 블로그 발표 사용자의 마이크로 블로그 운영 기록은 마이크로 블로그 발표 사용자의 활성도를 나타낸다. 구체적으로, 마이크로 블로그 발표 사용자가 VIP 사용자이거나 또는 그의 마이크로 블로그의 업데이트 빈도가 높거나, 리포스팅 비율이 높거나, 원작 비율이 높거나, 추천 평론된 횟수가 많거나, 평균 글자수가 많거나, 재미 점수 값이 높으면, 그에 대응되게, 마이크로 블로그 발표 사용자의 활성도를 높게 설정할 수도 있다.

단계 S122: 활성도에 따라 마이크로 블로그 정보에 대해 평점을 수행한다.

바람직하게, 마이크로 블로그 발표 사용자의 활성도가 높으면, 그와 상응하게 해당 마이크로 블로그에 대한 평점을 높일 수 있는바 이는 활성도가 높은 마이크로 블로그 사용자에 의해 발표된 마이크로 블로그가 보다 더 용이하게 사용자의 관심을 받기 때문이다.

본 실시예에서는 활성도가 높은 마이크로 블로그 발표 사용자의 마이크로 블로그 정보에 대한 평점도 높고 또한 평점이 높은 마이크로 블로그 정보를 앞쪽으로 위치시키는바 즉 사용자의 관심을 더 받을 수 있는 마이크로 블로그 정보를 앞쪽으로 위치시킴으로써 사용자가 용이하게 자신이 관심을 갖는 마이크로 정보를 열람할 수 있도록 한다.

도3에 도시된 바와 같이, 일 실시예에 있어서, 단계 S102에서 마이크로 블로그 정보 내의 마이크로 블로그 발표 사용자 정보를 추출하여 마이크로 블로그 정보에 대해 평점을 수행하는 단계에는 다음과 같은 단계가 포함된다.

단계 S132: 마이크로 블로그 발표 사용자의 개인 정보 및 마이크로 블로그 요청 사용자의 개인 정보를 획득하여 마이크로 블로그 발표 사용자의 개인 정보와 마이크로 블로그 요청 사용자의 개인 정보 사이의 유사성을 산출한다.

일 실시예에 있어서, 사용자의 ID에 따라, 사용자의 개인 정보를 이미 저장한 데이터 베이스 내에서 사용자의 ID에 대응되는 개인 정보를 찾아낸다. 구체적으로, 개인 정보에는 취미, 학력, 전공, 지역, 개성있는 서명(personalized signature), 즐겨찾는 마이크로 블로그 정보, 공통된 친구 수, 사용자 타입 정보 등이 포함될 수 있다. 일 실시예에 있어서, 사용자 타입은, 과학기술형, 오락형, 체육형, 예술형, 정치형 등으로 분류될 수 있다. 바람직하게, 사용자 타입 정보에는 사용자 타입 벡터가 포함되며, 사용자 타입 벡터의 성분은 어느 한 사용자 타입에 대한 사용자의 편향 점수값을 표시한다. 예를 들면, 사용자 타입 벡터의 첫번째 성분은 과학기술형 점수값을 표시하고 두번째 성분은 오락형 점수값을 표시하며 이와 같이 유추하는 것으로 정의할 수 있다. 만약 과학기술형에 대한 사용자의 편향 점수값이 3이고, 오락형에 대한 편향 점수값이 4이면, 사용자 타입 벡터는 (3, 4, …)로 표시할 수 있다. 바람직하게, 사용자 타입 벡터의 성분들 중 점수값이 가장 높은 성분에 대응되는 사용자 타입을 해당 사용자의 사용자 타입으로 선택할 수 있다.

일 실시예에 있어서, 사용자 타입 벡터는 사용자에 의한 수동 설정을 통해 획득할 수도 있고 사용자가 주목하는 마이크로 블로그 사용자 및 사용자의 친구의 사용자 타입에 대한 통계를 통해 획득할 수도 있다. 예를 들면, 사용자가 주목하는 마이크로 블로그 사용자 및 사용자의 친구들 중, 과학기술형에 속하는 인수가 5이면 사용자 타입 벡터에서 과학기술형에 대응되는 성분을 5로 설정할 수 있다.

일 실시예에 있어서, 사용자의 취미가 같거나 취미가 속하는 카테고리가 같으면, 예를 들어 모두 예술 카테고리이면, 마이크로 블로그 발표 사용자와 마이크로 블로그 요청 사용자의 유사성 값을 높일 수 있다. 일 실시예에 있어서, 취미가 속하는 카테고리를 저장한 데이터베이스 내에서 사용자의 취미가 속하는 카테고리를 검색할 수 있다. 이와 상응하게, 만약 사용자의 학력이 같으면 예를 들어 모두 본과이거나 모두 박사 이상 학력이면, 사용자 사이의 유사성 값을 높일 수도 있다. 마찬가지로, 만약 사용자의 전공이 같거나 전공이 속하는 카테고리가 같거나, 또는 사용자의 지역이 같거나 속하는 지역이 같거나, 또는 사용자의 개성있는 서명에 동일한 키워드가 있거나, 또는 사용자가 즐겨찾는 마이크로 블로그 정보가 같거나, 또는 사용자의 사용자 타입 정보가 유사하거나, 또는 사용자 사이의 공통 마이크로 블로그 친구의 수량이 기 설정된 임계값을 초과하는 등 경우에, 사용자 사이의 유사성 값을 모두 높일 수 있다. 일 실시예에 있어서, 상기 사용자 타입 벡터의 거리를 산출함으로써 사용자 타입 정보의 유사성을 획득할 수도 있으며, 두 사용자 타입 벡터의 거리가 작을수록 사용자 타입 정보의 유사성이 더 높으며, 그와 상응한 사용자 사이의 유사성도 높게 된다.

단계 S142: 마이크로 블로그 발표 사용자와 마이크로 블로그 요청 사용자 사이의 인터랙션 기록을 획득하여, 인터랙션 기록에 따라 마이크로 블로그 발표 사용자와 마이크로 블로그 요청 사용자 사이의 연관성을 산출한다.

일 실시예에 의하면, 인터랙션 기록에는 사용자 사이의 인용, 방문, 평론, 리포스팅 기록 등이 포함된다. 구체적으로, 만약 사용자 사이의 인용, 방문, 평론, 리포스팅 횟수가 높으면, 그와 상응하게 사용자 사이의 연관성도 높게 설정할 수 있다.

단계 S152: 상기 유사성과 연관성에 따라 마이크로 블로그 정보에 대해 평점을 수행한다.

바람직하게, 만약 마이크로 블로그 발표 사용자와 마이크로 블로그 요청 사용자 사이의 유사성이 높거나 또는 연관성이 높으면, 마이크로 블로그 정보에 대한 평점을 높일 수 있다.

본 실시예에 있어서, 만약 마이크로 블로그 발표 사용자와 마이크로 블로그 요청 사용자 사이의 개인 정보 유사성이 높거나 양자 사이의 연관성이 높으면, 마이크로 블로그 정보에 대한 평점도 높게 되고, 평점이 높은 마이크로 블로그 정보를 앞쪽으로 위치시키며, 이러한 마이크로 블로그 정보는 또한, 마이크로 블로그 요청 사용자의 관심을 보다 더 불러일으킬 수 있는 마이크로 블로그 정보이므로, 사용자가 자신이 관심갖는 마이크로 블로그 정보를 용이하게 열람할 수 있도록 한다.

일 실시예에 의하면, 단계 S102에서 마이크로 블로그 정보 내의 마이크로 블로그 발표 사용자 정보를 추출하여 마이크로 블로그 정보에 대해 평점을 수행하는 단계에는 단계 S112~S152이 포함된다. 단계 S152에서 마이크로 블로그 정보에 대한 평점은, 단계 S122에서 마이크로 블로그 정보에 대한 평점의 기초상에서 수행할 수 있다. 즉 마이크로 블로그 발표 사용자의 활성도에 따라 획득된 평점 및 마이크로 블로그 발표 사용자와 마이크로 블로그 요청 사용자 사이의 개인 정보 유사성과 연관성에 따라 획득된 평점을 종합하여 마이크로 블로그 정보의 종합 평점으로 하고 종합 평점에서 상기 두 평점이 차지하는 비중을 설정할 수 있다.

도4에 도시된 바와 같이, 일 실시예에 있어서, 단계 S102에서 마이크로 블로그 정보 내의 내용 정보를 추출하여 마이크로 블로그 정보에 대해 평점을 수행하는 단계에는 다음과 같은 단계가 포함된다.

단계 S162: 마이크로 블로그 정보 내의 마이크로 블로그 내용을 획득하여 마이크로 블로그 내용 및 마이크로 블로그 주제별 카테고리의 특징에 따라 마이크로 블로그 정보 내의 마이크로 블로그 내용의 주제별 카테고리 벡터를 획득한다.

바람직하게, 마이크로 블로그 내용에는 마이크로 블로그의 본문 내용 즉 마이크로 블로그 발표 사용자에 의해 발표된 내용이 포함되고, 마이크로 블로그 내용에는 또한 마이크로 블로그의 평론 내용이 더 포함될 수 있다. 일 실시예에 있어서, 마이크로 불르그 내용의 글자수가 많지 않으면 해당 마이크로 블로그의 발표 사용자가 해당 마이크로 블로그의 발표 시점에 근접한 시간(미리 설정될 수 있음) 내에 발표한 마이크로 블로그 내용을 획득하여 여러 개의 마이크로 블로그 내용을 하나로 조합할 수 있다.

바람직하게, 마이크로 블로그 주제별 카테고리에는, 정치군사, 문화예술, 재정주식, 감정인생, 사회법제, 오락가십, 과학기술네트워크, 건강미식, 체육운동, 자동차부동산, 교육취직, 패션여행 등이 포함된다. 바람직하게, 주제별 카테고리 벡터의 각 성분은 마이크로 블로그 내용이 어느 한 마이크로 블로그 주제별 카테고리에 속하는 편향 점수값을 표시한다. 예를 들어, 주제별 카테고리 벡터의 첫번째 성분은 정치군사 카테고리의 점수값을 표시하고, 두번째 성분은 문화예술 카테고리의 점수값을 표시하며, 이와 같이 유추한다. 주제별 카테고리 벡터(5, 10, …)은 마이크로 블로그 내용이 정치 군사 카테고리 소속으로 편향하는 점수값이 5이고 문화예술 카테고리 소속으로 편향하는 점수값이 10임을 표시한다. 바람직하게, 점수값이 가장 높은 성분에 대응되는 마이크로 블로그 주제별 카테고리를 마이크로 블로그 내용이 속하는 마이크로 블로그 주제별 카테고리로 취할 수 있다.

구체적으로, 마이크로 블로그 주제별 카테고리의 특징을 미리 훈련할 수 있으며, 또한, 기존의 나이브 베이즈 문서 분류 알고리즘을 채용하여 마이크로 블로그 내용에 대해 분류하여 마이크로 블로그 내용의 주제별 카테고리 벡터를 획득할 수 있으며, 더 이상 설명하지 않는다.

단계 S172: 마이크로 블로그 요청 사용자의 역사 마이크로 블로그 내용을 획득하여 역사 마이크로 블로그 내용 및 마이크로 블로그 주제별 카테고리의 특징에 따라 마이크로 블로그 요청 사용자의 역사 마이크로 블로그 내용의 주제별 카테고리 벡터를 획득한다.

구체적으로, 최근 시간 동안(미리 설정할 수 있음) 내의 마이크로 블로그 요청 사용자가 발표한 마이크로 블로그 내용을 획득할 수 있다. 바람직하게, 여러 개의 역사 마이크로 블로그 내용의 주제별 카테고리 벡터를 획득한 후, 해당 여러 개 벡터의 평균값을 산출하여 마이크로 블로그 요청 사용자의 역사 마이크로 블로그 내용의 주제별 카테고리 벡터로 한다.

단계 S182: 마이크로 블로그 정보 내의 마이크로 블로그 내용의 주제별 카테고리 벡터와 마이크로 블로그 요청 사용자의 역사 마이크로 블로그 내용의 주제별 카테고리 벡터에 따라, 마이크로 블로그 정보 내의 마이크로 블로그 내용과 마이크로 블로그 요청 사용자의 역사 마이크로 블로그 내용 사이의 유사성을 산출할 수 있다.

구체적으로, 상기 두개 주제별 카테고리 벡터 사이의 거리를 산출함으로써 마이크로 블로그 정보 내의 마이크로 블로그 내용과 마이크로 블로그 요청 사용자의 역사 마이크로 블로그 내용 사이의 유사성을 산출할 수 있다. 바람직하게, 거리가 작을수록 유사성을 더 높게 설정한다.

단계 S192: 해당 유사성에 따라 마이크로 블로그 정보에 대해 평점을 수행한다.

바람직하게, 유사성이 높을수록 마이크로 블로그 정보에 대한 평점이 더 높다.

본 실시예에 있어서, 만약 마이크로 블로그 정보 내의 마이크로 블로그 내용과 마이크로 블로그 요청 사용자의 역사 마이크로 블로그 내용의 유사성이 높으면 마이크로 블로그 정보에 대한 평점도 높고 평점이 높은 마이크로 블로그 정보를 앞쪽으로 위치시키며, 이러한 앞쪽으로 위치되는 마이크로 블로그 내용은 사용자의 관심을 보다 쉽게 끌 수 있어 사용자가 용이하게 관심갖는 마이크로 블로그를 열람할 수 있도록 한다.

도5에 도시된 바와 같이, 일 실시예에 있어서, 단계 S102 내의 마이크로 블로그 정보 내의 내용 정보를 추출하여 마이크로 블로그 정보에 대해 평점을 수행하기 전에, 마이크로 블로그 주제별 카테고리의 특징을 미리 훈련해야 하며, 상기 마이크로 블로그 배열 방법에는 다음과 같은 단계가 더 포함된다.

S501: 미리 설정된 마이크로 블로그 주제별 카테고리를 획득한다.

바람직하게, 마이크로 블로그 주제별 카테고리에는, 정치군사, 문화예술, 재정주식, 감정인생, 사회법제, 오락가십, 과학기술네트워크, 건강미식, 체육운동, 자동차부동산, 교육취직, 패션여행 등이 포함된다.

단계 S502: 마이크로 블로그 주제별 카테고리의 훈련 서브 집합을 획득한다.

바람직하게, 훈련 서브 집합으로부터 주제별 카테고리의 보다 나은 특징을 추출하기 위해 일정한 범위 내에서 될수록 많은 마이크로 블로그 훈련 샘플을 획득할 수 있다. 도6에 도시된 바와 같이, 일 실시예에 있어서, 단계 S502의 구체적인 과정에는, 마이크로 블로그 주제별 카테고리의 키워드에 따라 마이크로 블로그를 검색하여 마이크로 블로그 주제별 카테고리의 초기 훈련 서브 집합을 획득하는 단계 S512; 미리 설정된 횟수에 따라 이하의 단계 S532 및 단계 S542를 반복적으로 수행하는 단계 S522; 초기 훈련 서브 집합 내의 고빈도 어휘를 통계하는 단계 S532; 및 고빈도 어휘에 따라 마이크로 블로그를 검색하여 검색 결과를 초기 훈련 서브 집합에 추가하는 단계 S542가 포함된다.

구체적으로, 마이크로 블로그 주제별 카테고리 명칭 및 그 분할 어휘를 마이크로 블로그 주제별 카테고리의 키워드로 하는바, 예를 들어 정치군사 카테고리의 경우 정치, 군사 및 정치군사를 이 카테고리의 키워드로 하며, 이러한 키워드에 따라 검색을 수행하여 해당 카테고리의 초기 훈련 서브 집합을 획득한다. 또한, 초기 훈련 서브 집합에 대해 사전 처리를 수행한 후 어휘 분할, 사용 금지 어휘의 필터링 등 처리를 수행하여, 초기 서브 집합 내의 고빈도 어휘를 통계한다. 또한, 고빈도 어휘 및 고빈도 어휘의 조합을 키워드로 하여 계속하여 검색을 수행하여 보다 많은 마이크로 블로그 훈련 샘플을 획득할 수 있다. 초기 훈련 서브 집합 내의 고빈도 어휘를 통계하고 고빈도 어휘를 키워드로 하여 마이크로 블로그를 검색하여 검색 결과를 초기 훈련 서브 집합에 추가하는 단계를 미리 설정된 횟수에 따라 반복한다.

예를 들면, 도7에 도시된 바와 같이, "과학기술, 네트워크, 과학기술 네트워크"를 검색 집합 QS1에 추가하여 QS1 내의 어휘를 키워드로 하여 마이크로 블로그를 검색하여 훈련 서브 집합 RS1을 얻는다. RS1 내의 고빈도 어휘를 통계하는바 예를 들어 "과학, IT, 핸드폰, 데이터, 인터넷" 등을 획득하여 획득된 고빈도 어휘를 QS1에 추가하여 QS2를 얻는다. QS2 내의 어휘 및 어휘 조합을 키워드로 하여 마이크로 블로그를 검색하여 획득된 마이크로 블로그 검색 결과를 RS1에 추가하여 RS2를 얻는다. RS2 내의 고빈도 어휘를 통계하여 획득된 고빈도 어휘를 QS2에 추가하여 QS3을 얻는다. QS3 내의 어휘 및 어휘 조합을 키워드로 하여 마이크로 블로그를 검색하여 획득된 마이크로 블로그 검색 결과를 RS2 내에 추가하여 RS3을 얻는다. 이와 같이 유추하여 QS4와 RS4를 얻고 상기 통계와 검색 단계를 반복하면 훈련 서브 집합 내의 샘플의 수량은 확충된다.

본 실시예에서 마이크로 블로그 주제별 카테고리의 훈련 서브 집합을 획득하는 방법을 통해 각 주제별 카테고리의 훨씬 많은 마이크로 블로그 훈련 샘플을 획득할 수 있으며 훈련 서브 집합으로부터 각 마이크로 블로그 주제별 카테고리의 특징을 추출하기 위한 기반을 제공한다.

단계 S503: 훈련 서브 집합으로부터 마이크로 블로그 주제별 카테고리의 특징을 추출한다.

구체적으로, 기존의 분류 훈련 방법을 이용하여 각 주제별 카테고리의 훈련 서브 집합 내의 마이크로 블로그 내용에 대해 훈련하여 각 주제별 카테고리의 특징을 추출할 수 있다. 여기서 더 이상 설명하지 않는다.

일 실시예에 있어서, 단계 S104전에 상기 방법은 다음과 같은 단계를 더 포함한다.

미리 설정된 마이크로 블로그 표시 카테고리에 따라 마이크로 블로그 정보 내의 마이크로 블로그 내용에 대해 분류하여 마이크로 블로그 내용이 속하는 표시 카테고리를 얻는다.

구체적으로, 표시 카테고리에는 상기에서 언급된 마이크로 블로그 주제별 카테고리, 예를 들어 정치군사 카테고리, 문화예술 카테고리, 재정주식 카테고리 등이 포함될 수 있다. 마이크로 블로그 내용이 속하는 마이크로 블로그 주제별 카테고리는 단계 S162에서 획득된 마이크로 블로그 정보 내의 마이크로 블로그 내용의 주제별 카테고리 벡터에 따라 얻을 수 있고, 주제별 카테고리 벡터 내의 점수값이 가장 높은 성분에 대응되는 주제별 카테고리를 마이크로 블로그 내용이 속하는 마이크로 블로그 카테고리로 취할 수 있다.

일 실시예에 있어서, 마이크로 블로그 주제별 카테고리외에도, 기타 표시 카테고리, 예를 들어 친구 카테고리, 지점 카테고리, 재미 카테고리, 도움요청 리포스팅 카테고리, 광고활동 카테고리 등이 추가될 수 있다. 마이크로 블로그 정보가 친구 카테고리에 속하는지는 마이크로 블로그 발표 사용자와 마이크로 블로그 요청 사용자가 친구인지에 따라 판단할 수 있다. 일 실시예에 있어서, 마이크로 블로그 발표 사용자의 ID 및 마이크로 블로그 요청 사용자의 ID에 따라 친구 대응 관계를 이미 저장한 데이터베이스 내에서 마이크로 블로그 발표 사용자와 마이크로 블로그 요청 사용자 사이가 친구인지를 찾을 수 있다. 마이크로 블로그 정보가 지점 카테고리에 속하는지는, 마이크로 블로그 발표 사용자와 마이크로 블로그 요청 사용자의 주소가 동일한 지역(현, 구 등으로 설정할 수 있음)에 속하는지에 따라 판단할 수 있다. 마이크로 블로그가 재미 카테고리에 속하는지는 마이크로 블로그 발표 사용자의 ID에 따라 사용자의 재미 점수값을 이미 저장한 데이터베이스 내에서 찾은 재미 점수값이 미리 설정된 임계값보다 큰지에 따라 판단할 수 있다. 일 실시예에 있어서, 사용자의 재미 점수값은 해당 사용자에 대한 기타 사용자의 재미 평점에 따라 획득할 수 있다. 마이크로 블로그 정보가 도움요청 리포스팅 카테고리, 광고활동 카테고리에 속하는지는 마이크로 블로그 내용 내에 도움요청, 광고 고빈도 어휘 등의 출현 여부에 따라 판단할 수 있다.

일 실시예에 있어서, 마이크로 블로그 표시 카테고리에는 인기화제 카테고리가 더 포함될 수 있다. 구체적으로, 웹페이지 내용을 분석하여 고빈도 기록을 획득하며, 마이크로 블로그 요청 사용자의 역사 마이크로 블로그 내용에 따라, 상기 고빈도 기록에 대해 평점을 수행하며, 고빈도 기록 평점에 따라 검색 결과 내의 마이크로 블로그를 선택하여 인기화제 카테고리로 분류시킨다.

바람직하게, 기존의 오픈소스 툴 Html-parser에 따라 웹 페이지 내용에 대한 분석을 통해 출현 횟수가 미리 설정된 임계값을 초과하는 어휘 그룹, 즉 고빈도 기록을 얻을 수 있다. 또한, 고빈도 기록과 마이크로 블로그 요청 사용자의 역사 마이크로 블로그 내용의 유사성에 따라 고빈도 기록에 대한 평점을 수행할 수 있다. 구체적으로, 고빈도 기록이 마이크로 블로그 요청 사용자에 의해 발표, 리포스팅, 평론된 마이크로 블로그 내용에서 출현된 횟수를 통계하여 해당 횟수에 따라 고빈도 기록에 대해 평점을 수행할 수 있다. 마지막으로, 평점이 미리 설정된 앞쪽 자리인 고빈도 기록을 선택하고 마이크로 블로그 내용 중 해당 고빈도 기록이 나타난 마이크로 블로그 정보를 선택하여 해당 마이크로 블로그 정보를 인기 화제 카테고리로 분류시킬 수 있다.

본 실시예에 있어서, 단계 S104의 구체적인 과정은, 마이크로 블로그 내용이 속하는 표시 카테고리 및 상기 배열의 결과에 따라 마이크로 블로그 정보를 표시한다.

구체적으로, 마이크로 블로그 정보를 각 표시 카테고리에 따라 분류하여 표시하고 각 표시 카테고리에서 평점이 높은 마이크로 블로그 정보를 앞쪽으로 배열시킬 수 있다.

본 실시예에 있어서, 마이크로 블로그 정보를 여러 개의 표시 카테고리로 분할하여 표시함으로써 사용자가 자신이 관심 있는 마이크로 블로그를 용이하게 선택하여 열람할 수 있도록 하여 사용자의 조작을 간편화한다. 또한, 각 표시 카테고리는 모두 마이크로 블로그의 평점의 내림차순으로 표시되며 배열 순서가 앞쪽인 마이크로 블로그는 그 마이크로 블로그 발표 사용자의 활성도가 비교적 높거나 마이크로 블로그 발표 사용자의 개인 정보와 마이크로 블로그 요청 사용자의 개인 정보 유사성이 비교적 높거나 마이크로 블로그 발표 사용자와 마이크로 블로그 요청 사용자의 연관성이 비교적 높아 사용자가 용이하게 자신과 관련된, 관심있는 마이크로 블로그를 열람할 수 있도록 한다.

도8은 일 실시예에 의한 마이크로 블로그 배열 방법의 원리 예시도이다.

마이크로 블로그 배열 방법에 의하면, 마이크로 블로그 발표 사용자 정보와 내용 정보에 따라 마이크로 블로그 정보에 대해 평점을 수행할 수 있으며, 마이크로 블로그 발표 사용자 정보에 대한 평점은 U로 표기하고 내용 정보에 대한 평점은 C로 표기한다. 여기서, 마이크로 블로그 발표 사용자 정보에 대한 평점 U는 마이크로 블로그 발표 사용자 활성도에 대한 평점 A, 마이크로 블로그 발표 사용자와 마이크로 블로그 요청 사용자의 개인 정보 유사성에 대한 평점 P, 마이크로 블로그 발표 사용자와 마이크로 블로그 요청 사용자의 연관성에 대한 평점 R에 따라 산출하여 얻을 수 있다. 마이크로 블로그 발표 사용자 활성도에 대한 평점 A는 마이크로 블로그 발표 사용자의 정보, 즉 VIP 사용자 여부, 마이크로 블로그 업데이트 빈도, 마이크로 블로그 리포스팅(reposting) 비율, 마이크로 블로그 원작 비율, 마이크로 블로그 추천 평론 횟수, 마이크로 블로그 평균 글자수, 재미(funny) 점수값 등 정보에 따라 획득할 수 있다. 마이크로 블로그 발표 사용자와 마이크로 블로그 요청 사용자의 개인 정보 유사성에 대한 평점 P는 양자의 정보, 즉 취미, 학력, 전공, 지역, 개성있는 서명(personalized signature), 즐겨찾는 마이크로 블로그 정보, 공통된 친구 수, 사용자 타입 정보 등 정보에 따라 획득할 수 있다. 마이크로 블로그 발표 사용자와 마이크로 블로그 요청 사용자의 연관성에 대한 평점 R은 마이크로 블로그 발표 사용자와 마이크로 블로그 요청 사용자 사이의 인터랙션 기록에 따라 획득할 수 있는바 인터랙션 기록에는 인용, 방문, 평론, 리포스팅 기록 등이 포함된다. 마이크로 블로그 내용 정보에 대한 평점 C는 마이크로 블로그 내용과 마이크로 블로그 요청 사용자의 역사 마이크로 블로그 내용 사이의 유사성에 따라 산출하여 얻을 수 있다. 여기서, 해당 유사성은 마이크로 블로그 주제별 카테고리 벡터와 마이크로 블로그 요청 사용자의 역사 마이크로 블로그 주제별 카테고리 벡터 사이의 거리에 따라 산출하여 얻을 수 있다. 마지막으로, 상기 평점들을 통합하여 마이크로 블로그 정보의 종합 평점을 획득할 수 있으며, 일 실시예에 있어서 종합 평점=a1*U+a2*C=b1*A+b2*P+b3*R+a2*C이며, a1, a2, b1, b2, b3은 미리 설정된 계수이다.

도9에 도시된 바와 같이, 일 실시예에 의한 마이크로 블로그 배열 시스템에는 마이크로 블로그 정보 획득 모듈(10), 평점 모듈(20), 배열 모듈(30), 표시 모듈(40)이 포함된다.

마이크로 블로그 정보 획득 모듈(10)은 사용자에 의해 요청되는 마이크로 블로그 정보를 획득하도록 구성된다.

평점 모듈(20)은 사용자 정보 평점 모듈(201)과 내용 정보 평점 모듈(202)을 포함하며, 도10에 도시된 바와 같이, 사용자 정보 평점 모듈(201)은 마이크로 블로그 정보 내의 마이크로 블로그 발표 사용자 정보를 추출하여 마이크로 블로그 발표 사용자 정보에 따라 마이크로 블로그 정보에 대해 평점을 수행하도록 구성되고, 내용 정보 평점 모듈(202)은 마이크로 블로그 정보 내의 내용 정보를 추출하여 내용 정보에 따라 마이크로 블로그 정보에 대해 평점을 수행하도록 구성된다.

사용자 정보 평점 모듈(201)과 내용 정보 평점 모듈(202)은 마이크로 블로그 정보에 대한 평점을 통해 종합 평점을 얻는다. 바람직하게, 만약 마이크로 블로그 정보 내의 마이크로 블로그 발표 사용자 정보와 내용 정보가 마이크로 블로그 요청 사용자와의 연관성이 높으면 해당 마이크로 블로그 정보의 종합 평점도 높게 된다.

배열 모듈(30)은 상기 평점에 따라 마이크로 블로그 정보에 대해 배열을 수행하도록 구성된다.

바람직하게, 배열 모듈(30)은 상기 종합 평점의 높고 낮음에 따라 마이크로 블로그 정보에 대해 배열을 수행하며 즉 마이크로 블로그 정보의 평점이 높을수록 보다 더 앞쪽으로 배열된다.

표시 모듈(104)은 배열 결과에 따라 마이크로 블로그 정보를 표시하도록 구성된다.

상기 마이크로 블로그 배열 시스템에 있어서, 마이크로 블로그 정보 내의 마이크로 블로그 발표 사용자 정보와 내용 정보를 추출하여 마이크로 블로그에 대해 평점을 수행하고 평점에 따라 마이크로 블로그 정보에 대해 배열을 수행하여, 사용자와 관련된 마이크로 블로그 정보를 앞쪽으로 위치시킬 수 있으며 이로써 사용자가 용이하게 마이크로 블로그 정보를 열람할 수 있도록 한다.

도11에 도시된 바와 같이, 일 실시예에 의하면 사용자 정보 평점 모듈(201)에는 활성도 산출 유닛(211) 및 제1 평점 유닛(221)이 포함되며,

활성도 산출 유닛(211)은 마이크로 블로그 발표 사용자의 마이크로 블로그 운영 기록을 획득하여 해당 마이크로 블로그 운영 기록에 따라 마이크로 블로그 발표 사용자의 활성도를 산출하도록 구성된다.

일 실시예에 있어서, 활성도 산출 유닛(211)은 마이크로 블로그 발표 사용자의 ID에 따라, 사용자의 마이크로 블로그 운영 기록을 이미 저장한 데이터베이스 내에서 사용자의 ID에 대응되는 마이크로 블로그 운영 기록을 검색한다. 바람직하게, 마이크로 블로그 운영 기록에는 VIP 사용자 여부, 마이크로 블로그 업데이트 빈도, 마이크로 블로그 리포스팅(reposting) 비율, 마이크로 블로그 원작 비율, 마이크로 블로그 추천 평론 횟수, 마이크로 블로그 평균 글자수, 재미(funny) 점수값 등이 포함될 수 있다. 일 실시예에 있어서, 재미 점수값은 마이크로 블로그 발표 사용자의 마이크로 블로그에 대한 기타 사용자의 재미 평점에 따라 얻을 수 있다.

마이크로 블로그 발표 사용자의 마이크로 블로그 운영 기록은 마이크로 블로그 발표 사용자의 활성도를 나타낸다. 구체적으로, 마이크로 블로그 발표 사용자가 VIP 사용자이거나 또는 그의 마이크로 블로그의 업데이트 빈도가 높거나, 리포스팅 비율이 높거나, 원작 비율이 높거나, 추천 평론된 횟수가 많거나, 평균 글자수가 많거나, 재미 점수값이 높으면, 그에 대응되게, 마이크로 블로그 발표 사용자의 활성도를 높게 설정할 수도 있다.

제1 평점 유닛(221)은 활성도에 따라 마이크로 블로그 정보에 대해 평점을 수행하도록 구성된다.

바람직하게, 마이크로 블로그 발표 사용자의 활성도가 높으면, 제1 평점 유닛(221)은 그와 상응하게 해당 마이크로 블로그에 대한 평점을 높일 수 있는바 이는 활성도가 높은 마이크로 블로그 발표 사용자에 의해 발표된 마이크로 블로그가 보다 더 용이하게 사용자의 관심을 받기 때문이다.

도12에 도시된 바와 같이, 일 실시예에 있어서, 사용자 정보 평점 모듈(201)에는 개인 정보 유사성 산출 유닛(231), 연관성 산출 유닛(241) 및 제2 평점 유닛(251)이 포함되며, 여기서

개인 정보 유사성 산출 유닛(231)은 마이크로 블로그 발표 사용자의 개인 정보 및 마이크로 블로그 요청 사용자의 개인 정보를 획득하여 마이크로 블로그 발표 사용자의 개인 정보와 마이크로 블로그 요청 사용자의 개인 정보 사이의 유사성을 산출하도록 구성된다.

일 실시예에 있어서, 개인 정보 유사성 산출 유닛(231)은 사용자의 ID에 따라, 사용자의 개인 정보를 이미 저장한 데이터베이스 내에서 사용자의 ID에 대응되는 개인 정보를 찾아낸다. 구체적으로, 개인 정보에는 취미, 학력, 전공, 지역, 개성있는 서명(personalized signature), 즐겨찾는 마이크로 블로그 정보, 공통된 친구 수, 사용자 타입 정보 등이 포함될 수 있다. 일 실시예에 있어서, 사용자 타입은, 과학기술형, 오락형, 체육형, 예술형, 정치형 등으로 분류될 수 있다. 바람직하게, 사용자 타입 정보에는 사용자 타입 벡터가 포함되며, 사용자 타입 벡터의 성분은 어느 한 사용자 타입에 대한 사용자의 편향 점수값을 표시한다. 예를 들면, 사용자 타입 벡터의 첫 번째 성분은 과학기술형 점수값을 표시하고 두번째 성분은 오락형 점수값을 표시하며 이와 같이 유추하는 것으로 정의할 수 있다. 만약 과학기술형에 대한 사용자의 편향 점수값이 3이고, 오락형에 대한 편향 점수값이 4이면, 사용자 타입 벡터는 (3, 4, …)로 표시할 수 있다. 바람직하게, 사용자 타입 벡터의 성분들 중 점수값이 가장 높은 성분에 대응되는 사용자 타입을 해당 사용자의 사용자 타입으로 선택할 수 있다.

일 실시예에 있어서, 사용자 타입 벡터는 사용자에 의한 수동 설정을 통해 획득할 수도 있고 사용자가 주목하는 마이크로 블로그 사용자 및 사용자의 친구의 사용자 타입에 대한 통계를 통해 획득할 수도 있다. 예를 들면, 사용자가 주목하는 마이크로 블로그 사용자 및 사용자의 친구 들 중, 과학기술형에 속하는 인수가 5이면 사용자 타입 벡터에서 과학기술형에 대응되는 성분을 5로 설정할 수 있다.

일 실시예에 있어서, 사용자의 취미가 같거나 또는 취미가 속하는 카테고리가 같으면, 예를 들어 모두 예술 카테고리이면, 개인 정보 유사성 산출 유닛(231)은 마이크로 블로그 발표 사용자와 마이크로 블로그 요청 사용자의 유사성 값을 높일 수 있다. 일 실시예에 있어서, 개인 정보 유사성 산출 유닛(231)은 취미가 속하는 카테고리를 저장한 데이터베이스 내에서 사용자의 취미가 속하는 카테고리를 검색할 수 있다. 이와 상응하게, 만약 사용자의 학력이 같으면 예를 들어 모두 본과이거나 모두 박사 이상 학력이면, 사용자 사이의 유사성 값을 높일 수도 있다. 마찬가지로, 만약 사용자의 전공이 같거나 전공이 속하는 카테고리가 같거나, 또는 사용자의 지역이 같거나 속하는 지역이 같거나, 또는 사용자의 개성있는 서명에 동일한 키워드가 있거나, 또는 사용자가 즐겨찾는 마이크로 블로그 정보가 같거나, 또는 사용자의 사용자 타입 정보가 유사하거나, 또는 사용자 사이의 공통된 마이크로 블로그 친구의 수량이 기 설정된 임계값을 초과하는 등 경우에, 사용자 사이의 유사성 값을 모두 높일 수 있다. 일 실시예에 있어서, 상기 사용자 타입 벡터의 거리를 산출함으로써 사용자 타입 정보의 유사성을 획득할 수도 있으며, 두 사용자 타입 벡터의 거리가 작을수록 사용자 타입 정보의 유사성이 더 높으며, 그와 상응한 사용자 사이의 유사성도 높게 된다.

연관성 산출 유닛(241)은 마이크로 블로그 발표 사용자와 마이크로 블로그 요청 사용자 사이의 인터랙션 기록을 획득하여, 인터랙션 기록에 따라 마이크로 블로그 발표 사용자와 마이크로 블로그 요청 사용자 사이의 연관성을 산출하도록 구성된다.

일 실시예에 있어서, 인터랙션 기록에는 사용자 사이의 인용, 방문, 평론, 리포스팅 기록 등이 포함된다. 구체적으로, 만약 사용자 사이의 인용, 방문, 평론, 리포스팅 횟수가 높으면, 연관성 산출 유닛(241)은 그와 상응하게 사용자 사이의 연관성도 높게 설정할 수 있다.

제2 평점 유닛(251)은 상기 유사성과 연관성에 따라 마이크로 블로그 정보에 대해 평점을 수행하도록 구성된다.

바람직하게, 만약 마이크로 블로그 발표 사용자와 마이크로 블로그 요청 사용자 사이의 유사성이 높거나 연관성이 높으면, 제2 평점 유닛(251)은 마이크로 블로그 정보에 대한 평점을 높일 수 있다.

본 실시예에 있어서, 만약 마이크로 블로그 발표 사용자와 마이크로 블로그 요청 사용자 사이의 개인 정보 유사성이 높거나 양자 사이의 연관성이 높으면, 마이크로 블로그 정보의 평점도 높게 되고, 평점이 높은 마이크로 블로그 정보는 앞쪽으로 위치시키며, 이러한 마이크로 블로그 정보는, 마이크로 블로그 요청 사용자의 관심을 보다 더 불러일으킬 수 있는 마이크로 블로그 정보이므로, 사용자가 자신이 관심갖는 마이크로 블로그 정보를 용이하게 열람할 수 있도록 한다.

일 실시예에 있어서, 사용자 정보 평점 모듈(201)에는 활성도 산출 유닛(211), 제1 평점 유닛(221), 개인 정보 유사성 산출 유닛(231), 연관성 산출 유닛(241) 및 제2 평점 유닛(251)이 포함된다. 마이크로 블로그 정보에 대한 제2 평점 유닛(251)의 평점은, 마이크로 블로그 정보에 대한 제1 평점 유닛(221)의 평점의 기초상에서 수행할 수 있다. 즉 마이크로 블로그 발표 사용자의 활성도에 따라 획득된 평점 및 마이크로 블로그 발표 사용자와 마이크로 블로그 요청 사용자 사이의 개인 정보 유사성과 연관성에 따라 획득된 평점을 종합하여 마이크로 블로그 정보의 종합 평점으로 하고 종합 평점에서 상기 두 평점이 차지하는 비중을 설정할 수 있다.

도13에 도시된 바와 같이, 일 실시예에 있어서, 내용 정보 평점 모듈(202)에는 카테고리 벡터 추출 유닛(212), 내용 유사성 산출 유닛(222) 및 제3 평점 유닛(232)이 포함되며, 여기서

카테고리 벡터 추출 유닛(212)은 마이크로 블로그 정보 내의 마이크로 블로그 내용을 획득하여 마이크로 블로그 내용 및 마이크로 블로그 주제별 카테고리의 특징에 따라 마이크로 블로그 정보 내의 마이크로 블로그 내용의 주제별 카테고리 벡터를 획득하도록 구성된다.

바람직하게, 마이크로 블로그 내용에는 마이크로 블로그의 본문 내용 즉 마이크로 블로그 발표 사용자에 의해 발표된 내용이 포함되고, 마이크로 블로그 내용에는 또한 마이크로 블로그의 평론 내용이 더 포함될 수 있다. 일 실시예에 있어서, 마이크로 블로그 내용의 글자수가 많지 않으면 카테고리 벡터 추출 유닛(212)은 해당 마이크로 블로그의 발표 사용자가 해당 마이크로 블로그의 발표 시점에 근접한 시간(미리 설정될 수 있음) 내에 발표한 마이크로 블로그 내용을 획득하여 여러 개의 마이크로 블로그 내용을 하나로 조합할 수 있다.

바람직하게, 마이크로 블로그 주제별 카테고리에는, 정치군사, 문화예술, 재정주식, 감정인생, 사회법제, 오락가십, 과학기술네트워크, 건강미식, 체육운동, 자동차부동산, 교육취직, 패션여행 등이 포함된다. 바람직하게, 주제별 카테고리 벡터의 각 성분은 마이크로 블로그 내용이 어느 한 마이크로 블로그 주제별 카테고리에 속하는 편향 점수값을 표시한다. 예를 들어, 주제별 카테고리 벡터의 첫번째 성분은 정치군사 카테고리의 점수값을 표시하고, 두번째 성분은 문화예술 카테고리의 점수값을 표시하며, 이와 같이 유추한다. 주제별 카테고리 벡터(5, 10, …)는 마이크로 블로그 내용이 정치 군사 카테고리 소속으로 편향하는 점수값이 5이고 문화예술 카테고리 소속으로 편향하는 점수값이 10임을 표시한다. 바람직하게, 점수값이 가장 높은 성분에 대응되는 마이크로 블로그 주제별 카테고리를 마이크로 블로그 내용이 속하는 마이크로 블로그 주제별 카테고리로 취할 수 있다.

구체적으로, 마이크로 블로그 주제별 카테고리의 특징을 미리 훈련할 수 있으며, 또한, 카테고리 벡터 추출 유닛(212)은 기존의 나이브 베이즈 문서 분류 알고리즘을 채용하여 마이크로 블로그 내용에 대해 분류하여 마이크로 블로그 내용의 주제별 카테고리 벡터를 획득할 수 있으며, 더 이상 설명하지 않는다.

카테고리 벡터 추출 유닛(212)은 또한 마이크로 블로그 요청 사용자의 역사 마이크로 블로그 내용을 획득하여 역사 마이크로 블로그 내용 및 마이크로 블로그 주제별 카테고리의 특징에 따라 마이크로 블로그 요청 사용자의 역사 마이크로 블로그 내용의 주제별 카테고리 벡터를 획득하도록 구성된다.

구체적으로, 카테고리 벡터 추출 유닛(212)은 최근 시간 동안(미리 설정할 수 있음) 내의 마이크로 블로그 요청 사용자가 발표한 마이크로 블로그 내용을 획득할 수 있다. 바람직하게, 여러 개의 역사 마이크로 블로그 내용의 주제별 카테고리 벡터를 획득한 후, 카테고리 벡터 추출 유닛(712)은 해당 여러 개 벡터의 평균값을 산출하여 마이크로 블로그 요청 사용자의 역사 마이크로 블로그 내용의 주제별 카테고리 벡터로 할 수 있다.

내용 유사성 산출 유닛(222)은 마이크로 블로그 정보 내의 마이크로 블로그 내용의 주제별 카테고리 벡터와 마이크로 블로그 요청 사용자의 역사 마이크로 블로그 내용의 주제별 카테고리 벡터에 따라, 마이크로 블로그 정보 내의 마이크로 블로그 내용과 마이크로 블로그 요청 사용자의 역사 마이크로 블로그 내용 사이의 유사성을 산출하도록 구성된다.

구체적으로, 내용 유사성 산출 유닛(222)은 상기 두개 주제별 카테고리 벡터 사이의 거리를 산출함으로써 마이크로 블로그 정보 내의 마이크로 블로그 내용과 마이크로 블로그 요청 사용자의 역사 마이크로 블로그 내용 사이의 유사성을 산출할 수 있다. 바람직하게, 거리가 작을수록 유사성을 더 높게 설정한다.

제3 평점 유닛(232)은 유사성에 따라 마이크로 블로그 정보에 대해 평점을 수행하도록 구성된다.

바람직하게, 유사성이 높을수록 제3 평점 유닛(232)은 마이크로 블로그 정보에 대한 평점이 더 높다.

본 실시예에 있어서, 만약 마이크로 블로그 정보 내의 마이크로 블로그 내용과 마이크로 블로그 요청 사용자의 역사 마이크로 블로그 내용의 유사성이 높으면 마이크로 블로그 정보에 대한 평점도 높고 평점이 높은 마이크로 블로그 정보를 앞쪽으로 위치시키며, 이러한 앞쪽으로 위치되는 마이크로 블로그 내용은 사용자의 관심을 보다 쉽게 끌 수 있어 사용자가 용이하게 자신이 관심갖는 마이크로 블로그를 열람할 수 있도록 한다.

본 실시예에서, 마이크로 블로그 주제별 카테고리의 특징을 미리 훈련해야 하며 상기 마이크로 블로그 배열 시스템에는 분류 모델 훈련 모듈(50)이 더 포함되며, 분류 모델 훈련 모듈(50)은 각 마이크로 블로그 주제별 카테고리의 샘플을 훈련하여 각 마이크로 블로그 주제별 카테고리의 특징을 추출하도록 구성되며, 도14에 도시된 바와 같이 분류 모델 훈련 모듈(50)에는 주제별 카테고리 획득 모듈(501), 훈련 집합 획득 모듈(502) 및 특징 추출 모듈(503)이 포함된다.

주제별 카테고리 획득 모듈(501)은 미리 설정된 마이크로 블로그 주제별 카테고리를 획득하도록 구성된다.

훈련 집합 획득 모듈(502)은 마이크로 블로그 주제별 카테고리의 훈련 서브 집합을 획득하도록 구성된다.

바람직하게, 훈련 서브 집합으로부터 주제별 카테고리의 보다 나은 특징을 추출하기 위해 일정한 범위 내에서 될수록 많은 마이크로 블로그 훈련 샘플을 획득할 수 있다. 일 실시예에 있어서, 훈련 집합 획득 모듈(502)은 마이크로 블로그 주제별 카테고리의 키워드에 따라 마이크로 블로그를 검색하여 마이크로 블로그 주제별 카테고리의 초기 훈련 서브 집합을 획득하고, 미리 설정된 횟수에 따라 반복적으로 초기 훈련 서브 집합 내의 고빈도 어휘를 통계하는 단계 및 고빈도 어휘에 따라 마이크로 블로그를 검색하여 검색 결과를 초기 훈련 서브 집합에 추가하는 단계를 수행할 수 있다.

구체적으로, 훈련 집합 획득 모듈(502)은 마이크로 블로그 주제별 카테고리 명칭 및 그 분할 어휘를 마이크로 블로그 주제별 카테고리의 키워드로 할 수 있는바, 예를 들어 정치군사 카테고리의 경우, 정치, 군사 및 정치군사를 이 카테고리의 키워드로 하며, 이러한 키워드에 따라 검색을 수행하여 해당 카테고리의 초기 훈련 서브 집합을 획득할 수 있다. 또한, 초기 훈련 서브 집합에 대해 사전 처리를 수행한 후 어휘 분할, 사용 금지 어휘의 필터링 등 처리를 수행하여, 초기 서브 집합 내의 고빈도 어휘를 통계한다. 또한, 고빈도 어휘 및 고빈도 어휘의 조합을 키워드로 하여 계속하여 검색을 수행하여 보다 많은 마이크로 블로그 훈련 샘플을 획득할 수 있다. 초기 훈련 서브 집합 내의 고빈도 어휘를 통계하고 고빈도 어휘를 키워드로 하여 마이크로 블로그를 검색하여 검색 결과를 초기 훈련 서브 집합에 추가하는 단계를 미리 설정된 횟수에 따라 반복한다.

특징 추출 모듈(503)은 훈련 서브 집합으로부터 마이크로 블로그 주제별 카테고리의 특징을 획득하도록 구성된다.

구체적으로, 특징 추출 모듈(503)은 기존의 분류 훈련 방법을 이용하여 각 주제별 카테고리의 훈련 서브 집합 내의 마이크로 블로그 내용에 대해 훈련하여 각 주제별 카테고리의 특징을 추출할 수 있다. 여기서 더 이상 설명하지 않는다.

일 실시예에 있어서, 상기 마이크로 블로그 배열 시스템에는 표시 카테고리 분류 모듈(미도시)이 더 포함되는바, 미리 설정된 마이크로 블로그 표시 카테고리에 따라 마이크로 블로그 정보 내의 마이크로 블로그 내용에 대해 분류하여 마이크로 블로그 내용이 속하는 표시 카테고리를 얻도록 구성된다.

구체적으로, 표시 카테고리에는 상기에서 언급된 마이크로 블로그 주제별 카테고리, 예를 들어 정치군사 카테고리, 문화예술 카테고리, 재정주식 카테고리 등이 포함될 수 있다. 마이크로 블로그 내용이 속하는 마이크로 블로그 주제별 카테고리는 카테고리 벡터 추출 유닛(212)에서 획득된 마이크로 블로그 정보 내의 마이크로 블로그 내용의 주제별 카테고리 벡터에 따라 얻을 수 있고, 주제별 카테고리 벡터 내의 점수값이 가장 높은 성분에 대응되는 주제별 카테고리를 마이크로 블로그 내용이 속하는 마이크로 블로그 카테고리로 취할 수 있다.

일 실시예에 있어서, 마이크로 블로그 주제별 카테고리외에도, 기타 표시 카테고리, 예를 들어 친구 카테고리, 지점 카테고리, 재미 카테고리, 도움요청 리포스팅 카테고리, 광고활동 카테고리 등이 추가될 수 있다. 마이크로 블로그 정보가 친구 카테고리에 속하는지는 마이크로 블로그 발표 사용자와 마이크로 블로그 요청 사용자가 친구인지에 따라 판단할 수 있다. 일 실시예에 있어서, 표시 카테고리 분류 모듈은 마이크로 블로그 발표 사용자의 ID 및 마이크로 블로그 요청 사용자의 ID에 따라 친구 대응 관계를 이미 저장한 데이터베이스 내에서 마이크로 블로그 발표 사용자와 마이크로 블로그 요청 사용자 사이가 친구인지 를 찾을 수 있다. 마이크로 블로그 정보가 지점 카테고리에 속하는지는, 마이크로 블로그 발표 사용자와 마이크로 블로그 요청 사용자의 주소가 동일한 지역(현, 구 등으로 설정할 수 있음)에 속하는지에 따라 판단할 수 있다. 마이크로 블로그가 재미 카테고리에 속하는지는 마이크로 블로그 발표 사용자의 ID에 따라 사용자의 재미 점수값을 이미 저장한 데이터베이스 내에서 찾은 재미 점수값이 미리 설정된 임계값보다 큰지에 따라 판단할 수 있다. 일 실시예에 있어서, 사용자의 재미 점수값은 해당 사용자에 대한 기타 사용자의 재미 평점에 따라 획득할 수 있다. 마이크로 블로그 정보가 도움요청 리포스팅 카테고리, 광고활동 카테고리에 속하는지는 마이크로 블로그 내용 내에 도움요청, 광고 고빈도 어휘 등의 출현 여부에 따라 판단할 수 있다.

일 실시예에 있어서, 마이크로 블로그 표시 타입에는 인기화제 카테고리가 더 포함될 수 있다. 구체적으로, 표시 카테고리 분류 모듈은 웹 페이지 내용을 분석하여 고빈도 기록을 획득하며, 마이크로 블로그 요청 사용자의 역사 마이크로 블로그 내용에 따라, 상기 고빈도 기록에 대해 평점을 수행하며, 고빈도 기록 평점에 따라 검색 결과 내의 마이크로 블로그를 선택하여 인기화제 카테고리로 분류시킨다.

바람직하게, 표시 카테고리 분류 모듈은 기존의 오픈소스 툴 Html-parser에 따라 웹 페이지 내용에 대한 분석을 통해 출현 횟수가 미리 설정된 임계값을 초과하는 어휘 그룹, 즉 고빈도 기록을 얻을 수 있다. 또한, 고빈도 기록과 마이크로 블로그 요청 사용자의 역사 마이크로 블로그 내용의 유사성에 따라 고빈도 기록에 대한 평점을 수행할 수 있다. 구체적으로, 고빈도 기록이 마이크로 블로그 요청 사용자에 의해 발표, 리포스팅, 평론된 마이크로 블로그 내용에서 출현된 횟수를 통계하여 해당 횟수에 따라 고빈도 기록에 대해 평점을 수행할 수 있다. 마지막으로, 평점이 미리 설정된 앞쪽 자리인 고빈도 기록을 선택하고 마이크로 블로그 내용 중 해당 고빈도 기록이 나타난 마이크로 블로그 정보를 선택하여 해당 마이크로 블로그 정보를 인기 화제 카테고리로 분류시킬 수 있다.

본 실시예에서, 표시 모듈(40)은, 마이크로 블로그 내용이 속하는 표시 카테고리 및 상기 배열의 결과에 따라 마이크로 블로그 정보를 표시하도록 구성된다.

구체적으로, 표시 모듈(40)은 마이크로 블로그 정보를 각 표시 카테고리에 따라 분류하여 표시하고 각 표시 카테고리에서 평점이 높은 마이크로 블로그 정보를 앞쪽으로 배열시킬 수 있다.

본 실시예에 있어서, 마이크로 블로그 정보를 여러 개의 표시 카테고리로 분할하여 표시함으로써 사용자가 자신이 관심 있는 마이크로 블로그 카테고리를 용이하게 선택하여 열람할 수 있도록 하여 사용자의 조작을 간편화한다. 또한, 각 표시 카테고리는 모두 마이크로 블로그의 평점의 내림차순으로 표시되며 배열 순서가 앞쪽인 마이크로 블로그는 그 마이크로 블로그 발표 사용자의 활성도가 비교적 높거나 마이크로 블로그 발표 사용자의 개인 정보와 마이크로 블로그 요청 사용자의 개인 정보 유사성이 비교적 높거나 마이크로 블로그 발표 사용자와 마이크로 블로그 요청 사용자의 연관성이 비교적 높아 사용자가 용이하게 자신과 관련된, 관심있는 마이크로 블로그를 열람할 수 있도록 한다.

마이크로 블로그 검색 방법에 있어서, 상기 마이크로 블로그 배열 방법에 따라 마이크로 블로그 검색 결과에 대해 배열을 수행하며, 상기 사용자에 의해 요청되는 마이크로 블로그 정보를 획득하는 단계에는, 사용자에 의해 입력되는 키워드에 따라 검색을 수행하여 사용자에 의해 요청되는 마이크로 블로그 정보를 획득하는 단계가 포함된다.

구체적으로, 기존의 검색 엔진을 이용하여, 사용자에 의해 입력된 키워드에 대해 검색을 수행하여, 키워드와 매칭되는 마이크로 블로그 정보를 찾아내어 사용자에 의해 요청된 마이크로 블로그 정보를 얻을 수 있도록 한다.

마이크로 블로그 검색 시스템에 있어서, 상기 마이크로 블로그 배열 시스템이 포함되며, 마이크로 블로그 정보 획득 모듈(10)은, 사용자에 의해 입력되는 키워드에 따라 검색을 수행하여 사용자에 의해 요청되는 마이크로 블로그 정보를 획득하도록 구성된다.

구체적으로, 마이크로 블로그 정보 획득 모듈(10)은 기존의 검색 엔진을 이용하여, 사용자에 의해 입력된 키워드에 대해 검색을 수행하여, 키워드와 매칭되는 마이크로 블로그 정보를 찾아내어 사용자에 의해 요청된 마이크로 블로그 정보를 얻을 수 있도록 한다.

마이크로 블로그 표시 방법에 있어서, 상기 마이크로 블로그 배열 방법에 따라 마이크로 블로그 요청 결과에 대해 배열을 수행하며, 사용자에 의해 요청되는 마이크로 블로그 정보를 획득하는 단계에는, 사용자 식별자에 대응되는 마이크로 블로그 요청 정보에 따라, 사용자에 의해 요청되는 마이크로 블로그 정보를 획득하는 단계가 포함된다.

일 실시예에 있어서, 사용자 식별자에 대응되는 마이크로 블로그 요청 정보를 미리 설정함에 있어서, 사용자 식별자에 대응되는 그룹의 마이크로 블로그 정보를 획득할 수 있다. 예를 들어, 사용자가 마이크로 블로그 계정에 로그인할 경우, 사용자 식별자(예를 들어 사용자 ID)에 따라 사용자가 주목하거나 구독하는 그룹 및 사용자 친구를 검색하여 해당 그룹 및 사용자 친구의 최근의 마이크로 블로그 정보를 획득하여 사용자에 의해 요청되는 마이크로 블로그 정보를 얻을 수 있다.

마이크로 블로그 표시 시스템에 있어서, 상기 마이크로 블로그 배열 시스템이 포함되며, 마이크로 블로그 정보 획득 모듈(10)은 사용자 식별자에 대응되는 마이크로 블로그 요청 정보에 따라 상기 사용자에 의해 요청되는 마이크로 블로그 정보를 획득하도록 구성된다.

일 실시예에 있어서, 사용자 식별자에 대응되는 마이크로 블로그 요청 정보를 미리 설정함에 있어서, 사용자 식별자에 대응되는 그룹의 마이크로 블로그 정보를 획득할 수 있다. 예를 들어, 사용자가 마이크로 블로그 계정에 로그인할 경우, 마이크로 블로그 정보 획득 모듈(10)은 사용자 식별자(예를 들어 사용자 ID)에 따라 사용자가 주목하거나 구독하는 그룹 및 사용자 친구를 검색하여 해당 그룹 및 사용자 친구의 최근의 마이크로 블로그 정보를 획득하여 사용자에 의해 요청되는 마이크로 블로그 정보를 얻을 수 있다.

본 분야의 통상의 지식을 가진 자라면, 컴퓨터 프로그램으로 관련 하드웨어를 제어함으로써 상기 실시예 방법 내의 전부 또는 부분 프로세스를 구현할 수 있으며 상기 프로그램은 컴퓨터 판독 가능한 저장 매체 내에 저장되어 해당 프로그램의 실행 시 상기 각 방법의 실시예와 같은 프로세스를 포함할 수 있다는 점을 이해할 것이다. 여기서, 상기 저장 매체는 디스켓, 광 디스크, 읽기 전용 메모리(Read-Only Memory, ROM) 또는 랜덤 액세스 메모리(Random Access Memory, RAM) 등 일 수 있다.

상기 실시예는 본 발명의 몇 가지 실시방식을 보여줄 뿐이며 그 설명이 비교적 구체적이고 상세하지만 이로써 본 발명의 특허청구범위에 대한 제한으로 이해하여서는 안된다. 설명해야 할 점이라면, 본 분야의 통상의 지식을 가진 자라면 본 발명의 구상을 벗어나지 않는 전제하에 여러 가지 변형과 개진을 더 할 수 있으며 이들 모두가 본 발명의 보호범위에 속한다. 따라서, 본 발명에 따른 특허의 보호범위는 응당 첨부된 특허청구범위를 기준으로 해야 한다.

Claims

사용자에 의해 요청되는 마이크로 블로그 정보를 획득하는 단계;
상기 마이크로 블로그 정보 내의 마이크로 블로그 발표 사용자 정보와 내용 정보를 추출하여 상기 마이크로 블로그 정보에 대해 평점을 수행하는 단계;
상기 평점에 따라 상기 마이크로 블로그 정보에 대해 배열을 수행하는 단계; 및
상기 배열의 결과에 따라 상기 마이크로 블로그 정보를 표시하는 단계가 포함되는
것을 특징으로 하는 마이크로 블로그 배열 방법.
청구항 1에 있어서,
상기 마이크로 블로그 정보 내의 마이크로 블로그 발표 사용자 정보를 추출하여 상기 마이크로 블로그 정보에 대해 평점을 수행하는 단계에는,
상기 마이크로 블로그 발표 사용자의 마이크로 블로그 운영 기록을 획득하여 상기 마이크로 블로그 운영 기록에 따라 상기 마이크로 블로그 발표 사용자의 활성도를 산출하는 단계; 및
상기 활성도에 따라 상기 마이크로 블로그 정보에 대해 평점을 수행하는 단계가 포함되는
것을 특징으로 하는 마이크로 블로그 배열 방법.
청구항 1 또는 청구항 2에 있어서,
상기 마이크로 블로그 정보 내의 마이크로 블로그 발표 사용자 정보를 추출하여 상기 마이크로 블로그 정보에 대해 평점을 수행하는 단계에는,
상기 마이크로 블로그 발표 사용자의 개인 정보 및 마이크로 블로그 요청 사용자의 개인 정보를 획득하여 상기 마이크로 블로그 발표 사용자의 개인 정보와 상기 마이크로 블로그 요청 사용자의 개인 정보 사이의 유사성을 산출하는 단계;
상기 마이크로 블로그 발표 사용자와 상기 마이크로 블로그 요청 사용자 사이의 인터랙션 기록을 획득하여, 상기 인터랙션 기록에 따라 상기 마이크로 블로그 발표 사용자와 상기 마이크로 블로그 요청 사용자 사이의 연관성을 산출하는 단계; 및
상기 유사성과 상기 연관성에 따라 상기 마이크로 블로그 정보에 대해 평점을 수행하는 단계가 포함되는
것을 특징으로 하는 마이크로 블로그 배열 방법.
청구항 1에 있어서,
상기 마이크로 블로그 정보 내의 내용 정보를 추출하여 상기 마이크로 블로그 정보에 대해 평점을 수행하는 단계에는,
상기 마이크로 블로그 정보 내의 마이크로 블로그 내용을 획득하여 상기 마이크로 블로그 내용 및 마이크로 블로그 주제별 카테고리의 특징에 따라 상기 마이크로 블로그 정보 내의 마이크로 블로그 내용의 주제별 카테고리 벡터를 획득하는 단계;
마이크로 블로그 요청 사용자의 역사 마이크로 블로그 내용을 획득하여 상기 역사 마이크로 블로그 내용 및 마이크로 블로그 주제별 카테고리의 특징에 따라 상기 마이크로 블로그 요청 사용자의 역사 마이크로 블로그 내용의 주제별 카테고리 벡터를 획득하는 단계;
상기 마이크로 블로그 정보 내의 마이크로 블로그 내용의 주제별 카테고리 벡터와 상기 마이크로 블로그 요청 사용자의 역사 마이크로 블로그 내용의 주제별 카테고리 벡터에 따라, 상기 마이크로 블로그 정보 내의 마이크로 블로그 내용과 상기 마이크로 블로그 요청 사용자의 역사 마이크로 블로그 내용 사이의 유사성을 산출하는 단계; 및
상기 유사성에 따라 상기 마이크로 블로그 정보에 대해 평점을 수행하는 단계가 포함되는
것을 특징으로 하는 마이크로 블로그 배열 방법.
청구항 4에 있어서,
상기 마이크로 블로그 정보 내의 내용 정보를 추출하여 상기 마이크로 블로그 정보에 대해 평점을 수행하는 단계 전에,
미리 설정된 마이크로 블로그 주제별 카테고리를 획득하는 단계;
상기 마이크로 블로그 주제별 카테고리의 훈련 서브 집합을 획득하는 단계; 및
상기 훈련 서브 집합으로부터 상기 마이크로 블로그 주제별 카테고리의 특징을 추출하는 단계가 더 포함되는
것을 특징으로 하는 마이크로 블로그 배열 방법.
청구항 5에 있어서,
상기 마이크로 블로그 주제별 카테고리의 훈련 서브 집합을 획득하는 단계에는,
상기 마이크로 블로그 주제별 카테고리의 키워드에 따라 마이크로 블로그를 검색하여 상기 마이크로 블로그 주제별 카테고리의 초기 훈련 서브 집합을 획득하는 단계; 및
미리 설정된 횟수에 따라, 상기 초기 훈련 서브 집합 내의 고빈도 어휘를 통계하는 단계와 상기 고빈도 어휘에 따라 마이크로 블로그를 검색하여 검색 결과를 상기 초기 훈련 서브 집합에 추가하는 단계를 반복적으로 수행하는 단계가 포함되는
것을 특징으로 하는 마이크로 블로그 배열 방법.
청구항 1에 있어서,
상기 배열의 결과에 따라 상기 마이크로 블로그 정보를 표시하는 단계 전에,
미리 설정된 마이크로 블로그 표시 카테고리에 따라 상기 마이크로 블로그 정보 내의 마이크로 블로그 내용에 대해 분류하여 마이크로 블로그 내용이 속하는 표시 카테고리를 얻는 단계가 더 포함되며,
상기 배열의 결과에 따라 상기 마이크로 블로그 정보를 표시하는 단계에서, 상기 마이크로 블로그 내용이 속하는 표시 카테고리 및 상기 배열의 결과에 따라 상기 마이크로 블로그 정보를 표시하는
것을 특징으로 하는 마이크로 블로그 배열 방법.
사용자에 의해 요청되는 마이크로 블로그 정보를 획득하도록 구성되는 마이크로 블로그 정보 획득 모듈;
상기 마이크로 블로그 정보 내의 마이크로 블로그 발표 사용자 정보를 추출하여 상기 마이크로 블로그 발표 사용자 정보에 따라 상기 마이크로 블로그 정보에 대해 평점을 수행하도록 구성되는 사용자 정보 평점 모듈과, 상기 마이크로 블로그 정보 내의 내용 정보를 추출하여 상기 내용 정보에 따라 상기 마이크로 블로그 정보에 대해 평점을 수행하도록 구성되는 내용 정보 평점 모듈을 포함하는 평점 모듈;
상기 평점에 따라 상기 마이크로 블로그 정보에 대해 배열을 수행하도록 구성되는 배열 모듈; 및
상기 배열의 결과에 따라 상기 마이크로 블로그 정보를 표시하도록 구성되는 표시 모듈이 포함되는
것을 특징으로 하는 마이크로 블로그 배열 시스템.
청구항 8에 있어서,
상기 사용자 정보 평점 모듈에는,
상기 마이크로 블로그 발표 사용자의 마이크로 블로그 운영 기록을 획득하여 상기 마이크로 블로그 운영 기록에 따라 상기 마이크로 블로그 발표 사용자의 활성도를 산출하도록 구성되는 활성도 산출 유닛; 및
상기 활성도에 따라 상기 마이크로 블로그 정보에 대해 평점을 수행하도록 구성되는 제1 평점 유닛이 포함되는
것을 특징으로 하는 마이크로 블로그 배열 시스템.
청구항 8 또는 청구항 9에 있어서,
상기 사용자 정보 평점 모듈에는,
상기 마이크로 블로그 발표 사용자의 개인 정보 및 마이크로 블로그 요청 사용자의 개인 정보를 획득하여 상기 마이크로 블로그 발표 사용자의 개인 정보와 상기 마이크로 블로그 요청 사용자의 개인 정보 사이의 유사성을 산출하도록 구성되는 개인 정보 유사성 산출 유닛;
상기 마이크로 블로그 발표 사용자와 상기 마이크로 블로그 요청 사용자 사이의 인터랙션 기록을 획득하여, 상기 인터랙션 기록에 따라 상기 마이크로 블로그 발표 사용자와 상기 마이크로 블로그 요청 사용자 사이의 연관성을 산출하도록 구성되는 연관성 산출 유닛; 및
상기 유사성과 상기 연관성에 따라 상기 마이크로 블로그 정보에 대해 평점을 수행하도록 구성되는 제2 평점 유닛이 포함되는
것을 특징으로 하는 마이크로 블로그 배열 시스템.
청구항 8에 있어서,
상기 내용 정보 평점 모듈에는,
상기 마이크로 블로그 정보 내의 마이크로 블로그 내용을 획득하여 상기 마이크로 블로그 내용 및 마이크로 블로그 주제별 카테고리의 특징에 따라 상기 마이크로 블로그 정보 내의 마이크로 블로그 내용의 주제별 카테고리 벡터를 획득하도록 구성되며, 또한 마이크로 블로그 요청 사용자의 역사 마이크로 블로그 내용을 획득하여 상기 역사 마이크로 블로그 내용 및 마이크로 블로그 주제별 카테고리의 특징에 따라 상기 마이크로 블로그 요청 사용자의 역사 마이크로 블로그 내용의 주제별 카테고리 벡터를 획득하도록 구성되는 카테고리 벡터 추출 유닛;
상기 마이크로 블로그 정보 내의 마이크로 블로그 내용의 주제별 카테고리 벡터와 상기 마이크로 블로그 요청 사용자의 역사 마이크로 블로그 내용의 주제별 카테고리 벡터에 따라, 상기 마이크로 블로그 정보 내의 마이크로 블로그 내용과 상기 마이크로 블로그 요청 사용자의 역사 마이크로 블로그 내용 사이의 유사성을 산출하도록 구성되는 내용 유사성 산출 유닛; 및
상기 유사성에 따라 상기 마이크로 블로그 정보에 대해 평점을 수행하도록 구성되는 제3 평점 유닛이 포함되는
것을 특징으로 하는 마이크로 블로그 배열 시스템.
청구항 11에 있어서,
분류 모델 훈련 모듈이 더 포함되며,
상기 분류 모델 훈련 모듈에는,
미리 설정된 마이크로 블로그 주제별 카테고리를 획득하도록 구성되는 주제별 카테고리 획득 모듈;
상기 마이크로 블로그 주제별 카테고리의 훈련 서브 집합을 획득하도록 구성되는 훈련 집합 획득 모듈; 및
상기 훈련 서브 집합으로부터 상기 마이크로 블로그 주제별 카테고리의 특징을 추출하도록 구성되는 특징 추출 모듈이 포함되는
것을 특징으로 하는 마이크로 블로그 배열 시스템.
청구항 12에 있어서,
상기 훈련 집합 획득 모듈은,
상기 마이크로 블로그 주제별 카테고리의 키워드에 따라 마이크로 블로그를 검색하여 상기 마이크로 블로그 주제별 카테고리의 초기 훈련 서브 집합을 획득하고, 미리 설정된 횟수에 따라, 상기 초기 훈련 서브 집합 내의 고빈도 어휘를 통계하는 단계와 상기 고빈도 어휘에 따라 마이크로 블로그를 검색하여 검색 결과를 상기 초기 훈련 서브 집합에 추가하는 단계를 반복적으로 수행하도록 구성되는
것을 특징으로 하는 마이크로 블로그 배열 시스템.
청구항 8에 있어서,
미리 설정된 마이크로 블로그 표시 카테고리에 따라 상기 마이크로 블로그 정보 내의 마이크로 블로그 내용에 대해 분류하여 상기 마이크로 블로그 내용이 속하는 표시 카테고리를 얻도록 구성되는 표시 카테고리 분류 모듈이 더 포함되며,
상기 표시 모듈은 또한 상기 마이크로 블로그 내용이 속하는 표시 카테고리 및 상기 배열의 결과에 따라 상기 마이크로 블로그 정보를 표시하도록 구성되는
것을 특징으로 하는 마이크로 블로그 배열 시스템.
청구항 1 내지 청구항 7 중의 어느 한 항에 따른 마이크로 블로그 배열 방법에 따라 마이크로 블로그 검색 결과에 대해 배열을 수행하며, 상기 사용자에 의해 요청되는 마이크로 블로그 정보를 획득하는 단계에는, 사용자에 의해 입력되는 키워드에 따라 검색을 수행하여 상기 사용자에 의해 요청되는 마이크로 블로그 정보를 획득하는 단계가 포함되는
것을 특징으로 하는 마이크로 블로그 검색 방법.
청구항 8 내지 청구항 14 중의 어느 한 항에 따른 마이크로 블로그 배열 시스템이 포함되며, 상기 마이크로 블로그 정보 획득 모듈은, 사용자에 의해 입력되는 키워드에 따라 검색을 수행하여 상기 사용자에 의해 요청되는 마이크로 블로그 정보를 획득하도록 구성되는
것을 특징으로 하는 마이크로 블로그 검색 시스템.
청구항 1 내지 청구항 7 중의 어느 한 항에 따른 마이크로 블로그 배열 방법에 따라 마이크로 블로그 요청 결과에 대해 배열을 수행하며, 상기 사용자에 의해 요청되는 마이크로 블로그 정보를 획득하는 단계에는, 사용자 식별자에 대응되는 마이크로 블로그 요청 정보에 따라, 상기 사용자에 의해 요청되는 마이크로 블로그 정보를 획득하는 단계가 포함되는
것을 특징으로 하는 마이크로 블로그 표시 방법.
청구항 8 내지 청구항 14 중의 어느 한 항에 따른 마이크로 블로그 배열 시스템이 포함되며, 상기 마이크로 블로그 정보 획득 모듈은 사용자 식별자에 대응되는 마이크로 블로그 요청 정보에 따라 상기 사용자에 의해 요청되는 마이크로 블로그 정보를 획득하도록 구성되는
것을 특징으로 하는 마이크로 블로그 표시 시스템.