KR20140012750A - 마이크로 블로그 배열, 검색 및 표시 방법과 시스템 - Google Patents

마이크로 블로그 배열, 검색 및 표시 방법과 시스템 Download PDF

Info

Publication number
KR20140012750A
KR20140012750A KR1020137031978A KR20137031978A KR20140012750A KR 20140012750 A KR20140012750 A KR 20140012750A KR 1020137031978 A KR1020137031978 A KR 1020137031978A KR 20137031978 A KR20137031978 A KR 20137031978A KR 20140012750 A KR20140012750 A KR 20140012750A
Authority
KR
South Korea
Prior art keywords
microblog
information
user
category
rating
Prior art date
Application number
KR1020137031978A
Other languages
English (en)
Inventor
야오 마
Original Assignee
텐센트 테크놀로지(센젠) 컴퍼니 리미티드
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 텐센트 테크놀로지(센젠) 컴퍼니 리미티드 filed Critical 텐센트 테크놀로지(센젠) 컴퍼니 리미티드
Publication of KR20140012750A publication Critical patent/KR20140012750A/ko

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2457Query processing with adaptation to user needs
    • G06F16/24578Query processing with adaptation to user needs using ranking
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Systems or methods specially adapted for specific business sectors, e.g. utilities or tourism
    • G06Q50/01Social networking
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F13/00Interconnection of, or transfer of information or other signals between, memories, input/output devices or central processing units
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9535Search customisation based on user profiles and personalisation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/14Digital output to display device ; Cooperation and interconnection of the display device with other functional units

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Databases & Information Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Data Mining & Analysis (AREA)
  • General Health & Medical Sciences (AREA)
  • Economics (AREA)
  • Tourism & Hospitality (AREA)
  • Primary Health Care (AREA)
  • General Business, Economics & Management (AREA)
  • Marketing (AREA)
  • Human Resources & Organizations (AREA)
  • Strategic Management (AREA)
  • Health & Medical Sciences (AREA)
  • Computing Systems (AREA)
  • Computational Linguistics (AREA)
  • Human Computer Interaction (AREA)
  • Information Transfer Between Computers (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

마이크로 블로그 검색 방법이 개시되는바, 해당 방법에는 사용자에 의해 요청되는 마이크로 블로그 정보를 획득하는 단계; 상기 마이크로 블로그 정보 내의 마이크로 블로그 발표 사용자 정보와 내용 정보를 추출하여 상기 마이크로 블로그 정보에 대해 평점을 수행하는 단계; 상기 평점에 따라 상기 마이크로 블로그 정보에 대해 배열을 수행하는 단계; 및 상기 배열의 결과에 따라 상기 마이크로 블로그 정보를 표시하는 단계가 포함된다. 상기 마이크로 블로그 배열 방법에 의하면, 마이크로 블로그 정보 내의 마이크로 블로그 발표 사용자 정보와 내용 정보를 추출하여 마이크로 블로그에 대해 평점을 수행하고 평점에 따라 마이크로 블로그 정보에 대해 배열을 수행하며 사용자와 관련된 마이크로 블로그 정보를 앞쪽에 배열시킴으로써 사용자가 용이하게 마이크로 블로그 정보를 열람할 수 있도록 한다. 또한, 마이크로 블로그 배열 시스템 및 마이크로 블로그 검색, 표시 방법과 시스템이 더 개시된다.

Description

마이크로 블로그 배열, 검색 및 표시 방법과 시스템{METHOD AND SYSTEM FOR SEQUENCING, SEEKING, AND DISPLAYING MICRO-BLOG}
본 발명은 네트워크 기술에 관한 것으로서, 특히 마이크로 블로그 배열, 검색 및 표시 방법과 시스템에 관한 것이다.
네트워크 기술의 발전과 더불어, 마이크로 블로그는 사용자들 상호간 소통과 교류 및 사용자의 자아 표현을 위한 중요한 플랫폼으로 되었다. 사용자는 마이크로 블로그에 대한 검색을 통해 자신이 관심을 갖는 정보를 획득한다.
기존의 마이크로 블로그의 배열 방법에 의하면, 통상적으로 시간 선후 순서에 따라 마이크로 블로그가 배열되는바, 보다 새로운 마이크로 블로그가 보다 앞쪽으로 배열된다.
기존의 마이크로 블로그의 배열 방법에 의하면, 모든 사용자들의 마이크로 블로그가 함께 혼합되어 단지 시간 선후 순서에만 따라 배열되므로 많고 번잡한 마이크로 블로그들로부터 사용자가 자신이 관심을 갖고 자신과 관련된 마이크로 블로그를 찾는데 너무 많은 정력과 시간이 필요하게 된다.
이를 감안한 본 발명은 사용자의 열람을 용이하게 할 수 있는 마이크로 블로그 배열 방법 및 시스템을 제공하고자 한다.
또한, 본 발명은 사용자의 열람을 용이하게 할 수 있는 마이크로 블로그 검색 방법 및 시스템을 제공하고자 한다.
또한, 본 발명은 사용자의 열람을 용이하게 할 수 있는 마이크로 블로그 표시 방법 및 시스템을 제공하고자 한다.
본 발명에 따른 마이크로 블로그 배열 방법에는,
사용자에 의해 요청되는 마이크로 블로그 정보를 획득하는 단계;
상기 마이크로 블로그 정보 내의 마이크로 블로그 발표 사용자 정보와 내용 정보를 추출하여 상기 마이크로 블로그 정보에 대해 평점을 수행하는 단계;
상기 평점에 따라 상기 마이크로 블로그 정보에 대해 배열을 수행하는 단계; 및
상기 배열의 결과에 따라 상기 마이크로 블로그 정보를 표시하는 단계가 포함된다.
본 발명에 따른 마이크로 블로그 배열 시스템에는,
사용자에 의해 요청되는 마이크로 블로그 정보를 획득하도록 구성되는 마이크로 블로그 정보 획득 모듈;
상기 마이크로 블로그 정보 내의 마이크로 블로그 발표 사용자 정보를 추출하여 상기 마이크로 블로그 발표 사용자 정보에 따라 상기 마이크로 블로그 정보에 대해 평점을 수행하도록 구성되는 사용자 정보 평점 모듈과, 상기 마이크로 블로그 정보 내의 내용 정보를 추출하여 상기 내용 정보에 따라 상기 마이크로 블로그 정보에 대해 평점을 수행하도록 구성되는 내용 정보 평점 모듈을 포함하는 평점 모듈;
상기 평점에 따라 상기 마이크로 블로그 정보에 대해 배열을 수행하도록 구성되는 배열 모듈; 및
상기 배열의 결과에 따라 상기 마이크로 블로그 정보를 표시하도록 구성되는 표시 모듈이 포함된다.
본 발명에 따른 마이크로 블로그 검색 방법에 있어서, 상기 마이크로 블로그 배열 방법에 따라 마이크로 블로그 검색 결과에 대해 배열을 수행하며, 상기 사용자에 의해 요청되는 마이크로 블로그 정보를 획득하는 단계에는, 사용자에 의해 입력되는 키워드에 따라 검색을 수행하여 상기 사용자에 의해 요청되는 마이크로 블로그 정보를 획득하는 단계가 포함된다.
본 발명에 따른 마이크로 블로그 검색 시스템에는, 상기 마이크로 블로그 배열 시스템이 포함되며, 상기 마이크로 블로그 정보 획득 모듈은, 사용자에 의해 입력되는 키워드에 따라 검색을 수행하여 상기 사용자에 의해 요청되는 마이크로 블로그 정보를 획득하도록 구성된다.
본 발명에 따른 마이크로 블로그 표시 방법에 있어서, 상기 마이크로 블로그 배열 방법에 따라 마이크로 블로그 요청 결과에 대해 배열을 수행하며, 상기 사용자에 의해 요청되는 마이크로 블로그 정보를 획득하는 단계에는, 사용자 식별자에 대응되는 마이크로 블로그 요청 정보에 따라 상기 사용자에 의해 요청되는 마이크로 블로그 정보를 획득하는 단계가 포함된다.
본 발명에 따른 마이크로 블로그 표시 시스템에는, 상기 마이크로 블로그 배열 시스템이 포함되며, 상기 마이크로 블로그 정보 획득 모듈은 사용자 식별자에 대응되는 마이크로 블로그 요청 정보에 따라 상기 사용자에 의해 요청되는 블로그 정보를 획득하도록 구성된다.
상기 마이크로 블로그 배열, 검색 및 표시 방법과 시스템에 의하면, 마이크로 블로그 정보 내의 마이크로 블로그 발표 사용자 정보와 내용 정보를 추출하여 마이크로 블로그에 대해 평점을 수행하고 평점에 따라 마이크로 블로그 정보에 대해 배열을 수행하며 사용자와 관련된 마이크로 블로그 정보를 앞쪽에 배열시킴으로써 사용자가 용이하게 마이크로 블로그 정보를 열람할 수 있도록 한다.
도1은 일 실시예에 의한 마이크로 블로그 배열 방법의 흐름도이고,
도2는 일 실시예에 의한, 마이크로 블로그 정보 내의 마이크로 블로그 발표 사용자 정보를 추출하여 마이크로 블로그 정보에 대해 평점을 수행하는 흐름도이며,
도3은 다른 일 실시예에 의한, 마이크로 블로그 정보 내의 마이크로 블로그 발표 사용자 정보를 추출하여 마이크로 블로그 정보에 대해 평점을 수행하는 흐름도이며,
도4는 일 실시예에 의한, 마이크로 블로그 정보 내의 내용 정보를 추출하여 마이크로 블로그 정보에 대해 평점을 수행하는 흐름도이며,
도5는 일 실시예에 의한, 마이크로 블로그 주제별 카테고리의 특징을 훈련(training)하는 흐름도이며,
도6은 일 실시예에 의한, 마이크로 블로그 주제별 카테고리의 훈련 서브 집합을 획득하는 흐름도이며,
도7은 일 실시예에 의한, 과학 기술 네트워크 카테고리의 훈련 서브 집합의 예시도이며,
도8은 일 실시예에 의한, 마이크로 블로그 배열 방법의 원리 예시도이며,
도9는 일 실시예에 의한, 마이크로 블로그 배열 시스템의 구성 예시도이며,
도10은 일 실시예에 의한, 평점 모듈의 구성 예시도이며,
도11은 일 실시예에 의한, 사용자 정보 평점 모듈의 구성 예시도이며,
도12는 다른 일 실시예에 의한, 사용자 정보 평정 모듈의 구성 예시도이며,
도13은 일 실시예에 의한, 내용 정보 평점 모듈의 구성 예시도이며,
도14는 일 실시예에 의한, 분류 모델 훈련 모듈의 구성 예시도이다.
도1에 도시된 바와 같이, 일 실시예에 의한 마이크로 블로그 배열 방법에는 다음과 같은 단계가 포함된다.
단계 S101: 사용자에 의해 요청되는 마이크로 블로그 정보를 획득한다.
단계 S102: 마이크로 블로그 정보 내의 마이크로 블로그 발표 사용자 정보와 내용 정보를 추출하여 마이크로 블로그 정보에 대해 평점을 수행한다.
바람직하게, 마이크로 블로그 정보 내의 마이크로 블로그 발표 사용자 정보와 내용 정보가, 마이크로 블로그 요청 사용자와의 연관성이 높으면, 해당 마이크로 블로그 정보에 대한 평점도 높다.
단계 S103: 평점에 따라 마이크로 블로그 정보에 대해 배열을 수행한다.
바람직하게, 평점의 높고 낮음에 따라 마이크로 블로그 정보에 대해 배열을 수행하며 즉 마이크로 블로그 정보의 평점이 높을수록 보다 더 앞쪽으로 배열된다.
단계 S104: 배열 결과에 따라 마이크로 블로그 정보를 표시한다.
상기 마이크로 블로그 배열 방법에 있어서, 마이크로 블로그 정보 내의 마이크로 블로그 발표 사용자 정보와 내용 정보를 추출하여 마이크로 블로그에 대해 평점을 수행하고 평점에 따라 마이크로 블로그 정보에 대해 배열을 수행하여, 사용자와 관련된 마이크로 블로그 정보를 앞쪽으로 위치시킬 수 있으며 이로써 사용자가 용이하게 마이크로 블로그 정보를 열람할 수 있도록 한다.
도2에 도시된 바와 같이, 일 실시예에 의하면 단계 S102에서 마이크로 블로그 정보 내의 마이크로 블로그 발표 사용자 정보를 추출하여 마이크로 블로그 정보에 대해 평점을 수행하는 단계에는 다음과 같은 단계가 포함된다.
단계 S112: 마이크로 블로그 발표 사용자의 마이크로 블로그 운영 기록을 획득하여 마이크로 블로그 운영 기록에 따라 마이크로 블로그 발표 사용자의 활성도를 산출한다.
일 실시예에 있어서, 마이크로 블로그 발표 사용자의 ID에 따라, 사용자의 마이크로 블로그 운영 기록을 이미 저장한 데이터베이스 내에서 사용자의 ID에 대응되는 마이크로 블로그 운영 기록을 검색한다. 바람직하게, 마이크로 블로그 운영 기록에는 VIP 사용자 여부, 마이크로 블로그 업데이트 빈도, 마이크로 블로그 리포스팅(reposting) 비율, 마이크로 블로그 원작 비율, 마이크로 블로그 추천 평론 횟수, 마이크로 블로그 평균 글자수, 재미(funny) 점수값 등이 포함될 수 있다. 일 실시예에 있어서, 재미 점수는 마이크로 블로그 발표 사용자의 마이크로 블로그에 대한 기타 사용자의 재미 평점에 따라 얻을 수 있다.
마이크로 블로그 발표 사용자의 마이크로 블로그 운영 기록은 마이크로 블로그 발표 사용자의 활성도를 나타낸다. 구체적으로, 마이크로 블로그 발표 사용자가 VIP 사용자이거나 또는 그의 마이크로 블로그의 업데이트 빈도가 높거나, 리포스팅 비율이 높거나, 원작 비율이 높거나, 추천 평론된 횟수가 많거나, 평균 글자수가 많거나, 재미 점수 값이 높으면, 그에 대응되게, 마이크로 블로그 발표 사용자의 활성도를 높게 설정할 수도 있다.
단계 S122: 활성도에 따라 마이크로 블로그 정보에 대해 평점을 수행한다.
바람직하게, 마이크로 블로그 발표 사용자의 활성도가 높으면, 그와 상응하게 해당 마이크로 블로그에 대한 평점을 높일 수 있는바 이는 활성도가 높은 마이크로 블로그 사용자에 의해 발표된 마이크로 블로그가 보다 더 용이하게 사용자의 관심을 받기 때문이다.
본 실시예에서는 활성도가 높은 마이크로 블로그 발표 사용자의 마이크로 블로그 정보에 대한 평점도 높고 또한 평점이 높은 마이크로 블로그 정보를 앞쪽으로 위치시키는바 즉 사용자의 관심을 더 받을 수 있는 마이크로 블로그 정보를 앞쪽으로 위치시킴으로써 사용자가 용이하게 자신이 관심을 갖는 마이크로 정보를 열람할 수 있도록 한다.
도3에 도시된 바와 같이, 일 실시예에 있어서, 단계 S102에서 마이크로 블로그 정보 내의 마이크로 블로그 발표 사용자 정보를 추출하여 마이크로 블로그 정보에 대해 평점을 수행하는 단계에는 다음과 같은 단계가 포함된다.
단계 S132: 마이크로 블로그 발표 사용자의 개인 정보 및 마이크로 블로그 요청 사용자의 개인 정보를 획득하여 마이크로 블로그 발표 사용자의 개인 정보와 마이크로 블로그 요청 사용자의 개인 정보 사이의 유사성을 산출한다.
일 실시예에 있어서, 사용자의 ID에 따라, 사용자의 개인 정보를 이미 저장한 데이터 베이스 내에서 사용자의 ID에 대응되는 개인 정보를 찾아낸다. 구체적으로, 개인 정보에는 취미, 학력, 전공, 지역, 개성있는 서명(personalized signature), 즐겨찾는 마이크로 블로그 정보, 공통된 친구 수, 사용자 타입 정보 등이 포함될 수 있다. 일 실시예에 있어서, 사용자 타입은, 과학기술형, 오락형, 체육형, 예술형, 정치형 등으로 분류될 수 있다. 바람직하게, 사용자 타입 정보에는 사용자 타입 벡터가 포함되며, 사용자 타입 벡터의 성분은 어느 한 사용자 타입에 대한 사용자의 편향 점수값을 표시한다. 예를 들면, 사용자 타입 벡터의 첫번째 성분은 과학기술형 점수값을 표시하고 두번째 성분은 오락형 점수값을 표시하며 이와 같이 유추하는 것으로 정의할 수 있다. 만약 과학기술형에 대한 사용자의 편향 점수값이 3이고, 오락형에 대한 편향 점수값이 4이면, 사용자 타입 벡터는 (3, 4, …)로 표시할 수 있다. 바람직하게, 사용자 타입 벡터의 성분들 중 점수값이 가장 높은 성분에 대응되는 사용자 타입을 해당 사용자의 사용자 타입으로 선택할 수 있다.
일 실시예에 있어서, 사용자 타입 벡터는 사용자에 의한 수동 설정을 통해 획득할 수도 있고 사용자가 주목하는 마이크로 블로그 사용자 및 사용자의 친구의 사용자 타입에 대한 통계를 통해 획득할 수도 있다. 예를 들면, 사용자가 주목하는 마이크로 블로그 사용자 및 사용자의 친구들 중, 과학기술형에 속하는 인수가 5이면 사용자 타입 벡터에서 과학기술형에 대응되는 성분을 5로 설정할 수 있다.
일 실시예에 있어서, 사용자의 취미가 같거나 취미가 속하는 카테고리가 같으면, 예를 들어 모두 예술 카테고리이면, 마이크로 블로그 발표 사용자와 마이크로 블로그 요청 사용자의 유사성 값을 높일 수 있다. 일 실시예에 있어서, 취미가 속하는 카테고리를 저장한 데이터베이스 내에서 사용자의 취미가 속하는 카테고리를 검색할 수 있다. 이와 상응하게, 만약 사용자의 학력이 같으면 예를 들어 모두 본과이거나 모두 박사 이상 학력이면, 사용자 사이의 유사성 값을 높일 수도 있다. 마찬가지로, 만약 사용자의 전공이 같거나 전공이 속하는 카테고리가 같거나, 또는 사용자의 지역이 같거나 속하는 지역이 같거나, 또는 사용자의 개성있는 서명에 동일한 키워드가 있거나, 또는 사용자가 즐겨찾는 마이크로 블로그 정보가 같거나, 또는 사용자의 사용자 타입 정보가 유사하거나, 또는 사용자 사이의 공통 마이크로 블로그 친구의 수량이 기 설정된 임계값을 초과하는 등 경우에, 사용자 사이의 유사성 값을 모두 높일 수 있다. 일 실시예에 있어서, 상기 사용자 타입 벡터의 거리를 산출함으로써 사용자 타입 정보의 유사성을 획득할 수도 있으며, 두 사용자 타입 벡터의 거리가 작을수록 사용자 타입 정보의 유사성이 더 높으며, 그와 상응한 사용자 사이의 유사성도 높게 된다.
단계 S142: 마이크로 블로그 발표 사용자와 마이크로 블로그 요청 사용자 사이의 인터랙션 기록을 획득하여, 인터랙션 기록에 따라 마이크로 블로그 발표 사용자와 마이크로 블로그 요청 사용자 사이의 연관성을 산출한다.
일 실시예에 의하면, 인터랙션 기록에는 사용자 사이의 인용, 방문, 평론, 리포스팅 기록 등이 포함된다. 구체적으로, 만약 사용자 사이의 인용, 방문, 평론, 리포스팅 횟수가 높으면, 그와 상응하게 사용자 사이의 연관성도 높게 설정할 수 있다.
단계 S152: 상기 유사성과 연관성에 따라 마이크로 블로그 정보에 대해 평점을 수행한다.
바람직하게, 만약 마이크로 블로그 발표 사용자와 마이크로 블로그 요청 사용자 사이의 유사성이 높거나 또는 연관성이 높으면, 마이크로 블로그 정보에 대한 평점을 높일 수 있다.
본 실시예에 있어서, 만약 마이크로 블로그 발표 사용자와 마이크로 블로그 요청 사용자 사이의 개인 정보 유사성이 높거나 양자 사이의 연관성이 높으면, 마이크로 블로그 정보에 대한 평점도 높게 되고, 평점이 높은 마이크로 블로그 정보를 앞쪽으로 위치시키며, 이러한 마이크로 블로그 정보는 또한, 마이크로 블로그 요청 사용자의 관심을 보다 더 불러일으킬 수 있는 마이크로 블로그 정보이므로, 사용자가 자신이 관심갖는 마이크로 블로그 정보를 용이하게 열람할 수 있도록 한다.
일 실시예에 의하면, 단계 S102에서 마이크로 블로그 정보 내의 마이크로 블로그 발표 사용자 정보를 추출하여 마이크로 블로그 정보에 대해 평점을 수행하는 단계에는 단계 S112~S152이 포함된다. 단계 S152에서 마이크로 블로그 정보에 대한 평점은, 단계 S122에서 마이크로 블로그 정보에 대한 평점의 기초상에서 수행할 수 있다. 즉 마이크로 블로그 발표 사용자의 활성도에 따라 획득된 평점 및 마이크로 블로그 발표 사용자와 마이크로 블로그 요청 사용자 사이의 개인 정보 유사성과 연관성에 따라 획득된 평점을 종합하여 마이크로 블로그 정보의 종합 평점으로 하고 종합 평점에서 상기 두 평점이 차지하는 비중을 설정할 수 있다.
도4에 도시된 바와 같이, 일 실시예에 있어서, 단계 S102에서 마이크로 블로그 정보 내의 내용 정보를 추출하여 마이크로 블로그 정보에 대해 평점을 수행하는 단계에는 다음과 같은 단계가 포함된다.
단계 S162: 마이크로 블로그 정보 내의 마이크로 블로그 내용을 획득하여 마이크로 블로그 내용 및 마이크로 블로그 주제별 카테고리의 특징에 따라 마이크로 블로그 정보 내의 마이크로 블로그 내용의 주제별 카테고리 벡터를 획득한다.
바람직하게, 마이크로 블로그 내용에는 마이크로 블로그의 본문 내용 즉 마이크로 블로그 발표 사용자에 의해 발표된 내용이 포함되고, 마이크로 블로그 내용에는 또한 마이크로 블로그의 평론 내용이 더 포함될 수 있다. 일 실시예에 있어서, 마이크로 불르그 내용의 글자수가 많지 않으면 해당 마이크로 블로그의 발표 사용자가 해당 마이크로 블로그의 발표 시점에 근접한 시간(미리 설정될 수 있음) 내에 발표한 마이크로 블로그 내용을 획득하여 여러 개의 마이크로 블로그 내용을 하나로 조합할 수 있다.
바람직하게, 마이크로 블로그 주제별 카테고리에는, 정치군사, 문화예술, 재정주식, 감정인생, 사회법제, 오락가십, 과학기술네트워크, 건강미식, 체육운동, 자동차부동산, 교육취직, 패션여행 등이 포함된다. 바람직하게, 주제별 카테고리 벡터의 각 성분은 마이크로 블로그 내용이 어느 한 마이크로 블로그 주제별 카테고리에 속하는 편향 점수값을 표시한다. 예를 들어, 주제별 카테고리 벡터의 첫번째 성분은 정치군사 카테고리의 점수값을 표시하고, 두번째 성분은 문화예술 카테고리의 점수값을 표시하며, 이와 같이 유추한다. 주제별 카테고리 벡터(5, 10, …)은 마이크로 블로그 내용이 정치 군사 카테고리 소속으로 편향하는 점수값이 5이고 문화예술 카테고리 소속으로 편향하는 점수값이 10임을 표시한다. 바람직하게, 점수값이 가장 높은 성분에 대응되는 마이크로 블로그 주제별 카테고리를 마이크로 블로그 내용이 속하는 마이크로 블로그 주제별 카테고리로 취할 수 있다.
구체적으로, 마이크로 블로그 주제별 카테고리의 특징을 미리 훈련할 수 있으며, 또한, 기존의 나이브 베이즈 문서 분류 알고리즘을 채용하여 마이크로 블로그 내용에 대해 분류하여 마이크로 블로그 내용의 주제별 카테고리 벡터를 획득할 수 있으며, 더 이상 설명하지 않는다.
단계 S172: 마이크로 블로그 요청 사용자의 역사 마이크로 블로그 내용을 획득하여 역사 마이크로 블로그 내용 및 마이크로 블로그 주제별 카테고리의 특징에 따라 마이크로 블로그 요청 사용자의 역사 마이크로 블로그 내용의 주제별 카테고리 벡터를 획득한다.
구체적으로, 최근 시간 동안(미리 설정할 수 있음) 내의 마이크로 블로그 요청 사용자가 발표한 마이크로 블로그 내용을 획득할 수 있다. 바람직하게, 여러 개의 역사 마이크로 블로그 내용의 주제별 카테고리 벡터를 획득한 후, 해당 여러 개 벡터의 평균값을 산출하여 마이크로 블로그 요청 사용자의 역사 마이크로 블로그 내용의 주제별 카테고리 벡터로 한다.
단계 S182: 마이크로 블로그 정보 내의 마이크로 블로그 내용의 주제별 카테고리 벡터와 마이크로 블로그 요청 사용자의 역사 마이크로 블로그 내용의 주제별 카테고리 벡터에 따라, 마이크로 블로그 정보 내의 마이크로 블로그 내용과 마이크로 블로그 요청 사용자의 역사 마이크로 블로그 내용 사이의 유사성을 산출할 수 있다.
구체적으로, 상기 두개 주제별 카테고리 벡터 사이의 거리를 산출함으로써 마이크로 블로그 정보 내의 마이크로 블로그 내용과 마이크로 블로그 요청 사용자의 역사 마이크로 블로그 내용 사이의 유사성을 산출할 수 있다. 바람직하게, 거리가 작을수록 유사성을 더 높게 설정한다.
단계 S192: 해당 유사성에 따라 마이크로 블로그 정보에 대해 평점을 수행한다.
바람직하게, 유사성이 높을수록 마이크로 블로그 정보에 대한 평점이 더 높다.
본 실시예에 있어서, 만약 마이크로 블로그 정보 내의 마이크로 블로그 내용과 마이크로 블로그 요청 사용자의 역사 마이크로 블로그 내용의 유사성이 높으면 마이크로 블로그 정보에 대한 평점도 높고 평점이 높은 마이크로 블로그 정보를 앞쪽으로 위치시키며, 이러한 앞쪽으로 위치되는 마이크로 블로그 내용은 사용자의 관심을 보다 쉽게 끌 수 있어 사용자가 용이하게 관심갖는 마이크로 블로그를 열람할 수 있도록 한다.
도5에 도시된 바와 같이, 일 실시예에 있어서, 단계 S102 내의 마이크로 블로그 정보 내의 내용 정보를 추출하여 마이크로 블로그 정보에 대해 평점을 수행하기 전에, 마이크로 블로그 주제별 카테고리의 특징을 미리 훈련해야 하며, 상기 마이크로 블로그 배열 방법에는 다음과 같은 단계가 더 포함된다.
S501: 미리 설정된 마이크로 블로그 주제별 카테고리를 획득한다.
바람직하게, 마이크로 블로그 주제별 카테고리에는, 정치군사, 문화예술, 재정주식, 감정인생, 사회법제, 오락가십, 과학기술네트워크, 건강미식, 체육운동, 자동차부동산, 교육취직, 패션여행 등이 포함된다.
단계 S502: 마이크로 블로그 주제별 카테고리의 훈련 서브 집합을 획득한다.
바람직하게, 훈련 서브 집합으로부터 주제별 카테고리의 보다 나은 특징을 추출하기 위해 일정한 범위 내에서 될수록 많은 마이크로 블로그 훈련 샘플을 획득할 수 있다. 도6에 도시된 바와 같이, 일 실시예에 있어서, 단계 S502의 구체적인 과정에는, 마이크로 블로그 주제별 카테고리의 키워드에 따라 마이크로 블로그를 검색하여 마이크로 블로그 주제별 카테고리의 초기 훈련 서브 집합을 획득하는 단계 S512; 미리 설정된 횟수에 따라 이하의 단계 S532 및 단계 S542를 반복적으로 수행하는 단계 S522; 초기 훈련 서브 집합 내의 고빈도 어휘를 통계하는 단계 S532; 및 고빈도 어휘에 따라 마이크로 블로그를 검색하여 검색 결과를 초기 훈련 서브 집합에 추가하는 단계 S542가 포함된다.
구체적으로, 마이크로 블로그 주제별 카테고리 명칭 및 그 분할 어휘를 마이크로 블로그 주제별 카테고리의 키워드로 하는바, 예를 들어 정치군사 카테고리의 경우 정치, 군사 및 정치군사를 이 카테고리의 키워드로 하며, 이러한 키워드에 따라 검색을 수행하여 해당 카테고리의 초기 훈련 서브 집합을 획득한다. 또한, 초기 훈련 서브 집합에 대해 사전 처리를 수행한 후 어휘 분할, 사용 금지 어휘의 필터링 등 처리를 수행하여, 초기 서브 집합 내의 고빈도 어휘를 통계한다. 또한, 고빈도 어휘 및 고빈도 어휘의 조합을 키워드로 하여 계속하여 검색을 수행하여 보다 많은 마이크로 블로그 훈련 샘플을 획득할 수 있다. 초기 훈련 서브 집합 내의 고빈도 어휘를 통계하고 고빈도 어휘를 키워드로 하여 마이크로 블로그를 검색하여 검색 결과를 초기 훈련 서브 집합에 추가하는 단계를 미리 설정된 횟수에 따라 반복한다.
예를 들면, 도7에 도시된 바와 같이, "과학기술, 네트워크, 과학기술 네트워크"를 검색 집합 QS1에 추가하여 QS1 내의 어휘를 키워드로 하여 마이크로 블로그를 검색하여 훈련 서브 집합 RS1을 얻는다. RS1 내의 고빈도 어휘를 통계하는바 예를 들어 "과학, IT, 핸드폰, 데이터, 인터넷" 등을 획득하여 획득된 고빈도 어휘를 QS1에 추가하여 QS2를 얻는다. QS2 내의 어휘 및 어휘 조합을 키워드로 하여 마이크로 블로그를 검색하여 획득된 마이크로 블로그 검색 결과를 RS1에 추가하여 RS2를 얻는다. RS2 내의 고빈도 어휘를 통계하여 획득된 고빈도 어휘를 QS2에 추가하여 QS3을 얻는다. QS3 내의 어휘 및 어휘 조합을 키워드로 하여 마이크로 블로그를 검색하여 획득된 마이크로 블로그 검색 결과를 RS2 내에 추가하여 RS3을 얻는다. 이와 같이 유추하여 QS4와 RS4를 얻고 상기 통계와 검색 단계를 반복하면 훈련 서브 집합 내의 샘플의 수량은 확충된다.
본 실시예에서 마이크로 블로그 주제별 카테고리의 훈련 서브 집합을 획득하는 방법을 통해 각 주제별 카테고리의 훨씬 많은 마이크로 블로그 훈련 샘플을 획득할 수 있으며 훈련 서브 집합으로부터 각 마이크로 블로그 주제별 카테고리의 특징을 추출하기 위한 기반을 제공한다.
단계 S503: 훈련 서브 집합으로부터 마이크로 블로그 주제별 카테고리의 특징을 추출한다.
구체적으로, 기존의 분류 훈련 방법을 이용하여 각 주제별 카테고리의 훈련 서브 집합 내의 마이크로 블로그 내용에 대해 훈련하여 각 주제별 카테고리의 특징을 추출할 수 있다. 여기서 더 이상 설명하지 않는다.
일 실시예에 있어서, 단계 S104전에 상기 방법은 다음과 같은 단계를 더 포함한다.
미리 설정된 마이크로 블로그 표시 카테고리에 따라 마이크로 블로그 정보 내의 마이크로 블로그 내용에 대해 분류하여 마이크로 블로그 내용이 속하는 표시 카테고리를 얻는다.
구체적으로, 표시 카테고리에는 상기에서 언급된 마이크로 블로그 주제별 카테고리, 예를 들어 정치군사 카테고리, 문화예술 카테고리, 재정주식 카테고리 등이 포함될 수 있다. 마이크로 블로그 내용이 속하는 마이크로 블로그 주제별 카테고리는 단계 S162에서 획득된 마이크로 블로그 정보 내의 마이크로 블로그 내용의 주제별 카테고리 벡터에 따라 얻을 수 있고, 주제별 카테고리 벡터 내의 점수값이 가장 높은 성분에 대응되는 주제별 카테고리를 마이크로 블로그 내용이 속하는 마이크로 블로그 카테고리로 취할 수 있다.
일 실시예에 있어서, 마이크로 블로그 주제별 카테고리외에도, 기타 표시 카테고리, 예를 들어 친구 카테고리, 지점 카테고리, 재미 카테고리, 도움요청 리포스팅 카테고리, 광고활동 카테고리 등이 추가될 수 있다. 마이크로 블로그 정보가 친구 카테고리에 속하는지는 마이크로 블로그 발표 사용자와 마이크로 블로그 요청 사용자가 친구인지에 따라 판단할 수 있다. 일 실시예에 있어서, 마이크로 블로그 발표 사용자의 ID 및 마이크로 블로그 요청 사용자의 ID에 따라 친구 대응 관계를 이미 저장한 데이터베이스 내에서 마이크로 블로그 발표 사용자와 마이크로 블로그 요청 사용자 사이가 친구인지를 찾을 수 있다. 마이크로 블로그 정보가 지점 카테고리에 속하는지는, 마이크로 블로그 발표 사용자와 마이크로 블로그 요청 사용자의 주소가 동일한 지역(현, 구 등으로 설정할 수 있음)에 속하는지에 따라 판단할 수 있다. 마이크로 블로그가 재미 카테고리에 속하는지는 마이크로 블로그 발표 사용자의 ID에 따라 사용자의 재미 점수값을 이미 저장한 데이터베이스 내에서 찾은 재미 점수값이 미리 설정된 임계값보다 큰지에 따라 판단할 수 있다. 일 실시예에 있어서, 사용자의 재미 점수값은 해당 사용자에 대한 기타 사용자의 재미 평점에 따라 획득할 수 있다. 마이크로 블로그 정보가 도움요청 리포스팅 카테고리, 광고활동 카테고리에 속하는지는 마이크로 블로그 내용 내에 도움요청, 광고 고빈도 어휘 등의 출현 여부에 따라 판단할 수 있다.
일 실시예에 있어서, 마이크로 블로그 표시 카테고리에는 인기화제 카테고리가 더 포함될 수 있다. 구체적으로, 웹페이지 내용을 분석하여 고빈도 기록을 획득하며, 마이크로 블로그 요청 사용자의 역사 마이크로 블로그 내용에 따라, 상기 고빈도 기록에 대해 평점을 수행하며, 고빈도 기록 평점에 따라 검색 결과 내의 마이크로 블로그를 선택하여 인기화제 카테고리로 분류시킨다.
바람직하게, 기존의 오픈소스 툴 Html-parser에 따라 웹 페이지 내용에 대한 분석을 통해 출현 횟수가 미리 설정된 임계값을 초과하는 어휘 그룹, 즉 고빈도 기록을 얻을 수 있다. 또한, 고빈도 기록과 마이크로 블로그 요청 사용자의 역사 마이크로 블로그 내용의 유사성에 따라 고빈도 기록에 대한 평점을 수행할 수 있다. 구체적으로, 고빈도 기록이 마이크로 블로그 요청 사용자에 의해 발표, 리포스팅, 평론된 마이크로 블로그 내용에서 출현된 횟수를 통계하여 해당 횟수에 따라 고빈도 기록에 대해 평점을 수행할 수 있다. 마지막으로, 평점이 미리 설정된 앞쪽 자리인 고빈도 기록을 선택하고 마이크로 블로그 내용 중 해당 고빈도 기록이 나타난 마이크로 블로그 정보를 선택하여 해당 마이크로 블로그 정보를 인기 화제 카테고리로 분류시킬 수 있다.
본 실시예에 있어서, 단계 S104의 구체적인 과정은, 마이크로 블로그 내용이 속하는 표시 카테고리 및 상기 배열의 결과에 따라 마이크로 블로그 정보를 표시한다.
구체적으로, 마이크로 블로그 정보를 각 표시 카테고리에 따라 분류하여 표시하고 각 표시 카테고리에서 평점이 높은 마이크로 블로그 정보를 앞쪽으로 배열시킬 수 있다.
본 실시예에 있어서, 마이크로 블로그 정보를 여러 개의 표시 카테고리로 분할하여 표시함으로써 사용자가 자신이 관심 있는 마이크로 블로그를 용이하게 선택하여 열람할 수 있도록 하여 사용자의 조작을 간편화한다. 또한, 각 표시 카테고리는 모두 마이크로 블로그의 평점의 내림차순으로 표시되며 배열 순서가 앞쪽인 마이크로 블로그는 그 마이크로 블로그 발표 사용자의 활성도가 비교적 높거나 마이크로 블로그 발표 사용자의 개인 정보와 마이크로 블로그 요청 사용자의 개인 정보 유사성이 비교적 높거나 마이크로 블로그 발표 사용자와 마이크로 블로그 요청 사용자의 연관성이 비교적 높아 사용자가 용이하게 자신과 관련된, 관심있는 마이크로 블로그를 열람할 수 있도록 한다.
도8은 일 실시예에 의한 마이크로 블로그 배열 방법의 원리 예시도이다.
마이크로 블로그 배열 방법에 의하면, 마이크로 블로그 발표 사용자 정보와 내용 정보에 따라 마이크로 블로그 정보에 대해 평점을 수행할 수 있으며, 마이크로 블로그 발표 사용자 정보에 대한 평점은 U로 표기하고 내용 정보에 대한 평점은 C로 표기한다. 여기서, 마이크로 블로그 발표 사용자 정보에 대한 평점 U는 마이크로 블로그 발표 사용자 활성도에 대한 평점 A, 마이크로 블로그 발표 사용자와 마이크로 블로그 요청 사용자의 개인 정보 유사성에 대한 평점 P, 마이크로 블로그 발표 사용자와 마이크로 블로그 요청 사용자의 연관성에 대한 평점 R에 따라 산출하여 얻을 수 있다. 마이크로 블로그 발표 사용자 활성도에 대한 평점 A는 마이크로 블로그 발표 사용자의 정보, 즉 VIP 사용자 여부, 마이크로 블로그 업데이트 빈도, 마이크로 블로그 리포스팅(reposting) 비율, 마이크로 블로그 원작 비율, 마이크로 블로그 추천 평론 횟수, 마이크로 블로그 평균 글자수, 재미(funny) 점수값 등 정보에 따라 획득할 수 있다. 마이크로 블로그 발표 사용자와 마이크로 블로그 요청 사용자의 개인 정보 유사성에 대한 평점 P는 양자의 정보, 즉 취미, 학력, 전공, 지역, 개성있는 서명(personalized signature), 즐겨찾는 마이크로 블로그 정보, 공통된 친구 수, 사용자 타입 정보 등 정보에 따라 획득할 수 있다. 마이크로 블로그 발표 사용자와 마이크로 블로그 요청 사용자의 연관성에 대한 평점 R은 마이크로 블로그 발표 사용자와 마이크로 블로그 요청 사용자 사이의 인터랙션 기록에 따라 획득할 수 있는바 인터랙션 기록에는 인용, 방문, 평론, 리포스팅 기록 등이 포함된다. 마이크로 블로그 내용 정보에 대한 평점 C는 마이크로 블로그 내용과 마이크로 블로그 요청 사용자의 역사 마이크로 블로그 내용 사이의 유사성에 따라 산출하여 얻을 수 있다. 여기서, 해당 유사성은 마이크로 블로그 주제별 카테고리 벡터와 마이크로 블로그 요청 사용자의 역사 마이크로 블로그 주제별 카테고리 벡터 사이의 거리에 따라 산출하여 얻을 수 있다. 마지막으로, 상기 평점들을 통합하여 마이크로 블로그 정보의 종합 평점을 획득할 수 있으며, 일 실시예에 있어서 종합 평점=a1*U+a2*C=b1*A+b2*P+b3*R+a2*C이며, a1, a2, b1, b2, b3은 미리 설정된 계수이다.
도9에 도시된 바와 같이, 일 실시예에 의한 마이크로 블로그 배열 시스템에는 마이크로 블로그 정보 획득 모듈(10), 평점 모듈(20), 배열 모듈(30), 표시 모듈(40)이 포함된다.
마이크로 블로그 정보 획득 모듈(10)은 사용자에 의해 요청되는 마이크로 블로그 정보를 획득하도록 구성된다.
평점 모듈(20)은 사용자 정보 평점 모듈(201)과 내용 정보 평점 모듈(202)을 포함하며, 도10에 도시된 바와 같이, 사용자 정보 평점 모듈(201)은 마이크로 블로그 정보 내의 마이크로 블로그 발표 사용자 정보를 추출하여 마이크로 블로그 발표 사용자 정보에 따라 마이크로 블로그 정보에 대해 평점을 수행하도록 구성되고, 내용 정보 평점 모듈(202)은 마이크로 블로그 정보 내의 내용 정보를 추출하여 내용 정보에 따라 마이크로 블로그 정보에 대해 평점을 수행하도록 구성된다.
사용자 정보 평점 모듈(201)과 내용 정보 평점 모듈(202)은 마이크로 블로그 정보에 대한 평점을 통해 종합 평점을 얻는다. 바람직하게, 만약 마이크로 블로그 정보 내의 마이크로 블로그 발표 사용자 정보와 내용 정보가 마이크로 블로그 요청 사용자와의 연관성이 높으면 해당 마이크로 블로그 정보의 종합 평점도 높게 된다.
배열 모듈(30)은 상기 평점에 따라 마이크로 블로그 정보에 대해 배열을 수행하도록 구성된다.
바람직하게, 배열 모듈(30)은 상기 종합 평점의 높고 낮음에 따라 마이크로 블로그 정보에 대해 배열을 수행하며 즉 마이크로 블로그 정보의 평점이 높을수록 보다 더 앞쪽으로 배열된다.
표시 모듈(104)은 배열 결과에 따라 마이크로 블로그 정보를 표시하도록 구성된다.
상기 마이크로 블로그 배열 시스템에 있어서, 마이크로 블로그 정보 내의 마이크로 블로그 발표 사용자 정보와 내용 정보를 추출하여 마이크로 블로그에 대해 평점을 수행하고 평점에 따라 마이크로 블로그 정보에 대해 배열을 수행하여, 사용자와 관련된 마이크로 블로그 정보를 앞쪽으로 위치시킬 수 있으며 이로써 사용자가 용이하게 마이크로 블로그 정보를 열람할 수 있도록 한다.
도11에 도시된 바와 같이, 일 실시예에 의하면 사용자 정보 평점 모듈(201)에는 활성도 산출 유닛(211) 및 제1 평점 유닛(221)이 포함되며,
활성도 산출 유닛(211)은 마이크로 블로그 발표 사용자의 마이크로 블로그 운영 기록을 획득하여 해당 마이크로 블로그 운영 기록에 따라 마이크로 블로그 발표 사용자의 활성도를 산출하도록 구성된다.
일 실시예에 있어서, 활성도 산출 유닛(211)은 마이크로 블로그 발표 사용자의 ID에 따라, 사용자의 마이크로 블로그 운영 기록을 이미 저장한 데이터베이스 내에서 사용자의 ID에 대응되는 마이크로 블로그 운영 기록을 검색한다. 바람직하게, 마이크로 블로그 운영 기록에는 VIP 사용자 여부, 마이크로 블로그 업데이트 빈도, 마이크로 블로그 리포스팅(reposting) 비율, 마이크로 블로그 원작 비율, 마이크로 블로그 추천 평론 횟수, 마이크로 블로그 평균 글자수, 재미(funny) 점수값 등이 포함될 수 있다. 일 실시예에 있어서, 재미 점수값은 마이크로 블로그 발표 사용자의 마이크로 블로그에 대한 기타 사용자의 재미 평점에 따라 얻을 수 있다.
마이크로 블로그 발표 사용자의 마이크로 블로그 운영 기록은 마이크로 블로그 발표 사용자의 활성도를 나타낸다. 구체적으로, 마이크로 블로그 발표 사용자가 VIP 사용자이거나 또는 그의 마이크로 블로그의 업데이트 빈도가 높거나, 리포스팅 비율이 높거나, 원작 비율이 높거나, 추천 평론된 횟수가 많거나, 평균 글자수가 많거나, 재미 점수값이 높으면, 그에 대응되게, 마이크로 블로그 발표 사용자의 활성도를 높게 설정할 수도 있다.
제1 평점 유닛(221)은 활성도에 따라 마이크로 블로그 정보에 대해 평점을 수행하도록 구성된다.
바람직하게, 마이크로 블로그 발표 사용자의 활성도가 높으면, 제1 평점 유닛(221)은 그와 상응하게 해당 마이크로 블로그에 대한 평점을 높일 수 있는바 이는 활성도가 높은 마이크로 블로그 발표 사용자에 의해 발표된 마이크로 블로그가 보다 더 용이하게 사용자의 관심을 받기 때문이다.
본 실시예에서는 활성도가 높은 마이크로 블로그 발표 사용자의 마이크로 블로그 정보에 대한 평점도 높고 또한 평점이 높은 마이크로 블로그 정보를 앞쪽으로 위치시키는바 즉 사용자의 관심을 더 받을 수 있는 마이크로 블로그 정보를 앞쪽으로 위치시킴으로써 사용자가 용이하게 자신이 관심을 갖는 마이크로 정보를 열람할 수 있도록 한다.
도12에 도시된 바와 같이, 일 실시예에 있어서, 사용자 정보 평점 모듈(201)에는 개인 정보 유사성 산출 유닛(231), 연관성 산출 유닛(241) 및 제2 평점 유닛(251)이 포함되며, 여기서
개인 정보 유사성 산출 유닛(231)은 마이크로 블로그 발표 사용자의 개인 정보 및 마이크로 블로그 요청 사용자의 개인 정보를 획득하여 마이크로 블로그 발표 사용자의 개인 정보와 마이크로 블로그 요청 사용자의 개인 정보 사이의 유사성을 산출하도록 구성된다.
일 실시예에 있어서, 개인 정보 유사성 산출 유닛(231)은 사용자의 ID에 따라, 사용자의 개인 정보를 이미 저장한 데이터베이스 내에서 사용자의 ID에 대응되는 개인 정보를 찾아낸다. 구체적으로, 개인 정보에는 취미, 학력, 전공, 지역, 개성있는 서명(personalized signature), 즐겨찾는 마이크로 블로그 정보, 공통된 친구 수, 사용자 타입 정보 등이 포함될 수 있다. 일 실시예에 있어서, 사용자 타입은, 과학기술형, 오락형, 체육형, 예술형, 정치형 등으로 분류될 수 있다. 바람직하게, 사용자 타입 정보에는 사용자 타입 벡터가 포함되며, 사용자 타입 벡터의 성분은 어느 한 사용자 타입에 대한 사용자의 편향 점수값을 표시한다. 예를 들면, 사용자 타입 벡터의 첫 번째 성분은 과학기술형 점수값을 표시하고 두번째 성분은 오락형 점수값을 표시하며 이와 같이 유추하는 것으로 정의할 수 있다. 만약 과학기술형에 대한 사용자의 편향 점수값이 3이고, 오락형에 대한 편향 점수값이 4이면, 사용자 타입 벡터는 (3, 4, …)로 표시할 수 있다. 바람직하게, 사용자 타입 벡터의 성분들 중 점수값이 가장 높은 성분에 대응되는 사용자 타입을 해당 사용자의 사용자 타입으로 선택할 수 있다.
일 실시예에 있어서, 사용자 타입 벡터는 사용자에 의한 수동 설정을 통해 획득할 수도 있고 사용자가 주목하는 마이크로 블로그 사용자 및 사용자의 친구의 사용자 타입에 대한 통계를 통해 획득할 수도 있다. 예를 들면, 사용자가 주목하는 마이크로 블로그 사용자 및 사용자의 친구 들 중, 과학기술형에 속하는 인수가 5이면 사용자 타입 벡터에서 과학기술형에 대응되는 성분을 5로 설정할 수 있다.
일 실시예에 있어서, 사용자의 취미가 같거나 또는 취미가 속하는 카테고리가 같으면, 예를 들어 모두 예술 카테고리이면, 개인 정보 유사성 산출 유닛(231)은 마이크로 블로그 발표 사용자와 마이크로 블로그 요청 사용자의 유사성 값을 높일 수 있다. 일 실시예에 있어서, 개인 정보 유사성 산출 유닛(231)은 취미가 속하는 카테고리를 저장한 데이터베이스 내에서 사용자의 취미가 속하는 카테고리를 검색할 수 있다. 이와 상응하게, 만약 사용자의 학력이 같으면 예를 들어 모두 본과이거나 모두 박사 이상 학력이면, 사용자 사이의 유사성 값을 높일 수도 있다. 마찬가지로, 만약 사용자의 전공이 같거나 전공이 속하는 카테고리가 같거나, 또는 사용자의 지역이 같거나 속하는 지역이 같거나, 또는 사용자의 개성있는 서명에 동일한 키워드가 있거나, 또는 사용자가 즐겨찾는 마이크로 블로그 정보가 같거나, 또는 사용자의 사용자 타입 정보가 유사하거나, 또는 사용자 사이의 공통된 마이크로 블로그 친구의 수량이 기 설정된 임계값을 초과하는 등 경우에, 사용자 사이의 유사성 값을 모두 높일 수 있다. 일 실시예에 있어서, 상기 사용자 타입 벡터의 거리를 산출함으로써 사용자 타입 정보의 유사성을 획득할 수도 있으며, 두 사용자 타입 벡터의 거리가 작을수록 사용자 타입 정보의 유사성이 더 높으며, 그와 상응한 사용자 사이의 유사성도 높게 된다.
연관성 산출 유닛(241)은 마이크로 블로그 발표 사용자와 마이크로 블로그 요청 사용자 사이의 인터랙션 기록을 획득하여, 인터랙션 기록에 따라 마이크로 블로그 발표 사용자와 마이크로 블로그 요청 사용자 사이의 연관성을 산출하도록 구성된다.
일 실시예에 있어서, 인터랙션 기록에는 사용자 사이의 인용, 방문, 평론, 리포스팅 기록 등이 포함된다. 구체적으로, 만약 사용자 사이의 인용, 방문, 평론, 리포스팅 횟수가 높으면, 연관성 산출 유닛(241)은 그와 상응하게 사용자 사이의 연관성도 높게 설정할 수 있다.
제2 평점 유닛(251)은 상기 유사성과 연관성에 따라 마이크로 블로그 정보에 대해 평점을 수행하도록 구성된다.
바람직하게, 만약 마이크로 블로그 발표 사용자와 마이크로 블로그 요청 사용자 사이의 유사성이 높거나 연관성이 높으면, 제2 평점 유닛(251)은 마이크로 블로그 정보에 대한 평점을 높일 수 있다.
본 실시예에 있어서, 만약 마이크로 블로그 발표 사용자와 마이크로 블로그 요청 사용자 사이의 개인 정보 유사성이 높거나 양자 사이의 연관성이 높으면, 마이크로 블로그 정보의 평점도 높게 되고, 평점이 높은 마이크로 블로그 정보는 앞쪽으로 위치시키며, 이러한 마이크로 블로그 정보는, 마이크로 블로그 요청 사용자의 관심을 보다 더 불러일으킬 수 있는 마이크로 블로그 정보이므로, 사용자가 자신이 관심갖는 마이크로 블로그 정보를 용이하게 열람할 수 있도록 한다.
일 실시예에 있어서, 사용자 정보 평점 모듈(201)에는 활성도 산출 유닛(211), 제1 평점 유닛(221), 개인 정보 유사성 산출 유닛(231), 연관성 산출 유닛(241) 및 제2 평점 유닛(251)이 포함된다. 마이크로 블로그 정보에 대한 제2 평점 유닛(251)의 평점은, 마이크로 블로그 정보에 대한 제1 평점 유닛(221)의 평점의 기초상에서 수행할 수 있다. 즉 마이크로 블로그 발표 사용자의 활성도에 따라 획득된 평점 및 마이크로 블로그 발표 사용자와 마이크로 블로그 요청 사용자 사이의 개인 정보 유사성과 연관성에 따라 획득된 평점을 종합하여 마이크로 블로그 정보의 종합 평점으로 하고 종합 평점에서 상기 두 평점이 차지하는 비중을 설정할 수 있다.
도13에 도시된 바와 같이, 일 실시예에 있어서, 내용 정보 평점 모듈(202)에는 카테고리 벡터 추출 유닛(212), 내용 유사성 산출 유닛(222) 및 제3 평점 유닛(232)이 포함되며, 여기서
카테고리 벡터 추출 유닛(212)은 마이크로 블로그 정보 내의 마이크로 블로그 내용을 획득하여 마이크로 블로그 내용 및 마이크로 블로그 주제별 카테고리의 특징에 따라 마이크로 블로그 정보 내의 마이크로 블로그 내용의 주제별 카테고리 벡터를 획득하도록 구성된다.
바람직하게, 마이크로 블로그 내용에는 마이크로 블로그의 본문 내용 즉 마이크로 블로그 발표 사용자에 의해 발표된 내용이 포함되고, 마이크로 블로그 내용에는 또한 마이크로 블로그의 평론 내용이 더 포함될 수 있다. 일 실시예에 있어서, 마이크로 블로그 내용의 글자수가 많지 않으면 카테고리 벡터 추출 유닛(212)은 해당 마이크로 블로그의 발표 사용자가 해당 마이크로 블로그의 발표 시점에 근접한 시간(미리 설정될 수 있음) 내에 발표한 마이크로 블로그 내용을 획득하여 여러 개의 마이크로 블로그 내용을 하나로 조합할 수 있다.
바람직하게, 마이크로 블로그 주제별 카테고리에는, 정치군사, 문화예술, 재정주식, 감정인생, 사회법제, 오락가십, 과학기술네트워크, 건강미식, 체육운동, 자동차부동산, 교육취직, 패션여행 등이 포함된다. 바람직하게, 주제별 카테고리 벡터의 각 성분은 마이크로 블로그 내용이 어느 한 마이크로 블로그 주제별 카테고리에 속하는 편향 점수값을 표시한다. 예를 들어, 주제별 카테고리 벡터의 첫번째 성분은 정치군사 카테고리의 점수값을 표시하고, 두번째 성분은 문화예술 카테고리의 점수값을 표시하며, 이와 같이 유추한다. 주제별 카테고리 벡터(5, 10, …)는 마이크로 블로그 내용이 정치 군사 카테고리 소속으로 편향하는 점수값이 5이고 문화예술 카테고리 소속으로 편향하는 점수값이 10임을 표시한다. 바람직하게, 점수값이 가장 높은 성분에 대응되는 마이크로 블로그 주제별 카테고리를 마이크로 블로그 내용이 속하는 마이크로 블로그 주제별 카테고리로 취할 수 있다.
구체적으로, 마이크로 블로그 주제별 카테고리의 특징을 미리 훈련할 수 있으며, 또한, 카테고리 벡터 추출 유닛(212)은 기존의 나이브 베이즈 문서 분류 알고리즘을 채용하여 마이크로 블로그 내용에 대해 분류하여 마이크로 블로그 내용의 주제별 카테고리 벡터를 획득할 수 있으며, 더 이상 설명하지 않는다.
카테고리 벡터 추출 유닛(212)은 또한 마이크로 블로그 요청 사용자의 역사 마이크로 블로그 내용을 획득하여 역사 마이크로 블로그 내용 및 마이크로 블로그 주제별 카테고리의 특징에 따라 마이크로 블로그 요청 사용자의 역사 마이크로 블로그 내용의 주제별 카테고리 벡터를 획득하도록 구성된다.
구체적으로, 카테고리 벡터 추출 유닛(212)은 최근 시간 동안(미리 설정할 수 있음) 내의 마이크로 블로그 요청 사용자가 발표한 마이크로 블로그 내용을 획득할 수 있다. 바람직하게, 여러 개의 역사 마이크로 블로그 내용의 주제별 카테고리 벡터를 획득한 후, 카테고리 벡터 추출 유닛(712)은 해당 여러 개 벡터의 평균값을 산출하여 마이크로 블로그 요청 사용자의 역사 마이크로 블로그 내용의 주제별 카테고리 벡터로 할 수 있다.
내용 유사성 산출 유닛(222)은 마이크로 블로그 정보 내의 마이크로 블로그 내용의 주제별 카테고리 벡터와 마이크로 블로그 요청 사용자의 역사 마이크로 블로그 내용의 주제별 카테고리 벡터에 따라, 마이크로 블로그 정보 내의 마이크로 블로그 내용과 마이크로 블로그 요청 사용자의 역사 마이크로 블로그 내용 사이의 유사성을 산출하도록 구성된다.
구체적으로, 내용 유사성 산출 유닛(222)은 상기 두개 주제별 카테고리 벡터 사이의 거리를 산출함으로써 마이크로 블로그 정보 내의 마이크로 블로그 내용과 마이크로 블로그 요청 사용자의 역사 마이크로 블로그 내용 사이의 유사성을 산출할 수 있다. 바람직하게, 거리가 작을수록 유사성을 더 높게 설정한다.
제3 평점 유닛(232)은 유사성에 따라 마이크로 블로그 정보에 대해 평점을 수행하도록 구성된다.
바람직하게, 유사성이 높을수록 제3 평점 유닛(232)은 마이크로 블로그 정보에 대한 평점이 더 높다.
본 실시예에 있어서, 만약 마이크로 블로그 정보 내의 마이크로 블로그 내용과 마이크로 블로그 요청 사용자의 역사 마이크로 블로그 내용의 유사성이 높으면 마이크로 블로그 정보에 대한 평점도 높고 평점이 높은 마이크로 블로그 정보를 앞쪽으로 위치시키며, 이러한 앞쪽으로 위치되는 마이크로 블로그 내용은 사용자의 관심을 보다 쉽게 끌 수 있어 사용자가 용이하게 자신이 관심갖는 마이크로 블로그를 열람할 수 있도록 한다.
본 실시예에서, 마이크로 블로그 주제별 카테고리의 특징을 미리 훈련해야 하며 상기 마이크로 블로그 배열 시스템에는 분류 모델 훈련 모듈(50)이 더 포함되며, 분류 모델 훈련 모듈(50)은 각 마이크로 블로그 주제별 카테고리의 샘플을 훈련하여 각 마이크로 블로그 주제별 카테고리의 특징을 추출하도록 구성되며, 도14에 도시된 바와 같이 분류 모델 훈련 모듈(50)에는 주제별 카테고리 획득 모듈(501), 훈련 집합 획득 모듈(502) 및 특징 추출 모듈(503)이 포함된다.
주제별 카테고리 획득 모듈(501)은 미리 설정된 마이크로 블로그 주제별 카테고리를 획득하도록 구성된다.
바람직하게, 마이크로 블로그 주제별 카테고리에는, 정치군사, 문화예술, 재정주식, 감정인생, 사회법제, 오락가십, 과학기술네트워크, 건강미식, 체육운동, 자동차부동산, 교육취직, 패션여행 등이 포함된다.
훈련 집합 획득 모듈(502)은 마이크로 블로그 주제별 카테고리의 훈련 서브 집합을 획득하도록 구성된다.
바람직하게, 훈련 서브 집합으로부터 주제별 카테고리의 보다 나은 특징을 추출하기 위해 일정한 범위 내에서 될수록 많은 마이크로 블로그 훈련 샘플을 획득할 수 있다. 일 실시예에 있어서, 훈련 집합 획득 모듈(502)은 마이크로 블로그 주제별 카테고리의 키워드에 따라 마이크로 블로그를 검색하여 마이크로 블로그 주제별 카테고리의 초기 훈련 서브 집합을 획득하고, 미리 설정된 횟수에 따라 반복적으로 초기 훈련 서브 집합 내의 고빈도 어휘를 통계하는 단계 및 고빈도 어휘에 따라 마이크로 블로그를 검색하여 검색 결과를 초기 훈련 서브 집합에 추가하는 단계를 수행할 수 있다.
구체적으로, 훈련 집합 획득 모듈(502)은 마이크로 블로그 주제별 카테고리 명칭 및 그 분할 어휘를 마이크로 블로그 주제별 카테고리의 키워드로 할 수 있는바, 예를 들어 정치군사 카테고리의 경우, 정치, 군사 및 정치군사를 이 카테고리의 키워드로 하며, 이러한 키워드에 따라 검색을 수행하여 해당 카테고리의 초기 훈련 서브 집합을 획득할 수 있다. 또한, 초기 훈련 서브 집합에 대해 사전 처리를 수행한 후 어휘 분할, 사용 금지 어휘의 필터링 등 처리를 수행하여, 초기 서브 집합 내의 고빈도 어휘를 통계한다. 또한, 고빈도 어휘 및 고빈도 어휘의 조합을 키워드로 하여 계속하여 검색을 수행하여 보다 많은 마이크로 블로그 훈련 샘플을 획득할 수 있다. 초기 훈련 서브 집합 내의 고빈도 어휘를 통계하고 고빈도 어휘를 키워드로 하여 마이크로 블로그를 검색하여 검색 결과를 초기 훈련 서브 집합에 추가하는 단계를 미리 설정된 횟수에 따라 반복한다.
본 실시예에서 마이크로 블로그 주제별 카테고리의 훈련 서브 집합을 획득하는 방법을 통해 각 주제별 카테고리의 훨씬 많은 마이크로 블로그 훈련 샘플을 획득할 수 있으며 훈련 서브 집합으로부터 각 마이크로 블로그 주제별 카테고리의 특징을 추출하기 위한 기반을 제공한다.
특징 추출 모듈(503)은 훈련 서브 집합으로부터 마이크로 블로그 주제별 카테고리의 특징을 획득하도록 구성된다.
구체적으로, 특징 추출 모듈(503)은 기존의 분류 훈련 방법을 이용하여 각 주제별 카테고리의 훈련 서브 집합 내의 마이크로 블로그 내용에 대해 훈련하여 각 주제별 카테고리의 특징을 추출할 수 있다. 여기서 더 이상 설명하지 않는다.
일 실시예에 있어서, 상기 마이크로 블로그 배열 시스템에는 표시 카테고리 분류 모듈(미도시)이 더 포함되는바, 미리 설정된 마이크로 블로그 표시 카테고리에 따라 마이크로 블로그 정보 내의 마이크로 블로그 내용에 대해 분류하여 마이크로 블로그 내용이 속하는 표시 카테고리를 얻도록 구성된다.
구체적으로, 표시 카테고리에는 상기에서 언급된 마이크로 블로그 주제별 카테고리, 예를 들어 정치군사 카테고리, 문화예술 카테고리, 재정주식 카테고리 등이 포함될 수 있다. 마이크로 블로그 내용이 속하는 마이크로 블로그 주제별 카테고리는 카테고리 벡터 추출 유닛(212)에서 획득된 마이크로 블로그 정보 내의 마이크로 블로그 내용의 주제별 카테고리 벡터에 따라 얻을 수 있고, 주제별 카테고리 벡터 내의 점수값이 가장 높은 성분에 대응되는 주제별 카테고리를 마이크로 블로그 내용이 속하는 마이크로 블로그 카테고리로 취할 수 있다.
일 실시예에 있어서, 마이크로 블로그 주제별 카테고리외에도, 기타 표시 카테고리, 예를 들어 친구 카테고리, 지점 카테고리, 재미 카테고리, 도움요청 리포스팅 카테고리, 광고활동 카테고리 등이 추가될 수 있다. 마이크로 블로그 정보가 친구 카테고리에 속하는지는 마이크로 블로그 발표 사용자와 마이크로 블로그 요청 사용자가 친구인지에 따라 판단할 수 있다. 일 실시예에 있어서, 표시 카테고리 분류 모듈은 마이크로 블로그 발표 사용자의 ID 및 마이크로 블로그 요청 사용자의 ID에 따라 친구 대응 관계를 이미 저장한 데이터베이스 내에서 마이크로 블로그 발표 사용자와 마이크로 블로그 요청 사용자 사이가 친구인지 를 찾을 수 있다. 마이크로 블로그 정보가 지점 카테고리에 속하는지는, 마이크로 블로그 발표 사용자와 마이크로 블로그 요청 사용자의 주소가 동일한 지역(현, 구 등으로 설정할 수 있음)에 속하는지에 따라 판단할 수 있다. 마이크로 블로그가 재미 카테고리에 속하는지는 마이크로 블로그 발표 사용자의 ID에 따라 사용자의 재미 점수값을 이미 저장한 데이터베이스 내에서 찾은 재미 점수값이 미리 설정된 임계값보다 큰지에 따라 판단할 수 있다. 일 실시예에 있어서, 사용자의 재미 점수값은 해당 사용자에 대한 기타 사용자의 재미 평점에 따라 획득할 수 있다. 마이크로 블로그 정보가 도움요청 리포스팅 카테고리, 광고활동 카테고리에 속하는지는 마이크로 블로그 내용 내에 도움요청, 광고 고빈도 어휘 등의 출현 여부에 따라 판단할 수 있다.
일 실시예에 있어서, 마이크로 블로그 표시 타입에는 인기화제 카테고리가 더 포함될 수 있다. 구체적으로, 표시 카테고리 분류 모듈은 웹 페이지 내용을 분석하여 고빈도 기록을 획득하며, 마이크로 블로그 요청 사용자의 역사 마이크로 블로그 내용에 따라, 상기 고빈도 기록에 대해 평점을 수행하며, 고빈도 기록 평점에 따라 검색 결과 내의 마이크로 블로그를 선택하여 인기화제 카테고리로 분류시킨다.
바람직하게, 표시 카테고리 분류 모듈은 기존의 오픈소스 툴 Html-parser에 따라 웹 페이지 내용에 대한 분석을 통해 출현 횟수가 미리 설정된 임계값을 초과하는 어휘 그룹, 즉 고빈도 기록을 얻을 수 있다. 또한, 고빈도 기록과 마이크로 블로그 요청 사용자의 역사 마이크로 블로그 내용의 유사성에 따라 고빈도 기록에 대한 평점을 수행할 수 있다. 구체적으로, 고빈도 기록이 마이크로 블로그 요청 사용자에 의해 발표, 리포스팅, 평론된 마이크로 블로그 내용에서 출현된 횟수를 통계하여 해당 횟수에 따라 고빈도 기록에 대해 평점을 수행할 수 있다. 마지막으로, 평점이 미리 설정된 앞쪽 자리인 고빈도 기록을 선택하고 마이크로 블로그 내용 중 해당 고빈도 기록이 나타난 마이크로 블로그 정보를 선택하여 해당 마이크로 블로그 정보를 인기 화제 카테고리로 분류시킬 수 있다.
본 실시예에서, 표시 모듈(40)은, 마이크로 블로그 내용이 속하는 표시 카테고리 및 상기 배열의 결과에 따라 마이크로 블로그 정보를 표시하도록 구성된다.
구체적으로, 표시 모듈(40)은 마이크로 블로그 정보를 각 표시 카테고리에 따라 분류하여 표시하고 각 표시 카테고리에서 평점이 높은 마이크로 블로그 정보를 앞쪽으로 배열시킬 수 있다.
본 실시예에 있어서, 마이크로 블로그 정보를 여러 개의 표시 카테고리로 분할하여 표시함으로써 사용자가 자신이 관심 있는 마이크로 블로그 카테고리를 용이하게 선택하여 열람할 수 있도록 하여 사용자의 조작을 간편화한다. 또한, 각 표시 카테고리는 모두 마이크로 블로그의 평점의 내림차순으로 표시되며 배열 순서가 앞쪽인 마이크로 블로그는 그 마이크로 블로그 발표 사용자의 활성도가 비교적 높거나 마이크로 블로그 발표 사용자의 개인 정보와 마이크로 블로그 요청 사용자의 개인 정보 유사성이 비교적 높거나 마이크로 블로그 발표 사용자와 마이크로 블로그 요청 사용자의 연관성이 비교적 높아 사용자가 용이하게 자신과 관련된, 관심있는 마이크로 블로그를 열람할 수 있도록 한다.
마이크로 블로그 검색 방법에 있어서, 상기 마이크로 블로그 배열 방법에 따라 마이크로 블로그 검색 결과에 대해 배열을 수행하며, 상기 사용자에 의해 요청되는 마이크로 블로그 정보를 획득하는 단계에는, 사용자에 의해 입력되는 키워드에 따라 검색을 수행하여 사용자에 의해 요청되는 마이크로 블로그 정보를 획득하는 단계가 포함된다.
구체적으로, 기존의 검색 엔진을 이용하여, 사용자에 의해 입력된 키워드에 대해 검색을 수행하여, 키워드와 매칭되는 마이크로 블로그 정보를 찾아내어 사용자에 의해 요청된 마이크로 블로그 정보를 얻을 수 있도록 한다.
마이크로 블로그 검색 시스템에 있어서, 상기 마이크로 블로그 배열 시스템이 포함되며, 마이크로 블로그 정보 획득 모듈(10)은, 사용자에 의해 입력되는 키워드에 따라 검색을 수행하여 사용자에 의해 요청되는 마이크로 블로그 정보를 획득하도록 구성된다.
구체적으로, 마이크로 블로그 정보 획득 모듈(10)은 기존의 검색 엔진을 이용하여, 사용자에 의해 입력된 키워드에 대해 검색을 수행하여, 키워드와 매칭되는 마이크로 블로그 정보를 찾아내어 사용자에 의해 요청된 마이크로 블로그 정보를 얻을 수 있도록 한다.
마이크로 블로그 표시 방법에 있어서, 상기 마이크로 블로그 배열 방법에 따라 마이크로 블로그 요청 결과에 대해 배열을 수행하며, 사용자에 의해 요청되는 마이크로 블로그 정보를 획득하는 단계에는, 사용자 식별자에 대응되는 마이크로 블로그 요청 정보에 따라, 사용자에 의해 요청되는 마이크로 블로그 정보를 획득하는 단계가 포함된다.
일 실시예에 있어서, 사용자 식별자에 대응되는 마이크로 블로그 요청 정보를 미리 설정함에 있어서, 사용자 식별자에 대응되는 그룹의 마이크로 블로그 정보를 획득할 수 있다. 예를 들어, 사용자가 마이크로 블로그 계정에 로그인할 경우, 사용자 식별자(예를 들어 사용자 ID)에 따라 사용자가 주목하거나 구독하는 그룹 및 사용자 친구를 검색하여 해당 그룹 및 사용자 친구의 최근의 마이크로 블로그 정보를 획득하여 사용자에 의해 요청되는 마이크로 블로그 정보를 얻을 수 있다.
마이크로 블로그 표시 시스템에 있어서, 상기 마이크로 블로그 배열 시스템이 포함되며, 마이크로 블로그 정보 획득 모듈(10)은 사용자 식별자에 대응되는 마이크로 블로그 요청 정보에 따라 상기 사용자에 의해 요청되는 마이크로 블로그 정보를 획득하도록 구성된다.
일 실시예에 있어서, 사용자 식별자에 대응되는 마이크로 블로그 요청 정보를 미리 설정함에 있어서, 사용자 식별자에 대응되는 그룹의 마이크로 블로그 정보를 획득할 수 있다. 예를 들어, 사용자가 마이크로 블로그 계정에 로그인할 경우, 마이크로 블로그 정보 획득 모듈(10)은 사용자 식별자(예를 들어 사용자 ID)에 따라 사용자가 주목하거나 구독하는 그룹 및 사용자 친구를 검색하여 해당 그룹 및 사용자 친구의 최근의 마이크로 블로그 정보를 획득하여 사용자에 의해 요청되는 마이크로 블로그 정보를 얻을 수 있다.
본 분야의 통상의 지식을 가진 자라면, 컴퓨터 프로그램으로 관련 하드웨어를 제어함으로써 상기 실시예 방법 내의 전부 또는 부분 프로세스를 구현할 수 있으며 상기 프로그램은 컴퓨터 판독 가능한 저장 매체 내에 저장되어 해당 프로그램의 실행 시 상기 각 방법의 실시예와 같은 프로세스를 포함할 수 있다는 점을 이해할 것이다. 여기서, 상기 저장 매체는 디스켓, 광 디스크, 읽기 전용 메모리(Read-Only Memory, ROM) 또는 랜덤 액세스 메모리(Random Access Memory, RAM) 등 일 수 있다.
상기 실시예는 본 발명의 몇 가지 실시방식을 보여줄 뿐이며 그 설명이 비교적 구체적이고 상세하지만 이로써 본 발명의 특허청구범위에 대한 제한으로 이해하여서는 안된다. 설명해야 할 점이라면, 본 분야의 통상의 지식을 가진 자라면 본 발명의 구상을 벗어나지 않는 전제하에 여러 가지 변형과 개진을 더 할 수 있으며 이들 모두가 본 발명의 보호범위에 속한다. 따라서, 본 발명에 따른 특허의 보호범위는 응당 첨부된 특허청구범위를 기준으로 해야 한다.

Claims (18)

  1. 사용자에 의해 요청되는 마이크로 블로그 정보를 획득하는 단계;
    상기 마이크로 블로그 정보 내의 마이크로 블로그 발표 사용자 정보와 내용 정보를 추출하여 상기 마이크로 블로그 정보에 대해 평점을 수행하는 단계;
    상기 평점에 따라 상기 마이크로 블로그 정보에 대해 배열을 수행하는 단계; 및
    상기 배열의 결과에 따라 상기 마이크로 블로그 정보를 표시하는 단계가 포함되는
    것을 특징으로 하는 마이크로 블로그 배열 방법.
  2. 청구항 1에 있어서,
    상기 마이크로 블로그 정보 내의 마이크로 블로그 발표 사용자 정보를 추출하여 상기 마이크로 블로그 정보에 대해 평점을 수행하는 단계에는,
    상기 마이크로 블로그 발표 사용자의 마이크로 블로그 운영 기록을 획득하여 상기 마이크로 블로그 운영 기록에 따라 상기 마이크로 블로그 발표 사용자의 활성도를 산출하는 단계; 및
    상기 활성도에 따라 상기 마이크로 블로그 정보에 대해 평점을 수행하는 단계가 포함되는
    것을 특징으로 하는 마이크로 블로그 배열 방법.
  3. 청구항 1 또는 청구항 2에 있어서,
    상기 마이크로 블로그 정보 내의 마이크로 블로그 발표 사용자 정보를 추출하여 상기 마이크로 블로그 정보에 대해 평점을 수행하는 단계에는,
    상기 마이크로 블로그 발표 사용자의 개인 정보 및 마이크로 블로그 요청 사용자의 개인 정보를 획득하여 상기 마이크로 블로그 발표 사용자의 개인 정보와 상기 마이크로 블로그 요청 사용자의 개인 정보 사이의 유사성을 산출하는 단계;
    상기 마이크로 블로그 발표 사용자와 상기 마이크로 블로그 요청 사용자 사이의 인터랙션 기록을 획득하여, 상기 인터랙션 기록에 따라 상기 마이크로 블로그 발표 사용자와 상기 마이크로 블로그 요청 사용자 사이의 연관성을 산출하는 단계; 및
    상기 유사성과 상기 연관성에 따라 상기 마이크로 블로그 정보에 대해 평점을 수행하는 단계가 포함되는
    것을 특징으로 하는 마이크로 블로그 배열 방법.
  4. 청구항 1에 있어서,
    상기 마이크로 블로그 정보 내의 내용 정보를 추출하여 상기 마이크로 블로그 정보에 대해 평점을 수행하는 단계에는,
    상기 마이크로 블로그 정보 내의 마이크로 블로그 내용을 획득하여 상기 마이크로 블로그 내용 및 마이크로 블로그 주제별 카테고리의 특징에 따라 상기 마이크로 블로그 정보 내의 마이크로 블로그 내용의 주제별 카테고리 벡터를 획득하는 단계;
    마이크로 블로그 요청 사용자의 역사 마이크로 블로그 내용을 획득하여 상기 역사 마이크로 블로그 내용 및 마이크로 블로그 주제별 카테고리의 특징에 따라 상기 마이크로 블로그 요청 사용자의 역사 마이크로 블로그 내용의 주제별 카테고리 벡터를 획득하는 단계;
    상기 마이크로 블로그 정보 내의 마이크로 블로그 내용의 주제별 카테고리 벡터와 상기 마이크로 블로그 요청 사용자의 역사 마이크로 블로그 내용의 주제별 카테고리 벡터에 따라, 상기 마이크로 블로그 정보 내의 마이크로 블로그 내용과 상기 마이크로 블로그 요청 사용자의 역사 마이크로 블로그 내용 사이의 유사성을 산출하는 단계; 및
    상기 유사성에 따라 상기 마이크로 블로그 정보에 대해 평점을 수행하는 단계가 포함되는
    것을 특징으로 하는 마이크로 블로그 배열 방법.
  5. 청구항 4에 있어서,
    상기 마이크로 블로그 정보 내의 내용 정보를 추출하여 상기 마이크로 블로그 정보에 대해 평점을 수행하는 단계 전에,
    미리 설정된 마이크로 블로그 주제별 카테고리를 획득하는 단계;
    상기 마이크로 블로그 주제별 카테고리의 훈련 서브 집합을 획득하는 단계; 및
    상기 훈련 서브 집합으로부터 상기 마이크로 블로그 주제별 카테고리의 특징을 추출하는 단계가 더 포함되는
    것을 특징으로 하는 마이크로 블로그 배열 방법.
  6. 청구항 5에 있어서,
    상기 마이크로 블로그 주제별 카테고리의 훈련 서브 집합을 획득하는 단계에는,
    상기 마이크로 블로그 주제별 카테고리의 키워드에 따라 마이크로 블로그를 검색하여 상기 마이크로 블로그 주제별 카테고리의 초기 훈련 서브 집합을 획득하는 단계; 및
    미리 설정된 횟수에 따라, 상기 초기 훈련 서브 집합 내의 고빈도 어휘를 통계하는 단계와 상기 고빈도 어휘에 따라 마이크로 블로그를 검색하여 검색 결과를 상기 초기 훈련 서브 집합에 추가하는 단계를 반복적으로 수행하는 단계가 포함되는
    것을 특징으로 하는 마이크로 블로그 배열 방법.
  7. 청구항 1에 있어서,
    상기 배열의 결과에 따라 상기 마이크로 블로그 정보를 표시하는 단계 전에,
    미리 설정된 마이크로 블로그 표시 카테고리에 따라 상기 마이크로 블로그 정보 내의 마이크로 블로그 내용에 대해 분류하여 마이크로 블로그 내용이 속하는 표시 카테고리를 얻는 단계가 더 포함되며,
    상기 배열의 결과에 따라 상기 마이크로 블로그 정보를 표시하는 단계에서, 상기 마이크로 블로그 내용이 속하는 표시 카테고리 및 상기 배열의 결과에 따라 상기 마이크로 블로그 정보를 표시하는
    것을 특징으로 하는 마이크로 블로그 배열 방법.
  8. 사용자에 의해 요청되는 마이크로 블로그 정보를 획득하도록 구성되는 마이크로 블로그 정보 획득 모듈;
    상기 마이크로 블로그 정보 내의 마이크로 블로그 발표 사용자 정보를 추출하여 상기 마이크로 블로그 발표 사용자 정보에 따라 상기 마이크로 블로그 정보에 대해 평점을 수행하도록 구성되는 사용자 정보 평점 모듈과, 상기 마이크로 블로그 정보 내의 내용 정보를 추출하여 상기 내용 정보에 따라 상기 마이크로 블로그 정보에 대해 평점을 수행하도록 구성되는 내용 정보 평점 모듈을 포함하는 평점 모듈;
    상기 평점에 따라 상기 마이크로 블로그 정보에 대해 배열을 수행하도록 구성되는 배열 모듈; 및
    상기 배열의 결과에 따라 상기 마이크로 블로그 정보를 표시하도록 구성되는 표시 모듈이 포함되는
    것을 특징으로 하는 마이크로 블로그 배열 시스템.
  9. 청구항 8에 있어서,
    상기 사용자 정보 평점 모듈에는,
    상기 마이크로 블로그 발표 사용자의 마이크로 블로그 운영 기록을 획득하여 상기 마이크로 블로그 운영 기록에 따라 상기 마이크로 블로그 발표 사용자의 활성도를 산출하도록 구성되는 활성도 산출 유닛; 및
    상기 활성도에 따라 상기 마이크로 블로그 정보에 대해 평점을 수행하도록 구성되는 제1 평점 유닛이 포함되는
    것을 특징으로 하는 마이크로 블로그 배열 시스템.
  10. 청구항 8 또는 청구항 9에 있어서,
    상기 사용자 정보 평점 모듈에는,
    상기 마이크로 블로그 발표 사용자의 개인 정보 및 마이크로 블로그 요청 사용자의 개인 정보를 획득하여 상기 마이크로 블로그 발표 사용자의 개인 정보와 상기 마이크로 블로그 요청 사용자의 개인 정보 사이의 유사성을 산출하도록 구성되는 개인 정보 유사성 산출 유닛;
    상기 마이크로 블로그 발표 사용자와 상기 마이크로 블로그 요청 사용자 사이의 인터랙션 기록을 획득하여, 상기 인터랙션 기록에 따라 상기 마이크로 블로그 발표 사용자와 상기 마이크로 블로그 요청 사용자 사이의 연관성을 산출하도록 구성되는 연관성 산출 유닛; 및
    상기 유사성과 상기 연관성에 따라 상기 마이크로 블로그 정보에 대해 평점을 수행하도록 구성되는 제2 평점 유닛이 포함되는
    것을 특징으로 하는 마이크로 블로그 배열 시스템.
  11. 청구항 8에 있어서,
    상기 내용 정보 평점 모듈에는,
    상기 마이크로 블로그 정보 내의 마이크로 블로그 내용을 획득하여 상기 마이크로 블로그 내용 및 마이크로 블로그 주제별 카테고리의 특징에 따라 상기 마이크로 블로그 정보 내의 마이크로 블로그 내용의 주제별 카테고리 벡터를 획득하도록 구성되며, 또한 마이크로 블로그 요청 사용자의 역사 마이크로 블로그 내용을 획득하여 상기 역사 마이크로 블로그 내용 및 마이크로 블로그 주제별 카테고리의 특징에 따라 상기 마이크로 블로그 요청 사용자의 역사 마이크로 블로그 내용의 주제별 카테고리 벡터를 획득하도록 구성되는 카테고리 벡터 추출 유닛;
    상기 마이크로 블로그 정보 내의 마이크로 블로그 내용의 주제별 카테고리 벡터와 상기 마이크로 블로그 요청 사용자의 역사 마이크로 블로그 내용의 주제별 카테고리 벡터에 따라, 상기 마이크로 블로그 정보 내의 마이크로 블로그 내용과 상기 마이크로 블로그 요청 사용자의 역사 마이크로 블로그 내용 사이의 유사성을 산출하도록 구성되는 내용 유사성 산출 유닛; 및
    상기 유사성에 따라 상기 마이크로 블로그 정보에 대해 평점을 수행하도록 구성되는 제3 평점 유닛이 포함되는
    것을 특징으로 하는 마이크로 블로그 배열 시스템.
  12. 청구항 11에 있어서,
    분류 모델 훈련 모듈이 더 포함되며,
    상기 분류 모델 훈련 모듈에는,
    미리 설정된 마이크로 블로그 주제별 카테고리를 획득하도록 구성되는 주제별 카테고리 획득 모듈;
    상기 마이크로 블로그 주제별 카테고리의 훈련 서브 집합을 획득하도록 구성되는 훈련 집합 획득 모듈; 및
    상기 훈련 서브 집합으로부터 상기 마이크로 블로그 주제별 카테고리의 특징을 추출하도록 구성되는 특징 추출 모듈이 포함되는
    것을 특징으로 하는 마이크로 블로그 배열 시스템.
  13. 청구항 12에 있어서,
    상기 훈련 집합 획득 모듈은,
    상기 마이크로 블로그 주제별 카테고리의 키워드에 따라 마이크로 블로그를 검색하여 상기 마이크로 블로그 주제별 카테고리의 초기 훈련 서브 집합을 획득하고, 미리 설정된 횟수에 따라, 상기 초기 훈련 서브 집합 내의 고빈도 어휘를 통계하는 단계와 상기 고빈도 어휘에 따라 마이크로 블로그를 검색하여 검색 결과를 상기 초기 훈련 서브 집합에 추가하는 단계를 반복적으로 수행하도록 구성되는
    것을 특징으로 하는 마이크로 블로그 배열 시스템.
  14. 청구항 8에 있어서,
    미리 설정된 마이크로 블로그 표시 카테고리에 따라 상기 마이크로 블로그 정보 내의 마이크로 블로그 내용에 대해 분류하여 상기 마이크로 블로그 내용이 속하는 표시 카테고리를 얻도록 구성되는 표시 카테고리 분류 모듈이 더 포함되며,
    상기 표시 모듈은 또한 상기 마이크로 블로그 내용이 속하는 표시 카테고리 및 상기 배열의 결과에 따라 상기 마이크로 블로그 정보를 표시하도록 구성되는
    것을 특징으로 하는 마이크로 블로그 배열 시스템.
  15. 청구항 1 내지 청구항 7 중의 어느 한 항에 따른 마이크로 블로그 배열 방법에 따라 마이크로 블로그 검색 결과에 대해 배열을 수행하며, 상기 사용자에 의해 요청되는 마이크로 블로그 정보를 획득하는 단계에는, 사용자에 의해 입력되는 키워드에 따라 검색을 수행하여 상기 사용자에 의해 요청되는 마이크로 블로그 정보를 획득하는 단계가 포함되는
    것을 특징으로 하는 마이크로 블로그 검색 방법.
  16. 청구항 8 내지 청구항 14 중의 어느 한 항에 따른 마이크로 블로그 배열 시스템이 포함되며, 상기 마이크로 블로그 정보 획득 모듈은, 사용자에 의해 입력되는 키워드에 따라 검색을 수행하여 상기 사용자에 의해 요청되는 마이크로 블로그 정보를 획득하도록 구성되는
    것을 특징으로 하는 마이크로 블로그 검색 시스템.
  17. 청구항 1 내지 청구항 7 중의 어느 한 항에 따른 마이크로 블로그 배열 방법에 따라 마이크로 블로그 요청 결과에 대해 배열을 수행하며, 상기 사용자에 의해 요청되는 마이크로 블로그 정보를 획득하는 단계에는, 사용자 식별자에 대응되는 마이크로 블로그 요청 정보에 따라, 상기 사용자에 의해 요청되는 마이크로 블로그 정보를 획득하는 단계가 포함되는
    것을 특징으로 하는 마이크로 블로그 표시 방법.
  18. 청구항 8 내지 청구항 14 중의 어느 한 항에 따른 마이크로 블로그 배열 시스템이 포함되며, 상기 마이크로 블로그 정보 획득 모듈은 사용자 식별자에 대응되는 마이크로 블로그 요청 정보에 따라 상기 사용자에 의해 요청되는 마이크로 블로그 정보를 획득하도록 구성되는
    것을 특징으로 하는 마이크로 블로그 표시 시스템.
KR1020137031978A 2012-02-09 2013-02-04 마이크로 블로그 배열, 검색 및 표시 방법과 시스템 KR20140012750A (ko)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
CN201210028740.7 2012-02-09
CN201210028740.7A CN103246670B (zh) 2012-02-09 2012-02-09 微博排序、搜索、展示方法和系统
PCT/CN2013/071325 WO2013117147A1 (zh) 2012-02-09 2013-02-04 微博排序、搜索、展示方法和系统

Publications (1)

Publication Number Publication Date
KR20140012750A true KR20140012750A (ko) 2014-02-03

Family

ID=48926194

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020137031978A KR20140012750A (ko) 2012-02-09 2013-02-04 마이크로 블로그 배열, 검색 및 표시 방법과 시스템

Country Status (7)

Country Link
US (1) US9785677B2 (ko)
EP (1) EP2704040A4 (ko)
JP (1) JP2014522540A (ko)
KR (1) KR20140012750A (ko)
CN (1) CN103246670B (ko)
AP (1) AP2014007382A0 (ko)
WO (1) WO2013117147A1 (ko)

Families Citing this family (19)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103678474B (zh) * 2013-09-24 2016-10-05 浙江大学 一种在社交网络中快速获取大量热门话题的方法
CN103744918A (zh) * 2013-12-27 2014-04-23 东软集团股份有限公司 基于垂直领域的微博搜索排序方法及系统
CN104899201B (zh) * 2014-03-04 2019-05-14 腾讯科技(北京)有限公司 文本提取方法、敏感词判定方法、装置和服务器
CN104317881B (zh) * 2014-04-11 2017-11-24 北京理工大学 一种基于用户话题权威性的微博重排序方法
US9819618B2 (en) * 2014-06-18 2017-11-14 Microsoft Technology Licensing, Llc Ranking relevant discussion groups
US9819633B2 (en) * 2014-06-18 2017-11-14 Social Compass, LLC Systems and methods for categorizing messages
CN106294363A (zh) * 2015-05-15 2017-01-04 厦门美柚信息科技有限公司 一种论坛帖子评价方法、装置及系统
JP6842825B2 (ja) * 2015-09-25 2021-03-17 株式会社ユニバーサルエンターテインメント 情報提供システム、情報提供方法、及びプログラム
CN105468714B (zh) * 2015-11-20 2018-11-09 北京邮电大学 一种基于论坛的自媒体信息展示方法和系统
CN105808722B (zh) * 2016-03-08 2020-07-24 苏州大学 一种信息判别方法和系统
CN105824951B (zh) * 2016-03-23 2019-10-11 百度在线网络技术(北京)有限公司 检索方法和装置
CN106027303B (zh) * 2016-05-24 2019-07-16 腾讯科技(深圳)有限公司 一种征信特征获取方法及其设备
CN107844492A (zh) * 2016-09-19 2018-03-27 阿里巴巴集团控股有限公司 一种进行对象排序和展示搜索对象的方法及设备
CN108280198B (zh) * 2018-01-29 2021-03-02 口碑(上海)信息技术有限公司 榜单生成方法及装置
CN109885763B (zh) * 2019-01-26 2021-04-16 北京工业大学 一种基于用户头像的博文推荐方法
CN109948313B (zh) * 2019-03-15 2022-11-25 江苏金智教育信息股份有限公司 一种个人信息查看赋权的方法和装置
CN110941759B (zh) * 2019-11-20 2022-11-11 国元证券股份有限公司 一种微博情感分析方法
CN111860299B (zh) * 2020-07-17 2023-09-08 北京奇艺世纪科技有限公司 目标对象的等级确定方法、装置、电子设备及存储介质
CN117093762B (zh) * 2023-07-18 2024-02-13 南京特尔顿信息科技有限公司 一种舆情数据评估分析系统及方法

Family Cites Families (34)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH09231238A (ja) * 1996-02-20 1997-09-05 Omron Corp テキスト検索結果表示方法及び装置
JP2006185356A (ja) * 2004-12-28 2006-07-13 Canon Inc 情報処理装置及びその処理方法、プログラム、記憶媒体、並びに文書分類システム
US7421429B2 (en) * 2005-08-04 2008-09-02 Microsoft Corporation Generate blog context ranking using track-back weight, context weight and, cumulative comment weight
US8244720B2 (en) * 2005-09-13 2012-08-14 Google Inc. Ranking blog documents
US7765209B1 (en) * 2005-09-13 2010-07-27 Google Inc. Indexing and retrieval of blogs
US8171128B2 (en) * 2006-08-11 2012-05-01 Facebook, Inc. Communicating a newsfeed of media content based on a member's interactions in a social network environment
JP2007334502A (ja) * 2006-06-13 2007-12-27 Fujifilm Corp 検索装置、方法およびプログラム
CN101004749A (zh) * 2006-12-26 2007-07-25 朱莉君 一种互联网用户交流平台的构建方法
JP4802125B2 (ja) * 2007-03-09 2011-10-26 富士通株式会社 ウェブログ管理プログラム、ウェブログ管理装置およびウェブログ管理方法
US8572094B2 (en) 2007-08-17 2013-10-29 Google Inc. Ranking social network objects
CN101561805B (zh) * 2008-04-18 2014-06-25 日电(中国)有限公司 文档分类器生成方法和系统
US20100042612A1 (en) * 2008-07-11 2010-02-18 Gomaa Ahmed A Method and system for ranking journaled internet content and preferences for use in marketing profiles
CN101661474B (zh) * 2008-08-26 2012-07-04 华为技术有限公司 一种搜索方法和系统
US8145636B1 (en) * 2009-03-13 2012-03-27 Google Inc. Classifying text into hierarchical categories
JP2010218475A (ja) 2009-03-19 2010-09-30 Nifty Corp ブログ分析方法及び装置
KR20100125697A (ko) 2009-05-21 2010-12-01 장경호 블로그를 이용한 광고 및 정보 제공 시스템
US8719302B2 (en) * 2009-06-09 2014-05-06 Ebh Enterprises Inc. Methods, apparatus and software for analyzing the content of micro-blog messages
US8539161B2 (en) 2009-10-12 2013-09-17 Microsoft Corporation Pre-fetching content items based on social distance
CN102088419B (zh) * 2009-12-07 2012-08-15 倪加元 一种在社交网络中查找好友信息的方法和系统
US20110178995A1 (en) * 2010-01-21 2011-07-21 Microsoft Corporation Microblog search interface
US8606792B1 (en) * 2010-02-08 2013-12-10 Google Inc. Scoring authors of posts
US20110231296A1 (en) * 2010-03-16 2011-09-22 UberMedia, Inc. Systems and methods for interacting with messages, authors, and followers
US8751511B2 (en) * 2010-03-30 2014-06-10 Yahoo! Inc. Ranking of search results based on microblog data
US20110302103A1 (en) * 2010-06-08 2011-12-08 International Business Machines Corporation Popularity prediction of user-generated content
US8583674B2 (en) * 2010-06-18 2013-11-12 Microsoft Corporation Media item recommendation
US8954451B2 (en) * 2010-06-30 2015-02-10 Hewlett-Packard Development Company, L.P. Selecting microblog entries based on web pages, via path similarity within hierarchy of categories
US20120042020A1 (en) * 2010-08-16 2012-02-16 Yahoo! Inc. Micro-blog message filtering
US9324112B2 (en) * 2010-11-09 2016-04-26 Microsoft Technology Licensing, Llc Ranking authors in social media systems
CN102063488A (zh) * 2010-12-29 2011-05-18 南京航空航天大学 一种基于语义的代码搜索方法
US8825679B2 (en) * 2011-02-15 2014-09-02 Microsoft Corporation Aggregated view of content with presentation according to content type
WO2012174638A1 (en) * 2011-06-22 2012-12-27 Rogers Communications Inc. System and method for filtering documents
CN102332006B (zh) * 2011-08-03 2016-08-03 百度在线网络技术(北京)有限公司 一种信息推送控制方法及装置
US8751917B2 (en) * 2011-11-30 2014-06-10 Facebook, Inc. Social context for a page containing content from a global community
US20130159277A1 (en) * 2011-12-14 2013-06-20 Microsoft Corporation Target based indexing of micro-blog content

Also Published As

Publication number Publication date
US20140108388A1 (en) 2014-04-17
EP2704040A4 (en) 2015-08-05
AP2014007382A0 (en) 2014-01-31
CN103246670A (zh) 2013-08-14
US9785677B2 (en) 2017-10-10
EP2704040A1 (en) 2014-03-05
JP2014522540A (ja) 2014-09-04
WO2013117147A1 (zh) 2013-08-15
CN103246670B (zh) 2016-02-17

Similar Documents

Publication Publication Date Title
KR20140012750A (ko) 마이크로 블로그 배열, 검색 및 표시 방법과 시스템
US9165305B1 (en) Generating models based on user behavior
US9444772B2 (en) Social search engine
US8935192B1 (en) Social search engine
US9536003B2 (en) Method and system for hybrid information query
Luo et al. An effective approach to tweets opinion retrieval
Rahim Taleqani et al. Public opinion on dockless bike sharing: A machine learning approach
CN110942337A (zh) 一种基于互联网大数据的精准旅游营销方法
US9633119B2 (en) Content ranking based on user features in content
US9317594B2 (en) Social community identification for automatic document classification
US20090106307A1 (en) System of a knowledge management and networking environment and method for providing advanced functions therefor
US20120197993A1 (en) Skill ranking system
KR20160057475A (ko) 소셜 데이터를 능동적으로 획득하기 위한 시스템 및 방법
US20160117397A1 (en) System and method for identifying experts on social media
Al-Kabi et al. Content-based analysis to detect Arabic web spam
CN113934941A (zh) 一种基于多维度信息的用户推荐系统及方法
Zhu et al. Real-time personalized twitter search based on semantic expansion and quality model
US20150186932A1 (en) Systems and methods for a unified audience targeting solution
Tarasova Classification of hate tweets and their reasons using svm
Shayegan et al. A method for identifying personality traits in telegram
Shayegan et al. A Recommender System based on the analysis of personality traits in Telegram social network
Samarawickrama et al. Search result personalization in Twitter using neural word embeddings
Li et al. User communities and contents co‐ranking for user‐generated content quality evaluation in social networks
US20200226159A1 (en) System and method of generating reading lists
Tiwary et al. Determination Of Category–Wise Influential Users Using Information Retrieval Technique from Twitter

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E601 Decision to refuse application