CN108664483B - 特定用户群体的管理方法及管理系统 - Google Patents

特定用户群体的管理方法及管理系统 Download PDF

Info

Publication number
CN108664483B
CN108664483B CN201710190782.3A CN201710190782A CN108664483B CN 108664483 B CN108664483 B CN 108664483B CN 201710190782 A CN201710190782 A CN 201710190782A CN 108664483 B CN108664483 B CN 108664483B
Authority
CN
China
Prior art keywords
user
evaluation value
evaluation
group
user group
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
CN201710190782.3A
Other languages
English (en)
Other versions
CN108664483A (zh
Inventor
李宇涵
曹六一
张丹
于晓明
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
New Founder Holdings Development Co ltd
Beijing Founder Electronics Co Ltd
Original Assignee
Peking University Founder Group Co Ltd
Beijing Founder Electronics Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Peking University Founder Group Co Ltd, Beijing Founder Electronics Co Ltd filed Critical Peking University Founder Group Co Ltd
Priority to CN201710190782.3A priority Critical patent/CN108664483B/zh
Publication of CN108664483A publication Critical patent/CN108664483A/zh
Application granted granted Critical
Publication of CN108664483B publication Critical patent/CN108664483B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/01Social networking

Landscapes

  • Business, Economics & Management (AREA)
  • Engineering & Computer Science (AREA)
  • Primary Health Care (AREA)
  • Strategic Management (AREA)
  • Economics (AREA)
  • General Health & Medical Sciences (AREA)
  • Human Resources & Organizations (AREA)
  • Marketing (AREA)
  • Computing Systems (AREA)
  • Health & Medical Sciences (AREA)
  • Tourism & Hospitality (AREA)
  • Physics & Mathematics (AREA)
  • General Business, Economics & Management (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • Information Transfer Between Computers (AREA)

Abstract

本发明提供了一种特定用户群体的管理方法和一种特定用户群体的管理系统,其中,所述特定用户群体的管理方法包括:获取待筛选用户群体中每个用户的社交基本信息;根据所述社交基本信息分析确定所述每个用户的多个用户评价参数值;将所述多个用户评价参数值进行加权计算确定所述每个用户的综合评价值;根据所述综合评价值确定是否将所述每个用户自所述待筛选用户群体移至特定用户群体中。通过本发明的技术方案,可以实现对特定用户群体快速准确地扩展筛选,以便于准确地、有方向性地进行舆情追踪。

Description

特定用户群体的管理方法及管理系统
技术领域
本发明涉及数据处理技术领域,具体而言,涉及特定用户群体的管理方法和特定用户群体的管理系统。
背景技术
目前,随着互联网的急速发展,越来越多的人倾向于在网络中获取资讯、发表观点等,各类社交活动都已经开始向互联网迁移。而社交媒体作为互联网社交的重要组成部分,越来越多的人选择在社交媒体中设立账号、发布信息。由于社交媒体用户基数的庞大和互联网的迅捷,其内容扩展的速度与广度都远远高于传统媒体,使得社交媒体上传播的信息极有可能快速而强烈地威胁到社会公共安全。因此对社交媒体进行长时间的追踪是十分必要的,但是社交媒体用户数量过于庞大且不活跃用户占据主流,对全部用户进行实时追踪是十分浪费资源且不现实的处理方式,故根据种子用户使用社交媒体的特点快速扩展并筛选出值得进行追踪观察的用户群体是十分重要的。
现有的用户评价体系一般只基于某些特定的指标评定用户优先级,无法全局综合性地评价用户价值,且也很难人工对结果进行干预,无法突出重点用户,并且需要大量采集用户信息后才能对用户进行评价。
发明内容
本发明正是基于上述技术问题,提出了一种新的技术方案,基于社交媒体的用户行为特征分析对待筛选用户群体中的每个用户进行综合评价,并根据评价结果进行剪枝,实现对特定用户群体快速准确地扩展筛选,提高扩展速度,且便于准确地、有方向性地进行舆情追踪。
有鉴于此,本发明的第一方面,提出了一种特定用户群体的管理方法,包括:获取待筛选用户群体中每个用户的社交基本信息;根据所述社交基本信息分析确定所述每个用户的多个用户评价参数值;将所述多个用户评价参数值进行加权计算确定所述每个用户的综合评价值;根据所述综合评价值确定是否将所述每个用户自所述待筛选用户群体移至特定用户群体中。
在该技术方案中,通过对社交媒体中的待筛选用户群体中的每个用户的社交基本信息进行分析,从而确定每个用户的用于评价其媒体账号的综合评价值的多个用户评价参数值,具体通过对该多个用户评价参数值进行加权计算确定该综合评价值,以根据该综合评价值确定是否将该每个用户自待筛选用户群体转移至特定用户群体,通过对待筛选用户群体进行综合评价及剪枝实现对特定用户群体的快速而准确地扩展筛选,从而提高特定用户群体的扩展速度,以对特定用户群体进行舆情追踪,避免对社交媒体中过多用户进行实时追踪的资源浪费,同时能够掌控社交媒体的信息传播主流动态,即特定用户群体是指在社交媒体中需要对其进行舆情追踪的用户群体。
在上述技术方案中,优选地,所述根据所述综合评价值确定是否将所述每个用户自所述待筛选用户群体移至特定用户群体中的步骤,包括:根据所述综合评价值和阈值计算公式确定所述每个用户的评价阈值;判断所述评价阈值是否大于或等于预设阈值;若是,则将所述每个用户自所述待筛选用户群体移至所述特定用户群体中,否则将所述每个用户保留在所述待筛选用户群体中。
在该技术方案中,具体可以根据阈值计算公式和每个用户的综合评价值确定每个用户的评价阈值,进而根据该评价阈值与预设阈值的大小比较结果确定是否将每个用户自待筛选用户群体移至特定用户群体中,若该评价阈值大于或等于预设阈值则对特定用户群体进行扩展,否则将该用户继续保留在待筛选用户群体中,避免增加舆情追踪的工作量,提高舆情追踪的有效价值。
在上述任一技术方案中,优选地,所述阈值计算公式为:
Figure BDA0001256102770000021
Figure BDA0001256102770000022
其中,T代表所述评价阈值,
Figure BDA0001256102770000023
代表所述综合评价值的算术平均值,D(S)代表所述综合评价值的方差,a和b为常数。
在该技术方案中,通过获取每个用户的多组综合评价值,并基于该多组综合评价值的算术平均值和方差值计算其评价阈值,以确保计算结果的准确性和稳定性,其中,a和b为可调节的常数,用于调整评价阈值使其适用于定向程度具有不同需求的采集环境,使得计算结果更加符合用户需求。
在上述任一技术方案中,优选地,所述多个用户评价参数值包括:相似性评价值、言论评价值、注册信息评价值和影响力评价值,其中,所述相似性评价值是指所述每个用户与所述特定用户群体的特征相似度值;以及采用如下公式加权计算所述综合评价值:S=Am+Bn+Cp+Dq,其中,S代表所述综合评价值,m代表所述相似性评价值,n代表所述言论评价值,p代表所述注册信息评价值,q代表所述影响力评价值,以及A、B、C和D为常数,且A+B+C+D=1。
在该技术方案中,具体可以通过对待筛选用户群体中的每个用户的社交基本信息分析确定其至少包括相似性评价值、言论评价值、注册信息评价值和影响力评价值,其中,言论评价值、注册信息评价值和影响力评价值是分别对每个用户最近发表的言论、注册社交媒体账号时填写的信息以及每个用户的舆情影响力的评价值,而相似性评价值用于表征每个用户与特定用户群体中已有用户的相似程度,从而结合多个方面对用户的舆情追踪价值进行综合评价;进一步地,可以基于上述公式对每个用户的综合评价值进行准确的加权计算。
在上述任一技术方案中,优选地,所述社交基本信息包括:用户发帖内容信息、用户发帖数量、用户发帖评论数、用户发帖转发数、用户发帖点赞数、用户注册信息完整度、用户基本注册信息;以及所述根据所述社交基本信息分析确定所述每个用户的多个用户评价参数值的步骤包括:根据所述用户发帖内容信息分析确定所述相似性评价值;根据所述用户发帖数量和所述用户发帖内容信息分析确定所述言论评价值;根据所述用户注册信息完整度和所述用户基本注册信息分析确定所述注册信息评价值;根据所述用户发帖评论数、所述用户发帖转发数和所述用户发帖点赞数分析确定所述影响力评价值。
在该技术方案中,用于评估待筛选用户群体中的每个用户的各个用户评价参数值的社交基本信息至少可以包括:用户发帖内容信息、用户发帖数量、用户发帖评论数、用户发帖转发数、用户发帖点赞数、用户注册信息完整度、用户基本注册信息,具体地可以基于用户发帖内容信息分析确定对应用户与特定用户群体的相似性评价值,根据用户发帖数量和用户发帖内容信息分析确定对应用户的言论评价值,根据用户注册信息完整度和用户基本注册信息分析确定对应用户的注册信息评价值,根据用户发帖评论数、用户发帖转发数和用户发帖点赞数分析确定对应用户的影响力评价值;当然,用户的社交基本信息还可以包括其用户自我介绍信息、社交媒体账号的用户关注者数量和被用户关注者数量等,比如,在分析确定用户的相似性评价值时可以综合考虑用户自我介绍信息,在分析确定用户的言论评价值时可以综合考虑用户发帖的原创比,以及在分析确定用户的影响力评价值可以综合考虑用户关注者数量和被用户关注者数量,以使评价结果更加准确、更具有说服力。
根据本发明的第二方面,提出了一种特定用户群体的管理系统,包括:获取模块,用于获取待筛选用户群体中每个用户的社交基本信息;分析模块,用于根据所述获取模块获取的所述社交基本信息分析确定所述每个用户的多个用户评价参数值;计算模块,用于将所述分析模块确定的所述多个用户评价参数值进行加权计算确定所述每个用户的综合评价值;处理模块,用于根据所述计算模块得到的所述综合评价值确定是否将所述每个用户自所述待筛选用户群体移至特定用户群体中。
在该技术方案中,通过对社交媒体中的待筛选用户群体中的每个用户的社交基本信息进行分析,从而确定每个用户的用于评价其媒体账号的综合评价值的多个用户评价参数值,具体通过对该多个用户评价参数值进行加权计算确定该综合评价值,以根据该综合评价值确定是否将该每个用户自待筛选用户群体转移至特定用户群体,通过对待筛选用户群体进行综合评价及剪枝实现对特定用户群体的快速而准确地扩展筛选,从而提高特定用户群体的扩展速度,以对特定用户群体进行舆情追踪,避免对社交媒体中过多用户进行实时追踪的资源浪费,同时能够掌控社交媒体的信息传播主流动态,即特定用户群体是指在社交媒体中需要对其进行舆情追踪的用户群体。
在上述技术方案中,优选地,所述处理模块具体包括:确定子模块,用于根据所述综合评价值和阈值计算公式确定所述每个用户的评价阈值;判断子模块,用于判断所述评价阈值是否大于或等于预设阈值;处理子模块,用于在所述判断子模块判定为是时,将所述每个用户自所述待筛选用户群体移至所述特定用户群体中,否则将所述每个用户保留在所述待筛选用户群体中。
在该技术方案中,具体可以根据阈值计算公式和每个用户的综合评价值确定每个用户的评价阈值,进而根据该评价阈值与预设阈值的大小比较结果确定是否将每个用户自待筛选用户群体移至特定用户群体中,若该评价阈值大于或等于预设阈值则对特定用户群体进行扩展,否则将该用户继续保留在待筛选用户群体中,避免增加舆情追踪的工作量,提高舆情追踪的有效价值。
在上述任一技术方案中,优选地,所述确定子模块用于确定所述评价阈值的所述阈值计算公式为:
Figure BDA0001256102770000051
其中,T代表所述评价阈值,
Figure BDA0001256102770000052
代表所述综合评价值的算术平均值,D(S)代表所述综合评价值的方差,a和b为常数。
在该技术方案中,通过获取每个用户的多组综合评价值,并基于该多组综合评价值的算术平均值和方差值计算其评价阈值,以确保计算结果的准确性和稳定性,其中,a和b为可调节的常数,用于调整评价阈值使其适用于定向程度具有不同需求的采集环境,使得计算结果更加符合用户需求。
在上述任一技术方案中,优选地,所述多个用户评价参数值包括:相似性评价值、言论评价值、注册信息评价值和影响力评价值,其中,所述相似性评价值是指所述每个用户与所述特定用户群体的特征相似度值;以及所述计算模块采用如下公式加权计算所述综合评价值:S=Am+Bn+Cp+Dq,其中,S代表所述综合评价值,m代表所述相似性评价值,n代表所述言论评价值,p代表所述注册信息评价值,q代表所述影响力评价值,以及A、B、C和D为常数,且A+B+C+D=1。
在该技术方案中,具体可以通过对待筛选用户群体中的每个用户的社交基本信息分析确定其至少包括相似性评价值、言论评价值、注册信息评价值和影响力评价值,其中,言论评价值、注册信息评价值和影响力评价值是分别对每个用户最近发表的言论、注册社交媒体账号时填写的信息以及每个用户的舆情影响力的评价值,而相似性评价值用于表征每个用户与特定用户群体中已有用户的相似程度,从而结合多个方面对用户的舆情追踪价值进行综合评价;进一步地,可以基于上述公式对每个用户的综合评价值进行准确的加权计算。
在上述任一技术方案中,优选地,所述社交基本信息包括:用户发帖内容信息、用户发帖数量、用户发帖评论数、用户发帖转发数、用户发帖点赞数、用户注册信息完整度、用户基本注册信息;以及所述分析模块具体用于:根据所述用户发帖内容信息分析确定所述相似性评价值;根据所述用户发帖数量和所述用户发帖内容信息分析确定所述言论评价值;根据所述用户注册信息完整度和所述用户基本注册信息分析确定所述注册信息评价值;根据所述用户发帖评论数、所述用户发帖转发数和所述用户发帖点赞数分析确定所述影响力评价值。
在该技术方案中,用于评估待筛选用户群体中的每个用户的各个用户评价参数值的社交基本信息至少可以包括:用户发帖内容信息、用户发帖数量、用户发帖评论数、用户发帖转发数、用户发帖点赞数、用户注册信息完整度、用户基本注册信息,具体地可以基于用户发帖内容信息分析确定对应用户与特定用户群体的相似性评价值,根据用户发帖数量和用户发帖内容信息分析确定对应用户的言论评价值,根据用户注册信息完整度和用户基本注册信息分析确定对应用户的注册信息评价值,根据用户发帖评论数、用户发帖转发数和用户发帖点赞数分析确定对应用户的影响力评价值;当然,用户的社交基本信息还可以包括其用户自我介绍信息、社交媒体账号的用户关注者数量和被用户关注者数量等,比如,在分析确定用户的相似性评价值时可以综合考虑用户自我介绍信息,在分析确定用户的言论评价值时可以综合考虑用户发帖的原创比,以及在分析确定用户的影响力评价值可以综合考虑用户关注者数量和被用户关注者数量,以使评价结果更加准确、更具有说服力。
通过本发明的上述技术方案,基于社交媒体的用户行为特征分析对待筛选用户群体中的每个用户进行综合评价,并根据评价结果进行剪枝,实现对特定用户群体快速准确地扩展筛选,提高扩展速度。
附图说明
图1示出了根据本发明的实施例的特定用户群体的管理方法的流程示意图;
图2示出了根据本发明的实施例的筛选用户的方法流程示意图;
图3示出了根据本发明的实施例的特定用户群体的管理系统的示意框图;
图4示出了图3所示的处理模块的示意框图。
具体实施方式
为了能够更清楚地理解本发明的上述目的、特征和优点,下面结合附图和具体实施方式对本发明进行进一步的详细描述。需要说明的是,在不冲突的情况下,本申请的实施例及实施例中的特征可以相互组合。
在下面的描述中阐述了很多具体细节以便于充分理解本发明,但是,本发明还可以采用其他不同于在此描述的其他方式来实施,因此,本发明的保护范围并不受下面公开的具体实施例的限制。
图1示出了根据本发明的实施例的特定用户群体的管理方法的流程示意图。
如图1所示,根据本发明的实施例的特定用户群体的管理方法,具体包括以下流程步骤:
步骤102,获取待筛选用户群体中每个用户的社交基本信息。
步骤104,根据社交基本信息分析确定每个用户的多个用户评价参数值。
步骤106,将多个用户评价参数值进行加权计算确定每个用户的综合评价值。
步骤108,根据综合评价值确定是否将每个用户自待筛选用户群体移至特定用户群体中。
在该实施例中,通过对社交媒体中的待筛选用户群体中的每个用户的社交基本信息进行分析,从而确定每个用户的用于评价其媒体账号的综合评价值的多个用户评价参数值,具体通过对该多个用户评价参数值进行加权计算确定该综合评价值,以根据该综合评价值确定是否将该每个用户自待筛选用户群体转移至特定用户群体,通过对待筛选用户群体进行综合评价及剪枝实现对特定用户群体的快速而准确地扩展筛选,从而提高特定用户群体的扩展速度,以对特定用户群体进行舆情追踪,避免对社交媒体中过多用户进行实时追踪的资源浪费,同时能够掌控社交媒体的信息传播主流动态,即特定用户群体是指在社交媒体中需要对其进行舆情追踪的用户群体。
进一步地,如图2所示,上述实施例中的步骤108具体可以执行为如下步骤:
步骤1082,根据综合评价值和阈值计算公式确定每个用户的评价阈值。
步骤1084,判断评价阈值是否大于或等于预设阈值。
步骤1086,若是,则将每个用户自待筛选用户群体移至特定用户群体中,否则将每个用户保留在待筛选用户群体中。
在该实施例中,具体可以根据阈值计算公式和每个用户的综合评价值确定每个用户的评价阈值,进而根据该评价阈值与预设阈值的大小比较结果确定是否将每个用户自待筛选用户群体移至特定用户群体中,若该评价阈值大于或等于预设阈值则对特定用户群体进行扩展,否则将该用户继续保留在待筛选用户群体中,避免增加舆情追踪的工作量,提高舆情追踪的有效价值,即对低于预设阈值的用户扩展得到的用户进行剪枝,防止下载资源浪费,实现快速定向用户扩展,其中,预设阈值的具体指可以根据实际应用场景进行设定及调整。
进一步地,在上述任一实施例中,阈值计算公式为:
Figure BDA0001256102770000081
其中,T代表评价阈值,
Figure BDA0001256102770000091
代表综合评价值的算术平均值,D(S)代表综合评价值的方差,a和b为常数。
在该实施例中,通过获取每个用户的多组综合评价值,并基于该多组综合评价值的算术平均值和方差值计算其评价阈值,以确保计算结果的准确性和稳定性,其中,a和b为可调节的常数,用于调整评价阈值使其适用于定向程度具有不同需求的采集环境,使得计算结果更加符合用户需求。
进一步地,在上述任一实施例中,多个用户评价参数值包括:相似性评价值、言论评价值、注册信息评价值和影响力评价值,其中,相似性评价值是指每个用户与特定用户群体的特征相似度值;以及采用如下公式加权计算综合评价值:S=Am+Bn+Cp+Dq,其中,S代表综合评价值,m代表相似性评价值,n代表言论评价值,p代表注册信息评价值,q代表影响力评价值,以及A、B、C和D为常数,且A+B+C+D=1。
在该实施例中,具体可以通过对待筛选用户群体中的每个用户的社交基本信息分析确定其至少包括相似性评价值、言论评价值、注册信息评价值和影响力评价值,其中,言论评价值、注册信息评价值和影响力评价值是分别对每个用户最近发表的言论、注册社交媒体账号时填写的信息以及每个用户的舆情影响力的评价值,而相似性评价值用于表征每个用户与特定用户群体中已有用户的相似程度,从而结合多个方面对用户的舆情追踪价值进行综合评价;进一步地,可以基于上述公式对每个用户的综合评价值进行准确的加权计算。
进一步地,在上述任一实施例中,社交基本信息包括:用户发帖内容信息、用户发帖数量、用户发帖评论数、用户发帖转发数、用户发帖点赞数、用户注册信息完整度、用户基本注册信息;以及根据社交基本信息分析确定每个用户的多个用户评价参数值的步骤包括:根据用户发帖内容信息分析确定相似性评价值;根据用户发帖数量和用户发帖内容信息分析确定言论评价值;根据用户注册信息完整度和用户基本注册信息分析确定注册信息评价值;根据用户发帖评论数、用户发帖转发数和用户发帖点赞数分析确定影响力评价值。
在该实施例中,用于评估待筛选用户群体中的每个用户的各个用户评价参数值的社交基本信息至少可以包括:用户发帖内容信息、用户发帖数量、用户发帖评论数、用户发帖转发数、用户发帖点赞数、用户注册信息完整度、用户基本注册信息,具体地可以基于用户发帖内容信息分析确定对应用户与特定用户群体的相似性评价值,根据用户发帖数量和用户发帖内容信息分析确定对应用户的言论评价值,根据用户注册信息完整度和用户基本注册信息分析确定对应用户的注册信息评价值,根据用户发帖评论数、用户发帖转发数和用户发帖点赞数分析确定对应用户的影响力评价值;当然,用户的社交基本信息还可以包括其用户自我介绍信息、社交媒体账号的用户关注者数量和被用户关注者数量等,比如,在分析确定用户的相似性评价值时可以综合考虑用户自我介绍信息,在分析确定用户的言论评价值时可以综合考虑用户发帖的原创比,以及在分析确定用户的影响力评价值可以综合考虑用户关注者数量和被用户关注者数量,以使评价结果更加准确、更具有说服力。
图3示出了根据本发明的实施例的特定用户群体的管理系统的示意框图。
如图3所示,根据本发明的实施例的特定用户群体的管理系统300,具体包括:获取模块302、分析模块304、计算模块306和处理模块308。
其中,获取模块302用于获取待筛选用户群体中每个用户的社交基本信息;分析模块304用于根据获取模块302获取的社交基本信息分析确定每个用户的多个用户评价参数值;计算模块306用于将分析模块304确定的多个用户评价参数值进行加权计算确定每个用户的综合评价值;处理模块308用于根据计算模块306得到的综合评价值确定是否将每个用户自待筛选用户群体移至特定用户群体中。
在该实施例中,通过对社交媒体中的待筛选用户群体中的每个用户的社交基本信息进行分析,从而确定每个用户的用于评价其媒体账号的综合评价值的多个用户评价参数值,具体通过对该多个用户评价参数值进行加权计算确定该综合评价值,以根据该综合评价值确定是否将该每个用户自待筛选用户群体转移至特定用户群体,通过对待筛选用户群体进行综合评价及剪枝实现对特定用户群体的快速而准确地扩展筛选,从而提高特定用户群体的扩展速度,以对特定用户群体进行舆情追踪,避免对社交媒体中过多用户进行实时追踪的资源浪费,同时能够掌控社交媒体的信息传播主流动态,即特定用户群体是指在社交媒体中需要对其进行舆情追踪的用户群体。
进一步地,如图4所示,上述实施例中的处理模块308具体包括:确定子模块3082、判断子模块3084和处理子模块3086。
其中,确定子模块3082用于根据综合评价值和阈值计算公式确定每个用户的评价阈值;判断子模块3084用于判断评价阈值是否大于或等于预设阈值;处理子模块3086用于在判断子模块3084判定为是时,将每个用户自待筛选用户群体移至特定用户群体中,否则将每个用户保留在待筛选用户群体中。
在该实施例中,具体可以根据阈值计算公式和每个用户的综合评价值确定每个用户的评价阈值,进而根据该评价阈值与预设阈值的大小比较结果确定是否将每个用户自待筛选用户群体移至特定用户群体中,若该评价阈值大于或等于预设阈值则对特定用户群体进行扩展,否则将该用户继续保留在待筛选用户群体中,避免增加舆情追踪的工作量,提高舆情追踪的有效价值,即对低于预设阈值的用户扩展得到的用户进行剪枝,防止下载资源浪费,实现快速定向用户扩展,其中,预设阈值的具体指可以根据实际应用场景进行设定及调整。
进一步地,在上述任一实施例中,确定子模块3082用于确定评价阈值的阈值计算公式为:
Figure BDA0001256102770000111
其中,T代表评价阈值,
Figure BDA0001256102770000112
代表综合评价值的算术平均值,D(S)代表综合评价值的方差,a和b为常数。
在该实施例中,通过获取每个用户的多组综合评价值,并基于该多组综合评价值的算术平均值和方差值计算其评价阈值,以确保计算结果的准确性和稳定性,其中,a和b为可调节的常数,用于调整评价阈值使其适用于定向程度具有不同需求的采集环境,使得计算结果更加符合用户需求。
进一步地,在上述任一实施例中,多个用户评价参数值包括:相似性评价值、言论评价值、注册信息评价值和影响力评价值,其中,相似性评价值是指每个用户与特定用户群体的特征相似度值;以及计算模块306采用如下公式加权计算综合评价值:S=Am+Bn+Cp+Dq,其中,S代表综合评价值,m代表相似性评价值,n代表言论评价值,p代表注册信息评价值,q代表影响力评价值,以及A、B、C和D为常数,且A+B+C+D=1。
在该实施例中,具体可以通过对待筛选用户群体中的每个用户的社交基本信息分析确定其至少包括相似性评价值、言论评价值、注册信息评价值和影响力评价值,其中,言论评价值、注册信息评价值和影响力评价值是分别对每个用户最近发表的言论、注册社交媒体账号时填写的信息以及每个用户的舆情影响力的评价值,而相似性评价值用于表征每个用户与特定用户群体中已有用户的相似程度,从而结合多个方面对用户的舆情追踪价值进行综合评价;进一步地,可以基于上述公式对每个用户的综合评价值进行准确的加权计算。
进一步地,在上述任一实施例中,社交基本信息包括:用户发帖内容信息、用户发帖数量、用户发帖评论数、用户发帖转发数、用户发帖点赞数、用户注册信息完整度、用户基本注册信息;以及分析模块304具体用于:根据用户发帖内容信息分析确定相似性评价值;根据用户发帖数量和用户发帖内容信息分析确定言论评价值;根据用户注册信息完整度和用户基本注册信息分析确定注册信息评价值;根据用户发帖评论数、用户发帖转发数和用户发帖点赞数分析确定影响力评价值。
进一步地在上述任一实施例中,用于评估待筛选用户群体中的每个用户的各个用户评价参数值的社交基本信息至少可以包括:用户发帖内容信息、用户发帖数量、用户发帖评论数、用户发帖转发数、用户发帖点赞数、用户注册信息完整度、用户基本注册信息,具体地可以基于用户发帖内容信息分析确定对应用户与特定用户群体的相似性评价值,根据用户发帖数量和用户发帖内容信息分析确定对应用户的言论评价值,根据用户注册信息完整度和用户基本注册信息分析确定对应用户的注册信息评价值,根据用户发帖评论数、用户发帖转发数和用户发帖点赞数分析确定对应用户的影响力评价值;当然,用户的社交基本信息还可以包括其用户自我介绍信息、社交媒体账号的用户关注者数量和被用户关注者数量等,比如,在分析确定用户的相似性评价值时可以综合考虑用户自我介绍信息,在分析确定用户的言论评价值时可以综合考虑用户发帖的原创比,以及在分析确定用户的影响力评价值可以综合考虑用户关注者数量和被用户关注者数量,以使评价结果更加准确、更具有说服力。
综上,对于如图1和图2所示的特定用户群体的管理方法的实施例和如图3和图4所示的特定用户群体的管理系统的实施例,其核心是通过评价算法对从社交媒体的用户数据中提炼出的用户行为特征进行分析与计算,从整体的角度评估社交媒体账号的价值,给出评分,并利用该评分影响扩展方向,实现定向扩展。
具体可以分为扩展和评价两个方面,其中扩展部分负责获取社交媒体中用户相关信息(即社交基本信息)以及扩展新用户,而扩展新用户即是通过当前用户的用户社交关系、社交网站推荐类似用户等途径获取新用户,在扩展过程中会参考评价部分给出的评分对用户进行剪枝以达到对扩展方向进行调整的目的;而评价部分即是通过对由扩展模块获取的用户相关信息进行分析和计算给出多方面的评价值(即得到多个用户评价参数值)并通过加权调整给出最终的评价结果(即综合评价值S)。
进一步地,在上述任一实施例中,根据用户发帖内容信息分析确定相似性评价值m的步骤具体可以采用如下方式执行:
Figure BDA0001256102770000131
其中,N代表用户发帖内容信息中特征词命中个数(即与特定用户群体的用户发帖内容信息特征词库中的词的匹配个数),u、v和w为可调节参数。
进一步地,在上述任一实施例中,根据用户发帖数量和用户发帖内容信息分析确定言论评价值n的步骤具体可以采用如下方式执行:
Figure BDA0001256102770000132
其中,G代表用户发帖内容信息中的特征词命中数(即与特定用户群体的用户发帖内容信息特征词库中的词的匹配个数),即需要预先通过自然语言处理提取其中的特征词,H代表每日的用户发帖数量,e、f和g为可调节参数。
进一步地,在上述任一实施例中,根据用户注册信息完整度和用户基本注册信息分析确定注册信息评价值p的步骤具体可以采用如下方式执行:
Figure BDA0001256102770000141
其中,E代表用户注册信息完整度,为用户注册时个人资料中已填写的常用信息数目与所列待填写的所有常用信息数目的比值,F代表用户基本注册信息中特征词命中个数(即与特定用户群体的用户基本注册信息特征词库中的词的匹配个数),用户基本注册信息可以包括用户个人简介信息和/或昵称,即需要预先通过自然语言处理提取其中的特征词,用于后续处理,c和d为可调节参数。
进一步地,在上述任一实施例中,根据用户发帖评论数、用户发帖转发数和用户发帖点赞数分析确定影响力评价值q的步骤具体可以采用如下方式执行:
q=Ih+Jl+Kr+Ls(+t),
其中,h代表每天的用户发帖数量,l代表每天平均的用户发帖评论数的,r代表每天平均的用户发帖转发数,s代表每天平均的用户发帖点赞数,I、J、K和L为可调节参数,且I+J+K+L=1,t为可调节参数,当前用户为认证用户时添加至该式中。
进一步地,上述用户发帖内容信息用户发帖数量、用户发帖评论数、用户发帖转发数和用户发帖点赞数等可以为用户近期一段时间内数据统计。
进一步地,对上述四个参数评价值对其进行加权平均即可得到最终的用户价值评分,其中,其中权重(即A、B、C和D)可以根据应用场景进行分配,一般情况下用户相似性权重大于用户影响力大于用户言论权重大于用户信息权重。
进一步地,在本发明的其他实施例中,除了上述常规统计数据外,也可按用户特殊需求添加统计数据,例如用户需求为优先关注认证账号或建立时间久的账号则可以统计出相应数据为相关评价提供支持。
以上结合附图详细说明了本发明的技术方案,通过本发明的技术方案,基于社交媒体的用户行为特征分析对待筛选用户群体中的每个用户进行综合评价,并根据评价结果进行剪枝,实现对特定用户群体快速准确地扩展筛选,提高扩展速度,且便于准确地、有方向性地进行舆情追踪。
以上所述仅为本发明的优选实施例而已,并不用于限制本发明,对于本领域的技术人员来说,本发明可以有各种更改和变化。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (8)

1.一种特定用户群体的管理方法,其特征在于,包括:
获取待筛选用户群体中每个用户的社交基本信息;
根据所述社交基本信息分析确定所述每个用户的多个用户评价参数值;
将所述多个用户评价参数值进行加权计算确定所述每个用户的综合评价值;
根据所述综合评价值确定是否将所述每个用户自所述待筛选用户群体移至特定用户群体中;
所述根据所述综合评价值确定是否将所述每个用户自所述待筛选用户群体移至特定用户群体中的步骤,包括:
获取每个用户的多组所述综合评价值;
根据多组所述综合评价值和阈值计算公式确定所述每个用户的评价阈值;
所述阈值计算公式为:
Figure FDA0002827399850000011
其中,T代表所述评价阈值,
Figure FDA0002827399850000012
代表多组所述综合评价值的算术平均值,D(S)代表多组所述综合评价值的方差,a和b为常数。
2.根据权利要求1所述的特定用户群体的管理方法,其特征在于,所述根据所述综合评价值确定是否将所述每个用户自所述待筛选用户群体移至特定用户群体中的步骤,还包括:
判断所述评价阈值是否大于或等于预设阈值;
若是,则将所述每个用户自所述待筛选用户群体移至所述特定用户群体中,否则将所述每个用户保留在所述待筛选用户群体中。
3.根据权利要求1或2所述的特定用户群体的管理方法,其特征在于,
所述多个用户评价参数值包括:相似性评价值、言论评价值、注册信息评价值和影响力评价值,其中,所述相似性评价值是指所述每个用户与所述特定用户群体的特征相似度值;以及
采用如下公式加权计算所述综合评价值:
S=Am+Bn+Cp+Dq,
其中,S代表所述综合评价值,m代表所述相似性评价值,n代表所述言论评价值,p代表所述注册信息评价值,q代表所述影响力评价值,以及A、B、C和D为常数,且A+B+C+D=1。
4.根据权利要求3所述的特定用户群体的管理方法,其特征在于,
所述社交基本信息包括:用户发帖内容信息、用户发帖数量、用户发帖评论数、用户发帖转发数、用户发帖点赞数、用户注册信息完整度、用户基本注册信息;以及
所述根据所述社交基本信息分析确定所述每个用户的多个用户评价参数值的步骤包括:
根据所述用户发帖内容信息分析确定所述相似性评价值;
根据所述用户发帖数量和所述用户发帖内容信息分析确定所述言论评价值;
根据所述用户注册信息完整度和所述用户基本注册信息分析确定所述注册信息评价值;
根据所述用户发帖评论数、所述用户发帖转发数和所述用户发帖点赞数分析确定所述影响力评价值。
5.一种特定用户群体的管理系统,其特征在于,包括:
获取模块,用于获取待筛选用户群体中每个用户的社交基本信息;
分析模块,用于根据所述获取模块获取的所述社交基本信息分析确定所述每个用户的多个用户评价参数值;
计算模块,用于将所述分析模块确定的所述多个用户评价参数值进行加权计算确定所述每个用户的综合评价值;
处理模块,用于根据所述计算模块得到的所述综合评价值确定是否将所述每个用户自所述待筛选用户群体移至特定用户群体中;
所述处理模块具体包括:
确定子模块,用于获取每个用户的多组所述综合评价值,根据多组所述综合评价值和阈值计算公式确定所述每个用户的评价阈值;
所述确定子模块用于确定所述评价阈值的所述阈值计算公式为:
Figure FDA0002827399850000031
其中,T代表所述评价阈值,
Figure FDA0002827399850000032
代表多组所述综合评价值的算术平均值,D(S)代表多组所述综合评价值的方差,a和b为常数。
6.根据权利要求5所述的特定用户群体的管理系统,其特征在于,所述处理模块具体还包括:
判断子模块,用于判断所述评价阈值是否大于或等于预设阈值;
处理子模块,用于在所述判断子模块判定为是时,将所述每个用户自所述待筛选用户群体移至所述特定用户群体中,否则将所述每个用户保留在所述待筛选用户群体中。
7.根据权利要求5或6所述的特定用户群体的管理系统,其特征在于,
所述多个用户评价参数值包括:相似性评价值、言论评价值、注册信息评价值和影响力评价值,其中,所述相似性评价值是指所述每个用户与所述特定用户群体的特征相似度值;以及
所述计算模块采用如下公式加权计算所述综合评价值:
S=Am+Bn+Cp+Dq,
其中,S代表所述综合评价值,m代表所述相似性评价值,n代表所述言论评价值,p代表所述注册信息评价值,q代表所述影响力评价值,以及A、B、C和D为常数,且A+B+C+D=1。
8.根据权利要求7所述的特定用户群体的管理系统,其特征在于,
所述社交基本信息包括:用户发帖内容信息、用户发帖数量、用户发帖评论数、用户发帖转发数、用户发帖点赞数、用户注册信息完整度、用户基本注册信息;以及
所述分析模块具体用于:
根据所述用户发帖内容信息分析确定所述相似性评价值;
根据所述用户发帖数量和所述用户发帖内容信息分析确定所述言论评价值;
根据所述用户注册信息完整度和所述用户基本注册信息分析确定所述注册信息评价值;
根据所述用户发帖评论数、所述用户发帖转发数和所述用户发帖点赞数分析确定所述影响力评价值。
CN201710190782.3A 2017-03-28 2017-03-28 特定用户群体的管理方法及管理系统 Expired - Fee Related CN108664483B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201710190782.3A CN108664483B (zh) 2017-03-28 2017-03-28 特定用户群体的管理方法及管理系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201710190782.3A CN108664483B (zh) 2017-03-28 2017-03-28 特定用户群体的管理方法及管理系统

Publications (2)

Publication Number Publication Date
CN108664483A CN108664483A (zh) 2018-10-16
CN108664483B true CN108664483B (zh) 2021-04-09

Family

ID=63785965

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201710190782.3A Expired - Fee Related CN108664483B (zh) 2017-03-28 2017-03-28 特定用户群体的管理方法及管理系统

Country Status (1)

Country Link
CN (1) CN108664483B (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110046910B (zh) * 2018-12-13 2023-04-14 蚂蚁金服(杭州)网络技术有限公司 判断客户通过电子支付平台所进行交易合法性的方法和设备

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2017011438A (ja) * 2015-06-19 2017-01-12 シャープ株式会社 情報処理装置、プログラム、情報処理システム、及び受信装置

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102314489B (zh) * 2011-08-15 2017-02-15 哈尔滨工业大学 网络论坛中舆论领袖分析方法
CN103024017B (zh) * 2012-12-04 2015-09-30 武汉大学 一种社交网络重要目标及社区群体识别方法
CN104866474B (zh) * 2014-02-20 2018-10-09 阿里巴巴集团控股有限公司 个性化数据搜索方法及装置
CN104050258B (zh) * 2014-06-15 2017-02-15 中国传媒大学 一种基于兴趣群组的群体推荐方法
CN105653518A (zh) * 2015-12-25 2016-06-08 北京理工大学 一种基于微博数据的特定群体发现及扩充方法

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2017011438A (ja) * 2015-06-19 2017-01-12 シャープ株式会社 情報処理装置、プログラム、情報処理システム、及び受信装置

Also Published As

Publication number Publication date
CN108664483A (zh) 2018-10-16

Similar Documents

Publication Publication Date Title
Nasution et al. The quality of small and medium enterprises performance using the structural equation model-part least square (SEM-PLS)
Choumert et al. Is the Environmental Kuznets Curve for deforestation a threatened theory? A meta-analysis of the literature
Chanda et al. Dual economies and international total factor productivity differences: Channelling the impact from institutions, trade, and geography
CN108595655B (zh) 一种基于会话特征相似性模糊聚类的异常用户检测方法
Costas et al. Scaling rules in the science system: Influence of field‐specific citation characteristics on the impact of individual researchers
WO2020135642A1 (zh) 一种基于生成对抗网络的模型训练方法及设备
Gold et al. Issues and opportunities: The application of the numerical likelihood ratio framework to forensic speaker comparison
Zhang et al. Configurational path to financing performance of crowdfunding projects using fuzzy set qualitative comparative analysis
CN115456695A (zh) 一种店铺选址的分析方法、装置、系统及介质
CN110826623B (zh) 基于气象数据的分类方法、装置、计算机设备及存储介质
CN112711691A (zh) 网络舆情引导效果数据信息处理方法、系统、终端及介质
CN108664483B (zh) 特定用户群体的管理方法及管理系统
CN111078859B (zh) 一种基于引用次数的作者推荐方法
CN112052686B (zh) 一种用户交互式教育的语音学习资源推送方法
Wang Research on bank marketing behavior based on machine learning
Martinez-Zarzoso et al. Are labour provisions in free trade agreements improving labour conditions?
Couronne et al. Online social network popularity evolution: an additive mixture model
CN108280073A (zh) 新闻客户端的影响力分析方法及系统
Verboon et al. Trajectories of loneliness across adolescence: an empirical comparison of longitudinal clustering methods using R
KR20150058662A (ko) 비교데이터 프루닝과 가우시안 혼합 모델의 유사도 추정을 이용한 유해 동영상 필터링 시스템 및 방법
CN109559169B (zh) 一种基于在线用户评分的敏锐用户识别的方法
CN110717837A (zh) 一种面向黑客论坛的用户画像构建方法
Gaitán et al. Determinants of the Impact Factor of Publications: A Panel Model for Journals Indexed in Scopus 2017
Song et al. Detecting the convergence clubs and catch-up in growth
Gulma The impact of community cohesion on crime

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
TR01 Transfer of patent right
TR01 Transfer of patent right

Effective date of registration: 20230609

Address after: 3007, Hengqin international financial center building, No. 58, Huajin street, Hengqin new area, Zhuhai, Guangdong 519031

Patentee after: New founder holdings development Co.,Ltd.

Patentee after: BEIJING FOUNDER ELECTRONICS Co.,Ltd.

Address before: 100871, Beijing, Haidian District Cheng Fu Road 298, founder building, 9 floor

Patentee before: PEKING UNIVERSITY FOUNDER GROUP Co.,Ltd.

Patentee before: BEIJING FOUNDER ELECTRONICS Co.,Ltd.

CF01 Termination of patent right due to non-payment of annual fee
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20210409