CN109684454A - 一种社交网络用户影响力计算方法及装置 - Google Patents

一种社交网络用户影响力计算方法及装置 Download PDF

Info

Publication number
CN109684454A
CN109684454A CN201811606829.0A CN201811606829A CN109684454A CN 109684454 A CN109684454 A CN 109684454A CN 201811606829 A CN201811606829 A CN 201811606829A CN 109684454 A CN109684454 A CN 109684454A
Authority
CN
China
Prior art keywords
user
dispatch
similarity
target
content
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201811606829.0A
Other languages
English (en)
Inventor
雷少东
刘世明
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Pingzero Digital Technology Co Ltd
Original Assignee
Beijing Pingzero Digital Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Pingzero Digital Technology Co Ltd filed Critical Beijing Pingzero Digital Technology Co Ltd
Priority to CN201811606829.0A priority Critical patent/CN109684454A/zh
Publication of CN109684454A publication Critical patent/CN109684454A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/22Matching criteria, e.g. proximity measures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/205Parsing
    • G06F40/216Parsing using statistical methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/258Heading extraction; Automatic titling; Numbering
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/30Semantic analysis

Abstract

本申请提供了一种社交网络用户影响力计算方法及装置,其中,所述方法包括:获取预设范围内全部社交网络用户的用户信息,所述用户信息至少包括:发文内容、文章ID、发文用户ID、互动用户ID及互动类型;计算所述发文内容与给定查询内容的相似度;根据预设过滤阈值,确定目标相似度以及所述目标相似度所对应的目标文章;建立所述目标文章与对应的互动用户之间的网络拓扑模型;根据所述目标相似度和所述网络拓扑模型,计算发文用户的影响力。本申请提供的影响力计算方法能够有效解决现有影响力计算方法准确度低的问题。

Description

一种社交网络用户影响力计算方法及装置
技术领域
本申请涉及网络用户信息评定技术领域,尤其涉及一种社交网络用户影响力计算方法及装置。
背景技术
随着移动互联网等信息技术的进步,以微博、微信为代表的社交网络取得了飞速发展。社交网络在信息传播扩散、广告营销、品牌口碑建设等领域的价值日益显著。KOL(KeyOpinion Leader,关键意见领袖)用户拥有更多、更准确的产品信息,且被相关群体所关注、接受或信任,并能够对该群体的购买力产生巨大影响,因此,准确发掘出KOL用户,在广告投放、品牌推广等应用场景下均具有巨大价值。KOL用户的一个重要指标即为用户影响力,因此,通过准确计算用户影响力,进而找到KOL用户具有重大意义。
现有用户影响力的计算方法主要分为两类,一类是基于用户等级、粉丝数量、发文数量等信息,对用户进行排序,进而作为对用户影响力的评价指标。但是在实际应用中,此种方法,忽略了用户与用户之间的互动行为,例如,转发、点赞、分享等,因此,此方法对用户影响力的度量较为粗糙、准确性较差。另一类是基于网络分析的方法,通过社交网络中用户与用户之间的互动行为,例如,转发、点赞等行为构建用户之间的网络拓扑模型,并基于此网络拓扑模型度量用户影响力。但是在实际应用中,某一用户仅在部分主题下具有KOL潜质,例如,同一用户在汽车相关主题下具有较大影响力,而在母婴相关主题下具有较小影响力。可见,同一用户在不同主题下的影响力差别巨大。因此,利用此种方法对用户影响力的评价由于缺乏定向性,即通常不考虑主题的相关性或者仅通过用户先验知识(人工标注标签、关键词等)对用户发文与相关主题进行粗略匹配,即使考虑了用户之间的互动行为,仍然会严重降低影响力计算的准确度。
发明内容
本申请提供了一种社交网络用户影响力计算方法及装置,以解决现有影响力计算方法准确度低的问题。
本申请第一方面提供了一种社交网络用户影响力计算方法,其特征在于,包括:
获取预设范围内全部社交网络用户的用户信息,所述用户信息至少包括:发文内容、文章ID、发文用户ID、互动用户ID及互动类型;
计算所述发文内容与给定查询内容的相似度;
根据预设过滤阈值,确定目标相似度以及所述目标相似度所对应的目标文章;
建立所述目标文章与对应的互动用户之间的网络拓扑模型;
根据所述目标相似度和所述网络拓扑模型,计算发文用户的影响力。
可选地,所述计算所述发文内容与给定查询内容的相似度的具体步骤包括:
根据语义分析技术,获取所述发文内容与所述给定查询内容的语句信息,所述语句信息至少包括:主题词及各所述主题词的词权重;
根据词嵌入技术,计算各所述主题词的词向量;
根据所述词向量和所述语句信息,计算所述发文内容和所述给定查询内容的语句向量;
计算所述发文内容与所述给定查询内容的语句向量的向量间距,确定所述发文内容与所述给定查询内容的相似度。
可选地,所述根据预设过滤阈值,确定目标相似度以及所述目标相似度所对应的目标文章的具体步骤包括:
转化全部所述发文内容所对应的相似度为相似度分布图像;
确定所述相似度分布图像的突变节点为过滤阈值;
确定大于所述过滤阈值的相似度为目标相似度;
确定所述目标相似度所对应的发文内容为目标文章。
可选地,所述建立所述目标文章与对应的互动用户之间的网络拓扑模型的具体步骤包括:
以用户为节点,所述用户包括发文用户和互动用户;
如果当前发文用户的任一当前目标文章与其他用户存在互动行为,则确定当前目标文章对应的互动用户为当前互动用户,并以当前互动用户为起点,以所述当前发文用户为终点,在所述当前互动用户与响应所述当前目标文章之间,针对每一所述互动类型,均建立一条有向边;其中,
如果当前发文用户与另一发文用户的任一目标文章存在互动行为,则确定所述当前发文用户为下一互动用户,并以所述下一互动用户为起点,以与所述另一发文用户为终点,在所述下一互动用户与相应所述目标文章之间,针对每一所述互动类型,均建立一条有向边。
可选地,所述根据所述目标相似度和所述网络拓扑模型,计算发文用户的影响力的具体步骤包括:
根据所述目标相似度,为对应的所述有向边赋权;
根据所述赋权和所述网络拓扑模型,确定有向带权网络;
获取所述有向带权网络中全部所述目标文章所对应的全部互动用户的影响力数据,并计算各所述发文用户的影响力。
本申请第二方面提供了一种社交网络用户影响力计算装置,其特征在于,所述装置包括:
用户信息获取单元,用于获取预设范围内全部社交网络用户的用户信息,所述用户信息至少包括:发文内容、文章ID、发文用户ID、互动用户ID及互动类型;
相似度计算单元,用于计算所述发文内容与给定查询内容的相似度;
目标确定单元,用于根据预设过滤阈值,确定目标相似度以及所述目标相似度所对应的目标文章;
网络拓扑模型建立单元,用于建立所述目标文章与对应的互动用户之间的网络拓扑模型;
影响力计算单元,用于根据所述目标相似度和所述网络拓扑模型,计算发文用户的影响力。
可选地,所述相似度计算单元包括:
语义分析单元,用于根据语义分析技术,获取所述发文内容与所述给定查询内容的语句信息,所述语句信息至少包括:主题词及各所述主题词的词权重;
词向量计算单元,用于根据词嵌入技术,计算各所述主题词的词向量;
语句向量计算单元,用于根据所述词向量和所述语句信息,计算所述发文内容和所述给定查询内容的语句向量;
向量间距计算单元,用于计算所述发文内容与所述给定查询内容的语句向量的向量间距,确定所述发文内容与所述给定查询内容的相似度。
可选地,所述目标确定单元包括:
图像转化单元,用于转化全部所述发文内容所对应的相似度为相似度分布图像;
阈值确定单元,用于确定所述相似度分布图像的突变节点为过滤阈值;
目标相似度确定单元,用于确定大于所述过滤阈值的相似度为目标相似度;
目标文章确定单元,用于确定所述目标相似度所对应的发文内容为目标文章。
可选地,所述网络拓扑模型建立单元包括:
节点确定单元,用于以用户为节点,所述用户包括发文用户和互动用户;
建边单元,用于如果当前发文用户的任一当前目标文章与其他用户存在互动行为,则确定当前目标文章对应的互动用户为当前互动用户,并以当前互动用户为起点,以所述当前发文用户为终点,在所述当前互动用户与相应所述当前目标文章之间,针对每一所述互动类型,均建立一条有向边;其中,
如果当前发文用户与另一发文用户的任一目标文章存在互动行为,则确定所述当前发文用户为下一互动用户,并以所述下一互动用户为起点,以与所述另一发文用户为终点,在所述下一互动用户与相应所述目标文章之间,针对每一所述互动类型,均建立一条有向边。
可选地,所述影响力计算单元包括:
赋权单元,用于根据所述目标相似度,为对应的所述有向边赋权;
有向带权网络确定单元,用于根据所述赋权和所述网络拓扑模型,确定有向带权网络;
影响力数据获取单元,用于获取所述有向带权网络中全部所述目标文章所对应的全部互动用户的影响力数据,并计算各所述发文用户的影响力。
由以上技术可知,本申请提供了一种社交网络用户影响力计算方法及装置,其中,所述方法包括:获取预设范围内全部社交网络用户的用户信息,所述用户信息至少包括:发文内容、文章ID、发文用户ID、互动用户ID及互动类型;计算所述发文内容与给定查询内容的相似度;根据预设过滤阈值,确定目标相似度以及所述目标相似度所对应的目标文章;建立所述目标文章与对应的互动用户之间的网络拓扑模型;根据所述目标相似度和所述网络拓扑模型,计算发文用户的影响力。使用时,在社交网络中进行发文、互动的用户,必须在使用之前使用个人信息注册用户信息,因此,对应于每个用户在社交网络中都能够对应找到与其相关的用户信息,包括用户的固定个人信息,如用户ID,以及其原创的作品信息,如文章ID、发文内容等,并且能够获得与其相关的互动用户的各种信息,如互动用户ID及互动类型等。要计算社交网络用户的影响力,本申请以社交网络用户中的发文用户作为基础,即所述社交网络用户指发文用户。同一发文用户的不同发文内容针对不同的给定查询内容均有不同的影响力,为了能够准确计算发文用户在某一特定领域所具有的影响力,就需要排除该发文用户与该特定领域无关的发文内容对其影响力计算所造成的影响。因此,针对给定查询内容,需要首先计算得到发文用户的全部发文内容与给定查询内容的相似度(匹配度),然后根据预设过滤阈值,筛选出符合相似度标准的高相似度发文内容,即目标文章。针对各目标文章,会有与该发文用户相关的互动用户发生对应的互动行为。在发文用户的各目标文章与对应的互动用户之间建立网络拓扑模型,能够清晰获得发文用户与各互动用户之间的关系。结合各目标文章对应的相似度及对应的网络拓扑模型,能够准确计算出与给定查询内容最为相关,最具说服力的网络用户影响力。
附图说明
为了更清楚地说明本申请的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,显而易见地,对于本领域普通技术人员而言,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1为本申请实施例提供的一种社交网络用户影响力计算方法的流程图;
图2为本申请实施例提供的一种相似度计算方法的流程图;
图3为本申请实施例提供的一种确定目标文章方法的流程图;
图4为本申请实施例提供的一种相似度分布图的示意图;
图5为本申请实施例提供的一种网络拓扑模型的建立方法的流程图;
图6为本申请实施例提供的一种影响力计算方法的流程图;
图7为本申请实施例提供的一种社交网络用户影响力计算装置的结构示意图;
图8为本申请实施例提供的一种相似度计算单元的具体结构示意图;
图9为本申请实施例提供的一种目标确定单元的具体结构示意图;
图10为本申请实施例提供的一种网络拓扑建模建立单元的具体结构示意图;
图11为本申请实施例提供的一种影响力计算单元的具体结构示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整的描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
参见图1,一种社交网络用户影响力计算方法的流程图。
本申请实施例提供了一种社交网络用户影响力计算方法,其特征在于,包括:
S100、获取预设范围内全部社交网络用户的用户信息,所述用户信息至少包括:发文内容、文章ID、发文用户ID、互动用户ID及互动类型;
在社交网络中进行发文、互动的用户,必须在使用之前使用个人信息注册用户信息,因此,对应于每个用户在社交网络中都能够对应找到与其相关的用户信息,包括用户的固定个人信息,如用户ID,以及其原创的作品信息,如文章ID、发文内容等,并且能够获得与其发生互动行为,如转发、点赞、收藏、评论、分享等相关的互动用户的各种信息,如互动用户ID及互动类型等。要计算社交网络用户的影响力,本申请以社交网络用户中的发文用户作为基础,即所述社交网络用户指发文用户。
S200、计算所述发文内容与给定查询内容的相似度;
对于同一发文用户的不同发文内容针对不同的给定查询内容均有不同的影响力,为了能够准确计算发文用户在某一特定领域所具有的影响力,就需要排除该发文用户与该特定领域无关的发文内容对其影响力计算所造成的影响。因此,针对给定查询内容,需要首先计算得到发文用户的全部发文内容与给定查询内容的相似度(匹配度)。
具体地,参见图2,一种相似度计算方法的流程图。
S201、根据语义分析技术,获取所述发文内容与所述给定查询内容的语句信息,所述语句信息至少包括:主题词及各所述主题词的词权重;
S202、根据词嵌入技术,计算各所述主题词的词向量;
S203、根据所述词向量和所述语句信息,计算所述发文内容和所述给定查询内容的语句向量;
S204、计算所述发文内容与所述给定查询内容的语句向量的向量间距,确定所述发文内容与所述给定查询内容的相似度。
发文内容通常为由语句构成的文本段,因此,分析各文本段之间的相似度,需要以语句为分析基础。利用语义分析技术将发文内容和给定查询内容的文本段拆分为若干语句,每个语句均由若干主题及对应的主题词组成,且根据语义侧重不同,各主题及主题词的权重也不同。例如,语句为“我喜欢吃苹果”,则需要拆分为“我”、“喜欢”、“吃”、“苹果”四个词,事实上,每个词均有各自突出的维度,即对语句的贡献度,例如,“我”突出人称,“喜欢”突出取向,“吃”突出动作,“苹果”突出作用物。给定查询内容也具有其突出的维度,例如,仅突出人称与作用物,则取向与动作就变为次要维度,因此在对比语句与给定文本的相似度时,需要突出对比人称与作用物,即对应的这两个方面的权重要相对高些。利用词嵌入技术,获得各主题词的词向量,在词权重的基础上叠加各词向量,能够获得更加贴合实际语义的语句向量。在获得各发文内容与给定查询内容的若干语句向量之后,通过计算各语句向量之间的距离,从而能够确定发文内容与给定查询内容的相似度。
S300、根据预设过滤阈值,确定目标相似度以及所述目标相似度所对应的目标文章;
根据预设过滤阈值,筛选出符合相似度标准的高相似度发文内容,即目标文章。
具体地,参见图3,一种确定目标文章方法的流程图。
S301、转化全部所述发文内容所对应的相似度为相似度分布图像;
S302、确定所述相似度分布图像的突变节点为过滤阈值;
S303、确定大于所述过滤阈值的相似度为目标相似度;
S304、确定所述目标相似度所对应的发文内容为目标文章。
为发文用户的每一篇文章编号,按照相似度从高到低的顺序排列各文章,以相似度为纵坐标,以文章编号为横坐标,将相似度转化为相似度分布图,能够得到清晰的相似度分布情况,如图4所示。在图4中可以清晰的看到相似度分布存在两个明显的突变节点A和B,可知,在A点之前的文章所对应的发文内容与给定查询内容之间的相似度极高,在B点之后的文章所对应的发文内容与给定查询内容之间的相似度极低,在A、B两点之间的文章所对应的发文内容与给定查询内容之间的相似度平滑变化。为了剔除相似度低的干扰发文内容,需要制定一个合理的过滤阈值。如果对相似度要求严格,则可将过滤阈值设置为A点,即A点之前的相似度为目标相似度,对应的发文内容为目标文章;如果对相似度要求较为宽松,则可将过滤阈值设置为B点,即B点之前的相似度为目标相似度,对应的发文内容为目标文章。优选地,将过滤阈值设置于相似度分布图像的突变节点上,利于快速计算及确定,提高影响力计算效率,且准确度高。
S400、建立所述目标文章与对应的互动用户之间的网络拓扑模型;
针对各目标文章,会有与该发文用户相关的互动用户发生对应的互动行为。在发文用户的各目标文章与对应的互动用户之间建立网络拓扑模型,能够清晰获得发文用户与各互动用户之间的关系。
具体地,参见图5,一种网络拓扑模型的建立方法的流程图。
S401、以用户为节点,所述用户包括发文用户和互动用户;
S402、如果当前发文用户的任一当前目标文章与其他用户存在互动行为,则确定当前目标文章对应的互动用户为当前互动用户,并以当前互动用户为起点,以所述当前发文用户为终点,在所述当前互动用户与相应所述当前目标文章之间,针对每一所述互动类型,均建立一条有向边;其中,
S403、如果当前发文用户与另一发文用户的任一目标文章存在互动行为,则确定所述当前发文用户为下一互动用户,并以所述下一互动用户为起点,以与所述另一发文用户为终点,在所述下一互动用户与相应所述目标文章之间,针对每一所述互动类型,均建立一条有向边。
以每个用户作为网络拓扑模型中的节点,具体地,将每一个发文用户和互动用户设置为节点,以发文用户中的目标文章与互动用户之间的互动行为为基础建立边关系。首先,以当前发文用户为基础,建立子网络拓扑模型,即互动用户与当前发文用户之间连线,边代表互动行为,且边为有向边。如果存在与当前用户互动的互动用户,例如,给当前用户的任一目标文章点赞、转发、评论等,则需要在互动用户与当前发文用户之间建立边关系,边的数量与互动用户所对应的目标文章数量相对应,且方向为互动用户指向当前发文用户。其中,如果目标文章所对应的当前发文用户也与另一发文用户的目标文章发生了互动行为,则需要以另一发文用户为基础,重新建立子网络拓扑模型,即当前发文用户转变为下一互动用户,且在下一互动用户与另一发文用户之间建立有向边,边的数量与下一互动用户所对应的目标文章数量相对应,且方向为下一互动用户指向另一发文用户。最后整合全部子网络拓扑模型,形成整体网络拓扑模型。
本实施例所提供的建立网络拓扑模型的方法,能够避免出现多层互动行为,例如,多层转发、多层点赞等出现的A→B→C→D的长链拓扑模型,保证子网络拓扑模型均为以单个发文用户为中心生成的辐射状的短链网络拓扑模型。利于提高计算准确度与效率。
S500、根据所述目标相似度和所述网络拓扑模型,计算发文用户的影响力。
结合各目标文章对应的相似度及对应的网络拓扑模型,能够准确计算出与给定查询内容最为相关,最具说服力的网络用户影响力。
具体地,参见图6,一种影响力计算方法的流程图。
S501、根据所述目标相似度,为对应的所述有向边赋权;
S502、根据所述赋权和所述网络拓扑模型,确定有向带权网络;
S503、获取所述有向带权网络中全部所述目标文章所对应的全部互动用户的影响力数据;并计算各所述发文用户的影响力。
各目标文章可能与多个互动用户存在多种互动行为,例如一个目标文章D可能同时与互动用户A、B、C分别存在转发、点赞、评论三种互动行为,即构建的子网络拓扑模型为互动用户A、B、C同时指向目标文章D,并且每条边赋值均为的目标文章D的相似度为s,而根据实际情况的不同,互动行为也存在对应的权重,所以可以根据权重的不同调整不同的互动行为在影响力计算中的影响程度,例如,将转发行为对应的边的权重扩大为评论行为对应权重的2倍,相应地,互动用户A的互动行为为是互动用户C的互动行为对影响力的贡献度的2倍。本实施例提供的根据互动行为类型采取不同权重的赋权方法,能够令影响力计算更加贴近实际要求,令影响力计算更加有针对性,更准确。
利用上述赋权方法能够获得若干子网络拓扑模型,且各子网络拓扑模型均为有向带权网络。
发文用户Vj与互动用户Vi之间存在互动行为的目标文章的集合为Dij,则子网络拓扑模型中的边eij的权值记作wij,根据公式(1)计算权值,
wij=∑dock∈Dijsim(k,q) (1)
其中,sim(k,q)为目标文章dock与给定查询内容q的相似度。
同时,利用PageRank依据网络拓扑模型,在全图上对各用户的影响力做一次性计算,一个发文用户的互动用户越多,其影响力越大;而且一个发文用户的互动用户的影响力越大,其影响力也越大。假设互动用户Vi的影响力为πi,由全部n个用户的影响力组成的向量记作π,根据公式(2)可求得π,
π=αPπ+(1-α)e (2)
其中,α为经验参数,通常取值0.7-0.9,e为每个元素等于1/∑i∈(1,n)k∈(1,n)wik的向量,根据公式(3)可求得P,
现有多种方法均可计算π的有近似解,例如幂率迭代算法、蒙特卡罗算法等。
本实施例提供的影响力计算方法能够同时计算发文用户与互动用户的影响力。
根据本实施例提供的影响力计算方法计算所得的用户影响力,能够结合各目标文章对应的相似度及对应的网络拓扑模型,避免恶意刷粉丝数量、刷评论数量等作弊行为,且相较于单纯基于用户标签、粉丝数、评论数计算影响力的方法,基于互动行为能够更准确计算出与给定查询内容最为相关,最具说服力的网络用户影响力。
参见图7,一种社交网络用户影响力计算装置的结构示意图。
本申请实施例还提供了一种社交网络用户影响力计算装置,其特征在于,所述装置包括:
用户信息获取单元1,用于获取预设范围内全部社交网络用户的用户信息,所述用户信息至少包括:发文内容、文章ID、发文用户ID、互动用户ID及互动类型;
相似度计算单元2,用于计算所述发文内容与给定查询内容的相似度;
目标确定单元3,用于根据预设过滤阈值,确定目标相似度以及所述目标相似度所对应的目标文章;
网络拓扑模型建立单元4,用于建立所述目标文章与对应的互动用户之间的网络拓扑模型;
影响力计算单元5,用于根据所述目标相似度和所述网络拓扑模型,计算发文用户的影响力。
可选地,参见图8,一种相似度计算单元的具体结构示意图,所述相似度计算单元2包括:
语义分析单元21,用于根据语义分析技术,获取所述发文内容与所述给定查询内容的语句信息,所述语句信息至少包括:主题词及各所述主题词的词权重;
词向量计算单元22,用于根据词嵌入技术,计算各所述主题词的词向量;
语句向量计算单元23,用于根据所述词向量和所述语句信息,计算所述发文内容和所述给定查询内容的语句向量;
向量间距计算单元24,用于计算所述发文内容与所述给定查询内容的语句向量的向量间距,确定所述发文内容与所述给定查询内容的相似度。
可选地,参见图9,一种目标确定单元的具体结构示意图,所述目标确定单元3包括:
图像转化单元31,用于转化全部所述发文内容所对应的相似度为相似度分布图像;
阈值确定单元32,用于确定所述相似度分布图像的突变节点为过滤阈值;
目标相似度确定单元33,用于确定大于所述过滤阈值的相似度为目标相似度;
目标文章确定单元34,用于确定所述目标相似度所对应的发文内容为目标文章。
可选地,参见图10,一种网络拓扑建模建立单元的具体结构示意图,所述网络拓扑模型建立单元4包括:
节点确定单元41,用于以用户为节点,所述用户包括发文用户和互动用户;
建边单元42,用于如果当前发文用户的任一当前目标文章与其他用户存在互动行为,则确定当前目标文章对应的互动用户为当前互动用户,并以当前互动用户为起点,以所述当前发文用户为终点,在所述当前互动用户与相应所述当前目标文章之间,针对每一所述互动类型,均建立一条有向边;其中,
如果当前发文用户与另一发文用户的任一目标文章存在互动行为,则确定所述当前发文用户为下一互动用户,并以所述下一互动用户为起点,以与所述另一发文用户为终点,在所述下一互动用户与相应所述目标文章之间,针对每一所述互动类型,均建立一条有向边。
可选地,参见图11,一种影响力计算单元的具体结构示意图,所述影响力计算单元5包括:
赋权单元51,用于根据所述目标相似度,为对应的所述有向边赋权;
有向带权网络确定单元52,用于根据所述赋权和所述网络拓扑模型,确定有向带权网络;
影响力数据获取单元53,用于获取所述有向带权网络中全部所述目标文章所对应的全部互动用户的影响力数据,并计算各所述发文用户的影响力。
值得注意的是,具体实现中,本发明还提供一种计算机存储介质,其中,该计算机存储介质可存储有程序,该程序执行时可包括本发明提供的用户身份的服务提供方法或用户注册方法的各实施例中的部分或全部步骤。所述的存储介质可为磁碟、光盘、只读存储记忆体(英文:read-only memory,简称:ROM)或随机存储记忆体(英文:random accessmemory,简称:RAM)等。
本领域的技术人员可以清楚地了解到本发明实施例中的技术可借助软件加必需的通用硬件平台的方式来实现。基于这样的理解,本发明实施例中的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在存储介质中,如ROM/RAM、磁碟、光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例或者实施例的某些部分所述的方法。
本领域技术人员在考虑说明书及实践这里公开的发明后,将容易想到本发明的其它实施方案。本申请旨在涵盖本发明的任何变型、用途或者适应性变化,这些变型、用途或者适应性变化遵循本发明的一般性原理并包括本发明未公开的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的,本发明的真正范围和精神由下面的权利要求指出。
应当理解的是,本申请并不局限于上面已经描述并在附图中示出的精确结构,并且可以在不脱离其范围进行各种修改和改变。本申请的范围仅由所附的权利要求来限制。

Claims (10)

1.一种社交网络用户影响力计算方法,其特征在于,包括:
获取预设范围内全部社交网络用户的用户信息,所述用户信息至少包括:发文内容、文章ID、发文用户ID、互动用户ID及互动类型;
计算所述发文内容与给定查询内容的相似度;
根据预设过滤阈值,确定目标相似度以及所述目标相似度所对应的目标文章;
建立所述目标文章与对应的互动用户之间的网络拓扑模型;
根据所述目标相似度和所述网络拓扑模型,计算发文用户的影响力。
2.根据权利要求1所述的方法,其特征在于,所述计算所述发文内容与给定查询内容的相似度的具体步骤包括:
根据语义分析技术,获取所述发文内容与所述给定查询内容的语句信息,所述语句信息至少包括:主题词及各所述主题词的词权重;
根据词嵌入技术,计算各所述主题词的词向量;
根据所述词向量和所述语句信息,计算所述发文内容和所述给定查询内容的语句向量;
计算所述发文内容与所述给定查询内容的语句向量的向量间距,确定所述发文内容与所述给定查询内容的相似度。
3.根据权利要求1所述的方法,其特征在于,所述根据预设过滤阈值,确定目标相似度以及所述目标相似度所对应的目标文章的具体步骤包括:
转化全部所述发文内容所对应的相似度为相似度分布图像;
确定所述相似度分布图像的突变节点为过滤阈值;
确定大于所述过滤阈值的相似度为目标相似度;
确定所述目标相似度所对应的发文内容为目标文章。
4.根据权利要求1所述的方法,其特征在于,建立所述目标文章与对应的互动用户之间的网络拓扑模型的具体步骤包括:
以用户为节点,所述用户包括发文用户和互动用户;
如果当前发文用户的任一当前目标文章与其他用户存在互动行为,则确定当前目标文章对应的互动用户为当前互动用户,并以当前互动用户为起点,以所述当前发文用户为终点,在所述当前互动用户与相应所述当前目标文章之间,针对每一所述互动类型,均建立一条有向边;其中,
如果当前发文用户与另一发文用户的任一目标文章存在互动行为,则确定所述当前发文用户为下一互动用户,并以所述下一互动用户为起点,以与所述另一发文用户为终点,在所述下一互动用户与相应所述目标文章之间,针对每一所述互动类型,均建立一条有向边。
5.根据权利要求4所述的方法,其特征在于,所述根据所述目标相似度和所述网络拓扑模型,计算发文用户的影响力的具体步骤包括:
根据所述目标相似度,为对应的所述有向边赋权;
根据所述赋权和所述网络拓扑模型,确定有向带权网络;
获取所述有向带权网络中全部所述目标文章所对应的全部互动用户的影响力数据,并计算各所述发文用户的影响力。
6.一种社交网络用户影响力计算装置,其特征在于,所述装置包括:
用户信息获取单元,用于获取预设范围内全部社交网络用户的用户信息,所述用户信息至少包括:发文内容、文章ID、发文用户ID、互动用户ID及互动类型;
相似度计算单元,用于计算所述发文内容与给定查询内容的相似度;
目标确定单元,用于根据预设过滤阈值,确定目标相似度以及所述目标相似度所对应的目标文章;
网络拓扑模型建立单元,用于建立所述目标文章与对应的互动用户之间的网络拓扑模型;
影响力计算单元,用于根据所述目标相似度和所述网络拓扑模型,计算发文用户的影响力。
7.根据权利要求6所述的装置,其特征在于,所述相似度计算单元包括:
语义分析单元,用于根据语义分析技术,获取所述发文内容与所述给定查询内容的语句信息,所述语句信息至少包括:主题词及各所述主题词的词权重;
词向量计算单元,用于根据词嵌入技术,计算各所述主题词的词向量;
语句向量计算单元,用于根据所述词向量和所述语句信息,计算所述发文内容和所述给定查询内容的语句向量;
向量间距计算单元,用于计算所述发文内容与所述给定查询内容的语句向量的向量间距,确定所述发文内容与所述给定查询内容的相似度。
8.根据权利要求6所述的装置,其特征在于,所述目标确定单元包括:
图像转化单元,用于转化全部所述发文内容所对应的相似度为相似度分布图像;
阈值确定单元,用于确定所述相似度分布图像的突变节点为过滤阈值;
目标相似度确定单元,用于确定大于所述过滤阈值的相似度为目标相似度;
目标文章确定单元,用于确定所述目标相似度所对应的发文内容为目标文章。
9.根据权利要求6所述的装置,其特征在于,所述网络拓扑模型建立单元包括:
节点确定单元,以用户为节点,所述用户包括发文用户和互动用户;
建边单元,用于如果当前发文用户的任一当前目标文章与其他用户存在互动行为,则确定当前目标文章对应的互动用户为当前互动用户,并以当前互动用户为起点,以所述当前发文用户为终点,在所述当前互动用户与相应所述当前目标文章之间,针对每一所述互动类型,均建立一条有向边;其中,
如果当前发文用户与另一发文用户的任一目标文章存在互动行为,则确定所述当前发文用户为下一互动用户,并以所述下一互动用户为起点,以与所述另一发文用户为终点,在所述下一互动用户与相应所述目标文章之间,针对每一所述互动类型,均建立一条有向边。
10.根据权利要求9所述的装置,其特征在于,所述影响力计算单元包括:
赋权单元,用于根据所述目标相似度,为对应的所述有向边赋权;
有向带权网络确定单元,用于根据所述赋权和所述网络拓扑模型,确定有向带权网络;
影响力数据获取单元,用于获取所述有向带权网络中全部所述目标文章所对应的全部互动用户的影响力数据,并计算各所述发文用户的影响力。
CN201811606829.0A 2018-12-26 2018-12-26 一种社交网络用户影响力计算方法及装置 Pending CN109684454A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201811606829.0A CN109684454A (zh) 2018-12-26 2018-12-26 一种社交网络用户影响力计算方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201811606829.0A CN109684454A (zh) 2018-12-26 2018-12-26 一种社交网络用户影响力计算方法及装置

Publications (1)

Publication Number Publication Date
CN109684454A true CN109684454A (zh) 2019-04-26

Family

ID=66189888

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201811606829.0A Pending CN109684454A (zh) 2018-12-26 2018-12-26 一种社交网络用户影响力计算方法及装置

Country Status (1)

Country Link
CN (1) CN109684454A (zh)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110334356A (zh) * 2019-07-15 2019-10-15 腾讯科技(深圳)有限公司 文章质量的确定方法、文章筛选方法、以及相应的装置
CN110929168A (zh) * 2019-11-12 2020-03-27 北京百分点信息科技有限公司 关键受众确定方法、装置及电子设备
CN111949808A (zh) * 2019-04-29 2020-11-17 北京达佳互联信息技术有限公司 一种多媒体内容相似度确定方法、装置、电子设备及存储介质
CN113366567A (zh) * 2021-05-08 2021-09-07 腾讯音乐娱乐科技(深圳)有限公司 一种声纹识别方法、歌手认证方法、电子设备及存储介质

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102270204A (zh) * 2010-06-02 2011-12-07 上海佳艾商务信息咨询有限公司 一种基于矩阵分解对在线论坛用户影响力进行计算的方法
CN104008182A (zh) * 2014-06-10 2014-08-27 盐城师范学院 社交网络交流影响力的测定方法及系统
CN107862617A (zh) * 2017-10-20 2018-03-30 江苏大学 一种基于用户综合相似度的微博社区划分方法

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102270204A (zh) * 2010-06-02 2011-12-07 上海佳艾商务信息咨询有限公司 一种基于矩阵分解对在线论坛用户影响力进行计算的方法
CN104008182A (zh) * 2014-06-10 2014-08-27 盐城师范学院 社交网络交流影响力的测定方法及系统
CN107862617A (zh) * 2017-10-20 2018-03-30 江苏大学 一种基于用户综合相似度的微博社区划分方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
经程文: "基于社交网络的用户行为研究", 《互联网+技术》 *

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111949808A (zh) * 2019-04-29 2020-11-17 北京达佳互联信息技术有限公司 一种多媒体内容相似度确定方法、装置、电子设备及存储介质
CN111949808B (zh) * 2019-04-29 2024-01-02 北京达佳互联信息技术有限公司 一种多媒体内容相似度确定方法、装置、电子设备及存储介质
CN110334356A (zh) * 2019-07-15 2019-10-15 腾讯科技(深圳)有限公司 文章质量的确定方法、文章筛选方法、以及相应的装置
CN110334356B (zh) * 2019-07-15 2023-08-04 腾讯科技(深圳)有限公司 文章质量的确定方法、文章筛选方法、以及相应的装置
CN110929168A (zh) * 2019-11-12 2020-03-27 北京百分点信息科技有限公司 关键受众确定方法、装置及电子设备
CN113366567A (zh) * 2021-05-08 2021-09-07 腾讯音乐娱乐科技(深圳)有限公司 一种声纹识别方法、歌手认证方法、电子设备及存储介质
WO2022236453A1 (zh) * 2021-05-08 2022-11-17 腾讯音乐娱乐科技(深圳)有限公司 一种声纹识别方法、歌手认证方法、电子设备及存储介质

Similar Documents

Publication Publication Date Title
CN109684454A (zh) 一种社交网络用户影响力计算方法及装置
Li et al. Towards social user profiling: unified and discriminative influence model for inferring home locations
US9426233B2 (en) Multi-objective server placement determination
Quercia et al. Friendsensing: recommending friends using mobile phones
RU2607621C2 (ru) Способ, система и машиночитаемый носитель данных для группирования в социальных сетях
CN108520303A (zh) 一种推荐系统构建方法及装置
WO2017118426A1 (zh) 社交平台的用户影响力估算方法、装置及计算机存储介质
CN105653689B (zh) 一种用户传播影响力的确定方法和装置
CN103853739B (zh) 动态社会关系网络社区演化识别以及稳定社区提取方法
Liu et al. Identity crisis of ubicomp? Mapping 15 years of the field's development and paradigm change
CN107391542A (zh) 一种基于文件知识图谱的开源软件社区专家推荐方法
CN102135983A (zh) 基于网络用户行为的群体划分方法和装置
CN109492027B (zh) 一种基于弱可信数据的跨社群潜在人物关系分析方法
Traag et al. Exponential ranking: taking into account negative links
Li et al. Evolutionary community discovery in dynamic social networks via resistance distance
Kim et al. LinkBlackHole $^{*} $*: Robust Overlapping Community Detection Using Link Embedding
Palaghias et al. Quantifying trust relationships based on real-world social interactions
CN110929171B (zh) 一种基于场景和社交网络位置的兴趣点推荐方法
CN111966920A (zh) 舆情传播的稳定条件的预测方法、装置及设备
Assam et al. Context-based location clustering and prediction using conditional random fields
Saxena et al. Rank me thou shalln't compare me
CN109919459A (zh) 一种面向社交网络对象间影响力度量的方法
CN106651410A (zh) 一种应用管理方法及装置
Zobel et al. Modeling Civilian Mobility in Large-Scale Disasters.
Hamrouni et al. Context-Aware Service Discovery: Graph Techniques for IoT Network Learning and Socially Connected Objects

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
WD01 Invention patent application deemed withdrawn after publication
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20190426