CN103595740A - 一种更新对等网络版权内容相似度图的方法及系统 - Google Patents

一种更新对等网络版权内容相似度图的方法及系统 Download PDF

Info

Publication number
CN103595740A
CN103595740A CN201210288837.1A CN201210288837A CN103595740A CN 103595740 A CN103595740 A CN 103595740A CN 201210288837 A CN201210288837 A CN 201210288837A CN 103595740 A CN103595740 A CN 103595740A
Authority
CN
China
Prior art keywords
node
peer
content
source node
renewal
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201210288837.1A
Other languages
English (en)
Other versions
CN103595740B (zh
Inventor
曲本科
牛温佳
童恩栋
苗光胜
唐晖
谭红艳
慈松
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Institute of Acoustics CAS
Original Assignee
Institute of Acoustics CAS
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Institute of Acoustics CAS filed Critical Institute of Acoustics CAS
Priority to CN201210288837.1A priority Critical patent/CN103595740B/zh
Publication of CN103595740A publication Critical patent/CN103595740A/zh
Application granted granted Critical
Publication of CN103595740B publication Critical patent/CN103595740B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Information Transfer Between Computers (AREA)

Abstract

本发明提供了一种更新对等网络版权内容相似度图的方法及系统,该方法基于用户综合客观行为采用局部动态的方法更新对等网络版权内容相似度图,所述方法包含:更新对等网络版权内容相似度图中的源节点信息的步骤,所述源节点的信息包含:用户威胁度和节点扩散能力;基于对等网络版权内容相似度图以源节点为广播源,向该源节点的若干邻居节点广播更新指令的步骤;收到广播指令的各邻居节点更新其所在节点信息的步骤,所述的节点信息包含:用户威胁度和节点扩散能力;其中,所述的源节点为对等网络版权内容相似度图中的任意一个内容节点,且该节点满足启动更新操作的条件。本发明充分考虑用户客观行为,对CCSG更新方法做出重要改进。

Description

一种更新对等网络版权内容相似度图的方法及系统
技术领域
本发明涉及P2P网络版权内容传播过程中内容相似度图的局部动态更新方法,具体涉及一种更新对等网络版权内容相似度图的方法及系统。
背景技术
内容关系网络挖掘旨在通过揭示内容之间的相似度关系来深入发掘P2P用户之间的文件共享关系,深刻反映出对等网络内容交互与分布的内部结构,为传播分析与管控提供有效支持。部分研究者对此提出的P2P网络版权内容相似度图(CopyrightContent Similarity Graph,CCSG)的概念来描述内容关系网络,本发明的发明人在另一篇申请号为“201210240796.9”、名称为《一种对等网络版权内容相似度图的构建方法及系统》的申请文件中针对内容相似度图CCSG的构建进行分析研究并提出改进的构建方法,且具体的构建方法是基于如表1所示的构建模型的。而本发明延续对P2P网络版权内容相似度图CCSG的研究,探讨在完成构建过程后,如何对CCSG进行更好的更新的方法。
为清楚表述本发明内容,首先对CCSG的结构和构建进行简要描述。从图1可知,所述内容相似度图中包含的元素为:若干内容节点、连接内容节点间的无向边及对应于各无向边权重值;且所述内容节点表示某个音/视频内容,可以综合运用内容名称及内容描述元数据来标识;若存在某个用户同时拥有两个内容,则对应的内容节点通过所述无向边连接。在无向边权重计算方面,CCSG基于如下事实,即如果同时拥有两个内容的用户数目越大,则意味着内容之间的相似度越大,对应的无向边权重也越大。
本申请的发明人在上述《一种对等网络版权内容相似度图的构建方法及系统》提出用户综合客观行为模型——COB模型,以及基于用户综合客观行为COB模型的用户威胁程度判断模型和内容扩散能力预测模型进而提出了改进的CCSG构建流程。其中,在CCSG构建过程中提出的各种模型如表1所示。
表1.针对改进的CCSG构建过程提出的模型
Figure BDA00002008397100011
为便于可视化地展现内容节点的扩散能力,系统对节点的扩散能力范围进行区间划分,分出红、黄、绿、蓝四个层次,对不同扩散能力的版权内容节点进行层次过滤并添加不同的颜色属性。这样通过对节点进行着色,系统得以直观地展现CCSG中版权内容扩散能力的分布情况。
总之上述专利申请提供的CCGS图的构建方法综合考虑了包含用户客观行为的行为时间、行为数量和行为性质,即在构建CCGS图时对用户客观行为综合定量和定性进行了考虑,因此能够基于上述方法构建的CCGS图对于提高内容传播分析与管控的全面性和有效性上有了很大提高。本发明的提供的更新方法也是基于上述方法建立的CCGS图。
现有的CCSG构建方法仅仅定性地分析了用户客观行为的事件行为,主要指某个用户下载了某个内容或某个用户上传了某个内容,而对于用户客观行为中的行为时间、行为数量及行为性质,缺乏定量和定性的全面分析,而忽视对用户客观行为的综合定量和定性考虑,将会大大影响内容传播分析与管控的全面性和有效性。《一种对等网络版权内容相似度图的构建方法及系统》弥补了这方面的不足,其首次建立包括事件行为、行为时间、行为数量和行为性质在内的用户综合客观行为模型;基于该综合客观行为模型,计算用户威胁程度和内容扩散趋势,并将计算结果导入GKM聚类算法,从数据预处理和聚类两个步骤对整个构建过程分别实现一头一尾的改进,提高CCSG的全面性和准确性。详见《一种对等网络版权内容相似度图的构建方法及系统》。
针对P2P网络,要达到预测侵权内容扩散趋势,进而完成预先区域预警和管控这一目标,仅仅通过一张静态的CCSG是无法达到目的的。CCSG所反映的仅仅是当前时刻P2P网络中版权内容的扩散能力分布情况,要查看在一段时间内CCSG中版权内容扩散能力的系列变化,甚至是观察CCSG的动态演变过程,需要对CCSG进行定时或实时更新。且本发明所述的更新P2P网络版权内容相似度图具体是指代更新该图中包含的版权内容节点扩散能力信息、节点间无向边权重信息即节点内容扩散能力相似度以及内容节点的颜色属性。
现有技术在CCSG更新过程中,通过更新CCSG存储数据,包括更新已有的数据和捕获新的数据(比如出现了哪些新的内容,出现了哪些新的用户等),并以此为基础,重新进入CCSG的构建过程。CCSG的整体构建过程如图2所示。每次CCSG更新过程都需要完全完整地执行每一步骤即爬虫程序获取P2P网络中的内容信息、内容信息完全替换数据库已有内容信息、利用数据库中的新载入的数据重新完整绘制一幅CCSG图。
从上述描述可知现有技术通过周期性迭代执行CCSG整体构建流程的每一步,从而实现CCSG的整体更新和重绘。CCSG存储数据的更新可以通过两种方式实现,一种是定时启动爬虫程序,一种是基于用户的事件行为触发爬虫程序。不论哪种方式,以上CCSG的更新方法都存在两方面的缺陷。一方面,CCSG更新属于整体更新,这将耗费大量的计算资源,大大降低CCSG的更新速度。另一方面,我们认为,CCSG的更新仍然属于过程层面上的动态,即仍然按部就班,依靠固有的计算方法。实际上,在CCSG更新方面,应该支持局部动态的计算方法。例如,对于某一用户从偶然侵权的行为性质变化到常见侵权,CCSG计算方法应该随之动态变化,完成对应版权内容节点扩散能力和节点间扩散能力相似度的计算,以切合常见侵权用户造成危害更大的实际情况,而对于那些用户行为性质未发生变化的情况,则无需更新对应节点的相关能力信息。
总之,本发明针对以上问题,将围绕对等网络内容相似度图CCSG,充分考虑版权内容相似度图CCSG结构的动态调整策略,对版权内容相似度图CCSG更新方法做出重要改进。从权重、时间以及缓存等多角度来刻画、助力版权内容相似度图CCSG结构的局部动态更新,并可控扩散更新命令,达到版权内容相似度图CCSG的整体高效更新。
发明内容
本发明的目的在于,为克服现有技术对于内容相似度图更新采用的整体更新带来的诸多的技术问题,从而提供一种更新对等网络版权内容相似度图的方法及系统。
为实现上述目的,本发明提供了一种更新对等网络版权内容相似度图的方法,该方法基于用户综合客观行为采用局部动态的方法更新对等网络版权内容相似度图,所述方法包含:
步骤101)更新对等网络版权内容相似度图中的源节点信息的步骤,所述源节点的信息包含:用户威胁度和节点扩散能力;其中,所述用户威胁度是指通过系统设定的量化指标针对用户在P2P网络中上传下载版权内容的客观行为计算出的衡量用户行为性质的量化指标,所述节点扩散能力是指对与其相关的所有用户的用户威胁度进行加权求和而得到的衡量版权内容传播能力和程度的量化标准;
步骤102)基于对等网络版权内容相似度图以源节点为广播源,向该源节点的若干邻居节点广播更新指令的步骤;
步骤103)收到广播指令的各邻居节点更新其所在节点信息的步骤,所述的节点信息包含:用户威胁度和节点扩散能力;
其中,所述的源节点为对等网络版权内容相似度图中的任意一个内容节点,且该节点满足启动更新操作的条件,所述的启动更新操作的条件具体为:基于用户行为质变引起相关版权内容质变时,启动该版权内容节点的更新操作,所述用户行为质变的程度是通过用户客观行为状态、行为持续时间、行为累积次数以及行为性质共同参与计算得到的量化指标。
上述技术方案中,所述源节点通过更新队列选取传输指令的节点。
上述技术方案中,所述步骤102)进一步包含:
步骤102-1)将所述源节点的所有邻居节点放入更新队列作为候选参与更新的节点集;
步骤102-2)依次从更新队列中取出节点,计算其与源节点关联的无向边权重在所有与源节点关联的无向边权重和中的占比以及该无向边存在时长;
步骤102-3)判断权重占比是否大于系统设定阈值ξ,或者无向边存在时长是否大于系统参数θ与该边权重的商,只要满足该两个条件之一,该无向边对应的候选节点就会入选;
步骤102-4)抛弃不符合步骤102-3)所述条件的候选节点,将符合条件的候选节点加入到源节点缓存中;
步骤102-5)对于该满足条件的候选节点,判断其到源节点的路径跳数是否小于系统设定的扩散半径λ,如果小于λ,那么跳回步骤102-1),否则继续向下执行步骤102-6);
步骤102-6)判断源节点的更新队列是否为空,如果不为空,则跳回步骤102-2),否则继续向下执行步骤102-7);
步骤102-7)对缓存中的每一个更新节点,从数据库中获取与该节点相关的用户信息,借此更新节点自身的版权内容扩散能力和与父节点的扩散能力相似度信息,并据此更新自身的颜色标定,待对缓存中所有节点完成更新后,即完成CCSG的一次局部动态更新。
上述技术方案中,所述源头节点将参与一次更新操作的节点都加入到源节点缓存中;对加入源节点缓存的每一个节点,系统都为其附加一个更新计数器;利用计数器记录每次更新操作后,缓存节点自身信息实际发生变化的次数;如果系统有新的节点需要加入到缓存中,则需要判断源节点缓存是否已满,如果已满那么在缓存中检查每一个节点的计数器,挑出计数器值为0的节点,即每次更新操作都没有对其自身信息产生影响的节点,剔除这些节点,并添加新节点,完成源节点的缓存更新。
基于上述方法本发明提供了一种更新对等网络版权内容相似度图的系统,该系统基于用户综合客观行为采用局部动态的方法更新对等网络版权内容相似度图,所述系统包含:
启动更新操作的源节点、对等网络的其余各节点及更新命令扩散半径设置模块;
所述源节点进一步包含:
更新驱动模块,用于基于用户行为质变引起相关版权内容质变的原则启动该节点的更新操作;
广播模块,用于将更新操作向其若干邻居节点进行广播;
所述其余各节点包含:
广播传输模块,用于接收源节点或其余节点发送的更新操作指令,并向它的若干邻居节点继续传输该更新指令;
更新驱动模块,用于基于广播指令启动该节点的更新操作;
所述更新命令扩散半径设置模块,用户设置更新命令的扩散半径,对源节点广播的更新操作的扩散命令的扩散范围进行限制;
其中,所述的源节点为对等网络版权内容相似度图中的任意一个内容节点,且该节点满足启动更新操作的条件,所述的更新操作的条件具体为:基于用户行为质变引起相关版权内容质变时,启动该版权内容节点的更新操作,所述用户行为质变的程度是通过用户客观行为状态、行为持续时间、行为累积次数以及行为性质共同参与计算得到的量化指标。
上述技术方案中,所述源节点和其余各节点均还包含:
邻居节点获取模块,用于获取节点的所有邻居节点;
信息收集模块,用于获取各邻居节点与源节点的内容相似度的值,并获取源节点与各邻居节点组成的无向边的存在时间的长度值;
第一级节点集筛选处理模块,用于依据由权重条件和时间条件组成的扩散概率模型的函数值从邻居节点获取模块得到邻居节点中选择第一级节点集;
其中,所述扩散概率模型为:
Pi→j=cond_ω·cond_t
所述权重条件为:
Figure BDA00002008397100061
所述时间条件为:
Figure BDA00002008397100062
其中,ωij为源节点i与其任意邻居节点j的版权内容相似度值;ξ为设置的权重比例的阈值;ωik为所有与节点i关联的边的权重和,k为与节点i关联的任意一个节点;θ为设定的参与计算无向边存在时长阈值的系统参数;t(i,j)为源节点i与其邻居节点j组成的无向边的存在时长;所述的第一节点集作为更新命令的扩散节点。
上述技术方案中,所述扩散概率模型还采用源节点与某个邻居节点间的无向边权重占该源节点所有无向边权重和的比例和源节点与某个邻居节点的关联时间长度值两个因素选中第一级节点集中的各节点;
即当源节点与某个邻居节点间的无向边权重占该源节点所有无向边权重和的比例大于等于设置的权重比例阈值并且源节点与某个邻居节点的关联时间长度值大于等于为该边设置的存在时长时将节点归入第一级节点集。
上述技术方案中,所述各节点还设置有缓存策略执行模块,用于在执行下次更新时,直接从缓存中读取待更新的第一级节点,而无需重复计算并筛选邻居节点的操作。
上述技术方案中,所述缓存策略执行模块进一步包含如下子模块:
待更新节点加入缓存模块:源头节点会将本次满足更新条件并将接收更新指令的节点缓存起来,并对每个缓存的节点增加一个计数器;
节点更新频率统计模块:利用对每个节点附加的计数器累计得到每个节点的在接收到更新指令后自身信息实际发生变化的频率;
缓存更新模块:用于依据节点更新频率统计模块获得的更新频率统计值剔除缓存中的更新频率为零的节点并添加新节点。
本发明针对以上问题,将围绕对等网络内容相似度图CCSG,充分考虑用户客观行为的多个方面,对CCSG更新方法做出重要改进。
与现有技术相比较,本发明的优点在于:
第一,在CCSG更新过程中,基于用户客观行为综合模型,利用用户客观行为推导计算出的无向边动态权重,实现针对某个内容节点附近区域的CCSG局部动态更新方法,降低计算资源损耗,提高CCSG的更新速度。
第二,在动态更新的过程中,系统存储本次更新涉及到的邻居节点,在下次更新时,优先考虑存储的邻居节点,并依据提出的缓存策略更新存储的邻居节点,保证CCSG更新的效率和准确率。
附图说明
图1是现有技术的CCSG结构示意图;
图2是现有技术的CCSG构建流程示意图;
图3是本发明提出的CCSG更新模型示意图;
图4是本发明提供的对等网络版权内容相似度图的局部动态更新方法的流程图;
图5是本发明提供的更新节点的缓存策略流程图;
图6是本发明的版权内容节点对象包含的属性示意图;
图7是当λ=2时,局部需要动态更新的节点筛选图。
具体实施方式
下面结合附图对本发明的内容进行详细说明。
基于用户客观行为的CCSG更新
CCSG是由内容关系网中的版权内容节点以及节点间关联的无向边构成的,CCSG更新的落脚点就是对版权内容节点扩散能力以及无向边权重的重新计算。而版权内容节点扩散能力有赖于拥有它的用户的威胁度。由表1可知,用户威胁度又是通过对用户客观行为的全面刻画来获得。通过对用户客观行为描述的更新,实现每一步的增量更新,并最终完成更新的传递,实现对版权内容节点扩散能力的更新。
1)CCSG局部动态更新方法
CCSG的更新模型如图3所示:
CCSG的局部动态更新是一个靠每一步模型增量更新驱动的周期性迭代过程。不同于CCSG整体更新导致旧有数据的无谓更新,CCSG局部动态更新着眼于CCSG局部数据——用户综合客观行为——的增量变化,利用增量数据直接作用于相关用户威胁程度,而威胁程度的变化又沿着螺线参与到版权内容的扩散能力更新的程序中,最终根据系统的扩散能力区间划分,重新对内容节点进行颜色标定,完成一次局部动态更新。而相关内容节点会把一次更新对外进行扩散传播,导致其邻居也连带开始一次新的计算扩散能力和颜色标定的过程。这样通过连锁反应,将更新命令一步步传播从而完成CCSG各个局部的更新,并最终完成CCSG的整体更新,最后通过新的节点着色直观展现出CCSG自底向上更新带来一系列变化的效果。
本发明提供的CCSG的局部动态更新流程如图4所示,具体描述如下:
Step1.将节点的所有邻居节点放入更新队列作为候选参与更新的节点集;
Step2.依次从更新队列中取出节点,计算其与源节点关联的无向边权重在所有与源节点关联的无向边权重和中的占比以及该无向边存在时长;
Step3.判断权重占比是否大于系统设定阈值ξ,以及无向边存在时长是否大于系统参数Θ与该边权重的商,只有同时满足该两个条件,该无向边对应的候选节点才会入选;
Step4.抛弃不符合Step3所述条件的候选节点,将符合条件的候选节点加入到源节点缓存中;
Step5.对于该满足条件的候选节点,判断其到源节点的路径跳数是否小于系统设定的扩散半径λ,如果小于λ,那么跳回Step1,否则继续向下执行Step6;
Step6.判断源节点的更新队列是否为空,如果不为空,则跳回Step2,否则继续向下执行Step7;
Step7.对缓存中的每一个更新节点,从数据库中获取与该节点相关的用户信息,并借此更新节点自身的版权内容扩散能力和与父节点的扩散能力相似度信息,并据此更新自身的颜色标定。待对缓存中所有节点完成更新后,即完成CCSG的一次局部动态更新。
为便于下次更新能高效筛选出参与更新节点,减小系统开销,CCSG会将本次参与更新的节点缓存起来用于下次更新。在完成CCSG的一次次局部更新后,源节点缓存如果已满,如果还需要往其中添加更新节点则需要依据一定的缓存更新策略,替换一些老节点以添加新节点。其缓存更新策略流程如图5所示,具体描述如下:
Step1.源节点将参与一次更新操作的节点都加入到源节点缓存中;
Step2.对加入源节点缓存的每一个节点,系统都为其附加一个更新计数器;
Step3.利用计数器记录每次更新操作后,缓存节点自身信息实际发生变化的次数;
Step4.如果系统有新的节点需要加入到缓存中,则需要判断源节点缓存是否已满,如果已满那么在缓存中检查每一个节点的计数器,挑出计数器值为0的节点,即每次更新操作都没有对其自身信息产生影响的节点,剔除这些节点,并添加新节点,完成源节点的缓存更新。对于一个版权内容节点,其自身存储了与其相关的用户、节点内容扩散能力以及节点颜色。版权内容节点对象与用户对象结构及关系如图6所示:其中,owner表示与该版权内容相关的一系列用户集合,spread表示相应版权内容的扩散能力,color则表示该版权内容节点的颜色,其取值是系统参数——RED、YELLOW、GREEN、BLUE,不同颜色指示不同的扩散能力。
P2P网络用户在对版权内容进行上传/下载行为时,其自身的威胁程度T会随着行为的发生、进行以及完成而产生一系列变化。比如一位持续进行下载的用户,其当前状态为”download_doing”,当其完成下载后状态变为”download_done”,而如果他转而开始对下载的版权内容进行上传分享,那么他的状态转变为”upload_doing”。变化的用户状态在参与到用户威胁度计算后,其变化就在T上体现出来。而T的变化又会反映到其相关的版权内容扩散能力spread上,进而改变了内容节点的颜色color。在完成源头节点的信息更新后,源头节点会把更新向其邻居节点进行广播。
由于用户处在某一状态具有一定的稳定性,其相关的版权内容节点信息的变化也不会频繁发生。因而如果一个内容节点更新信息后,没有必要对其所有邻居节点进行更新,只需要筛选出与其内容相似度较接近的邻居节点进行更新即可,少做无用功。同时,由于CCSG中节点连接的紧密性,一个更新节点的某一个邻居此次更新即使未获选连带更新,它在其他邻居更新时也有可能获选,从而得到补偿更新。这样的筛选更新也会有效减少系统开销,提高系统效率。版权内容相似度从共享的用户数上度量了两版权内容的相似性大小,即如果两版权内容相似度越大,那么同一个用户同时拥有两版权内容的可能性就越大,而一个用户行为性质的变化就会连带导致两版权内容的扩散能力同时发生变化。因而,两版权内容相似度,从这个角度上讲,反映出两节点会一同发生更新的概率大小。另外,两个节点维持关联的时间越长,就说明两节点的关系越牢固,而时间尺度上的累积,也为达到从一个节点到另一个节点扩散的目的起到了正向影响。结合以上两点,系统采用的扩散概率模型如式(1)、(2)、(3)所示:
Pi→j=cond_ω|cond_t,(1)
Figure BDA00002008397100101
Figure BDA00002008397100102
G(V,E)表示CCSG,V表示CCSG中的节点集,E表示CCSG的边集。式(1)、(2)、(3)涉及的变量说明如表2所示:
表2.扩散概率模型变量说明
Figure BDA00002008397100103
为保证一定的更新节点的数量,系统采用了边权重占边集权重和的比例作为筛选CCSG局部动态更新的一个条件,而系统阈值ξ则是在大量的既往历史统计的基础上,保证CCSG整体更新的完整性而选取的一个固定值。Pi→j的取值情况如表3所示:
表3.Pi→j的取值情况
式(1)对cond_ω和cond_t进行了或运算,其旨在说明要达到从节点i到节点j传播更新命令的条件,权重和时间都存在对条件的正向影响并且只要其中一个条件得到满足传播更新命令的条件及成立。当一边权重达到对权重和的一定占比,或者如果权重占比不占优势但两节点的关联时长足以保证两节点牢固的关联关系(例如,现实中,爱好广泛的用户会同时分享不同类型的版权内容),那么系统会对这些邻居进行信息更新。这里需要特别指出的是,cond_t的系统阈值针对不同节点采用不同的取值,这是因为对于无向边权重大(即版权内容相似度大)的邻居节点在关联保持一段时间后已明显说明其与更新命令源头节点之间的紧密关系,而对于无向边权重小(即版权内容相似度小)的节点,则需要通过时间的不断累积以达到一个相当高的水平才足以证明两节点之间关系的稳固,而稳固的关系足以将该邻居节点纳入通知更新命令的集合当中。为避免局部动态更新命令广播的发散而无法收敛,系统设定系统阈值λ作为扩散半径来对更新命令的扩散范围加以限制。即从源头节点到接收通知节点的跳数不超过λ。对于λ的取值,用户可以对系统性能和效果加以权衡来定夺。图7显示的是在λ=2,ξ=0.2,θ=0.2时,系统所筛选出的需要通知更新的邻居节点。
图7中,节点Nt之所以入选不是因为其权重占比超过0.2,而是其与源头节点O之间的关联的持续时长已超过1小时
Figure BDA00002008397100121
2)CCSG更新节点缓存策略
如果每一次局部动态更新都执行一次邻居节点的筛选,很多未发生更新的邻居节点会再次入选,将会影响系统的效率,为进一步提高CCSG更新的效率,在局部动态更新时,源头节点会缓存第一次所筛选出来的邻居节点作为下一次局部动态更新首先选择,并对每个缓存的节点增加一个计数器,累计得到每个节点的在接收到更新指令后自身信息实际发生变化的频率。。
如果经过一段时间后,缓存中某些节点的更新频率计数器仍为零,即每次更新操作并没有改变该节点的自身信息,那么源头节点会把该“僵尸”节点剔除缓存,并添加新的邻居节点到缓存中。这样就形成了下次更新候选的节点集,将筛选候选更新节点的操作复杂度由O(nλ)降到O(1),提高了系统效率。即系统采用的缓存更新策略是剔除最久未更新者。
通过基于权重和时长的增量更新方法以及节点更新缓存策略,系统得以对CCSG进行局部动态更新并最终完成整体结构的更新。CCSG的高效率更新为用户观察P2P网络中版权内容传播态势、发现盗版内容泛滥迹象提供支持和保证,达到及时预先区域预警与管控目的。
最后所应说明的是,以上实施例仅用以说明本发明的技术方案而非限制。尽管参照实施例对本发明进行了详细说明,本领域的普通技术人员应当理解,对本发明的技术方案进行修改或者等同替换,都不脱离本发明技术方案的精神和范围,其均应涵盖在本发明的权利要求范围当中。

Claims (9)

1.一种更新对等网络版权内容相似度图的方法,该方法基于用户综合客观行为采用局部动态的方法更新对等网络版权内容相似度图,所述方法包含:
步骤101)更新对等网络版权内容相似度图中的源节点信息的步骤,所述源节点的信息包含:用户威胁度和节点扩散能力;其中,所述用户威胁度是指通过系统设定的量化指标针对用户在P2P网络中上传下载版权内容的客观行为计算出的衡量用户行为性质的量化指标,所述节点扩散能力是指对与其相关的所有用户的用户威胁度进行加权求和而得到的衡量版权内容传播能力和程度的量化标准;
步骤102)基于对等网络版权内容相似度图以源节点为广播源,向该源节点的若干邻居节点广播更新指令的步骤;
步骤103)收到广播指令的各邻居节点更新其所在节点信息的步骤,所述的节点信息包含:用户威胁度和节点扩散能力;
其中,所述的源节点为对等网络版权内容相似度图中的任意一个内容节点,且该节点满足启动更新操作的条件,所述的启动更新操作的条件具体为:基于用户行为质变引起相关版权内容质变时,启动该版权内容节点的更新操作,所述用户行为质变的程度是通过用户客观行为状态、行为持续时间、行为累积次数以及行为性质共同参与计算得到的量化指标。
2.根据权利要求1所述的更新对等网络版权内容相似度图的方法,其特征在于,所述源节点通过更新队列选取传输指令的节点。
3.根据权利要求2所述的更新对等网络版权内容相似度图的方法,其特征在于,所述步骤102)进一步包含:
步骤102-1)将所述源节点的所有邻居节点放入更新队列作为候选参与更新的节点集;
步骤102-2)依次从更新队列中取出节点,计算其与源节点关联的无向边权重在所有与源节点关联的无向边权重和中的占比以及该无向边存在时长;
步骤102-3)判断权重占比是否大于系统设定阈值ξ,或者无向边存在时长是否大于系统参数θ与该边权重的商,只要满足该两个条件之一,该无向边对应的候选节点就会入选;
步骤102-4)抛弃不符合步骤102-3)所述条件的候选节点,将符合条件的候选节点加入到源节点缓存中;
步骤102-5)对于该满足条件的候选节点,判断其到源节点的路径跳数是否小于系统设定的扩散半径λ,如果小于λ,那么跳回步骤102-1),否则继续向下执行步骤102-6);
步骤102-6)判断源节点的更新队列是否为空,如果不为空,则跳回步骤102-2),否则继续向下执行步骤102-7);
步骤102-7)对缓存中的每一个更新节点,从数据库中获取与该节点相关的用户信息,借此更新节点自身的版权内容扩散能力和与父节点的扩散能力相似度信息,并据此更新自身的颜色标定,待对缓存中所有节点完成更新后,即完成CCSG的一次局部动态更新。
4.根据权利要求3所述的更新对等网络版权内容相似度图的方法,其特征在于,所述源头节点将参与一次更新操作的节点都加入到源节点缓存中;对加入源节点缓存的每一个节点,系统都为其附加一个更新计数器;利用计数器记录每次更新操作后,缓存节点自身信息实际发生变化的次数;如果系统有新的节点需要加入到缓存中,则需要判断源节点缓存是否已满,如果已满那么在缓存中检查每一个节点的计数器,挑出计数器值为0的节点,即每次更新操作都没有对其自身信息产生影响的节点,剔除这些节点,并添加新节点,完成源节点的缓存更新。
5.一种更新对等网络版权内容相似度图的系统,该系统基于用户综合客观行为采用局部动态的方法更新对等网络版权内容相似度图,所述系统包含:
启动更新操作的源节点、对等网络的其余各节点及更新命令扩散半径设置模块;
所述源节点进一步包含:
更新驱动模块,用于基于用户行为质变引起相关版权内容质变的原则启动该节点的更新操作;
广播模块,用于将更新操作向其若干邻居节点进行广播;
所述其余各节点包含:
广播传输模块,用于接收源节点或其余节点发送的更新操作指令,并向它的若干邻居节点继续传输该更新指令;
更新驱动模块,用于基于广播指令启动该节点的更新操作;
所述更新命令扩散半径设置模块,用户设置更新命令的扩散半径,对源节点广播的更新操作的扩散命令的扩散范围进行限制;
其中,所述的源节点为对等网络版权内容相似度图中的任意一个内容节点,且该节点满足启动更新操作的条件,所述的更新操作的条件具体为:基于用户行为质变引起相关版权内容质变时,启动该版权内容节点的更新操作,所述用户行为质变的程度是通过用户客观行为状态、行为持续时间、行为累积次数以及行为性质共同参与计算得到的量化指标。
6.根据权利要求5所述的更新对等网络版权内容相似度图的系统,其特征在于,所述源节点和其余各节点均还包含:
邻居节点获取模块,用于获取节点的所有邻居节点;
信息收集模块,用于获取各邻居节点与源节点的内容相似度的值,并获取源节点与各邻居节点组成的无向边的存在时间的长度值;
第一级节点集筛选处理模块,用于依据由权重条件和时间条件组成的扩散概率模型的函数值从邻居节点获取模块得到邻居节点中选择第一级节点集;
其中,所述扩散概率模型为:
Pi→j=cond_ω·cond_t
所述权重条件为:
所述时间条件为:
Figure FDA00002008397000032
其中,ωij为源节点i与其任意邻居节点j的版权内容相似度值;ξ为设置的权重比例的阈值;ωik为所有与节点i关联的边的权重和,k为与节点i关联的任意一个节点;θ为设定的参与计算无向边存在时长阈值的系统参数;t(i,j)为源节点i与其邻居节点j组成的无向边的存在时长;所述的第一节点集作为更新命令的扩散节点。
7.根据权利要求6所述的更新对等网络版权内容相似度图的系统,其特征在于,所述扩散概率模型还采用源节点与某个邻居节点间的无向边权重占该源节点所有无向边权重和的比例和源节点与某个邻居节点的关联时间长度值两个因素选中第一级节点集中的各节点;
即当源节点与某个邻居节点间的无向边权重占该源节点所有无向边权重和的比例大于等于设置的权重比例阈值并且源节点与某个邻居节点的关联时间长度值大于等于为该边设置的存在时长时将节点归入第一级节点集。
8.根据权利要7所述的更新对等网络版权内容相似度图的系统,其特征在于,所述各节点还设置有缓存策略执行模块,用于在执行下次更新时,直接从缓存中读取待更新的第一级节点,而无需重复计算并筛选邻居节点的操作。
9.根据权利要求8所述的更新对等网络版权内容相似度图的系统,其特征在于,所述缓存策略执行模块进一步包含如下子模块:
待更新节点加入缓存模块:源头节点会将本次满足更新条件并将接收更新指令的节点缓存起来,并对每个缓存的节点增加一个计数器;
节点更新频率统计模块:利用对每个节点附加的计数器累计得到每个节点的在接收到更新指令后自身信息实际发生变化的频率;
缓存更新模块:用于依据节点更新频率统计模块获得的更新频率统计值剔除缓存中的更新频率为零的节点并添加新节点。
CN201210288837.1A 2012-08-14 2012-08-14 一种更新对等网络版权内容相似度图的方法及系统 Expired - Fee Related CN103595740B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201210288837.1A CN103595740B (zh) 2012-08-14 2012-08-14 一种更新对等网络版权内容相似度图的方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201210288837.1A CN103595740B (zh) 2012-08-14 2012-08-14 一种更新对等网络版权内容相似度图的方法及系统

Publications (2)

Publication Number Publication Date
CN103595740A true CN103595740A (zh) 2014-02-19
CN103595740B CN103595740B (zh) 2016-08-24

Family

ID=50085722

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201210288837.1A Expired - Fee Related CN103595740B (zh) 2012-08-14 2012-08-14 一种更新对等网络版权内容相似度图的方法及系统

Country Status (1)

Country Link
CN (1) CN103595740B (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111064780A (zh) * 2017-03-01 2020-04-24 贵州白山云科技股份有限公司 一种多任务内容更新方法、装置、设备及介质

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006195694A (ja) * 2005-01-13 2006-07-27 Brother Ind Ltd ノード装置、ノード装置情報更新方法、ノード装置情報更新プログラム、及びノード装置情報更新プログラムを記録した記録媒体
CN101178754A (zh) * 2006-11-08 2008-05-14 上海东方宽频传播有限公司 宽频数字版权保护方法
US20100039931A1 (en) * 2007-11-22 2010-02-18 Huawei Technologies Co., Ltd. Method, device and system for updating routes after node fails in p2p network
CN102571839A (zh) * 2010-12-15 2012-07-11 北京邮电大学 基于用户社会属性的p2p内容分发方法及系统

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006195694A (ja) * 2005-01-13 2006-07-27 Brother Ind Ltd ノード装置、ノード装置情報更新方法、ノード装置情報更新プログラム、及びノード装置情報更新プログラムを記録した記録媒体
CN101178754A (zh) * 2006-11-08 2008-05-14 上海东方宽频传播有限公司 宽频数字版权保护方法
US20100039931A1 (en) * 2007-11-22 2010-02-18 Huawei Technologies Co., Ltd. Method, device and system for updating routes after node fails in p2p network
CN102571839A (zh) * 2010-12-15 2012-07-11 北京邮电大学 基于用户社会属性的p2p内容分发方法及系统

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
YUVAL SHAVITT 等: "Mining musical from large-scale peer-to-peer network", 《IEEE MULTIMEDIA》 *
郑毅等: "对等网络视频点播系统中的用户行为研究", 《北京交通大学学报》 *

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111064780A (zh) * 2017-03-01 2020-04-24 贵州白山云科技股份有限公司 一种多任务内容更新方法、装置、设备及介质
CN111064780B (zh) * 2017-03-01 2023-04-18 贵州白山云科技股份有限公司 一种多任务内容更新方法、装置、设备及介质

Also Published As

Publication number Publication date
CN103595740B (zh) 2016-08-24

Similar Documents

Publication Publication Date Title
Zhou et al. Multi-population parallel self-adaptive differential artificial bee colony algorithm with application in large-scale service composition for cloud manufacturing
CN107451393B (zh) 基于随机变邻域搜索算法的护士排班方法和装置
CN106357405A (zh) 一种基于区块链技术一致性算法的数据管理方法及系统
CN102075352A (zh) 一种网络用户行为预测的方法和装置
CN115329985B (zh) 无人集群智能模型训练方法、装置和电子设备
CN101242432A (zh) 一种互联网内容分发方法、系统及装置
CN103152436A (zh) 基于兴趣群组的p2p网络信任云模型计算方法
CN114257395A (zh) 基于协作学习的定制化网络安全态势感知方法及装置
Zeng et al. A system dynamic model to quantify the impacts of water resources allocation on water–energy–food–society (WEFS) nexus
Tian et al. Solving the resource-constrained multi-project scheduling problem with an improved critical chain method
JP7527535B1 (ja) マルチバリューチェーン進化の予測方法、システムおよび記憶媒体
Faltings et al. Eliciting truthful measurements from a community of sensors
CN103593543B (zh) 一种更新p2p网络用户主观行为分析模型参数的方法及系统
Thomas Experimentation with reputation concerns–Dynamic signalling with changing types
CN108833294A (zh) 面向数据中心广域网的低带宽开销的流量调度方法
CN116386336A (zh) 基于卡口车牌数据的路网交通流量鲁棒计算方法及系统
Borgs et al. Game-theoretic models of information overload in social networks
Zhao et al. Enhancing traffic signal control with composite deep intelligence
CN102006305A (zh) P2p网络中基于分布式可推荐的声誉遏制恶意行为的方法
CN114120672A (zh) 基于多智能体强化学习的异构路口场景交通信号控制方法
Knari et al. Multi-Agent Deep Reinforcement Learning for content caching within the Internet of Vehicles
CN104901892A (zh) 一种基于蚁群算法的QoS组播路由优化器及其实现方法
CN103595740A (zh) 一种更新对等网络版权内容相似度图的方法及系统
CN117392483A (zh) 基于增强学习的相册分类模型训练加速方法、系统及介质
Zhang et al. A multi-objective optimization method for service composition problem with sharing property

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20160824

Termination date: 20190814

CF01 Termination of patent right due to non-payment of annual fee