CN103593543A - 一种更新p2p网络用户主观行为分析模型参数的方法及系统 - Google Patents

一种更新p2p网络用户主观行为分析模型参数的方法及系统 Download PDF

Info

Publication number
CN103593543A
CN103593543A CN201210288565.5A CN201210288565A CN103593543A CN 103593543 A CN103593543 A CN 103593543A CN 201210288565 A CN201210288565 A CN 201210288565A CN 103593543 A CN103593543 A CN 103593543A
Authority
CN
China
Prior art keywords
user
analysis model
network
model
degree
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201210288565.5A
Other languages
English (en)
Other versions
CN103593543B (zh
Inventor
童恩栋
牛温佳
曲本科
苗光胜
谭红艳
唐晖
慈松
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Institute of Acoustics CAS
Original Assignee
Institute of Acoustics CAS
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Institute of Acoustics CAS filed Critical Institute of Acoustics CAS
Priority to CN201210288565.5A priority Critical patent/CN103593543B/zh
Publication of CN103593543A publication Critical patent/CN103593543A/zh
Application granted granted Critical
Publication of CN103593543B publication Critical patent/CN103593543B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明提供了一种更新P2P网络中的用户主观行为分析模型参数的方法及系统,该方法从构建P2P网络中基于计划行为理论的用户主观行为分析模型出发,根据P2P网络中当前的版权内容分布情况,量化信念指标,扩充样本数据,从而动态修正行为模型参数。本发明一方面面向对等网络版权内容分析,建立了包括喜好度、受欢迎程度、版权意识度、惩罚度各信念指标在内的基于计划行为理论的用户主观行为分析模型,对版权管控中用户主观行为分析提出了理论依据;另一方面,基于客观版权内容分布情况,提出了该用户主观行为分析模型中各信念指标的量化方法。本发明提出了用户主观行为分析模型的动态拟合方法。基于当前版权内容分布,动态修正用户主观行为分析模型参数。

Description

一种更新P2P网络用户主观行为分析模型参数的方法及系统
技术领域
本发明涉及对等网络中基于版权内容分布的用户主观行为分析模型的动态拟合,具体涉及一种更新P2P网络用户主观行为分析模型参数的方法及系统。
背景技术
对等网络技术(P2P技术)已被广泛应用于集群计算、协同工作、搜索引擎和文件共享与交换等方面。由于P2P技术的核心是点对点的传播模式,因而相较于传统的客户-服务器的集中处理模式,网络内容传播的管理与控制更为复杂和困难。从目前状况来看,这主要体现在两个方面:对不良内容的传播控制更为复杂和对版权管理更为困难。以P2P文件共享与交换软件BT为例,它克服了传统下载方式的局限性,具有参与下载的人越多,文件下载速度越快的特点。BT软件自动将一个文件分割成若干块,当某一PC节点在进行下载,它也作为一个对外提供服务的节点,向其他PC供应已经下载的文件块。最终,来自不同节点的文件块在一台PC上融合成了一个完整的文件。从上述P2P文件共享与交换的工作原理可以看出,一台PC在进行下载的同时,也自动进行着上传的行为,成为一台临时的服务器。因此,从版权角度来讲,鉴于P2P技术导致受侵害的用户和版权的数量、范围急剧增加的状况,对版权内容的传播分析与管控变得紧迫和必要。
目前版权内容的传播分析研究主要集中在内容检测和内容关系挖掘两个方面。内容检测主要是利用数字水印及DNA等技术来检测某个音/视频内容是否属于盗版内容。而内容关系挖掘又可以从主观和客观两个方面进行,从而为传播分析与管控提供有效支持。其中,客观方面的内容关系挖掘旨在通过揭示内容之间的相似度关系来深入发掘P2P网络用户之间的文件共享关系,深刻反映P2P网络内容交互与分布的内部结构;主观方面的内容关系挖掘旨在分析P2P网络用户的主观行为意图,推测某一时刻、某一状态下用户是否会参与到盗版内容的传播。
其实,任何版权内容的传播都是由用户的主观行为决定的,用户的主观行为决定了用户是否会参与到相应版权内容的传播。因此,分析对等网络中用户的主观行为对版权内容的传播分析及管控至关重要。目前,版权内容管控大多数采用事后处理,即发现盗版内容传播后,通过采取“下载阻止”等技术来达到阻断盗版内容传播的目的。而通过分析用户主观行为则能够在盗版内容扩散传播之前发现其潜在的传播趋势,实现预警,从而先发制人的采取措施,能够有效地抑制盗版内容的传播。
已有的用户主观行为分析大多基于计划行为理论(Theory of Planned Behavior,TPB)。TPB认为行为(Behavior,简称B)是行为意图(Behavior Intention,简称BI)的直接函数,而行为意图则由态度(Attitude,简称A),主观规范(SubjectiveNorm,简称SN)和知觉行为控制(Perceived Behavioral Control,简称PBC)构成。它们之间的关系可表述为:
BI=c1×A+c2×SN+c3×PBC               (1)
其中,态度是指个人对该项行为所抱持的正面或负面的感觉;主观规范是指个人对于是否采取某项特定行为所感受到的社会压力;知觉行为控制是反映个人过去的经验和预期的阻碍。所述态度、主观规范及知觉行为控制是抽象概念,是不可观测的变量,解决方法就是采用可直接观测的变量(即信念指标)来对态度、主观规范及知觉行为控制予以测量,如采用可直接测量的喜好度这一信念指标来测量态度。
现有的用户主观行为分析首先根据应用场景为不同的抽象概念选择合适的信念指标,建立用户主观行为分析模型。依据所选信念指标编制正式调查问卷,经模型拟合及模型评价并最终确立模型参数(即图1中的c11、c21、c31、c1~c3),且现有技术虽然包含模型拟合,但这种模拟拟合过程不是动态的。由此可见,已有方法仅仅在模型建立之初确定模型参数,从而使得模型参数是静态的(即,现有技术建立初期是确定模型结构及模型参数的,且仅是在建立初期确立模型参数,之后参数保持不变,其中模型参数指模型中连线的权值,即图1中的c11、c21、c31、c1、c2及c3)。而P2P网络中用户的主观行为受到多方面的因素影响,呈现动态变化的特点。因此最初的模型参数随着时间的推移可能并不再适用,现有技术的用户主观行为分析模型缺乏动态性。因此,本发明针对上述问题,从构建P2P网络中基于计划行为理论的用户主观行为分析模型出发,根据P2P网络中当前的版权内容分布情况,动态地修正用户主观行为分析模型的参数,从而达到实时动态的拟合用户主观行为的目标。
发明内容
本发明的目的在于,为克服现有技术仅仅在用户主观行为分析模型建立之初确定模型参数造成的随着时间的推移模型涉及的各参数并不再适用,从而造成用户主观行为分析模型缺乏动态性,最终导致的大大影响版权内容传播分析与管控等问题,从而提供一种更新P2P网络用户主观行为分析模型参数的方法及系统。
为了实现上述目的,本发明提供了一种更新P2P网络中的用户主观行为分析模型参数的方法,该方法基于动态拟合的方法动态实时调整用户主观行为分析模型的参数,所述方法包含:
步骤101)根据选取的信念指标设定用户主观行为分析模型,并采用调查问卷获得初始样本数据;
步骤102)依据初始样本数据获得各信念指标间的第一相关系数矩阵;
步骤103)根据第一相关系数矩阵及用户主观行为分析模型,采用统计算法生成一个基于该用户主观行为分析模型的最接近信念指标的相关系数矩阵的相关矩阵,即再生矩阵,并依据该再生矩阵确定用户主观行为分析模型各参数的初始值;
步骤104)通过多次迭代修正用户主观行为分析模型的各初始参数值直至该用户主观行为分析模型较好的拟合调查问卷获得的样本数据,获得初始的用户主观行为分析模型;
步骤105)基于P2P网络的版权内容分布信息得到基于版权内容分布的样本数据,将该样本数据与调查问卷获得的初始样本数据融合获得第二样本数据,并依据第二样本数据生成各信念指标间的第二相关系数矩阵;
步骤106)监控基于初始用户主观行为分析模型得到的再生矩阵和第二相关系数矩阵之间的拟合关系,当两者拟合度小于某设定阈值时,根据当前信念指标间的相关关系矩阵,重新构建再生矩阵以更新模型参数,由模型评价与模型拟合多次迭代后,得到拟合当前内容分布的用户主观行为分析模型的参数,依据该参数修正用户主观行为分析模型,从而获得实时动态的用户主观行为分析模型;
其中,所述的信念指标包含:喜好度、版权意识度、受欢迎程度和惩罚度;所述第二样本数据包含来源于调查问卷的样本数据和基于版权内容分布信息得到的样本数据,所述版权内容分布信息为P2P网络中的事件行为,包括用户拥有的具体内容、用户当前的上传或下载状态、上传或下载时间持续的时间以及上传或下载在持续时间内发生的次数。
上述技术方案中,所述调查问卷根据选取的信念指标进行编制;
采用结构方程模型验证用户主观行为分析模型与调查问卷样本数据的拟合度并修正用户主观行为分析模型的各参数。
上述技术方案中,所述喜好度采用如下策略获取;
步骤201)根据内容的相似度计算两个用户的相似度,当两用户分别为用户A与用户B时的相似度表示为:
S AB = Σ i = 1 k w i
步骤202)得到用户的相似度后,采用k-medoids聚类算法将相似度大的用户聚类为簇;
步骤203)找到目标用户所在的簇,统计本簇内已经下载了目标用户将要下载的版权内容的用户数量,记为Nu,目标用户所在的簇大小表示为Ns,则比例参数值为:
l = N u N s ;
步骤204)确定比例参数值所在的具体范围,并根据该范围依据划分规则确定喜好度的具体取值;
其中,目标用户指当前需要计算喜好度的用户:而用户指P2P网络中的每一个用户。
上述技术方案中,所述版权意识度采用如下策略获得:
步骤301)计算用户历史下载中正版内容所占比例值p,且p的取值范围为[0,1]:
Figure BDA00002008519600043
步骤302)依据量化规则将获得的比例值p量化为某个具体的版权意识度值;所述量化规则为依据p落在区间[0,1]中的具体位置将版权意识度量化为某些具体的整数值,其中p值越小表示用户下载的正版内容所占比例越小,从而表明该用户的版权意识较弱,反之则表明该用户的版权意识较强。
上述技术方案中,所述惩罚度通过记录用户的下载时长获得,具体包含:
用户开始下载版权内容时开始记录,在完成下载后则终止计算其下载时长,且该下载时长记为Td
设置阈值Ts表示用户的下载时长忍受阈值,若Td>Ts,表示该用户被版权监管系统“下载阻止”并记录一次“下载阻止”,记录某段时间内用户被下载阻止的总次数;
依据下载阻止次数获得惩罚度的取值,所述惩罚度为若干整数值,该值越大表示用户被惩罚的次数越多,反之越少。
基于上述方法本发明还提供了一种更新P2P网络中的用户主观行为分析模型参数的系统,该系统基于动态拟合的方法动态实时调整用户主观行为分析模型的参数,所述系统包含:
模型构建模块,用于依据选取的信念指标设定用户主观行为分析模型的结构;
材料收集模块,用于依据选取的信念指标编制调查问卷,并依据该调查问卷收集基于多个用户的第一样本数据;
样本库,用于存放用于统计分析的样本数据,当首次建立用户主观行为模型时仅存放由调查问卷获得的第一样本数据,当模型及参数初步确定后还存放基于版权内容分布信息得到的基于版权内容分布的样本数据;
统计分析模块,用于将所述样本库输入的数据进行统计分析处理,获得各信念指标间的相关系数矩阵,将该相关系数矩阵输入模型拟合模块;并接收监控模块的相关系数查询请求,然后向该监控模块返回基于样本库所有样本数据的当前的相关系数矩阵;
模型拟合模块,用于将统计分析处理后的相关系数矩阵与模型构建模块设定的用户主观行为分析模型进行模型拟合处理,得到再生矩阵;
模型评价模块,用于计算模型拟合模块输出的再生矩阵与相关系数矩阵的拟合度结果决定是否再次触发模型拟合模块,即当拟合度小于设定拟合度时再次返回模型拟合模块进行拟合,当拟合度大于设定拟合度时停止拟合过程,并根据最终的再生矩阵及用户主观行为分析模型的结构得到模型的参数,输出用户主观行为模型;
用户主观行为分析模型,用于将满足拟合度要求的参数值设置为用户主观行为模型的参数值得到最终用户主观行为分析模型,该模型还与监控模块连接,当用户主观行为分析模型的参数确定后就向监控模块输出再生矩阵,当模型更改后,才再次向监控模块输出再生矩阵;
版权内容分布情况记录模块,用于实时记录P2P网络的版权内容的变化情况;
预处理模块,对输入的版权内容的变化情况转换为统计分析模块适用的样本数据并存入样本库,该统计信息与调查问卷获得的样本数据;和
监控模块,用于周期性的向所述统计分析模块请求相关系数矩阵和基于用户主观行为分析模型得到的再生矩阵进行拟合,当得到拟合度小于设定阈值时该监控模块驱动模型拟合模块再次进行模型拟合;
其中,所述的信念指标包含:喜好度、版权意识度、受欢迎程度和惩罚度;所述监控模块依据的相关系数矩阵基于调查问卷和版权内容分布信息获得的样本数据。
上述技术方案中,所述调查问卷根据选取的信念指标进行编制;
采用结构方程模型验证用户主观行为分析模型与调查问卷样本数据的拟合度并修正用户主观行为分析模型的各参数。
上述技术方案中,所述预处理模块进一步包含:喜好度量化模块、版权意识度量化模块、受欢迎度量化模块和惩罚度量化模块。
上述技术方案中,所述喜好度量化模块进一步包含:
第一处理模块,用于根据内容的相似度推出两个用户的相似度,当两用户分别为用户A与用户B时的相似度表示为:
S AB = Σ i = 1 k w i
聚类模块,用于采用k-medoids聚类算法将相似度大的用户聚类为簇;
第二处理模块,用于寻找目标用户所在的簇,统计本簇内已经下载了目标用户将要下载的版权内容的用户数量,记为Nu,目标用户所在的簇大小表示为Ns,则比例参数值为:
l = N u N s ;
量化模块,用于确定比例参数值所在的具体范围,并根据该范围依据划分规则确定喜好度的具体取值。
上述技术方案中,所述版权意识度量化模块进一步包含:
第三处理模块,用于计算用户历史下载中正版内容所占比例值p,且p的取值范围为[0,1]:
Figure BDA00002008519600063
第二量化处理模块,用于依据量化规则将获得的比例值p量化为某个具体的版权意识度值;所述量化规则为依据p落在区间[0,1]中的具体位置将版权意识度量化为某些具体的整数值,其中p值越小表示用户下载的正版内容所占比例越小,从而表明该用户的版权意识较弱,反之则表明该用户的版权意识较强。
与现有技术相比,本发明的技术优势在于:
本发明一方面面向对等网络版权内容分析,建立了包括喜好度、受欢迎程度、版权意识度、惩罚度各信念指标在内的基于计划行为理论的用户主观行为分析模型,对版权管控中用户主观行为分析提出了理论依据;另一方面,基于客观版权内容分布情况,首次提出了该用户主观行为分析模型中各信念指标的量化方法。区别于已有的基于调查问卷的静态的用户主观行为分析模型,本发明提出了用户主观行为分析模型的动态拟合方法。基于当前版权内容分布,动态修正用户主观行为分析模型参数,从而得到实时有效的用户主观行为分析。
附图说明
图1是现有技术的计划行为理论模型;
图2是对等网络中用户主观行为分析模型;
图3是本发明的用户主观行为分析模型动态拟合系统示意图;
图4是本发明的版权内容相似度图;
图5是对本发明的用户版权内容映射组合关系示意图。
具体实施方式
以下结合附图对本发明作进一步的详细说明。
本发明首先构建P2P网络中的用户主观行为分析模型,并在P2P网络运行过程中不断获得版权内容分布情况,经过预处理提取适用于用户主观行为分析模型的样本数据,通过不断丰富的样本数据,动态拟合用户主观行为分析模型,提高用户主观行为分析的准确度。
1.用户主观行为分析模型
本发明基于计划行为理论来建模P2P网络中的用户主观行为。计划行为理论中,行为意图的每一个决定因素(即态度、主观规范与知觉行为控制)都由特定的信念结构决定,即行为信念(bi),规范信念(nbi)及控制信念(cbi)。针对P2P网络中的用户系在盗版内容行为,我们有如下假设,
Figure BDA00002008519600071
假设1:喜好度越高,用户下载盗版内容的可能性越大。
Figure BDA00002008519600072
假设2:版权意识度越高,用户下载盗版内容的可能性越小。
Figure BDA00002008519600073
假设3:受欢迎度越高,用户下载盗版内容的可能性越大。
Figure BDA00002008519600074
假设4:惩罚度越高,用户下载盗版内容的可能性越小。
显然,喜好度及受欢迎度对用户的下载行为具有正负荷,而版权意识度及惩罚度对用户的下载行为具有负负荷。用户主观行为分析模型各信念指标描述如表1所示,
表1.用户主观行为模型各因素信念指标描述
Figure BDA00002008519600075
Figure BDA00002008519600081
由此,P2P网络中用户主观行为分析的计划行为理论模型如图2所示,模型动态拟合初始阶段,我们根据选取的信念指标编制调查问卷,抽样选取经常使用P2P网络的用户作为调查对象,并对获得的样本数据进行筛选。然后,采用StructuralEquation Modeling(SEM,结构方程模型)验证模型与问卷数据的拟合度并修正模型参数(c1~c3,c11,c21,c22,c31),迭代直到得到拟合度良好的用户主观行为分析模型。
2.用户主观行为分析模型动态拟合系统
通过调查问卷方法建立起来的P2P网络用户主观行为分析模型是静态的,缺乏自适应能力。因此,通过爬虫获取P2P网络中版权内容的分布情况,以此来扩充模型动态拟合所需的样本数据,动态地修正用户主观行为分析模型参数。P2P网络中用户主观行为分析模型动态拟合系统如图3所示,其中,左边虚线部分描述的是现有技术的用户主观行为分析流程。首先,根据选取的具体信念指标设定用户主观行为分析模型(即模型建构)。模型设定之后,为了使所设定的模型能够用于执行用户主观行为分析,需要对模型的一些属性进行设置,这就涉及模型参数的设定问题。现有技术采用调查问卷的方式获得样本数据,统计分析模块经过一定的统计分析(如协方差)获得各信念指标间的相关系数矩阵。其次,模型拟合过程依据各信念指标间的相关系数矩阵及设定的模型,通过一定的统计手段(如最大似然法)生成一个该模型结构下最为接近信念指标相关系数矩阵的相关矩阵,即再生矩阵(reproducedmatrix),从而可以由再生矩阵确定模型各参数。最后,模型评价评估模型拟合程度。通过模型评价及模型拟合多次迭代修正模型参数直至模型较好的拟合调查问卷获得的样本数据。右边虚线内是本发明添加的基于版权内容分布的用户主观行为分析动态拟合模块。图3中的监控模块的输入分别为当前用户主观行为分析模型的再生矩阵以及统计分析模块依据当前样本数据计算得到的相关关系矩阵,负责监控再生矩阵及相关关系矩阵是否拟合良好,并据此决定是否触发模型拟合过程。同现有技术不同,这里的样本数据不仅来源于调查问卷,还来源于P2P网络中的当前版权内容分布。因此,样本数据库会随着P2P网络中版权内容分布的变化而实时扩充,从而提高用户主观行为分析的准确度。为实现这一目的,预处理模块负责将版权内容分布信息转换为模型动态拟合适用的统计信息,即样本数据。
3.用户主观行为分析模型动态拟合方法
3.1样本数据的获取
要实现对等网络中用户主观行为分析模型的动态拟合,首要的是要获得动态的样本数据。因此,我们需要从版权内容分布中提取动态拟合所需的样本数据,这里样本数据的量表采用5分表。
◆喜好度(Lt):
获得用户对某一音/视频文件的喜好度有基于内容和基于协同过滤两种方法。基于内容的方法就是根据用户历史的下载记录来推测用户的喜好度;而基于协同过滤的方法基于一个假设“与目标用户喜好相似的用户喜欢的东西,目标用户也很有可能喜欢”。基于协同过滤的方法共享其他人的经验,增加了内容喜好度分析的准确性。因此,本发明采用基于协同过滤的方法推测目标用户对某一音/视频文件的喜好度。
本发明采用版权内容相似度图(Copyright Content Similarity Graph,CCSG)的概念对P2P网络内容进行管理。CCSG由内容节点和带权无向边组成,如图4所示。其中,内容节点表示某个音/视频内容,可以综合运用内容名称及内容描述元数据来标识;若存在某个用户同时拥有两个内容,则对应的内容节点可通过无向边连接。如果同时拥有两个内容的用户数目越大,则意味着内容之间的相似度越大,对应的无向边权重也越大。
我们根据内容的相似度推出用户的相似度,并据此将用户聚类。假设用户A下载了版权内容集合CA={CA1,CA2,...,CAi},用户B下载了版权内容集合CB={CB1,CB2,…,CBj}。我们需要找到CA与CB各内容之间的这样一种映射组合,即映射的双方在CCSG图中存在一条边,且映射的双方仅存在于一条映射中。映射的权值为CCSG中两内容间边的权值,上述的映射组合还应该满足所有映射的权值和是所有映射组合中最大。如图5所示,
用户A与用户B的相似度表示为,
S AB = Σ i = 1 k w i - - - ( 2 )
得到用户的相似度后,我们采用k-medoids聚类算法将相似度大的用户聚类为簇。然后,找到目标用户所在的簇,统计本簇内已经下载了目标用户将要下载的版权内容的用户数量,记为Nu。目标用户所在的簇大小表示为Ns。
l = N u N s - - - ( 3 )
则目标用户对该版权内容的喜好度如表2所示,
表2.用户喜好度
  l取值区间   喜好度
  [0,0.1]   1
  (0.1,0.3]   2
  (0.3,0.5]   3
  (0.5,0.7]   4
  (0.7,1.0]   5
经过一次相似用户聚类后,短时间内用户相似度不会存在太大变化。因此,我们一般采用较大的用户相似度更新周期。尤其当对等网络中用户的历史下载内容较大时,用户的相似度计算准确度很高。而用户的喜好是一个相对稳定的因素,因此已有的用户相似度会基本保持不变,所需的只是计算新加用户与已有用户的相似度。所以系统中用户相似度计算并不会带来太大的开销。
◆版权意识度(Cr):
用户的版权意识度是通过计算用户历史下载中正版内容所占比例来获取的,
p的取值范围为[0,1],p值越小表示用户下载的正版内容所占比例越小,从而表明该用户的版权意识较弱,反之则表明该用户的版权意识较强。用户的版权意识度如表3所示,
表3.用户版权意识度
  p取值区间   版权意识度
  [0,0.2]   1
  (0.2,0.4]   2
  (0.4,0.6]   3
  (0.6,0.8]   4
  (0.8,1.0]   5
◆受欢迎度(Re):
系统统计最近三个月CCSG中各音/视频节点内容的下载量,并按降序排列。按照排序将音/视频内容划分为五类,即Top20,Top50,Top100,Top200和Top200开外。则音/视频内容的受欢迎度如表4所示,
表4.用户版权意识度
  排名区间   受欢迎度
  Top20   5
  Top50   4
  Top100   3
  Top200   2
  Top200开外   1
◆惩罚度(Pu):
用户的惩罚度是通过记录用户的被惩罚次数来获得的。当前P2P网络中对侵权行为的惩罚是通过技术手段来实现,即通过技术手段使得正在下载盗版内容的用户的下载速度极慢,超出用户的可接受程度,从而达到“下载阻止”的目的。因此,本发明通过记录用户的下载时长来判断用户是否被惩罚。统计过程中,用户开始下载版权内容时即开始记录,在完成下载后则终止计算其下载时长,下载时长记为Td。本发明采用实验值Ts表示用户的下载时长忍受阈值。若Td>Ts,表示该用户被版权监管系统“下载阻止”并记录一次“下载阻止”。另外,若用户在开始下载t(t为实验值)时间后主动终止了下载过程,也记录一次“下载阻止”。记录其累计次数,得到用户的惩罚度如表5所示,
表5.用户惩罚度
  阻止次数区间   惩罚度
  [0,5]   1
  (5,10]   2
  (10,15]   3
  (15,20]   4
  (20,∞)   5
3.2行为分析模型动态拟合方法
用户每下载一次版权内容,则用户对该内容的喜好度,以及下载该内容前用户的版权意识度、受欢迎度和惩罚度都会被预处理模块按照5分表的方法计算出来并作为一个样本数据存储,表示为,
sample=(Lt,Cr,Re,Pu)                   (5)
获得的新的样本数据将被存储到样本库,扩充已有的调查问卷收集的样本数据,图3中样本库负责存储样本数据。统计分析模块会接受监控模块的请求,获取样本库中的样本数据从而计算当前各信念指标间的相关关系矩阵。
关于模型拟合模块采用的模型拟合评价指标选取结构方程模型中最为常用的卡方值。通过卡方值的P值(P-value)的大小来检验模型,此时一个显著性标准为0.05。监控模块计算当前各信念指标间的相关关系矩阵与当前用户主观行为分析模型再生矩阵的卡方值P值。当P值大于0.05时,我们认为该模型未达到0.05显著性水平,即当前的用户主观行为分析模型与当前的版权内容分布拟合良好。当P值小于0.01时,我们认为模型已经不太拟合当前内容分布,监控模块激活模型拟合模块,触发动态拟合过程。模型拟合模块会根据当前信念指标(即,喜好度、版权意识度、受欢迎度和惩罚度)间的相关关系矩阵与图2所示的模型,重新构建再生矩阵以更新模型参数,由模型评价与模型拟合多次迭代后,得到拟合当前内容分布的用户主观行为分析模型的参数,依据该参数修正用户主观行为分析模型。
本发明基于P2P网络中当前的版权内容分布,动态修正用户主观行为分析模型的参数,可以得到实时有效的用户主观行为分析模型。基于该用户主观行为分析模型,当CCSG图显示版权内容侵权较严重时,通过比较用户主观行为分析模型中的参数(即图2中c11,c21,c22,c31)大小,某一信念指标的参数值越大,其对用户主观行为的影响也就越大,从而可以显著地发现造成该侵权严重现象的关键因素(即参数值最大的信念指标),因此本发明可以对今后的版权监管工作提供重要的指导意义。
最后需要说明的是,具体实施方式中所述的实验用图仅用来说明本发明的技术方案软件算法的可行性而非局限于此例,算法已经经过大量实验数据验证,是真实可靠的,搭配硬件便可实现本发明的技术方案。尽管参照实施例对本发明进行了详细说明,本领域的普通技术人员应当理解,对本发明的技术方案进行修改或者等同替换,都不脱离本发明技术方案的精神和范围,其均应涵盖在本发明的权利要求范围当中。

Claims (10)

1.一种更新P2P网络中的用户主观行为分析模型参数的方法,该方法基于动态拟合的方法动态实时调整用户主观行为分析模型的参数,所述方法包含:
步骤101)根据选取的信念指标设定用户主观行为分析模型,并采用调查问卷获得初始样本数据;
步骤102)依据初始样本数据获得各信念指标间的第一相关系数矩阵;
步骤103)根据第一相关系数矩阵及用户主观行为分析模型,采用统计算法生成一个基于该用户主观行为分析模型的最接近信念指标的相关系数矩阵的相关矩阵,即再生矩阵,并依据该再生矩阵确定用户主观行为分析模型各参数的初始值;
步骤104)通过多次迭代修正用户主观行为分析模型的各初始参数值直至该用户主观行为分析模型较好的拟合调查问卷获得的样本数据,获得初始的用户主观行为分析模型;
步骤105)基于P2P网络的版权内容分布信息得到基于版权内容分布的样本数据,将该样本数据与调查问卷获得的初始样本数据融合获得第二样本数据,并依据第二样本数据生成各信念指标间的第二相关系数矩阵;
步骤106)监控基于初始用户主观行为分析模型得到的再生矩阵和第二相关系数矩阵之间的拟合关系,当两者拟合度小于某设定阈值时,根据当前信念指标间的相关关系矩阵,重新构建再生矩阵以更新模型参数,由模型评价与模型拟合多次迭代后,得到拟合当前内容分布的用户主观行为分析模型的参数,依据该参数修正用户主观行为分析模型,从而获得实时动态的用户主观行为分析模型;
其中,所述的信念指标包含:喜好度、版权意识度、受欢迎程度和惩罚度;所述第二样本数据包含来源于调查问卷的样本数据和基于版权内容分布信息得到的样本数据,所述版权内容分布信息为P2P网络中的事件行为,包括用户拥有的具体内容、用户当前的上传或下载状态、上传或下载状态持续的时间以及上传或下载状态发生的次数。
2.根据权利要求1所述的更新P2P网络中的用户主观行为分析模型参数的方法,其特征在于,所述调查问卷根据选取的信念指标进行编制;
采用结构方程模型验证用户主观行为分析模型与调查问卷样本数据的拟合度并修正用户主观行为分析模型的各参数。
3.根据权利要求1所述的更新P2P网络中的用户主观行为分析模型参数的方法,其特征在于,所述喜好度采用如下策略获取;
步骤201)根据内容的相似度计算两个用户的相似度,当两用户分别为用户A与用户B时的相似度表示为:
S AB = Σ i = 1 k w i
步骤202)得到用户的相似度后,采用k-medoids聚类算法将相似度大的用户聚类为簇;
步骤203)找到目标用户所在的簇,统计本簇内已经下载了目标用户将要下载的版权内容的用户数量,记为Nu,目标用户所在的簇大小表示为Ns,则比例参数值为:
l = N u N s ;
步骤204)确定比例参数值所在的具体范围,并根据该范围依据划分规则确定喜好度的具体取值;
其中,目标用户指当前需要计算喜好度的用户:而用户指P2P网络中的每一个用户。
4.根据权利要求1所述的更新P2P网络中的用户主观行为分析模型参数的方法,其特征在于,所述版权意识度采用如下策略获得:
步骤301)计算用户历史下载中正版内容所占比例值p,且p的取值范围为[0,1]:
Figure FDA00002008519500023
步骤302)依据量化规则将获得的比例值p量化为某个具体的版权意识度值;所述量化规则为依据p落在区间[0,1]中的具体位置将版权意识度量化为某些具体的整数值,其中p值越小表示用户下载的正版内容所占比例越小,从而表明该用户的版权意识较弱,反之则表明该用户的版权意识较强。
5.根据权利要求1所述的更新P2P网络中的用户主观行为分析模型参数的方法,其特征在于,所述惩罚度通过记录用户的下载时长获得,具体包含:
用户开始下载版权内容时开始记录,在完成下载后则终止计算其下载时长,且该下载时长记为Td
设置阈值Ts表示用户的下载时长忍受阈值,若Td>Ts,表示该用户被版权监管系统“下载阻止”并记录一次“下载阻止”,记录某段时间内用户被下载阻止的总次数;
依据下载阻止次数获得惩罚度的取值,所述惩罚度为若干整数值,该值越大表示用户被惩罚的次数越多,反之越少。
6.一种更新P2P网络中的用户主观行为分析模型参数的系统,该系统基于动态拟合的方法动态实时调整用户主观行为分析模型的参数,所述系统包含:
模型构建模块,用于依据选取的信念指标设定用户主观行为分析模型的结构;
材料收集模块,用于依据选取的信念指标编制调查问卷,并依据该调查问卷收集基于多个用户的第一样本数据;
样本库,用于存放用于统计分析的样本数据,当首次建立用户主观行为模型时仅存放由调查问卷获得的第一样本数据,当模型及参数初步确定后还存放基于版权内容分布信息得到的基于版权内容分布的样本数据;
统计分析模块,用于将所述样本库输入的数据进行统计分析处理,获得各信念指标间的相关系数矩阵,将该相关系数矩阵输入模型拟合模块;并接收监控模块的相关系数查询请求,然后向该监控模块返回基于样本库所有样本数据的当前的相关系数矩阵;
模型拟合模块,用于将统计分析处理后的相关系数矩阵与模型构建模块设定的用户主观行为分析模型进行模型拟合处理,得到再生矩阵;
模型评价模块,用于计算模型拟合模块输出的再生矩阵与相关系数矩阵的拟合度结果决定是否再次触发模型拟合模块,即当拟合度小于设定拟合度时再次返回模型拟合模块进行拟合,当拟合度大于设定拟合度时停止拟合过程,并根据最终的再生矩阵及用户主观行为分析模型的结构得到模型的参数,输出用户主观行为模型;
用户主观行为分析模型,用于将满足拟合度要求的参数值设置为用户主观行为模型的参数值得到最终用户主观行为分析模型,该模型还与监控模块连接,当用户主观行为分析模型的参数确定后就向监控模块输出再生矩阵,当模型更改后,才再次向监控模块输出再生矩阵;
版权内容分布情况记录模块,用于实时记录P2P网络的版权内容的变化情况;
预处理模块,对输入的版权内容的变化情况转换为统计分析模块适用的样本数据并存入样本库,该统计信息与调查问卷获得的样本数据为第二样本数据;和
监控模块,用于周期性的向所述统计分析模块请求相关系数矩阵和基于用户主观行为分析模型得到的再生矩阵进行拟合,当得到拟合度小于设定阈值时该监控模块驱动模型拟合模块再次进行模型拟合;
其中,所述的信念指标包含:喜好度、版权意识度、受欢迎程度和惩罚度;所述监控模块依据的相关系数矩阵基于调查问卷和版权内容分布信息获得的样本数据。
7.根据权利要求6所述的更新P2P网络中的用户主观行为分析模型参数的系统,其特征在于,所述调查问卷根据选取的信念指标进行编制;
采用结构方程模型验证用户主观行为分析模型与调查问卷样本数据的拟合度并修正用户主观行为分析模型的各参数。
8.根据权利要求6所述的更新P2P网络中的用户主观行为分析模型参数的系统,其特征在于,所述预处理模块进一步包含:喜好度量化模块、版权意识度量化模块、受欢迎度量化模块和惩罚度量化模块。
9.根据权利要求6所述的更新P2P网络中的用户主观行为分析模型参数的系统,其特征在于,所述喜好度量化模块进一步包含:
第一处理模块,用于根据内容的相似度推出两个用户的相似度,当两用户分别为用户A与用户B时的相似度表示为:
S AB = Σ i = 1 k w i
聚类模块,用于采用k-medoids聚类算法将相似度大的用户聚类为簇;
第二处理模块,用于寻找目标用户所在的簇,统计本簇内已经下载了目标用户将要下载的版权内容的用户数量,记为Nu,目标用户所在的簇大小表示为Ns,则比例参数值为:
l = N u N s ;
量化模块,用于确定比例参数值所在的具体范围,并根据该范围依据划分规则确定喜好度的具体取值。
10.根据权利要求6所述的更新P2P网络中的用户主观行为分析模型参数的系统,其特征在于,所述版权意识度量化模块进一步包含:
第三处理模块,用于计算用户历史下载中正版内容所占比例值p,且p的取值范围为[0,1]:
Figure FDA00002008519500043
第二量化处理模块,用于依据量化规则将获得的比例值p量化为某个具体的版权意识度值;所述量化规则为依据p落在区间[0,1]中的具体位置将版权意识度量化为某些具体的整数值,其中p值越小表示用户下载的正版内容所占比例越小,从而表明该用户的版权意识较弱,反之则表明该用户的版权意识较强。
CN201210288565.5A 2012-08-14 2012-08-14 一种更新p2p网络用户主观行为分析模型参数的方法及系统 Expired - Fee Related CN103593543B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201210288565.5A CN103593543B (zh) 2012-08-14 2012-08-14 一种更新p2p网络用户主观行为分析模型参数的方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201210288565.5A CN103593543B (zh) 2012-08-14 2012-08-14 一种更新p2p网络用户主观行为分析模型参数的方法及系统

Publications (2)

Publication Number Publication Date
CN103593543A true CN103593543A (zh) 2014-02-19
CN103593543B CN103593543B (zh) 2016-11-23

Family

ID=50083681

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201210288565.5A Expired - Fee Related CN103593543B (zh) 2012-08-14 2012-08-14 一种更新p2p网络用户主观行为分析模型参数的方法及系统

Country Status (1)

Country Link
CN (1) CN103593543B (zh)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105631029A (zh) * 2015-12-30 2016-06-01 芜湖乐锐思信息咨询有限公司 基于用户主观行为分析的网络监控系统
CN105677784A (zh) * 2015-12-30 2016-06-15 芜湖乐锐思信息咨询有限公司 基于并行处理的集成网络信息分析系统
CN105701157A (zh) * 2015-12-30 2016-06-22 芜湖乐锐思信息咨询有限公司 集成社交网站信息的监控系统
CN108924100A (zh) * 2018-06-20 2018-11-30 广东电网有限责任公司 一种异常用户识别方法
CN113485983A (zh) * 2021-06-07 2021-10-08 上海众言网络科技有限公司 问卷数据处理方法及装置
CN113703886A (zh) * 2021-07-21 2021-11-26 青岛海尔科技有限公司 用户系统行为监控方法、系统、电子设备及存储介质

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102571839A (zh) * 2010-12-15 2012-07-11 北京邮电大学 基于用户社会属性的p2p内容分发方法及系统

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102571839A (zh) * 2010-12-15 2012-07-11 北京邮电大学 基于用户社会属性的p2p内容分发方法及系统

Non-Patent Citations (6)

* Cited by examiner, † Cited by third party
Title
DOMINIK PAPIES等: "计划行为理论框架下消费者网络电影下载动力因素研究", 《文化艺术研究》, vol. 2, no. 2, 31 March 2009 (2009-03-31), pages 202 - 210 *
O.HASSANZADEH ET AL.: "A declarative framework for semantic link discovery over relational data", 《PROCEEDINGS OF 18TH ACM CONFERENCE ON INFORMATION AND KNOWLEDGE MANAGEMENT》, 31 December 2009 (2009-12-31), pages 1027 - 1036 *
YUVAL SHAVITT ET AL.: "Mining musical from large-scale peer-to-peer networks", 《IEEE MULTIMEDIA》, vol. 18, no. 1, 31 December 2011 (2011-12-31), pages 14 - 23 *
盛旭东: "软件用户使用盗版软件影响因素分析", 《中国优秀硕士学位论文全文数据库经济与管理科学辑》, no. 12, 15 December 2011 (2011-12-15), pages 11 - 43 *
郑毅等: "对等网络视频点播系统中的用户行为研究", 《北京交通大学学报》, vol. 35, no. 2, 30 April 2011 (2011-04-30) *
高连峰: "基于用户行为P2P网络全文搜索机制", 《情报科学》, vol. 26, no. 8, 31 August 2008 (2008-08-31), pages 1244 - 1247 *

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105631029A (zh) * 2015-12-30 2016-06-01 芜湖乐锐思信息咨询有限公司 基于用户主观行为分析的网络监控系统
CN105677784A (zh) * 2015-12-30 2016-06-15 芜湖乐锐思信息咨询有限公司 基于并行处理的集成网络信息分析系统
CN105701157A (zh) * 2015-12-30 2016-06-22 芜湖乐锐思信息咨询有限公司 集成社交网站信息的监控系统
CN108924100A (zh) * 2018-06-20 2018-11-30 广东电网有限责任公司 一种异常用户识别方法
CN108924100B (zh) * 2018-06-20 2020-12-01 广东电网有限责任公司 一种异常用户识别方法
CN113485983A (zh) * 2021-06-07 2021-10-08 上海众言网络科技有限公司 问卷数据处理方法及装置
CN113485983B (zh) * 2021-06-07 2023-12-26 上海众言网络科技有限公司 问卷数据处理方法及装置
CN113703886A (zh) * 2021-07-21 2021-11-26 青岛海尔科技有限公司 用户系统行为监控方法、系统、电子设备及存储介质
CN113703886B (zh) * 2021-07-21 2023-06-20 青岛海尔科技有限公司 用户系统行为监控方法、系统、电子设备及存储介质

Also Published As

Publication number Publication date
CN103593543B (zh) 2016-11-23

Similar Documents

Publication Publication Date Title
CN103593543A (zh) 一种更新p2p网络用户主观行为分析模型参数的方法及系统
CN107368891A (zh) 一种深度学习模型的压缩方法和装置
CN109961142B (zh) 一种基于元学习的神经网络优化方法及装置
CN110610242A (zh) 一种联邦学习中参与者权重的设置方法及装置
CN103647800A (zh) 推荐应用资源的方法及系统
CN109697512B (zh) 基于贝叶斯网络的个人数据分析方法及计算机存储介质
WO2020187113A1 (zh) 一种用于预测单车排放量的方法
CN104866699B (zh) 一种网络游戏智能化数据分析方法
CN101505311A (zh) 一种基于社会化网络的信息传播方法及系统
CN106529727A (zh) 一种用户流失预测模型生成方法及相关装置
CN104182457A (zh) 在社交网络中基于泊松过程模型的事件流行度预测方法
CN113077052A (zh) 用于稀疏奖励环境的强化学习方法、装置、设备及介质
CN112990478B (zh) 联邦学习数据处理系统
CN111047338A (zh) 用户活跃度预测方法、预测系统及介质
CN111310918A (zh) 一种数据处理方法、装置、计算机设备及存储介质
CN114529228A (zh) 一种面向电力监控系统供应链的风险预警方法及系统
CN113569151B (zh) 基于人工智能的数据推荐方法、装置、设备及介质
CN115062734A (zh) 可输出解释性信息的风控建模方法、装置、设备及介质
CN112102139A (zh) 一种闲置物品交易扶贫管理方法及系统
CN111368060A (zh) 对话机器人的自学习方法、装置、系统、电子设备及介质
Shen et al. Efficient deep structure learning for resource-limited IoT devices
CN105718564A (zh) 推广行为的检测方法及装置
CN112016971B (zh) 基于以太坊gas原理的移动群智感知数据可靠性保障方法
CN111984842B (zh) 银行客户数据处理方法及装置
CN115018333A (zh) 一种产业园区的数字化运营管理方法及系统

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20161123

Termination date: 20190814

CF01 Termination of patent right due to non-payment of annual fee