CN107145517A - 微博群组间具有全局最小代价的信息传播路径生成方法 - Google Patents
微博群组间具有全局最小代价的信息传播路径生成方法 Download PDFInfo
- Publication number
- CN107145517A CN107145517A CN201710227761.4A CN201710227761A CN107145517A CN 107145517 A CN107145517 A CN 107145517A CN 201710227761 A CN201710227761 A CN 201710227761A CN 107145517 A CN107145517 A CN 107145517A
- Authority
- CN
- China
- Prior art keywords
- msub
- mrow
- user
- information communication
- bit string
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 230000006854 communication Effects 0.000 title claims abstract description 46
- 238000004891 communication Methods 0.000 title claims abstract description 40
- 238000000034 method Methods 0.000 title claims abstract description 17
- 238000005457 optimization Methods 0.000 claims abstract description 9
- 238000010276 construction Methods 0.000 claims abstract description 5
- 238000001514 detection method Methods 0.000 claims description 8
- 239000004576 sand Substances 0.000 claims description 8
- 238000013507 mapping Methods 0.000 claims description 6
- 238000012545 processing Methods 0.000 claims description 6
- 230000008569 process Effects 0.000 claims description 5
- 230000002068 genetic effect Effects 0.000 claims description 3
- 230000035772 mutation Effects 0.000 claims description 2
- 238000013079 data visualisation Methods 0.000 abstract description 2
- 230000036541 health Effects 0.000 abstract description 2
- 238000012544 monitoring process Methods 0.000 abstract description 2
- 238000005516 engineering process Methods 0.000 description 2
- 235000007926 Craterellus fallax Nutrition 0.000 description 1
- 240000007175 Datura inoxia Species 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 230000004992 fission Effects 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 238000011835 investigation Methods 0.000 description 1
- 230000006855 networking Effects 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/958—Organisation or management of web site content, e.g. publishing, maintaining pages or automatic linking
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/04—Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
- G06Q10/047—Optimisation of routes or paths, e.g. travelling salesman problem
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/01—Social networking
Landscapes
- Engineering & Computer Science (AREA)
- Business, Economics & Management (AREA)
- Human Resources & Organizations (AREA)
- Theoretical Computer Science (AREA)
- Strategic Management (AREA)
- General Physics & Mathematics (AREA)
- Physics & Mathematics (AREA)
- Economics (AREA)
- Databases & Information Systems (AREA)
- Marketing (AREA)
- General Business, Economics & Management (AREA)
- Tourism & Hospitality (AREA)
- Development Economics (AREA)
- General Health & Medical Sciences (AREA)
- General Engineering & Computer Science (AREA)
- Primary Health Care (AREA)
- Health & Medical Sciences (AREA)
- Data Mining & Analysis (AREA)
- Game Theory and Decision Science (AREA)
- Entrepreneurship & Innovation (AREA)
- Operations Research (AREA)
- Quality & Reliability (AREA)
- Computing Systems (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
- Mobile Radio Communication Systems (AREA)
Abstract
本发明公开一种微博群组间具有全局最小代价的信息传播路径生成方法,主要包括路径代价建模、初始路径生成和路径深度优化3个步骤。其中,步骤1实现群组间信息传播路径的形式化表示及其时间代价模型构建,步骤2生成群组间具有局部最小代价的信息传播路径,而步骤3通过交叉和变异两个操作算子的迭代优化,来最终产生并输出具有全局最小代价的信息传播路径。与现有技术相比,本发明具有准确度高、速度快、可扩展性强和简单易实现等优点,能够有效应用于舆情监控、数据可视化、电子商务、智能交通以及医疗健康等领域。
Description
技术领域
本发明涉及网络空间大数据信息服务技术领域,尤其是涉及一种微博群组间具有全局最小代价的信息传播路径生成方法。
背景技术
进入Web2.0时代,以微博为主的社交网络系统的崛起为人们提供了高度自由分析信息和交流观点的重要平台。借助基于用户微博关系的信息分享、传播以及获取技术,可以使用户通过WEB、WAP以及各种客户端组建不同的社区,从而较之传统的平面媒体、网络媒体等,获得更大程度和规模的信息,同时产生更为丰富的互动交流体验,增进用户的实际使用感受。正是凭借这种社交关系产生的特有的裂变式信息传播分享模式,微博迅速席卷网络,从政府、名人、明星,到普通民众,已经成为特有用户群体的网络汇集重要平台。
近年来,群组模式被广泛引入微博等社交网络平台中,群组模式的出发点是基于某种紧密的关系将不同用户组合在一个社区中,从而把用户从相对封闭的好友关系疏导至群组,并创建一种新的更开放的社交关系,实现信息的传播和分享。在微博平台中,将源群组中的一些重要信息在第一时间里面以最小的时间代价来完成处理、加工、数据传输等行为,并传播到目标群组中,让目标群组中的每个用户都能及时了解到这些重要信息,是近些年学术界和工业界的一个研究热点和重点,目前已广泛应用于舆情监控、数据可视化、电子商务、智能交通以及医疗健康等领域。
然而,根据深入的调研和分析,我们发现现有微博群组间具有全局最小代价的信息传播路径生成方法在模型准确性、模型可理解性以及处理效率方面均存在缺陷。
发明内容
本发明的目的就是为了克服上述现有技术存在的缺陷而提供一种准确度高、处理速度快且可扩展性强的微博群组间具有全局最小代价的信息传播路径生成方法,工作流程如图1所示。
本发明主要由路径代价建模、初始路径生成和路径深度优化三个步骤完成。
步骤1(路径代价建模):
以微博平台中的源群组和目标群组为输入,首先构造源群组到目标群组的信息传播过程模型,
然后对源群组到目标群组一条可行的信息传播路径进行形式化表示,最后构造信息传播路径的时间代价模型。
步骤2(初始路径生成):以步骤1中构造的信息传播过程模型为输入,产生具有局部最小代价的信息传播路径。
步骤3(路径深度优化):以步骤1中构造的信息传播路径的时间代价模型和步骤2中所生成的具有局部最小代价的信息传播路径为输入,基于遗传算法,通过两点交叉和两 点变异两个操作算子对具有局部最小代价的信息传播路径进行迭代优化,并最终输出群组间具有全局最小代价的信息传播路径。
本发明具有以下优点:
1、本发明能够在多项式时间复杂度内生成具有全局最小代价的群组间信息传播路径,从而具有较高的处理效率和较短的用户响应时间。
2、本发明基于遗传算法中交叉和变异两个操作算子的迭代优化来实施群组间具有全局最小代价信息传播路径的生成,从而克服了陷入局部最优解的问题,因此具有较高的准确度。
3、本发明主要由3个算法步骤组成,每个步骤的实施过程简单、容易实现,同时不受具体开发工具和编程软件的限制,并且能够快速扩展到分布式和并行化的开发环境中。
附图说明
图1本发明的工作流程图
具体实施方式
在步骤1中,本发明通过两个步骤来构造源群组Gs到目标群组Gg的信息传播过程模型:
步骤1.1:首先构造信息传播过程模型
步骤1.1.1:获取Gs和Gg之间可信度最高的2个群组G1和G2。对于某一个具体群组G,使用下列公式来获取它的可信度c[G]:
c[G]=ln∑u∈Ger(u)+b(u),
其中ln为自然对数,e为自然对数的底数,r(u)为用户u在微博中的客观信誉度,b(u)为Gs和Gg对用户u的平均主观信任度,表示为:
其中b(su,u)为Gs中用户su对u的主观信任度,b(gu,u)为Gg中用户gu对u的主观信任度,|Gs|和|Gg|分别表示Gs和Gg中用户的数量。
步骤1.1.2:将Gs、Gg、G1和G2四个群组组成一个加权有向图L=(N,E,W),其中:
1)N为L的顶点(用户)集合,N=Gs∪G1∪G2∪Gg;
2)E为L的有向边集合,E由三个子集E1、E2和Eg组成,即E=E1∪E2∪Eg,E1={<u1→u2>|u2∈G1∧u1∈Gs∧u2能够在微博平台中直接接收u1传播的信息},E2={<u1→u2>|u2∈G2∧u1∈Gs∪G1∧u2能够在微博平台中直接接收u1传播的信息},Eg={<u1→u2>|u2∈Gg∧u1∈Gs∪G1∪G2∧u2能够在微博平台中直接接收u1传播的信息};
3)W为L的权重映射函数,对于每一个用户u∈Gs∪G1∪G2,W(u)取值为u处理所接收信息的CPU和I/O时间代价,而对于每条有向边<u1→u2>∈E,W(<u1→u2>)取值为用户u1上的信息传播给用户u2的通讯时间代价。
经过步骤1.1.1和1.1.2得到的加权有向图L即为源群组Gs到目标群组Gg的信息传播过程模型L。
步骤1.2,构造信息传播路径的时间代价模型
基于信息传播过程模型L,本发明将源群组Gs到目标群组Gg一条可行的信息传播路径定义为L的一个子图SL=(SN,SE,SW),同时满足如下4个条件:
1)顶点集合SN中必须包含Gg中的所有用户,即
2)对于Gg中的每一个用户gu,有向边集合SE中均有一条且仅有一条有向边指向gu,即gu的入度必须为1;
3)对于SN-Gg中每个的用户u,如果u是Gs中的用户,那么u的出度必须大于0,如果u是G1∪G2中的用户,那么u的出度和入度均必须大于0;
4)SW为SL的权重映射函数,且和L中的权重映射函数W相同。
最后,信息传播路径SL=(SN,SE,SW)的时间代价模型F(SL)表示为:
在步骤2中,本发明获取源群组Gs到目标群组Gg具有局部最小代价的信息传播路径,具体实施步骤如下:
步骤2.1:基于步骤1中的加权有向图L=(N,E,W),删除L中的所有有向边,从而得到一个新的加权有向图L’=(N,E’,W),其中
步骤2.2:对于Gg中的每个用户gu,执行下列操作:在加权有向图L上获取SN-Gg中的用户mu,使得W(mu)+W(<mu→gu>)的取值最小,并在E’中增加一条有向边<mu→gu>,然后,判断mu属于Gs、G1和G2中的哪一个群组:
2.2.1)如果mu是Gs中的用户,那么结束对gu的操作;
2.2.2)如果mu是G1中的用户,那么在L上获取Gs中的用户su,使得W(su)+W(<su→mu>)的取值最小,然后在E’中增加一条有向边<su→mu>;
2.2.3)如果mu是G2中的用户,那么在L上获取Gs∪G1中的用户tu,使得W(tu)+W(<tu→mu>)的取值最小,并在E’中增加一条有向边<tu→mu>,然后,判断tu属于Gs和G1中的哪一个群组:
2.2.3.1)如果tu是Gs中的用户,那么结束对gu的操作;
2.2.3.2)如果tu是G1中的用户,那么在L上获取Gs中的用户su,使得W(su)+W(<su→tu>)的取值最小,然后在E’中增加一条有向边<su→tu>。
步骤2.3:删除L’中入度和出度均为0的顶点,得到新的顶点集合N’。
经过上述步骤21-23,步骤2最终产生的加权有向图L’=(N’,E’,W)即为所要获取的具有局部最小代价的信息传播路径。
在步骤3中,本发明迭代优化步骤2中产生的信息传播路径L’=(N’,E’,W),具体实施步骤如下:
步骤3.1:基于步骤1中的时间代价模型,计算L’的时间代价:
步骤3.2:对于N’-Gg中的每个用户u,生成一个长度为|Gg|的位串V(u),初始化所有位为0,然后,对于Gg中的每个用户gu,检查E’中是否包含有向边<u→gu>,如果包含,那么将gu在V(u)中对应的位设置为1。当N’-Gg中所有用户处理完毕之后,将它们的位串组成一个集合VS。
步骤3.3:迭代执行步骤3.4-3.9,迭代次数为2000。
步骤3.4:对位串集合VS执行两点交叉操作,处理过程如下:
步骤3.4.1:在VS中随机挑选出半数的位串,构成集合TS,如果TS中包含奇数个位串,那么再增加一个位串进TS中,并且将VS中剩下的位串构成集合IS;
步骤3.4.2:依次处理TS中的每对位串V(u1)和V(u2):首先随机产生两个选择点s1和s2,接着,在集合IS中获取满足如下条件的第一对位串V(u3)和V(u4):V(u1)[s1,s2]∨V(u2)[s1,s2]=V(u3)[s1,s2]∨V(u4)[s1,s2],其中V(ui)[s1,s2](1≤i≤4)表示位串V(ui)在选择点s1和s2之间的子串,然后,在V(u1)和V(u3)之间交换V(u1)[s1,s2]和V(u3)[s1,s2],同时,在V(u2)和V(u4)之间交换V(u2)[s1,s2]和V(u4)[s1,s2];
步骤3.4.3:基于TS∪IS中的位串构造加权有向图IL=(IN,IE,W),实施过程如下:
步骤3.4.3.1:初始化IN和IE为空集;
步骤3.4.3.2:将TS∪IS中位串不全为0的所有用户添加到IN中,并将Gg中的用户添加到IN中;
步骤3.4.3.3:初始化三个集合Ns、N1和N2为空集,并针对IN-Gg中的每个用户u,判断u的归属,如果u是Gs中的用户,那么将u添加进Ns中,如果u是G1中的用户,那么将u添加进N1中,如果u是G2中的用户,那么将u添加进N2中;
步骤3.4.3.4:对于N2中的每个用户u,获取它对应的位串V(u),然后对于V(u)中每个为1的位,获取它在Gg中对应的用户gu,然后在IE增加一条有向边<u→gu>;
步骤3.4.3.5:对于N1中的每个用户u,获取它对应的位串V(u),然后对于V(u)中每个为1的位,获取它在Gg中对应的用户gu,并做如下检测:
如果gu在当前加权有向图IL中的入度为0,那么在IE增加一条有向边<u→gu>,否则在IL中获取N2里面指向gu的用户tu,然后在IE增加一条有向边<u→tu>;
步骤3.4.3.6:对于Ns中的每个用户u,获取它对应的位串V(u),然后对于V(u)中每个为1的位,获取它在Gg中对应的用户gu,并做如下检测:
如果gu在当前加权有向图IL中的入度为0,那么在IE增加一条有向边<u→gu>,否则在IL中获取N2里面指向gu的用户tu,并做进一步检测:
如果tu在当前加权有向图IL中的入度为0,那么在IE增加一条有向边<u→tu>,否则在IL中获取N1里面指向tu的用户fu,然后在IE增加一条有向边<u→fu>;
步骤3.5:基于步骤1中的时间代价模型,计算IL的时间代价:
步骤3.6:比较F(IL)与F(L’)取值的大小,如果F(IL)<F(L’),那么将集合VS替换成集合TS∪IS、将加权有向图L’替换成IL并且将F(L’)替换成F(IL),即VS=TS∪IS、L’=IL以及F(L’)=F(IL)。
步骤3.7:对位串集合VS执行两点变异操作,处理过程如下:
步骤3.7.1:在VS中随机挑选出半数的位串,构成集合MS,并且将VS中剩下的位串构成集合HS;
步骤3.7.2:依次处理MS中的每个位串V(u):首先随机产生两个选择点s1和s2,然后对于子串V(u1)[s1,s2]中的每个位V(u1)[j](s1≤j≤s2),做如下检测:
如果V(u1)[j]=0,那么将V(u1)[j]置为1,接着在集合HS中获取第一个第j位为1的位串V(u2),并将V(u2)[j]置为0,反之,如果V(u1)[j]=1,那么将V(u1)[j]置为0,接着在集合HS中获取第一个第j位为0的位串V(u2),并将V(u2)[j]置为1;
步骤3.7.3:使用与步骤3.4.3相同的实施方式,基于MS∪HS中的位串构造加权有向图QL=(QN,QE,W);
步骤3.8:基于步骤1中的时间代价模型,计算QL的时间代价:
步骤3.9:比较F(QL)与F(L’)取值的大小,如果F(QL)<F(L’),那么将集合VS替换成集合MS∪HS、将加权有向图L’替换成QL并且将F(L’)替换成F(QL),即VS=MS∪HS、L’=QL以及F(L’)=F(QL)。
步骤3.10:将具有全局最小代价的信息传播路径L’=(N’,E’,W)输出给用户。
Claims (2)
1.一种微博群组间具有全局最小代价的信息传播路径生成方法,其特征在于,包括步骤如下:
步骤1(路径代价建模):
以微博平台中的源群组和目标群组为输入,首先构造源群组到目标群组的信息传播过程模型,
然后对源群组到目标群组一条可行的信息传播路径进行形式化表示,最后构造信息传播路径的时间代价模型。
步骤2(初始路径生成):以步骤1中构造的信息传播过程模型为输入,产生具有局部最小代价的信息传播路径。
步骤3(路径深度优化):以步骤1中构造的信息传播路径的时间代价模型和步骤2中所生成的具有局部最小代价的信息传播路径为输入,基于遗传算法,通过两点交叉和两点变 异两个操作算子对具有局部最小代价的信息传播路径进行迭代优化,并最终输出群组间具有全局最小代价的信息传播路径。
2.如权利要求1所述的方法,其特征在于,
在步骤1中,本发明通过两个步骤来构造源群组Gs到目标群组Gg的信息传播过程模型:
步骤1.1:首先构造信息传播过程模型
步骤1.1.1:获取Gs和Gg之间可信度最高的2个群组G1和G2。对于某一个具体群组G,使用下列公式来获取它的可信度c[G]:
c[G]=ln∑u∈Ger(u)+b(u),
其中ln为自然对数,e为自然对数的底数,r(u)为用户u在微博中的客观信誉度,b(u)为Gs和Gg对用户u的平均主观信任度,表示为:
<mrow>
<mi>b</mi>
<mrow>
<mo>(</mo>
<mi>u</mi>
<mo>)</mo>
</mrow>
<mo>=</mo>
<mfrac>
<mrow>
<msub>
<mo>&Sigma;</mo>
<mrow>
<mi>s</mi>
<mi>u</mi>
<mo>&Element;</mo>
<msub>
<mi>G</mi>
<mi>s</mi>
</msub>
</mrow>
</msub>
<mi>b</mi>
<mrow>
<mo>(</mo>
<mi>s</mi>
<mi>u</mi>
<mo>,</mo>
<mi>u</mi>
<mo>)</mo>
</mrow>
<mo>+</mo>
<msub>
<mo>&Sigma;</mo>
<mrow>
<mi>g</mi>
<mi>u</mi>
<mo>&Element;</mo>
<msub>
<mi>G</mi>
<mi>g</mi>
</msub>
</mrow>
</msub>
<mi>b</mi>
<mrow>
<mo>(</mo>
<mi>g</mi>
<mi>u</mi>
<mo>,</mo>
<mi>u</mi>
<mo>)</mo>
</mrow>
</mrow>
<mrow>
<mrow>
<mo>|</mo>
<msub>
<mi>G</mi>
<mi>s</mi>
</msub>
<mo>|</mo>
</mrow>
<mo>+</mo>
<mrow>
<mo>|</mo>
<msub>
<mi>G</mi>
<mi>g</mi>
</msub>
<mo>|</mo>
</mrow>
</mrow>
</mfrac>
<mo>,</mo>
</mrow>
其中b(su,u)为Gs中用户su对u的主观信任度,b(gu,u)为Gg中用户gu对u的主观信任度,|Gs|和|Gg|分别表示Gs和Gg中用户的数量。
步骤1.1.2:将Gs、Gg、G1和G2四个群组组成一个加权有向图L=(N,E,W),其中:
1)N为L的顶点(用户)集合,N=Gs∪G1∪G2∪Gg;
2)E为L的有向边集合,E由三个子集E1、E2和Eg组成,即E=E1∪E2∪Eg,E1={<u1→u2>|u2∈G1∧u1∈Gs∧u2能够在微博平台中直接接收u1传播的信息},E2={<u1→u2>|u2∈G2∧u1∈Gs∪G1∧u2能够在微博平台中直接接收u1传播的信息},Eg={<u1→u2>|u2∈Gg∧u1∈Gs∪G1∪G2∧u2能够在微博平台中直接接收u1传播的信息};
3)W为L的权重映射函数,对于每一个用户u∈Gs∪G1∪G2,W(u)取值为u处理所接收信息的CPU和I/O时间代价,而对于每条有向边<u1→u2>∈E,W(<u1→u2>)取值为用户u1上的信息传播给用户u2的通讯时间代价。
经过步骤1.1.1和1.1.2得到的加权有向图L即为源群组Gs到目标群组Gg的信息传播过程模型L。
步骤1.2,构造信息传播路径的时间代价模型
基于信息传播过程模型L,本发明将源群组Gs到目标群组Gg一条可行的信息传播路径定义为L的一个子图SL=(SN,SE,SW),同时满足如下4个条件:
1)顶点集合SN中必须包含Gg中的所有用户,即
2)对于Gg中的每一个用户gu,有向边集合SE中均有一条且仅有一条有向边指向gu,即gu的入度必须为1;
3)对于SN-Gg中每个的用户u,如果u是Gs中的用户,那么u的出度必须大于0,如果u是G1∪G2中的用户,那么u的出度和入度均必须大于0;
4)SW为SL的权重映射函数,且和L中的权重映射函数W相同。
最后,信息传播路径SL=(SN,SE,SW)的时间代价模型F(SL)表示为:
<mrow>
<mi>F</mi>
<mrow>
<mo>(</mo>
<mi>S</mi>
<mi>L</mi>
<mo>)</mo>
</mrow>
<mo>=</mo>
<msub>
<mo>&Sigma;</mo>
<mrow>
<mi>u</mi>
<mo>&Element;</mo>
<mi>S</mi>
<mi>N</mi>
<mo>-</mo>
<msub>
<mi>G</mi>
<mi>g</mi>
</msub>
</mrow>
</msub>
<mi>S</mi>
<mi>W</mi>
<mrow>
<mo>(</mo>
<mi>u</mi>
<mo>)</mo>
</mrow>
<mo>+</mo>
<msub>
<mo>&Sigma;</mo>
<mrow>
<mo><</mo>
<msub>
<mi>u</mi>
<mn>1</mn>
</msub>
<mo>&RightArrow;</mo>
<msub>
<mi>u</mi>
<mn>2</mn>
</msub>
<mo>></mo>
<mo>&Element;</mo>
<mi>S</mi>
<mi>E</mi>
</mrow>
</msub>
<mi>S</mi>
<mi>W</mi>
<mrow>
<mo>(</mo>
<mo><</mo>
<msub>
<mi>u</mi>
<mn>1</mn>
</msub>
<mo>&RightArrow;</mo>
<msub>
<mi>u</mi>
<mn>2</mn>
</msub>
<mo>></mo>
<mo>)</mo>
</mrow>
<mo>.</mo>
</mrow>
在步骤2中,本发明获取源群组Gs到目标群组Gg具有局部最小代价的信息传播路径,具体实施步骤如下:
步骤2.1:基于步骤1中的加权有向图L=(N,E,W),删除L中的所有有向边,从而得到一个新的加权有向图L’=(N,E’,W),其中
步骤2.2:对于Gg中的每个用户gu,执行下列操作:在加权有向图L上获取SN-Gg中的用户mu,使得W(mu)+W(<mu→gu>)的取值最小,并在E’中增加一条有向边<mu→gu>,然后,判断mu属于Gs、G1和G2中的哪一个群组:
2.2.1)如果mu是Gs中的用户,那么结束对gu的操作;
2.2.2)如果mu是G1中的用户,那么在L上获取Gs中的用户su,使得W(su)+W(<su→mu>)的取值最小,然后在E’中增加一条有向边<su→mu>;
2.2.3)如果mu是G2中的用户,那么在L上获取Gs∪G1中的用户tu,使得W(tu)+W(<tu→mu>)的取值最小,并在E’中增加一条有向边<tu→mu>,然后,判断tu属于Gs和G1中的哪一个群组:
2.2.3.1)如果tu是Gs中的用户,那么结束对gu的操作;
2.2.3.2)如果tu是G1中的用户,那么在L上获取Gs中的用户su,使得W(su)+W(<su→tu>)的取值最小,然后在E’中增加一条有向边<su→tu>。
步骤2.3:删除L’中入度和出度均为0的顶点,得到新的顶点集合N’。
经过上述步骤21-23,步骤2最终产生的加权有向图L’=(N’,E’,W)即为所要获取的具有局部最小代价的信息传播路径。
在步骤3中,本发明迭代优化步骤2中产生的信息传播路径L’=(N’,E’,W),具体实施步骤如下:
步骤3.1:基于步骤1中的时间代价模型,计算L’的时间代价:
<mrow>
<mi>F</mi>
<mrow>
<mo>(</mo>
<msup>
<mi>L</mi>
<mo>,</mo>
</msup>
<mo>)</mo>
</mrow>
<mo>=</mo>
<msub>
<mo>&Sigma;</mo>
<mrow>
<mi>u</mi>
<mo>&Element;</mo>
<msup>
<mi>L</mi>
<mo>&prime;</mo>
</msup>
<mo>-</mo>
<msub>
<mi>G</mi>
<mi>g</mi>
</msub>
</mrow>
</msub>
<mi>W</mi>
<mrow>
<mo>(</mo>
<mi>u</mi>
<mo>)</mo>
</mrow>
<mo>+</mo>
<msub>
<mo>&Sigma;</mo>
<mrow>
<mo><</mo>
<msub>
<mi>u</mi>
<mn>1</mn>
</msub>
<mo>&RightArrow;</mo>
<msub>
<mi>u</mi>
<mn>2</mn>
</msub>
<mo>></mo>
<mo>&Element;</mo>
<msup>
<mi>E</mi>
<mo>&prime;</mo>
</msup>
</mrow>
</msub>
<mi>W</mi>
<mrow>
<mo>(</mo>
<mo><</mo>
<msub>
<mi>u</mi>
<mn>1</mn>
</msub>
<mo>&RightArrow;</mo>
<msub>
<mi>u</mi>
<mn>2</mn>
</msub>
<mo>></mo>
<mo>)</mo>
</mrow>
<mo>.</mo>
</mrow>
步骤3.2:对于N’-Gg中的每个用户u,生成一个长度为|Gg|的位串V(u),初始化所有位为0,然后,对于Gg中的每个用户gu,检查E’中是否包含有向边<u→gu>,如果包含,那么将gu在V(u)中对应的位设置为1。当N’-Gg中所有用户处理完毕之后,将它们的位串组成一个集合VS。
步骤3.3:迭代执行步骤3.4-3.9,迭代次数为2000。
步骤3.4:对位串集合VS执行两点交叉操作,处理过程如下:
步骤3.4.1:在VS中随机挑选出半数的位串,构成集合TS,如果TS中包含奇数个位串,那么再增加一个位串进TS中,并且将VS中剩下的位串构成集合IS;
步骤3.4.2:依次处理TS中的每对位串V(u1)和V(u2):首先随机产生两个选择点s1和s2,接着,在集合IS中获取满足如下条件的第一对位串V(u3)和V(u4):V(u1)[s1,s2]∨V(u2)[s1,s2]=V(u3)[s1,s2]∨V(u4)[s1,s2],其中V(ui)[s1,s2](1≤i≤4)表示位串V(ui)在选择点s1和s2之间的子串,然后,在V(u1)和V(u3)之间交换V(u1)[s1,s2]和V(u3)[s1,s2],同时,在V(u2)和V(u4)之间交换V(u2)[s1,s2]和V(u4)[s1,s2];
步骤3.4.3:基于TS∪IS中的位串构造加权有向图IL=(IN,IE,W),实施过程如下:
步骤3.4.3.1:初始化IN和IE为空集;
步骤3.4.3.2:将TS∪IS中位串不全为0的所有用户添加到IN中,并将Gg中的用户添加到IN中;
步骤3.4.3.3:初始化三个集合Ns、N1和N2为空集,并针对IN-Gg中的每个用户u,判断u的归属,如果u是Gs中的用户,那么将u添加进Ns中,如果u是G1中的用户,那么将u添加进N1中,如果u是G2中的用户,那么将u添加进N2中;
步骤3.4.3.4:对于N2中的每个用户u,获取它对应的位串V(u),然后对于V(u)中每个为1的位,获取它在Gg中对应的用户gu,然后在IE增加一条有向边<u→gu>;
步骤3.4.3.5:对于N1中的每个用户u,获取它对应的位串V(u),然后对于V(u)中每个为1的位,获取它在Gg中对应的用户gu,并做如下检测:
如果gu在当前加权有向图IL中的入度为0,那么在IE增加一条有向边<u→gu>,否则在IL中获取N2里面指向gu的用户tu,然后在IE增加一条有向边<u→tu>;
步骤3.4.3.6:对于Ns中的每个用户u,获取它对应的位串V(u),然后对于V(u)中每个为1的位,获取它在Gg中对应的用户gu,并做如下检测:
如果gu在当前加权有向图IL中的入度为0,那么在IE增加一条有向边<u→gu>,否则在IL中获取N2里面指向gu的用户tu,并做进一步检测:
如果tu在当前加权有向图IL中的入度为0,那么在IE增加一条有向边<u→tu>,否则在IL中获取N1里面指向tu的用户fu,然后在IE增加一条有向边<u→fu>;
步骤3.5:基于步骤1中的时间代价模型,计算IL的时间代价:
<mrow>
<mi>F</mi>
<mrow>
<mo>(</mo>
<mi>I</mi>
<mi>L</mi>
<mo>)</mo>
</mrow>
<mo>=</mo>
<msub>
<mo>&Sigma;</mo>
<mrow>
<mi>u</mi>
<mo>&Element;</mo>
<mi>I</mi>
<mi>L</mi>
<mo>-</mo>
<msub>
<mi>G</mi>
<mi>g</mi>
</msub>
</mrow>
</msub>
<mi>W</mi>
<mrow>
<mo>(</mo>
<mi>u</mi>
<mo>)</mo>
</mrow>
<mo>+</mo>
<msub>
<mo>&Sigma;</mo>
<mrow>
<mo><</mo>
<msub>
<mi>u</mi>
<mn>1</mn>
</msub>
<mo>&RightArrow;</mo>
<msub>
<mi>u</mi>
<mn>2</mn>
</msub>
<mo>></mo>
<mo>&Element;</mo>
<mi>I</mi>
<mi>E</mi>
</mrow>
</msub>
<mi>W</mi>
<mrow>
<mo>(</mo>
<mo><</mo>
<msub>
<mi>u</mi>
<mn>1</mn>
</msub>
<mo>&RightArrow;</mo>
<msub>
<mi>u</mi>
<mn>2</mn>
</msub>
<mo>></mo>
<mo>)</mo>
</mrow>
<mo>.</mo>
</mrow>
步骤3.6:比较F(IL)与F(L’)取值的大小,如果F(IL)<F(L’),那么将集合VS替换成集合TS∪IS、将加权有向图L’替换成IL并且将F(L’)替换成F(IL),即VS=TS∪IS、L’=IL以及F(L’)=F(IL)。
步骤3.7:对位串集合VS执行两点变异操作,处理过程如下:
步骤3.7.1:在VS中随机挑选出半数的位串,构成集合MS,并且将VS中剩下的位串构成集合HS;
步骤3.7.2:依次处理MS中的每个位串V(u):首先随机产生两个选择点s1和s2,然后对于子串V(u1)[s1,s2]中的每个位V(u1)[j](s1≤j≤s2),做如下检测:
如果V(u1)[j]=0,那么将V(u1)[j]置为1,接着在集合HS中获取第一个第j位为1的位串V(u2),并将V(u2)[j]置为0,反之,如果V(u1)[j]=1,那么将V(u1)[j]置为0,接着在集合HS中获取第一个第j位为0的位串V(u2),并将V(u2)[j]置为1;
步骤3.7.3:使用与步骤3.4.3相同的实施方式,基于MS∪HS中的位串构造加权有向图QL=(QN,QE,W);
步骤3.8:基于步骤1中的时间代价模型,计算QL的时间代价:
<mrow>
<mi>F</mi>
<mrow>
<mo>(</mo>
<mi>Q</mi>
<mi>L</mi>
<mo>)</mo>
</mrow>
<mo>=</mo>
<msub>
<mo>&Sigma;</mo>
<mrow>
<mi>u</mi>
<mo>&Element;</mo>
<mi>Q</mi>
<mi>L</mi>
<mo>-</mo>
<msub>
<mi>G</mi>
<mi>g</mi>
</msub>
</mrow>
</msub>
<mi>W</mi>
<mrow>
<mo>(</mo>
<mi>u</mi>
<mo>)</mo>
</mrow>
<mo>+</mo>
<msub>
<mo>&Sigma;</mo>
<mrow>
<mo><</mo>
<msub>
<mi>u</mi>
<mn>1</mn>
</msub>
<mo>&RightArrow;</mo>
<msub>
<mi>u</mi>
<mn>2</mn>
</msub>
<mo>></mo>
<mo>&Element;</mo>
<mi>Q</mi>
<mi>E</mi>
</mrow>
</msub>
<mi>W</mi>
<mrow>
<mo>(</mo>
<mo><</mo>
<msub>
<mi>u</mi>
<mn>1</mn>
</msub>
<mo>&RightArrow;</mo>
<msub>
<mi>u</mi>
<mn>2</mn>
</msub>
<mo>></mo>
<mo>)</mo>
</mrow>
<mo>.</mo>
</mrow>
步骤3.9:比较F(QL)与F(L’)取值的大小,如果F(QL)<F(L’),那么将集合VS替换成集合MS∪HS、将加权有向图L’替换成QL并且将F(L’)替换成F(QL),即VS=MS∪HS、L’=QL以及F(L’)=F(QL)。
步骤3.10:将具有全局最小代价的信息传播路径L’=(N’,E’,W)输出给用户。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710227761.4A CN107145517B (zh) | 2017-04-10 | 2017-04-10 | 微博群组间具有全局最小代价的信息传播路径生成方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710227761.4A CN107145517B (zh) | 2017-04-10 | 2017-04-10 | 微博群组间具有全局最小代价的信息传播路径生成方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN107145517A true CN107145517A (zh) | 2017-09-08 |
CN107145517B CN107145517B (zh) | 2020-08-14 |
Family
ID=59774206
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201710227761.4A Active CN107145517B (zh) | 2017-04-10 | 2017-04-10 | 微博群组间具有全局最小代价的信息传播路径生成方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN107145517B (zh) |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20060026017A1 (en) * | 2003-10-28 | 2006-02-02 | Walker Richard C | National / international management and security system for responsible global resourcing through technical management to brige cultural and economic desparity |
CN101373542A (zh) * | 2008-08-20 | 2009-02-25 | 浙江大学 | 一种适用于群组动画的全局路径控制方法 |
CN102880186A (zh) * | 2012-08-03 | 2013-01-16 | 北京理工大学 | 基于稀疏a*算法和遗传算法的航迹规划方法 |
CN103489042A (zh) * | 2013-09-17 | 2014-01-01 | 中国科学院深圳先进技术研究院 | 一种灾害应急决策系统路径优化的方法 |
-
2017
- 2017-04-10 CN CN201710227761.4A patent/CN107145517B/zh active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20060026017A1 (en) * | 2003-10-28 | 2006-02-02 | Walker Richard C | National / international management and security system for responsible global resourcing through technical management to brige cultural and economic desparity |
CN101373542A (zh) * | 2008-08-20 | 2009-02-25 | 浙江大学 | 一种适用于群组动画的全局路径控制方法 |
CN102880186A (zh) * | 2012-08-03 | 2013-01-16 | 北京理工大学 | 基于稀疏a*算法和遗传算法的航迹规划方法 |
CN103489042A (zh) * | 2013-09-17 | 2014-01-01 | 中国科学院深圳先进技术研究院 | 一种灾害应急决策系统路径优化的方法 |
Non-Patent Citations (2)
Title |
---|
程久军: "移动P2P流媒体业务及市场分析", 《电信网技术》 * |
黄震华等: "一种社交网络群组间信息推荐的有效方法", 《电子学报》 * |
Also Published As
Publication number | Publication date |
---|---|
CN107145517B (zh) | 2020-08-14 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
WO2022222231A1 (zh) | 药物与靶标的相互作用预测方法、装置、设备及存储介质 | |
CN110837602B (zh) | 基于表示学习和多模态卷积神经网络的用户推荐方法 | |
CN107220277A (zh) | 基于手绘草图的图像检索算法 | |
Sukhija et al. | The recent state of educational data mining: A survey and future visions | |
Gharaee et al. | Graph representation learning for road type classification | |
CN106997373A (zh) | 一种基于深度置信网络的链路预测方法 | |
CN110489661A (zh) | 一种基于生成对抗网络和迁移学习的社交关系预测方法 | |
Li et al. | SybilFlyover: Heterogeneous graph-based fake account detection model on social networks | |
CN112966165A (zh) | 基于图神经网络的交互式社区搜索方法及装置 | |
Li et al. | Local community detection for multi-layer mobile network based on the trust relation | |
Moreno et al. | Learning mixed kronecker product graph models with simulated method of moments | |
Zhou et al. | HID: Hierarchical multiscale representation learning for information diffusion | |
CN104899283A (zh) | 一种针对单个不确定图的频繁子图挖掘与优化方法 | |
Zhu et al. | Roles of degree, H-index and coreness in link prediction of complex networks | |
CN107145517A (zh) | 微博群组间具有全局最小代价的信息传播路径生成方法 | |
Yang et al. | A few-shot inductive link prediction model in knowledge graphs | |
CN115526293A (zh) | 一种顾及语义和结构信息的知识图谱推理方法 | |
Zou et al. | Will More Expressive Graph Neural Networks do Better on Generative Tasks? | |
CN113158088A (zh) | 一种基于图神经网络的位置推荐方法 | |
CN103064856A (zh) | 一种基于信度网的资源推荐方法和装置 | |
CN106685686A (zh) | 基于模拟退火的网络拓扑估计方法 | |
Menezes et al. | Automatic discovery of agent based models: An application to social anthropology | |
Guo et al. | How artificial intelligence cooperating with agent‐based modeling for urban studies: A systematic review | |
Mao | Research on the Design of Teaching Aid Resource System Based on Unsupervised Representation Learning | |
Salehi Rizi | Graph Representation Learning for Social Networks |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |