CN107767280A - 一种基于时间要素的优质节点探测方法 - Google Patents
一种基于时间要素的优质节点探测方法 Download PDFInfo
- Publication number
- CN107767280A CN107767280A CN201710956412.6A CN201710956412A CN107767280A CN 107767280 A CN107767280 A CN 107767280A CN 201710956412 A CN201710956412 A CN 201710956412A CN 107767280 A CN107767280 A CN 107767280A
- Authority
- CN
- China
- Prior art keywords
- node
- quality
- time
- msub
- mrow
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 55
- 238000001514 detection method Methods 0.000 claims abstract description 56
- 230000008569 process Effects 0.000 claims abstract description 20
- 238000000605 extraction Methods 0.000 claims abstract description 17
- 239000011159 matrix material Substances 0.000 claims description 15
- 239000000523 sample Substances 0.000 claims description 14
- 238000012549 training Methods 0.000 claims description 12
- 230000003993 interaction Effects 0.000 claims description 10
- 238000013507 mapping Methods 0.000 claims description 9
- 238000002474 experimental method Methods 0.000 claims description 8
- 238000012423 maintenance Methods 0.000 claims description 7
- 230000008859 change Effects 0.000 claims description 6
- 238000005457 optimization Methods 0.000 claims description 6
- 238000012360 testing method Methods 0.000 claims description 6
- 230000035772 mutation Effects 0.000 claims description 5
- 238000009472 formulation Methods 0.000 claims description 3
- 239000000203 mixture Substances 0.000 claims description 3
- 108010014172 Factor V Proteins 0.000 claims description 2
- 241000287196 Asthenes Species 0.000 claims 1
- 238000009795 derivation Methods 0.000 abstract description 4
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 abstract description 2
- 238000011160 research Methods 0.000 description 22
- 230000000694 effects Effects 0.000 description 8
- 238000005516 engineering process Methods 0.000 description 6
- 238000011156 evaluation Methods 0.000 description 6
- 230000006870 function Effects 0.000 description 6
- 238000011161 development Methods 0.000 description 4
- 238000010586 diagram Methods 0.000 description 4
- 239000000284 extract Substances 0.000 description 4
- 238000003325 tomography Methods 0.000 description 4
- 230000006399 behavior Effects 0.000 description 3
- 238000004422 calculation algorithm Methods 0.000 description 3
- 238000007418 data mining Methods 0.000 description 3
- 230000002452 interceptive effect Effects 0.000 description 3
- 230000006855 networking Effects 0.000 description 3
- 230000007480 spreading Effects 0.000 description 3
- 238000003892 spreading Methods 0.000 description 3
- 230000002776 aggregation Effects 0.000 description 2
- 238000004220 aggregation Methods 0.000 description 2
- 238000004458 analytical method Methods 0.000 description 2
- 238000013459 approach Methods 0.000 description 2
- 230000008901 benefit Effects 0.000 description 2
- 230000005540 biological transmission Effects 0.000 description 2
- 230000015572 biosynthetic process Effects 0.000 description 2
- 244000144992 flock Species 0.000 description 2
- 230000004927 fusion Effects 0.000 description 2
- 230000002068 genetic effect Effects 0.000 description 2
- 238000010801 machine learning Methods 0.000 description 2
- 230000007246 mechanism Effects 0.000 description 2
- 238000005065 mining Methods 0.000 description 2
- 239000000047 product Substances 0.000 description 2
- 230000007474 system interaction Effects 0.000 description 2
- 230000002123 temporal effect Effects 0.000 description 2
- 235000012364 Peperomia pellucida Nutrition 0.000 description 1
- 240000007711 Peperomia pellucida Species 0.000 description 1
- 230000004888 barrier function Effects 0.000 description 1
- 238000009412 basement excavation Methods 0.000 description 1
- 230000000903 blocking effect Effects 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 230000001427 coherent effect Effects 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 230000002860 competitive effect Effects 0.000 description 1
- 238000000205 computational method Methods 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 230000007812 deficiency Effects 0.000 description 1
- 230000002950 deficient Effects 0.000 description 1
- 238000000151 deposition Methods 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 230000001066 destructive effect Effects 0.000 description 1
- 238000009826 distribution Methods 0.000 description 1
- 230000005284 excitation Effects 0.000 description 1
- 235000013305 food Nutrition 0.000 description 1
- 238000009415 formwork Methods 0.000 description 1
- 239000010931 gold Substances 0.000 description 1
- 229910052737 gold Inorganic materials 0.000 description 1
- 230000005484 gravity Effects 0.000 description 1
- 238000009499 grossing Methods 0.000 description 1
- 230000036541 health Effects 0.000 description 1
- 230000000670 limiting effect Effects 0.000 description 1
- 230000001404 mediated effect Effects 0.000 description 1
- 230000036961 partial effect Effects 0.000 description 1
- 230000000644 propagated effect Effects 0.000 description 1
- 208000020016 psychiatric disease Diseases 0.000 description 1
- 210000001747 pupil Anatomy 0.000 description 1
- 238000012797 qualification Methods 0.000 description 1
- 230000035484 reaction time Effects 0.000 description 1
- 230000002829 reductive effect Effects 0.000 description 1
- 238000007670 refining Methods 0.000 description 1
- 230000011514 reflex Effects 0.000 description 1
- 230000001105 regulatory effect Effects 0.000 description 1
- 230000008439 repair process Effects 0.000 description 1
- 238000010845 search algorithm Methods 0.000 description 1
- 241000894007 species Species 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
- 239000013589 supplement Substances 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
- 230000003442 weekly effect Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/01—Social networking
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Databases & Information Systems (AREA)
- Business, Economics & Management (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Computing Systems (AREA)
- Data Mining & Analysis (AREA)
- Health & Medical Sciences (AREA)
- Economics (AREA)
- General Health & Medical Sciences (AREA)
- Human Resources & Organizations (AREA)
- Marketing (AREA)
- Primary Health Care (AREA)
- Strategic Management (AREA)
- Tourism & Hospitality (AREA)
- General Business, Economics & Management (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明公开了一种基于时间要素的优质节点探测方法,本发明主要包括社交网络中基于时间要素的优质节点属性的特征提取规则的建立,基于时间要素的节点属性的优质度分类,与时间序列相关联的优质节点探测模型的建立与节点排名关系,及基于时间序列的探测模型的衍化预测。其中,模型的建立主要用于描述已提取特征规则基于时间要素的节点属性,对节点属性建立时间序列特征库以识别随机样本节点的优质程度,之后对已识别节点进行排名并归类,最后对已识别节点随着时间的推移可能出现的衍化过程进行预测,以印证基于时间要素的优质节点探测方法的准确性。
Description
技术领域
本发明属于社交网络中关键节点探测技术范畴,涉及一种基于时间要素的优质节点探测方法。
背景技术
近几年来,由于社交网络的研究日趋热门,基于社交网络平台上的探测和发现优质用户问题的研究也日益得到人们的重视。通过对这类用户的挖掘,可以和这些优质用户建立更直接的关联以获取蕴含的社会价值。例如,教师热衷于发现优秀的学生进行重点培养,商人热衷于发现优质的合作伙伴进行商业合作,金融行业热衷于发现优质的客户以实现经济价值,从业多年的HR善于发现优秀的人才来为企业服务等等。那么,作为一个具备敏锐眼光的观察者,他们又是凭借何种知识和经验去发现所在行业中的优质客户的呢?这些问题正是本专利所要解决的核心问题:通过提取目光敏锐观察者对优质用户发现的知识和经验为基础,从中提取优质用户所具备的特征建立关联规则和特征识别库。将观察者发现优质用户的问题引入到社交网络的研究领域中,以社交网络的图挖掘为理论依据,将该问题转化为社交网络中发现和探测优质节点的问题,从而形成了一套对该挑战性问题加以解决的方法体系。
通过对国内外参考文献的阅读和研究现状的分析发现,以社交网络图挖掘知识建立模型,以发现优质节点的相关研究文献并不多见,与本专利紧密相关的参考文献就更难以寻觅。因此,本专利所要解决的问题,不仅在该问题所涉及的国内外研究现状中具有一定的创新性,而且在解决问题的方法、途径和思路上,更具有其独创性。通过涉猎与本专利相关的参考文献,涉及的主要研究问题和研究点可概括如下。其中,
最佳消息发布时间:Nemanja Spasojevic等人规划出了一种叫做when-to-post的问题([文献1]),解决该类问题的目标是要找出社交网络中用户发布消息的最佳时间,从而值得听众的反馈概率达到最大化。为了让读者能够理解这个问题的复杂性,他们在发布消息反应时间方面考察了用户行为的变化情况,并比较了不同城市中的用户每周在Twitter和Facebook上跨网络和跨城市的反应行为。他们将这种分析思路用十亿条发布消息进行实施验证,观察听众的反应并提出了生成个性化发布计划的多种解决方法。
双向影响力传播:Rui Yan等人提出了通过影响力传播来平滑语言模型([文献2]),以达到解决社会网络中薄弱环节的目的。他们建立了一种双向社会化因素图模型,该模型利用文档对和文档背后的社会化增强网络二者之间的文本关联。例如,用户关系和社会互动。这些因素作为文档和他们通信作者中的属性和依赖关系而被建模。最后,他们基于估计的影响力传播词项给平滑后的文档。
社交网络中的局部共校准:当前,人们通常参与到多种在线社交网路中同时共享多个社交网络富服务。除了共同的用户以外,社交网络能提供类似的服务。这些服务可以共享很多其它种类的信息实体。例如,位置,视频和产品。然而,这些在不同社交网络中共享的实体大都没有任何已知的对应关系而相互孤立。Jiawei Zhang等人针对这些同时跨网络链接多种共享实体的潜在对应关系([文献3]),而在形式上,这类问题被称之为网络的“局部共校准”(PCT)问题。它是很多具体跨网络应用的先决条件,例如社会网络融合,多信息交换与传递。同时,局部共校准问题也由于下列原因而被认为是一种挑战性问题。包括:1、社交网络的异质性;2、建模所需的训练实例的缺乏;3、通信连接方面一对一的限制。为了解决这些挑战,他们提出了一种新的网络校准架构UNI-COAT(非监督型共校准)。基于异质信息,该架构将局部共校准问题转化为一个联合优化问题。为了解决这个目标函数,通信关系上的一对一限制被释放,而冗余非存在性相关连接将由一种新的网络共匹配算法被裁减。
多社交网络学习和应用:人类生活在社交网络时代,全世界的人类由多个社交网络连接并组织起来。对于不同的社交网络而言,这种观点可能根据它们所提供服务的不同而有所差异。人们之间相互问候并从不同角度全面地描述了某个特定的用户。相对于单一来源传递的匮乏知识,多社交网络的恰当融合提供给本发明一个更好的机遇来进行深层次用户理解。然而,挑战与机遇并存。第一个挑战就是由于一些用户在某个社交网络中表现活跃而在另一些设计网络中表现不活跃而导致块丢失数据的存在。第二个挑战是如何协同的整合多个社交网络。为达到这个目的,Xuemeng Song等人通过对来自多源知识的无缝探索,提出了一种针对数据丢失实现的新模型([文献4])。然后,他们开发了一种鲁棒性的多社交网络学习模型。
针对地位提升的用户移动性建模:随着智能手机和社交网络服务的激增,基于位置的社交网络日益被看作是一种为商业提升产品和服务的工具。Wen-Yuan Zhu等人研究了辅助商业提升地位的关键性技术([文献5]),这些技术能通过潜在基于位置的社交网络而明智地打广告。为了最大化地位提升的利益,他们把它标准化为一个基于位置社交网络中的影响力最大化问题。例如,给定一个目标位置和一个基于位置的社交网络,选取哪些用户作为初始用户才能达到让他们成功传播和吸引最多的用户来访问目标位置的目的。已存在的研究已经提出了各种方法来计算信息传递的概率。也就是说,在一个静态社交网络的配置中,一个用户可能怎样去影响另一个用户。然而,源于基于位置的社交网络中的传播概率带来了更多的挑战。因为目标位置和用户移动性是动态和查询依赖的,因此传播概率受到这二者的严重影响。Wen-Yuan Zhu等人提出了两种用户移动性模型([文献5]),分别命名为基于高斯的和基于距离的移动性模型,用于捕获单个基于位置社交网络用户的签到行为。而基于此,位置感知的传播概率能够分别被获取。
在线社交数据挖掘:Hong-Han Shuai等人提出了一种叫做社交网络精神障碍探测(SNMDD)的机器学习架构用于从社交网络数据中提取特征来精确识别社交网络精神障碍的潜在案例([文献6])。他们在社交网络精神障碍探测中也利用多源学习并提出了一种基于张量模型的新型社交网络探测模型用于改进性能。
互联地理社交网络:大都市把不同的个体聚集在一起,为文化和知识的交流创造了机遇,这些最终能够带来社会和经济的繁荣。Desislava Hristova等人在人与地理互联的本质方面提出了一种新型的网络视角([文献7]),这一视角使得通过社交网络和移动模式捕获访问者的城市位置的社交多样性变得可能。他们定义了与社交经纪角色、熵、访问者的同质性以及它们能引起的各种偶然的邂逅者等相关的四条地理社交多样性准则。这样就能够将聚集陌生人的地方和聚集朋友的地方进行区分。同样,也可用于区分聚集各种不同人的地方和聚集常客的地方。他们将伦敦地区的这些属性和健康指标进行关联,在带高熵值和佣金的贫困地区发现乡绅化信号。通过对这些地区五年以上人口调查并根据数据的综合贫困英国指数显示,这些地方有大量富人和各种游客涌入表明了他们的排名具有整体提升。Desislava Hristova等人揭示了人与地区属性之间的关系,并区分不同分类和重要的城市地理学以应对城市政策和基于位置应用的社会感知的下一代发展。
社交网络中的嫌犯追踪搜索:通过指定名字去搜索一个特定的人在诸如Facebook的社交网络服务中是一项基本功能。然而很多时候,想要找一个人但是她却对搜索目标的社交网络标签知之甚少(例如兴趣,技能,家乡,学校,职业等)。假定每个用户关联一个社交标签集合,他们提出了一种在线社交网络中新搜索模型(疑犯追踪搜索),旨在发现一系列基于用户指定查询标签集合的期望目标,这些标签用来描述目标。他们设计了一种贪心启发式图搜索算法,用以发现搜索目标。这些目标不仅覆盖查询标签,而且能处理更优的社交对等交互或者对于用户而言,具有更高社交接近度的连接([文献8])。
企业客户识别:当前,一个现代电子商务公司可能既有在线销售又有离线销售的部门。一般地,在线销售通过群发大量电子邮件或促销码的方式尝试销售少量商品给客户,这样就严重依赖于设计的后台算法。另一方面,离线销售试图通过由销售代表发起的联系人售卖大量商品给企业客户。而离线销售与在线销售相比,成本更高一些。与仅关注支持在线销售的机器学习算法等研究工作不同的是,Qingbo Hu等人介绍了一种利用异质社交网络改进离线销售有效性的方法([文献9])。更具体的说,他们提出了一种二相架构。其中,Hetero-Sales首先从基于元路径学习的语义学中得到启发,构造出了一个“公司-公司”的图,又叫公司同质性图(CHG)。然后,采用图上的标签传播预测有前途的公司,而这些公司能够确保成功的结束离线销售的方式。
基于多网络群体链接预测的元路径:日常生活中,在线社交网络由于提供各种服务而变得无处不在。同时,当前用户通常同时涉及多个在线社交网络并享受不同网络提供的特定服务。一般地,社交网络通常共享一些共同用户而被称之为部分一致网络。J.Zhang等人想在多个部分一致的社交网络中同时预测社交链接的形成([文献10])。这一问题被正式定义为多网络链接预测(形成)问题。在多个部分一致的社交网络中,用户通过彼此相连可以形成广阔的链接。
为了给这些用户间不同的连接分类,他们提出了7种“网内社交元路径”和4类“网间元路径”。这些“社交元路径”在网络中覆盖多种多样的连接信息,这些连接信息中的一些对解决多网络链接预测问题有帮助,而另一些则不能。为了利用有用的连接信息,大多数有用“社交元路径”的一个子集被选取,而选取过程在形式上被定义为“社交元路径选择”。J.Zhang等人提出了一个叫做“多网络链接标识符”(Multi-Network Link Identifier,MLI)有效框架,用于解决一般链接信息预测的问题。在多个部分一致社交网络中基于可选择“社交网络元路径”抽取并建立异构拓扑特征,MLI能在全局一致网络中辅助提炼和消除互相预测的结果。
电子商务中捆绑推荐:在当今电商中,推荐系统已经成为一个重要的组成部分。当前在推荐系统方面的研究主要关注于改进单个推荐商品的相关性和盈利率。但事实上,用户通常接触的是一个商品集合,他们可能在一个订单中购买多个商品。因此,单个商品的相关性和盈利性可能实际上依赖于集合中的其它商品。换句话说,推荐集合是商品之间必须捆绑销售的。T.Zhu等人介绍一种被称为捆绑推荐问题的新问题([文献11])。为了解决这类问题,他们找出与首选经营目标相关的最优化商品捆绑进行推荐。然而,捆绑推荐问题是一个大规模NP难问题。他们认为依赖输入数据的属性解决小版本的捆绑推荐问题是绰绰有余的。
城市贫困程度度量:精确和及时的度量一个城市社会经济的贫困指数已经成为世界各地政府优先考虑的事项。因为见证的大规模城市化进程正在引起高度不平衡而这些都是需要被调停的。习惯上,贫困指数是由人口普查数据获取的,然而这种获取方式成本较高,而且是每隔几年才能获取。最近几年中,可替代的计算方法在一定的时空粒度上被提出来用于自动提取贫困指数。然而,它们通常要求访问数据集(例如详细的记录),而这些是不能公开从政府和代理机构获取到的。为了弥补,Desislava Hristova等人提出了一种新方法用以在一个较好的时空粒度上自动挖掘贫困指数([文献12]),这方法只需要自由获取用户生成内容即可。更确切地说,这种方法需要访问数据集来描述在物理世界中什么城市元素需要被提出来。
城市环境中的拓扑属性和时间动态性:理解空间网络是由移动用户的轨迹形成对于流行病的局部搜索的应用是有帮助的。尽管在很多领域具有潜在影响,但是由于在一个较好的时空解决方案上缺乏大规模数据,因此人类移动性网络的一些方面仍旧没有被大范围探究。Anastasios Noulas等人对地区网络的拓扑属性进行了经验分析([文献13]),在重尾度分布,三元闭合机制和小世界属性等方面记录他们与社交网络的相似之处。然而与社交网络不同的是,在同配性方面地区网络显现出一种混合连接的趋势。而这个与那些网络图具有惊人的相似点。Anastasios Noulas等人利用额外的语义信息来解释那些在网络中承担功能角色的节点(例如,旅游中心或者食物点)的行为([文献13])。最后,在地区网络中随着时间的流逝,大规模新链接的出现,他们提出了一种新的重力模型,用以把城市环境中地区间连通性的三个本质元素(网络层交互、人类移动性的动态性、地理距离)聚集在一起。
地理社交网络中的多层经纪:开放的网络结构和经纪位置长期被认为是在维持社会资本和竞争优势方面发挥了至关重要的作用。原本断开个体的中介程度能把在线和离线社交网络区分开。例如,用户可能是两个在线用户的中介,而这两个用户通过社交媒体进行信息检索来交换离线信息。然而,社会资本的网络研究在线上和线下的相互影响中通常被忽略,而主要集中在单层上。Desislava Hristova等人提出了一种地理社会的多层方法用以中介([文献14]),这就使得整合社会资本的线上和线下基础的真相被揭露出来。他们通过核查在线社交网络中用户的位置和用户通过签入check-ins数据的离线移动模式来扩展中介的概念。他们发现,通过社交和协同定位网络的社交和地图中介的位置明显而且不对称。一方面,事实上如果用户的离线位置也被纳入考虑范围的话,当用户中介能力得到缓和的时候,他们可能会表现为经纪人的特征。另一方面,在网络中用户表现出不足的离线经纪业务实力可能激活经纪人,而这些把在线和离线交互连接在了一起。
从在线关注跟踪城市经济增长:城市资源是根据社会经济指标进行分配的,发展中国家的快速城市化需要及时更新这些指标。人口普查数据收集的高昂成本使得这种及时更新变得非常困难。为了避免依据过时的指标分配资源,可使用数据对这些指标进行部分更新和补充。在发达国家(主要是在英美)使用社交媒体来达到这个目的是可能的。CarmenVaca Ruiz等人分析了微博服务中的一个随机样本并准确预测出了城市的GDP值([文献15])。为了进行预测,他们利用全球地方性的社会学概念说明,经济上成功的城市趋向于同时在本地和全球范围内涉及交互。事实上,利用社交媒体数据度量一个城市的全球地方性能有效表示这个城市的幸福感。
通过对已存在研究工作的研读发现,基于时间要素对优质节点进行探测的研究工作和发明专利鲜有涉猎。而之前的发明专利“一种社交网络中优质节点探测方法及系统”(ZL201610550702.6)在解决问题的过程中存在其局限性。因此本专利通过引入时间要素,对优质节点涉及时间序列相关的现实应用问题进一步完善。
参考文献:
[文献1]Nemanja Spasojevic,Zhisheng Li,Adithya Rao et al.When-To-Poston Social Networks.In Proc.of ACM Conference on Knowledge Discovery and DataMining(KDD’15),pages 2127-2136,Sydney,NSW,Australia,2015.
[文献2]Rui Yan,Cheng-Te Li,Hsun-Ping Hsieh et al.Socialized LanguageModel Smoothing via Bi-directional Influence Propagation on SocialNetworks.In Proceedings of the 38th International Conference on World WideWeb,WWW’16,pages 1395-1405,Montréal,Québec,Canada,2016.International WorldWide Web Conferences Steering Committee.
[文献3]Jiawei Zhang and Philip S.Yu.PCT:Partial Co-Alignment ofSocial Networks.In Proceedings of the 38th Special Interest Group onInformation Retrieval,SIGIR’15,pages 749-759,Montréal,Québec,Canada,2016.International World Wide Web Conferences Steering Committee.
[文献4]Xuemeng Song,Liqiang Nie,Luming Zhang et al.Multiple SocialNetwork Learning and Its Application in Volunteerism Tendency Prediction.InProceedings of the 38th International Conference on Research on Development inInformation Retrieval,SIGIR 2015,pages 213-222,Santiago,Chile,2015.
[文献5]Wen-Yuan Zhu,Wen-Chih Peng,Ling-Jyh Chen et al.Modeling UserMobility for Location Promotion in Location-based Social Networks.In Proc.ofACM Conference on Knowledge Discovery and Data Mining(KDD’15),pages 1573-1582,Sydney,NSW,Australia,2015.
[文献6]Hong-Han Shuai,Chih-Ya Shen,De-Nian Yang et al.Mining OnlineSocial Data for Detecting Social Network Mental Disorders.In Proceedings ofthe 38th International Conference on World Wide Web,WWW’16,pages 275-285,Montréal,Québec,Canada,2016.International World Wide Web Conferences SteeringCommittee.
[文献7]Desislava Hristova,Matthew J.Williams.Measuring Urban SocialDiversity Using Interconnected Geo-Social Networks.In Proceedings of the 38thInternational Conference on World Wide Web,WWW’16,pages 21-30,Montréal,Québec,Canada,2016.International World Wide Web Conferences Steering Committee.
[文献8]Hsun-Ping Hsieh,Cheng-Te Li,Rui Yan.I See You:Person-of-Interest Search in Social Networks.In Proceedings of the 38th InternationalConference on Research on Development in Information Retrieval,SIGIR 2015,pages 839-842,Santiago,Chile,2015.
[文献9]Qingbo Hu,Sihong Xie,Jiawei Zhang.HeteroSales:UtilizingHeterogeneous Social Networks to Identify the Next Enterprise Customer.InProceedings of the 38th International Conference on World Wide Web,WWW’16,pages 41-50,Montréal,Québec,Canada,2016.International World Wide WebConferences Steering Committee.
[文献10]J.Zhang,P.S.Yu,and Z.-H.Zhou.Meta-path based multi-networkcollective link prediction.In Proc.of ACM Conference on Knowledge Discoveryand Data Mining(KDD’14),pages 1286-1295,New York,NY,USA,2014.
[文献11]T.Zhu,P.Harrington,J.Li,and L.Tang.Bundle recommendation inecommerce.In Proceedings of the 37th International Conference on Research onDevelopment in Information Retrieval,SIGIR 2014,pages 657-666,Gold Coast,Queensland,Australia,2014.
[文献12]Alessandro Venerandi,Giovanni Quattrone,Licia Capra etal.Measuring Urban Deprivation from User Generated Content.In Proceedings ofthe 18th ACM Conference on Computer Supported Cooperative Work and SocialComputing (CSCW’15),pages 254–264,2015.
[文献13]Anastasios Noulas,Blake Shaw,Renaud Lambiotte,and CeciliaMascolo.Topological Properties and Temporal Dynamics of Place Networks inUrban Environments.In Proceedings of the 24th International Conference onWorld Wide Web(WWW’15),pages 431–441,2015.
[文献14]Desislava Hristova,Pietro Panzarasa,and CeciliaMascolo.Multilayer Brokerage in Geo-Social Networks.In Proceedings of the 9thInternational AAAI Conference on Web and Social Media(ICWSM’15),2015.
[文献15]Carmen Vaca Ruiz,Daniele Quercia,Luca Maria Aiello,and PieroFraternali.Taking Brazil’s Pulse:Tracking Growing Urban Economies from OnlineAttention.In Proceedings of the 23rd International Conference on World WideWeb (WWW’14),pages 451–456,2014.
发明内容
针对现有技术的缺陷,本发明提出了一种基于时间要素的优质节点探测方法,用于发现社交网络中与用户需求具有较高契合度的核心节点。
本发明所采用的技术方案是:一种基于时间要素的优质节点探测方法,其特征在于,包括以下步骤:
步骤1:提取需要探测的优质节点所在的社交网络节点集合;
本实施例的优质节点指的是社交网络中,有能力满足特定指标所需条件的核心节点。此处的特定指标记为In,通常为一个指标集合,它包括社交网络中(如某机构或组织)为达成一定时期内的目标为各节点制定的所有预计的阶段性目标或规则。例如,对于一个计算机专业的优秀大学毕业生而言,他在大学四年中需要英语通过CET-6,记为Icet=6;需要通过计算机软件水平考试,记为Isle=1,其中1表示通过,0表示未通过;需要大学期间的课程平均成绩在80分以上,记为Iave≥80,等等。因此,In={Icet,Isle,Iave,...}。这样就构造出了判断该群体中优质节点的判断依据和方法。
步骤2:对社交网络节点建立社交网络的节点映射关系;
本实施例的节点映射关系指的是社交网络中的社交关系,例如,校园里的“老师-学生”在授课过程中,企业在寻找合作伙伴的过程中,均可建立“1对多”的社交映射关系。
步骤3:基于时间要素,提取优质节点特征;
取优质节点特征,包括:
1:优质节点发生变异具有固定的时间节点,因此在时间节点到来之前在某个恰当时刻再次选拔出优质节点作为候补;
设置节点被选定为优质节点的时刻为ts,优质节点变异的时间节点为te,则优质节点的活动周期选择候补优质节点的恰当时刻为其中α为微调参数;
2:针对优质节点属性变异的前兆提取时间要素作为特征;
具体的前兆包括:影响优质节点属性变异的主观因素Vsf和客观因素Vof。客观因素的发生可能会影响主观因素的变化,从而导致优质节点发生变异。例如,某人家中突逢巨变,客观因素表现为其中,of1=家破人亡,of2=家人离世,of3=彩票中奖,等等。不同类型的客观因素都会引起相应的主观因素发生变化。主观因素集合记为那么联合主客观因素可构建节点属性变异的前兆映射关系为:
其中,sf/of表示矩阵名称为“主客观映射”矩阵,o.sij表示每一种客观因素产生对应主观因素的可能性,取值介于0-1之间,i=1...n,j=1...m,n表示客观因素的个数,m表示主观因素的个数;取0表示客观因素对主观因素的影响程度为0,1表示客观因素对主观因素的影响程度为100%,介于0-1之间的值表示客观因素对主观因素的影响程度的百分比值;
3:确定优质节点的变异传递性和周期性;
变异传递性判断:在社交网络中,若两个节点的社交关系较密切,且二者在一定时期内同时达到优质节点的判断标准,则可认定变异的传递性成立;否则,判定为不成立。
在社交网络的社交关系研究中,一般使用社交强度(Social ties)对社交关系的亲密程度进行界定,而亲密程度受到交互频次、血缘关系等社会学因素的影响,因此一般认为,节点的正交互频次越高或血缘关系越近,则二者的社交关系越亲密(即社交强度越大)所谓社交正交互,通俗点讲就是社交的结果能拉近两个结点的亲密关系;
变异周期性判断:将社交网络中的一个时间起始点tcs到终止点tce所经历的时长记为T,若该时长T内,某节点发生变异。在接下来的连续n(n≥2)个时长T内,与该变异节点关系密切的节点均发生类似变异,则可认定变异周期性成立;否则,判定为不成立。
步骤4:建立优质节点动态探测模型;
优质节点动态探测模型为:
其中,优质节点为Nhq,变异要素为Ve,候补节点为Ne,时间要素集合为Tes={Ts,Ta,Tim,Tr,Te},变异要素诱惑阶段记为Ta,优质关系交互与维持阶段记为Tim,优质关系重组阶段记为Tr,Te与Ts对应,分别表示时间轴的开始Ts和结束Te,Tr≤Te;原优质节点关系阶段Ts为时间序列的起始阶段;变异要素诱惑阶段Ta表明该阶段将有变异要素介入,所谓变异要素是任何影响和破坏优质节点,最终导致优质节点对关系被破坏的一切主客观因素;优质关系交互与维持阶段Tim,用于防止原优质阶段突变,为候补优质节点的探测提供时间保障;优质关系重组阶段Tr为原优质节点的替补和优质关系恢复阶段,是优质节点探测的迭代与自修复过程;Ws×a∈Ts×a表示处于Ts到Ta阶段的优质节点探测权重,该权重取自于时间要素的边界限定矩阵Ts×a;Wa×im∈Ta×im表示处于Ta到Tim阶段的优质节点探测权重,该权重取自于时间要素的边界限定矩阵Ta×im;Wim×r∈Tim×r表示处于Tim到Tr阶段的优质节点探测权重,该权重取自于时间要素的边界限定矩阵和分别表示Ts到Ta、Ta到Tim和Tim到Tr三个阶段的优质节点获取函数,i,j,k分别表示获取优质节点探测函数的迭代次数,在Ta到Tim阶段存在变异要素为Ve的引入;
其中,中,上标s×a用于说明时间要素边界限定所处的时间序列阶段;下标用于说明节点y相对于节点x的优质程度,其中优质程度量化为节点完成优质节点预制规则或条件的完成度,完成度记为Rcom,若完成度越高则表明节点优质程度越高,例如,计算机专业的优秀大学毕业生的预制规则假定为5条,某同学仅完成了其中4条,则他的节点优质程度仅为80%;中,上标s×a用于说明时间要素边界限定所处的时间序列阶段,下标表示节点编号。
步骤5:将社交网络节点看作实验样本进行分组,并对节点进行训练和分类;
分组的依据如下:
1)根据样本节点所处的时间序列阶段(Ts,Ta,Tim,Tr,Te)的不同,第一次分组可首先分为5组;
2)将步骤1)中的5组样本再分解为训练集、测试集和验证集,共可得到五个不同时间序列阶段的15组样本;
训练方法:针对分组依据中所得的5个不同阶段的训练样本分别提取优质节点特征,建立不同时间序列阶段的节点分类规则。
分类依据和方法:基于5个不同阶段提取的分类规则,利用分组步骤2得到的测试集对分类规则进行测试,测试节点分类规则的召回率、准确率等评估指标。此处的准确率等结果指标就是图1中的“结果评估与反馈”阶段。在图1中“探测规则校正与模型优化”和“时间序列阈值设定”两个阶段后,则需要用到步骤2中的验证集再次进行验证实验,如此迭代实验过程,直至“时间序列阈值设定与比较”过程中的比较符合要求时,整个实验终止。
步骤6:对时间要素的边界进行限定,获取时间限定范围内的优质节点;
步骤7:对优质节点探测的结果进行评估并反馈结果,并在反复地训练过程中将不符合探测优质节点特征的规则进行校正,以达到对模型进行优化的目的;
不符合探测优质节点特征的规则进行校正,是制定各不同时间要素阶段探测结果的召回率和准确率,并对准确率进行阈值设定。
步骤8:回转执行步骤5,利用优化后的模型,进行优质节点探测以提高探测进度,如此进行迭代运算直到优质节点的探测进度超过时间序列的设定阈值为止,从而完成整个探测过程。
与现有技术(ZL201610550702.6)相比,本发明专利研究的内容详细阐述了基于时间要素的优质节点的探测过程。已存在的技术仅阐述了如何对社交网络中的优质节点进行探测的方法,但并未考虑随着时间的推移,优质节点会受到变异要素的影响而产生变异,也就是说在考虑时间要素的前提下,已存在的技术所探测出来的优质节点只能被称为局部优质节点,而非全局优质节点。为了优质节点探测的全局性,必须将本专利中阐述的时间要素考虑在内,并同时考虑在变异要素(包括客观因素和主观因素)影响下,优质节点是否在经历了优质节点交互与维持阶段后,能最终成为全局优质节点。若不能,则会在优质节点重组阶段被其他局部优质节点所取代。本专利的研究内容在现实生活中具有较广泛的应用价值,例如应对企业或组织的稀缺人才突发性跳槽问题,应对企业在寻求优质合作伙伴的过程中产生的突发性伙伴关系破裂问题等。本专利的研究内容不仅对上述内容有较好的解释和阐述,更给出了解决问题的方案和选择弥补上述问题出现的恰当时期。
附图说明
图1为本发明实施例的流程图;
图2为本发明实施例的“教师-学生”社交关系下的优质节点探测模型示意图;
图3为本发明实施例的基于时间要素的优质节点探测方法示意图(带变异要素)。
具体实施方式
为了便于本领域普通技术人员理解和实施本发明,下面结合附图及实施例对本发明作进一步的详细描述,应当理解,此处所描述的实施示例仅用于说明和解释本发明,并不用于限定本发明。
本发明主要包括社交网络中基于时间要素的优质节点属性的特征提取规则的建立,基于时间要素的节点属性的优质度分类,与时间序列相关联的优质节点探测模型的建立与节点排名关系,及基于时间序列的探测模型的衍化预测。其中,模型的建立主要用于描述已提取特征规则基于时间要素的节点属性,对节点属性建立时间序列特征库以识别随机样本节点的优质程度,之后对已识别节点进行排名并归类,最后对已识别节点随着时间的推移可能出现的衍化过程进行预测,以印证基于时间要素的优质节点探测方法的准确性。
在物理世界中,这一探测方法具有非常广阔的应用前景。例如,针对已建立优质节点对关系的“老师-学生”组合,随着时间的推移,学生的毕业会导致原本稳定的组合关系被破坏;对于已建立优质节点对关系的“企业-客户”组合,随着时间的推移,市场需求的变化导致了原本关系对在新市场形势下不再具有较大优势。诸如此类的社交网络关系比比皆是,由此可见,在众多社交网络的节点中基于时间要素对优质节点的动态探测技术更具有社会价值和现实意义。为了解决社交网络中针对优质节点进行动态探测的问题,现将解决问题的思路和步骤详细给出,如图1所示。
从图1中可以看出,首先要提取需要探测的优质节点所在的社交网络节点集合。例如上文所述的,优秀老师或优秀学生所在“老师-学生”关系的社交网络节点集合。在提取社交网络节点集合的全集之后,需要对社交网络节点建立社交网络的节点映射关系。然后,根据优质节点的活动规律提取探测优质节点需要满足哪些特征。例如,优秀学生往往喜欢提问题。那么这一现象就可成为探测优质节点的特征。但是有些优秀学生在取得些许成绩时,又往往喜欢骄傲自满,容易产生懈怠。因此,需要对优秀学生在恰当的时候采取必要的手段或措施。即,抓住优质节点产生变异的时间要素并加以限定显得非常重要。事实上,只有有经验的教师才会很敏感的抓住学生的懈怠期,但为了提醒那些不太优秀的老师能够像优秀老师一样,能准确抓住优秀学生的懈怠期,那么本专利的价值就由此凸显出来了。即,基于时间要素的优质节点探测过程能够从局部进行扩展,直至全局化。通俗而言就是经验分享。由于时间要素的提取,从而为优质节点的动态探测提供了激励和保障措施。由此,可使优质节点的动态探测模型能够顺利建立。然后,将社交网络节点看作实验样本进行分组,并进行分组训练和节点分类。紧接着,对时间要素的边界进行限定,因为优质节点只有在一定时期内才有可能产生变异,同时也为节点保持优质性提供可控性条件。之后,可对优质节点探测的结果进行评估并反馈结果,并在反复地训练过程中将不太符合探测优质节点特征的规则进行校正,以达到对模型进行优化的目的。最后,将优化后的模型再次回到节点训练与分类环节进行优质节点探测以提高探测进度,如此进行迭代运算直到优质节点的探测进度超过时间序列的设定阈值为止,从而完成整个探测过程。
接下来,将结合具体的应用来详细描述基于时间要素的优质节点探测的过程。整个描述的过程将以众所周知的“老师-学生”关系这一社交网络进行过程描述。如图2所示已构建的优质节点对“老师-学生”的组合。特别是在大学教授的研究梯队里,优质节点往往代表了优秀的高年级学生,他们往往成为研究梯队里的核心和关键。一旦这类学生毕业,从图2中可以明显看出,如果不继续从学生集合中探测优质节点,那么整个社交网络的结构将会彻底破坏。这种现象往往直观地表现为现实生活中团队的“断层”现象。而企业中技术层一旦出现“断层”,是会给依靠技术支撑的企业带来毁灭性打击的。
因此,基于时间要素的优质节点探测通过提取时间要素,能够适时选取候补优质节点,从而避免“断层”现象的出现。
接下来,将以图2中所示的已存在优质节点对“老师-学生”组合为例,针对时间要素的提取并结合优质节点的变异过程加以详细描述。
通过现实生活中的悉心观察可发现,优秀学生的变异期往往具备较明显的时间序列特征。例如,硕士生的三年学制期满,顺利毕业;博士生发表学术论文的要求完成,申请毕业答辩。这些都是较明显的时间序列,因此这些时间节点可被提取为时间要素的限定条件用于优质节点探测。因此,透过这些现象可对时间要素的特征提取进行归纳如下:
1、优质节点发生变异可能具有固定的时间节点,因此在时间节点到来之前可在某个恰当的时候从图2所示的节点集合中再次选拔优质节点作为候补;
2、优质节点的变异在发生前,可能具有其节点属性的变化。例如,优秀学生可能存在主客观因素导致其学习成绩的较大波动。因此,可针对优质节点属性变异的前兆提取时间要素作为特征;
3、优质节点的变异可能具有传递性和周期性。例如,优秀博士生可能存在于同一个研究小组,因此他们极有可能在一个较短的时间阈值内都满足毕业所需的论文要求,那么他们有可能同期毕业(尽管不同届)。因此,把握优质节点变异的传递性和周期性,除了可以避免出现某个优质节点变异,还可以避免批量断层现象。
值得说明的,第3点对于企业也相当重要。其现象可表现为,某个技术经理的周期性离职导致后续多个技术骨干的集体跳槽。这种现象的频繁出现就是优质节点传递性和周期性的具体表现,而优质节点集体变异的突发性对于技术型企业而言却是毁灭性的。
针对上述特征的描述,可提出如下解决问题的方案供参考:
1、设置节点被选定为优质节点的时刻为ts,优质节点变异的时间节点为te,那么即为优质节点的活动周期,本专利中称该活动周期为服务期。而选择候补优质节点的恰当时刻假定可选定为其中α为微调参数。对于“老师-学生”的优质节点对,优秀教师在选定候补优质节点时,通常会选择服务期的一半左右作为恰当时期,且α的取值不可过大。原因在于,遴选候补节点时间过早可能候补优质节点还未有能力胜任接替工作;但遴选时间过完,可能前期引起候补节点懈怠,同样导致“断层”。
2、应对优质节点受主客观因素影响而导致优质性的波动时,可采取及时沟通交互的策略。通过及时交互可了解优质节点状态所处的时间要素(序列)阶段,为避免节点间的传递性变异的发生建立保障.
3、优质节点变异的周期性虽然是社交网络中的常规现象,但并非无法预测和避免。例如对于硕士生正常毕业而言,其周期可设定为3年;通过统计研究室的博士生毕业周期,可设定优质节点变异周期(服务期)为5±α。
接下来将结合下图3的示意图来说明详述以上三点解决方案。
从图3中可以看出,基于时间要素的优质节点探测过程可大致分为四个时间阶段:原优质节点关系阶段Ts,变异要素诱惑阶段Ta,优质关系交互与维持阶段Tim和优质关系重组阶段Tr,而上文提到的Te与此处的Tr的关系为Te≤Td。其中,原优质节点关系阶段Ts为时间序列的起始阶段;变异要素诱惑阶段Ta表明该阶段将有变异要素介入,所谓变异要素可以是任何影响和破坏优质节点,最终导致优质节点对关系被破坏的一切主客观因素;优质关系交互与维持阶段Tim,并非阻止原优质节点的变异过程。此处的交互与维持的作用在于防止原优质阶段突变,为候补优质节点的探测提供时间保障。原优质节点能不受变异要素诱惑而发生变异情况可能最好,但就算它发生变异,该阶段也可为优质关系重组阶段提供保障;优质关系重组阶段Tr即为原优质节点的替补和优质关系恢复阶段,可以看作是优质节点探测的迭代与自修复过程。
在给出解决方案后,接下来可给出基于时间要素的优质节点探测模型如下,首先假设优质节点为Nhq,变异要素为Ve,候补节点(如图3学生集合)为Nc,时间要素集合为Tes={Ts,Ta,Tim,Tr,Td},则:
其中,Ws×a∈Ts×a表示处于Ts到Ta阶段的优质节点探测权重,该权重取自于时间要素的边界限定矩阵Ts×a;Wa×im∈Ta×im表示处于Ta到Tim阶段的优质节点探测权重,该权重取自于时间要素的边界限定矩阵Ta×im;,Wim×r∈Tim×r表示处于Tim到Tr阶段的优质节点探测权重,该权重取自于时间要素的边界限定矩阵Tim×r,和分别表示Ts到Ta、Ta到Tim和Tim到Tr三个阶段的优质节点获取函数,i,j,k分别表示获取优质节点探测函数的迭代次数,在Ta到Tim阶段存在变异要素为Ve的引入。以下为三个阶段时间要素的边界限定矩阵:
公式(2)中,以为例,上标s×a用于说明时间要素边界限定所处的时间序列阶段。下标用于说明节点y相对于节点x的优质程度。矩阵从表达意义上讲,大致可分为节点间互评和外部节点评价两大部分。此处的节点间互评正如“老师-学生”节点对中的学生集合互评,用于学生之间评优。外部节点评价正如优秀教师对优秀学生的选拔。通过两部分的综合评价,最终选定基于时间要素(s×a阶段)的优质节点探测过程。
上述矩阵(3)和(4)中权重和的上下标与(2)具有相类似的含义,但由于Ta和Tim阶段存在变异要素的引入,从而导致两个矩阵中节点间的评价所得权重必然与(2)不同。
针对基于时间要素的优质节点的评估标准往往遵照探测结果是否满足探测需求来进行制定。例如,“老师-学生”关系下的优秀学生的探测结果,如果探测模型得到的探测结果并非是一个优秀学生,那么评估标准的制定就应该进行修正。例如,可制定各不同时间要素阶段探测结果的召回率和准确率,并对准确率进行阈值设定,以决定是否要继续如图1所示的迭代运算过程。
应当理解的是,本说明书未详细阐述的部分均属于现有技术。
应当理解的是,上述针对较佳实施例的描述较为详细,并不能因此而认为是对本发明专利保护范围的限制,本领域的普通技术人员在本发明的启示下,在不脱离本发明权利要求所保护的范围情况下,还可以做出替换或变形,均落入本发明的保护范围之内,本发明的请求保护范围应以所附权利要求为准。
Claims (7)
1.一种基于时间要素的优质节点探测方法,其特征在于,包括以下步骤:
步骤1:提取需要探测的优质节点所在的社交网络节点集合;
步骤2:对社交网络节点建立社交网络的节点映射关系;
步骤3:基于时间要素,提取优质节点特征;
步骤4:建立优质节点动态探测模型;
步骤5:将社交网络节点看作实验样本进行分组,并对节点进行训练和分类;
步骤6:对时间要素的边界进行限定,获取时间限定范围内的优质节点;
步骤7:对优质节点探测的结果进行评估并反馈结果,并在反复地训练过程中将不符合探测优质节点特征的规则进行校正,以达到对模型进行优化的目的;
步骤8:回转执行步骤5,利用优化后的模型,进行优质节点探测以提高探测进度,如此进行迭代运算直到优质节点的探测进度超过时间序列的设定阈值为止,从而完成整个探测过程。
2.根据权利要求1所述的基于时间要素的优质节点探测方法,其特征在于:步骤1中所述优质节点指的是社交网络中,有能力满足特定指标所需条件的核心节点;所述特定指标记为In,为一个指标集合,它包括社交网络中为达成一定时期内的目标为各节点制定的所有预计的阶段性目标或规则。
3.根据权利要求1所述的基于时间要素的优质节点探测方法,其特征在于:步骤2中所述节点映射关系,指的是社交网络中的社交关系。
4.根据权利要求1所述的基于时间要素的优质节点探测方法,其特征在于,步骤3中所述提取优质节点特征,包括:
1:优质节点发生变异具有固定的时间节点,因此在时间节点到来之前在某个恰当时刻再次选拔出优质节点作为候补;
设置节点被选定为优质节点的时刻为ts,优质节点变异的时间节点为te,则优质节点的活动周期选择候补优质节点的恰当时刻为其中α为微调参数;
2:针对优质节点属性变异的前兆提取时间要素作为特征;
具体的前兆包括:影响优质节点属性变异的主观因素Vsf和客观因素Vof,不同类型的客观因素都会引起相应的主观因素发生变化;主观因素集合记为则联合主客观因素构建节点属性变异的前兆映射关系为:
其中,sf/of表示矩阵名称为“主客观映射”矩阵,o.sij表示每一种客观因素产生对应主观因素的可能性,取值介于0-1之间,i=1...n,j=1...m,n表示客观因素的个数,m表示主观因素的个数;取0表示客观因素对主观因素的影响程度为0,1表示客观因素对主观因素的影响程度为100%,介于0-1之间的值表示客观因素对主观因素的影响程度的百分比值;
3:确定优质节点的变异传递性和周期性;
变异传递性判断:在社交网络中,若两个节点的社交关系较密切,且二者在一定时期内同时达到优质节点的判断标准,则可认定变异的传递性成立;否则,判定为不成立;
变异周期性判断:将社交网络中的一个时间起始点tcs到终止点tce所经历的时长记为T,若该时长T内,某节点发生变异,在接下来的连续n个时长T内,n≥2,与该变异节点关系密切的节点均发生类似变异,则可认定变异周期性成立;否则,判定为不成立。
5.根据权利要求1所述的基于时间要素的优质节点探测方法,其特征在于,步骤4中所述优质节点动态探测模型为:
<mrow>
<msub>
<mi>g</mi>
<mrow>
<mi>h</mi>
<mi>q</mi>
</mrow>
</msub>
<mo>=</mo>
<msub>
<mi>W</mi>
<mrow>
<mi>s</mi>
<mo>&times;</mo>
<mi>a</mi>
</mrow>
</msub>
<msubsup>
<mi>g</mi>
<mrow>
<mo>(</mo>
<msub>
<mi>N</mi>
<mrow>
<mi>h</mi>
<mi>q</mi>
</mrow>
</msub>
<mo>)</mo>
<msubsup>
<mo>|</mo>
<msub>
<mi>T</mi>
<mi>s</mi>
</msub>
<msub>
<mi>T</mi>
<mi>a</mi>
</msub>
</msubsup>
</mrow>
<mi>i</mi>
</msubsup>
<mo>+</mo>
<msub>
<mi>W</mi>
<mrow>
<mi>a</mi>
<mo>&times;</mo>
<mi>i</mi>
<mi>m</mi>
</mrow>
</msub>
<msubsup>
<mi>g</mi>
<mrow>
<mo>(</mo>
<msub>
<mi>N</mi>
<mrow>
<mi>h</mi>
<mi>q</mi>
</mrow>
</msub>
<mo>,</mo>
<msub>
<mi>V</mi>
<mi>e</mi>
</msub>
<mo>)</mo>
<msubsup>
<mo>|</mo>
<msub>
<mi>T</mi>
<mi>a</mi>
</msub>
<msub>
<mi>T</mi>
<mrow>
<mi>i</mi>
<mi>m</mi>
</mrow>
</msub>
</msubsup>
</mrow>
<mi>j</mi>
</msubsup>
<mo>+</mo>
<msub>
<mi>W</mi>
<mrow>
<mi>i</mi>
<mi>m</mi>
<mo>&times;</mo>
<mi>r</mi>
</mrow>
</msub>
<msubsup>
<mi>g</mi>
<mrow>
<mo>(</mo>
<msub>
<mi>N</mi>
<mrow>
<mi>h</mi>
<mi>q</mi>
</mrow>
</msub>
<mo>,</mo>
<msub>
<mi>N</mi>
<mi>e</mi>
</msub>
<mo>)</mo>
<msubsup>
<mo>|</mo>
<msub>
<mi>T</mi>
<mrow>
<mi>i</mi>
<mi>m</mi>
</mrow>
</msub>
<msub>
<mi>T</mi>
<mi>r</mi>
</msub>
</msubsup>
</mrow>
<mi>k</mi>
</msubsup>
<mo>-</mo>
<mo>-</mo>
<mo>-</mo>
<mrow>
<mo>(</mo>
<mn>1</mn>
<mo>)</mo>
</mrow>
<mo>;</mo>
</mrow>
其中,优质节点为Nhq,变异要素为Ve,候补节点为Ne,时间要素集合为
Tes={Ts,Ta,Tim,Tr,Te},变异要素诱惑阶段记为Ta,优质关系交互与维持阶段记为Tim,优质关系重组阶段记为Tr,Te与Ts对应,分别表示时间轴的开始Ts和结束Te,Tr≤Te;原优质节点关系阶段Ts为时间序列的起始阶段;变异要素诱惑阶段Ta表明该阶段将有变异要素介入,所谓变异要素是任何影响和破坏优质节点,最终导致优质节点对关系被破坏的一切主客观因素;优质关系交互与维持阶段Tim,用于防止原优质阶段突变,为候补优质节点的探测提供时间保障;优质关系重组阶段Tr为原优质节点的替补和优质关系恢复阶段,是优质节点探测的迭代与自修复过程;Ws×a∈Ts×a表示处于Ts到Ta阶段的优质节点探测权重,该权重取自于时间要素的边界限定矩阵Ts×a;Wa×im∈Ta×im表示处于Ta到Tim阶段的优质节点探测权重,该权重取自于时间要素的边界限定矩阵Ta×im;Wim×r∈Tim×r表示处于Tim到Tr阶段的优质节点探测权重,该权重取自于时间要素的边界限定矩阵和分别表示Ts到Ta、Ta到Tim和Tim到Tr三个阶段的优质节点获取函数,i,j,k分别表示获取优质节点探测函数的迭代次数,在Ta到Tim阶段存在变异要素为Ve的引入;
其中,中,上标s×a用于说明时间要素边界限定所处的时间序列阶段;下标用于说明节点y相对于节点x的优质程度,其中优质程度量化为节点完成优质节点预制规则或条件的完成度,完成度记为Rcom,若完成度越高则表明节点优质程度越高;中,上标s×a用于说明时间要素边界限定所处的时间序列阶段,下标表示节点编号。
6.根据权利要求1所述的基于时间要素的优质节点探测方法,其特征在于,步骤5中所述将社交网络节点看作实验样本进行分组,并对节点进行训练和分类;
分组依据为:
(1)根据样本节点所处的时间序列阶段(Ts,Ta,Tim,Tr,Te)的不同,第一次分组首先分为5组样本;
(2)将5组样本再分解为训练集、测试集和验证集,共可得到五个不同时间序列阶段的15组样本;
训练方法为:针对分组依据中所得的5个不同阶段的训练样本分别提取优质节点特征,建立不同时间序列阶段的节点分类规则;
分类依据和方法为:基于5个不同阶段提取的分类规则,利用分组依据中得到的测试集对分类规则进行测试,测试节点分类规则的召回率、准确率指标;然后用到分组依据中得到的验证集再次进行验证实验,如此迭代实验过程,直至“时间序列阈值设定与比较”过程中的比较符合要求时,整个实验终止。
7.根据权利要求1所述的基于时间要素的优质节点探测方法,其特征在于:步骤7中所述将不符合探测优质节点特征的规则进行校正,是制定各不同时间要素阶段探测结果的召回率和准确率,并对准确率进行阈值设定。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710956412.6A CN107767280A (zh) | 2017-10-16 | 2017-10-16 | 一种基于时间要素的优质节点探测方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710956412.6A CN107767280A (zh) | 2017-10-16 | 2017-10-16 | 一种基于时间要素的优质节点探测方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN107767280A true CN107767280A (zh) | 2018-03-06 |
Family
ID=61269560
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201710956412.6A Pending CN107767280A (zh) | 2017-10-16 | 2017-10-16 | 一种基于时间要素的优质节点探测方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN107767280A (zh) |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109670635A (zh) * | 2018-12-05 | 2019-04-23 | 厦门笨鸟电子商务有限公司 | 一种社交信息最优发布时间的生成方法 |
CN111125269A (zh) * | 2019-12-31 | 2020-05-08 | 腾讯科技(深圳)有限公司 | 一种数据管理方法、血缘关系显示方法和相关装置 |
CN111159483A (zh) * | 2019-12-26 | 2020-05-15 | 华中科技大学 | 一种基于增量计算的社交网络图摘要的生成方法 |
CN112149941A (zh) * | 2019-06-28 | 2020-12-29 | 上海掌学教育科技有限公司 | 一种智能排课系统和方法 |
-
2017
- 2017-10-16 CN CN201710956412.6A patent/CN107767280A/zh active Pending
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109670635A (zh) * | 2018-12-05 | 2019-04-23 | 厦门笨鸟电子商务有限公司 | 一种社交信息最优发布时间的生成方法 |
CN112149941A (zh) * | 2019-06-28 | 2020-12-29 | 上海掌学教育科技有限公司 | 一种智能排课系统和方法 |
CN111159483A (zh) * | 2019-12-26 | 2020-05-15 | 华中科技大学 | 一种基于增量计算的社交网络图摘要的生成方法 |
CN111159483B (zh) * | 2019-12-26 | 2023-07-04 | 华中科技大学 | 一种基于张量计算的社交网络图摘要的生成方法 |
CN111125269A (zh) * | 2019-12-31 | 2020-05-08 | 腾讯科技(深圳)有限公司 | 一种数据管理方法、血缘关系显示方法和相关装置 |
CN111125269B (zh) * | 2019-12-31 | 2023-05-02 | 腾讯科技(深圳)有限公司 | 一种数据管理方法、血缘关系显示方法和相关装置 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Werner | Gaining access by doing good: The effect of sociopolitical reputation on firm participation in public policy making | |
Liu et al. | Public perceptions of environmental, social, and governance (ESG) based on social media data: Evidence from China | |
Kaplan | Research in cognition and strategy: Reflections on two decades of progress and a look to the future | |
Smaiziene et al. | Corporate reputation: Multidisciplinary richness and search for a relevant definition | |
CN107767280A (zh) | 一种基于时间要素的优质节点探测方法 | |
CN106126746A (zh) | 一种社交网络中优质节点探测方法及系统 | |
Tang et al. | Evaluation of tourism E-commerce user satisfaction | |
Liu et al. | Cloud model-based PROMETHEE method under 2D uncertain linguistic environment | |
Lekhanya et al. | Risks and factors contributing towards rural entrepreneurial orientation growth of business in an emerging economy | |
Sun et al. | Combining online news articles and web search to predict the fluctuation of real estate market in big data context | |
Kumar et al. | Banking 4.0: The era of artificial intelligence‐based fintech | |
Dinçer et al. | Selecting investment strategies for European Tourism Industry using the hybrid decision making approach based on interval type-2 fuzzy sets | |
Liu et al. | Seeking the resilience of service firms: a strategic learning process based on digital platform capability | |
Martínez-Torres et al. | Identifying the features of reputable users in eWOM communities by using Particle Swarm Optimization | |
Zhao et al. | A consensus model for large-scale multi-attribute group decision making with collaboration-reference network under uncertain linguistic environment | |
Zhang et al. | Wasserstein distance-based probabilistic linguistic TODIM method with application to the evaluation of sustainable rural tourism potential | |
Yu | Research on the evaluation algorithm of social capital influence of enterprise network marketing | |
Mulquin | Roles of IEC in supporting effective Smart City standards | |
Bégin-Caouette | The perceived impact of eight systemic factors on scientific capital accumulation | |
Li et al. | Influence of Internet-based Social Big Data on Personal Credit Reporting | |
Sokol et al. | Analytics in a big data environment | |
Jiang et al. | Applying Rough Set Theory to Evaluate Network Marketing Performance of China's Agricultural Products. | |
Fengwen et al. | Women's Financial Inclusion and Women's Financial Literacy: Bibliometric Analysis | |
Chen et al. | Development characteristics of public-private partnership projects using fuzzy approach in China during 2016–2018 | |
Niu | Sports Training Strategies Based on Data Mining Technology |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20180306 |