CN117539963B - 一种社交网络数据动态分析方法及系统 - Google Patents
一种社交网络数据动态分析方法及系统 Download PDFInfo
- Publication number
- CN117539963B CN117539963B CN202410032828.9A CN202410032828A CN117539963B CN 117539963 B CN117539963 B CN 117539963B CN 202410032828 A CN202410032828 A CN 202410032828A CN 117539963 B CN117539963 B CN 117539963B
- Authority
- CN
- China
- Prior art keywords
- social network
- network data
- prediction model
- data prediction
- preliminary
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000004458 analytical method Methods 0.000 title claims abstract description 26
- 238000012549 training Methods 0.000 claims abstract description 41
- 238000012545 processing Methods 0.000 claims abstract description 27
- 230000006399 behavior Effects 0.000 claims abstract description 25
- 238000000034 method Methods 0.000 claims abstract description 25
- 238000007781 pre-processing Methods 0.000 claims abstract description 10
- 230000008451 emotion Effects 0.000 claims description 8
- 238000004140 cleaning Methods 0.000 claims description 7
- 238000010276 construction Methods 0.000 claims description 7
- 238000005516 engineering process Methods 0.000 claims description 7
- 238000003058 natural language processing Methods 0.000 claims description 6
- 230000007246 mechanism Effects 0.000 claims description 3
- 230000006855 networking Effects 0.000 claims description 2
- 238000010801 machine learning Methods 0.000 abstract description 4
- 238000004364 calculation method Methods 0.000 abstract description 2
- 230000008569 process Effects 0.000 description 7
- 239000011159 matrix material Substances 0.000 description 5
- 238000007405 data analysis Methods 0.000 description 4
- 238000005457 optimization Methods 0.000 description 4
- 238000012544 monitoring process Methods 0.000 description 3
- 230000004913 activation Effects 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 230000006870 function Effects 0.000 description 2
- 230000007935 neutral effect Effects 0.000 description 2
- 238000003860 storage Methods 0.000 description 2
- 206010028347 Muscle twitching Diseases 0.000 description 1
- 230000002776 aggregation Effects 0.000 description 1
- 238000004220 aggregation Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000008901 benefit Effects 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 230000036461 convulsion Effects 0.000 description 1
- 230000010485 coping Effects 0.000 description 1
- 238000000354 decomposition reaction Methods 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 230000002996 emotional effect Effects 0.000 description 1
- 230000006397 emotional response Effects 0.000 description 1
- 230000003203 everyday effect Effects 0.000 description 1
- 238000009472 formulation Methods 0.000 description 1
- 230000014509 gene expression Effects 0.000 description 1
- 238000005304 joining Methods 0.000 description 1
- 239000000203 mixture Substances 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000003012 network analysis Methods 0.000 description 1
- 238000003672 processing method Methods 0.000 description 1
- 238000010223 real-time analysis Methods 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 239000013598 vector Substances 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/27—Replication, distribution or synchronisation of data between databases or within a distributed database system; Distributed database system architectures therefor
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/24—Querying
- G06F16/245—Query processing
- G06F16/2458—Special types of queries, e.g. statistical queries, fuzzy queries or distributed queries
- G06F16/2465—Query processing support for facilitating data mining operations in structured databases
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/0499—Feedforward networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02D—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
- Y02D10/00—Energy efficient computing, e.g. low power processors, power management or thermal management
Abstract
本发明公开了一种社交网络数据动态分析方法及系统,涉及高性能计算与机器学习技术领域。该方法包括步骤:获取社交网络数据,将社交网络数据进行数据预处理,并转换成统一的文本格式,得到训练样本;搭建分布式计算环境;利用线贯序极限学习机构建初步社交网络数据预测模型,利用训练样本对初步社交网络数据预测模型进行训练,得到训练好的社交网络数据预测模型;利用社交网络数据预测模型在分布式计算环境中对社交网络数据进行行为模式预测,并根据预测结果反馈实时动态调整社交网络数据预测模型。本发明能够克服现有技术在处理大规模社交网络数据时的效率低下和扩展性差的局限性。
Description
技术领域
本发明涉及高性能计算与机器学习技术领域,尤其涉及一种社交网络数据动态分析方法及系统。
背景技术
在当今的数据科学领域,特别是在社交网络分析方面,分布式优化技术已成为处理大规模数据集的关键工具。随着社交媒体平台的普及和用户数据量的飞速增长,传统的中心化处理方法已经难以应对如此庞大且不断增长的数据需求。分布式计算通过在多节点上并行处理数据,有效提高了数据处理的速度和效率,解决了大规模数据集处理的瓶颈问题。然而,分布式计算环境中的数据一致性、节点间通信效率、以及数据安全和隐私保护等问题,仍然是该技术领域面临的主要挑战。与此同时,线贯序极限学习机(FOS-ELM)技术作为一种高效的机器学习方法,在处理复杂数据集,尤其是社交网络数据方面展现出巨大潜力。FOS-ELM以其高速的学习能力和对新数据的及时适应能力而著称,能够有效处理非线性、高维度和复杂结构的数据。但在实际应用中,FOS-ELM在泛化能力和算法稳定性方面仍存在局限,这成为该技术领域的研究热点。尤其是在信息传播、用户行为分析、社区发现等方面,对于算法的设计和优化,以及算法在分布式环境中的应用效率和稳定性,都提出了新的要求。
因此,面对社交网络数据的日益增长和复杂化,如何有效地结合分布式计算的高效处理能力和FOS-ELM的快速学习特性,以实现更高效和准确的数据分析,已成为数据科学领域的一大挑战。
发明内容
针对现有技术存在的不足,本发明的目的是提供一种社交网络数据动态分析方法及系统,利用分布式计算的高效并行处理能力和FOS-ELM的快速学习特性,提高社交网络数据分析的速度和准确性,从而克服现有技术在处理大规模社交网络数据时的效率低下和扩展性差的局限性。
为了实现上述目的,本发明是通过如下的技术方案来实现:
本发明第一方面提供了一种社交网络数据动态分析方法,包括以下步骤:
获取社交网络数据,将社交网络数据进行数据预处理,并转换成统一的文本格式,得到训练样本;
搭建分布式计算环境;
利用线贯序极限学习机构建初步社交网络数据预测模型,利用训练样本对初步社交网络数据预测模型进行训练,得到训练好的社交网络数据预测模型;
利用社交网络数据预测模型在分布式计算环境中对社交网络数据进行行为模式预测,并根据预测结果反馈实时动态调整社交网络数据预测模型。
进一步的,将社交网络数据进行数据预处理的具体步骤为:
应用自然语言处理技术对社交网络数据进行数据清洗,清洗方式包括去除停用词、进行词性标注和情感分析。
进一步的,搭建分布式计算环境的具体步骤为:
在云平台上部署分布式计算环境,配置多个虚拟机实例以处理庞大的数据集;
安装和配置高效的分布式数据处理框架。
进一步的,为了适应分布式计算环境,利用线贯序极限学习机分布式构建初步社交网络数据预测模型,使用多个社交网络数据预测模型协同工作,预测值是所有模型输出的平均值。
进一步的,初步社交网络数据预测模型包括输入层、隐藏层和输出层,在隐藏层中引入遗忘因子。
进一步的,利用训练样本对初步社交网络数据预测模型进行训练的具体步骤为:
在无初始样本的情况下,通过引入遗忘因子来初始化初步社交网络数据预测模型;
利用训练样本和社交网络结构特征对初步社交网络数据预测模型进行训练,得到训练好的社交网络数据预测模型。
更进一步的,社交网络数据预测模型用于分析社交网络中的数据流动路径,并预测用户未来的行为模式。
本发明第二方面提供了一种社交网络数据动态分析系统,包括:
数据获取模块,被配置为获取社交网络数据,将社交网络数据进行数据预处理,并转换成统一的文本格式,得到训练样本;
环境搭建模块,被配置为搭建分布式计算环境;
模型构建模块,被配置为利用线贯序极限学习机构建初步社交网络数据预测模型,利用训练样本对初步社交网络数据预测模型进行训练,得到训练好的社交网络数据预测模型;
行为预测模块,被配置为利用社交网络数据预测模型在分布式计算环境中对社交网络数据进行行为模式预测,并根据预测结果反馈实时动态调整社交网络数据预测模型。
以上一个或多个技术方案存在以下有益效果:
本发明公开了一种社交网络数据动态分析方法及系统,专注于分布式优化技术和在线贯序极限学习机在大规模社交网络数据分析中的应用。具体而言,本发明通过分布式计算框架,提高社交网络数据处理的效率和可扩展性,克服了传统串行算法在处理海量数据时的局限性。在此基础上,本发明利用FOS-ELM技术,对复杂的社交网络数据进行高效的学习和分析,以实现对社交网络中的信息流动模式、用户行为和社区结构的快速识别和预测。
本发明不仅有效地提高了处理大规模社交网络数据的效率和准确性,还优化了算法在不同计算环境下的性能和稳定性。通过分布式计算的并行处理能力,本发明显著提升了数据处理速度,同时降低了内存和存储的压力。利用FOS-ELM的快速学习特性和对新数据的及时适应能力,本发明能够更准确地处理和分析社交网络中的动态变化。
本发明附加方面的优点将在下面的描述中部分给出,部分将从下面的描述中变得明显,或通过本发明的实践了解到。
附图说明
构成本发明的一部分的说明书附图用来提供对本发明的进一步理解,本发明的示意性实施例及其说明用于解释本发明,并不构成对本发明的不当限定。
图1为本发明中ELM模型结构示意图;
图2为本发明实施例一中FOS-ELM 分布式模型结构示意图。
具体实施方式
应该指出,以下详细说明都是示例性的,旨在对本发明提供进一步的说明。除非另有指明,本文使用的所有技术和科学术语具有与本发明所属技术领域的普通技术人员通常理解的相同含义。
需要注意的是,这里所使用的术语仅是为了描述具体实施方式,而非意图限制根据本发明的示例性实施方式。如在这里所使用的,除非上下文另外明确指出,否则单数形式也意图包括复数形式,此外,还应当理解的是,当在本说明书中使用术语“包含”和/或“包括”时,其指明存在特征、步骤、操作、器件、组件和/或它们的组合;
ELM和OS-ELM的基本内容:
首先,ELM模型如图1所示,表示为:。
其中,i和j表示第i和第j个节点;L表示模型在隐藏层共有L个节点;K为常数,表示j可选择的范围,β是隐藏层和输出层之间连接的权重,G是隐藏层的激活函数,a和b是输入层和隐藏层之间链接的权重和偏差。式子可简化为:。
。
其中,矩阵H称为“隐层输出矩阵”,而学习过程H和Y是已知的,那么β可以直接计算为: 。
其中H†是矩阵H的伪逆,使用奇异值分解来计算H†。
OS-ELM基于ELM,能够从新到达的数据中持续学习,而不会丢失过去学习的数据。将递归最小二乘法应用于ELM,可以让它每次从一个或分块的新数据中学习。OS-ELM有两个工作阶段:初始化阶段和顺序学习阶段。
在初始化阶段,利用初始样本创建隐层输出矩阵并计算/>,其中和ELM方法相同。设置变量c作为输入数据的序号。顺序学习阶段,当第/>个数据到达时,创建新的隐藏层输出矩阵/>,并计算新的输出权重:。
其中,。/>是从/>得到的结果,所以OS-ELM可以从新到达的样本中增量学习,而不会忘记过去的样本。
实施例一:
本发明实施例一提供了一种社交网络数据动态分析方法,以新浪微博的用户行为预测为例进行说明,本实施例中,所有获取的数据均为公开数据,且预测过程得到用户许可,本发明仅对数据流向和用户对特定事件的反应或参与特定讨论的可能性进行概率分析,并不涉及侵犯用户隐私的行为。
该方法具体包括以下步骤:
步骤1:获取社交网络数据,将社交网络数据进行数据预处理,并转换成统一的文本格式,得到训练样本。
步骤2:搭建分布式计算环境。
步骤3:利用线贯序极限学习机构建初步社交网络数据预测模型,利用训练样本对初步社交网络数据预测模型进行训练,得到训练好的社交网络数据预测模型。
步骤4:利用社交网络数据预测模型在分布式计算环境中对社交网络数据进行行为模式预测,并根据预测结果反馈实时动态调整社交网络数据预测模型。
步骤1中,将社交网络数据进行数据预处理的具体步骤为:
首先从社交网络平台,如新浪微博,收集用户的推文、转推、点赞和评论数据,以及用户的关注列表和粉丝列表。应用自然语言处理技术对社交网络数据进行数据清洗,清洗方式包括去除停用词、进行词性标注和情感分析,将文本数据转换为适合机器学习的格式,例如词向量或TF-IDF表示。
本实施例中,词性标注和情感分析的处理方式相近,步骤均为先清洗数据,移除无关内容,并将文本拆分为单独的词或符号。然后使用自然语言处理库(NLP)和情感分析库(textblob)等,将每个词根据上下文赋予词性(动词、名词、形容词等)和文本的情感倾向(积极、中性、消极等)。
步骤2中,搭建分布式计算环境的具体步骤为:
(1)在云平台上部署分布式计算环境,配置多个虚拟机实例以处理庞大的数据集。
(2)安装和配置高效的分布式数据处理框架,如Apache Spark或Hadoop,以提高数据处理的速度和效率。
步骤3中,初步社交网络数据预测模型包括输入层、隐藏层和输出层,在隐藏层中引入遗忘因子。具体的,利用训练样本对初步社交网络数据预测模型进行训练的具体步骤为:
(1)在无初始样本的情况下,通过引入遗忘因子来初始化初步社交网络数据预测模型。
在一种具体的实施方式中,在是奇异值时,OS-ELM无法应用。为了防止这种奇异值的问题,OS-ELM要求初始训练样本的数量大于隐含层的节点数量。另一种预防奇点的方法是增加一些小值/>到/>。在不需要初始样本的情况下,带遗忘因子的在线贯序极限学习机以/>来启动,所以FOS-ELM系统可以在不需要初始样本的情况下进行训练。
上述FOS-ELM系统构建过程如下:
1.选取性能指标。本实施例选择均方误差(MSE)作为性能指标, MSE越小,模型性能越好。首先在初始训练数据上计算MSE,设定为基准MSE,例如,基准MSE = 0.05。每次模型更新后,使用新数据计算当前MSE。如果当前MSE高于基准MSE(模型性能下降),降低遗忘因子;如果当前MSE等于或低于基准MSE(性能提升或稳定),维持或轻微增加遗忘因子。
2.调整公式。本实施例使用公式:新遗忘因子 = 旧遗忘因子(1 - 调整系数) 来降低遗忘因子,其中调整系数是基于性能差异的一个比例。
示例:
假设初始遗忘因子为 0.5,调整系数设置为 0.1(10%)。模型在新数据上的性能下降。
假设新数据上的MSE = 0.06(高于基准MSE)。调整遗忘因子:新遗忘因子 = 0.5(1 - 0.1) = 0.45。模型在新数据上的性能稳定。
假设新数据上的MSE = 0.05(等于基准MSE)。保持遗忘因子不变或轻微增加:新遗忘因子 = 0.5 或轻微增加。
调整公式过程中,通过设置遗忘因子的上下限,例如,0.1 至 0.9,以避免极端调整,并根据应用场景确定调整频率,例如,每处理1000个新样本或每天进行一次调整。
优化过程包括:
a)设置社交网络数据预测模型参数,包括训练集为系统24小时前的数值,目标值为系统下小时的数值,模型输出设置为系统的预测值,并设置学习次数。
b)接受训练集数据,利用FOS-ELM计算系统的预测值。
c)等待系统下小时的数值。
d)计算平均绝对百分比误差:
。
e)根据设置的学习次数进行增量学习,根据新数据调整和更新模型的权重,并利用遗忘因子逐渐减少对旧数据的依赖,直到学习结束。
此外,为了提高预测的精度和适应分布式计算环境,还采用FOS-ELM分布式建模,如图2所示,利用线贯序极限学习机分布式构建初步社交网络数据预测模型,使用多个社交网络数据预测模型协同工作,预测值是所有模型输出的平均值。
本实施例中,使用10个FOS-ELM模型协同工作,其中预测值是所有模型输出的平均值。FOS-ELM的结构为输入层24个节点,以sigmoid为激活函数的隐含层50个节点,输出层1个节点。在获取社交网络的信息后,将信息分类并作为输入值在FOS-ELM中使用。且由于FOS-ELM的主要特点是引入了遗忘因子。这意味着它能够在学习新数据的同时逐渐“遗忘”旧数据,从而更有效地适应数据流的变化。
这种方法的核心在于有效地解决了在处理庞大的社交网络数据时遇到的效率低下和可扩展性差的问题。通过利用分布式计算的强大并行处理能力,本方法显著提高了数据处理速度,同时借助FOS-ELM的快速学习特性,进一步提升了数据分析的准确性。随着新数据的到来,FOS-ELM能够更灵活地调整其学习重点,确保模型始终反映最新的数据特征。
(2)利用训练样本和社交网络结构特征对初步社交网络数据预测模型进行训练,得到训练好的社交网络数据预测模型。其中,社交网络结构特征包括节点和边,网络密度,集聚系数,度中心性等属性特征,为社交网络已知信息。
(3)社交网络数据预测模型用于分析社交网络中的数据流动路径,并预测用户未来的行为模式。
本实施例中,分析社交网络中的数据流动路径包括识别推动信息传播的关键用户或帖子。
预测用户未来的行为模式包括基于用户的历史数据,预测其未来的行为模式,如对特定事件的反应或参与特定讨论的可能性。
在一种具体的实施方式中,行为模式包括:
话题参与:根据用户在类似话题上的过去参与情况和表现的兴趣,预测用户加入特定话题讨论或社群的可能性。
购买行为:根据用户对相关或类似产品的历史购买记录和反馈,预测用户对特定产品的购买意愿。
舆情反应:根据用户对类似事件的历史情感表达,预测用户对特定事件或信息的情感反应,如积极、消极或中性。
上述预测行为均采用用户公开数据,且预测过程均获得用户同意。
之后,利用分析和预测得到的批处理或实时数据流对FOS-ELM模型进行训练,不断更新模型中隐藏层的权重和输出层β值。
步骤4中,持续监控FOS-ELM模型的性能,根据预测结果与实际情况的对比来调整模型参数和计算资源。并且定期使用新收集的数据重新训练模型,确保模型能够适应社交网络的动态变化。
本发明通过结合大数据处理能力和FOS-ELM模型的快速学习特性,有效传统方法的效率问题。这种方法有望显著提升推荐服务的准确性和个性化水平,从而改善社交网络用户的体验。
在应用领域方面,这项发明具有广泛的用途。它可以应用于社交媒体趋势的分析,帮助快速识别和分析流行的趋势和模式;在用户行为预测上,根据用户的历史行为数据预测其未来行为;在网络营销中,通过分析用户群体和趋势来优化市场策略;在舆情监控方面,实时监控和分析公众的舆论和情绪变化;在个性化推荐系统上,根据用户的社交媒体活动提供定制化的内容和推荐;以及在网络安全领域中,监测和预防社交网络中的欺诈和恶意行为。关于其效果,这项技术的主要优势在于提高了处理大规模社交网络数据的效率,减少了对计算资源的需求,同时确保了分析的准确性。此外,其实时分析的能力使得可以即时处理新到达的数据,并提供及时的分析结果,极大地提高了模型的适应性和时效性。本发明的应用能够帮助研究者和实践者更好地理解和利用社交网络数据,为社会科学、市场营销、公共政策制定等领域提供有力的数据支持。
实施例二:
本发明实施例二提供了一种社交网络数据动态分析系统,包括:
数据获取模块,被配置为获取社交网络数据,将社交网络数据进行数据预处理,并转换成统一的文本格式,得到训练样本;
环境搭建模块,被配置为搭建分布式计算环境;
模型构建模块,被配置为利用线贯序极限学习机构建初步社交网络数据预测模型,利用训练样本对初步社交网络数据预测模型进行训练,得到训练好的社交网络数据预测模型;
行为预测模块,被配置为利用社交网络数据预测模型在分布式计算环境中对社交网络数据进行行为模式预测,并根据预测结果反馈实时动态调整社交网络数据预测模型。
数据获取模块,还被配置为:
应用自然语言处理技术对社交网络数据进行数据清洗,清洗方式包括去除停用词、进行词性标注和情感分析。
环境搭建模块,还被配置为在云平台上部署分布式计算环境,配置多个虚拟机实例以处理庞大的数据集;安装和配置高效的分布式数据处理框架。
模型构建模块中,为了适应分布式计算环境,利用线贯序极限学习机分布式构建初步社交网络数据预测模型,使用多个社交网络数据预测模型协同工作,预测值是所有模型输出的平均值。
本实施例中,初步社交网络数据预测模型包括输入层、隐藏层和输出层,在隐藏层中引入遗忘因子。
社交网络数据预测模型用于分析社交网络中的数据流动路径,并预测用户未来的行为模式。
模型构建模块还包还被配置为:
在无初始样本的情况下,通过引入遗忘因子来初始化初步社交网络数据预测模型;
利用训练样本和社交网络结构特征对初步社交网络数据预测模型进行训练,得到训练好的社交网络数据预测模型。
本领域技术人员应该明白,上述本发明的各模块或各步骤可以用通用的计算机装置来实现,可选地,它们可以用计算装置可执行的程序代码来实现,从而,可以将它们存储在存储装置中由计算装置来执行,或者将它们分别制作成各个集成电路模块,或者将它们中的多个模块或步骤制作成单个集成电路模块来实现。本发明不限制于任何特定的硬件和软件的结合。
上述虽然结合附图对本发明的具体实施方式进行了描述,但并非对本发明保护范围的限制,所属领域技术人员应该明白,在本发明的技术方案的基础上,本领域技术人员不需要付出创造性劳动即可做出的各种修改或变形仍在本发明的保护范围以内。
Claims (6)
1.一种社交网络数据动态分析方法,其特征在于,包括以下步骤:
获取社交网络数据,将社交网络数据进行数据预处理,并转换成统一的文本格式,得到训练样本;
搭建分布式计算环境;
利用线贯序极限学习机构建初步社交网络数据预测模型,利用训练样本对初步社交网络数据预测模型进行训练,得到训练好的社交网络数据预测模型;其中,所述初步社交网络数据预测模型包括输入层、隐藏层和输出层,在隐藏层中引入遗忘因子;
所述利用训练样本对初步社交网络数据预测模型进行训练的具体步骤为:
在无初始样本的情况下,通过引入遗忘因子来初始化初步社交网络数据预测模型;
利用训练样本和社交网络结构特征对初步社交网络数据预测模型进行训练,得到训练好的社交网络数据预测模型;
利用社交网络数据预测模型在分布式计算环境中对社交网络数据进行行为模式预测,并根据预测结果反馈实时动态调整社交网络数据预测模型。
2.如权利要求1所述的社交网络数据动态分析方法,其特征在于,将社交网络数据进行数据预处理的具体步骤为:
应用自然语言处理技术对社交网络数据进行数据清洗,清洗方式包括去除停用词、进行词性标注和情感分析。
3.如权利要求1所述的社交网络数据动态分析方法,其特征在于,搭建分布式计算环境的具体步骤为:
在云平台上部署分布式计算环境,配置多个虚拟机实例以处理庞大的数据集;
安装和配置高效的分布式数据处理框架。
4.如权利要求1所述的社交网络数据动态分析方法,其特征在于,为了适应分布式计算环境,利用线贯序极限学习机分布式构建初步社交网络数据预测模型,使用多个社交网络数据预测模型协同工作,预测值是所有模型输出的平均值。
5.如权利要求1所述的社交网络数据动态分析方法,其特征在于,社交网络数据预测模型用于分析社交网络中的数据流动路径,并预测用户未来的行为模式。
6.一种社交网络数据动态分析系统,其特征在于,包括:
数据获取模块,被配置为获取社交网络数据,将社交网络数据进行数据预处理,并转换成统一的文本格式,得到训练样本;
环境搭建模块,被配置为搭建分布式计算环境;
模型构建模块,被配置为利用线贯序极限学习机构建初步社交网络数据预测模型,利用训练样本对初步社交网络数据预测模型进行训练,得到训练好的社交网络数据预测模型;其中,所述初步社交网络数据预测模型包括输入层、隐藏层和输出层,在隐藏层中引入遗忘因子;
所述利用训练样本对初步社交网络数据预测模型进行训练的具体步骤为:
在无初始样本的情况下,通过引入遗忘因子来初始化初步社交网络数据预测模型;
利用训练样本和社交网络结构特征对初步社交网络数据预测模型进行训练,得到训练好的社交网络数据预测模型;
行为预测模块,被配置为利用社交网络数据预测模型在分布式计算环境中对社交网络数据进行行为模式预测,并根据预测结果反馈实时动态调整社交网络数据预测模型。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202410032828.9A CN117539963B (zh) | 2024-01-10 | 2024-01-10 | 一种社交网络数据动态分析方法及系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202410032828.9A CN117539963B (zh) | 2024-01-10 | 2024-01-10 | 一种社交网络数据动态分析方法及系统 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN117539963A CN117539963A (zh) | 2024-02-09 |
CN117539963B true CN117539963B (zh) | 2024-04-05 |
Family
ID=89792386
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202410032828.9A Active CN117539963B (zh) | 2024-01-10 | 2024-01-10 | 一种社交网络数据动态分析方法及系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN117539963B (zh) |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104915537A (zh) * | 2015-04-08 | 2015-09-16 | 郑州航空工业管理学院 | 基于神经网络的行为预测方法 |
CN106651016A (zh) * | 2016-12-13 | 2017-05-10 | 重庆邮电大学 | 一种热点话题下动态预测用户行为的系统及方法 |
CN111241421A (zh) * | 2020-01-14 | 2020-06-05 | 西安电子科技大学 | 基于社交上下文信息的用户转发行为预测方法 |
US11195107B1 (en) * | 2017-09-13 | 2021-12-07 | Hrl Laboratories, Llc | Method of malicious social activity prediction using spatial-temporal social network data |
CN113901298A (zh) * | 2021-10-29 | 2022-01-07 | 杭州师范大学钱江学院 | 一种基于微博文本嵌入学习的社交网络转发行为预测方法 |
CN117114912A (zh) * | 2023-08-02 | 2023-11-24 | 淮阴工学院 | 一种新型智能社交状态诊断系统 |
Family Cites Families (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20130173485A1 (en) * | 2011-12-29 | 2013-07-04 | Telefonica, S.A. | Computer-implemented method to characterise social influence and predict behaviour of a user |
US20150309962A1 (en) * | 2014-04-25 | 2015-10-29 | Xerox Corporation | Method and apparatus for modeling a population to predict individual behavior using location data from social network messages |
-
2024
- 2024-01-10 CN CN202410032828.9A patent/CN117539963B/zh active Active
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104915537A (zh) * | 2015-04-08 | 2015-09-16 | 郑州航空工业管理学院 | 基于神经网络的行为预测方法 |
CN106651016A (zh) * | 2016-12-13 | 2017-05-10 | 重庆邮电大学 | 一种热点话题下动态预测用户行为的系统及方法 |
US11195107B1 (en) * | 2017-09-13 | 2021-12-07 | Hrl Laboratories, Llc | Method of malicious social activity prediction using spatial-temporal social network data |
CN111241421A (zh) * | 2020-01-14 | 2020-06-05 | 西安电子科技大学 | 基于社交上下文信息的用户转发行为预测方法 |
CN113901298A (zh) * | 2021-10-29 | 2022-01-07 | 杭州师范大学钱江学院 | 一种基于微博文本嵌入学习的社交网络转发行为预测方法 |
CN117114912A (zh) * | 2023-08-02 | 2023-11-24 | 淮阴工学院 | 一种新型智能社交状态诊断系统 |
Non-Patent Citations (4)
Title |
---|
"ediction system for dynamic transmission line load capacity based on PCA and online sequential extreme learning machine";Jun Lin 等;《2018 IEEE International Conference on Industrial Technology (ICIT)》;20180222;1714-1717 * |
基于并行决策树的微博互动数预测;黄林昊;郭昆;;福建工程学院学报;20170625(第03期);93-99 * |
移动社交网络信息传播研究述评与展望;张鹏;赵动员;梅蕾;;情报科学;20200201(第02期);172-178 * |
网络舆情传播与演变背景下的微博信息转发预测分析;郭淼;焦垣生;;情报杂志;20160518(第05期);41+50-55 * |
Also Published As
Publication number | Publication date |
---|---|
CN117539963A (zh) | 2024-02-09 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Castiglione et al. | Exploiting mean field analysis to model performances of big data architectures | |
Gao et al. | A cross-domain recommendation model for cyber-physical systems | |
CN109063939B (zh) | 一种基于邻域门长短期记忆网络的风速预测方法及系统 | |
CN110336700B (zh) | 一种基于时间及用户的转发序列的微博流行度预测方法 | |
CN111461286B (zh) | 基于进化神经网络的Spark参数自动优化系统和方法 | |
CN111813958A (zh) | 基于创新创业平台的智慧服务方法与系统 | |
CN110489749B (zh) | 一种智能办公自动化系统的业务流程优化方法 | |
CN109816144B (zh) | 分布式内存并行计算优化深度信念网络的短期负荷预测方法 | |
Jin et al. | Boosting edge intelligence with collaborative cross-edge analytics | |
Song et al. | Mixed H 2/H∞ distributed robust model predictive control for polytopic uncertain systems subject to actuator saturation and missing measurements | |
CN110807508B (zh) | 计及复杂气象影响的母线峰值负荷预测方法 | |
Gao et al. | A deep learning framework with spatial-temporal attention mechanism for cellular traffic prediction | |
CN117539963B (zh) | 一种社交网络数据动态分析方法及系统 | |
CN110020214B (zh) | 一种融合知识的社交网络流式事件检测系统 | |
Li et al. | A priori data-driven multi-clustered reservoir generation algorithm for echo state network | |
CN116308854A (zh) | 一种基于概率扩散的信息级联流行度预测方法及系统 | |
CN114374708B (zh) | 一种基于协同过滤和mqtt的智能工厂数据自动订阅方法 | |
Tan et al. | A method towards Web service combination for cross-organisational business process using QoS and cluster | |
CN114662658A (zh) | 一种基于lstm神经网络的片上光网络热点预测方法 | |
Zhen et al. | Improved Hybrid Collaborative Fitering Algorithm Based on Spark Platform | |
Hung et al. | Reflecting on two decades of services computing | |
Larrakoetxea et al. | Efficient machine learning on edge computing through data compression techniques | |
Zhao et al. | Combining influence and sensitivity to factorize matrix for multi-context recommendation | |
Lin et al. | Thinking and methodology of multi-objective optimization | |
CN117648174B (zh) | 基于人工智能的云计算异构任务调度和容器管理方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |