CN117574189B - 基于马尔科夫随机场的社交网络用户约束聚类方法及系统 - Google Patents
基于马尔科夫随机场的社交网络用户约束聚类方法及系统 Download PDFInfo
- Publication number
- CN117574189B CN117574189B CN202410059730.2A CN202410059730A CN117574189B CN 117574189 B CN117574189 B CN 117574189B CN 202410059730 A CN202410059730 A CN 202410059730A CN 117574189 B CN117574189 B CN 117574189B
- Authority
- CN
- China
- Prior art keywords
- probability
- data
- data point
- data points
- label
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 26
- 238000002372 labelling Methods 0.000 claims abstract description 10
- 238000003491 array Methods 0.000 claims description 10
- 238000004364 calculation method Methods 0.000 claims description 7
- 238000010606 normalization Methods 0.000 claims description 4
- 230000001502 supplementing effect Effects 0.000 claims 1
- 230000009471 action Effects 0.000 description 3
- 238000002474 experimental method Methods 0.000 description 3
- 238000012986 modification Methods 0.000 description 3
- 230000004048 modification Effects 0.000 description 3
- 230000008569 process Effects 0.000 description 3
- 230000006399 behavior Effects 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000007405 data analysis Methods 0.000 description 1
- 238000007418 data mining Methods 0.000 description 1
- 230000003247 decreasing effect Effects 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/23—Clustering techniques
- G06F18/232—Non-hierarchical techniques
- G06F18/2321—Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/01—Social networking
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02D—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
- Y02D10/00—Energy efficient computing, e.g. low power processors, power management or thermal management
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Theoretical Computer Science (AREA)
- Business, Economics & Management (AREA)
- General Physics & Mathematics (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Probability & Statistics with Applications (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Evolutionary Biology (AREA)
- Evolutionary Computation (AREA)
- General Engineering & Computer Science (AREA)
- Artificial Intelligence (AREA)
- Life Sciences & Earth Sciences (AREA)
- Computing Systems (AREA)
- Bioinformatics & Computational Biology (AREA)
- Health & Medical Sciences (AREA)
- Economics (AREA)
- General Health & Medical Sciences (AREA)
- Human Resources & Organizations (AREA)
- Marketing (AREA)
- Primary Health Care (AREA)
- Strategic Management (AREA)
- Tourism & Hospitality (AREA)
- General Business, Economics & Management (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明涉及数据处理领域,公开了基于马尔科夫随机场的社交网络用户约束聚类方法及系统,包括:随机选择一个数据点作为广度优先搜索的起点,将除起点外其余各数据点,属于各标签的概率初始化为1/K;对于广度优先搜索每次访问的数据点,使用其邻域内已访问的数据点来计算该数据点的属于各个标签的概率;顺序遍历所有的数据点,使用正在访问的数据点的邻域内的所有的数据点来计算该数据点概率,每轮遍历统计概率更新了的数据点的个数,若没有数据点更新概率,则迭代结束;遍历所有的标注,得到标注属于must‑link的概率。本发明使用马尔科夫随机场进行聚类,可以得到每个用户属于各个标签的概率,并且可以找出标注错误。
Description
技术领域
本发明涉及数据处理领域,具体是基于马尔科夫随机场的社交网络用户约束聚类方法及系统。
背景技术
聚类是要确定一个物体的类别,但和分类问题不同的是,这里没有事先定义好的类别,聚类算法要自己想办法把一批样本分开,分成多个类,保证每一个类中的样本之间是相似的,而不同类的样本之间是不同的。在这里,类型被称为“簇”(cluster)。而约束聚类而是在原有的聚类上加入了两种约束:must-link:必连约束,是指样本必属于同一个簇。如果2 个样本满足必连约束,那么在聚类时这 2 个样本应该被分到同一个簇中。 cannot-link:勿连约束,是指样本不必属于同一个簇。如果 2 个样本满足勿连约束,那么在聚类时这2个样本不应该被分到同一个簇中。
随着社交网络的普及,用户生成的内容呈爆炸式增长,这为数据分析和挖掘提供了丰富的资源。在社交网络中,用户的行为、兴趣、偏好等都以各种形式存在,如何有效地对这些信息进行挖掘,以便更好地理解用户群体,提升用户体验,成为了迫切需要解决的问题。
对于约束聚类问题,现有技术无法纠出存在一些标注错误的问题。因此,如何精确的标注不同的用户,并且纠正标注的错误,是当下需要解决的问题。
发明内容
本发明的目的在于克服现有技术的不足,提供基于马尔科夫随机场的社交网络用户约束聚类方法,包括如下步骤:
步骤一,根据采集的用户数据点,随机选择一个数据点作为广度优先搜索的起点,将随机选择的这个数据点随机赋给一个标签,将标签的概率赋值为1;将除起点外其余各数据点,属于各标签的概率初始化为1/K,其中K表示要划分为的簇的数量;设置visited数组并初始化为False;对于广度优先搜索每次访问的数据点,将其在visited数组中设置为True,并使用其邻域内已访问的数据点来计算该数据点的属于各个标签的概率;
步骤二,顺序遍历所有的数据点,使用正在访问的数据点的邻域内的所有的数据点来计算该数据点概率,每轮遍历统计概率更新了的数据点的个数,若没有数据点更新概率,则迭代结束,得到所有数据点属于不同标签的概率;
步骤三,遍历所有的标签,两端实例点属于同一标签的概率相乘再累加得到must-link的概率,根据标注属于must-link的概率得到标注属于cannot-link的概率,若标注属于must-link的概率大于标注属于cannot-link的概率,而标注为cannot-link,则判断标注错误;若标注属于cannot-link的概率大于标注属于must-link的概率,而标注为must-link,则判断标注错误。
进一步的,所述的对于广度优先搜索每次访问的数据点,设置visited数组并初始化为False,使用其邻域内已访问的数据点来计算该数据点的属于各个标签的概率,包括:
从广度优先搜索的起点开始访问,将正在访问的数据点在visited数组中设置为True,遍历该数据点的邻域,如果邻居数据点还未被访问,则将其放入队列中,计算该数据点属于不同标签的概率,上一个数据点计算完成后,取出队列首位的一个数据点,访问该数据点并计算该数据点属于不同标签的概率。
进一步的,所述的顺序遍历所有的数据点,使用正在访问的数据点的邻域内的所有的数据点来计算该数据点概率,每轮遍历统计概率更新了的数据点的个数,其中的概率的更新,采用信念传播算法,计算成对马尔科夫随机场的势函数:
势函数分为两个部分:距离势函数/>和约束势函数:
距离势函数:
其中dist表示需要计算势函数的两数据点之间的距离,maxdist表示数据集中最远的两个数据点之间的欧式距离,K表示要划分的簇的数量;
约束势函数为:
而总的势函数的计算如下:
势函数=约束势函数×α+距离势函数;
即:
其中α表示约束势函数相较于距离势函数需要提高的数量级;
计算完势函数,即可计算邻域的数据点传递给数据点/>的标签为m的消息:
其中表示数据点/>属于标签t,/>属于标签m间的势函数,表示/>属于标签t的概率。
计算完邻域内的所有数据点传递的消息后,接着计算归一化因子:
接着就可以计算该数据点属于某标签m的概率:
进一步的,对于邻域的计算,若约束的总数量为total_constr条,数据点的总数为total_points个,则与每个数据点相连的约束平均有2*total_constr/total_points条,先将与该数据点有约束相连的数据点算入邻域,如果没有达到根据约束的平均数量,则照距离从近到远将邻域内的数据点补充至平均数量。
进一步的,所述的根据标注属于must-link的概率得到标注属于cannot-link的概率,为:cannot-link的概率=1-must-link的概率。
基于马尔科夫随机场的社交网络用户约束聚类的系统,应用所述的基于马尔科夫随机场的社交网络用户约束聚类方法,包括:数据点采集模块、数据处理模块、输出模块;所述的数据点采集模块、数据处理模块、输出模块分别与所述的数据处理模块连接;所述的数据点采集模块用于采集不同的用户数据,得到用户数据点。
本发明的有益效果是:本发明使用马尔科夫随机场进行聚类,可以得到每个数据点属于各个标签的概率,并且可以找出标注错误。
附图说明
图1为基于马尔科夫随机场的社交网络用户约束聚类方法的流程示意图。
具体实施方式
下面结合附图进一步详细描述本发明的技术方案,但本发明的保护范围不局限于以下所述。
为了使本发明的目的,技术方案及优点更加清楚明白,结合附图及实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅用以解释本发明,并不用于限定本发明,即所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。通常在此处附图中描述和示出的本发明实施例的组件可以以各种不同的配置来布置和设计。
因此,以下对在附图中提供的本发明的实施例的详细描述并非旨在限制要求保护的本发明的范围,而是仅仅表示本发明的选定实施例。基于本发明的实施例,本领域技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例,都属于本发明保护的范围。需要说明的是,术语“第一”和“第二”等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。
而且,术语“包括”,“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程,方法,物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程,方法,物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程,方法,物品或者设备中还存在另外的相同要素。
以下结合实施例对本发明的特征和性能作进一步的详细描述。
如图1所示,基于马尔科夫随机场的社交网络用户约束聚类方法,包括如下步骤:
步骤一,根据采集的用户数据点,随机选择一个数据点作为广度优先搜索的起点,将随机选择的这个数据点随机赋给一个标签,将标签的概率赋值为1;将除起点外其余各数据点,属于各标签的概率初始化为1/K,其中K表示要划分为的簇的数量;设置visited数组并初始化为False;对于广度优先搜索每次访问的数据点,将其在visited数组中设置为True,并使用其邻域内已访问的数据点来计算该数据点的属于各个标签的概率;
步骤二,顺序遍历所有的数据点,使用正在访问的数据点的邻域内的所有的数据点来计算该数据点概率,每轮遍历统计概率更新了的数据点的个数,若没有数据点更新概率,则迭代结束,得到所有数据点属于不同标签的概率;
步骤三,遍历所有的标签,两端实例点属于同一标签的概率相乘再累加得到must-link的概率,根据标注属于must-link的概率得到标注属于cannot-link的概率,若标注属于must-link的概率大于标注属于cannot-link的概率,而标注为cannot-link,则判断标注错误;若标注属于cannot-link的概率大于标注属于must-link的概率,而标注为must-link,则判断标注错误。
所述的对于广度优先搜索每次访问的数据点,设置visited数组并初始化为False,使用其邻域内已访问的数据点来计算该数据点的属于各个标签的概率,包括:
从广度优先搜索的起点开始访问,将正在访问的数据点在visited数组中设置为True,遍历该数据点的邻域,如果邻居数据点还未被访问,则将其放入队列中,计算该数据点属于不同标签的概率,上一个数据点计算完成后,取出队列首位的一个数据点,访问该数据点并计算该数据点属于不同标签的概率。
所述的顺序遍历所有的数据点,使用正在访问的数据点的邻域内的所有的数据点来计算该数据点概率,每轮遍历统计概率更新了的数据点的个数,其中的概率的更新,采用信念传播算法,计算成对马尔科夫随机场的势函数:
势函数分为两个部分:距离势函数/>和约束势函数:
距离势函数:
其中dist表示需要计算势函数的两数据点之间的距离,maxdist表示数据集中最远的两个数据点之间的欧式距离,K表示要划分的簇的数量;
约束势函数为:
而总的势函数的计算如下:
势函数=约束势函数×α+距离势函数;
即:
其中α表示约束势函数相较于距离势函数需要提高的数量级;
计算完势函数,即可计算邻域的数据点传递给数据点/>的标签为m的消息:
其中表示数据点/>属于标签t,/>属于标签m间的势函数,表示/>属于标签t的概率。
计算完邻域内的所有数据点传递的消息后,接着计算归一化因子:
接着就可以计算该数据点属于某标签m的概率:
对于邻域的计算,若约束的总数量为total_constr条,数据点的总数为total_points个,则与每个数据点相连的约束平均有2*total_constr/total_points条,先将与该数据点有约束相连的数据点算入邻域,如果没有达到根据约束的平均数量,则照距离从近到远将邻域内的数据点补充至平均数量。
所述的根据标注属于must-link的概率得到标注属于cannot-link的概率,为:cannot-link的概率=1-must-link的概率。
基于马尔科夫随机场的社交网络用户约束聚类的系统,应用所述的基于马尔科夫随机场的社交网络用户约束聚类方法,包括:数据点采集模块、数据处理模块、输出模块;所述的数据点采集模块、数据处理模块、输出模块分别与所述的数据处理模块连接;所述的数据点采集模块用于采集不同的用户数据,得到用户数据点。
具体的,步骤一:随机选择一个数据点作为BFS的起点,将此起点随机赋给一个标签,将该标签的概率赋值为1;并将除起点外其余各数据点,属于各标签的概率初始化为1/K,设置visited数组并初始化为False。对于BFS每次访问的数据点,使用其邻域内已访问的数据点来计算该数据点的属于各个标签的概率。
其中BFS表示广度优先搜索,K表示此数据集要分的簇的数量。
步骤二:顺序遍历所有的数据点,使用其邻域内的所有的数据点来计算要访问的数据点的概率,每轮遍历统计概率更新了的数据点的个数,如果没有数据点更新概率,则迭代结束。
步骤三:遍历所有的标注,根据标注两端的数据点属于不同标签的概率,计算此标注属于must-link的概率,用1减去此概率得到cannot-link的概率,如果must-link的概率大于cannot-link的概率,而此标注为cannot-link,则认为此标注错误,cannot-link同理。
对于概率的更新,我们采用信念传播算法,计算成对马尔科夫随机场的势函数:
这里的势函数分为两个部分:距离势函数/>和约束势函数:
对于距离势函数,我们需要构建一个势函数随距离减小而增大的模型,并映射到0-1之间,即若两个数据点之间的距离越小,则这两个数据点越又可能聚到一个类中去。在实验中我们设置的是,其中dist表示两数据点之间的距离,maxdist表示数据集中最远的两个数据点之间的欧式距离。
对于约束势函数,我们同样需要设置在0-1之间的常数,来衡量must-link和cannot-link的影响,如果是must-link则接近1,如果是cannot-link,则接近为0,如果既不是must-link也不是cannot-link,则接近中间值。
在实验中我们设置的约束势函数为:
最后计算完两种势函数,我们来计算总的势函数:
势函数=约束势函数×α+距离势函数
其中α表示约束势函数相较于距离势函数需要提高的数量级。
在实验中,我们设置的是。
计算完势函数,即可计算邻域的数据点传递给数据点/>的标签为m的消息:
其中表示数据点/>属于标签t,/>属于标签m间的势函数,表示/>属于标签t的概率。
计算完邻域内的所有数据点传递的消息后,接着计算归一化因子:
接着就可以计算该数据点属于某标签m的概率:
对于邻域的计算,若约束的总数量为total_constr条,数据点的总数为total_points个,则与每个数据点相连的约束平均有2*total_constr/total_points条,先将与该数据点有约束相连的数据点算入邻域,如果没有达到根据约束的平均数量,则照距离从近到远将邻域内的数据点补充至平均数量。
以上所述仅是本发明的优选实施方式,应当理解本发明并非局限于本文所披露的形式,不应看作是对其他实施例的排除,而可用于各种其他组合、修改和环境,并能够在本文所述构想范围内,通过上述教导或相关领域的技术或知识进行改动。而本领域人员所进行的改动和变化不脱离本发明的精神和范围,则都应在本发明所附权利要求的保护范围内。
Claims (1)
1.基于马尔科夫随机场的社交网络用户约束聚类的系统,其特征在于,应用基于马尔科夫随机场的社交网络用户约束聚类方法,包括如下步骤:
步骤一,根据采集的用户数据点,随机选择一个数据点作为广度优先搜索的起点,将随机选择的这个数据点随机赋给一个标签,将标签的概率赋值为1;将除起点外其余各数据点,属于各标签的概率初始化为1/K,其中K表示要划分为的簇的数量;设置visited数组并初始化为False;对于广度优先搜索每次访问的数据点,将其在visited数组中设置为True,并使用其邻域内已访问的数据点来计算该数据点的属于各个标签的概率;其中的用户数据点为用户的行为、兴趣、偏好数据;
步骤二,顺序遍历所有的数据点,使用正在访问的数据点的邻域内的所有的数据点来计算该数据点概率,每轮遍历统计概率更新了的数据点的个数,若没有数据点更新概率,则迭代结束,得到所有数据点属于不同标签的概率;
步骤三,遍历所有的标签,两端实例点属于同一标签的概率相乘再累加得到must-link的概率,根据标注属于must-link的概率得到标注属于cannot-link的概率,若标注属于must-link的概率大于标注属于cannot-link的概率,而标注为cannot-link,则判断标注错误;若标注属于cannot-link的概率大于标注属于must-link的概率,而标注为must-link,则判断标注错误;
所述的对于广度优先搜索每次访问的数据点,设置visited数组并初始化为False,使用其邻域内已访问的数据点来计算该数据点的属于各个标签的概率,包括:
从广度优先搜索的起点开始访问,将正在访问的数据点在visited数组中设置为True,遍历该数据点的邻域,如果邻居数据点还未被访问,则将其放入队列中,计算该数据点属于不同标签的概率,上一个数据点计算完成后,取出队列首位的一个数据点,访问该数据点并计算该数据点属于不同标签的概率;
所述的顺序遍历所有的数据点,使用正在访问的数据点的邻域内的所有的数据点来计算该数据点概率,每轮遍历统计概率更新了的数据点的个数,其中的概率的更新,采用信念传播算法,计算成对马尔科夫随机场的势函数:
势函数 分为两个部分:距离势函数/>和约束势函数:
距离势函数:
其中dist表示需要计算势函数的两数据点之间的距离,maxdist表示数据集中最远的两个数据点之间的欧式距离,K表示要划分的簇的数量;
约束势函数为:
而总的势函数的计算如下:
势函数=约束势函数×α+距离势函数;
即:
其中α表示约束势函数相较于距离势函数需要提高的数量级;
计算完势函数,即可计算邻域的数据点传递给数据点/>的标签为m的消息:
其中表示数据点/>属于标签t, />属于标签m间的势函数,表示/>属于标签t的概率;
计算完邻域内的所有数据点传递的消息后,接着计算归一化因子:
接着就可以计算该数据点属于某标签m的概率:
对于邻域的计算,若约束的总数量为total_constr条,数据点的总数为total_points个,则与每个数据点相连的约束平均有2*total_constr/total_points条,先将与该数据点有约束相连的数据点算入邻域,如果没有达到根据约束的平均数量,则照距离从近到远将邻域内的数据点补充至平均数量;
所述的根据标注属于must-link的概率得到标注属于cannot-link的概率,为:cannot-link的概率=1-must-link的概率;
包括:数据点采集模块、数据处理模块、输出模块;所述的数据点采集模块、数据处理模块、输出模块分别与所述的数据处理模块连接;所述的数据点采集模块用于采集不同的用户数据,得到用户数据点。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202410059730.2A CN117574189B (zh) | 2024-01-16 | 2024-01-16 | 基于马尔科夫随机场的社交网络用户约束聚类方法及系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202410059730.2A CN117574189B (zh) | 2024-01-16 | 2024-01-16 | 基于马尔科夫随机场的社交网络用户约束聚类方法及系统 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN117574189A CN117574189A (zh) | 2024-02-20 |
CN117574189B true CN117574189B (zh) | 2024-05-03 |
Family
ID=89895937
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202410059730.2A Active CN117574189B (zh) | 2024-01-16 | 2024-01-16 | 基于马尔科夫随机场的社交网络用户约束聚类方法及系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN117574189B (zh) |
Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102169584A (zh) * | 2011-05-28 | 2011-08-31 | 西安电子科技大学 | 基于分水岭和treelet的遥感图像变化检测方法 |
CN103077404A (zh) * | 2012-12-31 | 2013-05-01 | 中国科学院自动化研究所 | 基于马尔科夫随机场的局部增量式可视化聚类方法 |
CN106228120A (zh) * | 2016-07-14 | 2016-12-14 | 南京航空航天大学 | 查询驱动的大规模人脸数据标注方法 |
CN107403438A (zh) * | 2017-08-07 | 2017-11-28 | 河海大学常州校区 | 改进模糊聚类算法的超声图像病灶区分割方法 |
CN110322067A (zh) * | 2019-07-03 | 2019-10-11 | 中山大学 | 基于因子图模型的移动用户位置预测方法 |
CN111125469A (zh) * | 2019-12-09 | 2020-05-08 | 重庆邮电大学 | 一种社交网络的用户聚类方法、装置以及计算机设备 |
CN114090778A (zh) * | 2021-11-29 | 2022-02-25 | 中国平安人寿保险股份有限公司 | 基于知识锚点的检索方法、装置、电子设备及存储介质 |
CN114240552A (zh) * | 2021-12-15 | 2022-03-25 | 平安科技(深圳)有限公司 | 基于深度聚类算法的产品推荐方法、装置、设备及介质 |
CN116701979A (zh) * | 2023-05-29 | 2023-09-05 | 齐鲁工业大学(山东省科学院) | 基于受限k-均值的社交网络数据分析方法及系统 |
-
2024
- 2024-01-16 CN CN202410059730.2A patent/CN117574189B/zh active Active
Patent Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102169584A (zh) * | 2011-05-28 | 2011-08-31 | 西安电子科技大学 | 基于分水岭和treelet的遥感图像变化检测方法 |
CN103077404A (zh) * | 2012-12-31 | 2013-05-01 | 中国科学院自动化研究所 | 基于马尔科夫随机场的局部增量式可视化聚类方法 |
CN106228120A (zh) * | 2016-07-14 | 2016-12-14 | 南京航空航天大学 | 查询驱动的大规模人脸数据标注方法 |
CN107403438A (zh) * | 2017-08-07 | 2017-11-28 | 河海大学常州校区 | 改进模糊聚类算法的超声图像病灶区分割方法 |
CN110322067A (zh) * | 2019-07-03 | 2019-10-11 | 中山大学 | 基于因子图模型的移动用户位置预测方法 |
CN111125469A (zh) * | 2019-12-09 | 2020-05-08 | 重庆邮电大学 | 一种社交网络的用户聚类方法、装置以及计算机设备 |
CN114090778A (zh) * | 2021-11-29 | 2022-02-25 | 中国平安人寿保险股份有限公司 | 基于知识锚点的检索方法、装置、电子设备及存储介质 |
CN114240552A (zh) * | 2021-12-15 | 2022-03-25 | 平安科技(深圳)有限公司 | 基于深度聚类算法的产品推荐方法、装置、设备及介质 |
CN116701979A (zh) * | 2023-05-29 | 2023-09-05 | 齐鲁工业大学(山东省科学院) | 基于受限k-均值的社交网络数据分析方法及系统 |
Non-Patent Citations (2)
Title |
---|
条件随机场模型约束下的遥感影像模糊C-均值聚类算法;王少宇;焦洪赞;钟燕飞;;测绘学报;20161215(第12期);全文 * |
空间约束FCM与MRF结合的侧扫声呐图像分割算法;霍冠英;刘静;李庆武;周亮基;;仪器仪表学报;20170115(第01期);全文 * |
Also Published As
Publication number | Publication date |
---|---|
CN117574189A (zh) | 2024-02-20 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Yuan et al. | Measuring similarity of mobile phone user trajectories–a Spatio-temporal Edit Distance method | |
US9852212B2 (en) | Dynamic clustering for streaming data | |
US10382556B2 (en) | Iterative learning for reliable sensor sourcing systems | |
CN106919957B (zh) | 处理数据的方法及装置 | |
CN113918733B (zh) | 一种获取目标知识图谱的数据处理系统 | |
CN108882172A (zh) | 一种基于hmm模型的室内移动轨迹数据的预测方法 | |
Belcastro et al. | Automatic detection of user trajectories from social media posts | |
Xu et al. | Map matching based on conditional random fields and route preference mining for uncertain trajectories | |
Cordonnier et al. | Extrapolating paths with graph neural networks | |
Zhao et al. | Annotating points of interest with geo-tagged tweets | |
CN111414357A (zh) | 地址数据处理方法、装置、系统和存储介质 | |
CN109919198A (zh) | 一种重启式随机游走的新型网络嵌入学习方法 | |
CN111460044B (zh) | 地理位置数据处理方法及装置 | |
Miao et al. | Reliable community search on uncertain graphs | |
CN117574189B (zh) | 基于马尔科夫随机场的社交网络用户约束聚类方法及系统 | |
CN109271491B (zh) | 基于非结构化文本信息的云服务推荐方法 | |
Lyu et al. | Movement-aware map construction | |
Wehrhahn et al. | A Bayesian approach to disease clustering using restricted Chinese restaurant processes | |
Rathore | Big data cluster analysis and its applications. | |
Wang et al. | Reinforcement learning enhanced weighted sampling for accurate subgraph counting on fully dynamic graph streams | |
Stahl et al. | A frequent pattern conjunction Heuristic for rule generation in data streams | |
CN109086373B (zh) | 一种构建公平的链接预测评估系统的方法 | |
Yu et al. | An iterative framework with active learning to match segments in road networks | |
Kakar et al. | A review of critical research areas under information diffusion in social networks | |
CN118569177B (zh) | 基于dbscan聚类算法的fpga布局拥挤预估方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |