CN110990722A - 基于大数据挖掘的模糊共站分析算法模型及其分析系统 - Google Patents

基于大数据挖掘的模糊共站分析算法模型及其分析系统 Download PDF

Info

Publication number
CN110990722A
CN110990722A CN201911314576.4A CN201911314576A CN110990722A CN 110990722 A CN110990722 A CN 110990722A CN 201911314576 A CN201911314576 A CN 201911314576A CN 110990722 A CN110990722 A CN 110990722A
Authority
CN
China
Prior art keywords
data
station
site
time
people
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201911314576.4A
Other languages
English (en)
Other versions
CN110990722B (zh
Inventor
薛岭
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nanjing Baiyue Software Co Ltd
Original Assignee
Nanjing Baiyue Software Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nanjing Baiyue Software Co Ltd filed Critical Nanjing Baiyue Software Co Ltd
Priority to CN201911314576.4A priority Critical patent/CN110990722B/zh
Publication of CN110990722A publication Critical patent/CN110990722A/zh
Application granted granted Critical
Publication of CN110990722B publication Critical patent/CN110990722B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9536Search customisation based on social or collaborative filtering
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9537Spatial or temporal dependent retrieval, e.g. spatiotemporal queries

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明提供一种基于大数据挖掘的模糊共站分析算法模型,属于大数据挖掘技术领域。该方法包括对邻近站点的位置泛同一化;获取已知社团成员的轨迹并做预处理;根据已知社团成员的轨迹,获取可能存在共站的可能的其他人的轨迹数据,并进行相应的预处理;将社团成员和其他人的轨迹数据合并后按时间排序;定义单次两个轨迹点的共站强度;汇总共站强度,确定潜在的社团成员。本发明的有益效果是,本发明通过各个站点上传的,人进入站点监控区域的时间、站点坐标,站点名称等属性,和已知的社团成员的轨迹,寻找那些与社团成员在近似相同时间出现在近似相同地点的人。

Description

基于大数据挖掘的模糊共站分析算法模型及其分析系统
技术领域
本发明涉及大数据挖掘领域,更具体地说,是一种基于大数据挖掘的模糊共站分析算法模型及其分析系统。
背景技术
社团发现已经有很长的研究历史,并且在不同的学科有不同的形式。它与图论和计算机学科中的图分割和社会网络中的层次聚类的思想联系密切。
图分割是并行计算领域研究的重要问题。假设有n个能够通信的计算处理器(处理区并不是要与其他所有的处理器相互通信)。据此可以建立一个网络,其中节点代表处理器,节点之间的边把相互通信的两个节点链接在一起。并行计算要解决的问题是为每个节点分配数量相同的任务,并且使得节点之间的通信最少,也就是使边数数量尽可能少的问题。
分层聚类是寻找社会网络中的社团结构的一类传统算法,这种算法是社会科学家在研究社会网络时提出的发现社会网络中社团结构的方法。它是基于各个节点之间连接的相似性或者强度,把网络自然的分为若干个子群。根据向网络中新增边还是删减边,该算法又分为两类:凝聚算法(agglomerative method)和分裂算法(divisive method)。
Giran和Newman提出了一种新的基于边移除的算法称为GN算法。GN算法寻找处于社团之间的边,然后移除这些边,从而找出网络中的社团。
上述的GN算法,每移除一条边后都要重新计算边的介,这就使得此算法的复杂度较高。为此,出现了很多基于GN算法的优化。这些算法很多都是从改进边的度量以高算法的执行速度。例如Tyler算法和Radicchi算法。并且还引出了一类优化模块度Q的算法。
除了上述的算法,还有一些基于其他思想的算法。例如,在已知社团数目的前提下,Wu和Huberman提出了一种基于电阻网络电压谱的快速分割算法,这种算法不但可以发现网络中的社团,而且还能在不考虑社团结构的前提下,寻找一个节点所在的整个社团,这是很多算法无法实现的。
考虑到本场景的特殊性,在社团成员出现的分布未知,而且存在大量缺失数据,导致不同研究个体之间数据量严重失衡,并且在无法构建边的前提下,考虑模糊匹配,利用概率论中的贝叶斯和极大似然的思想,通过构建共站强度这一统计量,用以刻画与已知的社团成员之间联系紧密,暨属于同一社团的可能性。
发明内容
本发明实施例的目的在于提供一种基于大数据挖掘的模糊共站分析算法模型,旨在通过对大数据进行分析计算,找到潜在的社团成员。
为了实现上述目的,本发明的技术方案如下:
S1:邻近站点位置泛同一化;
S2:获取社团成员名单;
S3:获取社团成员的轨迹并做预处理;
S4:根据已知社团成员的轨迹,获取可能存在与之共站的其他人的轨迹数据,并进行相应的预处理;
S5:将社团成员和其他人的轨迹合并后按时间排序;
S6:定义单次共站的强度;
S7:消除数据倾斜,汇总共站强度;
S8:确定疑似社团成员,进一步核实和更新社团成员名单;
优选地,所述步骤S1中,由于站点分布具有偏向性以及数据采集机制,将站点标签数据作如下定义:以某个站点a为例,在其半径r以内的所有站点(包括a本身),记为f(a),称为a的泛同一站点。
优选地,所述步骤S3中,对每个成员的轨迹数据,去重:在指定的时间间隔interval内,如果多次出现仅有时间不同,其他属性相同的记录,则只保留该重复记录中的第一条和最后一条记录;另外,如果重复数据持续的时间超过△t,则每隔△t,保留一条就近的记录(若相等,则保留时间早的那一条记录),后面保留数据的时间依据上一条保留数据的时间。
优选地,所述步骤S4中,在S3的基础上,获取每条记录的时间和对应的地点,从所有站点采集数据中找出和社团成员的站点数据,同一站点,时间上下浮动和同一时间,地点在泛同一站点的出现的所有人员名单,找出这些人的站点采集数据,并对这些数据按照步骤S3中按同样的方式处理。
优选地,所述步骤S6中,定义单次共站的强度,这里所述共站,即如果某社团成员和其他人出现在同一地点的时间点相差越小,则共站强度越大,如果出现在同一地点的时间也完全一致,则两者之间单次共站强度为1;如果两者出现在同一地点的时间差超出指定阈值δ,则定义当前单次共站强度为0。这里所述共站,即同时出现在某处,考虑到不同时间,不同地点同时出现在某处的意义不一样,所以引入共站强度:两个人a,b分别在
Figure BDA0002325491950000041
时刻和
Figure BDA0002325491950000042
出现地点pi的泛同一站点pa,i和pb,i,则此时两人在地点pi的共站强度记为:
Figure BDA0002325491950000043
其中
Figure BDA0002325491950000044
表示a出现在pi的泛同一站点的时间,
Figure BDA0002325491950000045
表示b出现在pi的泛同一站点的时间,S(pa,i,pb,i)表示pa,i和pb,i这两点之间的距离,(如果这两点不是某个点的泛同一站点,则这两点的共站强度为0)。
优选地,所述步骤S7具体包括:消除权重的差异带来的倾斜,所谓权重的差异带来的倾斜,即如果某个人的轨迹出现多次,则更有可能会使得该他与其他人的共站强度会高,消除倾斜的方法是,共站强度求和乘以两人的站点数据量的调和平均数,再除以两人的站点数据量的和;其中乘以调和平均数的意在处理两人之间数量不等的问题,除以两人站点数据量的和则是为了统一不同共站对象之间的数据量不等的问题。
本发明同时提供一种基于大数据挖掘的模糊共站分析系统,包括社团成员名单存储模块、站点基本信息存储模块、站点采集数据存储模块、数据预处理模块、模糊共站匹配模块、共站强度计算模块、疑似社团成员存储模块;
所述确认社团成员名单存储模块,记录着已经证实的社团成员名单和相应的基本信息;
所述站点基本信息存储模块,记录着各采集站点的经纬度、站点名称等基本信息;
所述站点采集数据存储模块,保存着各个站点实时上传的采集身份的数据,一条数据包括如下属性,身份,时间,站点经纬度,一条记录意味着某人在该时刻该站点附近出现。由于站点采集装置的不同,以及不同地点空旷程度不同,甚至天气影响,不同站点的采集装置覆盖半径不同,这会导致对人行踪采集片面的问题。于是需要对站点进行同一化、对站点采集数据去重和保留关键时间点的数据来强调人的行踪,以此来提升模型的泛化能力;
所述数据预处理模块,包括两部分:(1)邻近站点位置泛同一化;以某个站点a,在其半径r以内的所有站点(包括a本身),记为f(a),称为a的泛站点;(2)站点采集数据预处理:对每个成员的轨迹数据,去重:在指定的时间间隔interval内,如果多次出现仅有时间不同,其他属性相同的记录,则只保留该重复记录中的第一条和最后一条记录;另外,如果重复数据持续的时间超过△t,则每隔△t,保留一条就近的记录(若相等,则保留时间早的那一条记录),后面保留数据的时间依据上一条保留数据的时间;
所述模糊共站匹配模块,抽取所有人的站点采集数据,对每个站点的泛站点数据按数据实际发生的时间进行排序;
所述共站强度计算模块,(1)定义单次共站强度:如果某社团成员和其他人出现在同一地点的时间点相差越小,则共站强度越大,如果出现在同一地点的时间也完全一致,则两者之间单次共站强度为1;如果两者出现在同一地点的时间差超出指定阈值δ,则定义当前单次共站强度为0。对于距离的考量同理,但是由于采集点是离散的,所以强度关于距离的函数是间断函数。(2)消除数据倾斜,汇总共站强度:由于各方面因素,不同的人的站点数据量可能相差很多,所以,应对的方案是共站强度求和乘以两人的站点数据量的调和平均数,再除以两人的站点数据量的和;其中乘以调和平均数的意在处理两人之间数量不等的问题,除以两者数据量的和则是统一不同共站对象之间的数据量不等的问题。
共站强度描述的是两个人的在相似的时间点出现在准相同的地点的可能性;对时间的处理,目前只考虑了相对时间,如果社团成员和其他人出现在同一地点的时间点相差越小,则共站强度越大,如果出现在同一地点的时间也完全一致,则两者之间单次共站强度为1;如果两者出现在同一地点的时间差超出指定阈值δ,则定义当前单次共站强度为0。对于距离的考量同理,但是由于采集点是离散的,所以强度关于距离的函数是分段函数。
附图说明
图1是本发明实施例1中方法的流程框图。
具体实施方式
下面结合实例对本发明所述的一种基于大数据挖掘的轨迹智能匹配共站分析算法模型及其分析系统作进一步说明。
以下是本发明所述的最佳实例,并不因此限定本发明的保护范围。
实施例1
图1示出了本发明所述的一种基于大数据挖掘的轨迹智能匹配共站分析算法模型,包括以下步骤:
S1:对邻近站点位置泛同一化;
S2:获取社团成员名单;
S3:获取已知社团成员的轨迹并做预处理;
对每个成员的轨迹数据,去重:在指定的时间间隔interval内,如果多次出现仅有时间不同,其他属性相同的记录,则只保留该重复记录中的第一条和最后一条记录;另外,如果重复数据持续的时间超过△t,则每隔△t,保留一条就近的记录(若相等,则保留时间早的那一条记录),后面保留数据的时间依据上一条保留数据的时间。比如,如果一个人的的站点采集数据为:
Figure BDA0002325491950000071
Figure BDA0002325491950000081
,在interval=5(min)时,则处理后的记录为:
站点名称 时间
p1 2019-4-12 19:22:52
p1 2019-4-12 19:28:31
p1 2019-4-12 19:31:19
S4:根据已知社团成员的轨迹,获取可能存在共站的可能的其他人的轨迹数据,并进行相应的预处理;
在步骤S3的处理完的数据上,获取每条记录的时间和对应的地点,从所有站点采集数据中找出和社团成员的站点数据,同一站点,时间上下浮动和同一时间,地点在泛同一站点的出现的所有人员名单,找出这些人的站点采集数据,并对这些数据步骤S3中同样的数据处理;
S5:将社团成员和其他人的轨迹数据合并后按时间排序;
S6:定义单次共站强度;
这里所述共站,即同时出现在某处,考虑到不同时间,不同地点同时出现在某处的意义不一样,所以引入共站强度:两个人a,b分别在
Figure BDA0002325491950000082
时刻和
Figure BDA0002325491950000083
出现地点pi的泛同一站点pa,i和pb,i,则此时两人在地点pi的共站强度记为:
Figure BDA0002325491950000084
其中
Figure BDA0002325491950000092
表示a出现在pi的泛同一站点的时间,
Figure BDA0002325491950000093
表示b出现在pi的泛同一站点的时间,S(pa,i,pb,i)表示pa,i和pb,i这两点之间的距离,(如果这两点不是某个点的泛同一站点,则这两点的共站强度为0);
共站强度描述的是两个人的在相似的时间点出现在准相同的地点的可能性;对时间的处理,目前只考虑了相对时间,如果社团成员和其他人出现在同一地点的时间点相差越小,则共站强度越大,如果出现在同一地点的时间也完全一致,则两者之间单次共站强度为1;如果两者出现在同一地点的时间差超出指定阈值δ,则定义当前单次共站强度为0。对于距离的考量同理,但是由于采集点是离散的,所以强度关于距离的函数是分段函数;
S7:消除数据倾斜,汇总共站强度;
消除权重的差异带来的倾斜,所谓权重的差异带来的倾斜,即如果某人的轨迹出现多次,则更有可能会使得他与其他人的共站强度会高,消除倾斜的方法是,共站强度求和乘以两人的站点数据量的调和平均数,再除以两人的站点数据量的和;其中乘以调和平均数的意在处理两人之间数量不等的问题,除以两人站点数据量的和则是统一不同共站对象之间的数据量不等的问题;
S8:确定疑似社团成员,进一步核实和更新社团成员名单。
与社团成员共站强度越高的人,越疑似社团成员。
本发明同时提供一种基于大数据挖掘的模糊共站分析系统,包括社团成员名单存储模块、站点基本信息存储模块、站点采集数据存储模块、数据预处理模块、模糊共站匹配模块、共站强度计算模块、疑似社团成员存储模块;
所述确认社团成员名单存储模块,记录着已经证实的社团成员名单和相应的基本信息;
所述站点基本信息存储模块,记录着各采集站点的经纬度、站点名称等基本信息;
所述站点采集数据存储模块,保存着各个站点实时上传的采集身份的数据,一条数据包括如下属性,身份,时间,站点经纬度,一条记录意味着某人在该时刻该站点附近出现。由于站点采集装置的不同,以及不同地点空旷程度不同,甚至天气影响,不同站点的采集装置覆盖半径不同,这会导致对人行踪采集片面的问题。于是需要对站点进行同一化、对站点采集数据去重和保留关键时间点的数据来强调人的行踪,以此来提升模型的泛化能力;
所述数据预处理模块,包括两部分:(1)邻近站点位置泛同一化;以某个站点a,在其半径r以内的所有站点(包括a本身),记为f(a),称为a的泛站点;(2)站点采集数据预处理:对每个成员的轨迹数据,去重:在指定的时间间隔interval内,如果多次出现仅有时间不同,其他属性相同的记录,则只保留该重复记录中的第一条和最后一条记录;另外,如果重复数据持续的时间超过△t,则每隔△t,保留一条就近的记录(若相等,则保留时间早的那一条记录),后面保留数据的时间依据上一条保留数据的时间;
所述模糊共站匹配模块,抽取所有人的站点采集数据,对每个站点的泛站点数据按数据实际发生的时间进行排序;
所述共站强度计算模块,(1)定义单次共站强度:如果某社团成员和其他人出现在同一地点的时间点相差越小,则共站强度越大,如果出现在同一地点的时间也完全一致,则两者之间单次共站强度为1;如果两者出现在同一地点的时间差超出指定阈值δ,则定义当前单次共站强度为0。对于距离的考量同理,但是由于采集点是离散的,所以强度关于距离的函数是间断函数。(2)消除数据倾斜,汇总共站强度:由于各方面因素,不同的人的站点数据量可能相差很多,所以,应对的方案是共站强度求和乘以两人的站点数据量的调和平均数,再除以两人的站点数据量的和;其中乘以调和平均数的意在处理两人之间数量不等的问题,除以两者数据量的和则是统一不同共站对象之间的数据量不等的问题。
以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等,均应包含在本发明的保护范围之内。

Claims (7)

1.一种基于大数据挖掘的模糊共站分析算法模型,其特征在于,包括以下步骤:
S1:邻近站点位置泛同一化;
S2:获取社团成员名单;
S3:获取社团成员的轨迹并做预处理;
S4:根据已知社团成员的轨迹,获取可能存在与之共站的其他人的轨迹数据,并进行相应的预处理;
S5:将社团成员和其他人的轨迹合并后按时间排序;
S6:定义单次共站强度;
S7:消除数据倾斜,汇总共站强度;
S8:确定疑似社团成员,进一步核实和更新社团成员名单。
2.根据权利要求1所述的基于大数据挖掘的模糊共站分析算法模型,其特征在于,所述步骤S1中,由于站点分布具有偏向性以及数据采集机制,将站点标签数据作如下定义:以某个站点a为例,在其半径r以内的所有站点(包括a本身),记为f(a),称为a的泛同一站点。
3.根据权利要求1所述的基于大数据挖掘的模糊共站分析算法模型,其特征在于,所述步骤S3中,对每个成员的轨迹数据,去重:在指定的时间间隔interval内,如果多次出现仅有时间不同,其他属性相同的记录,则只保留该重复记录中的第一条和最后一条记录;另外,如果重复数据持续的时间超过△t,则每隔△t,保留一条就近的记录(若相等,则保留时间早的那一条记录),后面保留数据的时间依据上一条保留数据的时间。
4.根据权利要求1所述的基于大数据挖掘的模糊共站分析算法模型,其特征在于,所述步骤S4中,在S3的基础上,获取每条记录的时间和对应的地点,从所有站点采集数据中找出和社团成员的站点数据,同一站点,时间上下浮动和同一时间,地点在泛同一站点的出现的所有人员名单,找出这些人的站点采集数据,并对这些数据按照步骤S3中按同样的方式处理。
5.根据权利要求1所述的基于大数据挖掘的模糊共站分析算法模型,其特征在于,所述步骤S6中,定义单次共站的强度,这里所述共站,即如果某社团成员和其他人出现在同一地点的时间点相差越小,则共站强度越大,如果出现在同一地点的时间也完全一致,则两者之间单次共站强度为1;如果两者出现在同一地点的时间差超出指定阈值δ,则定义当前单次共站强度为0。
6.根据权利要求1所述的基于大数据挖掘的模糊共站分析算法模型,其特征在于,所述步骤S7具体包括:消除权重的差异带来的倾斜,所谓权重的差异带来的倾斜,即如果某个人的轨迹出现多次,则更有可能会使得该他与其他人的共站强度会高,消除倾斜的方法是,共站强度求和乘以两人的站点数据量的调和平均数,再除以两人的站点数据量的和;其中乘以调和平均数的意在处理两人之间数量不等的问题,除以两人站点数据量的和则是为了统一不同共站对象之间的数据量不等的问题。
7.一种根据权利要求1至5任一所述的基于大数据挖掘的模糊共站分析系统,其特征在于,包括社团成员名单存储模块、站点基本信息存储模块、站点采集数据存储模块、数据预处理模块、模糊共站匹配模块、共站强度计算模块、疑似社团成员存储模块;
所述确认社团成员名单存储模块,记录着已经证实的社团成员名单和相应的基本信息;
所述站点基本信息存储模块,记录着各采集站点的经纬度、站点名称等基本信息;
所述站点采集数据存储模块,保存着各个站点实时上传的采集身份的数据,一条数据包括如下属性,身份,时间,站点经纬度,一条记录意味着某人在该时刻该站点附近出现。由于站点采集装置的不同,以及不同地点空旷程度不同,甚至天气影响,不同站点的采集装置覆盖半径不同,这会导致对人行踪采集片面的问题。于是需要对站点进行同一化、对站点采集数据去重和保留关键时间点的数据来强调人的行踪,以此来提升模型的泛化能力;
所述数据预处理模块,包括两部分:(1)邻近站点位置泛同一化;以某个站点a,在其半径r以内的所有站点(包括a本身),记为f(a),称为a的泛站点;(2)站点采集数据预处理:对每个成员的轨迹数据,去重:在指定的时间间隔interval内,如果多次出现仅有时间不同,其他属性相同的记录,则只保留该重复记录中的第一条和最后一条记录;另外,如果重复数据持续的时间超过△t,则每隔△t,保留一条就近的记录(若相等,则保留时间早的那一条记录),后面保留数据的时间依据上一条保留数据的时间;
所述模糊共站匹配模块,抽取所有人的站点采集数据,对每个站点的泛站点数据按数据实际发生的时间进行排序;
所述共站强度计算模块,(1)定义单次共站强度:如果某社团成员和其他人出现在同一地点的时间点相差越小,则共站强度越大,如果出现在同一地点的时间也完全一致,则两者之间单次共站强度为1;如果两者出现在同一地点的时间差超出指定阈值δ,则定义当前单次共站强度为0。对于距离的考量同理,但是由于采集点是离散的,所以强度关于距离的函数是间断函数。(2)消除数据倾斜,汇总共站强度:由于各方面因素,不同的人的站点数据量可能相差很多,所以,应对的方案是共站强度求和乘以两人的站点数据量的调和平均数,再除以两人的站点数据量的和;其中乘以调和平均数的意在处理两人之间数量不等的问题,除以两者数据量的和则是统一不同共站对象之间的数据量不等的问题。
CN201911314576.4A 2019-12-19 2019-12-19 基于大数据挖掘的模糊共站分析方法及其分析系统 Active CN110990722B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201911314576.4A CN110990722B (zh) 2019-12-19 2019-12-19 基于大数据挖掘的模糊共站分析方法及其分析系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201911314576.4A CN110990722B (zh) 2019-12-19 2019-12-19 基于大数据挖掘的模糊共站分析方法及其分析系统

Publications (2)

Publication Number Publication Date
CN110990722A true CN110990722A (zh) 2020-04-10
CN110990722B CN110990722B (zh) 2020-11-06

Family

ID=70095948

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201911314576.4A Active CN110990722B (zh) 2019-12-19 2019-12-19 基于大数据挖掘的模糊共站分析方法及其分析系统

Country Status (1)

Country Link
CN (1) CN110990722B (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111221879A (zh) * 2020-04-22 2020-06-02 南京柏跃软件有限公司 一种基于轨迹相似性的潜在社团成员探测方法及探测模型

Citations (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103942310A (zh) * 2014-04-18 2014-07-23 厦门雅迅网络股份有限公司 基于时空模式的用户行为相似性挖掘方法
CN105678457A (zh) * 2016-01-06 2016-06-15 成都小步创想畅联科技有限公司 基于地点挖掘的用户行为评估方法
CN105808754A (zh) * 2016-03-15 2016-07-27 苏州大学 一种从移动轨迹数据中快速发现聚集模式的方法
CN106776902A (zh) * 2016-11-30 2017-05-31 北京锐安科技有限公司 路径轨迹的分析方法及装置
US20180014161A1 (en) * 2016-06-10 2018-01-11 Apple Inc. Harvesting labels for significant locations
CN107729373A (zh) * 2017-09-12 2018-02-23 小草数语(北京)科技有限公司 运动轨迹显示方法和装置
CN108052518A (zh) * 2017-10-25 2018-05-18 小草数语(北京)科技有限公司 时空轨迹的表示方法及装置
CN108228670A (zh) * 2016-12-22 2018-06-29 航天信息股份有限公司 一种基于轨迹相似度的目标对象关系识别方法和系统
CN109800279A (zh) * 2019-01-11 2019-05-24 武汉虹旭信息技术有限责任公司 一种基于时空轨迹快速碰撞的算法
CN109977109A (zh) * 2019-04-03 2019-07-05 深圳市甲易科技有限公司 一种轨迹数据清洗方法及伴随分析方法
CN110378002A (zh) * 2019-07-11 2019-10-25 华中农业大学 基于移动轨迹的社会关系建模方法

Patent Citations (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103942310A (zh) * 2014-04-18 2014-07-23 厦门雅迅网络股份有限公司 基于时空模式的用户行为相似性挖掘方法
CN105678457A (zh) * 2016-01-06 2016-06-15 成都小步创想畅联科技有限公司 基于地点挖掘的用户行为评估方法
CN105808754A (zh) * 2016-03-15 2016-07-27 苏州大学 一种从移动轨迹数据中快速发现聚集模式的方法
US20180014161A1 (en) * 2016-06-10 2018-01-11 Apple Inc. Harvesting labels for significant locations
CN106776902A (zh) * 2016-11-30 2017-05-31 北京锐安科技有限公司 路径轨迹的分析方法及装置
CN108228670A (zh) * 2016-12-22 2018-06-29 航天信息股份有限公司 一种基于轨迹相似度的目标对象关系识别方法和系统
CN107729373A (zh) * 2017-09-12 2018-02-23 小草数语(北京)科技有限公司 运动轨迹显示方法和装置
CN108052518A (zh) * 2017-10-25 2018-05-18 小草数语(北京)科技有限公司 时空轨迹的表示方法及装置
CN109800279A (zh) * 2019-01-11 2019-05-24 武汉虹旭信息技术有限责任公司 一种基于时空轨迹快速碰撞的算法
CN109977109A (zh) * 2019-04-03 2019-07-05 深圳市甲易科技有限公司 一种轨迹数据清洗方法及伴随分析方法
CN110378002A (zh) * 2019-07-11 2019-10-25 华中农业大学 基于移动轨迹的社会关系建模方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
肖艳丽: "基于移动数据用户行为挖掘及相似性计算方法", 《中国优秀硕士学位论文全文数据库信息科技辑》 *

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111221879A (zh) * 2020-04-22 2020-06-02 南京柏跃软件有限公司 一种基于轨迹相似性的潜在社团成员探测方法及探测模型
CN111221879B (zh) * 2020-04-22 2021-01-26 南京柏跃软件有限公司 基于轨迹相似性的潜在社团成员探测方法及探测系统

Also Published As

Publication number Publication date
CN110990722B (zh) 2020-11-06

Similar Documents

Publication Publication Date Title
US7627542B2 (en) Group identification in large-scaled networks via hierarchical clustering through refraction over edges of networks
Xu et al. A supervoxel approach to the segmentation of individual trees from LiDAR point clouds
CN112258254B (zh) 基于大数据架构的互联网广告风险监测方法及系统
CN110727756A (zh) 时空轨迹数据的管理方法和装置
CN112364176A (zh) 一种人员行动轨迹的构建方法、设备及系统
CN116701979A (zh) 基于受限k-均值的社交网络数据分析方法及系统
CN110990722B (zh) 基于大数据挖掘的模糊共站分析方法及其分析系统
CN111191147B (zh) 一种基于大数据挖掘的群体发现方法及分析系统
CN116186759A (zh) 一种面向隐私计算的敏感数据识别与脱敏方法
CN114707685A (zh) 一种基于大数据建模分析的事件预测方法及装置
Kou et al. Faircrowd: Fair human face dataset sampling via batch-level crowdsourcing bias inference
CN110750730A (zh) 基于时空约束的群体检测方法和系统
Pang et al. Federated Learning for Crowd Counting in Smart Surveillance Systems
CN111652329B (zh) 一种图像分类方法、装置、存储介质和电子设备
CN111861830B (zh) 一种情报云平台
CN111061916B (zh) 一种基于多目标库图像识别的视频共享系统
CN116127337B (zh) 基于位置和图像的风险挖掘方法、装置、存储介质及设备
CN116467751A (zh) 一种带有隐私保护的关联规则学习方法
Xue et al. KMUL: a user identity linkage method across social networks based on spatiotemporal data
CN114003803A (zh) 一种社交平台上特定地域的媒体账号发现方法及系统
US11423059B2 (en) System and method for restrictive clustering of datapoints
US11436262B2 (en) System and method of creating entity records
Li et al. Enhanced semi-supervised community detection with active node and link selection
Basik Scalable Linkage across Location Enhanced Services.
Liu et al. Integration of museum user behavior information based on wireless network

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant