CN113032949B - 一种基于大数据的测试方法 - Google Patents

一种基于大数据的测试方法 Download PDF

Info

Publication number
CN113032949B
CN113032949B CN202011259574.2A CN202011259574A CN113032949B CN 113032949 B CN113032949 B CN 113032949B CN 202011259574 A CN202011259574 A CN 202011259574A CN 113032949 B CN113032949 B CN 113032949B
Authority
CN
China
Prior art keywords
track
abnormal
behavior
personnel
time
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202011259574.2A
Other languages
English (en)
Other versions
CN113032949A (zh
Inventor
孟艳
静国玥
朴希望
张妍
王冠群
罗芬
荣志国
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shanghai Software Testing Ct Co ltd
Original Assignee
Shanghai Software Testing Ct Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shanghai Software Testing Ct Co ltd filed Critical Shanghai Software Testing Ct Co ltd
Priority to CN202011259574.2A priority Critical patent/CN113032949B/zh
Publication of CN113032949A publication Critical patent/CN113032949A/zh
Application granted granted Critical
Publication of CN113032949B publication Critical patent/CN113032949B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F30/00Computer-aided design [CAD]
    • G06F30/20Design optimisation, verification or simulation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/21Design, administration or maintenance of databases
    • G06F16/211Schema design and management
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2458Special types of queries, e.g. statistical queries, fuzzy queries or distributed queries
    • G06F16/2462Approximate or statistical queries
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2458Special types of queries, e.g. statistical queries, fuzzy queries or distributed queries
    • G06F16/2465Query processing support for facilitating data mining operations in structured databases
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/28Databases characterised by their database models, e.g. relational or object models
    • G06F16/283Multi-dimensional databases or data warehouses, e.g. MOLAP or ROLAP
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/28Databases characterised by their database models, e.g. relational or object models
    • G06F16/284Relational databases
    • G06F16/285Clustering or classification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N7/00Computing arrangements based on specific mathematical models
    • G06N7/02Computing arrangements based on specific mathematical models using fuzzy logic

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Databases & Information Systems (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Software Systems (AREA)
  • Probability & Statistics with Applications (AREA)
  • Fuzzy Systems (AREA)
  • Mathematical Physics (AREA)
  • Evolutionary Computation (AREA)
  • Computational Linguistics (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • Algebra (AREA)
  • Mathematical Analysis (AREA)
  • General Health & Medical Sciences (AREA)
  • Pure & Applied Mathematics (AREA)
  • Health & Medical Sciences (AREA)
  • Computational Mathematics (AREA)
  • Mathematical Optimization (AREA)
  • Biomedical Technology (AREA)
  • Computer Hardware Design (AREA)
  • Geometry (AREA)
  • Automation & Control Theory (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明公开了一种基于大数据的测试方法,所述方法包括如下步骤:S1:建立大数据知识库;S2:大数据预处理,根据数据建立模型;S3:根据模型类型,进行特征提取,提取代表性特征数据;S4:根据提取的代表性特征数据,与知识库进行匹配,并基于模糊综合评价法建立计算模型,进行测试。

Description

一种基于大数据的测试方法
技术领域
本发明涉及电学技术领域,具体涉及一种基于大数据的测试方法。
背景技术
“大数据”正是新形势下技术融合型发展和应用智能化理念的集中体现,具有应对数据体量巨大、数据类型繁多、价值密度低和处理速度快等数据特征的技术架构,及以行业内外高附加值的内容增值服务为目标的应用模式,其核心就是信息资源的开发利用。
本申请依据大数据资源,通过建模等方法步骤,建立一种测试人员轨迹的方法。
发明内容
针对上述现有技术中的不足,本申请的目的是提供一种基于大数据的测试方法及其系统和应用,实时、有效地实现人员异常轨迹识别与预警,模型的召回率能达到90%,为社区治安管理部分的人员管控工作提供技术支持。
一种基于大数据的测试方法,所述方法包括如下步骤:
S1:建立大数据知识库;
S2:大数据预处理,根据数据建立模型;
S3:根据模型类型,进行特征提取,提取代表性特征数据;
S4:根据提取的代表性特征数据,与知识库进行匹配,并基于模糊综合评价法建立计算模型,进行测试。
所述步骤具体为:
步骤S1、建立了人员异常轨迹模式知识库;
步骤S2、通过对人员的实时定位信息进行标定和序列化建模,构建动态行为链;
步骤S3、提供多种行为模式判别模型,基于人员的动态行为链,识别包括昼伏夜出、频繁活动、同类聚集在内的多种行为模式;
步骤S4、将人员的风险特征、行为模式与知识库进行匹配,并基于模糊综合评价法建立轨迹异常性计算模型,计算人员的轨迹异常程度。
步骤S1中所述人员异常轨迹模式知识库构建了人员在社区范围内的各类异常轨迹模式,包括人员静态属性、场所类别、时间背景、行为模式四个维度在内的属性信息,通过不同维度的特征的组合,形成了异常轨迹模式。
步骤S2中所述实时定位信息标定和序列化建模,首先利用ST-DBSCAN聚类算法和观测点法将实时、连续的定位信息反向地理编码,转换为地址或地名描述,然后按照时间先后顺序建立人员的动态行为链,行为链的属性包括人员名称、地点名称、地点类型、轨迹开始时间、轨迹结束时间、同行人员、伴随物品、交通工具在内的信息。
步骤S3中的所述行为模式判别模型提供多种异常行为模式识别方法,所述异常行为模式识别方法包括基于地理位置的判别方法、基于长期轨迹记录进行统计分析的方法,所述异常行为识别模式方法能够识别“进出某场所”、“频繁进出”、“长时间未出”、“长时间未归”在内的行为模式;同时也提供基于轨迹大数据挖掘的方法。
所述基于轨迹大数据挖掘的方法为利用协同过滤算法识别“同类聚集”以及“灰色人群”与人员相似的轨迹模式。
步骤S4中的所述轨迹异常性计算模型以模糊综合评价模型为主体,在结合人员风险特征与行为模式匹配的基础上,将人员的静态威胁性、社会背景时期的政治敏感性也作为轨迹异常性的评价指标,计算得出综合轨迹异常性,预警的召回率达到90%。
一种基于大数据的测试方法的系统,所述系统包括四个模块,即人员异常轨迹模式知识库模块,动态轨迹标定与序列化建模模块,行为模式识别模块和轨迹异常性计算模型模块;其中,所述人员异常轨迹模式知识库模块,用于构建人员在社区范围内的各类异常轨迹模式,包括人员静态属性、场所类别、时间背景、行为模式四个维度的属性信息;所述动态轨迹标定与序列化建模模块的用于将实时、连续的定位信息反向地理编码,转换为地址或地名描述,并基于此建立动态行为链;所述行为模式识别模块首先识别人员的行为模式,然后结合人员的静态属性、活动发生的场所、行为模式等信息,在人员异常轨迹模式知识库中进行匹配,最后通过模糊综合评价法得到对应的风险值,对超过风险阈值的轨迹进行预警;所述轨迹异常性计算模型模块,首先利用模糊综合评价法确定各类型人员与各种异常轨迹模式搭配下的轨迹异常程度,然后结合人员的静态属性和背景时期等信息,对异常轨迹分析模型的七种特征变量进行标准化,建立异常轨迹分析模型。
所述的一种基于大数据的测试方法的系统应用,所述动态轨迹标定与序列化建模模块连接与行为模式识别模块和轨迹异常性计算模型模块连接,所述轨迹异常性计算模型模块与所述人员异常轨迹模式知识库模块连接,当所述轨迹异常性计算模块中得出的结果,与所述人员异常轨迹模式知识库模块进行匹配。本发明首先建立了人员异常轨迹模式知识库,其次利用动态轨迹标定模块对人员的实时定位信息进行轨迹标定,并建立动态行为链,然后基于动态行为链挖掘人员的行为模式,并将人员的风险特征、行为模式在知识库中进行匹配,最后基于模糊综合评价法计算人员动态轨迹的综合异常性,实现对异常轨迹进行识别与预警。
步骤S1、建立了人员异常轨迹模式知识库
人员异常轨迹模式知识库构建了人员在社区范围内的各类异常轨迹模式,如表1所示,包括人员静态属性、场所类别、时间背景、行为模式四个维度的属性信息。各个维度的属性信息具体为:
(1)人员的静态属性:人员的类型,例如A类型人员、B类型人员、C类型人员、D类型人员、E类型人员、F类型人员和G类型人员,人员的性别,人员与场所之间所属关系等。
(2)场所类别:居民区,学校,经营场所,娱乐场所,车站及交通枢纽,加油站,政府机关,企事业机关,公园绿地等。
(3)时间背景:普通时期,节假日,政治敏感时期等。
(4)行为模式:入访、离开、昼伏夜出、频繁出入、同类人员聚集、访客频繁、单独活动、多日未归、多日未出、出行距离过长、长时间不移动等。
Figure GDA0003080779980000051
步骤S2、通过对人员的实时定位信息进行标定和序列化建模,构建动态行为链;
动态轨迹标定与序列化建模模块的主要功能是,将实时、连续的定位信息反向地理编码,转换为地址或地名描述,并基于此建立动态行为链,具体地:
(1)动态轨迹标定,本发明提供两种轨迹标定方法,第一种是利用ST-DBSCAN算法对实时、连续的“北斗”定位信息或GPS定位信息进行聚类与降维,ST-DBSCAN算法同时考虑了轨迹点的时间和空间上的间隔,从而避免错误地将空间相邻而时间间隔很大的GPS轨迹点聚类为同一类,表2为ST-DBSCAN算法的计算过程。
表2ST-DBSCAN算法计算过程
Figure GDA0003080779980000061
第二种是基于观测点对动态轨迹进行标定,其基本思路为:在重要的地点、路线、区域等,设置若干观测点,当高危人员进入或离开观测点的观测区域时,便生成一条轨迹标定记录。每个观测点拥有“名称”、“经度”、“纬度”、“类型”、“覆盖范围半径。观测点分为:封闭式场所出入口、重要的路口、经营场所、娱乐场所、公园绿地、企事业单位、政府机关、学校、加油站九种类型。其中根据经纬度计算两点之间的距离方法如公式1所示:
d=6.371*106*arcos[cosy1*cosy2*cos(x1-x2)+siny1*siny2] (1)
其中d为两点之间的距离,单位为米,(x1,y1)为GPS轨迹点的经纬度坐标,(x2,y2)为观测点的经纬度坐标。
(2)动态轨迹序列化建模,由于不同种类的轨迹数据的格式和所包含的信息存在差异,因此需要对多源异构的轨迹数据进行融合,并形成统一的、序列化的轨迹数据。根据动态轨迹标定结果将高危人员一个周期的轨迹划分为若干个子行为,然后以人员身份为索引,将子行为按时间顺序排列,构建“动态行为链”,以便于基于“行为链”进行异常轨迹分析和识别。子行为的属性如表2所示,包括高危人员名称,子行为的开始时间、结束时间、维持时间,访问的地点名称及类型,同行人员,伴随物品和出行方式等九种属性。其中地点类型有居民区、学校、经营场所等九种属性;同行人员根据人数划分为四个等级,分别为单人、小规模同行(2-5人)、中规模聚集(6-20人)和大规模聚集(20人以上)。将每个子行为按照时间串联,形成行为链如式(2),(3)所示。
behavior=(time_start,time_stop,time_hold,place_name,
place_type,accompany,concomitant,transportation) (2)
behavior_chain={name:[behavior1,behavior2,...,behaviorn]} (3)
其中behaviori表示高危人员的子行为,behavior-chain表示给高危人员的行为链。
表3动态行为链属性表
Figure GDA0003080779980000071
Figure GDA0003080779980000081
步骤S3、提供多种行为模式判别模型,基于人员的动态行为链,识别昼伏夜出、频繁活动、同类聚集等多种行为模式;
异常轨迹判别模块首先识别人员的行为模式,然后结合人员的静态属性、活动发生的场所、行为模式等信息,在人员异常轨迹模式知识库中进行匹配,最后通过模糊综合评价法得到对应的风险值,对超过风险阈值的轨迹进行预警。
具体地:
(1)行为模式识别:人员的行为模式可分为简单行为模式(出现、经过、离开)和复杂行为模式(频繁出入、同类聚集、昼伏夜出),简单的行为模式可直接通过轨迹标定结果得到,而识别复杂的行为模式则需要通过综合分析该人员以及其他人员在一段时期内的轨迹记录。本发明提供的基于地理位置的判别方法、基于长期轨迹记录进行统计分析的方法,能够有效地识别“进出某场所”、“频繁进出”、“长时间未出”、“长时间未归”等行为模式;同时也提供基于轨迹大数据挖掘的方法,例如利用协同过滤算法识别“同类聚集”以及“灰色人群”与人员相似的轨迹模式。
(2)异常轨迹模式知识库匹配:在异常轨迹模式知识库中,只有特定类型的人员匹配特定的行为模式时,其轨迹才会被系统判定为异常。例如人员类型为“异常上访人员”,且系统检测到其行为模式为“同类聚集”,则该人员的身份类型与行为模式形成了匹配,系统判定其轨迹为异常。若同一名人员具有多种人员特征[p1,p2],且人员特征[p1,p2]同时能与行为模式b形成匹配,则该人员的异常轨迹模式匹配结果为[p1b,p2b]。
步骤S4、将人员的风险特征、行为模式与知识库进行匹配,并基于模糊综合评价法建立轨迹异常性计算模型,计算人员的轨迹异常程度。
计算动态轨迹风险,首先利用模糊综合评价法确定各类型人员与各种异常轨迹模式搭配下的轨迹异常程度,然后结合人员的静态属性和背景时期等信息,对异常轨迹分析模型的7种特征变量进行标准化,并根据上文中各个影响因素的权重,建立异常轨迹分析模型定义为:
Y=attractionT·risk_source·(w1*time)·(w2*frequency)·
(w3*age+w4*sex+w5*insider+ξ) (4)
其中Y指的是异常轨迹分析模型计算的异常性得分,其高低程度代表人员的异常程度,(attraction,risk_source,time,frequency,age,sex,insider)分别为如表3所示的风险源吸引力、风险源特征、入访的时间、入访频率、年龄、性别、空间归属关系,{w1,w2,……,w5}分别对应为入访时间、入访频率、年龄、性别和空间所属关系5种变量的权重,ξ代表残差项。将所得Y进行归一化,公式为:
Figure GDA0003080779980000101
其中是归一化后的异常性得分,是原始的异常性得分,分别是异常性得分的最大值和最小值。根据的数值分布的80%和95%的异常性范围作为分级的标准,划定入访人员的行为异常性等级,如表3所示:0-0.5代表该人员的行为异常程度较低,0.5-0.8代表该人员的行为异常程度较高,0.8-1.0代表该人员的行为异常程度非常高。
表4轨迹异常性等级表
Figure GDA0003080779980000102
附图说明
图1是基于观测点方法对动态轨迹进行标定的计算流程图;
图2是基于大数据的测试系统整体工作流程示意图;
图3a-图3c是Geolife数据集中三名人员动态轨迹的人员空间分布图;其中,图3a是人员a的动态轨迹可视化结果,图3b是人员b的动态轨迹可视化结果,图3c是人员c的动态轨迹可视化结果;
图4a-图4c是基于ST-DBSCAN聚类算法的动态轨迹标定结果;其中,图4a是人员a的驻留点提取结果,图4b是人员b的驻留点提取结果,图4c人员c的驻留点提取结果;
图5为高危人员b入访清华大学的异常轨迹分析结果;
图6a-图6d是高危人员b入访清华大学、北京大学、北京体育大学和北京航空航天大学的异常轨迹分析结果;其中,图6a是入访清华大学,图6b是入访北京大学,图6c是入访北京体育大学,图6d是入访北京航空航天大学。
具体实施方式
实施例1
如图1本发明基于大数据的测试系统工作流程示意图所示。本发明基于人员实时的定位信息,对其进行轨迹标定与序列化建模,构建动态行为链,然后识别人员的行为模式,并利用人员的静态属性信息与行为模式,在异常行为模式知识库中进行匹配,若匹配成功,则结合异常行为模式风险大小、人员的背景信息、背景时期风险,计算综合风险的大小并进行预警。
1.实例数据准备
本文利用Geolife动态轨迹数据集中的部分人员的GPS轨迹进行实例研究。表5为Geolife的数据属性表。本文从Geolife动态轨迹数据集中选取3名人员进行试验,三名人员在原数据集中的编号分别为36、96、101,别分表示为人员a、人员b、人员c,其动态轨迹空间分布如图3所示。选取该三名人员的原因是:他们的日常活动区域都集中在北京市某个大学城区域内,且除了经常活动的区域外,同时存在一些较为异常的动态轨迹,满足试验的要求。
表5Geolife数据集属性表
Figure GDA0003080779980000121
表6ST-DBSCAN聚类算法最优参数
Figure GDA0003080779980000122
2.动态轨迹标定与序列化建模
本文使用了基于聚类算法和基于观测点的两种方法对三名人员的动态轨迹进行标定。其中基于聚类算法的标定结果如图4所示,每个子图中x,y轴分别为经度和纬度,z轴为时间,每个点代表聚类所得的驻留点。
表7人员b的动态行为链片段
Figure GDA0003080779980000131
然而当高危人员长时间在某个空间范围内徘徊或逗留时,会产生较多冗余的驻留点,为了进一步降低动态轨迹的数据维度,本文在第一次聚类结果的基础上对提取到的驻留点进行二次聚类,在第二次聚类过程中,满足聚类时空阈值的相邻驻留点,被聚类成为同一类,并用同一种颜色标记,经过调参得到了如表6所示在此场景下最优的聚类参数。
本文基于动态轨迹标定结果,对高危人员的动态轨迹进行序列化建模,构建了高危人员的行为链。人员b在2008年10月3日的动态行为链如表7所示:b于早上从QH出发,途经若干交通路口和场所,最后与晚上回到QH,人员b的行为链在时空上形成了闭环。表7展示了人员b一天的行为链,附图6展示了人员b多天的行为异常性分析结果。
3.行为模式挖掘与轨迹异常性计算
以高危人员b为例,其入访QH的异常轨迹分析结果如图3所示,附图5代表五种特征信息的风险值(入访场所与风险源特征匹配情况风险值、空间所属关系风险值、高危人员性别风险值,入访时间风险值、入访频次风险值)随入访次数的变化情况,附图6a-附图6d代表每次入访行为的异常性分值随入访次数的变化情况。
各项特征信息中,性别、年龄是高危人员的静态属性决定的,不会随着入访行为发生变化。空间所属关系、入访场所与风险源特征匹配情况的风险值由高危人员与入访空间共同决定,若高危人员与入访的地点存在居住关系或工作关系等,空间所属关系风险值较小,若二者是外来访客关系,则空间关系风险值较大。人员b风险源特征为Risk_source=[0,1,0,0,0,0],入访场所对风险源的吸引力为Attraction=[0,1,1,1,0,1],进行矩阵点积运算:attractionT·risk_source,其结果表示高危人员与入访空间的空间匹配情况,此处高危人员b入访QH的行为在空间上存在盗窃风险(“1”表示存在、“0”表示不存在)。入访时间风险值和入访频次风险值是动态变化的,不同的时间入访同一个地点具有不同的风险值,在n为20,50,70,85附近均存在时间异常“波峰”(如子图3所示),而行为异常性得分仅在n为20,50附近存在异常的“波峰”(如子图6所示),且前者的异常性得分比后者更高,是因为随着入访频次的增高,入访行为的频次异常性会先增高然后衰减,当入访频次特别高时,即使时间异常值较高,轨迹总体的异常值仍然很低。
同时本文也利用异常轨迹分析模型对高危人员4入访其他地点的轨迹进行了分析,所得结果如图6a-图6d所示,子图a-d分别为人员b入访QH(作为对照)、BJ、BT和BH时,轨迹异常性得分以观察到,第12次入访BT和第12-14次入访值随入访的次数的变化情况。在子图b,c,d中可BT和第12-14次入访BD时,存在两个明显的轨迹异常性波峰,且分值超过0.8,根据轨迹异常程度划分标准,其异常程度属于“高”,应当对人员的行为进行干预。
在该实施例中,对高危人员的异常轨迹漏识率平均值低于10%(异常行为漏识率=1–成功识别的异常轨迹/异常轨迹总和),异常行为误判率低于20%(异常行为误判率=无效预警次数/预警总次数)。

Claims (4)

1.一种基于大数据的测试方法,其特征在于,步骤具体为:
步骤S1、建立了人员异常轨迹模式知识库;
步骤S2、通过对人员的实时定位信息进行标定和序列化建模,构建动态行为链;
步骤S3、提供多种行为模式判别模型,基于人员的动态行为链,识别包括昼伏夜出、频繁活动、同类聚集在内的多种行为模式;步骤S3中的所述行为模式判别模型提供多种异常行为模式识别方法,所述异常行为模式识别方法包括基于地理位置的判别方法、基于长期轨迹记录进行统计分析的方法,所述异常行为模式识别方法能够识别“进出某场所”、“频繁进出”、“长时间未出”、“长时间未归”在内的行为模式;同时也提供基于轨迹大数据挖掘的方法;
步骤S4、将人员的风险特征、行为模式与知识库进行匹配,并基于模糊综合评价法建立轨迹异常性计算模型,计算人员的轨迹异常程度;步骤S4中的所述轨迹异常性计算模型以模糊综合评价模型为主体,在结合人员风险特征与行为模式匹配的基础上,将人员的静态威胁性、社会背景时期的政治敏感性也作为轨迹异常性的评价指标,计算得出综合轨迹异常性,预警的召回率达到90%;
计算动态轨迹风险,首先利用模糊综合评价法确定各类型人员与各种异常轨迹模式搭配下的轨迹异常程度,然后结合人员的静态属性和背景时期信息,对异常轨迹分析模型的7种特征变量进行标准化,并根据上文中各个影响因素的权重,建立异常轨迹分析模型定义为:
Y=attractionT·risk_source·(w1*time)·(w2*frequency)·(w3*age+w4*sex+w5*insider+ξ)
其中Y指的是异常轨迹分析模型计算的异常性得分,其高低程度代表人员的异常程度,(attraction,risk_source,time,frequency,age,sex,insider)分别为风险源吸引力、风险源特征、入访的时间、入访频率、年龄、性别、空间归属关系,{w1,w2,……,w5}分别对应为入访时间、入访频率、年龄、性别和空间所属关系5种变量的权重,ξ代表残差项;将所得Y进行归一化,公式为:
Figure FDA0003467148120000021
其中Y′是归一化后的异常性得分,Y是原始的异常性得分,Ymax和Ymin分别是异常性得分的最大值和最小值;根据数值分布的80%和95%的异常性范围作为分级的标准,划定入访人员的行为异常性等级。
2.根据权利要求1所述的一种基于大数据的测试方法,其特征在于:步骤S1中所述人员异常轨迹模式知识库构建了人员在社区范围内的各类异常轨迹模式,包括人员静态属性、场所类别、时间背景、行为模式四个维度在内的属性信息,通过不同维度的特征的组合,形成了异常轨迹模式。
3.根据权利要求1所述的一种基于大数据的测试方法,其特征在于:步骤S2中所述实时定位信息标定和序列化建模,首先利用ST-DBSCAN聚类算法和观测点法将实时、连续的定位信息反向地理编码,转换为地址或地名描述,然后按照时间先后顺序建立人员的动态行为链,行为链的属性包括人员名称、地点名称、地点类型、轨迹开始时间、轨迹结束时间、同行人员、伴随物品、交通工具在内的信息。
4.根据权利要求1所述的一种基于大数据的测试方法,其特征在于:所述基于轨迹大数据挖掘的方法为利用协同过滤算法识别“同类聚集”以及“灰色人群”与人员相似的轨迹模式。
CN202011259574.2A 2020-11-11 2020-11-11 一种基于大数据的测试方法 Active CN113032949B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202011259574.2A CN113032949B (zh) 2020-11-11 2020-11-11 一种基于大数据的测试方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202011259574.2A CN113032949B (zh) 2020-11-11 2020-11-11 一种基于大数据的测试方法

Publications (2)

Publication Number Publication Date
CN113032949A CN113032949A (zh) 2021-06-25
CN113032949B true CN113032949B (zh) 2022-02-18

Family

ID=76459010

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202011259574.2A Active CN113032949B (zh) 2020-11-11 2020-11-11 一种基于大数据的测试方法

Country Status (1)

Country Link
CN (1) CN113032949B (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115576850B (zh) * 2022-11-21 2023-03-14 舟谱数据技术南京有限公司 数据指标测试方法、装置、电子设备及存储介质

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106846801A (zh) * 2017-02-06 2017-06-13 安徽新华博信息技术股份有限公司 一种基于车辆轨迹的区域徘徊异常行为检测方法
CN109993181A (zh) * 2017-12-29 2019-07-09 中国移动通信集团山西有限公司 异常行为模式识别方法、装置、设备及介质
CN111639497A (zh) * 2020-05-27 2020-09-08 北京东方通科技股份有限公司 一种基于大数据机器学习的异常行为发现方法
CN111783295A (zh) * 2020-06-28 2020-10-16 中国人民公安大学 城市社区特定人行为链动态识别与预测评估方法及系统

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109657547B (zh) * 2018-11-13 2020-07-07 成都四方伟业软件股份有限公司 一种基于伴随模型的异常轨迹分析方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106846801A (zh) * 2017-02-06 2017-06-13 安徽新华博信息技术股份有限公司 一种基于车辆轨迹的区域徘徊异常行为检测方法
CN109993181A (zh) * 2017-12-29 2019-07-09 中国移动通信集团山西有限公司 异常行为模式识别方法、装置、设备及介质
CN111639497A (zh) * 2020-05-27 2020-09-08 北京东方通科技股份有限公司 一种基于大数据机器学习的异常行为发现方法
CN111783295A (zh) * 2020-06-28 2020-10-16 中国人民公安大学 城市社区特定人行为链动态识别与预测评估方法及系统

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
Spatio-temporal Anomaly Detection in Traffic Data;Qing Wang 等;《Proceedings of the 2nd International Symposium》;20181231;第1-5页 *
基于轨迹分析的异常行为识别与管控研究;王晓龙 等;《信息安全与通信保密》;20150310(第3期);第76-80页 *
异常轨迹数据预警与预测关键技术综述;仇功达 等;《系统仿真学报》;20171108;第29卷(第11期);第2608-2617页 *

Also Published As

Publication number Publication date
CN113032949A (zh) 2021-06-25

Similar Documents

Publication Publication Date Title
Ma et al. Analyzing driving factors of land values in urban scale based on big data and non-linear machine learning techniques
Dwyer et al. Quantifying social vulnerability: a methodology for identifying those at risk to natural hazards
Kim Exploring the difference between ridership patterns of subway and taxi: Case study in Seoul
Zhou et al. A data-driven method for trip ends identification using large-scale smartphone-based GPS tracking data
CN110109908B (zh) 基于社会基础信息挖掘人物潜在关系的分析系统及方法
CN111783295B (zh) 城市社区特定人行为链动态识别与预测评估方法及系统
CN113344408B (zh) 民航交通管制运行多尺度态势感知流程的处理方法
CN112633779B (zh) 一种对环境监测数据可信度进行评估的方法
CN113032949B (zh) 一种基于大数据的测试方法
Wang et al. Study on the location of private clinics based on k-means clustering method and an integrated evaluation model
CN114511432A (zh) 一种基于区块链的数字乡村管理服务系统
Caceres et al. Supervised land use inference from mobility patterns
CN115660296B (zh) 一种基于机器学习的不合规项目建议方案自动出具方法
Qiu et al. Classifying urban fabrics into mobile call activity with supervised machine learning
CN115510056A (zh) 一种利用手机信令数据进行宏观经济分析的数据处理系统
CN114666738A (zh) 基于手机信令的国土空间规划方法和系统
CN114169901A (zh) 一种基于行为序列分类的医保异常检测方法及系统
CN112885482A (zh) 一种用于学生返校的疫情预防方法
Yang et al. Design and Application of Big Data Technology Management for the Analysis System of High Speed Railway Operation Safety Rules
Jiang et al. Multi-Criterion Spatial Optimization of Future Police Stations Based on Urban Expansion and Criminal Behavior Characteristics
Laadan et al. Using data mining for infrastructure and safety violations discovery in cities
Little et al. Discovery of burglary hotspots and extraction of their features
Yang et al. Information Fusion and Construction of Evidence Collection
Gunda Network-wide traffic congestion visual analytics: A case study for Brisbane Bluetooth MAC scanner data
Azizi et al. Smart Disaster Management Solutions for Risk Mitigation and Preparedness in Tehran, Iran

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant