CN107133646B - 一种通过人员行为轨迹识别重点人员的方法及系统 - Google Patents
一种通过人员行为轨迹识别重点人员的方法及系统 Download PDFInfo
- Publication number
- CN107133646B CN107133646B CN201710305675.0A CN201710305675A CN107133646B CN 107133646 B CN107133646 B CN 107133646B CN 201710305675 A CN201710305675 A CN 201710305675A CN 107133646 B CN107133646 B CN 107133646B
- Authority
- CN
- China
- Prior art keywords
- personnel
- emphasis
- trace information
- probability
- hashtable
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
- G06F18/2155—Generating training patterns; Bootstrap methods, e.g. bagging or boosting characterised by the incorporation of unlabelled data, e.g. multiple instance learning [MIL], semi-supervised techniques using expectation-maximisation [EM] or naïve labelling
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/211—Selection of the most significant subset of features
Landscapes
- Engineering & Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Theoretical Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Artificial Intelligence (AREA)
- Evolutionary Biology (AREA)
- Evolutionary Computation (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明公开了一种通过人员行为轨迹识别重点人员的方法及系统;收集重点人员和非重点人员的行为轨迹数据,建立重点人员轨迹信息集和非重点人员轨迹信息集;对重点人员轨迹信息集和非重点人员轨迹信息集的信息进行特征提取;从重点人员轨迹信息集和非重点人员轨迹信息集中提取每个人行为轨迹信息中的位置特征和时间特征,将位置特征和时间特征作为TOKEN串,并统计提取出的TOKEN串出现的次数和字频;建立动态模型;计算每个哈希表TOKEN串ti出现的概率;利用样本人员的轨迹特征进行学习训练,计算样本人员为重点人员的概率;建立新表;根据建立哈希表估计新人员为重点人员的可能性。
Description
技术领域
本发明涉及一种通过人员行为轨迹识别重点人员的方法及系统。
背景技术
在日益飞速发展的信息技术支撑下,利用信息化手段管控犯罪前科、在逃人员等重点人员已经成为了公安机关研究的重要方向。重点人员日常活动时,产生的各项行为记录的数据信息,记载了重点人员的行动轨迹和方向。因此利用人员动态轨迹,来分析重点人员的类型,提高公安情报人员的研判效率,显得尤为重要。
而目前人员分类方法,要么是具有局限性,只能应用到单一场景,如只能识别上班族或者贩毒人员等单一类型,要么具有时效性,当时代发展,改变了人们的生活方式后,固定的识别算法便不再适用。
发明内容
本发明的目的就是为了解决上述问题,提供一种通过人员行为轨迹识别重点人员的方法及系统,它具有通过人员行为轨迹迅速准确识别重点人员的优点。
为了实现上述目的,本发明采用如下技术方案:
一种通过人员行为轨迹识别重点人员的方法,包括如下步骤:
步骤(1):收集重点人员和非重点人员的行为轨迹数据,建立重点人员轨迹信息集和非重点人员轨迹信息集;
步骤(2):对重点人员轨迹信息集和非重点人员轨迹信息集的信息进行特征提取;
从重点人员轨迹信息集和非重点人员轨迹信息集中提取每个人行为轨迹信息中的位置特征和时间特征,将位置特征和时间特征作为TOKEN串,并统计提取出的TOKEN串出现的次数和字频;
步骤(3):建立动态模型;
每个人员行为轨迹信息对应一个哈希表,hashtable_true哈希表对应重点人员行为轨迹信息集,而hashtable_false哈希表对应非重点人员行为轨迹集合;每个哈希表中存储TOKEN串到字频的映射关系;
步骤(4):计算hashtable_true哈希表和hashtable_false哈希表TOKEN串ti出现的概率;
步骤(5):从建立重点人员轨迹信息集和非重点人员轨迹信息集中选择样本人员,利用样本人员的轨迹特征进行学习训练,计算样本人员为重点人员的概率;
步骤(6):建立新的hashtable_probability哈希表,存储TOKEN串ti到P(A|ti)的映射;P(A|ti)表示在事件A中,样本人员轨迹信息中出现TOKEN串ti时,该人员为重点人员的概率;
步骤(7):重复步骤(5)-(6),直至每个重点人员和非重点人员轨迹均学习训练结束;根据建立的hashtable_probability哈希表估计新人员为重点人员的可能性。
所述步骤(4)为:
P1(ti)表示TOKEN串ti在hashtable_true哈希表中出现的频率;
P2(ti)表示TOKEN串ti在hashtable_false哈希表中出现的频率。
所述步骤(5):利用hashtable_true哈希表和hashtable_false哈希表,推断出当样本人员轨迹信息中出现某个TOKEN串时,计算样本人员为重点人员的概率:
假设样本人员的TOKEN串包括t1、t2……tn;
则P(A|ti)表示在事件A中,样本人员轨迹信息中出现TOKEN串ti时,该人员为重点人员的概率;i的取值范围是1到n;
则
当收到一条新人员行为轨迹时,提取新人员行为轨迹信息中的位置特征和时间特征,将位置特征和时间特征作为TOKEN串;利用新人员的TOKEN串查询hashtable_probability哈希表,得到TOKEN串的键值;
假设由该新人员行为轨迹共得到m个TOKEN串t1、t2……tm,hashtable_probability哈希表中对应的值为P1、P2……Pm;
P(A|t1,t2,t3......tm)表示在人员轨迹信息中同时出现多个TOKEN串t1、t2……tm时,该新人员为重点人员的概率;
当P(A|t1,t2,t3......tm)超过预定阈值时,就判断人员为重点人员。
其中,
一种通过人员行为轨迹识别重点人员的系统,包括:
收集模块:收集重点人员和非重点人员的行为轨迹数据,建立重点人员轨迹信息集和非重点人员轨迹信息集;
特征提取模块:对重点人员轨迹信息集和非重点人员轨迹信息集的信息进行特征提取;
从重点人员轨迹信息集和非重点人员轨迹信息集中提取每个人行为轨迹信息中的位置特征和时间特征,将位置特征和时间特征作为TOKEN串,并统计提取出的TOKEN串出现的次数和字频;
动态模型建立模块:每个人员行为轨迹信息对应一个哈希表,hashtable_true哈希表对应重点人员行为轨迹信息集,而hashtable_false哈希表对应非重点人员行为轨迹集合;每个哈希表中存储TOKEN串到字频的映射关系;
第一计算模块:计算hashtable_true哈希表和hashtable_false哈希表TOKEN串ti出现的概率;
第二计算模块:从建立重点人员轨迹信息集和非重点人员轨迹信息集中选择样本人员,利用样本人员的轨迹特征进行学习训练,计算样本人员为重点人员的概率;
新哈希表建立模块:建立新的hashtable_probability哈希表,存储TOKEN串ti到P(A|ti)的映射;P(A|ti)表示在事件A中,样本人员轨迹信息中出现TOKEN串ti时,该人员为重点人员的概率;
估计模块:直至每个重点人员和非重点人员轨迹均学习训练结束;根据建立的hashtable_probability哈希表能够估计新人员为重点人员的可能性。
本发明的有益效果:
1从建立重点人员轨迹信息集和非重点人员轨迹信息集中选择样本人员,利用样本人员的轨迹特征进行学习训练,计算样本人员为重点人员的概率;建立新的hashtable_probability哈希表,利用新的哈希表来识别重点人员,具有识别范围广的优点。
2通过设定阈值来判断是否为重点人员,具有识别精度高的优点。
附图说明
图1为本发明的方法流程图。
具体实施方式
下面结合附图与实施例对本发明作进一步说明。
如图1所示,一种通过人员行为轨迹识别人员类型的方法,包括如下步骤:
1.收集大量人员行为轨迹数据,建立重点人员轨迹信息集和非重点人员轨迹信息集。
2.重点人员特征提取
以送餐员为例,送餐员具有明显的行为特征,在吃饭时间奔波在餐馆与小区、餐馆与办公区等之间,其轨迹一天内此刻最为密集,而且由于送餐员都有自己特定的送餐区域,其轨迹长时间内趋于一致性。
提取这些行为轨迹信息中的场所、时间等特征信息作为TOKEN串,并统计提取出的TOKEN串出现的次数和字频。
按照上述的方法分别处理重点人员轨迹信息集合非重点人员信息集的所有人员轨迹信息。
3.建立动态模型
每一个人员行为轨迹信息对应一个哈希表,hashtable_true对应重点人员行为轨迹信息集,而hashtable_false对应非重点人员行为轨迹集合。表中存储TOKEN串到字频的映射关系。
4.计算TOKEN出现的概率
计算每个哈希表中TOKEN串出现的概率P=(某TOKEN串的字频)/(对应哈希表的长度)。
5.计算新人员为重点人员的概率。
综合考虑hashtable_true和hashtable_false,推断出当新来的人员轨迹信息中出现某个TOKEN串时,该新人员为重点人员的概率。数学表达式为:
A事件----人员为重点人员;
t1,t2…….tn代表TOKEN串
则P(A|ti)表示在人员轨迹信息中出现TOKEN串ti时,该人员为重点人员的概率。
设
则
6.建立新的哈希表hashtable_probability存储TOKEN串ti到P(A|ti)的映射
7.至此,重点人员和非重点人员的学习过程结束。根据建立的哈希表hashtable_probability可以估计一封新到人员为重点人员的可能性。
当新到一条人员行为轨迹时,按照步骤2,生成TOKEN串。查询hashtable_probability得到该TOKEN串的键值。
假设由该新人员行为轨迹共得到m个TOKEN串t1、t2……tm,hashtable_probability哈希表中对应的值为P1、P2……Pm;P(A|t1,t2,t3......tm)表示在人员轨迹信息中同时出现多个TOKEN串t1、t2……tm时,该人员为重点人员的概率。
由复合概率公式可得
当P(A|t1,t2,t3......tm)超过预定阈值时,就可以判断人员为重点人员。
重点人员:一类具有明显特征的人员,如常驻人员、外卖人员、贩毒人员等。
上述虽然结合附图对本发明的具体实施方式进行了描述,但并非对本发明保护范围的限制,所属领域技术人员应该明白,在本发明的技术方案的基础上,本领域技术人员不需要付出创造性劳动即可做出的各种修改或变形仍在本发明的保护范围以内。
Claims (6)
1.一种通过人员行为轨迹识别重点人员的方法,其特征是,包括如下步骤:
步骤(1):收集重点人员和非重点人员的行为轨迹数据,建立重点人员轨迹信息集和非重点人员轨迹信息集;
步骤(2):对重点人员轨迹信息集和非重点人员轨迹信息集的信息进行特征提取;
从重点人员轨迹信息集和非重点人员轨迹信息集中提取每个人行为轨迹信息中的位置特征和时间特征,将位置特征和时间特征作为TOKEN串,并统计提取出的TOKEN串出现的次数和字频;
步骤(3):建立动态模型;
每个人员行为轨迹信息对应一个哈希表,hashtable_true哈希表对应重点人员行为轨迹信息集,而hashtable_false哈希表对应非重点人员行为轨迹集合;每个哈希表中存储TOKEN串到字频的映射关系;
步骤(4):计算hashtable_true哈希表和hashtable_false哈希表TOKEN串ti出现的概率;
步骤(5):从建立重点人员轨迹信息集和非重点人员轨迹信息集中选择样本人员,利用样本人员的轨迹特征进行学习训练,计算样本人员为重点人员的概率;
步骤(6):建立新的hashtable_probability哈希表,存储TOKEN串ti到P(A|ti)的映射;P(A|ti)表示在事件A中,样本人员轨迹信息中出现TOKEN串ti时,该人员为重点人员的概率;
步骤(7):重复步骤(5)-(6),直至每个重点人员和非重点人员轨迹均学习训练结束;根据建立的hashtable_probability哈希表估计新人员为重点人员的可能性;
当新到一条人员行为轨迹时,按照步骤2,生成TOKEN串;查询hashtable_probability得到该TOKEN串的键值;
假设由该新人员行为轨迹共得到m个TOKEN串t1、t2……tm,hashtable_probability哈希表中对应的值为P1、P2……Pm;P(A|t1,t2,t3......tm)表示在人员轨迹信息中同时出现多个TOKEN串t1、t2……tm时,该人员为重点人员的概率;
由复合概率公式可得
当P(A|t1,t2,t3......tm)超过预定阈值时,就可以判断人员为重点人员。
2.如权利要求1所述的一种通过人员行为轨迹识别重点人员的方法,其特征是,所述步骤(4)为:
P1(ti)表示TOKEN串ti在hashtable_true哈希表中出现的频率;
P2(ti)表示TOKEN串ti在hashtable_false哈希表中出现的频率。
3.如权利要求1所述的一种通过人员行为轨迹识别重点人员的方法,其特征是,所述步骤(5):利用hashtable_true哈希表和hashtable_false哈希表,推断出当样本人员轨迹信息中出现某个TOKEN串时,计算样本人员为重点人员的概率:
假设样本人员的TOKEN串包括t1、t2……tn;
则P(A|ti)表示在事件A中,样本人员轨迹信息中出现TOKEN串ti时,该人员为重点人员的概率;i的取值范围是1到n;
则
4.如权利要求1所述的一种通过人员行为轨迹识别重点人员的方法,其特征是,当收到一条新人员行为轨迹时,提取新人员行为轨迹信息中的位置特征和时间特征,将位置特征和时间特征作为TOKEN串;利用新人员的TOKEN串查询hashtable_probability哈希表,得到TOKEN串的键值;
假设由该新人员行为轨迹共得到m个TOKEN串t1、t2……tm,hashtable_probability哈希表中对应的值为P1、P2……Pm;
P(A|t1,t2,t3......tm)表示在人员轨迹信息中同时出现多个TOKEN串t1、t2……tm时,该新人员为重点人员的概率;
当P(A|t1,t2,t3......tm)超过预定阈值时,就判断人员为重点人员。
5.如权利要求4所述的一种通过人员行为轨迹识别重点人员的方法,其特征是,
其中,
6.一种通过人员行为轨迹识别重点人员的系统,其特征是,包括:
收集模块:收集重点人员和非重点人员的行为轨迹数据,建立重点人员轨迹信息集和非重点人员轨迹信息集;
特征提取模块:对重点人员轨迹信息集和非重点人员轨迹信息集的信息进行特征提取;
从重点人员轨迹信息集和非重点人员轨迹信息集中提取每个人行为轨迹信息中的位置特征和时间特征,将位置特征和时间特征作为TOKEN串,并统计提取出的TOKEN串出现的次数和字频;
动态模型建立模块:每个人员行为轨迹信息对应一个哈希表,hashtable_true哈希表对应重点人员行为轨迹信息集,而hashtable_false哈希表对应非重点人员行为轨迹集合;每个哈希表中存储TOKEN串到字频的映射关系;
第一计算模块:计算hashtable_true哈希表和hashtable_false哈希表TOKEN串ti出现的概率;
第二计算模块:从建立重点人员轨迹信息集和非重点人员轨迹信息集中选择样本人员,利用样本人员的轨迹特征进行学习训练,计算样本人员为重点人员的概率;
新哈希表建立模块:建立新的hashtable_probability哈希表,存储TOKEN串ti到P(A|ti)的映射;P(A|ti)表示在事件A中,样本人员轨迹信息中出现TOKEN串ti时,该人员为重点人员的概率;
估计模块:直至每个重点人员和非重点人员轨迹均学习训练结束;根据建立的hashtable_probability哈希表估计新人员为重点人员的可能性;
当新到一条人员行为轨迹时,按照步骤2,生成TOKEN串;查询hashtable_probability得到该TOKEN串的键值;
假设由该新人员行为轨迹共得到m个TOKEN串t1、t2……tm,hashtable_probability哈希表中对应的值为P1、P2……Pm;P(A|t1,t2,t3......tm)表示在人员轨迹信息中同时出现多个TOKEN串t1、t2……tm时,该人员为重点人员的概率;
由复合概率公式可得
当P(A|t1,t2,t3......tm)超过预定阈值时,就可以判断人员为重点人员。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710305675.0A CN107133646B (zh) | 2017-05-03 | 2017-05-03 | 一种通过人员行为轨迹识别重点人员的方法及系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710305675.0A CN107133646B (zh) | 2017-05-03 | 2017-05-03 | 一种通过人员行为轨迹识别重点人员的方法及系统 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN107133646A CN107133646A (zh) | 2017-09-05 |
CN107133646B true CN107133646B (zh) | 2019-09-17 |
Family
ID=59715211
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201710305675.0A Active CN107133646B (zh) | 2017-05-03 | 2017-05-03 | 一种通过人员行为轨迹识别重点人员的方法及系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN107133646B (zh) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111882421B (zh) * | 2020-06-17 | 2022-06-07 | 马上消费金融股份有限公司 | 一种信息处理方法、风控方法、装置、设备及存储介质 |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1423795A (zh) * | 2000-11-01 | 2003-06-11 | 皇家菲利浦电子有限公司 | 应用基于外貌和几何特征的统计模型的图形处理系统中的人的标记 |
JP2008141700A (ja) * | 2006-12-05 | 2008-06-19 | Fujifilm Corp | 監視システム、監視方法、及びプログラム |
JP2010139325A (ja) * | 2008-12-10 | 2010-06-24 | Panasonic Corp | 位置推定装置及び位置推定方法 |
CN103593361A (zh) * | 2012-08-14 | 2014-02-19 | 中国科学院沈阳自动化研究所 | 感应网络环境下移动时空轨迹分析方法 |
CN104820905A (zh) * | 2015-05-19 | 2015-08-05 | 威海北洋电气集团股份有限公司 | 基于空间轨迹大数据分析的人员管控方法及系统 |
CN105260795A (zh) * | 2015-10-13 | 2016-01-20 | 广西师范学院 | 一种基于条件随机场的重点人员位置时空预测方法 |
CN105404890A (zh) * | 2015-10-13 | 2016-03-16 | 广西师范学院 | 一种顾及轨迹时空语义的犯罪团伙判别方法 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20110184649A1 (en) * | 2006-12-15 | 2011-07-28 | Physical Logic Ag | Method of Assessing Risk in an Area |
-
2017
- 2017-05-03 CN CN201710305675.0A patent/CN107133646B/zh active Active
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1423795A (zh) * | 2000-11-01 | 2003-06-11 | 皇家菲利浦电子有限公司 | 应用基于外貌和几何特征的统计模型的图形处理系统中的人的标记 |
JP2008141700A (ja) * | 2006-12-05 | 2008-06-19 | Fujifilm Corp | 監視システム、監視方法、及びプログラム |
JP2010139325A (ja) * | 2008-12-10 | 2010-06-24 | Panasonic Corp | 位置推定装置及び位置推定方法 |
CN103593361A (zh) * | 2012-08-14 | 2014-02-19 | 中国科学院沈阳自动化研究所 | 感应网络环境下移动时空轨迹分析方法 |
CN104820905A (zh) * | 2015-05-19 | 2015-08-05 | 威海北洋电气集团股份有限公司 | 基于空间轨迹大数据分析的人员管控方法及系统 |
CN105260795A (zh) * | 2015-10-13 | 2016-01-20 | 广西师范学院 | 一种基于条件随机场的重点人员位置时空预测方法 |
CN105404890A (zh) * | 2015-10-13 | 2016-03-16 | 广西师范学院 | 一种顾及轨迹时空语义的犯罪团伙判别方法 |
Non-Patent Citations (1)
Title |
---|
基于手机信令数据的快递人员辨识方法;方珊珊 等;《北京工业大学学报》;20170331;第43卷(第3期);第413-422页 |
Also Published As
Publication number | Publication date |
---|---|
CN107133646A (zh) | 2017-09-05 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN103699795B (zh) | 一种运动行为识别方法、装置及运动强度监测系统 | |
Meng et al. | Travel purpose inference with GPS trajectories, POIs, and geo-tagged social media data | |
Alzantot et al. | Crowdinside: Automatic construction of indoor floorplans | |
CN105354196B (zh) | 信息推送方法和信息推送装置 | |
Ye et al. | FTrack: Infrastructure-free floor localization via mobile phone sensing | |
CN105307121B (zh) | 一种信息处理方法及装置 | |
WO2020164320A1 (zh) | 定位方法及电子设备 | |
CN111950937A (zh) | 一种基于融合时空轨迹的重点人员风险评估方法 | |
CN104699818A (zh) | 一种多源异构的多属性poi融合方法 | |
CN103093133B (zh) | 面向ieee802.15.6的生物身份认证方法 | |
CN103477241A (zh) | 来自运动和环境光分类器的装置位置估计 | |
CN109918674B (zh) | 一种基于案件要素相似性建模的案件串并方法 | |
CN103778186A (zh) | 一种“网络马甲”的检测方法 | |
CN106156528A (zh) | 一种轨迹数据停留识别方法及系统 | |
CN109978016A (zh) | 一种网络用户身份识别方法 | |
CN112053222A (zh) | 一种基于知识图谱的互联网金融团伙欺诈行为检测方法 | |
Du et al. | Group mobility classification and structure recognition using mobile devices | |
Lau et al. | Extracting point of interest and classifying environment for low sampling crowd sensing smartphone sensor data | |
CN108876509A (zh) | 利用poi分析用户标签的方法及系统 | |
CN108513262A (zh) | 基于合成似真路径的位置隐私保护方法 | |
CN107133646B (zh) | 一种通过人员行为轨迹识别重点人员的方法及系统 | |
Xu et al. | Multi-modal description of public safety events using surveillance and social media | |
CN107247962A (zh) | 一种基于滑动窗口的实时电器识别方法和系统 | |
Li et al. | Collaborative recognition of queuing behavior on mobile phones | |
Unankard et al. | Location-based emerging event detection in social networks |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |