CN115359592B - 一种交通卡号实名匹配方法、电子设备及存储介质 - Google Patents

一种交通卡号实名匹配方法、电子设备及存储介质 Download PDF

Info

Publication number
CN115359592B
CN115359592B CN202211291692.0A CN202211291692A CN115359592B CN 115359592 B CN115359592 B CN 115359592B CN 202211291692 A CN202211291692 A CN 202211291692A CN 115359592 B CN115359592 B CN 115359592B
Authority
CN
China
Prior art keywords
data
track
station
name
code scanning
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202211291692.0A
Other languages
English (en)
Other versions
CN115359592A (zh
Inventor
张晓春
杜军
鄢全文
杨良
梁晨
刘星
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shenzhen Urban Transport Planning Center Co Ltd
Original Assignee
Shenzhen Urban Transport Planning Center Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shenzhen Urban Transport Planning Center Co Ltd filed Critical Shenzhen Urban Transport Planning Center Co Ltd
Priority to CN202211291692.0A priority Critical patent/CN115359592B/zh
Publication of CN115359592A publication Critical patent/CN115359592A/zh
Application granted granted Critical
Publication of CN115359592B publication Critical patent/CN115359592B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G07CHECKING-DEVICES
    • G07CTIME OR ATTENDANCE REGISTERS; REGISTERING OR INDICATING THE WORKING OF MACHINES; GENERATING RANDOM NUMBERS; VOTING OR LOTTERY APPARATUS; ARRANGEMENTS, SYSTEMS OR APPARATUS FOR CHECKING NOT PROVIDED FOR ELSEWHERE
    • G07C9/00Individual registration on entry or exit
    • G07C9/20Individual registration on entry or exit involving the use of a pass
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F17/00Digital computing or data processing equipment or methods, specially adapted for specific functions
    • G06F17/10Complex mathematical operations
    • G06F17/16Matrix or vector computation, e.g. matrix-matrix or matrix-vector multiplication, matrix factorization
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/10Services
    • G06Q50/26Government or public services
    • GPHYSICS
    • G07CHECKING-DEVICES
    • G07BTICKET-ISSUING APPARATUS; FARE-REGISTERING APPARATUS; FRANKING APPARATUS
    • G07B11/00Apparatus for validating or cancelling issued tickets

Landscapes

  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Theoretical Computer Science (AREA)
  • Mathematical Physics (AREA)
  • Computational Mathematics (AREA)
  • Mathematical Optimization (AREA)
  • Pure & Applied Mathematics (AREA)
  • Tourism & Hospitality (AREA)
  • Data Mining & Analysis (AREA)
  • Mathematical Analysis (AREA)
  • Educational Administration (AREA)
  • General Health & Medical Sciences (AREA)
  • Computing Systems (AREA)
  • Software Systems (AREA)
  • Development Economics (AREA)
  • Databases & Information Systems (AREA)
  • Algebra (AREA)
  • Health & Medical Sciences (AREA)
  • Economics (AREA)
  • General Engineering & Computer Science (AREA)
  • Human Resources & Organizations (AREA)
  • Marketing (AREA)
  • Primary Health Care (AREA)
  • Strategic Management (AREA)
  • General Business, Economics & Management (AREA)
  • Train Traffic Observation, Control, And Security (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明提出一种交通卡号实名匹配方法、电子设备及存储介质,属于交通卡号实名匹配技术领域。包括以下步骤:S1.对轨道刷卡数据进行预处理;S2.判断轨道站点和扫码场所之间的映射关系;S3.对实名扫码数据进行预处理;S4.构建轨道刷卡进站稀疏矩阵和扫码进站稀疏矩阵;S5.将三维稀疏矩阵变换为二维矩阵;S6.计算轨道刷卡数据和实名扫码数据之间的匹配度,获取交通卡号和个体匹配结果。解决了现有技术中存在的数据利用率低、匹配率低和计算资源开销大的技术问题。

Description

一种交通卡号实名匹配方法、电子设备及存储介质
技术领域
本发明涉及一种交通卡号实名匹配方法,尤其涉及一种交通卡号实名匹配方法、电子设备及存储介质,属于交通卡号实名匹配技术领域。
背景技术
CN108074301A公开了一种交通卡的实名制方法及装置,该方法针对待匹配的地铁站,识别与所述地铁站之间的距离小于设定距离阈值的小区;针对在设定时间长度内针对所述地铁站保存的第一刷卡记录及针对每个小区保存的第二刷卡记录,识别所述第一刷卡记录中的交通卡的标识信息及进出站时间,并识别所述第二刷卡记录中的用户身份标识信息及出进门时间;统计包含目标用户身份标识信息的第二刷卡记录及包含目标交通卡的标识信息的第一刷卡记录,如果目标第一刷卡记录中的进站时间和目标第二刷卡记录中的出门时间之间的差值小于设定时间阈值,或目标第二刷卡记录中进门时间和目标第一刷卡记录中出站时间的差值小于设定时间阈值,则确定目标第一刷卡记录和目标第二刷卡记录为一条匹配记录;根据该目标用户身份标识信息和目标交通卡的标识信息的匹配记录的条数,确定所述用户身份标识信息和目标交通卡的标识信息的匹配次数,当所述匹配次数大于设定的次数阈值时,确定该目标用户身份标识信息与该目标交通卡的标识信息匹配。
但该方法存在以下问题:
1.数据利用率低:需考虑每个地铁站附近的小区,若地铁站附近不存在小区或小区数据量极少,或乘车人并非从小区出发乘坐地铁,则地铁站的刷卡数据则无法有效利用;
2.匹配率低、准确率低:当数据利用率较低时,交通卡号的匹配率及准确率也会随之降低;
3.计算资源开销大:进入小区的个体实际上可能并非搭乘地铁,但是否搭乘地铁信息无法从小区刷卡数据得到,计算时可能大部分数据没有实际用处,会造成计算资源开销大的问题。
发明内容
在下文中给出了关于本发明的简要概述,以便提供关于本发明的某些方面的基本理解。应当理解,这个概述并不是关于本发明的穷举性概述。它并不是意图确定本发明的关键或重要部分,也不是意图限定本发明的范围。其目的仅仅是以简化的形式给出某些概念,以此作为稍后论述的更详细描述的前序。
鉴于此,为解决现有技术中存在的数据利用率低、匹配率低和计算资源开销大的技术问题,本发明提供一种交通卡号实名匹配方法、电子设备及存储介质。本发明对轨道刷卡数据及实名扫码数据进行预处理获取轨道刷卡进站数据和扫码进站数据后,通过场所映射建立他们之间的位置关系,再通过时间离散化及时间片扩展获得三维稀疏矩阵,通过维度合并将三维矩阵变换为二维矩阵,利用矩阵相乘运算计算匹配度,并基于事实规则对结果进行后处理和结果输出。本发明采用实际场景中覆盖面广、使用率高的实名扫码数据代替小区刷卡记录,进而提高轨道刷卡数据的可使用量;通过计算扫码场所和地铁站点之间的映射关系,筛选实名扫码数据,能够在计算前提前删除与轨道站点无映射关系的实名扫码数据,减少无效数据;利用稀疏矩阵进一步降低计算资源开销。
方案一、一种交通卡号实名匹配方法,基于实名扫码数据和轨道刷卡数据实现的一种交通卡号实名匹配方法,包括以下步骤:
S1.对轨道刷卡数据进行预处理;
S2.判断轨道站点和扫码场所之间的映射关系;
S3.对实名扫码数据进行预处理;
S4.构建轨道刷卡进站稀疏矩阵和扫码进站稀疏矩阵;
S5.将三维稀疏矩阵变换为二维矩阵;
S6.计算轨道刷卡数据和实名扫码数据之间的匹配度,获取交通卡号和个体匹配结果。
优选的,S1具体是:包括以下步骤:
S11.数据清洗:删除员工卡、单次卡、特殊类型刷卡数据、进站时间大于出站时间的数据、删除个体乘坐地铁的出站时间和出站站点信息;若出现极短时间内重复进入同一站点的数据,保留其中一条数据;
S12.建立站点索引表:从轨道刷卡数据中提取进站和出站站点,去重后给予唯一自增id作为轨道站点索引;
S13.交通卡号筛选:基于轨道刷卡数据覆盖时间范围、覆盖工作日数量设定卡号在轨道刷卡数据中出现的次数;若轨道刷卡数据中卡号的出现次数小于设定的阈值,则将小于设定阈值的卡号数据删除;
S14.建立交通卡号索引表:从卡号筛选后的数据中提取卡号,去重后给予唯一自增id作为交通卡号索引。
优选的,S2具体是:包括以下步骤:
S21.通过轨道站点名称和扫码场所名称,通过正则表达式或NLP语义分析对轨道站点名称和扫码场所名称进行匹配;
S22.通过轨道站点和扫码场所之间的距离进行匹配,采用下述公式计算两者距离:
Figure 687573DEST_PATH_IMAGE001
=2*
Figure 11238DEST_PATH_IMAGE002
*arcsin
Figure 322133DEST_PATH_IMAGE003
其中,
Figure 123867DEST_PATH_IMAGE004
代表场所纬度,
Figure 734977DEST_PATH_IMAGE005
代表场所经度,
Figure 963964DEST_PATH_IMAGE006
代表地球赤道半径;
S23.设定轨道站点和扫码场所之间的距离阈值;当轨道站点和扫码场所满足名称匹配条件且距离小于设定阈值时判断轨道站点和扫码场所存在映射关系。
优选的,S3具体是:包括以下步骤:
S31.时间筛选:筛选实名扫码数据的时间与清洗后的轨道刷卡数据的最小时间和最大时间对应的数据;
S32.场所筛选、获取对应轨道站点索引:基于场所映射结果,删除与轨道站点不存在映射关系的场所扫码数据,获取与轨道站点存在映射关系的扫码场所对应的轨道站点索引;
S33.个体筛选:设定个体在实名扫码数据中出现的次数,个体在实名扫码数据中出现的次数与设定的交通卡号在轨道刷卡数据中出现次数保持一致;若实名扫码数据中个体的出现次数小于设定的阈值,则将小于设定阈值的个体数据删除;
S34.建立个体索引表:从个体筛选后的实名扫码数据提取个体信息,去重后给予唯一自增id作为个体索引。
优选的,S4具体是:包括以下步骤:
S41.将轨道刷卡数据中的刷卡进站时间与实名扫码数据中的扫码时间通过下述公式进行离散化,获取时间片索引表:
Figure 762156DEST_PATH_IMAGE007
其中,
Figure 600537DEST_PATH_IMAGE008
代表将时间转换为10位时间戳,
Figure 66153DEST_PATH_IMAGE009
代表清洗后的轨道刷卡数据和实名 扫码数据的最小时间,
Figure 466042DEST_PATH_IMAGE010
代表向下取整;
S42.根据站点索引表和交通卡号索引表构建轨道刷卡进站稀疏矩阵;预处理后的轨道刷卡数据中存在的交通卡号、站点、时间所对应的交通卡号索引、站点索引、时间片索引下的元素为1,其余为0;
S43.根据个体索引表、轨道站点索引表构建扫码进站稀疏矩阵;预处理后的实名扫码数据中存在的个体、站点、时间所对应的交通卡号索引、站点索引、时间片索引下的元素为1,其余为0;
S44.将扫码进站稀疏矩阵向后扩展延伸n个时间片,扩展延伸的矩阵元素为1;
S45.将轨道刷卡进站稀疏矩阵需向前扩展延伸n个时间片,扩展延伸的矩阵元素为0。
优选的,S5具体是:
采用如下规则进行变换:
Figure 954792DEST_PATH_IMAGE011
其中,
Figure 222962DEST_PATH_IMAGE012
代表站点索引,
Figure 152872DEST_PATH_IMAGE013
代表时间片索引,
Figure 113875DEST_PATH_IMAGE014
代表轨道刷卡 进站数据和扫码进站数据的最大时间片索引。
优选的,S6具体是:通过二维矩阵乘法运算计算轨道刷卡数据和实名扫码数据之间的匹配度。将轨道刷卡进站稀疏矩阵和扫码进站稀疏矩阵相乘,得到的矩阵行索引和列索引分别为交通卡号索引和个体索引,矩阵中每个元素值为交通卡号索引和个体索引匹配度,结合交通卡号索引表和个体索引表即可获取交通卡号和个体之间的匹配度;匹配度在实际意义中代表同一时间段个体和交通卡号出现在同一个轨道站点的次数;
设定匹配度阈值为
Figure 762025DEST_PATH_IMAGE015
,当匹配度大于等于
Figure 568307DEST_PATH_IMAGE016
时,认为卡号匹配成功;
匹配度计算结果若存在一卡对应多人或一人拥有多卡现象时,设定以下规则:
A一个交通卡最多对应一人;
B一人最多拥有
Figure 382417DEST_PATH_IMAGE017
交通卡;
每个交通卡号选取匹配度最高的对应个体作为该卡持有个体,若大于
Figure 248742DEST_PATH_IMAGE017
个交通卡号匹配度最高的对应个体为同一个,则认为前
Figure 712084DEST_PATH_IMAGE017
个匹配度最高的交通卡 号为该个体持有卡。
方案二、一种电子设备,包括存储器和处理器,存储器存储有计算机程序,所述的处理器执行所述计算机程序时实现方案一所述一种交通卡号实名匹配方法的步骤。
方案三、一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现方案一所述一种交通卡号实名匹配方法。
本发明的有益效果如下:
1)适配大数据技术,可依托于大数据分布式计算技术实施,可充分发挥分布式计算的优点,有效减少计算时间;
2)减少存储资源,通过引入稀疏矩阵,降低计算所需的存储资源,节省资源开销;
3)结果可重复利用,所得结果在一定时间段内可重复使用,无需高频率重复计算;
4)应用场景广泛,可应用于现实场景,如个体级轨迹还原,进而可拓展至个体追踪、疫情防控等重要场景;
5)可与其他技术相结合使用,可与地铁仿真技术、出行推演技术结合,获取更为详细的个体出行信息。
附图说明
此处所说明的附图用来提供对本发明的进一步理解,构成本发明的一部分,本发明的示意性实施例及其说明用于解释本发明,并不构成对本发明的不当限定。在附图中:
图1为本发明一种交通卡号实名匹配方法流程示意图;
图2为本发明轨道刷卡进站稀疏矩阵示意图;
图3为本发明扫码进站稀疏矩阵。
具体实施方式
为了使本发明实施例中的技术方案及优点更加清楚明白,以下结合附图对本发明的示例性实施例进行进一步详细的说明,显然,所描述的实施例仅是本发明的一部分实施例,而不是所有实施例的穷举。需要说明的是,在不冲突的情况下,本发明中的实施例及实施例中的特征可以相互组合。
实施例1、参照图1-图3说明本实施方式,一种交通卡号实名匹配方法,实名扫码数据需包含个体实名信息(即证件类型和证件号码)、扫码场所信息、扫码时间信息,与之对应的,轨道刷卡数据需包含交通卡号信息、站点信息、刷卡时间信息。本发明将以上两类活动数据进行轨迹碰撞,计算轨迹的匹配度来获取个体的交通卡号信息。首先需要获取轨道刷卡数据和实名扫码数据,其次,再进行以下步骤:
S1.对轨道刷卡数据进行预处理,轨道刷卡数据预处理的目的是去除脏数据、建立站点及交通卡号索引表并获取清洗后的轨道刷卡进站数据,其包括以下步骤:
S11.数据清洗:删除员工卡、单次卡、特殊类型刷卡数据、进站时间大于出站时间的数据、删除个体乘坐地铁的出站时间和出站站点信息;若出现极短时间内重复进入同一站点的数据,保留其中一条数据;
S12.建立站点索引表:从轨道刷卡数据中提取进站和出站站点,去重后给予唯一自增id作为轨道站点索引;
S13.交通卡号筛选:基于轨道刷卡数据覆盖时间范围、覆盖工作日数量设定卡号在轨道刷卡数据中出现的次数;若轨道刷卡数据中卡号的出现次数小于设定的阈值,则将小于设定阈值的卡号数据删除;
S14.建立交通卡号索引表:从卡号筛选后的数据中提取卡号,去重后给予唯一自增id作为交通卡号索引。
S2.判断轨道站点和扫码场所之间的映射关系;场所映射的目的为将轨道站点与扫码场所建立等价关系,基于场所映射结果对实名扫码数据进行筛选,判断轨道站点和扫码场所之间的映射关系,包括以下步骤:
S21.通过轨道站点名称和扫码场所名称,通过正则表达式或NLP语义分析对轨道站点名称和扫码场所名称进行匹配;
S22.通过轨道站点和扫码场所之间的距离进行匹配,采用下述公式计算两者距离:
Figure 197423DEST_PATH_IMAGE001
=2*
Figure 226559DEST_PATH_IMAGE018
*arcsin
Figure 670310DEST_PATH_IMAGE019
其中,
Figure 152107DEST_PATH_IMAGE020
代表场所纬度,
Figure 769033DEST_PATH_IMAGE021
代表场所经度,
Figure 528042DEST_PATH_IMAGE022
代表地球赤道半径;
S23.设定轨道站点和扫码场所之间的距离阈值;当轨道站点和扫码场所满足名称匹配条件且距离小于设定阈值时判断轨道站点和扫码场所存在映射关系。
S3.对实名扫码数据进行预处理,实名扫码数据预处理的目的是对实名扫码数据进行筛选、建立个体索引表、获取扫码进入轨道站点数据,包括以下步骤:
S31.时间筛选:筛选实名扫码数据的时间与清洗后的轨道刷卡数据的最小时间和最大时间对应的数据;
S32.场所筛选、获取对应轨道站点索引:基于场所映射结果,删除与轨道站点不存在映射关系的场所扫码数据,获取与轨道站点存在映射关系的扫码场所对应的轨道站点索引;
S33.个体筛选:设定个体在实名扫码数据中出现的次数,个体在实名扫码数据中出现的次数与设定的交通卡号在轨道刷卡数据中出现次数保持一致;若实名扫码数据中个体的出现次数小于设定的阈值,则将小于设定阈值的个体数据删除;
S34.建立个体索引表:从个体筛选后的实名扫码数据提取个体信息,去重后给予唯一自增id作为个体索引。
S4.构建轨道刷卡进站稀疏矩阵和扫码进站稀疏矩阵,包括以下步骤:
S41.将轨道刷卡数据中的刷卡进站时间与实名扫码数据中的扫码时间通过下述公式进行离散化,获取时间片索引表:
Figure 1748DEST_PATH_IMAGE023
其中,
Figure 368180DEST_PATH_IMAGE024
代表将时间转换为10位时间戳,
Figure 585535DEST_PATH_IMAGE025
代表清洗后的轨道刷卡数据和实名 扫码数据的最小时间,
Figure 464629DEST_PATH_IMAGE026
代表向下取整;
S42.根据站点索引表和交通卡号索引表构建轨道刷卡进站稀疏矩阵;预处理后的轨道刷卡数据中存在的交通卡号、站点、时间所对应的交通卡号索引、站点索引、时间片索引下的元素为1,其余为0;
S43.根据个体索引表、轨道站点索引表构建扫码进站稀疏矩阵;预处理后的实名扫码数据中存在的个体、站点、时间所对应的交通卡号索引、站点索引、时间片索引下的元素为1,其余为0;
由于个体在乘坐地铁时的动作顺序为先进行场所扫码,再进行刷卡,两个动作间 存在一定时间差,因此需将扫码进站稀疏矩阵向后扩展延伸n个时间片,扩展延伸的矩阵元 素为1,相对应地,轨道刷卡进站稀疏矩阵需向前扩展延伸n个时间片,但扩展延伸的矩阵元 素为0。上述处理代表同一轨道站点下个体的轨道刷卡进站时间片
Figure 312499DEST_PATH_IMAGE027
位于区间
Figure 768889DEST_PATH_IMAGE028
中,
Figure 399721DEST_PATH_IMAGE029
代表扫码进站时间片。
S44.将扫码进站稀疏矩阵向后扩展延伸n个时间片,即扩展延伸后的扫码进站稀 疏矩阵的数量级是原始稀疏矩阵的
Figure 257956DEST_PATH_IMAGE030
倍,扩展延伸的矩阵元素为1;扩展延伸后的扫码 进站稀疏矩阵大小为
Figure 948831DEST_PATH_IMAGE031
;其中
Figure 892516DEST_PATH_IMAGE032
代表个体数量,
Figure 654936DEST_PATH_IMAGE033
代表轨道站点数据,
Figure 741579DEST_PATH_IMAGE034
代表时间片 数量。
S45.将轨道刷卡进站稀疏矩阵需向前扩展延伸n个时间片,即扩展延伸后的轨道 刷卡进站稀疏矩阵的数量级是原始稀疏矩阵的
Figure 462410DEST_PATH_IMAGE035
倍,扩展延伸的矩阵元素为0。扩展延 伸后的轨道刷卡进站稀疏矩阵大小为
Figure 34337DEST_PATH_IMAGE036
; 其中
Figure 131606DEST_PATH_IMAGE037
代表交通卡号数量。
S5.为方便矩阵运算,需对三维矩阵进行维度合并,转换为二维矩阵。由于交通卡号和个体为需要匹配的维度,因此将轨道站点维度和时间片维度进行合并。合并规则必须保证在唯一站点、唯一时间片下的合并值是唯一的,且需保证在合并后的维度上为连续自然数,将三维稀疏矩阵变换位二维矩阵,采用如下规则进行变换:
Figure 839799DEST_PATH_IMAGE038
其中,
Figure 934794DEST_PATH_IMAGE039
代表站点索引,
Figure 853071DEST_PATH_IMAGE040
代表时间片索引,
Figure 894976DEST_PATH_IMAGE041
代表轨道刷卡 进站数据和扫码进站数据的最大时间片索引。
由于轨道刷卡进站稀疏矩阵和扫码进站稀疏矩阵中站点维度和时间维度均为连 续自然数且
Figure 316730DEST_PATH_IMAGE042
,因此上述合并规则可保证合并维度的连续自然性和合并 值的唯一性。
S6.计算轨道刷卡数据和实名扫码数据之间的匹配度,获取交通卡号和个体匹配结果;
通过二维矩阵乘法运算计算轨道刷卡数据和实名扫码数据之间的匹配度。将轨道刷卡进站稀疏矩阵和扫码进站稀疏矩阵相乘,得到的矩阵行索引和列索引分别为交通卡号索引和个体索引,矩阵中每个元素值为交通卡号索引和个体索引匹配度,结合交通卡号索引表和个体索引表即可获取交通卡号和个体之间的匹配度;匹配度在实际意义中代表同一时间段个体和交通卡号出现在同一个轨道站点的次数;
其具体方法是:设定匹配度阈值为
Figure 18845DEST_PATH_IMAGE043
,当匹配度大于等于
Figure 158839DEST_PATH_IMAGE043
时,认为卡 号匹配成功;
匹配度计算结果若存在一卡对应多人或一人拥有多卡现象时,设定以下规则:
A一个交通卡最多对应一人;
B一人最多拥有
Figure 66752DEST_PATH_IMAGE044
交通卡;
每个交通卡号选取匹配度最高的对应个体作为该卡持有个体,若大于
Figure 483958DEST_PATH_IMAGE044
个交通卡号匹配度最高的对应个体为同一个,则认为前
Figure 983073DEST_PATH_IMAGE044
个匹配度最高的交通卡 号为该个体持有卡。
实施例2、本发明的计算机装置可以是包括有处理器以及存储器等装置,例如包含中央处理器的单片机等。并且,处理器用于执行存储器中存储的计算机程序时实现上述的基于CREO软件的可修改由关系驱动的推荐数据的推荐方法的步骤。
所称处理器可以是中央处理单元(Central Processing Unit,CPU),还可以是其他通用处理器、数字信号处理器 (Digital Signal Processor,DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现成可编程门阵列 (Field-Programmable Gate Array,FPGA) 或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。
所述存储器可主要包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需的应用程序(比如声音播放功能、图像播放功能等)等;存储数据区可存储根据手机的使用所创建的数据(比如音频数据、电话本等)等。此外,存储器可以包括高速随机存取存储器,还可以包括非易失性存储器,例如硬盘、内存、插接式硬盘,智能存储卡(Smart Media Card, SMC),安全数字(Secure Digital, SD)卡,闪存卡(Flash Card)、至少一个磁盘存储器件、闪存器件、或其他易失性固态存储器件。
实施例3、计算机可读存储介质实施例
本发明的计算机可读存储介质可以是被计算机装置的处理器所读取的任何形式的存储介质,包括但不限于非易失性存储器、易失性存储器、铁电存储器等,计算机可读存储介质上存储有计算机程序,当计算机装置的处理器读取并执行存储器中所存储的计算机程序时,可以实现上述的基于CREO软件的可修改由关系驱动的建模数据的建模方法的步骤。
所述计算机程序包括计算机程序代码,所述计算机程序代码可以为源代码形式、对象代码形式、可执行文件或某些中间形式等。所述计算机可读介质可以包括:能够携带所述计算机程序代码的任何实体或装置、记录介质、U盘、移动硬盘、磁碟、光盘、计算机存储器、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、电载波信号、电信信号以及软件分发介质等。需要说明的是,所述计算机可读介质包含的内容可以根据司法管辖区内立法和专利实践的要求进行适当的增减,例如在某些司法管辖区,根据立法和专利实践,计算机可读介质不包括电载波信号和电信信号。
尽管根据有限数量的实施例描述了本发明,但是受益于上面的描述,本技术领域内的技术人员明白,在由此描述的本发明的范围内,可以设想其它实施例。此外,应当注意,本说明书中使用的语言主要是为了可读性和教导的目的而选择的,而不是为了解释或者限定本发明的主题而选择的。因此,在不偏离所附权利要求书的范围和精神的情况下,对于本技术领域的普通技术人员来说许多修改和变更都是显而易见的。对于本发明的范围,对本发明所做的公开是说明性的,而非限制性的,本发明的范围由所附权利要求书限定。

Claims (6)

1.一种交通卡号实名匹配方法,其特征在于,基于实名扫码数据和轨道刷卡数据实现的一种交通卡号实名匹配方法,包括以下步骤:
S1.对轨道刷卡数据进行预处理,包括以下步骤:
S11.数据清洗:删除员工卡、单次卡、特殊类型刷卡数据、进站时间大于出站时间的数据、删除个体乘坐地铁的出站时间和出站站点信息;若出现极短时间内重复进入同一站点的数据,保留其中一条数据;
S12.建立站点索引表:从轨道刷卡数据中提取进站和出站站点,去重后给予唯一自增id作为轨道站点索引;
S13.交通卡号筛选:基于轨道刷卡数据覆盖时间范围、覆盖工作日数量设定卡号在轨道刷卡数据中出现的次数;若轨道刷卡数据中卡号的出现次数小于设定的阈值,则将小于设定阈值的卡号数据删除;
S14.建立交通卡号索引表:从卡号筛选后的数据中提取卡号,去重后给予唯一自增id作为交通卡号索引;
S2.判断轨道站点和扫码场所之间的映射关系;
S3.对实名扫码数据进行预处理,包括以下步骤:
S31.时间筛选:筛选实名扫码数据的时间与清洗后的轨道刷卡数据的最小时间和最大时间对应的数据;
S32.场所筛选、获取对应轨道站点索引:基于场所映射结果,删除与轨道站点不存在映射关系的场所扫码数据,获取与轨道站点存在映射关系的扫码场所对应的轨道站点索引;
S33.个体筛选:设定个体在实名扫码数据中出现的次数,个体在实名扫码数据中出现的次数与设定的交通卡号在轨道刷卡数据中出现次数保持一致;若实名扫码数据中个体的出现次数小于设定的阈值,则将小于设定阈值的个体数据删除;
S34.建立个体索引表:从个体筛选后的实名扫码数据提取个体信息,去重后给予唯一自增id作为个体索引;
S4.构建轨道刷卡进站稀疏矩阵和扫码进站稀疏矩阵,包括以下步骤:
S41.将轨道刷卡数据中的刷卡进站时间与实名扫码数据中的扫码时间通过下述公式进行离散化,获取时间片索引表:
tindex=ffloor(fut(t)-fut(tmin))/60)
其中,tindex代表时间片索引,fut代表将时间转换为10位时间戳,tmin代表清洗后的轨道刷卡数据和实名扫码数据的最小时间,ffloor代表向下取整;
S42.根据站点索引表和交通卡号索引表构建轨道刷卡进站稀疏矩阵;预处理后的轨道刷卡数据中存在的交通卡号、站点、时间所对应的交通卡号索引、站点索引、时间片索引下的元素为1,其余为0;
S43.根据个体索引表、轨道站点索引表构建扫码进站稀疏矩阵;预处理后的实名扫码数据中存在的个体、站点、时间所对应的交通卡号索引、站点索引、时间片索引下的元素为1,其余为0;
S44.将扫码进站稀疏矩阵向后扩展延伸n个时间片,扩展延伸的矩阵元素为1;
S45.将轨道刷卡进站稀疏矩阵需向前扩展延伸n个时间片,扩展延伸的矩阵元素为0;
S5.将三维稀疏矩阵变换为二维矩阵;
S6.计算轨道刷卡数据和实名扫码数据之间的匹配度,获取交通卡号和个体匹配结果。
2.根据权利要求1所述的一种交通卡号实名匹配方法,其特征在于,S2具体是:包括以下步骤:
S21.通过轨道站点名称和扫码场所名称,通过正则表达式或NLP语义分析对轨道站点名称和扫码场所名称进行匹配;
S22.通过轨道站点和扫码场所之间的距离进行匹配,采用下述公式计算两者距离:
Figure FDA0003971842310000021
其中,lat代表场所纬度,lng代表场所经度,Re代表地球赤道半径;
S23.设定轨道站点和扫码场所之间的距离阈值;当轨道站点和扫码场所满足名称匹配条件且距离小于设定阈值时判断轨道站点和扫码场所存在映射关系。
3.根据权利要求2所述的一种交通卡号实名匹配方法,其特征在于,S5具体是:
采用如下规则进行变换:
(stopindex)*(tindex max+1)+tindex
其中,stopindex代表站点索引,tindex代表时间片索引,tindex max代表轨道刷卡进站数据和扫码进站数据的最大时间片索引。
4.根据权利要求3所述的一种交通卡号实名匹配方法,其特征在于,S6具体是:
通过二维矩阵乘法运算计算轨道刷卡数据和实名扫码数据之间的匹配度,将轨道刷卡进站稀疏矩阵和扫码进站稀疏矩阵相乘,得到的矩阵行索引和列索引分别为交通卡号索引和个体索引,矩阵中每个元素值为交通卡号索引和个体索引匹配度,结合交通卡号索引表和个体索引表获取交通卡号和个体之间的匹配度;
设定匹配度阈值为nmatch,当匹配度大于等于nmatch时,认为卡号匹配成功;
匹配度计算结果若存在一卡对应多人或一人拥有多卡现象时,设定以下规则:
A一个交通卡最多对应一人;
B一人最多拥有nmatch card交通卡;
每个交通卡号选取匹配度最高的对应个体作为该卡持有个体,若大于nmatch card个交通卡号匹配度最高的对应个体为同一个,则认为前nmatch card个匹配度最高的交通卡号为该个体持有卡。
5.一种电子设备,其特征在于,包括存储器和处理器,存储器存储有计算机程序,所述的处理器执行所述计算机程序时实现权利要求1-4任一项所述的一种交通卡号实名匹配方法的步骤。
6.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1-4任一项所述的一种交通卡号实名匹配方法。
CN202211291692.0A 2022-10-21 2022-10-21 一种交通卡号实名匹配方法、电子设备及存储介质 Active CN115359592B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202211291692.0A CN115359592B (zh) 2022-10-21 2022-10-21 一种交通卡号实名匹配方法、电子设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202211291692.0A CN115359592B (zh) 2022-10-21 2022-10-21 一种交通卡号实名匹配方法、电子设备及存储介质

Publications (2)

Publication Number Publication Date
CN115359592A CN115359592A (zh) 2022-11-18
CN115359592B true CN115359592B (zh) 2023-02-14

Family

ID=84008260

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202211291692.0A Active CN115359592B (zh) 2022-10-21 2022-10-21 一种交通卡号实名匹配方法、电子设备及存储介质

Country Status (1)

Country Link
CN (1) CN115359592B (zh)

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102467771A (zh) * 2010-10-29 2012-05-23 国际商业机器公司 用于识别智能卡与移动电话之间的关联关系的系统和方法
CN107657006A (zh) * 2017-09-22 2018-02-02 东南大学 基于时空特性的公共自行车ic卡与地铁ic卡匹配方法
CN108074301A (zh) * 2016-11-15 2018-05-25 方正国际软件(北京)有限公司 一种交通卡的实名制方法及装置
CN110489428A (zh) * 2019-08-26 2019-11-22 上海燧原智能科技有限公司 多维稀疏矩阵压缩方法、解压缩方法、装置、设备及介质
CN111651527A (zh) * 2020-04-21 2020-09-11 高新兴科技集团股份有限公司 基于轨迹相似度的身份关联方法、装置、设备及存储介质
WO2021184640A1 (zh) * 2020-03-16 2021-09-23 平安国际智慧城市科技股份有限公司 基于稀疏矩阵的产品推送方法、装置、计算机设备及介质

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11783344B2 (en) * 2018-08-23 2023-10-10 Mastercard International Incorporated System and methods for obtaining real-time cardholder authentication of a payment transaction

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102467771A (zh) * 2010-10-29 2012-05-23 国际商业机器公司 用于识别智能卡与移动电话之间的关联关系的系统和方法
CN108074301A (zh) * 2016-11-15 2018-05-25 方正国际软件(北京)有限公司 一种交通卡的实名制方法及装置
CN107657006A (zh) * 2017-09-22 2018-02-02 东南大学 基于时空特性的公共自行车ic卡与地铁ic卡匹配方法
CN110489428A (zh) * 2019-08-26 2019-11-22 上海燧原智能科技有限公司 多维稀疏矩阵压缩方法、解压缩方法、装置、设备及介质
WO2021184640A1 (zh) * 2020-03-16 2021-09-23 平安国际智慧城市科技股份有限公司 基于稀疏矩阵的产品推送方法、装置、计算机设备及介质
CN111651527A (zh) * 2020-04-21 2020-09-11 高新兴科技集团股份有限公司 基于轨迹相似度的身份关联方法、装置、设备及存储介质

Also Published As

Publication number Publication date
CN115359592A (zh) 2022-11-18

Similar Documents

Publication Publication Date Title
Ayzel et al. RainNet v1. 0: a convolutional neural network for radar-based precipitation nowcasting
US8306288B2 (en) Automatic identification of fingerprint inpainting target areas
CN110245132B (zh) 数据异常检测方法、装置、计算机可读存储介质和计算机设备
CN110070115B (zh) 一种单像素攻击样本生成方法、装置、设备及存储介质
CN109784316B (zh) 一种追溯地铁闸机逃票的方法、装置及存储介质
CN111860496A (zh) 车牌识别方法、装置、设备及计算机可读存储介质
US20160306885A1 (en) Method and apparatus for determining core word of image cluster description text
CN114078277A (zh) 一人一档的人脸聚类方法、装置、计算机设备及存储介质
CN111079626B (zh) 一种活体指纹识别方法、电子设备及计算机可读存储介质
CN113033524A (zh) 遮挡预测模型训练方法、装置、电子设备及存储介质
CN110674413B (zh) 用户关系挖掘方法、装置、设备和存储介质
CN115359592B (zh) 一种交通卡号实名匹配方法、电子设备及存储介质
CN109710628B (zh) 信息处理方法及装置、系统、计算机及可读存储介质
CN115495498B (zh) 数据关联方法、系统、电子设备及存储介质
CN110930106A (zh) 线上面试系统的信息处理方法、装置和系统
KR20070059607A (ko) 누적 합 기반의 변화점 분석을 이용한 홍채 인식 방법 및그 장치
CN112669163B (zh) 基于大数据和云计算的金融业务管理方法及系统
CN113407760B (zh) 一种用于共享平台的政务数据分析系统
CN113409423A (zh) 一种车牌图像生成方法、系统、装置及存储介质
CN110399399B (zh) 用户分析的方法、装置、电子设备和存储介质
CN109754151A (zh) 基于交易数据的地铁站点识别方法、装置、设备及介质
CN116205726B (zh) 一种贷款风险预测方法、装置、电子设备及存储介质
CN117202106B (zh) 基于信令数据的区域空间场所属性标注方法、系统和介质
CN114418884A (zh) 现场指掌纹图像增强方法、装置及电子设备
JP3415114B2 (ja) 入力情報の分析方法及び入力情報の分析装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant