CN112508541A - 基于培训学员信息数据采集的便携式手机采集软件系统 - Google Patents
基于培训学员信息数据采集的便携式手机采集软件系统 Download PDFInfo
- Publication number
- CN112508541A CN112508541A CN202011612072.3A CN202011612072A CN112508541A CN 112508541 A CN112508541 A CN 112508541A CN 202011612072 A CN202011612072 A CN 202011612072A CN 112508541 A CN112508541 A CN 112508541A
- Authority
- CN
- China
- Prior art keywords
- data
- desensitization
- sensitive
- sensitive data
- information
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000012549 training Methods 0.000 title claims abstract description 72
- 238000003860 storage Methods 0.000 claims abstract description 4
- 238000000586 desensitisation Methods 0.000 claims description 227
- 238000000034 method Methods 0.000 claims description 96
- 238000007726 management method Methods 0.000 claims description 42
- 230000008569 process Effects 0.000 claims description 42
- 230000008520 organization Effects 0.000 claims description 19
- 238000012550 audit Methods 0.000 claims description 18
- 238000005516 engineering process Methods 0.000 claims description 18
- 238000012015 optical character recognition Methods 0.000 claims description 16
- 230000007246 mechanism Effects 0.000 claims description 15
- 230000006870 function Effects 0.000 claims description 10
- 238000004519 manufacturing process Methods 0.000 claims description 10
- 238000004458 analytical method Methods 0.000 claims description 9
- 239000008280 blood Substances 0.000 claims description 9
- 210000004369 blood Anatomy 0.000 claims description 9
- 238000013480 data collection Methods 0.000 claims description 9
- 238000011161 development Methods 0.000 claims description 9
- 230000003068 static effect Effects 0.000 claims description 9
- 238000012360 testing method Methods 0.000 claims description 9
- 238000010367 cloning Methods 0.000 claims description 7
- 230000033228 biological regulation Effects 0.000 claims description 6
- 230000000694 effects Effects 0.000 claims description 6
- 238000012544 monitoring process Methods 0.000 claims description 6
- 238000012545 processing Methods 0.000 claims description 5
- 230000035945 sensitivity Effects 0.000 claims description 5
- 238000009826 distribution Methods 0.000 claims description 4
- 238000012797 qualification Methods 0.000 claims description 4
- 230000005856 abnormality Effects 0.000 claims description 3
- 230000005540 biological transmission Effects 0.000 claims description 3
- 238000009960 carding Methods 0.000 claims description 3
- 230000006378 damage Effects 0.000 claims description 3
- 238000011156 evaluation Methods 0.000 claims description 3
- 230000004927 fusion Effects 0.000 claims description 3
- 238000007499 fusion processing Methods 0.000 claims description 3
- 238000012423 maintenance Methods 0.000 claims description 3
- 238000003058 natural language processing Methods 0.000 claims description 3
- 238000012795 verification Methods 0.000 description 3
- 238000009825 accumulation Methods 0.000 description 1
- 230000006978 adaptation Effects 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000013523 data management Methods 0.000 description 1
- 238000013500 data storage Methods 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 238000009472 formulation Methods 0.000 description 1
- 230000007774 longterm Effects 0.000 description 1
- 239000000203 mixture Substances 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000001629 suppression Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/10—Office automation; Time management
- G06Q10/103—Workflow collaboration or project management
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F21/00—Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
- G06F21/60—Protecting data
- G06F21/62—Protecting access to data via a platform, e.g. using keys or access control rules
- G06F21/6218—Protecting access to data via a platform, e.g. using keys or access control rules to a system of files or objects, e.g. local or distributed file system or database
- G06F21/6245—Protecting personal data, e.g. for financial or medical purposes
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/10—Services
- G06Q50/20—Education
- G06Q50/205—Education administration or guidance
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/40—Document-oriented image-based pattern recognition
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
Landscapes
- Engineering & Computer Science (AREA)
- Business, Economics & Management (AREA)
- Strategic Management (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Human Resources & Organizations (AREA)
- Tourism & Hospitality (AREA)
- Health & Medical Sciences (AREA)
- General Health & Medical Sciences (AREA)
- Economics (AREA)
- General Business, Economics & Management (AREA)
- Educational Technology (AREA)
- Educational Administration (AREA)
- Marketing (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Entrepreneurship & Innovation (AREA)
- Bioethics (AREA)
- Quality & Reliability (AREA)
- Data Mining & Analysis (AREA)
- Medical Informatics (AREA)
- General Engineering & Computer Science (AREA)
- Software Systems (AREA)
- Operations Research (AREA)
- Multimedia (AREA)
- Artificial Intelligence (AREA)
- Databases & Information Systems (AREA)
- Computer Security & Cryptography (AREA)
- Computer Hardware Design (AREA)
- Primary Health Care (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明公开了一种基于培训学员信息数据采集的便携式手机采集软件系统,实现职业技能培训人员信息的快速采集,便于政府监督机构,培训学校,班主任等角色能够快速的通过便携式的手机APP,能够前往培训的乡镇,村落等偏远地区采集当地培训学员/培训意向学员的基础信息,培训意向信息等,并能够将采集到的数据,上传至职业技能培训人员管理系统,实现40项数据采集信息无纸化,有效的解决信息难采集,信息难管理,信息难保存的问题。
Description
技术领域
本发明属于数据采集和管理领域,具体涉及一种基于培训学员信息数据采集的便携式手机采集软件系统。
背景技术
职业技能培训人员管理系统旨在通过信息化的方式提高劳动力的职业技能水平和就业能力,实现培训人员的在培训前、培训中和培训后的信息管理,为培训资金使用审计提供数据支撑,为培训学校培训费用结算资料提供一站式服务。
培训系统包括了培训机构管理、培训业务管理、涵盖了培训机构的录入、培训人员学籍管理、分班、就业情况反馈等十几项功能,能够完成职业培训管理部门对于培训机构的管理、实现对于培训人员培训情况的掌握、和对于培训费用拔付等多方面的业务需求.并且通过身份证读卡器,劳动力数据采集APP等多种方式采集培训人员的信息,在减轻工作人员的工作量的同时保证了信息的准确性;实现对参加培训的人员资格的审核,确保培训补贴能够实名发放。而且通过人员信息的录入,培训前,中,后的数据管理,培训机构工作人员可以将一整套的培训上报资料“一键打印”,减少工作人员资料整理过程与资料收集,存档过程。
发明内容
本发明解决目前学员信息采集难,整理难,归档难的问题,提供一种采集效率高、数据精准度高、减少了政府监督机构工作的基于培训学员信息数据采集的便携式手机采集软件系统。
本发明的技术方案是:一种基于培训学员信息数据采集的便携式手机采集软件系统,包括信息采集系统、职业技能培训人员管理系统;
所述信息采集系统包括OCR识别程序与身份证蓝牙模块,通过OCR识别程序与身份证蓝牙模块适配可进行身份证的识别,智能化读取身份证芯片数据,快速匹配录入学员基础信息,同时调用移动客户端的摄像头,拍摄学员身份证实体照片、学员户口本实体照片以及其他需要采集的图片进行存储;
所述职业技能培训人员管理系统用于存储和管理学员的基础信息数据,并根据移动客户端生完信息采集系统上传的信息进行归集与整理,并用于进行培训前的学员资质审查,培训中的实名制监管,培训后的报表导出、在线审核等功能提供数据通道;同时本移动客户端采集软件采用数据安全及隐私保护方向的安全技术、AI技术长期积累保障整体数据安全可控。
数据采集后数据信息存储至云端的数据库管理系统,存放在巨量资料的文件夹中,该文件夹位于数据库管理系统的云端上;对敏感数据进行数据脱敏,通过脱敏算法将敏感数据进行遮蔽、变形,将敏感级别降低后对外发放,或供访问使用;针对云端数据的调度治理分为数据调度、血缘分析和权限管理,血缘分析是保证数据融合的一个手段,通过血缘分析实现数据融合处理的可追溯;最后数据经过隐私保护形成数据报表、数据查询、数据地图和AI模型。
具体地,所述身份证OCR识别程序包括OCR识别模块,支持Android、iOS两种移动操作系统;采用手机、平板电脑等带有摄像头的设备拍摄身份证原件,通过OCR识别模块对身份证信息进行提取,通过身份证蓝牙模块对身份信息进行识别。
具体地,所述数据数据安全及隐私保护的安全技术采用MPC、TEE、DP技术;AI技术采用图像识别、自然语言处理技术。
更具体地,所述基于MPC技术,用户可以发布和部署与应用程序相关、涉及到多源数据输入,由两个主要部分组成,一部分是应用程序本身, 另一部分则提供了辅助信息,如MPC协议参数、数据源发现参数等。
具体地,所述敏感数据分为高度敏感数据、中度敏感数据和非敏感数据。
更具体地,所述数据脱敏的过程为:发现敏感数据、标识敏感数据、确定脱敏方法、定义脱敏规则、执行脱敏操作和评估脱敏效果;
所述发现敏感数据首先定义数据脱敏工作执行的范围,在该范围内执行敏感数据的发现工作;通过数据表名称、字段名称、数据记录内容、数据表备注、数据文件内容等直接匹配或正则表达式匹配的方式发现敏感数据;确保数据引用的完整性,如保证数据库的引用完整性约束;数据发现手段应支持主流的数据库系统、数据仓库系统、文件系统,同时应支持云计算环境下的主流新型存储系统;尽量利用自动化工具执行数据发现工作,并降低该过程对生产系统的影响;数据发现工具具有扩展机制,可根据业务需要自定义敏感数据的发现逻辑;固化常用的敏感数据发现规则,如身份证号、手机号等敏感数据的发现规则,避免重复定义数据发现规则;
所述标识敏感数据指在通过业务梳理发现了敏感数据之后,需要对敏感数据进行标识,包括标识敏感数据的位置、敏感数据的格式等信息,以便后续对敏感数据的访问、传输和处理进行跟踪和监督;
在标识敏感数据时,应该尽早在数据的收集阶段就对敏感数据进行识别和标识,这样便于在数据的整个生命周期阶 段对敏感数据进行有效管理;敏感数据的标识方法必须考虑到便捷性和安全性,使得标识后的数据很容易被识别,同时,要确保敏感数据标识信息不容易被恶意攻击者删除和篡改;敏感数据的标识方法应支持静态数据的敏感标识以及动态流数据的敏感标识;
所述确定脱敏方法指在对标识后的敏感数据进行脱敏前,应首先确定脱敏方法,可选的数据脱敏方案包括静态数据脱敏和动态数据脱敏;不同的数据脱敏方案对数据源的影响不同,脱敏的时效性也不一样;脱敏方案确定后,就可以选择对应的数据脱敏工具;
在确定数据脱敏方案时,静态数据脱敏方法是对原始数据进行一次脱敏后,脱敏后的结果数据可以多次使用,非常适合使用场景比较单一的场合;动态数据脱敏方法只是在敏感数据显示时,针对不同用户需求,对显示数据进行屏蔽处理的数据脱敏方式,动态数据脱敏方法要求系统有安全措施确保用户不能够绕过数据脱敏层次直接接触敏感数据;动态数据脱敏比较适合用户需求不确定、使用场景复杂的情形;
所述定义脱敏规则指针对组织机构内已识别和标识出的敏感数据,组织机构需建立敏感数据在相关业务场景下的脱敏规则;在敏感数据生命周期识别的基础上,明确存在数据脱敏需求的业务场景,并结合行业法规的要求和业务场景的需求,制定相应业务场景下有效的数据脱敏规则;
在该过程中,识别组织机构业务开展过程中应遵循的个人隐私保护、数据安全保护等关键领域国内外法规、行业监管规范或标准,以此作为数据脱敏规则必须遵循的原则;对已识别出的敏感数据执行生命周期,如产生、采集、使用、交换、销毁等流程的梳理,明确在生命周期各阶段,用户对数据的访问需求和当前的权限设置情况,分析整理出存在数据脱敏需求的业务场景;例如,在梳理过程中,会发现存在对敏感数据的访问需求和访问权限不匹配的情况,用户仅需获取敏感数据中部分内容即可,但却拥有对敏感数据内容全部的访权限,因此该业务场景存在敏感数据的脱敏需求;进一步分析存在数据脱敏需求的业务场景;
数据脱敏工具应提供扩展机制,从而让用户可根据需求自定义脱敏的方法;通过数据脱敏工具选择数据脱敏方法时,脱敏工具中应对各类方法的使用进行详细的说明,说明应包括但不限于规则的实现原理、数据引用完整性影响、数据语义完整性影响、数据分布频率影响、约束和限制等,以支撑脱敏工具的使用者在选择脱敏方式时做出正确的选择;应固化常用的敏感数据脱敏规则,例如身份证号、手机号等的常用脱敏规则,避免数据脱敏项目实施过程中重复定义数据脱敏规则;
所述执行脱敏操作根据已定义的数据脱敏规则、以及数据脱敏工作的流程和数据脱敏工具的运维管理制度,在实际业务运营过程中执行数据脱敏,可包括条数据脱敏和块数据脱敏;条数据脱敏是对单条数据根据脱敏规则实施脱敏,块数据脱敏是对聚合数据实施脱敏;在日常的脱敏工作中,监控分析数据脱敏过程的稳定性、以及对业务的影响性,同时对脱敏工作开展定期的安全审计,已发现脱敏工作中存在的安全风险;
在该过程中,支持从数据源克隆数据到新环境,并在新环境中进行脱敏过程的执行;也支持在数据源端直接进行脱敏;对脱敏任务的管理,可考虑采用自动化管理的方式提升任务管理效率,如定时、条件设置的方式触发脱敏任务的执行;执行对脱敏任务的运行监控,关注任务执行的稳定性、以及脱敏任务对业务的影响;设置专人定期对数据脱敏的相关日志记录进行安全审计,审计应重点关注高权限账号的操作日志和脱敏工作的记录日志;发布审计报告,并跟进审计中发现的例外和异常;
所述评估脱敏效果通过收集、整理数据脱敏工作执行的数据,对数据脱敏的前期工作开展情况进行反馈,从而优化相关规程、明确数据脱敏过程中应关注的事项;
在该过程中,利用测试工具评估脱敏后数据对应用系统的功能、性能的影响,从而明确对整体业务服务水平的影响;测试负载应尽量保证与生产环境一致,应尽量提供从生产环境克隆数据访问负载到脱 敏系统进行回放测试的功能;根据组织业务发展的情况和脱敏工作执行的反馈,优化数据脱敏工作开展的规程,旨在全组织机构范围内增强数据安全能力并满足合规要求。
与现有技术比较,本发明的有益效果是:本发明为方便职业技能培训学员数据采集、提高学员信息的采集效率,学员信息采集的数据准确度,解决目前学员信息采集难,整理难,归档难的问题,总结出一套基于互联网的职业技能培训人员信息采集模式。该模式将培训人员信息字段进行归集,整理,分类为个人基础信息录入,调用手机相机采集身份证照片、户口本照片与其他相关照片录入,通过手机相机采集人脸实名制照片进行认证后,将个人信息上传至职业技能培训人员管理系统,有效的减少了政府监督机构,培训学校采集人员的基础性工作。
附图说明
图1是本系统软件流程结构图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明的部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其它实施例,都属于本发明保护的范围。
如图1所示,一种基于培训学员信息数据采集的便携式手机采集软件系统,包括信息采集系统、职业技能培训人员管理系统;
信息采集系统包括OCR识别程序与身份证蓝牙模块,通过OCR识别程序与身份证蓝牙模块适配可进行身份证的识别,智能化读取身份证芯片数据,快速匹配录入学员基础信息,同时调用移动客户端的摄像头,拍摄学员身份证实体照片、学员户口本实体照片以及其他需要采集的图片进行存储;身份证OCR识别程序包括OCR识别模块,支持Android、iOS两种移动操作系统;采用手机、平板电脑等带有摄像头的设备拍摄身份证原件,通过OCR识别模块对身份证信息进行提取,通过身份证蓝牙模块对身份信息进行识别。
职业技能培训人员管理系统用于存储和管理学员的基础信息数据,并根据移动客户端生完信息采集系统上传的信息进行归集与整理,并用于进行培训前的学员资质审查,培训中的实名制监管,培训后的报表导出、在线审核等功能提供数据通道;同时本移动客户端采集软件采用数据安全及隐私保护方向的安全技术、AI技术长期积累保障整体数据安全可控,上述数据数据安全及隐私保护的安全技术采用MPC、TEE、DP技术;AI技术采用图像识别、自然语言处理技术。基于MPC技术,用户可以发布和部署与应用程序相关、涉及到多源数据输入,由两个主要部分组成,一部分是应用程序本身, 另一部分则提供了辅助信息, 如MPC协议参数、数据源发现参数等。
数据采集后数据信息存储至云端的数据库管理系统,存放在巨量资料的文件夹中,该文件夹位于数据库管理系统的云端上;对敏感数据进行数据脱敏,通过脱敏算法将敏感数据进行遮蔽、变形,将敏感级别降低后对外发放,或供访问使用;针对云端数据的调度治理分为数据调度、血缘分析和权限管理,血缘分析是保证数据融合的一个手段,通过血缘分析实现数据融合处理的可追溯;最后数据经过隐私保护形成数据报表、数据查询、数据地图和AI模型。
敏感数据从真实性效验需注意原数据的格式、类型、依存关系、语义完整性、数据统计特征、频率分布、唯一识别性;从数据脱敏稳定性上需保证在输入条件一致时,脱敏输出的结果是稳定统一的;从敏感识别上先梳理所有信息分类、内容、特征并标注敏感程度、泄露后的后果、应急预案;从安全可控上需要保证数据脱敏信息被隐藏和处理,保证原始数据的统计特征和结构特征不被破坏;从安全审计上需要保证各个阶段加入安全审计机制、严格、详细的记录数据处理过程信息,形成完整的数据处理记录;数据脱敏常用方法包括对数据截断、数据日期偏移取整泛化技术,对关键字符使用掩码替换的抑制技术,对原始数据进行加密、重排、替换、重写、均化、散列的扰乱技术。
为了有效开展数据脱敏工作,必须对组织所拥有的数据进行梳理和分类,建议将数据分为高度敏感数据、中度敏感数据和非敏感数据;同时,组织机构需首先分析建立完整的敏感数据位置和关系库,确保数据脱敏工作能够充分考虑到必须的业务范围、脱敏后数据对原数据业务特性的继承(如保持原数据间的依赖关系)。
基于敏感数据分类分级制度,一方面建立有效的数据发现手段,在组织机构完整的数据范围 内查找并发现敏感数据;另一方面明确敏感数据结构化或非结构化的数据表现形态,如敏感数据固定的字段。
数据脱敏的过程为:发现敏感数据、标识敏感数据、确定脱敏方法、定义脱敏规则、执行脱敏操作和评估脱敏效果;
发现敏感数据首先定义数据脱敏工作执行的范围,在该范围内执行敏感数据的发现工作;通过数据表名称、字段名称、数据记录内容、数据表备注、数据文件内容等直接匹配或正则表达式匹配的方式发现敏感数据;确保数据引用的完整性,如保证数据库的引用完整性约束;数据发现手段应支持主流的数据库系统、数据仓库系统、文件系统,同时应支持云计算环境下的主流新型存储系统;尽量利用自动化工具执行数据发现工作,并降低该过程对生产系统的影响;数据发现工具具有扩展机制,可根据业务需要自定义敏感数据的发现逻辑;固化常用的敏感数据发现规则,如身份证号、手机号等敏感数据的发现规则,避免重复定义数据发现规则;
所述标识敏感数据指在通过业务梳理发现了敏感数据之后,需要对敏感数据进行标识,包括标识敏感数据的位置、敏感数据的格式等信息,以便后续对敏感数据的访问、传输和处理进行跟踪和监督;敏感数据的标识方法应该确保敏感数据标识信息能够随敏感数据一起流动,并不易于删除和篡改,从而可以对敏感数据进行有效跟踪,以确保敏感数据的安全合规性;
在标识敏感数据时,应该尽早在数据的收集阶段就对敏感数据进行识别和标识,这样便于在数据的整个生命周期阶段对敏感数据进行有效管理;敏感数据的标识方法必须考虑到便捷性和安全性,使得标识后的数据很容易被识别,同时,要确保敏感数据标识信息不容易被恶意攻击者删除和篡改;敏感数据的标识方法应支持静态数据的敏感标识以及动态流数据的敏感标识;
确定脱敏方法指在对标识后的敏感数据进行脱敏前,应首先确定脱敏方法,可选的数据脱敏方案包括静态数据脱敏和动态数据脱敏;不同的数据脱敏方案对数据源的影响不同,脱敏的时效性也不一样;脱敏方案确定后,就可以选择对应的数据脱敏工具;
在确定数据脱敏方案时,静态数据脱敏方法是对原始数据进行一次脱敏后,脱敏后的结果数据可以多次使用,非常适合使用场景比较单一的场合;动态数据脱敏方法只是在敏感数据显示时,针对不同用户需求,对显示数据进行屏蔽处理的数据脱敏方式,动态数据脱敏方法要求系统有安全措施确保用户不能够绕过数据脱敏层次直接接触敏感数据;动态数据脱敏比较适合用户需求不确定、使用场景复杂的情形;
所述定义脱敏规则指针对组织机构内已识别和标识出的敏感数据,组织机构需建立敏感数据在相关业务场景下的脱敏规则;在敏感数据生命周期识别的基础上,明确存在数据脱敏需求的业务场景,并结合行业法规的要求和业务场景的需求,制定相应业务场景下有效的数据脱敏规则;
在该过程中,识别组织机构业务开展过程中应遵循的个人隐私保护、数据安全保护等关键领域国内外法规、行业监管规范或标准,以此作为数据脱敏规则必须遵循的原则;对已识别出的敏感数据执行生命周期,如产生、采集、使用、交换、销毁等流程的梳理,明确在生命周期各阶段,用户对数据的访问需求和当前的权限设置情况,分析整理出存在数据脱敏需求的业务场景;例如,在梳理过程中,会发现存在对敏感数据的访问需求和访问权限不匹配的情况,用户仅需获取敏感数据中部分内容即可,但却拥有对敏感数据内容全部的访权限,因此该业务场景存在敏感数据的脱敏需求;进一步分析存在数据脱敏需求的业务场景;在“最小够用”的原则下明确待脱敏的数据内容、 符合业务需求的脱敏方式,以及该业务的服务水平方面的要求,以便于脱敏规则的制定;
数据脱敏工具应提供扩展机制,从而让用户可根据需求自定义脱敏的方法;通过数据脱敏工具选择数据脱敏方法时,脱敏工具中应对各类方法的使用进行详细的说明,说明应包括但不限于规则的实现原理、数据引用完整性影响、数据语义完整性影响、数据分布频率影响、约束和限制等,以支撑脱敏工具的使用者在选择脱敏方式时做出正确的选择;应固化常用的敏感数据脱敏规则,例如身份证号、手机号等的常用脱敏规则,避免数据脱敏项目实施过程中重复定义数据脱敏规则;
所述执行脱敏操作根据已定义的数据脱敏规则、以及数据脱敏工作的流程和数据脱敏工具的运维管理制度,在实际业务运营过程中执行数据脱敏,可包括条数据脱敏和块数据脱敏;条数据脱敏是对单条数据根据脱敏规则实施脱敏,块数据脱敏是对聚合数据实施脱敏;在日常的脱敏工作中,监控分析数据脱敏过程的稳定性、以及对业务的影响性,同时对脱敏工作开展定期的安全审计,已发现脱敏工作中存在的安全风险;
在该过程中,支持从数据源克隆数据到新环境,如从生产环境、备份库克隆数据到新环境,并在新环境中进行脱敏过程的执行;也支持在数据源端直接进行脱敏;对脱敏任务的管理,可考虑采用自动化管理的方式提升任务管理效率,如定时、条件设置的方式触发脱敏任务的执行;执行对脱敏任务的运行监控,关注任务执行的稳定性、以及脱敏任务对业务的影响;设置专人定期对数据脱敏的相关日志记录进行安全审计,审计应重点关注高权限账号的操作日志和脱敏工作的记录日志;发布审计报告,并跟进审计中发现的例外和异常;
所述评估脱敏效果通过收集、整理数据脱敏工作执行的数据,对数据脱敏的前期工作开展情况进行反馈,从而优化相关规程、明确数据脱敏过程中应关注的事项;
在该过程中,利用测试工具评估脱敏后数据对应用系统的功能、性能的影响,从而明确对整体业务服务水平的影响;测试负载应尽量保证与生产环境一致,应尽量提供从生产环境克隆数据访问负载到脱 敏系统进行回放测试的功能;根据组织业务发展的情况和脱敏工作执行的反馈,优化数据脱敏工作开展的规程,旨在全组织机构范围内增强数据安全能力并满足合规要求。
软件通过与系统之间的联动根据权限账号进行数据配置,用户可根据配置的账号密码进行登录,软件通过嵌入OCR识别程序与身份证蓝牙模块适配可进行身份证的识别,智能化读取身份证芯片数据,快速匹配录入学员基础信息,同时调用手机摄像头,拍摄学员身份证实体照片、学员户口本实体照片以及其他需要采集的图片进行存储,软件通过调用手机摄像头动态采集学员的人像图片,通过人像图片获取人像关键帧并与公安接口进行实名制认证,最终通过认证后将学员信息动态添加至职业技能培训人员管理系统进行数据存储。
实现职业技能培训人员信息的快速采集,便于政府监督机构,培训学校,班主任等角色能够快速的通过便携式的手机APP,能够前往培训的乡镇,村落等偏远地区采集当地培训学员/培训意向学员的基础信息,培训意向信息等,并能够将采集到的数据,上传至职业技能培训人员管理系统,实现40项数据采集信息无纸化,有效的解决信息难采集,信息难管理,信息难保存的问题。
以上公开的本发明优选实施例只是用于帮助阐述本发明。优选实施例并没有详尽叙述所有的细节,也不限制该发明仅为所述的具体实施方式。显然,根据本说明书的内容,可作很多的修改和变化。本说明书选取并具体描述实施例,是为了更好地解释本发明的原理和实际应用,从而使所属技术领域技术人员能很好地理解和利用本发明。
Claims (6)
1.一种基于培训学员信息数据采集的便携式手机采集软件系统,其特征在于:包括信息采集系统、职业技能培训人员管理系统;
所述信息采集系统包括OCR识别程序与身份证蓝牙模块,通过OCR识别程序与身份证蓝牙模块适配可进行身份证的识别,智能化读取身份证芯片数据,快速匹配录入学员基础信息,同时调用移动客户端的摄像头,拍摄学员身份证实体照片、学员户口本实体照片以及其他需要采集的图片进行存储;
所述职业技能培训人员管理系统用于存储和管理学员的基础信息数据,并根据移动客户端生完信息采集系统上传的信息进行归集与整理,并用于进行培训前的学员资质审查,培训中的实名制监管,培训后的报表导出、在线审核等功能提供数据通道;同时本移动客户端采集软件采用数据安全及隐私保护方向的安全技术、AI技术长期积累保障整体数据安全可控;
数据采集后数据信息存储至云端的数据库管理系统,存放在巨量资料的文件夹中,该文件夹位于数据库管理系统的云端上;对敏感数据进行数据脱敏,通过脱敏算法将敏感数据进行遮蔽、变形,将敏感级别降低后对外发放,或供访问使用;针对云端数据的调度治理分为数据调度、血缘分析和权限管理,血缘分析是保证数据融合的一个手段,通过血缘分析实现数据融合处理的可追溯;最后数据经过隐私保护形成数据报表、数据查询、数据地图和AI模型。
2.根据权利要求1所述的基于培训学员信息数据采集的便携式手机采集软件系统,其特征在于:所述身份证OCR识别程序包括OCR识别模块,支持Android、iOS两种移动操作系统;采用手机、平板电脑等带有摄像头的设备拍摄身份证原件,通过OCR识别模块对身份证信息进行提取,通过身份证蓝牙模块对身份信息进行识别。
3.根据权利要求1所述的基于培训学员信息数据采集的便携式手机采集软件系统,其特征在于:所述数据数据安全及隐私保护的安全技术采用MPC、TEE、DP技术;AI技术采用图像识别、自然语言处理技术。
4.根据权利要求3所述的基于培训学员信息数据采集的便携式手机采集软件系统,其特征在于:所述基于MPC技术,用户可以发布和部署与应用程序相关、涉及到多源数据输入,由两个主要部分组成,一部分是应用程序本身, 另一部分则提供了辅助信息, 如MPC协议参数、数据源发现参数等。
5.根据权利要求1所述的基于培训学员信息数据采集的便携式手机采集软件系统,其特征在于:所述敏感数据分为高度敏感数据、中度敏感数据和非敏感数据。
6.根据权利要求1或5所述的基于培训学员信息数据采集的便携式手机采集软件系统,其特征在于:所述数据脱敏的过程为:发现敏感数据、标识敏感数据、确定脱敏方法、定义脱敏规则、执行脱敏操作和评估脱敏效果;
所述发现敏感数据首先定义数据脱敏工作执行的范围,在该范围内执行敏感数据的发现工作;通过数据表名称、字段名称、数据记录内容、数据表备注、数据文件内容等直接匹配或正则表达式匹配的方式发现敏感数据;确保数据引用的完整性,如保证数据库的引用完整性约束;数据发现手段应支持主流的数据库系统、数据仓库系统、文件系统,同时应支持云计算环境下的主流新型存储系统;尽量利用自动化工具执行数据发现工作,并降低该过程对生产系统的影响;数据发现工具具有扩展机制,可根据业务需要自定义敏感数据的发现逻辑;固化常用的敏感数据发现规则,如身份证号、手机号等敏感数据的发现规则,避免重复定义数据发现规则;
所述标识敏感数据指在通过业务梳理发现了敏感数据之后,需要对敏感数据进行标识,包括标识敏感数据的位置、敏感数据的格式等信息,以便后续对敏感数据的访问、传输和处理进行跟踪和监督;
在标识敏感数据时,应该尽早在数据的收集阶段就对敏感数据进行识别和标识,这样便于在数据的整个生命周期阶 段对敏感数据进行有效管理;敏感数据的标识方法必须考虑到便捷性和安全性,使得标识后的数据很容易被识别,同时,要确保敏感数据标识信息不容易被恶意攻击者删除和篡改;敏感数据的标识方法应支持静态数据的敏感标识以及动态流数据的敏感标识;
所述确定脱敏方法指在对标识后的敏感数据进行脱敏前,应首先确定脱敏方法,可选的数据脱敏方案包括静态数据脱敏和动态数据脱敏;不同的数据脱敏方案对数据源的影响不同,脱敏的时效性也不一样;脱敏方案确定后,就可以选择对应的数据脱敏工具;
在确定数据脱敏方案时,静态数据脱敏方法是对原始数据进行一次脱敏后,脱敏后的结果数据可以多次使用,非常适合使用场景比较单一的场合;动态数据脱敏方法只是在敏感数据显示时,针对不同用户需求,对显示数据进行屏蔽处理的数据脱敏方式,动态数据脱敏方法要求系统有安全措施确保用户不能够绕过数据脱敏层次直接接触敏感数据;动态数据脱敏比较适合用户需求不确定、使用场景复杂的情形;
所述定义脱敏规则指针对组织机构内已识别和标识出的敏感数据,组织机构需建立敏感数据在相关业务场景下的脱敏规则;在敏感数据生命周期识别的基础上,明确存在数据脱敏需求的业务场景,并结合行业法规的要求和业务场景的需求,制定相应业务场景下有效的数据脱敏规则;
在该过程中,识别组织机构业务开展过程中应遵循的个人隐私保护、数据安全保护等关键领域国内外法规、行业监管规范或标准,以此作为数据脱敏规则必须遵循的原则;对已识别出的敏感数据执行生命周期,如产生、采集、使用、交换、销毁等流程的梳理,明确在生命周期各阶段,用户对数据的访问需求和当前的权限设置情况,分析整理出存在数据脱敏需求的业务场景;例如,在梳理过程中,会发现存在对敏感数据的访问需求和访问权限不匹配的情况,用户仅需获取敏感数据中部分内容即可,但却拥有对敏感数据内容全部的访权限,因此该业务场景存在敏感数据的脱敏需求;进一步分析存在数据脱敏需求的业务场景;
数据脱敏工具应提供扩展机制,从而让用户可根据需求自定义脱敏的方法;通过数据脱敏工具选择数据脱敏方法时,脱敏工具中应对各类方法的使用进行详细的说明,说明应包括但不限于规则的实现原理、数据引用完整性影响、数据语义完整性影响、数据分布频率影响、约束和限制等,以支撑脱敏工具的使用者在选择脱敏方式时做出正确的选择;应固化常用的敏感数据脱敏规则,例如身份证号、手机号等的常用脱敏规则,避免数据脱敏项目实施过程中重复定义数据脱敏规则;
所述执行脱敏操作根据已定义的数据脱敏规则、以及数据脱敏工作的流程和数据脱敏工具的运维管理制度,在实际业务运营过程中执行数据脱敏,可包括条数据脱敏和块数据脱敏;条数据脱敏是对单条数据根据脱敏规则实施脱敏,块数据脱敏是对聚合数据实施脱敏;在日常的脱敏工作中,监控分析数据脱敏过程的稳定性、以及对业务的影响性,同时对脱敏工作开展定期的安全审计,已发现脱敏工作中存在的安全风险;
在该过程中,支持从数据源克隆数据到新环境,并在新环境中进行脱敏过程的执行;也支持在数据源端直接进行脱敏;对脱敏任务的管理,可考虑采用自动化管理的方式提升任务管理效率,如定时、条件设置的方式触发脱敏任务的执行;执行对脱敏任务的运行监控,关注任务执行的稳定性、以及脱敏任务对业务的影响;设置专人定期对数据脱敏的相关日志记录进行安全审计,审计应重点关注高权限账号的操作日志和脱敏工作的记录日志;发布审计报告,并跟进审计中发现的例外和异常;
所述评估脱敏效果通过收集、整理数据脱敏工作执行的数据,对数据脱敏的前期工作开展情况进行反馈,从而优化相关规程、明确数据脱敏过程中应关注的事项;
在该过程中,利用测试工具评估脱敏后数据对应用系统的功能、性能的影响,从而明确对整体业务服务水平的影响;测试负载应尽量保证与生产环境一致,应尽量提供从生产环境克隆数据访问负载到脱 敏系统进行回放测试的功能;根据组织业务发展的情况和脱敏工作执行的反馈,优化数据脱敏工作开展的规程,旨在全组织机构范围内增强数据安全能力并满足合规要求。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011612072.3A CN112508541A (zh) | 2020-12-30 | 2020-12-30 | 基于培训学员信息数据采集的便携式手机采集软件系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011612072.3A CN112508541A (zh) | 2020-12-30 | 2020-12-30 | 基于培训学员信息数据采集的便携式手机采集软件系统 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN112508541A true CN112508541A (zh) | 2021-03-16 |
Family
ID=74952303
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202011612072.3A Pending CN112508541A (zh) | 2020-12-30 | 2020-12-30 | 基于培训学员信息数据采集的便携式手机采集软件系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112508541A (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116186601A (zh) * | 2022-12-15 | 2023-05-30 | 广州光点信息科技股份有限公司 | 一种数据分级分类的方法和装置 |
CN116975136A (zh) * | 2023-09-25 | 2023-10-31 | 北京众图识人科技有限公司 | 应用程序接口的处理方法、装置、终端设备及存储介质 |
Citations (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20130080164A1 (en) * | 2011-09-28 | 2013-03-28 | Google Inc. | Selective Feedback For Text Recognition Systems |
CN105718972A (zh) * | 2016-01-15 | 2016-06-29 | 卢怀农 | 一种信息智能采集方法 |
CN105800410A (zh) * | 2016-04-12 | 2016-07-27 | 天津康途科技有限公司 | 一种采用网络营销的电梯维保综合性管理系统 |
CN106384491A (zh) * | 2016-08-25 | 2017-02-08 | 嘉洋智慧安全生产科技发展(北京)有限公司 | 基于移动智能设备的hse数据采集仪 |
CN206584354U (zh) * | 2017-02-28 | 2017-10-24 | 江苏中育优教科技发展有限公司 | 基于图像识别的体检信息采集系统 |
CN108011872A (zh) * | 2017-11-23 | 2018-05-08 | 深圳航信德诚科技有限公司 | 个人信息智能采集方法和系统 |
KR20190099617A (ko) * | 2018-02-19 | 2019-08-28 | 이우성 | 원거리 경사각 스캔이 가능한 ocr 기능이 있는 펜과 블루투스로 연결된 휴대용 전자기기의 전자 사전 검색 장치 |
CN111177785A (zh) * | 2019-12-31 | 2020-05-19 | 广东鸿数科技有限公司 | 一种基于企业的业务系统的隐私数据的脱敏处理方法 |
CN111190881A (zh) * | 2019-11-13 | 2020-05-22 | 深圳市华傲数据技术有限公司 | 一种数据治理方法和系统 |
CN111292569A (zh) * | 2020-03-30 | 2020-06-16 | 广西通途科技有限公司 | 职业技能远程培训与考试系统 |
CN111600890A (zh) * | 2020-05-18 | 2020-08-28 | 广东电网有限责任公司惠州供电局 | 基于大数据的网络安全感知系统 |
US10817619B1 (en) * | 2017-12-05 | 2020-10-27 | Jagannadha babu Kolli | Method and system for securing data stored in a cloud-based software system |
-
2020
- 2020-12-30 CN CN202011612072.3A patent/CN112508541A/zh active Pending
Patent Citations (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20130080164A1 (en) * | 2011-09-28 | 2013-03-28 | Google Inc. | Selective Feedback For Text Recognition Systems |
CN105718972A (zh) * | 2016-01-15 | 2016-06-29 | 卢怀农 | 一种信息智能采集方法 |
CN105800410A (zh) * | 2016-04-12 | 2016-07-27 | 天津康途科技有限公司 | 一种采用网络营销的电梯维保综合性管理系统 |
CN106384491A (zh) * | 2016-08-25 | 2017-02-08 | 嘉洋智慧安全生产科技发展(北京)有限公司 | 基于移动智能设备的hse数据采集仪 |
CN206584354U (zh) * | 2017-02-28 | 2017-10-24 | 江苏中育优教科技发展有限公司 | 基于图像识别的体检信息采集系统 |
CN108011872A (zh) * | 2017-11-23 | 2018-05-08 | 深圳航信德诚科技有限公司 | 个人信息智能采集方法和系统 |
US10817619B1 (en) * | 2017-12-05 | 2020-10-27 | Jagannadha babu Kolli | Method and system for securing data stored in a cloud-based software system |
KR20190099617A (ko) * | 2018-02-19 | 2019-08-28 | 이우성 | 원거리 경사각 스캔이 가능한 ocr 기능이 있는 펜과 블루투스로 연결된 휴대용 전자기기의 전자 사전 검색 장치 |
CN111190881A (zh) * | 2019-11-13 | 2020-05-22 | 深圳市华傲数据技术有限公司 | 一种数据治理方法和系统 |
CN111177785A (zh) * | 2019-12-31 | 2020-05-19 | 广东鸿数科技有限公司 | 一种基于企业的业务系统的隐私数据的脱敏处理方法 |
CN111292569A (zh) * | 2020-03-30 | 2020-06-16 | 广西通途科技有限公司 | 职业技能远程培训与考试系统 |
CN111600890A (zh) * | 2020-05-18 | 2020-08-28 | 广东电网有限责任公司惠州供电局 | 基于大数据的网络安全感知系统 |
Non-Patent Citations (1)
Title |
---|
叶水勇: "数据脱敏全生命周期过程研究", 《电力与能源》, vol. 40, no. 6, 28 December 2019 (2019-12-28), pages 723 - 727 * |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116186601A (zh) * | 2022-12-15 | 2023-05-30 | 广州光点信息科技股份有限公司 | 一种数据分级分类的方法和装置 |
CN116975136A (zh) * | 2023-09-25 | 2023-10-31 | 北京众图识人科技有限公司 | 应用程序接口的处理方法、装置、终端设备及存储介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Joy et al. | Plagiarism in programming assignments | |
CN108520464B (zh) | 一种基于传统区块链的实时自动化监管报告系统 | |
US9171072B2 (en) | System and method for real-time dynamic measurement of best-estimate quality levels while reviewing classified or enriched data | |
CN108536521B (zh) | 基于仿真平台离线环境核对方法及装置 | |
CN103136471A (zh) | 一种恶意Android应用程序检测方法和系统 | |
CN114117171A (zh) | 一种基于赋能思维的工程档案智能收整方法及系统 | |
CN112508541A (zh) | 基于培训学员信息数据采集的便携式手机采集软件系统 | |
CN112070338A (zh) | 一种企业内部辅助审计方法 | |
CN113408890A (zh) | 基于人工智能的产业投资项目后评价报告生成方法和系统 | |
CN112446555A (zh) | 一种风险识别方法、装置及设备 | |
CN113190501A (zh) | 水利水电工程质量验评电子文件形成及归档方法 | |
CN106355489A (zh) | 一种面向管理的数据中心系统及数据处理方法 | |
CN115186025A (zh) | 可视化报表的自动配置方法、系统及设备 | |
CN115221380A (zh) | 一种城建档案的批量管理方法、系统和平台 | |
WO2024108973A1 (zh) | 一种面向建筑业企业的信用评价方法 | |
CN108897633A (zh) | 一种基于机器数据的故障诊断方法与装置 | |
US20210142233A1 (en) | Systems and methods for process mining using unsupervised learning | |
Chun | An AI framework for the automatic assessment of e-government forms | |
CN116228402A (zh) | 一种金融征信特征仓库技术支持系统 | |
CN117009509A (zh) | 数据安全分级方法、装置、设备、存储介质和程序产品 | |
CN115719289A (zh) | 一种房屋数据的处理方法、装置、设备及介质 | |
CN115630404A (zh) | 一种数据安全治理服务方法 | |
Chen et al. | Research and Construction of University Data Governance Platform Based on Smart Campus Environment | |
CN112380264A (zh) | 一种基于个人全生命周期的政策解析和匹配的方法及装置 | |
Yang | Human resource big data analysis and decision making of group enterprises based on cloud platform |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |