CN116842093A - 一种用于大规模用户筛查的数据采集方法及系统 - Google Patents

一种用于大规模用户筛查的数据采集方法及系统 Download PDF

Info

Publication number
CN116842093A
CN116842093A CN202310694007.7A CN202310694007A CN116842093A CN 116842093 A CN116842093 A CN 116842093A CN 202310694007 A CN202310694007 A CN 202310694007A CN 116842093 A CN116842093 A CN 116842093A
Authority
CN
China
Prior art keywords
user
identity card
information
card information
face recognition
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202310694007.7A
Other languages
English (en)
Inventor
谷尧
马珠江
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Zhejiang Naodong Aurora Medical Technology Co ltd
Original Assignee
Zhejiang Naodong Aurora Medical Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Zhejiang Naodong Aurora Medical Technology Co ltd filed Critical Zhejiang Naodong Aurora Medical Technology Co ltd
Priority to CN202310694007.7A priority Critical patent/CN116842093A/zh
Publication of CN116842093A publication Critical patent/CN116842093A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/26Visual data mining; Browsing structured data
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/22Indexing; Data structures therefor; Storage structures
    • G06F16/2219Large Object storage; Management thereof
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F21/00Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
    • G06F21/30Authentication, i.e. establishing the identity or authorisation of security principals
    • G06F21/31User authentication
    • G06F21/32User authentication using biometric data, e.g. fingerprints, iris scans or voiceprints
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V40/00Recognition of biometric, human-related or animal-related patterns in image or video data
    • G06V40/10Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
    • G06V40/16Human faces, e.g. facial parts, sketches or expressions

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Databases & Information Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Software Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Computer Security & Cryptography (AREA)
  • Health & Medical Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Oral & Maxillofacial Surgery (AREA)
  • Human Computer Interaction (AREA)
  • Multimedia (AREA)
  • Computer Hardware Design (AREA)
  • Collating Specific Patterns (AREA)

Abstract

本发明公开了一种用于大规模用户筛查的数据采集方法及系统。该方法包括如下步骤:识别用户的身份证,以获取用户的身份证信息;基于用户的身份证信息,对用户进行人脸识别,以获取人脸识别结果;校验身份证信息与人脸识别结果是否一致;若一致,则生成用户的专属唯一标识,以用于后续调研和数据筛查;若不一致,则提示识别错误并提醒用户确认身份证信息。该数据采集方法优化了筛查信息录入方式,通过刷身份证即可完成信息录入,免去人工录入及复核流程,提高了数据采集效率。同时,本发明通过生成用户的专属唯一标识,将用户后续筛查及调研工作与专属唯一标识绑定,提高了数据的准确性。

Description

一种用于大规模用户筛查的数据采集方法及系统
技术领域
本发明涉及一种用于大规模用户筛查的数据采集方法,同时也涉及相应的数据采集系统,属于数据采集技术领域。
背景技术
目前,常用的数据采集方式有两种,一种是人工录入,用户口述,采集员将用户的基本信息录入系统,另一种是由用户自己录入,然后保存上传到录入系统,采集员需要复核识别用户录入结果。然而,第一种数据采集方式的采集过程繁琐,浪费时间,效率较低。第二种数据采集方式由用户自主录入上传,存在信息错误的分享,后期人工需要核实,增加了复核的工作量。
专利号为ZL 201410668197.6的中国发明专利中,公开了一种大规模数据采集系统及方法。该系统包括移动终端子系统和服务管理子系统。移动终端子系统包括数据采集器,能够自主申请采集任务并执行;数据处理器,对采集到的数据进行抽取、解析、压缩及传输;状态控制器,记录移动设备的运行及执行情况并控制调度。服务管理子系统包括设备管理器,管理所有在网移动设备及其运行与网络状态;任务管理器,集中管理所有采集任务,并对采集频率、任务状态做动态化管理;数据分析器对移动设备返回的数据进行清洗加工;中央控制器,控制管理其他管理器模块。采用该系统,能够灵活地部署大规模数据采集网络,并有效利用闲置移动设备与网络带宽,降低数据采集的成本。
然而,上述大规模数据采集系统及方法需要依赖于智能可移动设备,存在一定的局限性,并且采集过程相对复杂。
发明内容
本发明所要解决的首要技术问题在于提供一种用于大规模用户筛查的数据采集方法。
本发明所要解决的另一技术问题在于提供一种用于大规模用户筛查的数据采集系统。
本发明所要解决的又一技术问题在于提供一种包括程序指令的计算机可读存储介质。
为实现上述技术目的,本发明采用以下的技术方案:
根据本发明实施例的第一方面,提供一种用于大规模用户筛查的数据采集方法,包括如下步骤:
识别用户的身份证,以获取用户的身份证信息;
基于所述用户的身份证信息,对用户进行人脸识别,以获取人脸识别结果;
校验所述身份证信息与所述人脸识别结果是否一致;
若一致,则生成所述用户的专属唯一标识,以用于后续调研和数据筛查;若不一致,则提示识别错误并提醒所述用户确认身份证信息。
其中较优地,所述数据采集方法还包括:
将所述用户的身份证信息按照多个维度进行细分;
经过大数据分析计算后,获取各个维度所对应的调研结果及数据筛查结果。
其中较优地,多个所述维度至少包括:姓名、年龄、性别和地区。
其中较优地,在对用户进行人脸识别之前还包括:
基于所述用户的身份证信息,判断所述用户是否已经存在专属唯一标识,若已存在,则数据采集结束,若不存在,则对用户进行人脸识别。
其中较优地,所述生成所述用户的专属唯一标识,包括:
获取所述用户的身份证信息,其中,所述身份证信息至少包括:人脸信息、年龄信息、地区信息和身份证号码;
基于所述用户的身份证信息,形成专属于所述用户的用户画像。
根据本发明实施例的第二方面,提供一种用于大规模用户筛查的数据采集系统,包括:
身份证识别部,用于识别用户的身份证,以获取用户的身份证信息;
数据处理单元,内置有预设协议并与所述身份证识别部连接,以用于接收所述用户的身份证信息,并基于所述预设协议进行数据处理;
人脸识别单元,与所述数据处理单元连接,以用于接收所述数据处理单元的数据处理结果,并弹出人脸识别弹框进行人脸识别;
校验单元,与所述数据处理单元和人脸识别单元连接,以用于接收用户的身份证信息和人脸识别结果,并校验所述身份证信息与所述人脸识别结果是否一致;
信息录入单元,与所述校验单元连接,以用于根据所述校验单元的校验结果进行信息录入。
其中较优地,所述数据采集系统还包括:
数据查重单元,与所述信息录入单元连接,以用于根据用户的身份证信息进行数据查重。
其中较优地,所述信息录入包括:
若校验结果一致,则生成所述用户的专属唯一标识,以用于后续调研和数据筛查;
若校验结果不一致,则提示识别错误并提醒所述用户确认身份证信息。
根据本发明实施例的第三方面,提供一种用于大规模用户筛查的数据采集系统,包括处理器和存储器,所述处理器读取所述存储器中的计算机程序,用于执行以下操作:
识别用户的身份证,以获取用户的身份证信息;
基于所述用户的身份证信息,对用户进行人脸识别,以获取人脸识别结果;
校验所述身份证信息与所述人脸识别结果是否一致;
若一致,则生成所述用户的专属唯一标识,以用于后续调研和数据筛查;若不一致,则提示识别错误并提醒所述用户确认身份证信息。
根据本发明实施例的第四方面,提供一种包括程序指令的计算机可读存储介质,所述程序指令被处理器执行时实现上述数据采集方法。
与现有技术相比较,本发明实施例提供的数据采集方法及系统,优化了筛查信息录入方式,通过刷身份证即可完成信息录入,免去人工录入及复核流程,提高了数据采集效率。同时,本发明通过生成专属于用户的唯一标识,将用户后续筛查及调研工作与用户的专属唯一标识绑定,提高了数据的准确性。
附图说明
图1为本发明第一实施例提供的一种用于大规模用户筛查的数据采集系统的结构示意图;
图2为本发明第二实施例提供的一种用于大规模用户筛查的数据采集方法的流程图;
图3为本发明第三实施例提供的一种用于大规模用户筛查的数据采集系统的结构示意图。
具体实施方式
下面结合附图和具体实施例对本发明的技术内容进行详细具体的说明。
<第一实施例>
如图1所示,本发明第一实施例提供的一种用于大规模用户筛查的数据采集系统,包括身份证识别部1、数据处理单元2、人脸识别单元3、校验单元4、信息录入单元5和数据查重单元6。其中,身份证识别部1作为数据采集系统的硬件设备,用于进行身份识别;数据处理单元2、人脸识别单元3、校验单元4、信息录入单元5和数据查重单元6共同作为数据采集系统的软件系统,用于进行数据处理、信息录入和数据查重。
具体的,身份证识别部1为市面上常见的身份识别设备,用于识别用户的身份证,以获取用户的身份证信息。其中,该身份证信息至少包括:姓名信息、人脸信息、年龄信息、性别信息、地区信息和身份证号码等信息。
数据处理单元2内置有预设可扩展身份验证协议(包括基于IEEE 802.1X的无线访问、基于IEEE 802.1X的有线访问和点到点协议(PPP)连接)并与身份证识别部1连接,以用于接收用户的身份证信息,并基于预设协议进行数据处理。人脸识别单元3与数据处理单元2连接,以用于接收数据处理单元的数据处理结果,并弹出人脸识别弹框进行人脸识别。校验单元4与数据处理单元2和人脸识别单元3连接,以用于接收用户的身份证信息和人脸识别结果,并校验身份证信息与人脸识别结果是否一致。信息录入单元5与校验单元4连接,以用于根据校验单元4的校验结果进行信息录入。数据查重单元6与信息录入单元5连接,以用于进行数据查重。
在上述实施例中,具体的,信息录入包括:若校验结果一致,则生成用户的专属唯一标识,以用于后续调研和数据筛查;若校验结果不一致,则提示识别错误并提醒用户确认身份证信息。其中,生成用户的专属唯一标识包括:获取用户的身份证信息(具体为:姓名、性别、年龄、地区和身份证号),从而基于用户的身份证信息形成专属于用户的用户画像。
可以理解的是,本发明第一实施例提供的数据采集系统优化了筛查信息录入方式,通过刷身份证即可完成信息录入,免去人工录入及复核流程,提高了数据采集效率。同时,该数据采集系统通过生成专属于用户的唯一标识,将用户后续筛查及调研工作与用户的专属唯一标识绑定,提高了数据的准确性。
<第二实施例>
如图2所示,在第一实施例的基础上,本发明第二实施例提供的一种用于大规模用户筛查的数据采集方法,包括步骤S1~S4:
S1:识别用户的身份证,以获取用户的身份证信息。
具体的,当需要对用户进行数据采集时,用户将身份证放置在身份证识别部1的读卡区,从而通过身份证识别部1识别用户的身份证,以获取用户的身份证信息。其中,该身份证信息至少包括:人脸信息、年龄信息、地区信息和身份证号码等信息。
S2:基于用户的身份证信息,对用户进行人脸识别,以获取人脸识别结果。
具体的,当身份证识别部1识别出用户的身份证信息后,将该身份证信息发送给数据处理单元2,基于数据处理单元2内置的预设协议对用户的身份证信息进行数据处理。并且,完成数据处理后,数据处理单元2将数据处理结果发送给人脸识别单元3,以利用人脸识别单元3弹出人脸识别弹框进行人脸识别,从而获取人脸识别结果。
S3:校验身份证信息与人脸识别结果是否一致。
具体的,通过校验单元4分别接收用户的身份证信息和人脸识别结果,从而校验二者是否一致。
可以理解的是,用户的身份证信息中包括用户的人脸信息,该人脸信息通过用户的身份证识别出来。而人脸识别结果指的是人脸识别单元3实际识别出来的人脸信息,该人脸信息通过用户的实际面部识别出来。校验单元4通过对比两个人脸信息,从而判断二者是否一致。
S4:基于校验结果进行信息录入。
具体的,若步骤S3中的校验结果为二者一致,则生成用户的专属唯一标识,以用于后续调研和数据筛查;反之,若校验结果为二者不一致,则提示识别错误并提醒用户确认身份证信息。其中,生成用户的专属唯一标识包括:获取用户的身份证信息(具体为:姓名、性别、年龄、地区和身份证号),并基于用户的身份证信息,形成专属于用户的用户画像。
S5:数据分类。
具体的,当完成信息录入后,将用户的身份证信息按照多个维度进行细分;其中,本实施例中的多个维度至少包括:年龄、性别和地区。
经过大数据分析计算后,获取各个维度所对应的调研结果及数据筛查结果。其中,调研结果可以是对用户的认知调研结果、生理指标调研结果或生活满意度调研结果等。数据筛查结果可以是与系统预设的多种常模相比,用户的认知水平处于哪一等级,生理指标处于哪一等级或生活满意度处于哪一等级等。
此外,在上述实施例中,优选地,在步骤S2之前还包括:
步骤S20:查重判断。
具体的,在对用户进行人脸识别之前,基于用户的身份证信息,判断用户是否已经存在专属唯一标识,若已存在,则数据采集结束,若不存在,则对用户进行人脸识别。其中,该判断步骤可利用用户的身份证号进行查重搜索,以在系统中搜索是否存在与该身份证号相对应的专属唯一标识。
可以理解的是,若用户已经完成数据采集,则系统会根据步骤S1~S4生成用户的专属唯一标识,若用户未进行数据采集,则系统不会存在用户的专属唯一标识。由此,能够避免因用户忘记或误操作,而导致系统数据重复。
<第三实施例>
在第二实施例提供的在用于大规模用户筛查的数据采集方法的基础上,本发明进一步提供一种数据采集系统。如图3所示,该数据采集系统包括一个或多个处理器21和存储器22。其中,存储器22与处理器21耦接,用于存储一个或多个程序,当所述一个或多个程序被所述一个或多个处理器21执行,使得所述一个或多个处理器21实现如上述第二实施例中的用于大规模用户筛查的数据采集方法。
其中,处理器21用于控制该数据采集系统的整体操作,以完成上述用于大规模用户筛查的数据采集方法的全部或部分步骤。该处理器21可以是中央处理器(CPU)、图形处理器(GPU)、现场可编程逻辑门阵列(FPGA)、专用集成电路(ASIC)、数字信号处理(DSP)芯片等。存储器22用于存储各种类型的数据以支持在该数据采集系统的操作,这些数据例如可以包括用于在该数据采集系统上操作的任何应用程序或方法的指令,以及应用程序相关的数据。该存储器22可以由任何类型的易失性或非易失性存储设备或者它们的组合实现,例如静态随机存取存储器(SRAM)、电可擦除可编程只读存储器(EEPROM)、可擦除可编程只读存储器(EPROM)、可编程只读存储器(PROM)、只读存储器(ROM)、磁存储器、快闪存储器等。
在一个示例性实施例中,数据采集系统具体可以由计算机芯片或实体实现,或者由具有某种功能的产品来实现,用于执行上述的用于大规模用户筛查的数据采集方法,并达到如上述方法一致的技术效果。一种典型的实施例为计算机。具体地说,计算机例如可以为个人计算机、膝上型计算机、车载人机交互设备、蜂窝电话、相机电话、智能电话、个人数字助理、媒体播放器、导航设备、电子邮件设备、游戏控制台、平板计算机、可穿戴设备或者这些设备中的任何设备的组合。
在另一个示例性实施例中,本发明还提供一种包括程序指令的计算机可读存储介质,该程序指令被处理器执行时实现上述任意一个实施例中的用于大规模用户筛查的数据采集方法的步骤。例如,该计算机可读存储介质可以为上述包括程序指令的存储器,上述程序指令可由数据采集系统的处理器执行以完成上述的用于大规模用户筛查的数据采集方法,并达到如上述方法一致的技术效果。
上面对本发明所提供的用于大规模用户筛查的数据采集方法及系统进行了详细的说明。对本领域的一般技术人员而言,在不背离本发明实质内容的前提下对它所做的任何显而易见的改动,都将构成对本发明专利权的侵犯,将承担相应的法律责任。

Claims (10)

1.一种用于大规模用户筛查的数据采集方法,其特征在于包括:
识别用户的身份证,以获取用户的身份证信息;
基于所述用户的身份证信息,对用户进行人脸识别,以获取人脸识别结果;
校验所述身份证信息与所述人脸识别结果是否一致;
若一致,则生成所述用户的专属唯一标识,以用于后续调研和数据筛查;若不一致,则提示识别错误并提醒所述用户确认身份证信息。
2.如权利要求1所述的数据采集方法,其特征在于还包括:
将所述用户的身份证信息按照多个维度进行细分;
经过大数据分析计算后,获取各个维度所对应的调研结果及数据筛查结果。
3.如权利要求2所述的数据采集方法,其特征在于:
多个所述维度至少包括:姓名、年龄、性别和地区。
4.如权利要求1所述的数据采集方法,其特征在于,在对用户进行人脸识别之前还包括:
基于所述用户的身份证信息,判断所述用户是否已经存在专属唯一标识,若已存在,则数据采集结束,若不存在,则对用户进行人脸识别。
5.如权利要求1所述的数据采集方法,其特征在于,所述生成所述用户的专属唯一标识,包括:
获取所述用户的身份证信息,其中,所述身份证信息至少包括:人脸信息、年龄信息、地区信息和身份证号码;
基于所述用户的身份证信息,形成专属于所述用户的用户画像。
6.一种用于大规模用户筛查的数据采集系统,其特征在于包括:
身份证识别部,用于识别用户的身份证,以获取用户的身份证信息;
数据处理单元,内置有预设协议并与所述身份证识别部连接,以用于接收所述用户的身份证信息,并基于所述预设协议进行数据处理;
人脸识别单元,与所述数据处理单元连接,以用于接收所述数据处理单元的数据处理结果,并弹出人脸识别弹框进行人脸识别;
校验单元,与所述数据处理单元和人脸识别单元连接,以用于接收用户的身份证信息和人脸识别结果,并校验所述身份证信息与所述人脸识别结果是否一致;
信息录入单元,与所述校验单元连接,以用于根据所述校验单元的校验结果进行信息录入。
7.如权利要求6所述的数据采集系统,其特征在于还包括:
数据查重单元,与所述信息录入单元连接,以用于根据用户的身份证信息进行数据查重。
8.如权利要求6所述的数据采集系统,其特征在于,所述信息录入包括:
若校验结果一致,则生成所述用户的专属唯一标识,以用于后续调研和数据筛查;
若校验结果不一致,则提示识别错误并提醒所述用户确认身份证信息。
9.一种用于大规模用户筛查的数据采集系统,其特征在于包括处理器和存储器,所述处理器读取所述存储器中的计算机程序,用于执行以下操作:
识别用户的身份证,以获取用户的身份证信息;
基于所述用户的身份证信息,对用户进行人脸识别,以获取人脸识别结果;
校验所述身份证信息与所述人脸识别结果是否一致;
若一致,则生成所述用户的专属唯一标识,以用于后续调研和数据筛查;若不一致,则提示识别错误并提醒所述用户确认身份证信息。
10.一种包括程序指令的计算机可读存储介质,其特征在于,所述程序指令被处理器执行时实现如权利要求1~5中任意一项所述的数据采集方法。
CN202310694007.7A 2023-06-12 2023-06-12 一种用于大规模用户筛查的数据采集方法及系统 Pending CN116842093A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202310694007.7A CN116842093A (zh) 2023-06-12 2023-06-12 一种用于大规模用户筛查的数据采集方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202310694007.7A CN116842093A (zh) 2023-06-12 2023-06-12 一种用于大规模用户筛查的数据采集方法及系统

Publications (1)

Publication Number Publication Date
CN116842093A true CN116842093A (zh) 2023-10-03

Family

ID=88166183

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202310694007.7A Pending CN116842093A (zh) 2023-06-12 2023-06-12 一种用于大规模用户筛查的数据采集方法及系统

Country Status (1)

Country Link
CN (1) CN116842093A (zh)

Similar Documents

Publication Publication Date Title
EP3457322B1 (en) Identity authentication by using specific human biological characteristics collection algorithms
US11526799B2 (en) Identification and application of hyperparameters for machine learning
CN108090567B (zh) 电力通信系统故障诊断方法及装置
CN109710677B (zh) 实验数据处理方法、装置、计算机设备和存储介质
CN112686746A (zh) 信贷流程的配置方法、装置及设备
CN110688168A (zh) 提高应用程序启动速度方法、装置、设备及存储介质
US20210058405A1 (en) Shared electronic device management device and method
WO2019148657A1 (zh) 关联环境测试方法、电子装置及计算机可读存储介质
CN117112336B (zh) 智能通信设备异常检测方法、设备、存储介质及装置
CN112671878A (zh) 一种区块链的信息订阅方法、装置、服务器和存储介质
CN116842093A (zh) 一种用于大规模用户筛查的数据采集方法及系统
CN114090462B (zh) 软件重复缺陷识别方法、装置、计算机设备及存储介质
CN109460001B (zh) 一种故障码和配件的关联方法及装置
CN111222739B (zh) 核电站的任务分配方法及核电站的任务分配系统
CN110177006B (zh) 基于接口预测模型的节点测试方法及装置
CN109040990B (zh) 信息采集方法、装置、计算机设备及存储介质
CN114648784B (zh) 指纹库预匹配的指纹验证方法、装置、设备及存储介质
CN113534691A (zh) 一种终端设备的控制系统及方法
CN111242256A (zh) 信息验证方法、装置及终端
CN113254248B (zh) 一种故障诊断方法、系统及计算设备
CN110706734B (zh) Ssd归一化集成测试方法、装置、计算机设备及存储介质
CN109543363B (zh) 电子装置与软件更新及注册样板产生方法
CN117312062A (zh) 一种芯片中模块回归的方法、装置及存储介质
CN117141290A (zh) 一种新能源汽车的充电管控方法及系统
CN117785973A (zh) 社区用户信息集成方法、装置、设备及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination