CN109492533A - 利用图像识别技术验证学历的方法、装置和计算机设备 - Google Patents

利用图像识别技术验证学历的方法、装置和计算机设备 Download PDF

Info

Publication number
CN109492533A
CN109492533A CN201811185762.8A CN201811185762A CN109492533A CN 109492533 A CN109492533 A CN 109492533A CN 201811185762 A CN201811185762 A CN 201811185762A CN 109492533 A CN109492533 A CN 109492533A
Authority
CN
China
Prior art keywords
information
certificate picture
schooling certificate
picture
schooling
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201811185762.8A
Other languages
English (en)
Inventor
李毅
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ping An Technology Shenzhen Co Ltd
Original Assignee
Ping An Technology Shenzhen Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ping An Technology Shenzhen Co Ltd filed Critical Ping An Technology Shenzhen Co Ltd
Priority to CN201811185762.8A priority Critical patent/CN109492533A/zh
Publication of CN109492533A publication Critical patent/CN109492533A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/40Document-oriented image-based pattern recognition
    • G06V30/41Analysis of document content
    • G06V30/413Classification of content, e.g. text, photographs or tables
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V40/00Recognition of biometric, human-related or animal-related patterns in image or video data
    • G06V40/10Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
    • G06V40/16Human faces, e.g. facial parts, sketches or expressions
    • G06V40/172Classification, e.g. identification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Artificial Intelligence (AREA)
  • Health & Medical Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Oral & Maxillofacial Surgery (AREA)
  • Human Computer Interaction (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本申请揭示了一种利用图像识别技术验证学历的方法、装置、计算机设备和存储介质,其中,方法包括:获取学历证明图片;利用图像识别技术提取所述学历证明图片中的信息;通过全国学信网系统的链接自动访问所述全国学信网系统;利用全国学信网系统自动获取与所述学历证明图片相对应的准确学历信息;判断从所述学历证明图片中提取的信息与所述准确学历信息是否一致;若一致,则判定所述学历证明图片记录的学历是真实的,从而实现了高效、准确地验证学历真实性,实现了对学历验证过程的优化。

Description

利用图像识别技术验证学历的方法、装置和计算机设备
技术领域
本申请涉及到计算机领域,特别是涉及到一种利用图像识别技术验证学历的方法、装置、计算机设备和存储介质。
背景技术
很多场景中都需要验证学历的真实性,例如某些公司,单位,事业部门就业入职时,需提供学历学位证明,且需提供证件的真实有效性。目前对于学历真实性的验证,多是人工完成,费时费力且容易出错,且对于新的验证人员而言,不一定不清楚在哪里验证,怎么验证等。从而造成学历假证泛滥。因此现有技术对没有高效高质量实现验证学历的方案。
发明内容
本申请的主要目的为提供一种利用图像识别技术验证学历的方法、装置、计算机设备和存储介质,从而实现了自动、准确地验证学历验证。
为了实现上述发明目的,本申请提出一种利用图像识别技术验证学历的方法,包括:
获取学历证明图片,所述学历证明图片包括学位证书或毕业证书;
利用图像识别技术提取所述学历证明图片中的信息,其中所述信息至少包括面部图像、证件号码、姓名、毕业时间、学习形式和学校名称信息;
通过全国学信网系统的链接自动访问所述全国学信网系统,其中所述链接设置在所述学历证明图片的空白位置;
根据所述证件号码与所述姓名,利用全国学信网系统自动获取与所述学历证明图片相对应的准确学历信息;
判断从所述学历证明图片中提取的信息与所述准确学历信息是否一致;
若一致,则判定所述学历证明图片记录的学历是真实的。
进一步地,所述获取学历证明图片,所述学历证明图片包括学位证书或毕业证书的步骤,包括:
接收关联软件发送的获取学历证明图片的指令,所述关联软件包括社交软件;
根据所述获取学历证明图片的指令,打开摄像头扫描所述学历证明,以获得所述学历证明图片。
进一步地,所述提取所述学历证明图片中的信息,其中所述信息至少包括面部图像、证件号码、姓名、毕业时间、学习形式和学校名称信息的步骤,包括:
利用图像识别技术在所述学历证明图片中提取出面部图像与初步文字信息;
从所述初步文字信息中搜索预存的关键词,其中所述关键词至少与证件号码、姓名、毕业时间、学习形式和学校名称信息之一相关联;
采用预设规则获取所述学历证明图片中的文字信息,所述预设规则包括以所述关键词本身或邻近的文字信息作为所述学历证明图片中的文字信息,从而所述面部图像与所述学历证明图片中的文字信息共同构成从所述学历证明图片中提取的信息。
进一步地,所述判断从所述学历证明图片中提取的信息与所述准确学历信息是否一致的步骤,包括:
判断所述面部图像是否与所述准确学历信息中的面部图像一致;
若一致,判断从所述学历证明图片中提取的除面部图像外的其他信息是否与所述准确学历信息一致。
进一步地,所述若一致,则判定所述学历证明图片记录的学历是真实的步骤之后,包括:
生成对比表格,所述对比表格包括从所述学历证明图片中提取的信息与所述准确学历信息;
生成二维码,所述二维码直接链接所述对比表格。
进一步地,所述通过全国学信网系统的链接自动访问所述全国学信网系统,其中所述链接设置在所述学历证明图片的空白位置的步骤之前,还包括:
判断所述毕业时间与当前时间的时间间隔是否大于第一阈值;
若大于第一阈值,则在所述图片中的空白位置生成全国学信网系统的访问链接,其中所述访问链接的颜色为第一种颜色;
若不大于第一阈值,则在所述图片中的空白位置生成全国学信网系统的访问链接,其中所述访问链接的颜色为第二种颜色。
进一步地,所述提取所述学历证明图片中的信息,其中所述信息至少包括面部图像、证件号码、姓名、毕业时间、学习形式和学校名称信息的步骤之前,包括:
对所述学历证明图片进行预处理,所述预处理至少包括使用灰度转换和中值滤波法进行处理。
本申请提出一种利用图像识别技术验证学历的装置,包括:
学历证明图片获取单元,用于获取学历证明图片,所述学历证明图片包括学位证书或毕业证书;
学历证明图片信息提取单元,用于利用图像识别技术提取所述学历证明图片中的信息,其中所述信息至少包括面部图像、证件号码、姓名、毕业时间、学习形式和学校名称信息;
全国学信网系统访问单元,用于通过全国学信网系统的链接自动访问所述全国学信网系统,其中所述链接设置在所述学历证明图片的空白位置;
准确学历信息获取单元,用于根据所述证件号码与所述姓名,利用全国学信网系统自动获取与所述学历证明图片相对应的准确学历信息;
第一判断单元,用于判断从所述学历证明图片中提取的信息与所述准确学历信息是否一致;
学历证明真实性判定单元,用于若一致,则判定所述学历证明图片记录的学历是真实的。
本申请还提供一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序所述处理器执行所述计算机程序时实现上述任一项所述方法的步骤。
本申请还提供一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现上述任一项所述的方法的步骤。
本申请的利用图像识别技术验证学历的方法、装置、计算机设备和存储介质,采用自动获取学历证明图片,并提取学历证明信息,利用设置在所述学历证明图片的空白位置的链接访问全国学信网系统以自动获取准确学历信息,通过对比确定学历的真实性,具有高效、准确地技术效果。
附图说明
图1为本申请一实施例的利用图像识别技术验证学历的方法的流程示意图;
图2为本申请一实施例的利用图像识别技术验证学历的装置的结构示意框图;
图3为本申请一实施例的计算机设备的结构示意框图。
本申请目的的实现、功能特点及优点将结合实施例,参照附图做进一步说明。
具体实施方式
为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本申请进行进一步详细说明。应当理解,此处描述的具体实施例仅仅用以解释本申请,并不用于限定本申请。
参照图1,本申请实施例提供一种利用图像识别技术验证学历的方法,包括步骤:
S1、获取学历证明图片,所述学历证明图片包括学位证书或毕业证书;
S2、利用图像识别技术提取所述学历证明图片中的信息,其中所述信息至少包括面部图像、证件号码、姓名、毕业时间、学习形式和学校名称信息;
S3、通过全国学信网系统的链接自动访问所述全国学信网系统,其中所述链接设置在所述学历证明图片的空白位置;
S4、根据所述证件号码与所述姓名,利用全国学信网系统自动获取与所述学历证明图片相对应的准确学历信息;
S5、判断从所述学历证明图片中提取的信息与所述准确学历信息是否一致;
S6、若一致,则判定所述学历证明图片记录的学历是真实的。
如上述步骤S1所述,获取学历证明图片,所述学历证明图片包括学位证书或毕业证书。获取学历证明图片的方式包括:当接收到获取学历证明图片的指令后,自动调取预先存储的学历证明图片,或者自动打开摄像头拍摄或者扫描学历证明,以获取学历证明图片。学历证明指能够证明学历的文件,本实施方式的学历证明包括学位证书或毕业证书。其中,学位证书或毕业证书上记载了面部图像、证件号码、姓名、性别、入学时间、毕业时间、出生日期、专业、学习形式(例如普通全日制)和学校名称信息。
如上述步骤S2所述,利用图像识别技术提取所述学历证明图片中的信息,其中所述信息至少包括面部图像、证件号码、姓名、毕业时间、学习形式和学校名称信息。图片中的信息不便于计算机比对,因此将所述学历证明图片中的信息提取出来。提取的方法包括:采用图像识别技术提取面部图像、文字信息,优选采用开源的图像识别工具,例如Tesseract-OCR、OCRopus、Cuneiform、GOCR、OCRFeeder工具实现图片信息提取。
如上述步骤S3所述,通过全国学信网系统的链接自动访问所述全国学信网系统,其中所述链接设置在所述学历证明图片的空白位置。全国学信网系统存储有全国的准确学历信息,通过与所述准确学历信息对比,就能判断学历证件的真伪。将全国学信网系统的链接置于所述学历证明图片中,便于访问全国学信网系统,实现本方法的装置只需确认学历证明图片中存在链接,即可利用此链接直接访问全国学信网系统。进一步地,所述链接可设置为不同形状、不同颜色、不同大小,从而适应所述学历证明图片,起到美观且一目了然的效果。例如可设链接为围绕着学校名称的花环形状,学校若是211、985高校可设置链接为紫色,从而只需判断所述链接的颜色,即可获得学校的类别。其中,将所述链接设置在所述学历证明图片的空白位置至少包括如下有益效果:可直接获取正确的学信网系统的链接,从而减少获得错误链接的可能性;可仅通过鼠标点击该链接的操作,即可实现访问学信网系统。
如上述步骤S4所述,根据所述证件号码与所述姓名,利用全国学信网系统自动获取与所述学历证明图片相对应的准确学历信息。全国学信网系统被设置为需要证件号码与姓名一致,才能获取相应的学历信息,因此在全国学信网系统中查询所述证件号码与所述姓名,即可得到与所述学历证明图片相对应的准确学历信息。
如上述步骤S5所述,判断从所述学历证明图片中提取的信息与所述准确学历信息是否一致。由于所述准确学历信息是从全国学信网系统中获取的,其正确性有所保证,因此对比从所述学历证明图片中提取的信息与所述准确学历信息即可确定所述历证明图片是否作伪。其中判断的过程包括:判断面部图像、证件号码、姓名、性别、入学时间、毕业时间、出生日期、专业、学习形式(例如普通全日制)和学校名称信息是否一致;或者判断面部图像、证件号码、姓名、性别、入学时间、毕业时间、出生日期、专业、学习形式(例如普通全日制)和学校名称信息中的至少随机五种是否一致。其中,若学历信息中的随机五种已经一致,可以基本确定所述学历证明图片并未做伪,因此可以省略算力,不再进行判断。
如上述步骤S6所述,若一致,则判定所述学历证明图片记录的学历是真实的。经过了对比所述学历证明图片中提取的信息与所述准确学历信息的步骤,可以得出若所述学历证明图片中提取的信息与所述准确学历信息一致,则所述学历证明图片记录的学历是真实的,否则所述学历证明图片记录的学历做伪的结论。
一实施例中,所述获取学历证明图片,所述学历证明图片包括学位证书或毕业证书的步骤S1,包括:
S101、接收关联软件发送的获取学历证明图片的指令,所述关联软件包括社交软件;
S102、根据所述获取学历证明图片的指令,打开摄像头扫描所述学历证明,以获得所述学历证明图片。
如上述步骤S101-S102所述,实现了获取学历证明图片。采用本实施方式所述方法的产品或装置可以与关联软件联动,例如常用的软件支付宝、微信或者QQ,从而更便于使用,优化用户体验。进一步地,可根据关联软件发送的学历真实性验证指令,从而开始执行本方法,以验证所述学历证明图片是否做伪。其中,关联软件除了社交软件外,还可以包括具有电子卡包的软件。
一实施例中,所述提取所述学历证明图片中的信息,其中所述信息至少包括面部图像、证件号码、姓名、毕业时间、学习形式和学校名称信息的步骤S2,包括:
S201、利用图像识别技术在所述学历证明图片中提取面部图像与初步文字信息;
S202、从所述初步文字信息中搜索预存的关键词,其中所述关键词至少与证件号码、姓名、毕业时间、学习形式和学校名称信息之一相关联;
S203、采用预设规则获取所述学历证明图片中的文字信息,所述预设规则包括以所述关键词本身或邻近的文字信息作为所述学历证明图片中的文字信息,从而所述面部图像与所述学历证明图片中的文字信息共同构成从所述学历证明图片中提取的信息。
如上述步骤S201-S203所述,实现了提取所述学历证明图片中的信息。其中图像识别技术采用开源的图像识别工具,例如Tesseract-OCR、OCRopus、Cuneiform、GOCR、OCRFeeder工具实现图片信息提取。其中,预存的关键词与需要提取的所述学历证明图片中的信息相关,包括:“证书编号”、“学生”、“研究生”、“学院”、“专业”、“本科”、“硕士”、“博士”等。再根据所述关键词提取与所述关键词相关联的信息。所述预设规则是指以关键词本身或关键词邻近的文字信息作为需要提取的所述学历证明图片中的信息的规则,包括:提取“证书编号”后的数字串作为证件号码;提取“学生”、“研究生”后的姓名;提取“硕士”、“博士”本身作为学位信息等。从而实现了提取所述学历证明图片中的信息。
一实施例中,判断从所述学历证明图片中提取的信息与所述准确学历信息是否一致的步骤S5,包括:
S501、判断所述面部图像是否与所述准确学历信息一致;
S502、若一致,判断从所述学历证明图片中提取的除面部图像外的其他信息是否与所述准确学历信息一致。
如上述步骤S501-S502,实现了判断从所述学历证明图片中提取的信息与所述准确学历信息是否一致。本实施方式采用了先判断面部图像是否一致,再判断其余信息(文字信息)是否一致,原因在于,面部图像较难作伪,若判断出面部图像不一致,一般而言即可判定学历不真实,可以终止学历真实性验证流程。其中,判断面部图像是否与所述准确学历信息一致的步骤包括:将所述面部图像的脸部特征与所述准确学历信息中的面部图像的脸部特征进行对比;判断相似度是否超过预定阈值。进一步地,判断面部图像是否与所述准确学历信息一致可采用已知的现有技术,在此不再赘述。
一实施例中,所述若一致,则判定所述学历证明图片记录的学历是真实的步骤S6之后,包括:
S7、生成对比表格,所述对比表格包括从所述学历证明图片中提取的信息与所述准确学历信息;
S8、生成二维码,所述二维码直接链接所述对比表格。
如上述步骤S7-S8所述,实现了将学历真实性的验证结果输出为对比表格。据此,需要利用图像识别技术验证学历的工作人员,只需扫描所述二维码,即可得到反应学历真实性的对比表格,而无需做任何其余操作。
一实施例中,所述通过全国学信网系统的链接自动访问所述全国学信网系统,其中所述链接设置在所述学历证明图片的空白位置的步骤S3之前,还包括:
S21、判断所述毕业时间与当前时间的时间间隔是否大于第一阈值;
S22、若大于第一阈值,则在所述图片中的空白位置生成全国学信网系统的访问链接,其中所述访问链接的颜色为第一种颜色;
S23、若不大于第一阈值,则在所述图片中的空白位置生成全国学信网系统的访问链接,其中所述访问链接的颜色为第二种颜色。
如上述步骤S21-S23所述,实现了将毕业时间直接反应为链接颜色。一般而言,毕业时间至当前时间的时间间隔代表了工作年限,因此访问链接的颜色直接代表了工作年限长短,从而工作年限一目了然。其中第一种颜色可为绿色,第二种颜色可为红色。
一实施例中,所述提取所述学历证明图片中的信息,其中所述信息至少包括面部图像、证件号码、姓名、毕业时间、学习形式和学校名称信息的步骤S2之前,包括:
S11、对所述学历证明图片进行预处理,所述预处理至少包括使用灰度转换和中值滤波法进行处理。
如上述步骤S11所述,对所述学历证明图片进行预处理。其中预处理的方式包括:灰度转换、中值滤波法,从而减轻计算量和优化图像质量。其中灰度转换是将原学历证明图片的像素值利用灰度值变换函数转化为灰度值,由于灰度值为O~255,因此能有效减少计算量。中值滤波法是一种非线性平滑技术,它将每一像素点的灰度值设置为该点某邻域窗口内的所有像素点灰度值的中值,从而有效抑制噪声。
本申请的利用图像识别技术验证学历的方法,采用自动获取学历证明图片,并提取学历证明信息,利用设置在所述学历证明图片的空白位置的链接访问全国学信网系统以自动获取准确学历信息,通过对比确定学历的真实性,具有高效、准确地技术效果。
参照图2,本申请实施例提供一种利用图像识别技术验证学历的装置,包括:
学历证明图片获取单元10,用于获取学历证明图片,所述学历证明图片包括学位证书或毕业证书;
学历证明图片信息提取单元20,用于利用图像识别技术提取所述学历证明图片中的信息,其中所述信息至少包括面部图像、证件号码、姓名、毕业时间、学习形式和学校名称信息;
全国学信网系统访问单元30,用于通过全国学信网系统的链接自动访问所述全国学信网系统,其中所述链接设置在所述学历证明图片的空白位置;
准确学历信息获取单元40,用于根据所述证件号码与所述姓名,利用全国学信网系统自动获取与所述学历证明图片相对应的准确学历信息;
第一判断单元50,用于判断从所述学历证明图片中提取的信息与所述准确学历信息是否一致;
学历证明真实性判定单元60,用于若一致,则判定所述学历证明图片记录的学历是真实的。
如上述单元10所述,获取学历证明图片,所述学历证明图片包括学位证书或毕业证书。获取学历证明图片的方式包括:当接收到获取学历证明图片的指令后,自动调取预先存储的学历证明图片,或者自动打开摄像头拍摄或者扫描学历证明,以获取学历证明图片。学历证明指能够证明学历的文件,本实施方式的学历证明包括学位证书或毕业证书。其中,学位证书或毕业证书上记载了面部图像、证件号码、姓名、性别、入学时间、毕业时间、出生日期、专业、学习形式(例如普通全日制)和学校名称信息。
如上述单元20所述,提取所述学历证明图片中的信息,其中所述信息至少包括面部图像、证件号码、姓名、毕业时间、学习形式和学校名称信息。图片中的信息不便于计算机比对,因此将所述学历证明图片中的信息提取出来。提取的方法包括:采用图像识别技术提取面部图像、文字信息,优选采用开源的图像识别工具,例如Tesseract-OCR、OCRopus、Cuneiform、GOCR、OCRFeeder工具实现图片信息提取。
如上述单元30所述,通过全国学信网系统的链接自动访问所述全国学信网系统,其中所述链接设置在所述学历证明图片的空白位置。全国学信网系统存储有全国的准确学历信息,通过与所述准确学历信息对比,就能判断学历证件的真伪。将全国学信网系统的链接置于所述学历证明图片中,便于访问全国学信网系统,实现本方法的装置只需确认学历证明图片中存在链接,即可利用此链接直接访问全国学信网系统。进一步地,所述链接可设置为不同形状、不同颜色、不同大小,从而适应所述学历证明图片,起到美观且一目了然的效果。例如可设链接设为围绕着学校名称的花环形状,学校若是211、985高校可设置链接为紫色,从而只需判断所述链接的颜色,即可获得学校的类别。其中,将所述链接设置在所述学历证明图片的空白位置至少包括如下有益效果:可直接获取正确的学信网系统的链接,从而减少获得错误链接的可能性;可仅通过鼠标点击该链接的操作,即可实现访问学信网系统。
如上述单元40所述,根据所述证件号码与所述姓名,利用全国学信网系统自动获取与所述学历证明图片相对应的准确学历信息。全国学信网系统被设置为需要证件号码与姓名一致,才能获取相应的学历信息,因此在全国学信网系统中查询所述证件号码与所述姓名,即可得到与所述学历证明图片相对应的准确学历信息。
如上述单元50所述,判断从所述学历证明图片中提取的信息与所述准确学历信息是否一致。由于所述准确学历信息是从全国学信网系统中获取的,其正确性有所保证,因此对比从所述学历证明图片中提取的信息与所述准确学历信息即可确定所述历证明图片是否作伪。其中判断的过程包括:判断面部图像、证件号码、姓名、性别、入学时间、毕业时间、出生日期、专业、学习形式(例如普通全日制)和学校名称信息是否一致;或者判断面部图像、证件号码、姓名、性别、入学时间、毕业时间、出生日期、专业、学习形式(例如普通全日制)和学校名称信息中的至少随机五种是否一致。其中,若学历信息中的随机五种已经一致,可以基本确定所述学历证明图片并未做伪,因此可以省略算力,不再进行判断。
如上述单元60所述,若一致,则判定所述学历证明图片记录的学历是真实的。经过了对比所述学历证明图片中提取的信息与所述准确学历信息的步骤,可以得出若所述学历证明图片中提取的信息与所述准确学历信息一致,则所述学历证明图片记录的学历是真实的,否则所述学历证明图片记录的学历做伪的结论。
一实施例中,所述学历证明图片获取单元10,包括:
关联软件指令接收子单元,用于接收关联软件发送的获取学历证明图片的指令,所述关联软件包括社交软件;
扫描子单元,用于根据所述获取学历证明图片的指令,打开摄像头扫描所述学历证明,以获得所述学历证明图片。
如上述子单元所述,实现了获取学历证明图片。采用本实施方式所述方法的产品或装置可以与关联软件联动,例如常用的软件支付宝、微信或者QQ,从而更便于使用,优化用户体验。进一步地,可接收关联软件发送的学历真实性验证指令,以验证所述学历证明图片是否做伪。其中,关联软件除了社交软件外,还可以包括具有电子卡包的软件。
一实施例中,所述学历证明图片信息提取单元20,包括:
信息转换子单元,用于利用图像识别技术在所述学历证明图片中提取出面部图像与初步文字信息;
关键词搜索子单元,用于从所述初步文字信息中搜索预存的关键词,其中所述关键词至少与证件号码、姓名、毕业时间、学习形式和学校名称信息之一相关联;
信息获取子单元,用于采用预设规则获取所述学历证明图片中的文字信息,所述预设规则包括以所述关键词本身或邻近的文字信息作为所述学历证明图片中的文字信息,从而所述面部图像与所述学历证明图片中的文字信息共同构成从所述学历证明图片中提取的信息。
如上述子单元所述,实现了提取所述学历证明图片中的信息。其中图像识别技术采用开源的图像识别工具,例如Tesseract-OCR、OCRopus、Cuneiform、GOCR、OCRFeeder工具实现图片信息提取。其中,预存的关键词与需要提取的所述学历证明图片中的信息相关,包括:“证书编号”、“学生”、“研究生”、“学院”、“专业”、“本科”、“硕士”、“博士”等。再根据所述关键词提取与所述关键词相关联的信息。所述预设规则是指以关键词本身或关键词邻近的文字信息作为需要提取的所述学历证明图片中的信息的规则,包括:提取“证书编号”后的数字串作为证件号码;提取“学生”、“研究生”后的姓名;提取“硕士”、“博士”本身作为学位信息等。从而实现了提取所述学历证明图片中的信息。
一实施例中,第一判断单元50,包括:
第一初始判断子单元,用于判断所述面部图像是否与所述准确学历信息中的面部图像一致;
第一继续判断子单元,用于若一致,判断从所述学历证明图片中提取的除面部图像外的其他信息是否与所述准确学历信息一致。
如上述子单元,实现了判断从所述学历证明图片中提取的信息与所述准确学历信息是否一致。本实施方式采用了先判断面部图像是否一致,再判断其余信息(文字信息)是否一致,原因在于,面部图像较难作伪,若判断出面部图像不一致,一般而言即可判定学历不真实,可以终止学历真实性验证流程。其中,判断面部图像是否与所述准确学历信息一致可采用:将所述面部图像的脸部特征与所述准确学历信息中的面部图像的脸部特征进行对比;判断相似度是否超过预定阈值。进一步地,判断面部图像是否与所述准确学历信息一致可采用已知的现有技术,在此不再赘述。
一实施例中,利用图像识别技术验证学历的装置,包括:
对比表格生成单元,用于生成对比表格,所述对比表格包括从所述学历证明图片中提取的信息与所述准确学历信息;
二维码生成单元,用于生成二维码,所述二维码直接链接所述对比表格。
如上述单元所述,实现了将学历真实性的验证结果输出为对比表格。据此,需要验证学历真实性的工作人员,只需扫描所述二维码,即可得到反应学历真实性的对比表格,而无需做任何其余操作。
一实施例中,利用图像识别技术验证学历的装置,包括:
第一阈值判断单元,用于判断所述毕业时间与当前时间的时间间隔是否大于第一阈值;
第一种颜色设置单元,用于若大于第一阈值,则在所述图片中的空白位置生成全国学信网系统的访问链接,其中所述访问链接的颜色为第一种颜色;
第二种颜色设置单元,用于若不大于第一阈值,则在所述图片中的空白位置生成全国学信网系统的访问链接,其中所述访问链接的颜色为第二种颜色。
如上述单元所述,实现了将毕业时间直接反应为链接颜色。一般而言,毕业时间至当前时间的时间间隔代表了工作年限,因此访问链接的颜色直接代表了工作年限长短,从而工作年限一目了然。其中第一种颜色可为绿色,第二种颜色可为红色。
一实施例中,所述利用图像识别技术验证学历的装置,包括:
预处理单元,用于对所述学历证明图片进行预处理,所述预处理至少包括使用灰度转换和中值滤波法进行处理。
如上述单元所述,对所述学历证明图片进行预处理。其中预处理的方式包括:灰度转换、中值滤波法,从而减轻计算量和优化图像质量。其中灰度转换是将原学历证明图片的像素值利用灰度值变换函数转化为灰度值,由于灰度值为O~255,因此能有效减少计算量。中值滤波法是一种非线性平滑技术,它将每一像素点的灰度值设置为该点某邻域窗口内的所有像素点灰度值的中值,从而有效抑制噪声。
本申请的利用图像识别技术验证学历的装置,采用自动获取学历证明图片,并提取学历证明信息,利用设置在所述学历证明图片的空白位置的链接访问全国学信网系统以自动获取准确学历信息,通过对比确定学历的真实性,具有高效、准确地技术效果。
参照图3,本发明实施例中还提供一种计算机设备,该计算机设备可以是服务器,其内部结构可以如图所示。该计算机设备包括通过系统总线连接的处理器、存储器、网络接口和数据库。其中,该计算机设计的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作系统、计算机程序和数据库。该内存器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该计算机设备的数据库用于存储利用图像识别技术验证学历的方法所用数据。该计算机设备的网络接口用于与外部的终端通过网络连接通信。该计算机程序被处理器执行时以实现一种利用图像识别技术验证学历的方法。
上述处理器执行上述利用图像识别技术验证学历的方法,包括:获取学历证明图片,所述学历证明图片包括学位证书或毕业证书;利用图像识别技术提取所述学历证明图片中的信息,其中所述信息至少包括面部图像、证件号码、姓名、毕业时间、学习形式和学校名称信息;通过全国学信网系统的链接自动访问所述全国学信网系统,其中所述链接设置在所述学历证明图片的空白位置;根据所述证件号码与所述姓名,利用全国学信网系统自动获取与所述学历证明图片相对应的准确学历信息;判断从所述学历证明图片中提取的信息与所述准确学历信息是否一致;若一致,则判定所述学历证明图片记录的学历是真实的。
在一个实施例中,所述获取学历证明图片,所述学历证明图片包括学位证书或毕业证书的步骤,包括:接收关联软件发送的获取学历证明图片的指令,所述关联软件包括社交软件;根据所述获取学历证明图片的指令,打开摄像头扫描所述学历证明,以获得所述学历证明图片。
在一个实施例中,所述提取所述学历证明图片中的信息,其中所述信息至少包括面部图像、证件号码、姓名、毕业时间、学习形式和学校名称信息的步骤,包括:利用图像识别技术在所述学历证明图片中提取出面部图像与初步文字信息;从所述初步文字信息中搜索预存的关键词,其中所述关键词至少与证件号码、姓名、毕业时间、学习形式和学校名称信息之一相关联;采用预设规则获取所述学历证明图片中的文字信息,所述预设规则包括以所述关键词本身或邻近的文字信息作为所述学历证明图片中的文字信息,从而所述面部图像与所述学历证明图片中的文字信息共同构成从所述学历证明图片中提取的信息。
在一个实施例中,所述判断从所述学历证明图片中提取的信息与所述准确学历信息是否一致的步骤,包括:判断所述面部图像是否与所述准确学历信息一致;若一致,判断从所述学历证明图片中提取的除面部图像外的其他信息是否与所述准确学历信息一致。
在一个实施例中,所述若一致,则判定所述学历证明图片记录的学历是真实的步骤之后,包括:生成对比表格,所述对比表格包括从所述学历证明图片中提取的信息与所述准确学历信息;生成二维码,所述二维码直接链接所述对比表格。
在一个实施例中,所述通过全国学信网系统的链接自动访问所述全国学信网系统,其中所述链接设置在所述学历证明图片的空白位置的步骤之前,还包括:判断所述毕业时间与当前时间的时间间隔是否大于第一阈值;若大于第一阈值,则在所述图片中的空白位置生成全国学信网系统的访问链接,其中所述访问链接的颜色为第一种颜色;若不大于第一阈值,则在所述图片中的空白位置生成全国学信网系统的访问链接,其中所述访问链接的颜色为第二种颜色。
在一个实施例中,所述提取所述学历证明图片中的信息,其中所述信息至少包括面部图像、证件号码、姓名、毕业时间、学习形式和学校名称信息的步骤之前,包括:对所述学历证明图片进行预处理,所述预处理至少包括使用灰度转换和中值滤波法进行处理。
本领域技术人员可以理解,图中示出的结构,仅仅是与本申请方案相关的部分结构的框图,并不构成对本申请方案所应用于其上的计算机设备的限定。
本申请的计算机设备,采用自动获取学历证明图片,并提取学历证明信息,利用设置在所述学历证明图片的空白位置的链接访问全国学信网系统以自动获取准确学历信息,通过对比确定学历的真实性,具有高效、准确地技术效果。
本申请一实施例还提供一种计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时实现利用图像识别技术验证学历的方法,
包括:获取学历证明图片,所述学历证明图片包括学位证书或毕业证书;利用图像识别技术提取所述学历证明图片中的信息,其中所述信息至少包括面部图像、证件号码、姓名、毕业时间、学习形式和学校名称信息;通过全国学信网系统的链接自动访问所述全国学信网系统,其中所述链接设置在所述学历证明图片的空白位置;根据所述证件号码与所述姓名,利用全国学信网系统自动获取与所述学历证明图片相对应的准确学历信息;判断从所述学历证明图片中提取的信息与所述准确学历信息是否一致;若一致,则判定所述学历证明图片记录的学历是真实的。
在一个实施例中,所述获取学历证明图片,所述学历证明图片包括学位证书或毕业证书的步骤,包括:接收关联软件发送的获取学历证明图片的指令,所述关联软件包括社交软件;根据所述获取学历证明图片的指令,打开摄像头扫描所述学历证明,以获得所述学历证明图片。
在一个实施例中,所述提取所述学历证明图片中的信息,其中所述信息至少包括面部图像、证件号码、姓名、毕业时间、学习形式和学校名称信息的步骤,包括:利用图像识别技术在所述学历证明图片中提取出面部图像与初步文字信息;从所述初步文字信息中搜索预存的关键词,其中所述关键词至少与证件号码、姓名、毕业时间、学习形式和学校名称信息之一相关联;采用预设规则获取所述学历证明图片中的文字信息,所述预设规则包括以所述关键词本身或邻近的文字信息作为所述学历证明图片中的文字信息,从而所述面部图像与所述学历证明图片中的文字信息共同构成从所述学历证明图片中提取的信息。
在一个实施例中,所述判断从所述学历证明图片中提取的信息与所述准确学历信息是否一致的步骤,包括:判断所述面部图像是否与所述准确学历信息一致;若一致,判断从所述学历证明图片中提取的除面部图像外的其他信息是否与所述准确学历信息一致。
在一个实施例中,所述若一致,则判定所述学历证明图片记录的学历是真实的步骤之后,包括:生成对比表格,所述对比表格包括从所述学历证明图片中提取的信息与所述准确学历信息;生成二维码,所述二维码直接链接所述对比表格。
在一个实施例中,所述通过全国学信网系统的链接自动访问所述全国学信网系统,其中所述链接设置在所述学历证明图片的空白位置的步骤之前,还包括:判断所述毕业时间与当前时间的时间间隔是否大于第一阈值;若大于第一阈值,则在所述图片中的空白位置生成全国学信网系统的访问链接,其中所述访问链接的颜色为第一种颜色;若不大于第一阈值,则在所述图片中的空白位置生成全国学信网系统的访问链接,其中所述访问链接的颜色为第二种颜色。
在一个实施例中,所述提取所述学历证明图片中的信息,其中所述信息至少包括面部图像、证件号码、姓名、毕业时间、学习形式和学校名称信息的步骤之前,包括:对所述学历证明图片进行预处理,所述预处理至少包括使用灰度转换和中值滤波法进行处理。
本申请的计算机可读存储介质,采用自动获取学历证明图片,并提取学历证明信息,利用设置在所述学历证明图片的空白位置的链接访问全国学信网系统以自动获取准确学历信息,通过对比确定学历的真实性,具有高效、准确地技术效果。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一非易失性计算机可读取存储介质中,该计算机程序在执行时,可包括如上述各方法的实施例的流程。其中,本申请所提供的和实施例中所使用的对存储器、存储、数据库或其它介质的任何引用,均可包括非易失性和/或易失性存储器。非易失性存储器可以包括只读存储器(ROM)、可编程ROM(PROM)、电可编程ROM(EPROM)、电可擦除可编程ROM(EEPROM)或闪存。易失性存储器可包括随机存取存储器(RAM)或者外部高速缓冲存储器。作为说明而非局限,RAM以多种形式可得,诸如静态RAM(SRAM)、动态RAM(DRAM)、同步DRAM(SDRAM)、双速据率SDRAM(SSRSDRAM)、增强型SDRAM(ESDRAM)、同步链路(Synchlink)DRAM(SLDRAM)、存储器总线(Rambus)直接RAM(RDRAM)、直接存储器总线动态RAM(DRDRAM)、以及存储器总线动态RAM(RDRAM)等。
需要说明的是,在本文中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、装置、物品或者方法不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、装置、物品或者方法所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括该要素的过程、装置、物品或者方法中还存在另外的相同要素。
以上所述仅为本申请的优选实施例,并非因此限制本申请的专利范围,凡是利用本申请说明书及附图内容所作的等效结构或等效流程变换,或直接或间接运用在其他相关的技术领域,均同理包括在本申请的专利保护范围内。

Claims (10)

1.一种利用图像识别技术验证学历的方法,其特征在于,包括:
获取学历证明图片,所述学历证明图片包括学位证书或毕业证书;
利用图像识别技术提取所述学历证明图片中的信息,其中所述信息至少包括面部图像、证件号码、姓名、毕业时间、学习形式和学校名称信息;
通过全国学信网系统的链接自动访问所述全国学信网系统,其中所述链接设置在所述学历证明图片的空白位置;
根据所述证件号码与所述姓名,利用全国学信网系统自动获取与所述学历证明图片相对应的准确学历信息;
判断从所述学历证明图片中提取的信息与所述准确学历信息是否一致;
若一致,则判定所述学历证明图片记录的学历是真实的。
2.根据权利要求1所述的利用图像识别技术验证学历的方法,其特征在于,所述获取学历证明图片,所述学历证明图片包括学位证书或毕业证书的步骤,包括:
接收关联软件发送的获取学历证明图片的指令,所述关联软件包括社交软件;
根据所述获取学历证明图片的指令,打开摄像头扫描所述学历证明,以获得所述学历证明图片。
3.根据权利要求1所述的利用图像识别技术验证学历的方法,其特征在于,所述提取所述学历证明图片中的信息,其中所述信息至少包括面部图像、证件号码、姓名、毕业时间、学习形式和学校名称信息的步骤,包括:
利用图像识别技术在所述学历证明图片中提取出面部图像与初步文字信息;
从所述初步文字信息中搜索预存的关键词,其中所述关键词至少与证件号码、姓名、毕业时间、学习形式和学校名称信息之一相关联;
采用预设规则获取所述学历证明图片中的文字信息,所述预设规则包括以所述关键词本身或邻近的文字信息作为所述学历证明图片中的文字信息,从而所述面部图像与所述学历证明图片中的文字信息共同构成从所述学历证明图片中提取的信息。
4.根据权利要求1所述的利用图像识别技术验证学历的方法,其特征在于,所述判断从所述学历证明图片中提取的信息与所述准确学历信息是否一致的步骤,包括:
判断所述面部图像是否与所述准确学历信息中的面部图像一致;
若一致,判断从所述学历证明图片中提取的除面部图像外的其他信息是否与所述准确学历信息一致。
5.根据权利要求1所述的利用图像识别技术验证学历的方法,其特征在于,所述若一致,则判定所述学历证明图片记录的学历是真实的步骤之后,包括:
生成对比表格,所述对比表格包括从所述学历证明图片中提取的信息与所述准确学历信息;
生成二维码,所述二维码直接链接所述对比表格。
6.根据权利要求1所述的利用图像识别技术验证学历的方法,其特征在于,所述通过全国学信网系统的链接自动访问所述全国学信网系统,其中所述链接设置在所述学历证明图片的空白位置的步骤之前,还包括:
判断所述毕业时间与当前时间的时间间隔是否大于第一阈值;
若大于第一阈值,则在所述图片中的空白位置生成全国学信网系统的访问链接,其中所述访问链接的颜色为第一种颜色;
若不大于第一阈值,则在所述图片中的空白位置生成全国学信网系统的访问链接,其中所述访问链接的颜色为第二种颜色。
7.根据权利要求1所述的利用图像识别技术验证学历的方法,其特征在于,所述提取所述学历证明图片中的信息,其中所述信息至少包括面部图像、证件号码、姓名、毕业时间、学习形式和学校名称信息的步骤之前,包括:
对所述学历证明图片进行预处理,所述预处理至少包括使用灰度转换和中值滤波法进行处理。
8.一种利用图像识别技术验证学历的装置,其特征在于,包括:
学历证明图片获取单元,用于获取学历证明图片,所述学历证明图片包括学位证书或毕业证书;
学历证明图片信息提取单元,用于利用图像识别技术提取所述学历证明图片中的信息,其中所述信息至少包括面部图像、证件号码、姓名、毕业时间、学习形式和学校名称信息;
全国学信网系统访问单元,用于通过全国学信网系统的链接自动访问所述全国学信网系统,其中所述链接设置在所述学历证明图片的空白位置;
准确学历信息获取单元,用于根据所述证件号码与所述姓名,利用全国学信网系统自动获取与所述学历证明图片相对应的准确学历信息;
第一判断单元,用于判断从所述学历证明图片中提取的信息与所述准确学历信息是否一致;
学历证明真实性判定单元,用于若一致,则判定所述学历证明图片记录的学历是真实的。
9.一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1至7中任一项所述方法的步骤。
10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至7中任一项所述的方法的步骤。
CN201811185762.8A 2018-10-11 2018-10-11 利用图像识别技术验证学历的方法、装置和计算机设备 Pending CN109492533A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201811185762.8A CN109492533A (zh) 2018-10-11 2018-10-11 利用图像识别技术验证学历的方法、装置和计算机设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201811185762.8A CN109492533A (zh) 2018-10-11 2018-10-11 利用图像识别技术验证学历的方法、装置和计算机设备

Publications (1)

Publication Number Publication Date
CN109492533A true CN109492533A (zh) 2019-03-19

Family

ID=65689555

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201811185762.8A Pending CN109492533A (zh) 2018-10-11 2018-10-11 利用图像识别技术验证学历的方法、装置和计算机设备

Country Status (1)

Country Link
CN (1) CN109492533A (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110070019A (zh) * 2019-04-15 2019-07-30 南京孜博汇信息科技有限公司 位置编码表单数据有效性鉴别方法及装置
CN110442744A (zh) * 2019-08-09 2019-11-12 泰康保险集团股份有限公司 提取图像中目标信息的方法、装置、电子设备及可读介质
CN110895711A (zh) * 2019-11-05 2020-03-20 泰康保险集团股份有限公司 入职管理方法及装置

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105279525A (zh) * 2015-11-19 2016-01-27 浪潮软件集团有限公司 一种图像处理的方法及装置
CN105956578A (zh) * 2016-05-23 2016-09-21 深圳华中科技大学研究院 一种基于身份证件信息的人脸验证方法
CN106790061A (zh) * 2016-12-20 2017-05-31 财付通支付科技有限公司 用户信息验证方法和装置
CN107729847A (zh) * 2017-10-20 2018-02-23 阿里巴巴集团控股有限公司 一种证件验证、身份验证方法和装置
CN107909339A (zh) * 2017-11-01 2018-04-13 平安科技(深圳)有限公司 应聘人员验证定级方法、应用服务器及计算机可读存储介质

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105279525A (zh) * 2015-11-19 2016-01-27 浪潮软件集团有限公司 一种图像处理的方法及装置
CN105956578A (zh) * 2016-05-23 2016-09-21 深圳华中科技大学研究院 一种基于身份证件信息的人脸验证方法
CN106790061A (zh) * 2016-12-20 2017-05-31 财付通支付科技有限公司 用户信息验证方法和装置
CN107729847A (zh) * 2017-10-20 2018-02-23 阿里巴巴集团控股有限公司 一种证件验证、身份验证方法和装置
CN107909339A (zh) * 2017-11-01 2018-04-13 平安科技(深圳)有限公司 应聘人员验证定级方法、应用服务器及计算机可读存储介质

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110070019A (zh) * 2019-04-15 2019-07-30 南京孜博汇信息科技有限公司 位置编码表单数据有效性鉴别方法及装置
CN110442744A (zh) * 2019-08-09 2019-11-12 泰康保险集团股份有限公司 提取图像中目标信息的方法、装置、电子设备及可读介质
CN110442744B (zh) * 2019-08-09 2022-11-04 泰康保险集团股份有限公司 提取图像中目标信息的方法、装置、电子设备及可读介质
CN110895711A (zh) * 2019-11-05 2020-03-20 泰康保险集团股份有限公司 入职管理方法及装置

Similar Documents

Publication Publication Date Title
KR102226619B1 (ko) 증명서 및 신원 검증 방법 및 장치
CN109492533A (zh) 利用图像识别技术验证学历的方法、装置和计算机设备
CN112613501A (zh) 信息审核分类模型的构建方法和信息审核方法
CN106022317A (zh) 人脸识别方法及装置
CN109446905A (zh) 电子签名审核方法、装置、计算机设备和存储介质
CN109711874A (zh) 用户画像生成方法、装置、计算机设备和存储介质
CN110110588A (zh) 基于人脸识别在线办理业务的方法、装置计算机设备
CN108764239A (zh) 发票验伪方法、装置、计算机设备及存储介质
CN109255747A (zh) 一种信息申报的智能审核方法
CN110428399A (zh) 用于检测图像的方法、装置、设备和存储介质
CN110147787A (zh) 基于深度学习的银行卡号自动识别方法及系统
CN108429745A (zh) 登录的认证方法和认证系统、网页登录方法和系统
CN109816200A (zh) 任务推送方法、装置、计算机设备和存储介质
CN113111880B (zh) 证件图像校正方法、装置、电子设备及存储介质
CN109409349A (zh) 信贷证件鉴别方法、装置、终端及计算机可读存储介质
WO2021042842A1 (zh) 基于ai面试系统的面试方法、装置和计算机设备
CN108846015A (zh) 不动产信息查询方法、装置、计算机设备和存储介质
US20210019511A1 (en) Systems and methods for extracting data from an image
US6161108A (en) Method and apparatus for managing images, a method and apparatus for retrieving images, and a computer-readable recording medium with a program for making a computer execute the methods stored therein
Cho et al. A Study on Development of OTIP System using QR Code based on Smartphone
CN111832547A (zh) 文字识别模型的动态部署方法、装置和计算机设备
CN116468633A (zh) 一种图像复原方法、装置及电子设备
CN110147850A (zh) 图像识别的方法、装置、设备及存储介质
CN113837169B (zh) 文本数据处理方法、装置、计算机设备及存储介质
CN115984047A (zh) 结合rpa和ai实现ia的文书处理方法、装置、设备及介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination