CN113869257A - 一种笔迹分析方法、装置、设备及可读存储介质 - Google Patents

一种笔迹分析方法、装置、设备及可读存储介质 Download PDF

Info

Publication number
CN113869257A
CN113869257A CN202111171615.7A CN202111171615A CN113869257A CN 113869257 A CN113869257 A CN 113869257A CN 202111171615 A CN202111171615 A CN 202111171615A CN 113869257 A CN113869257 A CN 113869257A
Authority
CN
China
Prior art keywords
handwriting
model
picture
feature recognition
evaluation
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202111171615.7A
Other languages
English (en)
Inventor
李松
张川波
张凤
潘世慧
黄成�
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Xinhua Technology Beijing Co ltd
Original Assignee
Xinhua Technology Beijing Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Xinhua Technology Beijing Co ltd filed Critical Xinhua Technology Beijing Co ltd
Priority to CN202111171615.7A priority Critical patent/CN113869257A/zh
Publication of CN113869257A publication Critical patent/CN113869257A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/36Creation of semantic tools, e.g. ontology or thesauri
    • G06F16/367Ontology
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • G06F18/2415Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on parametric or probabilistic models, e.g. based on likelihood ratio or false acceptance rate versus a false rejection rate
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N5/00Computing arrangements using knowledge-based models
    • G06N5/04Inference or reasoning models
    • G06N5/042Backward inferencing

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Computational Linguistics (AREA)
  • Evolutionary Computation (AREA)
  • Software Systems (AREA)
  • Mathematical Physics (AREA)
  • Computing Systems (AREA)
  • Biophysics (AREA)
  • Molecular Biology (AREA)
  • General Health & Medical Sciences (AREA)
  • Biomedical Technology (AREA)
  • Health & Medical Sciences (AREA)
  • Probability & Statistics with Applications (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Biology (AREA)
  • Animal Behavior & Ethology (AREA)
  • Databases & Information Systems (AREA)
  • Character Discrimination (AREA)

Abstract

本发明公开了一种笔迹分析方法,该方法依托深度学习和机器视觉技术基于海量笔迹样本及标注文件训练得到笔迹特征识别模型,同时基于大量数据分析建立笔迹特征与性格特质知识图谱,在应用阶段通过调用预训练的笔迹特征识别模型得到笔迹特征,然后从笔迹特征与性格特质知识图谱中得到受测者相应基础性格特质以及情绪状态,再调用垂直指标评估模型融合基础性格特质以及情绪状态确定书写者在书写时的表现倾向或能力特长,再调用文本生成模型根据评估结果进行语句组织,可以生成针对书写者不同维度和应用场景的评估分析报告。本发明还公开了一种笔迹分析装置、设备及可读存储介质,具有相应的技术效果。

Description

一种笔迹分析方法、装置、设备及可读存储介质
技术领域
本发明涉及数据处理技术领域,特别是涉及一种笔迹分析方法、装置、设备及可读存储介质。
背景技术
笔迹是指书写人内在的书写习惯与特定时空条件下的主客观因素相互作用外化成的一种文字符号形象系统。
笔迹分析依据特质理论,所谓“特质”是指一种可表现于许多环境的、相对持久的、一致而稳定的思想、情感和动作的特点,它表现在一个人人格的特点的行为倾向。每个人在学习或工作过程中,个人特质会不同程度地影响其外在表现,或者使其产生倾向性行为,而这些行为决定了相应的结果。笔迹分析经常会用在人才测评、心理咨询、家庭教育、企业EAP、情绪判断、学习力、领导力等的分析,比如一个孩子行向或者横向上倾,代表这个孩子心态是积极向上的。
目前笔迹分析主要靠分析师个人,而个人的笔迹分析能力掌握程度完全依靠各自悟性,属于主观感性研究,难以量化;而且有理论基础有经验的分析师资源少,各分析师之间水平参差不齐,而且大多停留在一般性格分析层面,难以适应不同领域、场景以及深度应用;同时个人的知识和经验难以积累,分析结果缺乏数据支撑,难以广泛扩展应用。
综上所述,如何实现精准的自动化笔迹分析,是目前本领域技术人员急需解决的技术问题。
发明内容
本发明的目的是提供一种笔迹分析方法、装置、设备及可读存储介质,以实现精准的自动化笔迹分析。
为解决上述技术问题,本发明提供如下技术方案:
一种笔迹分析方法,包括:
接收待识别的笔迹图片,作为目标图片;
对所述目标图片进行归一化处理,得到归一化图片;
调用预训练的笔迹特征识别模型对所述归一化图片进行笔迹特征识别,得到笔迹特征;
根据所述笔迹特征从性格特质知识图谱中得到对应的基础性格特质以及情绪状态;
融合所述基础性格特质以及所述情绪状态,调用垂直指标评估模型生成评估结果;
调用文本生成模型根据所述评估结果进行语句组织,生成评估分析报告。
可选地,所述笔迹特征识别模型的训练方法,包括:
接收笔迹样本集;
对所述笔迹样本集中各图片进行归一化预处理,得到归一化样本集;
接收所述归一化样本集中各图片的笔迹特征标注,生成标注文件集;
根据所述标注文件集对搭建的笔迹特征识别模型进行训练,得到训练后的笔迹特征识别模型;
对所述训练后的笔迹特征识别模型进行测试验证,并根据所述测试验证反馈的模型收敛情况及准确率进行参数优化调整。
可选地,在所述对所述笔迹样本集中各图片进行归一化预处理之前,还包括:
删除所述笔迹样本集中的重复图片以及不清晰图片。
可选地,在所述根据所述标注文件集对搭建的笔迹特征识别模型进行训练之前,还包括:
根据所述笔迹特征标注对对应的图片进行有效信息部分裁剪,得到裁剪图片集;
则相应地,所述根据所述标注文件集对搭建的笔迹特征识别模型进行训练,包括:根据所述裁剪图片集对搭建的笔迹特征识别模型进行训练。
可选地,在所述根据所述标注文件集对搭建的笔迹特征识别模型进行训练之前,还包括:
对所述标注文件集进行数据增强处理,得到扩展图片集;
则相应地,所述根据所述标注文件集对搭建的笔迹特征识别模型进行训练,包括:根据所述扩展图片集对搭建的笔迹特征识别模型进行训练。
可选地,在所述根据所述笔迹特征从性格特质知识图谱中得到对应的基础性格特质以及情绪状态之前,还包括:
提取所述归一化图片中的文字信息;
则相应地,所述根据所述笔迹特征从性格特质知识图谱中得到对应的基础性格特质以及情绪状态,包括:根据所述笔迹特征以及所述文字信息,从性格特质知识图谱中得到对应的基础性格特质以及情绪状态。
可选地,所述笔迹特征识别模型、所述垂直指标评估模型以及所述文本生成模型分布式部署于若干台服务器;
则相应地,所述调用预训练的笔迹特征识别模型对所述归一化图片进行笔迹特征识别,包括:确定所述笔迹特征识别模型部署的各服务器,作为特征识别服务器;并发调用各所述特征识别服务器对所述归一化图片进行笔迹特征识别;
融合所述基础性格特质以及所述情绪状态,调用垂直指标评估模型生成评估结果,包括:确定所述垂直指标评估模型部署的各服务器,作为指标评估服务器;融合所述基础性格特质以及所述情绪状态,并发调用各所述指标评估服务器生成评估结果;
所述调用文本生成模型根据所述评估结果进行语句组织,包括:确定所述文本生成模型部署的各服务器,作为文本生成服务器;并发调用各所述文本生成服务器根据所述评估结果进行语句组织。
一种笔迹分析装置,包括:
图片接收单元,用于接收待识别的笔迹图片,作为目标图片;
归一化处理单元,用于对所述目标图片进行归一化处理,得到归一化图片;
笔记特征识别单元,用于调用预训练的笔迹特征识别模型对所述归一化图片进行笔迹特征识别,得到笔迹特征;
性格情绪匹配单元,用于根据所述笔迹特征从性格特质知识图谱中得到对应的基础性格特质以及情绪状态;
应用评估单元,用于融合所述基础性格特质以及所述情绪状态,调用垂直指标评估模型生成评估结果;
报告生成单元,用于调用文本生成模型根据所述评估结果进行语句组织,生成评估分析报告。
一种计算机设备,包括:
存储器,用于存储计算机程序;
处理器,用于执行所述计算机程序时实现上述笔迹分析方法的步骤。
一种可读存储介质,所述可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现上述笔迹分析方法的步骤。
本发明实施例所提供的方法,该方法依托深度学习和机器视觉技术基于海量笔迹样本及标注文件训练得到笔迹特征识别模型,同时基于大量数据分析建立笔迹特征与性格特质知识图谱,在应用阶段通过调用预训练的笔迹特征识别模型得到笔迹特征,然后从笔迹特征与性格特质知识图谱中得到受测者相应基础性格特质,再调用垂直指标评估模型融合基础性格特质确定书写者在书写时的表现倾向或能力特长,再调用文本生成模型根据评估结果进行语句组织,可以生成针对书写者不同维度和应用场景的评估分析报告,通过该分析报告可以帮助使用者清楚了解书写者的性格特质、负向情绪状态、学习力、领导力、工作表现倾向、能力特长等应用层面的指标。相应地,本发明实施例还提供了与上述笔迹分析方法相对应的笔迹分析装置、设备和可读存储介质,具有上述技术效果,在此不再赘述。
附图说明
为了更清楚地说明本发明实施例或相关技术中的技术方案,下面将对实施例或相关技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例中一种笔迹分析方法的实施流程图;
图2为本发明实施例中一种模型结构示意图;
图3为本发明实施例中一种模型分布式部署示意图;
图4为本发明实施例中一种笔迹分析装置的结构示意图;
图5为本发明实施例中一种计算机设备的结构示意图。
具体实施方式
本发明的核心是提供一种笔迹分析方法,可以实现精准的自动化笔迹分析。
为了使本技术领域的人员更好地理解本发明方案,下面结合附图和具体实施方式对本发明作进一步的详细说明。显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
笔迹是指书写人内在的书写习惯与特定时空条件下的主客观因素相互作用外化成的一种文字符号形象系统。“笔迹学”是研究书写习惯的特性及其表现规律特点,以及鉴定、识别方法的物证技术科学,是以笔迹鉴定和笔迹分析作为研究内容的学科。
笔迹心理学起源于笔迹学,是以心理学投射理论与潜意识理论为基础,结合生理学基础及社会学基础的理论。笔迹心理分析是利用笔迹分析及鉴定等技术,比较笔迹的异同,分析和判断书写者的主要书写特征和次要书写特征,从而分析这些特征与心理的关系,根据临床经验,实证资料推论,间接地评估其中的表现和反映投射出来的情绪、个性、知觉特征等。
之所以能够从笔迹分析出书写者的性格、气质、能力等特征,就是因为笔迹已经包含了书写者的相关信息,笔迹分析的过程就是将这些信息翻译出来的过程。本方法以笔迹学为理论基础,结合笔迹心理学与人格特质理论,通过研究心理投射和书写习惯特性及其表现规律特点,利用鉴定、识别方法的物证技术科学,对人在自然状态下习惯性书写的笔迹进行分析和判断并应用大数据和人工智能多模态深度学习和自然语义理解等技术,基于海量样本,以及临床经验和实证资料,得出笔迹特征与个人特质和能力关系模型,是一种智能高效的性格特质测评工具,可以帮助使用者清楚了解书写者的特质、工作表现倾向与能力特长,根据书写者特质进行人岗匹配的评估,协助用人部门主管制定人才培养规划,为企业人才选、用、育、留提供有效的参考依据。
请参考图1,图1为本发明实施例中一种笔迹分析方法的流程图,该方法包括以下步骤:
S101、接收待识别的笔迹图片,作为目标图片;
获取待识别评估的带有手写笔迹的图片,作为目标图片。其中,笔迹在图片中需保证清晰,以便后续文字提取的可靠性。
S102、对目标图片进行归一化处理,得到归一化图片;
由于采集的笔迹图片一般是通过手机等设备拍照采集得到,不同的图片之间分辨率和大小以及拍摄角度、亮度、曝光度等都不一样,为保证识别的精准度,排除其他无关因素的干扰,首先对目标图片进行摆正、调色、去噪、分辨率增强、对齐、透视变换、以及颜色归一化、颜色通道分离等归一化预处理,对于具体采用的归一化预处理手段本实施例中不做限定,可以根据实际应用场景下的拍摄环境以及拍摄设备进行适应性调整。
S103、调用预训练的笔迹特征识别模型对归一化图片进行笔迹特征识别,得到笔迹特征;
系统调用已经训练好的笔迹特征识别模型,笔迹特征识别模型为预训练的用于根据笔迹图片进行笔迹特征识别的模型,模型根据归一化图片中展示的用户书写方式分别对不同笔迹特征进行识别并给出判断结果,这里的笔迹特征比如笔压、行向、行间距、字间距、整洁度、字体大小、字的结构、速度、连笔、布局等,对于具体的特征类别本实施例中不做限定,可以根据识别的需要进行相应设定,本实施例中仅以上述特征为例进行介绍,基于其他笔迹特征的识别均可参照本实施例的介绍,在此不再赘述。
笔迹特征识别模型为预训练的模型,对于其模型结构以及模型训练方式,本实施例中均不做限定,可以根据使用需要进行模型结构以及训练方式的设置。
S104、根据笔迹特征从性格特质知识图谱中得到对应的基础性格特质以及情绪状态;
基础性格特质,也即个人“特质”,是指一种可表现于许多环境的、相对持久的、一致而稳定的思想、情感和动作的特点,它表现在一个人人格的特点的行为倾向,基础性格特质比如个性平和、有自制力、开朗、内向、圆滑、有目标感、思维严谨、周密、有追求欲等。每个人在工作过程中,个人特质会不同程度地影响其外在表现,或者使其产生倾向性行为,而这些行为决定了笔迹特征的差异性。
情绪状态是一种由于外界环境及事务影响下个人的表现,不同于稳定的基础性格特质,情绪状态往往会随着外界事务的变化而变化,是一种实时性用户特征,而个人情绪状态也会不同程度地影响其外在表现,导致了笔迹特征的差异性。
影响一个人的表现的因素可以分为内部因素以及外在因素,内部隐私即基础性格特质,外部因素即情绪状态,两者共同影响了其外在的笔迹,使得在不同基础性格特质以及情绪状态下笔迹特征也存在差异性。
本方法中就是基于笔迹特征间的差异性对基础性格特质以及情绪状态进行反向推理,通过性格特质知识图谱统计各种笔迹特征对应的基础性格特质以及情绪状态,比如字体大→自信、开朗;字与字之间结构松散→思维活跃等,从整洁度、字体大小、字的结构、笔压、速度、连笔、行向、布局、字间距、行间距等笔迹特征中匹配对应的基础性格特质,从整体字态分析、行向多角度分析、字间距分析、字向多角度分析、线条分析、末笔收笔分析、主笔之横的分析、主笔之竖的分析、出头情况分析、上下对齐分析、字内3维分析等笔迹特征中匹配对应的情绪状态,再基于基础性格特质和情绪状态进行应用层面的用户评估,实现笔迹分析。需要说明的是,对于情绪状态匹配以及基础性格特质匹配的具体匹配指标本实施例中不做限定,上述只介绍了一种评估特征的配置,可以根据实际研究分析进行自定义配置,本实施例中对此不做限定。
本步骤中调用的性格特质知识图谱为围绕笔迹分析理论及绘画心理学,关联提取的文字信息与笔迹图片基于大量数据分析建立的笔迹特征与基础性格特质、情绪状态匹配的知识图谱,性格特质知识图谱构建了专门针对性格和心理特征提取的业务标签体系,可以实现书写者笔迹特征的数字化、结构化。在确定笔迹特征后,可以从性格特质知识图谱中匹配得到对应的基础性格特质以及情绪状态,实现方式简单且可以实现精准匹配。
S105、融合基础性格特质以及情绪状态,调用垂直指标评估模型生成评估结果;
垂直指标评估模型指用于实现垂直领域下的特定指标评估的模型,其中特定指标属于用户的表现倾向或能力特长范围,由于本实施例中对于具体的应用场景不做限定,因此对于垂直指标评估模型中具体评估的指标不做限定,具体地可以根据具体的应用领域进行垂直指标评估模型的具体设置,比如垂直指标评估模型可以为负面情绪评估模型以实现负面情绪(抑郁)早期筛查;还可以为学习力(学习能力、学习动力、学习毅力、学习创新力、学习态度、学习适应性)评估模型以实现学生学习力测评;还可以为领导力评估模型以实现特种职业心理素质测评以及职业发展测试等,以广泛适应包括企业人力资源管理、金融行业人员风险管理、学校及文化教育、健康养生、心理咨询、政府、公安司法等多领域下的测评。
需要说明的是,输入至垂直指标评估模型中进行分析的对象除了基础性格特质以及情绪状态外还可以包括其他数据,比如笔迹特征等,以实现多方面综合测评。
由于本实施例中对于调用垂直指标评估模型具体的模型评估指标不做限定,则对于不同评估指标下的评估方式,即对于基础性格特质以及情绪状态在指定指标下的表现程度标准也不做限定,可以根据实际应用的评估对象以及评估指标来确定,在此不再赘述。
经过调用垂直指标评估模型根据基础性格特质以及情绪状态在指定指标下的表现程度进行用户综合评估后,会生成针对该指定指标的用户评估结果,该评估结果指示用户在指定指标下的表现力,比如抑郁程度、学习能力的高低以及领导力的大小等。
S106、调用文本生成模型根据评估结果进行语句组织,生成评估分析报告。
评估结果一般是若干单独的关键词,为提升可读性,本实施例中在得到评估结果后进一步调用文本生成模型应用自然语义处理及深度学习技术自主根据评估结果撰写针对该笔迹图片人物特质,生成分析结果报告,评估分析报告是一种逻辑完整衔接恰当的文本,将关键词组织为评估分析报告可以提升结果的专业程度以及可读性,从而提升用户体验。
而具体调用的文本生成模型的具体模型类型以及模型结构本实施例中不做限定,一种实现方式如下:基于paddlehub,应用图像分类模型xception71_imagenet,基于前面建立的笔记特征和性格特质知识图谱以及抽取到的文本信息,调用文本生成模型ernie_gen_couplet和情感分析模型senta_bow生成带有情感的近义词并组成报告语句然后按照设计的模板形成分析结果报告。
上述笔迹分析的实现过程对于用户侧来说,只需拍照并上传笔迹图片,然后只需等待系统返回分析结果报告,流程简单,无需过多的用户操作,优化了用户体验,也降低了使用者的专业性要求。
基于上述介绍,本发明实施例所提供的技术方案,依托深度学习和机器视觉技术基于海量笔迹样本及标注文件训练得到笔迹特征识别模型,同时基于大量数据分析建立笔迹特征与性格特质知识图谱,在应用阶段通过调用预训练的笔迹特征识别模型得到笔迹特征,然后从笔迹特征与性格特质知识图谱中得到受测者相应基础性格特质,再调用垂直指标评估模型融合基础性格特质确定书写者在书写时的表现倾向或能力特长,再调用文本生成模型根据评估结果进行语句组织,可以生成针对书写者不同维度和应用场景的评估分析报告,通过该分析报告可以帮助使用者清楚了解书写者的性格特质、负向情绪状态、学习力、领导力、工作表现倾向、能力特长等应用层面的指标。
需要说明的是,基于上述实施例,本发明实施例还提供了相应的改进方案。在优选/改进实施例中涉及与上述实施例中相同步骤或相应步骤之间可相互参考,相应的有益效果也可相互参照,在本文的优选/改进实施例中不再一一赘述。
为进一步提升基础性格特质以及情绪状态的识别精准度,在根据笔迹特征从性格特质知识图谱中得到对应的基础性格特质以及情绪状态之前,可以提取归一化图片的文字信息。
本步骤中提取归一化图片中的文字信息,主要目的是为了再重点研究书写者对特殊字的书写方式,以提升基础性格特质的分析精准度。经过申请人研究发现有几个重点字的写法能够特别提现某个特质,因此需要把重点字识别出来然后重点分析;另外,在不限定书写内容时,一些特别的字的写法也有意义,例如:我是中国人等;还有,一个人在写一般的字和签名有很大差异,因此也可以通过签名进行特质的重点分析。
对于文字信息的提取可以应用光学字符识别、文本信息抽取等自然语言(NLP)处理相关技术,本实施例中对此不做限定。
则在提取归一化图片中的文字信息之后,上述实施例中根据笔迹特征从性格特质知识图谱中得到对应的基础性格特质以及情绪状态,具体为:根据笔迹特征以及文字信息,从性格特质知识图谱中得到对应的基础性格特质以及情绪状态。
模型根据文字信息以及归一化图片中展示的用户书写方式分别对不同笔迹特征进行识别并给出判断结果,可以得到更精准的识别结果。
另外,上述实施例中对于各模型的模型类型、模型结构以及模型训练方式均不作限定,可以根据实际应用场景的需要进行相应设定。本实施例中主要介绍一种笔记特征识别模型的训练方法,其他类型或结构的模型的训练方式均可参照本实施例的介绍,在此不再赘述。
在一种实施例中,笔迹特征识别模型的训练方法,具体可以包括以下步骤:
(1)接收笔迹样本集;
为提升笔记识别的精准度,笔迹样本集图像尽量通过在自然背景下书写现场采集得到,以为后期实际推广应用奠定基础。笔迹样本集尽量选取笔迹成熟的不同性格环境下的人员的笔迹图像,比如可以选取12周岁以上学生、公司职员、企事业单位工作人员、政府工作人员、抑郁症患者、自杀者遗书等6大类30多个分支的笔迹图像,对于图像的数量不做限定,为提升后续模型识别精准度,样本集数量尽可能的多,比如可以采集910万样本作为笔迹样本集,以每个类别的80%数据构建训练集,剩余20%的数据构成测试集。
(2)对笔迹样本集中各图片进行归一化预处理,得到归一化样本集;
由于采集的笔迹图片大多是通过手机等非专业设备拍照采集得到,分辨率和大小以及拍摄角度、亮度、曝光度等可能都不一样,为提升识别精准度,对笔迹图片进行摆正、调色、去噪、分辨率增强、对齐、透视变换、以及颜色归一化、颜色通道分离等归一化预处理,具体的预处理手段仅以上述为例,其他手段均可参照本实施例的介绍,在此不再赘述。
(3)接收归一化样本集中各图片的笔迹特征标注,生成标注文件集;
本实施例中以弱监督模型结构为例,(采用LabelImg工具)人工标注所有用于研发的笔迹图片数据集,比如分别将性格特征的29个类别、137个笔迹特征以及情绪识别的13个类别39个笔迹特征做标注,生成标注文件集。
(4)根据标注文件集对搭建的笔迹特征识别模型进行训练,得到训练后的笔迹特征识别模型;
将标注的训练样本输入至搭建的笔迹特征识别模型进行笔迹特征识别,得到训练后的笔迹特征识别模型。
(5)对训练后的笔迹特征识别模型进行测试验证,并根据测试验证反馈的模型收敛情况及准确率进行参数优化调整。
测试验证指模型提取的特征与对应标注的差异,标注指示需要达到的目标特征,因此对训练后的笔迹特征识别模型进行测试验证可以确定根据笔迹特征标注与训练特征间的差异,具体可以包括模型收敛情况及准确率等,并依据该差异对笔迹特征识别模型进行优化反馈调整,以保证模型提取效果逐步向目标特征靠近,提升模型特征提取效果。
该种模型训练方法可以保证在不同设备下采集的不同样本图片的精准识别训练。
而进一步地,在对笔迹样本集中各图片进行归一化预处理之前,可以还执行以下步骤:删除笔迹样本集中的重复图片以及不清晰图片。
对所有样本笔迹图片数据作删除重复样本和删除不清晰样本等预处理,可以避免劣质样本对于模型训练的干扰,提升模型训练的针对性,从而保证训练效果。
而进一步地,在根据标注文件集对搭建的笔迹特征识别模型进行训练之前,可以还执行以下步骤:
根据笔迹特征标注对对应的图片进行有效信息部分裁剪,得到裁剪图片集;根据标注信息,裁剪数据集图片样本,仅仅裁剪处包含标注信息的有用信息部分,剔除无用信息,避免干扰。
则在得到裁剪图片集之后,上述步骤中根据标注文件集对搭建的笔迹特征识别模型进行训练,具体为:根据裁剪图片集对搭建的笔迹特征识别模型进行训练。
而进一步地,在根据裁剪图片集对搭建的笔迹特征识别模型进行训练之前,可以还执行以下步骤:
删除裁剪图片集中的重复图片以及不清晰图片。
在进行有用信息的裁剪后,对裁剪后数据集进行二次去重和清除脏数据的处理,以全面剔除劣质样本。
而进一步地,在根据标注文件集对搭建的笔迹特征识别模型进行训练之前,还执行以下步骤:对标注文件集进行数据增强处理,得到扩展图片集;对清洗后的笔迹图片数据做数据增强处理,使每种类型图像数量显著增加(达到100000以上),以保证在样本图片有限的情况下保障模型训练效果。
则相应地,上述步骤中根据标注文件集对搭建的笔迹特征识别模型进行训练,具体为:根据扩展图片集对搭建的笔迹特征识别模型进行训练,具体可以根据4∶1的比例构建试验的训练集和测试集进行模型的识别训练,构建比例在此不做限定。
上述实施例中针对不同模型结构下的模型训练过程进行了介绍,为加深理解,本实施例中以VGG-16网络结构为例,在得到训练集和测试集之后,对模型的识别训练具体实现方式进行具体介绍,其他模型结构下的模型处理以及训练过程均可参照本实施例的介绍,在此不再赘述。
卷积神经网络是一种模拟人脑结构的多层次非全连接的神经网络,具有强大的特征提取能力,通过有监督的多层网络学习,能够直接从原始图像中识别理解图像内容。VGG-16是其中的一个经典的卷积神经网络模型,如图2所示为一种模型结构示意图,该网络模型共经历13次卷积层、4次池化和3个全连接层,共16层,具有局部连接、权值共享、池化等特点,其网络结构如图所示。输入图片尺寸变化规律是从224x224到112x112等,直到最后变成7x7。因此VGG-16结构简单而优美,层次清晰,实现起来也很规整。VGG-16最大的特点是通过3×3滤波器的组合与堆叠,可提取输入图像包含的细小特征。
输入图像尺寸是3个通道的224×224,采用VGG-16构建智能识别模型,整个网络模型分为卷积层、池化层、全连接层和分类层,其中卷积层共有5个卷积段,每个卷积段采用2或3个卷基层连续堆叠组成卷积序列,卷积过程中采用“SAME”模式,不会改变特征图的分辨率;在池化层采用2×2池化窗口,步长为2,用于减小卷积后的特征图像尺寸大小,也实现了模型的平移不变性;在全连接层由3个连续的全连接进行组合,通道数分别为4096、4096、1000个;最后,在分类层由具有1000个标签的SoftMax分类器进行分类输出。
笔迹特征识别模型可以安装有4个NVIDIA Tesla P40 24GB卡和2个Intel至强E5-2697v4处理器18核36线程服务器上完成,该服务器装有Ubuntu 16.0操作系统、PaddlePaddle 1.8.4框架。本实施例中仅以该种笔迹特征识别模型运行环境为例进行介绍,其他运行环境下的配置均可参照本实施例的介绍,在此不再赘述。
笔迹特征识别模型在装有4个NVIDIA Tesla P启动模型训练程序,训练过程采用弱监督卷积神经网络技术,应用VGG卷积神经网络模型实现笔迹细节特征的识别,卷积神经网络是一种模拟人脑结构的多层次非全连接的神经网络,具有强大的特征提取能力,通过有监督的多层网络学习,能够直接从笔迹图像中识别理解图像内容。VGG-16是一个经典的卷积神经网络模型,经历13次卷积层、4次池化和3个全连接层,共16层,通过局部连接、权值共享、池化等过程,输入笔迹图片尺寸从224x224递减到112x112,直到最后变成7x7。整个网络模型分为卷积层、池化层、全连接层和分类层,其中卷积层共有5个卷积段,每个卷积段采用2或3个卷基层连续堆叠组成卷积序列,卷积过程中采用“SAME”模式,不会改变特征图的分辨率;在池化层采用2×2池化窗口,步长为2,用于减小卷积后的特征图像尺寸大小,也实现了模型的平移不变性;在全连接层由3个连续的全连接进行组合,通道数分别为4096、4096、1000个;最后,在分类层由具有1000个标签的SoftMax分类器进行分类输出。实现了结构简单、层次清晰、过程规整。VGG-16通过3×3滤波器的组合与堆叠,提取输入的笔迹图像包含的细小特征,包括:笔压、行向、行间距、字间距、整洁度等等笔迹特征,从而得到识别笔压、行向、行间距、字间距、整洁度等特征的模型,笔迹特征识别模型。
需要说明的是,本实施例和上述实施例中仅以笔迹特征识别模型的训练过程进行介绍,其他机器学习模型,比如垂直指标评估模型、文本生成模型的训练过程均可参照本实施例与上述实施例的介绍,比如垂直指标评估模型具体为学习力评估模型时,可以选取若干名(比如5100名)初二、初三、高一至高三不同水平学校学生的影响学习力(学习动力、学习毅力、学习创新力、学习能力、学习态度、学习适应性)的性格特质以及相应笔迹特征,基于性格特质影响程度训练得出学习力评估模型;又比如垂直指标评估模型具体为负向情绪识别模型时可以通过案例验证以及抓取的互联网大数据分析选取若干个(比如1600个)与负向情绪相关笔迹特征,结合临床经验和实证资料,融合单维度笔迹特征模型进行测试以及调参训练得到。
另外,由于本方法中调用不止一个学习模型,需要调用包括笔迹特征识别模型、垂直指标评估模型以及文本生成模型在内至少三个模型。而学习模型会消耗大量系统资源,为保证系统的快速响应,各模型可以分布式部署和并发调度,同时系统在软件层面实现资源灵活调度和系统负载均衡。
具体地,如图3所示为一种模型分布式部署示意图,笔迹特征识别模型、垂直指标评估模型以及文本生成模型分布式部署于若干台服务器;
则相应地,调用预训练的笔迹特征识别模型对归一化图片进行笔迹特征识别,包括:确定笔迹特征识别模型部署的各服务器,作为特征识别服务器;并发调用各特征识别服务器对归一化图片进行笔迹特征识别;
融合基础性格特质以及情绪状态,调用垂直指标评估模型生成评估结果,包括:确定垂直指标评估模型部署的各服务器,作为指标评估服务器;融合基础性格特质以及情绪状态,并发调用各指标评估服务器生成评估结果;
调用文本生成模型根据评估结果进行语句组织,包括:确定文本生成模型部署的各服务器,作为文本生成服务器;并发调用各文本生成服务器根据评估结果进行语句组织
相应于上面的方法实施例,本发明实施例还提供了一种笔迹分析装置,下文描述的笔迹分析装置与上文描述的笔迹分析方法可相互对应参照。
参见图4所示,该装置包括以下模块:
图片接收单元110主要用于接收待识别的笔迹图片,作为目标图片;
归一化处理单元120主要用于对目标图片进行归一化处理,得到归一化图片;
笔记特征识别单元130主要用于调用预训练的笔迹特征识别模型对归一化图片进行笔迹特征识别,得到笔迹特征;
性格情绪匹配单元150主要用于根据笔迹特征从性格特质知识图谱中得到对应的基础性格特质以及情绪状态;
应用评估单元160主要用于融合基础性格特质以及情绪状态,调用垂直指标评估模型生成评估结果;
报告生成单元170主要用于调用文本生成模型根据评估结果进行语句组织,生成评估分析报告。
相应于上面的方法实施例,本发明实施例还提供了一种计算机设备,下文描述的一种计算机设备与上文描述的一种笔迹分析方法可相互对应参照。
该计算机设备包括:
存储器,用于存储计算机程序;
处理器,用于执行计算机程序时实现上述方法实施例的笔迹分析方法的步骤。
具体的,请参考图5,为本实施例提供的一种计算机设备的具体结构示意图,该计算机设备可因配置或性能不同而产生比较大的差异,可以包括一个或一个以上处理器(central processing units,CPU)322(例如,一个或一个以上处理器)和存储器332,存储器332存储有一个或一个以上的计算机应用程序342或数据344。其中,存储器332可以是短暂存储或持久存储。存储在存储器332的程序可以包括一个或一个以上模块(图示没标出),每个模块可以包括对数据处理设备中的一系列指令操作。更进一步地,中央处理器322可以设置为与存储器332通信,在计算机设备301上执行存储器332中的一系列指令操作。
计算机设备301还可以包括一个或一个以上电源326,一个或一个以上有线或无线网络接口350,一个或一个以上输入输出接口358,和/或,一个或一个以上操作系统341。
上文所描述的笔迹分析方法中的步骤可以由计算机设备的结构实现。
相应于上面的方法实施例,本发明实施例还提供了一种可读存储介质,下文描述的一种可读存储介质与上文描述的一种笔迹分析方法可相互对应参照。
一种可读存储介质,可读存储介质上存储有计算机程序,计算机程序被处理器执行时实现上述方法实施例的笔迹分析方法的步骤。
该可读存储介质具体可以为U盘、移动硬盘、只读存储器(Read-Only Memory,ROM)、随机存取存储器(Random Access Memory,RAM)、磁碟或者光盘等各种可存储程序代码的可读存储介质。
本领域技术人员还可以进一步意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、计算机软件或者二者的结合来实现,为了清楚地说明硬件和软件的可互换性,在上述说明中已经按照功能一般性地描述了各示例的组成及步骤。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。本领域技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本发明的范围。

Claims (10)

1.一种笔迹分析方法,其特征在于,包括:
接收待识别的笔迹图片,作为目标图片;
对所述目标图片进行归一化处理,得到归一化图片;
调用预训练的笔迹特征识别模型对所述归一化图片进行笔迹特征识别,得到笔迹特征;
根据所述笔迹特征从性格特质知识图谱中得到对应的基础性格特质以及情绪状态;
融合所述基础性格特质以及所述情绪状态,调用垂直指标评估模型生成评估结果;
调用文本生成模型根据所述评估结果进行语句组织,生成评估分析报告。
2.根据权利要求1所述的笔迹分析方法,其特征在于,所述笔迹特征识别模型的训练方法,包括:
接收笔迹样本集;
对所述笔迹样本集中各图片进行归一化预处理,得到归一化样本集;
接收所述归一化样本集中各图片的笔迹特征标注,生成标注文件集;
根据所述标注文件集对搭建的笔迹特征识别模型进行训练,得到训练后的笔迹特征识别模型;
对所述训练后的笔迹特征识别模型进行测试验证,并根据所述测试验证反馈的模型收敛情况及准确率进行参数优化调整。
3.根据权利要求2所述的笔迹分析方法,其特征在于,在所述对所述笔迹样本集中各图片进行归一化预处理之前,还包括:
删除所述笔迹样本集中的重复图片以及不清晰图片。
4.根据权利要求2所述的笔迹分析方法,其特征在于,在所述根据所述标注文件集对搭建的笔迹特征识别模型进行训练之前,还包括:
根据所述笔迹特征标注对对应的图片进行有效信息部分裁剪,得到裁剪图片集;
则相应地,所述根据所述标注文件集对搭建的笔迹特征识别模型进行训练,包括:根据所述裁剪图片集对搭建的笔迹特征识别模型进行训练。
5.根据权利要求2所述的笔迹分析方法,其特征在于,在所述根据所述标注文件集对搭建的笔迹特征识别模型进行训练之前,还包括:
对所述标注文件集进行数据增强处理,得到扩展图片集;
则相应地,所述根据所述标注文件集对搭建的笔迹特征识别模型进行训练,包括:根据所述扩展图片集对搭建的笔迹特征识别模型进行训练。
6.根据权利要求1所述的笔迹分析方法,其特征在于,在所述根据所述笔迹特征从性格特质知识图谱中得到对应的基础性格特质以及情绪状态之前,还包括:
提取所述归一化图片中的文字信息;
则相应地,所述根据所述笔迹特征从性格特质知识图谱中得到对应的基础性格特质以及情绪状态,包括:根据所述笔迹特征以及所述文字信息,从性格特质知识图谱中得到对应的基础性格特质以及情绪状态。
7.根据权利要求1至6任一项所述的笔迹分析方法,其特征在于,所述笔迹特征识别模型、所述垂直指标评估模型以及所述文本生成模型分布式部署于若干台服务器;
则相应地,所述调用预训练的笔迹特征识别模型对所述归一化图片进行笔迹特征识别,包括:确定所述笔迹特征识别模型部署的各服务器,作为特征识别服务器;并发调用各所述特征识别服务器对所述归一化图片进行笔迹特征识别;
融合所述基础性格特质以及所述情绪状态,调用垂直指标评估模型生成评估结果,包括:确定所述垂直指标评估模型部署的各服务器,作为指标评估服务器;融合所述基础性格特质以及所述情绪状态,并发调用各所述指标评估服务器生成评估结果;
所述调用文本生成模型根据所述评估结果进行语句组织,包括:确定所述文本生成模型部署的各服务器,作为文本生成服务器;并发调用各所述文本生成服务器根据所述评估结果进行语句组织。
8.一种笔迹分析装置,其特征在于,包括:
图片接收单元,用于接收待识别的笔迹图片,作为目标图片;
归一化处理单元,用于对所述目标图片进行归一化处理,得到归一化图片;
笔记特征识别单元,用于调用预训练的笔迹特征识别模型对所述归一化图片进行笔迹特征识别,得到笔迹特征;
性格情绪匹配单元,用于根据所述笔迹特征从性格特质知识图谱中得到对应的基础性格特质以及情绪状态;
应用评估单元,用于融合所述基础性格特质以及所述情绪状态,调用垂直指标评估模型生成评估结果;
报告生成单元,用于调用文本生成模型根据所述评估结果进行语句组织,生成评估分析报告。
9.一种计算机设备,其特征在于,包括:
存储器,用于存储计算机程序;
处理器,用于执行所述计算机程序时实现如权利要求1至7任一项所述笔迹分析方法的步骤。
10.一种可读存储介质,其特征在于,所述可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现如权利要求1至7任一项所述笔迹分析方法的步骤。
CN202111171615.7A 2021-10-08 2021-10-08 一种笔迹分析方法、装置、设备及可读存储介质 Pending CN113869257A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202111171615.7A CN113869257A (zh) 2021-10-08 2021-10-08 一种笔迹分析方法、装置、设备及可读存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202111171615.7A CN113869257A (zh) 2021-10-08 2021-10-08 一种笔迹分析方法、装置、设备及可读存储介质

Publications (1)

Publication Number Publication Date
CN113869257A true CN113869257A (zh) 2021-12-31

Family

ID=79001971

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202111171615.7A Pending CN113869257A (zh) 2021-10-08 2021-10-08 一种笔迹分析方法、装置、设备及可读存储介质

Country Status (1)

Country Link
CN (1) CN113869257A (zh)

Similar Documents

Publication Publication Date Title
CN106503055B (zh) 一种从结构化文本到图像描述的生成方法
CN113886567A (zh) 一种基于知识图谱的教学方法及系统
CN110517130A (zh) 一种智能记账方法及其系统
CN111401828A (zh) 一种强化排序的动态智能面试方法、装置、设备及计算机存储介质
CN116386862A (zh) 多模态认知障碍的评估方法、装置、设备和存储介质
KR20020084564A (ko) 인터넷 기반 가상 면접 시스템 및 그것의 방법
CN113888757A (zh) 基于对标评价的考卷智能分析方法、系统及存储介质
Wibawa et al. Learning analytic and educational data mining for learning science and technology
CN116070599A (zh) 智能化题库生成及辅助管理系统
CN115641101A (zh) 一种智能化招聘的方法、装置及计算机可读介质
Ojha et al. From robots to books: An introduction to smart applications of AI in education (AIEd)
Aitken Becoming an academic: Professional identity on the road to tenure
CN109272262B (zh) 一种自然语言特征的分析方法
CN110705523A (zh) 一种基于神经网络的创业者路演能力测评方法及其测评系统
CN113869257A (zh) 一种笔迹分析方法、装置、设备及可读存储介质
CN111460245A (zh) 多维度人群特征测定方法
Yu et al. Bridging computer and education sciences: a systematic review of automated emotion recognition in online learning environments
Nayak et al. AI-enabled personalized interview coach in Rural India
CN112597271B (zh) 一种面向庭审过程中刑事案件审判被告人态度预测的方法
Ghadekar et al. A Semantic Approach for Automated Hiring using Artificial Intelligence & Computer Vision
Shen et al. Design of International Chinese Education Promotion Platform Based on Artificial Intelligence and Facial Recognition Technology
CN111914683A (zh) 一种基于仿生图像增强算法和fpga硬件加速的手写成绩录入系统
KR102671618B1 (ko) 딥러닝에 기반한 교육 목적의 사용자 맞춤형 면접 피드백 제공 방법 및 시스템
CN117932039B (zh) 基于启发式问答推理的可解释文本评阅方法和系统
Sunarti et al. Optimation Parameter and Attribute Naive Bayes in Machine Learning for Performance Assessment in Online Learning

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination