CN108171144B - 信息处理方法、装置、电子设备及存储介质 - Google Patents
信息处理方法、装置、电子设备及存储介质 Download PDFInfo
- Publication number
- CN108171144B CN108171144B CN201711428533.XA CN201711428533A CN108171144B CN 108171144 B CN108171144 B CN 108171144B CN 201711428533 A CN201711428533 A CN 201711428533A CN 108171144 B CN108171144 B CN 108171144B
- Authority
- CN
- China
- Prior art keywords
- line
- image
- word
- obtaining
- features
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V40/00—Recognition of biometric, human-related or animal-related patterns in image or video data
- G06V40/30—Writer recognition; Reading and verifying signatures
- G06V40/33—Writer recognition; Reading and verifying signatures based only on signature image, e.g. static signature recognition
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61B—DIAGNOSIS; SURGERY; IDENTIFICATION
- A61B5/00—Measuring for diagnostic purposes; Identification of persons
- A61B5/16—Devices for psychotechnics; Testing reaction times ; Devices for evaluating the psychological state
- A61B5/165—Evaluating the state of mind, e.g. depression, anxiety
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/20—Image preprocessing
- G06V10/26—Segmentation of patterns in the image field; Cutting or merging of image elements to establish the pattern region, e.g. clustering-based techniques; Detection of occlusion
- G06V10/267—Segmentation of patterns in the image field; Cutting or merging of image elements to establish the pattern region, e.g. clustering-based techniques; Detection of occlusion by performing operations on regions, e.g. growing, shrinking or watersheds
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/20—Image preprocessing
- G06V10/30—Noise filtering
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/40—Extraction of image or video features
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/40—Extraction of image or video features
- G06V10/44—Local feature extraction by analysis of parts of the pattern, e.g. by detecting edges, contours, loops, corners, strokes or intersections; Connectivity analysis, e.g. of connected components
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/14—Image acquisition
- G06V30/148—Segmentation of character regions
- G06V30/153—Segmentation of character regions using recognition of characters or words
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Multimedia (AREA)
- Theoretical Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Psychiatry (AREA)
- Social Psychology (AREA)
- Biomedical Technology (AREA)
- Educational Technology (AREA)
- Hospice & Palliative Care (AREA)
- Psychology (AREA)
- Child & Adolescent Psychology (AREA)
- Human Computer Interaction (AREA)
- Biophysics (AREA)
- Pathology (AREA)
- Developmental Disabilities (AREA)
- Heart & Thoracic Surgery (AREA)
- Medical Informatics (AREA)
- Molecular Biology (AREA)
- Surgery (AREA)
- Animal Behavior & Ethology (AREA)
- General Health & Medical Sciences (AREA)
- Public Health (AREA)
- Veterinary Medicine (AREA)
- Character Input (AREA)
Abstract
本发明提供了一种信息处理方法、装置、电子设备及存储介质,涉及计算机技术领域。该信息处理方法包括:利用预设图像分割算法获得用户的第一笔迹图像对应的二值化图像、行文本图像以及字文本图像;利用预设字特征提取算法获得字文本图像中的字特征;利用预设行特征提取算法获得行文本图像中的行特征;利用预设篇章特征提取算法获得二值化图像中的篇章特征;基于字特征、行特征以及篇章特征利用预设分类器获得第一笔迹图像对应的第一特征类别;根据预先存储的特征类别与心理分析内容的对应关系获得第一特征类别对应的第一心理分析内容。该信息处理方法、装置、电子设备及存储介质可实现基于用户的笔迹图像对用户的心理进行分析。
Description
技术领域
本发明涉及计算机技术领域,具体而言,涉及一种信息处理方法、装置、电子设备及存储介质。
背景技术
手写笔迹分析类似于心理学的心理投射分析技术;书写活动作为一种后天形成的条件反射活动,受到情绪和情感、人格的影响,与个人人格发展保持同步,并保持了相对的独特性和稳定性;这种独特性和稳定性奠定了从手写笔迹获得书写者的人格特征是可行的。另外,因为笔迹采集更具隐蔽性、难伪造,因此可应用于人才选拔、司法鉴定、心理测量以及公共安全等多个领域。
目前,文字识别方法主要是用于识别文字对应的语义,无法实现基于手写笔迹识别出作者的人格或者心理分析。
发明内容
有鉴于此,本发明实施例提供了一种信息处理方法、装置、电子设备及存储介质。
为了实现上述目的,本发明采用的技术方案如下:
第一方面,本发明第一实施例提供了一种信息处理方法,该方法包括:利用预设图像分割算法获得用户的第一笔迹图像对应的二值化图像、行文本图像以及字文本图像;利用预设字特征提取算法获得所述字文本图像中的字特征;利用预设行特征提取算法获得所述行文本图像中的行特征;利用预设篇章特征提取算法获得所述二值化图像中的篇章特征;基于所述字特征、所述行特征以及所述篇章特征利用预设分类器获得所述第一笔迹图像对应的第一特征类别;根据预先存储的特征类别与心理分析内容的对应关系获得所述第一特征类别对应的第一心理分析内容。
第二方面,本发明第二实施例提供了一种信息处理装置,所述装置包括图像分割模块、第一特征提取模块、第二特征提取模块、第三特征提取模块、类别获得模块以及内容获得模块,其中,所述图像分割模块用于利用预设图像分割算法获得用户的第一笔迹图像对应的二值化图像、行文本图像以及字文本图像;所述第一特征提取模块用于利用预设字特征提取算法获得所述字文本图像中的字特征;所述第二特征提取模块用于利用预设行特征提取算法获得所述行文本图像中的行特征;所述第三特征提取模块用于利用预设篇章特征提取算法获得所述二值化图像中的篇章特征;所述类别获得模块用于基于所述字特征、所述行特征以及所述篇章特征利用预设分类器获得所述第一笔迹图像对应的第一特征类别;所述内容获得模块用于根据预先存储的特征类别与心理分析内容的对应关系获得所述第一特征类别对应的第一心理分析内容。
第三方面,本发明实施例提供了一种电子设备,所述电子设备包括存储器和处理器,所述存储器存储有计算机指令,当所述计算机指令由所述处理器读取并执行时,使所述处理器执行上述第一方面提供的信息处理方法。
第四方面,本发明实施例提供了一种存储介质,所述存储介质中存储有计算机指令,其中,所述计算机指令在被读取并运行时执行上述第一方面提供的信息处理方法。
本发明实施例提供的信息处理方法、装置、电子设备及存储介质,通过利用预设图像分割算法获得用户的第一笔迹图像对应的二值化图像、行文本图像以及字文本图像,然后利用预设字特征提取算法获得字文本图像中的字特征,利用预设行特征提取算法获得行文本图像中的行特征,利用预设篇章特征提取算法获得二值化图像中的篇章特征,再基于字特征、行特征以及篇章特征利用预设分类器获得第一笔迹图像对应的第一特征类别,最后根据预先存储的特征类别与心理分析内容的对应关系获得第一特征类别对应的第一心理分析内容。从而,该信息处理方法、装置、电子设备及存储介质可以实现基于用户的笔迹图像获得用户的心理分析内容,解决现有技术中法实现基于手写笔迹识别出作者的心理分析的问题。
为使本发明的上述目的、特征和优点能更明显易懂,下文特举较佳实施例,并配合所附附图,作详细说明如下。
附图说明
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
图1示出了本发明实施例提供的电子设备的方框示意图;
图2示出了本发明实施例提供的信息处理方法的流程图;
图3示出了本发明实施例提供的信息处理方法中步骤S110的流程图;
图4示出了本发明实施例提供的信息处理装置的模块图。
具体实施方式
下面将结合本发明实施例中附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。通常在此处附图中描述和示出的本发明实施例的组件可以以各种不同的配置来布置和设计。因此,以下对在附图中提供的本发明的实施例的详细描述并非旨在限制要求保护的本发明的范围,而是仅仅表示本发明的选定实施例。基于本发明的实施例,本领域技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例,都属于本发明保护的范围。
应注意到:相似的标号和字母在下面的附图中表示类似项,因此,一旦某一项在一个附图中被定义,则在随后的附图中不需要对其进行进一步定义和解释。同时,在本发明的描述中,术语“第一”、“第二”等仅用于区分描述,而不能理解为指示或暗示相对重要性。
图1示出了一种可应用于本发明实施例中的电子设备的结构框图。如图1所示,电子设备100包括存储器102、存储控制器104,一个或多个(图中仅示出一个)处理器106、外设接口108、射频模块110、音频模块112、显示单元114等。这些组件通过一条或多条通讯总线/信号线116相互通讯。
存储器102可用于存储软件程序以及模块,如本发明实施例中的信息处理方法及装置对应的程序指令/模块,处理器106通过运行存储在存储器102内的软件程序以及模块,从而执行各种功能应用以及数据处理,如本发明实施例提供的信息处理方法。
存储器102可包括高速随机存储器,还可包括非易失性存储器,如一个或者多个磁性存储装置、闪存、或者其他非易失性固态存储器。处理器106以及其他可能的组件对存储器102的访问可在存储控制器104的控制下进行。
外设接口108将各种输入/输出装置耦合至处理器106以及存储器102。在一些实施例中,外设接口108,处理器106以及存储控制器104可以在单个芯片中实现。在其他一些实例中,他们可以分别由独立的芯片实现。
射频模块110用于接收以及发送电磁波,实现电磁波与电信号的相互转换,从而与通讯网络或者其他设备进行通讯。
音频模块112向用户提供音频接口,其可包括一个或多个麦克风、一个或者多个扬声器以及音频电路。
显示单元114在电子设备100与用户之间提供一个显示界面。具体地,显示单元114向用户显示视频输出,这些视频输出的内容可包括文字、图形、视频及其任意组合。
可以理解,图1所示的结构仅为示意,电子设备100还可包括比图1中所示更多或者更少的组件,或者具有与图1所示不同的配置。图1中所示的各组件可以采用硬件、软件或其组合实现。
第一实施例
如图2示出了本发明实施例提供的信息处理方法的流程图。请参见图2,该信息处理方法包括:
步骤S110:利用预设图像分割算法获得用户的第一笔迹图像对应的二值化图像、行文本图像以及字文本图像。
在需要对用户的心理、人格等进行分析时,用户可以于带有触摸屏的采集设备手写一定行数的字,采集设备采集到用户的笔迹图像。当然,用户也可以于纸上写一定行数的字后,由图像采集设备采集纸上的笔迹,获得上述用户的笔迹图像。从而,可以获得到上述用户的第一笔迹图像。
当然,对笔迹图像的具体获取方式在本发明实施例中并不作为限定。
在获得上述用户的笔迹图像后,再对该笔迹图像进行处理,以便后续获得笔迹图像对应的心理分析内容。
在本发明实施例中,请参见图3,步骤S110可以包括:
步骤S111:对所述第一笔迹图像进行二值化处理,获得所述二值化图像。
在本发明实施例中,步骤S111可以包括:
对所述第一笔迹图像进行去噪处理,获得第二笔迹图像;对所述第二笔迹图像进行校准处理,获得第三笔迹图像;对所述第三笔迹图像进行二值分割,获得所述二值化图像。
可以理解的是,在对第一笔迹图像进行二值化处理中,首先可以对第一笔迹图像做灰度处理,获得第一笔迹图像对应的灰度图像后,再对第一笔迹图像对应的灰度图像进行预处理,以消除成像过程中造成的影响,使后续二值分割的结果准确。
在本发明实施例中,对第一笔迹图像进行预处理可以是先对第一笔迹图像对应的灰度图像进行去噪处理,再进行校准处理。
其中,去噪处理可以采用高斯滤波的方法去噪,也可以采用中值滤波的方法去噪,具体实现去噪的方法在本发明实施例中并不作为限定。
在进行去噪处理后的校准处理,可以采用基于OpenCV的灰度校正算法进行校正处理,针对图像成像不均匀如曝光不均匀,使图像半边暗半边亮,对图像逐点进行不同程度的灰度级校正,使整幅图像灰度均匀。
在对第一笔迹图像进行预处理后再对预处理后的图像进行二值分割,具体二值分割的算法可以为p-tile阈值分割算法,也可以利用OpenCV图像处理库中的threshold函数进行二值分割。当然,具体进行二值分割的方法在本发明实施例中并不作为限定。
另外,在本发明实施例中,在进行二值分割后,还可以进行边缘提取,具体边缘提取的算法可以是基于facet模型的边缘提取算法。在边缘提取后,还可以基于用户的操作移除二值化图像中的非笔迹数据、移除无法识别的内容、移除修正符号等,从而获得用于后续步骤的二值化图像,以使后续特征提取更加准确。
步骤S112:基于预设行分割算法分割出所述二值化图像中的行区域,获得所述行文本图像。
在获得上述二值化图像后,可以再分割出二值化图像中的行区域。具体行分割的方法可以为投影法,也可以为搜寻法。其中,投影法可以为:计算上述二值化图像在垂直方向的投影直方图,寻找垂直直方图的显著峰谷,按峰谷水平分割图像,将分割后的图像作后处理(确定行边界)。搜寻法可以为:按寻路方式寻找从二值化图像左端至右端的有效路径,其不同之处在于笔迹内容作为寻路中的障碍,其代价函数为行径代价与越过障碍需要的代价与预测到目标的代价之和。
当然,具体行分割的算法在本发明实施例中并不作为限定。
步骤S113:基于预设字分割算法分割出所述行文本图像中的文字区域,获得所述字文本图像。
在获得行文本图像后,可以再分割出上述行文本图像中的文字区域。具体字分割的算法可以是过分割合并法。其中,过分割合并法可以为:将文本行内容应用分割能力过高的算法(例如,训练神经网络,使用滑动窗口选择过分割点),对分割后的行文本图像应用文字识别,寻找一种分割图片的组合方式,使得整体文字内容的识别准确率最高。
当然,具体字分割的算法在本发明实施例中并不作为限定。
步骤S120:利用预设字特征提取算法获得所述字文本图像中的字特征。
在获得上述字文本图像后,可以利用预设字特征提取算法提取字文本图像中的字特征。
在本发明实施例中,步骤S120可以包括:
提取所述字文本图像的文字边缘,获得用于特征提取的字文本图像;对所述用于特征提取的字文本图像进行多层卷积,提取所述字文本图像中的字对应的多个第一特征;对所述多个第一特征作池化,获得所述字文本图像中的字特征。
可以理解的是,对字文本图像进行提取边缘,然后遍历边缘,再应用多种类型的卷积核进行多层卷积,并降维,提取所有字的第一特征,例如间架结构特征,有关字特征,无关字特征。
其中,有关字特征为:特殊汉字的特征,例如口字的封口程度特征,中字竖线离口部件的长度与字高的比例,束字的撇和捺,相较于字宽的比例等一系列关于特定汉字的特征。无关字特征为:汉字的相对长宽比例,汉字的重心,汉字的倾斜程度等一系列与具体的汉字无关的特征。
当然,本发明实施例中的提取的第一特征并不限定于上述字特征。
在获得上述第一特征之后,再对获得的所有第一特征进行池化,获得行文本图像对应的字特征。
步骤S130:利用预设行特征提取算法获得所述行文本图像中的行特征。
在本发明实施例中,利用预设行特征提取算法提取行文本图像中的行特征可以包括:
利用直线拟合算法拟合出所述行文本图像中行文本的中心线、上边线以及下边线,获得多个拟合线特征;对所述多个拟合线特征作池化,获得所述行文本图像中的行特征。
可以理解的是,将一行中按照字的外接矩形的中心的所有点拟合成一条中心线,将一行每个字的最高点与最低点分别拟合为一条直线,获得上边线以及下边线,将此三条线作为拟合线特征。
另外,还可以提取横向扫描线特征,从至右,依水平方向垂直扫描行文本图像的像素值,对每次扫描的一列像素,将最高的笔迹像素与最低的笔迹像素取高度均值,由此得到一行数值,将该行数值的最大值、最小值、均值、中值等统计信息作为横向扫描线特征。
在本发明实施例中,还可以提取平均字间距与平均字宽之间的比值,最大字间距与字宽之间的比值,最小字间距与字宽之间的比值,字高一致性系数,字宽一致性系数等,作为行文本图像的其他特征。
当然,具体的提取的行文本图像的特征并不限于上述的拟合线特征、上述横向扫描线特征以及上述其他特征。
在获得上述行拟合线特征、上述横向扫描线特征以及上述行文本图像的其他特征之后,可以将所有上述行拟合线特征、上述横向扫描线特征以及上述行文本图像的其他特征进行池化,从而获得行文本图像中的行特征。
步骤S140:利用预设篇章特征提取算法获得所述二值化图像中的篇章特征。
在本发明实施例中,利用预设篇章特征提取算法获得上述二值化图像中的篇章特征可以包括:
获取所述二值化图像中最上一行文本的上边线以及最下一行文本的上边线;获取所述二值化图像中多个行文本对应的左边线以及右边线;获取所述上边线、下边线、左边线以及右边线分别与所述二值化图像中文字区域的边缘的夹角以及最小距离,获得边距特征;对所述边距特征作池化,获得所述篇章特征。
可以理解的是,提取边距特征为取二值化图像中最上面一行的上边线,取最下面一行的下边线,取二值化图像中每行最左和最右的字分别拟合为左边线以及右边线,然后求得四个边线分别与文字区域的边缘的夹角以及最小距离,从而获得边距特征。
另外,还可以提取二值化图像中纵向扫描线特征:从上至下,依垂直方向水平扫描二值化图像中所有文本像素,对每次扫描的一行像素,将最左的笔迹像素与最右的笔迹像素取水平均值,由此得到一行数值,将该行数值的最大值、最小值、均值、中值等统计信息作为纵向扫描线特征。
在本发明实施例中,还可以提取平均行间距与平均行高的比值,平均行间距与整个图像的高度的比值,平均行高(宽)与整个图像的高度(宽度)的比值等作为其他特征。
当然,具体的提取的二值化图像的特征并不限于上述的边距特征、上述纵向扫描线特征以及上述其他特征。
在获得上述行边距特征、上述纵向扫描线特征以及上述二值化图像中的其他特征之后,可以将所有上述行边距特征、上述纵向扫描线特征以及上述二值化图像中的其他特征进行池化,从而获得二值化图像中的篇章特征。
需要说明的是,步骤S120、步骤S130以及步骤S140的先后顺序在本发明实施例中并不作为限定,可以为并列进行的步骤;可以为先进行步骤S120,再进行步骤S130,然后执行步骤S140的顺序;也可以为先进行步骤S120,再进行步骤S140,然后执行步骤S130的顺序;还可以为先进行步骤S130,再进行步骤S120,然后执行步骤S140的顺序;还可以为先进行步骤S130,再进行步骤S140,然后执行步骤S120的顺序;还可以为先进行步骤S140,再进行步骤S120,然后执行步骤S130的顺序;还可以为先进行步骤S140,再进行步骤S130,然后执行步骤S120的顺序。
步骤S150:基于所述字特征、所述行特征以及所述篇章特征利用预设分类器获得所述第一笔迹图像对应的第一特征类别。
在本发明实施例中,可以将上述获得的第一笔迹图像对应的字特征、行特征以及篇章特征放入预设的训练过的分类器中,获得第一笔迹图像对应的第一特征类别。
在本发明实施例中,预设分类器可以为训练后的随机森林分类器。当然,预设分类器的具体类型在本发明实施例中并不作为限定。
在本发明实施例中,预设分类器可以为分类器对多张笔迹图像对应的字特征、行特征以及篇章特征进行训练后获得的。分类器训练时,多张笔迹图像的字特征、行特征以及篇章特征的获取方式,可以参照上述步骤S110至步骤S140的内容,在此不再一一赘述。
另外,训练时,每个笔迹图像可以预先对应有一心理分析内容,该心理分析内容为通过测试获得的心理分析内容。从而,可以使训练后的分类器中的每个特征类别都对应有心理分析内容。并将每个特征类别与心理分析内容的对应关系进行存储。
步骤S160:根据预先存储的特征类别与心理分析内容的对应关系获得所述第一特征类别对应的第一心理分析内容。
在获得第一笔迹图像对应的第一特征类别之后,再根据上述特征类别与心理分析内容的对应关系,获得第一特征类别对应的第一心理分析内容。从而,实现了基于用户的笔迹图像完成用户的心理测试分析的目的。
本发明第一实施例提供的信息处理方法可以实现基于用户的笔迹图像完成对用户的心理预测或测试,获得用户对应的心理分析内容。由于笔迹的隐蔽性和难伪造性,可以使该方法应用于人才选拔、司法鉴定、心理测量等多个领域中,完成心理测试、人格分析或者性格分析等。
第二实施例
本发明第二实施例提供了一种信息处理装置200,请参见图4,所述信息处理装置200包括图像分割模块210、第一特征提取模块220、第二特征提取模块230、第三特征提取模块240、类别获得模块250以及内容获得模块260。其中,所述图像分割模块210用于利用预设图像分割算法获得用户的第一笔迹图像对应的二值化图像、行文本图像以及字文本图像;所述第一特征提取模块220用于利用预设字特征提取算法获得所述字文本图像中的字特征;所述第二特征提取模块230用于利用预设行特征提取算法获得所述行文本图像中的行特征;所述第三特征提取模块240用于利用预设篇章特征提取算法获得所述二值化图像中的篇章特征;所述类别获得模块250用于基于所述字特征、所述行特征以及所述篇章特征利用预设分类器获得所述第一笔迹图像对应的第一特征类别;所述内容获得模块260用于根据预先存储的特征类别与心理分析内容的对应关系获得所述第一特征类别对应的第一心理分析内容。
需要说明的是,本发明第二实施例提供的信息处理装置200为本发明第一实施例提供的信息处理方法对应的装置,其他具体的内容可以参见本发明第一实施例提供的信息处理方法,在此不再一一赘述。
第三实施例
本发明第三实施例提供了一种电子设备。请参见图1,所述电子设备100包括存储器102和处理器106,所述存储器102存储有计算机指令,当所述计算机指令由所述处理器106读取并执行时,使所述处理器106执行本发明第一实施例提供的信息处理方法。
第四实施例
本发明第四实施例提供了一种存储介质,所述存储介质中存储有计算机指令,其中,所述计算机指令在被读取并运行时执行本发明第一实施例提供的信息处理方法。
综上所述,本发明实施例提供的信息处理方法、装置、电子设备及存储介质,通过利用预设图像分割算法获得用户的第一笔迹图像对应的二值化图像、行文本图像以及字文本图像,然后利用预设字特征提取算法获得字文本图像中的字特征,利用预设行特征提取算法获得行文本图像中的行特征,利用预设篇章特征提取算法获得二值化图像中的篇章特征,再基于字特征、行特征以及篇章特征利用预设分类器获得第一笔迹图像对应的第一特征类别,最后根据预先存储的特征类别与心理分析内容的对应关系获得第一特征类别对应的第一心理分析内容。从而,该信息处理方法、装置、电子设备及存储介质可以实现基于用户的笔迹图像获得用户的心理分析内容,解决现有技术中法实现基于手写笔迹识别出作者的心理分析的问题。
需要说明的是,本说明书中的各个实施例均采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似的部分互相参见即可。对于装置类实施例而言,由于其与方法实施例基本相似,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
本申请所提供的几个实施例中,应该理解到,所揭露的装置和方法,也可以通过其它的方式实现。以上所描述的装置实施例仅仅是示意性的,例如,附图中的流程图和框图显示了根据本发明的多个实施例的装置、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段或代码的一部分,所述模块、程序段或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现方式中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个连续的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或动作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
另外,在本发明各个实施例中的各功能模块可以集成在一起形成一个独立的部分,也可以是各个模块单独存在,也可以两个或两个以上模块集成形成一个独立的部分。
所述功能如果以软件功能模块的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
以上所述仅为本发明的优选实施例而已,并不用于限制本发明,对于本领域的技术人员来说,本发明可以有各种更改和变化。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。应注意到:相似的标号和字母在下面的附图中表示类似项,因此,一旦某一项在一个附图中被定义,则在随后的附图中不需要对其进行进一步定义和解释。
以上所述,仅为本发明的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应所述以权利要求的保护范围为准。
Claims (9)
1.一种信息处理方法,其特征在于,所述方法包括:
利用预设图像分割算法获得用户的第一笔迹图像对应的二值化图像、行文本图像以及字文本图像;
利用预设字特征提取算法获得所述字文本图像中的字特征;
将一行中按照字的外接矩形的中心的所有点拟合成一条中心线,将一行中每个字的最高点与最低点分别拟合为一条直线,获得上边线以及下边线,将此三条线作为行拟合线特征;
提取横向扫描线特征,从左至右,依水平方向垂直扫描行文本图像的像素值,对每次扫描的一列像素,将最高的笔迹像素与最低的笔迹像素取高度均值,得到一行数值,将该行数值的最大值、最小值、均值、中值统计信息作为横向扫描线特征;
提取平均字间距与平均字宽之间的比值,最大字间距与字宽之间的比值,最小字间距与字宽之间的比值,字高一致性系数,字宽一致性系数,作为行文本图像特征;
将所有所述行拟合线特征、所述横向扫描线特征以及所述行文本图像的特征进行池化,获得行文本图像中的行特征;
利用预设篇章特征提取算法获得所述二值化图像中的篇章特征;
基于所述字特征、所述行特征以及所述篇章特征利用预设分类器获得所述第一笔迹图像对应的第一特征类别;
根据预先存储的特征类别与心理分析内容的对应关系获得所述第一特征类别对应的第一心理分析内容。
2.根据权利要求1所述的方法,其特征在于,所述基于预设图像分割算法获得用户的第一笔迹图像对应的二值化图像、行文本图像以及字文本图像,包括:
对所述第一笔迹图像进行二值化处理,获得所述二值化图像;
基于预设行分割算法分割出所述二值化图像中的行区域,获得所述行文本图像;
基于预设字分割算法分割出所述行文本图像中的文字区域,获得所述字文本图像。
3.根据权利要求2所述的方法,其特征在于,对所述第一笔迹图像进行二值化处理,获得所述二值化图像,包括:
对所述第一笔迹图像进行去噪处理,获得第二笔迹图像;
对所述第二笔迹图像进行校准处理,获得第三笔迹图像;
对所述第三笔迹图像进行二值分割,获得所述二值化图像。
4.根据权利要求1所述的方法,其特征在于,所述利用预设字特征提取算法获得所述字文本图像中的字特征,包括:
提取所述字文本图像的文字边缘,获得用于特征提取的字文本图像;
对所述用于特征提取的字文本图像进行多层卷积,提取所述字文本图像中的字对应的多个第一特征;
对所述多个第一特征作池化,获得所述字文本图像中的字特征。
5.根据权利要求1所述的方法,其特征在于,所述利用预设篇章特征提取算法获得所述二值化图像中的篇章特征,包括:
获取所述二值化图像中最上一行文本的上边线以及最下一行文本的上边线;
获取所述二值化图像中多个行文本对应的左边线以及右边线;
获取所述上边线、下边线、左边线以及右边线分别与所述二值化图像中文字区域的边缘的夹角以及最小距离,获得边距特征;
对所述边距特征作池化,获得所述篇章特征。
6.根据权利要求1所述的方法,其特征在于,所述利用预设图像分割算法获得用户的第一笔迹图像对应的二值化图像、行文本图像以及字文本图像之前,所述方法还包括:
获得所述第一笔迹图像。
7.一种信息处理装置,其特征在于,所述装置包括图像分割模块、第一特征提取模块、第二特征提取模块、第三特征提取模块、类别获得模块以及内容获得模块,其中,
所述图像分割模块用于利用预设图像分割算法获得用户的第一笔迹图像对应的二值化图像、行文本图像以及字文本图像;
所述第一特征提取模块用于利用预设字特征提取算法获得所述字文本图像中的字特征;
所述第二特征提取模块用于:
将一行中按照字的外接矩形的中心的所有点拟合成一条中心线,将一行中每个字的最高点与最低点分别拟合为一条直线,获得上边线以及下边线,将此三条线作为行拟合线特征;
提取横向扫描线特征,从左至右,依水平方向垂直扫描行文本图像的像素值,对每次扫描的一列像素,将最高的笔迹像素与最低的笔迹像素取高度均值,得到一行数值,将该行数值的最大值、最小值、均值、中值统计信息作为横向扫描线特征;
提取平均字间距与平均字宽之间的比值,最大字间距与字宽之间的比值,最小字间距与字宽之间的比值,字高一致性系数,字宽一致性系数,作为行文本图像特征;
将所有所述行拟合线特征、所述横向扫描线特征以及所述行文本图像的其他特征进行池化,获得行文本图像中的行特征;
所述第三特征提取模块用于利用预设篇章特征提取算法获得所述二值化图像中的篇章特征;
所述类别获得模块用于基于所述字特征、所述行特征以及所述篇章特征利用预设分类器获得所述第一笔迹图像对应的第一特征类别;
所述内容获得模块用于根据预先存储的特征类别与心理分析内容的对应关系获得所述第一特征类别对应的第一心理分析内容。
8.一种电子设备,其特征在于,所述电子设备包括存储器和处理器,所述存储器存储有计算机指令,当所述计算机指令由所述处理器读取并执行时,使所述处理器执行如权利要求1-6中任一权项所述的方法。
9.一种存储介质,其特征在于,所述存储介质中存储有计算机指令,其中,所述计算机指令在被读取并运行时执行如权利要求1-6中任一权项所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201711428533.XA CN108171144B (zh) | 2017-12-26 | 2017-12-26 | 信息处理方法、装置、电子设备及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201711428533.XA CN108171144B (zh) | 2017-12-26 | 2017-12-26 | 信息处理方法、装置、电子设备及存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN108171144A CN108171144A (zh) | 2018-06-15 |
CN108171144B true CN108171144B (zh) | 2020-12-11 |
Family
ID=62520734
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201711428533.XA Expired - Fee Related CN108171144B (zh) | 2017-12-26 | 2017-12-26 | 信息处理方法、装置、电子设备及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN108171144B (zh) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109086837A (zh) * | 2018-10-24 | 2018-12-25 | 高嵩 | 基于卷积神经网络的用户属性分类方法、存储介质、装置及电子设备 |
CN112541328B (zh) * | 2020-12-07 | 2022-04-01 | 四川大学 | 一种笔迹的存储方法、装置、设备及存储介质 |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101895626A (zh) * | 2010-05-19 | 2010-11-24 | 济南北秀信息技术有限公司 | 一种手机用笔迹分析装置及其方法 |
CN104915627A (zh) * | 2014-03-11 | 2015-09-16 | 重庆邮电大学 | 一种文字识别方法及装置 |
JP2015219731A (ja) * | 2014-05-19 | 2015-12-07 | 吉田 一雄 | 検査システム |
CN105740786A (zh) * | 2016-01-25 | 2016-07-06 | 中国科学院深圳先进技术研究院 | 书写人的身份识别方法及装置 |
CN105787522A (zh) * | 2016-03-31 | 2016-07-20 | 科大讯飞股份有限公司 | 基于手写笔迹的书写态度评价方法及系统 |
CN106991374A (zh) * | 2017-03-07 | 2017-07-28 | 中国矿业大学 | 基于卷积神经网络和随机森林的手写数字识别方法 |
Family Cites Families (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8102397B2 (en) * | 2009-01-26 | 2012-01-24 | Mitsubishi Electric Research Laboratories Inc. | Method for improving uniform width character strokes using multiple alignment zones |
CN102592124B (zh) * | 2011-01-13 | 2013-11-27 | 汉王科技股份有限公司 | 文本图像的几何校正方法、装置和双目立体视觉系统 |
CN103076334B (zh) * | 2013-01-25 | 2014-12-17 | 上海理工大学 | 一种定量检测数字印刷线条与文本的方法 |
CN104156730B (zh) * | 2014-07-25 | 2017-12-01 | 山东大学 | 一种基于骨架的抗噪声汉字特征提取方法 |
-
2017
- 2017-12-26 CN CN201711428533.XA patent/CN108171144B/zh not_active Expired - Fee Related
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101895626A (zh) * | 2010-05-19 | 2010-11-24 | 济南北秀信息技术有限公司 | 一种手机用笔迹分析装置及其方法 |
CN104915627A (zh) * | 2014-03-11 | 2015-09-16 | 重庆邮电大学 | 一种文字识别方法及装置 |
JP2015219731A (ja) * | 2014-05-19 | 2015-12-07 | 吉田 一雄 | 検査システム |
CN105740786A (zh) * | 2016-01-25 | 2016-07-06 | 中国科学院深圳先进技术研究院 | 书写人的身份识别方法及装置 |
CN105787522A (zh) * | 2016-03-31 | 2016-07-20 | 科大讯飞股份有限公司 | 基于手写笔迹的书写态度评价方法及系统 |
CN106991374A (zh) * | 2017-03-07 | 2017-07-28 | 中国矿业大学 | 基于卷积神经网络和随机森林的手写数字识别方法 |
Non-Patent Citations (3)
Title |
---|
A New Automated Method for Evaluating Mental Workload Using Handwriting Features;Zhiming Wu等;《The Institute of Electronics, Information and Communication Engineers》;20170930;第E100-D卷(第9期);2147-2155 * |
Personality identification through handwriting analysis a review;Seema Kedar等;《International Journal of Advanced Research in Computer Science and Software Engineering》;20150131;第5卷(第1期);548-556 * |
笔迹心理分析的研究现状及问题;张鹏博等;《心理研究》;20130723;第6卷(第2期);70-77 * |
Also Published As
Publication number | Publication date |
---|---|
CN108171144A (zh) | 2018-06-15 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Diem et al. | cBAD: ICDAR2017 competition on baseline detection | |
CN105868758B (zh) | 图像中文本区域检测方法、装置及电子设备 | |
CN106156766B (zh) | 文本行分类器的生成方法及装置 | |
US8014603B2 (en) | System and method for characterizing handwritten or typed words in a document | |
CN106846362B (zh) | 一种目标检测跟踪方法和装置 | |
US20120134576A1 (en) | Automatic recognition of images | |
Chaudhuri et al. | An approach for detecting and cleaning of struck-out handwritten text | |
CN101122953A (zh) | 一种图片文字分割的方法 | |
Rigaud et al. | Text-independent speech balloon segmentation for comics and manga | |
Ma et al. | A surface defects inspection method based on multidirectional gray-level fluctuation | |
CN108154132A (zh) | 一种身份证文字提取方法、系统及设备和存储介质 | |
Garoot et al. | A comprehensive survey on handwriting and computerized graphology | |
Yadav et al. | Text extraction in document images: highlight on using corner points | |
Kesiman et al. | Southeast Asian palm leaf manuscript images: a review of handwritten text line segmentation methods and new challenges | |
CN109035256A (zh) | 用户界面图像切割方法、装置、服务器和存储介质 | |
CN116562991B (zh) | 面向元宇宙电商平台的商品大数据信息识别方法及系统 | |
CN106339661A (zh) | 一种用于检测图像中文本区域的方法及装置 | |
CN108171144B (zh) | 信息处理方法、装置、电子设备及存储介质 | |
Susan et al. | Text area segmentation from document images by novel adaptive thresholding and template matching using texture cues | |
García et al. | Supervised texture classification by integration of multiple texture methods and evaluation windows | |
Papandreou et al. | Slant estimation and core-region detection for handwritten Latin words | |
Sharma et al. | Piece-wise linearity based method for text frame classification in video | |
Shivakumara et al. | Text line segmentation from struck-out handwritten document images | |
Jana et al. | A fuzzy C-means based approach towards efficient document image binarization | |
CN117315668A (zh) | 一种基于ocr的文本智能识别系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant | ||
CF01 | Termination of patent right due to non-payment of annual fee | ||
CF01 | Termination of patent right due to non-payment of annual fee |
Granted publication date: 20201211 Termination date: 20211226 |