CN110009027B - 图像的比对方法、装置、存储介质及电子装置 - Google Patents
图像的比对方法、装置、存储介质及电子装置 Download PDFInfo
- Publication number
- CN110009027B CN110009027B CN201910242869.XA CN201910242869A CN110009027B CN 110009027 B CN110009027 B CN 110009027B CN 201910242869 A CN201910242869 A CN 201910242869A CN 110009027 B CN110009027 B CN 110009027B
- Authority
- CN
- China
- Prior art keywords
- feature
- target
- reference image
- neural network
- image
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/22—Matching criteria, e.g. proximity measures
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/40—Extraction of image or video features
- G06V10/46—Descriptors for shape, contour or point-related descriptors, e.g. scale invariant feature transform [SIFT] or bags of words [BoW]; Salient regional features
- G06V10/462—Salient features, e.g. scale invariant feature transforms [SIFT]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/74—Image or video pattern matching; Proximity measures in feature spaces
- G06V10/75—Organisation of the matching processes, e.g. simultaneous or sequential comparisons of image or video features; Coarse-fine approaches, e.g. multi-scale approaches; using context analysis; Selection of dictionaries
- G06V10/757—Matching configurations of points or features
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- General Physics & Mathematics (AREA)
- Artificial Intelligence (AREA)
- Data Mining & Analysis (AREA)
- Evolutionary Computation (AREA)
- Life Sciences & Earth Sciences (AREA)
- Multimedia (AREA)
- Software Systems (AREA)
- General Health & Medical Sciences (AREA)
- Health & Medical Sciences (AREA)
- Computing Systems (AREA)
- General Engineering & Computer Science (AREA)
- Biophysics (AREA)
- Mathematical Physics (AREA)
- Molecular Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Computational Linguistics (AREA)
- Evolutionary Biology (AREA)
- Biomedical Technology (AREA)
- Databases & Information Systems (AREA)
- Medical Informatics (AREA)
- Image Analysis (AREA)
Abstract
本发明公开了一种图像的比对方法、装置、存储介质及电子装置。其中,该方法包括:从目标区域上获取输入图像;获取目标参照图像的第一特征以及输入图像的第二特征,其中,第一特征是通过目标神经网络模型从目标参照图像中提取的特征,第二特征是通过目标神经网络模型从输入图像中提取的特征,目标神经网络模型是使用具有对应关系的参照图像和样本图像分别对初始神经网络模型进行训练得到的模型,参照图像包括目标参照图像;对第一特征与第二特征进行比对,得到比对结果,其中,比对结果用于指示目标参照图像与输入图像之间的相似度。本发明解决了相关技术中对图像进行比对的准确率较低的技术问题。
Description
技术领域
本发明涉及计算机领域,具体而言,涉及一种图像的比对方法、装置、存储介质及电子装置。
背景技术
人们在对某些对象(比如书法、画作、雕刻)进行临摹的过程中,往往会想要知道自己临摹的像不像,目前的判定临摹的作品和参照的作品是否相像的方法是将临摹作品的图像和参照作品的图像输入到计算机设备中,计算机设备将这两张图像重叠在一起,由用户来分辨它们有哪些部分是重合的,又有哪些部分是无法重合的,从而确定它们是否相似,但是这种比对方式严重地影响了比对的效率和比对的准确性。
针对上述的问题,目前尚未提出有效的解决方案。
发明内容
本发明实施例提供了一种图像的比对方法、装置、存储介质及电子装置,以至少解决相关技术中对图像进行比对的准确率较低的技术问题。
根据本发明实施例的一个方面,提供了一种图像的比对方法,包括:从目标区域上获取输入图像,其中,所述输入图像用于指示对照显示界面上显示的目标参照图像在所述目标区域上输入的信息;获取所述目标参照图像的第一特征以及所述输入图像的第二特征,其中,所述第一特征是通过目标神经网络模型从所述目标参照图像中提取的特征,所述第二特征是通过所述目标神经网络模型从所述输入图像中提取的特征,所述目标神经网络模型是使用具有对应关系的参照图像和样本图像分别对初始神经网络模型进行训练得到的模型,所述参照图像包括所述目标参照图像;对所述第一特征与所述第二特征进行比对,得到比对结果,其中,所述比对结果用于指示所述目标参照图像与所述输入图像之间的相似度。
根据本发明实施例的另一方面,还提供了一种图像的比对装置,包括:
第一获取模块,用于从目标区域上获取输入图像,其中,所述输入图像用于指示对照显示界面上显示的目标参照图像在所述目标区域上输入的信息;
第二获取模块,用于获取所述目标参照图像的第一特征以及所述输入图像的第二特征,其中,所述第一特征是通过目标神经网络模型从所述目标参照图像中提取的特征,所述第二特征是通过所述目标神经网络模型从所述输入图像中提取的特征,所述目标神经网络模型是使用具有对应关系的参照图像和样本图像分别对初始神经网络模型进行训练得到的模型,所述参照图像包括所述目标参照图像;
比对模块,用于对所述第一特征与所述第二特征进行比对,得到比对结果,其中,所述比对结果用于指示所述目标参照图像与所述输入图像之间的相似度。
可选地,所述第二获取模块包括以下之一:
第一处理单元,用于从具有对应关系的参照图像和图像特征中查找与所述目标参照图像对应的所述第一特征,并将所述输入图像输入至所述目标神经网络模型,得到所述目标神经网络模型输出的所述第二特征,其中,所述图像特征是预先将所述参照图像输入至所述目标神经网络模型中得到的所述目标神经网络模型输出的特征;
第二处理单元,用于将所述目标参照图像和所述输入图像分别输入至所述目标神经网络模型,得到所述目标神经网络模型输出的所述目标参照图像对象的所述第一特征以及所述输入图像对应的所述第二特征。
可选地,所述比对模块包括:
第一确定单元,用于确定所述第一特征与所述第二特征之间的第一距离值,其中,所述第一距离值用于指示所述目标参照图像与所述输入图像之间的相似度,所述第一距离值越小所述目标参照图像与所述输入图像之间的相似度越高;
第二确定单元,用于将所述第一距离值确定为所述比对结果;或者,将所述第一距离值转换至目标阈值区间,得到所述比对结果。
可选地,所述装置还包括:
训练模块,用于使用具有对应关系的所述参照图像和所述样本图像对所述初始神经网络模型的参数进行训练,得到所述目标神经网络模型,其中,所述初始神经网络模型包括串联的多个层级,所述多个层级中的每一个层级依次包括卷积层和池化层。
可选地,所述训练模块包括:
输入单元,用于将所述参照图像输入所述多个层级中的第一个层级所包括的目标卷基层,得到所述多个层级中的最后一个层级所包括的目标池化层输出的所述参照图像所对应的第三特征,并将所述样本图像输入所述目标卷基层,得到所述目标池化层输出的所述样本图像所对应的第四特征;
第三确定单元,用于确定所述第三特征与所述第四特征之间的第二距离值,其中,所述第二距离值用于指示所述参照图像与所述样本图像之间的相似度;
调整单元,用于根据所述第二距离值与目标距离值之间的第一差值对所述多个层级中所包括的卷积层的参数进行调整,使得所述第一差值最小化,其中,所述目标距离值用于指示预先标注的所述参照图像与所述样本图像之间的目标相似度;
第四确定单元,用于将所述第一差值达到最小化的模型确定为所述目标神经网络模型。
可选地,所述第三特征包括第一特征图集合,所述第四特征包括第二特征图集合,所述第一特征图集合中所包括的第一特征图与所述第二特征图集合中所包括的第二特征图一一对应,其中,第三确定单元用于:
确定具有一一对应关系的所述第一特征图与所述第二特征图中每一组特征图上对应位置上的像素点所具有的特征值之间的第二差值;
将所述第二差值的平方和的算术平方根的值确定为所述第二距离值。
可选地,所述多个层级中的每一个层级中的卷积层包括多个卷积核,所述多个层级的数量和/或所述多个卷积核的数量根据所述参照图像所包括的字符的字体确定。
可选地,所述第一获取模块包括:
显示单元,用于在所述显示界面上显示所述目标参照图像;
拍摄单元,用于对在所述目标区域中输入的信息进行拍摄,得到所述输入图像;
建立单元,用于建立所述目标参照图像与所述输入图像之间的对应关系。
根据本发明实施例的另一方面,还提供了一种存储介质,其特征在于,所述存储介质中存储有计算机程序,其中,所述计算机程序被设置为运行时执行上述任一项中所述的方法。
根据本发明实施例的另一方面,还提供了一种电子装置,包括存储器和处理器,其特征在于,所述存储器中存储有计算机程序,所述处理器被设置为通过所述计算机程序执行上述任一项中所述的方法。
在本发明实施例中,采用从目标区域上获取输入图像,其中,输入图像用于指示对照显示界面上显示的目标参照图像在目标区域上输入的信息;获取目标参照图像的第一特征以及输入图像的第二特征,其中,第一特征是通过目标神经网络模型从目标参照图像中提取的特征,第二特征是通过目标神经网络模型从输入图像中提取的特征,目标神经网络模型是使用具有对应关系的参照图像和样本图像分别对初始神经网络模型进行训练得到的模型,参照图像包括目标参照图像;对第一特征与第二特征进行比对,得到比对结果,其中,比对结果用于指示目标参照图像与输入图像之间的相似度的方式,输入图像是对照显示界面上显示的目标参照图像在目标区域上输入的信息形成的图像,从目标区域上获取输入图像,并获取通过目标神经网络模型分别从目标参照图像和输入图像中提取到的第一特征和第二特征,通过对第一特征和第二特征的比对确定目标参照图像与输入图像之间的相似度,从而使得用于对图像进行比对的特征是通过训练好的目标神经网络模型得到的,提高了特征获取的准确性和全面性,进而使得基于特征获取到的比对结果更加准确,使得对目标参照图像进行临摹的用户清楚准确地了解到自己临摹的输入图像与目标参照图像的相似程度,从而实现了提高对图像进行比对的准确率的技术效果,进而解决了相关技术中对图像进行比对的准确率较低的技术问题。
附图说明
此处所说明的附图用来提供对本发明的进一步理解,构成本申请的一部分,本发明的示意性实施例及其说明用于解释本发明,并不构成对本发明的不当限定。在附图中:
图1是根据本发明实施例的一种可选的图像的比对方法的示意图;
图2是根据本发明实施例的一种可选的图像的比对方法的应用环境示意图;
图3是根据本发明可选的实施方式的一种可选的图像的比对方法的示意图;
图4是根据本发明可选的实施方式的另一种可选的图像的比对方法的示意图一;
图5是根据本发明可选的实施方式的另一种可选的图像的比对方法的示意图二;
图6是根据本发明可选的实施方式的另一种可选的图像的比对方法的示意图三;
图7是根据本发明可选的实施方式的另一种可选的图像的比对方法的示意图四;
图8是根据本发明可选的实施方式的另一种可选的图像的比对方法的示意图五;
图9是根据本发明实施例的一种可选的图像的比对装置的示意图;
图10是根据本发明实施例的一种可选的图像的比对方法的应用场景示意图;以及
图11是根据本发明实施例的一种可选的电子装置的示意图。
具体实施方式
为了使本技术领域的人员更好地理解本发明方案,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分的实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本发明保护的范围。
需要说明的是,本发明的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本发明的实施例能够以除了在这里图示或描述的那些以外的顺序实施。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
根据本发明实施例的一个方面,提供了一种图像的比对方法,如图1所示,该方法包括:
S102,从目标区域上获取输入图像,其中,输入图像用于指示对照显示界面上显示的目标参照图像在目标区域上输入的信息;
S104,获取目标参照图像的第一特征以及输入图像的第二特征,其中,第一特征是通过目标神经网络模型从目标参照图像中提取的特征,第二特征是通过目标神经网络模型从输入图像中提取的特征,目标神经网络模型是使用具有对应关系的参照图像和样本图像分别对初始神经网络模型进行训练得到的模型,参照图像包括目标参照图像;
S106,对第一特征与第二特征进行比对,得到比对结果,其中,比对结果用于指示目标参照图像与输入图像之间的相似度。
可选地,在本实施例中,上述图像的比对方法可以应用于如图2所示的计算机设备202所构成的硬件环境中。如图2所示,计算机设备202包括:图像采集器2022、显示器2024和处理器2026,图像采集器2022从目标区域上获取输入图像,并将输入图像传输给处理器2026,其中,输入图像用于指示对照显示器2024的显示界面上显示的目标参照图像在目标区域上输入的信息。处理器2026获取目标参照图像的第一特征以及输入图像的第二特征,其中,第一特征是通过目标神经网络模型从目标参照图像中提取的特征,第二特征是通过目标神经网络模型从输入图像中提取的特征,目标神经网络模型是使用具有对应关系的参照图像和样本图像分别对初始神经网络模型进行训练得到的模型,参照图像包括目标参照图像。处理器2026对第一特征与第二特征进行比对,得到比对结果,并将比对结果传输给显示器2024进行显示,其中,比对结果用于指示目标参照图像与输入图像之间的相似度。
可选地,在本实施例中,上述图像的比对方法可以但不限于应用于对目标参照图像与输入图像进行比对的场景中。其中,上述计算机设备可以但不限于为各种类型的应用的客户端或者服务器,例如,上述应用可以但不限于包括在线教育应用、学习应用、即时通讯应用、社区空间应用、游戏应用、购物应用、浏览器应用、金融应用、多媒体应用、直播应用等。具体的,可以但不限于应用于在字帖应用中对目标字帖图像与手写图像进行比对的场景中,或还可以但不限于应用于在绘画应用中对目标画作图像与绘制图像进行比对的场景中,以提高对图像进行比对的准确率。上述仅是一种示例,本实施例中对此不做任何限定。
可选地,在本实施例中,目标参照图像可以但不限于是用于进行临摹的图像。比如:字帖、书法作品、绘画作品等等。目标参照图像显示在显示界面上,比如:显示在手机、电脑等设备的显示器上。输入图像用于指示对照显示界面上显示的目标参照图像在目标区域上输入的信息,比如:用户临摹字帖在手写区域写下文字,对手写区域进行拍摄得到输入图像。或者,用户临摹目标绘画在绘画区域进行作画,对绘画区域上所完成的作品进行拍摄得到输入图像。
可选地,在本实施例中,目标区域是用于对照目标参照图像输入信息的区域。其可以但不限于包括:纸张、手写板等等。如果是纸张,可以通过拍摄来获取输入图像。如果是手写板,则可以通过截图来获取输入图像。
可选地,在本实施例中,目标神经网络模型可以但不限于包括:卷积神经网络模型(CNN)、循环神经网络(RNN)等等。
可选地,在本实施例中,第一特诊和第二特征可以但不限于是图像中所包括的内容的特征,比如:如果是文字,则可以是文字的笔画特征,如果是绘画,则可以是绘画的线条特征、色彩特征等等。
在一个可选的实施方式中,如图3所示,提供了一个图像的比对系统,该系统包括:客户端和服务器,客户端上安装有摄像头,客户端的显示界面上显示了目标参照图像:字帖“本”,用户在纸上写下了“本”字,客户端的摄像头对其进行拍摄,得到输入图像:手写“本”,客户端将手写“本”发送给服务器。服务器从目标区域上获取到手写“本”,并获取字帖“本”的第一特征以及手写“本”的第二特征,其中,第一特征是通过目标CNN模型从字帖“本”中提取的特征,第二特征是通过目标CNN模型从手写“本”中提取的特征,目标CNN模型是使用具有对应关系的字帖集合和手写字样本分别对初始CNN模型进行训练得到的模型,服务器对第一特征与第二特征进行比对,得到比对结果:55分(0-110分),其中,比对结果用于指示字帖“本”与手写“本”之间的相似度。服务器将比对结果55分发送给客户端,由客户端将其显示在显示界面上。
可见,通过上述步骤,输入图像是对照显示界面上显示的目标参照图像在目标区域上输入的信息形成的图像,从目标区域上获取输入图像,并获取通过目标神经网络模型分别从目标参照图像和输入图像中提取到的第一特征和第二特征,通过对第一特征和第二特征的比对确定目标参照图像与输入图像之间的相似度,从而使得用于对图像进行比对的特征是通过训练好的目标神经网络模型得到的,提高了特征获取的准确性和全面性,进而使得基于特征获取到的比对结果更加准确,使得对目标参照图像进行临摹的用户清楚准确地了解到自己临摹的输入图像与目标参照图像的相似程度,从而实现了提高对图像进行比对的准确率的技术效果,进而解决了相关技术中对图像进行比对的准确率较低的技术问题。
作为一种可选的方案,获取目标参照图像的第一特征以及输入图像的第二特征包括:
S1,获取目标参照图像的第一字符特征,其中,第一字符特征用于指示目标参照图像所包括的目标字符的笔画特征,第一特征包括第一字符特征;
S2,获取输入图像的第二字符特征,其中,第二字符特征用于指示输入图像所包括的输入字符的笔画特征,第二特征包括第二字符特征,对照目标参照图像在目标区域上输入的信息包括输入字符。
可选地,在本实施例中,以字符图像的比对为例,从图像中提取的特征可以但不限于包括字符的笔画特征。字符可以但不限于包括各种语言的文字,比如:汉字、英文字母、英文单词、拉丁字符、希腊字符、法文、德文、俄文等等。
可选地,在本实施例中,可以但不限于通过以下方式获取目标参照图像的第一字符特征:
S11,获取目标字符的第一笔画特征和第二笔画特征,其中,第一笔画特征为目标字符所包括的关键笔画所具有的特征,第二笔画特征为目标字符所具有的除第一笔画特征之外的特征;
S12,将第一笔画特征与第二笔画特征的加权和确定为第一字符特征,其中,第一笔画特征所对应的第一权重值高于第二笔画特征所对应的第二权重值;
可选地,在本实施例中,可以但不限于通过以下方式获取输入图像的第二字符特征:
S21,获取输入字符的第三笔画特征和第四笔画特征,其中,第三笔画特征为输入字符所包括的关键笔画所具有的特征,第四笔画特征为输入字符所具有的除第三笔画特征之外的特征;
S22,将第三笔画特征与第四笔画特征的加权和确定为第二字符特征,其中,第三笔画特征对应第一权重值,第二笔画特征对应第二权重值。
可选地,在本实施例中,对于字符中的关键笔画,由于其对于书写相似度的影响较大,可以为其赋予较高的第一权重值,以使其在相似度的计算中占据较大的比重。
可选地,在本实施例中,对于通过目标神经网络模型来提取特征的方式,可以通过对样本图像的不同标注来使得训练后的目标神经网络模型识别出字符中的关键笔画。
例如:字帖字体和书写字体的对比,主要是一些笔画的关键位置的对比,例如:如何写横竖撇捺折,如何组合这些横竖撇捺折等等,这写刚好就能够通过卷积神经网络将这些特征抽取出来,如果两个字体使用同样的卷积神经网络来抽取,那么就能抽取同样的特征,再加上样本里的评分,就能对比两个特征是不是相似,从而训练出能够抽取字体里关键特征的卷积神经网络模型。如图4所示,字迹到底像不像,关键就是看方框里的那些书写方式对比是否一致,至于方框之外的部分,就不是那么重要了。
对于如图5所示的文字“当”来说,不同的卷积核,抽取出来的特征是不同的,比如使用三个不同的卷积核抽取出如图5所示的三个特征:特征一、特征二和特征三。可以发现,字迹像不像,其实特征一、特征二很重要,但是特征三却不那么重要。
在样本训练的时候,特征一和特征二这两类特征相似的样本,评分会很高(可以人工标注),而特征一和特征二这两类特征不相似的样本,评分会很低(可以人工标注),特征三相似和不相似的样本评分有的高有的底(可以人工标注),这就相当于说明特征一和特征二是关键特征,而特征三是不重要的特征。在训练不断进行之后,抽取特征一和特征二的卷积核所对应的参数权重会越来越大,抽取特征三的卷积核所对应的参数权重会越来越小。经过不断训练之后,就会发现,模型越来越倾向于把关键特征抽取出来作对比。那么,在比对过程中,模型也会将关键特征抽取出来,然后用这个关键特征来对比,从而给出准确的评分。
作为一种可选的方案,获取目标参照图像的第一特征以及输入图像的第二特征包括以下之一:
S1,从具有对应关系的参照图像和图像特征中查找与目标参照图像对应的第一特征,并将输入图像输入至目标神经网络模型,得到目标神经网络模型输出的第二特征,其中,图像特征是预先将参照图像输入至目标神经网络模型中得到的目标神经网络模型输出的特征;
S2,将目标参照图像和输入图像分别输入至目标神经网络模型,得到目标神经网络模型输出的目标参照图像对象的第一特征以及输入图像对应的第二特征。
可选地,在本实施例中,参照图像的图像特征可以但不限于是在模型训练好后就获取到的,可以将其存储起来,在进行图像比对时直接根据目标参照图像来提取对应的第一特征,从而节省了使用模型进行特征提取的时间,提高了比对的效率。
可选地,在本实施例中,也可以但不限于在每次进行比对时均将目标参照图像与输入图像分别输入到目标神经网络模型中来提取特征。对于历史的比对结果可以用来对目标神经网络模型进行更新,比如:用户在接收到比对结果时可以对比对结果的满意度进行评价,服务器根据用户的评价对目标神经网络模型的参数进行调整,那么从参照图像中提取的图像特征则可能会发生变化,通过更新后的目标神经网络对目标参照图像的第一特征进行提取,提取的结果也可以替换掉数据库中原本存储的第一特征。
作为一种可选的方案,对第一特征与第二特征进行比对,得到比对结果包括:
S1,确定第一特征与第二特征之间的第一距离值,其中,第一距离值用于指示目标参照图像与输入图像之间的相似度,第一距离值越小目标参照图像与输入图像之间的相似度越高;
S2,将第一距离值确定为比对结果;或者,将第一距离值转换至目标阈值区间,得到比对结果。
可选地,在本实施例中,特征之间的距离可以但不限于用欧式距离、马氏距离、曼哈顿距离等方式进行表示。距离表示了特征之间的差异程度,距离越大表示特征之间的差异越大,特征之间越不相似,即相似度越小。
可选地,在本实施例中,可以但不限于直接将第一距离值作为比对结果。或者,也可以将第一距离值映射到一个数值范围内作为比对结果。比如:目标阈值区间可以但不限于为0~110,0~1,0~10,5~185,-111~1等等。
作为一种可选的方案,在获取目标参照图像的第一特征以及输入图像的第二特征之前,还包括:
S1,使用具有对应关系的参照图像和样本图像对初始神经网络模型的参数进行训练,得到目标神经网络模型,其中,初始神经网络模型包括串联的多个层级,多个层级中的每一个层级依次包括卷积层和池化层。
可选地,在本实施例中,可以但不限于使用以下方式对初始神经网络模型的参数进行训练:
S11,将参照图像输入多个层级中的第一个层级所包括的目标卷基层,得到多个层级中的最后一个层级所包括的目标池化层输出的参照图像所对应的第三特征,并将样本图像输入目标卷基层,得到目标池化层输出的样本图像所对应的第四特征;
S12,确定第三特征与第四特征之间的第二距离值,其中,第二距离值用于指示参照图像与样本图像之间的相似度;
S13,根据第二距离值与目标距离值之间的第一差值对多个层级中所包括的卷积层的参数进行调整,使得第一差值最小化,其中,目标距离值用于指示预先标注的参照图像与样本图像之间的目标相似度;
S14,将第一差值达到最小化的模型确定为目标神经网络模型。
可选地,在本实施例中,初始神经网络模型可以但不限于是一个模型,将参照图像输入到这一个模型得到第三特征,将样本图像输入到这一个模型得到第四特征,根据第三特征与第四特征之间的第二距离值对这一个模型的参数进行调整,从而得到目标神经网络模型。
可选地,在本实施例中,初始神经网络模型可以但不限于是两个相同的模型,将参照图像输入到其中一个模型得到第三特征,将样本图像输入到另一个模型得到第四特征,根据第三特征与第四特征之间的第二距离值对这两个模型的参数同时作出相同的调整,从而得到包括两个子模型的目标神经网络模型。
在一个可选的实施方式中,如图6所示,两个相同的卷积神经网络模型用来将图像的特征抽取出来,将原始图像,用n个不同的特征视野去做卷积操作,得到第一个卷积层的结果,一张原始图片,会被映射成n个特征图,再对这些特征图进行池化操作,得到一个池化层,接着,再对这个池化层的每一层,再用m个不同的特征视野去做卷积操作,就能得到n×m层的特征图,再进行一次池化,就能得到最终的池化结果,这个池化结果,就是用计算机语言描述的图像的特征。如图7所示,对于字帖字体,抽取出一个特征图集合,那么,对于手写字体就能用同样的方法抽取出手写字体的特征图集合(用相同的卷积核和池化方法)。
作为一种可选的方案,第三特征包括第一特征图集合,第四特征包括第二特征图集合,第一特征图集合中所包括的第一特征图与第二特征图集合中所包括的第二特征图一一对应,其中,确定第三特征与第四特征之间的第二距离值包括:
S1,确定具有一一对应关系的第一特征图与第二特征图中每一组特征图上对应位置上的像素点所具有的特征值之间的第二差值;
S2,将第二差值的平方和的算术平方根的值确定为第二距离值。
可选地,在本实施例中,第二距离值可以使用欧氏距离表示。在得到两个特征图序列之后,对比两张图的相似度,欧氏距离的公式如下:
其中,如图8所示,xi表示字帖字体特征图里的一个值,yi表示手写字体特征图里的一个值。d(x,y)就表示了两者之间的差异。
在上一步抽取出来的特征图,实际就是n×m张位图:位图里的每一个像素,就是xi和yi,带入到欧氏距离公式里,就能得到第二距离值。
在训练阶段,输入可以是字帖字体和手写字体以及这两个的对比度评分,将得到的d(x,y),映射到0-110,再对应到评分,这样就得到了一个等式,如下公式就是最终用于训练的等式:
h(d(f(X),f(Y))=score
上述公式中,f表示卷积神经网络,d表示欧氏距离,h表示值域为0-110的函数。通过上面的公式,就可以用梯度下降算法将模型训练出来了,其中只有f的参数未知,d和h这两个函数都是不带参数的。
可选地,在本实施例中,多个层级中的每一个层级中的卷积层包括多个卷积核,多个层级的数量和/或多个卷积核的数量根据参照图像所包括的字符的字体确定。
作为一种可选的方案,从目标区域上获取输入图像包括:
S1,在显示界面上显示目标参照图像;
S2,对在目标区域中输入的信息进行拍摄,得到输入图像;
S3,建立目标参照图像与输入图像之间的对应关系。
可选地,在本实施例中,输入图像可以但不限于是通过摄像头等图像采集装置对目标区域输入的信息进行拍照得到的。
需要说明的是,对于前述的各方法实施例,为了简单描述,故将其都表述为一系列的动作组合,但是本领域技术人员应该知悉,本发明并不受所描述的动作顺序的限制,因为依据本发明,某些步骤可以采用其他顺序或者同时进行。其次,本领域技术人员也应该知悉,说明书中所描述的实施例均属于优选实施例,所涉及的动作和模块并不一定是本发明所必须的。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到根据上述实施例的方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质(如ROM/RAM、磁碟、光盘)中,包括若干指令用以使得一台终端设备(可以是手机,计算机,服务器,或者网络设备等)执行本发明各个实施例所述的方法。
根据本发明实施例的另一个方面,还提供了一种用于实施上述图像的比对方法的图像的比对装置,如图9所示,该装置包括:
1)第一获取模块92,用于从目标区域上获取输入图像,其中,输入图像用于指示对照显示界面上显示的目标参照图像在目标区域上输入的信息;
2)第二获取模块94,用于获取目标参照图像的第一特征以及输入图像的第二特征,其中,第一特征是通过目标神经网络模型从目标参照图像中提取的特征,第二特征是通过目标神经网络模型从输入图像中提取的特征,目标神经网络模型是使用具有对应关系的参照图像和样本图像分别对初始神经网络模型进行训练得到的模型,参照图像包括目标参照图像;
3)比对模块96,用于对第一特征与第二特征进行比对,得到比对结果,其中,比对结果用于指示目标参照图像与输入图像之间的相似度。
作为一种可选的方案,第二获取模块包括:
第一获取单元,用于获取目标参照图像的第一字符特征,其中,第一字符特征用于指示目标参照图像所包括的目标字符的笔画特征,第一特征包括第一字符特征;
第二获取单元,用于获取输入图像的第二字符特征,其中,第二字符特征用于指示输入图像所包括的输入字符的笔画特征,第二特征包括第二字符特征,对照目标参照图像在目标区域上输入的信息包括输入字符。
作为一种可选的方案,第一获取单元用于:获取目标字符的第一笔画特征和第二笔画特征,其中,第一笔画特征为目标字符所包括的关键笔画所具有的特征,第二笔画特征为目标字符所具有的除第一笔画特征之外的特征;将第一笔画特征与第二笔画特征的加权和确定为第一字符特征,其中,第一笔画特征所对应的第一权重值高于第二笔画特征所对应的第二权重值;
第二获取单元用于:获取输入字符的第三笔画特征和第四笔画特征,其中,第三笔画特征为输入字符所包括的关键笔画所具有的特征,第四笔画特征为输入字符所具有的除第三笔画特征之外的特征;将第三笔画特征与第四笔画特征的加权和确定为第二字符特征,其中,第三笔画特征对应第一权重值,第二笔画特征对应第二权重值。
作为一种可选的方案,第二获取模块包括以下之一:
第一处理单元,用于从具有对应关系的参照图像和图像特征中查找与目标参照图像对应的第一特征,并将输入图像输入至目标神经网络模型,得到目标神经网络模型输出的第二特征,其中,图像特征是预先将参照图像输入至目标神经网络模型中得到的目标神经网络模型输出的特征;
第二处理单元,用于将目标参照图像和输入图像分别输入至目标神经网络模型,得到目标神经网络模型输出的目标参照图像对象的第一特征以及输入图像对应的第二特征。
作为一种可选的方案,比对模块包括:
第一确定单元,用于确定第一特征与第二特征之间的第一距离值,其中,第一距离值用于指示目标参照图像与输入图像之间的相似度,第一距离值越小目标参照图像与输入图像之间的相似度越高;
第二确定单元,用于将第一距离值确定为比对结果;或者,将第一距离值转换至目标阈值区间,得到比对结果。
作为一种可选的方案,上述装置还包括:
训练模块,用于使用具有对应关系的参照图像和样本图像对初始神经网络模型的参数进行训练,得到目标神经网络模型,其中,初始神经网络模型包括串联的多个层级,多个层级中的每一个层级依次包括卷积层和池化层。
作为一种可选的方案,训练模块包括:
输入单元,用于将参照图像输入多个层级中的第一个层级所包括的目标卷基层,得到多个层级中的最后一个层级所包括的目标池化层输出的参照图像所对应的第三特征,并将样本图像输入目标卷基层,得到目标池化层输出的样本图像所对应的第四特征;
第三确定单元,用于确定第三特征与第四特征之间的第二距离值,其中,第二距离值用于指示参照图像与样本图像之间的相似度;
调整单元,用于根据第二距离值与目标距离值之间的第一差值对多个层级中所包括的卷积层的参数进行调整,使得第一差值最小化,其中,目标距离值用于指示预先标注的参照图像与样本图像之间的目标相似度;
第四确定单元,用于将第一差值达到最小化的模型确定为目标神经网络模型。
作为一种可选的方案,第三特征包括第一特征图集合,第四特征包括第二特征图集合,第一特征图集合中所包括的第一特征图与第二特征图集合中所包括的第二特征图一一对应,其中,第三确定单元用于:
确定具有一一对应关系的第一特征图与第二特征图中每一组特征图上对应位置上的像素点所具有的特征值之间的第二差值;
将第二差值的平方和的算术平方根的值确定为第二距离值。
作为一种可选的方案,多个层级中的每一个层级中的卷积层包括多个卷积核,多个层级的数量和/或多个卷积核的数量根据参照图像所包括的字符的字体确定。
作为一种可选的方案,第一获取模块包括:
显示单元,用于在显示界面上显示目标参照图像;
拍摄单元,用于对在目标区域中输入的信息进行拍摄,得到输入图像;
建立单元,用于建立目标参照图像与输入图像之间的对应关系。
本发明实施例的应用环境可以但不限于参照上述实施例中的应用环境,本实施例中对此不再赘述。本发明实施例提供了用于实施上述实时通信的连接方法的一种可选的具体应用示例。
作为一种可选的实施例,上述图像的比对方法可以但不限于应用于如图10所示的对比字帖图像与手写图像的场景中。在本场景中,通过两个相同的卷积神经网络,分别抽取书写者书写的文字和字帖里对应文字的特征,然后将两个特征通过比对距离来进行评分,通过评分,来得到两个字体的相似度。训练阶段,输入为字帖字体、书写字体和对应评分,输出为两个相同的神经网络模型;比对阶段,输入为字帖字体和书写字体,输出为对应评分。
在本场景中,提供了一个完整练字系统,如图10所示,这个练字系统包含对照字帖、书写笔、摄像头和字迹分析系统。
对照字帖是用户对照着练习的字帖,用户会比对着字帖来写字,在多次书写之后,字迹越来越接近于字帖,最终达到书写字迹越来越好的目的。
书写笔和摄像头用于在用户使用书写笔进行书写时,由摄像头进行记录,每书写一个字,就会生成一张图像,当用户对照着字帖写完一篇之后,就会得到一系列的图像,这个图像的顺序和字帖里文字顺序一一对应,即每书写一个字,生成一张图像,并建立书写图像和字帖图像之间的对应关系。
字迹分析系统用于计算两个图像之间的相似度,首先通过样本数据来训练神经网络模型,让模型参数适合于对比特定的某一个字体的字帖和用户的手写文字,训练好之后再通过推演,告诉用户字迹和字帖相似的程度,从而给用户一个评分,用户在不断提高评分的过程中,字就会越写越好。
对字迹分析系统进行模型建立和使用模型。第一个步骤是建立模型,模型包括两个部分,第一个部分是两个相同的卷积神经网络,这个部分是用来将图像的特征抽取出来的,如果这些特征转换成人能理解的描述,就诸如:横的书写方式、勾的书写方式等等;模型的第二个部分是一个相似度计算公式,两个特征图计算欧氏距离,并且将这个欧式距离映射到0-110的区间上,这个区间就对应了评分,这样,整个模型就建立起来了,总的来说,就是两个同样的卷积神经网络去计算不同的字符图像,得到的结果再放入欧式距离公式,再映射到0-110的区间。用已经知道评分的训练样本图像去训练整个模型,就能得到能够抽取字体关键特征的卷积神经网络模型。第二个步骤,是使用模型,将手写字体和字帖里对应的文字放入训练好的模型,最终就能输出评分。
根据本发明实施例的又一个方面,还提供了一种用于实施上述图像的比对的电子装置,如图11所示,该电子装置包括:一个或多个(图中仅示出一个)处理器1102、存储器1104、传感器1106、编码器1108以及传输装置1110,该存储器中存储有计算机程序,该处理器被设置为通过计算机程序执行上述任一项方法实施例中的步骤。
可选地,在本实施例中,上述电子装置可以位于计算机网络的多个网络设备中的至少一个网络设备。
可选地,在本实施例中,上述处理器可以被设置为通过计算机程序执行以下步骤:
S1,从目标区域上获取输入图像,其中,输入图像用于指示对照显示界面上显示的目标参照图像在目标区域上输入的信息;
S2,获取目标参照图像的第一特征以及输入图像的第二特征,其中,第一特征是通过目标神经网络模型从目标参照图像中提取的特征,第二特征是通过目标神经网络模型从输入图像中提取的特征,目标神经网络模型是使用具有对应关系的参照图像和样本图像分别对初始神经网络模型进行训练得到的模型,参照图像包括目标参照图像;
S3,对第一特征与第二特征进行比对,得到比对结果,其中,比对结果用于指示目标参照图像与输入图像之间的相似度。
可选地,本领域普通技术人员可以理解,图11所示的结构仅为示意,电子装置也可以是智能手机(如Android手机、iOS手机等)、平板电脑、掌上电脑以及移动互联网设备(Mobile Internet Devices,MID)、PAD等终端设备。图11其并不对上述电子装置的结构造成限定。例如,电子装置还可包括比图11中所示更多或者更少的组件(如网络接口、显示装置等),或者具有与图11所示不同的配置。
其中,存储器1102可用于存储软件程序以及模块,如本发明实施例中的图像的比对方法和装置对应的程序指令/模块,处理器1104通过运行存储在存储器1102内的软件程序以及模块,从而执行各种功能应用以及数据处理,即实现上述的目标组件的控制方法。存储器1102可包括高速随机存储器,还可以包括非易失性存储器,如一个或者多个磁性存储装置、闪存、或者其他非易失性固态存储器。在一些实例中,存储器1102可进一步包括相对于处理器1104远程设置的存储器,这些远程存储器可以通过网络连接至终端。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。
上述的传输装置1110用于经由一个网络接收或者发送数据。上述的网络具体实例可包括有线网络及无线网络。在一个实例中,传输装置1110包括一个网络适配器(NetworkInterface Controller,NIC),其可通过网线与其他网络设备与路由器相连从而可与互联网或局域网进行通讯。在一个实例中,传输装置1110为射频(Radio Frequency,RF)模块,其用于通过无线方式与互联网进行通讯。
其中,具体地,存储器1102用于存储应用程序。
本发明的实施例还提供了一种存储介质,该存储介质中存储有计算机程序,其中,该计算机程序被设置为运行时执行上述任一项方法实施例中的步骤。
可选地,在本实施例中,上述存储介质可以被设置为存储用于执行以下步骤的计算机程序:
S1,从目标区域上获取输入图像,其中,输入图像用于指示对照显示界面上显示的目标参照图像在目标区域上输入的信息;
S2,获取目标参照图像的第一特征以及输入图像的第二特征,其中,第一特征是通过目标神经网络模型从目标参照图像中提取的特征,第二特征是通过目标神经网络模型从输入图像中提取的特征,目标神经网络模型是使用具有对应关系的参照图像和样本图像分别对初始神经网络模型进行训练得到的模型,参照图像包括目标参照图像;
S3,对第一特征与第二特征进行比对,得到比对结果,其中,比对结果用于指示目标参照图像与输入图像之间的相似度。
可选地,存储介质还被设置为存储用于执行上述实施例中的方法中所包括的步骤的计算机程序,本实施例中对此不再赘述。
可选地,在本实施例中,本领域普通技术人员可以理解上述实施例的各种方法中的全部或部分步骤是可以通过程序来指令终端设备相关的硬件来完成,该程序可以存储于一计算机可读存储介质中,存储介质可以包括:闪存盘、只读存储器(Read-Only Memory,ROM)、随机存取器(Random Access Memory,RAM)、磁盘或光盘等。
上述本发明实施例序号仅仅为了描述,不代表实施例的优劣。
上述实施例中的集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在上述计算机可读取的存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在存储介质中,包括若干指令用以使得一台或多台计算机设备(可为个人计算机、服务器或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。
在本发明的上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述的部分,可以参见其他实施例的相关描述。
在本申请所提供的几个实施例中,应该理解到,所揭露的客户端,可通过其它的方式实现。其中,以上所描述的装置实施例仅仅是示意性的,例如所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,单元或模块的间接耦合或通信连接,可以是电性或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
以上所述仅是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本发明的保护范围。
Claims (9)
1.一种图像的比对方法,其特征在于,包括:
使用具有对应关系的参照图像和样本图像对初始神经网络模型的参数进行训练,得到目标神经网络模型,其中,所述初始神经网络模型包括串联的多个层级,所述多个层级中的每一个层级依次包括卷积层和池化层,所述多个层级中的每一个层级中的卷积层包括多个卷积核,用于抽取关键特征与非关键特征的卷积核对应的参数权重在所述初始神经网络模型的训练过程中被动态调整,所述关键特征为图像中的字符包括的关键笔画所具有的特征,所述非关键特征为图像中的字符所具有的除所述关键特征之外的特征;
在显示界面上显示目标参照图像;通过图像采集装置对目标区域输入的信息进行拍照以得到输入图像;建立所述目标参照图像与所述输入图像之间的对应关系,其中,所述输入图像用于指示对照所述目标参照图像在所述目标区域上输入的信息,所述参照图像包括所述目标参照图像;
通过所述目标神经网络模型从所述目标参照图像中提取目标字符的第一笔画特征和第二笔画特征;将所述第一笔画特征与所述第二笔画特征的加权和确定为第一字符特征,其中,所述第一笔画特征对应第一权重值,所述第二笔画特征对应第二权重值,所述第一笔画特征为所述目标字符的关键特征,所述第二笔画特征为所述目标字符所具有的除所述第一笔画特征的非关键特征,所述第一笔画特征所对应的第一权重值高于所述第二笔画特征所对应的第二权重值;
通过所述目标神经网络模型从所述输入图像中提取输入字符的第三笔画特征和第四笔画特征;将所述第三笔画特征与所述第四笔画特征的加权和确定为第二字符特征,其中,所述输入字符为对照所述目标参照图像在所述目标区域上输入的字符信息,所述第三笔画特征为所述输入字符的关键特征,所述第四笔画特征为所述输入字符所具有的除所述第三笔画特征之外的非关键特征;
对包括所述第一字符特征的第一特征,与包括所述第二字符特征的第二特征进行比对,得到比对结果,其中,所述比对结果用于指示所述目标参照图像与所述输入图像之间的相似度;
所述使用具有对应关系的所述参照图像和所述样本图像对所述初始神经网络模型的参数进行训练,包括:
使用所述初始神经网络模型中的第一卷积神经网络模型用n个不同的特征视野对所述参照图像做卷积操作,得到第一个卷积层的结果,其中,所述第一个卷积层的结果包括被映射成的n个第一特征图;对所述n个第一特征图进行池化操作,得到第一池化层;对所述第一池化层的每一层用m个不同的特征视野做卷积操作,得到n×m层的第一目标特征图,其中,所述第一目标特征图为用计算机语言描述的所述参照图像的特征;
使用所述初始神经网络模型中的第二卷积神经网络模型用n个不同的特征视野对所述样本图像做卷积操作,得到第二个卷积层的结果,其中,所述第二个卷积层的结果包括被映射成的n个第二特征图;对所述n个第二特征图进行池化操作,得到第二池化层;对所述第二池化层的每一层用m个不同的特征视野做卷积操作,得到n×m层的第二目标特征图,其中,所述第二目标特征图为用计算机语言描述的所述样本图像的特征,所述第一卷积神经网络模型与所述第二卷积神经网络模型为相同模型;
利用下述公式,对比所述第一目标特征图以及所述第二目标特征图的相似度:
其中,xi表示所述第一目标特征图里的每一个像素,yi表示手所述第二目标特征图里的每一个像素,d(x,y)就表示了两者之间的差异;
利用下述公式结合梯度下降算法,对所述初始神经网络模型的参数进行训练:
h(d(f(X),f(Y)))=score
其中,f表示卷积神经网络,d表示欧氏距离,h表示一个阈值区间的函数,score为将得到的d(f(X),f(Y))映射到所述一个阈值区间得到的对比度评分。
2.根据权利要求1所述的方法,其特征在于,获取所述目标参照图像的所述第一特征以及所述输入图像的所述第二特征包括以下之一:
从具有对应关系的参照图像和图像特征中查找与所述目标参照图像对应的所述第一特征,并将所述输入图像输入至所述目标神经网络模型,得到所述目标神经网络模型输出的所述第二特征,其中,所述图像特征是预先将所述参照图像输入至所述目标神经网络模型中得到的所述目标神经网络模型输出的特征;
将所述目标参照图像和所述输入图像分别输入至所述目标神经网络模型,得到所述目标神经网络模型输出的所述目标参照图像对象的所述第一特征以及所述输入图像对应的所述第二特征。
3.根据权利要求1所述的方法,其特征在于,对所述第一特征与所述第二特征进行比对,得到比对结果包括:
确定所述第一特征与所述第二特征之间的第一距离值,其中,所述第一距离值用于指示所述目标参照图像与所述输入图像之间的相似度,所述第一距离值越小所述目标参照图像与所述输入图像之间的相似度越高;
将所述第一距离值确定为所述比对结果;或者,将所述第一距离值转换至目标阈值区间,得到所述比对结果。
4.根据权利要求1所述的方法,其特征在于,使用具有对应关系的所述参照图像和所述样本图像对所述初始神经网络模型的参数进行训练包括:
将所述参照图像输入所述多个层级中的第一个层级所包括的目标卷基层,得到所述多个层级中的最后一个层级所包括的目标池化层输出的所述参照图像所对应的第三特征,并将所述样本图像输入所述目标卷基层,得到所述目标池化层输出的所述样本图像所对应的第四特征;
确定所述第三特征与所述第四特征之间的第二距离值,其中,所述第二距离值用于指示所述参照图像与所述样本图像之间的相似度;
根据所述第二距离值与目标距离值之间的第一差值对所述多个层级中所包括的卷积层的参数进行调整,使得所述第一差值最小化,其中,所述目标距离值用于指示预先标注的所述参照图像与所述样本图像之间的目标相似度;
将所述第一差值达到最小化的模型确定为所述目标神经网络模型。
5.根据权利要求4所述的方法,其特征在于,所述第三特征包括第一特征图集合,所述第四特征包括第二特征图集合,所述第一特征图集合中所包括的第一特征图与所述第二特征图集合中所包括的第二特征图一一对应,其中,确定所述第三特征与所述第四特征之间的所述第二距离值包括:
确定具有一一对应关系的所述第一特征图与所述第二特征图中每一组特征图上对应位置上的像素点所具有的特征值之间的第二差值;
将所述第二差值的平方和的算术平方根的值确定为所述第二距离值。
6.根据权利要求1所述的方法,其特征在于,所述多个层级的数量和/或所述多个卷积核的数量根据所述参照图像所包括的字符的字体确定。
7.一种图像的比对装置,其特征在于,包括:
第一获取模块,用于从目标区域上获取输入图像,其中,所述输入图像用于指示对照显示界面上显示的目标参照图像在所述目标区域上输入的信息;
第二获取模块,用于获取所述目标参照图像的第一特征以及所述输入图像的第二特征,其中,所述第一特征是通过目标神经网络模型从所述目标参照图像中提取的特征,所述第二特征是通过所述目标神经网络模型从所述输入图像中提取的特征,所述目标神经网络模型是使用具有对应关系的参照图像和样本图像分别对初始神经网络模型进行训练得到的模型,所述参照图像包括所述目标参照图像;
比对模块,用于对所述第一特征与所述第二特征进行比对,得到比对结果,其中,所述比对结果用于指示所述目标参照图像与所述输入图像之间的相似度;
所述第二获取模块包括:
第一获取单元,用于获取所述目标参照图像的第一字符特征,其中,所述第一字符特征用于指示所述目标参照图像所包括的目标字符的笔画特征,所述第一特征包括所述第一字符特征;
第二获取单元,用于获取所述输入图像的第二字符特征,其中,所述第二字符特征用于指示所述输入图像所包括的输入字符的笔画特征,所述第二特征包括所述第二字符特征,对照所述目标参照图像在所述目标区域上输入的信息包括所述输入字符;
所述第一获取单元用于:获取所述目标字符的第一笔画特征和第二笔画特征,其中,所述第一笔画特征为所述目标字符的关键特征,所述第二笔画特征为所述目标字符所具有的除所述第一笔画特征的非关键特征;将所述第一笔画特征与所述第二笔画特征的加权和确定为所述第一字符特征,其中,所述第一笔画特征所对应的第一权重值高于所述第二笔画特征所对应的第二权重值;
所述第二获取单元用于:获取所述输入字符的第三笔画特征和第四笔画特征,其中,所述第三笔画特征为所述输入字符的关键特征,所述第四笔画特征为所述输入字符所具有的除所述第三笔画特征之外的非关键特征;将所述第三笔画特征与所述第四笔画特征的加权和确定为所述第二字符特征,其中,所述第三笔画特征对应所述第一权重值,所述第二笔画特征对应所述第二权重值;
上述装置还包括:
训练模块,用于参数进行训练,得到目标神经网络模型,其中,所述初始神经网络模型包括串联的多个层级,所述多个层级中的每一个层级依次包括卷积层和池化层,所述多个层级中的每一个层级中的卷积层包括多个卷积核,用于抽取关键特征与非关键特征的卷积核对应的参数权重在所述初始神经网络模型的训练过程中动态调整,所述关键特征为字符所包括的关键笔画所具有的特征,所述非关键特征为字符所具有的除所述关键特征之外的特征;
显示单元,用于在所述显示界面上显示所述目标参照图像;
拍摄单元,用于对在所述目标区域中输入的信息进行拍摄,得到所述输入图像;
建立单元,用于建立所述目标参照图像与所述输入图像之间的对应关系;
所述训练模块,还用于:使用所述初始神经网络模型中的第一卷积神经网络模型用n个不同的特征视野对所述参照图像做卷积操作,得到第一个卷积层的结果,其中,所述第一个卷积层的结果包括被映射成的n个第一特征图;对所述n个第一特征图进行池化操作,得到第一池化层;对所述第一池化层的每一层用m个不同的特征视野做卷积操作,得到n×m层的第一目标特征图,其中,所述第一目标特征图为用计算机语言描述的所述参照图像的特征;使用所述初始神经网络模型中的第二卷积神经网络模型用n个不同的特征视野对所述样本图像做卷积操作,得到第二个卷积层的结果,其中,所述第二个卷积层的结果包括被映射成的n个第二特征图;对所述n个第二特征图进行池化操作,得到第二池化层;对所述第二池化层的每一层用m个不同的特征视野做卷积操作,得到n×m层的第二目标特征图,其中,所述第二目标特征图为用计算机语言描述的所述样本图像的特征,所述第一卷积神经网络模型与所述第二卷积神经网络模型为相同模型;
利用下述公式,对比所述第一目标特征图以及所述第二目标特征图的相似度:
其中,xi表示所述第一目标特征图里的每一个像素,yi表示手所述第二目标特征图里的每一个像素,d(x,y)就表示了两者之间的差异;
利用下述公式结合梯度下降算法,对所述初始神经网络模型的参数进行训练:
h(d(f(X),f(Y)))=score
其中,f表示卷积神经网络,d表示欧氏距离,h表示一个阈值区间的函数,score为将得到的d(f(X),f(Y))映射到所述一个阈值区间得到的对比度评分。
8.一种存储介质,其特征在于,所述存储介质中存储有计算机程序,其中,所述计算机程序被设置为运行时执行所述权利要求1至6任一项中所述的方法。
9.一种电子装置,包括存储器和处理器,其特征在于,所述存储器中存储有计算机程序,所述处理器被设置为通过所述计算机程序执行所述权利要求1至6任一项中所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910242869.XA CN110009027B (zh) | 2019-03-28 | 2019-03-28 | 图像的比对方法、装置、存储介质及电子装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910242869.XA CN110009027B (zh) | 2019-03-28 | 2019-03-28 | 图像的比对方法、装置、存储介质及电子装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN110009027A CN110009027A (zh) | 2019-07-12 |
CN110009027B true CN110009027B (zh) | 2022-07-29 |
Family
ID=67168581
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910242869.XA Active CN110009027B (zh) | 2019-03-28 | 2019-03-28 | 图像的比对方法、装置、存储介质及电子装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN110009027B (zh) |
Families Citing this family (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112287932B (zh) * | 2019-07-23 | 2024-05-10 | 上海高德威智能交通系统有限公司 | 一种确定图像质量的方法、装置、设备及存储介质 |
CN110717508B (zh) * | 2019-08-29 | 2023-04-18 | 苏州通富超威半导体有限公司 | 治具确定方法、确定设备、终端设备及存储介质 |
CN110796065A (zh) * | 2019-10-26 | 2020-02-14 | 深圳市锦上科技有限公司 | 基于图像识别的练字评分方法、系统以及计算机可读介质 |
CN111294512A (zh) * | 2020-02-10 | 2020-06-16 | 深圳市铂岩科技有限公司 | 图像处理方法、装置、存储介质及摄像装置 |
CN111305293A (zh) * | 2020-02-25 | 2020-06-19 | 深圳冰河导航科技有限公司 | 一种自动化平地机控制系统及其平地方法 |
CN113496115B (zh) * | 2020-04-08 | 2023-07-28 | 中国移动通信集团广东有限公司 | 文件内容比对方法和装置 |
CN111738330A (zh) * | 2020-06-19 | 2020-10-02 | 电子科技大学中山学院 | 一种手绘临摹作品的智能自动化评分方法 |
CN111931672A (zh) * | 2020-08-17 | 2020-11-13 | 珠海大横琴科技发展有限公司 | 字迹识别方法、装置、计算机设备及存储介质 |
CN114322440A (zh) * | 2020-09-30 | 2022-04-12 | 青岛海尔智能技术研发有限公司 | 用于食材储存提醒的方法、装置及储存装置 |
CN113095421B (zh) | 2021-04-20 | 2024-03-05 | 北京百度网讯科技有限公司 | 生成字体数据库的方法、神经网络模型的训练方法和装置 |
CN116883698B (zh) * | 2023-09-07 | 2023-12-26 | 腾讯科技(深圳)有限公司 | 一种图像对比方法及相关装置 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103106410A (zh) * | 2013-01-10 | 2013-05-15 | 北京万集科技股份有限公司 | 一种实现智能公交站牌的方法及系统 |
CN105247540A (zh) * | 2013-06-09 | 2016-01-13 | 苹果公司 | 管理实时手写识别 |
CN106600538A (zh) * | 2016-12-15 | 2017-04-26 | 武汉工程大学 | 一种基于区域深度卷积神经网络的人脸超分辨率算法 |
US9940551B1 (en) * | 2016-06-17 | 2018-04-10 | Google Llc | Image generation using neural networks |
CN108921822A (zh) * | 2018-06-04 | 2018-11-30 | 中国科学技术大学 | 基于卷积神经网络的图像目标计数方法 |
Family Cites Families (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103927532B (zh) * | 2014-04-08 | 2017-11-03 | 武汉汉德瑞庭科技有限公司 | 基于笔画特征的笔迹配准方法 |
CN104182732B (zh) * | 2014-08-12 | 2017-09-26 | 南京师范大学 | 基于特征矩阵进行相似度匹配的手写汉字笔画确认方法 |
CN104504412A (zh) * | 2014-11-28 | 2015-04-08 | 苏州大学 | 一种手写体笔划特征提取和识别方法及系统 |
CN106326907A (zh) * | 2015-06-23 | 2017-01-11 | 王东锐 | 手写体自动评价方法和系统 |
CN107609575B (zh) * | 2017-08-21 | 2020-09-01 | 北京华文众合科技有限公司 | 书法评价方法、书法评价装置和电子设备 |
CN108595602A (zh) * | 2018-04-20 | 2018-09-28 | 昆明理工大学 | 基于浅层模型与深度模型结合的问句文本分类方法 |
CN108595632B (zh) * | 2018-04-24 | 2022-05-24 | 福州大学 | 一种融合摘要与主体特征的混合神经网络文本分类方法 |
CN109145703A (zh) * | 2018-06-14 | 2019-01-04 | 北京凌云智链科技有限公司 | 智能鉴定方法、装置、设备和介质 |
CN109255369B (zh) * | 2018-08-09 | 2020-10-16 | 杭州易现先进科技有限公司 | 利用神经网络识别图片的方法及装置、介质和计算设备 |
CN109389150B (zh) * | 2018-08-28 | 2022-04-05 | 东软集团股份有限公司 | 图像一致性比对方法、装置、存储介质及电子设备 |
CN109034147B (zh) * | 2018-09-11 | 2020-08-11 | 上海唯识律简信息科技有限公司 | 基于深度学习和自然语言的光学字符识别优化方法和系统 |
CN109214471A (zh) * | 2018-10-10 | 2019-01-15 | 北京米蓝科技有限公司 | 评价练字字帖中的书写字的方法及系统 |
CN109472249A (zh) * | 2018-11-22 | 2019-03-15 | 京东方科技集团股份有限公司 | 一种确定书写体优劣等级的方法及装置 |
-
2019
- 2019-03-28 CN CN201910242869.XA patent/CN110009027B/zh active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103106410A (zh) * | 2013-01-10 | 2013-05-15 | 北京万集科技股份有限公司 | 一种实现智能公交站牌的方法及系统 |
CN105247540A (zh) * | 2013-06-09 | 2016-01-13 | 苹果公司 | 管理实时手写识别 |
US9940551B1 (en) * | 2016-06-17 | 2018-04-10 | Google Llc | Image generation using neural networks |
CN106600538A (zh) * | 2016-12-15 | 2017-04-26 | 武汉工程大学 | 一种基于区域深度卷积神经网络的人脸超分辨率算法 |
CN108921822A (zh) * | 2018-06-04 | 2018-11-30 | 中国科学技术大学 | 基于卷积神经网络的图像目标计数方法 |
Non-Patent Citations (2)
Title |
---|
DCFont: an end-to-end deep chinese font generation system;Yue Jiang 等,;《SA "17: SIGGRAPH Asia 2017 Technical Briefs》;20171127;第2017年卷;第1-4页 * |
维吾尔文字识别关键技术的研究;杨娜娜 等,;《中国优秀博硕士学位论文全文数据库(硕士)信息科技辑》;20180515;第2018年卷(第5期);第I138-406页 * |
Also Published As
Publication number | Publication date |
---|---|
CN110009027A (zh) | 2019-07-12 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110009027B (zh) | 图像的比对方法、装置、存储介质及电子装置 | |
KR102260553B1 (ko) | 메타 데이터 기반의 관련 문제 추천 방법 | |
CN110232311B (zh) | 手部图像的分割方法、装置及计算机设备 | |
CN114155543B (zh) | 神经网络训练方法、文档图像理解方法、装置和设备 | |
RU2661750C1 (ru) | Распознавание символов с использованием искусственного интеллекта | |
CN111507330B (zh) | 习题识别方法、装置、电子设备及存储介质 | |
CN111709409A (zh) | 人脸活体检测方法、装置、设备及介质 | |
CN108399386A (zh) | 饼图中的信息提取方法及装置 | |
CN109359539B (zh) | 注意力评估方法、装置、终端设备及计算机可读存储介质 | |
CN109359214A (zh) | 基于神经网络的视频描述生成方法、存储介质及终端设备 | |
CN108319888B (zh) | 视频类型的识别方法及装置、计算机终端 | |
CN109214471A (zh) | 评价练字字帖中的书写字的方法及系统 | |
US20240169518A1 (en) | Method and apparatus for identifying body constitution in traditional chinese medicine, electronic device, storage medium and program | |
CN114511452B (zh) | 融合多尺度空洞卷积和三元组注意力的遥感图像检索方法 | |
CN114049568B (zh) | 基于图像比对的标的物形变检测方法、装置、设备及介质 | |
WO2022126917A1 (zh) | 基于深度学习的人脸图像评估方法、装置、设备及介质 | |
CN111353325A (zh) | 关键点检测模型训练方法及装置 | |
CN113283432A (zh) | 图像识别、文字排序方法及设备 | |
CN114168768A (zh) | 图像检索方法及相关设备 | |
CN104252473A (zh) | 一种图像识别方法 | |
CN111027533B (zh) | 一种点读坐标的变换方法、系统、终端设备及存储介质 | |
CN113516697A (zh) | 图像配准的方法、装置、电子设备及计算机可读存储介质 | |
CN112991410A (zh) | 一种文本图像配准方法、电子设备及其存储介质 | |
CN112488126A (zh) | 特征图处理方法、装置、设备以及存储介质 | |
CN115906861B (zh) | 基于交互方面信息融合的语句情感分析方法以及装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |