CN115909306A - 一种确定打光方案的方法和装置 - Google Patents
一种确定打光方案的方法和装置 Download PDFInfo
- Publication number
- CN115909306A CN115909306A CN202211357774.0A CN202211357774A CN115909306A CN 115909306 A CN115909306 A CN 115909306A CN 202211357774 A CN202211357774 A CN 202211357774A CN 115909306 A CN115909306 A CN 115909306A
- Authority
- CN
- China
- Prior art keywords
- character
- lighting
- scheme
- detection target
- score
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000005498 polishing Methods 0.000 title claims abstract description 201
- 238000000034 method Methods 0.000 title claims abstract description 82
- 238000001514 detection method Methods 0.000 claims abstract description 256
- 238000013136 deep learning model Methods 0.000 claims abstract description 18
- 238000003860 storage Methods 0.000 claims description 6
- 238000003384 imaging method Methods 0.000 description 17
- 238000012015 optical character recognition Methods 0.000 description 13
- 238000012545 processing Methods 0.000 description 12
- 238000013461 design Methods 0.000 description 9
- 238000007781 pre-processing Methods 0.000 description 8
- 238000004422 calculation algorithm Methods 0.000 description 7
- 230000006870 function Effects 0.000 description 6
- 238000003062 neural network model Methods 0.000 description 6
- 239000013598 vector Substances 0.000 description 6
- 238000004891 communication Methods 0.000 description 5
- 230000007797 corrosion Effects 0.000 description 4
- 238000005260 corrosion Methods 0.000 description 4
- 238000010586 diagram Methods 0.000 description 4
- 238000011156 evaluation Methods 0.000 description 4
- 238000001914 filtration Methods 0.000 description 4
- 230000008878 coupling Effects 0.000 description 3
- 238000010168 coupling process Methods 0.000 description 3
- 238000005859 coupling reaction Methods 0.000 description 3
- 238000003064 k means clustering Methods 0.000 description 3
- 238000012935 Averaging Methods 0.000 description 2
- 238000009826 distribution Methods 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 238000012549 training Methods 0.000 description 2
- 238000013528 artificial neural network Methods 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 238000004590 computer program Methods 0.000 description 1
- 238000013135 deep learning Methods 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000001788 irregular Effects 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
Images
Classifications
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02B—CLIMATE CHANGE MITIGATION TECHNOLOGIES RELATED TO BUILDINGS, e.g. HOUSING, HOUSE APPLIANCES OR RELATED END-USER APPLICATIONS
- Y02B20/00—Energy efficient lighting technologies, e.g. halogen lamps or gas discharge lamps
- Y02B20/40—Control techniques providing energy savings, e.g. smart controller or presence detection
Landscapes
- Character Input (AREA)
Abstract
本申请提供了一种确定打光方案的方法和装置,涉及智能调光技术领域,该方法包括:按照N个备选打光方案,分别对第一检测目标进行打光并拍照,以获得分别对应于N个备选打光方案的N个打光图像,其中N个备选打光方案是按照预设的调节规则对光源的打光参数进行调节而获得的;通过深度学习模型,对N个打光图像进行字符识别,以获得N个备选打光方案的字符识别结果;根据N个备选打光方案的字符识别结果,从N个备选打光方案中确定针对第一检测目标的打光方案,N为正整数。该方法能够根据字符识别结果客观地选取合适的打光方案,所以减少了确定打光方案时来自人工主观判断的影响,提升了打光方案的质量,进而提升了产品图像的字符识别准确性。
Description
技术领域
本申请涉及智能调光技术领域,尤其涉及一种确定打光方案的方法和装置。
背景技术
随着科技的发展,工业产品的生产规模日益扩大。在工业产品出厂前,需要对产品进行相应的检测,获取产品表面的图像信息,其中具有代表性的有产品表面的字符信息。对于机器是否能够准确识别产品表面的字符信息,主要取决于在获取图像时,对产品采用的打光方案是否合适。如果打光方案合适,则识别的结果就更准确。但是,目前比较常用的打光方式是只通过人工手动调整打光参数,确定打光方案。因此,选取的打光方案受到操作人主观影响较大,会导致对产品表面字符的识别准确性较差。而且,不同操作人之间的评判标准也有所不同,无法确定一个相对客观的打光方案。此外,只通过人工的方式进行打光效率较低。
因此,在选取的打光方案时,如何减少来自人工主观判断的影响,提升打光方案的质量,进而提升产品图像的字符识别准确性,是一项亟待解决的问题。
发明内容
本申请提供一种确定打光方案的方法和装置,目的提升打光方案的质量,进而提升产品图像的字符识别准确性。
第一方面,提供了一种确定打光方案的方法,该方法包括:按照N个备选打光方案,分别对第一检测目标进行打光并拍照,以获得分别对应于N个备选打光方案的N个打光图像,其中N个备选打光方案是按照预设的调节规则对光源的打光参数进行调节而获得的,打光参数包括以下至少一种可调参数:发射光方向、波长、亮度、色温、以及光源的数量;通过深度学习模型,对N个打光图像进行字符识别,以获得N个备选打光方案的字符识别结果;根据N个备选打光方案的字符识别结果,从N个备选打光方案中确定针对第一检测目标的打光方案,其中,N为正整数。
应理解,由于用于对上述第一检测目标进行打光的光源可以由多个子光源构成,因此,光源的数量可以作为一种打光参数。
本申请的实施例通过自动调节光源的打光参数,确定可用的备选打光方案,分别对基于每种打光方案获得的打光图像进行字符识别,根据字符识别结果,客观地从多个备选打光方案中挑选出一个相对合适的打光方案,从而减少了确定打光方案时来自人工主观判断的影响,提升了打光方案的质量,进而提升了产品图像的字符识别准确性和效率。同时,备选打光方案的调节可以自动进行,而不需要人工根据经验调整,从而能够提高选择效率且能够提供更合适的打光方案。
具体地,当需要对某种类型的检测目标(例如晶圆、电路板、机械设备上的字符)进行字符检测时,不同类型的检测目标可能适用不同的打光方案。在传统方案中,需要人工根据经验设置有限几个备选打光方案,然后一一判断是否适用于当前的检测目标。但是,这种方法不仅效率较低,也不能保证一定筛选出最合适的打光方案。本申请的实施例将包括备选打光方案的获得、打光图像的采集、打光图像的字符识别和打光方案的挑选的整个过程全部自动化,这样能够大大减少打光方案的设置和选择过程中的人工主观判断影响,并且能够提供更合适的打光方案,而提升产品图像的字符识别准确性。
示例地,一种打光方案可以产生一个打光图像,而一个打光图像对应一个字符识别结果。
示例地,在通过深度学习模型,分别对上述N张打光图像进行字符识别,根据上述N张打光图像对应的字符识别结果,确定上述N个第一评分之前,对打光图像进行图像预处理,图像预处理包括:图像翻转、图像旋转、高斯滤波、腐蚀膨胀。
基于上述技术方案,能够有效提升打光图像字符识别的准确性,使打光图片更易于进行字符识别。
示例地,上述深度学习模型可以是光学字符识别(optical characterrecognition,OCR)模型。通过OCR模型对上述N张打光图像中的每一个打光图像进行字符识别。本申请实施例对OCR模型的具体类型不作限制。
应理解,上述最终确定的针对于第一检测目标的打光方案的字符识别结果为相比于其他备选打光方案的字符识别结果更清晰或者更准确。因此,最终输出的字符识别结果也是相对更准确的。
基于上述技术方案,能够自动根据多个备选打光方案的字符识别结果,对多个备选打光方案进行评判,确定一个针对第一检测目标的较为合适的打光方案,减少了确定打光方案时来自人工主观判断的影响,选取合适的打光方案为目标打光,提升了打光方案的质量,进而提升了产品图像的字符识别准确性。
结合第一方面,在第一方面的某些实现方式中,对于每个打光图像,确定打光图像中的每个字符的最小外接矩形位置、最小外接矩形面积以及置信度,并根据打光图像中的所述每个字符的所述最小外接矩形位置、所述最小外接矩形面积以及所述置信度,确定打光图像的评分;确定具有最高评分的打光图像对应的备选打光方案为针对上述第一检测目标的打光方案。
示例地,上述每个字符的置信度可以为深度网络推理置信度。
示例地,在上述评分为上述第一评分时,根据最高的第一评分,即可确定,最高第一评分对应的备选打光方案相较于其他打光方案是更为合适的,其对应的字符识别结果也是更为准确的,因此可以确定该备选打光方案为针对第一检测目标的打光方案。
基于上述技术方案,通过打光图像中的每个字符的最小外接矩形位置、最小外接矩形面积以及置信度确定第一评分,并通过第一评分对当前的打光方案进行客观评价,由于第一评分的标准客观统一,所以减少了因人工评判的主观因素造成的打光方案质量不统一的情况,有助于提升打光方案的质量,进而有助于提升对对产品打光图像的字符识别准确性。
结合第一方面,在第一方面的某些实现方式中,根据打光图像中每个字符的最小外接矩形位置,通过聚类模型,确定打光图像中的J个字符区域块,每个字符区域块包括I个字符,其中J和I为正整数;根据每个字符区域块中的每个字符的置信度,确定打光图像的每个字符区域块的字符置信度平均值;根据每个字符区域块中的每个字符的最小外接矩形面积,确定打光图像的每个字符区域块的字符外接矩形面积平均值;根据打光图像的字符置信度平均值和字符外接矩形面积平均值,确定打光图像的第一字符区域块;根据打光图像的第一字符区域块对应的字符置信度平均值和字符外接矩形面积平均值,确定第一评分。
示例地,上述聚类模型主要用来将较大的字符区域划分为J个局部,每个局部内的I个字符都是相互邻接或者形式类似的字符,通过对每个局部进行字符识别,能够有效提高字符识别的准确度。应用于本申请实施例的聚类模型可以包括:K-means聚类算法,系统聚类算法等。
基于上述技术方案,可以通过上述方法客观统一地确定N个备选打光方案对应的第一评分,减少了确定打光方案时来自人工主观判断的影响,选取合适的打光方案为目标打光,提升了打光方案的质量,进而提升了产品图像的字符识别准确性。
结合第一方面,在第一方面的某些实现方式中,根据打光图像的字符置信度平均值和字符外接矩形面积平均值,确定J个字符区域块中的每个字符区域块的字符置信度的标准差和字符外接矩形面积的标准差;确定字符置信度的标准差与字符外接矩形面积的标准差之和最小的字符区域块为第一字符区域块。
示例地,可以根据如下公式(1)至(4)确定打光图像的第一字符区域块:
在std_avgpj与std_avgaj之和最小时,确定第j个字符区域块为第一字符区域块;
其中表示第j个字符区域块中第i个字符的置信度,avgpj表示第j个字符区域块的字符置信度平均值,表示第j个字符区域块中第i个字符的最小外接矩形面积,avgpj表示第j个字符区域块的字符外接矩形面积平均值,std_avgpj表示第j个字符区域块的字符置信度的标准差,std_avgaj表示第j个字符区域块中的字符外接矩形面积的标准差,i为小于等于I的正整数,j为小于等于J的正整数。
结合第一方面,在第一方面的某些实现方式中,第一评分包括第一部分与第二部分之和,其中,第一部分与打光图像的第一字符区域块的字符置信度平均值之间呈正相关关系,第二部分与打光图像的第一字符区域块的字符外接矩形面积平均值的标准差之间呈负相关关系。
基于上述技术方案,可以通过上述方法客观统一地确定N个备选打光方案对应的第一评分,减少了确定打光方案时来自人工主观判断的影响,选取合适的打光方案为目标打光,提升了打光方案的质量,进而提升了产品图像的字符识别准确性。
结合第一方面,在第一方面的某些实现方式中,根据第一真实字符串的长度和备选打光方案的字符识别结果的长度,确定第二评分,该第一真实字符串为已知的、上述第一检测目标表面的真实字符信息;根据该第一真实字符串和备选打光方案的字符识别结果之间的相似度,确定第三评分;根据第一评分、第二评分以及第三评分,确定上述评分。
示例地,上述第一真实字符串可以通过外部输入而获得。
基于上述技术方案,在已知第一真实字符串时,通过引入第二评分以及第三评分,与第一评分共同确定上述评分,因此,客观合理地确定针对于第一检测目标的打光方案,提升了打光方案的质量,进而使最终输出的字符识别结果更准确,提升了对产品打光图像的字符识别准确性。
结合第一方面,在第一方面的某些实现方式中,通过对比打光图像的第一真实字符串长度和备选打光方案的字符识别结果的长度之间的差值,确定第二评分。
示例地,可以根据如下公式(5)或(6)确定第二评分:
其中score2表示第二评分,ltrue表示打光图像的第一真实字符串长度,locr表示备选打光方案的字符识别结果的长度。
示例地,对于公式(6),当第一真实字符串的长度与字符识别结果的长度相同时,则第二评分为1,当第一真实字符串的长度与字符识别结果的长度不同时,则第二评分为0。
示例地,对于公式(7),若第一真实字符串的长度小于或等于字符识别结果对应的字符长度,则第二评分为第一真实字符串的长度与字符识别结果对应的字符长度的比值。若第一真实字符串的长度大于或字符识别结果的长度,则第二评分为字符识别结果对应的字符长度与第一真实字符串的长度的比值。若第一真实字符串的长度与字符识别结果对应的字符长度相差越小,则第二评分越高。若第一真实字符串的长度与字符识别结果对应的字符长度相差越大,则第二评分越低。
结合第一方面,在第一方面的某些实现方式中,根据第一真实字符串与备选打光方案的字符识别结果之间的编辑距离,确定第三评分;或者,根据第一真实字符串与备选打光方案的字符识别结果之间的余弦相似性,确定第三评分;或者,根据第一真实字符串与备选打光方案的字符识别结果之间的欧氏距离,确定第三评分。
示例地,编辑距离是指字符识别结果转换为第一真实字符串的最少的编辑操作次数,该编辑操作可以包括任意位置插入一个字符、任意位置删除一个字符与任意位置修改一个字符。第一真实字符串和字符识别结果之间的相似度越高,编辑距离越小,第三评分越高。
示例地,第一真实字符串和字符识别结果之间的相似度越高,第一真实字符串和字符识别结果之间的余弦相似性越高,第三评分越高。
示例地,第一真实字符串和字符识别结果之间的相似度越高,第一真实字符串和字符识别结果之间的欧氏距离越小,第三评分越高。
结合第一方面,在第一方面的某些实现方式中,根据上述第一评分、上述第二评分以及上述第三评分的加权和,确定上述评分。
基于上述技术方案,在已知第一真实字符串时,通过引入第二评分以及第三评分,与第一评分共同确定上述评分,客观合理地确定针对于第一检测目标的打光方案,提升了打光方案的质量,进而使最终输出的字符识别结果更准确,提升了对产品打光图像的字符识别准确性。
结合第一方面,在第一方面的某些实现方式中,按照已确定的针对第一检测目标的打光方案,对第二检测目标进行打光并拍照,获得第二检测目标的打光图像;通过深度学习模型,对第二检测目标的打光图像进行字符识别,以获得第一检测目标的打光方案应用于第二检测目标时的字符识别结果。
基于上述技术方案,由于确定的针对于第一检测目标的打光方案是一个较为通用的方案,所以当首次对第一检测目标进行打光后,该针对于第一检测目标的打光方案还可以应用于对其他检测目标的打光操作,提升了对不同产品的表面进行字符识别的效率。
结合第一方面,在第一方面的某些实现方式中,根据第一检测目标的打光方案应用于第二检测目标时的字符识别结果,确定第一检测目标的打光方案应用于第二检测目标时的上述第一评分;当该第一检测目标的打光方案应用于第二检测目标时的上述第一评分高于第一预设阈值时,沿用第一检测目标的打光方案对第二检测目标进行打光,其中第一预设阈值为正数。
示例地,当第一检测目标的打光方案应用于第二检测目标时的第一评分不高于第一预设阈值时,则需要重新确定第二检测目标的打光方案,执行如上述第一方面的方法设计中任意一种可能的实现方式中的方法,以选取最高第一评分对应的备选打光方案为针对于第二检测目标的打光方案。
基于上述技术方案,即便第一检测目标和其他检测目标之间的差异很大,还可以自动重新确定打光方案,减少人工参与后续的调光操作,进一步提升了打光方案的质量,提升了产品图像的字符识别准确性和效率。
结合第一方面,在第一方面的某些实现方式中,根据第二真实字符串和上述第一检测目标的打光方案应用于上述第二检测目标时的字符识别结果,确定上述第一检测目标的打光方案应用于所述第二检测目标时的上述评分,该第二真实字符串为已知的、上述第二检测目标表面的真实字符信息;当第一检测目标的打光方案应用于第二检测目标时的上述评分高于第二预设阈值时,沿用第一检测目标的打光方案对第二检测目标进行打光,其中第二预设阈值为正数。
示例地,上述第二真实字符串可以通过外部输入而获得。
示例地,当第一检测目标的打光方案应用于第二检测目标时的评分不高于第二预设阈值时,则需要重新确定第二检测目标的打光方案,执行如上述第一方面的方法设计中可能实现的方法,以选取最高评分对应的备选打光方案为针对于第二检测目标的打光方案。
基于上述技术方案,即便第一检测目标和其他检测目标之间的差异很大,还可以自动重新确定打光方案,减少人工参与后续的调光操作,进一步提升了打光方案的质量,提升了产品图像的字符识别准确性和效率。
第二方面,提供了一种确定打光方案的装置,该装置包括:确定单元,用于按照预设的调节规则对光源的打光参数进行调节,确定N个备选打光方案;拍摄单元,用于按照N个备选打光方案,分别对第一检测目标进行打光并拍照,以获得分别对应于N个备选打光方案的N个打光图像;处理单元,用于通过深度学习模型,对N个打光图像进行字符识别,以获得N个备选打光方案的字符识别结果;上述确定单元还用于,根据N个备选打光方案的字符识别结果,从N个备选打光方案中确定针对第一检测目标的打光方案,其中,N为正整数。
应理解,由于用于对上述第一检测目标进行打光的光源可以由多个子光源构成,因此,光源的数量可以作为一种打光参数。
示例地,一种打光方案可以与一个打光图像相对应,而一个打光图像对应一个字符识别结果。
示例地,上述处理单元还用于对打光图像进行图像预处理,图像预处理包括:图像翻转、图像旋转、高斯滤波、腐蚀膨胀。
基于上述技术方案,能够有效提升打光图像字符识别的准确性,使打光图片更易于进行字符识别。
示例地,上述深度学习模型可以是光学字符识别(optical characterrecognition,OCR)模型。通过OCR模型对上述N张打光图像中的每一个打光图像进行字符识别。
应理解,上述最终确定的针对于第一检测目标的打光方案的字符识别结果为相比于其他备选打光方案的字符识别结果更清晰更准确。因此,最终输出的字符识别结果也是相对准确的。
基于上述技术方案,能够自动根据多个备选打光方案的字符识别结果,对多个备选打光方案进行评判,确定一个针对第一检测目标的较为合适的打光方案,减少了确定打光方案时来自人工主观判断的影响,选取合适的打光方案为目标打光,提升了打光方案的质量,进而提升了产品图像的字符识别准确性。
结合第二方面,在第二方面的某些实现方式中,对于每个打光图像,上述确定单元具体用于确定打光图像中的每个字符的最小外接矩形位置、最小外接矩形面积以及置信度,并根据打光图像中的所述每个字符的所述最小外接矩形位置、所述最小外接矩形面积以及所述置信度,确定打光图像的评分;确定具有最高评分的打光图像对应的备选打光方案为针对上述第一检测目标的打光方案。
示例地,上述每个字符的置信度可以为深度网络推理置信度。
示例地,在上述评分为上述第一评分时,根据最高的第一评分,即可确定,最高第一评分对应的备选打光方案相较于其他打光方案是更为合适的,其对应的字符识别结果也是更为准确的,因此可以确定该备选打光方案为针对第一检测目标的打光方案。
基于上述技术方案,通过打光图像中的每个字符的最小外接矩形位置、最小外接矩形面积以及置信度确定第一评分,并通过第一评分对当前的打光方案进行客观评价,由于第一评分的标准客观统一,所以减少了因人工评判的主观因素造成的打光方案质量不统一的情况,有助于提升打光方案的质量,进而有助于提升对产品打光图像的字符识别准确性。
结合第二方面,在第二方面的某些实现方式中,上述确定单元具体用于根据打光图像中每个字符的最小外接矩形位置,通过聚类模型,确定打光图像中的J个字符区域块,每个字符区域块包括I个字符,其中J和I为正整数;根据每个字符区域块中的每个字符的置信度,确定打光图像的每个字符区域块的字符置信度平均值;根据每个字符区域块中的每个字符的最小外接矩形面积,确定打光图像的每个字符区域块的字符外接矩形面积平均值;根据打光图像的字符置信度平均值和字符外接矩形面积平均值,确定打光图像的第一字符区域块;根据打光图像的第一字符区域块对应的字符置信度平均值和字符外接矩形面积平均值,确定第一评分。
示例地,上述聚类模型主要用来将较大的字符区域划分为J个局部,每个局部内的I个字符都是相互邻接或者形式类似的字符,通过对每个局部进行字符识别,能够有效提高字符识别的准确度。应用于本申请实施例的聚类模型可以包括:K-means聚类算法,系统聚类算法等。
基于上述技术方案,可以通过上述方法客观统一地确定N个备选打光方案对应的第一评分,减少了确定打光方案时来自人工主观判断的影响,选取合适的打光方案为目标打光,提升了打光方案的质量,进而提升了产品图像的字符识别准确性。
结合第二方面,在第二方面的某些实现方式中,上述确定单元具体用于根据打光图像的字符置信度平均值和字符外接矩形面积平均值,确定J个字符区域块中的每个字符区域块的字符置信度的标准差和字符外接矩形面积的标准差;确定字符置信度的标准差与字符外接矩形面积的标准差之和最小的字符区域块为第一字符区域块。
示例地,上述确定单元可以根据如下公式(1)至(4)确定打光图像的第一字符区域块:
在std_avgpj与std_avgaj之和最小时,确定第j个字符区域块为第一字符区域块;
其中表示第j个字符区域块中第i个字符的置信度,avgpj表示第j个字符区域块的字符置信度平均值,表示第j个字符区域块中第i个字符的最小外接矩形面积,avgpj表示第j个字符区域块的字符外接矩形面积平均值,std_avgpj表示第j个字符区域块的字符置信度的标准差,std_avgaj表示第j个字符区域块中的字符外接矩形面积的标准差,i为小于等于I的正整数,j为小于等于J的正整数。
结合第二方面,在第二方面的某些实现方式中,上述第一评分包括第一部分与第二部分之和,其中,第一部分与打光图像的第一字符区域块的字符置信度平均值之间呈正相关关系,第二部分与打光图像的第一字符区域块的字符外接矩形面积平均值的标准差之间呈负相关关系。
基于上述技术方案,可以通过上述方法客观统一地确定N个备选打光方案对应的第一评分,减少了确定打光方案时来自人工主观判断的影响,选取合适的打光方案为目标打光,提升了打光方案的质量,进而提升了产品图像的字符识别准确性。
结合第二方面,在第二方面的某些实现方式中,上述确定单元还用于根据第一真实字符串的长度和备选打光方案的字符识别结果的长度,确定第二评分,该第一真实字符串为已知的、上述第一检测目标表面的真实字符信息;根据该第一真实字符串和备选打光方案的字符识别结果之间的相似度,确定第三评分;根据第一评分、第二评分以及第三评分,确定上述评分。
基于上述技术方案,在已知第一真实字符串时,通过引入第二评分以及第三评分,与第一评分共同确定上述评分,客观合理地确定针对于第一检测目标的打光方案,提升了打光方案的质量,进而使最终输出的字符识别结果更准确,提升了对产品打光图像的字符识别准确性。
结合第二方面,在第二方面的某些实现方式中,上述确定单元具体用于通过对比打光图像的第一真实字符串长度和备选打光方案的字符识别结果的长度之间的差值,确定第二评分。
示例地,上述确定单元可以根据如下公式(5)或(6)确定第二评分:
其中score2表示第二评分,ltrue表示打光图像的第一真实字符串长度,locr表示备选打光方案的字符识别结果的长度。
示例地,对于公式(6),当第一真实字符串的长度与字符识别结果的长度相同时,则第二评分为1,当第一真实字符串的长度与字符识别结果的长度不同时,则第二评分为0。
示例地,对于公式(7),若第一真实字符串的长度小于或等于字符识别结果对应的字符长度,则第二评分为第一真实字符串的长度与字符识别结果对应的字符长度的比值。若第一真实字符串的长度大于或字符识别结果的长度,则第二评分为字符识别结果对应的字符长度与第一真实字符串的长度的比值。若第一真实字符串的长度与字符识别结果对应的字符长度相差越小,则第二评分越高。若第一真实字符串的长度与字符识别结果对应的字符长度相差越大,则第二评分越低。
结合第二方面,在第二方面的某些实现方式中,上述确定单元具体用于根据第一真实字符串与备选打光方案的字符识别结果之间的编辑距离,确定第三评分;或者,根据第一真实字符串与备选打光方案的字符识别结果之间的余弦相似性,确定第三评分;或者,根据第一真实字符串与备选打光方案的字符识别结果之间的欧氏距离,确定第三评分。
示例地,编辑距离是指字符识别结果转换为第一真实字符串的最少的编辑操作次数,该编辑操作可以包括任意位置插入一个字符、任意位置删除一个字符与任意位置修改一个字符。第一真实字符串和字符识别结果之间的相似度越高,编辑距离越小,第三评分越高。
示例地,第一真实字符串和字符识别结果之间的相似度越高,第一真实字符串和字符识别结果之间的余弦相似性越高,第三评分越高。
示例地,第一真实字符串和字符识别结果之间的相似度越高,第一真实字符串和字符识别结果之间的欧氏距离越小,第三评分越高。
结合第二方面,在第二方面的某些实现方式中,上述评分是上述第一评分、上述第二评分以及上述第三评分的加权和。
基于上述技术方案,在已知第一真实字符串时,通过引入第二评分以及第三评分,与第一评分共同确定上述评分,客观合理地确定针对于第一检测目标的打光方案,提升了打光方案的质量,进而使最终输出的字符识别结果更准确,提升了对产品打光图像的字符识别准确性。
结合第二方面,在第二方面的某些实现方式中,上述拍摄单元还用于按照已确定的针对第一检测目标的打光方案,对第二检测目标进行打光并拍照,获得第二检测目标的打光图像;上述处理单元还用于通过深度学习模型,对第二检测目标的打光图像进行字符识别,以获得第一检测目标的打光方案应用于第二检测目标时的字符识别结果。
基于上述技术方案,由于确定的针对于第一检测目标的打光方案是一个较为通用的方案,所以当首次对第一检测目标进行打光后,该针对于第一检测目标的打光方案还可以应用于对其他检测目标的打光操作,提升了对不同产品的表面进行字符识别的效率。
结合第二方面,在第二方面的某些实现方式中,上述确定单元还用于根据第一检测目标的打光方案应用于第二检测目标时的字符识别结果,确定第一检测目标的打光方案应用于第二检测目标时的第一评分;当该第一检测目标的打光方案应用于第二检测目标时的第一评分高于第一预设阈值时,沿用第一检测目标的打光方案对第二检测目标进行打光,其中第一预设阈值为正数。
示例地,当第一检测目标的打光方案应用于第二检测目标时的第一评分不高于第一预设阈值时,则需要重新确定第二检测目标的打光方案,执行如上述第二方面的装置设计中任意一种可能的实现方式中的装置所实现的方法,以选取最高第一评分对应的备选打光方案为针对于第二检测目标的打光方案。
基于上述技术方案,即便第一检测目标和其他检测目标之间的差异很大,还可以自动重新确定打光方案,减少人工参与后续的调光操作,进一步提升了打光方案的质量,提升了产品图像的字符识别准确性和效率。
结合第二方面,在第二方面的某些实现方式中,上述确定单元还用于根据第二真实字符串和上述第一检测目标的打光方案应用于上述第二检测目标时的字符识别结果,确定上述第一检测目标的打光方案应用于所述第二检测目标时的评分,该第二真实字符串为已知的、上述第二检测目标表面的真实字符信息;当第一检测目标的打光方案应用于第二检测目标时的评分高于第二预设阈值时,沿用第一检测目标的打光方案对第二检测目标进行打光,其中第二预设阈值为正数。
示例地,当第一检测目标的打光方案应用于第二检测目标时的评分不高于第二预设阈值时,则需要重新确定第二检测目标的打光方案,执行如上述第二方面的装置设计中任意一种可能的实现方式中的装置所实现的方法,以选取最高评分对应的备选打光方案为针对于第二检测目标的打光方案。
基于上述技术方案,即便第一检测目标和其他检测目标之间的差异很大,还可以自动重新确定打光方案,减少人工参与后续的调光操作,进一步提升了打光方案的质量,提升了产品图像的字符识别准确性和效率。
第三方面,提供了一种确定打光方案的装置,包括存储器,用于存储计算机指令;还包括处理器,用于执行存储器中存储的计算机指令,以使得装置执行上述第一方面的方法设计中任意一种可能的实现方式中的方法。
第四方面,提供了一种计算机存储介质,其特征在于,计算机存储介质中存储有计算机指令,该指令在计算机上执行时,使得计算机执行上述第一方面的方法设计中任意一种可能的实现方式中的方法。
第五方面,提供了一种芯片,包括处理器,该处理器用于执行上述第一方面的方法设计中任意一种可能的实现方式中的方法。
示例地,该芯片可以是基带芯片。
第六方面,提供了一种计算机程序产品,该计算机程序代码或指令在计算机上执行时,使得计算机执行上述第一方面的方法设计中任意一种可能的实现方式中的方法。
附图说明
图1是适用于本申请实施例的字符识别系统100的示意图。
图2是本申请实施例提供的一种确定打光方案的方法流程示意图。
图3是本申请实施例提供的又一种确定打光方案的方法流程示意图。
图4是本申请实施例提供的一种确定第一评分的方法流程示意图。
图5是本申请实施例提供的又一种确定打光方案的方法流程示意图。
图6是本申请实施例提供的一种确定打光方案的装置600的示意性框图。
具体实施方式
下面将结合附图,对本申请中的技术方案进行描述。
图1是适用于本申请实施例的字符识别系统100的示意图。
适用于本申请实施例的字符识别系统包括:光源控制系统、成像系统以及计算设备。上述计算设备可以与上述光源控制系统和上述成像系统连接。
其中,光源控制系统,包括一个或者多个光源,每个光源具有以下至少一个可调的打光参数:发射光方向、波长、亮度、色温等。该光源控制系统用于按照预设的调节规则对每个光源的打光参数进行调节,以获得N个备选打光方案,其中,N为正整数。本申请实施例中预设的调节规则可以是通过步进调节参数的方式,获得不同的打光参数组合,从而获得不同的备选打光方案。但是,本申请中预设的调节规则不限于步进方式,也可以采用其他方式,例如固定值设置方式(即采用固定的参数组合)、函数运算方式(即根据特定的函数关系确定打光参数组合)、区间设置方式(即,对于不同的区间可以采用不同的设置,如第一区间内采用固定值设置方式,第二区间内采用步进方式等)、参照推理方式(即,在参照已知的打光方案的基础上推理调节打光参数,从而得到新到的备选打光方案),只需要能够实现备选打光方案的自动调节即可。
一个实施例中,以光源控制系统包括一个光源,打光参数包括发射光方向和亮度,发射光方向使用平视角度和俯仰角度表示。其中,平视角度的可调范围为[-30,30],俯仰角度的可调范围为[-30,30],单位为度,单次可调角度值为30度(即调节步长为30度),负数角度为发射光向左偏,正数角度为发射光向右偏。亮度则直接使用亮度数值表示,亮度的可调范围为[6000,10000],单位为尼特,单次可调亮度为2000尼特。因此,本申请提出的预设的调节规则可以是依次调节上述打光参数,并且对每种打光参数及其调节的不同数值进行组合。因此,基于上述示例,最多能够获得以下27种备选打光方案:
发射光方向:(-30,-30),亮度:6000;发射光方向:(0,-30),亮度:6000;发射光方向:(30,-30),亮度:6000;发射光方向:(-30,0),亮度:6000;发射光方向:(0,0),亮度:6000;发射光方向:(30,0),亮度:6000;发射光方向:(-30,30),亮度:6000;发射光方向:(0,30),亮度:6000;发射光方向:(30,30),亮度:6000;
发射光方向:(-30,-30),亮度:8000;发射光方向:(0,-30),亮度:8000;发射光方向:(30,-30),亮度:8000;发射光方向:(-30,0),亮度:8000;发射光方向:(0,0),亮度:8000;发射光方向:(30,0),亮度:8000;发射光方向:(-30,30),亮度:8000;发射光方向:(0,30),亮度:8000;发射光方向:(30,30),亮度:8000;
发射光方向:(-30,-30),亮度:10000;发射光方向:(0,-30),亮度:10000;发射光方向:(30,-30),亮度:10000;发射光方向:(-30,0),亮度:10000;发射光方向:(0,0),亮度:10000;发射光方向:(30,0),亮度:10000;发射光方向:(-30,30),亮度:10000;发射光方向:(0,30),亮度:10000;发射光方向:(30,30),亮度:10000。
当有多个光源时,与上述确定备选打光方案的方式同理。
在一些可能的实施例中,上述光源控制系统包括两种模式:推荐模式和全方案模式。其中,推荐模式下确定的备选打光方案是存储在光源控制系统中使用频率较多的备选打光方案。例如,上述实施例中的如下备选打光方案:
发射光方向:(-30,0),亮度:8000;发射光方向:(0,0),亮度:8000;发射光方向:(0,30),亮度:8000;
发射光方向:(-30,0),亮度:8000;发射光方向:(0,0),亮度:8000;发射光方向:(0,30),亮度:8000;
发射光方向:(-30,0),亮度:10000;发射光方向:(0,0),亮度:10000;发射光方向:(0,30),亮度:10000;
而全方案模式则是将每个光源中的每一种打光参数依次进行调节并互相组合,确定当前光源控制系统能够组合出的所有备选打光方案,例如,上述实施例中的所有备选打光方案。
可见,全方案模式虽然需要从众多备选打光方案中确定一个选用的打光方案,确定打光方案的耗时要比推荐模式长,但是最终确定的打光方案准确性最高。推荐模式虽然确定打光方案的速度较快,但是进行对比的备选打光方案有限,最终确定的打光方案质量可能不如全方案模式下的打光方案高。因此,全方案模式可以适用于光源控制系统首次确定打光方案的情况,而推荐模式可以适用于光源控制系统非首次确定打光方案的情况。
成像系统,包括一个或多个相机,在光源控制系统对打光目标进行打光时,相机同步对目标进行拍摄,获得N张打光图像。
在一些可能的实施例中,成像系统拍摄的频率需要等于光源控制系统更换打光方案的频率,或者大于光源控制系统更换打光方案的频率,以保证至少每一种打光方案至少有一个打光图像与之对应。
为了降低系统图像处理的负荷,成像系统会记录光源控制系统更换打光方案时间戳之间的间隔,并且与光源控制系统同时运行,保证时序同步。当成像系统在两个时间戳之间拍摄了多张打光图像时,系统将保留这些打光图像中亮度较高的一张。
在一些可能的实施例中,上述成像系统包括多个相机,分别按照不同拍摄角度,或者不同焦距等对被打光目标进行拍摄。其中,同一时间戳中不同相机对同一打光方案下的目标共同拍摄了多张打光图像。成像系统可以先对每个相机拍摄的图像进行上述选片处理,保留每个相机该时间戳中亮度较高的打光图像,而选出的这些打光图像可以拼接为一个打光图像。因此,一个打光方案对应一个打光图像,无论这张打光图像包括一个画面,还是包括多个画面拼接。
应理解,当成像系统只包括一个相机时,一个打光图像只包括一个画面。当成像系统包括多个相机时,一个打光图像包括拼接而成的多个画面。
计算设备,包括处理器、存储器、通信接口、发送器、接收器。具备计算能力,并且可以用于向光源控制系统与成像系统发送指示信息,指示光源控制系统生成打光方案并且对目标进行打光,以及指示成像系统进行拍摄等。该计算设备还可以用于接收来自于成像系统的N张打光图像。
在一些可能的实施例中,上述计算设备可以是一种服务器。该服务器可以是本地服务器,也可以是云端服务器,本申请实施例对此不作限定。
在一些可能的实施例中,上述处理器可以是中央处理器(central processingunit,CPU)或图形处理器(graphics processing unit,GPU)等。上述处理器可以用于对获得的打光图像进行预处理;还可以用于根据深度学习模型对打光图像进行字符识别;还可以用于对N张打光图像对应的N个备选打光方案进行评分,挑选出最终选用的打光方案。应理解,对最终选用的打光方案对应的打光图像进行字符识别,其输出的字符识别结果也是相对准确的。
在一些可能的实施例中,上述存储器可以是易失性存储器(random accessmemory,RAM)或非易失性存储器(non-volatile memory,NVM)等。上述存储器可以用于存储处理器在计算过程所需的数据;还可以用于存储处理器的字符识别结果等;还可以用于保存打光方案、打光图像及其评分等。
在一些可能的实施例中,通信接口用于与其他设备进行通信,例如,与显示器、键盘等用户设备。上述的处理器、存储器和通信接口通过总线进行通信。其中,总线可以包括:数据总线、电源总线、控制总线和状态信号总线等。
在一些可能的实施例中,接收器与发送器可以用于接收来自其他设备或系统的信息或数据等。其中,接收器可以用于接收来自成像系统的打光图像,或者可以用于接收来自控制成像系统的设备的打光图像;发送器可以用于向光源控制系统发送打光方案或指示信息,或者可以用于向控制光源控制系统的设备发送打光方案或指示信息。
基于上述提供的系统,本申请实施例提出了一种确定打光方案的方法。
图2是本申请实施例提供的一种确定打光方案的方法流程示意图。
S210:按照N个备选打光方案,分别对第一检测目标进行打光并拍照,以获得分别对应于N个备选打光方案的N个打光图像。
其中,N个备选打光方案是按照预设的调节规则对光源的打光参数进行调节而获得的,该预设的调节规则可以参考前述实施例中的对应说明。打光参数包括以下至少一种可调参数:发射光方向、波长、亮度、色温、以及光源的数量。
应理解,由于用于对目标进行打光的光源可以由多个子光源构成。因此,光源的数量可以作为打光参数。
所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,获得N种备选打光方案以及获得N个打光图像的具体工作过程可以参考前述实施例中的对应过程,在此不再赘述。
S220:通过深度学习模型,对N个打光图像进行字符识别,以获得N个备选打光方案的字符识别结果。
在一些可能的实施例中,上述深度学习模型可以是OCR模型。通过OCR模型对上述N个打光图像中的每一个打光图像进行字符识别,并获得N个备选打光方案的字符识别结果。
S230:根据N个备选打光方案的字符识别结果,从N个备选打光方案中确定针对第一检测目标的打光方案。
应理解,上述最终确定的针对于第一检测目标的打光方案的字符识别结果为相比于其他备选打光方案的字符识别结果更清晰更准确。因此,最终输出的字符识别结果也是相对准确的。
基于上述技术方案,通过自动调节光源的打光参数,确定可用的备选打光方案,分别对基于每种打光方案获得的打光图像进行字符识别,根据字符识别结果,能够客观地从多个备选打光方案中挑选出一个相对合适的打光方案,从而减少了确定打光方案时来自人工主观判断的影响,提升了打光方案的质量,进而提升了产品图像的字符识别准确性和效率。同时,备选打光方案的调节可以自动进行,而不需要人工根据经验调整,从而能够提高选择效率且能够提供更合适的打光方案。
具体地,当需要对某种类型的检测目标(例如晶圆、电路板、机械设备上的字符)进行字符检测时,不同类型的检测目标可能适用不同的打光方案。在传统方案中,需要人工根据经验设置有限几个备选打光方案,然后一一判断是否适用于当前的检测目标。但是,这种方法不仅效率较低,也不能保证一定筛选出最合适的打光方案。本申请的实施例将包括备选打光方案的获得、打光图像的采集、打光图像的字符识别和打光方案的挑选的整个过程全部自动化,这样能够大大减少打光方案的设置和选择过程中的人工主观判断影响,并且能够提供更合适的打光方案,而提升产品图像的字符识别准确性。
在一些可能的实施例中,在通过深度学习模型,分别对上述N张打光图像进行字符识别之前,还可以对获得的打光图像进行图像预处理,该图像预处理包括:图像翻转、图像旋转、高斯滤波、腐蚀膨胀等处理。
基于上述技术方案,能够有效提升打光图像字符识别的准确性,使打光图片更易于进行字符识别。
另外,在打光图像足够清晰或易于后续对字符进行识别的情况下,可以直接对打光图像进行字符识别,而无需对打光图像进行上述图像预处理操作。
在一些可能的实施例中,基于上述S230,本申请实施例进一步提供了又一种确定打光方案的方法。
图3是本申请实施例提供的又一种确定打光方案的方法流程示意图。
S310:对于每个打光图像,确定打光图像中的每个字符的最小外接矩形位置、最小外接矩形面积以及置信度,并根据打光图像中的所述每个字符的所述最小外接矩形位置、所述最小外接矩形面积以及所述置信度,确定打光图像的评分。
在一些可能的实施例中,可以通过上述OCR模型确定打光图像中的每个字符的最小外接矩形位置、最小外接矩形面积以及置信度,并且根据打光图像中的每个字符的最小外接矩形位置、最小外接矩形面积以及置信度,确定每一个打光图像对应的第一评分。其中,第一评分可以是上述打光图像的评分,上述每个字符的置信度可以为深度网络推理置信度。
应理解,除OCR模型之外,上述深度学习模型还可以是其他能够识别字符最小外接矩形位置、最小外接矩形面积以及置信度的深度学习模型,本申请实施例对此不作限定。
S320:确定具有最高评分的打光图像对应的备选打光方案为针对上述第一检测目标的打光方案。
应理解,当上述评分为第一评分时,最高第一评分对应的备选打光方案的打光质量最好,所以基于该打光方案下识别出的每个字符最清晰,进一步地,字符识别结果是相对最准确的字符识别结果。
基于上述技术方案,通过打光图像中的每个字符的最小外接矩形位置、最小外接矩形面积以及置信度确定第一评分,并通过第一评分对当前的打光方案进行客观评价,由于第一评分的标准客观统一,所以减少了因人工评判的主观因素造成的打光方案质量不统一的情况,有助于提升打光方案的质量,进而有助于提升对产品打光图像的字符识别准确性。
通过上述实施例的说明可知,上述第一评分可以通过打光图像中每个字符的最小外接矩形位置、最小外接矩形面积以及置信度来综合确定。鉴于此,本申请实施例还提出了一种确定第一评分的方法。
图4示出了本申请实施例提供的一种确定第一评分的方法流程示意图。
S410:根据打光图像中每个字符的最小外接矩形的位置,通过聚类模型,确定打光图像中的J个字符区域块,其中,每个字符区域块包括I个字符。
其中,I和J为正整数。
在一些可能的实施例中,上述聚类模型主要用来将较大的字符区域划分为J个局部,每个局部内的I个字符都是相互邻接或者形式类似的字符。通过对每个局部进行字符识别,能够有效提高字符识别的准确度。应用于本申请实施例的聚类模型可以包括:K-means聚类算法,系统聚类算法等。
应理解,在打光图像中只有一个字符时,也可以先对打光图像进行聚类操作,聚类操作后的结果也仅是打光图像具有一个局部,该局部仅有一个字符。
S420:根据每个字符区域块中的每个字符的置信度,确定打光图像的每个字符区域块的字符置信度平均值。
在一些可能的实施例中,打光图像的字符区域块的字符置信度平均值可以根据如下公式(1)确定:
应理解,上述公式(1)所获得的字符置信度平均值,是一个打光图像中的一个字符区域块对应的字符置信度平均值。由于一个打光图像中有J个字符区域块,所以一个打光图像应当对应J个字符置信度平均值,而每个字符置信度平均值都是由I个字符的置信度取平均值计算得到的。
一个实施例中,上述置信度可以是基于深度学习的神经网络模型确定的,范围在[0,1]内,越接近1代表该模型判断该字符属于指定类别的概率越大。
例如,现有10张打光图像,每张打光图像上只有一个数字,分别为0~9。此时,可以将图片分成Char0~Char9,共10个类别,并给打光图像标注上它们对应的标签。再将每个图片输入到神经网络分类器中去训练,在训练过程中自动调节神经网络模型中的参数,使得神经网络模型最终输出的结果和标注的标签一致。至此,神经网络模型则已经学习到了如何识别0~9这10类数字。
但实际上,通过神经网络模型输出的识别结果不一定达到完全一致,所以神经网络模型的输出可能是这样:
当前图片分类为Char0的概率为0.25,分类为Char1的概率为0.57;分类为Char2的概率为0.12;分类为Char3的概率为0.24;分类为Char4的概率为0.54;分类为Char5的概率为0.14;分类为Char6的概率为0.28;分类为Char7的概率为0.58;分类为Char8的概率为0.99;分类为Char9的概率为0.05。
此时,可以取最高概率的分类Char8对应数字8为字符的识别结果,其置信度为0.99,进而获取到字符置信度。
S430:根据每个字符区域块中的每个字符的最小外接矩形面积,确定打光图像的每个字符区域块的字符外接矩形面积平均值。
在一些可能的实施例中,打光图像的字符区域块的字符外接矩形面积平均值可以根据如下公式(2)确定:
与上述确定字符置信度平均值类似,字符外接矩形面积平均值是一个打光图像中的一个字符区域块对应的字符外接矩形面积平均值。由于一个打光图像中有J个字符区域块,所以一个打光图像应当对应J个字符外接矩形面积平均值,而每个字符外接矩形面积平均值都是由I个字符的最小外接矩形面积取平均值计算得到的。
S440:根据打光图像的字符置信度平均值和字符外接矩形面积平均值,确定打光图像的第一字符区域块。
在一些可能的实施例中,打光图像的第一字符区域块可以由该打光图像的每个字符区域块中的字符置信度的标准差和每个字符区域块中的字符外接矩形面积的标准差共同确定:根据打光图像的字符置信度平均值和字符外接矩形面积平均值,确定J个字符区域块中的每个字符区域块的字符置信度的标准差和字符外接矩形面积的标准差;确定字符置信度的标准差与字符外接矩形面积的标准差之和最小的字符区域块为第一字符区域块。
以第j个字符区域块为例,第j个字符区域块中的字符置信度的标准差可以根据如下公式(3)确定:
第j个字符区域块中的字符外接矩形面积的标准差可以根据如下公式(4)确定:
其中,std_avgpj表示第j个字符区域块的字符置信度的标准差,std_avgaj表示第j个字符区域块中的字符外接矩形面积的标准差。
然后,分别对一个打光图像中每个字符区域块对应的字符置信度的标准差和字符外接矩形面积的标准差均进行加和处理,获得综合标准差。由于一张图片中包括J个字符区域块,所以获得J个综合标准差,从这些综合标准差中选取最小标准差,该最小标准差对应的字符区域块就是第一字符区域块。在std_avgpj与所述std_avgaj之和最小时,即可确定第j个字符区域块为第一字符区域块。
应理解,第一字符区域块中的每个字符之间的最小外接矩形的面积最平均,并且每个字符之间的字符置信度最接近。
S450:根据打光图像的第一字符区域块对应的字符置信度平均值和字符外接矩形面积平均值,确定第一评分。
在一些可能的实施例中,上述第一评分主要包括两部分,第一部分与打光图像的第一字符区域块的字符置信度平均值之间呈正相关关系。即打光图像的第一字符区域块的字符置信度平均值越大,表示识别出的字符整体置信度越高,第一部分的数值越大。而第二部分与打光图像的第一字符区域块的字符外接矩形面积平均值的标准差之间呈负相关关系。即打光图像的第一字符区域块的字符外接矩形面积平均值的标准差越大,识别出的字符越不整齐,第二部分的数值越小。而将这两部分进行加和,即可表示,当这串字符越整齐并且置信度越高时,上述第一评分的分值越高。
在一些可能的实施例中,还可以在上述第一评分中引入其他常量或者变量,以扩充确定上述第一评分时所考虑的评分因素。
应理解,上述第一评分的第二部分能够表征识别出来的字符大小是否均匀整齐,主要包括两种情况:
第一种情况是由于打光方案缺陷造成识别出的字符大小不均匀不整齐。此时,即便识别出的字符对应的字符置信度平均值很高,由于识别的字符大小不均匀不整齐,拉低了上述第一评分,使之在确定出的N个第一评分中,无法成为最高分。
第二种情况是由于打光图像中的字符分布本身就是不均匀整齐的,但是可能会因为打光方案的缺陷,使获取到的打光图像中每个字符区域的字符都是残缺不全的。而正是因为字符残缺不全,就导致了字符区域的字符外接矩形面积平均值都比较相近,进一步导致字符外接矩形面积标准差接近0。但是该情况下确定的字符置信度平均值会很低,整体拉低了上述第一评分,使之与其他已确定的第一评分相比无法成为最高分。而对于较优的打光方案,由于字符分布本身就是不均匀整齐的,即便识别出字符区域的字符外接矩形面积标准差较大,通常情况下其造成的影响并不会过多拉低整体的第一评分。
基于上述技术方案,可以通过上述方法客观统一地确定备选打光方案对应的第一评分,进而选取较为合适的打光方案,减少了确定打光方案时来自人工主观判断的影响,选取合适的打光方案为目标打光,提升了打光方案的质量,进而提升了产品图像的字符识别准确性。
在一些可能的实施例中,对于为第一检测目标选取打光方案的场景下,能够确定最高的第一评分对应的打光方案为最终选用的针对第一检测目标的打光方案。由于该打光方案是一个较为通用的打光方案,因此,在对第二检测目标进行打光时,也可以根据该针对第一检测目标的打光方案,对第二检测目标进行打光并拍照,获得第二检测目标的打光图像,并对其进行后续的字符识别过程。
但是,即便选取确定的针对于第一检测目标的打光方案对第二检测目标进行打光,在获得第二检测目标的打光图像后,仍需要对该打光图像进行上述评分操作,确定第一评分。在该第一评分高于第一预设阈值时,则沿用针对第一检测目标的打光方案对所述第二检测目标进行打光,输出字符识别结果。
其中,第一预设阈值为正数,可以是1.0、1.2等合理的阈值。
应理解,在第一检测目标和第二检测目标为同种或同类产品时,通常可以沿用第一检测目标下确定的打光方案。但是,在第一检测目标和第二检测目标的种类不同时,其结构相差较大时,可能无法沿用针对第一检测目标的打光方案。此时,该打光方案在第二检测目标下确定的第一评分可能低于第一预设阈值,所以,需要调节打光参数,重新确定N个备选打光方案,再进行S210~S230、S310~S320、S410~S450的步骤,重新确定针对于第二检测目标的合适的打光方案。
基于上述技术方案,由于确定的针对于第一检测目标的打光方案是一个较为通用的方案,所以当首次对第一检测目标进行打光后,在其他检测目标与第一检测目标之间的差异不大时,之前确定的针对于第一检测目标的打光方案还可以应用于对其他检测目标的打光操作,提升了对不同产品的表面进行字符识别的效率。即便第一检测目标和其他检测目标之间的差异很大,还可以自动重新确定打光方案,以减少人工参与后续的调光操作,进一步提升了打光方案的质量,进而提升了产品图像的字符识别准确性和效率。
在一些可能的实施例中,当确定针对于第一检测目标的打光方案后,可以将该打光方案和第一检测目标信息,存储在本地或服务器中。对于后续进行打光的检测目标,也可以将其最终确定的打光方案存储在本地或服务器中。
以对第二检测目标进行打光为例,在对上述第二检测目标进行打光之前,可以先确定该第二检测目标的信息,查找是否存储了已确定的针对于第二检测目标的打光方案,即该第二检测目标是否为历史目标。
如果查找成功,则直接使用查找到的打光方案对第二检测目标进行打光操作,并对打光图像进行字符识别。
如果查找失败,则沿用上一次打光目标最终使用的打光方案。
例如,上一次打光目标为第一检测目标,确定了针对于第一检测目标的打光方案,因此,先沿用针对第一检测目标的打光方案对该第二检测目标进行打光,并且确定该打光方案对应的打光图片的的第一评分,如果此时的第一评分不高于第一预设阈值,则调节打光参数,重新确定N个备选打光方案,再进行S210~S230、S310~S320、S410~S450的步骤,重新确定该第二检测目标的打光方案,最终确定针对第二检测目标的打光方案。
基于上述技术方案,可以将历史确定的打光方案存储下来,当再次对历史目标进行打光操作时,可以调取该历史目标对应的打光方案进行打光操作,从而保证该打光方案针对于该目标是最优的同时,还避免了重复确定打光方案的情况,提升了确定打光方案的效率,进一步提升了对产品的表面进行字符识别的效率。
在上述实施例基础之上,本申请实施例提供了又一种确定打光方案的方法:引入了第二评分和第三评分,与第一评分共同确定评分,将最高评分对应的备选打光方案作为当前针对于第一检测目标的打光方案,使最终确定的选用打光方案更合适,打光质量更高。
图5示出了本申请实施例提供的又一种确定打光方案的方法流程示意图。
S510:根据第一真实字符串的长度和备选打光方案的字符识别结果的长度,确定第二评分。
其中,上述第一真实字符串为已知的、上述第一检测目标表面的真实字符信息。
在一些可能的实施例中,可以通过对比打光图像的第一真实字符串长度和备选打光方案的字符识别结果的长度之间的差值,确定第二评分。例如,上述第二评分可以根据如下公式(5)确定:
其中,score2表示第二评分,ltrue表示打光图像的第一真实字符串长度,locr表示备选打光方案的字符识别结果长度。
应理解,当对比后确认第一真实字符串的长度与字符识别结果的长度之间的差值为0时,则第二评分为1,当第一真实字符串的长度与字符识别结果的长度之间的差值不为0时,则第二评分为0。
在一些可能的实施例中,还可以通过对比打光图像的第一真实字符串长度和字符识别结果的长度之间差值的其他变形方式,确定上述第二评分。例如,可以根据如下公式(6)确定:
应理解,若第一真实字符串的长度小于或等于字符识别结果对应的字符长度,则第二评分为第一真实字符串的长度与字符识别结果对应的字符长度的比值。
若第一真实字符串的长度大于或字符识别结果的长度,则第二评分为字符识别结果对应的字符长度与第一真实字符串的长度的比值。
若第一真实字符串的长度与字符识别结果对应的字符长度相差越小,则第二评分越高。
若第一真实字符串的长度与字符识别结果对应的字符长度相差越大,则第二评分越低。
S520:根据第一真实字符串和备选打光方案的字符识别结果之间的相似度,确定第三评分。
在一些可能实现的实施例中,可以根据第一真实字符串与备选打光方案的字符识别结果之间的编辑距离,确定第三评分。
应理解,编辑距离是指字符识别结果转换为第一真实字符串的最少的编辑操作次数,该编辑操作可以包括任意位置插入一个字符、任意位置删除一个字符与任意位置修改一个字符。在本申请实施例中,第一真实字符串和字符识别结果之间的相似度越高,编辑距离越小,第三评分越高,例如越接近1。
或者,还可以根据第一真实字符串与备选打光方案的字符识别结果之间的余弦相似性,确定第三评分;
应理解,余弦相似性是通过测量两个向量的夹角的余弦值来度量它们之间的相似性。0度角的余弦值是1,其他任何角度的余弦值都不大于1,并且其最小值是-1。从而根据两个向量之间的角度的余弦值能够确定两个向量是否大致指向相同的方向。当两个向量有相同的指向时,余弦相似度的值为1;当两个向量夹角为90°时,余弦相似度的值为0;当两个向量指向完全相反的方向时,余弦相似度的值为-1。在本申请实施例中,第一真实字符串和字符识别结果之间的相似度越高,第一真实字符串和字符识别结果之间的余弦相似性越高,第三评分越高,例如越接近1。
或者,还可以根据第一真实字符串与备选打光方案的字符识别结果之间的欧氏距离,确定第三评分。
应理解,欧氏距离是一种距离度量,衡量的是多维空间中各个点之间的绝对距离,其中,距离度量用于衡量个体在空间上存在的距离,距离越远,说明个体间的差异越大。在本申请实施例中,第一真实字符串和字符识别结果之间的相似度越高,第一真实字符串和字符识别结果之间的欧氏距离越小,第三评分越高,例如越接近1。
S530:根据第一评分、第二评分以及第三评分,确定上述评分。
在一些可能的实施例中,上述评分是上述第一评分、上述第二评分以及上述第三评分的加权和。
在一些可能的实施例中,可以通过预设权值λ1、λ2、λ3,分别为上述第一评分、第二评分以及第三评分进行加权。而预设权值可以预先设定,也可以在后续的过程中直接修改,本申请实施例对此不作限定。且λ1、λ2、λ3可以满足如下条件:λ1+λ2+λ3=1。进一步地,λ1的取值范围可以是[0.5,0.8],λ2的取值范围可以是[0.1,0.25],λ3的取值范围可以是[0.1,0.25]。
S540:在评分为当前最高评分时,确定该最高评分对应的备选打光方案为当前针对第一检测目标的打光方案。
基于上述技术方案,在已知第一真实字符串时,通过引入第二评分以及第三评分,与第一评分共同确定上述评分,使确定的针对于第一检测目标的打光方案更为客观合理,进而使输出的字符识别结果更准确。
在一些可能的实施例中,对于为第一检测目标选取打光方案的场景下,能够确定最高的评分对应的打光方案为最终选用的针对第一检测目标的打光方案。由于该打光方案是一个较为通用的打光方案,因此,在对第二检测目标进行打光时,也可以根据该针对第一检测目标的打光方案,对第二检测目标进行打光并拍照,获得第二检测目标的打光图像,并对其进行后续的字符识别过程。
但是,即便选取确定的针对于第一检测目标的打光方案对第二检测目标进行打光,在获得第二检测目标的打光图像后,仍需要对该打光图像进行上述评分操作,确定评分。在该评分高于第二预设阈值时,则沿用针对第一检测目标的打光方案对所述第二检测目标进行打光,输出字符识别结果。
其中,第二预设阈值为正数,可以是1.25、1.5等合理的阈值。
应理解,在第一检测目标和第二检测目标为同种或同类产品时,通常可以沿用第一检测目标下确定的打光方案。但是,在第一检测目标和第二检测目标的种类不同时,其结构相差较大时,可能无法沿用针对第一检测目标的打光方案。此时,该打光方案在第二检测目标下确定的评分可能低于第二预设阈值,所以,需要调节打光参数,重新确定N个备选打光方案,再进行S210~S230、S310~S320、S410~S450、S510~S540的步骤,重新确定针对于第二检测目标的合适的打光方案。
基于上述技术方案,由于确定的针对于第一检测目标的打光方案是一个较为通用的方案,在其他检测目标与第一检测目标之间的差异不大时,之前确定的针对于第一检测目标的打光方案还可以应用于对其他检测目标进行打光。提升了对不同产品的表面进行字符识别的效率。即便第一检测目标和其他检测目标之间的差异很大,还可以自动重新确定打光方案,以减少人工参与后续的调光操作,进一步提升了打光方案的质量,进而提升了产品图像的字符识别准确性。
在一些可能的实施例中,当确定针对于第一检测目标的打光方案后,可以将该打光方案和第一检测目标信息,存储在本地或服务器中。对于后续进行打光的检测目标,也可以将其最终确定的打光方案存储在本地或服务器中。
以对第二检测目标进行打光为例,在对上述第二检测目标进行打光之前,可以先确定该第二检测目标的信息,查找是否存储了已确定的针对于第二检测目标的打光方案,即该第二检测目标是否为历史目标。
如果查找成功,则直接使用查找到的打光方案对第二检测目标进行打光操作,并对打光图像进行字符识别。
如果查找失败,则沿用上一次打光目标最终使用的打光方案。
例如,上一次打光目标为第一检测目标,确定了针对于第一检测目标的打光方案,因此,先沿用针对第一检测目标的打光方案对该第二检测目标进行打光,并且确定该打光方案对应的打光图像的评分,如果此时评分不高于第二预设阈值,则调节打光参数,重新确定N个备选打光方案,再进行S210~S230、S310~S330、S410~S450、S510~S540的步骤,重新确定该第二检测目标的打光方案,最终确定针对第二检测目标的打光方案。
基于上述技术方案,可以将历史确定的打光方案存储下来,当再次对历史目标进行打光操作时,可以调取该历史目标对应的打光方案进行打光操作,从而保证该打光方案针对于该目标是最优的同时,还避免了重复确定打光方案的情况,提升了确定打光方案的效率,进一步提升了对产品的表面进行字符识别的效率。
本申请实施例还提供用于实现以上任一种方法的装置,例如,提供一种用于字符识别的装置,包括用以实现以上任一种方法的单元(或手段)。
图6示出了本申请实施例提供的一种确定打光方案的装置600的示意性框图。如图6所示,该装置600包括:
确定单元610,用于按照预设的调节规则对光源的打光参数进行调节,确定N个备选打光方案;
拍摄单元620,用于按照N个备选打光方案,分别对第一检测目标进行打光并拍照,以获得分别对应于N个备选打光方案的N个打光图像;
处理单元630,用于通过深度学习模型,对N个打光图像进行字符识别,以获得N个备选打光方案的字符识别结果;
上述确定单元610还用于,根据N个备选打光方案的字符识别结果,从N个备选打光方案中确定针对第一检测目标的打光方案,其中,N为正整数。
可选地,上述处理单元630还用于对打光图像进行图像预处理,图像预处理包括:图像翻转、图像旋转、高斯滤波腐蚀膨胀。
可选地,对于每个打光图像,上述确定单元610具体用于确定打光图像中的每个字符的最小外接矩形位置、最小外接矩形面积以及置信度,并根据打光图像中的所述每个字符的所述最小外接矩形位置、所述最小外接矩形面积以及所述置信度,确定打光图像的评分;确定具有最高评分的打光图像对应的备选打光方案为针对上述第一检测目标的打光方案。
可选地,上述确定单元610具体用于根据打光图像中每个字符的最小外接矩形位置,通过聚类模型,确定打光图像中的J个字符区域块,每个字符区域块包括I个字符,其中J和I为正整数;根据每个字符区域块中的每个字符的置信度,确定打光图像的每个字符区域块的字符置信度平均值;根据每个字符区域块中的每个字符的最小外接矩形面积,确定打光图像的每个字符区域块的字符外接矩形面积平均值;根据打光图像的字符置信度平均值和字符外接矩形面积平均值,确定打光图像的第一字符区域块;根据打光图像的第一字符区域块对应的字符置信度平均值和字符外接矩形面积平均值,确定第一评分。
可选地,在已知第一真实字符串时,第一真实字符串为第一检测目标表面的真实字符信息,上述确定单元610具体用于根据第一真实字符串的长度和备选打光方案的字符识别结果的长度,确定第二评分,该第一真实字符串为已知的、上述第一检测目标表面的真实字符信息;根据第一真实字符串和备选打光方案的字符识别结果之间的相似度,确定第三评分;根据第一评分、第二评分以及第三评分,确定上述评分。
可选地,上述确定单元610具体用于根据第一真实字符串与备选打光方案的字符识别结果之间的编辑距离,确定第三评分;或者,根据第一真实字符串与备选打光方案的字符识别结果之间的余弦相似性,确定第三评分;或者,根据第一真实字符串与备选打光方案的字符识别结果之间的欧氏距离,确定第三评分。
可选地,上述拍摄单元620还用于按照已确定的针对第一检测目标的打光方案,对第二检测目标进行打光并拍照,获得第二检测目标的打光图像;上述处理单元630还用于通过深度学习模型,对第二检测目标的打光图像进行字符识别,以获得第一检测目标的打光方案应用于第二检测目标时的字符识别结果。
可选地,上述确定单元610还用于根据第一检测目标的打光方案应用于第二检测目标时的字符识别结果,确定第一检测目标的打光方案应用于第二检测目标时的第一评分;当该第一检测目标的打光方案应用于第二检测目标时的第一评分高于第一预设阈值时,沿用第一检测目标的打光方案对第二检测目标进行打光,其中第一预设阈值为正数。
可选地,在已知第二真实字符串时,第二真实字符串为第二检测目标表面的真实字符信息;上述确定单元610还用于根据第二真实字符串和上述第一检测目标的打光方案应用于上述第二检测目标时的字符识别结果,确定上述第一检测目标的打光方案应用于所述第二检测目标时的上述评分,该第二真实字符串为已知的、上述第二检测目标表面的真实字符信息;当第一检测目标的打光方案应用于第二检测目标时的上述评分高于第二预设阈值时,沿用第一检测目标的打光方案对第二检测目标进行打光,其中第二预设阈值为正数。
应理解,上述确定单元610的功能可以由上述实施例中的计算设备和光源控制系统实现。上述拍摄单元620的功能可以由上述实施例中的成像系统实现。上述处理单元630的功能可以由上述实施例中的计算设备实现。
本领域普通技术人员可以意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、或者计算机软件和电子硬件的结合来实现。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本申请的范围。
所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的系统、装置和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
在本申请所提供的几个实施例中,应该理解到,所揭露的系统、装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本申请各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。
所述功能如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本申请各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(Read-Only Memory,ROM)、随机存取存储器、磁碟或者光盘等各种可以存储程序代码的介质。
以上所述,仅为本申请的具体实施方式,但本申请的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本申请揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本申请的保护范围之内。因此,本申请的保护范围应以所述权利要求的保护范围为准。
Claims (16)
1.一种确定打光方案的方法,其特征在于,包括:
按照N个备选打光方案,分别对第一检测目标进行打光并拍照,以获得分别对应于所述N个备选打光方案的N个打光图像,其中所述N个备选打光方案是按照预设的调节规则对光源的打光参数进行调节而获得的,所述打光参数包括以下至少一种可调参数:发射光方向、波长、亮度、色温、以及光源的数量;
通过深度学习模型,对所述N个打光图像进行字符识别,以获得所述N个备选打光方案的字符识别结果;
根据所述N个备选打光方案的字符识别结果,从所述N个备选打光方案中确定针对所述第一检测目标的打光方案,所述N为正整数。
2.根据权利要求1所述的方法,其特征在于,所述根据所述N个备选打光方案的字符识别结果,从所述N个备选打光方案中确定针对所述第一检测目标的打光方案包括:
对于每个所述打光图像,确定所述打光图像中的每个字符的最小外接矩形位置、最小外接矩形面积以及置信度,并根据所述打光图像中的所述每个字符的所述最小外接矩形位置、所述最小外接矩形面积以及所述置信度,确定所述打光图像的评分;
确定具有最高评分的打光图像对应的备选打光方案为针对所述第一检测目标的打光方案。
3.根据权利要求2所述的方法,其特征在于,所述根据所述打光图像中的所述每个字符的所述最小外接矩形位置、所述最小外接矩形面积以及所述置信度,确定所述打光图像的评分包括:
根据所述打光图像中所述每个字符的所述最小外接矩形位置,通过聚类模型,确定所述打光图像中的J个字符区域块,每个字符区域块包括I个字符,其中所述J和所述I为正整数;
根据所述每个字符区域块中的所述每个字符的所述置信度,确定所述打光图像的所述每个字符区域块的字符置信度平均值;
根据所述每个字符区域块中的所述每个字符的所述最小外接矩形面积,确定所述打光图像的所述每个字符区域块的字符外接矩形面积平均值;
根据所述打光图像的所述字符置信度平均值和所述字符外接矩形面积平均值,确定所述打光图像的第一字符区域块;
根据所述打光图像的所述第一字符区域块对应的所述字符置信度平均值和所述字符外接矩形面积平均值,确定第一评分。
4.根据权利要求3所述的方法,其特征在于,所述根据所述打光图像的所述字符置信度平均值和所述字符外接矩形面积平均值,确定所述打光图像的第一字符区域块包括:
根据所述打光图像的所述字符置信度平均值和所述字符外接矩形面积平均值,确定所述J个字符区域块中的每个字符区域块的字符置信度的标准差和字符外接矩形面积的标准差;
确定所述字符置信度的标准差与所述字符外接矩形面积的标准差之和最小的字符区域块为所述第一字符区域块。
5.根据权利要求4所述的方法,其特征在于,所述第一评分包括第一部分与第二部分之和,其中,所述第一部分与所述打光图像的所述第一字符区域块的字符置信度平均值之间呈正相关关系,所述第二部分与所述打光图像的所述第一字符区域块的字符外接矩形面积平均值的标准差之间呈负相关关系。
6.根据权利要求2至5中任一项所述的方法,其特征在于,所述方法还包括:
根据所述第一真实字符串的长度和所述备选打光方案的字符识别结果的长度,确定第二评分,所述第一真实字符串为已知的、所述第一检测目标表面的真实字符信息;
根据所述第一真实字符串和所述备选打光方案的字符识别结果之间的相似度,确定第三评分;
根据所述第一评分、所述第二评分以及所述第三评分,确定所述评分。
7.根据权利要求6所述的方法,其特征在于,所述根据所述第一真实字符串的长度和所述备选打光方案的字符识别结果的长度,确定第二评分包括:
通过对比所述打光图像的所述第一真实字符串长度和所述备选打光方案的字符识别结果的长度之间的差值,确定所述第二评分。
8.根据权利要求6所述的方法,其特征在于,所述根据所述第一真实字符串和所述备选打光方案的字符识别结果之间的相似度,确定所述打光图像的第三评分包括:
根据所述第一真实字符串与所述备选打光方案的字符识别结果之间的编辑距离,确定所述第三评分;或者,
根据所述第一真实字符串与所述备选打光方案的字符识别结果之间的余弦相似性,确定所述第三评分;或者,
根据所述第一真实字符串与所述备选打光方案的字符识别结果之间的欧氏距离,确定所述第三评分。
9.根据权利要求6所述的方法,其特征在于,所述根据所述第一评分、所述第二评分以及所述第三评分,确定所述评分包括:
根据所述第一评分、所述第二评分以及所述第三评分的加权和,确定所述评分。
10.根据权利要求6所述的方法,其特征在于,所述方法还包括:
按照已确定的针对所述第一检测目标的打光方案,对第二检测目标进行打光并拍照,获得所述第二检测目标的打光图像;
通过所述深度学习模型,对所述第二检测目标的打光图像进行字符识别,以获得所述第一检测目标的打光方案应用于所述第二检测目标时的字符识别结果。
11.根据权利要求10所述的方法,其特征在于,所述方法还包括:
根据所述第一检测目标的打光方案应用于所述第二检测目标时的字符识别结果,确定所述第一检测目标的打光方案应用于所述第二检测目标时的所述第一评分;
当所述第一检测目标的打光方案应用于所述第二检测目标时的所述第一评分高于第一预设阈值时,沿用所述第一检测目标的打光方案对所述第二检测目标进行打光,其中所述第一预设阈值为正数。
12.根据权利要求10所述的方法,其特征在于,所述方法还包括:
根据所述第二真实字符串和所述第一检测目标的打光方案应用于所述第二检测目标时的字符识别结果,确定所述第一检测目标的打光方案应用于所述第二检测目标时的所述评分,所述第二真实字符串为已知的、所述第二检测目标表面的真实字符信息;
当所述第一检测目标的打光方案应用于所述第二检测目标时的所述评分高于第二预设阈值时,沿用所述第一检测目标的打光方案对所述第二检测目标进行打光,其中所述第二预设阈值为正数。
13.一种确定打光方案的装置,其特征在于,所述装置用于执行如权利要求1至12中任一项所述的方法。
14.一种确定打光方案的装置,其特征在于,包括:
存储器,用于存储计算机指令;
处理器,用于执行所述存储器中存储的计算机指令,以使得所述装置执行如权利要求1至12中任一项所述的方法。
15.一种计算机存储介质,其特征在于,所述计算机存储介质中存储有计算机指令,所述指令在计算机上执行时,使得所述计算机执行如权利要求1至12中任一项所述的方法。
16.一种芯片,其特征在于,包括处理器,所述处理器用于执行如权利要求1至12中任一项所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211357774.0A CN115909306A (zh) | 2022-11-01 | 2022-11-01 | 一种确定打光方案的方法和装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211357774.0A CN115909306A (zh) | 2022-11-01 | 2022-11-01 | 一种确定打光方案的方法和装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN115909306A true CN115909306A (zh) | 2023-04-04 |
Family
ID=86477043
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202211357774.0A Pending CN115909306A (zh) | 2022-11-01 | 2022-11-01 | 一种确定打光方案的方法和装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN115909306A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116977332A (zh) * | 2023-09-21 | 2023-10-31 | 合肥联宝信息技术有限公司 | 摄像头补光灯性能测试方法、装置、电子设备及存储介质 |
-
2022
- 2022-11-01 CN CN202211357774.0A patent/CN115909306A/zh active Pending
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116977332A (zh) * | 2023-09-21 | 2023-10-31 | 合肥联宝信息技术有限公司 | 摄像头补光灯性能测试方法、装置、电子设备及存储介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US7715596B2 (en) | Method for controlling photographs of people | |
JP4744918B2 (ja) | 顔検出方法および装置並びにプログラム | |
CN104978710B (zh) | 一种基于拍照识别调节人脸亮度的方法和装置 | |
JP4988770B2 (ja) | モード間の関心領域画像オブジェクト区分 | |
US8155396B2 (en) | Method, apparatus, and program for detecting faces | |
JP2005316973A (ja) | 赤目検出装置および方法並びにプログラム | |
CN106503638B (zh) | 用于颜色识别的图像处理、车辆颜色识别方法和系统 | |
WO2022222575A1 (zh) | 用于目标识别的方法和系统 | |
JP2007102401A (ja) | 顔向き特定方法、顔判別方法および装置並びにプログラム | |
CN112528939A (zh) | 一种人脸图像的质量评价方法及装置 | |
CN115170567B (zh) | 一种船舶用的防水钢板缺陷检测方法 | |
CN115909306A (zh) | 一种确定打光方案的方法和装置 | |
JP5317934B2 (ja) | オブジェクト検出装置および方法並びにプログラム | |
CN118097305B (zh) | 一种半导体发光元件质量的检测方法及系统 | |
CN115147936A (zh) | 一种活体检测方法、电子设备、存储介质及程序产品 | |
KR100909540B1 (ko) | 영상인식 오류 통보 방법 및 장치 | |
CN112926557B (zh) | 一种训练多模态人脸识别模型的方法以及多模态人脸识别方法 | |
CN112818983B (zh) | 一种利用图片相识度判断字符倒置的方法 | |
JP2011170890A (ja) | 顔検出方法および装置並びにプログラム | |
CN110210401B (zh) | 一种弱光下的目标智能检测方法 | |
Smiatacz | Normalization of face illumination using basic knowledge and information extracted from a single image | |
Sekhar et al. | Splicing forgery localisation using colour illumination inconsistencies | |
JP2001167273A (ja) | 顔面検出方法及びその装置、コンピュータ可読媒体 | |
JP4795737B2 (ja) | 顔検出方法および装置並びにプログラム | |
JPH11306348A (ja) | 対象物検出装置及び対象物検出方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |