CN111598102B - 叠加字符的检测方法及装置 - Google Patents

叠加字符的检测方法及装置 Download PDF

Info

Publication number
CN111598102B
CN111598102B CN202010470333.6A CN202010470333A CN111598102B CN 111598102 B CN111598102 B CN 111598102B CN 202010470333 A CN202010470333 A CN 202010470333A CN 111598102 B CN111598102 B CN 111598102B
Authority
CN
China
Prior art keywords
pixel
superimposed
character
standard
characters
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202010470333.6A
Other languages
English (en)
Other versions
CN111598102A (zh
Inventor
张月坤
周竹青
薛宝满
胡小平
卫瑞东
王洋
翟清云
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Rail Transport Roa Network Management Co ltd
Original Assignee
Beijing Rail Transport Roa Network Management Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Rail Transport Roa Network Management Co ltd filed Critical Beijing Rail Transport Roa Network Management Co ltd
Priority to CN202010470333.6A priority Critical patent/CN111598102B/zh
Publication of CN111598102A publication Critical patent/CN111598102A/zh
Application granted granted Critical
Publication of CN111598102B publication Critical patent/CN111598102B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/14Image acquisition
    • G06V30/148Segmentation of character regions
    • G06V30/153Segmentation of character regions using recognition of characters or words
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/20Image preprocessing
    • G06V10/22Image preprocessing by selection of a specific region containing or referencing a pattern; Locating or processing of specific regions to guide the detection or recognition
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Image Analysis (AREA)

Abstract

本发明公开了一种叠加字符的检测方法及装置。其中,该方法包括:获取图像,其中,图像中包括有叠加字符;对图像中的叠加字符所在的区域进行识别,确定叠加字符的像素和像素坐标;将像素与预先存储的标准像素进行比对,以及判断像素坐标是否满足区域的像素点坐标要求;在像素与预先存储的叠加字符的标准像素相匹配,且叠加字符的像素坐标均满足指定区域的像素点坐标要求的情况下,确定叠加字符正常。本发明解决了相关技术中人工对图像的叠加字符进行的规范性检测方式,检测准确性较差,效率较低的技术问题。

Description

叠加字符的检测方法及装置
技术领域
本发明涉及数据处理领域,具体而言,涉及一种叠加字符的检测方法及装置。
背景技术
城市轨道交通视频监视系统作为城市轨道交通运营管理自动化的配套设备,能够为控制中心的调度员、各车站值班员等提供有关列车运行、防灾救灾、乘客疏导以及社会治安等方面的视觉信息,是轨道交通安全运营维护的重要保障手段。视频监视系统中,前端视频采集设备字符叠加可提供的视频图像中的摄像机位置信息、时间信息以及控制者信息,是后期调取处理以及调度员调度使用时所需的关键信息。其叠加字符的准确性和易识别性是保证准确获取相关信息的必要条件。
相关部门对前端视频采集设备的字符叠加字体、大小、形状等作了严格规定,规范了北京市轨道交通视频监视系统的字符叠加显示。在检测字符叠加规范性的工作中,人工核查往往存在不可避免的误差,亟需提出有效的前端视频采集设备字符叠加规范性检测方法。
针对上述的问题,目前尚未提出有效的解决方案。
发明内容
本发明实施例提供了一种叠加字符的检测方法及装置,以至少解决相关技术中人工对图像的叠加字符进行的规范性检测方式,检测准确性较差,效率较低的技术问题。
根据本发明实施例的一个方面,提供了一种叠加字符的检测方法,包括:获取图像,其中,所述图像中包括有叠加字符;对所述图像中的所述叠加字符所在的区域进行识别,确定所述叠加字符的像素和像素坐标;将所述像素与预先存储的标准像素进行比对,以及判断所述像素坐标是否满足所述区域的像素点坐标要求;在所述像素与预先存储的叠加字符的标准像素相匹配,且所述叠加字符的像素坐标均满足所述指定区域的像素点坐标要求的情况下,确定所述叠加字符正常。
可选的,将所述像素与预先存储的标准像素进行比对包括:计算所述像素与所述标准像素的色差;在所述色差不超过预设色差范围的情况下,确定所述叠加字符的像素与预先存储的叠加字符的标准像素相匹配。
可选的,确定所述叠加字符正常之后,还包括:对所述区域的叠加字符进行识别,确定所述叠加字符的文本信息;将所述文本信息与预先存储的标准文本进行比对,在所述文本信息与所述标准文本相同的情况下,确定所述叠加字符的信息准确。
可选的,对所述图像中的所述叠加字符所在的区域进行识别,确定所述叠加字符的像素和像素坐标包括:去除所述区域的背景区域,确定所述区域的前景字符区域;对所述前景字符区域进行分割,确定多个包含叠加字符的子区域;确定不同子区域字符的像素位置:SeqPt(n)={pt[0],pt[1],...,pt[k]},确定所述叠加字符所在像素位置对应像素的RGB值:SeqRGB(n)={(R0,G0,B0),(R1,G1,B1),...,(Rk,Gk,Bk)},式中,pt[k]代表所述叠加字符的第k个像素的位置,k为所述叠加字符的像素的数量;(Rk,Gk,Bk)代表所述叠加字符的第k个像素的R像素值,G像素值,B像素值;对所述区域的叠加字符进行识别,确定所述图像中的叠加字符的文本信息包括:获取不同区域叠加字符文本信息:SeqOCR(n),式中,n为通过光学识别字符技术OCR识别的字符数量。
可选的,计算所述像素与所述标准像素的色差包括:通过下式计算所述色差ΔE:
式中,Rk代表所述叠加字符的第k个像素的R像素值,Gk代表所述叠加字符的第k个像素的G像素值,Bk代表所述叠加字符的第k个像素的B像素值;代表所述叠加字符的标准像素的R像素值,/>代表所述叠加字符的标准像素的G像素值,/>代表所述叠加字符的标准像素的B像素值。
可选的,将所述叠加字符的像素坐标与所述指定区域的像素点坐标要求进行比对包括:所述叠加字符的标准区域为Δpt(Δx,Δy),标准区域内像素点坐标位于标准区域表示为pt(x,y)∈Δpt(Δx,Δy),通过下式确定所述叠加字符的像素坐标与所述指定区域的像素点坐标要求:所述叠加字符的像素坐标满足上式,确定所述叠加字符的像素坐标与所述指定区域的像素点坐标要求。
可选的,确定所述叠加字符正常之后,还包括:向所述图像的发送端,发送所述图像的所述叠加字符对应的标准图像的标准字符,其中,所述准图像的标准字符用于所述发送端进行比对和验证;接收所述发送端返回的比对和验证结果;根据所述比对和验证结果,统计所述叠加字符的偏差率。
根据本发明实施例的另一方面,还提供了一种叠加字符的检测装置,包括:获取模块,用于获取图像,其中,所述图像中包括有叠加字符;识别模块,用于对所述图像中的所述叠加字符所在的区域进行识别,确定所述叠加字符的像素和像素坐标;比对模块,用于将所述像素与预先存储的标准像素进行比对,以及判断所述像素坐标是否满足所述区域的像素点坐标要求;确定模块,用于在所述叠加字符的像素与预先存储的叠加字符的标准像素相同,且所述叠加字符的像素坐标均满足所述指定区域的像素点坐标要求的情况下,确定所述叠加字符正常。
根据本发明实施例的另一方面,还提供了一种存储介质,所述存储介质包括存储的程序,其中,在所述程序运行时控制所述存储介质所在设备执行上述中任意一项所述的叠加字符的检测方法。
根据本发明实施例的另一方面,还提供了一种处理器,所述处理器用于运行程序,其中,所述程序运行时执行上述中任意一项所述的叠加字符的检测方法。
在本发明实施例中,采用获取图像,其中,图像中包括有叠加字符;对图像中的叠加字符所在的区域进行识别,确定叠加字符的像素和像素坐标;将像素与预先存储的标准像素进行比对,以及判断像素坐标是否满足区域的像素点坐标要求;在像素与预先存储的叠加字符的标准像素相匹配,且叠加字符的像素坐标均满足指定区域的像素点坐标要求的情况下,确定叠加字符正常的方式,通过对叠加字符的像素和像素坐标与标准像素和像素点坐标要求进行对比,确定上述叠加字符是否正常,符合规范性的要求,达到了对叠加字符的规范性进行有效检测的目的,从而实现了提高了叠加字符的规范性检测准确性和效率的技术效果,进而解决了相关技术中人工对图像的叠加字符进行的规范性检测方式,检测准确性较差,效率较低的技术问题。
附图说明
此处所说明的附图用来提供对本发明的进一步理解,构成本申请的一部分,本发明的示意性实施例及其说明用于解释本发明,并不构成对本发明的不当限定。在附图中:
图1是根据本发明实施例的一种叠加字符的检测方法的流程图;
图2是根据本发明实施方式的规范性检测系统的示意图;
图3是根据本发明实施方式的规范性检测方法的流程图;
图4是根据本发明实施例的一种叠加字符的检测装置的示意图。
具体实施方式
为了使本技术领域的人员更好地理解本发明方案,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分的实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本发明保护的范围。
需要说明的是,本发明的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本发明的实施例能够以除了在这里图示或描述的那些以外的顺序实施。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
根据本发明实施例,提供了一种叠加字符的检测方法的方法实施例,需要说明的是,在附图的流程图示出的步骤可以在诸如一组计算机可执行指令的计算机系统中执行,并且,虽然在流程图中示出了逻辑顺序,但是在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤。
图1是根据本发明实施例的一种叠加字符的检测方法的流程图,如图1所示,该方法包括如下步骤:
步骤S102,获取图像,其中,图像中包括有叠加字符;
步骤S104,对图像中的叠加字符所在的区域进行识别,确定叠加字符的像素和像素坐标;
步骤S106,将像素与预先存储的标准像素进行比对,以及判断像素坐标是否满足区域的像素点坐标要求;
步骤S108,在像素与预先存储的叠加字符的标准像素相匹配,且叠加字符的像素坐标均满足指定区域的像素点坐标要求的情况下,确定叠加字符正常。
通过上述步骤,采用获取图像,其中,图像中包括有叠加字符;对图像中的叠加字符所在的区域进行识别,确定叠加字符的像素和像素坐标;将像素与预先存储的标准像素进行比对,以及判断像素坐标是否满足区域的像素点坐标要求;在像素与预先存储的叠加字符的标准像素相匹配,且叠加字符的像素坐标均满足指定区域的像素点坐标要求的情况下,确定叠加字符正常的方式,通过对叠加字符的像素和像素坐标与标准像素和像素点坐标要求进行对比,确定上述叠加字符是否正常,符合规范性的要求,达到了对叠加字符的规范性进行有效检测的目的,从而实现了提高了叠加字符的规范性检测准确性和效率的技术效果,进而解决了相关技术中人工对图像的叠加字符进行的规范性检测方式,检测准确性较差,效率较低的技术问题。
上述图像可以为是数据库中存储的图像,还可以是通过图像采集设备实时采集的图像数据流。上述图像可以是视频监控系统中的视频流的图片。上述视频监控系统包括多个视频采集装置,生成视频流,将视频流通过以太网发送给视频监控系统的监控终端,通过监控终端对视频进行显示。上述视频流由多帧图像组成,通过对视频流进行截帧处理,可以获得视频流的图片。例如,获取待检测的具有叠加字符的图像包括:获取待检测的视频流,其中,视频流具有叠加字符;从视频流中截取画面,获取图像。
上述叠加字符在图片的生成设备上叠加到图片时,就是将叠加字符叠加到图片的区域,例如右下角的预设位置的预设大小的区域。
通过对叠加字符所在的区域进行识别,确定叠加字符的像素和像素点坐标;具体的,对字符区域进行分割,分别提取字符区域的字符的像素的颜色,并在标准坐标系中确定叠加字符的像素的位置。从而对叠加字符的像素以及像素点坐标进行有效确定。
将像素与预先存储的标准像素进行比对,可以通过分别对像素以及标准像素的像素值进行计算,通过像素值进行比对,在标准像素值与像素值的像素值的差不超过预设像素值差的情况下,确定像素与标准像素相匹配。以及判断像素坐标是否满足区域的像素点坐标要求,上述像素点坐标要求可以是范围要求,例如,上述像素点坐标均需处于预设坐标范围,才满足像素点坐标要求。上述像素点坐标要求还可以是像素点之间的位置要求,例如,矩阵排列,平行或垂直等。
在像素与预先存储的叠加字符的标准像素相匹配,且叠加字符的像素坐标均满足指定区域的像素点坐标要求的情况下,确定叠加字符正常。在像素与预先存储的叠加字符的标准像素不匹配,和/或,叠加字符的像素坐标不能满足指定区域的像素点坐标要求的情况下,确定叠加字符异常。达到了对叠加字符的规范性进行有效检测的目的,从而实现了提高了叠加字符的规范性检测准确性和效率的技术效果,进而解决了相关技术中人工对图像的叠加字符进行的规范性检测方式,检测准确性较差,效率较低的技术问题。
上述多个源设备可以为上述视频监控系统的多个视频采集装置,上述源设备的识别信息,可以为视频采集终端的名称、视频采集终端的IP地址,视频采集终端布设的实际地址。上述视频采集装置,可以为摄像头,摄像机等。
可选的,将像素与预先存储的标准像素进行比对包括:计算像素与标准像素的色差;在色差不超过预设色差范围的情况下,确定叠加字符的像素与预先存储的叠加字符的标准像素相匹配。从而有效确定叠加字符的像素与标准像素是否匹配,对叠加字符的像素进行规范性检测,
上述色素可以包括RGB值,也即是RED红像素值,GREEN绿像素值,BLUE蓝像素值,上述像素与标准像素的色差可以包括红像素值的差,绿像素值的差,以及蓝像素的差,对不同的颜色的像素值,可以采用不同的预设色差范围,在本实施例中,采用相同的色差范围,例如,红像素值的差,绿像素值的差,以及蓝像素值的差均不超过30。还可以根据上述红像素值的差,绿像素值的差,以及蓝像素值的差确定综合的色差。
具体的,对图像中的叠加字符所在的区域进行识别,确定叠加字符的像素和像素坐标包括:去除区域的背景区域,确定区域的前景字符区域;对前景字符区域进行分割,确定多个包含叠加字符的子区域;确定不同子区域字符的像素位置:SeqPt(n)={pt[0],pt[1],...,pt[k]},确定叠加字符所在像素位置对应像素的RGB值:SeqRGB(n)={(R0,G0,B0),(R1,G1,B1),...,(Rk,Gk,Bk)},式中,pt[k]代表叠加字符的第k个像素的位置,k为叠加字符的像素的数量;(Rk,Gk,Bk)代表叠加字符的第k个像素的R像素值,G像素值,B像素值;对区域的叠加字符进行识别,确定图像中的叠加字符的文本信息包括:获取不同区域叠加字符文本信息:SeqOCR(n),式中,n为通过光学识别字符技术OCR识别的字符数量。
计算像素与标准像素的色差包括:通过下式计算色差ΔE:
式中,Rk代表叠加字符的第k个像素的R像素值,Gk代表叠加字符的第k个像素的G像素值,Bk代表叠加字符的第k个像素的B像素值;代表叠加字符的标准像素的R像素值,/>代表叠加字符的标准像素的G像素值,/>代表叠加字符的标准像素的B像素值。
可选的,将叠加字符的像素坐标与指定区域的像素点坐标要求进行比对包括:叠加字符的标准区域为Δpt(Δx,Δy),标准区域内像素点坐标位于标准区域表示为pt(x,y)∈Δpt(Δx,Δy),通过下式确定叠加字符的像素坐标与指定区域的像素点坐标要求:叠加字符的像素坐标满足上式,确定叠加字符的像素坐标与指定区域的像素点坐标要求。
作为一种可选的实施方式,确定叠加字符正常之后,还包括:对区域的叠加字符进行识别,确定叠加字符的文本信息;将文本信息与预先存储的标准文本进行比对,在文本信息与标准文本相同的情况下,确定叠加字符的信息准确。提高了字符识别的准确性,而且对叠加字符的文本信息进行规范性检测。
可选的,确定叠加字符正常之后,还包括:向图像的发送端,发送图像的叠加字符对应的标准图像的标准字符,其中,准图像的标准字符用于发送端进行比对和验证;接收发送端返回的比对和验证结果;根据比对和验证结果,统计叠加字符的偏差率。
需要说明的是,本实施例还提供了一种可选的实施方式,下面对该实施方式进行详细说明。
本实施方式提出的轨道交通视频图像字符叠加规范性的自动化检测方法有效的避免了核验结果受核验人员工作经验、专注力等主观因素的影响,减低了人力成本,能够提供客观、有效的字符规范性检测结果。
本实施方式提出的轨道交通视频图像字符叠加规范性检测方法通过优化检测流程,、先提取字符局部区域再进行规范性检测,并采用模块化配置的检测方案,减少对图像中无关区域的冗余计算量,节省硬件成本。
本实施方式将字符规范性检测进一步细化为字符的颜色检测、位置及尺寸检测和字体规范性检测,严格执行北京市交通委发布的《北京市轨道交通视频监控系统(VMS)应用实施指南》中对前端视频采集设备的字符叠加字体、大小、形状等的规定。
图2是根据本发明实施方式的规范性检测系统的示意图,如图2所示,本实施方式的系统组成结构:轨道交通视频图像字符叠加规范性检测系统包括指令模块、流媒体模块、字符识别模块和规范性检测模块:
1.指令模块:发送标准的字符叠加指令,可让前端视频采集设备叠加指定的字符。
2.流媒体模块:通过网络拉取已叠加字符的前端视频采集设备视频流,并截取图片。
3.字符识别模块:识别图片中叠加的字符信息,对前景字符区域进行分割,去除背景信息,提取保留字符区域。
4.规范性检测模块:包括字符的颜色检测、字符的位置及尺寸检测和字符的字体规范性检测。
图3是根据本发明实施方式的规范性检测方法的流程图,如图3所示,本实施方式的系统工作流程:
步骤1:通过指令模块发送标准字符指令,让前端视频采集设备叠加指定的字符信息,包括摄像机位置信息、时间信息以及控制者信息等。
步骤2:流媒体模块拉取已叠加指定字符的前端视频采集设备视频流,并截取视频图片作为待检的目标图片。
步骤3:字符识别模块识别目标图片中叠加的字符信息,对字符区域进行分割,按规范要求分别提取字符区域的字符的颜色,字符位置及大小,字体及识别的文字等信息。
步骤4:检测模块依据标准图片的字符状态,对提取的目标图片字符的颜色,字符位置及大小、字体是否规范进行验证。
步骤5:,对每一个区域字符的像素的颜色值与规定字符颜色进行对比,采用RGB转换为LAB颜色空间计算该点色差,验证字符颜色符合性,在色差范围内的认为字符颜色符合,否则为不符合。
步骤6:根据字符识别的内容确定当前叠加的信息是否准确。
步骤7:遍历目标图片字符叠加区域中的所有字符像素坐标,判断是否满足标准字符区域内要求的像素点坐标要求。
步骤8:通过指令模块向目标图片发送与标准图片叠加字符一致的字符内容。双向校验目标图片字符与标准图片中对应叠加字符的偏差,并计算偏差率,判断是否符合规范要求。
本实施方式提出的轨道交通视频字符叠加规范性检测方法提高了字符检测系统的自动化程度,避免了人工核验带来的主观因素的影响,减少了人力成本,为轨道交通安全运营提供了重要保障。
本实施方式提出的轨道交通视频字符叠加规范性检测方法包含指令模模块、流媒体模块、字符识别模块和规范性检测模块,通过先提取字符局部区域再进行规范性检测的方案极大的避免了对原始图像无关区域的无效计算,提高了轨道交通视频图像字符叠加规范性检测系统的工作效率。
本实施方式将字符规范性检测进一步细化为字符的颜色检测、位置及尺寸检测和字体规范性检测,极大的提高了轨道交通视频检测系统的标准化及规范化。
本实施方式采用模块化设计,可根据不同应用场景下系统对视频叠加字符的不同要求灵活调整检测模块,提高了检测方法的通用性和适应性。
字符的识别与提取:
轨道交通视频图像上叠加的字符包括摄像机名称、时间信息、控制者信息,分别叠加在摄像机的不同区域,所以在进行规范性检测之前需要识别并提取字符,其流程具体如下:
1.字符识别模块识别图片中叠加的字符信息,对前景字符区域进行分割,去除背景区域,将背景区域RGB置为与标准字符无关的颜色,如RGB(0,255,0)。
2.获取不同区域字符的像素位置:
SeqPt(n)={pt[0],pt[1],...,pt[k]}
3.获取字符所在像素位置对应像素的RGB值:
SeqRGB(n)={(R0,G0,B0),(R1,G1,B1),...,(Rk,Gk,Bk)}
4.获取不同区域叠加字符内容:
SeqOCR(n)
字符的颜色检测:
为验证字符颜色符合性,对每一个区域字符的像素的颜色值与规定字符颜色进行对比,在色差范围内的认为字符颜色符合,否则为不符合。
对于字符中某单个像素点的RGB值为(Rk,Gk,Bk),标准RGB值为采用RGB转换为LAB颜色空间计算该点色差ΔE,具体公式如下:
基于人眼对颜色的感知,一般的建议色差至ΔE<30。
字符的位置及尺寸检测:
首先根据字符识别的内容SeqOCR(n)确定当前叠加的时钟信息是否准确,且是否叠加在对应的位置。
遍历目标图片字符叠加区域中的所有字符像素坐标,应足标准字符区域内要求的像素点坐标要求。
叠加字符信息的标准区域为Δpt(Δx,Δy),标准区域内像素点坐标位于标准区域的可表示为pt(x,y)∈Δpt(Δx,Δy),即应符合如下公式:
目标图片叠加字符的任意字符像素坐标pt[k]=(xk,yk)均应满足pt[k](xk,yk)∈Δpt(Δx,Δy)。
根据规范要求,用于视频图像的时钟信息应叠加在视频图像的右下方,描述字符下沿距视频底边缘为1个字符,最右边字符距视频右边缘为1个字符。时钟信息描述格式采用“YYYY-MM-DD hh:mm:ss”,日和时之间距1汉字字符,其中YYYY为4位数字(2个汉字字符),表示年;MM为2位数字(1个汉字字符),表示月;DD为2位数字(1个汉字字符),表示日;hh为2位数字(1个汉字字符),以24小时制表示小时;mm为2位数字(1个汉字字符),表示分钟;ss为2位数字(1个汉字字符),“-”和“:”和为半角符号每个为(1/2个汉字字符)。时钟信息字符长度共为10个汉字字符。
1080P模式下的1个字符标准大小为72x72像素,要求字符位置、大小偏差不超过1个字符标准大小的1/20,即3.6个像素。
根据上述要求,时钟信息标准区域内像素点坐标位于时钟信息的标准区域应满足:
类似的规范要求的摄像机名称、云镜控制者等字符叠加信息应准确,且叠加区域坐标均应满足其对应规范要求的标准区域。
本实施方式中,字符的字体规范性检测:
通过指令模块向目标图片发送与标准图片叠加字符一致的字符内容。
同样的对标准图片叠加字符的信息进行文字识别预处理,提取标准摄像机名称、时间信息、控制者信息区域字符的像素位置:
获取字符所在像素位置对应像素的RGB值:
对目标图片和标准图片的前景文字图片进行双向校验。
以标准图片的前景文字图片为母版,遍历标准图片中的字符所占n个像素位置的RGB值依次提取目标图像中对应像素位置的RGB值进行比较,记录颜色偏差情况,并记录偏差占比,如下公式:
同样的,以目标图片的前景文字图片作为母版,遍历目标图片中的字符所占m个像素位置的RGB值SeqRGB(m),依次提取标准图像中对应像素位置的RGB值进行比较,记录颜色偏差情况,并记录偏差占比,如下公式:
一般的,建议双向校验后的偏差占比不超过5%,即e1<5%且e2<5%。
图4是根据本发明实施例的一种叠加字符的检测装置的示意图,如图4所示,根据本发明实施例的另一方面,还提供了一种叠加字符的检测装置,包括:获取模块42,识别模块44,比对模块46和确定模块48,下面对该装置进行详细说明。
获取模块42,用于获取图像,其中,图像中包括有叠加字符;识别模块44,与上述获取模块42相连,用于对图像中的叠加字符所在的区域进行识别,确定叠加字符的像素和像素坐标;比对模块46,与上述识别模块44相连,用于将像素与预先存储的标准像素进行比对,以及判断像素坐标是否满足区域的像素点坐标要求;确定模块48,与上述比对模块46相连,用于在叠加字符的像素与预先存储的叠加字符的标准像素相同,且叠加字符的像素坐标均满足指定区域的像素点坐标要求的情况下,确定叠加字符正常。
通过上述装置,采用获取模块42获取图像,其中,图像中包括有叠加字符;识别模块44对图像中的叠加字符所在的区域进行识别,确定叠加字符的像素和像素坐标;比对模块46将像素与预先存储的标准像素进行比对,以及判断像素坐标是否满足区域的像素点坐标要求;确定模块48在像素与预先存储的叠加字符的标准像素相匹配,且叠加字符的像素坐标均满足指定区域的像素点坐标要求的情况下,确定叠加字符正常的方式,通过对叠加字符的像素和像素坐标与标准像素和像素点坐标要求进行对比,确定上述叠加字符是否正常,符合规范性的要求,达到了对叠加字符的规范性进行有效检测的目的,从而实现了提高了叠加字符的规范性检测准确性和效率的技术效果,进而解决了相关技术中人工对图像的叠加字符进行的规范性检测方式,检测准确性较差,效率较低的技术问题。
根据本发明实施例的另一方面,还提供了一种存储介质,存储介质包括存储的程序,其中,在程序运行时控制存储介质所在设备执行上述中任意一项的叠加字符的检测方法。
根据本发明实施例的另一方面,还提供了一种处理器,处理器用于运行程序,其中,程序运行时执行上述中任意一项的叠加字符的检测方法。
上述本发明实施例序号仅仅为了描述,不代表实施例的优劣。
在本发明的上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述的部分,可以参见其他实施例的相关描述。
在本申请所提供的几个实施例中,应该理解到,所揭露的技术内容,可通过其它的方式实现。其中,以上所描述的装置实施例仅仅是示意性的,例如所述单元的划分,可以为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,单元或模块的间接耦合或通信连接,可以是电性或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可为个人计算机、服务器或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、移动硬盘、磁碟或者光盘等各种可以存储程序代码的介质。
以上所述仅是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本发明的保护范围。

Claims (9)

1.一种叠加字符的检测方法,其特征在于,包括:
获取图像,其中,所述图像中包括有叠加字符;
对所述图像中的所述叠加字符所在的区域进行识别,确定所述叠加字符的像素和像素坐标;
将所述像素与预先存储的标准像素进行比对,以及判断所述像素坐标是否满足所述区域的像素点坐标要求;
在所述像素与预先存储的叠加字符的标准像素相匹配,且所述叠加字符的像素坐标均满足所述区域的像素点坐标要求的情况下,确定所述叠加字符正常;
其中,将所述像素与预先存储的标准像素进行比对包括:
计算所述像素与所述标准像素的色差;
在所述色差不超过预设色差范围的情况下,确定所述叠加字符的像素与预先存储的叠加字符的标准像素相匹配。
2.根据权利要求1所述的方法,其特征在于,确定所述叠加字符正常之后,还包括:
对所述区域的叠加字符进行识别,确定所述叠加字符的文本信息;
将所述文本信息与预先存储的标准文本进行比对,在所述文本信息与所述标准文本相同的情况下,确定所述叠加字符的信息准确。
3.根据权利要求2所述的方法,其特征在于,对所述图像中的所述叠加字符所在的区域进行识别,确定所述叠加字符的像素和像素坐标包括:
去除所述区域的背景区域,确定所述区域的前景字符区域;
对所述前景字符区域进行分割,确定多个包含叠加字符的子区域;
确定不同子区域字符的像素位置:
SeqPt(n)={pt[0],pt[1],…,pt[k]}
确定所述叠加字符所在像素位置对应像素的RGB值:
SeqRGB(n)={(R0,G0,B0),(R1,G1,B1),…,(Rk,Gk,Bk)}
式中,pt[k]代表所述叠加字符的第k个像素的位置,k为所述叠加字符的像素的数量;(Rk,Gk,Bk)代表所述叠加字符的第k个像素的R像素值,G像素值,B像素值;
对所述区域的叠加字符进行识别,确定所述图像中的叠加字符的文本信息包括:
获取不同区域叠加字符文本信息:
SeqOCR(n)
式中,n为通过光学识别字符技术OCR识别的字符数量。
4.根据权利要求3所述的方法,其特征在于,计算所述像素与所述标准像素的色差包括:
通过下式计算所述色差ΔE:
式中,Rk代表所述叠加字符的第k个像素的R像素值,Gk代表所述叠加字符的第k个像素的G像素值,Bk代表所述叠加字符的第k个像素的B像素值;代表所述叠加字符的标准像素的R像素值,/>代表所述叠加字符的标准像素的G像素值,/>代表所述叠加字符的标准像素的B像素值。
5.根据权利要求4所述的方法,其特征在于,将所述叠加字符的像素坐标与所述区域的像素点坐标要求进行比对包括:
所述叠加字符的标准区域为Δpt(Δx,Δy),标准区域内像素点坐标位于标准区域表示为pt(x,y)∈Δpt(Δx,Δy),通过下式确定所述叠加字符的像素坐标与所述区域的像素点坐标要求:
所述叠加字符的像素坐标满足上式,确定所述叠加字符的像素坐标与所述区域的像素点坐标要求。
6.根据权利要求1所述的方法,其特征在于,确定所述叠加字符正常之后,还包括:
向所述图像的发送端,发送所述图像的所述叠加字符对应的标准图像的标准字符,其中,所述准图像的标准字符用于所述发送端进行比对和验证;
接收所述发送端返回的比对和验证结果;
根据所述比对和验证结果,统计所述叠加字符的偏差率。
7.一种叠加字符的检测装置,其特征在于,包括:
获取模块,用于获取图像,其中,所述图像中包括有叠加字符;
识别模块,用于对所述图像中的所述叠加字符所在的区域进行识别,确定所述叠加字符的像素和像素坐标;
比对模块,用于将所述像素与预先存储的标准像素进行比对,以及判断所述像素坐标是否满足所述区域的像素点坐标要求;
确定模块,用于在所述叠加字符的像素与预先存储的叠加字符的标准像素相同,且所述叠加字符的像素坐标均满足所述区域的像素点坐标要求的情况下,确定所述叠加字符正常;
其中,比对模块还用于计算所述像素与所述标准像素的色差,在所述色差不超过预设色差范围的情况下,确定所述叠加字符的像素与预先存储的叠加字符的标准像素相匹配。
8.一种存储介质,其特征在于,所述存储介质包括存储的程序,其中,在所述程序运行时控制所述存储介质所在设备执行权利要求1至6中任意一项所述的叠加字符的检测方法。
9.一种处理器,其特征在于,所述处理器用于运行程序,其中,所述程序运行时执行权利要求1至6中任意一项所述的叠加字符的检测方法。
CN202010470333.6A 2020-05-28 2020-05-28 叠加字符的检测方法及装置 Active CN111598102B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010470333.6A CN111598102B (zh) 2020-05-28 2020-05-28 叠加字符的检测方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010470333.6A CN111598102B (zh) 2020-05-28 2020-05-28 叠加字符的检测方法及装置

Publications (2)

Publication Number Publication Date
CN111598102A CN111598102A (zh) 2020-08-28
CN111598102B true CN111598102B (zh) 2023-08-22

Family

ID=72189530

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010470333.6A Active CN111598102B (zh) 2020-05-28 2020-05-28 叠加字符的检测方法及装置

Country Status (1)

Country Link
CN (1) CN111598102B (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113784067B (zh) * 2021-09-07 2023-07-28 浙江大华技术股份有限公司 字符叠加方法及装置、存储介质、电子装置

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0327488A (ja) * 1989-06-26 1991-02-05 Oki Electric Ind Co Ltd 文字認識装置
KR101287190B1 (ko) * 2012-06-04 2013-07-17 주식회사 로드코리아 영상감시장치의 촬영 위치 자동 추적 방법
CN106446889A (zh) * 2015-08-10 2017-02-22 Tcl集团股份有限公司 一种台标的本地识别方法和装置
CN106529529A (zh) * 2016-10-31 2017-03-22 腾讯科技(深圳)有限公司 一种视频字幕识别方法及系统
CN109030384A (zh) * 2018-07-04 2018-12-18 中国航空制造技术研究院 一种在线监测打磨质量的方法
CN110298250A (zh) * 2019-05-30 2019-10-01 广东爱贝佳科技有限公司 一种书写评分及纠错方法和交互式系统

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104298982B (zh) * 2013-07-16 2019-03-08 深圳市腾讯计算机系统有限公司 一种文字识别方法及装置

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0327488A (ja) * 1989-06-26 1991-02-05 Oki Electric Ind Co Ltd 文字認識装置
KR101287190B1 (ko) * 2012-06-04 2013-07-17 주식회사 로드코리아 영상감시장치의 촬영 위치 자동 추적 방법
CN106446889A (zh) * 2015-08-10 2017-02-22 Tcl集团股份有限公司 一种台标的本地识别方法和装置
CN106529529A (zh) * 2016-10-31 2017-03-22 腾讯科技(深圳)有限公司 一种视频字幕识别方法及系统
CN109030384A (zh) * 2018-07-04 2018-12-18 中国航空制造技术研究院 一种在线监测打磨质量的方法
CN110298250A (zh) * 2019-05-30 2019-10-01 广东爱贝佳科技有限公司 一种书写评分及纠错方法和交互式系统

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
一种基于边缘检测和线条特征的视频字符检测算法;刘洋等;《计算机学报》;第427-433页 *

Also Published As

Publication number Publication date
CN111598102A (zh) 2020-08-28

Similar Documents

Publication Publication Date Title
CN104506621A (zh) 一种采用视频标注进行远程指导的方法
EP3220636A1 (en) Video monitoring method and device
CN111598102B (zh) 叠加字符的检测方法及装置
CN108765935A (zh) 一种行人闯红灯违章处理系统及其方法
CN105550663A (zh) 影院上座率统计方法及系统
CN103985158A (zh) 火车票一体化自动闸机和自动验证方法
CN109101925A (zh) 活体检测方法
CN104537664A (zh) 一种基于背景比对的监控摄像头异常情况进行判别方法
CN111612088B (zh) 叠加字符的图像的检测方法及装置
CN115278217A (zh) 图像画面检测方法、装置、电子设备及存储介质
CN106257493B (zh) 交通优惠卡冒用识别方法及识别系统
CN111126378B (zh) 一种视频osd提取与覆盖区域重建的方法
CN112037235B (zh) 伤情图片自动化审核方法、装置、电子设备及存储介质
CN111582278A (zh) 人像分割方法、装置及电子设备
CN109815848A (zh) 停车场安全预警系统及方法
WO2015167202A1 (ko) 차량번호 실사화 장치, 방법 및 이를 이용한 차량번호 판독시스템
CN109165637B (zh) 一种基于动态视频分析的身份识别方法及系统
CN111988569A (zh) 一种变电站工业视频监控画面着火现象监控方法及系统
CN112818759A (zh) 一种交通安全管控方法及系统
CN106778573A (zh) 一种智能铁路安检安防管理系统
CN110443906A (zh) 一种考勤信息呈现的方法、装置及移动终端
KR101040791B1 (ko) 부정승하차 단속 시스템 및 그 방법
KR20170120910A (ko) 광고 연동 서비스 제공 방법 및 기록매체
CN110796826A (zh) 一种用于识别烟雾火焰的报警方法及系统
US20230401847A1 (en) System and Method to Create Configurable, Context Sensitive Functions in AR Experiences

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant