CN103034855A - 在图像中识别字符区域的方法 - Google Patents
在图像中识别字符区域的方法 Download PDFInfo
- Publication number
- CN103034855A CN103034855A CN2012105181536A CN201210518153A CN103034855A CN 103034855 A CN103034855 A CN 103034855A CN 2012105181536 A CN2012105181536 A CN 2012105181536A CN 201210518153 A CN201210518153 A CN 201210518153A CN 103034855 A CN103034855 A CN 103034855A
- Authority
- CN
- China
- Prior art keywords
- zone
- image
- pixel
- color
- character
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Landscapes
- Facsimile Image Signal Circuits (AREA)
Abstract
本发明提供了一种在图像中识别字符区域的方法,包括以下步骤:步骤S1:建立图像的彩色直方图;以及步骤S2:根据彩色直方图上的像素点密度区分图像上的字符区域和非字符区域。通过本发明所提供的在图像中识别字符区域的方法,能够更准确地在图像中识别字符区域,从而能够应对较为复杂的识别需要。
Description
技术领域
本发明基本上涉及图像处理领域,更具体地来说,涉及一种在图像中识别字符区域的方法。
背景技术
在如今的计算机应用中,经常需要将视频或者静态图片中的字符信息提取出来,这就在技术实现上提出了更高的要求。
现有技术提供了一种视频字幕提取的方法,包括以下步骤:(1)对视频字幕区域进行基于连通区统计的字幕颜色判断,确认字幕颜色是深色还是浅色,同时反转浅色字幕的灰度图片为深色字幕图片;(2)对步骤(1)获得的灰度图片进行基于局部窗口分析的灰度图片二值化;(3)进行OCR软件识别,提取字幕文本结果。
上述现有技术使用了字幕文字颜色判断和局部阈值的方法,能取得较好的二值化效果,然而,该现有技术通过深色和浅色对于字幕区域进行判断,准确度不高,无法应对较为复杂的识别需要。
发明内容
针对现有技术准确度不高,无法应对较为复杂的识别需要的缺陷,本发明提供了一种在图像中识别字符区域的方法。通过本发明所描述的技术方案,解决了如何更精确地在图像中识别字符区域的技术问题。
本发明提供了一种在图像中识别字符区域的方法,其特征在于,包括:步骤S1:建立所述图像的彩色直方图;以及步骤S2:根据所述彩色直方图上的像素点密度识别所述图像上的字符区域和非字符区域。
优选地,所述步骤S2包括:步骤S21:如果所述彩色直方图上只具有一个像素点聚集区域,则所述像素点聚集区域中的直方图坐标点所表示的颜色是字符颜色;以及步骤S22:将所述图像中的所述字符颜色的区域识别为字符区域,其他区域为非字符区域。
优选地,所述步骤S2包括:步骤S21:如果所述彩色直方图上具有两个像素点聚集区域,则所述两个像素点聚集区域中的第一像素点聚集区域中的直方图坐标点所表示的颜色是字符颜色,所述两个像素点聚集区域中的第二像素点聚集区域中的直方图坐标点所表示的颜色是非字符颜色;以及步骤S22:将所述图像中的所述字符颜色的区域识别为字符区域,并且将所述图像中的所述非字符颜色的区域识别为非字符区域。
优选地,所述第一像素点聚集区域中的像素点多于所述第二像素点聚集区域中的像素点。
优选地,所述像素点聚集区域为像素点密度大于预定密度阈值的区域。
优选地,所述像素点聚集区域为像素点占所述图像中的所有像素点的比例大于预定比例阈值的区域。
优选地,还包括:对所述图像进行二值化处理。
优选地,所述预定比例阈值为20%至30%。
优选地,所述彩色直方图的像素为256*256*256。
通过本发明所提供的在图像中识别字符区域的方法,能够更准确地在图像中识别字符区域,从而能够应对较为复杂的识别需要。
附图说明
附图用来提供对本发明的进一步理解,并且构成说明书的一部分,与本发明的实施例一起用于解释本发明,并不构成对本发明的限制。在附图中:
图1是根据本发明的实施例的在图像中识别字符区域的方法的总体流程图;
图2是根据本发明的一个具体实施例的在图像中识别字符区域的方法的流程图;
图3是根据本发明的另一个具体实施例的在图像中识别字符区域的方法的流程图。
具体实施方式
以下结合附图对本发明的优选实施例进行说明,应当理解,此处所描述的优选实施例仅用于说明和解释本发明,并不用于限定本发明。
图1是根据本发明的实施例的在图像中识别字符区域的方法的总体流程图。在图1中:
步骤S100:建立图像的彩色直方图。在一个优选实施例中,该彩色直方图的像素为256*256*256。
步骤S102:根据彩色直方图上的像素点密度区分图像上的字符区域和非字符区域。具体来说,彩色直方图中的每个直方图坐标点均代表了一种颜色,而每个直方图坐标点上均标记有数字,这个数字代表了在图像上有多少个像素点的颜色是这个直方图坐标点所表示的颜色。可以通过两种具体方式来实现该步骤,这两种方式将在以下两个具体实施例中示出。
通过本发明所描述的在图像中识别字符区域的方法,能够更准确地在图像中识别字符区域,从而能够应对较为复杂的识别需要。
图2是根据本发明的一个具体实施例的在图像中识别字符区域的方法的流程图。步骤S200和步骤S100相同,在此不再赘述。此外,在图2中还包括以下步骤:
步骤S202:如果彩色直方图上具有一个像素点聚集区域,则像素点聚集区域中的直方图坐标点所表示的颜色是字符颜色。其中,可以通过两种方式来判断一个区域是否是像素点聚集区域:在第一种方式中,该像素点聚集区域被限定为像素点密度大于预定密度阈值的区域,其中,该像素点密度是在彩色直方图的坐标系中的单位体积中所包含的图像的像素点的数量;在第二种方式中,该像素点聚集区域为像素点占图像中的所有像素点的比例大于预定比例阈值的区域,也就是说,在该像素点聚集区域中,像素点的数量所占全部像素点的数量的比例达到了一定程度。
优选地,该预定比例阈值为20%至30%。
在本实施例中,由于有且只有一个区域是像素点聚集区域,也就是只有该区域所包含的像素点的数量达到了一定程度,因此,可以认为该区域中的颜色是字符颜色,即步骤S204:将图像中的字符颜色的区域识别为字符区域,其他区域为非字符区域。
通过本实施例所描述的在图像中识别字符区域的方法,能够更准确地在图像中识别字符区域,从而能够应对较为复杂的识别需要。
图3是根据本发明的另一个具体实施例的在图像中识别字符区域的方法的流程图。步骤S300和步骤S100相同,在此不再赘述。此外,在图3中还包括以下步骤:
步骤S302:如果彩色直方图上具有两个像素点聚集区域,则两个像素点聚集区域中的第一像素点聚集区域中的直方图坐标点所表示的颜色是字符颜色,两个像素点聚集区域中的第二像素点聚集区域中的直方图坐标点所表示的颜色是非字符颜色。
其中,可以通过两种方式来判断一个区域是否是像素点聚集区域(包括第一像素点聚集区域和第二像素点聚集区域):在第一种方式中,该像素点聚集区域被限定为像素点密度大于预定密度阈值的区域,其中,该像素点密度是在彩色直方图的坐标系中的单位体积中所包含的图像的像素点的数量;在第二种方式中,该像素点聚集区域为像素点占图像中的所有像素点的比例大于预定比例阈值的区域,也就是说,在该像素点聚集区域中,像素点的数量所占全部像素点的数量的比例达到了一定程度。
优选地,该预定比例阈值为20%至30%。
在本实施例中,由于有两个区域是像素点聚集区域,也就是说有两个区域所包含的像素点的数量达到了一定程度,因此,可以认为这两个区域中的颜色是一种字符颜色,另一种是非字符颜色(即,背景颜色),即步骤S304:将图像中的字符颜色的区域识别为字符区域,并且将图像中的非字符颜色的区域识别为非字符区域。
通过本实施例所描述的在图像中识别字符区域的方法,能够更准确地在图像中识别字符区域,从而能够应对较为复杂的识别需要。
以上所描述的内容仅为本发明的优选实施例而已,并不用于限制本发明,对于本领域的技术人员来说,本发明可以有各种更改和变化。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
Claims (9)
1.一种在图像中识别字符区域的方法,其特征在于,包括:
步骤S1:建立所述图像的彩色直方图;以及
步骤S2:根据所述彩色直方图上的像素点密度识别所述图像上的字符区域和非字符区域。
2.根据权利要求1中所述的在图像中识别字符区域的方法,其特征在于,所述步骤S2包括:
步骤S21:如果所述彩色直方图上只具有一个像素点聚集区域,则所述像素点聚集区域中的直方图坐标点所表示的颜色是字符颜色;以及
步骤S22:将所述图像中的所述字符颜色的区域识别为字符区域。
3.根据权利要求1中所述的在图像中识别字符区域的方法,其特征在于,所述步骤S2包括:
步骤S21:如果所述彩色直方图上具有两个像素点聚集区域,则所述两个像素点聚集区域中的第一像素点聚集区域中的直方图坐标点所表示的颜色是字符颜色,所述两个像素点聚集区域中的第二像素点聚集区域中的直方图坐标点所表示的颜色是非字符颜色;以及
步骤S22:将所述图像中的所述字符颜色的区域识别为字符区域,并且将所述图像中的所述非字符颜色的区域识别为非字符区域。
4.根据权利要求3中所述的在图像中识别字符区域的方法,其特征在于,所述第一像素点聚集区域中的像素点多于所述第二像素点聚集区域中的像素点。
5.根据权利要求2-4中的任一项所述的在图像中识别字符区域的方法,其特征在于,所述像素点聚集区域为像素点密度大于预定密度阈值的区域。
6.根据权利要求2-4中的任一项所述的在图像中识别字符区域的方法,其特征在于,所述像素点聚集区域为像素点占所述图像中的所有像素点的比例大于预定比例阈值的区域。
7.根据权利要求1中所述的在图像中识别字符区域的方法,其特征在于,还包括:对所述图像进行二值化处理。
8.根据权利要求6中所述的在图像中识别字符区域的方法,其特征在于,所述预定比例阈值为20%至30%。
9.根据权利要求1中所述的在图像中识别字符区域的方法,其特征在于,所述彩色直方图的像素为256*256*256。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN2012105181536A CN103034855A (zh) | 2012-12-05 | 2012-12-05 | 在图像中识别字符区域的方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN2012105181536A CN103034855A (zh) | 2012-12-05 | 2012-12-05 | 在图像中识别字符区域的方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN103034855A true CN103034855A (zh) | 2013-04-10 |
Family
ID=48021734
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN2012105181536A Pending CN103034855A (zh) | 2012-12-05 | 2012-12-05 | 在图像中识别字符区域的方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN103034855A (zh) |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104281850A (zh) * | 2013-07-09 | 2015-01-14 | 腾讯科技(深圳)有限公司 | 一种文字区域识别方法和装置 |
CN107239784A (zh) * | 2017-07-03 | 2017-10-10 | 福建中金在线信息科技有限公司 | 一种图片识别方法、装置、电子设备及可读存储介质 |
CN112735476A (zh) * | 2020-12-29 | 2021-04-30 | 北京声智科技有限公司 | 一种音频数据标注方法及装置 |
CN117336548A (zh) * | 2023-10-16 | 2024-01-02 | 北京百度网讯科技有限公司 | 一种视频编码的处理方法、装置、设备及存储介质 |
Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2001043313A (ja) * | 1999-07-30 | 2001-02-16 | Toshiba Corp | 文字切出し方法 |
CN1419679A (zh) * | 2000-03-14 | 2003-05-21 | 英特尔公司 | 估计文本颜色和图像的分割 |
CN1790377A (zh) * | 2004-12-17 | 2006-06-21 | 佳能株式会社 | 反白字符识别、快速准确的块分类方法和文本行生成方法 |
CN101154270A (zh) * | 2006-09-30 | 2008-04-02 | 电子科技大学中山学院 | 基于补偿原理和中心区域扫描的车牌二值化方法 |
JP2008143313A (ja) * | 2006-12-08 | 2008-06-26 | Mitsubishi Steel Mfg Co Ltd | 中空スタビライザ |
CN101360175A (zh) * | 2007-07-31 | 2009-02-04 | 夏普株式会社 | 图像处理方法、图像处理装置、图像形成装置及读取装置 |
CN101714257A (zh) * | 2009-12-23 | 2010-05-26 | 公安部第三研究所 | 图像主颜色特征提取和结构化描述的方法 |
CN102737238A (zh) * | 2011-04-01 | 2012-10-17 | 洛阳磊石软件科技有限公司 | 基于手势动作的字符识别系统、方法、及其应用 |
-
2012
- 2012-12-05 CN CN2012105181536A patent/CN103034855A/zh active Pending
Patent Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2001043313A (ja) * | 1999-07-30 | 2001-02-16 | Toshiba Corp | 文字切出し方法 |
CN1419679A (zh) * | 2000-03-14 | 2003-05-21 | 英特尔公司 | 估计文本颜色和图像的分割 |
CN1790377A (zh) * | 2004-12-17 | 2006-06-21 | 佳能株式会社 | 反白字符识别、快速准确的块分类方法和文本行生成方法 |
CN101154270A (zh) * | 2006-09-30 | 2008-04-02 | 电子科技大学中山学院 | 基于补偿原理和中心区域扫描的车牌二值化方法 |
JP2008143313A (ja) * | 2006-12-08 | 2008-06-26 | Mitsubishi Steel Mfg Co Ltd | 中空スタビライザ |
CN101360175A (zh) * | 2007-07-31 | 2009-02-04 | 夏普株式会社 | 图像处理方法、图像处理装置、图像形成装置及读取装置 |
CN101714257A (zh) * | 2009-12-23 | 2010-05-26 | 公安部第三研究所 | 图像主颜色特征提取和结构化描述的方法 |
CN102737238A (zh) * | 2011-04-01 | 2012-10-17 | 洛阳磊石软件科技有限公司 | 基于手势动作的字符识别系统、方法、及其应用 |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104281850A (zh) * | 2013-07-09 | 2015-01-14 | 腾讯科技(深圳)有限公司 | 一种文字区域识别方法和装置 |
CN104281850B (zh) * | 2013-07-09 | 2020-01-31 | 腾讯科技(深圳)有限公司 | 一种文字区域识别方法和装置 |
CN107239784A (zh) * | 2017-07-03 | 2017-10-10 | 福建中金在线信息科技有限公司 | 一种图片识别方法、装置、电子设备及可读存储介质 |
CN112735476A (zh) * | 2020-12-29 | 2021-04-30 | 北京声智科技有限公司 | 一种音频数据标注方法及装置 |
CN117336548A (zh) * | 2023-10-16 | 2024-01-02 | 北京百度网讯科技有限公司 | 一种视频编码的处理方法、装置、设备及存储介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN103955660B (zh) | 一种批量二维码图像识别方法 | |
CN108764352B (zh) | 重复页面内容检测方法和装置 | |
WO2019223586A1 (zh) | 车位使用状况的检测方法、装置、电子设备及存储介质 | |
KR102595704B1 (ko) | 영상 검측 방법, 장치, 전자 기기, 저장 매체 및 프로그램 | |
CN103067736B (zh) | 一种基于字符识别的自动测试系统 | |
CN104732227B (zh) | 一种基于清晰度和亮度评估的车牌快速定位方法 | |
CN104616021B (zh) | 交通标志图像处理方法及装置 | |
CN101122953B (zh) | 一种图片文字分割的方法 | |
CN110488368B (zh) | 一种基于双能x光安检机的违禁品识别方法及装置 | |
CN107256379B (zh) | 基于图像识别的信息采集方法、移动终端及存储介质 | |
CN103310422B (zh) | 获取图像的方法及装置 | |
CN101599175B (zh) | 确定拍摄背景发生改变的检测方法及图像处理设备 | |
US9171224B2 (en) | Method of improving contrast for text extraction and recognition applications | |
US9235779B2 (en) | Method and apparatus for recognizing a character based on a photographed image | |
KR102002024B1 (ko) | 객체 라벨링 처리 방법 및 객체 관리 서버 | |
CN103366170A (zh) | 图像二值化处理装置及其方法 | |
CN108615030B (zh) | 一种标题一致性检测方法、装置及电子设备 | |
US20160012796A1 (en) | Method and system for replacing theme of a mobile terminal on the basis of a user's clothes color | |
US20150356952A1 (en) | Apparatus and method for performing image content adjustment according to viewing condition recognition result and content classification result | |
CN107659799B (zh) | 摄像装置、图像处理方法和存储介质 | |
CN103034855A (zh) | 在图像中识别字符区域的方法 | |
CN106203454A (zh) | 证件版式分析的方法及装置 | |
CN103618892A (zh) | 电视机的检测方法及电视机 | |
CN104463134A (zh) | 一种车牌检测方法和系统 | |
CN103854019A (zh) | 图像中的字段提取方法及装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20130410 |
|
RJ01 | Rejection of invention patent application after publication |