JP2014153820A - 文字切り出し装置及び文字切り出し方法 - Google Patents
文字切り出し装置及び文字切り出し方法 Download PDFInfo
- Publication number
- JP2014153820A JP2014153820A JP2013021483A JP2013021483A JP2014153820A JP 2014153820 A JP2014153820 A JP 2014153820A JP 2013021483 A JP2013021483 A JP 2013021483A JP 2013021483 A JP2013021483 A JP 2013021483A JP 2014153820 A JP2014153820 A JP 2014153820A
- Authority
- JP
- Japan
- Prior art keywords
- character
- pixel value
- minimum pixel
- image data
- unit
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/40—Document-oriented image-based pattern recognition
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/14—Image acquisition
- G06V30/148—Segmentation of character regions
- G06V30/153—Segmentation of character regions using recognition of characters or words
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/18—Extraction of features or characteristics of the image
- G06V30/18086—Extraction of features or characteristics of the image by performing operations within image blocks or by using histograms
- G06V30/18095—Summing image-intensity values; Projection and histogram analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
Landscapes
- Engineering & Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Multimedia (AREA)
- Theoretical Computer Science (AREA)
- Artificial Intelligence (AREA)
- Character Input (AREA)
Abstract
【解決手段】文字切り出し装置は、線図形等が存在する文字列を撮像して得られた多値画像データを処理して、文字列を形成する文字を切り出す文字切り出し部82を有し、文字切り出し部82は、多値画像データにおいて、文字列方向と直交する方向の画素列を構成する画素の中で最も小さい画素値を抽出して最小画素値曲線を作成する最小画素値曲線作成部821と、最小画素値曲線に基づき、文字の区切り位置を決定する文字区切り位置決定部822と、最小画素値曲線から線図形等を示す最小画素値を検出して二値化しきい値を求め、多値画像データの二値化処理を行う二値化処理部823と、各文字の画像データを抽出する文字切り出し実行部と、を備えている。
【選択図】図1
Description
図3は、文字認識装置における文字認識部8の機能構成を示すブロック図である。
各文字両端位置検出部は、左から2番目の文字から右端の1つ手前の文字までの各文字について、各文字の両端位置を検出する。文字数計数部は、各文字の両端位置が所定の範囲(文字幅)に入っているか否かを判定する。実施例では、文字数計数部は、切り出された文字に従って、識別文字列が記されているべき領域内にある文字の数が予め定められた数と一致するか否かを判定している。文字数計数部は、識別文字列が記されているべき領域内にある文字の数が予め定められた数と一致すると判定された場合には、運転免許証40の画像の方向が正立方向であると判定する。
次に、本実施形態に係る文字認識装置の全体的な動作について図6に関連付けて説明する。図6は、本実施形態に係る文字切り出し装置としての文字認識装置の動作を説明するためのフローチャートである。
また、後述で詳細に説明するが、図8の文字区切り処理の詳細について、図9に関連付けて説明する。
次に、文字列切り出し処理について図7に関連付けて説明する。図7は、本実施形態に係る文字列切り出し処理を示すフローチャートである。
次に、文字切り出し処理について図8に関連付けて説明する。図8は、本実施形態に係る文字切り出し処理を示すフローチャートである。
図8の文字区切り処理(ステップS42)の詳細について、図9に示すフローチャートを参照しつつ説明する。図9は、本実施形態に係る文字区切り処理を示すフローチャートである。
Xc(12)=(Xsl+Xsr)/2 …(1)
Xer=Xsl+Dx …(2)
Xc(1)=(Xel+Xer)/2 …(3)
Dc=(Xc(1)−Xc(12))/11 …(4)
Xc(k)=Xc(1)−(k−1)*Dc …(5)
文字区切り位置決定部822において文字区切り処理が実行された後、二値化処理部823において文字切り出し処理のための二値化処理を実行する。
本発明の文字切り出し装置及び文字切り出し方法は、運転免許証に記載された文字領域に斜線が存在する文字列を画像データとして読み取って文字認識する際に、画像データを回転する操作、すなわち座標変換を伴わないため計算負荷が軽く、装置のコストを低く抑えつつ、処理時間の短縮につなげることができる。また、本装置は、回転文字用の辞書を備えなくてよいので、余分な記憶域が不要となる。さらに、本発明は、文字と文字との間に形成された空白区間における斜線部分の最小画素値を求めてこれを閾値とするため、斜線画素が黒領域にマップされることが確実に排除されるため、文字認識にとって望ましい二値化画像を得ることができる。
上述した実施形態は、本発明の実施の一例に過ぎず、以下のように変形させてもよい。また、上述した実施形態及び以下に示す変形例は、必要に応じて組み合わせて実施してもよい。
Claims (6)
- 情報記録媒体上の線図形等が存在する文字列を撮像して得られた多値画像データを処理して、前記文字列を形成する文字を切り出す文字切り出し部を有する文字切り出し装置であって、
前記文字切り出し部は、
前記多値画像データにおいて、文字列方向と直交する方向に配置された画素列を構成する画素の中で最も小さい画素値を抽出して最小画素値曲線を作成する最小画素値曲線作成部と、
前記最小画素値曲線に基づき、前記文字の区切り位置を決定する文字区切り位置決定部と、
前記最小画素値曲線から前記線図形等を示す最小画素値を検出し、この最小画素値に基づき二値化しきい値を求め、この二値化しきい値を用いて前記多値画像データの二値化処理を行う二値化処理部と、
各文字の画像データを抽出する文字切り出し実行部と、を備えたことを特徴とする文字切り出し装置。 - 前記二値化処理部が、文字と文字との間に形成された空白区間における前記最小画素値曲線の最小画素値を検出し、該最小画素値を二値化しきい値として前記多値画像データの二値化処理を行うことを特徴とする請求項1記載の文字切り出し装置。
- 前記文字区切り位置決定部が、仮の二値化しきい値を算出して前記多値画像データの二値化処理を行い、この二値化画像データに基づいて文字が形成された文字区間と文字と文字との間に形成された空白区間の境界を決定することを特徴とする請求項1又は2記載の文字切り出し装置。
- 情報記録媒体上の線図形等が存在する文字列を撮像して得られた多値画像データを処理して、前記文字列を形成する文字を切り出す文字切り出し方法であって、
前記多値画像データにおいて、文字列方向と直交する方向に配置された画素列を構成する画素の中で最も小さい画素値を抽出して最小画素値曲線を作成する最小画素値曲線作成工程と、
前記最小画素値曲線に基づき、前記文字の区切り位置を決定する文字区切り処理工程と、
前記最小画素値曲線から前記線図形等を示す最小画素値を検出し、この最小画素値に基づき二値化しきい値を求め、この二値化しきい値を用いて前記多値画像データの二値化処理を行う二値化処理工程と、
各文字の画像データを抽出する文字切り出し処理工程と、を備えたことを特徴とする文字切り出し方法。 - 前記二値化処理工程が、文字と文字との間に形成された空白区間における前記最小画素値曲線の最小画素値を検出し、該最小画素値を二値化しきい値として前記多値画像データの二値化処理を行うことを特徴とする請求項4記載の文字切り出し方法。
- 前記文字区切り処理工程が、仮の二値化しきい値を算出して前記多値画像データの二値化処理を行い、この二値化画像データに基づいて文字が形成された文字区間と文字と文字との間に形成された空白区間の境界を決定することを特徴とする請求項4又は5記載の文字切り出し方法。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2013021483A JP6080259B2 (ja) | 2013-02-06 | 2013-02-06 | 文字切り出し装置及び文字切り出し方法 |
US14/174,424 US9158986B2 (en) | 2013-02-06 | 2014-02-06 | Character segmentation device and character segmentation method |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2013021483A JP6080259B2 (ja) | 2013-02-06 | 2013-02-06 | 文字切り出し装置及び文字切り出し方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2014153820A true JP2014153820A (ja) | 2014-08-25 |
JP6080259B2 JP6080259B2 (ja) | 2017-02-15 |
Family
ID=51259263
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2013021483A Expired - Fee Related JP6080259B2 (ja) | 2013-02-06 | 2013-02-06 | 文字切り出し装置及び文字切り出し方法 |
Country Status (2)
Country | Link |
---|---|
US (1) | US9158986B2 (ja) |
JP (1) | JP6080259B2 (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113392838A (zh) * | 2021-08-16 | 2021-09-14 | 智道网联科技(北京)有限公司 | 字符分割方法、装置及字符识别方法、装置 |
Families Citing this family (18)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2014098248A1 (ja) * | 2012-12-21 | 2014-06-26 | 株式会社 東芝 | 超音波診断装置及び医用画像処理装置 |
US9256795B1 (en) | 2013-03-15 | 2016-02-09 | A9.Com, Inc. | Text entity recognition |
US8908021B2 (en) * | 2013-03-15 | 2014-12-09 | Orcam Technologies Ltd. | Systems and methods for automatic control of a continuous action |
US9934526B1 (en) | 2013-06-27 | 2018-04-03 | A9.Com, Inc. | Text recognition for search results |
US20150379502A1 (en) * | 2014-06-26 | 2015-12-31 | Wipro Limited | Image processing method of enabling financial transaction and an image processing system thereof |
EP3167408B1 (en) * | 2014-07-10 | 2023-12-13 | Sanofi-Aventis Deutschland GmbH | A device and method for performing optical character recognition |
US9430766B1 (en) * | 2014-12-09 | 2016-08-30 | A9.Com, Inc. | Gift card recognition using a camera |
US9646202B2 (en) * | 2015-01-16 | 2017-05-09 | Sony Corporation | Image processing system for cluttered scenes and method of operation thereof |
US9798948B2 (en) * | 2015-07-31 | 2017-10-24 | Datalogic IP Tech, S.r.l. | Optical character recognition localization tool |
CN105426818B (zh) * | 2015-10-30 | 2019-07-02 | 小米科技有限责任公司 | 区域提取方法及装置 |
CN105528606B (zh) * | 2015-10-30 | 2019-08-06 | 小米科技有限责任公司 | 区域识别方法及装置 |
CN106156767A (zh) * | 2016-03-02 | 2016-11-23 | 平安科技(深圳)有限公司 | 行驶证有效期自动提取方法、服务器及终端 |
JP6969164B2 (ja) * | 2017-05-31 | 2021-11-24 | 株式会社リコー | 評価装置、評価プログラム及び評価方法 |
CN108171239A (zh) * | 2018-02-02 | 2018-06-15 | 杭州清本科技有限公司 | 证书图像文字的提取方法、装置及系统、计算机存储介质 |
WO2020041448A1 (en) * | 2018-08-22 | 2020-02-27 | Leverton Holding Llc | Text line image splitting with different font sizes |
JP7224856B2 (ja) * | 2018-11-02 | 2023-02-20 | キヤノン株式会社 | 画像生成装置、画像生成方法、及びプログラム |
CN109582946B (zh) * | 2018-11-28 | 2019-10-25 | 龙马智芯(珠海横琴)科技有限公司 | 文字区域排版方向的确定方法及装置 |
FR3106428B1 (fr) * | 2020-01-16 | 2022-07-29 | Surys | Procédé de traitement d’une image candidate |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH0652357A (ja) * | 1992-07-31 | 1994-02-25 | Sumitomo Metal Ind Ltd | 文字認識方法及びそのための装置 |
JPH09326009A (ja) * | 1996-06-05 | 1997-12-16 | Oki Electric Ind Co Ltd | ナンバープレートの一連指定番号切り出し装置 |
JP2008097590A (ja) * | 2006-09-13 | 2008-04-24 | Keyence Corp | 文字切り出し装置、方法およびプログラム |
Family Cites Families (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP0807297B1 (en) * | 1995-01-31 | 1999-09-29 | United Parcel Service Of America, Inc. | Method and apparatus for separating foreground from background in images containing text |
JP2974061B2 (ja) * | 1996-11-13 | 1999-11-08 | 日本電気株式会社 | パタン抽出装置 |
US6549658B1 (en) * | 1998-01-21 | 2003-04-15 | Xerox Corporation | Method and system for classifying and processing of pixels of image data |
JP2000341501A (ja) * | 1999-03-23 | 2000-12-08 | Minolta Co Ltd | 画像処理装置および画像処理方法、ならびに画像処理プログラムを記録した記録媒体 |
JP3849385B2 (ja) * | 2000-02-03 | 2006-11-22 | コニカミノルタホールディングス株式会社 | 画像処理装置、画像処理方法および画像処理プログラムを記録したコンピュータ読取可能な記録媒体 |
US6941013B1 (en) * | 2002-04-22 | 2005-09-06 | The United States Of America As Represented By The National Security Agency | Method of image binarization using histogram modeling |
US7787711B2 (en) * | 2006-03-09 | 2010-08-31 | Illinois Institute Of Technology | Image-based indexing and classification in image databases |
JP4851353B2 (ja) * | 2007-01-31 | 2012-01-11 | 株式会社リコー | 画像処理装置及び画像処理方法 |
JP4594952B2 (ja) | 2007-03-20 | 2010-12-08 | 株式会社東芝 | 文字認識装置及び文字認識方法 |
US9292759B2 (en) * | 2012-05-07 | 2016-03-22 | Xerox Corporation | Methods and systems for optimized parameter selection in automated license plate recognition |
JP6171167B2 (ja) * | 2012-12-28 | 2017-08-02 | 日本電産サンキョー株式会社 | 文字認識装置、文字認識方法、及び文字認識プログラム |
-
2013
- 2013-02-06 JP JP2013021483A patent/JP6080259B2/ja not_active Expired - Fee Related
-
2014
- 2014-02-06 US US14/174,424 patent/US9158986B2/en not_active Expired - Fee Related
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH0652357A (ja) * | 1992-07-31 | 1994-02-25 | Sumitomo Metal Ind Ltd | 文字認識方法及びそのための装置 |
JPH09326009A (ja) * | 1996-06-05 | 1997-12-16 | Oki Electric Ind Co Ltd | ナンバープレートの一連指定番号切り出し装置 |
JP2008097590A (ja) * | 2006-09-13 | 2008-04-24 | Keyence Corp | 文字切り出し装置、方法およびプログラム |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113392838A (zh) * | 2021-08-16 | 2021-09-14 | 智道网联科技(北京)有限公司 | 字符分割方法、装置及字符识别方法、装置 |
CN113392838B (zh) * | 2021-08-16 | 2021-11-19 | 智道网联科技(北京)有限公司 | 字符分割方法、装置及字符识别方法、装置 |
Also Published As
Publication number | Publication date |
---|---|
US20140219561A1 (en) | 2014-08-07 |
JP6080259B2 (ja) | 2017-02-15 |
US9158986B2 (en) | 2015-10-13 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6080259B2 (ja) | 文字切り出し装置及び文字切り出し方法 | |
US8494273B2 (en) | Adaptive optical character recognition on a document with distorted characters | |
JP3904840B2 (ja) | 多値画像から罫線を抽出する罫線抽出装置 | |
US5410611A (en) | Method for identifying word bounding boxes in text | |
US8200012B2 (en) | Image determination apparatus, image search apparatus and computer readable recording medium storing an image search program | |
US5539841A (en) | Method for comparing image sections to determine similarity therebetween | |
CN104751142B (zh) | 一种基于笔划特征的自然场景文本检测方法 | |
Gebhardt et al. | Document authentication using printing technique features and unsupervised anomaly detection | |
US9349237B2 (en) | Method of authenticating a printed document | |
EP2553626A2 (en) | Segmentation of textual lines in an image that include western characters and hieroglyphic characters | |
JP4704601B2 (ja) | 文字認識方法,プログラム及び記録媒体 | |
CN113011426A (zh) | 一种识别证件的方法和装置 | |
JP2006338578A (ja) | 文字認識装置 | |
JP2010026805A (ja) | 文字認識装置及び文字認識方法 | |
JP5630689B2 (ja) | 文字認識方法及び文字認識装置 | |
CN109460763B (zh) | 一种基于多层次文本组件定位与生长的文本区域提取方法 | |
CN111488870A (zh) | 文字识别方法和文字识别装置 | |
JPH08190690A (ja) | ナンバープレート決定方法 | |
JP6144892B2 (ja) | 画像処理装置、画像処理方法及びプログラム | |
CN109086766B (zh) | 一种基于积分图的多阈值融合冠字号提取方法 | |
JP2871590B2 (ja) | 画像抽出方式 | |
CN115995080B (zh) | 基于ocr识别的档案智能管理系统 | |
Ali et al. | Detection and extraction of pantograph region from bank cheque images | |
KR101437286B1 (ko) | 디지털 컨텐츠 식별 방법 및 장치 | |
JP4732626B2 (ja) | 帳票処理方法および装置並びにプログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
RD01 | Notification of change of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7421 Effective date: 20150609 |
|
RD02 | Notification of acceptance of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7422 Effective date: 20150622 |
|
RD04 | Notification of resignation of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7424 Effective date: 20150622 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20160108 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20161220 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20170104 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20170113 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6080259 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
LAPS | Cancellation because of no payment of annual fees |