JP2014130415A - 文字認識装置、文字認識方法、及び文字認識プログラム - Google Patents
文字認識装置、文字認識方法、及び文字認識プログラム Download PDFInfo
- Publication number
- JP2014130415A JP2014130415A JP2012286645A JP2012286645A JP2014130415A JP 2014130415 A JP2014130415 A JP 2014130415A JP 2012286645 A JP2012286645 A JP 2012286645A JP 2012286645 A JP2012286645 A JP 2012286645A JP 2014130415 A JP2014130415 A JP 2014130415A
- Authority
- JP
- Japan
- Prior art keywords
- character
- characters
- minimum luminance
- image data
- character string
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/14—Image acquisition
- G06V30/148—Segmentation of character regions
- G06V30/158—Segmentation of character regions using character size, text spacings or pitch estimation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
Landscapes
- Engineering & Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Multimedia (AREA)
- Theoretical Computer Science (AREA)
- Character Input (AREA)
- Character Discrimination (AREA)
Abstract
【解決手段】文字認識装置10は、撮像素子11と、画像メモリ12と、文字切り出し部133と、を有し、文字切り出し部133は、画像データにおいて文字列の方向と直交する方向に配列された画素列に格納されている輝度値の中で最小輝度値を検出し、各画素列の最小輝度値に基づいて画像データにおける最小輝度曲線を作成する最小輝度曲線作成部1331と、作成した最小輝度曲線上において隣接する文字間の区間を求めて文字間の区切り位置を検出する文字区切り位置検出部1332と、検出した文字間の区切り位置に基づいて各文字を切り出す文字切り出し処理部1333と、を備えている。
【選択図】図1
Description
文字認識装置10は、文字切り出し処理における射影生成に際し、文字が第1方向である横方向すなわちX軸方向に並んでいるときはX軸への射影を生成し、文字が第1方向に直交する第2方向である縦方向すなわちY軸方向に並んでいるときはY軸への射影を生成する。以下では、一例として、文字が第1方向である横方向すなわちX軸方向に並んでいる状態において、X軸への射影として説明する。
図1において、文字認識装置10は、情報記録媒体上の文字列を読み取る画像読取部としての密着型の(1次元)撮像素子11と、撮像素子11で撮像された文字列の画像データを記憶する画像メモリ12と、画像メモリ12に記憶された画像データを処理することによって文字列を認識するデータ処理部13と、を有している。
次に、データ処理部13の各部の基本的な構成および機能について説明する。
データ処理部13は、画像メモリ12から画像データを読み出して、その画像データが多階調の濃淡画像である場合には、白黒2値の画像に変換を行う。
図3は、本実施形態に係る文字切り出し部の構成例を示すブロック図である。
本実施形態に係る文字切り出し部133は、図3に示すように、最小輝度曲線作成部1331、文字区切り位置検出部1332と、文字切り出し処理部1333と、で構成されている。すなわち、この文字切り出し部133は、最小輝度曲線作成部1331で作成した最小輝度曲線上において隣接する文字間の区間を求めて文字間の区切り位置を検出する文字区切り位置検出部1332と、検出した文字間の区切り位置に基づいて各文字を切り出す文字切り出し処理部1333と、を備えている。
次に、本実施形態に係る文字認識装置10の全体的な動作について図4に関連付けて説明する。図4は、本実施形態に係る文字認識装置の動作を説明するためのフローチャートである。
次に、このような特徴を有する文字切り出し部133における文字切り出し処理例について、図5から図7に関連付けてより具体的に説明する。図5は、本実施形態に係る文字切り出し部の処理フローを示すフローチャートである。図6は、本実施形態に係る文字切り出し部における最小輝度曲線作成部の処理フローを示すフローチャートである。図7は、本実施形態に係る文字切り出し部における文字区切り位置検出部の処理フローを示すフローチャートである。
最小輝度曲線作成部1331で作成される最小輝度曲線は、画像データにおける各画素列の最小値を求めているため、文字と文字との間の空白区間に汚れや、ピンポイントがあると、これが疑似文字区間を形成する可能性がある。このような汚れやピンポイントによる文字区間の誤検出を排除するには、基準の文字幅を設定し、これに比較して小さい場合には非文字であると判定するようにすればよい。本発明の文字認識装置10は、文字切り出し部133が、基準の文字幅を設定した文字幅設定部を有し、最小輝度曲線を基準の文字幅と比較して、最小輝度曲線の輝度値=0の区間が基準の文字幅を超えた区間を文字区間として検出する文字区間検出部を備えた構成にしてもよい。
また、このようなプログラムは、半導体メモリ、磁気ディスク、光ディスク、フロッピー(登録商標)ディスク等の記録媒体、この記録媒体をセットしたコンピュータによりアクセスし上記プログラムを実行するように構成可能である。
以上のように、本実施形態によれば、最小輝度曲線作成部は、撮像された文字列の画像データにおける文字画像領域について、画素列を文字列と垂直な方向にスキャンして最小輝度値を求める操作を文字画像領域の左端側の輝度列から右端側の輝度列まで繰り返すことによって最小輝度曲線を求め、この最小輝度曲線に基づいて各文字の文字列方向の境界点を求めるようにしたため、文字区間と空白区間が明確に分離され、正確な文字区切り位置の決定が可能となる。また、本発明は、文字認識の性能を左右する閾値を設定することなく、文字境界部分の状態にかかわりなく文字の境界位置を高い精度で的確に決定することが可能であり、ひいては文字認識性能の向上を図ることが可能となる。
Claims (5)
- 情報記録媒体上の文字列を撮像する撮像手段と、
前記撮像手段で撮像された文字列の画像データを記憶する記憶手段と、
前記画像データを処理して前記文字列を形成する文字を切り出す文字切り出し部と、を有する文字認識装置であって、
前記文字切り出し部は、前記画像データにおいて前記文字列の方向と直交する方向に配列された画素列に格納されている輝度値の中で最小輝度値を検出し、各画素列の最小輝度値に基づいて前記画像データにおける最小輝度曲線を作成する最小輝度曲線作成部と、作成した最小輝度曲線上において隣接する文字間の区間を求めて文字間の区切り位置を検出する文字区切り位置検出部と、検出した文字間の区切り位置に基づいて各文字を切り出す文字切り出し処理部と、を備えたことを特徴とする文字認識装置。 - 前記文字切り出し部が、基準の文字幅を設定した文字幅設定部を有し、前記最小輝度曲線を前記基準の文字幅と比較して前記基準の文字幅を超えた区間を文字区間として検出する文字区間検出部を備えたことを特徴とする請求項1記載の文字認識装置。
- 前記最小輝度曲線作成部が、2値化された前記画像データに基づいて最小輝度値を検出して最小輝度曲線を作成することを特徴とする請求項1又は2記載の文字認識装置。
- 情報記録媒体上の文字列を撮像して得られた画像データを処理することによって前記文字列を認識する文字認識方法において、
前記画像データにおいて前記文字列の方向と直交する方向に配列された画素列に格納されている輝度値の中で最小輝度値を検出し、各画素列の最小輝度値に基づいて前記画像データにおける最小輝度曲線を作成する最小輝度曲線作成工程と、
作成した最小輝度曲線上において隣接する文字間の区間を求めて文字間の区切り位置を検出する文字区切り位置検出工程と、
検出した文字間の区切り位置に基づいて各文字を切り出す文字切り出し処理工程と、を有することを特徴とする文字認識方法。 - 情報記録媒体上の文字列を撮像して得られた画像データを処理することによって、前記文字列から各文字を切り出す文字切り出し処理をコンピュータに実行させる文字認識プログラムであって、
コンピュータに、
前記画像データにおいて前記文字列の方向と直交する方向に配列された画素列に格納されている輝度値の中で最小輝度値を検出し、各画素列の最小輝度値に基づいて前記画像データにおける最小輝度曲線を作成する最小輝度曲線作成手順と、
作成した最小輝度曲線上において隣接する文字間の区間を求めて文字間の区切り位置を検出する文字区切り位置検出手順と、
検出した文字間の区切り位置に基づいて各文字を切り出す文字切り出し処理手順と、を実行させるための文字認識プログラム。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2012286645A JP6171167B2 (ja) | 2012-12-28 | 2012-12-28 | 文字認識装置、文字認識方法、及び文字認識プログラム |
US14/142,079 US9251430B2 (en) | 2012-12-28 | 2013-12-27 | Apparatus, method, and program for character recognition using minimum intensity curve of image data |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2012286645A JP6171167B2 (ja) | 2012-12-28 | 2012-12-28 | 文字認識装置、文字認識方法、及び文字認識プログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2014130415A true JP2014130415A (ja) | 2014-07-10 |
JP6171167B2 JP6171167B2 (ja) | 2017-08-02 |
Family
ID=51016906
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2012286645A Active JP6171167B2 (ja) | 2012-12-28 | 2012-12-28 | 文字認識装置、文字認識方法、及び文字認識プログラム |
Country Status (2)
Country | Link |
---|---|
US (1) | US9251430B2 (ja) |
JP (1) | JP6171167B2 (ja) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2016194800A (ja) * | 2015-03-31 | 2016-11-17 | 日本電産サンキョー株式会社 | 文字切り出し装置、文字認識装置、および文字切り出し方法 |
US9858477B2 (en) | 2015-07-17 | 2018-01-02 | Nidec Sankyo Corporation | Character segmenting apparatus, character recognition apparatus, and character segmenting method |
CN112418217A (zh) * | 2020-11-20 | 2021-02-26 | 北京百度网讯科技有限公司 | 用于识别字符的方法、装置、设备和介质 |
Families Citing this family (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP6080259B2 (ja) * | 2013-02-06 | 2017-02-15 | 日本電産サンキョー株式会社 | 文字切り出し装置及び文字切り出し方法 |
FR3038100A1 (fr) * | 2015-06-26 | 2016-12-30 | Orange | Procede de reconnaissance d'ecriture manuscrite sur une surface physique |
US9946945B2 (en) * | 2016-04-08 | 2018-04-17 | Intelligent Security Systems Corporation | Systems and methods for recognizing symbols in images |
CN106156768B (zh) * | 2016-07-01 | 2019-03-12 | 屈桢深 | 基于视觉的机动车行驶证检测方法 |
CN111340029A (zh) * | 2018-12-19 | 2020-06-26 | 富士通株式会社 | 用于识别收件人地址中的至少部分地址的装置和方法 |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH04260181A (ja) * | 1991-02-15 | 1992-09-16 | Toshiba Corp | 文字読取装置 |
JPH06119494A (ja) * | 1992-10-02 | 1994-04-28 | Nippon Steel Corp | 文字列認識方法 |
JPH0765123A (ja) * | 1993-08-24 | 1995-03-10 | Matsushita Electric Ind Co Ltd | 画像処理装置及び画像処理方法 |
JPH0793476A (ja) * | 1993-09-22 | 1995-04-07 | Toshiba Corp | 文字列検出装置 |
JP2008097589A (ja) * | 2006-09-13 | 2008-04-24 | Keyence Corp | 文字切り出し装置、方法およびプログラム |
JP2010218041A (ja) * | 2009-03-13 | 2010-09-30 | Omron Corp | 携帯式文字認識装置、文字認識プログラム及び文字認識方法 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP4945739B2 (ja) * | 2007-03-30 | 2012-06-06 | 日本電産サンキョー株式会社 | 文字列認識方法及び文字列認識装置 |
-
2012
- 2012-12-28 JP JP2012286645A patent/JP6171167B2/ja active Active
-
2013
- 2013-12-27 US US14/142,079 patent/US9251430B2/en active Active
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH04260181A (ja) * | 1991-02-15 | 1992-09-16 | Toshiba Corp | 文字読取装置 |
JPH06119494A (ja) * | 1992-10-02 | 1994-04-28 | Nippon Steel Corp | 文字列認識方法 |
JPH0765123A (ja) * | 1993-08-24 | 1995-03-10 | Matsushita Electric Ind Co Ltd | 画像処理装置及び画像処理方法 |
JPH0793476A (ja) * | 1993-09-22 | 1995-04-07 | Toshiba Corp | 文字列検出装置 |
JP2008097589A (ja) * | 2006-09-13 | 2008-04-24 | Keyence Corp | 文字切り出し装置、方法およびプログラム |
JP2010218041A (ja) * | 2009-03-13 | 2010-09-30 | Omron Corp | 携帯式文字認識装置、文字認識プログラム及び文字認識方法 |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2016194800A (ja) * | 2015-03-31 | 2016-11-17 | 日本電産サンキョー株式会社 | 文字切り出し装置、文字認識装置、および文字切り出し方法 |
US9886643B2 (en) | 2015-03-31 | 2018-02-06 | Nidec Sankyo Corporation | Character segmentation device, character recognition device and character segmentation method |
US9858477B2 (en) | 2015-07-17 | 2018-01-02 | Nidec Sankyo Corporation | Character segmenting apparatus, character recognition apparatus, and character segmenting method |
CN112418217A (zh) * | 2020-11-20 | 2021-02-26 | 北京百度网讯科技有限公司 | 用于识别字符的方法、装置、设备和介质 |
Also Published As
Publication number | Publication date |
---|---|
US9251430B2 (en) | 2016-02-02 |
US20140185106A1 (en) | 2014-07-03 |
JP6171167B2 (ja) | 2017-08-02 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6171167B2 (ja) | 文字認識装置、文字認識方法、及び文字認識プログラム | |
JP5334042B2 (ja) | 文字列認識方法及び文字列認識装置 | |
JP6268023B2 (ja) | 文字認識装置およびその文字切り出し方法 | |
JP5591578B2 (ja) | 文字列認識装置および文字列認識方法 | |
JP4658848B2 (ja) | 文字列認識方法及び文字列認識装置 | |
JP6039413B2 (ja) | 文字切り出し装置、文字認識装置、文字切り出し方法、およびプログラム | |
KR101452562B1 (ko) | 비디오 이미지에서 텍스트를 검출하는 방법 | |
KR101617681B1 (ko) | 히스토그램들을 갖는 다중 층 연결 요소들을 사용하는 텍스트 검출 | |
JP6487255B2 (ja) | 文字切り出し装置、文字認識装置、および文字切り出し方法 | |
JP2010170539A5 (ja) | ||
JP6599672B2 (ja) | 文字切り出し装置、文字認識装置、および文字切り出し方法 | |
JP6075190B2 (ja) | 画像処理方法及び装置 | |
JP4945739B2 (ja) | 文字列認識方法及び文字列認識装置 | |
JP5011508B2 (ja) | 文字列認識方法及び文字列認識装置 | |
JP5630689B2 (ja) | 文字認識方法及び文字認識装置 | |
JP2018055496A (ja) | 媒体認識装置および媒体認識方法 | |
Nor et al. | Image segmentation and text extraction: application to the extraction of textual information in scene images | |
JP2005250786A (ja) | 画像認識方法 | |
Chanda et al. | Font identification—In context of an Indic script | |
KR101070051B1 (ko) | 도트 패턴에서 불변 영역을 인식하는 방법 | |
Soumya et al. | Text extraction from images: a survey | |
JPH06501803A (ja) | 抽出されたデータから特定の部分を分離して抽出することを含む文字認識方法 | |
JP2015032213A (ja) | 情報処理装置、方法、及びプログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
RD01 | Notification of change of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7421 Effective date: 20150609 |
|
RD02 | Notification of acceptance of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7422 Effective date: 20150622 |
|
RD04 | Notification of resignation of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7424 Effective date: 20150622 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20151106 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20160916 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20161019 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20161205 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20170524 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20170605 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6171167 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |