JP6139658B2 - 文字認識方法及び文字認識システム - Google Patents
文字認識方法及び文字認識システム Download PDFInfo
- Publication number
- JP6139658B2 JP6139658B2 JP2015502674A JP2015502674A JP6139658B2 JP 6139658 B2 JP6139658 B2 JP 6139658B2 JP 2015502674 A JP2015502674 A JP 2015502674A JP 2015502674 A JP2015502674 A JP 2015502674A JP 6139658 B2 JP6139658 B2 JP 6139658B2
- Authority
- JP
- Japan
- Prior art keywords
- character
- image
- character recognition
- template
- template image
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/77—Processing image or video features in feature spaces; using data integration or data reduction, e.g. principal component analysis [PCA] or independent component analysis [ICA] or self-organising maps [SOM]; Blind source separation
- G06V10/772—Determining representative reference patterns, e.g. averaging or distorting patterns; Generating dictionaries
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/28—Determining representative reference patterns, e.g. by averaging or distorting; Generating dictionaries
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/20—Image preprocessing
- G06V10/28—Quantising the image, e.g. histogram thresholding for discrimination between background and foreground patterns
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/40—Document-oriented image-based pattern recognition
- G06V30/41—Analysis of document content
- G06V30/414—Extracting the geometrical structure, e.g. layout tree; Block segmentation, e.g. bounding boxes for graphics or text
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F2218/00—Aspects of pattern recognition specially adapted for signal processing
- G06F2218/08—Feature extraction
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F2218/00—Aspects of pattern recognition specially adapted for signal processing
- G06F2218/12—Classification; Matching
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V2201/00—Indexing scheme relating to image or video recognition or understanding
- G06V2201/01—Solutions for problems related to non-uniform document background
Description
10 文字認識処理部
11 文字認識スコア算出部
12 文字決定部
20 文字画像取得部
30 記憶部
31 画像データ
32 文字認識用辞書データ
100 有価媒体
101 文字列
104、105、124 文字画像(文字認識処理対象)
120 紙幣画像
121、122 記番号
123 記番号画像
124 文字画像
200 有価媒体
201 文字列
202、210、220 文字画像(テンプレート画像生成処理対象)
211 背景領域
300、301、310、310a〜310z、311 テンプレート画像
Claims (10)
- 有価媒体で背景模様の上に印刷された文字を認識する文字認識方法であって、
有価媒体に印刷された文字を撮像した文字画像を取得する文字画像取得工程と、
前記文字画像と、前記有価媒体に印刷される可能性がある各文字を撮像して背景領域を均一に塗りつぶした各テンプレート画像との類似度を評価する類似度評価工程と、
前記類似度評価工程で最も高い類似度を示したテンプレート画像に対応する文字が前記文字画像に含まれる文字であると決定する文字決定工程と
を含んだことを特徴とする文字認識方法。 - 前記テンプレート画像は、前記有価媒体に印刷された文字を撮像した画像を、該画像の輝度分布から求めた文字背景分離しきい値により背景領域と文字とに分離して、前記背景領域に含まれる画素の画素値の分布に基づく所定の画素値で、前記背景領域に含まれる全ての画素値を置き換えることにより塗りつぶした画像であることを特徴とする請求項1に記載の文字認識方法。
- 文字認識処理の処理対象となる前記文字画像に文字が含まれない可能性がある場合には、前記テンプレート画像に、前記背景領域のみから成る画像を含めることを特徴とする請求項1に記載の文字認識方法。
- 前記類似度評価工程では、各テンプレート画像により前記文字画像の全面を走査しながら、各画素位置で類似度を評価する文字認識スコアを算出することにより類似度を評価することを特徴とする請求項1、2又は3に記載の文字認識方法。
- 前記文字認識スコアとして、前記テンプレート画像及び前記文字画像の画素値に基づいて求められる濃度値残差、濃度値の2乗誤差、正規化相関係数及び位相限定相関係数のいずれかの値を利用することを特徴とする請求項4に記載の文字認識方法。
- 前記有価媒体は紙幣であることを特徴とする請求項1〜5のいずれか1項に記載の文字認識方法。
- 前記テンプレート画像は、前記有価媒体に印刷されるフォントの数に応じて準備されることを特徴とする請求項1〜6のいずれか1項に記載の文字認識方法。
- 有価媒体で背景模様の上に印刷された文字を認識する文字認識システムであって、
有価媒体に印刷された文字を撮像した文字画像を取得する文字画像取得部と、
前記文字画像と、前記有価媒体に印刷される可能性がある各文字を撮像して背景領域を均一に塗りつぶした各テンプレート画像との類似度を評価する文字認識スコアを算出する文字認識スコア算出部と、
各テンプレート画像について算出された前記文字認識スコアに基づいて、最も高い類似度を示したテンプレート画像に対応する文字が前記文字画像に含まれる文字であると決定する文字決定部と
を備えることを特徴とする文字認識システム。 - 前記テンプレート画像は、前記有価媒体に印刷された文字を撮像した画像を、該画像の輝度分布から求めた文字背景分離しきい値により背景領域と文字とに分離して、前記背景領域に含まれる画素の画素値の分布に基づく所定の画素値で、前記背景領域に含まれる全ての画素値を置き換えることにより塗りつぶした画像であることを特徴とする請求項8に記載の文字認識システム。
- 文字認識処理の処理対象となる前記文字画像に文字が含まれない可能性がある場合には、前記テンプレート画像に、前記背景領域のみから成る画像を含めることを特徴とする請求項8又は9に記載の文字認識システム。
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
PCT/JP2013/055552 WO2014132414A1 (ja) | 2013-02-28 | 2013-02-28 | 文字認識方法及び文字認識システム |
Publications (2)
Publication Number | Publication Date |
---|---|
JPWO2014132414A1 JPWO2014132414A1 (ja) | 2017-02-02 |
JP6139658B2 true JP6139658B2 (ja) | 2017-05-31 |
Family
ID=51427715
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2015502674A Active JP6139658B2 (ja) | 2013-02-28 | 2013-02-28 | 文字認識方法及び文字認識システム |
Country Status (4)
Country | Link |
---|---|
US (1) | US9977957B2 (ja) |
EP (1) | EP2963584B1 (ja) |
JP (1) | JP6139658B2 (ja) |
WO (1) | WO2014132414A1 (ja) |
Families Citing this family (18)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP5664813B1 (ja) * | 2014-06-10 | 2015-02-04 | 富士ゼロックス株式会社 | デザイン管理装置及びプログラム |
CN104616009B (zh) * | 2015-02-13 | 2018-05-18 | 广州广电运通金融电子股份有限公司 | 一种字符切割识别方法 |
JP6634873B2 (ja) * | 2016-02-24 | 2020-01-22 | コニカミノルタ株式会社 | 画像形成装置及び画像の最適化方法 |
JP2017157039A (ja) * | 2016-03-02 | 2017-09-07 | 株式会社東芝 | 紙葉類処理装置およびプログラム |
JP2018088116A (ja) * | 2016-11-29 | 2018-06-07 | キヤノン株式会社 | 情報処理装置、プログラム、情報処理方法 |
US10296788B1 (en) * | 2016-12-19 | 2019-05-21 | Matrox Electronic Systems Ltd. | Method and system for processing candidate strings detected in an image to identify a match of a model string in the image |
JP6552012B2 (ja) * | 2017-03-03 | 2019-07-31 | Necプラットフォームズ株式会社 | コンテナ番号読取り装置、コンテナ番号読取り方法およびコンテナ番号読取りプログラム |
US10346702B2 (en) | 2017-07-24 | 2019-07-09 | Bank Of America Corporation | Image data capture and conversion |
US10192127B1 (en) | 2017-07-24 | 2019-01-29 | Bank Of America Corporation | System for dynamic optical character recognition tuning |
CN107766854B (zh) * | 2017-09-28 | 2021-07-06 | 电子科技大学 | 一种基于模板匹配实现快速页码识别的方法 |
CN110689017A (zh) * | 2018-07-06 | 2020-01-14 | 康姆德润达(无锡)测量技术有限公司 | 一种滤膜id图像识别系统 |
JP7147544B2 (ja) * | 2018-12-19 | 2022-10-05 | 京セラドキュメントソリューションズ株式会社 | 情報処理装置、及び情報処理方法 |
JP7379876B2 (ja) * | 2019-06-17 | 2023-11-15 | 株式会社リコー | 文字認識装置、文書ファイル生成方法、文書ファイル生成プログラム |
CN111243160B (zh) * | 2020-03-09 | 2020-12-08 | 深圳市德利时科技有限公司 | 大数据式印刷版型鉴定平台 |
WO2022044311A1 (ja) * | 2020-08-31 | 2022-03-03 | 富士通フロンテック株式会社 | データ生成装置、データ生成方法およびデータ生成プログラム |
CN113989404A (zh) * | 2021-11-05 | 2022-01-28 | 北京字节跳动网络技术有限公司 | 图片处理方法、装置、设备、存储介质和程序产品 |
WO2024013901A1 (ja) * | 2022-07-13 | 2024-01-18 | 日本電信電話株式会社 | マッチ率算出装置、マッチ率算出方法およびマッチ率算出プログラム |
CN116468742B (zh) * | 2023-06-12 | 2023-10-03 | 恒银金融科技股份有限公司 | 含有分数形式的冠字号的分割方法和装置 |
Family Cites Families (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2740291B2 (ja) | 1989-09-14 | 1998-04-15 | 富士通株式会社 | 証券処理装置 |
JP2985893B2 (ja) | 1990-08-30 | 1999-12-06 | グローリー工業株式会社 | パターン認識装置 |
JP2000222574A (ja) * | 1999-01-28 | 2000-08-11 | Hitachi Ltd | ディジタル画像の線状領域抽出方法および画像処理装置 |
MC2491A1 (fr) * | 1999-06-21 | 1999-11-22 | Stringa Luigi | Reconnaissance automatique de caractères sur fond structuré par combinaison des modèles du fond et des caractères |
JP4732626B2 (ja) * | 2001-07-17 | 2011-07-27 | グローリー株式会社 | 帳票処理方法および装置並びにプログラム |
JP2005151455A (ja) * | 2003-11-19 | 2005-06-09 | Canon Inc | 画像処理装置、情報処理装置及びそれらの制御方法、プログラム |
JP2007304864A (ja) | 2006-05-11 | 2007-11-22 | Fuji Xerox Co Ltd | 文字認識処理システムおよび文字認識処理プログラム |
US8929640B1 (en) * | 2009-04-15 | 2015-01-06 | Cummins-Allison Corp. | Apparatus and system for imaging currency bills and financial documents and method for using the same |
WO2010151305A2 (en) * | 2009-06-26 | 2010-12-29 | Venkatesh Rajagopalan Chari | Compact assistive reading device |
JP2011238279A (ja) * | 2011-07-25 | 2011-11-24 | Seiko Epson Corp | 光学読取装置、認識処理装置、文字読取方法及びプログラム、並びに磁気インク文字読取装置、及びpos端末装置 |
-
2013
- 2013-02-28 US US14/770,249 patent/US9977957B2/en active Active
- 2013-02-28 JP JP2015502674A patent/JP6139658B2/ja active Active
- 2013-02-28 EP EP13876323.0A patent/EP2963584B1/en active Active
- 2013-02-28 WO PCT/JP2013/055552 patent/WO2014132414A1/ja active Application Filing
Also Published As
Publication number | Publication date |
---|---|
EP2963584B1 (en) | 2020-07-15 |
US20160012288A1 (en) | 2016-01-14 |
JPWO2014132414A1 (ja) | 2017-02-02 |
EP2963584A1 (en) | 2016-01-06 |
EP2963584A4 (en) | 2016-10-26 |
US9977957B2 (en) | 2018-05-22 |
WO2014132414A1 (ja) | 2014-09-04 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6139658B2 (ja) | 文字認識方法及び文字認識システム | |
JP6080259B2 (ja) | 文字切り出し装置及び文字切り出し方法 | |
JP5624671B2 (ja) | 文字列切出方法及び文字列切出装置 | |
Gebhardt et al. | Document authentication using printing technique features and unsupervised anomaly detection | |
JP5934174B2 (ja) | 印刷文書を認証するための方法及びプログラム | |
JP4658848B2 (ja) | 文字列認識方法及び文字列認識装置 | |
US11176410B2 (en) | Preprocessing images for OCR using character pixel height estimation and cycle generative adversarial networks for better character recognition | |
US20100329576A1 (en) | Method for detecting alterations in printed document using image comparison analyses | |
JP6171167B2 (ja) | 文字認識装置、文字認識方法、及び文字認識プログラム | |
Alam et al. | A complete Bangla OCR system for printed characters | |
CN110598566A (zh) | 图像处理方法、装置、终端和计算机可读存储介质 | |
JPWO2017141802A1 (ja) | 画像処理装置、文字認識装置、画像処理方法及びプログラム記録媒体 | |
JP2011248702A (ja) | 画像処理装置、画像処理方法、画像処理プログラム及びプログラム記憶媒体 | |
BE1026159B1 (fr) | Système de traitement d’image et procede de traitement d’image | |
JP5630689B2 (ja) | 文字認識方法及び文字認識装置 | |
KR102094234B1 (ko) | 지폐 일련번호 인식 장치 및 방법 | |
CN115410191A (zh) | 文本图像识别方法、装置、设备和存储介质 | |
KR100888674B1 (ko) | 주파수영역을 이용한 지폐의 유사도 측정방법 | |
CN109086766B (zh) | 一种基于积分图的多阈值融合冠字号提取方法 | |
JP2000357287A (ja) | ナンバープレート認識方法および認識装置 | |
Chitrakala et al. | An efficient character segmentation based on VNP algorithm | |
JPH09305707A (ja) | 画像抽出方式 | |
JP6039944B2 (ja) | 帳票種類判別装置および帳票種類判別方法 | |
Dinh et al. | Improved Lexicon-driven based Chord Symbol Recognition in Musical Images | |
JP2923004B2 (ja) | 画像生成装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20161025 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20161219 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20170411 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20170427 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6139658 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |