JP5098504B2 - 文字認識プログラム、文字認識装置および文字認識方法 - Google Patents
文字認識プログラム、文字認識装置および文字認識方法 Download PDFInfo
- Publication number
- JP5098504B2 JP5098504B2 JP2007208612A JP2007208612A JP5098504B2 JP 5098504 B2 JP5098504 B2 JP 5098504B2 JP 2007208612 A JP2007208612 A JP 2007208612A JP 2007208612 A JP2007208612 A JP 2007208612A JP 5098504 B2 JP5098504 B2 JP 5098504B2
- Authority
- JP
- Japan
- Prior art keywords
- character
- partial
- image
- images
- mesh
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/14—Image acquisition
- G06V30/1444—Selective acquisition, locating or processing of specific regions, e.g. highlighted text, fiducial marks or predetermined fields
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/18—Extraction of features or characteristics of the image
- G06V30/18143—Extracting features based on salient regional features, e.g. scale invariant feature transform [SIFT] keypoints
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
Landscapes
- Engineering & Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Multimedia (AREA)
- Theoretical Computer Science (AREA)
- Character Discrimination (AREA)
Description
前記入力画像を複数の部分入力画像に分割する分割ステップと、
前記分割ステップによって得られた複数の部分入力画像の各々について特徴量を算出する特徴量算出ステップと、
複数の文字画像をそれぞれ複数の部分に分割して得られた各部分における部分文字画像の特徴量と、前記文字画像内における各部分文字画像の位置関係と、前記文字画像によって示される文字種別とを対応付けて記憶した検索テーブルから、前記特徴量算出ステップによって算出された特徴量をキーにして、前記部分入力画像の各々について特徴量が類似する部分文字画像を検索する検索ステップと、
前記検索ステップによって得られた複数の部分文字画像を文字種別毎に集計し、各文字種別内における前記部分文字画像の位置関係と、当該部分文字画像に対応する部分入力画像の前記入力画像内における位置関係との整合性を判定し、部分文字画像の位置関係と整合する部分入力画像の組み合わせを文字候補として抽出する整合性判定ステップと、
前記整合性判定ステップによって抽出された文字候補が、所定数以上の部分入力画像を有する場合に、当該文字候補が有する部分入力画像が前記文字種別によって示された文字の構成要素であると認識する認識ステップと、
をコンピュータに実行させることを特徴とする文字認識プログラム。
複数の文字画像をそれぞれ複数の部分に分割して得られた各部分における部分文字画像の特徴量と、前記文字画像内における各部分文字画像の位置関係と、前記文字画像によって示される文字種別とを対応付けた検索テーブルを記憶する検索テーブル記憶手段と、
前記入力画像を複数の部分入力画像に分割する分割手段と、
前記分割手段によって得られた複数の部分入力画像の各々について特徴量を算出する特徴量算出手段と、
前記特徴量算出手段によって算出された特徴量をキーにして前記検索テーブルを参照し、前記部分入力画像の各々について特徴量が類似する部分文字画像を検索する検索手段と、
前記検索手段によって得られた複数の部分文字画像を文字種別毎に集計し、各文字種別内における前記部分文字画像の位置関係と、当該部分文字画像に対応する部分入力画像の前記入力画像内における位置関係との整合性を判定し、部分文字画像の位置関係と整合する部分入力画像の組み合わせを文字候補として抽出する整合性判定手段と、
前記整合性判定手段によって抽出された文字候補が、所定数以上の部分入力画像を有する場合に、当該文字候補が有する部分入力画像が前記文字種別によって示された文字の構成要素であると認識する認識手段と、
を備えたことを特徴とする文字認識装置。
前記入力画像を複数の部分入力画像に分割する分割工程と、
前記分割工程によって得られた複数の部分入力画像の各々について特徴量を算出する特徴量算出工程と、
複数の文字画像をそれぞれ複数の部分に分割して得られた各部分における部分文字画像の特徴量と、前記文字画像内における各部分文字画像の位置関係と、前記文字画像によって示される文字種別とを対応付けて記憶した検索テーブルから、前記特徴量算出工程によって算出された特徴量をキーにして、前記部分入力画像の各々について特徴量が類似する部分文字画像を検索する検索工程と、
前記検索工程によって得られた複数の部分文字画像を文字種別毎に集計し、各文字種別内における前記部分文字画像の位置関係と、当該部分文字画像に対応する部分入力画像の前記入力画像内における位置関係との整合性を判定し、部分文字画像の位置関係と整合する部分入力画像の組み合わせを文字候補として抽出する整合性判定工程と、
前記整合性判定工程によって抽出された文字候補が、所定数以上の部分入力画像を有する場合に、当該文字候補が有する部分入力画像が前記文字種別によって示された文字の構成要素であると認識する認識工程と、
を含んだことを特徴とする文字認識方法。
11 入力部
12 表示部
13 画像読取部
14 外部インターフェース
15 記憶部
16 ハッシュテーブル
20 制御部
21 認識処理部
22 ハッシュテーブル登録部
31 メッシュ分割部
32 特徴算出部
33 正規化処理部
34 文字カテゴリ検索部
35 位置整合性判定部
36 文字判定部
40 コンピュータ
41 入力装置
42 表示装置
43 画像読取装置
44 外部インターフェース
49 バス
51 認識処理プログラム
52 ハッシュテーブル登録プログラム
53 ハッシュテーブルデータ
54 認識処理プロセス
100 画像認識システム
101 スキャナ
102 差分画像作成部
103 画像解析部
D1,D2,D3 画像データ
D4 解析結果データ
G1 グラフ
G2,G3 クリーク
m21,m43,m44,m104,m105,m108,mα,mβ メッシュ
mα’,mα’’,mβ’ 投影像
Claims (7)
- 入力画像内の文字を認識する文字認識処理をコンピュータに実行させる文字認識プログラムであって、
前記入力画像を、当該入力画像内の1文字が所定の数に分割される大きさの、複数の部分入力画像に分割する分割ステップと、
前記分割ステップによって得られた複数の部分入力画像の各々について特徴量を算出する特徴量算出ステップと、
複数の文字画像をそれぞれ前記所定の数に分割した部分文字画像の特徴量と、当該部分文字画像の特徴量がどの文字画像の、どの位置の部分文字画像の特徴量であるかと、前記文字画像によって示される文字種別とを対応付けて記憶した検索テーブルから、前記特徴量算出ステップによって算出された特徴量をキーにして、前記部分入力画像の各々について特徴量が類似する部分文字画像を検索する検索ステップと、
前記検索ステップによって得られた複数の部分文字画像を文字種別毎に集計し、各文字種別内における前記部分文字画像の位置関係と、当該部分文字画像に対応する部分入力画像の前記入力画像内における位置関係との整合性を判定し、部分文字画像の位置関係と整合する部分入力画像の組み合わせを文字候補として抽出する整合性判定ステップと、
前記整合性判定ステップによって抽出された文字候補が、所定数以上の部分入力画像を有する場合に、当該文字候補が有する部分入力画像が前記文字種別によって示された文字の構成要素であると認識する認識ステップと、
をコンピュータに実行させることを特徴とする文字認識プログラム。 - 前記整合性判定ステップは、前記複数の部分入力画像のうち、同一の文字種別の部分文字画像に類似する部分入力画像をノードとし、各ノードに対応する部分文字画像間の相対位置関係と、各ノードに対応する部分入力画像間の相対位置関係とが矛盾しないノード間を接続してグラフを作成するグラフ作成ステップと、前記グラフ作成ステップによって作成されたグラフの完全部分グラフであるクリークを前記文字候補として抽出するクリーク抽出ステップとを含んだことを特徴とする請求項1に記載の文字認識プログラム。
- 前記認識ステップは、前記整合性判定ステップによって抽出された文字候補が、所定数以上の部分入力画像を有する場合、当該部分入力画像の組み合わせに外接する矩形を求め、当該矩形内に前記文字種別によって示された文字が存在すると認識することを特徴とする請求項1または2に記載の文字認識プログラム。
- 前記検索テーブルは、同一の文字画像に対して分割サイズおよび/または分割位置の異なる分割処理を行なった場合にそれぞれ得られる部分文字画像に対して、各部分文字画像の特徴量と、当該各部分文字画像の特徴量がどの文字画像の、どの位置の部分文字画像の特徴量であるかと、前記文字画像によって示される文字種別とを対応付けて記憶することを特徴とする請求項1〜3のいずれか一つに記載の文字認識プログラム。
- 前記検索テーブルは、前記部分文字画像に対して類似する複数の特徴量を対応付け、当該複数の特徴量の各々に対して、前記部分文字画像の特徴量がどの文字画像の、どの位置の部分文字画像の特徴量であるかと、前記文字画像によって示される文字種別とを対応付けて記憶することを特徴とする請求項1〜4のいずれか一つに記載の文字認識プログラム。
- 入力画像内の文字を認識する文字認識装置であって、
前記入力画像を、当該入力画像内の1文字が所定の数に分割される大きさの、複数の部分入力画像に分割する分割手段と、
前記分割手段によって得られた複数の部分入力画像の各々について特徴量を算出する特徴量算出手段と、
複数の文字画像をそれぞれ前記所定の数に分割した部分文字画像の特徴量と、当該部分文字画像の特徴量がどの文字画像の、どの位置の部分文字画像の特徴量であるかと、前記文字画像によって示される文字種別とを対応付けた検索テーブルを記憶する検索テーブル記憶手段と、
前記特徴量算出手段によって算出された特徴量をキーにして前記検索テーブルを参照し、前記部分入力画像の各々について特徴量が類似する部分文字画像を検索する検索手段と、
前記検索手段によって得られた複数の部分文字画像を文字種別毎に集計し、各文字種別内における前記部分文字画像の位置関係と、当該部分文字画像に対応する部分入力画像の前記入力画像内における位置関係との整合性を判定し、部分文字画像の位置関係と整合する部分入力画像の組み合わせを文字候補として抽出する整合性判定手段と、
前記整合性判定手段によって抽出された文字候補が、所定数以上の部分入力画像を有する場合に、当該文字候補が有する部分入力画像が前記文字種別によって示された文字の構成要素であると認識する認識手段と、
を備えたことを特徴とする文字認識装置。 - 入力画像内の文字を認識する文字認識方法であって、
前記入力画像を、当該入力画像内の1文字が所定の数に分割される大きさの、複数の部分入力画像に分割する分割工程と、
前記分割工程によって得られた複数の部分入力画像の各々について特徴量を算出する特徴量算出工程と、
複数の文字画像をそれぞれ前記所定の数に分割した部分文字画像の特徴量と、当該部分文字画像の特徴量がどの文字画像の、どの位置の部分文字画像の特徴量であるかと、前記文字画像によって示される文字種別とを対応付けて記憶した検索テーブルから、前記特徴量算出工程によって算出された特徴量をキーにして、前記部分入力画像の各々について特徴量が類似する部分文字画像を検索する検索工程と、
前記検索工程によって得られた複数の部分文字画像を文字種別毎に集計し、各文字種別内における前記部分文字画像の位置関係と、当該部分文字画像に対応する部分入力画像の前記入力画像内における位置関係との整合性を判定し、部分文字画像の位置関係と整合する部分入力画像の組み合わせを文字候補として抽出する整合性判定工程と、
前記整合性判定工程によって抽出された文字候補が、所定数以上の部分入力画像を有する場合に、当該文字候補が有する部分入力画像が前記文字種別によって示された文字の構成要素であると認識する認識工程と、
を含んだことを特徴とする文字認識方法。
Priority Applications (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2007208612A JP5098504B2 (ja) | 2007-08-09 | 2007-08-09 | 文字認識プログラム、文字認識装置および文字認識方法 |
US12/153,015 US20090041361A1 (en) | 2007-08-09 | 2008-05-12 | Character recognition apparatus, character recognition method, and computer product |
CN2008101082592A CN101364267B (zh) | 2007-08-09 | 2008-06-05 | 字符识别装置、字符识别方法及计算机产品 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2007208612A JP5098504B2 (ja) | 2007-08-09 | 2007-08-09 | 文字認識プログラム、文字認識装置および文字認識方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2009043102A JP2009043102A (ja) | 2009-02-26 |
JP5098504B2 true JP5098504B2 (ja) | 2012-12-12 |
Family
ID=40346612
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2007208612A Active JP5098504B2 (ja) | 2007-08-09 | 2007-08-09 | 文字認識プログラム、文字認識装置および文字認識方法 |
Country Status (3)
Country | Link |
---|---|
US (1) | US20090041361A1 (ja) |
JP (1) | JP5098504B2 (ja) |
CN (1) | CN101364267B (ja) |
Families Citing this family (20)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2011166402A (ja) * | 2010-02-09 | 2011-08-25 | Seiko Epson Corp | 画像処理装置、方法及びコンピュータプログラム |
CN102208022A (zh) * | 2010-03-31 | 2011-10-05 | 富士通株式会社 | 遮挡字符恢复装置及其方法、遮挡字符识别装置及其方法 |
JP5372853B2 (ja) * | 2010-07-08 | 2013-12-18 | 株式会社日立製作所 | デジタルシーケンス特徴量算出方法及びデジタルシーケンス特徴量算出装置 |
JP5630863B2 (ja) | 2010-11-26 | 2014-11-26 | インターナショナル・ビジネス・マシーンズ・コーポレーションInternational Business Machines Corporation | 構造化文書に含まれるノードの全順序関係を、ログ情報に基づいて決定して可視化する方法、装置及びコンピュータプログラム |
CN102622366B (zh) | 2011-01-28 | 2014-07-30 | 阿里巴巴集团控股有限公司 | 相似图像的识别方法和装置 |
JP5168435B2 (ja) * | 2011-05-17 | 2013-03-21 | パナソニック株式会社 | 文字列抽出方法と文字列抽出装置 |
CN102724387B (zh) * | 2012-05-26 | 2016-08-03 | 安科智慧城市技术(中国)有限公司 | 一种电子稳像的方法及装置 |
CN102880874B (zh) * | 2012-09-29 | 2016-04-13 | 重庆新媒农信科技有限公司 | 字符识别方法和字符识别器 |
JP2014127186A (ja) * | 2012-12-27 | 2014-07-07 | Ricoh Co Ltd | 画像処理装置、画像処理方法およびプログラム |
JP6127685B2 (ja) * | 2013-04-19 | 2017-05-17 | 富士通株式会社 | 情報処理装置、プログラム、及び形状認識方法 |
CN104348624B (zh) * | 2013-08-09 | 2018-02-02 | 阿里巴巴集团控股有限公司 | 一种哈希认证可信度的方法和装置 |
JP6170860B2 (ja) * | 2014-03-25 | 2017-07-26 | 株式会社日立情報通信エンジニアリング | 文字認識装置及び識別関数生成方法 |
JP6694638B2 (ja) * | 2015-01-21 | 2020-05-20 | 国立大学法人東京農工大学 | プログラム、情報記憶媒体及び認識装置 |
CN107092903A (zh) * | 2016-02-18 | 2017-08-25 | 阿里巴巴集团控股有限公司 | 信息识别方法及装置 |
CN106599028B (zh) * | 2016-11-02 | 2020-04-28 | 华南理工大学 | 一种基于视频图像处理的书本内容搜索匹配方法 |
CN109753967A (zh) * | 2018-12-29 | 2019-05-14 | 北京师范大学 | 一种图片文字识别方法 |
CN110929708A (zh) * | 2019-09-30 | 2020-03-27 | 京东数字科技控股有限公司 | 识别泰国身份证中国旗的方法、设备及存储介质 |
CN113542750B (zh) * | 2021-05-27 | 2024-06-25 | 绍兴市北大信息技术科创中心 | 采用两套以上哈希表进行搜索的数据编码方法 |
CN113962199B (zh) * | 2021-12-20 | 2022-04-08 | 腾讯科技(深圳)有限公司 | 文本识别方法、装置、设备、存储介质及程序产品 |
CN114637845B (zh) * | 2022-03-11 | 2023-04-14 | 上海弘玑信息技术有限公司 | 模型测试方法、装置、设备和存储介质 |
Family Cites Families (14)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US4075605A (en) * | 1974-09-13 | 1978-02-21 | Recognition Equipment Incorporated | Character recognition unit |
JPS5923467B2 (ja) * | 1979-04-16 | 1984-06-02 | 株式会社日立製作所 | 位置検出方法 |
US5119441A (en) * | 1989-03-28 | 1992-06-02 | Ricoh Company, Ltd. | Optical character recognition apparatus and method using masks operation |
US5067165A (en) * | 1989-04-19 | 1991-11-19 | Ricoh Company, Ltd. | Character recognition method |
JPH03160585A (ja) * | 1989-11-17 | 1991-07-10 | Sanyo Electric Co Ltd | 文字認識方法 |
JPH06236455A (ja) * | 1993-02-10 | 1994-08-23 | Oki Electric Ind Co Ltd | 文字認識装置 |
JP2951814B2 (ja) * | 1993-02-25 | 1999-09-20 | 富士通株式会社 | 画像抽出方式 |
JPH0896080A (ja) * | 1994-09-26 | 1996-04-12 | Nec Eng Ltd | 光学文字読取装置 |
JP3294995B2 (ja) * | 1996-06-21 | 2002-06-24 | 三菱電機株式会社 | 帳票読取装置 |
JPH11184971A (ja) * | 1997-12-22 | 1999-07-09 | Toshiba Corp | 手書き文字認識機能を持つ文字入力装置及び方法 |
CN1200387C (zh) * | 2003-04-11 | 2005-05-04 | 清华大学 | 基于单个字符的统计笔迹鉴别和验证方法 |
US7190834B2 (en) * | 2003-07-22 | 2007-03-13 | Cognex Technology And Investment Corporation | Methods for finding and characterizing a deformed pattern in an image |
US7386172B2 (en) * | 2005-03-11 | 2008-06-10 | Kabushiki Kaisha Toshiba | Image recognition method |
JP4750802B2 (ja) * | 2006-01-13 | 2011-08-17 | 富士通株式会社 | 帳票処理プログラムおよび帳票処理装置 |
-
2007
- 2007-08-09 JP JP2007208612A patent/JP5098504B2/ja active Active
-
2008
- 2008-05-12 US US12/153,015 patent/US20090041361A1/en not_active Abandoned
- 2008-06-05 CN CN2008101082592A patent/CN101364267B/zh active Active
Also Published As
Publication number | Publication date |
---|---|
CN101364267B (zh) | 2011-09-28 |
JP2009043102A (ja) | 2009-02-26 |
US20090041361A1 (en) | 2009-02-12 |
CN101364267A (zh) | 2009-02-11 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5098504B2 (ja) | 文字認識プログラム、文字認識装置および文字認識方法 | |
US10853638B2 (en) | System and method for extracting structured information from image documents | |
Moreno-García et al. | New trends on digitisation of complex engineering drawings | |
Hajič et al. | The MUSCIMA++ dataset for handwritten optical music recognition | |
US11113518B2 (en) | Apparatus and methods for extracting data from lineless tables using Delaunay triangulation and excess edge removal | |
JP5500480B2 (ja) | 帳票認識装置及び帳票認識方法 | |
JP5134628B2 (ja) | 連続する記事部分の媒体資料解析 | |
US8233726B1 (en) | Image-domain script and language identification | |
CN111523537A (zh) | 一种文字识别方法、存储介质及系统 | |
CN112925938A (zh) | 一种图像标注方法、装置、电子设备及存储介质 | |
CN110020005A (zh) | 一种病历中主诉和现病史中症状匹配方法 | |
CN110796145B (zh) | 基于智能决策的多证件分割关联方法及相关设备 | |
JP5343617B2 (ja) | 文字認識プログラム、文字認識方法および文字認識装置 | |
CN116343237A (zh) | 基于深度学习和知识图谱的票据识别方法 | |
JP4140221B2 (ja) | 画像照合装置および画像照合プログラム | |
CN114782965A (zh) | 基于布局关联性的视觉富文档信息抽取方法、系统及介质 | |
Sotoodeh et al. | A music symbols recognition method using pattern matching along with integrated projection and morphological operation techniques | |
Sotoodeh et al. | Staff detection and removal using derivation and connected component analysis | |
CN112287763A (zh) | 图像处理方法、装置、设备及介质 | |
JP2004046723A (ja) | 文字認識方法、該方法の実行に用いるプログラム及び文字認識装置 | |
Maity et al. | An approach for detecting circular callouts in architectural, engineering and constructional drawing documents | |
CN113420840B (zh) | 基于低分辨率图像的目标检测方法和系统 | |
Liu et al. | Table detection method based on feature pyramid network with faster R-CNN | |
CN112183538B (zh) | 一种满文识别方法及系统 | |
JP2014081867A (ja) | 情報処理装置及び情報処理プログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20100416 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20120323 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20120403 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20120604 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20120828 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20120910 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20151005 Year of fee payment: 3 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5098504 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |