JP2023036833A - 情報処理装置、及びプログラム - Google Patents
情報処理装置、及びプログラム Download PDFInfo
- Publication number
- JP2023036833A JP2023036833A JP2022207647A JP2022207647A JP2023036833A JP 2023036833 A JP2023036833 A JP 2023036833A JP 2022207647 A JP2022207647 A JP 2022207647A JP 2022207647 A JP2022207647 A JP 2022207647A JP 2023036833 A JP2023036833 A JP 2023036833A
- Authority
- JP
- Japan
- Prior art keywords
- rectangle
- circumscribing
- image data
- rectangles
- subgroup
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 230000010365 information processing Effects 0.000 title claims abstract description 30
- 238000000605 extraction Methods 0.000 abstract description 9
- 239000000284 extract Substances 0.000 abstract description 8
- 238000000034 method Methods 0.000 description 27
- 238000010586 diagram Methods 0.000 description 7
- 230000001174 ascending effect Effects 0.000 description 3
- 238000003491 array Methods 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 239000011159 matrix material Substances 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000012015 optical character recognition Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
Images
Landscapes
- Character Input (AREA)
- Image Analysis (AREA)
Abstract
Description
RIN>ROUT、かつ、
ROUT<Rrow_th
を満足するか否かを調べる。ここでRrow_thは、経験的に定められるしきい値であり、線分AH,ABの外にある部分の面積がどの程度であれば、選択した外接矩形Aが属する第1矩形サブグループに含めるかを定めるものである。
RIN>ROUT、かつ、
ROUT<Rcolumn_th
を満足するか否かを調べる。ここでRcolumn_thは、経験的に定められるしきい値であり、線分AL,ARの外にある部分の面積がどの程度であれば、選択した外接矩形Aが属する第2矩形サブグループに含めるかを定めるものである。
本実施の形態の情報処理装置1は、以上の構成を備えており、次のように動作する。以下の例では、スキャナ2が読み取る帳票には、図6(a)に例示するように、記入枠(A,B,C,D,E,Fで示される部分)がそれぞれ所定の間隔をおいて、マトリクス状に(行方向及び列方向に)配列され、それぞれ文字列AAA,BB,CC,DDD,EE,FFF(それぞれ文字数は互いに異なってよい)が記入されているものとする。また、図6(a)の例では、罫線はないものとしている。
なお、ここまでの説明において、制御部11は、第1認識部23としての処理において、外接矩形の一つを選択し、当該選択した外接矩形に対して、帳票の画像データの行方向(または列方向)に存在する他の外接矩形を検出してグループ化するものとした。この際、選択した外接矩形を行方向(または列方向)に延長した領域に重なりあう他の外接矩形であって、当該重なりあう範囲の面積が当該他の外接矩形全体の面積に対して所定の比より大きい場合にグループ化する、といった条件としていたが当該グループ化の条件はこれに限られない。
また本実施の形態の別の例では、制御部11は、次のようにして表を認識してもよい。制御部11は、二値化処理や階調反転、輪郭線抽出等の処理を用いて、スキャナ2等から受け入れた帳票の画像データから矩形状の領域を認識し、認識した矩形状の領域の各々について固有の識別情報を発行する。
本実施の形態によると、光学的に読み取られた帳票の記入枠の領域を、罫線の有無に関わらず、人為的操作なく認識できる。また、表組の項目名と本体とを区別して、記入枠の領域を、認識できる。
Claims (6)
- 帳票の画像データを受け入れる手段と、
前記受け入れた帳票の画像データから、帳票上の記入枠の候補の外接矩形を抽出する手段と、
前記帳票の画像データの第1の軸方向に配列された、複数の前記外接矩形を含む第1矩形サブグループを少なくとも一つ認識する第1認識手段と、
前記第1認識手段が認識した第1矩形サブグループごとに、当該第1矩形サブグループに含まれる複数の外接矩形にさらに外接する第1グループ矩形を設定する第1グループ化手段と、
前記帳票の画像データの、前記第1の軸方向に交差する第2の軸方向に配列された、複数の前記外接矩形を含む第2矩形サブグループを少なくとも一つ認識する第2認識手段と、
前記第2認識手段が認識した前記第2矩形サブグループごとに、当該第2矩形サブグループに含まれる複数の外接矩形にさらに外接する第2グループ矩形を設定する第2グループ化手段と、
前記第1グループ矩形と、前記第2グループ矩形との交差範囲を、記入枠として認識し、当該認識した記入枠内の画像データを抽出して所定の処理に供する手段と、
を有する情報処理装置。 - 請求項1に記載の情報処理装置であって、
前記所定の処理は、前記記入枠に含まれる画像データに基づく文字認識処理を含む情報処理装置。 - 請求項1または2に記載の情報処理装置であって、
前記第1認識手段は、前記帳票の画像データの前記第1の軸方向に配列された、複数の前記外接矩形であって、所定の基準を満足する複数の前記外接矩形を含む第1矩形サブグループを少なくとも一つ認識する情報処理装置。 - 請求項1から3のいずれか一項に記載の情報処理装置であって、
前記第2認識手段は、前記帳票の画像データの前記第2の軸方向に配列された、複数の前記外接矩形であって、所定の基準を満足する複数の前記外接矩形を含む第2矩形サブグループを少なくとも一つ認識する情報処理装置。 - 請求項3または4に記載の情報処理装置であって、
前記所定の基準は、
複数の前記外接矩形に含まれる一対の外接矩形間の距離に基づく基準、または
複数の前記外接矩形の形状に基づく基準、
の少なくとも一方の基準である情報処理装置。 - コンピュータを、
帳票の画像データを受け入れる手段と、
前記受け入れた帳票の画像データから、帳票上の記入枠の候補の外接矩形を抽出する手段と、
前記帳票の画像データの第1の軸方向に配列された、複数の前記外接矩形を含む第1矩形サブグループを少なくとも一つ認識する第1認識手段と、
前記第1認識手段が認識した第1矩形サブグループごとに、当該第1矩形サブグループに含まれる複数の外接矩形にさらに外接する第1グループ矩形を設定する第1グループ化手段と、
前記帳票の画像データの、前記第1の軸方向に交差する第2の軸方向に配列された、複数の前記外接矩形を含む第2矩形サブグループを少なくとも一つ認識する第2認識手段と、
前記第2認識手段が認識した前記第2矩形サブグループごとに、当該第2矩形サブグループに含まれる複数の外接矩形にさらに外接する第2グループ矩形を設定する第2グループ化手段と、
前記第1グループ矩形と、前記第2グループ矩形との交差範囲を、記入枠として認識し、当該認識した記入枠内の画像データを抽出して所定の処理に供する手段と、
として機能させるプログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2022207647A JP7458600B2 (ja) | 2020-05-12 | 2022-12-23 | 情報処理装置、及びプログラム |
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2020084128A JP7283756B2 (ja) | 2020-05-12 | 2020-05-12 | 情報処理装置、及びプログラム |
JP2022207647A JP7458600B2 (ja) | 2020-05-12 | 2022-12-23 | 情報処理装置、及びプログラム |
Related Parent Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2020084128A Division JP7283756B2 (ja) | 2020-05-12 | 2020-05-12 | 情報処理装置、及びプログラム |
Publications (3)
Publication Number | Publication Date |
---|---|
JP2023036833A true JP2023036833A (ja) | 2023-03-14 |
JP2023036833A5 JP2023036833A5 (ja) | 2023-03-22 |
JP7458600B2 JP7458600B2 (ja) | 2024-04-01 |
Family
ID=78511627
Family Applications (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2020084128A Active JP7283756B2 (ja) | 2020-05-12 | 2020-05-12 | 情報処理装置、及びプログラム |
JP2022207647A Active JP7458600B2 (ja) | 2020-05-12 | 2022-12-23 | 情報処理装置、及びプログラム |
Family Applications Before (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2020084128A Active JP7283756B2 (ja) | 2020-05-12 | 2020-05-12 | 情報処理装置、及びプログラム |
Country Status (1)
Country | Link |
---|---|
JP (2) | JP7283756B2 (ja) |
Family Cites Families (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP0407935B1 (en) | 1989-07-10 | 1999-10-06 | Hitachi, Ltd. | Document data processing apparatus using image data |
JP3415342B2 (ja) * | 1995-09-13 | 2003-06-09 | 富士通株式会社 | 文字切り出し方式 |
JP4153850B2 (ja) * | 2003-08-29 | 2008-09-24 | 株式会社東芝 | 画像処理装置、画像処理プログラム |
JP4867401B2 (ja) * | 2006-03-06 | 2012-02-01 | 富士ゼロックス株式会社 | 画像処理装置及びプログラム |
JP4549400B2 (ja) * | 2008-03-04 | 2010-09-22 | 富士通株式会社 | 文書認識プログラム、文書認識装置、および文書認識方法 |
JP4856235B2 (ja) | 2009-12-15 | 2012-01-18 | 富士通株式会社 | 帳票認識方法及び帳票認識装置 |
-
2020
- 2020-05-12 JP JP2020084128A patent/JP7283756B2/ja active Active
-
2022
- 2022-12-23 JP JP2022207647A patent/JP7458600B2/ja active Active
Also Published As
Publication number | Publication date |
---|---|
JP7283756B2 (ja) | 2023-05-30 |
JP2021179743A (ja) | 2021-11-18 |
JP7458600B2 (ja) | 2024-04-01 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US4903312A (en) | Character recognition with variable subdivisions of a character region | |
US7558426B2 (en) | Device for outputting character recognition results, character recognition device, and program therefor | |
US5325447A (en) | Handwritten digit normalization method | |
US8548246B2 (en) | Method and system for preprocessing an image for optical character recognition | |
US5046114A (en) | Method and structure for separating joined patterns for use in pattern and character recognition system | |
US6798895B1 (en) | Character string extraction and image processing methods and apparatus | |
EP0750415B1 (en) | Image processing method and apparatus | |
CN114004204A (zh) | 基于计算机视觉的表格结构重建与文字提取方法和系统 | |
US20170161580A1 (en) | Method and system for text-image orientation | |
JP3837193B2 (ja) | 文字行抽出方法および装置 | |
JP4538214B2 (ja) | グラフによる画像分割 | |
JP7283756B2 (ja) | 情報処理装置、及びプログラム | |
JP4390523B2 (ja) | 最小領域による合成画像の分割 | |
US5369715A (en) | Optical character recognition system | |
JP2004282701A5 (ja) | ||
JP3607753B2 (ja) | 文書画像の領域分割方法および装置、並びに段組種類判別方法および装置 | |
JP7370574B2 (ja) | コマ抽出方法及びプログラム | |
JPH0449148B2 (ja) | ||
JP2918363B2 (ja) | 文字分類方法及び文字認識装置 | |
JP2003271973A (ja) | 画像処理方法および画像処理プログラム | |
JP3104355B2 (ja) | 特徴抽出装置 | |
JP2571826B2 (ja) | 文字列パターン切り出し装置 | |
JPH0262682A (ja) | 文字認識方法 | |
JP2004030340A (ja) | 帳票識別装置及びその識別方法 | |
JPH06131496A (ja) | パターン正規化処理方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20230310 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20230310 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20240125 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20240213 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20240308 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 7458600 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |