JP7599640B2 - 帳票の特定フィールド認識方法および特定フィールド読取り装置 - Google Patents
帳票の特定フィールド認識方法および特定フィールド読取り装置 Download PDFInfo
- Publication number
- JP7599640B2 JP7599640B2 JP2021092111A JP2021092111A JP7599640B2 JP 7599640 B2 JP7599640 B2 JP 7599640B2 JP 2021092111 A JP2021092111 A JP 2021092111A JP 2021092111 A JP2021092111 A JP 2021092111A JP 7599640 B2 JP7599640 B2 JP 7599640B2
- Authority
- JP
- Japan
- Prior art keywords
- ruled line
- intersection
- specific field
- ruled
- intersections
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims description 37
- 238000000605 extraction Methods 0.000 claims description 10
- 239000003086 colorant Substances 0.000 claims description 5
- 238000012545 processing Methods 0.000 description 11
- 238000010586 diagram Methods 0.000 description 9
- 238000005516 engineering process Methods 0.000 description 9
- 239000000284 extract Substances 0.000 description 7
- 230000006870 function Effects 0.000 description 5
- 238000004364 calculation method Methods 0.000 description 4
- 238000001514 detection method Methods 0.000 description 3
- 230000000694 effects Effects 0.000 description 3
- 230000008520 organization Effects 0.000 description 3
- 238000000926 separation method Methods 0.000 description 3
- 238000004458 analytical method Methods 0.000 description 2
- 238000004891 communication Methods 0.000 description 2
- 230000010365 information processing Effects 0.000 description 2
- 238000012015 optical character recognition Methods 0.000 description 2
- 229930091051 Arenine Natural products 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 239000002989 correction material Substances 0.000 description 1
- 238000010191 image analysis Methods 0.000 description 1
- 238000007781 pre-processing Methods 0.000 description 1
- 238000012958 reprocessing Methods 0.000 description 1
Landscapes
- Character Input (AREA)
Description
帳票100は、スキャナ等の入力装置101にセットされ、帳票面が読取られる。この読取り操作は、例えば、自治体や企業等、帳票100が大量に生じる組織内で行われるケース(その後の処理は外部委託となるケース)、電子化作業を受託する組織に帳票100が送付された後に当該組織内で他の操作とともに一括して行われるケース等が挙げられる。前者のように、異なる主体によって本発明に係る一連の処理が行われる場合、入力装置101と計算機102間の通信は、ネットワークを介する方法、または、いわゆるCD、DVD、USBメモリ等の記憶媒体を介する方法等のいずれの方法でもよい。
まず、罫線抽出にあたっては、所定の前処理が必要である。帳票画像は、必ずしも正確に読取られていないからである。画像サイズが異なる、傾いている、パンチ穴等の不要な部分が含まれている等、罫線の抽出を阻害する問題がある。ただし、これらの問題は、いずれも今日の一般的な技術常識によって処理可能である。
帳票書式の特性として、罫線によって閉じている、罫線が線分として単独で存在することはないことが挙げられる。すなわち、罫線の線分は必ず他の罫線の線分とつながっている。次の処理は、この特性を前提とするものである。
抽出された交点から罫線を再構築する処理について、図8の左上の形状の交点を例に挙げる(交点Aとする)。罫線の再構築処理は、各交点の罫線伸長方向において近接する交点同士を結ぶ線分を新たな罫線とする処理である。交点Aにおける罫線伸長方向は、交点Aから右方向(行方向)と下方向(列方向)である。交点Aが行方向においてつながり得る交点の形状は6種類ある(図10)。これらの形状を有する交点の中から一定の高さ範囲(縦座標範囲)にあり、かつ、交点Aと最短距離にあるものが、交点Aと結ばれる交点(交点Bとする)として選択される。交点Bが交点Aの近接交点として決定したら、交点A、Bを結ぶ線分(新たな罫線)が形成される。この線分は、後述するフィールド特定に供される。
帳票中の所望の領域の特定は次の通りである。所望の領域とは、罫線によって四方を囲まれた、認識対象となる領域である。次の要素に基づき、所望の領域が特定される。一つは、起点となる交点である。起点は任意の交点でよいが、帳票外枠の角であることが望ましい。ただし、所望の領域を囲む罫線上の交点は、本発明に係る起点から除外される。もう一つは、起点からの罫線経路である。罫線経路は、起点から次の交点までの線分(罫線)による道順を示すものである。例えば、起点から「右」、「下」、「下」、「右」・・・のように次の交点を示し、終点が特定されるものである。
Claims (4)
- 帳票面の画像を入力し、取得した画像中の所望の領域を特定フィールドとして認識する特定フィールド認識方法であり、
前記取得した画像について、所定値以上の連続性を有する選択色を罫線として抽出し、
前記罫線を、罫線交点形状に係る登録類型と比較して、前記登録類型のいずれかの形状に該当する箇所をその形状に係る交点として抽出し、
前記交点の罫線伸長方向において近接する前記交点同士を結ぶ線分を新たな罫線として再構成し、
前記交点のいずれかの交点を起点として、終点となる交点への罫線経路を指定し、
前記罫線経路に従って到達した終点を一隅とする罫線に囲まれた領域を特定フィールドとして認識する特定フィールド認識方法。 - 前記起点が複数あり、それぞれの起点から到達したそれぞれの終点を一隅とする罫線に囲まれた領域の画像を比較し、同一と判断される場合にのみ当該領域を特定フィールドとして認識する請求項1に記載の特定フィールド認識方法。
- 帳票面入力手段と、
前記帳票面入力手段によって取得した帳票画像について、所定値以上の連続性を有する選択色を罫線として抽出する罫線抽出手段と、
罫線交点形状に係る類型を登録する交点形状類型登録手段と、
前記罫線を、前記交点形状類型登録手段で登録された登録類型と比較して、前記登録類型のいずれかの形状に該当する箇所をその形状に係る交点として抽出する交点抽出手段と、
前記交点の罫線伸長方向において近接する前記交点同士を結ぶ線分を新たな罫線として再構成する罫線再構成手段と、
前記交点のいずれかの交点を起点とする罫線経路に従って到達した終点を一隅とする罫線に囲まれた領域を特定フィールドとして認識する特定フィールド認識手段とを有する特定フィールド読取り装置。 - 前記特定フィールド認識手段が、複数の起点から到達したそれぞれの終点を一隅とする罫線に囲まれた領域の画像を比較し、同一と判断される場合にのみ当該領域を特定フィールドとして認識するものである請求項3に記載の特定フィールド読取り装置。
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2021092111A JP7599640B2 (ja) | 2021-06-01 | 2021-06-01 | 帳票の特定フィールド認識方法および特定フィールド読取り装置 |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2021092111A JP7599640B2 (ja) | 2021-06-01 | 2021-06-01 | 帳票の特定フィールド認識方法および特定フィールド読取り装置 |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| JP2022184331A JP2022184331A (ja) | 2022-12-13 |
| JP7599640B2 true JP7599640B2 (ja) | 2024-12-16 |
Family
ID=84437546
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP2021092111A Active JP7599640B2 (ja) | 2021-06-01 | 2021-06-01 | 帳票の特定フィールド認識方法および特定フィールド読取り装置 |
Country Status (1)
| Country | Link |
|---|---|
| JP (1) | JP7599640B2 (ja) |
Families Citing this family (1)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP7754993B1 (ja) | 2024-05-30 | 2025-10-15 | 東急不動産株式会社 | プログラム、情報処理装置及び方法 |
Citations (1)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP2012064098A (ja) | 2010-09-17 | 2012-03-29 | Glory Ltd | 枠線認識方法および枠線認識装置 |
Family Cites Families (3)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP3179280B2 (ja) * | 1994-04-15 | 2001-06-25 | 三菱電機株式会社 | 表を含む帳票処理装置 |
| JP3586949B2 (ja) * | 1995-11-16 | 2004-11-10 | 松下電器産業株式会社 | 帳票認識装置 |
| JP3936436B2 (ja) * | 1997-07-31 | 2007-06-27 | 株式会社日立製作所 | 表認識方法 |
-
2021
- 2021-06-01 JP JP2021092111A patent/JP7599640B2/ja active Active
Patent Citations (1)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP2012064098A (ja) | 2010-09-17 | 2012-03-29 | Glory Ltd | 枠線認識方法および枠線認識装置 |
Also Published As
| Publication number | Publication date |
|---|---|
| JP2022184331A (ja) | 2022-12-13 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| EP0063454B1 (en) | Method for recognizing machine encoded characters | |
| US5410611A (en) | Method for identifying word bounding boxes in text | |
| US9158986B2 (en) | Character segmentation device and character segmentation method | |
| CN115661848B (zh) | 一种基于深度学习的表格提取和识别方法及系统 | |
| JP3345224B2 (ja) | パターン抽出装置、パターン再認識用テーブル作成装置及びパターン認識装置 | |
| JP2004139484A (ja) | 帳票処理装置、該装置実行のためのプログラム、及び、帳票書式作成プログラム | |
| KR19980023917A (ko) | 패턴 인식 장치 및 방법 | |
| CN114495141B (zh) | 文档段落位置提取方法、电子设备及存储介质 | |
| CN114663897A (zh) | 表格提取方法与表格提取系统 | |
| JPH01253077A (ja) | 文字列検出方法 | |
| JP2009169948A (ja) | 原稿方向判定装置、原稿方向判定方法、プログラムおよびその記録媒体 | |
| US8249364B2 (en) | Method for resolving contradicting output data from an optical character recognition (OCR) system, wherein the output data comprises more than one recognition alternative for an image of a character | |
| CN115620322A (zh) | 一种基于关键点检测的全线表表格结构识别方法 | |
| JP2000285190A (ja) | 帳票識別方法および帳票識別装置および記憶媒体 | |
| CN115311666A (zh) | 图文识别方法、装置、计算机设备及存储介质 | |
| JP7599640B2 (ja) | 帳票の特定フィールド認識方法および特定フィールド読取り装置 | |
| JP2011090578A (ja) | 画像処理装置、画像処理方法及びプログラム | |
| CN119445600A (zh) | 图像中表格的识别方法、装置、计算机设备和可读存储介质 | |
| JP4492258B2 (ja) | 文字・図形の認識方法および検査方法 | |
| JP3442847B2 (ja) | 文字読取装置 | |
| JP2008108114A (ja) | 文書処理装置および文書処理方法 | |
| JP5712415B2 (ja) | 帳票処理システム及び帳票処理方法 | |
| JP4878057B2 (ja) | 文字認識方法,プログラム及び記録媒体 | |
| JP2009193170A (ja) | 文字認識装置及び文字認識方法 | |
| Bhujade et al. | A technique for segmentation of handwritten Hindi text |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20240531 |
|
| A871 | Explanation of circumstances concerning accelerated examination |
Free format text: JAPANESE INTERMEDIATE CODE: A871 Effective date: 20240531 |
|
| A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20240829 |
|
| A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20240830 |
|
| TRDD | Decision of grant or rejection written | ||
| A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20241125 |
|
| A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20241125 |
|
| R150 | Certificate of patent or registration of utility model |
Ref document number: 7599640 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |