JP2021167990A - レイアウト解析装置、その解析プログラムおよびその解析方法 - Google Patents
レイアウト解析装置、その解析プログラムおよびその解析方法 Download PDFInfo
- Publication number
- JP2021167990A JP2021167990A JP2020070113A JP2020070113A JP2021167990A JP 2021167990 A JP2021167990 A JP 2021167990A JP 2020070113 A JP2020070113 A JP 2020070113A JP 2020070113 A JP2020070113 A JP 2020070113A JP 2021167990 A JP2021167990 A JP 2021167990A
- Authority
- JP
- Japan
- Prior art keywords
- item
- area
- layout
- document image
- attributes
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Landscapes
- Character Input (AREA)
- Image Analysis (AREA)
Abstract
【解決手段】レイアウト解析装置1は、項目抽出部2と、レイアウト解析部5と、を備える。項目抽出部2は、文書上に活字で印刷された項目名を含む項目領域を抽出対象として、文書画像中に含まれる項目領域とその項目領域の属性とを項目名に対応させて抽出する。レイアウト解析部5は、文書画像上における項目領域の位置およびその属性に基づいて、文書画像のレイアウトを解析する。
【選択図】図1
Description
本実施形態に係るレイアウト解析装置では、解析対象として帳票を例に挙げたが、解析対象は任意の文書であってもよい。
2 項目抽出部
3 手書き領域抽出部
4 フィルタ処理部
5 レイアウト解析部
6 学習処理部
7 学習モデル
8 対応規則テーブル
Claims (8)
- 文書画像中の、活字で印刷された項目名を含む項目領域、及び当該項目領域の属性を前記項目名に対応させて抽出する項目抽出部と、
前記文書画像上における項目領域の位置およびその属性に基づいて、前記文書画像のレイアウトを解析するレイアウト解析部と、
を備える、レイアウト解析装置。 - 文書上に手書き文字で記入された文字列を含む手書き文字領域を文書画像中から抽出する手書き領域抽出部をさらに有し、
前記レイアウト解析部は、前記手書き文字領域に対して、前記項目抽出部によって抽出された属性を割り当てる、
請求項1に記載されたレイアウト解析装置。 - 前記レイアウト解析部は、予め設定された対応規則にしたがって、前記項目領域と、当該項目領域から所定距離内に位置する前記手書き文字領域とを対応付けて前記項目領域の属性を割り当てる、
請求項2に記載されたレイアウト解析装置。 - 前記項目抽出部は、文書画像に対し、当該文書画像における項目名の部分をバウンディングボックスで指定した教師データ又は当該文書画像における項目名の部分に対応するピクセルを指定した教師データのいずれか若しくは両方の教師データによる学習により構築された学習モデルを用いて、前記文書画像の入力に応じて前記文書画像における前記項目領域の抽出と属性とを出力する、
請求項1から3のいずれか1項に記載されたレイアウト解析装置。 - 前記項目抽出部は、前記属性の分類確度を出力し
前記分類確度が所定のしきい値よりも小さい前記属性をノイズとして除去するフィルタ処理部をさらに有する、
請求項1から4のいずれか1項に記載されたレイアウト解析装置。 - 前記レイアウト解析部は、文書画像のレイアウトについて複数の解析結果が得られた場合、当該複数の解析結果をレイアウトの候補としてユーザに提示する
請求項1から5のいずれか1項に記載されたレイアウト解析装置。 - 文書画像中の、活字で印刷された項目名を含む項目領域、及び当該項目領域の属性を前記項目名に対応させて抽出する第1のステップと、
前記文書画像上における項目領域の位置およびその属性に基づいて、前記文書画像のレイアウトを解析する第2のステップと、
を有する処理をコンピュータに実行させる、レイアウト解析プログラム。 - 文書画像中の、活字で印刷された項目名を含む項目領域、及び当該項目領域の属性を前記項目名に対応させて抽出する第1のステップと、
前記文書画像上における項目領域の位置およびその属性に基づいて、前記文書画像のレイアウトを解析する第2のステップと、
を有する、レイアウト解析方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2020070113A JP6896260B1 (ja) | 2020-04-08 | 2020-04-08 | レイアウト解析装置、その解析プログラムおよびその解析方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2020070113A JP6896260B1 (ja) | 2020-04-08 | 2020-04-08 | レイアウト解析装置、その解析プログラムおよびその解析方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP6896260B1 JP6896260B1 (ja) | 2021-06-30 |
JP2021167990A true JP2021167990A (ja) | 2021-10-21 |
Family
ID=76540428
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2020070113A Active JP6896260B1 (ja) | 2020-04-08 | 2020-04-08 | レイアウト解析装置、その解析プログラムおよびその解析方法 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP6896260B1 (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR102555809B1 (ko) * | 2022-09-30 | 2023-07-13 | 에스케이 주식회사 | 문서 양식을 웹폼으로 변환하는 방법 및 시스템 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH09231291A (ja) * | 1996-02-27 | 1997-09-05 | Mitsubishi Electric Corp | 帳票読取方法及びその装置 |
JPH11259597A (ja) * | 1998-03-12 | 1999-09-24 | Oki Electric Ind Co Ltd | フォーマット認識装置及び文字読み取り装置 |
JP2009230498A (ja) * | 2008-03-24 | 2009-10-08 | Oki Electric Ind Co Ltd | 帳票処理方法、帳票処理プログラム、帳票処理装置、および、帳票処理システム |
WO2016147652A1 (ja) * | 2015-03-19 | 2016-09-22 | 日本電気株式会社 | オブジェクト検出装置、オブジェクト検出方法および記録媒体 |
JP6590355B1 (ja) * | 2019-04-26 | 2019-10-16 | Arithmer株式会社 | 学習モデル生成装置、文字認識装置、学習モデル生成方法、文字認識方法、及びプログラム |
-
2020
- 2020-04-08 JP JP2020070113A patent/JP6896260B1/ja active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH09231291A (ja) * | 1996-02-27 | 1997-09-05 | Mitsubishi Electric Corp | 帳票読取方法及びその装置 |
JPH11259597A (ja) * | 1998-03-12 | 1999-09-24 | Oki Electric Ind Co Ltd | フォーマット認識装置及び文字読み取り装置 |
JP2009230498A (ja) * | 2008-03-24 | 2009-10-08 | Oki Electric Ind Co Ltd | 帳票処理方法、帳票処理プログラム、帳票処理装置、および、帳票処理システム |
WO2016147652A1 (ja) * | 2015-03-19 | 2016-09-22 | 日本電気株式会社 | オブジェクト検出装置、オブジェクト検出方法および記録媒体 |
JP6590355B1 (ja) * | 2019-04-26 | 2019-10-16 | Arithmer株式会社 | 学習モデル生成装置、文字認識装置、学習モデル生成方法、文字認識方法、及びプログラム |
Non-Patent Citations (1)
Title |
---|
陳 放歌 外2名: "案内標識のリアルタイム検出および自動生成した学習データに基づく内容認識に関する研究", 第23回 画像センシングシンポジウム SSII2017,画像センシング技術研究会,SO3-IS3-09, JPN6020040924, 9 June 2017 (2017-06-09), JP, ISSN: 0004374463 * |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR102555809B1 (ko) * | 2022-09-30 | 2023-07-13 | 에스케이 주식회사 | 문서 양식을 웹폼으로 변환하는 방법 및 시스템 |
Also Published As
Publication number | Publication date |
---|---|
JP6896260B1 (ja) | 2021-06-30 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP7396568B2 (ja) | 帳票レイアウト解析装置、その解析プログラムおよびその解析方法 | |
US10853638B2 (en) | System and method for extracting structured information from image documents | |
CA3027038C (en) | Document field detection and parsing | |
US10223345B2 (en) | Interactively predicting fields in a form | |
CN109685052A (zh) | 文本图像处理方法、装置、电子设备及计算机可读介质 | |
CN109685065B (zh) | 试卷内容自动分类的版面分析方法、系统 | |
Lu et al. | Automated analysis of images in documents for intelligent document search | |
CN109389050B (zh) | 一种流程图连接关系识别方法 | |
Slavin | Using special text points in the recognition of documents | |
CN111078979A (zh) | 一种基于ocr和文本处理技术识别网贷网站的方法及系统 | |
WO2017092574A1 (zh) | 一种基于混合数据类型数据的挖掘方法 | |
Rigaud et al. | What do we expect from comic panel extraction? | |
CN114463767A (zh) | 信用证识别方法、装置、计算机设备和存储介质 | |
Papandreou et al. | Slant estimation and core-region detection for handwritten Latin words | |
Dhanikonda et al. | An efficient deep learning model with interrelated tagging prototype with segmentation for telugu optical character recognition | |
Mörzinger et al. | Visual Structure Analysis of Flow Charts in Patent Images. | |
JP6896260B1 (ja) | レイアウト解析装置、その解析プログラムおよびその解析方法 | |
Sánchez-DelaCruz et al. | Importance and challenges of handwriting recognition with the implementation of machine learning techniques: a survey | |
Lue et al. | A novel character segmentation method for text images captured by cameras | |
Tran et al. | A deep learning-based system for document layout analysis | |
US11900705B2 (en) | Intelligent engineering data digitization | |
US11335108B2 (en) | System and method to recognise characters from an image | |
CN114359912A (zh) | 基于图神经网络的软件页面关键信息提取方法及系统 | |
Kumar et al. | Line based robust script identification for indianlanguages | |
Akhter et al. | Semantic segmentation of printed text from marathi document images using deep learning methods |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20200811 |
|
A871 | Explanation of circumstances concerning accelerated examination |
Free format text: JAPANESE INTERMEDIATE CODE: A871 Effective date: 20200811 |
|
A975 | Report on accelerated examination |
Free format text: JAPANESE INTERMEDIATE CODE: A971005 Effective date: 20200820 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20201027 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20201222 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20210126 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20210325 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20210518 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20210601 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6896260 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
S531 | Written request for registration of change of domicile |
Free format text: JAPANESE INTERMEDIATE CODE: R313531 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |