JP7211157B2 - 情報処理装置、関連付け方法および関連付けプログラム - Google Patents
情報処理装置、関連付け方法および関連付けプログラム Download PDFInfo
- Publication number
- JP7211157B2 JP7211157B2 JP2019034980A JP2019034980A JP7211157B2 JP 7211157 B2 JP7211157 B2 JP 7211157B2 JP 2019034980 A JP2019034980 A JP 2019034980A JP 2019034980 A JP2019034980 A JP 2019034980A JP 7211157 B2 JP7211157 B2 JP 7211157B2
- Authority
- JP
- Japan
- Prior art keywords
- item
- column
- item name
- columns
- association
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/40—Document-oriented image-based pattern recognition
- G06V30/41—Analysis of document content
- G06V30/412—Layout analysis of documents structured with printed lines or input boxes, e.g. business forms or tables
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/28—Character recognition specially adapted to the type of the alphabet, e.g. Latin alphabet
- G06V30/287—Character recognition specially adapted to the type of the alphabet, e.g. Latin alphabet of Kanji, Hiragana or Katakana characters
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/40—Document-oriented image-based pattern recognition
- G06V30/41—Analysis of document content
- G06V30/414—Extracting the geometrical structure, e.g. layout tree; Block segmentation, e.g. bounding boxes for graphics or text
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/40—Document-oriented image-based pattern recognition
- G06V30/42—Document-oriented image-based pattern recognition based on the type of document
Description
以下の実施の形態では、第1の実施形態に係る情報処理装置10の構成、帳票処理ツール16の論理構成、情報処理装置10の処理の流れを順に説明し、最後に第1の実施形態による効果を説明する。
まず、図1を用いて、本実施形態の情報処理装置10を含むシステムの構成例を説明する。図1は、第1の実施形態に係る情報処理装置の構成例を示すブロック図である。なお、図1に示す構成は一例にすぎず、具体的な構成は特に限定されない。
・(1)項目値欄jの左上の領域
・(2)項目値欄jの右上、右、右下、下、左下の領域、またはこれらのいくつか、あるいはすべてを結合した領域
・(3)上記(1)、(2)領域と、項目値欄jの同位の領域を結合した領域
・(1)項目名欄iの右下の領域
・(2)項目名欄iの左下、左、左上、上、右上の領域、またはこれらを結合した領域
・(3)上記(1)、(2)の領域と、項目値欄iの同位の領域を結合した領域
次に、図21Aおよび図21Bを用いて、第1の実施形態に係る情報処理装置10の処理手順の例を説明する。図21Aおよび図21Bは、第1の実施形態に係る情報処理装置における全体的な処理の流れの一例を示すフローチャートである。
このように、第1の実施形態に係る情報処理装置10は、様式情報を登録し、登録済み様式情報利用時には、登録した様式情報から求められる項目名のセットに基づいて、処理対象の帳票に含まれる項目名欄と項目値欄との関連付けを特定する。このため、帳票の欄の配置に変更があった場合であっても、帳票に含まれる項目名欄と項目値欄との関連付けを特定すること可能である。
また、図示した各装置の各構成要素は機能概念的なものであり、必ずしも物理的に図示の如く構成されていることを要しない。すなわち、各装置の分散・統合の具体的形態は図示のものに限られず、その全部または一部を、各種の負荷や使用状況などに応じて、任意の単位で機能的または物理的に分散・統合して構成することができる。さらに、各装置にて行なわれる各処理機能は、その全部または任意の一部が、CPUおよび当該CPUにて解析実行されるプログラムにて実現され、あるいは、ワイヤードロジックによるハードウェアとして実現され得る。
また、上記実施形態において説明した情報処理装置が実行する処理をコンピュータが実行可能な言語で記述したプログラムを作成することもできる。例えば、実施形態に係る情報処理装置10が実行する処理をコンピュータが実行可能な言語で記述した関連付けプログラムを作成することもできる。この場合、コンピュータが関連付けプログラムを実行することにより、上記実施形態と同様の効果を得ることができる。さらに、かかる関連付けプログラムをコンピュータ読み取り可能な記録媒体に記録して、この記録媒体に記録された関連付けプログラムをコンピュータに読み込ませて実行することにより上記実施形態と同様の処理を実現してもよい。
11a 操作入力部
11b 帳票入力部
12 表示部
13 OS
14 記憶部
15 エディタ
16 帳票処理ツール
161 記載内容・位置取得部
162 欄の種別判別部
163 票分割部
164 関連付け許容判定部
165 評価関数生成部
166 制約条件付与部
167 求解部
168a 登録部
168b 修正部
169 許容相対配置パターン生成部
170 作業データ蓄積部
170a 記載内容・位置データ
170b、172b 欄種別データ
170c、172d 票別記載内容・位置データ
170d、172e 相対配置パターン
170e 関連付け許容情報
170f 適用する評価関数
170g 適用する制約条件
170h、172a 項目名欄と項目値欄の関連情報
171 相対配置パターン保持部
171a 許容される/されない相対配置パターン
172 様式保持部
172c 項目名別ルール
Claims (9)
- 所定の帳票における項目値欄と関連付けられた項目名欄に対応付けられた項目名のセットを登録する登録部と、
前記登録部によって登録された項目名のセットに基づいて、処理対象の帳票に含まれる項目名欄と項目値欄との関連付けを特定する求解部とを
有し、
前記処理対象の帳票中の項目名欄と項目値欄とが判別できる場合に、項目名欄と項目値欄が関連付けられるのは、欄の相対的な配置関係の観点から関連付けが許容される場合に限られるという制約条件と、各項目値欄は、少なくとも1個以上の項目名欄と関連付くという制約条件と、文字列が同じ項目名欄が複数ある場合、その中で同じ項目値欄と関連付くのは最大1個という制約条件と、項目値欄同士は、それぞれ関連付く項目名欄に記載されている項目名のセットが互いに異なるという制約条件とを付与する制約条件付与部をさらに有し、
前記求解部は、前記制約条件付与部によって付与された制約条件を満たすように、処理対象の帳票に含まれる項目名欄と項目値欄との関連付けを特定することを特徴とする情報処理装置。 - 所定の帳票における項目値欄と関連付けられた項目名欄に対応付けられた項目名のセットを登録する登録部と、
前記登録部によって登録された項目名のセットに基づいて、処理対象の帳票に含まれる項目名欄と項目値欄との関連付けを特定する求解部とを
有し、
あらかじめ項目値欄と項目名欄の関連付けが特定されている帳票の様式情報を用いて別の帳票を処理する場合に、登録されている様式情報で保持されている項目名セットそれぞれについて、処理対象の帳票中の項目名欄セットを生成し、項目名欄と項目値欄が関連付けられるのは、欄の相対的な配置関係の観点から関連付けが許容される場合に限られるという制約条件と、各項目値欄は、最大1個の項目名欄セットと関連付くという制約条件と、各項目名欄セットは最大1個の項目値欄と関連付くという制約条件と、同じ項目名セットに対して生成される項目名欄セットのうち、項目値欄と関連付くのは最大1個という制約条件とを付与する制約条件付与部をさらに有し
前記求解部は、前記制約条件付与部によって付与された制約条件を満たすように、処理対象の帳票に含まれる項目値欄と項目名欄セットの関連付けと、項目名欄と項目値欄との関連付けを特定することを特徴とする情報処理装置。 - 前記処理対象の帳票中の各欄を基準にして他の欄の存在領域の分布パターンをそれぞれ求め、該分布パターンと、予め設定された許容される分布パターンおよび許容されない分布パターンのうちのいずれか一つまたは両方と比較し、前記処理対象の帳票中の項目名欄と項目値欄との関連付く可能性の有無を判定する関連付け許容判定部をさらに有することを特徴とする請求項1または2に記載の情報処理装置。
- 前記関連付け許容判定部は、予め設定された許容される分布パターンおよび許容されない分布パターンのうちのいずれか一つまたは両方を項目名別に定義する項目名個別ルールが設定されている場合には、該項目名個別ルールに応じて、前記処理対象の帳票中の項目名欄と項目値欄との関連付く可能性の有無を判定することを特徴とする請求項3に記載の情報処理装置。
- 所定の様式の帳票における項目名欄と項目値欄との関連付けから、相対配置パターンを取得して、取得した相対配置パターンを基に許容する配置パターンのデータを作成する許容相対配置パターン生成部をさらに有することを特徴とする請求項1または2に記載の情報処理装置。
- 情報処理装置によって実行される関連付け方法であって、
所定の帳票における項目値欄と関連付けられた項目名欄に対応付けられた項目名のセットを登録する登録工程と、
前記登録工程によって登録された項目名のセットに基づいて、処理対象の帳票に含まれる項目名欄と項目値欄との関連付けを特定する求解工程と
を含み、
前記処理対象の帳票中の項目名欄と項目値欄とが判別できる場合に、項目名欄と項目値欄が関連付けられるのは、欄の相対的な配置関係の観点から関連付けが許容される場合に限られるという制約条件と、各項目値欄は、少なくとも1個以上の項目名欄と関連付くという制約条件と、文字列が同じ項目名欄が複数ある場合、その中で同じ項目値欄と関連付くのは最大1個という制約条件と、項目値欄同士は、それぞれ関連付く項目名欄に記載されている項目名のセットが互いに異なるという制約条件とを付与する制約条件付与工程をさらに含み、
前記求解工程は、前記制約条件付与工程によって付与された制約条件を満たすように、処理対象の帳票に含まれる項目名欄と項目値欄との関連付けを特定することを特徴とする関連付け方法。 - 情報処理装置によって実行される関連付け方法であって、
所定の帳票における項目値欄と関連付けられた項目名欄に対応付けられた項目名のセットを登録する登録工程と、
前記登録工程によって登録された項目名のセットに基づいて、処理対象の帳票に含まれる項目名欄と項目値欄との関連付けを特定する求解工程と
を含み、
あらかじめ項目値欄と項目名欄の関連付けが特定されている帳票の様式情報を用いて別の帳票を処理する場合に、登録されている様式情報で保持されている項目名セットそれぞれについて、処理対象の帳票中の項目名欄セットを生成し、項目名欄と項目値欄が関連付けられるのは、欄の相対的な配置関係の観点から関連付けが許容される場合に限られるという制約条件と、各項目値欄は、最大1個の項目名欄セットと関連付くという制約条件と、各項目名欄セットは最大1個の項目値欄と関連付くという制約条件と、同じ項目名セットに対して生成される項目名欄セットのうち、項目値欄と関連付くのは最大1個という制約条件とを付与する制約条件付与工程をさらに含み、
前記求解工程は、前記制約条件付与工程によって付与された制約条件を満たすように、処理対象の帳票に含まれる項目値欄と項目名欄セットの関連付けと、項目名欄と項目値欄との関連付けを特定することを特徴とする関連付け方法。 - 所定の帳票における項目値欄と関連付けられた項目名欄に対応付けられた項目名のセットを登録する登録ステップと、
前記登録ステップによって登録された項目名のセットに基づいて、処理対象の帳票に含まれる項目名欄と項目値欄との関連付けを特定する求解ステップと
をコンピュータに実行させ、
前記処理対象の帳票中の項目名欄と項目値欄とが判別できる場合に、項目名欄と項目値欄が関連付けられるのは、欄の相対的な配置関係の観点から関連付けが許容される場合に限られるという制約条件と、各項目値欄は、少なくとも1個以上の項目名欄と関連付くという制約条件と、文字列が同じ項目名欄が複数ある場合、その中で同じ項目値欄と関連付くのは最大1個という制約条件と、項目値欄同士は、それぞれ関連付く項目名欄に記載されている項目名のセットが互いに異なるという制約条件とを付与する制約条件付与ステップをさらにコンピュータに実行させ、
前記求解ステップは、前記制約条件付与ステップによって付与された制約条件を満たすように、処理対象の帳票に含まれる項目名欄と項目値欄との関連付けを特定することを特徴とする関連付けプログラム。 - 所定の帳票における項目値欄と関連付けられた項目名欄に対応付けられた項目名のセットを登録する登録ステップと、
前記登録ステップによって登録された項目名のセットに基づいて、処理対象の帳票に含まれる項目名欄と項目値欄との関連付けを特定する求解ステップと
をコンピュータに実行させ、
あらかじめ項目値欄と項目名欄の関連付けが特定されている帳票の様式情報を用いて別の帳票を処理する場合に、登録されている様式情報で保持されている項目名セットそれぞれについて、処理対象の帳票中の項目名欄セットを生成し、項目名欄と項目値欄が関連付けられるのは、欄の相対的な配置関係の観点から関連付けが許容される場合に限られるという制約条件と、各項目値欄は、最大1個の項目名欄セットと関連付くという制約条件と、各項目名欄セットは最大1個の項目値欄と関連付くという制約条件と、同じ項目名セットに対して生成される項目名欄セットのうち、項目値欄と関連付くのは最大1個という制約条件とを付与する制約条件付与ステップをさらコンピュータに実行させ、
前記求解ステップは、前記制約条件付与ステップによって付与された制約条件を満たすように、処理対象の帳票に含まれる項目値欄と項目名欄セットの関連付けと、項目名欄と項目値欄との関連付けを特定することを特徴とする関連付けプログラム。
Priority Applications (5)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2019034980A JP7211157B2 (ja) | 2019-02-27 | 2019-02-27 | 情報処理装置、関連付け方法および関連付けプログラム |
EP20763375.1A EP3910546A4 (en) | 2019-02-27 | 2020-02-13 | INFORMATION PROCESSING DEVICE, RELATED METHOD AND RELATED PROGRAM |
PCT/JP2020/005631 WO2020175163A1 (ja) | 2019-02-27 | 2020-02-13 | 情報処理装置、関連付け方法および関連付けプログラム |
CN202080016620.8A CN113508393A (zh) | 2019-02-27 | 2020-02-13 | 信息处理装置、关联方法以及关联程序 |
US17/433,718 US20220165077A1 (en) | 2019-02-27 | 2020-02-13 | Information processing device, associating method, and associating program |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2019034980A JP7211157B2 (ja) | 2019-02-27 | 2019-02-27 | 情報処理装置、関連付け方法および関連付けプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2020140410A JP2020140410A (ja) | 2020-09-03 |
JP7211157B2 true JP7211157B2 (ja) | 2023-01-24 |
Family
ID=72239968
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2019034980A Active JP7211157B2 (ja) | 2019-02-27 | 2019-02-27 | 情報処理装置、関連付け方法および関連付けプログラム |
Country Status (5)
Country | Link |
---|---|
US (1) | US20220165077A1 (ja) |
EP (1) | EP3910546A4 (ja) |
JP (1) | JP7211157B2 (ja) |
CN (1) | CN113508393A (ja) |
WO (1) | WO2020175163A1 (ja) |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20170177557A1 (en) | 2015-12-21 | 2017-06-22 | Xerox Corporation | Relational database for assigning orphan fillable fields of electronic fillable forms with associated captions |
JP2018010489A (ja) | 2016-07-13 | 2018-01-18 | 日本電信電話株式会社 | 論理関係認識装置、論理関係認識方法および論理関係認識プログラム |
WO2019026147A1 (ja) | 2017-07-31 | 2019-02-07 | 株式会社Pfu | 情報処理装置、情報処理システム、制御方法及び制御プログラム |
Family Cites Families (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2003233516A (ja) * | 2002-02-08 | 2003-08-22 | Comax Inc | データベース、コンピュータ読取可能なプログラム、データベース管理システム、データベースの新規登録方法、データベースの検索方法、および、データベースの更新登録方法 |
JP3878518B2 (ja) * | 2002-07-08 | 2007-02-07 | 松下電器産業株式会社 | データ検索装置 |
JP4973063B2 (ja) * | 2006-08-14 | 2012-07-11 | 富士通株式会社 | 表データ処理方法及び装置 |
JP2008108114A (ja) * | 2006-10-26 | 2008-05-08 | Just Syst Corp | 文書処理装置および文書処理方法 |
CN101276412A (zh) * | 2007-03-30 | 2008-10-01 | 夏普株式会社 | 信息处理装置、信息处理系统和信息处理方法 |
JP5556524B2 (ja) * | 2010-09-13 | 2014-07-23 | 株式会社リコー | 帳票処理装置、帳票処理方法、帳票処理プログラム、及びそのプログラムを記録した記録媒体 |
JP2012194879A (ja) * | 2011-03-17 | 2012-10-11 | Pfu Ltd | 情報処理装置、情報処理方法及びプログラム |
JP6109688B2 (ja) * | 2013-09-06 | 2017-04-05 | 株式会社東芝 | 帳票読取装置およびプログラム |
CN111767953B (zh) * | 2020-06-30 | 2021-11-26 | 北京字节跳动网络技术有限公司 | 用于训练物品编码模型的方法和装置 |
-
2019
- 2019-02-27 JP JP2019034980A patent/JP7211157B2/ja active Active
-
2020
- 2020-02-13 WO PCT/JP2020/005631 patent/WO2020175163A1/ja unknown
- 2020-02-13 CN CN202080016620.8A patent/CN113508393A/zh not_active Withdrawn
- 2020-02-13 US US17/433,718 patent/US20220165077A1/en active Pending
- 2020-02-13 EP EP20763375.1A patent/EP3910546A4/en active Pending
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20170177557A1 (en) | 2015-12-21 | 2017-06-22 | Xerox Corporation | Relational database for assigning orphan fillable fields of electronic fillable forms with associated captions |
JP2018010489A (ja) | 2016-07-13 | 2018-01-18 | 日本電信電話株式会社 | 論理関係認識装置、論理関係認識方法および論理関係認識プログラム |
WO2019026147A1 (ja) | 2017-07-31 | 2019-02-07 | 株式会社Pfu | 情報処理装置、情報処理システム、制御方法及び制御プログラム |
Also Published As
Publication number | Publication date |
---|---|
EP3910546A1 (en) | 2021-11-17 |
US20220165077A1 (en) | 2022-05-26 |
JP2020140410A (ja) | 2020-09-03 |
WO2020175163A1 (ja) | 2020-09-03 |
CN113508393A (zh) | 2021-10-15 |
EP3910546A4 (en) | 2022-10-05 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US10191889B2 (en) | Systems, apparatuses and methods for generating a user interface by performing computer vision and optical character recognition on a graphical representation | |
US8719738B2 (en) | High performance design rule checking technique | |
US8407805B2 (en) | Method and system for classifying and redacting segments of electronic documents | |
US8693790B2 (en) | Form template definition method and form template definition apparatus | |
US8503781B2 (en) | Finding text regions from coloured image independent of colours | |
US8448097B2 (en) | High performance DRC checking algorithm for derived layer based rules | |
US20180232573A1 (en) | Information processing apparatus, control method, and storage medium | |
KR102356909B1 (ko) | 인공지능 학습용 데이터의 객체를 지정하고 속성을 설정하는 어노테이션 방법 및 이를 실행하기 위하여 기록매체에 기록된 컴퓨터 프로그램 | |
JP2019204399A (ja) | 情報処理装置及びプログラム | |
CN115240213A (zh) | 表格图像识别方法、装置、电子设备及存储介质 | |
US20220101643A1 (en) | Information processing device, discerning method, and discerning program | |
JP2009217562A (ja) | 関連文書提示システム及びプログラム | |
KR102310595B1 (ko) | 제안된 정보를 이용하여 객체 속성을 설정할 수 있는 어노테이션 방법 및 이를 실행하기 위하여 기록매체에 기록된 컴퓨터 프로그램 | |
JP7211157B2 (ja) | 情報処理装置、関連付け方法および関連付けプログラム | |
CN112487437A (zh) | 一种基于用户界面特征的安卓仿冒应用检测方法及装置 | |
JP4967045B2 (ja) | 背景判別装置、方法及びプログラム | |
CN113449732A (zh) | 信息处理装置、图像读取装置、记录介质、信息处理方法 | |
CN110990834A (zh) | 一种android恶意软件的静态检测方法、系统及介质 | |
US9437020B2 (en) | System and method to check the correct rendering of a font | |
KR102439429B1 (ko) | 객체 추출이 용이한 어노테이션 방법 및 이를 실행하기 위하여 기록매체에 기록된 컴퓨터 프로그램 | |
KR102433002B1 (ko) | 다중 바인딩 박스 선택을 통한 어노테이션 방법 및 이를 실행하기 위하여 기록매체에 기록된 컴퓨터 프로그램 | |
CN109598683A (zh) | 影像截取方法、装置及计算机可读存储介质 | |
KR102583247B1 (ko) | Bom 리스트 생성 시스템, 방법 및 컴퓨터 프로그램 | |
JP2018055256A (ja) | 情報処理装置、情報処理方法及びプログラム | |
JP2007048061A (ja) | 文字処理装置、文字処理方法及び記録媒体 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20210517 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20220726 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20220926 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20221213 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20221226 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 7211157 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |