JP2022003579A - 帳票入力フォーム生成装置、帳票入力フォーム生成方法及びプログラム - Google Patents
帳票入力フォーム生成装置、帳票入力フォーム生成方法及びプログラム Download PDFInfo
- Publication number
- JP2022003579A JP2022003579A JP2021164966A JP2021164966A JP2022003579A JP 2022003579 A JP2022003579 A JP 2022003579A JP 2021164966 A JP2021164966 A JP 2021164966A JP 2021164966 A JP2021164966 A JP 2021164966A JP 2022003579 A JP2022003579 A JP 2022003579A
- Authority
- JP
- Japan
- Prior art keywords
- input
- item
- unit
- area
- field
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims description 76
- 238000000605 extraction Methods 0.000 claims abstract description 32
- 238000011156 evaluation Methods 0.000 claims description 40
- 239000000284 extract Substances 0.000 claims description 7
- 238000004891 communication Methods 0.000 description 30
- 238000012545 processing Methods 0.000 description 18
- 238000012790 confirmation Methods 0.000 description 11
- 230000006870 function Effects 0.000 description 8
- 238000010586 diagram Methods 0.000 description 7
- 238000009966 trimming Methods 0.000 description 3
- 230000001186 cumulative effect Effects 0.000 description 2
- 238000012015 optical character recognition Methods 0.000 description 2
- 230000001174 ascending effect Effects 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 239000000470 constituent Substances 0.000 description 1
- 238000012217 deletion Methods 0.000 description 1
- 230000037430 deletion Effects 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 230000004044 response Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/10—Office automation; Time management
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/10—Image acquisition
Landscapes
- Engineering & Computer Science (AREA)
- Business, Economics & Management (AREA)
- General Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Human Resources & Organizations (AREA)
- Strategic Management (AREA)
- Marketing (AREA)
- Tourism & Hospitality (AREA)
- Economics (AREA)
- Entrepreneurship & Innovation (AREA)
- General Business, Economics & Management (AREA)
- Multimedia (AREA)
- Primary Health Care (AREA)
- General Health & Medical Sciences (AREA)
- Data Mining & Analysis (AREA)
- Health & Medical Sciences (AREA)
- Operations Research (AREA)
- Quality & Reliability (AREA)
- Character Input (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
- Character Discrimination (AREA)
Abstract
Description
こうすることで、帳票の複数の項目欄間の階層関係を特定することができる。これにより、入力フォームにおいて帳票の項目欄間の関係を正しく反映できる。
こうすることで、帳票の複数の項目欄間の階層関係を特定することができる。これにより、入力フォームにおいて帳票の項目欄間の関係を正しく反映できる。
こうすることで、帳票の項目欄と穴埋め入力欄間の階層関係を特定することができる。これにより、入力フォームにおいて帳票の項目欄と穴埋め入力欄との関係を正しく反映できる。
こうすることで、帳票の項目欄と入力欄の対応関係を特定することができる。これにより、入力フォームにおいて帳票の項目欄と入力欄の関係を正しく反映できる。
こうすることで、帳票に含まれる項目のうちから選択した項目についての入力フォームを生成できる。これにより、例えば帳票に含まれる項目のうち重要な項目を抜き出した入力フォームの生成が可能となる。
こうすることで、帳票から抜き出した項目を重要な順に並べた入力フォームを生成できる。
こうすることで、ユーザが帳票のスキャン画像から生成した入力フォームの内容を確認できる。
こうすることで、入力フォームをユーザの選択に応じて更新することができる。これにより、入力フォームをユーザの所期の内容に編集することができる。すなわち、本構成に係る帳票入力フォーム生成装置によれば、ユーザが一から入力フォームを生成する場合に比べて、入力フォームの生成に要する労力を低減できる。
こうすることで、矩形領域を項目欄に分類する精度を向上できる。
こうすることで、矩形領域を穴埋め入力欄に分類する精度を向上できる。
こうすることで、矩形領域を穴埋め入力欄に分類する精度を向上できる。
なお、以下に説明する実施形態は、本発明の理解を容易にするための一例に過ぎず、本発明を限定するものではない。すなわち、以下に説明するシステムの構成、データ、処理等については、本発明の趣旨を逸脱することなく、変更、改良され得るとともに、本発明にはその等価物が含まれる。
図1には、帳票入力フォーム生成システム1のシステム構成を示した。図1に示されるように、帳票入力フォーム生成システム1は、帳票入力フォーム生成装置10及びクライアント装置20を備える。帳票入力フォーム生成装置10とクライアント装置20とは例えばインターネット等のネットワークNを介して相互に通信可能に接続される。
なお、本実施形態では、クライアント装置20が入力部24及び表示部25を備えることとして説明するが、入力部24及び表示部25はクライアント装置20の外部装置として設けられてもよい。
次に、図2乃至図7を参照しながら、帳票入力フォーム生成システム1において実行される処理の概要について説明する。
例えば、帳票入力フォーム生成装置10は、矩形領域Rから文字列が認識されなかった場合にはその矩形領域Rを入力欄に分類する。
また例えば、帳票入力フォーム生成装置10は、矩形領域Rから文字列が認識された場合であって、空きスペース(文字列のない領域)又は空きスペースの占める割合が閾値以上であるときには以下の処理を実行する。すなわち、帳票入力フォーム生成装置10は、上記の矩形領域Rを穴埋め入力欄に分類し、それ以外の場合には上記の矩形領域Rを項目欄に分類する。
ここでクライアント装置20は、帳票入力フォーム生成装置10から受信した入力フォームをユーザに提示する入力フォーム提示画面W1を表示部25に表示させる。
そして、確定ボタンP2は、入力フォーム提示画面W1に表示される入力フォームの内容を確定するための操作部である。
なお、戻るボタンP3は、項目選択画面W2の前の画面に戻るための操作部である。
また、決定ボタンP4は、項目選択画面W2に入力された内容を項目の選択として決定するための操作部である。
なお、図6に示す例では、「その他」の項目が新たに選択されたこととする。
帳票入力フォーム生成装置10は、確定された入力フォームのデータを記憶部12又は、他のサーバに登録し、確定された入力フォームを利用可能な状態とする。
以下においては、以上説明した処理を実現するために帳票入力フォーム生成装置10に備えられる機能について説明する。
また、上記のプログラムは、コンピュータ読取り可能な情報記憶媒体に記憶されることとしてもよい。この場合、コンピュータとしての帳票入力フォーム生成装置10が上記の情報記憶媒体に記憶されたプログラムを読み込んで取得することとしてもよい。
また、上記のプログラムに基づいて、帳票入力フォーム生成装置10が実行する方法が、帳票入力フォーム生成方法となる。
以下、上記の各部の機能の詳細について説明する。
評価値記憶部100は、主に帳票入力フォーム生成装置10の記憶部12により実現される。
評価値記憶部100は、帳票名に関連付けて複数の項目ごとの評価値を記憶する。ここで、帳票名に関連付けられる項目は、予め登録された情報に加えて、帳票Sのスキャン画像の項目欄、穴埋め入力欄から認識された文字列に基づいて追加してもよい。この際、各項目の評価値は、同一の帳票名の帳票に関する項目の出現頻度(出現割合)、出現累積数等に基づいて設定することとしてよい。
なお、上記の帳票名とは、帳票の種類を識別する情報としてよく、必ずしも帳票に記載の名称と一致しなくともよい。
図9に示されるように、評価値記憶テーブルT1では、帳票名、項目を一意に識別する項目ID、項目の標準的名称である標準項目名、評価値が関連付けて記憶される。本実施形態では、評価値には、帳票名により識別される帳票における項目の優先順位を用いている。すなわち、評価値に格納される値が小さい程、優先順位が高いことを示している。
もちろん、評価値は優先順位に限られるものではなく、評価値に出現割合、出現累積数等を採用した場合には、評価値が大きい程、優先順位が高いことを示すこととなる。
辞書情報記憶部102は、主に帳票入力フォーム生成装置10の記憶部12により実現される。
辞書情報記憶部102は、帳票名により識別される帳票に含まれる複数の項目ごとに、標準表現と同義表現とを対応付けた辞書情報を記憶する。ここで、項目を標準表現で表記したものを標準項目名と称する。また、上記の同義表現とは、一の項目について標準表現と同じ意味を示す別の表現である。
辞書情報記憶部102に記憶される辞書情報は、予め登録された情報に加えて、帳票Sのスキャン画像の項目欄、穴埋め入力欄から認識された文字列に基づいて追加してもよい。
図10に示されるように、辞書情報記憶テーブルT2では、帳票名、項目を一意に識別する項目ID、項目の標準的名称である標準項目名、項目の同義表現が関連付けて記憶される。
取得部104は、主に帳票入力フォーム生成装置10の制御部11、記憶部12及び通信部13により実現される。なお、取得部104により実行される処理が取得工程である。
取得部104は、帳票Sをスキャンしたスキャン画像を取得する。例えば、取得部104は、クライアント装置20から送信された帳票Sのスキャン画像を、通信部13を介して受信して取得することとしてよい。
もちろん、取得部104による帳票Sのスキャン画像の取得方法はクライアント装置20からの取得に限られるものではない。例えば、帳票Sのスキャン画像が記憶媒体に記憶されている場合には、当該記憶媒体から取得してもよい。また例えば、帳票入力フォーム生成装置10がスキャナ30と接続されている場合には、スキャナ30がスキャンした帳票Sのスキャン画像を直接取得してもよい。
抽出部106は、主に帳票入力フォーム生成装置10の制御部11及び記憶部12により実現される。なお、抽出部106により実行される処理が抽出工程である。
抽出部106は、取得部104により取得した帳票Sのスキャン画像に含まれる罫線により囲まれた矩形領域を抽出する。例えば、抽出部106は、帳票Sのスキャン画像を二値化し、縦方向又は横方向に連結する黒画素の連結画素を罫線として検出する。そして、抽出部106は、スキャン画像の中から罫線により囲まれる矩形領域を抽出する。
ここで、矩形領域として抽出する領域のサイズに予め所定の範囲を設定し、所定の範囲外にある矩形領域については抽出しないようにしてもよい。
また、抽出部106は、上記抽出する矩形領域については、例えば左上の頂点の位置座標、横方向及び縦方向の長さ(画素数)により表される領域サイズの情報をそれぞれ矩形領域の情報として得ることとしてよい。
文字列認識部108は、主に帳票入力フォーム生成装置10の制御部11及び記憶部12により実現される。なお、文字列認識部108により実行される処理が文字列認識工程である。
文字列認識部108は、抽出部106により抽出した各々の矩形領域に含まれる文字列を認識する。例えば、文字列認識部108は、抽出部106により抽出した各々の矩形領域について、公知のOCR(光学文字認識)処理により、矩形領域内に含まれる文字列のコード(文字列データ)を取得することとしてよい。
ここで、文字列認識部108は、矩形領域内に含まれる文字の間にスペースがある場合には、当該スペースの情報も取得することとしてよい。
分類部110は、主に帳票入力フォーム生成装置10の制御部11及び記憶部12により実現される。なお、分類部110により実行される処理が分類工程である。
分類部110は、文字列認識部108による認識結果に基づいて、抽出部106により抽出された各々の矩形領域を、項目のみを含む項目欄、項目と入力領域の両方を含む穴埋め入力欄、入力領域のみを含む入力欄のいずれかに分類する。
図13に示されるように、矩形領域40Aには、文字41A、文字41B、文字41Cが含まれており、それぞれの文字を包含する領域を文字領域42A、文字領域42B、文字領域42Cとする。
そして、分類部110は、文字領域42A、文字領域42B、文字領域42Cから文字の基準サイズを決定する。例えば、文字の基準サイズは、矩形領域40Aに含まれる文字領域の平均値としてよい。
なお、図13に示す例では、文字が配置される領域の前後について、文字領域43Aと空白領域43Bを設定している。
なお、矩形領域において文字列の配列方向が上下方向である場合には、文字列が上下対称に配置されているか否かを判定することとする。
図14に示されるように、矩形領域40Bには、文字41D、文字41E、文字41Fが含まれており、それぞれの文字を包含する領域を文字領域42D、文字領域42E、文字領域42Fとする。
また、分類部110は、矩形領域40Bに対し、文字41D、文字41E、文字41Fのうち最後尾にある文字41Fよりも後方の空白領域である後方空白領域45Bを設定する。
なお、上記の第2判定基準は、文字の前後に入力領域が設けられるタイプの穴埋め入力欄を判定するものである。
そして、分類部110は、中間空白領域46が所定サイズよりも大きい場合であって、文字41D、文字41E、文字41Fを繋げた文字列が所定の辞書情報に存在しないものである場合に、矩形領域40Cを穴埋め入力欄に分類する。
なお、上記の所定サイズは、例えば、文字領域42D、文字領域42E、文字領域42Fから決定される文字の基準サイズ(例えば平均値)のN(Nは整数)倍としてよい。
また、上記の所定の辞書情報は、例えば、単語、連語、句等を集めた情報であって、辞書情報記憶部102に記憶されることとしてよい。
また、分類部110は、入力欄に分類されなかった矩形領域のうち、第2判定基準、又は第3判定基準により穴埋め入力欄に分類されなかった矩形領域を項目欄に分類することとしてもよい。
まず、分類部110は、矩形領域に対し、前後の空白を同じサイズだけトリミングする。例えば、図14の例であれば、前方空白領域45Aと後方空白領域45Bのうち小さい方のサイズの分だけ矩形領域40Bの前後の空白をトリミングする。ここでは、矩形領域40Bの前後から後方空白領域45Bのサイズをそれぞれトリミングする。
解析部112は、主に帳票入力フォーム生成装置10の制御部11及び記憶部12により実現される。なお、解析部112により実行される処理が解析工程である。
解析部112は、帳票Sについて解析された所定の方向に並ぶ矩形領域の各々の分類及び位置関係に基づいて、帳票Sにおける項目欄同士の階層関係、項目欄と穴埋め入力欄の階層関係、及び項目欄と入力欄との対応関係を解析する。なお、上記の所定方向とは、横方向/縦方向としてよく、本実施形態では、特に横方向の右向き(右方向と称する)を例として説明する。
例えば、解析部112は、帳票Sに含まれる第1の項目欄(任意の項目欄)に対して、所定の方向(例えば右方向)に第2の項目欄が隣接する場合に、第2の項目欄を第1の項目欄の下位に設定する。
具体的な例を挙げて説明すると、解析部112は、図3に示す帳票Sに関し、項目欄(2)の右方向に項目欄(3)が隣接しているため、項目欄(3)を項目欄(2)の下位に設定する。なお、この例では、項目欄(2)、項目欄(3)がそれぞれ第1の項目欄、第2の項目欄に相当する。
具体的な例を挙げて説明すると、解析部112は、図3に示す帳票Sに関し、項目欄(3)の右方向に穴埋め入力欄[7],[8]を挟んで、項目欄(5)が並んでいるため、項目欄(5)を項目欄(2)の下位に設定する。なお、この例では、項目欄(2)、項目欄(3)、項目欄(5)がそれぞれ第1の項目欄、第2の項目欄、第3の項目欄に相当する。
例えば、解析部112は、帳票Sに含まれる第1の項目欄(任意の項目欄)に対して、所定の方向(例えば右方向)に1以上の第1の穴埋め入力欄が隣接する場合に、当該1以上の第1の穴埋め入力欄を第1の項目欄の下位に設定する。
具体的な例を挙げて説明すると、解析部112は、図3に示す帳票Sに関し、項目欄(3)の右方向に穴埋め入力欄[7],[8]が隣接しているため、穴埋め入力欄[7],[8]を項目欄(3)の下位に設定する。なお、この例では、項目欄(3)が第1の項目欄、穴埋め入力欄[7],[8]が第1の穴埋め入力欄にそれぞれ相当する。
解析部112は、帳票Sに含まれる第1の項目欄(任意の項目欄)に対して、1以上の入力欄が連続して隣接する場合に、当該1以上の入力欄を第1の項目欄に対応付ける。
具体的な例を挙げて説明すると、解析部112は、図3に示す帳票Sに関し、項目欄(16)の右方向に入力欄<17>が隣接しているため、入力欄<17>を項目欄(16)に対応付ける。なお、この例では、項目欄(16)が第1の項目欄に、入力欄<17>が第1の入力欄にそれぞれ相当する。また、帳票のツリー構造における項目欄と入力欄の対応関係は、項目欄の下位に入力欄を設定することにより表すこととしてよい。
特定部114は、主に帳票入力フォーム生成装置10の制御部11及び記憶部12により実現される。
特定部114は、取得部104により取得した帳票Sのスキャン画像に示される帳票名を特定する。
例えば、特定部114は、帳票Sのスキャン画像において所定の領域の文字認識結果に基づいて帳票名を特定してもよいし、スキャン画像から認識された最大の文字サイズの文字列に基づいて帳票名を特定してもよい。また、特定部114は、取得部104により帳票Sのスキャン画像とともに帳票名をクライアント装置20から取得することで、帳票名を特定してもよい。
項目選択部116は、主に帳票入力フォーム生成装置10の制御部11及び記憶部12により実現される。
項目選択部116は、帳票Sに含まれる各項目について、特定部114により特定した帳票名に関連付けて評価値記憶部100に記憶される評価値に基づいて、各項目の中から少なくとも1つの項目を選択する。
生成部118は、主に帳票入力フォーム生成装置10の制御部11及び記憶部12により実現される。なお、生成部118により実行される処理が生成工程である。
生成部118は、解析部112による解析結果に基づいて、帳票Sに含まれる少なくとも1つの項目に関する入力フォームを生成する。
例えば、生成部118は、項目選択部116により選択された項目についての入力フォームを生成することとしてよい。
このとき、生成部118は、項目選択部116により選択された項目が、評価値の高い順に並べるように入力フォームを生成してもよい。
また、生成部118は、抽出部106により抽出された矩形領域から認識された文字列が項目の同義表現である場合に、当該文字列を対応する標準表現に変換するようにしてもよい。
次に、生成部118は、項目選択部116により選択された項目について優先順位が高い順(ここでは優先順位の番号が若い順)に、項目の配置位置を決定する。
そして、生成部118は、項目の入力形式を、解析部112による解析結果に基づいて決定する。
例えば、項目が項目欄から認識されたものであり、且つ対応する入力欄がある場合には、自由入力形式とする。一方で、項目が穴埋め入力欄から認識されたものである場合には、穴埋め入力欄について認識された穴埋め入力形式とする。
なお、生成部118は、入力フォームを、HTML形式により記述することとしてよい。これにより、生成された入力フォームは、ウェブブラウザにより表示、且つ入力可能となる。
提示部120は、主に帳票入力フォーム生成装置10の制御部11、記憶部12及び通信部13により実現される。
提示部120は、生成部118により生成された入力フォームをユーザに提示する。
例えば、提示部120は、生成部118により生成された入力フォームを含む画面(例えば図5に示す入力フォーム提示画面W1)のデータを、クライアント装置20に送信することとしてよい。
そして、クライアント装置20は、帳票入力フォーム生成装置10から受信した上記の画面のデータに基づいて、入力フォームを表示部25に表示させることとする。これにより、提示部120は、生成部118により生成された入力フォームをユーザに提示する。
選択受付部122は、主に帳票入力フォーム生成装置10の制御部11、記憶部12及び通信部13により実現される。
選択受付部122は、提示部120により提示した入力フォームに対し追加/削除する項目の選択をクライアント装置20(ユーザ)から受け付ける。
例えば、選択受付部122は、入力フォームに対する追加/削除の項目の選択要求を、通信部13を介して受信すると、項目の選択画面(例えば図6に示す項目選択画面W2)の表示データをクライアント装置20に送信する。
ここで、項目の選択画面には、帳票Sに含まれる項目以外にも、帳票名に関連付けて記憶される項目(例えば帳票Sに含まれない項目)を含めてもよい。
そして、選択受付部122は、例えば項目選択画面W2を介して選択された項目の選択結果を、クライアント装置20から受信する。
更新部124は、主に帳票入力フォーム生成装置10の制御部11及び記憶部12により実現される。
更新部124は、選択受付部122により受け付けた項目に基づいて入力フォームを更新する。
具体的には、更新部124は、選択受付部122により受け付けた項目を含む入力フォームを、生成部118により再度生成させる。そして、更新部124は、更新後の入力フォームを提示部120により再度提示させる。ここで、例えば、図7に示す入力フォーム提示画面W3が、更新後の入力フォームを再度提示する画面に相当する。
次に、図11及び図12を参照しながら、帳票入力フォーム生成システム1において実行される処理の流れについて具体的に説明する。
ここで、図11は、帳票入力フォーム生成システム1における処理の全体的な流れを示すシーケンス図である。図12は、帳票入力フォーム生成装置10において実行される入力フォームを生成する処理のフロー図である。
例えば、帳票入力フォーム生成装置10の制御部11は、帳票Sのスキャン画像とともに、帳票Sの帳票名を取得している場合には、当該取得した帳票名を帳票Sの帳票名とする。
また例えば、帳票入力フォーム生成装置10の制御部11は、帳票Sのスキャン画像とともに、帳票Sの帳票名を取得していない場合には、帳票Sのスキャン画像からの所定領域の文字認識結果に基づいて、帳票Sの帳票名を特定する。
そして、帳票入力フォーム生成装置10の制御部11は、矩形領域において、文字列の前方側の空白領域である前方空白領域、文字列の後方側の空白領域である後方空白領域、及び文字列を構成する文字の間の空白領域である中間空白領域を特定する(S53)。
一方で、帳票入力フォーム生成装置10の制御部11は、矩形領域における文字の配置が線対称でない場合には(S54:No)、S56に進む。
一方で、S58において、中間空白領域のサイズが閾値(A)以上である場合であって(S58:Yes)、矩形領域から検出された文字列(中間空白領域で区切らずに連結した文字)が辞書にある場合には(S59:Yes)、制御部11は、矩形領域を項目欄に分類する(S60)。
また、S58において、中間空白領域のサイズが閾値(A)未満である場合には(S58:No)、制御部11は、矩形領域を項目欄に分類する(S60)。
なお、図16に示すフローにおいて、S54で矩形領域における文字の配置が線対称でない場合には(S54:No)、S56〜S59の処理は省略し、矩形領域を穴埋め入力欄に分類するようにしてもよい。
次に、帳票入力フォーム生成装置10の制御部11は、各々の矩形領域の分類と、矩形領域の横方向(又は/及び縦方向)の位置関係に基づいて、帳票構造を解析する(S6)。なお、S6の処理は、帳票入力フォーム生成装置10の解析部112により実行される処理である。
そして、クライアント装置20の制御部21は、受信した入力フォームのデータに基づいて入力フォームを表示部25に表示させる(S204)。例えば、入力フォーム提示画面W1が、S204で表示部25に表示される画面の一例に相当する。
なお、項目選択画面には、帳票Sに含まれる項目に限らず、帳票Sの帳票名に関連付けて記憶される任意の項目を含めることとしてもよい。
以上が帳票入力フォーム生成システム1において実行される処理の一例である。
本発明は上記の実施形態に限定されるものではない。例えば、帳票入力フォーム生成装置10は、登録後の入力フォームをクライアント装置20からの要求に応じて所定の出力形式に変換してクライアント装置20に提供してもよい。
10 帳票入力フォーム生成装置
11 制御部
12 記憶部
13 通信部
20 クライアント装置
21 制御部
22 記憶部
23 通信部
24 入力部
25 表示部
26 入出力部
30 スキャナ
40A 矩形領域
40B 矩形領域
40C 矩形領域
41A 文字
41B 文字
41C 文字
41D 文字
41E 文字
41F 文字
41G 文字
41H 文字
41I 文字
42A 文字領域
42B 文字領域
42C 文字領域
42D 文字領域
42E 文字領域
42F 文字領域
42G 文字領域
42H 文字領域
42I 文字領域
43A 文字領域
43B 空白領域
44 中心線
45A 前方空白領域
45B 後方空白領域
45C 差分領域
46 中間空白領域
100 評価値記憶部
102 辞書情報記憶部
104 取得部
106 抽出部
108 文字列認識部
110 分類部
112 解析部
114 特定部
116 項目選択部
118 生成部
120 提示部
122 選択受付部
124 更新部
N ネットワーク
S 帳票
L 罫線
R 矩形領域
T1 評価値記憶テーブル
T2 辞書情報記憶テーブル
W1 入力フォーム提示画面
W3 入力フォーム提示画面
A1 表示領域
A2 表示領域
A3 表示領域
A4 表示領域
A5 表示領域
A6 表示領域
A7 表示領域
P1 項目選択ボタン
P2 確定ボタン
W2 項目選択画面
CB チェックボックス
P3 戻るボタン
P4 決定ボタン
こうすることで、帳票に含まれる項目のうちから選択した項目についての入力フォームを生成できる。これにより、例えば帳票に含まれる項目のうち重要な項目を抜き出した入力フォームの生成が可能となる。
こうすることで、帳票から抜き出した項目を重要な順に並べた入力フォームを生成できる。
こうすることで、ユーザが帳票のスキャン画像から生成した入力フォームの内容を確認できる。
こうすることで、入力フォームをユーザの選択に応じて更新することができる。これにより、入力フォームをユーザの所期の内容に編集することができる。すなわち、本構成に係る帳票入力フォーム生成装置によれば、ユーザが一から入力フォームを生成する場合に比べて、入力フォームの生成に要する労力を低減できる。
こうすることで、矩形領域を項目欄に分類する精度を向上できる。
こうすることで、矩形領域を穴埋め入力欄に分類する精度を向上できる。
こうすることで、矩形領域を穴埋め入力欄に分類する精度を向上できる。
Claims (14)
- 帳票をスキャンしたスキャン画像を取得する取得部と、
前記スキャン画像に含まれる罫線により囲まれた矩形領域を抽出する抽出部と、
前記矩形領域に含まれる文字列を認識する文字列認識部と、
前記文字列認識部による認識結果に基づいて、前記抽出部により抽出された各々の前記矩形領域を、項目のみを含む項目欄、項目と入力領域の両方を含む穴埋め入力欄、入力領域のみを含む入力欄のいずれかに分類する分類部と、
所定の方向に並ぶ前記矩形領域の各々の分類及び位置関係に基づいて、前記項目欄同士の階層関係、前記項目欄と前記穴埋め入力欄の階層関係、及び前記項目欄と前記入力欄との対応関係を解析する解析部と、
前記解析部による解析結果に基づいて、前記帳票に含まれる少なくとも1つの項目に関する入力フォームを生成する生成部と、
を備えることを特徴とする帳票入力フォーム生成装置。 - 前記解析部は、第1の前記項目欄に対して、前記所定の方向に第2の前記項目欄が隣接する場合に、前記第2の前記項目欄を前記第1の前記項目欄の下位に設定することを特徴とする請求項1に記載の帳票入力フォーム生成装置。
- 前記解析部は、前記第2の前記項目欄に対して、前記所定の方向に1以上の前記矩形領域を挟んで第3の前記項目欄が並ぶ場合に、前記第3の前記項目欄を前記第1の前記項目欄の下位に設定することを特徴とする請求項2に記載の帳票入力フォーム生成装置。
- 前記解析部は、前記第1の前記項目欄に対して、前記所定の方向に1以上の第1の前記穴埋め入力欄が隣接する場合に、当該1以上の前記第1の前記穴埋め入力欄を前記第1の前記項目欄の下位に設定することを特徴とする請求項2又は3に記載の帳票入力フォーム生成装置。
- 前記解析部は、前記第1の前記項目欄に対して、1以上の前記入力欄が連続して隣接する場合に、当該1以上の前記入力欄を前記第1の前記項目欄に対応付けることを特徴とする請求項2乃至4のいずれかに記載の帳票入力フォーム生成装置。
- 帳票名に関連付けて複数の項目ごとの評価値を記憶する評価値記憶部と、
前記スキャン画像に示される帳票名を特定する特定部と、
前記帳票に含まれる各項目について、前記特定部により特定した帳票名に関連付けて前記評価値記憶部に記憶される評価値に基づいて、前記各項目の中から少なくとも1つの項目を選択する項目選択部と、
前記生成部は、前記項目選択部により選択された項目についての入力フォームを生成することを特徴とする請求項1乃至5のいずれかに記載の帳票入力フォーム生成装置。 - 前記入力フォームでは、前記項目選択部により選択された項目が、評価値の高い順に並べられることを特徴とする請求項6に記載の帳票入力フォーム生成装置。
- 前記生成部により生成された前記入力フォームをユーザに提示する提示部を更に備えることを特徴とする請求項1乃至7のいずれかに記載の帳票入力フォーム生成装置。
- 前記提示した前記入力フォームに対し追加/削除する項目の選択を受け付ける選択受付部と、
前記選択受付部により受け付けた項目に基づいて前記提示した前記入力フォームを更新する更新部と、を更に備えることを特徴とする請求項8に記載の帳票入力フォーム生成装置。 - 前記分類部は、前記矩形領域から認識された前記文字列の配置が、前記矩形領域において線対称である場合に、前記矩形領域を前記項目欄と分類する
ことを特徴とする請求項1乃至9のいずれかに記載の帳票入力フォーム生成装置。 - 前記分類部は、前記矩形領域から認識された前記文字列の前方の空白である前方空白領域と、前記文字列の後方の空白である後方空白領域の大きさの差分が、所定のサイズ以上である場合に、前記矩形領域を前記穴埋め入力欄と分類する
ことを特徴とする請求項1乃至10のいずれかに記載の帳票入力フォーム生成装置。 - 前記分類部は、前記矩形領域から認識された前記文字列の中に所定のサイズ以上の空白が存在し、且つ、前記文字列が所定の辞書情報に含まれない場合に、前記矩形領域を前記穴埋め入力欄と分類する
ことを特徴とする請求項1乃至11のいずれかに記載の帳票入力フォーム生成装置。 - 帳票入力フォーム生成装置が、
帳票をスキャンしたスキャン画像を取得する取得工程と、
前記スキャン画像に含まれる罫線により囲まれた矩形領域を抽出する抽出工程と、
前記矩形領域に含まれる文字列を認識する文字列認識工程と、
前記文字列認識工程による認識結果に基づいて、前記抽出工程により抽出されたそれぞれの前記矩形領域を、項目のみを含む項目欄、項目と入力領域の両方を含む穴埋め入力欄、入力領域のみを含む入力欄のいずれかに分類する分類工程と、
所定の方向に並ぶ前記矩形領域の各々の分類と位置関係に基づいて、前記項目欄同士の階層関係、前記項目欄と前記穴埋め入力欄の階層関係、及び前記項目欄と前記入力欄との対応関係を解析する解析工程と、
前記解析工程による解析結果に基づいて、前記帳票に含まれる少なくとも1つの項目に関する入力フォームを生成する生成工程と、
を実行することを特徴とする帳票入力フォーム生成方法。 - 帳票をスキャンしたスキャン画像を取得する取得工程と、
前記スキャン画像に含まれる罫線により囲まれた矩形領域を抽出する抽出工程と、
前記矩形領域に含まれる文字列を認識する文字列認識工程と、
前記文字列認識工程による認識結果に基づいて、前記抽出工程により抽出されたそれぞれの前記矩形領域を、項目のみを含む項目欄、項目と入力領域の両方を含む穴埋め入力欄、入力領域のみを含む入力欄のいずれかに分類する分類工程と、
所定の方向に並ぶ前記矩形領域の各々の分類と位置関係に基づいて、前記項目欄同士の階層関係、前記項目欄と前記穴埋め入力欄の階層関係、及び前記項目欄と前記入力欄との対応関係を解析する解析工程と、
前記解析工程による解析結果に基づいて、前記帳票に含まれる少なくとも1つの項目に関する入力フォームを生成する生成工程と、
をコンピュータに実行させるためのプログラム。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2016143615 | 2016-07-21 | ||
JP2016143615 | 2016-07-21 | ||
JP2021093112A JP6961280B2 (ja) | 2016-07-21 | 2021-06-02 | 帳票入力フォーム生成装置、帳票入力フォーム生成方法及びプログラム |
Related Parent Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2021093112A Division JP6961280B2 (ja) | 2016-07-21 | 2021-06-02 | 帳票入力フォーム生成装置、帳票入力フォーム生成方法及びプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2022003579A true JP2022003579A (ja) | 2022-01-11 |
JP7072304B2 JP7072304B2 (ja) | 2022-05-20 |
Family
ID=60992597
Family Applications (3)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2018528849A Active JP6896292B2 (ja) | 2016-07-21 | 2017-07-20 | 帳票入力フォーム生成装置、帳票入力フォーム生成方法及びプログラム |
JP2021093112A Active JP6961280B2 (ja) | 2016-07-21 | 2021-06-02 | 帳票入力フォーム生成装置、帳票入力フォーム生成方法及びプログラム |
JP2021164966A Active JP7072304B2 (ja) | 2016-07-21 | 2021-10-06 | 帳票入力フォーム生成装置、帳票入力フォーム生成方法及びプログラム |
Family Applications Before (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2018528849A Active JP6896292B2 (ja) | 2016-07-21 | 2017-07-20 | 帳票入力フォーム生成装置、帳票入力フォーム生成方法及びプログラム |
JP2021093112A Active JP6961280B2 (ja) | 2016-07-21 | 2021-06-02 | 帳票入力フォーム生成装置、帳票入力フォーム生成方法及びプログラム |
Country Status (2)
Country | Link |
---|---|
JP (3) | JP6896292B2 (ja) |
WO (1) | WO2018016552A1 (ja) |
Families Citing this family (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP7041963B2 (ja) * | 2018-06-22 | 2022-03-25 | 株式会社ミラボ | 標準項目名設定装置、標準項目名設定方法及び標準項目名設定プログラム |
WO2019245016A1 (ja) * | 2018-06-22 | 2019-12-26 | 株式会社ミラボ | 標準項目名設定装置、標準項目名設定方法及び標準項目名設定プログラム |
JP6565106B1 (ja) * | 2018-07-10 | 2019-08-28 | 株式会社ミトリ | ワークフローシステム及びそのプログラム |
JP6849121B2 (ja) * | 2019-03-15 | 2021-03-24 | 株式会社リコー | コンテンツ解析エンジンによるCloud EMR通信のためのアプローチ |
JP6964891B2 (ja) * | 2019-05-08 | 2021-11-10 | 株式会社ミラボ | 窓口業務管理装置、窓口業務管理方法及び窓口業務管理プログラム |
JP7358838B2 (ja) | 2019-08-21 | 2023-10-11 | 富士フイルムビジネスイノベーション株式会社 | 情報処理装置、及び情報処理プログラム |
JP7365835B2 (ja) * | 2019-09-30 | 2023-10-20 | Toppanエッジ株式会社 | 構造認識システム、構造認識装置、構造認識方法、及びプログラム |
KR102575085B1 (ko) * | 2021-11-19 | 2023-09-06 | 조남제 | 문서 분석 시스템 |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH1011531A (ja) * | 1996-06-21 | 1998-01-16 | Mitsubishi Electric Corp | 帳票読取装置 |
JPH1063744A (ja) * | 1996-07-18 | 1998-03-06 | Internatl Business Mach Corp <Ibm> | 文書のレイアウト解析方法及びシステム |
JP2000339406A (ja) * | 1999-05-28 | 2000-12-08 | Fujitsu Ltd | 帳票認識方法 |
JP2002007953A (ja) * | 2000-06-22 | 2002-01-11 | Hitachi Ltd | 電子帳票処理装置 |
JP2003187177A (ja) * | 2001-12-21 | 2003-07-04 | Oki Electric Ind Co Ltd | 帳票入力装置及び帳票入力方法 |
JP2008083988A (ja) * | 2006-09-27 | 2008-04-10 | Casio Comput Co Ltd | 入力フォーム作成装置及びプログラム |
JP2016115088A (ja) * | 2014-12-12 | 2016-06-23 | 株式会社エヌ・ティ・ティ・データ | 帳票定義装置、帳票定義方法、及び帳票定義プログラム |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2012190434A (ja) * | 2011-02-24 | 2012-10-04 | Ricoh Co Ltd | 帳票定義装置、帳票定義方法、プログラム及び記録媒体 |
-
2017
- 2017-07-20 WO PCT/JP2017/026182 patent/WO2018016552A1/ja active Application Filing
- 2017-07-20 JP JP2018528849A patent/JP6896292B2/ja active Active
-
2021
- 2021-06-02 JP JP2021093112A patent/JP6961280B2/ja active Active
- 2021-10-06 JP JP2021164966A patent/JP7072304B2/ja active Active
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH1011531A (ja) * | 1996-06-21 | 1998-01-16 | Mitsubishi Electric Corp | 帳票読取装置 |
JPH1063744A (ja) * | 1996-07-18 | 1998-03-06 | Internatl Business Mach Corp <Ibm> | 文書のレイアウト解析方法及びシステム |
JP2000339406A (ja) * | 1999-05-28 | 2000-12-08 | Fujitsu Ltd | 帳票認識方法 |
JP2002007953A (ja) * | 2000-06-22 | 2002-01-11 | Hitachi Ltd | 電子帳票処理装置 |
JP2003187177A (ja) * | 2001-12-21 | 2003-07-04 | Oki Electric Ind Co Ltd | 帳票入力装置及び帳票入力方法 |
JP2008083988A (ja) * | 2006-09-27 | 2008-04-10 | Casio Comput Co Ltd | 入力フォーム作成装置及びプログラム |
JP2016115088A (ja) * | 2014-12-12 | 2016-06-23 | 株式会社エヌ・ティ・ティ・データ | 帳票定義装置、帳票定義方法、及び帳票定義プログラム |
Non-Patent Citations (1)
Title |
---|
駱 琴: "帳票文書の構造認識のための書式構造知識の自動獲得", 電子情報通信学会論文誌, vol. 第J76-D-II巻 第3号, JPN6017030983, 25 March 1993 (1993-03-25), JP, pages 534 - 546, ISSN: 0004690516 * |
Also Published As
Publication number | Publication date |
---|---|
JP2021152924A (ja) | 2021-09-30 |
JP6961280B2 (ja) | 2021-11-05 |
JPWO2018016552A1 (ja) | 2019-05-16 |
JP7072304B2 (ja) | 2022-05-20 |
JP6896292B2 (ja) | 2021-06-30 |
WO2018016552A1 (ja) | 2018-01-25 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP7072304B2 (ja) | 帳票入力フォーム生成装置、帳票入力フォーム生成方法及びプログラム | |
JP5402099B2 (ja) | 情報処理システム、情報処理装置、情報処理方法およびプログラム | |
US20190220508A1 (en) | Interactively predicting fields in a form | |
US7844896B2 (en) | Layout-rule generation system, layout system, layout-rule generation program, layout program, storage medium, method of generating layout rule, and method of layout | |
US8965125B2 (en) | Image processing device, method and storage medium for storing and displaying an electronic document | |
EP0539106B1 (en) | Electronic information delivery system | |
KR101357260B1 (ko) | 증강 현실 사용자 인터페이스 제공 장치 및 방법 | |
JP4271878B2 (ja) | 映像中の文字検索方法及び装置並びに文字検索処理プログラム | |
US20160344860A1 (en) | Document and image processing | |
JP5743443B2 (ja) | 画像処理装置、画像処理方法、コンピュータプログラム | |
EP0843277A2 (en) | Page analysis system | |
CN101820489A (zh) | 图像处理设备及图像处理方法 | |
KR102211516B1 (ko) | 가상 셀을 이용한 ocr 기반 문서 분석 시스템 및 방법 | |
EA000271B1 (ru) | Способ и устройство для обработки таблицы | |
CN106373447A (zh) | 一种智能阅卷系统及方法 | |
CN109447019B (zh) | 基于图像识别与数据库存储的纸质扫描文档电子化方法 | |
JP2021043650A (ja) | 画像処理装置、画像処理システム、画像処理方法、及びプログラム | |
US20130215476A1 (en) | Image processing apparatus and recording medium | |
KR102328034B1 (ko) | 표가 삽입된 이미지로부터 지식 데이터베이스의 구축이 가능한 데이터베이스 구축 장치 및 그 동작 방법 | |
JP6785181B2 (ja) | 物体認識装置、物体認識システム、及び物体認識方法 | |
CN111860450A (zh) | 票证识别装置以及票证信息管理系统 | |
CN111241955B (zh) | 一种票据信息提取方法及系统 | |
JP4952079B2 (ja) | 画像処理装置、方法及びプログラム | |
CN110390323B (zh) | 信息处理装置以及计算机可读介质 | |
JP2001034763A (ja) | 文書画像処理装置、その文書タイトル抽出方法及び文書タグ情報付与方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20211105 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20211105 |
|
A871 | Explanation of circumstances concerning accelerated examination |
Free format text: JAPANESE INTERMEDIATE CODE: A871 Effective date: 20211108 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20220125 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20220208 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20220412 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20220427 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 7072304 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |