JP7178445B2 - 情報処理装置、情報処理方法、及びプログラム - Google Patents
情報処理装置、情報処理方法、及びプログラム Download PDFInfo
- Publication number
- JP7178445B2 JP7178445B2 JP2021067196A JP2021067196A JP7178445B2 JP 7178445 B2 JP7178445 B2 JP 7178445B2 JP 2021067196 A JP2021067196 A JP 2021067196A JP 2021067196 A JP2021067196 A JP 2021067196A JP 7178445 B2 JP7178445 B2 JP 7178445B2
- Authority
- JP
- Japan
- Prior art keywords
- character string
- cell
- image
- node
- cells
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Description
帳票を表す画像のデータを用いて、前記帳票に存在する、1つ以上の文字が連なって意味を表している文字列が存在する可能性があるセルを認識し、認識した前記セルの前記画像における位置を特定することで、当該セルを抽出するセル抽出手段と、
前記セル抽出手段により抽出された1以上の前記セル及び位置に基づいて、前記画像においてグループを構成する1以上の前記セルを特定し、特定した前記1以上のセルが存在する範囲をテーブルとして抽出するテーブル抽出手段と、
前記帳票に存在する、前記文字列が存在する文字列領域を認識し、認識した前記文字列領域の前記画像における位置を特定することで、当該文字列領域を抽出する文字列抽出手段と、を備える。
図1は、本発明の情報処理装置の一実施形態に係る帳票認識装置により実現可能となる第1のサービス(以下、「本第1のサービス」と呼ぶ)の概要を説明する図である。
1つの文字列は、他の文字列と空間的に、或いは内容的に区別可能なものである。また、文字は、線、及び点のうちの少なくとも一方を用いて形作られた記号のことである。ひらがな、カタカナ、漢字、数字、アルファベット、及び各種マーク等は全て文字である。
本第1のサービスでは、セルが存在しない範囲に1つ以上の文字列が配置されていた場合、1つの文字列領域をテーブルとして抽出する。テーブルは、1つ以上のセル、及び1つ以上の文字列領域がグループを構成しているとして抽出する場合もある(後述する図2参照)。
即ち、帳票認識装置は、帳票画像に存在する罫線からセルを認識し、認識したセルの帳票画像における位置を特定することで、当該セルを抽出する。
さらに、帳票認識装置は、このようにして抽出した1以上のセル及び位置に基づいて、帳票画像においてグループを構成する1以上のセルを特定し、特定した1以上のセルが存在する範囲をテーブルとして抽出する。なお、帳票画像においてグループを構成する1以上のセルが特定されることにより、テーブルの帳票画像における位置も特定されることになる。
また、帳票認識装置は、帳票に存在する文字列領域を認識し、認識した文字列領域の帳票画像における位置を特定することで、当該文字列領域を抽出する。
この表示画面DSには、図1に示すように、表示領域DS1、表示領域DS2、及び表示領域DS3が確保されている。
即ち、1以上の帳票画像データはファイルの形態で予め帳票認識装置に入力されている。オペレータは、これらの1以上の帳票画像データのうち、レイアウト解析の対象となる帳票画像データを選択する操作を、表示領域DS1において行う。
なお、表示領域DS2の上方部分には、解析対象とする帳票画像(原画像)を含む各種画像のサムネイル画像が表示される。サムネイル画像として表示される画像には、原画像の他に、原画像の2値化画像、原画像上の罫線に着目したサリエンシーマップ画像、及び原画像上の罫線と文字列領域に着目したサリエンシーマップ画像が含まれる。2つのサリエンシーマップ画像は、例えばDNN(Deep Neural Network)を用いて生成された画像である。
ボタンBT1は、処理対象の帳票画像に対して、テーブルの抽出結果を重畳表示させる指示操作するためのボタンである。
ボタンBT2は、処理対象の帳票画像に対して、セルの抽出結果を重畳表示させる指示操作するためのボタンである。
ボタンBT3は、処理対象の帳票画像に対して、文字列領域の抽出結果を重畳表示させる指示操作するためのボタンである。
なお、レイアウト解析の実行直後においては、3つのボタンBT1乃至BT3の全ては選択状態となっている。この場合、オペレータは、テーブル、セル、及び文字列領域(テキスト)の夫々の抽出結果の全てを確認することができる。
以下、x軸と平行な方向は「左右方向」、y軸と平行な方向は「上下方向」とも表現する。また、特に断らない限り、位置情報は領域の位置、及び形状を表すものの意味で用いる。
「テキスト」タブT3は、解析結果として、文字列領域の抽出結果の詳細を表示させるのを指示するためのタブである。本第1のサービスでは、各文字列領域の位置情報、及び各文字列領域のイメージの抜粋を表示させるようにしている。
「認識結果(1)」タブT4は、解析結果として、文字列(テキスト)の認識結果を表示させるのを指示するためのタブである。本第1のサービスでは、各文字列の認識結果、及び各文字列の画像の抜粋を夫々、対応させて表示させるようにしている。
図2に示す帳票画像FIの抜粋部分では、テーブルTBは計5つが抽出される。5つのテーブルTBのうちの4つは全て、1つのセルが1つのテーブルTBとして抽出されている。残りの1つは、計11つのセルCEと、そのうちの1つと上下方向に隣接する1つの文字列領域TXとがグループにまとめられたテーブルとなっている。
位置情報を示すセルCEは、テーブルTBの左側に位置するセルCEのうちで上から2番目に位置するセルCEである。そのため、位置情報に含まれるx軸上の距離がテーブルTBのその距離と一致し、y軸上の距離がテーブルTBのその距離とは一致していない。
上記のように、抽出結果としては、テーブルTB、セルCE、及び文字列領域TXの3種類が存在する。ボタン表示領域DS31内に配置された3つのボタンBT1~3は、それらのうちの1つを選択的に表示させることを可能にする。その他に、本第1のサービスでは、3種類の抽出結果を初期表示として同時に表示させるようにしている。このことから、図3では、(A)~(D)に、表示される抽出結果を異ならせて示している。具体的には、図3(A)には初期表示、つまりテーブルTB、セルCE、及び文字列領域TXの各抽出結果を表示させた場合の例を示している。同様に図3(B)~(D)には、夫々テーブルTB、セルCE、及び文字列領域TXの抽出結果を表示させた場合の例を示している。それにより、図3(A)では、「テーブル」「セル」「テキスト」の全てのボタンBT1~3が選択状態となっている。図3(B)~(D)では、3つのボタンBT1~3のうちの1つのみが選択状態となっている。
このようなことから、オペレータは、後続処理をより確実に効率的に行うことができる。
即ち、帳票認識装置は、帳票を表す画像のデータを用いて、帳票画像に存在する、1つ以上の文字が連なる文字列TXを複数認識するとともに、認識した複数の文字列TXの夫々の帳票画像における位置情報を特定する。
さらに、帳票認識装置は、複数の文字列TXの夫々の認識結果、及び複数の文字列TXの位置情報を用いて、帳票に存在する複数の文字列TXのうち、所定の2つの文字列TXの間の対応関係を決定する。
また、帳票認識装置は、対応関係が決定された所定の2つの文字列TXのうち、所定条件を満たす2つの文字列TXの組を特定する。
本第2のサービスでは、帳票画像FIから認識した文字列TXはグラフのノードNDとして扱われる。このグラフは、ノードND間を線で結んだものであり、各線は2つのノードND間の対応関係、つまりエッジEDを示している。それにより、2つの文字列TXの組の特定は、グラフから、エッジEDで結ぶ2つのノードNDを抽出することに相当する。
図5(A)、及び(B)では、異なる帳票毎に、その帳票画像から夫々特定される2つの文字列TXの組の例を示している。
図5(A)に示す帳票画像では、2つの文字列TXの組として、文字列TX11である「賦課年度」と文字列TX13である「平成26」、及び文字列TX12である「対象年度」と文字列TX14である「平成26」が特定される。他に、「通知書番号」と「6200100001」、「期/月」と「7月」、「納期限」と「平成26年12月20日」の2つの文字列TXの組が特定される。
重要度が比較的に高い文字列TXの認識結果のみを後続処理で確認するような場合、オペレータは、全ての認識結果のうちから確認すべき認識結果を探し出して確認しなければならず、後続処理を迅速に行うのが困難となる。
このようなことから、オペレータにとっては、その2つの文字列TXの組を適切に確認するのがより容易に行えるようになる。それにより、後続処理における重度のミスをするのをオペレータはより回避できるようにもなる。これらのことから、オペレータは、状況等に応じた適切な後続処理をより迅速に行うことができる。
帳票認識装置1は、購入組織が用意した情報処理装置であり、購入した専用アプリがインストールされている。その帳票認識装置1は、帳票のイメージを読み取って電子化し、電子化によって得られる帳票画像データを出力するのが可能なスキャナ2と接続されている。それにより、情報処理システムは、帳票認識装置1とスキャナ2とを接続させた構成となっている。ここでは、帳票認識装置1は後続処理にオペレータが使用する想定である。
帳票認識装置1は、CPU(Central Processing Unit)11と、ROM(Read Only Memory)12と、RAM(Random Access Memoy)13と、バス14と、入出力インターフェース15と、出力部16と、入力部17と、記憶部18と、通信部19と、ドライブ20と、を備えている。
RAM13には、CPU11が各種の処理を実行する上において必要なデータ等も適宜記憶される。そのデータには、CPU11が実行する各種プログラムも含まれる。
入力部17は、例えばキーボード等の各種ハードウェア釦等を含む構成である。それにより、は、入力部17を介して各種情報を入力することができる。入力部17には、ポインティングデバイス、タッチパネル等の入力装置が複数、含まれていても良い。
通信部19は、スキャナ2との間の通信を可能にする。
具体的には例えば、セル抽出部111は、帳票画像データが表す帳票画像FI上に存在する罫線を検出することにより、セルCEを抽出する。また、セル抽出部111は、抽出したセルCE毎に、帳票画像においてセルCEが存在する範囲をセル領域として抽出するとともに、そのセル領域の位置情報を抽出する(図2参照)。なお、位置情報のxy軸の各距離は、上記のように、帳票画像上で帳票と見なされる矩形形状が抽出され、抽出された矩形形状の左上の点が基点とされて表されたものである。これは、文字列領域TX、及びテーブルTBでも同様である。
その指示により、テーブル抽出部112は、オペレータが選択した保存形式で解析結果を記憶部18に確保された解析結果保存部181に格納する。
図8に示すセル抽出部111は、このセル検出処理をCPU11が実行することで実現される。このことから、ここでは処理を実行する主体をセル抽出部111として説明を行う。
モルフォロジー変換は、DNNを用いて行っている。表示領域DS2(図1)の上方部分にサムネイル画像として表示される2つのサリエンシーマップ画像には、罫線が含まれる。その罫線は、DNNを用いて分離させた水平線成分、垂直線成分を用いて特定されたものである。そのため、2つのサリエンシーマップ画像の生成にDNNが用いられている。
また、セル抽出部111は、検出した各成分により囲まれた矩形領域を、接続、つまり隣接していると見なす範囲でグルーピングする。それにより、例えば上下左右のうちの何れかの方向で、定めた閾値以下の距離で隣り合う矩形領域は1つのグループにまとめられる。抽出した交差情報は、矩形領域のグルーピングのために参照される。
また、セル抽出部111は、検出した各成分のうちで適切に他の成分と接続されていない可能性が考えられる成分を特定し、特定した成分を必要に応じて操作する処理も併せて行う。
罫線では、図10に示すように、水平線、或いは垂直線の成分Lの一部Laが交差する他の成分Lからはみ出している場合がある。本第1のサービスでは、はみ出した一部Laは、その一部Laがはみ出した方向に存在する他の成分Lと接続させるべきものである可能性を考慮して対応するようにしている。具体的には、一部Laがはみ出している方向に、その一部Laに向かってはみ出している一部Laを有する他の成分Lが存在する場合、その2つの一部Laを、その2つの一部Laを含む1つの成分Lに置き換えるようにしている。その置き換えにより、2つの一部Laは、それらを結ぶ罫線として扱われる。以下、一部Laは「はみ出し部La」と呼ぶ。
水平線成分LH、及び垂直線成分LVはともに、本来は太さを有する成分である。水平線成分LHは高さを持たない成分に、垂直線成分LVは幅を持たない成分に変換される。その結果、図11に示すように、太さのない水平線成分と垂直線成分とで形成される格子を表す格子データが作成される。
上記のように、ステップS12では、他の成分Lからはみ出しているはみ出し部Laが特定される。図12では、同じ水平方向にはみ出している2つのはみ出し部La、その逆向きにはみ出している1つのはみ出し部La、及び垂直方向にはみ出している1つのはみ出し部Laが特定された場合の例を示している。
図13に示すように、帳票画像FI上に存在する罫線で囲まれ、且つ他の矩形領域に含まれた領域が存在しない矩形領域が全てセルCEとして検出される。検出されたセルCEは、形状を含む位置関係からグルーピングされ、1グループを構成するセルCEはテーブルTBの構成要素として扱われる。また、矩形形状となっていない領域を囲む罫線による閉罫線CLは、セルCEとして検出されず、排除される。
その排除により、有効とする罫線が確定する。それにより、2つのサリエンシーマップ画像上の罫線も確定する。その一方に配置される文字列領域TXは、罫線とは別に抽出されて特定される。
図8に示すテーブル抽出部112は、この外周取得処理をCPU11が実行することで実現される。このことから、ここでは処理を実行する主体をテーブル抽出部112として説明を行う。
上記セル検出処理では、セルCEの検出、及びセルCEのグループ化を行う。このことから、外周取得処理では、グループ化されたセルCEの集合の外周を特定することにより、テーブルTBの範囲を抽出するようになっている。
図15の左側に示すようにセルCEが検出されるか、或いはグルーピングされることにより、各セルCEの角で交差する水平線、及び垂直線が格子線GDとして引いた状態が想定される。節点Pは、セルCEを表す罫線が格子線GDの水平線、或いは垂直線と交差する点である。節点情報は、節点Pの位置を表す位置情報である。
節点Pは、テーブルTBの外周を特定するために想定される。テーブルTBの外周の特定は、起点とする節点Pから、隣接する別の節点Pに着目する節点Pを順次、移動させる探索により行われる。この探索は、既に探索済みの節点Pに戻った時点で終了する。
グラフモデラ部1211は、画像DT1、及び文字列領域TXの位置情報DT2を参照し、文字列領域TX間の相対的な位置情報、つまり距離情報を生成する。
特徴演算部1212は、文字列TXの認識結果DT3から、各文字列TXの属性を表す属性情報、及び文字列の自然言語処理(NLP:Natural Language Processing)を行った結果であるNLP情報を生成する。
文字列領域TX間の相対的な位置情報は、空間的な特徴を表す情報である。グラフモデラ部1211は、認識された文字列TX、より正確には、その文字列TXが存在する文字列領域毎に、隣接する文字列領域TXとの間の相対的な位置情報を生成する。本第2のサービスでは、図18に示すように、上下左右の4方向に分け、方向毎に、隣接する文字列領域TXまでの位置情報を生成する。具体的には、上下に隣接する文字列領域TXでは、その間の距離を、対象とする文字列領域TXの高さで割って得られる位置情報を生成する。左右に隣接する文字列領域TXでは、その間の距離を、対象とする文字列領域TXの幅で割って得られる位置情報を生成する。
グラフ構築部122では、図17に示すように、特徴抽出部1221、ノード分類部1222、ノード抽出部1223、エッジ分類部1224、及び結合部1225が機能する。特徴抽出部1221、ノード分類部1222、及びエッジ分類部1224は、MLP(MultiLayer Perceptron)を用いたものである。
特徴抽出部1221は、図19に示すように、3層のNN(Neural Network)である。この特徴抽出部1221には、グラフ情報生成部121から、ノードNDの集合、及びエッジEDの集合を表すグラフ、ノード数、エッジ数、ノード属性、ノードラベル、隣接行列、マッピングマトリックス、等が渡される。
その他と分類されるノードNDは、ノード削除部12231に通知され、各ノードのノード分類子はノード削除部12231に渡される。それにより、ノード削除部12231は、全てのノードNDのうちから、その他と分類されるノードNDを対象から削除する。この結果、ノード選択部12232には、キー、或いはバリューと分類されたノードNDのみが通知される。
この結果、エッジ分類部1224は、キー、或いはバリューと分類されたノードNDのみを対象に、そのノードNDとの間に対応関係があると見なすノードNDを特定し、マッピングマトリックスを更新する。
また、帳票画像FIを表す帳票画像データは、スキャナ2から取得しているが、その帳票画像データは、ネットワークを介して接続可能な端末から取得するようにしても良い。つまり、帳票画像データを取得する装置は特に限定されない。それにより、図1に示すような表示画面DSを表示させる装置も特に限定されない。
キー-バリューの関係にある2つの文字列TXの組の抽出にNNを用いているが、NNを用いなくても良い。しかし、NNを用いた場合、用意する学習データにより、様々な帳票に対応させることが比較的に容易に可能になるという利点がある。
テーブルTBの範囲内に複種類の罫線が存在する場合がある。複種類の罫線とは、太さが異なる、1つの罫線を形成する線の数が異なる、及び色が異なる、等のうちの何れかにより区別される複種類の罫線である。罫線を異ならせていることには何らかの意図が存在するのが普通である。このことから、テーブルTBの抽出、或いは文字列TX(ノードND)間の対応関係の決定に、罫線の種類の判定結果を反映させるようにしても良い。
帳票は表構造となっている。そのため、テーブルTBの抽出、文字列TX間の対応関係の決定を行う対象を帳票としている。それにより、表構造を有しているものであれば対象にすることが可能である。つまり、対象は、帳票以外のものであっても良い。
即ち、本第1のサービスを提供可能な情報処理装置(例えば図6に示す帳票認識装置1)は、
帳票を表す画像のデータを用いて、前記帳票に存在するセルを認識し、認識した前記セルの前記画像における位置を特定することで、当該セルを抽出するセル抽出手段(例えば図8に示すセル抽出部111)と、
前記セル抽出手段によりが抽出された1以上の前記セル及び位置に基づいて、前記画像においてグループを構成する1以上の前記セルを特定し、特定した前記1以上のセルが存在する範囲をテーブルとして抽出するテーブル抽出手段(例えば図8に示すテーブル抽出部112)と、
前記帳票に存在する文字列領域を認識し、認識した前記文字列領域の前記画像における位置を特定することで、当該文字列領域を抽出する文字列抽出手段(例えば図8に示す文字列認識部113)と、
を備える情報処理装置。
テーブルの抽出結果は、テーブル単位で文字列の認識結果、及びその対応関係を確認する後続処理を行うことを可能にする。テーブル単位で確認できることから、一度に意識すべき文字列の数はより少なくなり、文字列間の対応関係の確認もより容易となる。
このようなことから、オペレータは、適切な後続処理をより容易、且つより迅速に行うことができる。
前記セル抽出手段、前記テーブル抽出手段、及び前記文字列抽出手段により夫々抽出された前記セル、前記テーブル、及び前記文字列の夫々の位置を視認可能な形態で、前記画像を表示させる制御を実行する表示制御手段(例えば図8に示す表示制御部114)、を更に備えることができる。
これにより、オペレータは、表示された画像から、セル、テーブル、及び文字列領域の位置を確認することができる。
前記表示制御手段は、
操作者による操作に基づいて、前記テーブル、前記セル、及び前記文字列領域のうちの1つ以上の位置を選択的に視認可能な形態で、前記画像を表示させる制御を実行する、ようにさせることができる。
これにより、オペレータは、表示された画像から、セル、テーブル、及び文字列領域のうちの任意の位置を選択的に確認することができる。そのため、位置の確認はより容易に行えるようになる。
即ち、本第2のサービスを提供可能な情報処理装置(例えば図6に示す帳票認識装置1)は、
帳票を表す画像のデータを用いて、前記帳票に存在する、1つ以上の文字が連なる文字列を複数認識するとともに、認識した前記複数の文字列の夫々の前記画像における位置情報を特定する文字列認識手段(例えば図8に示す文字列認識部113)と、
前記文字列認識手段による前記複数の文字列の夫々の認識結果、及び前記複数の文字列の前記位置情報を用いて、前記帳票に存在する前記複数の文字列のうち、所定の2つの文字列の間の対応関係を決定する対応関係決定手段(例えば図8に示す対応関係決定部116)と、
前記関係性決定手段により対応関係が決定された前記所定の2つの文字列のうち、所定条件を満たす2つの文字列の組を特定する特定手段(例えば図8に示す特定部117)と、
を備える情報処理装置。
このようなことから、オペレータは、適切な後続処理をより迅速に行えるようになる。
前記対応関係決定手段は、前記複数の文字列の中で、所定の1種類以上の属性のうち何れかの属性を有する文字列のみを前記所定の2つの文字列の夫々として採用して、当該所定の2つの文字列の対応関係を決定する、ようにさせることができる。
これにより、採用させる文字列の属性を通して、所望の2つの文字列の組を特定させることができる。
前記所定条件は、一方の文字列がキーであり他方の文字列がバリューである関係が成立する条件を含む、ようにさせることができる。
これにより、その関係を有する2つの文字列の組を特定させることができる。
Claims (5)
- 帳票を表す画像のデータを用いて、前記帳票に存在する、1つ以上の文字が連なって意味を表している文字列が存在する可能性があるセルを認識し、認識した前記セルの前記画像における位置を特定することで、当該セルを抽出するセル抽出手段と、
前記セル抽出手段により抽出された1以上の前記セル及び位置に基づいて、前記画像においてグループを構成する1以上の前記セルを特定し、特定した前記1以上のセルが存在する範囲をテーブルとして抽出するテーブル抽出手段と、
前記帳票に存在する、前記文字列が存在する文字列領域を認識し、認識した前記文字列領域の前記画像における位置を特定することで、当該文字列領域を抽出する文字列抽出手段と、
を備える情報処理装置。 - 前記セル抽出手段、前記テーブル抽出手段、及び前記文字列抽出手段により夫々抽出された前記セル、前記テーブル、及び前記文字列領域の夫々の位置を視認可能な形態で、前記画像を表示させる制御を実行する表示制御手段、
を更に備える請求項1に記載の情報処理装置。 - 前記表示制御手段は、
操作者による操作に基づいて、前記テーブル、前記セル、及び前記文字列領域のうちの1つ以上の位置を選択的に視認可能な形態で、前記画像を表示させる制御を実行する、
請求項2に記載の情報処理装置。 - 情報処理装置が実行する情報処理方法において、
帳票を表す画像のデータを用いて、前記帳票に存在する、1つ以上の文字が連なって意味を表している文字列が存在する可能性があるセルを認識し、認識した前記セルの前記画像における位置を特定することで、当該セルを抽出するセル抽出ステップと、
前記セル抽出ステップの処理により抽出された1以上の前記セル及び位置に基づいて、前記画像においてグループを構成する1以上の前記セルを特定し、特定した前記1以上のセルが存在する範囲をテーブルとして抽出するテーブル抽出ステップと、
前記帳票に存在する、前記文字列が存在する文字列領域を認識し、認識した前記文字列領域の前記画像における位置を特定することで、当該文字列領域を抽出する文字列抽出ステップと、
を含む情報処理方法。 - 情報処理装置を制御するコンピューターに、
帳票を表す画像のデータを用いて、前記帳票に存在する、1つ以上の文字が連なって意味を表している文字列が存在する可能性があるセルを認識し、認識した前記セルの前記画像における位置を特定することで、当該セルを抽出するセル抽出ステップと、
前記セル抽出ステップの処理により抽出された1以上の前記セル及び位置に基づいて、前記画像においてグループを構成する1以上の前記セルを特定し、特定した前記1以上のセルが存在する範囲をテーブルとして抽出するテーブル抽出ステップと、
前記帳票に存在する、前記文字列が存在する文字列領域を認識し、認識した前記文字列領域の前記画像における位置を特定することで、当該文字列領域を抽出する文字列抽出ステップと、
を含む制御処理を実行するプログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2021067196A JP7178445B2 (ja) | 2021-04-12 | 2021-04-12 | 情報処理装置、情報処理方法、及びプログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2021067196A JP7178445B2 (ja) | 2021-04-12 | 2021-04-12 | 情報処理装置、情報処理方法、及びプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2022162379A JP2022162379A (ja) | 2022-10-24 |
JP7178445B2 true JP7178445B2 (ja) | 2022-11-25 |
Family
ID=83720996
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2021067196A Active JP7178445B2 (ja) | 2021-04-12 | 2021-04-12 | 情報処理装置、情報処理方法、及びプログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP7178445B2 (ja) |
Family Cites Families (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH08320914A (ja) * | 1995-05-24 | 1996-12-03 | Hitachi Ltd | 表認識方法および装置 |
JPH1166232A (ja) * | 1997-08-26 | 1999-03-09 | Ricoh Co Ltd | 帳票定義方法 |
JP2011003022A (ja) * | 2009-06-18 | 2011-01-06 | Fuji Xerox Co Ltd | 画像処理装置及びプログラム |
-
2021
- 2021-04-12 JP JP2021067196A patent/JP7178445B2/ja active Active
Also Published As
Publication number | Publication date |
---|---|
JP2022162379A (ja) | 2022-10-24 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110942074B (zh) | 字符切分识别方法、装置、电子设备、存储介质 | |
US20060224950A1 (en) | Media storing a program to extract and classify annotation data, and apparatus and method for processing annotation data | |
JP6122814B2 (ja) | 情報処理装置、プログラム、及びデジタル検版方法 | |
JP2005173730A (ja) | 帳票ocrプログラム、方法及び装置 | |
US20210056336A1 (en) | Image processing apparatus, image processing method, and storage medium | |
US9678642B2 (en) | Methods of content-based image area selection | |
US20220415008A1 (en) | Image box filtering for optical character recognition | |
JP6150766B2 (ja) | 情報処理装置、プログラム、及び自動ページ差し替え方法 | |
US8559718B1 (en) | Defining a layout of text lines of CJK and non-CJK characters | |
US11348331B2 (en) | Information processing apparatus and non-transitory computer readable medium | |
US20240111401A1 (en) | Information processing apparatus, information processing method, and program | |
JP2012203491A (ja) | 文書処理装置及び文書処理プログラム | |
JP7178445B2 (ja) | 情報処理装置、情報処理方法、及びプログラム | |
JP2012181653A (ja) | 採点方法、採点方法のプログラム及び採点システム | |
JP7317886B2 (ja) | 情報処理装置及び情報処理方法 | |
JP2010003218A (ja) | 文書レビュー支援装置及び方法、並びにプログラム及び記憶媒体 | |
US11588945B2 (en) | Data input support apparatus that displays a window with an item value display area, an overview image display area, and an enlarged image display area | |
JP4466241B2 (ja) | 文書処理手法及び文書処理装置 | |
JP2005165978A (ja) | 帳票ocrプログラム、方法及び装置 | |
JP7409292B2 (ja) | 情報処理装置、情報処理方法、及びプログラム | |
JP5402417B2 (ja) | 画像処理装置 | |
JP3153863B2 (ja) | フィールドにデータ・オブジェクトをリンクさせる方法及びシステム | |
US20220311894A1 (en) | Information processing apparatus, non-transitory computer readable medium storing program, and information processing method | |
JP2011003022A (ja) | 画像処理装置及びプログラム | |
US20210264099A1 (en) | Information processing device and computer readable medium |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20220428 |
|
A871 | Explanation of circumstances concerning accelerated examination |
Free format text: JAPANESE INTERMEDIATE CODE: A871 Effective date: 20220428 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20220628 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20220816 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20221018 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20221114 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 7178445 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |