JP2023036478A - 情報処理装置、プログラム、及び情報処理方法 - Google Patents

情報処理装置、プログラム、及び情報処理方法 Download PDF

Info

Publication number
JP2023036478A
JP2023036478A JP2021143550A JP2021143550A JP2023036478A JP 2023036478 A JP2023036478 A JP 2023036478A JP 2021143550 A JP2021143550 A JP 2021143550A JP 2021143550 A JP2021143550 A JP 2021143550A JP 2023036478 A JP2023036478 A JP 2023036478A
Authority
JP
Japan
Prior art keywords
information
coordinate
row
ruled line
specific area
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2021143550A
Other languages
English (en)
Other versions
JP7043667B1 (ja
Inventor
太郁由 谷本
Takayoshi Tanimoto
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
RYOBI SYSTEMS CO Ltd
Original Assignee
RYOBI SYSTEMS CO Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by RYOBI SYSTEMS CO Ltd filed Critical RYOBI SYSTEMS CO Ltd
Priority to JP2021143550A priority Critical patent/JP7043667B1/ja
Application granted granted Critical
Publication of JP7043667B1 publication Critical patent/JP7043667B1/ja
Publication of JP2023036478A publication Critical patent/JP2023036478A/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Abstract

【課題】地積測量図から座標求積表を高精度に抽出する情報処理装置、プログラム及び情報処理方法を提供する。【解決手段】情報処理装置10は、地積測量図の画像情報を記憶する記憶手段100と、画像情報からオブジェクトを抽出するオブジェクト抽出手段120と、オブジェクトから罫線を抽出する罫線抽出手段130と、オブジェクトにおける表の構成を判定する表判定手段140と、表の構成に基づき前記地積測量図から座標求積表の情報を取得する情報取得手段161と、を備える。表判定手段140は、オブジェクトの特定領域に罫線が有るか否かを判定する。情報取得手段161は、特定領域に罫線が有ると判定された場合、当該罫線により区分された情報に基づいて座標求積表の情報を取得し、特定領域に罫線が無いと判定された場合、特定領域に配されている画像に基づき区分された情報に基づいて座標求積表の情報を取得する。【選択図】図5

Description

本発明は、座標求積表を取得可能な情報処理装置、プログラム、及び情報処理方法に関する。
従来から、土地は法務局において登記されており、法務局が地積測量図などの情報により管理している。
土地の諸税管理は、地方自治体に委ねられていることから、法務局から地方自治体に対し、地積測量図が提供される。
地積測量図は、土地の辺長、面積などの測量情報などを表した「座標求積表」や地図等により構成されている。
例えば、特許文献1には、表内の数値を読み取り、数値同士に一定の関係性を有することを判定することに基づいて座標求積表を自動認識する技術が開示されている。
特開2021-28794号公報
しかしながら、座標求積表は、表内の数値に一定の関係性があるものの、表の構成や行列のパターンが多く不確定なため、認識の精度が低いことが課題であった。
本発明は、以上のような従来の技術が有する課題を解決するために提案されたものであり、地積測量図から座標求積表を高精度に取得可能な情報処理装置、プログラム、及び情報処理方法の提供を目的とする。
上記目的を達成するため本発明の情報処理装置は、地積測量図の画像情報を記憶する記憶手段と、前記画像情報からオブジェクトを抽出するオブジェクト抽出手段と、前記オブジェクトから罫線を抽出する罫線抽出手段と、前記オブジェクトにおける表の構成を判定する表判定手段と、前記表の構成に基づき前記地積測量図に含まれる座標求積表の情報を取得する情報取得手段と、を備え、前記表判定手段は、前記オブジェクトの特定領域に前記罫線が有るか否かを判定し、前記情報取得手段は、前記特定領域に罫線が有ると判定された場合、当該罫線により区分された情報に基づいて前記座標求積表の情報を取得し、前記特定領域に罫線が無いと判定された場合、前記特定領域に配されている画像に基づき区分された情報に基づいて前記座標求積表の情報を取得する構成としてある。
また、本発明は、上記のような情報処理装置において実行されるプログラムや情報処理方法として構成することもできる。
本発明によれば、地積測量図から座標求積表を高精度に取得することができる。
地積測量図の一例を示す図である。 座標求積表の一例を示す図である。(a)は測量点行が罫線で区分されている場合、(b)は測量点行が罫線で区分されていない場合を示す。 (a)はフッターが測量点行と同じセル内に含まれ、かつ、他のセルにも含まれる座標求積表(罫線無し)の一例を示す図であり、(b)はフッターが測量点行と同じセル内に含まれていない座標求積表(罫線無し)の一例を示す図である。 本発明の情報処理装置のハードウェア構成図である。 情報処理装置の機能ブロック図である。 オブジェクト抽出を示す図である。 二値化したオブジェクトにおける罫線抽出を示す図である。(a)は斜め補正前のオブジェクト、(b)は斜め補正後のオブジェクトにおいて横罫線を抽出した場合、(c)は横罫線の幅を縮めた場合、(d)は縦罫線を抽出した場合を示す。 行列等の特定を示す図である。 罫線有りの場合のセル座標抽出を示す図である。 罫線無しの場合の表判定を示す図である。(a)は特定領域における文字オブジェクトの抽出、(b)は文字オブジェクトに基づく文字行の長さの特定、(c)は文字行の長さに基づいて特定領域を特定する場合を示す。 罫線無しの場合の表判定結果を示す図である。(a)はフッターが4行の場合、(b)はフッターが3行の場合、(c)はフッターが別セルに含まれている場合を示す。 罫線無しの場合のセル座標抽出を示す図である。 ヘッダーOCR処理を示す図である。 セルOCR処理を示す図である。 座標求積表の情報の出力結果の一例を示す図である。 本発明に係る情報処理方法を示すフローチャートである。 表判定方法を示すフローチャートである。 特定領域(罫線有り)の特定方法を示すフローチャートである。 特定領域(罫線無し)の特定方法を示すフローチャートである。 地積測量図に含まれる様々なオブジェクトの一例である。(a)~(g)は座標求積表以外の表を示す。 座標求積表(罫線有り)の特種例を示す図である。 罫線の線幅を縮めない場合に生ずる問題を示す図である。 (a)は罫線が斜めでない場合を示す図であり、(b)は罫線が斜めの場合を示す図である。 (a)は罫線が斜めの場合に生ずる問題を示す図であり、(b)は罫線の線幅を縮めることで問題を解決することを示す図である。
以下、本発明の情報処理装置の一実施形態について説明する。
本発明の情報処理装置は、地積測量図から高精度で座標求積表を取得できるように構成されている。
図1は、地積測量図の一例を示す図である。
同図に示すように、地積測量図は、土地面積の算出方法などを図表で表した座標求積表、それ以外の各種表、土地の地図、方位図、文字、外枠、ノイズなどの各種オブジェクトにより構成されている。
これらの各オブジェクトは、様々な大きさで構成されているところ、座標求積表は、所定の大きさの範囲内で構成されていることが判明した。
具体的には、地積測量図の帳票のサイズに対し、例えば、5%<高さ<100%で、かつ、10%<横幅<50%が座標求積表の大きさであることが、本発明の発明者により解明された。
図2及び図3は、座標求積表の一例を示す図である。
同図に示すように、地積測量図は、基本的には、地番行、ヘッダー行、測量点行、及びフッターにより構成される。
地番行には、土地の地番が見出しとして記載される。
ヘッダー行には、測量点行における測量情報の見出しの情報が記載される。
見出し情報としては、X、XなどX座標列であることを示す見出し情報、Y、YなどY座標列であることを示す見出し情報、Xn+1-Xn-1など辺長であることを示す見出し情報、Y(Xn+1-Xn-1)など各面積であることを示す見出し情報などが記載される。
測量点行には、ヘッダー行の見出しに対応した各測点における測量情報(X座標値及びY座標値、辺長、各面積等)が記載される。
フッターには、各測量点行における各面積の合計値(倍面積)、土地の面積(倍面積の1/2)及び地積等が記載される。
座標求積表は、図2(a)に示すように、測量点行の測量情報が罫線で区分されているもの(以降、「罫線有り」ともいう)と、図2(b)に示すように、測量点行の測量情報が罫線で区分されていないもの(以降、「罫線無し」ともいう)との2つのタイプが存在することが、本発明の発明者により解明された。
また、以下の(1)及び(2)に示すように、「罫線有り」と「罫線無し」によって、それぞれ座標求積表の特徴があることが、本発明の発明者により解明された。
(1)座標求積表(罫線有り)
・地番行:2列1行の場合が多い。ただし、地番行がない場合もある。
・ヘッダー行:3列以上で構成される。表内で最大列数を構成する。測量点行の列数と同じ列数で構成される。1行で構成される。必ず存在する。
・測量点行:3列以上で構成される。ヘッダー行の列数と同じ列数で構成される。3行以上が必ず存在する。必ず、ヘッダー行の次の行から始まる。
・フッター:測量点行よりも列数が少ないことが多い。2行以上が必ず存在する。
(2)座標求積表(罫線無し)
・地番行:2列1行の場合が多い。ただし、地番行がない場合もある。
・ヘッダー行:3列以上で構成される。表内で最大列数を構成する。1行で構成される。必ず存在する。
・測量点行:1行1列である。必ずヘッダー行の次の行に配置される。フッターと同じセル内に構成される。なお、「セル」とは、罫線で区分された1マス(1枠)の領域のことである。
・フッター:測量点行と同じセル内に構成される。まれに、フッターが複数のセルに亘って構成される場合(図3(a)参照)や、測量点行とセルが同じセル内に配されずに分かれて構成される場合がある(図3(b)参照)。
図4は、情報処理装置10のハードウェア構成図である。
情報処理装置10は、例えば、地方自治体に設置されて利用されるパーソナルコンピュータが相当する。
なお、情報処理装置10は、パーソナルコンピュータに限らず、タブレット端末やスマートフォンであってもよく、地方自治体以外の場所で利用される態様でもよい。
情報処理装置10は、プロセッサ11と、メモリ12と、ストレージ13と、操作装置14と、表示装置15と、通信装置16と、を備える。
プロセッサ11は、プログラムを実行することにより、情報処理装置10の各部を制御し、情報処理装置10の機能を実現する処理を行う。プロセッサ11には、例えばCPUが用いられる。
メモリ12は、コンピュータが読み取り可能な記録媒体であり、プロセッサ11により実行されるプログラムを記憶する。メモリ12には、例えばROM、EPROM、EEPROM及びRAM等が用いられる。
ストレージ13は、コンピュータが読み取り可能な記録媒体であり、プロセッサ11により用いられる各種のデータ及びプログラムを記憶する。ストレージ13には、例えばハードディスクドライブ、フレキシブルディスク、USBメモリ、フラッシュメモリ、SSD等が用いられる。
操作装置14は、情報処理装置10の操作に用いられる。操作装置14は、例えばパーソナルコンピュータにおけるキーボードやマウスが該当し、スマートフォンやタブレット端末においてはタッチパネルや各種操作ボタンなどが該当する。
表示装置15は、例えば液晶ディスプレイが用いられており各種画面を表示する。表示装置15は、タッチセンサと一体となってタッチパネルとして構成されてもよい。
通信装置16は、図示しない通信ネットワークに接続され、通信ネットワークを介して外部装置とデータ通信を行うことができる。地積測量図は、電子ファイルとしてLG-WAN(Local Government - Wide Area Network:総合行政ネットワーク)を介して提供される場合、通信装置16を介して地積測量図を取得(受信)する。
なお、本発明の情報処理装置は、プログラム(ソフトウェア)の命令によりコンピュータで実行される処理,手段,機能によって実現される。プログラムは、コンピュータの各構成要素に指令を送り、以下に示す本発明に係る所定の処理や機能等を行わせることができる。すなわち、本発明における各処理や手段,機能は、プログラムとコンピュータとが協働した具体的手段によって実現される。
プログラムの全部又は一部は、例えば、磁気ディスク,光ディスク,半導体メモリ,その他任意のコンピュータで読取り可能な記録媒体により提供され、記録媒体から読み出されたプログラムがコンピュータにインストールされて実行される。また、プログラムは、記録媒体を介さず、通信回線を通じて直接にコンピュータにロードし実行することもできる。また、本発明に係る情報処理装置は、単一の情報処理装置(例えば一台のコンピュータ等)で構成することもでき、複数の情報処理装置(例えば複数台のコンピュータ群等)で構成することもできる。
図5は、情報処理装置10の機能ブロック図である。
同図に示すように、情報処理装置10は、記憶手段100、前処理部110、オブジェクト抽出手段120、罫線抽出手段130、表判定手段140、ヘッダーOCR処理部150、及びセルOCR処理部160を備えている。
記憶手段100は、ストレージ13やメモリ12において地積測量図の画像情報を記憶する。
地積測量図は、紙媒体に表記されているものをスキャンして得た画像情報が対象となる。
具体的には、通信装置16を介して法務局から取得した地積測量図を記憶手段100に記憶したり、USBメモリなどの可搬記憶媒体を介して取得したものを記憶手段100に記憶することもできる。
前処理部110は、記憶手段100において記憶されている地積測量図の画像情報に対し二値化を行う。
二値化は、具体的には、地積測量図に含まれる各オブジェクトを白と黒の2色に変換するものであり、前処理部110は、二値化したオブジェクトにおいて、白と黒を反転する処理を実行する。
前処理の結果、座標求積表などの表、地図、方位図、文字、外枠、ノイズなどの各種オブジェクトが白で表され、オブジェクトの背景が黒で表される。
オブジェクト抽出手段120は、地積測量図の画像情報からオブジェクトを抽出する。オブジェクト抽出には、ラベリングという公知の画像処理技術を用いる。
ラベリングは、ひとつながりの画素全体を一オブジェクトとして抽出する。
これにより、座標求積表などの表、地図、方位図、文字、外枠、ノイズがオブジェクトとして抽出される。
また、オブジェクト抽出手段120は、各オブジェクトの中から特定の大きさのオブジェクトを座標求積表の可能性の高いオブジェクトとして抽出する。
図6は、オブジェクト抽出を示す図である。
同図に示すように、地積測量図には、様々な大きさのオブジェクトがあるところ、座標求積表は一定の大きさ(中程度の大きさ)を占めることから、大きさに関する閾値処理を行うことで座標求積表の候補を効率よく抽出することができる。
具体的には、地積測量図の帳票のサイズに対する縦方向及び横方向のオブジェクト比率を閾値としてそれぞれ指定する。
例えば、閾値を、5%<高さ<100%、及び、10%<幅<50%と指定する。
これにより、座標求積表ではない小さいオブジェクトや大きいオブジェクトを効率よく排除でき、座標求積表のオブジェクトを含め、座標求積表である可能性の高いオブジェクトを効率よく抽出することができる。
なお、上記閾値は一例であり、任意値を指定することができる。
罫線抽出手段130は、オブジェクト抽出手段120により抽出されたオブジェクトから罫線を抽出する。
具体的には、オブジェクトから縦罫線と横罫線を抽出する。
図7は、オブジェクトからの罫線抽出を示す図である。
なお、説明の便宜上、図7及び図9は二値化した図を用いるが、それ以外の図は二値化されていない図を用いる。
図7(a)に示すように、まず、オブジェクトの傾きを修正する。
具体的には、オブジェクトの最小外接矩形に含まれる横罫線と水平罫線との間にα°の傾きがある場合は、オブジェクトをα°回転させて水平にする処理(斜め補正)を実行する。
これにより、表が斜めの場合に発生し易いノイズ(1本の罫線から発生する複数のピーク)を発生し難くすることができる。
図7(b)に示すように、次に、横罫線を抽出する。
例えば、横方向に白の画素を計数し、最小外接矩形の横幅に対する閾値(例えば35%)以上の部分を横罫線と判定する。
図7(c)に示すように、横罫線は、線幅を縮めて、線1本に対して1ピクセルを設定することで線1本のデータとして管理する。
線幅を1ピクセル幅に縮めて管理したのは、地積測量図の帳票の罫線は、実際には数ピクセル分の線幅があり、そのままセルやその大きさを特定しようとすると、横罫線の上端と下端に分けて線データを捉える必要があり、そうすると処理負荷が大きくなるなど煩雑になるからである。
また、図22に示すように、スキャン品質が悪いことが原因で、文字と罫線とが1ピクセル単位でつながっている場合がある(図中の矢印参照)ところ、このような場合に何ら措置をとらないと罫線とつながっている文字が罫線の一部と判定され、文字の欠損等が生じ得るからである。
特に、地積測量図の帳票が斜めにスキャンされた場合は、文字と罫線とがつながり易い問題がある。
これは、プログラム処理上、図23(a)に示すように罫線が斜めでない場合には、元の線幅と同じ線幅(例えば10ピクセル)の罫線として判定されるが、図23(b)に示すように罫線が斜めの場合には、その線幅よりも厚い線幅(例えば20ピクセル)の罫線として判定される可能性があるからである(破線部参照)。
図24(a)は、地積測量図に含まれる座標求積表が斜めの場合を示す図であり、図24(b)は、横罫線の線幅を縮めたことを示す図である。
なお、図24における破線は、座標求積表が斜めでない場合における外枠を示す図である。
図23(b)に示す問題は、例えば、図24(a)の矢印に示すように、数字「7」の上部が罫線と重なって「1」と誤って判定される問題として生じ得る。
このような問題に対し、図24(b)に示すように横罫線の線幅を縮めて管理することで、図中の矢印に示すように、数字と罫線とが重ならないように管理できるため、数字「7」を正確に数字「7」と判定することができる。
なお、本実施形態の情報処理装置10は、斜め補正を行うため、線幅を縮めて管理しなくても罫線と文字とが重なる問題は生じ難いが、線幅を縮めて管理することで少なくとも図22に示す問題を生じ難くすることができる。
また、例えば、横罫線と水平罫線との間の角度α°が所定値以上の場合には斜め補正を実行することで罫線と文字とが重なる問題の発生を防ぎ、前記角度α°が所定値未満の場合には線幅を縮めて管理することで罫線と文字とがつながる問題の発生を防ぐようにもできる。
これにより、横罫線と横罫線との間に挟まれた領域を「行」と判定することができる。
なお、閾値を35%としたのは、短めの横罫線でも表の横幅に対して40%位の長さがあり、他方、12%位の長さのノイズ罫線が発生する場合があるからである。
次に、図7(d)に示すように、判定した行ごとに縦罫線を抽出する。
例えば、縦方向に輝度が255の画素を計数し、最小外接矩形の縦幅に対する閾値(例えば90%)以上の部分を縦罫線と判定する。
これにより、縦罫線と縦罫線との間に挟まれた領域を「列」と判定することができる。
縦罫線における閾値を横罫線における閾値より高く設定したのは、縦方向には、ノイズが残っていることが多く、このノイズを除去するためである。
なお、本実施形態の前処理部110は、地積測量図に含まれる各オブジェクトを「白(画素:255)」と「黒(画素:0)」の二値に変換し、これを白黒反転することを例示したが、これに限るものではない。
例えば、「白」と「黒」に代え、「0」と「1」や「true」と「false」などに二値化し、これを反転してもよい。
この場合、罫線抽出手段130は、反転後の二値のうち、白に対応する値に基づいて罫線を抽出すればよい。
表判定手段140は、オブジェクトにおける表の構成を判定する。
例えば、表全体の行列の特定、測量点行に対応する特定領域Tにおける罫線の有無の判定、当該判定結果に基づく特定領域Tの判定などを実行する。
表判定手段140は、行列特定手段141、ヘッダー行特定手段142、セル座標抽出部(罫線有り)143、文字行特定手段144、特定領域判定手段145、及びセル座標抽出部(罫線無し)146を備えている。
行列特定手段141は、オブジェクトにおいて表を構成する各領域の行列を特定する。
具体的には、罫線により区分された領域であるセルの行列数を特定する。
例えば、図8(a)に示す座標求積表(罫線有り)のオブジェクトR1からは「2列×1行、4列×5行、3列×3行」の行列を特定し、図8(b)に示す座標求積表(罫線無し)のオブジェクトR2からは「1列×1行、6列×1行、1列×1行」の行列を特定することができる。
ヘッダー行特定手段142は、行列特定手段141により特定された行列のうち、列数が最大である最初の行をヘッダー行と特定する。
ヘッダー行は、列数が最大となり、かつ、最初(最上部)に配置される行であるからである。
また、ヘッダー行特定手段142は、3列以上の行をヘッダー行と特定する。
2列未満のヘッダー行は存在しないからである。
例えば、図8(a)、(b)においては、2行目の行がヘッダー行と特定される。
なお、本実施形態の情報処理装置10では、地番行の特定は実行しないが、地番行の特定を実行してもよい。
例えば、OCR処理により文字「地番」を含む領域を地番行と判定して、地番行に基づいてヘッダー行を判定したり、文字「地番」を含むオブジェクトを座標求積表のオブジェクトRとして抽出することができる。
測量点行に対応する特定領域Tに罫線が有るか否かを判定する。
具体的には、ヘッダー行の次に、ヘッダー行の列数と同じ列数の行がある場合、当該行を測量点行と推定し、当該行からなる領域を特定領域Tと判定し、当該特定領域Tには罫線が有ると判定する。
また、ヘッダー行の次に、1列の行が1行ある場合、当該1行の領域は特定領域Tとフッター領域Fにより構成される特別領域Tと判定し、当該特別領域Tや特定領域Tには罫線が無いと判定する。
また、ヘッダー行の次の行が3列以上か1列かの判定を加えて、特定領域Tの判定や特定領域Tに罫線が有るか否かを判定することもできる。
例えば、ヘッダー行の次の行が3列以上の行である場合は、ヘッダー行の次以降にヘッダー行と同じ列数の行からなる領域を特定領域Tと判定し、当該特定領域Tには罫線が有ると判定したり、ヘッダー行の次の行が1列の行である場合には、当該1行の領域を特別領域Tと判定し、当該特別領域Tや特定領域Tには罫線が無いと判定することができる。
なお、ヘッダー行の次の行が2列の場合、座標求積表のオブジェクトRではないと判定する。
これは、測量点行が2列の座標求積表は存在しないからである。つまり、この場合、オブジェクトは座標求積表以外のオブジェクトであるため、処理対象から除外するか、処理を終了する。
特定領域Tに罫線が有ると判定された場合、セル座標抽出部(罫線有り)143がセル座標の抽出を実行する。
具体的には、オブジェクトR1において、横罫線と縦罫線との交点の座標を、各領域(セル)を特定可能なセル座標の情報として取得する。
図9は、罫線有りの場合のセル座標抽出を示す図である。
例えば、1番上の横罫線のY座標(y1)と2番目の横罫線のY座標(y2)を取得すると共に、1番左の縦罫線のX座標(x1)と2番目の縦罫線のX座標(x2)を取得する。
これにより、1行目・1列目のセルを特定可能な座標として、例えば、当該セルの左上座標(x1,y1)と右下座標(x2,y2)とを抽出できる。
図9は、1行目・1列目のセルを特定可能なセル座標を抽出したことを示す図である。
この処理を繰り返すことでオブジェクトR1のセル座標を抽出することができ、すべてのセルの行列構成を特定することができる。
特定領域Tに罫線が無いと判定された場合、文字行特定手段144が、特別領域Tに配されている文字オブジェクト(文字画像)に基づいて文字行を特定する。
具体的には、図10(a)に示すように、特別領域Tに対するラベリングに基づき、閾値(例えば5%)以下の大きさのオブジェクトを文字オブジェクトとして抽出する。
閾値を5%以下としたのは、実際の座標求積表においては、4列未満のセルは確認されておらず、1つのセルにおいては、横方向に20文字以上配されていることが確認されているので、1文字当たりの横幅が5%を超えることがないからである。
このため、文字オブジェクトの外接矩形の横幅の積算値が閾値以下でない場合(例えば、少なくとも5%超、好ましくは10%以上の場合)に文字行があると認識することができる。
図10(b)には、文字オブジェクトの外接矩形の横幅の積算値を左端部から帯状に表した図を加えている。
この図に示すように、特定領域Tにおける文字行の長さは、フッター領域Fにおける文字行の長さよりも長いのが明らかである。
これは、測量点行には、X座標値、Y座標値の数値文字が配されるほか、辺長や面積の数値文字が配されるのに対し、フッターには、面積などの求積結果の数値文字のみが配されるからである。
したがって、図10(c)に示すように、特別領域Tにおける文字行の長さに基づいて、特別領域Tを特定領域Tとフッター領域Fとに判別することができる(特定領域判定手段)。
このように、特定領域判定手段145は、特別領域Tに配されている文字行の長さに基づいて特定領域Tを判定する。以下、その具体的な処理方法について詳細に説明する。
まず、特別領域Tに配されている文字オブジェクトの外接図形(矩形画像)の幅を積算することで各文字行の長さを求める。
そして、特別領域Tの最端部から複数行における文字行の長さに基づいて特定領域Tを判定する。
具体的には、特別領域Tの最後の行から2~4行における文字行の長さに基づいて特定領域Tとフッター領域Fの判別を行う。5行目を除いたのは、5行以上のフッターは存在しないからである。
例えば、特別領域Tの最後の行から4行目が「短い」場合は、当該4行目がフッター領域Fの行と判定する。
この場合、図11(a)に示すように、特別領域Tの最初の行~最後の行から5行目の行が特定領域Tであり、最後の行から4行目の行~最後の行がフッター領域Fであると判定される。
「短い」か「長い」かは、特別領域Tにおいて、例えば最初から1~3行目の各行の長さの中央値(第1中央値)と、最後から1~3行目の各行の長さの中央値(第2中央値)とを求め、文字行の長さが第2中央値よりも第1中央値に近い場合は「長い」と判定し、文字行の長さが第1中央値よりも第2中央値に近い場合は「短い」と判定する。
1~3行目の中央値を判定基準としたのは、最初の1行目は地番情報(例えば図11(c)に示す「1072」)などの長めの文字オブジェクトが配されることで長くなり易く、最後の1行目は短めの文字オブジェクト(例えば図11(c)に示す「〃」)が配されることで短くなり易いからであり、また、いずれの1行目もノイズが入り易く、その影響を排除するためである。
特別領域Tの最後の行から4行目が「長く」、且つ、3行目が「短い」場合は、図11(b)に示すように、特別領域Tの最初の行~最後の行から4行目の行までが特定領域Tと判定し、特別領域Tの最後の行から3行目の行~最後の行までがフッター領域Fと判定することができる。
罫線無しの場合であっても、図11(c)に示すように、測量点行とフッターとが罫線で区分される場合もある。
このような場合、特別領域Tは特定領域Tのみで構成されるため、文字行の長さに差異は生じにくい。
このような事象を勘案し、例えば、第1中央値と第2中央値との差が小さい場合は、特別領域Tにはフッター領域Fが含まれず、すべて特定領域Tであると判定する。
例えば、第1中央値と第2中央値との比率が1に近い場合(例えば0.75以上の場合)、特別領域Tは特定領域Tと判定する。
具体的には、第1中央値がオブジェクトの横幅に対し23%の長さで、第2中央値がオブジェクトの横幅に対し18%の場合、第1中央値(23%)×0.75=17.25となり、第2中央値(18%)の方が17.25よりも長いので特別領域Tは特定領域Tと判定する。
これにより、図11(c)に示すように、特定領域Tとフッター領域Fとが罫線で区分されている場合、つまり、フッターが含まれない場合の特定領域Tを精度良く判定することができる。
特定領域Tに罫線が無いと判定された場合には、セル座標抽出部(罫線無し)146は、特定領域Tに罫線が仮想的にあるものとみなして仮想的なセルのセル座標を抽出する。
具体的には、図12(a)に示すように、縦罫線はヘッダー行の縦罫線の延長線を仮想縦罫線として設定し、横罫線は、図12(b)に示すように、文字行と文字行との中間点に基づく仮想横罫線を設定する。
そして、横罫線と縦罫線との交点の座標を、仮想的な各領域(セル)を特定可能なセル座標の情報として取得する。
例えば、1番上の横罫線のY座標(y1)と2番目の横罫線のY座標(y2)を取得すると共に、1番左の縦罫線のX座標(x1)と2番目の縦罫線のX座標(x2)を取得する。
これにより、1行目・1列目の仮想セルを特定可能な座標として、例えば、当該仮想セルの左上座標(x1,y1)と右下座標(x2,y2)とを抽出できる。
この処理を繰り返すことでオブジェクトR2の仮想セル座標を抽出することができ、すべての仮想セルの行列構成を特定することができる。
ヘッダーOCR処理部150は、ヘッダー文字検出手段151と、座標列特定手段152と、を備える(図5参照)。
ヘッダー文字検出手段151は、ヘッダー行において特定文字の検出を行う。
座標列特定手段152は、ヘッダー行において特定文字が検出されたことに基づき特定領域における座標列を特定する。
具体的には、ヘッダー行に対してOCR処理を実行することで、ヘッダー行に配されている文字オブジェクトから文字情報を読み取る。
そして、文字情報として文字「X」が配されたセル(仮想セルを含む)のうち、最初(最左)のセルを「X座標列」と判定する。
また、X座標列の次(右側)のセルを「Y座標列」と判定する。
これにより、図13(a)に示すように文字「X」が2列目にある場合、図13(b)に示すように3列目にある場合、図13(c)に示すように4列目にある場合のいずれについても対応して「X座標列」及び「Y座標列」を特定することができる。
なお、特定文字は、文字「X」に限るものではなく、他の文字を特定文字とすることもできる。
例えば、特定文字を文字「Y」とし、文字「Y」が配された最初のセルを「Y座標列」として抽出し、そのセルの前(左側)のセルを「X座標列」と判定してもよい。
セルOCR処理部160は、情報取得手段161を備える(図5参照)。
情報取得手段161は、オブジェクトの表の構成に基づき地積測量図に含まれる座標求積表の情報を取得する。
具体的には、情報取得手段161は、情報取得手段と特定領域Tに罫線が有ると判定された場合、当該罫線により区分された情報に基づいて座標求積表の情報を取得し、特定領域Tに罫線が無いと判定された場合、特定領域Tに配されている画像に基づき区分された情報に基づいて座標求積表の情報を取得する。
すなわち、ヘッダーOCR処理部150により判定されたX座標列及びY座標列のセル(仮想セルを含む)に対しOCR処理を実行することで、X座標列及びY座標列の各セルに配されている文字オブジェクトから文字情報を読み取ってX座標値及びY座標値を取得する。
例えば、図14(a)に示す座標求積表(罫線有り)のオブジェクトR1については、特定領域TのX座標列及びY座標列の文字情報を読み取ることで、第1行のX座標値及びY座標値として「-168557.745」及び「-40513.833」を取得し、第2行のX座標値及びY座標値として「-168568.941」及び「-40504.243」を取得し、第3行のX座標値及びY座標値として「-168567.073」及び「-40501.322」を取得し、第4行のX座標値及びY座標値として「-168554.995」及び「-40510.059」を取得することができる。
また、図14(b)に示す座標求積表(罫線無し)のオブジェクトR2については、特定領域TのX座標列及びY座標列の文字情報を読み取ることで、第1行のX座標値及びY座標値として「-75134.133」及び「-37730.320」を取得し、第2行のX座標値及びY座標値として「-75138.911」及び「-37732.736」を取得し、第3行のX座標値及びY座標値として「-75144.856」及び「-37718.389」を取得し、第4行のX座標値及びY座標値として「-75137.105」及び「-37717.455」を取得することができる。
これにより、図14(a)に示すオブジェクトR1を含む地積測量図からは、図15(a)に示す座標求積表の測量情報を出力することができ、図14(b)に示すオブジェクトR2を含む地積測量図からは、図15(b)に示す座標求積表の測量情報を出力することができる。
出力態様としては、取得した座標求積表の情報をストレージ13等に出力して記憶・保存したり、表示装置15に出力して表示させることができる。
なお、辺長や面積(測量点行及びフッターの面積)は、X座標値及びY座標値に基づき算出して取得したり、出力することができる。
次に、座標求積表の取得方法について図16~図19を参照しながら説明する。
図16は、座標求積表の取得方法の全体の流れを示すフローチャートである。
図17は、表判定方法を示すフローチャートである。
図18は、特定領域(罫線有り)の処理方法を示すフローチャートである。
図19は、特定領域(罫線無し)の処理方法を示すフローチャートである。
図16に示すように、まず、地積測量図の画像を取得する(S1)。
具体的には、通信装置16等を介して地積測量図の画像を取得したり、取得した地積測量図の画像を記憶手段100に記憶することにより取得する。
次に、前処理を実行する(S2)。
具体的には、前処理部110が地積測量図の画像情報に対し二値化及び白黒反転を実行する。
次に、オブジェクトを抽出する(S3)。
具体的には、オブジェクト抽出手段120が、地積測量図の中から所定の大きさのオブジェクトを座標求積表の可能性のあるオブジェクトとして取得する。
次に、罫線を抽出する(S4)。
具体的には、罫線抽出手段130がオブジェクトから罫線を抽出する。
次に、表判定を実行する(S5)。
具体的には、表判定手段140が罫線に基づいて表の構成を判定する。
図17に示すように、表判定では、まず、行列特定手段141が、セルの行列を特定する(S21)。
次に、ヘッダー行特定手段142が、列数が最初に最大となる行で、かつ、3列以上の行をヘッダー行と特定する(S22)。
次に、ヘッダー行の次の行が1列又は3列以上であることを判定する(S23)。
S23において、3列以上の場合(S23-3列以上)、特定領域Tに罫線が有ると判定する(S24)。
ただし、表の行数が6行未満の場合、その表のオブジェクトは座標求積表ではないとして除外する(S25)が、それ以外は、特定領域(罫線有り)の処理を実行する(S26)。
図18に示すように、特定領域(罫線有り)の処理は、ヘッダー行の次以降で、ヘッダー行と同じ列数の行を特定領域Tと特定する(S31)。
ただし、特定領域Tの行が3行未満の場合、座標求積表ではないとしてそのオブジェクトは除外する(S32)。
次に、特定領域Tの列数よりも列数が少ない行をフッターと判定する(S33)。
ただし、フッターの行が2行未満の場合、座標求積表ではないとしてそのオブジェクトは除外する(S34)。
この結果、座標求積表(罫線有り)のオブジェクトR1から特定領域Tが特定される。
S23において、1列の場合(S23-1列)、特定領域Tに罫線が無いと判定する(S27)。
ただし、表の行数が2行未満の場合、その表のオブジェクトは座標求積表ではないとしてオブジェクトを除外する(S28)が、それ以外は、特定領域(罫線無し)の処理を実行する(S29)。
図19に示すように、特定領域(罫線無し)の処理は、ヘッダー行の次の1行(特別領域T)内における文字オブジェクトを抽出し(S41)、当該文字オブジェクトの横幅を積算して文字行の長さを算出し(S42)、当該文字行の長さに基づいて特定領域Tを特定する(S43)。
なお、特定領域(罫線無し)の処理においても、特定領域(罫線有り)の処理(S32、S34参照)と同様、特定領域Tやフッターの行数が少ない場合に、そのオブジェクトを除外することができる。
この結果、座標求積表(罫線無し)のオブジェクトR2から特定領域Tが特定される。
図16に戻り、次に、特定領域Tにおける罫線の有無に応じたセル座標抽出を実行する(S6~S8)。
罫線が有る場合(S6-有)、セル座標抽出(罫線有り)を実行し(S7)、罫線が無い場合(S6-無)、セル座標抽出(罫線無し)を実行する(S8)。
セル座標抽出(罫線有り)は、罫線の交点に対応するセル座標を抽出する。これにより、各セルの行列を特定する。
セル座標抽出(罫線無し)は、仮想的罫線の交点に対応する仮想セル座標を抽出する。これにより、各仮想セルの行列を特定する。
次に、ヘッダーOCR処理部150は、ヘッダー行に対しOCR処理を実行する(S9)。
これにより、特定領域TにおけるX座標列とY座標列とを特定する。
次に、セルOCR処理部160は、特定領域TのX座標列及びY座標列のセルに対しOCR処理を実行する(S10)。
これにより、座標求積表の情報として、X座標値及びY座標値を取得することができる。
そして、結果出力を実行する(S11)。
具体的には、取得した座標求積表の情報をストレージ13等に出力して記憶・保存したり、表示装置15に出力して表示させることができる。
以上のように、本発明の情報処理装置10においては、地積測量図の画像情報を記憶する記憶手段100と、前記画像情報からオブジェクトを抽出するオブジェクト抽出手段120と、前記オブジェクトから罫線を抽出する罫線抽出手段130と、前記オブジェクトにおける表の構成を判定する表判定手段140と、前記表の構成に基づき前記地積測量図に含まれる座標求積表の情報を取得する情報取得手段161と、を備え、表判定手段140は、前記オブジェクトの特定領域Tに罫線が有るか否かを判定し、情報取得手段161は、特定領域Tに罫線が有ると判定された場合、当該罫線により区分された情報に基づいて前記座標求積表の情報を取得し、特定領域Tに罫線が無いと判定された場合、特定領域Tに配されている画像に基づき区分された情報に基づいて前記座標求積表の情報を取得する構成としている。
具体的には、本発明の情報処理装置10は、ヘッダー行において特定文字を検出するヘッダー文字検出手段151と、ヘッダー行において特定文字が検出されたことに基づき特定領域Tの座標列を特定する座標列特定手段152とを有するヘッダーOCR処理部150を備え、情報取得手段161は、前記座標列の情報に基づき座標求積表の情報を取得するようにしている。
このような構成の情報処理装置10によれば、地積測量図から座標求積表を高精度に取得することができる。
例えば、図2(a)や(b)に示すように測量点行の情報が罫線で区分されている場合や区分されていない場合でも、これらの表の特徴を認識して情報を正確に取得するようにしている。
また、測量点行の情報が罫線で区分されていない場合、測量点行とフッターとが同じセル内に配置していることが多いが(図2(b))、測量点行及びフッターにおける文字行の長さの違いから測量点行(特定領域T)を特定することで、座標求積表の情報を高精度に取得できるようにしている。
また、図2及び図3に示すようにフッターの行数が異なる場合、図3(a)に示すようにフッターが複数のセルに亘って構成される場合、図3(b)に示すように測量点行とセルが同じセル内に配されずに分かれて構成される場合があるが、本発明によれば、このような表の構成の違いにも対応して正確に座標求積表の情報を取得できる。
また、座標求積表の大きさは、オブジェクトの中でも中程度であることに着目し、比較的大きいオブジェクトや小さいオブジェクト、行数や列数が少ないものを除外している。
また、フッターが無いものは座標求積表ではないため除外するようにしている。
例えば、図20(a)、(b)に示す「基準点等の名称及び座標値」は、表の大きさが小さく、フッターがないことを理由に除外され、図20(c)に示す「地番リスト」は、ヘッダー行、特定領域T、フッターを特定することができないことを理由に除外され、図20(d)、(e)に示す「境界標等の凡例」や図20(f)、(g)に示す「その他」は、表の大きさが小さく、行数が少ないことを理由に除外される。
以上のように、本発明によれば、地積測量図から座標求積表の可能性の高いオブジェクトを抽出したうえで上述の座標求積表の取得処理を実行することから、表の構成や行列数のパターンの違いがあったとしてもこれに対応して座標求積表の情報を高精度に取得することができる。
以上、本発明の情報処理装置、プログラム、及び情報処理方法について、好ましい実施形態を示して説明したが、本発明は、前述した実施形態にのみ限定されるものではなく、本発明の範囲で種々の変更実施が可能であることは言うまでもない。
例えば、図21は、フッターの列数がヘッダー行の列数と同じである座標求積表(罫線有り)の特種な例であり、上述の情報処理装置10によれば、ヘッダー行の列数と同じ列数の行を特定領域Tと特定して情報を取得するため、フッターの情報を測量点行の情報と誤って取得するという問題が生じる。
このような問題に鑑み、罫線有りの場合でも、罫線無しの場合と同様の処理を重ねて実行することでフッター領域Fを除く領域を特定領域Tとして特定できるため、当該特定した特定領域Tの情報に基づいて、座標求積表の情報を間違いなく取得することができる。
本発明は、地積測量図からの座標求積表を自動的に取得・出力する場合に好適に利用可能である。
10 情報処理装置
100 記憶手段
110 前処理部
120 オブジェクト抽出手段
130 罫線抽出手段
140 表判定手段
141 行列特定手段
142 ヘッダー行特定手段
143 セル座標抽出部(罫線有り)
144 文字行特定手段
145 特定領域判定手段
146 セル座標抽出部(罫線無し)
150 ヘッダーOCR処理部
151 ヘッダー文字検出手段
152 座標列特定手段
160 セルOCR処理部
161 情報取得手段
R 座標求積表のオブジェクト
R1 座標求積表(罫線有り)のオブジェクト
R2 座標求積表(罫線無し)のオブジェクト
T 特定領域
特別領域
F フッター領域
上記目的を達成するため本発明の情報処理装置は、地積測量図の画像情報を記憶する記憶手段と、前記画像情報からオブジェクトを抽出するオブジェクト抽出手段と、前記オブジェクトから罫線を抽出する罫線抽出手段と、前記オブジェクトにおける表の構成を判定する表判定手段と、前記表の構成に基づき前記地積測量図に含まれる座標求積表の情報を取得する情報取得手段と、を備え、前記表判定手段は、前記オブジェクトの特定領域に前記罫線が有るか否かを判定し、前記情報取得手段は、前記特定領域に罫線が有ると判定された場合、当該罫線により区分された情報に基づいて前記座標求積表の情報を取得し、前記特定領域に罫線が無いと判定された場合、前記特定領域に配されている画像に基づき区分された情報に基づいて前記座標求積表の情報を取得し、前記特定領域に罫線が無いと判定された場合、前記特定領域を含む特別領域に配されている文字画像に基づいて前記特定領域を判定する特定領域判定手段と、前記特別領域に配されている文字画像に基づいて文字行を特定する文字行特定手段と、を備え、前記特定領域判定手段は、前記特別領域の最端部の行から複数行における文字行の長さに基づいて前記特定領域を判定する構成としてある。
また、本発明は、上記のような情報処理装置において実行されるプログラムや情報処理方法として構成することもできる。

Claims (9)

  1. 地積測量図の画像情報を記憶する記憶手段と、
    前記画像情報からオブジェクトを抽出するオブジェクト抽出手段と、
    前記オブジェクトから罫線を抽出する罫線抽出手段と、
    前記オブジェクトにおける表の構成を判定する表判定手段と、
    前記表の構成に基づき前記地積測量図に含まれる座標求積表の情報を取得する情報取得手段と、を備え、
    前記表判定手段は、
    前記オブジェクトの特定領域に前記罫線が有るか否かを判定し、
    前記情報取得手段は、
    前記特定領域に罫線が有ると判定された場合、当該罫線により区分された情報に基づいて前記座標求積表の情報を取得し、
    前記特定領域に罫線が無いと判定された場合、前記特定領域に配されている画像に基づき区分された情報に基づいて前記座標求積表の情報を取得する
    ことを特徴とする情報処理装置。
  2. 前記特定領域に罫線が無いと判定された場合、前記特定領域を含む特別領域に配されている文字画像に基づいて前記特定領域を判定する特定領域判定手段を備えた
    ことを特徴とする請求項1に記載の情報処理装置。
  3. 前記特別領域に配されている文字画像に基づいて文字行を特定する文字行特定手段を備え、
    前記特定領域判定手段は、
    前記特別領域の最端部の行から複数行における文字行の長さに基づいて前記特定領域を判定する
    ことを特徴とする請求項2に記載の情報処理装置。
  4. 前記文字行の長さは、前記特別領域に配されている文字画像の外接図形の横幅を積算して求める
    ことを特徴とする請求項3に記載の情報処理装置。
  5. 前記オブジェクトにおける表の行列を特定する行列特定手段と、
    前記行列のうち、列数が最大である最初の行をヘッダー行と特定するヘッダー行特定手段と、を備え、
    前記表判定手段は、
    前記ヘッダー行の次に、前記ヘッダー行の列数と同じ列数の行がある場合、当該行からなる前記特定領域に罫線が有ると判定し、
    前記ヘッダー行の次に、1列の行が1行ある場合、当該1行からなる前記特定領域に罫線が無いと判定する
    ことを特徴とする請求項1~4のいずれか1項に記載の情報処理装置。
  6. 前記ヘッダー行において特定文字を検出するヘッダー文字検出手段と、
    前記ヘッダー行において特定文字が検出されたことに基づき前記特定領域の座標列を特定する座標列特定手段と、を備え、
    前記情報取得手段は、
    前記座標列の情報に基づき前記座標求積表の情報を取得する
    ことを特徴とする請求項5に記載の情報処理装置。
  7. 前記オブジェクト抽出手段は、
    特定の大きさのオブジェクトを前記座標求積表の可能性のあるオブジェクトとして抽出する
    ことを特徴とする請求項1~6のいずれか1項に記載の情報処理装置。
  8. 情報処理装置のコンピュータを、
    地積測量図の画像情報を記憶する記憶手段、
    前記画像情報からオブジェクトを抽出するオブジェクト抽出手段、
    前記オブジェクトから罫線を抽出する罫線抽出手段、
    前記オブジェクトにおける表の構成を判定する表判定手段、
    前記表の構成に基づき前記地積測量図に含まれる座標求積表の情報を取得する情報取得手段、として機能させ、
    前記表判定手段は、
    前記オブジェクトの特定領域に前記罫線が有るか否かを判定し、
    前記情報取得手段は、
    前記特定領域に罫線が有ると判定された場合、当該罫線により区分された情報に基づいて前記座標求積表の情報を取得し、
    前記特定領域に罫線が無いと判定された場合、前記特定領域に配されている画像に基づき区分された情報に基づいて前記座標求積表の情報を取得する
    ことを特徴とするプログラム。
  9. 地積測量図の画像情報を記憶するステップと、
    前記画像情報からオブジェクトを抽出するステップと、
    前記オブジェクトから罫線を抽出するステップと、
    前記オブジェクトにおける表の構成を判定するステップと、
    前記表の構成に基づき前記地積測量図に含まれる座標求積表の情報を取得するステップと、を有し、
    前記表を判定するステップは、
    前記オブジェクトの特定領域に前記罫線が有るか否かを判定し、
    前記座標求積表の情報を取得するステップは、
    前記特定領域に罫線が有ると判定された場合、当該罫線により区分された情報に基づいて前記座標求積表の情報を取得し、
    前記特定領域に罫線が無いと判定された場合、前記特定領域に配されている画像に基づき区分された情報に基づいて前記座標求積表の情報を取得する
    ことを特徴とする情報処理方法。
JP2021143550A 2021-09-02 2021-09-02 情報処理装置、プログラム、及び情報処理方法 Active JP7043667B1 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2021143550A JP7043667B1 (ja) 2021-09-02 2021-09-02 情報処理装置、プログラム、及び情報処理方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2021143550A JP7043667B1 (ja) 2021-09-02 2021-09-02 情報処理装置、プログラム、及び情報処理方法

Publications (2)

Publication Number Publication Date
JP7043667B1 JP7043667B1 (ja) 2022-03-29
JP2023036478A true JP2023036478A (ja) 2023-03-14

Family

ID=81215096

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2021143550A Active JP7043667B1 (ja) 2021-09-02 2021-09-02 情報処理装置、プログラム、及び情報処理方法

Country Status (1)

Country Link
JP (1) JP7043667B1 (ja)

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2017084012A (ja) * 2015-10-26 2017-05-18 シャープ株式会社 変換処理装置、それを備えた情報処理装置、プログラム、及び記録媒体
JP2021028794A (ja) * 2019-08-09 2021-02-25 株式会社パスコ 求積表判定装置、及び制御プログラム
WO2021084702A1 (ja) * 2019-10-31 2021-05-06 楽天株式会社 文書画像解析装置、文書画像解析方法およびプログラム

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2017084012A (ja) * 2015-10-26 2017-05-18 シャープ株式会社 変換処理装置、それを備えた情報処理装置、プログラム、及び記録媒体
JP2021028794A (ja) * 2019-08-09 2021-02-25 株式会社パスコ 求積表判定装置、及び制御プログラム
WO2021084702A1 (ja) * 2019-10-31 2021-05-06 楽天株式会社 文書画像解析装置、文書画像解析方法およびプログラム

Also Published As

Publication number Publication date
JP7043667B1 (ja) 2022-03-29

Similar Documents

Publication Publication Date Title
WO2020140698A1 (zh) 表格数据的获取方法、装置和服务器
RU2412482C2 (ru) Способ, система, цифровая фотокамера и сис, обеспечивающие геометрическое преобразование изображения на основании поиска текстовых строк
US9311533B2 (en) Device and method for detecting the presence of a logo in a picture
JP4694613B2 (ja) 原稿方向判定装置、原稿方向判定方法、プログラムおよびその記録媒体
JPH11219407A (ja) 文書画像認識装置および文書画像認識プログラムの記憶媒体
CN111144400B (zh) 身份证信息的识别方法、装置、终端设备及存储介质
JP2011192274A (ja) フォームテンプレートを定義する方法及び装置
US20100111419A1 (en) Image display device, image display method, and computer readable medium
JP2001307014A (ja) 二次元コード抽出方法
CN115619656A (zh) 数字化档案纠偏矫正方法及系统
JPH0721310A (ja) 文書認識装置
CN111626145A (zh) 一种简捷有效的残缺表格识别及跨页拼接方法
JP3471578B2 (ja) 行方向判定装置、画像傾き検出装置及び画像傾き補正装置
JP2013171309A (ja) 文字切り出し方法、およびこの方法を用いた文字認識装置およびプログラム
JP2000112599A (ja) 文書画像処理装置及び文書画像処理方法
JP2008234291A (ja) 文字認識装置及び文字認識方法
CN112036232A (zh) 一种图像表格结构识别方法、系统、终端以及存储介质
JP2023036478A (ja) 情報処理装置、プログラム、及び情報処理方法
CN100456317C (zh) 行方向判定方法以及装置
CN114529922A (zh) 一种无线框表格图像表格结构识别方法
CN112800824A (zh) 扫描文件的处理方法、装置、设备及存储介质
JPH06187489A (ja) 文字認識装置
JP2013065164A (ja) 画像処理装置、画像処理方法および画像処理プログラム
US11244190B1 (en) System and method for patterned artifact removal for bitonal images
JP2586117B2 (ja) 文字認識装置

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20210902

A871 Explanation of circumstances concerning accelerated examination

Free format text: JAPANESE INTERMEDIATE CODE: A871

Effective date: 20210902

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20211130

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20211207

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20220315

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20220316

R150 Certificate of patent or registration of utility model

Ref document number: 7043667

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150