JP2005190439A - 情報処理装置、情報処理方法、プログラム及び記録媒体 - Google Patents

情報処理装置、情報処理方法、プログラム及び記録媒体 Download PDF

Info

Publication number
JP2005190439A
JP2005190439A JP2003434686A JP2003434686A JP2005190439A JP 2005190439 A JP2005190439 A JP 2005190439A JP 2003434686 A JP2003434686 A JP 2003434686A JP 2003434686 A JP2003434686 A JP 2003434686A JP 2005190439 A JP2005190439 A JP 2005190439A
Authority
JP
Japan
Prior art keywords
line segment
vertical line
vertical
ruled
information processing
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2003434686A
Other languages
English (en)
Other versions
JP4263089B2 (ja
Inventor
Yoshihiro Naito
喜博 内藤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Marketing Japan Inc
Original Assignee
Canon Marketing Japan Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Marketing Japan Inc filed Critical Canon Marketing Japan Inc
Priority to JP2003434686A priority Critical patent/JP4263089B2/ja
Publication of JP2005190439A publication Critical patent/JP2005190439A/ja
Application granted granted Critical
Publication of JP4263089B2 publication Critical patent/JP4263089B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Landscapes

  • Processing Or Creating Images (AREA)
  • Image Analysis (AREA)

Abstract

【課題】 罫線で区切られる画像データ内の任意の領域を正確且つ容易に選択することを可能とする。
【解決手段】 罫線を含む画像データから前記罫線の垂直線分又は水平線分を識別し、識別した垂直線分又は水平線分に基づいて、当該垂直線分又は当該水平線分によって区分される画像データ内の各領域を指定する領域指定情報を生成する。
【選択図】 図4

Description

本発明は、例えば電子帳票システムに適用可能な情報処理装置、情報処理方法、プログラム及び記録媒体に関するものである。
電子帳票システムにおいて、電子帳票における所定の領域に対して検索を実行するためには、電子帳票における明細データ領域上の1または複数の列を矩形領域として指定し、当該矩形領域に対して適用する検索式を指定することで検索を実行する必要がある。ところで、複数の列を検索の対象としたい場合は、検索対象となる複数の矩形領域を指定する必要があるが、通常、明細データ領域が行列を成していることから、検索対象となる全ての矩形領域の上辺と下辺は、電子帳票における明細データ領域の上辺と下辺付近と同じ垂直座標となる。
そこで、従来の電子帳票システムでは、このように複数の矩形領域を指定する操作を簡略化するため、図21に示すように、各列共通の上辺と下辺の垂直座標を指定するために2つの表示上のオブジェクト「上限ルーラ211a」および「下限ルーラ211a」、各列の左辺と右辺の水平座標を指定するためのオブジェクト「列位置指定ルーラ212」を設けていた。
ここで、上限ルーラ211a及び下限ルーラ211bは、表示画面上の左端付近に位置し、電子帳票を表示した初期状態では、適当な位置に配置されるが、利用者がポインティングデバイスなどを使用して、それぞれ画面上を上下に移動させて位置を決定する。一方、列位置指定ルーラ212は、表示画面上の上端付近に位置し、電子帳票を表示した初期状態では、所定の数のルーラ(例えば、図21のように3つ)が、適当な幅で、適当な位置に配置される。
利用者は、図22に示すように、それぞれのルーラをポインティングデバイスなどにより、左右に移動させ(図22(a)、(b))、左端、右端の位置を調整することで(図22(c))幅の変更を行う。また、列位置指定ルーラは、ボタンの様に有効/無効(ON/OFF)を切り替えることができ、これを有効(ON)にした場合に(図22(d))、その要素の左端部を左辺、右端部を右辺、および上下限ルーラの位置を上辺、下辺とした矩形領域を指定したことになる。このようにして、明細上データ領域上の列を、比較的容易に指定できるようになっている。
しかし、上述したような検索矩形領域の指定方法では、利用者が正確な領域を指定するために「上限ルーラ」、「下限ルーラ」及び「列位置指定ルーラ」の3つのオブジェクトの配置を調整するために、画像表示装置上のピクセルサイズに相当する位置精度が必要であった。従って、図23に示すように、利用者が実際に指定したい領域と帳票上に実際に列が配置される領域とに、ある程度の誤差が生じてしまうという問題があった。
この誤差が大きくなると、例えば、表示されている範囲においては、上記領域指定により矩形領域内に目的とする列のテキストが全て含まれているとしても、表示されていない範囲又はページが複数存在する場合、指定領域の右辺を超えて該当列にテキストが印字されている可能性が高くなる。
このように指定領域の範囲から漏れたテキスト部分は、本来であれば検索条件式と一致すべきものであっても、指定領域範囲外であるため検索不一致と判定されることとなる。また、印字テキストが密に並ぶ帳票であればあるほど高い領域指定の精度が必要になるため、正しい検索結果が得られないという問題が発生する危険性が増大することになる。ところで、明細データの列の指定は、その電子帳票がフォームによる罫線を持つ書式の場合、その罫線に合わせて領域を指定することが望ましい。
何故なら、電子帳票は、通常、可読性が失われることを避けるために、各列に印字されるテキストが、区切り線となる罫線を超えて印字されたり重なって印字されたりすることがないようにデザインされているからである。特に、明細データ上の各列を区切る垂直方向の罫線を持つ帳票の場合、検索対象領域の左辺と右辺を正確にその罫線に合わせる事で、表示画面上に表示されていないテキストを含めて正確な検索結果を期待することができる。
一方、水平方向の罫線により、各行や列の見出部分を分離する書式の帳票があるが、検索対象領域の上辺や下辺をそのような罫線に正確に合わせることは、垂直方向の罫線に左辺、右辺を一致させるほどの意味は持たない。これは、通常、同じ列に配置されるテキストの高さは統一されていることと、仮に不統一であっても、列のテキストの高さは、文字列の幅ほどの偏差を持たないからである。従って、検索矩形領域指定を適切に行うためには、電子帳票の垂直罫線を抽出し、当該垂直罫線に基づいて矩形領域を指定すればよい。なお、電子帳票は、ベクタ形式のデータの集合によりデザインされているため、垂直罫線を抽出するためには、ベクタ形式のデータの中から垂直線分を有するものを識別する必要がある。
ところで、罫線を抽出する技術として、あらかじめ罫線構造が予測できない一般の文書画像から、罫線を正しく抽出する技術が特許文献1に、任意の画像に含まれる様々な形態のパターンを効率よく処理し、より正確に罫線を抽出すること技術が特許文献2に開示されている。
特開平10−232939号公報 特開平10−240959号公報
しかしながら、上記の両技術は、入力画像に基づいて罫線を抽出する技術であるため、ベクタ形式のデータに基づいて罫線を抽出する技術を提供するものではない。
従って、本発明は、罫線で区切られる画像データ内の任意の領域を正確且つ容易に選択することを可能とする情報処理装置、情報処理方法、プログラム及び記録媒体を提供することを目的とする。
斯かる目的を達成するために、本発明の情報処理装置は、罫線を含む画像データから前記罫線の垂直線分又は水平線分を識別する罫線識別手段と、前記罫線識別手段によって識別された垂直線分又は水平線分に基づいて、当該垂直線分又は当該水平線分によって区分される前記画像データ内の各領域を指定する領域指定情報を生成する領域指定情報生成手段とを有することを特徴とする。
本発明の情報処理方法は、情報処理装置による情報処理方法であって、罫線を含む画像データから前記罫線の垂直線分又は水平線分を識別する罫線識別ステップと、前記罫線識別ステップによって識別された垂直線分又は水平線分に基づいて、当該垂直線分又は当該水平線分によって区分される前記画像データ内の各領域を指定する領域指定情報を生成する領域指定情報生成ステップとを含むことを特徴とする。
本発明のプログラムは、前記情報処理方法をコンピュータに実行させることを特徴とする。本発明のコンピュータ読み取り可能な記録媒体は、前記プログラムを記録したことを特徴とする。
本発明によれば、罫線を含む画像データから罫線の垂直線分又は水平線分を識別し、識別された垂直線分又は水平線分に基づいて、それらによって区分される画像データ内の各領域を指定する領域指定情報を生成するように構成したので、ユーザは、領域指定情報を利用することにより罫線で区切られる画像データ内の任意の領域を正確且つ容易に選択することが可能となる。
以下、本発明を適用した好適な実施形態を、添付図面を参照しながら詳細に説明する。
図1は、本発明の一実施形態に係る電子帳票システムの構成を示す図である。本実施形態に係る電子帳票システムは、電子帳票を参照するための複数の利用者端末13(図1では、一つの利用者端末のみを表記)と、帳票データの集中管理を行なう電子帳票サーバ12とをLAN等のネットワークによって接続されることにより構築される。
個々の利用者端末13は、電子帳票の参照および検索を行なうビューアを有している。ビューアは、図1の構成のうち、帳票画像再現部132、検索領域入力部134、検索式入力部135、検索結果表示部133により構成される。電子帳票サーバ12は、印字用データ記憶部122、帳票データ変換部123、帳票データ記憶部124、検索実行部125を備える。利用者端末13及び電子帳票サーバ12は、LAN等のネットワークを介して通信を行なうため、前記構成以外にもそれぞれに通信部131、121、126を備える。
ここで、電子帳票サーバ12における各構成について説明する。電子帳票サーバ12は、印字用データ記憶部122において、ホストコンピュータなど外部のコンピュータシステム11が作成した印字用データを記憶する。帳票データ変換部124は、印字用データ記憶部122に記憶されている印刷用データをシステム固有の帳票データに変換する。
帳票データ記憶部124は、利用者端末の表示装置上に帳票の印刷画像を再現するために必要な帳票データを格納する。なお、印字用データ記憶部122及び帳票データ記憶部124は、ハードディスク等の記憶媒体内の一部の記憶領域に相当する構成である。検索実行部125は、利用者端末13から入力された検索領域および検索式に従い帳票データ記憶部124に格納されている帳票データを検索し、検索結果を出力する。
次に、利用者端末13の構成について説明する。帳票画像再現部132は、帳票データを入力し表示装置136上に帳票の印刷画像を再現させる。検索領域入力部134は、利用者が表示装置135上に再現された帳票画像から選択された検索の対象としたい領域を入力する。検索式入力部135は、利用者が検索の対象とした領域から目的の印字テキストを得る。検索結果表示部133は、検索結果を表示装置136上に一覧表示させる。
図2は、本実施形態における電子帳票サーバ12及び利用者端末13のハードウェア構成を示す図である。
電子帳票サーバ12及び利用者端末13は、CPU21、RAM(メモリ)22、ROM23、ハードディスクドライブ(HDD)24、記録媒体ドライブ25、ネットワークインタフェースカード(NIC)29、ポインティングデバイス(PD)28、キーボード(K/B)27、ビデオアダプタ26を備え、これらがシステムバスを介して互いに接続されている。
CPU21は、オペレーションシステム(OS)のプログラムやアプリケーションプログラムに基づいて四則演算や比較演算等の各種の演算及びハードウェアの制御を行うものである。
RAM22は、ハードディスクドライブ(HDD)24、ROM23、記録媒体(例えば、CD−ROM,DVD,FD)等の記憶装置に記録されているOSやアプリケーションプログラム等を一時的に記憶するものであり、これらRAM22に記憶されたプログラムはCPU21の制御の下に実行される。
ROM23には、OSと協働して外部記憶装置等への入出力を司るいわゆるBIOS等が記憶される。ハードディスクドライブ(HDD)24には、OS、情報処理方法を実行するためのプログラム等が記憶されている。
記録媒体ドライブ25は、CD−ROM、DVD−ROM、CD−R等の記録媒体に記録されているアプリケーションプログラム等からのデータ読み取り等に用いる。
ネットワークインタフェースカード(NIC)29は、CPU21によって制御されるOSの通信プログラムと協働してネットワークを介した外部との通信を行う。
キーボード(K/B)27やポインティングデバイス(例えばマウス)28は、情報処理装置への指示を入力するために用いられる。ビデオアダプタ26は、画像表示装置に表示する画像を形成するために用いられる。
なお、図1における帳票データ変換部123、検索実行部125、帳票画像再現部132、検索結果表示部133、検索領域入力部134及び検索式入力部135は夫々、HDD23、ROM23、他の記録媒体等から必要に応じてプログラムがRAM22にロードされ、CPU21によって実行される機能的構成である。印字用データ記憶部122は、帳票サーバ122のHDD24等の記録媒体に相当する構成である。尚、この記録媒体は、電子帳票サーバ12の外部に接続した構成としてもよい。また、通信部121、126、131は、NICに相当する構成である。
図3は、本実施形態に係る垂直罫線選択処理において利用される検索対象矩形領域の指定手順を示すフローチャートである。
マウス等のポインティングデバイス28を通じて利用者により、利用者端末13の表示装置136上に表示されている「上限ルーラ(図4の42a)」及び「下限ルーラ(図4の42b)」の位置が指定される(ステップS31)。利用者端末13は、垂直罫線選択処理実行の指示を検知することにより、図4に示す列位置指定ルーラ41a〜41cを帳票の垂直罫線に一致するように配置する(ステップS32)。
具体的には、上限ルーラ42a及び下限ルーラ42bによって指定された上限位置および下限位置の双方と交差する(貫く)連続した垂直の罫線(罫線上端が上限ルーラ41aより上位にあり、かつ罫線下端が下限ルーラ41bより下位に位置するような垂直罫線)の水平位置を各列の区切り位置とした状態にする(なお、本処理は後に詳述する)。そして、利用者の指示により、目的とする列に配置されている列位置指定ルーラ41a〜41cをON状態にすることで、検索対象領域に指定する(ステップS33)。なお、図4の例では、各列位置指定ルーラ41a〜41cは全てON状態となっているが、利用者により指示される前は、全ての位置指定ルーラ41a〜41cはOFF状態である。
次に、図5を参照しながら、利用者端末のビューアによって実行される垂直罫線選択処理の流れを説明する。なお、図5において情報の読み書きを行なう対象は、特に指定しない限りHDDなどの外部記憶媒体、メモリの何れでも構わない。実際は、この機能が呼び出される際には、次の情報がメモリ上に置かれている。
・フォームを描画するためのベクタ命令の列
・図3のステップS31で指定された上限、下限の位置(垂直座標)
・現在の列位置指定ルーラの配置(水平位置、幅を個数分)
本処理は、利用者による垂直罫線選択処理実行の指示を検知したとき開始される。電子帳票システムの入力情報となる印刷用データにおいて、罫線の情報はフォームの一部としてフォーム定義に含まれ、一般にベクタ形式と呼ばれる図形描画命令で表現されているが、ステップS51では、主記憶上に置かれているフォーム描画のためのベクタ命令の列から(次の)1レコードを読み取る。
なお、ベクタ命令とは、罫線のような直線や多角形、円などの幾何学図形を、その種類を表す符号と、極点の座標や半径などのパラメータ列により表現するものである。そのため、図形を点(ラスタ)の集合として表現するラスタ形式と比べ一般的に少ない情報量で幾何学図形を表現することができ、出力デバイスの解像度に対する依存性が低いという特性を有する。
また、電子帳票システムにおいては、画像再現の効率を考慮して、フォームを印刷用データ(元データ)そのままのベクタ形式ではなく、例えば、「Windows(R)メタファイル」と呼ばれるマイクロソフト社製のWindows(R)専用のベクタ形式に変換して帳票データとして保存することもあるが、その他一般のベクタ命令(標準化されているベクタ命令としては、SVG(スケーラブル・ベクタ・グラフィック)などが挙げられる。)であっても本発明に適用できることはいうまでもない。
ここで、ベクタ命令を図6を用いて簡単に説明するが、Windows(R)メタファイルなど特定のベクタ形式を表現したものではない。なお、図形一つ一つの描画命令をここでは「ベクタレコード」といい、図6(a)に示すように、命令は表の上から下に並んでいる。ベクタレコードは、描画する図形の種類により異なるパラメータ列を持つため可変長となり、各命令に格納されているレコード長の情報に従いフェッチ(走査、取り出し)される。
フォーム定義には、このようなベクタ形式で表現された図形描画命令が複数含まれ、それらを合成することで全体として図6(b)に示すような目的のフォームが描画されるようになっているが、本発明は、このようなベクタ命令を用いて、帳票上の列となる領域をプログラムにより判別することで、利用者による領域指定の簡易化と誤操作の防止を目的としている。
ステップS51において、最初にベクタ命令を読み取る際、フォーム定義の最初のレコードを読み取ることとなる。なお、読み取るベクタ命令の長さは、ベクタ命令中の特定の位置に格納されている命令長により決定される。図7の例では、図形の種類「1005(角円長方形)」、命令の長さ「26(バイト)」、図形の種類に固有のパラメータ「100,100,1800,1200,20(角の半径)」のベクタ命令が始めに読み取られることになる。
続く、ステップS52では、ステップS51で取り出した1つのベクタ命令により描画される図形が「垂直線分を持つか」を判定する。例えば、取り出した命令が直線であれば、始点と終点の水平座標が同じかを判定することで、それ自体が1つの垂直線分であると判定できるし、長方形の描画命令であれば、左辺および右辺の2つの垂直線分を持つと判断できる。
図7の例では、角の丸い長方形のベクタ命令を取り出したが、図8に示すように、この命令のパラメータは、左辺のX座標(100)、上辺のY座標(100)、右辺のX座標(1800)、下辺のY座標(1200)、各頂点の円の半径(20)であり、次の2つの垂直線分を取り出すことができる。(1)「X座標が100で、上端のY座標が100、下端のY座標が1200」、(2)「X座標が1800で、上端のY座標が100、下端のY座標が1200」である。なお、角の丸い長方形の場合、上記2つの垂直線分とも正確には端部が直線ではないが、列の区切りとしての意図があり作図されていると判断できるため、上記のように考えて差し支えない。
また、ステップS52は、次のような判定処理に細分化できる。
判定1として、ステップS51で読み取ったベクタ命令の図形の種類が、垂直線分を持つ可能性がある図形かを判定し、該当すれば次の判定(判定2)を行い、該当しなければこの部分で判定を終える(ステップS52/No)。例えば、「円」の描画命令は、これに該当せずここで判定が終わることになる。ここで、垂直線分をもつ可能性がある図形の種類のリスト(不図示)はプログラムの命令コード中に存在しており、実行時は、命令の一部としてメモリに(離散的に)ロードされることになる。
判定2として、判定1で垂直線分を持つ可能性がある図形と判定されたベクタ命令は、図形の種類により異なるパラメータの判定が行なわれ、実際に垂直線分を持つかが判定される。例えば、図形の種類が長方形であれば、長方形が空(長さが0の辺を持つ)でない場合に左辺、右辺の2つの垂直線分を持つことになる。また、直線であれば、始点と終点のX座標を比較することで、その直線が垂直であるかを判定することになり、多角形であれば、隣接する頂点について直線と同様のX座標の比較を行なう。ここでの判定は、図形の種類により異なる判定となるが、それぞれの説明は省略する。
ステップS53では、図9に示すように、ステップS52の判定の過程としてメモリ上に取り出された1つまたは複数の垂直線分のうち1つを取り出す。図9の例では、X座標(100)、上端のY座標(100)、下端のY座標(100)の垂直線分が取り出されている。
ステップS54では、ステップS53により取り出された1つの垂直線分と、過去同様にして取り出され、メモリ上に保存されている垂直線分の集合の各要素とを比較し、それらが接しているかを判定する。図10に示す例の場合、今回抽出した垂直線分は、過去にメモリ(一時域(4))に保存されている垂直線分のリストにおいて3番目の要素と接していると判定できる。
即ち、線分AのX座標をXa、上端下端のY座標をTa,Baとし、線分Bの各X座標をXb、上端下端のY座標をTb,Bbとした場合、「XaとXbが等しく」、かつ「TaとTbのうちの大きいほうの値Tmaxと、BaとBbのうち小さいほうの値Bminとを比較し、Tmax≦Bminであれば」、線分AとBは、接していることになる。
なお、ベクタ命令が長方形を描画するものであれば、左辺および右辺の2つが垂直線分となるが、このような処理をすることにより、例えば、表示装置上では、1本の垂直線分に見えるが、ある描画命令の一部であったり、複数の描画命令により描かれていたりする帳票にも対応することができる。このような帳票は、フォーム作成時に作成者が複数の線分や長方形を隣接して配置したため、2つの線分が画像上1つの垂直線分として再生されることになる。図11に、2つの長方形を隣接した配置したため、それらの左辺、右辺が夫々画像上において1つの垂直線分として再生される例を示す。
なお、ここでは、過去のリストからX座標が等しい線分を判定する際、リスト先頭からの順次検索を行なっているが、メモリの上記一時域(4)にツリーなどの検索に適した構造を適用することで、処理の高速化を図ることもできる。
ステップS55では、図12に示すように、ステップS54で接する線分があると判定した場合に、それらを1つの線分と見なし、今回抽出した垂直線分を、過去に抽出された線分の集合に追加せずに、過去の線分を延長する。図12の例では、メモリの一時域(4)に格納される過去に抽出された垂直線分のうち、今回抽出された垂直線分(一時域(3)に格納)と接すると判定された垂直線分の上端のY座標を190から100に更新することにより、過去の線分を延長している。ここで、合成の処理は、ステップS54の説明と同様に、TaとTbの小さい方Tmin、およびBaとBbの大きい方Bmaxをそれぞれ上端、下端の座標として過去に抽出された線分の座標を書き換えることで行なう。
ステップS56は、ステップS54において、メモリの一時域(4)に格納される過去に抽出した垂直線分に、今回抽出した垂直線分(一時域(3)に格納)に接するものがないと判定した場合に、図13に示すように、今回の垂直線分を過去のそれとして加える。
なお、ステップS54〜ステップS56の処理において線分が接することを判定する際に、数ドット(例えば5ドット)程度の誤差を許容する方法が考えられる。何故なら、フォーム作成時にこのような微細な誤差が生じる可能性があるからである。従って、この場合、ステップS55の合成後のX座標は、何れかのX座標を採用する、もしくは、平均を採用するなどの方法が考えられる。また、垂直線分が接していなくても、X座標が同じであれば線分を延長(結合)する方法も考えられる。この方法は、列の区切りが幾つかの離散的な罫線で描画されるケースにおいて有効となる。
ステップS57及びステップS58は、それぞれループの終りを判定している。ステップS57は、ステップS53で取り出せる垂直線分がもうないかを、ステップS58は、ステップS51で読み出すベクタ命令がもうないか(フォームの描画命令が終りか)を判定している。
ここまでで、フォームの描画命令に含まれる全ての垂直線分が抽出され、且つそれらのうちで接しているものは1つにまとめられた、列区切りの候補となる垂直線分のリストが作成されたことになり、このリスト(メモリ一時域(4)に格納)が以降のステップで使用される。
次に、上記抽出した垂直線分の中から列区切となる垂直線分を判定する。図14に、列の区切りとして判定される垂直罫線の例を挙げる(○の罫線が列の区切りとして採用される)。ただし、ここで用いている判定基準は一例であり、例えば、全ての垂直罫線を列区切として判定するという応用が考えられる。このような場合であっても、多くの場合は期待通りの結果が得られると考えられるからである。
なお、利用者は、前述したように「上限ルーラ」及び「下限ルーラ」の位置を指定することになるが、上図のように区切り垂直罫線を識別している関係上、列として判定したい個所の上端と下端に対し、簡単な目視により、上端の少し下に「上限ルーラ」を指定し、下端の少し上に「下限ルーラ」を指定することでより期待した判定結果を得ることができることとなる。例えば、図14の状態から下限ルーラを少し上に指定すると、破線で示される垂直罫線もさらに識別することが可能となる。
図15に、上記抽出した垂直線分の中から列区切となる垂直線分を判定する処理の流れを示す。
ステップS151では、図16に示すように、メモリ一時域(4)に保存されている抽出済みの垂直線分のリストから、順次垂直線分を読み取る。続くステップS152及びステップS153では、図17に示すように、ステップS151で読み取った垂直線分の上下端と、上限ルーラ及び下限ルーラにより指定された上下限の位置とを比較して、垂直線分が、上下限を「貫いているか」を判定する。
具体的には、ルーラにより指定された上下限をそれぞれUlim,Blimとし、垂直線分の上下端をそれぞれU,Bとしたとき、「U≦Ulim (ステップS152)」かつ「B≧Blim(ステップS153)」が成り立つか否かを調べる。なお、図17に示す例の垂直線分は、上下限を貫くと判定されることになる。
ステップS154では、ステップS152〜ステップS153により垂直線分が上下限を貫くと判定された場合に、図18に示すように、その線分のX座標を「列の区切り」としてメモリの一時域(6)に加える。ステップS155は、ステップS151で読み出す垂直線分がもうないかを判定している。
ステップS156では、図19に示すように、ここまでで判定された列の区切り位置のリストを、例えばクイックソート等のアルゴリズムを用いて昇順に分類(ソート)する。ステップS157では、図20に示すように、ステップS156により分類された列の区切り位置のリストに合わせて、列位置指定ルーラを配置している。
このように列位置指定ルーラが、各列に対応して配置された後は、利用者は、マウス等のポインティングデバイスにより検索等の対象として指定したい列のルーラをクリックすることによりON(選択)状態とすることで、罫線に従った正確な列領域の指定ができる。
なお、上記実施形態は飽くまでも本発明の一適用例であり、当然、その他の実施形態をとることができる。例えば、上記実施形態では、水平成分を抽出する例を説明したが、ベクタ命令から同様に垂直線分を抽出することもできる。
また、本発明の目的は、前述した実施形態の機能を実現するソフトウェアのプログラムコードを記録した記憶媒体を、システム或いは装置に供給し、そのシステム或いは装置のコンピュータ(またはCPUやMPU)が記憶媒体に格納されたプログラムコードを読み出し実行することによっても、達成されることは言うまでもない。
この場合、記憶媒体から読み出されたプログラムコード自体が前述した実施形態の機能を実現することになり、プログラムコード自体及びそのプログラムコードを記憶した記憶媒体は本発明を構成することになる。
プログラムコードを供給するための記憶媒体としては、例えば、フレキシブルディスク、ハードディスク、光ディスク、光磁気ディスク、CD−ROM、CD−R、磁気テープ、不揮発性のメモリカード、ROM等を用いることができる。
また、コンピュータが読み出したプログラムコードを実行することにより、前述した実施形態の機能が実現されるだけでなく、そのプログラムコードの指示に基づき、コンピュータ上で稼動しているOS(基本システム或いはオペレーティングシステム)などが実際の処理の一部又は全部を行い、その処理によって前述した実施形態の機能が実現される場合も含まれることは言うまでもない。
さらに、記憶媒体から読み出されたプログラムコードが、コンピュータに挿入された機能拡張ボードやコンピュータに接続された機能拡張ユニットに備わるメモリに書込まれた後、そのプログラムコードの指示に基づき、その機能拡張ボードや機能拡張ユニットに備わるCPU等が実際の処理の一部又は全部を行い、その処理によって前述した実施形態の機能が実現される場合も含まれることは言うまでもない。
本発明の一実施形態に係る電子帳票システムの構成を示す図である。 電子帳票サーバ及び利用者端末のハードウェア構成を示す図である。 垂直罫線選択処理において利用される検索対象矩形領域の指定手順を示すフローチャートである。 列位置指定ルーラの位置合わせの概要を説明するための図である。 垂直罫線選択処理の流れを示すフローチャートである。 ベクタ命令及びそれによる再生画像の一例を示す図である。 フォーム定義からのベクタ命令の読み取り例を示す図である。 ベクタ命令からの垂直線分の抽出例を示す図である。 メモリ上に取り出された垂直線分から1つの垂直線分を抽出する例を示す図である。 抽出された垂直線分が過去に抽出された垂直線分と接するか否かの判定処理を説明するための図である。 2つの長方形を隣接した配置したため、それらの左辺、右辺が夫々画像上において1つの垂直線分として再生される例を示す図である。 接する線分があると判定した場合にそれらを1つの線分と見なし、過去の線分を延長する例を示す図である。 過去に抽出した垂直線分に今回抽出した垂直線分に接するものがないと判定した場合における垂直線分のメモリ格納例を示す図である。 列の区切りとして判定される垂直罫線の例を示す図である。 垂直線分の中から列区切となる垂直線分を判定する処理の流れを示すフローチャートである。 メモリに保存されている抽出済みの垂直線分のリストから、順次垂直線分を読み取る例を示す図である。 読み取った垂直線分の上下端と、上限ルーラ及び下限ルーラにより指定された上下限の位置とを比較して、垂直線分が上下限を「貫いているか」を判定する処理を説明するための図である。 垂直線分が上下限を貫くと判定された場合に、その線分のX座標を「列の区切り」としてメモリに加える例を示す図である。 列の区切り位置のリストを昇順に分類(ソート)する例を示す図である。 分類された列の区切り位置のリストに合わせて、列位置指定ルーラを配置する例を示す図である。 矩形領域を指定する操作を行うための上限ルーラ、下限ルーラ及び列位置指定ルーラを説明するための図である。 列位置指定ルーラの操作方法を説明するための図である。 利用者が実際に指定したい領域と帳票上に実際に列が配置される領域とに誤差が生じることを説明するための図である。
符号の説明
11 外部コンピュータシステム
12 電子帳票サーバ
13 利用者端末
121、126、131 通信部
122 印字用データ記憶部
123 帳票データ変換部
124 帳票データ記憶部
125 検索実行部
132 帳票画像再現部
133 検索結果表示部
134 検索領域入力部
135 検索式入力部
136 表示装置
137 キーボード
21 CPU
22 RAM
23 ROM
24 HDD(ハードディスクドライブ)
25 記録媒体ドライブ
26 ビデオアダプタ
27 K/B(キーボード)
28 マウス
29 NIC(ネットワークインタフェースカード)

Claims (7)

  1. 罫線を含む画像データから前記罫線の垂直線分又は水平線分を識別する罫線識別手段と、
    前記罫線識別手段によって識別された垂直線分又は水平線分に基づいて、当該垂直線分又は当該水平線分によって区分される前記画像データ内の各領域を指定する領域指定情報を生成する領域指定情報生成手段とを有することを特徴とする情報処理装置。
  2. 前記画像データ内において指定された水平又は垂直方向の範囲を示す指定範囲情報を入力する指定範囲情報入力手段と、
    前記指定された範囲の方向とは異なる方向であって前記範囲の上下限を越える垂直線分又は水平線分を、前記罫線識別手段によって識別された垂直線分又は水平線分から抽出する罫線抽出手段とを更に有し、
    前記領域指定情報生成手段は、前記罫線抽出手段により抽出された垂直線分又は水平線分によって区分される前記画像データ内の各領域を指定する領域指定情報を生成することを特徴とする請求項1に記載の情報処理装置。
  3. 前記罫線識別手段によって識別された垂直線分又は水平線分と、その線分に重複又は隣接する垂直線分又は水平線分とを結合する罫線結合手段を更に有し、
    前記罫線抽出手段は、前記指定された範囲の方向とは異なる方向であって前記範囲の上下限を越える垂直線分又は水平線分を、前記罫線識別手段によって識別された垂直線分又は水平線分から抽出することを特徴とする請求項2に記載の情報処理装置。
  4. 前記罫線は、ベクタ形式のデータによって表される罫線であることを特徴とする請求項1乃至3の何れか1項に記載の情報処理装置。
  5. 情報処理装置による情報処理方法であって、
    罫線を含む画像データから前記罫線の垂直線分又は水平線分を識別する罫線識別ステップと、
    前記罫線識別ステップによって識別された垂直線分又は水平線分に基づいて、当該垂直線分又は当該水平線分によって区分される前記画像データ内の各領域を指定する領域指定情報を生成する領域指定情報生成ステップとを含むことを特徴とする情報処理方法。
  6. 請求項5に記載の情報処理方法をコンピュータに実行させるためのプログラム。
  7. 請求項6に記載のプログラムを記録したコンピュータ読み取り可能な記録媒体。
JP2003434686A 2003-12-26 2003-12-26 情報処理装置、情報処理方法、プログラム及び記録媒体 Expired - Fee Related JP4263089B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2003434686A JP4263089B2 (ja) 2003-12-26 2003-12-26 情報処理装置、情報処理方法、プログラム及び記録媒体

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2003434686A JP4263089B2 (ja) 2003-12-26 2003-12-26 情報処理装置、情報処理方法、プログラム及び記録媒体

Publications (2)

Publication Number Publication Date
JP2005190439A true JP2005190439A (ja) 2005-07-14
JP4263089B2 JP4263089B2 (ja) 2009-05-13

Family

ID=34791669

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2003434686A Expired - Fee Related JP4263089B2 (ja) 2003-12-26 2003-12-26 情報処理装置、情報処理方法、プログラム及び記録媒体

Country Status (1)

Country Link
JP (1) JP4263089B2 (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007179203A (ja) * 2005-12-27 2007-07-12 Canon Marketing Japan Inc 帳票検索装置、帳票検索方法、プログラム及びコンピュータ読み取り可能な記憶媒体
JP2007179201A (ja) * 2005-12-27 2007-07-12 Canon Marketing Japan Inc 電子帳票管理装置、検索結果出力方法、プログラム及び記憶媒体
WO2009060980A1 (en) * 2007-11-09 2009-05-14 Ricoh Company, Ltd. Information processing apparatus and information processing method

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007179203A (ja) * 2005-12-27 2007-07-12 Canon Marketing Japan Inc 帳票検索装置、帳票検索方法、プログラム及びコンピュータ読み取り可能な記憶媒体
JP2007179201A (ja) * 2005-12-27 2007-07-12 Canon Marketing Japan Inc 電子帳票管理装置、検索結果出力方法、プログラム及び記憶媒体
JP4693167B2 (ja) * 2005-12-27 2011-06-01 キヤノンマーケティングジャパン株式会社 帳票検索装置、帳票検索方法、プログラム及びコンピュータ読み取り可能な記憶媒体
WO2009060980A1 (en) * 2007-11-09 2009-05-14 Ricoh Company, Ltd. Information processing apparatus and information processing method
JP2009116825A (ja) * 2007-11-09 2009-05-28 Ricoh Co Ltd 情報処理装置、及び情報処理方法
US8548250B2 (en) 2007-11-09 2013-10-01 Ricoh Company, Ltd. Information processing apparatus and information processing method

Also Published As

Publication number Publication date
JP4263089B2 (ja) 2009-05-13

Similar Documents

Publication Publication Date Title
JP3427928B2 (ja) 手書き情報処理システムおよび方法
US6466694B2 (en) Document image processing device and method thereof
JP5321109B2 (ja) 情報処理装置及び情報処理プログラム
JP4194462B2 (ja) 電子透かし埋め込み方法、電子透かし埋め込み装置、及びそれらを実現するプログラム並びにコンピュータ可読記憶媒体
JP4818091B2 (ja) 情報処理装置、画像処理装置、情報処理装置の制御方法及び画像処理装置の制御方法
JP2007058304A (ja) 文字認識装置及び文字認識方法
JP5950700B2 (ja) 画像処理装置、画像処理方法及びプログラム
JP2007006058A (ja) 画像処理装置、および画像処理方法、並びにコンピュータ・プログラム
JP2009251872A (ja) 情報処理装置及び情報処理プログラム
JP4263089B2 (ja) 情報処理装置、情報処理方法、プログラム及び記録媒体
JP2018067298A (ja) 手書き内容編集装置および手書き内容編集方法
KR102102394B1 (ko) 문자 인식을 위한 영상 전처리 장치 및 방법
CN113378526A (zh) Pdf段落处理方法、装置、存储介质及设备
JP2009020689A (ja) データ検索方法及びデータ検索装置
JP2009278181A (ja) 電子透かし情報埋め込み装置及び方法、並びに、電子透かし情報抽出装置及び方法
JP2010108296A (ja) 情報処理装置、情報処理方法
JP4693167B2 (ja) 帳票検索装置、帳票検索方法、プログラム及びコンピュータ読み取り可能な記憶媒体
JP2006309611A (ja) 解析装置、プログラム及び記録媒体
JP5361315B2 (ja) 情報処理装置及び情報処理方法
JP4213558B2 (ja) 文書レイアウト解析プログラム、文書レイアウト解析プログラムを記憶したコンピュータ読み取り可能な記憶媒体、文書レイアウト解析方法および文書レイアウト解析装置
JP2006072877A (ja) 文書編集装置、文書編集方法、文書編集プログラムおよびその記録媒体
US11010679B1 (en) Systems and methods for autonomously executing computer programs
US20090241063A1 (en) Information processing apparatus, information processing method, and computer readable medium for designing a gui
JP4963633B2 (ja) 情報処理装置及び情報処理方法
JPH11187231A (ja) 画像検索装置及び画像検索方法

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20060627

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20081014

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20081215

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20090203

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20090210

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120220

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120220

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130220

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140220

Year of fee payment: 5

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

LAPS Cancellation because of no payment of annual fees