以下、図面を参照して本発明の実施の形態について説明する。
図1は、本実施形態における分類情報作成装置を実現する帳票出力装置の構成を示すブロック図である。帳票出力装置は、複数の項目が設けられた帳票に関するデータを管理し、所定のデータ形式によって出力することができる。分類情報作成装置は、複数の帳票データを分類して管理するための分類情報、例えば帳票に設けられた項目に入力されたデータを用いた目次や索引を作成して記憶しておくことができる。本実施形態における分類情報作成装置では、帳票に設定された複数の項目から任意に分類情報の作成に利用する項目を選択させ、分類情報を作成することができる。
図1において、CPU(Central Processing Unit)10には、入力装置11、表示装置12、印刷装置13、通信制御装置14、ROM15、RAM16、及び記憶装置17がバスライン18を介して接続されている。
CPU10は、RAM16内にロードされている各種制御プログラムに従って、帳票出力装置の全体動作を制御する。CPU10は、帳票出力プログラムを実行することで、データファイル17cとして記憶されている帳票データを所定の形態で出力することができる。また、記憶された帳票データを分類して管理するための分類情報を、帳票に設定された項目に入力されたデータを用いて作成する分類情報作成処理を実行することができる。
入力装置11は、キーボードやマウスなどのポインティングデバイスなどを含み、帳票出力装置に対する操作指示や帳票データの入力、あるいは帳票データを管理するための分類情報(目次、索引)を作成する場合の分類情報の作成の対象とする項目の選択操作などに使用される。
表示装置12は、CPU10の制御のもとで、記憶装置17に記憶されている帳票データを含む各種データの表示や、各種指定を入力するための入力画面などを表示する。
印刷装置13は、CPU10の制御のもとで、記憶装置17に記憶されたデータなどを印刷する。
通信制御装置14は、外部の伝送媒体を介した通信を制御するもので、例えばファクシミリ(FAX)や電子メールを送受信するための通信を制御する。
ROM15は、CPU10によりアクセスされる各種プログラムやデータなどが記憶される。
RAM16は、CPU10によりアクセスされる各種プログラムやデータなどが記憶される。例えば、記憶装置17に記憶されたレイアウトスペックファイル17bにより定義される帳票のデータ構成に従って帳票データが展開されたドキュメント情報ブロック16a、ドキュメント情報ブロック16aに応じた帳票を表示するためのドキュメント表示データ16b、帳票に設定された項目に入力されたデータを用いて作成された分類情報(目次、索引)を表示するための目次表示データ16cなどが記憶される。
記憶装置17は、オペレーティングシステムやアプリケーションプグラムなどの各種プログラム、データファイル等が格納されている記憶媒体やその駆動系を有している。記憶媒体は固定的に設けたもの、もしくは着脱自在に装着可能なものであり、フレキシブルディスク、ハードディスク、光ディスク、RAM(random access memory)カード等の磁気的・光学的記憶媒体、半導体メモリによって構成されている。また、記憶媒体に記憶されたプログラムやデータは、必要に応じてCPU10の制御により、RAM16にロードされる。さらに、CPU10は、通信制御装置14により、伝送媒体を介して他の機器側から送信されてきたプログラムやデータを受信して記憶媒体に格納したり、他の機器側に設けられている記憶媒体に格納されているプログラム、データを伝送媒体を介して使用することもできる。
例えば、記憶装置17には、帳票出力プログラム17a、レイアウトスペックファイル17b、データファイル17cが記憶され、必要に応じて読み出されてRAM16に記憶される。帳票出力プログラム17aを実行することで、データファイル17cとして記憶されている帳票データを所定の形態で出力することができる。また、記憶された帳票データを分類して管理するための分類情報を、帳票に設定された項目に入力されたデータを用いて作成する分類情報作成処理を実行する。レイアウトスペックファイル17bは、帳票のデータ構成を定義するデータを含むファイルである(詳細については後述する)。データファイル17cは、帳票出力装置において扱われる帳票に関する各種データを含み、例えば予め帳票に設定された項目に対して入力されたデータや、複数の項目が設定された帳票のイメージデータなどが含まれる。
次に、帳票出力装置の基本的な機能について、図2を参照しながら説明する。
本実施形態における帳票出力装置は、予め帳票の構成を定義するデータが設定されたレイアウトスペックファイル17bをもとに、帳票に対して設定された項目に対して入力されたデータを、ユーザによって指定される所定の出力形態によって出力することができる。
帳票出力装置は、帳票出力プログラム17aを実行することにより、レイアウトスペックファイル17bに定義された帳票レイアウトに対して、データファイル17cに設定された帳票に設けられた各項目に対してデータを展開して、各種の出力形態に応じた出力データを生成する。
出力形態としては、例えば所定のデータ形式に変換されたドキュメントファイル出力、印刷装置13(プリンタ)からの紙媒体への印刷出力、表示装置12における各項目にデータが入力された状態の帳票イメージを表示するビューア出力、通信制御装置14を通じたファクシミリ送信による出力、あるいは電子メールによる出力などがある。
(第1実施形態)
次に、本発明の第1実施形態における分類情報作成処理について説明する。第1実施形態の分類情報作成処理では、レイアウトスペックファイル17bにより定義された形式により、帳票に設定された項目に対して入力されたデータを含めて帳票イメージを表示し、この帳票イメージ中で任意に指定された項目を用いて分類情報を作成するものである。
図3(a)には、帳票出力装置におけるビューア出力された帳票イメージの画面構成例を示している。図3(a)に示す帳票では、「受注日」21、「受注コード」22、「得意先コード」23、「得意先名」24、「商品名」25などに関するデータを入力するための複数の項目が設定されている。
図4には、第1実施形態におけるレイアウトスペックファイル17bに記憶されたデータにより定義されるドキュメント情報ブロック16aの一例を示している。
ドキュメント情報ブロック16aには、複数の帳票からなるドキュメントに関するドキュメント情報31が設定される。ドキュメント情報31には、ドキュメント名称、基本索引情報アドレス、分類設定情報アドレス、分類情報などが含まれている。
基本索引情報アドレスが示す領域には、基本索引情報32が記憶されている。基本索引情報32には、各帳票についての帳票データが記憶されるページアドレス、すなわちページ1〜ページLのそれぞれについてのアドレスが記憶される。
例えば、基本索引情報32のページ1のアドレスが示す領域には、ページ1に関するデータ34が記憶される。ページ1のデータ34には、用紙種類、用紙サイズ、描画項目情報へのアドレス、分類識別情報アドレスが含まれている。
分類識別情報アドレスは、分類情報作成処理によって分類情報(目次、索引)が設定された場合に、帳票データと関連づけて記憶するために追加して設定される。分類識別情報アドレスが示す領域には、分類情報作成処理によって分類設定情報33に設定された目次名あるいは索引名に該当する項目のデータが分類識別情報37として記憶される。分類識別情報37には、目次については複数の目次キー1〜M、索引については複数の索引キー1〜Nのそれぞれに該当する項目に対して入力されたデータが記憶される。
また、描画項目情報へのアドレスが示す領域には、描画項目情報36が記憶される。描画項目情報36には、帳票に定義された複数の項目1〜Nに対するデータを記憶する領域を示すアドレスが記憶される。
描画項目情報36に設定される項目1へのアドレスが示す領域には、項目1についての項目情報310が設定される。項目情報310には、項目1の項目名、データ種(ページデータ、明細データなど)、データ(文字コードなど)、描画位置を示すデータがそれぞれ設定される。同様にして、項目2〜項目Nのそれぞれについてのデータが、描画項目情報36に設定された項目2〜項目Nへのアドレスが示す領域に設定される。例えば、項目Nへのアドレスが示す領域には、項目Nについての項目情報311が設定され、項目名、データ種、データ、描画位置が記憶される。
また、基本索引情報32のページ2〜Lのアドレスが示すそれぞれの領域には、同様にして、ページ2〜Lに関するデータが記憶される。例えば、ページLのデータ35には、用紙種類、用紙サイズ、描画項目情報へのアドレス、分類識別情報アドレスが含まれ、描画項目情報へのアドレスが示す領域には、描画項目情報38が記憶され、分類識別情報アドレスが示す領域には、ページLについての分類識別情報39が記憶される。描画項目情報38には、帳票に定義された複数の項目1〜Nに対するデータを記憶する領域を示すアドレスが記憶される。項目1へのアドレスが示す領域には、項目1についての項目情報312が設定され、項目1の項目名、データ種、データ(文字コードなど)、描画位置を示すデータがそれぞれ設定される。同様にして、項目2〜項目Nのそれぞれについてのデータが、描画項目情報38に設定された項目2〜項目Nへのアドレスが示す領域に設定される。例えば、項目Nへのアドレスが示す領域には、項目Nについての項目情報313が設定され、項目名、データ種、データ、描画位置が記憶される。
一方、ドキュメント情報31中の分類設定情報アドレスが示す領域には、分類情報作成処理においてユーザによって目次あるいは索引の対象として選択された項目が分類設定情報33として記憶される。分類設定情報33には、目次数(M)と、この目次数分の各目次名1〜M、索引数(N)と、この索引数分の各索引名1〜Nとがそれぞれ記憶される。分類設定情報33が追加されるのに伴って、分類設定情報33に設定された目次名あるいは索引名に該当する各ページのデータが分類識別情報(37,39)として追加される。
次に、第1実施形態の帳票出力装置における分類情報作成処理について、図5に示すフローチャートを参照しながら説明する。
まず、複数の帳票が含まれるドキュメントに対する分類情報作成処理の実行要求が入力されると、該当するドキュメントのデータをデータファイル17cから読み込み、このドキュメントに対応するレイアウトスペックファイル17bにより定義されたドキュメント情報ブロック16aに展開する(ステップA1)。そして、このドキュメント情報ブロック16aに従って、各項目にデータが入力された1ページ目の帳票イメージを表示装置12において表示させ(ステップA2)、分類情報(目次、索引)の作成を開始する(ステップA3)。
図3(b)には、各項目に対してデータが入力された状態の帳票イメージ(ドキュメント)が表示された表示画面例を示している。
また、図6には、図4に示すドキュメント情報ブロック16aをもとに、データファイル17cに含まれる帳票データを展開した例を示している。図6に示すドキュメント情報ブロック16aは、納品書を表す帳票を例にしたもので、分類情報作成処理によって目次と索引が作成されていない状態のデータ構成例を示している。
ここで、分類情報の作成に利用する項目を、表示された帳票イメージからユーザによって選択させる(ステップA4)。すなわち、図3(b)に示すように、入力装置11(ポインティングデバイス)をユーザに操作させて、分類情報に利用する項目を含むように領域選択させる。図3(b)に示す領域選択された範囲には、「受注日」51と「受注コード」52の項目が含まれている。
ここで、帳票に設定されている項目数を変数ItemCntに設定する(ステップA5)。図3に示す帳票の場合には、図6に示すドキュメント情報ブロック16aにあるように、描画項目情報(46,47,48)に5つの項目が定義されているので変数ItemCnt=5と設定する。
ここで、処理対象とする項目を示す変数ItemWkに1を設定し(ステップA6)、変数ItemWkの値が変数ItemCntが示す値以下である場合、すなわち全ての項目についての処理が完了していなければ(ステップA7、Yes)、変数ItemWkが示す項目がユーザにより指定された領域内に存在しているかを判別する(ステップA8)。ここでは、該当する項目についての項目情報に設定された描画位置のデータと、ユーザにより指定された領域の範囲を示す位置データとの比較により判別する。
例えば、図6に示すページ1の項目1についての項目情報49には、描画位置のデータとして「10,10,100,30」が設定されている。なお、この数字列は、xy座標系における矩形状の項目枠を定義する対角の頂点(2点(x1,y1)(x2,y2))の座標位置を示すデータである。
ここで、項目が領域内にあると判別された場合には(ステップA8、Yes)、変数ItemWkが示す項目を対象項目として一時登録しておく(ステップA9)。そして、次の項目に処理に移行するために変数ItemWkを1加算する(ステップA10)。なお、変数ItemWkが示す項目が領域内にないと判別された場合には(ステップA8、No)、何もしないで変数ItemWkを更新して、次の処理に移行する。
以下、同様にして、変数ItemWkを順次更新しながら、それぞれの項目がユーザにより指定された領域中に含まれるかを判別し、領域内にある項目については一時登録しておく(ステップA7〜A10)。
なお、図3(b)に示すように領域が選択された場合には、変数ItemWkが2と3の場合、すなわち「受注日」と「受注コード」との項目についての処理の際に、領域内に含まれるものとして判定される。
そして、変数ItemWkの値がItemCntの値以下ではない場合、すなわち帳票に設定された全ての項目についての処理が完了すると(ステップA7、No)、一時登録してある項目を用いて分類設定情報を作成する(ステップA11)。
すなわち、図7に示すように、ドキュメント情報41に分類設定情報を記憶するための領域を示す分類設定情報アドレス41aを追加し、このアドレスが示す領域に分類設定情報51を記憶させる。
図3(b)に示すように領域が選択された場合には、対象項目として「受注日」と「受注コード」が一時登録されているので、図7に示すように、分類設定情報51には、目次数として「2」、目次名1として「受注日時」、目次名2として「受注コード」が記憶される。
なお、前述した説明では、目次を作成する場合の操作を対象としているが、索引を作成する場合にも同様の処理が実行されるものとする。すなわち、帳票イメージ中から索引の対象とする項目を含むように領域範囲をユーザにより選択させ、その領域内に存在する項目を判別して分類設定情報51に記憶させる。
図7に示す分類設定情報51の例では、索引の対象とする項目として「得意先コード」の項目のみを含む領域が選択された例を示しており、索引数として「1」、索引名1として「得意先コード」が記憶されている。
なお、分類情報の目次と索引の何れを作成するかは、予め分類情報作成処理の起動時に指定する、あるいは図3に示すように、ユーザに対して帳票イメージに対して領域を選択させる際に、目次に用いる項目を選択するための領域指定であるか、索引に用いる項目を選択するための領域指定であるかを、任意に選択させるようにしても良い。
こうして、分類設定情報51の追加が完了すると、以下に説明するように、各ページについて分類設定情報51に基づく分類識別情報の追加を行う。
まず、現在処理対象としているドキュメントに含まれる帳票の総ページ数を変数PageCntに設定する(ステップA12)。図6及び図7に示すドキュメントの場合には、基本索引情報42にあるように、ページ1〜3の3つのページのアドレスが記憶され、それぞれに対応するページ1,2,3のデータ43,44,45が定義されているので変数PageCnt=3と設定する。
ここで、処理対象とするページを示す変数PageWkに1を設定し(ステップA13)、変数PageWkの値が変数PageCntが示す値以下である場合、すなわち全てのページについての処理が完了していなければ(ステップA14、Yes)、分類設定情報51に記憶された各目次についての処理を順次実行するために目次対象数を変数CatCntに設定する(ステップA15)。また、処理対象とする目次を示す変数CatAddrに1を設定する(ステップA16)。
ここで、変数CatAddrの値が変数CatCntが示す値以下である場合、すなわち全ての目次についての処理が完了していなければ(ステップA17、Yes)、各項目について分類情報として分類識別情報に記憶するかを判別するための処理を実行するために項目数を変数ItemCntに設定する(ステップA18)。
ここで、処理対象とする項目を示す変数ItemWkに1を設定し(ステップA19)、変数ItemWkの値が変数ItemCntが示す値以下である場合、すなわち全ての項目についての処理が完了していなければ(ステップA20、Yes)、変数ItemWkが示す項目と変数CatAddrが示す目次とが一致しているかを判別する(ステップA21)。
例えば、分類設定情報51に記憶された目次名1に該当する項目「受注日」と、描画項目情報46の項目1のアドレスが示す領域に記憶された最初の項目情報49に記憶された項目名「受注日」との比較により判別する。
ここで、項目名が一致すると判別された場合には(ステップA21、Yes)、該当する項目名に対して入力されているデータを分類識別情報として登録する(ステップA23)。例えば、項目情報49の項目名「受注日」が一致したと判別されると、この「受注日」に対応して記憶された「平成12年04年01日」のデータを、図7に示す分類識別情報52に記憶する。
この場合、処理対象とする目次を示す変数CatAddrをインクリメント(+1)し、次の目次についての処理に移行する(ステップA24)。
一方、項目名が一致していないと判別された場合(ステップA21、No)、処理対象とする項目を示す変数ItemWkをインクリメント(+1)し、次の項目の処理についての処理に移行する(ステップA22)。
以下、同様にして、変数ItemWkを順次更新しながら、それぞれの項目について変数CatAddrが示す目次と一致しているかを判別する(ステップA20〜A22)。
以上の処理を変数CatAddrを順次更新しながら(ステップA24)、変数CatAddrの値がItemCntの値以下ではなくなるまで、すなわち分類設定情報51に記憶された全ての目次名とする項目についての処理が完了すると(ステップA17、No)、処理対象とするページを示す変数PageWkをインクリメント(+1)し、次のページに対する処理に移行する(ステップA25)。
図7に示すドキュメント情報ブロック16aにおいて、ページ1についての処理を完了することで、分類識別情報52には目次名として分類設定情報51に記憶された項目「受注日」のデータ「平成12年04年01日」と、項目「受注コード」のデータ「1001」が記憶される。
なお、索引名として分類設定情報51に記憶された目次名「得意先コード」についても同様の処理を実行する。この結果、図7の分類識別情報52に示すように、項目情報615に記憶された項目「得意先コード」に対応するデータ「50001」が記憶される。
以下、各ページについて、前述と同様の処理を実行することにより、分類設定情報51に記憶された目次名と索引名に該当する項目のデータを、分類情報識別情報53,54として記憶していくことができる。
そして、変数PageWkが変数PageCnt以下ではなくなることで全てのページについての処理が完了すると(ステップA14、No)、分類情報作成処理を終了する。この結果、図7に示すように、ページ1のデータ43には、分類識別情報アドレス43aを追加して、このアドレスが示す領域に分類識別情報52を記憶し、同様にしてページ2のデータ44には分類識別情報アドレス44aを追加して類識別情報53を記憶し、ページ3のデータ45には、分類識別情報アドレス45aを追加して分類識別情報54を記憶する。
帳票出力装置は、例えば入力装置11に対するユーザの操作により、ドキュメント情報ブロック16aについての目次表示が要求された場合、図7に示す各ページの分類識別情報アドレス43a,44a,45aがそれぞれ示す領域に記憶された分類識別情報52,53,54を参照して、目次(あるいは索引)を一覧表示させる。
図8には、目次を一覧表示させた目次構成画面の一例を示している。帳票出力装置は、分類設定情報51に複数の目次名(索引名)が記憶されている場合、上位の目次名(図7に示す分類設定情報51の例では「受注日」)から順に階層化して目次を表示させる。図8では、項目「受注日」に対応する目次項目A1,A2が上位レベルの階層とし、項目「受注コード」に対応する目次項目B1,B2,B3を下位レベルの階層として表示している。
こうして階層化された目次に対しては、入力装置11(例えばポインティング)の操作により任意の項目を選択することができる。帳票出力装置は、目次中から選択された項目を判別し、この項目に該当する帳票を出力(帳票イメージ表示など)させることができる。
分類情報(目次、索引)が階層化されていることで、帳票データの分類系統を用意に把握しやすくなり、出力対象とする帳票を的確に選択することができ、分類情報をより有効に活用することができる。
このようにして、第1実施形態の分類情報作成処理では、ドキュメント情報ブロック16aに展開されたデータをもとにして表示された帳票イメージに対して、ユーザから分類情報(目次、索引)の対象とする項目を領域範囲の指定により選択させ、これにより選択された項目に対して入力されたデータによる目次(あるいは索引)を表示することができる。従って、データファイル17cに記憶された帳票データの取り扱いが変更になる場合、例えば受注日をもとにした管理から商品名をもとにした管理に変更する場合であっても、ユーザがドキュメント情報ブロック16aをもとにして表示される帳票イメージから任意に「商品名」の項目を選択する操作で「商品名」についての目次を作成することができる。分類情報として利用する項目を視覚的に選択できるため、実業務に近い操作感を得ることができる。
なお、前述した説明では、帳票イメージに対して、目次(索引)作成の対象とする項目をユーザにより指定された領域に含まれるものを対象としているが、領域に一部を含むものを対象とする、あるいは完全に領域内に含まれる項目のみを対象とするように設定することができる。
また、目次の作成の対象とする項目を領域範囲を指定することで選択しているが、例えばポインティングデバイスを用いて項目内の1点をポインティングするのみで項目を選択できるようにしても良い。
(第2実施形態)
次に、第2実施形態における帳票出力装置(分類情報作成装置)について説明する。
第1実施形態では、ドキュメント情報ブロック16aにおいて、帳票に設定された項目の位置や項目に入力されているデータが項目情報として記憶された帳票データを対象としているが、第2実施形態では、帳票データとして帳票イメージが記憶されている場合について説明する。帳票イメージには、帳票に設定された複数の項目に対して文字列が記入されているものとする。
図9には、第2実施形態におけるレイアウトスペックファイル17bに記憶されたデータにより定義されるドキュメント情報ブロック16aの一例を示している。なお、第2実施形態におけるドキュメント情報ブロック16aは、基本的に図4に示す第1実施形態のドキュメント情報ブロック16aと同じ構成を有しているので異なる構成部分についてのみ説明する。
図9に示すドキュメント情報ブロック16aでは、ページ1のデータ64には、用紙種類、用紙サイズ、描画項目(イメージ)情報へのアドレス、分類識別情報アドレスが記憶される。
イメージ情報へのアドレスが示す領域には、描画項目情報66が記憶される。描画項目情報66には、イメージ名称とイメージ情報へのアドレスが記憶される。イメージ情報へのアドレスが示す領域には、ページ1についてのイメージ情報610が記憶される。イメージ情報610には、データ種と1帳票分のイメージデータが記憶される。このイメージデータによる帳票イメージには、複数の項目が設けられており、各項目に所定形式の情報、例えば文字列が入力されている。なお、項目に入力される情報は、文字列に限らず、認識可能な他の情報であっても良い。
まず、第2実施形態における、分類情報(目次、索引)を階層化させない場合の分類情報作成処理について、図10に示すフローチャートを参照しながら説明する。
まず、複数の帳票が含まれるドキュメントに対する分類情報作成処理の実行要求が入力されると、該当するドキュメントのデータをデータファイル17cから読み込み、このドキュメントに対応するレイアウトスペックファイル17bにより定義されたドキュメント情報ブロック16aに展開する(ステップB1)。そして、このドキュメント情報ブロック16aに従って展開されたイメージ情報(610,611)として記憶されている1ページ目の帳票イメージを表示装置12において表示させ(ステップB2)、分類情報(目次、索引)の作成を開始する(ステップB3)。
図11には、各項目に対して文字列が入力されている帳票イメージ(ドキュメント)が表示された表示画面例を示している。
また、図12には、図9に示すドキュメント情報ブロック16aをもとに、データファイル17cに含まれる帳票データを展開した例を示している。図12に示すドキュメント情報ブロック16aは、納品書を表す帳票を例にしたもので、分類情報作成処理によって目次と索引が作成されていない状態のデータ構成例を示している。
ここで、分類情報の作成に利用する項目(文字列)に該当する範囲を、表示された帳票イメージからユーザによって選択させる(ステップB4)。すなわち、図11に示すように、入力装置11(ポインティングデバイス)をユーザに操作させて、分類情報に利用する項目(文字列)を含むように領域選択させる。ここでは、分類情報を階層化させない場合について説明しているので1つの領域、例えば図11に示す「受注日」に該当する「平成12年04年01日」を含む領域選択範囲1が指定されたものとする。
ここで、ユーザ操作により選択された領域を示す座標データ(xy座標系における矩形状の項目枠を定義する対角の頂点(2点))を記憶しておく(ステップB5)。
次に、現在処理対象としているドキュメントに含まれる帳票イメージの総ページ数を変数PageCntに設定する(ステップB6)。図12に示すドキュメントの場合には、基本索引情報72にあるように、ページ1〜3の3つのページのアドレスが記憶され、それぞれに対応するページ1,2,3のデータ73,74,75が定義されているので変数PageCnt=3と設定する。
ここで、処理対象とするページを示す変数PageWkに1を設定し(ステップB7)、変数PageWkの値が変数PageCntが示す値以下である場合、すなわち全てのページについての処理が完了していなければ(ステップB8、Yes)、ユーザにより選択された領域内のイメージから文字情報を取得する(ステップB9)。
すなわち、先に記憶にした領域を示す座標データをもとに、ドキュメント情報ブロック16aに展開されたイメージデータ79から部分イメージを切り出し、この部分イメージに対して文字認識処理を実行する。
文字認識処理では、文字に相当する文字イメージを切り出し、各文字イメージに対して文字認識用の辞書との照合を行うことで文字を認識する。
こうして、ユーザにより選択されたイメージ中から文字情報が取得されると、この文字情報を図13に示すように、ページ1のデータ76の分類識別情報アドレスが示す領域に分類識別情報81を記憶させる(ステップB10)。
図11に示す領域選択範囲1が指定された場合には、図13に示すように、ページ1に対する分類識別情報81として「平成12年04年01日」が記憶される。
そして、処理対象とするページを示す変数PageWkをインクリメント(+1)し、次のページに対する処理に移行する(ステップB11)。以下、前述と同様にして、各ページにおけるユーザにより設定された領域に該当する部分イメージから文字認識処理により文字情報を抽出し、例えば図13に示すように、それぞれのページに対する分類識別情報82,83として「平成12年04年02日」「平成12年04年02日」を記憶する(ステップB8〜B11)。
変数PageWkが変数PageCnt以下ではなくなることで全てのページについての処理が完了すると(ステップB8、No)、分類情報作成処理を終了する。
なお、前述した説明では目次を作成する場合について説明しているが、分類情報の目次と索引の何れを作成するかは、予め分類情報作成処理の起動時に指定する、あるいは図11に示すように、ユーザに対して帳票イメージに対して領域を選択させる際に、目次に用いる項目を選択するための領域指定であるか、索引に用いる項目を選択するための領域指定であるかを任意に選択させるようにしても良い。
このようにして、第2実施形態では、第1実施形態における効果に加えて、帳票データとしてイメージデータが記憶されている場合であっても、帳票イメージ中から任意に分類情報として利用する情報(文字列)が存在する領域を指定することで、この領域中の情報が抽出されて分類識別情報として記憶することができる。イメージデータとして記憶されている帳票データに対して目次などの分類情報を付加することで、分類情報から複数の帳票データを含むドキュメントの構成が把握でき、ドキュメントの管理を簡易化することができる。
次に、第2実施形態における、分類情報(目次、索引)を階層化させる場合の分類情報作成処理について、図14に示すフローチャートを参照しながら説明する。なお、図10に示すフローチャートを用いた説明と共通する部分については説明を省略する。
ここでは、前述と同様にして、図11に示すような帳票イメージ(ドキュメント)を表示させ、この帳票イメージから分類情報の作成に利用する項目(文字列)に該当する範囲をユーザによって選択させる(ステップC4)。
ここで、ユーザ操作により選択された領域を示す座標データ(xy座標系における矩形状の項目枠を定義する対角の頂点(2点))を選択領域情報として記憶しておく(ステップC5)。また、選択された領域(座標)に対するキー名の指定を、ユーザによって入力させて、座標データと対応づけて記憶しておく(ステップC6)。例えば、図11に示す領域選択範囲1に該当する部分には、受注日を表す文字列が存在していることから、キー名として「受注日」が入力される。
以下、同様にして、ユーザ操作によって帳票イメージから複数の領域を任意に選択させることができる。帳票イメージ中で指定された領域については座標データを記録すると共に、この領域に対するキー名を入力して対応づけて選択領域情報として記録する(ステップC4〜C7)。
図11では、2つの領域(領域選択範囲1,2)が選択された例を示している。この場合、選択領域情報としては、例えば図15に示すように、各領域における座標データとキー名とが対応づけて記憶される。
こうして領域の選択が終了すると、選択領域情報をもとにして分類設定情報を作成する(ステップC8)。
すなわち、図16に示すように、ドキュメント情報71に分類設定情報を記憶するための領域を示す分類設定情報アドレス71aを追加し、このアドレスが示す領域に分類設定情報90を記憶させる。
図15に示すように選択領域情報に2つの領域についての情報が記憶されているので、図16に示すように、分類設定情報90には、目次数として「2」、目次名1として1番目に入力されたキー名「受注日時」、目次名2として2番目に入力されたキー名「受注コード」が記憶される。
なお、前述した説明では、目次を作成する場合の操作を対象としているが、索引を作成する場合にも同様の処理が実行されるものとする。すなわち、帳票イメージ中から索引の対象とする領域範囲をユーザにより選択させ、その領域についてのキー名を入力して分類設定情報90に記憶させる。
図16に示す分類設定情報90の例では、索引の対象として「得意先コード」に該当する領域が選択されてキー名が入力された例を示しており、索引数として「1」、索引名1として「得意先コード」が記憶されている。
なお、分類情報の目次と索引の何れを作成するかは、予め分類情報作成処理の起動時に指定する、あるいは図11に示すように、ユーザに対して帳票イメージに対して領域を選択させる際に、目次に用いる項目を選択するための領域指定であるか、索引に用いる項目を選択するための領域指定であるかを任意に選択させるようにしても良い。
こうして、分類設定情報90の追加が完了すると、以下に説明するように、各ページについて分類設定情報90に基づく分類識別情報の追加を行う。
まず、現在処理対象としているドキュメントに含まれる帳票イメージの総ページ数を変数PageCntに設定する(ステップC9)。図16に示すドキュメントの場合には、基本索引情報72にあるように、ページ1〜3の3つのページのアドレスが記憶され、それぞれに対応するページ1,2,3のデータ73,74,75が定義されているので変数PageCnt=3と設定する。
ここで、処理対象とするページを示す変数PageWkに1を設定し(ステップC10)、変数PageWkの値が変数PageCntが示す値以下である場合、すなわち全てのページについての処理が完了していなければ(ステップC11、Yes)、選択領域情報に記録された選択領域数を変数SelCntにする(ステップC12)。また、処理対象とする選択領域を示す変数SelWkに1を設定する(ステップC13)。
ここで、変数SelWkの値が変数SelCntが示す値以下である場合、すなわち全ての選択領域についての処理が完了していなければ(ステップC14、Yes)、選択領域情報に記憶されたユーザにより選択された1番目の領域内のイメージから文字情報を取得する(ステップC15)。
すなわち、選択領域情報に記憶にした領域を示す座標データをもとに、ドキュメント情報ブロック16aに展開されたイメージデータ79から部分イメージを切り出し、この部分イメージに対して文字認識処理を実行する。
こうして、ユーザにより選択されたイメージ中から文字情報が取得されると、この文字情報を図16に示すように、ページ1のデータ76の分類識別情報アドレスが示す領域に分類識別情報91を記憶させる。
図11に示す領域選択範囲1が指定された場合には、図16に示すように、ページ1に対する分類識別情報81として「平成12年04年01日」が記憶される。
そして、処理対象とする選択領域を示す変数SelWkをインクリメント(+1)し、次の選択領域に対する処理に移行する。以下、同様にして、選択領域情報に記憶された各選択領域に該当する部分イメージから文字認識処理により文字情報を抽出し、分類識別情報91に記憶させる(ステップC14〜C17)。この結果、選択領域情報に記憶されたキー名「受注コード」に該当する領域についての文字情報「1001」についても分類識別情報91に記憶される。
なお、図16に示す分類識別情報91に記憶された文字情報「50001」は、索引の対象として選択された領域から抽出された文字情報である。前述した目次の場合と同様にして、選択された領域内の部分イメージから文字情報が抽出されて記憶されたものとする。
ここで、変数SelWkの値が変数SelCntが示す値以下ではなく、全ての選択領域についての処理が完了すると(ステップC14、No)、処理対象とするページを示す変数PageWkをインクリメント(+1)し、次のページに対する処理に移行する(ステップC18)。
以下、前述と同様にして、各ページにおけるユーザにより設定された領域に該当する部分イメージから文字認識処理により文字情報を抽出し、例えば図16に示すように、それぞれのページに対する分類識別情報92,93を記憶する(ステップC11〜C18)。
変数PageWkが変数PageCnt以下ではなくなることで全てのページについての処理が完了すると(ステップC11、No)、分類情報作成処理を終了する。
こうして、階層化した分類情報を図16に示す分類識別情報91,92,93のようにして記憶することで、第1実施形態と同様にして、図8に示すような階層化された目次を表示させることが可能となる。
なお、図15に示す選択領域情報には、座標データに対応するキー名を入力して記憶させるものとしたが、キー入力の入力を省略することも可能である。また、分類識別情報91,92,93には、帳票イメージから抽出した文字情報のみを記憶させているが、選択領域に記憶されたキー名を共に記憶するようにしても良い。
また、第2実施形態では、ドキュメント情報ブロック16aに展開されるイメージデータ(帳票イメージ)は、全てのページが、図11に示すような同一のフォーマットを有しているものとして説明しているが、複数のフォーマットのページが混在していても良い。この場合、各フォーマットに対して、ユーザにより領域範囲を指定させるようにする。
また、第2実施形態において、文字認識処理によって得られた文字列をそのまま分類情報として用いるものとしているが、文字認識により得られた文字列の一部を文字情報として記憶するようにしても良い。
また、第1及び第2実施形態において、複数の項目を選択して階層化された目次(索引)を作成する場合、複数の項目に対する階層レベルを、各項目ごとに任意に指定できるようにして、この指定に応じた階層化された目次を作成するようにしても良い。
このようにして、帳票データがイメージデータである場合に、任意に階層化された分類情報を作成できるので、帳票イメージの管理をより簡易化することが可能となる。
さらに、上記実施の形態には種々の段階の発明が含まれており、開示される複数の構成要件における適宜の組み合わせにより種々の発明が抽出され得る。例えば、実施の形態に示される全構成要件から幾つかの構成要件が削除されても、発明が解決しようとする課題の欄で述べた課題の少なくとも1つが解決でき、発明の効果の欄で述べられている効果の少なくとも1つが得られる場合には、この構成要件が削除された構成が発明として抽出され得る。
また、本実施形態における帳票出力装置を実現するコンピュータに実行させることのできる分類情報作成プログラムを、例えば磁気ディスク(フレキシブルディスク、ハードディスク等)、光ディスク(CD−ROM、DVD等)、半導体メモリなどの記憶媒体に書き込んで、あるいは通信媒体を通じて提供することができる。分類情報作成プログラムによりコンピュータの動作を制御することで、前述した実施形態における機能を実現することができる。
また、分類情報としては1.2.などの数字、イ、ロ、ハなどの一連の文字などでもよく、また、記号であってもよい。
10…CPU、11…入力装置、12…表示装置、13…印刷装置、14…通信制御装置、15…ROM、16…RAM、16a…ドキュメント情報ブロック、16b…ドキュメント表示データ、16c…目次表示データ、17…記憶装置、17a…帳票出力プログラム、17b…レイアウトスペックファイル、17c…データファイル。