JP4065484B2 - 帳票検索システム - Google Patents

帳票検索システム Download PDF

Info

Publication number
JP4065484B2
JP4065484B2 JP2001340606A JP2001340606A JP4065484B2 JP 4065484 B2 JP4065484 B2 JP 4065484B2 JP 2001340606 A JP2001340606 A JP 2001340606A JP 2001340606 A JP2001340606 A JP 2001340606A JP 4065484 B2 JP4065484 B2 JP 4065484B2
Authority
JP
Japan
Prior art keywords
similarity
template
index
template form
registered
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2001340606A
Other languages
English (en)
Other versions
JP2003141447A (ja
JP2003141447A5 (ja
Inventor
健一 数見
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Inc
Original Assignee
Canon Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Inc filed Critical Canon Inc
Priority to JP2001340606A priority Critical patent/JP4065484B2/ja
Publication of JP2003141447A publication Critical patent/JP2003141447A/ja
Publication of JP2003141447A5 publication Critical patent/JP2003141447A5/ja
Application granted granted Critical
Publication of JP4065484B2 publication Critical patent/JP4065484B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Landscapes

  • Character Input (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Image Analysis (AREA)

Description

【0001】
【発明の属する技術分野】
本発明は、大量の帳票を処理する分野で帳票のフォーマット毎に分類するシステムを構築する際に自動分類を可能にする帳票検索システムに関するものである。
【0002】
【従来の技術】
従来、検索帳票のフォームと一致するテンプレート帳票を検索するには、登録済みのテンプレート帳票の代表的な特微量を比較し、一致すれば更に細かい特微量を比較する全数チェックに近いことを行ってきた。
【0003】
【発明が解決しようとする課題】
しかしながら、代表的な特微量で検索対象を絞り込んだ場合は、代表的な特微量は一致しないが、詳細な特微量が一致している帳票に対しては検索漏れが発生する。
【0004】
ところが、全数チェックでは、テンプレート帳票が非常に多い場合には、特微量の比較計算に時間が掛かり、自動認識システムとしては実用的でなくなる。
【0005】
本発明は上記問題に鑑みてなされたもので、その目的とする処は、同一のテンプレート帳票の二重登録を防ぐことができる帳票検索システムを提供することにある。
【0006】
【課題を解決するための手段】
上記課題を解決するため、本発明の帳票検索システムは、帳票を画像データとして読み取る画像入力手段と、該画像入力手段で読み取った画像の特微量に基づいて当該画像をテキスト部分とテーブル部分とを含む複数の部分に分割する分割手段と、該分割手段で分割されたテキスト部分の文字を認識する文字認識手段と、前記分割手段で分割されたテーブル部分のテーブル構造を識別する識別手段と、該識別手段で識別されたテーブル構造と、前記文字認識手段により認識された文字とをページレイアウトを示すページデータに対応づけたページ書式データを作成するページ書式データ作成手段と、該ページ書式データ作成手段によりテンプレート帳票から作成されたページ書式データを保存する保存手段と、テーブルの個数に対してその個数と一致するテーブルを含むテンプレート帳票を対応づけたテーブル個数インデックスと、セルの個数に対してその個数と一致するセルを持つテーブルを含むテンプレート帳票を対応づけたセル個数・テンプレート帳票インデックスと、ページ書式データ間の類似度を計算する類似度計算手段とを備え、新規に登録帳票のページ書式データを前記保存手段に登録しようとする際に、前記テーブル個数インデックス及び前記セル個数・テンプレート帳票インデックスを参照して、当該登録帳票とテーブルの個数及び各テーブルのセルの個数が一致するテンプレート帳票を取得する第1の取得手段と、前記ページ書式データ作成手段により前記登録帳票から作成されたページ書式データと、前記第1の取得手段により取得されたテンプレート帳票について前記保存手段に保存されたページ書式データとの類似度を前記類似度計算手段により計算し、当該類似度により一致する帳票が既に保存されている場合に当該登録帳票の登録を禁止する重複登録防止手段と、前記テーブル個数インデックス及び前記セル個数・テンプレート帳票インデックスを参照して、当該登録帳票とテーブルの個数が一致し、各テーブルのセルの個数の差が所定値以内であるテンプレート帳票を取得する第2の取得手段と、前記第1の取得手段により取得されたテンプレート帳票で、前記類似度計算手段により計算された類似度が閾値以上であるテンプレート帳票を前記登録帳票と対応づけて第1の類似度インデックスに登録し、前記第2の取得手段により取得されたテンプレート帳票で、前記類似度計算手段により計算された類似度が前記閾値以上であるテンプレート帳票を前記登録帳票と対応づけて第2の類似度インデックスに登録する類似度インデックス登録手段と、前記テーブル個数インデックス及び前記セル個数・テンプレート帳票インデックスを参照して、検索帳票とテーブルの個数及び各テーブルのセルの個数が一致するテンプレート帳票を取得する第3の取得手段と、前記ページ書式データ作成手段により前記検索帳票から作成されたページ書式データと、前記第3の取得手段により取得されたテンプレート帳票について前記保存手段に保存されたテンプレート帳票のページ書式データとの類似度を前記類似度計算手段により計算し、類似度が最も高いテンプレート帳票に対応づけて前記第2の類似度インデックスに登録されたテンプレート帳票を取得する第4の取得手段と、前記第4の取得手段により取得されたテンプレート帳票に対応づけて前記第1の類似度インデックスに登録されたテンプレート帳票を取得する第5の取得手段と、前記ページ書式データ作成手段により前記検索帳票から作成されたページ書式データと、前記第4または第5の取得手段により取得されたテンプレート帳票について前記保存手段に保存されたテンプレート帳票のページ書式データとの類似度を前記類似度計算手段により計算し、当該計算結果及び前記第4の取得手段における計算結果において類似度が閾値以上となるテンプレート帳票を出力する出力手段とを備える。
【0008】
【発明の実施の形態】
以下に本発明の実施の形態を添付図面に基づいて説明する。
【0009】
<実施の形態1>
図1は本発明の実施の形態に係る帳票検索システムの概略構成を示すブロック図である。
【0010】
スキャナー1で読み取った画像は、2値化処理されて画像特微量抽出手段に送られる。黒ドットのヒストグラム法等の手法により、画像をテーブル、テキスト、画像等を領域毎に分割する。例えば、テーブル・ブロックであれば、罫線追跡手法等によってテーブルの詳細構造を求める。テキスト・ブロックであれば、文字認識手段で文字コードに変換する。
【0011】
このようにして取得した情報は、第2図に示す書式データとしてメモリ5及びディスク5に保存する。書式データは、帳票のページレイアウトを示す帳票ページデータと、この情報にリンクしたデーブル・データ及び帳票文字列データの3つのテーブルに分離している。この3つのテーブルをリンクするために、書式インデックス情報をメモリ5に保存している。
【0012】
このようなデータ構成をメモリ5に記憶するシステムは、キーボード3からテンプレート帳票の登録、帳票の検索等の命令を受け取り、それに対応する処理をプロセッサ2がこれらのデータを利用して行う。そして、その結果をディスプレイ6に表示する。
【0013】
以下、図3〜図5を参照して本実施の形態に係る帳票検索システム、特にプロセッサ2が実行する各種制御処理の動作について説明する。
【0014】
図3は本実施の形態の処理手順で使用するインデックス情報を示す図、図4はプロセッサ2がテンプレート帳票を登録する処理中の帳票フォームの重複チェックの手順を示すフローチャートである。
【0015】
スキャナー1で読み取った画像と、画像特微量抽出手段と文字認識手段により取得したデータを第2図に示す帳票書式データに構造化する。この書式データと既に登録しているテンプレート帳票の書式データが重複していないかをチェックする。
【0016】
S103では、登録帳票の各テーブルを抽出する。この段階では、仮のテーブルIDを与えておく。S105では、重複の可能性のあるテンプレート帳票を縛り込む。例えば、登録帳票は2つのテーブルを含み、各テーブルのセルの個数が4個と6個であったとすると、セル個数・テンプレート帳票IDインデックスとテーブル個数インデックスから該当するテンプレート帳票は、下記のの論理演算演算で、
{1,3,6,9 }And {1,3,4,6,10,12,13,15 }And {1,3,4,6,8,12,15}
{1,3,6 }の重複チェックすべき集合を取得した。
【0017】
この演算スピード上げるために、インデックスのテンプレート帳票IDは昇順に並んでいることは言うまでもない。
【0018】
S107では、この集合と登録帳票を類似度計算手段に入力して類似度を算出する。類似度計算手段では、100%一致する書式データが見つかれば、S111でその書式データが示す帳票文字列データと文字位置をも含めた文字列の比較を行う。文字列比較手段でも100%一致していれば、登録帳票は重複していると見なし、登録しないでに終了する。
【0019】
S109,S111で100%一致しなければ、S107で入力したテンプレート帳票以外の帳票の類似度を計算する。S121では、登録帳票とテーブル数が同じであるが、各テーブルのセルの個数が少し違う集合を抽出する。セルの個数の違いを類似度のペナルティにしている場合は、類似度が余り低くならないように予め閾値を決めてセル個数の違う組み合わせを選択する。
【0020】
登録テーブルのセル個数{4,6}に対して、{4,5},{5,5},{5,6}の3つの組み合わせの類似度を計算する。S105の処理と同様に、
{4,5}のテンプレート帳票の集合は、0
{5, 5}のテンプレート帳票の集合は、{8}
{5, 6}のテンプレート帳票の集合は、{4,12,15}
この集合と登録帳票を類似度計算手段に入力して類似度を算出する。
【0021】
S123,S125では、以上4つの集合の類似度を類似度インデックス1,2に反映する。類似度インデックス1は、{4,6}の集合で得たテンプレート帳票で、類似度が閾値以上に高かったテンプレート帳票のIDとその類似度を登録する。登録帳票は新たなIDを割り付けるため、このIDに対応するインデックスが1個増えることになり、そのレコードに情報を登録する処理と、登録したテンプレート帳票IDをインデックスとするレコードにも新しいIDの類似度を追加する処理を行う。
【0022】
類似度インデックス2は、後の3つの集合の中で、各々で最も類似度が高く、且つ、閾値以上であるテンプレート帳票IDを登録する。{5,5}、{5,6}の最大の類似度が共に閾値以上であれば、登録帳票のインデックスに対応するデータを2個登録する。前記と同様に、登録したテンプレート帳票IDをインデックスとするレコードの情報を更新する処理も行う。このように、類似度インデックスは、常に最新データを反映するようにする。
【0023】
図5はプロセッサが検索帳票に類似するテンプレート帳票を取得する手順を示すフローチャートである。
【0024】
S201〜S207は前記重複チェックの手順と同じである。S207で得た計算の結果、最も類似度の高いテンプレート帳票IDをインデックスとして類似度インデックス2を参照すると、テーブル・セルの個数の組み合わせの異なる類似度の最も高いテンプレート帳票を取得することができる。S211では、この情報を元に類似度インデックス1から類似度の高いテンプレート帳票の集合を取得することができる。
【0025】
これらの集合で再び類似度を計算して、S207までで得た結果を加味し、S215で類似するテンプレート帳票のリストを出力する。
【0026】
<実施の形態2>
次に、本発明の実施の形態2について説明する。
【0027】
本実施の形態では、テンプレート帳票の重複チェックで作成したインデックスを、帳票の検索処理で類似するテンプレート帳票を検索するのに利用するとしたが、テンプレート帳票と類似するテンプレート帳票のリストを出力する処理でも使用することができる。例えば、ユーザが選択したテンプレート帳票と類似するテンプレート帳票の一覧を表示するような場面を考えると、テンプレート帳票IDを入力し、このテンプレート帳票と類似するテンプレート帳票IDのリストを取得する機能が必要となる。類似度インデックス1を使用すれば、IDに対応するレコードに既に計算済みの類似度とテンプレート帳票IDリストを格納しているため、レコード検索処理のみで非常に速くリスト・アップすることができる。
【0028】
テンプレート帳票を削除する機能を有する帳票検索システムであれば、類似度インデックス2の構成では、次に示す類似度の再計算を行う必要が生じる。類似度インデックス2は、テーブル・セル個数の組み合わせパターンの各グループ中の最も類似度の高いIDとその類似度をリストしている。このリストに登録しているIDを削除した場合、このIDのグループで次に類似度の高いテンプレート帳票がリストされる類似度の閾値よりも高ければ、削除IDに代わってリストに登録する処理が発生する。
【0029】
しかし、グループ中次に類似度の高いIDの情報がないため、再度類似度計算を行う必要がある。削除IDの属するグループを類似度インデックス1からピック・アップし、そのテンプレート帳票の集合と、類似度インデックス2の当該レコードのテンプレート帳票との類似度の再計算である(図6参照)。
【0030】
テンプレート帳票8を削除すると仮定すると、類似度インデックス2からテンプレート帳票3と最も類似度が高いことが分かる。帳票3のインデックスに対応するデータから帳票8を削除するが、帳票3と帳票8のグループで、このリストの閾値80%を超える類似度の帳票が存在しているかも知れない。従って、次に類似度の高い帳票を計算することになる。
【0031】
このような再計算を避けるため、類似度インデックス2を閾値以上に類似度の高い帳票を全てリスト・アップするようにしても良い。削除処理では、このリストから該当するIDを削除するのみで、類似度の再計算を行わなくても良い。
【0032】
【発明の効果】
以上の説明で明らかなように、本発明によれば、帳票検索システムに、帳票を画像データとして読み取る画像入力手段と、該画像入力手段で読み取った画像の特微量に基づいて当該画像をテキスト部分とテーブル部分とを含む複数の部分に分割する分割手段と、該分割手段で分割されたテキスト部分の文字を認識する文字認識手段と、前記分割手段で分割されたテーブル部分のテーブル構造を識別する識別手段と、該識別手段で識別されたテーブル構造と、前記文字認識手段により認識された文字とをページレイアウトを示すページデータに対応づけたページ書式データを作成するページ書式データ作成手段と、該ページ書式データ作成手段によりテンプレート帳票から作成されたページ書式データを保存する保存手段と、テーブルの個数に対してその個数と一致するテーブルを含むテンプレート帳票を対応づけたテーブル個数インデックスと、セルの個数に対してその個数と一致するセルを持つテーブルを含むテンプレート帳票を対応づけたセル個数・テンプレート帳票インデックスと、ページ書式データ間の類似度を計算する類似度計算手段とを備え、新規に登録帳票のページ書式データを前記保存手段に登録しようとする際に、前記テーブル個数インデックス及び前記セル個数・テンプレート帳票インデックスを参照して、当該登録帳票とテーブルの個数及び各テーブルのセルの個数が一致するテンプレート帳票を取得する第1の取得手段と、前記ページ書式データ作成手段により前記登録帳票から作成されたページ書式データと、前記第1の取得手段により取得されたテンプレート帳票について前記保存手段に保存されたページ書式データとの類似度を前記類似度計算手段により計算し、当該類似度により一致する帳票が既に保存されている場合に当該登録帳票の登録を禁止する重複登録防止手段と、前記テーブル個数インデックス及び前記セル個数・テンプレート帳票インデックスを参照して、当該登録帳票とテーブルの個数が一致し、各テーブルのセルの個数の差が所定値以内であるテンプレート帳票を取得する第2の取得手段と、前記第1の取得手段により取得されたテンプレート帳票で、前記類似度計算手段により計算された類似度が閾値以上であるテンプレート帳票を前記登録帳票と対応づけて第1の類似度インデックスに登録し、前記第2の取得手段により取得されたテンプレート帳票で、前記類似度計算手段により計算された類似度が前記閾値以上であるテンプレート帳票を前記登録帳票と対応づけて第2の類似度インデックスに登録する類似度インデックス登録手段と、前記テーブル個数インデックス及び前記セル個数・テンプレート帳票インデックスを参照して、検索帳票とテーブルの個数及び各テーブルのセルの個数が一致するテンプレート帳票を取得する第3の取得手段と、前記ページ書式データ作成手段により前記検索帳票から作成されたページ書式データと、前記第3の取得手段により取得されたテンプレート帳票について前記保存手段に保存されたテンプレート帳票のページ書式データとの類似度を前記類似度計算手段により計算し、類似度が最も高いテンプレート帳票に対応づけて前記第2の類似度インデックスに登録されたテンプレート帳票を取得する第4の取得手段と、前記第4の取得手段により取得されたテンプレート帳票に対応づけて前記第1の類似度インデックスに登録されたテンプレート帳票を取得する第5の取得手段と、前記ページ書式データ作成手段により前記検索帳票から作成されたページ書式データと、前記第4または第5の取得手段により取得されたテンプレート帳票について前記保存手段に保存されたテンプレート帳票のページ書式データとの類似度を前記類似度計算手段により計算し、当該計算結果及び前記第4の取得手段における計算結果において類似度が閾値以上となるテンプレート帳票を出力する出力手段とを備えたため、同一のテンプレート帳票の二重登録を防ぐことができるという効果が得られる。
【図面の簡単な説明】
【図1】本発明の実施の形態に係る帳票検索システムの概略構成を示すブロック図である。
【図2】本発明に係る帳票検索システムの階層化した帳票書式データの模式図である。
【図3】登録・検索で使用するインデックス情報の一例を示すデータ構造を示す図である。
【図4】テンプレート帳票の登録で行う帳票フォームの重複チェックの手順を示すフローチャートである。
【図5】帳票検索の類似度計算の手順の一例を示すフローチャートである。
【図6】本発明の実施の形態2におけるインデックス情報の削除を説明する図である。
【符号の説明】
1 スキャナー
2 プロセッサ
3 キーボード
4 ディスク
5 メモリ
6 ディスプレイ

Claims (1)

  1. 帳票を画像データとして読み取る画像入力手段と、
    該画像入力手段で読み取った画像の特微量に基づいて当該画像をテキスト部分とテーブル部分とを含む複数の部分に分割する分割手段と、
    該分割手段で分割されたテキスト部分の文字を認識する文字認識手段と、
    前記分割手段で分割されたテーブル部分のテーブル構造を識別する識別手段と、
    該識別手段で識別されたテーブル構造と、前記文字認識手段により認識された文字とをページレイアウトを示すページデータに対応づけたページ書式データを作成するページ書式データ作成手段と、
    該ページ書式データ作成手段によりテンプレート帳票から作成されたページ書式データを保存する保存手段と、
    テーブルの個数に対してその個数と一致するテーブルを含むテンプレート帳票を対応づけたテーブル個数インデックスと、
    セルの個数に対してその個数と一致するセルを持つテーブルを含むテンプレート帳票を対応づけたセル個数・テンプレート帳票インデックスと、
    ページ書式データ間の類似度を計算する類似度計算手段とを備え、
    新規に登録帳票のページ書式データを前記保存手段に登録しようとする際に、前記テーブル個数インデックス及び前記セル個数・テンプレート帳票インデックスを参照して、当該登録帳票とテーブルの個数及び各テーブルのセルの個数が一致するテンプレート帳票を取得する第1の取得手段と、
    前記ページ書式データ作成手段により前記登録帳票から作成されたページ書式データと、前記第1の取得手段により取得されたテンプレート帳票について前記保存手段に保存されたページ書式データとの類似度を前記類似度計算手段により計算し、当該類似度により一致する帳票が既に保存されている場合に当該登録帳票の登録を禁止する重複登録防止手段と、
    前記テーブル個数インデックス及び前記セル個数・テンプレート帳票インデックスを参照して、当該登録帳票とテーブルの個数が一致し、各テーブルのセルの個数の差が所定値以内であるテンプレート帳票を取得する第2の取得手段と、
    前記第1の取得手段により取得されたテンプレート帳票で、前記類似度計算手段により計算された類似度が閾値以上であるテンプレート帳票を前記登録帳票と対応づけて第1の類似度インデックスに登録し、前記第2の取得手段により取得されたテンプレート帳票で、前記類似度計算手段により計算された類似度が前記閾値以上であるテンプレート帳票を前記登録帳票と対応づけて第2の類似度インデックスに登録する類似度インデックス登録手段と、
    前記テーブル個数インデックス及び前記セル個数・テンプレート帳票インデックスを参照して、検索帳票とテーブルの個数及び各テーブルのセルの個数が一致するテンプレート帳票を取得する第3の取得手段と、
    前記ページ書式データ作成手段により前記検索帳票から作成されたページ書式データと、前記第3の取得手段により取得されたテンプレート帳票について前記保存手段に保存されたテンプレート帳票のページ書式データとの類似度を前記類似度計算手段により計算し、類似度が最も高いテンプレート帳票に対応づけて前記第2の類似度インデックスに登録されたテンプレート帳票を取得する第4の取得手段と、
    前記第4の取得手段により取得されたテンプレート帳票に対応づけて前記第1の類似度インデックスに登録されたテンプレート帳票を取得する第5の取得手段と、
    前記ページ書式データ作成手段により前記検索帳票から作成されたページ書式データと、前記第4または第5の取得手段により取得されたテンプレート帳票について前記保存手段に保存されたテンプレート帳票のページ書式データとの類似度を前記類似度計算手段により計算し、当該計算結果及び前記第4の取得手段における計算結果において類似度が閾値以上となるテンプレート帳票を出力する出力手段と
    を有することを特徴とする帳票検索システム。
JP2001340606A 2001-11-06 2001-11-06 帳票検索システム Expired - Fee Related JP4065484B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2001340606A JP4065484B2 (ja) 2001-11-06 2001-11-06 帳票検索システム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2001340606A JP4065484B2 (ja) 2001-11-06 2001-11-06 帳票検索システム

Publications (3)

Publication Number Publication Date
JP2003141447A JP2003141447A (ja) 2003-05-16
JP2003141447A5 JP2003141447A5 (ja) 2005-08-18
JP4065484B2 true JP4065484B2 (ja) 2008-03-26

Family

ID=19154780

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2001340606A Expired - Fee Related JP4065484B2 (ja) 2001-11-06 2001-11-06 帳票検索システム

Country Status (1)

Country Link
JP (1) JP4065484B2 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105608452A (zh) * 2014-11-11 2016-05-25 金蝶软件(中国)有限公司 单据录入的方法和系统

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102831127B (zh) * 2011-06-17 2015-04-22 阿里巴巴集团控股有限公司 重复数据处理方法、装置及系统
CN105095842B (zh) * 2014-05-22 2018-12-11 口碑控股有限公司 一种单据的信息识别的方法和装置
JP6317280B2 (ja) * 2015-02-20 2018-04-25 日本電信電話株式会社 同種帳票ファイル選定装置、同種帳票ファイル選定方法、および、同種帳票ファイル選定プログラム
JP7069759B2 (ja) * 2018-01-31 2022-05-18 日本電気株式会社 帳票作成支援装置、帳票作成支援方法、及び、帳票作成支援プログラム
CN109829143B (zh) * 2018-12-28 2023-06-20 陈德芹 一种在线表格汇总方法及装置

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0728935A (ja) * 1993-07-07 1995-01-31 Oki Electric Ind Co Ltd 文書画像処理装置
JP3484446B2 (ja) * 1996-11-15 2004-01-06 シャープ株式会社 光学文字認識装置
EP1052593B1 (en) * 1999-05-13 2015-07-15 Canon Kabushiki Kaisha Form search apparatus and method

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105608452A (zh) * 2014-11-11 2016-05-25 金蝶软件(中国)有限公司 单据录入的方法和系统

Also Published As

Publication number Publication date
JP2003141447A (ja) 2003-05-16

Similar Documents

Publication Publication Date Title
US5745745A (en) Text search method and apparatus for structured documents
EP0752673B1 (en) Information processing method and apparatus for searching image or text information
JP2758826B2 (ja) 文書検索装置
JP4717049B2 (ja) 文書のページ番号を検出する方法及びシステム
JP3469345B2 (ja) 画像のファイリング装置及びファイリング方法
JPH11505052A (ja) 語彙辞書の検索範囲を削減するシステム及び方法
JP2004334334A (ja) 文書検索装置、文書検索方法及び記憶媒体
JP5978393B2 (ja) 計算機、記録媒体及びデータ検索方法
JP4065484B2 (ja) 帳票検索システム
JPH0772906B2 (ja) 文書認識装置
Mao et al. A dynamic feature generation system for automated metadata extraction in preservation of digital materials
JPH07152774A (ja) 文書検索方法および装置
JPWO2009048149A1 (ja) 電子文書の同等判定システムおよび同等判定方法
JP2005107931A (ja) 画像検索装置
JPH05159101A (ja) 文書論理構造認識および文書内容認識のための装置および方法
KR20140031269A (ko) 글꼴을 판별하는 방법 및 장치
JP3552318B2 (ja) 文書検索方法およびシステム
JP3727995B2 (ja) 文書処理方法及び装置
JP7326845B2 (ja) びまん性症例画像判定プログラム、システム、及び方法
JP2003141447A5 (ja)
JP4677750B2 (ja) 文書属性取得方法および装置並びにプログラムを記録した記録媒体
JP3985926B2 (ja) 文字認識方法、文字認識装置、文書画像処理システム及び記録媒体
JP3955410B2 (ja) 類似情報照合装置、類似情報照合方法、及び、類似情報照合プログラムを記録した記録媒体
CN112700830B (zh) 从电子病历中提取结构化信息的方法、装置及存储介质
AU2004262249B2 (en) Process of storage of biometric features

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20041108

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20041108

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20050120

RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20060106

RD03 Notification of appointment of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7423

Effective date: 20060110

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20070830

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20070904

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20071105

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20071225

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20080105

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110111

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120111

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130111

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140111

Year of fee payment: 6

LAPS Cancellation because of no payment of annual fees