JP2014235619A - 画像情報処理装置及び画像情報処理方法 - Google Patents

画像情報処理装置及び画像情報処理方法 Download PDF

Info

Publication number
JP2014235619A
JP2014235619A JP2013117396A JP2013117396A JP2014235619A JP 2014235619 A JP2014235619 A JP 2014235619A JP 2013117396 A JP2013117396 A JP 2013117396A JP 2013117396 A JP2013117396 A JP 2013117396A JP 2014235619 A JP2014235619 A JP 2014235619A
Authority
JP
Japan
Prior art keywords
image
document
index
information processing
type
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2013117396A
Other languages
English (en)
Other versions
JP6250307B2 (ja
Inventor
淳彦 山井
Atsuhiko Yamai
淳彦 山井
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Primagest Inc
Original Assignee
Primagest Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Primagest Inc filed Critical Primagest Inc
Priority to JP2013117396A priority Critical patent/JP6250307B2/ja
Publication of JP2014235619A publication Critical patent/JP2014235619A/ja
Application granted granted Critical
Publication of JP6250307B2 publication Critical patent/JP6250307B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

【課題】処理する対象が追加変更となっても、検索プログラムを新たに作り直す必要がなく所望の対象書類を検索可能な画像情報処理装置及び画像情報処理方法を提供する。
【解決手段】多種業務に係る多種の書類イメージを読み出し可能に記憶するイメージファイル230と、イメージファイル230に登録される書類イメージに表示されている文字情報の単語毎の文字列を書類イメージに対応するインデックスとする文字情報インデックス手段260と、書類イメージに書類種別IDを付与し、インデックスと対応付ける書類種別インデックス手段と、インデックス及び書類種別IDをイメージファイル230に登録されている書類イメージの読み出しキーワードとして記憶するインデックスファイル300とを備え、検索エンジン250は、インデックスファイル300を参照してイメージファイル230に記憶されている書類イメージを読み出すイメージ読み出し手段とを備える。
【選択図】図1

Description

本発明は、イメージ画像を登録し、登録したイメージ画像を検索可能な画像情報処理装置及び画像情報処理方法に関し、例えば、帳票をイメージ画像として登録し、将来の仕様変更にも柔軟に対処して検索可能な画像情報処理装置及び画像処理方法に関するものである。
近年おける業務の多様化に伴い、様々な業種において多種多様の書類や伝票、帳票等の帳票類が扱われる様になってきており、処理対象書類に記載されている情報中の必要情報は目視確認してキー入力してキャラクタ情報化し、入力済みの帳票はその後の入力結果に検証(入力情報の全文確認)する必要が生じたときに容易に取り出せる状態で保存していた。
その後、認識技術の向上に伴って帳票類をOCR装置などにより読み取って必要情報を文字認識してデジタル情報化するシステムが導入されてきている。そして、デジタル情報化した情報が正しく認識されているかを、別途、原帳票を目視確認しながら確認し、認識誤りがあればここで修正していた。
デジタル化が終了すると原帳票は保存期間が満了するまで倉庫などに保管されることになる。以上の処理でも、入力済みの帳票はその後の入力結果に検証(入力情報の全文確認)する必要が生じたときに容易に取り出せる状態で保存しなければならなかった。
その後、さらに記憶装置の大容量化が図られ、処理速度も原帳票類の表面・裏面をそのままイメージ化して保存可能になってきた。このため、原帳票類をそのままイメージ化してそのまま取り込み、このイメージ情報の一部領域を認識処理して例えばキャラクタデータ化して、認識処理が正しく行われたか否かも読み取ったイメージ情報を表示し、この表示情報を確認しながら行うことにより、一度イメージ情報化した帳票類は、現物を参照する必要をなくすことができる。
この種の装置においては、読み取ったイメージ情報を所定ファイルに登録する際に、当該イメージ情報を読み出してくることが可能なように所定の検索キーワードを設定して、設定したキーワードによりイメージを検索可能に構成することが望ましい。しかしながら、従来は帳票類をイメージデータ化して画像情報として登録し、登録した画像イメージを複数の処理システムで参照するものはなかった。
画像データのみを複数のシステムで検索するものではなく、テキストデータ(文書データ)を検索するシステムは多数提案されている。例えば、特許文献1では、キーワードとしては、文書を登録するシステムの目的に対応したキーワードを辞書からピックアップして限定したものであることが好ましいとしているが、辞書のデータそのままを使用する技術である。
特開2003−186884号公報
しかしながら、キーワードは初期の目的に応じたものとならざるを得ず、目的が異なるとキーワードも異なるため、目的が異なる処理をする必要が生じたような場合には、再度キーワードを決め、再設定しなければならなかった。
処理対象が帳票類であった場合であっても、処理する帳票が異なる場合にはキーワードの項目も一から選定し直す必要があり、処理対象が異なるとその都度処理システムを設計し直す必要があった。
例えば、処理対象が税公金の納付書イメージの検索システムを口座振替依頼書の検索に使用しようとした場合、納付書のイメージ検索時のキーは、銀行収納日付、収納店、収納市町村・企業名、金額などとなる。一方、口座振替依頼書イメージの検索では、店番・科目・口座番号(以下口座番号と略す)、登録日、委託会社コードなどがキーとなる。このように、キー項目が全く異なるため、まったく異なる2つの検索システムにならざるをえない。
このように、従来の処理システムでは、処理する業務メニューと業務毎の検索プログラムが一対であり、業務の追加/帳票の追加変更時にシステム変更、検索プログラムの変更が必要であった。画像データを登録する場合でもまったく同じである。
これを防ぐには、将来追加する可能性のある業務のキーを事前に全て洗い出しておく必要性があるが、現実には不可能である。
又、入手金伝票などは一度処理してしまうと将来的に繰り返し元の帳票を参照する必要性は低いが、銀行のローン申込み書類や許可決裁書類などは繰り返し参照する可能性が高く、検索の都度別の領域の記載情報を確認したい場合も多い。このため、イメージ情報の検索キーとしては全文が検索対象とできることが望ましい。
本発明は、上述した課題を解決することを目的としてなされたもので、処理する帳票類、業務の変更があっても、検索プログラムを変更などする必要がない画像情報処理装置及び画像情報処理方法を提供することにある。
係る目的を達成する一手段として例えば以下の構成を備える。すなわち、多種業務に係る多種の書類イメージを記憶する画像情報処理装置であって、前記書類イメージを読み出し可能に記憶するイメージ記憶手段と、前記イメージ記憶手段に登録される書類イメージに表示されている文字情報に対応するデジタル情報において、文字情報の単語毎の文字列を前記書類イメージに対応するインデックスとする文字情報インデックス手段と、前記書類イメージの種別毎に固有の書類種別IDを付与し、前記インデックス特定手段によるインデックスと対応付ける書類種別インデックス手段と、前記インデックス及び前記書類種別IDを前記イメージ記憶手段に登録されている書類イメージの読み出しキーワードとして記憶するインデックス記憶手段とを備えることを特徴とする。
そして例えば、前記インデックス記憶手段に記憶されている前記インデックス及び前記書類種別IDを受け取り、該受け取ったインデックス及び書類識別IDの全てで特定される前記イメージ記憶手段に記憶されている書類イメージを読み出すイメージ読み出し手段とを備えることを特徴とする。
また例えば、前記書類イメージは帳票イメージであり、処理対象書類種別の追加時には、前記書類種別インデックス手段は新たに追加される書類種別に固有の書類種別IDを付与し、前記文字情報インデックス手段は、追加された処理対象書類に表示されている文字情報に対応する文字列をインデックスとして前記インデックス記憶手段に追加登録することで対応可能であることを特徴とする。更に例えば、前記文字情報インデックス手段は前記処理対象書類に表示されている全文をインデックス対象とすることを特徴とする。
又は、多種業務に係る多種の書類イメージを記憶する書類イメージ記憶手段と該書類イメージ記憶手段に記憶されている書類イメージに対するインデックス情報を記憶するインデックス記憶手段を備える画像情報処理装置における画像情報処理方法であって、前記書類イメージ記憶手段に記憶される前記書類イメージに表示されている文字情報を認識して単語毎の文字列の全てを前記書類イメージに対応するインデックスとして抽出し、前記書類イメージの種別毎に固有の書類種別IDを付与し、前記抽出したインデックスと対応付け、書類イメージに対するインデックス情報として前記インデックス記憶手段に記憶させることを特徴とする。
そして例えば、前記インデックス記憶手段に記憶されている前記インデックス及び前記書類種別IDを受け取り、該受け取ったインデックス及び書類識別IDの全てで特定される前記イメージ記憶手段に記憶されている書類イメージを読み出すことを特徴とする。
又例えば、前記書類イメージは帳票イメージであり、処理対象書類種別の追加時には、新たに追加される書類種別に固有の書類種別IDを付与し、追加された処理対象書類に表示されている文字情報に対応する文字列をインデックスとして前記インデックス記憶手段に追加登録することで対応可能であることを特徴とする。
本発明によれば、処理する対象書類が追加変更となっても、検索プログラムを新たに作り直す必要がなく所望の対象書類を検索可能な画像情報処理装置及び画像情報処理方法を提供できる。
本発明に係る一実施の形態例の画像情報処理装置の全体構成を示すブロック図である。 本実施の形態例に係る処理帳票の例を示す図である。
本実施の形態例に係る画像情報処理装置の図2に示す帳票のインデックス、イメージファイルへのパス等の生成例を説明するための図である。 本実施の形態例に係る画像情報処理装置の処理対象帳票の例と帳票表示キャラクタデータファイルの例、イメージ格納ファイルの生成例を説明するための図である。
本実施の形態例に係る画像情報処理装置のインデックス生成用ファイルとインデックスファイル、イメージファイルへのパス等の生成例を説明するための図である。 本実施の形態例に係る画像情報処理装置のインデックス生成用ファイルとイメージ参照インデックスファイルの関係を説明するための図である。
本実施の形態例に係る画像情報処理装置のイメージ検索処理を説明するための図である。
以下、本発明に係る一発明の実施の形態例について添付図面を参照して詳細に説明する。本実施の形態例では、イメージ化した情報に対応して略全文検索が可能な画像情報処理装置及び画像情報処理方法を提供するものである。
本実施の形態例では、個別業務という考え方を持たない、自由な検索用キーの設定を可能とすることによって、検索業務毎の検索システムの設計を行う必要がなく、異なる業務間で串刺しに検索できる点に特徴を有している。
以下の本実施の形態例の説明は、例えば金融機関で処理する帳票類を検索するシステムに最適な装置及び処理方法を提供する例について説明を行う。更に、イメージの長期蓄積後においてもパフォーマンスの低下を起こさない情報処理システムとする。しかしながら、金融機関の処理帳票に限定されるものではなく、登録し、検索するイメージの種別に限定はない。
まず、図1を参照して本実施の形態例における画像情報処理装置の概略構成を説明する。図1は本発明に係る一実施の形態例の画像情報処理装置の全体構成を示すブロック図である。
図1において、10は登録されているイメージ情報の検索を行う操作端末である。110〜130は金融機関の帳票を処理するシステムであり、110は口座振替処理を行う口座振替システム、120は入出金伝票の処理を行う入出金伝票処理システム、130は法人に対する融資に関する処理を行う法人融資処理システムである。各システムは個別に備えなければならないものではなく、全ての処理に共通のひとつの構成であっても良い。
各システムは少なくとも150に示す構成を備えている。即ち、処理する書類のイメージを読み取るイメージリーダ151、イメージリーダ151で読み取ったイメージから必要な文字、数字情報を認識してデジタルデータに変換するデータ認識部152、データ認識部152で認識したデータから当該イメージ情報を検索する際のキーワードを抽出するキーワード抽出部153、読み取ったイメージ情報、抽出したキーワードを書類イメージ蓄積/検索装置200に出力するとともに、データ認識部152の認識結果の校正などを行う入出力部155などから構成される。
これら処理システム150では、イメージリーダ151で処理対象帳票の表裏表示情報をイメージ情報として読み取る。そして、読み取ったイメージデータ中の所定領域に表示されている文字・数字データを、データ認識部152で文字認識し、例えば、認識したデータと対応する読み取りイメージの双方を並列表示し、認識結果の確認校正を行なう。
例えば、多種業務に係る多種の書類イメージを読み出し可能に記憶するイメージファイル230と、イメージファイル230に登録される書類イメージに表示されている文字情報に対応するデジタル情報において、文字情報の単語毎の文字列を前記書類イメージに対応するインデックスとするとともに、前記書類イメージの種別毎に固有の書類種別IDを付与し、インデックスと対応付け、前記インデックス及び前記書類種別IDをイメージファイル230に登録されている書類イメージの読み出しキーワードとして記憶するインデックスファイル300とを備え、検索エンジン250はインデックス及び書類種別IDを受け取り、インデックスファイル300を参照して受け取ったインデックス及び書類識別IDの全てで特定されるイメージファイル230に記憶されている書類イメージを読み出すイメージ読み出し手段とを備えることを特徴とする。
そして、認識結果が正しいものと確認後に後述するキーワード抽出方法により抽出したキーワード及び読み取ったイメージ情報を入出力部155を解して書類イメージ蓄積/検索装置200に送ることになる。
200は各処理システムなどで読み取った書類イメージを蓄積し、必要に応じて蓄積した書類イメージを検索して取り出せる書類イメージ蓄積/検索装置であり、書類イメージを登録保持するイメージファイル230、イメージファイル230に登録されているイメージファイルを検索する検索エンジン250、インデックスファイル300より所望のインデックス(検索キーワード)を読み出し検索エンジン250に供給するインデクサ260を備えている。
300はキーワード抽出部153で抽出したキーワード情報を登録保持するインデックスファイル300である。
以上の構成を備える本実施の形態例の処理対象である金融機関での取扱い書類のイメージは、実務的には削除をしにくい。法律上も7年間、あるいは10年間の保管を要求され、かつ保管する枚数も非常に多くなる。
例えば、入出金伝票などは、小規模地方銀行でも一日当たり2万枚くらいはあり、年間500万枚以上となる。メガバンクでは年間5千万枚以上が想定される。このため、これらの書類をイメージ化して検索できるようにすることによりいちいち帳票類を確認する必要がなくなり、単に倉庫などに一括して保存しておけば良く、又、帳票類を破棄した後もイメージ情報として保存しておけばスペースもほとんど必要としない。
しかしながら、上記のような多量の帳票イメージを処理する環境の中で所望の帳票イメージを検索する処理のパフォーマンスを維持するには、比較的単純なインデックスしか使用できない。特に、インデックスなしのデータ項目に対する検索はレスポンスを期待できない。
本実施の形態例では、以上のことから、各個別の業務処理過程で得られた帳票読み取りイメージ情報を利用することとし、元の帳票などは倉庫などに格納して保存しコードデータの全てをキーとし、データ項目名を全文検索のインデックスに加えておき、検索時にデータ項目名と実体を論理積(AND)で検索するようにしている。これにより、アプリケーションに依存しない、汎用利用可能なイメージ検索システムが実現できる。
以下に本実施の形態例の検索方法の概要を具体例を用いて説明する。
例えば、「今日は良い天気です。」という文字列をバイグラムのインデックスを作成する場合、まず対象となる文書のIDを割り振り、例えば1番とする。続いて次のような索引情報を生成する。
「今日 1」
「日は 1」
「は良 1」
「良い 1」
「い天 1」
「天気 1」
「気で 1」
「です 1」
「す。 1」
「。 1」
又、同様に、「今日は大雨です。」という文書のIDを 2番とし、次の検索情報(バイグラム情報)を生成する。
「今日 2」
「日は 2」
「は大 2」
「大雨 2」
「雨で 2」
「です 2」
「す。 2」
「。 2」
本実施の形態例では、この文書ID 1番と2番の文書を合算した索引情報を、以下のように割り当てる。
「今日 1,2」
「日は 1,2」
「は良 1」
「良い 1」
「い天 1」
「天気 1」
「気で 1」
「です 1,2」
「す。 1,2」
「。 1,2」
「は大 2」
「大雨 2」
「雨で 2」
これが本実施の形態例におけるバイグラムによる転置インデックスである。このようにして作られた索引情報を使って「天気」という文字列を検索するには、文書IDが1番の文書が該当する。また、「今日」という文字列を検索すると文書IDが1番と2番の文章が該当する。
そして、「今日」と「大雨」という2つの文字列を含む文書を探す場合には,「今日」の検索結果と「大雨」の検索結果を論理積(AND)条件で合成すると、文書IDが2番という結果が得られる。以上の検索方法が本実施の形態例の検索方法の基本をなしている。
次に、実際の帳票イメージに適用した具体例を次に説明する。本実施の形態例では、各業務で共通のイメージ参照基盤を使う。具体的には、図2に示す税公金の納付書イメージと口座振替依頼書のイメージを管理する場合に、表示内容を当該イメージを検索するための処理は以下のようになる。
インデックスの中にキーの属性(名前)を含んでインデックス化し、例えば、税公金の納付書イメージの参照と口座振替依頼書で共通のイメージ参照基盤を使うためには、次のように行う。
納付書(税公金)を登録してイメージ検索処理するシステムでは、表示されている以下の項目を検索キーワードとする。
例えば、コードデータとして、納付書に表されている銀行収納日付、収納店、収納市町村・企業名、金額等が得られる。
システムを作成する際の図2に示すデータのインデックスは、例えば、納付済通知書(以後「済通」と省略。)である旨の情報となる。文書IDとしては済通に表示されている以下の情報等である、
銀行収納日付、例えば「2013/01/15」、
収納店。例えば、「102」、
収納市町村名「○○市」、
金額、例えば「4万円」、
上記のそれぞれを一単語とし、全文検索インデックスを生成する。なお、このときの文書ID部はそれぞれイメージ格納先のパスを関連付ける(紐づける)。
口座振替依頼書を登録してイメージ検索処理する場合の例では、インデックスとしては、例えば、口座振替依頼書登録の業務処理過程で得られた、口座振替依頼書である旨の情報である旨の情報であり、
文書IDとしては、口座振替依頼書に表示されている以下の情報等である。
登録日付例えば「2013/01/15」、
口座番号例えば「47192202050264」、
委託会社コード例えば「0264」、
委託会社名「□□株式会社」
をそれぞれ一単語として全文検索インデックスを生成する。なお、このときの文書ID部はそれぞれイメージ格納先のパスを関連付けている(紐づける)。
以上の場合における全文検索インデックスとイメージの関係を図3に示す。
本実施の形態例では、論理的な単語とイメージの関係を示しただけというシンプルな構成であり、物理的なインデックステーブルの構造は、図3に示す様に、イメージのインデックスと、該インデックスに対応するイメージへのポインタ情報が得うイメージへのポインタごく簡単な構成としている。
単純に全文検索を利用、例えば、番号、日付、氏名や住所を含んだ検索キーワードで検索する場合には、次のような不都合が発生する。例えば口座番号の「47192202050264」をキーとしてインデックスにおき、「471922」の検索をかけると「471922」を含んだ全てがヒットしてしまう。業務では、数字番号をキーとしているものは非常に多い。
例えば、銀行業務に限っても、口座番号に類似のものとして、CIF番号、案件番号、稟議書番号、受付番号がある。同様に、日付にしても、受付日、処理日、登録日、回答日、受領日、実行日、解約日、発行日等がある。住所をキーワードとする場合においても、本人住所、勤務先住所、保証人住所、物件所在地などあり、効率の良い検索を行うためには、これらを区別して検索する必要がある。
このためには、XML等を使って同じ属性のデータだとシステムに知らせなければならないが、同じ属性のデータだとシステムに知らせることは本質的にデータ項目を定義し構造化することに該当し、業務の追加に対応するのが難しく(弱く)なる。
このため、本実施の形態例では、データ項目名を全文検索のインデックスに加えておきながら、検索時にデータ項目名と実体のインデックスを論理積(AND)で検索することで解決している。これにより、先の登録時に予定していない他業務についての処理を追加するときに、参照業務プログラムの追加変更を行わず業務の追加を行える。
例えば、処理システム150のイメージリーダ151で図2に示す納付済通知書を読み込み、データ認識部152で認識し、キーワード抽出部163で抽出した納付済通知書処理結果ファイルの例及び納付済通知書イメージファイル(イメージファイル230)の具体例を図4に示す。
図4は、図2に示す納付済通知書から、各データ項目名及び内容「○○市」、「4万円(収納税額)」、「102(収納銀行店コード)」、「2013/01/05(銀行収納日)」、及びイメージファイルの格納座標である「イメージへのパス」を生成してインデックスファイル300に格納した状態を示している。
続いて、処理システム150では、生成した納付済通知書処理結果ファイルに帳票名とデータ項目名を追加したインデックス生成用ファイルを作成することになる。図5の左側に示すのが図4に示す納付済通知書処理結果ファイルに帳票名とデータ項目名を追加したインデックス生成用ファイルである。図5は納付済通知書の帳票IDとして「123」を割り当てた例である。
インデックス生成用ファイルは書類イメージ蓄積/検索装置200に送られ、処理結果イメージファイル230に格納した論理的な単語をインデックスとしてインデックスファイル300に帳票ID123のファイルにイメージ毎にイメージファイルへのパス情報(格納座標情報)とともに格納することになる。
以上の説明は、納付済通知書について行ったが、口座振替依頼書においてもまったく同様に口座振替依頼書の「委託会社名:□□株式会社」「口座番号:47 192202020264」「口座名義人/印鑑」(収納市町村名、収納店)について同様に処理結果ファイル、インデックス生成用ファイルを作成する。そして、図6に示すように、両方のインデックスを合成又は納付済通知書インデックスに追加することによりインデックスファイルを生成する。
即ち、既存の帳票インデックスに共通に処理したい帳票のインデックス生成用ファイルの内容を追加したり、合成したりするのみで良い。例えば、図3に示すように、処理対象帳票に追加や変更があっても、単に新たに追加となったインデックスを追加するのみで良く、検索時もインデックス(検索キー)を指定するのみでよい。
即ち、図3の例では、「委託会社コード0264」がインデックスとして設定されるのに比し、従来では「委託会社」としての項目にインデックスを割り当て、続いてその下に「0264」というインデックスを割り当てなければならず、口座振替依頼書処理システムでこの「委託会社コード」が項目としてない場合には、新たに「委託会社」としての項目を設ける必要があり、口座振替依頼書処理システムとはまったく別のシステム設計が必要となっていた。本実施の形態例ではこのようなシステム再構築が不要である。
本実施の形態例では、イメージ情報を検索することが目的であり、細かいデジタルデータを抽出する必要がないことに着目したもので、このようなイメージ検索システムに特有の検索方法については従来ほとんど注目もされていなかったのであり本願発明に特有のものである。
以上説明したように本実施の形態例では、各業務で共通のイメージ参照基盤とするため、帳票に表示されている各論理的単語全体をインデックスとして取扱い、論理的な単語とイメージの関係を関連付けたのみであるため、他の帳票や項目の追加があっても、単に追加合成するのみで足り、イメージ情報登録/検索システムの仕様変更などにも極めて容易に対応できる。
以上の様にしてイメージファイル230に登録したイメージ情報をインデックスファイル300を利用して検索する処理を図7も参照して以下に説明する。
イメージ情報を検索(参照)する場合には、帳票名(例えば納付済通知書あるいは口座振替依頼書等)とデータ項目名を論理和(AND)条件をかけて検索処理を行う。例えば、インデックスファイル300に帳票IDを指示すれば、イメージファイル230から帳票IDに対応するイメージファイルが特定され、続いて帳票を特定するためのインデックスを指定することになる。
例えば、操作端末10から図7に示すように検索キーとして「済通」で「収納市町村名○○市」を指定すると、検索エンジン250、インデクサ260はインデックスファイル300をアクセスして帳票ID「123」を得る。これにより、イメージファイル230の納付済通知書イメージファイルが対象イメージファイルであることが特定される。
ここでイメージ数がさほど多くない場合にはこのイメージファイルを順次確認して所望もイメージを特定すればよい。しかし、イメージ数が多い場合には、「102(収納銀行店コード)」、「2013/01/05(銀行収納日)」、「4万円(収納税額)」といったインデックスのいずれか、あるいは全てを指定して所望のイメージを得ることが可能となる。
以上説明したように本実施の形態例によれば、処理対象の書類種別が追加となった場合にも、単に書類種別IDを追加割り当てし、処理対象書類に表示されている文字列からインデックスを抽出して単にインデックスファイル300に追加登録するのみで、容易に対応でき、イメージファイル230に登録した書類イメージを検索することができ、この場合にも新たに検索プログラムをを作成する必要がなく、新たにイメージファイル230に登録する書類に表示されている文字列を単に検索のためのインデックスとしてインデックスファイル300に登録するのみで実現する。
以上の説明は主に口座振替システム110における口座振替依頼書処理や納付済通知書処理について説明したが、入出金伝票処理システム120による入出金伝票をイメージ化して必要なインデックスを生成してのイメージファイル230への登録処理であっても、伝票に表示されている文字列の全文についてインデックスとしてインデックスファイル300に登録し、伝票種別毎に固有の書類IDを割り当てて同様に上記インデックスに関連付けてインデックスファイル300に登録することになる。法人融資処理システム130でも同様である。

Claims (7)

  1. 多種業務に係る多種の書類イメージを記憶する画像情報処理装置であって、
    前記書類イメージを読み出し可能に記憶するイメージ記憶手段と、
    前記イメージ記憶手段に登録される書類イメージに表示されている文字情報に対応するデジタル情報において、文字情報の単語毎の文字列を前記書類イメージに対応するインデックスとする文字情報インデックス手段と、
    前記書類イメージの種別毎に固有の書類種別IDを付与し、前記インデックス特定手段によるインデックスと対応付ける書類種別インデックス手段と、
    前記インデックス及び前記書類種別IDを前記イメージ記憶手段に登録されている書類イメージの読み出しキーワードとして記憶するインデックス記憶手段とを備えることを特徴とする画像情報処理装置。
  2. 前記インデックス記憶手段に記憶されている前記インデックス及び前記書類種別IDを受け取り、該受け取ったインデックス及び書類識別IDの全てで特定される前記イメージ記憶手段に記憶されている書類イメージを読み出すイメージ読み出し手段とを備えることを特徴とする請求項1記載の画像情報処理装置。
  3. 前記書類イメージは帳票イメージであり、処理対象書類種別の追加時には、前記書類種別インデックス手段は新たに追加される書類種別に固有の書類種別IDを付与し、前記文字情報インデックス手段は、追加された処理対象書類に表示されている文字情報に対応する文字列をインデックスとして前記インデックス記憶手段に追加登録することで対応可能であることを特徴とする請求項1又は請求項2記載の画像情報処理装置。
  4. 前記文字情報インデックス手段は前記処理対象書類に表示されている全文をインデックス対象とすることを特徴とする請求項1乃至請求項3のいずれかに記載の画像情報処理装置。
  5. 多種業務に係る多種の書類イメージを記憶する書類イメージ記憶手段と該書類イメージ記憶手段に記憶されている書類イメージに対するインデックス情報を記憶するインデックス記憶手段を備える画像情報処理装置における画像情報処理方法であって、
    前記書類イメージ記憶手段に記憶される前記書類イメージに表示されている文字情報を認識して単語毎の文字列の全てを前記書類イメージに対応するインデックスとして抽出し、
    前記書類イメージの種別毎に固有の書類種別IDを付与し、前記抽出したインデックスと対応付け、書類イメージに対するインデックス情報として前記インデックス記憶手段に記憶させることを特徴とする画像情報処理方法。
  6. 前記インデックス記憶手段に記憶されている前記インデックス及び前記書類種別IDを受け取り、該受け取ったインデックス及び書類識別IDの全てで特定される前記イメージ記憶手段に記憶されている書類イメージを読み出すことを特徴とする請求項5記載の画像情報処理方法。
  7. 前記書類イメージは帳票イメージであり、処理対象書類種別の追加時には、新たに追加される書類種別に固有の書類種別IDを付与し、追加された処理対象書類に表示されている文字情報に対応する文字列をインデックスとして前記インデックス記憶手段に追加登録することで対応可能であることを特徴とする請求項5又は請求項6記載の画像情報処理方法。
JP2013117396A 2013-06-03 2013-06-03 画像情報処理装置及び画像情報処理方法 Active JP6250307B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2013117396A JP6250307B2 (ja) 2013-06-03 2013-06-03 画像情報処理装置及び画像情報処理方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2013117396A JP6250307B2 (ja) 2013-06-03 2013-06-03 画像情報処理装置及び画像情報処理方法

Publications (2)

Publication Number Publication Date
JP2014235619A true JP2014235619A (ja) 2014-12-15
JP6250307B2 JP6250307B2 (ja) 2017-12-20

Family

ID=52138263

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2013117396A Active JP6250307B2 (ja) 2013-06-03 2013-06-03 画像情報処理装置及び画像情報処理方法

Country Status (1)

Country Link
JP (1) JP6250307B2 (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2020119057A (ja) * 2019-01-21 2020-08-06 株式会社プリマジェスト 画像処理装置
JP6905724B1 (ja) * 2021-01-27 2021-07-21 株式会社 情報システムエンジニアリング 情報提供システム及び情報提供方法

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2004302683A (ja) * 2003-03-28 2004-10-28 Toshiba Corp 文書管理システム、文書生成方法、登録方法およびプログラム
JP2010102668A (ja) * 2008-10-27 2010-05-06 Hitachi Software Eng Co Ltd メタデータ抽出装置およびその方法
JP2010515167A (ja) * 2006-12-28 2010-05-06 グーグル インコーポレイテッド 文書保存システム

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2004302683A (ja) * 2003-03-28 2004-10-28 Toshiba Corp 文書管理システム、文書生成方法、登録方法およびプログラム
JP2010515167A (ja) * 2006-12-28 2010-05-06 グーグル インコーポレイテッド 文書保存システム
JP2010102668A (ja) * 2008-10-27 2010-05-06 Hitachi Software Eng Co Ltd メタデータ抽出装置およびその方法

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2020119057A (ja) * 2019-01-21 2020-08-06 株式会社プリマジェスト 画像処理装置
JP7291488B2 (ja) 2019-01-21 2023-06-15 株式会社プリマジェスト 画像処理装置
JP6905724B1 (ja) * 2021-01-27 2021-07-21 株式会社 情報システムエンジニアリング 情報提供システム及び情報提供方法
JP2022114721A (ja) * 2021-01-27 2022-08-08 株式会社 情報システムエンジニアリング 情報提供システム及び情報提供方法

Also Published As

Publication number Publication date
JP6250307B2 (ja) 2017-12-20

Similar Documents

Publication Publication Date Title
US11868717B2 (en) Multi-page document recognition in document capture
US10614527B2 (en) System and method for automatic generation of reports based on electronic documents
US10366123B1 (en) Template-free extraction of data from documents
CA3074633C (en) Systems and methods for data indexing and processing
US9213893B2 (en) Extracting data from semi-structured electronic documents
US9378205B1 (en) System and method for managing and sharing pharmaceutical clinical trial regulatory documents
US20080235227A1 (en) Systems and methods to extract data automatically from a composite electronic document
US20130275451A1 (en) Systems And Methods For Contract Assurance
US10614125B1 (en) Modeling and extracting elements in semi-structured documents
RU2768233C1 (ru) Нечеткий поиск с использованием форм слов для работы с большими данными
CN105630924A (zh) 异步数据处理方法和异步数据处理系统
US20180024983A1 (en) System and method for reporting based on electronic documents
JP6250307B2 (ja) 画像情報処理装置及び画像情報処理方法
US20220121881A1 (en) Systems and methods for enabling relevant data to be extracted from a plurality of documents
US20170185832A1 (en) System and method for verifying extraction of multiple document images from an electronic document
US20130300562A1 (en) Generating delivery notification
US20170323106A1 (en) System and method for encrypting data in electronic documents
JP7260380B2 (ja) 情報処理装置及び顧客情報解析方法
WO2022254560A1 (ja) 光学文字認識により生成されるテキストデータを用いたデータマッチング
JP7377565B2 (ja) 図面検索装置、図面データベース構築装置、図面検索システム、図面検索方法、及びプログラム
US20220327502A1 (en) Enhanced image transaction processing solution and architecture
US20230342558A1 (en) Systems and methods for generalized entity matching
JP7120981B2 (ja) 情報処理装置、情報処理方法、および、情報処理プログラム
EP3494496A1 (en) System and method for reporting based on electronic documents
JP2009134375A (ja) 融資審査支援システムおよびその方法

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20160526

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20170222

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20170418

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20170619

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20171024

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20171122

R150 Certificate of patent or registration of utility model

Ref document number: 6250307

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250