JP2007323474A - Ocrシステム、ocrフォーマットパラメータ作成方法、そのプログラムおよびプログラム記録媒体 - Google Patents

Ocrシステム、ocrフォーマットパラメータ作成方法、そのプログラムおよびプログラム記録媒体 Download PDF

Info

Publication number
JP2007323474A
JP2007323474A JP2006154493A JP2006154493A JP2007323474A JP 2007323474 A JP2007323474 A JP 2007323474A JP 2006154493 A JP2006154493 A JP 2006154493A JP 2006154493 A JP2006154493 A JP 2006154493A JP 2007323474 A JP2007323474 A JP 2007323474A
Authority
JP
Japan
Prior art keywords
field
information
ocr
format parameter
database
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
JP2006154493A
Other languages
English (en)
Inventor
Mitsuru Sugimoto
充 杉本
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Priority to JP2006154493A priority Critical patent/JP2007323474A/ja
Publication of JP2007323474A publication Critical patent/JP2007323474A/ja
Withdrawn legal-status Critical Current

Links

Images

Abstract

【課題】新たな帳票に関するフォーマットパラメータ作成作業の効率向上が可能なOCRシステムを提供する。
【解決手段】データベース112に、過去に作成した各帳票の性質を示す帳票属性情報と、各帳票の各フィールドの型を示すフィールドタイプと、各フィールドの記載方法を定義したフィールド情報と、そのサンプルイメージとを各フィールド単位に検索可能な形式で蓄積し、新規帳票のOCR用フォーマットパラメータのフィールド情報を作成する際に、フィールド選択部104で選択したフィールドタイプと帳票属性情報入力部106により入力した帳票属性情報とに基づいて、フィールド登録情報検索部107によりデータベース112をフィールド単位に検索し、新規帳票のフィールド情報として利用可能と推定される上位n個を候補として画面表示し、いずれかを利用して、フィールド登録部109において新規帳票のフィールド情報として流用又は編集可能とする。
【選択図】図1

Description

本発明は、OCRシステム、OCRフォーマットパラメータ作成方法、そのプログラムおよびプログラム記録媒体に関し、OCRの読取用のフォーマットパラメータ作成時におけるフィールド情報の設定を容易にするOCRシステム、OCRフォーマットパラメータ作成方法、OCRフォーマットパラメータ作成プログラムおよびプログラム記録媒体に関する。
OCRシステムを利用して帳票上に記録された文字を読み取るためには、OCRフォーマットパラメータと称する読取制御用情報をあらかじめ作成して登録しておくことが必要である。このフォーマットパラメータは、読取対象となる帳票の属性情報(帳票タイトル、文字枠のタイプ、ドロップアウトカラーによる印刷のものか否か、など)や帳票上の読取項目すなわちフィールド(文字枠)ごとの記載内容を特定するフィールド情報(フィールド領域情報、文字数など)を含んで構成されている。
従来のOCRシステムにおけるOCRフォーマットパラメータの作成方法については、特許文献1の特開平8−96044号公報「帳票設計・読取プログラム作成支援システム」に開示された技術がある。この特許文献1の技術は、OCRフォーマットパラメータの作成に際して、表示ガイダンスを画面上に出力して、読取条件/処理内容を会話形式に順次設定することを可能とすることにより、設定ミスを低減することができ、必要とするデータの設定漏れをなくすとともに、作業者の負担を軽減する機能を提供している。
また、特許文献2の特開2000−172779号公報「OCRシステム及び同システムに適用する読取制御情報の作成方法」に開示された技術がある。この特許文献2の技術は、予め登録したフィールド辞書情報を参照することにより読取対象として、有効なフィールド枠を自動的に確定する機能を提供している。
特許文献3の特開2004−062351号公報「レイアウト情報登録システム、レイアウト情報登録プログラム、およびレイアウト情報登録方法」に開示された技術がある。この特許文献3の技術は、帳票イメージに該当する帳票のレイアウト情報が、データベースに登録されている場合はその情報を使用し、データベースに登録されていない場合は類似する帳票イメージおよび類似情報、元の帳票イメージを表示し、異なる情報を修正した後、帳票のレイアウト情報をデータベースに登録し、次回登録以降、参照可能となる機能を提供している。
特開平8−96044号公報(第3−4頁) 特開2000−172779号公報 特開2004−062351号公報
しかしながら、前記特許文献1、特許文献2のような従来技術においては、既に、多数のOCR読取用のフォーマットパラメータが作成されて、それぞれのフィールド情報が登録されているような場合であっても、一度登録した帳票のフィールド情報を再利用可能とする機能はなく、新たな帳票のフォーマットパラメータ作成時におけるフィールド情報の登録作業について利便性に欠けるという課題があった。逆に言えば、過去にフィールド情報の登録実績があるにもかかわらず、それらを効率良く再利用していなく、過去にフィールド情報の蓄積があったとしても、新たな帳票のフォーマットパラメータ作成作業の効率を向上し得ないという課題があった。
特許文献3のような技術内容によれば、金融機関で使用されるような罫線情報等が類似した帳票が多い運用では有効であるが、各々異なったレイアウトを持つ帳票が多い運用の場合では、データベースを参照して、類似(=一部一致)候補のレイアウト情報を修正して登録するという手段では、類似情報を使用する有効性が発揮されず、効率化を図るのは難しいという課題がある。
特許文献2と特許文献3の技術内容を組み合わせた場合、例えば、帳票全体イメージをレイアウト解析し、有効な読取フィールド情報(フィールドイメージ、文字枠情報等)はデータベースに登録し、新規に読取フィールド作成の際はそのデータベースの類似情報を利用し、登録の効率化を図る機能が考えられるが、このような技術内容の場合、レイアウト解析のような機能で自動的には獲得できない情報(知識処理の有効なフィールド等の読取のための付加的な情報等)はデータベースに登録することはできないという課題がある。また、レイアウト解析では、帳票の性質にかかわる情報(帳票タイトル、枠タイプ、知識処理の有効な姓名・住所フィールド等)を獲得するための精度が、その性能と、実際に運用される帳票の種類に、大きく影響を受けるために、安定して有効な情報獲得が保証されないという課題がある。
そこで、本発明の目的は、OCRフォーマットパラメータの作成において、既に登録済みのフィールド情報を再利用することが可能なOCRシステム、OCRフォーマットパラメータ作成方法、OCRフォーマットパラメータ作成プログラムおよびプログラム記録媒体を提供することにある。
前述の課題を解決するため、本発明によるOCRシステム、OCRフォーマットパラメータ作成方法、OCRフォーマットパラメータ作成プログラムおよびプログラム記録媒体は、次のような特徴的な構成を採用している。
(1)帳票を読み取るためのOCR用フォーマットパラメータを作成する機能を備えたOCRシステムにおいて、過去に作成した1ないし複数の帳票について、該帳票の性質を示す帳票属性情報と、当該帳票に関する前記OCRフォーマットパラメータを構成する各フィールドごとの型を示すフィールドタイプと、各フィールドごとの記載方法を定義したフィールド情報とを各フィールド単位に検索可能な形式で蓄積したデータベースを備え、新規帳票のOCR用フォーマットパラメータを構成するフィールドのフィールド情報を作成する際に、当該新規帳票の帳票属性情報と当該新規帳票のフィールドのフィールドタイプとに基づいて、前記データベースをフィールド単位に検索し、前記データベースに蓄積された情報の中から当該新規帳票のフィールドに関するフィールド情報として利用可能と推定されるフィールド情報候補を抽出し、抽出した前記フィールド情報候補を画面表示することにより、前記フィールド情報候補を利用して、当該新規帳票のフィールドのフィールド情報を登録設定することができるOCRシステム。
(2)上記(1)のOCRシステムにおいて、前記フィールド情報として、フィールドタイプ、フィールド領域情報、文字数を少なくとも含むOCRシステム。
(3)上記(1)または(2)のOCRシステムにおいて、前記データベースに蓄積される前記フィールド情報として、当該フィールド情報の具体的なイメージを示すサンプルイメージを含み、前記データベースの検索結果として抽出された前記フィールド情報候補を画面表示する際に、当該フィールド情報候補に該当する前記サンプルイメージを含めて画面表示するOCRシステム。
(4)上記(1)ないし(3)のいずれかのOCRシステムにおいて、前記データベースの検索結果として抽出される前記フィールド情報候補の個数を、ユーザが任意に設定することができるOCRシステム。
(5)上記(1)ないし(4)のいずれかのOCRシステムにおいて、前記帳票属性情報として、帳票タイトル、文字枠のタイプ、ドロップアウトカラー帳票か否か、知識処理の有効な姓名・住所フィールドの有無、を少なくとも含むOCRシステム。
(6)上記(1)ないし(5)のいずれかのOCRシステムにおいて、前記フィールドタイプとして、英数カナ記号、姓名、住所、漢字、金額のタイプを少なくとも含むタイプのうち、いずれかを用いるOCRシステム。
(7)帳票を読み取るためのOCR用フォーマットパラメータを作成するOCRフォーマットパラメータ作成方法において、過去に作成した1ないし複数の帳票について、該帳票の性質を示す帳票属性情報と、当該帳票に関する前記OCRフォーマットパラメータを構成する各フィールドごとのフィールドの型を示すフィールドタイプと、各フィールドごとの記載方法を定義したフィールド情報とを各フィールド単位に検索可能な形式で蓄積したデータベースを有し、新規帳票のOCR用フォーマットパラメータを構成するフィールドのフィールド情報を作成する際に、当該新規帳票の帳票属性情報と当該新規帳票のフィールドのフィールドタイプとに基づいて、前記データベースをフィールド単位に検索し、前記データベースに蓄積された情報の中から当該新規帳票のフィールドに関するフィールド情報として利用可能と推定されるフィールド情報候補を抽出し、抽出した前記フィールド情報候補を画面表示することにより、前記フィールド情報候補を利用して、当該新規帳票のフィールドのフィールド情報を登録設定するOCRフォーマットパラメータ作成方法。
(8)上記(7)のOCRフォーマットパラメータ作成方法において、前記フィールド情報として、フィールドタイプ、フィールド領域情報、文字数を少なくとも含むOCRフォーマットパラメータ作成方法。
(9)上記(7)または(8)のOCRフォーマットパラメータ作成方法において、前記データベースに蓄積される前記フィールド情報として、当該フィールド情報の具体的なイメージを示すサンプルイメージを含み、前記データベースの検索結果として抽出された前記フィールド情報候補を画面表示する際に、当該フィールド情報候補に該当する前記サンプルイメージを含めて画面表示するOCRフォーマットパラメータ作成方法。
(10)上記(7)ないし(9)のいずれかのOCRフォーマットパラメータ作成方法において、前記データベースの検索結果として抽出される前記フィールド情報候補の個数を、ユーザが任意に設定することができるOCRフォーマットパラメータ作成方法。
(11)上記(7)ないし(10)のいずれかのOCRフォーマットパラメータ作成方法において、前記帳票属性情報として、帳票タイトル、文字枠のタイプ、ドロップアウトカラー帳票か否か、知識処理の有効な姓名・住所フィールドの有無、を少なくとも含むOCRフォーマットパラメータ作成方法。
(12)上記(7)ないし(11)のいずれかのOCRフォーマットパラメータ作成方法において、前記フィールドタイプとして、英数カナ記号、姓名、住所、漢字、金額のタイプを少なくとも含むタイプのうち、いずれかを用いるOCRフォーマットパラメータ作成方法。
(13)上記(7)ないし(12)のいずれかのOCRフォーマットパラメータ作成方法をコンピュータによって実行可能なプログラムとして実現しているOCRフォーマットパラメータ作成プログラム。
(14)上記(13)のOCRフォーマットパラメータ作成プログラムをコンピュータによって読み取り可能な記録媒体に格納しているプログラム記録媒体。
本発明のOCRシステム、OCRフォーマットパラメータ作成方法、OCRフォーマットパラメータ作成プログラムおよびプログラム記録媒体によれば、OCRのフィールド毎の登録情報がデータベースに蓄積されており、OCRの帳票の性質に関わる帳票属性情報とフィールドの型を示すフィールドタイプの情報とから該データベースをフィールド単位に検索することができ、検索結果として、新たに作成する帳票のフォーマットパラメータを作成するためのフィールド情報に関する候補を、サンプルイメージとともに、メニュー表示することができるので、ユーザは、従来よりも、簡単かつ適切に、フィールド情報を登録することができるという効果が得られる。
以下、本発明によるOCRシステム、OCRフォーマットパラメータ作成方法、OCRフォーマットパラメータ作成プログラムおよびプログラム記録媒体の好適実施形態例について添付図を参照して説明する。なお、以下の実施形態の説明においては、OCRシステム、OCRフォーマットパラメータ作成方法について説明するが、以下に説明するOCRフォーマットパラメータ作成方法をコンピュータによって実行可能なプログラム論理のOCRフォーマットパラメータ作成プログラムとして構成しても良いし、さらには、当該OCRフォーマットパラメータ作成プログラムをコンピュータにより読み取り可能なプログラム記録媒体として実現することも可能である。
(実施例の構成)
まず、本発明によるOCRシステムの一構成例について図1を参照して説明する。図1は、本発明によるOCRシステムの一構成例を示すブロック構成図である。図1のOCRシステムは、帳票イメージ入力部101、イメージメモリ102、帳票イメージ表示部103、フィールド選択部104、フィールド属性入力部105、帳票属性情報入力部106、フィールド登録情報検索部107、フィールド登録情報選択部108、フィールド登録部109、読取テスト部110、登録情報蓄積部111、および、データベース112、を少なくとも含んで構成される。
ここで、帳票イメージ入力部101は、OCRの帳票イメージを入力するためのスキャナまたはOCR装置等から構成されている。イメージメモリ102は、帳票イメージ入力部101から入力された帳票イメージデータを保持するものである。また、帳票イメージ表示部103は、イメージメモリ102から帳票イメージデータを受け取って、画面表示するものである。フィールド選択部104は、帳票イメージ表示部103により画面表示された帳票イメージデータについて、フィールド情報(すなわち、フィールドの記載方法を定義する情報)を登録する対象とするフィールドについて、当該フィールドの型を示すフィールドタイプ(例えば、英数カナ記号、姓名、住所、漢字、金額などを少なくとも含むタイプのうちのいずれかのタイプ)をユーザが選択するものである。フィールド属性入力部105は、フィールド選択部104により、ユーザがフィールドタイプを選択した後、ユーザがそのフィールドのフィールド属性(手書き、活字など)を入力するものである。
帳票属性情報入力部106は、ユーザが登録動作を開始するのに先立って、ユーザが今回フォーマットパラメータを作成する帳票の性質に関わる情報(帳票タイトル、枠タイプ(個別文字枠、罫線枠)、ドロップアウトカラー帳票か否か、知識処理の有効な姓名・住所フィールドの有無など)を入力するものである。フィールド登録情報検索部107は、フィールド選択部104と帳票属性情報入力部106とにおいてそれぞれ入力されたフィールドタイプ情報と帳票属性情報とを利用して、データベース112に蓄積されている過去の帳票に関するフィールド登録情報をフィールド単位に検索するものである。フィールド登録情報選択部108は、フィールド登録情報検索部107による検索結果を今回の帳票のフォーマットパラメータにおけるフィールド情報として利用するための候補としてそのサンプルイメージとともにメニュー表示するものである。
フィールド登録部109は、今回の帳票のフォーマットパラメータにおけるフィールド情報を登録設定するものであるが、ユーザが登録するフィールドを設定する際に、フィールド登録情報選択部108によりメニュー表示されたフィールド候補を再利用して登録設定することができる。読取テスト部110は、設定したフィールド登録情報が今回の帳票のフィールド情報として適切か否かを読み取り確認するものである。登録情報蓄積部111は、読取テストが成功裡に完了したフィールド登録情報を蓄積し、当該帳票のフォーマットパラメータのフィールド情報として使用可能とするとともに、以降に発生する可能性がある帳票のフォーマットパラメータの作成時におけるフィールド情報の作成に利用可能とするために、データベース112へ登録を行うものである。
以下に、図1における各構成要素の機能についてさらに詳細に説明する。帳票属性情報入力部106は、図2のようなダイアログ(テキストボックスとチェックボックスとの構成)を画面表示して、ユーザからの入力を受け付ける。図2は、本発明によるOCRシステムの帳票属性情報入力部106が画面表示するダイアログ画面の一例を示す模式図である。ユーザは、帳票イメージ表示部103によって画面表示した帳票イメージを参照して、図2に示すダイアログにしたがって、入力した帳票に関する帳票属性情報(例えば、帳票タイトル、枠タイプ(個別文字枠、罫線枠)、ドロップアウトカラー帳票か否か、知識処理の有効な姓名・住所フィールドの有無など)を入力して、「OK」ボタンをクリックすることにより、帳票属性情報入力部106に対して、入力した帳票の属性を示す帳票属性情報を設定したことを通知する。
フィールド選択部104は、図3のようなダイアログ(例えば、英数カナ記号、姓名、などの選択項目を選択するラジオボタンからなる構成)を画面表示して、ユーザからの入力を受け付ける。図3は、本発明によるOCRシステムのフィールド選択部104が画面表示するダイアログ画面の一例を示す模式図である。ユーザは、帳票イメージ表示部103によって画面表示した帳票イメージを参照して、図3に示すダイアログにしたがって、今回の帳票のフォーマットパラメータとして、これから登録するフィールドの型を示すフィールドタイプ(例えば、英数カナ記号、姓名、住所、漢字、金額を少なくとも含むタイプのうち、いずれかのタイプ)の選択をする。
データベース112は、過去に登録した帳票の性質を示す帳票属性情報と帳票を構成する各フィールドのフィールドタイプとフィールド情報とに関して、図4に示すような項目を所持し、帳票属性情報データとフィールドデータとして保管している。図4は、本発明によるOCRシステムのデータベース112に保管される帳票データに関する登録項目の一例を示すテーブルであり、過去に登録された帳票についてOCRシステムパラメータの作成の際に帳票の性質を示す情報として帳票属性情報入力部106に入力された帳票タイトル、枠タイプ、ドロップアウトカラー情報、知識処理の有効な姓名・住所フィールドなどを少なくとも含む帳票属性情報データと、フィールド選択部104で選択されたフィールドタイプとフィールド登録部109にて作成されたフィールド情報(フィールドタイプ、フィールド領域情報、文字数、サンプルイメージデータなど)とに関する設定項目からなるフィールドデータを少なくとも含んで構成されている。
フィールド登録情報検索部107は、今回、OCRシステムパラメータを作成しようとする帳票について、帳票属性情報入力部106に入力した帳票属性情報とフィールド選択部104にて選択したフィールドタイプ情報とに基づいて、データベース112に既に登録されている項目の中から類似する項目をフィールド単位に検索して、今回作成しようとしている帳票のフィールドに関するフィールド情報として利用可能と推定される候補を抽出する。
フィールド登録情報選択部108は、図5のような形式となっており、フィールド登録情報検索部107の検索結果として抽出されたフィールド情報の候補の中から、上位n候補(n:自然数。ユーザが任意に指定することができる)を、そのサンプルイメージとともに画面上にメニュー表示する。図5は、本発明によるOCRシステムのフィールド登録情報選択部108が画面表示するメニュー画面の一例を示す模式図である。図5に示すように、今回の帳票のフィールドに関するフィールド情報に利用可能と推定される上位n個のフィールド情報の候補として、フィールドタイプ(図5の例では、姓名の場合を示す)、その具体的なフィールド情報のイメージを示すサンプルイメージ、および、その帳票属性情報データが画面上にメニュー表示されるので、ユーザは、その中から、今回の帳票のフィールドとして最も利用に適するものを選択することができる。
今回の帳票に関するOCRフォーマットパラメータとして登録するフィールド情報を選択または設定するフィールド登録部109の動作は、図6のフローチャートに示すような手順となる。図6は、本発明によるOCRシステムのフィールド登録部109の動作の一例を示すフローチャートである。図6のフローチャートにおいて、まず、設定対象とする帳票上のフィールド領域を取得するために、例えば、『フィールド領域をマウスで囲んでください。』等のコメントが画面表示され、ユーザが、画面表示されている帳票上のフィールド領域をマウスで囲むと、囲んで領域を矩形領域に調整して、該矩形領域の座標値と、その文字枠から文字数とを取得する(ステップS601)。すなわち、矩形領域の行位置(矩形領域の上下の中心座標)、読取開始位置(矩形領域の左端座標)、読取終了位置(矩形領域の右端座標)、文字数(切り出した文字枠から文字数がカウントされる)を取得する。
次に、フィールド登録情報選択部108によって、今回の帳票のフィールドに利用可能と推定される上位n候補が表示されたメニュー画面の中から、いずれかの候補を利用するか否かを判定し、利用する場合は(ステップS602のYES)、メニュー画面の中から利用する候補を選択して、選択した項目に関してデータベース112に登録されているフィールド情報の設定項目の一覧をダイアログ等の形式で画面表示させる(ステップS603)。一方、いずれの候補も利用しない場合、もしくは候補が存在しない場合は(ステップS602のNO)、フィールド情報の設定項目の既定値としてあらかじめ設定されているデフォルト用の設定項目の一覧をダイアログ等の形式で画面表示させる(ステップS604)。
画面表示されたフィールド情報の設定項目の一覧のうちいずれかの設定項目を、ユーザが変更するような入力を行った場合(ステップS605の有り)、変更した内容を、今回の帳票のフィールド情報の設定項目として編集して(ステップS606)、フィールド登録部109の動作を終了する。一方、ユーザが変更をしなかった場合は(ステップS605の無し)、今回の帳票のフィールド情報の設定項目として画面表示された設定項目をそのまま利用するものとして、フィールド登録部109の動作を終了する。しかる後、今回の帳票のフィールド情報の設定項目として決定したフィールド登録情報は、その設定項目の読取確認がされた後、最終的に、今回の帳票のOCRフォーマットパラメータのフィールド情報として登録情報蓄積部111に蓄積されるとともに、データベース112に保管される。
(動作の説明)
次に、本発明の一実施例として図1に示した本発明のOCRシステムの動作について、さらに詳細に説明する。まず、スキャナまたはOCR装置等の帳票イメージ入力部101から帳票イメージデータが取得されると、取得された帳票イメージデータは、イメージメモリ102に一旦保持される。イメージメモリ102に保持された帳票イメージデータは、帳票イメージ表示部103にて、画面表示される。
次に、ユーザは、フィールド情報の登録作業を開始する前に、帳票イメージ表示部103に画面表示された帳票イメージを参照して、帳票属性情報入力部106が画面表示した図2のようなダイアログ画面を用いて、帳票属性情報(帳票タイトル、枠タイプ(個別文字枠、罫線枠)、ドロップアウトカラー帳票か否か、知識処理の有効な姓名・住所フィールドの有無など)を入力する。
次に、ユーザは、フィールド選択部104が画面表示した図3のようなダイアログ画面を用いて、これから登録するフィールドタイプ(英数カナ記号、姓名、住所、漢字、金額など)を選択する。さらに、フィールド属性入力部105にて、そのフィールドの属性情報(手書き、活字等の情報)を入力する。
しかる後、フィールド登録情報検索部107にて、帳票属性情報入力部106にて入力された帳票属性情報とフィールド選択部104にて選択されたフィールドタイプの情報とを利用して、データベース112に今までに保管された帳票の帳票属性情報とフィールドタイプとがフィールド単位に検索され、類似した帳票属性情報とフィールドタイプを有する登録設定項目が、今回の帳票のフィールド情報の設定項目の候補として抽出される。フィールド登録情報選択部108にて、候補として抽出された検索結果の帳票属性情報とフィールドタイプのうち、上位からユーザが任意に指定した個数n分が、図5のような形式で、そのサンプルイメージとともにメニュー表示される。
次に、ユーザは、フィールド登録部109において、図6のフローチャートにおいて説明したような動作により、該当するフィールド情報を選択して、あるいは、フィールド情報の変更をした場合は、変更後のフィールド情報を、今回の帳票のフィールドに関するフィールド情報として登録設定する。さらに、読取テスト部110にて、フィールド登録部109にて設定したフィールド登録情報が適切か否かの読取確認を行う。読取動作が適切であるとの確認が得られた後、そのフィールド登録情報は、登録情報蓄積部111に最終的なフィールド情報として蓄積され、登録情報蓄積部111に蓄積されたフィールド登録情報は、その後、データベース112にて保管される。
しかる後、さらに、追加して、今回の帳票のフィールド情報の登録設定が必要な場合には、フィールド選択部104によるフィールドタイプ選択動作以降、同様の動作を繰り返す。今回の帳票に関する全てのフィールド情報の登録設定が完了すると、今回の帳票のOCRフォーマットパラメータの作成が完了となる。
(効果の説明)
以上に説明したように、ユーザが新たな帳票のOCRフォーマットパラメータの作成のためにフィールド情報の登録設定を実施する場合、フィールド登録情報検索部107にて、既に登録済みの帳票に関するフィールド登録情報を候補としてフィールド単位に検索することができ、その検索結果の中からユーザが任意に設定した上位n個分の候補をフィールド登録情報選択部108にてメニュー表示することにより、既に登録済みのフィールド登録情報を再利用して、新たな帳票のフィールド登録情報として流用または編集することができる。また、読取テスト部110により、既存のフィールド登録情報を流用または編集して設定したフィールド登録情報が適切か否かを確認することも可能である。これにより、過去に登録したフィールド登録情報を再利用して、ユーザは、効率良く、新たな帳票に関するフィールド情報を登録することができるという効果が得られる。
すなわち、過去に設定登録されたOCRフォーマットパラメータに関するフィールド毎の登録情報がデータベース112に蓄積されており、帳票の性質に関わる帳票属性情報とフィールドの型を示すフィールドタイプの情報とに基づいて、登録済みのデータベース112を検索することができ、その候補がサンプルイメージとともにメニュー表示されるので、ユーザは、従来よりも、簡単かつ適切にフィールド登録をすることができるという効果が得られる。
以上、本発明の好適実施例の構成を説明した。しかし、斯かる実施例は、本発明の単なる例示に過ぎず、何ら本発明を限定するものではないことに留意されたい。本発明の要旨を逸脱することなく、特定用途に応じて種々の変形変更が可能であることは、当業者には容易に理解できよう。
本発明によるOCRシステムの一構成例を示すブロック構成図である。 本発明によるOCRシステムの帳票属性情報入力部が画面表示するダイアログ画面の一例を示す模式図である。 本発明によるOCRシステムのフィールド選択部が画面表示するダイアログ画面の一例を示す模式図である。 本発明によるOCRシステムのデータベースに保管される帳票データに関する登録項目の一例を示すテーブルである。 によるOCRシステムのフィールド登録情報選択部が画面表示するメニュー画面の一例を示す模式図である。 本発明によるOCRシステムのフィールド登録部の動作の一例を示すフローチャートである。
符号の説明
101 帳票イメージ入力部
102 イメージメモリ
103 帳票イメージ表示部
104 フィールド選択部
105 フィールド属性入力部
106 帳票属性情報入力部
107 フィールド登録情報検索部
108 フィールド登録情報選択部
109 フィールド登録部
110 読取テスト部
111 登録情報蓄積部
112 データベース

Claims (14)

  1. 帳票を読み取るためのOCR用フォーマットパラメータを作成する機能を備えたOCRシステムにおいて、過去に作成した1ないし複数の帳票について、該帳票の性質を示す帳票属性情報と、当該帳票に関する前記OCRフォーマットパラメータを構成する各フィールドごとの型を示すフィールドタイプと、各フィールドごとの記載方法を定義したフィールド情報とを各フィールド単位に検索可能な形式で蓄積したデータベースを備え、新規帳票のOCR用フォーマットパラメータを構成するフィールドのフィールド情報を作成する際に、当該新規帳票の帳票属性情報と当該新規帳票のフィールドのフィールドタイプとに基づいて、前記データベースをフィールド単位に検索し、前記データベースに蓄積された情報の中から当該新規帳票のフィールドに関するフィールド情報として利用可能と推定されるフィールド情報候補を抽出し、抽出した前記フィールド情報候補を画面表示することにより、前記フィールド情報候補を利用して、当該新規帳票のフィールドのフィールド情報を登録設定することができることを特徴とするOCRシステム。
  2. 請求項1に記載のOCRシステムにおいて、前記フィールド情報として、フィールドタイプ、フィールド領域情報、文字数を少なくとも含むことを特徴とするOCRシステム。
  3. 請求項1または2に記載のOCRシステムにおいて、前記データベースに蓄積される前記フィールド情報として、当該フィールド情報の具体的なイメージを示すサンプルイメージを含み、前記データベースの検索結果として抽出された前記フィールド情報候補を画面表示する際に、当該フィールド情報候補に該当する前記サンプルイメージを含めて画面表示することを特徴とするOCRシステム。
  4. 請求項1ないし3のいずれかに記載のOCRシステムにおいて、前記データベースの検索結果として抽出される前記フィールド情報候補の個数を、ユーザが任意に設定することができることを特徴とするOCRシステム。
  5. 請求項1ないし4のいずれかに記載のOCRシステムにおいて、前記帳票属性情報として、帳票タイトル、文字枠のタイプ、ドロップアウトカラー帳票か否か、知識処理の有効な姓名・住所フィールドの有無、を少なくとも含むことを特徴とするOCRシステム。
  6. 請求項1ないし5のいずれかに記載のOCRシステムにおいて、前記フィールドタイプとして、英数カナ記号、姓名、住所、漢字、金額のタイプを少なくとも含むタイプのうち、いずれかを用いることを特徴とするOCRシステム。
  7. 帳票を読み取るためのOCR用フォーマットパラメータを作成するOCRフォーマットパラメータ作成方法において、過去に作成した1ないし複数の帳票について、該帳票の性質を示す帳票属性情報と、当該帳票に関する前記OCRフォーマットパラメータを構成する各フィールドごとのフィールドの型を示すフィールドタイプと、各フィールドごとの記載方法を定義したフィールド情報とを各フィールド単位に検索可能な形式で蓄積したデータベースを有し、新規帳票のOCR用フォーマットパラメータを構成するフィールドのフィールド情報を作成する際に、当該新規帳票の帳票属性情報と当該新規帳票のフィールドのフィールドタイプとに基づいて、前記データベースをフィールド単位に検索し、前記データベースに蓄積された情報の中から当該新規帳票のフィールドに関するフィールド情報として利用可能と推定されるフィールド情報候補を抽出し、抽出した前記フィールド情報候補を画面表示することにより、前記フィールド情報候補を利用して、当該新規帳票のフィールドのフィールド情報を登録設定することができることを特徴とするOCRフォーマットパラメータ作成方法。
  8. 請求項7に記載のOCRフォーマットパラメータ作成方法において、前記フィールド情報として、フィールドタイプ、フィールド領域情報、文字数を少なくとも含むことを特徴とするOCRフォーマットパラメータ作成方法。
  9. 請求項7または8に記載のOCRフォーマットパラメータ作成方法において、前記データベースに蓄積される前記フィールド情報として、当該フィールド情報の具体的なイメージを示すサンプルイメージを含み、前記データベースの検索結果として抽出された前記フィールド情報候補を画面表示する際に、当該フィールド情報候補に該当する前記サンプルイメージを含めて画面表示することを特徴とするOCRフォーマットパラメータ作成方法。
  10. 請求項7ないし9のいずれかに記載のOCRフォーマットパラメータ作成方法において、前記データベースの検索結果として抽出される前記フィールド情報候補の個数を、ユーザが任意に設定することができることを特徴とするOCRフォーマットパラメータ作成方法。
  11. 請求項7ないし10のいずれかに記載のOCRフォーマットパラメータ作成方法において、前記帳票属性情報として、帳票タイトル、文字枠のタイプ、ドロップアウトカラー帳票か否か、知識処理の有効な姓名・住所フィールドの有無、を少なくとも含むことを特徴とするOCRフォーマットパラメータ作成方法。
  12. 請求項7ないし11のいずれかに記載のOCRフォーマットパラメータ作成方法において、前記フィールドタイプとして、英数カナ記号、姓名、住所、漢字、金額のタイプを少なくとも含むタイプのうち、いずれかを用いることを特徴とするOCRフォーマットパラメータ作成方法。
  13. 請求項7ないし12のいずれかに記載のOCRフォーマットパラメータ作成方法をコンピュータによって実行可能なプログラムとして実現していることを特徴とするOCRフォーマットパラメータ作成プログラム。
  14. 請求項13に記載のOCRフォーマットパラメータ作成プログラムをコンピュータによって読み取り可能な記録媒体に格納していることを特徴とするプログラム記録媒体。
JP2006154493A 2006-06-02 2006-06-02 Ocrシステム、ocrフォーマットパラメータ作成方法、そのプログラムおよびプログラム記録媒体 Withdrawn JP2007323474A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2006154493A JP2007323474A (ja) 2006-06-02 2006-06-02 Ocrシステム、ocrフォーマットパラメータ作成方法、そのプログラムおよびプログラム記録媒体

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2006154493A JP2007323474A (ja) 2006-06-02 2006-06-02 Ocrシステム、ocrフォーマットパラメータ作成方法、そのプログラムおよびプログラム記録媒体

Publications (1)

Publication Number Publication Date
JP2007323474A true JP2007323474A (ja) 2007-12-13

Family

ID=38856212

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2006154493A Withdrawn JP2007323474A (ja) 2006-06-02 2006-06-02 Ocrシステム、ocrフォーマットパラメータ作成方法、そのプログラムおよびプログラム記録媒体

Country Status (1)

Country Link
JP (1) JP2007323474A (ja)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009163438A (ja) * 2007-12-28 2009-07-23 Canon Inc データ検索装置、データ検索方法、及びコンピュータプログラム
JP2015184815A (ja) * 2014-03-20 2015-10-22 株式会社Pfu 帳票定義作成装置、帳票定義作成方法、および、プログラム
JP2015187765A (ja) * 2014-03-26 2015-10-29 グローリー株式会社 帳票フォーマット情報登録方法及びシステム並びにプログラム
JP2017142606A (ja) * 2016-02-09 2017-08-17 日本電気株式会社 帳票設計・読取設定支援装置、帳票設計・読取設定支援方法、及び、光学文字認識システム
JP2021135671A (ja) * 2020-02-26 2021-09-13 富士フイルムビジネスイノベーション株式会社 情報処理装置及びプログラム

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009163438A (ja) * 2007-12-28 2009-07-23 Canon Inc データ検索装置、データ検索方法、及びコンピュータプログラム
JP2015184815A (ja) * 2014-03-20 2015-10-22 株式会社Pfu 帳票定義作成装置、帳票定義作成方法、および、プログラム
JP2015187765A (ja) * 2014-03-26 2015-10-29 グローリー株式会社 帳票フォーマット情報登録方法及びシステム並びにプログラム
JP2017142606A (ja) * 2016-02-09 2017-08-17 日本電気株式会社 帳票設計・読取設定支援装置、帳票設計・読取設定支援方法、及び、光学文字認識システム
JP2021135671A (ja) * 2020-02-26 2021-09-13 富士フイルムビジネスイノベーション株式会社 情報処理装置及びプログラム
JP7380319B2 (ja) 2020-02-26 2023-11-15 富士フイルムビジネスイノベーション株式会社 情報処理装置及びプログラム

Similar Documents

Publication Publication Date Title
JP6826293B2 (ja) 情報処理システムと、その処理方法及びプログラム
JP2009230498A (ja) 帳票処理方法、帳票処理プログラム、帳票処理装置、および、帳票処理システム
JP2007323474A (ja) Ocrシステム、ocrフォーマットパラメータ作成方法、そのプログラムおよびプログラム記録媒体
JP4983464B2 (ja) 帳票画像処理装置及び帳票画像処理プログラム
JP2008299744A (ja) 帳票入力支援システム、プログラムおよび記録媒体
JP5168706B2 (ja) 電子帳票システムにおけるデータ検索項目情報の自動定義システム
JP6657799B2 (ja) 図形処理装置、図形処理方法、および、図形処理プログラム
JP5039505B2 (ja) 文書検索装置および文書検索支援方法
JP4521218B2 (ja) 画像形成システム、情報処理装置、画像形成装置、画像形成方法、および画像形成用プログラム
JP2000315209A (ja) 画像ファイリング装置、画像ファイリング方法およびその方法をコンピュータに実行させるプログラムを記録したコンピュータ読み取り可能な記録媒体
JP6048601B2 (ja) 情報表示装置、プログラムおよび単語情報表示方法
US9990420B2 (en) Method of searching and generating a relevant search string
JP2006134079A (ja) 画像処理装置及びプログラム
JPH0635987A (ja) 回路図作成装置および回路図作成方法
US11462014B2 (en) Information processing apparatus and non-transitory computer readable medium
JP2009157470A (ja) 電子文書処理装置及びプログラム
JP7180076B2 (ja) 外字検索用プログラムおよび外字検索装置
JP2002149682A (ja) 画像検索装置および方法
JP3815044B2 (ja) 入力データ処理装置およびそのプログラム記録媒体
JP2007172474A (ja) 属性情報検索装置
JP2022181367A (ja) 情報処理装置及びプログラム
JP2888458B2 (ja) ファイル格納装置
CN113438379A (zh) 信息处理装置以及记录媒体
JPH0237466A (ja) 情報処理システム
JP2022089087A (ja) 情報処理装置、及び情報処理プログラム

Legal Events

Date Code Title Description
RD02 Notification of acceptance of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7422

Effective date: 20080226

A300 Application deemed to be withdrawn because no request for examination was validly filed

Free format text: JAPANESE INTERMEDIATE CODE: A300

Effective date: 20090804