JP6081298B2

JP6081298B2 - 文字認識装置、文字認識方法、および文字認識プログラム

Info

Publication number: JP6081298B2
Application number: JP2013121992A
Authority: JP
Inventors: 勝利小原; 中村　一夫; 一夫中村
Original assignee: Fujitsu Frontech Ltd
Current assignee: Fujitsu Frontech Ltd
Priority date: 2013-06-10
Filing date: 2013-06-10
Publication date: 2017-02-15
Anticipated expiration: 2033-06-10
Also published as: JP2014238773A

Description

本発明は文字を認識する技術に関する。

近年、帳票に記載された文字を認識（以下、帳票の文字認識とも言う。）するために、ＯＣＲ（Optical Character Reader）機能を有する文字認識装置が用いられている。文字認識装置では、例えば、帳票の文字認識をするとき、帳票に記載された文字の位置や文字の種類などを格納した定義体が用いられている。

また、文字認識装置は、複数種類の帳票の文字認識をする場合、各帳票の文字認識で用いられる定義体に、さらに文字認識をする帳票の種類と帳票が有する特有の図形とを関連付けて格納する。そして、文字認識装置は、帳票の文字認識をするとき、入力された帳票の画像から図形を取得し、複数の定義体の中から取得した図形と同じ図形を格納した定義体を検索する。これにより、文字認識装置は、文字認識する対象の帳票が検索された定義体で示される種類の帳票であると判別する。そして、文字認識装置は、検索された定義体に格納された文字の位置や文字の種類などを用いて、帳票の文字認識をする処理を実行する。

関連する技術として、文字認識部によって帳票上に記載された文字を認識したとき、リジェクト率が非常に高い場合にはそのイメージデータをイメージデータ格納部に保存するとともに、認識結果の統計を行う。そして、必要と判断した場合には、フォーマット情報生成部がその帳票のイメージデータを使用してフォーマット情報を自動生成する。また、フォントが異なることによる認識率の低下に対してはフォント情報を再登録する技術が知られている。

関連する他の技術として、文字認識情報記憶手段には、予め、文字認識を行なう帳票上の対象範囲の位置指定を含む文字認識情報が格納されている。同様に、構文ルール情報記憶手段には、対象範囲の文字列によって表される文字認識項目と対象範囲の文字列についての規定を含む構文ルール情報が格納されている。文字認識手段は、イメージスキャナによって光学的に読み取られた帳票のイメージ情報を入力し、文字認識情報記憶手段から読み出した文字認識情報に基づき、対象範囲のイメージ情報を抽出して文字認識を行なう。文字認識された結果は、構文解析手段に送られる。構文解析手段は、文字認識結果である対象範囲の文字列を構文ルール情報に基づいて解析し、文字認識項目との対応付けを行なう技術が知られている。

関連する他の技術として、画像入力装置で入力され、画像記憶装置に格納された部分画像データは、画像認識処理によって罫線、文字コードに変換され、記憶装置に格納される。記憶装置に格納された部分領域の罫線、文字コードから、書式定義データが作成され、書式記憶装置に格納される。入力部分画像から表単位の書式データを生成し、これらを合成することにより、帳票全体の書式定義データを生成する技術が知られている。

関連する他の技術として、マスター画像入力部と、データ画像入力部と、マスク領域入力部と、画像整合部と、差分抽出部と、相違度出力部とを備える画像識別装置がある。マスター画像入力部は、第１の画像としてのマスター画像を入力する。データ画像入力部は、第２の画像としてのデータ画像を入力する。マスク領域入力部は、マスター画像に対して指定されるマスク領域の組を入力する。画像整合部は、マスター画像とデータ画像とを整合させる。差分抽出部は、整合されたマスター画像とデータ画像との間で、マスク領域を除いた差分を抽出する。相違度出力部は、抽出された差分の大きさにもとづいてマスター画像とデータ画像との相違度を出力する技術が知られている。

関連する他の技術として、被分類帳票から抽出された罫線特徴リストと、帳票様式データベース内の基準帳票の罫線特徴リストとを対応付け、罫線位置の補正量が補正量検出手段により算出され、罫線特徴補正手段で基準帳票の罫線位置の補正がされる。罫線特徴照合手段で、被分類帳票の罫線特徴リストと補正後の基準帳票の罫線特徴リストとを照合し、その類似度を求める。被分類帳票は、最大の類似度を持つ基準帳票と同一の様式として分類される。補正量は、被分類帳票の複数の罫線位置と、比較対照される一つの基準帳票の複数の罫線位置との間の、全ての組合せの対応関係から求められる技術が知られている。（例えば、特許文献１〜５）。

特開平９−７３５００号公報特開２００４−１９９５２９号公報特開平５−６７１８９号公報特開２０１３−６１７６４号公報特開２００３−１０９００７号公報

前述した文字認識技術では、例えば、特有の図形を用いて帳票の種類を判別する場合、ユーザが各帳票に記載された図形の中から各帳票に特有の図形を選択し、各帳票で用いられる定義体に選択した図形を予め格納している。したがって、前述した文字認識技術では、文字を認識する対象の帳票の種類が増加すると、定義体を生成する作業が煩雑になることがある。

本発明は、一側面として、定義体を自動生成する技術を提供する。

本明細書で開示する文字認識装置のひとつに、取得部と、抽出部と、生成部と、記憶部とを有する文字認識装置がある。取得部は、紙面の画像から１以上のアイテムの画像を取得する。抽出部は、取得した１以上のアイテムの画像から、第１サイズ以上のアイテムの画像を抽出する。生成部は、アイテムの画像を取得した紙面の種類と、抽出したアイテムの画像とを関連付けて格納する定義体を生成する。記憶部は、１以上の定義体を記憶する。さらに、前記定義体は、紙面の種類と罫線の配置とを関連付けて格納する。前記抽出部は、前記紙面が有する罫線の配置と同じ罫線の配置と、前記紙面から前記第１サイズを用いて抽出したアイテムの画像と同じアイテムの画像とを格納している定義体が前記記憶部に記憶されているとき、前記第１サイズよりも小さい第２サイズ以上のアイテムの画像を抽出する。

１実施態様によれば、定義体を自動生成することができる。

文字認識装置の一実施例を示す機能ブロック図である。帳票の種類を判別する処理を示すフローチャートである。帳票の種類を判別する処理を示すフローチャートである。定義体を生成する処理を示すフローチャートである。定義体を生成する処理を示すフローチャートである。定義体を生成する処理を示すフローチャートである。定義体を生成する処理を示すフローチャートである。定義体を生成する処理を示すフローチャートである。定義体を生成する処理を示すフローチャートである。帳票の一例を示す図である。帳票の一例を示す図である。帳票判別情報の一例を示す図である。文字認識情報の一例を示す図である。判別データの一例を示す図である。取引データの一例を示す図である。判別データの一例を示す図である。アイテムデータの一例を示す図である。抽出データの一例を示す図である。抽出データの一例を示す図である。見出しデータの一例を示す図である。認識領域を説明する図である。認識領域を説明する図である。コンピュータ装置の一実施例を示すブロック図である。

実施形態の文字認識装置について説明する。
図１は、文字認識装置の一実施例を示す機能ブロック図である。

図１を参照して、文字認識装置１について説明する。
文字認識装置１は、制御部１０と、記憶部２０と、読取部３０と、表示部４０とを備える。文字認識装置１は、例えば、後述するコンピュータ装置である。

制御部１０は、取得部１１と、抽出部１２と、生成部１３と、認識部１４と、判別部１５との機能を有する。

取得部１１は、紙面の画像から１以上のアイテムの画像を取得する。紙面とは、例えば、帳票、解答用紙、健康診断表、およびアンケート用紙などであり、見出しとデータとが関連付けられて記載されている用紙のことである。アイテムとは、例えば、紙面に記載された図形および文字列である。以下の説明において、文字列とは、１文字以上の文字を含む文言を意味する。

抽出部１２は、取得した１以上のアイテムの画像から、第１サイズ以上のアイテムの画像を抽出する。第１サイズとは、例えば、紙面の特徴となるアイテムの画像を抽出するときに用いられる閾値である。第１サイズ以上のアイテムの画像とは、例えば、紙面の特徴を示すアイテムの画像である。以下の説明では、紙面の特徴を示すアイテムの画像のことを特徴画像とも言う。

また、第１サイズは、アイテムの画像の縦幅のサイズと横幅のサイズとを含んでも良い。このとき、抽出部１２は、取得した１以上のアイテムの画像から、縦幅のサイズが第１サイズに含まれる縦幅のサイズ以上、および横幅のサイズが第１サイズに含まれる横幅のサイズ以上のアイテムの画像を抽出しても良い。

抽出部１２は、取得した１以上のアイテムの画像が１以上の文字列の画像を含むとき、１以上の文字列の画像から、所定の文字サイズ以上の文字を含む第１文字数以上の文字列の画像を抽出する。所定の文字サイズとは、例えば、紙面の特徴となる文字列の画像を抽出するために設定された文字のサイズの閾値である。所定の文字サイズとは、文字の縦幅のサイズと横幅のサイズとを含んでも良い。そして、所定の文字サイズには、第１文字サイズと第１文字サイズよりも小さい第２文字サイズを含んでも良い。第１文字数は、例えば、紙面の特徴となる文字列の画像を抽出するために用いられる閾値である。

抽出部１２は、紙面が有する罫線の配置と同じ罫線の配置と、紙面から第１サイズを用いて抽出したアイテムの画像と同じアイテムの画像とを格納している定義体が記憶部に記憶されているとき、第１サイズよりも小さい第２サイズ以上のアイテムの画像を抽出する。第２サイズは、例えば、紙面の特徴となるアイテムの画像を抽出するときに用いられる閾値である。

抽出部１２は、紙面が有する罫線の配置と同じ罫線の配置と、紙面から第１文字数を用いて抽出した文字列の画像と同じ文字列の画像とを格納している定義体が記憶部に記憶されているとき、第１文字数よりも少ない第２文字数以上の文字列の画像を抽出する。第２文字数は、例えば、紙面の特徴となる文字列の画像を抽出するために用いられる閾値である。

生成部１３は、アイテムの画像を取得した紙面の種類と抽出したアイテムの画像とを関連付けて格納する定義体を生成する。

生成部１３は、アイテムの画像を取得した紙面の種類と、抽出したアイテムの画像と、抽出したアイテムの画像が記載された領域を示す画像領域とを関連付けて格納する定義体を生成する。

生成部１３は、アイテムの画像を取得した紙面が有する罫線の配置と、同じ罫線の配置を格納した定義体が記憶部に記憶されていないとき、アイテムの画像を取得した紙面の種類と、抽出したアイテムの画像とを関連付けて格納する定義体を生成する。

生成部１３は、項目種に対応する種類のデータが、項目種を示すと認識した文字列の近傍にあるとき、項目種と、項目種に対応する種類のデータが記載された領域を示す認識領域とを関連付けて格納する定義体を生成する。項目種とは、例えば、紙面の見出しの種別のことである。紙面の見出しの種別とは、例えば、紙面が帳票であるとき、銀行名、支店名、預金種目、口座番号、金額、受取人、および依頼人などのことを言う。データの種類とは、例えば、漢字、カナ、英字および数字などの種類のことを言う。以下の説明においては、項目種を示すと認識した文字列のことを見出し文言とも言う。また、項目種に対応するデータのことを項目データとも言う。

生成部１３は、データが罫線に囲まれているとき、罫線に囲まれた領域を認識領域にする。

生成部１３は、データが罫線に囲まれていないとき、データを囲み、他の文言を含まない領域を認識領域にする。

認識部１４は、取得した１以上のアイテムの画像が文字列の画像を含むとき、文字列の文言と同じ見出し文言に関連付けられた項目種を見出し情報から検索し、文字列が検索した項目種を示すと認識する。

判別部１５は、取得したアイテムの画像と同じアイテムの画像を格納した定義体を検索し、アイテムを取得した紙面の種類を、検索された定義体に格納された紙面の種類であると判別する。

判別部１５は、取得したアイテムの画像と同じアイテムの画像と、取得したアイテムの画像領域と同じアイテムの画像領域とを関連付けて格納した定義体を検索し、アイテムを取得した紙面の種類を、検索された定義体に格納された紙面の種類であると判別する。

また、記憶部２０は、定義体情報２１と、取引情報２２と、判別情報２３と、アイテム情報２４と、抽出情報２５と、見出し情報２６と、設定情報２７とを記憶する。

定義体情報２１には、例えば、文字認識をする紙面の種類ごとに、紙面の種別を判別し、紙面の文字認識をするときに用いられる情報を格納した定義体が記憶される。

取引情報２２には、例えば、文字認識をする紙面の種類ごとに、紙面から読み取った各項目種に対応するデータに関する情報を格納した取引データが記憶される。

判別情報２３には、例えば、紙面の種類を判別した結果に関する情報を格納した判別データが記憶される。

アイテム情報２４には、例えば、文字認識をする紙面の種類ごとに、紙面から取得部１１が取得したアイテムに関する情報を格納したアイテムデータが記憶される。

抽出情報２５には、例えば、文字認識をする紙面の種類ごとに、抽出部１２が抽出したアイテムを示す情報を格納した抽出データが記憶される。

見出し情報２６には、例えば、紙面が有する項目種ごとに、使用される見出し文言に関する情報を格納した見出しデータが記憶される。

設定情報２７には、例えば、第１サイズ、第２サイズ、第１文字サイズ、第２文字サイズ、第１文字数、および第２文字数などの設定情報が記憶される。

読取部３０は、紙面の画像を取得する。読取部３０は、例えば、スキャナでも良い。そして、読取部３０は、光学的に紙面の画像を読み取る機能を有する。

表示部４０は、制御部１０から入力された情報を表示する。
文字認識装置１について、さらに詳細に説明する。

以下の説明では、文字認識装置１が文字認識をする紙面の一例として、帳票を用いて説明する。ただし、文字認識装置１は、帳票に限定されるものではなく、見出しとデータとが関連付けられて記載された各種紙面の文字認識に適用することができる。

図２、図３は、帳票の種類を判別する処理を示すフローチャートである。
図２、図３を参照して、帳票の種類を判別する処理を説明する。また、図２、図３を参照して、項目データを認識する処理を説明する。

以下の説明では、記憶部２０には、予め定義体情報２１と、見出し情報２６と、設定情報２７とが記憶されているものとする。そして、帳票は、例えば、ユーザにより読取部３０に設置されているものとする。また、読取部３０は、後述する帳票１００の画像を読み取ったものとして説明する。文字認識装置１による図形、文字列、および罫線の認識は、例えば、ＯＣＲ機能などを用いて実行しても良い。さらに、文字認識装置１は、例えば、各種データに識別子や名称を付与するとき、乱数を用いたアルゴリズムや所定の演算を用いたアルゴリズムなどを使用して任意の識別子や名称を付与しても良い。

図２を参照して説明する。
読取部３０は、図１０に示す帳票１００の画像を読み取る（Ｓ１０１）。そして、読取部３０は、帳票１００の画像を取得部１１に出力する。

図１０を参照して、読取部３０で読み取られた帳票１００について説明する。
図１０は、帳票の一例を示す図である。

帳票１００には、図１０に示すように、項目種を示す見出し文言として、銀行名、支店名、預金種目、口座番号、振込額、受取人、および依頼人が記載されている。そして、銀行名、支店名、預金種目、口座番号、振込額、受取人、および依頼人は、それぞれ銀行名、支店名、種目、口座番号、金額、受取人、および依頼人の項目種を示す見出し文言である。また、帳票１００は、第１サイズ以上のサイズを有するアイテムとして、図形ＳＨ１、ＳＨ３および文字列ＣＨ１、ＣＨ２を含む。さらに、帳票１００は、第１サイズよりも小さく、第２サイズ以上のサイズを有するアイテムとして、図形ＳＨ５および文字列ＣＨ３を含む。

図２を参照して説明する。
取得部１１は、読取部３０から帳票１００の画像が入力されると、帳票１００の画像に含まれる罫線の配置を取得する（Ｓ１０２）。そして、取得部１１は、判別部１５に取得した罫線の配置を出力する。

図１１を参照して、取得部１１による罫線の配置を取得する処理について説明する。
図１１は、帳票の一例を示す図である。図１１は、図１０で示した帳票１００の一部の領域を拡大した図である。以下の説明では、罫線Ｌ１の配置を取得する処理について説明する。取得部１１は、その他の罫線（例えば、図１１に示す罫線Ｌ２〜Ｌ７）についても同様に、罫線の配置を取得する。ただし、取得部１１が罫線の配置を取得する方法は、以下に説明する方法に限定するものではない。

取得部１１は、例えば、ＯＣＲ機能を用いて、帳票１００の画像から罫線Ｌ１を抽出する。そして、取得部１１は、罫線Ｌ１の配置として、罫線座標（Ａ１、Ｂ１）−（Ａ２、Ｂ１）を取得する。罫線座標（Ａ１、Ｂ１）−（Ａ２、Ｂ１）は、帳票１００上に設定された座標（Ａ１、Ｂ１）と座標（Ａ２、Ｂ１）とを結ぶ直線が罫線Ｌ１であることを示す情報である。座標（Ａ１、Ｂ１）は、例えば、罫線Ｌ１の始点の座標である。また、座標（Ａ２、Ｂ１）は、例えば、罫線Ｌ１の終点の座標である。

図２を参照して説明する。
判別部１５は、取得部１１から帳票１００の罫線の配置が入力されると、定義体情報２１に記憶されている定義体を参照して、帳票１００と同じ罫線の配置を格納した定義体（以下、罫線が一致する定義体とも言う。）があるか否かを判定する（Ｓ１０３）。このとき、判別部１５は、例えば、取得部１１からの帳票１００に記載された各罫線の罫線座標の入力を受け付け、入力された罫線座標と定義体情報２１に記憶されている各定義体の罫線座標との一致判定をする。これにより、判別部１５は、帳票１００と罫線が一致する定義体があるか否かを判定しても良い。

図１２、図１３を参照して、定義体に格納されている情報を説明する。
図１２は、帳票判別情報の一例を示す図である。図１３は、文字認識情報の一例を示す図である。定義体には、図１２に示す帳票判別情報２００と、図１３に示す文字認識情報２０１とが格納されている。以下の説明では、一例として、帳票１００に対応する定義体に格納された情報について説明する。ただし、定義体が格納する情報は、帳票判別情報２００、および文字認識情報２０１に限定されるものではなく、文字認識装置１が紙面の種別を判別し、紙面の文字認識をするときに用いられる情報を格納すれば良い。また、文字認識装置１は、文字認識をする他の帳票についても、同形式の定義体を格納しても良い。

帳票判別情報２００には、図１２に示すように、帳票種類と、罫線情報と、特徴情報とが関連付けられて格納されている。

帳票種類には、帳票１００の種類を示す帳票識別子を格納する。帳票Ｎは、帳票１００の種類を示す帳票識別子である。

罫線情報は、罫線識別子と、罫線座標とを関連付けて格納する。罫線識別子は、帳票１００に記載された各罫線を識別する情報を示す。なお、罫線識別子は、文字認識装置１が罫線情報を生成するときに、各レコードに付与しても良い。

特徴情報は、特徴識別子と、画像領域と、特徴画像とを関連付けて格納する。
特徴識別子は、帳票１００に記載された各特徴画像を識別する情報を示す。なお、特徴識別子は、文字認識装置１が特徴情報を生成するときに、各レコードに付与しても良い。

画像領域は、帳票１００において、特徴画像が記載されている領域を示す。特徴識別子ＳＨ１に対応する画像領域（Ｃ３、Ｄ３）−（Ｃ４、Ｄ４)は、例えば、図１１に示すように、図形ＳＨ１を囲む矩形の左上の座標（Ｃ３、Ｄ３）と右下の座標（Ｃ４、Ｄ４）とを示す。そして、画像領域（Ｃ３、Ｄ３）−（Ｃ４、Ｄ４)は、左上の座標（Ｃ３、Ｄ３）と右下の座標（Ｃ４、Ｄ４）とを結ぶ線を対角線とする矩形を示す情報として用いられる。なお、画像領域が示す矩形は、例えば、特徴画像を囲む矩形の中で最小の矩形としても良い。

特徴画像は、帳票１００に特有のアイテムの画像データである。特徴画像ＩＭ２は、例えば、画像領域（Ｃ３、Ｄ３）−（Ｃ４、Ｄ４）で示される領域を切り出した図形１の画像データである。

文字認識情報２０１には、図１３に示すように、項目種と、認識領域と、データ種と、最大桁数とが帳票種類に関連付けられて格納されている。

認識領域とは、帳票１００において、項目種に対応する項目データが記載されている領域を示す情報である。銀行名（項目種）に対応する認識領域（Ｇ１、Ｈ１）−（Ｇ２、Ｈ２）は、図１１に示すように、銀行名に対応する項目データである南多摩を囲む矩形の左上の座標（Ｇ１、Ｈ１）と右下の座標（Ｇ２、Ｈ２）とを示す。これにより、認識領域（Ｇ１、Ｈ１）−（Ｇ２、Ｈ２)は、左上の座標（Ｇ１、Ｈ１）と右下の座標（Ｇ２、Ｈ２）とを結ぶ線を対角線とする矩形を示す情報として用いられる。なお、認識領域が示す矩形は、例えば、項目データを囲む矩形の中で最小の矩形としても良い。

最大桁数とは、項目データの最大の文字数を示す情報である。そして、認識部１４は、帳票１００の文字認識をするとき、例えば、項目種に関連付けられた最大文字数よりも多い文字数を用いたデータを項目データとして認識しない。

図２を参照して説明する。
判別部１５は、帳票１００と同じ罫線の配置を格納した定義体が定義体情報２１に記憶されていないとき（Ｓ１０３にてＮｏ）、帳票１００の種類を罫線の一致する定義体がない新規の帳票であると判別する（Ｓ１０４）。そして、判別部１５は、後述するＳ２０６の処理を実行する。

図３を参照して説明する。
判別部１５は、帳票１００と同じ罫線の配置を格納した定義体（以下、罫線が一致する定義体とも言う。）が定義体情報２１に記憶されているとき（Ｓ１０３にてＹｅｓ）、罫線が一致する定義体に格納されている各特徴画像の画像領域を取得する（Ｓ２０１）。

判別部１５は、帳票１００からＳ２０１で取得した画像領域に記載された各アイテムの画像を取得する（Ｓ２０２）。なお、判別部１５は、紙面に記載されたアイテム画像と定義体に格納されている特徴画像とが同じ画像であっても、互いの画像領域が異なっているとき、紙面から特徴画像と同じアイテムの画像を取得しない。また、判別部１５は、紙面に記載されたアイテム画像と定義体に格納されている特徴画像とが同じ画像であり、互いの画像領域が同じとき、紙面から特徴画像と同じアイテムの画像を取得する。

そして、判別部１５は、Ｓ２０２で取得した各アイテムの画像と、定義体に格納された各特徴画像とがそれぞれ一致（以下、特徴画像が一致するとも言う。）しているか否かを判定する（Ｓ２０３）。すなわち、判別部１５は、Ｓ２０１〜Ｓ２０３を実行することにより、取得したアイテムの画像と同じ特徴画像と、取得したアイテムの画像領域と同じ特徴画像の画像領域とを関連付けて格納した定義体があるか否かを判定している。

判別部１５は、Ｓ２０２で取得した各アイテムの画像と、定義体に格納された各特徴画像とが全て一致しないとき（Ｓ２０３にてＮｏ）、帳票１００の種類を罫線が一致する定義体はあるが、罫線が一致する定義体と特徴画像が一致しない新規の帳票であると判別する（Ｓ２０４）。そして、判別部１５は、後述するＳ２０６の処理を実行する。

判別部１５は、Ｓ２０２で取得した各アイテムの画像と、定義体に格納された各特徴画像とが全て一致しているとき（Ｓ２０３にてＹｅｓ）、帳票１００の種類を既存の帳票であると判別する（Ｓ２０５）。

なお、判別部１５は、Ｓ１０３において、帳票１００と罫線の一致する定義体が、定義体情報２１に複数格納されていると判定したとき、各罫線の一致した定義体について、Ｓ２０１〜Ｓ２０５の処理を実行しても良い。

そして、判別部１５は、帳票１００の帳票識別子（帳票Ｎ）と、帳票１００の画像データ（ＳＰｎ）と、帳票１００の種類の判別結果（新規：罫線不一致）とを関連付けて判別データに格納する（Ｓ２０６）。このとき、判別部１５は、乱数を用いて任意の帳票識別子を生成し、帳票１００の画像と関連付けて格納しても良い。

図１４を参照して、判別データに格納されている情報を説明する。
図１４は、判別データの一例を示す図である。

判別データ３００には、図１４に示すように、帳票識別子と、帳票画像と、判別結果と、取引識別子と、罫線一致帳票とが関連付けられて格納されている。

帳票画像には、帳票の画像データが格納されている。帳票の画像データとは、読取部３０で読み取られた帳票の画像データである。

判別結果は、帳票の種類の判別結果を示す情報である。既存とは、帳票に記載されている罫線とアイテムの画像とアイテムの画像領域とに、一致する罫線と特徴画像と特徴画像の画像領域とを格納した定義体が定義体情報２１に記憶されていることを示す。新規：罫線不一致とは、帳票に記載されている罫線と、罫線が一致する定義体が定義体情報２１に記憶されていないことを示す。新規：特徴不一致とは、帳票に記載されている罫線と、罫線の一致する定義体が定義体情報２１に記憶されているが、罫線の一致する定義体に格納された特徴画像の画像領域に対応する帳票上の領域に、特徴画像と一致するアイテムが記載されていないことを示す。

取引識別子とは、取引情報２２から、帳票に対応する取引データを検索するときに用いられる識別子である。なお、文字認識装置１は、判別データ３００を生成するときに、各レコードに、対応する取引データを示す取引識別子を付与しても良い。

罫線一致帳票とは、帳票識別子で示される帳票と罫線が一致する定義体の帳票識別子である。

図３を参照して説明する。
認識部１４は、帳票１００の画像から取引データを取得する（Ｓ２０７）。

図１５を参照して、取引データに格納されている情報を説明する。
図１５は、取引データの一例を示す図である。

取引データ４００には、図１５に示すように、帳票種類と、取引識別子と、項目種と、項目データとが関連付けられて格納されている。なお、取引データ４００は、一例として、帳票１００の記載に対応する取引結果を示している。

取引データ４００は、帳票種類と、取引識別子と、項目種と、項目データとを格納している。

取引識別子は、各帳票の取引データを識別するための情報である。なお、取引識別子は、文字認識装置１が取引データを生成するときに、各レコードに付与しても良い。

ただし、取引データ４００が格納する情報は、帳票種類と、取引識別子と、項目種と、項目データとに限定されるものではなく、文字認識装置１が紙面から認識した取引結果に関する情報を格納すれば良い。また、文字認識装置１は、文字認識する他の帳票についても、同形式の取引データを格納しても良い。

図１３、図１５を参照して、Ｓ２０７において、認識部１４が取引データ４００を取得する処理を説明する。

以下の説明では、一例として、帳票１００に対応する取引データ４００に格納された情報を用いて説明する。

認識部１４は、図１３に示す文字認識情報２０１に格納されている各認識領域を取得する。そして、認識部１４は、帳票１００の画像を検索し、各認識領域の示す位置に記載された項目データを取得し、それぞれの項目データを項目種に関連付けて取引データ４００に格納する。

認識部１４は、帳票１００が汚れているなどして、帳票１００の画像から取得できない項目データがあるとき、表示部４０に帳票１００の画像を表示し、ユーザに取引データ４００への値の入力を促しても良い。これにより、ユーザは、表示部４０に表示された帳票１００の画像を参照しながら、取引データ４００に認識部１４が取得できなかった項目種の項目データを格納しても良い。

さらに、認識部１４は、定義体情報２１に、帳票１００に対応する文字認識情報２０１を格納した定義体が記憶されていないとき、表示部４０に帳票１００の画像を表示し、ユーザに取引データ４００への値の入力を促しても良い。これにより、ユーザは、表示部４０に表示された帳票１００の画像を参照しながら、取引データ４００に各項目種に対応する項目データを入力しても良い。

なお、認識部１４は、各項目データを認識するとき、文字認識情報２０１において、項目種に関連付けられているデータ種を参照し、文字認識の対象となるデータの種類に対応した文字認識アルゴリズムを用いて文字認識を実行しても良い。さらに、認識部１４は、各項目データを認識するとき、文字認識情報２０１において、項目種に関連付けられている最大桁数を参照し、最大桁数以下の文字数のデータのみを認識しても良い。これにより、認識部１４は、文字認識の精度を向上することができる。

図３を参照して説明する。
認識部１４は、帳票１００の帳票識別子（帳票Ｎ）と関連付けて取引データ４００の取引識別子（ＴＲｎ）を判別データ３０１に格納する（Ｓ２０８）。これにより、認識部１４は、図１６の判別データ３０１に示すように、帳票１００の判別結果に対応するレコードを生成する。なお、図１６は、Ｓ２０６、およびＳ２０８の処理により、帳票１００の判別結果に対応する、帳票識別子（帳票Ｎ）、帳票画像（ＳＰｎ）、判別結果（新規：罫線不一致）、および取引識別子（ＴＲｎ）を格納したレコードを含む判別データ３０１を示している。

以上により、文字認識装置１は、帳票１００の種類を判別する処理と、帳票１００に記載されている各項目データを認識する処理とを実行する。

図４〜図９は、定義体を生成する処理を示すフローチャートである。
図４〜図６は、帳票判別情報２００を生成する処理を示すフローチャートである。図７〜図９は、文字認識情報２０１を生成する処理を示すフローチャートである。

図４〜図６を参照して、帳票判別情報２００を生成する処理を説明する。
以下の説明では、文字認識装置１が図２、図３を用いて説明した帳票の種類を判別する処理を実行し、文字認識の対象とする各帳票の判別結果を含む判別データ３０１が生成されているものとする。また、以下の説明では、帳票１００の定義体を生成する処理を一例として示す。なお、文字認識装置１は、他の帳票に関しても、以下で説明する処理を実行することにより、帳票判別情報を生成しても良い。

取得部１１は、判別データ３０１からレコードを取得する（Ｓ３０１）。このとき、取得部１１は、帳票Ｎに対応するレコードを取得したものとする。

取得部１１は、Ｓ３０１で取得したレコードに含まれる帳票画像を取得する（Ｓ３０２）。

そして、取得部１１は、Ｓ３０２で取得した帳票画像に含まれるアイテムの画像を取得し、アイテムデータに格納する（Ｓ３０３）。取得部１１は、例えば、アイテムの画像を取得する帳票が帳票１００のとき、ＯＣＲ機能を用いて、図１０に示す帳票１００に記載されている図形および文字列の画像領域を切り出したアイテムの画像を取得しても良い。

図１７は、アイテムデータの一例を示す図である。
アイテムデータ５００は、一例として、帳票１００に対応するアイテムデータを示す。

アイテムデータ５００には、図１７に示すように、帳票種類と、アイテム識別子と、アイテム名と、画像領域と、アイテム画像とが関連付けられて格納されている。

アイテム識別子は、帳票１００に記載されている各アイテムを識別する情報である。なお、アイテム識別子は、文字認識装置１がアイテムデータを生成するときに、各レコードに付与しても良い。

アイテム名とは、帳票１００に記載されている各アイテムの名称を示す情報である。アイテム名には、例えば、アイテムが文字列のとき、認識部１４が認識した文字列を格納しても良い。

画像領域とは、帳票１００において、アイテムが記載されている領域を示す。アイテム識別子ＳＨ１に対応する画像領域（Ｃ３、Ｄ３）−（Ｃ４、Ｄ４)は、例えば、図１１に示すように、図形ＳＨ１を囲む矩形の左上の座標（Ｃ３、Ｄ３）と右下の座標（Ｃ４、Ｄ４）とを示す。これにより、画像領域（Ｃ３、Ｄ３）−（Ｃ４、Ｄ４)は、左上の座標（Ｃ３、Ｄ３）と右下の座標（Ｃ４、Ｄ４）とを結ぶ線を対角線とする矩形を示す情報として用いられる。なお、画像領域が示す矩形は、例えば、アイテムを囲む矩形の中で最小の矩形としても良い。

アイテム画像とは、帳票１００に記載されたアイテムの画像データである。アイテム画像ＩＭ２は、例えば、画像領域（Ｃ３、Ｄ３）−（Ｃ４、Ｄ４）で示される領域を切り出した図形１の画像データである。

図４を参照して説明する。
取得部１１は、Ｓ３０１で取得したレコードに含まれる判別結果は新規か否かを判定する（Ｓ３０４）。

取得部１１は、Ｓ３０１で取得したレコードに含まれる判別結果が新規でない（既存である）とき（Ｓ３０４にてＮｏ）、後述するＳ６０１の処理を実行する。

取得部１１は、Ｓ３０１で取得したレコードに含まれる判別結果が新規であるとき（Ｓ３０４にてＹｅｓ）、Ｓ３０１で取得したレコードに含まれる判別結果が罫線不一致であるか否かを判定する（Ｓ３０５）。

取得部１１は、Ｓ３０１で取得したレコードに含まれる判別結果が罫線不一致でないとき（Ｓ３０５にてＮｏ）、罫線が一致した帳票に対応する定義体を参照し、罫線座標を取得する（Ｓ３０６）。そして、取得部１１は、取得した罫線座標を生成部１３に出力する。生成部１３は、後述するＳ３０８の処理を実行する。

取得部１１は、Ｓ３０１で取得したレコードに含まれる判別結果が罫線不一致のとき（Ｓ３０５にてＹｅｓ）、帳票画像に含まれる罫線座標を取得する（Ｓ３０７）。そして、取得部１１は、取得した罫線座標を生成部１３に出力する。このとき、取得部１１は、例えば、帳票が帳票１００のとき、ＯＣＲ機能を用いて図１１に示す帳票１００に記載されている罫線座標を取得しても良い。なお、帳票１００（帳票識別子：帳票Ｎ）は、図１６の判別データ３０１に示すように、罫線一致帳票がないので、Ｓ３０５にてＹｅｓの場合に該当する。

そして、生成部１３は、罫線座標が入力されると、罫線情報に罫線識別子と、取得した罫線座標とを関連付けて格納する新規の定義体を生成する（Ｓ３０８）。なお、生成部１３は、例えば、帳票１００の定義体を生成するとき、図１２に示す帳票判別情報２００の罫線識別子、および罫線座標に示す情報を定義体に格納しても良い。定義体の帳票種類に格納する帳票識別子は、Ｓ３０１で取得したレコードに含まれる帳票識別子を格納しても良い。帳票１００の場合には、例えば、帳票種類に帳票Ｎを格納しても良い。

生成部１３は、生成した新規の定義体を定義体情報２１に記憶する（Ｓ３０９）。
図５を参照して説明する。

抽出部１２は、設定情報２７から第１サイズを取得する。そして、抽出部１２は、アイテムデータ５００に格納した画像領域を検索し、縦幅のサイズが第１サイズに含まれる縦幅のサイズ以上、および横幅のサイズが第１サイズに含まれる横幅のサイズ以上のアイテムの画像を抽出する（Ｓ４０１）。また、抽出部１２は、アイテムデータ５００に格納されたアイテムが文字列のとき、第１文字サイズを用いて、縦幅のサイズが第１文字サイズに含まれる縦幅のサイズ以上、および横幅のサイズが第１文字サイズに含まれる横幅のサイズ以上のアイテムの画像を抽出しても良い。

そして、抽出部１２は、抽出したアイテムの画像が文字列の画像であるか否かを判定する（Ｓ４０２）。

抽出部１２は、抽出した抽出したアイテムの画像が文字列の画像でない（図形である）とき（Ｓ４０２にてＮｏ）、後述するＳ４０４の処理を実行する。

抽出部１２は、抽出したアイテムの画像が文字列の画像であるとき（Ｓ４０２にてＹｅｓ）、文字列の画像に含まれる文字数が第１文字数以上か否かを判定する（Ｓ４０３）。

抽出部１２は、文字列の画像に含まれる文字数が第１文字数以上でないとき（Ｓ４０３にてＮｏ）、後述するＳ４０６の処理を実行する。

抽出部１２は、文字列の画像に含まれる文字数が第１文字数以上であるとき（Ｓ４０３にてＹｅｓ）、Ｓ４０４の処理を実行する。すなわち、抽出部１２は、Ｓ４０１で抽出したアイテムの画像が文字列の画像の場合、文字列の文字数が第１文字数以上であるとき、文字列の画像を特徴画像の候補として抽出する。

さらに、生成部１３は、アイテムデータから抽出したアイテムを含むレコードを取得する（Ｓ４０４）。

そして、生成部１３は、Ｓ４０４で取得したレコードを抽出データに格納する（Ｓ４０５）。

図１８は、抽出データの一例を示す図である。
抽出データ６００には、図１８に示すように、アイテム識別子と、アイテム名と、画像領域と、アイテム画像とが関連付けられて格納されている。なお、抽出データ６００は、帳票１００に対応するデータである。抽出データ６００には、帳票１００に記載されたアイテムの画像から、第１サイズ以上のアイテムの画像を抽出した結果が格納されている。すなわち、抽出データ６００には、帳票１００の特徴画像の候補が格納されている。

そして、抽出部１２は、アイテムデータに格納された画像領域について、全て検索が終了したか否かを判定する（Ｓ４０６）。すなわち、抽出部１２は、第１サイズ以上のアイテムを全て抽出したか否かを判定する。

抽出部１２は、アイテムデータに格納された画像領域について、全て検索していないとき（Ｓ４０６にてＮｏ）、Ｓ４０１の処理を実行する。

抽出部１２は、アイテムデータに格納された画像領域について、全て検索したとき（Ｓ４０６にてＹｅｓ）、Ｓ５０１の処理を実行する。すなわち、抽出部１２は、帳票から全ての特徴画像の候補となるアイテムの画像を抽出したとき、Ｓ５０１の処理を実行する。

図６を参照して説明する。
生成部１３は、Ｓ３０１で取得したレコードに含まれる判別結果が罫線不一致か否かを判定する（Ｓ５０１）。

生成部１３は、Ｓ３０１で取得したレコードに含まれる判別結果が罫線不一致のとき（Ｓ５０１にてＹｅｓ）、抽出データの各レコードを新規の定義体に格納する（Ｓ５０２）。生成部１３は、例えば、Ｓ３０８において生成した帳票１００の定義体に、図１８に示す抽出データ６００のアイテム識別子、画像領域、およびアイテム画像を、それぞれ図１２に示す帳票判別情報２００のアイテム識別子、画像領域、および特徴画像に格納する。すなわち、生成部１３は、Ｓ３０８とＳ５０２とを実行することで、帳票１００の定義体について、帳票判別情報２００を生成する。そして、後述するＳ６０１の処理を実行する。

生成部１３は、Ｓ３０１で取得したレコードに含まれる判別結果が罫線一致のとき（Ｓ５０１にてＮｏ）、罫線一致帳票に対応する定義体に格納されている画像領域と、抽出したアイテムの画像領域とが一致するか否かを判定する（Ｓ５０３）。このとき、生成部１３は、読取部３０による読取り誤差などを考慮して、所定の誤差を設定し、誤差の範囲内であれば罫線一致帳票に対応する定義体に格納されている画像領域と、抽出したアイテムの画像領域とが一致していると判定しても良い。なお、罫線一致帳票に対応する定義体とは、例えば、Ｓ３０１で取得したレコードに含まれる罫線一致帳票に格納された帳票識別子に対応する定義体である。

生成部１３は、罫線一致帳票に対応する定義体に格納されている画像領域と、抽出したアイテムの画像領域とが一致しないとき（Ｓ５０３にてＮｏ）、Ｓ５０２の処理を実行する。このとき、生成部１３は、Ｓ５０２において、罫線一致帳票に対応する定義体に格納された罫線情報と、Ｓ４０１〜Ｓ４０６の処理において生成した抽出データを格納した特徴情報とを関連付けて格納した新規の定義体を生成する。

生成部１３は、罫線一致帳票に対応する定義体に格納されている画像領域と、抽出したアイテムの画像領域とが一致するとき（Ｓ５０３にてＹｅｓ）、罫線一致帳票に対応する定義体に格納されている特徴画像と、抽出したアイテムの画像が一致するか否かを判定する（Ｓ５０４）。

生成部１３は、罫線一致帳票に対応する定義体に格納されている特徴画像と、抽出したアイテムの画像とが一致しないとき（Ｓ５０４にてＮｏ）、Ｓ５０２の処理を実行する。このとき、生成部１３は、Ｓ５０２において、罫線一致帳票に対応する定義体に格納された罫線情報と、Ｓ４０１〜Ｓ４０６の処理において生成した抽出データを格納した特徴情報とを関連付けて格納した新規の定義体を生成する。

生成部１３は、罫線一致帳票に対応する定義体に格納されている特徴画像と、抽出したアイテムの画像とが一致するとき（Ｓ５０４にてＹｅｓ）、未使用のサイズの閾値と、未使用の文字数の閾値とが設定情報２７に格納されているか否かを判定する（Ｓ５０５）。ここで、未使用のサイズの閾値とは、例えば、第１サイズをＳ４０１で使用していたとき、設定情報２７に格納されている第１サイズよりも小さい第２サイズのことである。また、未使用の文字数の閾値とは、例えば、第１文字数をＳ４０３で使用していたとき、設定情報２７に格納されている第１文字数よりも少ない第２文字数のことである。

生成部１３は、未使用のサイズの閾値と、未使用の文字数の閾値とが設定情報２７に格納されていないとき（Ｓ５０５にてＮｏ）、後述するＳ６０１の処理を実行する。このとき、生成部１３は、定義体を生成する処理をエラーとして終了しても良い。また、生成部１３は、表示部４０にエラー情報と、帳票の画像を表示させ、ユーザに対して手入力による帳票判別情報２００の生成を促しても良い。そして、生成部１３は、ユーザが帳票判別情報２００を生成したあと、後述するＳ６０１の処理を実行しても良い。

生成部１３は、未使用のサイズの閾値と、文字数の閾値とが設定情報２７に格納されているとき（Ｓ５０５にてＹｅｓ）、サイズの閾値、および文字数の閾値とを変更し、Ｓ４０１〜Ｓ４０６の処理を実行する（Ｓ５０６）。

図１９は、抽出データの一例を示す図である。
図１０、図１８および図１９を参照して、Ｓ５０６において、サイズの閾値と文字数の閾値とを変更したときの抽出データを説明する。以下の説明では、生成部１３は、サイズの閾値を第１サイズから第２サイズに変更し、文字数の閾値を第１文字数から第２文字数に変更したものとする。そして、第１文字数は、例えば、５文字であるものとする。また、第２文字数は、例えば、２文字であるものとする。

図１８に示す抽出データ６００は、帳票１００において、抽出部１２が第１サイズと第１文字数とを用いてアイテムの画像を抽出したときの抽出データである。抽出データ６００には、抽出部１２によって抽出された、第１サイズ以上の大きさである図形ＳＨ１、図形ＳＨ３が格納される。さらに、抽出データ６００には、抽出部１２によって抽出された、第１サイズ以上の大きさであり、かつ第１文字数（５文字）以上の文字数を有する文字列の画像である払込取扱表（ＣＨ２）が格納される。

図１９に示す抽出データ６００は、帳票１００において、抽出部１２が第２サイズと第２文字数とを用いてアイテムの画像を抽出したときの抽出データである。抽出データ６００には、抽出部１２によって抽出された、第２サイズ以上の大きさである図形ＳＨ１、図形ＳＨ３、図形ＳＨ５が格納される。さらに、抽出データ６００には、抽出部１２によって抽出された、第２サイズ以上の大きさであり、かつ第２文字数（２文字）以上の文字数を有する文字列の画像である東京（ＣＨ１）と払込取扱表（ＣＨ２）とが格納される。

なお、生成部１３は、Ｓ５０５において、未使用のサイズの閾値、および文字数の閾値のいずれか１以上が設定情報２７に記憶されているとき、Ｓ５０６において、サイズの閾値、および文字数の閾値のいずれか１以上を変更しても良い。また、生成部１３は、第１文字サイズよりも小さいサイズである第２文字サイズが設定情報２７に記憶されているとき、Ｓ５０６において、第1文字サイズを第２文字サイズに変更しても良い。

以上により、文字認識装置１は、帳票判別情報２００を生成する処理を終了する。続いて、文字認識装置１は、文字認識情報２０１を生成する処理を実行する。

図７〜図９を参照して、文字認識情報２０１を生成する処理を説明する。
図７を参照して説明する。以下の説明では、帳票１００の文字認識情報２０１の生成を一例として説明する。なお、文字認識装置１は、他の帳票に関しても、以下で説明する処理を実行することにより、文字認識情報を生成しても良い。

生成部１３は、アイテムデータ５００から文字列（アイテム名）を取得する（Ｓ６０１）。生成部１３は、後述するＳ６０４の処理に続いて、Ｓ６０１の処理を実行するとき、未取得の文字列をアイテムデータ５００から取得しても良い。

そして、生成部１３は、見出しデータ７００を検索し、Ｓ６０１で取得した文字列と同じ見出し文言があるか否かを判定する（Ｓ６０２）。

図２０は、見出しデータの一例を示す図である。
見出しデータ７００は、見出し識別子と、項目種と、見出し文言と、データ種と、最大桁数とを記憶している。

見出し識別子とは、各見出しを識別するための情報である。
生成部１３は、見出しデータ７００を検索し、Ｓ６０１で取得した文字列と同じ見出し文言があるとき（Ｓ６０２にてＹｅｓ）、文字列が見出し文言に関連付けられた項目種を示す見出しであると認識する（Ｓ６０３）。そして、生成部１３は、項目種を示す見出し文言として、文字列を設定情報２７に格納する。これにより、設定情報２７には、各項目種と、対応する見出し文言が関連付けられて記憶される。そして、生成部１３は、Ｓ６０４の処理を実行する。

生成部１３は、見出しデータ７００を検索し、Ｓ６０２で取得した文字列と同じ見出し文言がないとき（Ｓ６０２にてＮｏ）、Ｓ６０４の処理を実行する。

生成部１３は、Ｓ６０１において、アイテムデータ５００の全ての文字列を取得したか否かを判定する（Ｓ６０４）。

生成部１３は、Ｓ６０１において、アイテムデータ５００の全ての文字列を取得していないとき（Ｓ６０４にてＮｏ）、Ｓ６０１の処理を実行する。

生成部１３は、Ｓ６０１において、アイテムデータ５００の全ての文字列を取得したとき（Ｓ６０４にてＹｅｓ）、Ｓ７０１の処理を実行する。このとき、生成部１３は、帳票１００に記載されている項目種に対応する見出し文言を全て認識したものとする。なお、生成部１３は、帳票１００に記載されている項目種に対応する見出し文言を全て認識できないとき、定義体を生成する処理をエラーとして終了しても良い。このとき、生成部１３は、表示部４０にエラー情報を表示させることにより、ユーザに対して手入力による定義体の生成を促しても良い。

図８を参照して説明する。
生成部１３は、アイテムデータ５００から文字列（アイテム名）を取得する（Ｓ７０１）。生成部１３は、後述するＳ７０３の処理に続いて、Ｓ７０１の処理を実行するとき、未取得の文字列をアイテムデータ５００から取得しても良い。

生成部１３は、取引データ４００にＳ７０１で取得した文字列と同じ文字列を示す項目データがあるか否かを判定する（Ｓ７０２）。

生成部１３は、取引データ４００にＳ７０１で取得した文字列と同じ文字列を示す項目データがないとき（Ｓ７０２にてＮｏ）、Ｓ７０１においてアイテムデータ５００の全ての文字列を取得したか否かを判定する（Ｓ７０３）。

生成部１３は、Ｓ７０１においてアイテムデータ５００の全ての文字列を取得していないとき（Ｓ７０３にてＮｏ）、Ｓ７０１の処理を実行する。

生成部１３は、Ｓ７０１において、アイテムデータ５００の全ての文字列を取得したとき（Ｓ７０３にてＹｅｓ）、定義体を生成する処理を終了する。このとき、生成部１３は、後述するＳ８０５において、全ての項目種に対応するレコードを生成していないと判定されている場合、定義体を生成する処理をエラーとして終了しても良い。そして、生成部１３は、表示部４０にエラー情報と、生成していない文字認識情報２０１のレコードとを表示させ、ユーザに対して手入力による定義体の生成を促しても良い。

Ｓ７０２において、生成部１３は、取引データ４００にＳ７０１で取得した文字列と同じ文字列を示す項目データがあるとき（Ｓ７０２にてＹｅｓ）、取引データ４００から同じ文字列を示す項目データに関連付けられた項目種を取得する（Ｓ７０４）。

生成部１３は、設定情報２７を参照して、Ｓ７０４で取得した項目種を示す見出し文言を取得する（Ｓ７０５）。

そして、生成部１３は、Ｓ７０１で取得した文字列が、Ｓ７０５で取得した項目種を示す見出し文言の近傍にあるか否かを判定する（Ｓ７０６）。生成部１３は、例えば、アイテムデータ５００から、Ｓ７０５で取得した項目種を示す見出し文言に対応する画像領域を取得し、Ｓ７０１で取得した文字列に対応する画像領域との位置関係を判定する。これにより、生成部１３は、Ｓ７０１で取得した文字列が、Ｓ７０５で取得した項目種を示す見出しの近傍にあるか否かを判定する。見出しの近傍とは、例えば、紙面の種類や見出し種別により異なる。見出しの近傍とは、紙面が帳票１００であるとき、例えば、見出しの下、右下、および右側にある所定の領域のことを言う。

生成部１３は、Ｓ７０１で取得した文字列が、Ｓ７０５で取得した項目種を示す見出しの近傍にないとき（Ｓ７０６にてＮｏ）、Ｓ７０３の処理を実行する。

生成部１３は、Ｓ７０１で取得した文字列が、Ｓ７０５で取得した項目種を示す見出しの近傍にあるとき（Ｓ７０６にてＹｅｓ）、文字列が項目種に対応する項目データであると認識する（Ｓ７０７）。

なお、生成部１３は、Ｓ７０６において、Ｓ７０５で取得した見出し文言に対応するデータ種を見出しデータ７００から取得しても良い。そして、生成部１３は、取得したデータ種がＳ７０１で取得した文字列の種類に対応するとき、Ｓ７０７の処理を実行しても良い。また、生成部１３は、取得したデータ種がＳ７０１で取得した文字列の種類に対応しないとき、Ｓ７０３の処理を実行しても良い。

生成部１３は、Ｓ７０７で項目データと認識した文字列を囲む認識領域を取得する（Ｓ７０８）。そして、Ｓ８０１の処理を実行する。

図２１、および図２２は、認識領域を説明する図である。
図２１を参照して、認識領域の設定について説明する。以下の説明においては、項目種（金額）に対応する見出し文言（振込額）について、対応する項目データの認識領域を設定する処理について説明する。

生成部１３は、図２１に示すように、項目データ８００が罫線に囲まれているとき、項目データ８００を囲む罫線の左上の座標（Ｇ９、Ｈ９）と、右下の座標（Ｇ１０、Ｈ１０）とを取得する。これにより、生成部１３は、左上の座標（Ｇ９、Ｈ９）と右下の座標（Ｇ１０、Ｈ１０）とを結ぶ線を対角線とする矩形を示す画像領域（Ｇ９、Ｈ９）−（Ｇ１０、Ｈ１０)を取得する。そして、生成部１３は、取得した画像領域（Ｇ９、Ｈ９）−（Ｇ１０、Ｈ１０)を項目データ８００の認識をする認識領域に設定する。

生成部１３は、図２２（ａ）に示すように、項目データ８０１が罫線に囲まれていないとき、図２２（ｂ）に示すように、項目データ８０１を囲み、他の文言を含まない領域を囲む矩形を生成する。そして、生成部１３は、生成した矩形の左上の座標（Ｇ９、Ｈ９）と、矩形の右下の座標（Ｇ１０、Ｈ１０）とを取得する。これにより、生成部１３は、左上の座標（Ｇ９、Ｈ９）と右下の座標（Ｇ１０、Ｈ１０）とを結ぶ線を対角線とする矩形を示す画像領域（Ｇ９、Ｈ９）−（Ｇ１０、Ｈ１０)を取得する。そして、生成部１３は、取得した画像領域（Ｇ９、Ｈ９）−（Ｇ１０、Ｈ１０)を項目データ８００の認識をする認識領域に設定する。なお、認識領域が示す矩形は、例えば、項目データを囲む矩形の中で最小の矩形としても良い。

図９を参照して説明する。
生成部１３は、Ｓ３０１で取得したレコードに含まれる判別結果が新規であるか否かを判定する（Ｓ８０１）。

生成部１３は、Ｓ３０１で取得したレコードに含まれる判別結果が新規であるとき（Ｓ８０１にてＹｅｓ）、文字認識情報２０１に、Ｓ７０４で取得した項目種に対応するレコードを生成する。そして、生成部１３は、Ｓ７０４で取得した項目種と関連付けて、Ｓ７０８で取得した認識領域を文字認識情報２０１に格納する（Ｓ８０２）。

生成部１３は、見出しデータ７００を検索し、Ｓ７０４で取得した項目種を含むレコードを取得する（Ｓ８０３）。

生成部１３は、取得したレコードに含まれる情報を文字認識情報２０１に格納する（Ｓ８０４）。すなわち、生成部１３は、Ｓ７０４で取得した項目種を含むレコードから、データ種、および最大桁数を取得し、取得した情報をＳ７０４で取得した項目種に関連付けて文字認識情報２０１に格納する。

そして、生成部１３は、全ての項目種に対応するレコードを生成したか否かを判定する（Ｓ８０５）。

生成部１３は、全ての項目種に対応するレコードを生成していないとき（Ｓ８０５にてＮｏ）、Ｓ７０１の処理を実行する。

生成部１３は、全ての項目種に対応するレコードを生成したとき（Ｓ８０５にてＹｅｓ）、定義体を生成する処理を終了する。

Ｓ８０１において、生成部１３は、Ｓ３０１で取得したレコードに含まれる判別結果が既存であるとき（Ｓ８０１にてＮｏ）、Ｓ３０１で取得したレコードに含まれる罫線一致帳票に対応する定義体から、Ｓ７０４で取得した項目種に関連付けられた認識領域（以下、既存の認識領域とも言う。）を取得する。そして、生成部１３は、Ｓ７０８で取得した認識領域と、既存の認識領域とが異なるか否かを判定する（Ｓ８０６）。

生成部１３は、Ｓ７０８で取得した認識領域と、既存の認識領域とが同じとき（Ｓ８０６にてＮｏ）、Ｓ８０５の処理を実行する。

生成部１３は、Ｓ７０８で取得した認識領域と、既存の認識領域とが異なるとき（Ｓ８０６にてＹｅｓ）、既存の帳票の文字認識情報２０１に格納された認識領域をＳ７０８で取得した認識領域に更新する（Ｓ８０７）。そして、生成部１３は、Ｓ８０５の処理を実行する。これにより、生成部１３は、既存の帳票において、項目データの認識領域のみが変更されたとき、既存の帳票に対応する定義体の認識領域を自動で更新する。

図２３は、コンピュータ装置の一実施例を示すブロック図である。
図２３を参照して、文字認識装置１の構成について説明する。

図２３において、コンピュータ装置９００は、制御回路９０１と、記憶装置９０２と、読書装置９０３と、記録媒体９０４と、通信インターフェイス９０５（通信Ｉ／Ｆ）と、入出力インターフェイス９０６（入出力Ｉ／Ｆ）と、表示装置９０７とネットワーク９０８とを備えている。また、各構成要素は、バス９０９により接続されている。

制御回路９０１は、コンピュータ装置９００全体の制御をする。そして、制御回路９０１は、例えば、ＣＰＵ、マルチコアＣＰＵ、ＦＰＧＡ（ＦｉｅｌｄＰｒｏｇｒａｍｍａｂｌｅＧａｔｅＡｒｒａｙ）およびＰＬＤ（ＰｒｏｇｒａｍｍａｂｌｅＬｏｇｉｃＤｅｖｉｃｅ）などである。制御回路９０１は、例えば、図１において、制御部１０として機能する。なお、ＣＰＵ、ＦＰＧＡ、およびＰＬＤのキャッシュは、例えば、図１に示す設定情報２７を記憶しても良い。

記憶装置９０２は、各種データを記憶する。そして、記憶装置９０２は、例えば、ＲＯＭ（ＲｅａｄＯｎｌｙＭｅｍｏｒｙ）およびＲＡＭ（ＲａｎｄｏｍＡｃｃｅｓｓＭｅｍｏｒｙ）などのメモリや、ＨＤ（ＨａｒｄＤｉｓｋ）などで構成される。記憶装置９０２は、例えば、図１において、記憶部２０として機能する。そして、記憶装置９０２は、例えば、図１に示す、定義体情報２１と、取引情報２２と、判別情報２３と、アイテム情報２４と、抽出情報２５と、見出し情報２６と、設定情報２７とを記憶しても良い。

また、ＲＯＭは、ブートプログラムなどのプログラムを記憶している。ＲＡＭは、制御回路９０１のワークエリアとして使用される。ＨＤは、ＯＳ、アプリケーションプログラム、ファームウェアなどのプログラム、および各種データを記憶している。

記憶装置９０２は、例えば、制御回路９０１を、制御部１０として機能させる文字認識プログラムを記憶する。

文字認識装置１は、帳票の種類を判別する処理や定義体を生成する処理をするとき、記憶装置９０２に記憶された文字認識プログラムをＲＡＭに読み出す。そして、文字認識装置１は、制御回路９０１で、ＲＡＭに読み出された文字認識プログラムを実行することにより、帳票の種類を判別する処理や定義体を生成する処理を実行する。

なお、文字認識プログラムは、制御回路９０１が通信インターフェイス９０５を介してアクセス可能であれば、ネットワーク９０８上のサーバが有する記憶装置に記憶されていても良い。

読書装置９０３は、制御回路９０１に制御され、着脱可能な記録媒体９０４のデータのリード／ライトを行なう。そして、読書装置９０３は、例えば、ＦＤＤ（ＦｌｏｐｐｙＤｉｓｋＤｒｉｖｅ）、ＣＤＤ（ＣｏｍｐａｃｔＤｉｓｃＤｒｉｖｅ）、ＤＶＤＤ（ＤｉｇｉｔａｌＶｅｒｓａｔｉｌｅＤｉｓｋＤｒｉｖｅ）、ＢＤＤ（Ｂｌｕ−ｒａｙ（登録商標）ＤｉｓｋＤｒｉｖｅ）およびＵＳＢ（ＵｎｉｖｅｒｓａｌＳｅｒｉａｌＢｕｓ）などである。

記録媒体９０４は、各種データを保存する。記録媒体９０４は、例えば、文字認識プログラムを記憶する。さらに、記録媒体９０４は、例えば、図１に示す、定義体情報２１と、取引情報２２と、判別情報２３と、アイテム情報２４と、抽出情報２５と、見出し情報２６と、設定情報２７とを記憶しても良い。

そして、記録媒体９０４は、読書装置９０３を介してバス９０９に接続され、制御回路９０１が読書装置９０３を制御することにより、データのリード／ライトが行なわれる。また、記録媒体９０４は、例えば、ＦＤ（ＦｌｏｐｐｙＤｉｓｋ）、ＣＤ（ＣｏｍｐａｃｔＤｉｓｃ）、ＤＶＤ（ＤｉｇｉｔａｌＶｅｒｓａｔｉｌｅＤｉｓｋ）、ＢＤ（Ｂｌｕ−ｒａｙ(登録商標）Ｄｉｓｋ）、およびフラッシュメモリなどである。

通信インターフェイス９０５は、ネットワーク９０８を介してコンピュータ装置９００と他の装置とを通信可能に接続する。

入出力インターフェイス９０６は、例えば、キーボード、マウス、タッチパネル、およびスキャナなどと接続され、接続された装置から各種情報を示す信号が入力されると、バス９０９を介して入力された信号を制御回路９０１に出力する。また、入出力インターフェイス９０６は、制御回路９０１から出力された各種情報を示す信号がバス９０９を介して入力されると、接続された各種装置にその信号を出力する。入出力インターフェイス９０６は、例えば、第１サイズ、第２サイズ、第１文字サイズ、第２文字サイズ、第１文字数、および第２文字数の設定値の入力を受け付けても良い。また、入出力インターフェイス９０６に接続されるスキャナは、例えば、図１に示す読取部３０として機能する。

表示装置９０７は、例えば、入出力インターフェイス９０６に接続され、制御部１０から入力される信号に基づいて、各種情報を表示する。また、表示装置９０７は、例えば、例えばＣＲＴ（ＣａｔｈｏｄｅＲａｙＴｕｂｅ）、ＬＣＤ（ＬｉｑｕｉｄＣｒｙｓｔａｌＤｉｓｐｌａｙ）、ＰＤＰ（ＰｌａｓｍａＤｉｓｐｌａｙＰａｎｅｌ）、およびＯＥＬＤ（ＯｒｇａｎｉｃＥｌｅｃｔｒｏｌｕｍｉｎｅｓｃｅｎｃｅＤｉｓｐｌａｙ）などである。そして、表示装置９０７は、例えば、図１において、表示部４０として機能する。

ネットワーク９０８は、例えば、ＬＡＮ、無線通信、またはインターネットなどであり、コンピュータ装置９００と他の装置を通信接続する。

以上のように、実施形態の文字認識装置１は、紙面に記載されたアイテムの画像から所定のサイズ以上の画像を抽出し、抽出したアイテムの画像を特徴画像として格納する定義体を生成する。これにより、実施形態の文字認識装置１は、定義体を自動生成することができる。

実施形態の文字認識装置１は、読取部３０で読み取った紙面の画像からアイテムの画像を取得し、取得したアイテムの画像と同じ画像を、定義体に格納されている特徴画像から検索する。これにより、実施形態の文字認識装置１は、読取部３０で読み取った紙面の種類を、検索された特徴画像を格納した定義体に格納された紙面の種類であると認識することができる。

実施形態の文字認識装置１は、紙面から取得されたアイテムの画像の中で、縦幅のサイズと横幅のサイズとが所定のサイズ以上のアイテムの画像を抽出し、抽出したアイテムの画像を特徴画像として格納する定義体を生成する。したがって、実施形態の文字認識装置１は、縦幅、および横幅のいずれか一方のみが長い、文章や線などを抽出しない。これにより、実施形態の文字認識装置１は、紙面に記載されたアイテムの画像の中から、他の紙面にない特徴画像を精度よく抽出することができる。

実施形態の文字認識装置１は、アイテムの画像が文字列の画像を含むとき、文字列に含まれる文字が所定のサイズ以上のアイテムの画像を特徴画像として格納する定義体を生成する。したがって、実施形態の文字認識装置１は、文字列の文字が所定のサイズよりも小さいアイテムの画像を特徴画像として抽出しない。これにより、実施形態の文字認識装置１は、紙面に記載されたアイテムの画像の中から、他の紙面にない特徴画像を精度よく抽出することができる。

実施形態の文字認識装置１は、アイテムの画像が文字列の画像を含むとき、文字列に含まれる文字数が所定の文字数以上のアイテムの画像を特徴画像として格納する定義体を生成する。したがって、実施形態の文字認識装置１は、文字列の文字数が所定の文字数よりも少ないアイテムの画像を特徴画像として抽出しない。これにより、実施形態の文字認識装置１は、紙面に記載されたアイテムの画像の中から、他の紙面にない特徴画像を精度よく抽出することができる。

実施形態の文字認識装置１は、特徴画像が記載された領域を示す画像領域と特徴画像とを関連付けて格納する定義体を生成する。そして、実施形態の文字認識装置１は、紙面の種類を判別するとき、紙面に記載されているアイテムの画像と、定義体に格納されている特徴画像とのそれぞれに対応する画像領域を一致判定する。これにより、実施形態の文字認識装置１は、紙面と定義体とに格納されている画像領域が一致したとき、読取部３０で読み取った紙面の種類を、画像領域が一致した定義体に格納された紙面の種類であると認識することができる。

実施形態の文字認識装置１は、アイテムの画像を取得した紙面が有する罫線の配置と、同じ罫線の配置を格納した定義体が記憶部２０に記憶されていないとき、アイテムの画像を取得した紙面の種類と、抽出したアイテムの画像とを関連付けて格納する定義体を生成する。これにより、実施形態の文字認識装置１は、既存の定義体を重複して生成する処理を行わないので、処理の煩雑化を抑制することができる。

実施形態の文字認識装置１は、特徴画像を抽出するときに用いる閾値として、第１サイズと第２サイズとを記憶する。そして、実施形態の文字認識装置１は、紙面が有する罫線の配置と同じ罫線の配置と、紙面から第１サイズを用いて抽出したアイテムの画像と同じアイテムの画像とを格納している定義体が記憶部２０に記憶されているとき、第２サイズ以上のアイテムの画像を抽出する。これにより、実施形態の文字認識装置１は、特徴画像として抽出するアイテムの画像を段階的に小さくするので、抽出される特徴画像の数が多くなり処理が煩雑化するのを抑制し、かつ他の帳票にない特徴画像を抽出することができる。

実施形態の文字認識装置１は、紙面が有する罫線の配置と同じ罫線の配置と、紙面から第１文字数を用いて抽出した文字列の画像と同じ文字列の画像とを格納している定義体が記憶部２０に記憶されているとき、第１文字数よりも少ない第２文字数以上の文字列の画像を抽出する。これにより、実施形態の文字認識装置１は、特徴画像として抽出する文字列の文字数を段階的に少なくするので、抽出される特徴画像の数が多くなり処理が煩雑化するのを抑制し、かつ他の帳票にない特徴画像を抽出することができる。

実施形態の文字認識装置１は、項目種に対応する種類のデータが、項目種を示すと認識した文字列の近傍にあるとき、項目種と、項目種に対応する種類のデータが記載された領域を示す認識領域とを関連付けて格納する定義体を生成する。これにより、実施形態の文字認識装置１は、紙面に記載されている項目種に対応するデータの認識領域を示す定義体の作成を自動化することができる。

実施形態の文字認識装置１は、項目種に対応するデータが罫線に囲まれているとき、罫線に囲まれた領域を認識領域にする。これにより、実施形態の文字認識装置１は、認識領域を自動で設定することができる。

実施形態の文字認識装置１は、データが罫線に囲まれていないとき、データを囲み、他の文言を含まない領域を認識領域にする。これにより、実施形態の文字認識装置１は、認識領域を自動で設定することができる。

実施形態の文字認識装置１は、紙面から取得したアイテムの画像と同じ特徴画像を格納した定義体を検索し、アイテムを取得した紙面の種類を、検索された定義体に格納された紙面の種類であると判別する。これにより、実施形態の文字認識装置１は、定義体を用いて紙面の種類を判別することができる。

実施形態の文字認識装置１は、取得したアイテムの画像と同じ特徴画像と、取得したアイテムの画像領域と同じ特徴画像の画像領域とを関連付けて格納した定義体を検索し、アイテムを取得した紙面の種類を、検索された定義体に格納された紙面の種類であると判別する。これにより、実施形態の文字認識装置１は、定義体を用いて紙面の種類を判別する精度を向上することができる。

なお、本実施形態は、以上に述べた実施形態に限定されるものではなく、本実施形態の要旨を逸脱しない範囲内で種々の構成または実施形態を取ることができる。

１文字認識装置
１０制御部
１１取得部
１２抽出部
１３生成部
１４認識部
１５判別部
２０記憶部
２１定義体情報
２２取引情報
２３判別情報
２４アイテム情報
２５抽出情報
２６情報
２７設定情報
３０読取部
４０表示部
１００帳票
２００帳票判別情報
２０１字認識情報
３００、３０１判別データ
４００取引データ
５００アイテムデータ
６００抽出データ
７００見出しデータ
８００、８０１項目データ
９００コンピュータ装置
９０１制御回路
９０２記憶装置
９０３読書装置
９０４記録媒体
９０５通信インターフェイス
９０６入出力インターフェイス
９０７表示装置
９０８ネットワーク
９０９バス

Claims

紙面の画像から１以上のアイテムの画像を取得する取得部と、
前記取得した１以上のアイテムの画像から、第１サイズ以上のアイテムの画像を抽出する抽出部と、
前記アイテムの画像を取得した紙面の種類と、前記抽出したアイテムの画像とを関連付けて格納する定義体を生成する生成部と、
１以上の定義体を記憶する記憶部と、
を備え、
前記定義体は、紙面の種類と罫線の配置とを関連付けて格納し、
前記抽出部は、前記紙面が有する罫線の配置と同じ罫線の配置と、前記紙面から前記第１サイズを用いて抽出したアイテムの画像と同じアイテムの画像とを格納している定義体が前記記憶部に記憶されているとき、前記第１サイズよりも小さい第２サイズ以上のアイテムの画像を抽出する
ことを特徴とする文字認識装置。
前記第１サイズは、
アイテムの画像の縦幅のサイズと横幅のサイズとを含み、
前記抽出部は、
前記取得した１以上のアイテムの画像から、縦幅のサイズが前記第１サイズに含まれる縦幅のサイズ以上、および横幅のサイズが前記第１サイズに含まれる横幅のサイズ以上のアイテムの画像を抽出する
ことを特徴とする請求項１に記載の文字認識装置。
前記抽出部は、
前記取得した１以上のアイテムの画像が１以上の文字列の画像を含むとき、前記１以上の文字列の画像から、所定の文字サイズ以上の文字を含む第１文字数以上の文字列の画像を抽出する
ことを特徴とする請求項１または２に記載の文字認識装置。
前記生成部は、
前記アイテムの画像を取得した紙面の種類と前記抽出したアイテムの画像と、前記抽出したアイテムの画像が記載された領域を示す画像領域とを関連付けて格納する定義体を生成する
ことを特徴とする請求項１〜３のいずれか一つに記載の文字認識装置。
前記文字認識装置は、さらに、
１以上の定義体を記憶する記憶部を備え、
前記定義体は、さらに、
紙面の種類と罫線の配置とを関連付けて格納し、
前記生成部は、
前記アイテムの画像を取得した紙面が有する罫線の配置と、同じ罫線の配置を格納した定義体が前記記憶部に記憶されていないとき、前記アイテムの画像を取得した紙面の種類と、前記抽出したアイテムの画像とを関連付けて格納する定義体を生成する
ことを特徴とする請求項１〜４のいずれか一つに記載の文字認識装置。
紙面の画像から１以上のアイテムの画像を取得する取得部と、
前記取得した１以上のアイテムの画像から、第１サイズ以上のアイテムの画像を抽出する抽出部と、
前記アイテムの画像を取得した紙面の種類と、前記抽出したアイテムの画像とを関連付けて格納する定義体を生成する生成部と、
１以上の定義体を記憶する記憶部と、
を備え、
前記第１サイズは、アイテムの画像の縦幅のサイズと横幅のサイズとを含み、
前記定義体は、紙面の種類と罫線の配置とを関連付けて格納し、
前記抽出部は、
前記取得した１以上のアイテムの画像から、縦幅のサイズが前記第１サイズに含まれる縦幅のサイズ以上、および横幅のサイズが前記第１サイズに含まれる横幅のサイズ以上のアイテムの画像を抽出し、
前記取得した１以上のアイテムの画像が１以上の文字列の画像を含むとき、前記１以上の文字列の画像から、所定の文字サイズ以上の文字を含む第１文字数以上の文字列の画像を抽出し、
前記紙面が有する罫線の配置と同じ罫線の配置と、前記紙面から前記第１文字数を用いて抽出した文字列の画像と同じ文字列の画像とを格納している定義体が前記記憶部に記憶されているとき、前記第１文字数よりも少ない第２文字数以上の文字列の画像を抽出する
ことを特徴とする文字認識装置。
前記記憶部は、
見出しの項目種と見出し文言とを関連付けて格納する見出し情報を記憶し、
前記文字認識装置は、さらに、
前記取得した１以上のアイテムの画像が文字列の画像を含むとき、前記文字列の文言と同じ見出し文言に関連付けられた項目種を前記見出し情報から検索し、前記文字列が検索した項目種を示すと認識する認識部を備え、
前記生成部は、
項目種に対応する種類のデータが、前記項目種を示すと認識した文字列の近傍にあるとき、前記項目種と、前記項目種に対応する種類のデータが記載された領域を示す認識領域とを関連付けて格納する定義体を生成する
ことを特徴とする請求項１〜６のいずれか一つに記載の文字認識装置。
前記生成部は、
前記データが罫線に囲まれているとき、前記罫線に囲まれた領域を前記認識領域にする
ことを特徴とする請求項７に記載の文字認識装置。
前記生成部は、
前記データが罫線に囲まれていないとき、前記データを囲み、他の文言を含まない領域を前記認識領域にする
ことを特徴とする請求項７に記載の文字認識装置。
前記文字認識装置は、さらに、
前記取得したアイテムの画像と同じアイテムの画像を格納した定義体を検索し、前記アイテムを取得した紙面の種類を、前記検索された定義体に格納された紙面の種類であると判別する判別部と、
を備えることを特徴とする請求項１〜９のいずれか一つに記載の文字認識装置。
前記文字認識装置は、さらに、
前記取得したアイテムの画像と同じアイテムの画像と、前記取得したアイテムの画像領域と同じアイテムの画像領域とを関連付けて格納した定義体を検索し、前記アイテムを取得した紙面の種類を、前記検索された定義体に格納された紙面の種類であると判別する判別部と、
を備えることを特徴とする請求項４に記載の文字認識装置。
コンピュータにより実行される文字認識方法であって、
前記コンピュータは、
紙面の画像から１以上のアイテムの画像を取得し、
前記取得した１以上のアイテムの画像から、第１サイズ以上のアイテムの画像を抽出し、
前記アイテムの画像を取得した紙面の種類と前記抽出したアイテムの画像とを関連付けて格納する定義体を生成し、
１以上の定義体を記憶部に記憶し、
前記定義体は、紙面の種類と罫線の配置とを関連付けて格納され、
前記画像の抽出は、前記紙面が有する罫線の配置と同じ罫線の配置と、前記紙面から前記第１サイズを用いて抽出したアイテムの画像と同じアイテムの画像とを格納している定義体が前記記憶部に記憶されているとき、前記第１サイズよりも小さい第２サイズ以上のアイテムの画像を抽出する
ことを特徴とする文字認識方法。
紙面の画像から１以上のアイテムの画像を取得し、
前記取得した１以上のアイテムの画像から、第１サイズ以上のアイテムの画像を抽出し、
前記アイテムの画像を取得した紙面の種類と前記抽出したアイテムの画像とを関連付けて格納する定義体を生成し、
１以上の定義体を記憶部に記憶し、
前記定義体は、紙面の種類と罫線の配置とを関連付けて格納され、
前記画像の抽出は、前記紙面が有する罫線の配置と同じ罫線の配置と、前記紙面から前記第１サイズを用いて抽出したアイテムの画像と同じアイテムの画像とを格納している定義体が前記記憶部に記憶されているとき、前記第１サイズよりも小さい第２サイズ以上のアイテムの画像を抽出する
処理をコンピュータに実行させることを特徴とする文字認識プログラム。