JP6497012B2 - 情報処理装置及び情報処理プログラム - Google Patents

情報処理装置及び情報処理プログラム Download PDF

Info

Publication number
JP6497012B2
JP6497012B2 JP2014191726A JP2014191726A JP6497012B2 JP 6497012 B2 JP6497012 B2 JP 6497012B2 JP 2014191726 A JP2014191726 A JP 2014191726A JP 2014191726 A JP2014191726 A JP 2014191726A JP 6497012 B2 JP6497012 B2 JP 6497012B2
Authority
JP
Japan
Prior art keywords
character
area
character recognition
frame
type
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2014191726A
Other languages
English (en)
Other versions
JP2016062476A (ja
Inventor
智也 高橋
智也 高橋
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujifilm Business Innovation Corp
Original Assignee
Fuji Xerox Co Ltd
Fujifilm Business Innovation Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fuji Xerox Co Ltd, Fujifilm Business Innovation Corp filed Critical Fuji Xerox Co Ltd
Priority to JP2014191726A priority Critical patent/JP6497012B2/ja
Publication of JP2016062476A publication Critical patent/JP2016062476A/ja
Application granted granted Critical
Publication of JP6497012B2 publication Critical patent/JP6497012B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Character Input (AREA)

Description

本発明は、情報処理装置及び情報処理プログラムに関する。
特許文献1には、文字列中からキー単語の自動抽出を行うことができ、また、複数文字からなるキー単語を精度よく抽出することができ、単語認識に際し誤読することがない文字列認識装置を提供することを課題とし、キー文字コード抽出手段により、認識対象とする文字列群(コード)からキー単語の自動抽出を行い、それらを登録し、次に、キー単語抽出手段により、文字列イメージから、個別文字を切り出して文字認識を行い、上記キー文字コード抽出手段により抽出/登録されたキー単語に相当する文字列を抽出し、そして、文字列イメージから、キー単語で区切られた単語領域を抽出し、単語認識手段により単語認識を行い、さらに、検証手段により単語認識結果を検証し、最終的な文字列認識結果を出力することが開示されている。
特許文献2には、詳細な内容の帳票定義データの作成を自動化することを課題とし、罫線抽出部、罫線特徴抽出部、枠抽出部により、帳票のマスター画像上の罫線で囲まれた枠領域とその罫線特徴を抽出し、文字認識部の認識結果とキーワード辞書とを辞書照合部で照合し、枠作成部で、キーワードと一致した文字(列)の近傍に文字記入枠などの枠領域を作成し、その大きさの妥当性を枠判定部でチェックし、帳票定義出力部で、各領域の領域情報や罫線特徴などが帳票定義書式にしたがって整理され、帳票定義データとして出力されることが開示されている。
特許文献3には、文字列枠と選択肢枠との任意の組み合わせを許容する項目読取手段を提供し、記入者の多様な記入方法に対応した高精度な項目読取手段を提供することを課題とし、文字列枠と選択肢枠の差異を吸収する枠構造式を用いた帳票定義辞書とその枠構造式に沿った認識処理によって、文字列枠と選択肢枠との任意の組み合わせを許容する項目読取りを可能とし、また、各文字列枠や選択肢枠の認識結果を文字切出しグラフの形式で表現し、それらを結合させることにより各枠の認識結果を統合させ、最終的に得られた文字切出しグラフに対し文字列照合を行うことにより、高精度な項目読取りを可能とすることが開示されている。
特許文献4には、手書き文字と活字文字が混在して記入される領域を有する文書画像の文字パターンから特徴抽出を行い、認識辞書との照合によって文字認識を行う文字認識装置で、リジェクトが発生したときのオペレータの負担を軽減し、高速で高精度な文字認識処理を可能とすることを課題とし、文字認識装置に文字領域の座標及び属性を格納する領域属性格納部を設け、文書の各領域について「手書き文字」「活字文字」「手書き活字両用」等の領域属性情報を格納しておき、オペレータが属性を変更する修正部を有し、入力画像データから抽出した領域について属性格納部からのフォーマット情報に含まれる属性に応じた適切な認識辞書を選択して文字認識を行い、認識結果にリジェクトされた文字パターンが存在すると、その領域の属性を変更しその属性にしたがって再度、認識辞書を選択して文字認識処理を行うことが開示されている。
特開2002−216076号公報 特開2001−126010号公報 特開2005−044086号公報 特開2001−307020号公報
ところで、一般的に、文字認識の対象となる文書において、文字が記入されるべき記入領域を、当該文書の作成者が任意で作成すると、当該作成者毎に記入領域の少なくとも分割数及び分割割合のいずれか一方が異なるので、記入領域に記入されるべき文字の種類が決まっているにも関わらず、記入者により異なる種類の文字で記入されることがあった。これにより、文字が記入された後に当該記入領域を読み取って文字認識を行う場合に誤認識が生じやすくなっていた。
本発明は、文書の作成者が任意で当該文書の記入領域を作成する場合に比べて、文書の作成者毎に当該文書の記入領域の少なくとも分割数及び分割割合のいずれか一方が異なることを減らすことを目的とする。
かかる目的を達成するための本発明の要旨とするところは、次の各項の発明に存する。
請求項1の発明は、文字認識の対象となる領域と、前記領域に記入される情報の種別と、を受け付ける受付手段と、前記情報の種別毎に対応付けられた少なくとも分割数及び分割割合のいずれか一方にしたがって、前記領域を分割して部分領域を生成する生成手段と、前記生成手段によって生成された部分領域と、前記情報の種別毎に対応付けられた文字認識の条件と、を関連付ける関連付手段と、前記部分領域の大きさが予め定められた条件に合致する場合に通知する通知手段を具備し、前記通知手段は、前記部分領域内に予め記載されている第2の文字がある場合は、該第2の文字以外の領域のサイズを算出し、手書き文字認識用の推奨サイズと比較することを行う、ことを特徴とする情報処理装置である。
請求項2の発明は、前記関連付手段が関連付ける文字認識の条件として、前記部分領域に記入される文字認識の対象となる第1の文字の種類、該部分領域に予め記載されている第2の文字、該第2の文字の該部分領域における位置、該部分領域の枠線の種類のいずれか1つ以上を設定することを特徴とする請求項1に記載の情報処理装置である。
請求項3の発明は、前記生成手段によって生成された部分領域に、前記関連付手段によって関連付けられた文字認識の条件にしたがって、前記第2の文字の記載、部分領域の枠線の記載のいずれか1つ以上を行って、文書を生成する文書生成手段をさらに具備することを特徴とする請求項2に記載の情報処理装置である。
請求項の発明は、コンピュータを、文字認識の対象となる領域と、前記領域に記入される情報の種別と、を受け付ける受付手段と、前記情報の種別毎に対応付けられた少なくとも分割数及び分割割合のいずれか一方にしたがって、前記領域を分割して部分領域を生成する生成手段と、前記生成手段によって生成された部分領域と、前記情報の種別毎に対応付けられた文字認識の条件と、を関連付ける関連付手段と、前記部分領域の大きさが予め定められた条件に合致する場合に通知する通知手段として機能させ、前記通知手段は、前記部分領域内に予め記載されている第2の文字がある場合は、該第2の文字以外の領域のサイズを算出し、手書き文字認識用の推奨サイズと比較することを行う、情報処理プログラムである。
請求項1の情報処理装置によれば、文書の作成者が任意で当該文書の記入領域を作成する場合に比べて、文書の作成者毎に当該文書の記入領域の少なくとも分割数及び分割割合のいずれか一方が異なることを減らすことができる。
請求項2の情報処理装置によれば、文字認識の条件として、部分領域に記入される文字認識の対象となる第1の文字の種類、部分領域に予め記載されている第2の文字、第2の文字の部分領域における位置、部分領域の枠線の種類のいずれか1つ以上を設定することができる。
請求項3の情報処理装置によれば、部分領域に、第2の文字の記載、部分領域の枠線の記載のいずれか1つ以上を行って、文書を生成することができる。
請求項の情報処理プログラムによれば、文書の作成者が任意で当該文書の記入領域を作成する場合に比べて、文書の作成者毎に当該文書の記入領域の少なくとも分割数及び分割割合のいずれか一方が異なることを減らすことができる。
本実施の形態の構成例についての概念的なモジュール構成図である。 本実施の形態を実現した場合のシステム構成を示す説明図である。 本実施の形態による処理例を示すフローチャートである。 文字認識条件テーブルのデータ構造例を示す説明図である。 文字認識条件テーブルのデータ構造例を示す説明図である。 本実施の形態による処理例を示す説明図である。 本実施の形態による処理例を示す説明図である。 本実施の形態による処理例を示す説明図である。 本実施の形態による処理例を示す説明図である。 本実施の形態による処理例を示す説明図である。 本実施の形態による処理例を示す説明図である。 本実施の形態による処理例を示す説明図である。 本実施の形態による処理例を示す説明図である。 本実施の形態による処理例を示す説明図である。 本実施の形態による処理例を示す説明図である。 本実施の形態を実現するコンピュータのハードウェア構成例を示すブロック図である。
まず、本実施の形態を説明する前に、その前提となる技術について説明する。なお、この説明は、本実施の形態の理解を容易にすることを目的とするものである。
帳票に手書きされた文字を文字認識してデータ処理を行う場合、帳票作成者と筆記者(その帳票に手書きの文字を記載する者)は異なることが多く、帳票作成者と筆記者の意図が異なり、帳票作成者が求める形式に必ずしも記載されない場合がある。例えば、年を記載するのに、「H.25」、「平成25年」、「2013年」等と種々あり、時刻を記載するのに、「13:15」、「午後1時15分」等と種々あり、帳票作成者が意図した形式とは異なる記載が採用されてしまう場合がある。
一方、手書きされた帳票から期待する形式の文字認識結果を得るためには、認識対象となる領域を定義し、その領域内に筆記される文字の種類、並び方、割合、基準となる文字、線等を適する形で設定する必要がある。
以下、図面に基づき本発明を実現するにあたっての好適な一実施の形態の例を説明する。
図1は、本実施の形態の構成例についての概念的なモジュール構成図を示している。
なお、モジュールとは、一般的に論理的に分離可能なソフトウェア(コンピュータ・プログラム)、ハードウェア等の部品を指す。したがって、本実施の形態におけるモジュールはコンピュータ・プログラムにおけるモジュールのことだけでなく、ハードウェア構成におけるモジュールも指す。それゆえ、本実施の形態は、それらのモジュールとして機能させるためのコンピュータ・プログラム(コンピュータにそれぞれの手順を実行させるためのプログラム、コンピュータをそれぞれの手段として機能させるためのプログラム、コンピュータにそれぞれの機能を実現させるためのプログラム)、システム及び方法の説明をも兼ねている。ただし、説明の都合上、「記憶する」、「記憶させる」、これらと同等の文言を用いるが、これらの文言は、実施の形態がコンピュータ・プログラムの場合は、記憶装置に記憶させる、又は記憶装置に記憶させるように制御するの意である。また、モジュールは機能に一対一に対応していてもよいが、実装においては、1モジュールを1プログラムで構成してもよいし、複数モジュールを1プログラムで構成してもよく、逆に1モジュールを複数プログラムで構成してもよい。また、複数モジュールは1コンピュータによって実行されてもよいし、分散又は並列環境におけるコンピュータによって1モジュールが複数コンピュータで実行されてもよい。なお、1つのモジュールに他のモジュールが含まれていてもよい。また、以下、「接続」とは物理的な接続の他、論理的な接続(データの授受、指示、データ間の参照関係等)の場合にも用いる。「予め定められた」とは、対象としている処理の前に定まっていることをいい、本実施の形態による処理が始まる前はもちろんのこと、本実施の形態による処理が始まった後であっても、対象としている処理の前であれば、そのときの状況・状態に応じて、又はそれまでの状況・状態に応じて定まることの意を含めて用いる。「予め定められた値」が複数ある場合は、それぞれ異なった値であってもよいし、2以上の値(もちろんのことながら、全ての値も含む)が同じであってもよい。また、「Aである場合、Bをする」という意味を有する記載は、「Aであるか否かを判断し、Aであると判断した場合はBをする」の意味で用いる。ただし、Aであるか否かの判断が不要である場合を除く。
また、システム又は装置とは、複数のコンピュータ、ハードウェア、装置等がネットワーク(一対一対応の通信接続を含む)等の通信手段で接続されて構成されるほか、1つのコンピュータ、ハードウェア、装置等によって実現される場合も含まれる。「装置」と「システム」とは、互いに同義の用語として用いる。もちろんのことながら、「システム」には、人為的な取り決めである社会的な「仕組み」(社会システム)にすぎないものは含まない。
また、各モジュールによる処理毎に又はモジュール内で複数の処理を行う場合はその処理毎に、対象となる情報を記憶装置から読み込み、その処理を行った後に、処理結果を記憶装置に書き出すものである。したがって、処理前の記憶装置からの読み込み、処理後の記憶装置への書き出しについては、説明を省略する場合がある。なお、ここでの記憶装置としては、ハードディスク、RAM(Random Access Memory)、外部記憶媒体、通信回線を介した記憶装置、CPU(Central Processing Unit)内のレジスタ等を含んでいてもよい。
本実施の形態である情報処理装置100は、文字認識の条件を設定するものであって、図1の例に示すように、認識対象領域指定モジュール110、記入予定内容指示モジュール120、文字認識条件設定モジュール130、文字認識条件記憶モジュール140、推奨サイズ警告提示モジュール150、文書生成モジュール160を有している。特に、手書き文字認識対象領域の定義に関するものであって、活字やコンピュータで作成された文字・記号と手書き文字が混在する文書の文字認識に適用され得るものである。
情報処理装置100は、手書き文字が記入され得る文書(シート)を生成する。また、その文書には、文字認識条件が設定されている。文字認識が行われる際は、その文書に設定されている文字認識条件を参照して、文字認識処理を行う。なお、文書として、主に帳票を例示するが、これに限られず、手書き文字が記載され得る領域があり、その領域内の記載の形式が定められている文書であればよい。
認識対象領域指定モジュール110は、記入予定内容指示モジュール120と接続されている。認識対象領域指定モジュール110は、キーボード、マウス、タッチパネル、音声、ジェスチャー等に対する操作者の操作に応じて、手書き文字認識を行う帳票を選択する。そして、操作者の操作に応じて、その帳票において、手書き文字が記載され得る認識対象領域を指定する。例えば、情報処理装置100の液晶ディスプレイ等の表示装置に、帳票を表示し、操作者に領域を指定させる。
記入予定内容指示モジュール120は、認識対象領域指定モジュール110、文字認識条件設定モジュール130と接続されている。記入予定内容指示モジュール120は、操作者の操作に応じて、認識対象領域指定モジュール110によって指定された領域内に記入され得る内容を指示する。例えば、表示装置に表示されている帳票上に、領域内に記入され得る内容のリストを表示し、操作者に選択させるようにしてもよい。
文字認識条件設定モジュール130は、記入予定内容指示モジュール120、文字認識条件記憶モジュール140、推奨サイズ警告提示モジュール150、文書生成モジュール160と接続されている。文字認識条件設定モジュール130は、認識対象領域指定モジュール110によって指定された文字認識の対象となる領域と、記入予定内容指示モジュール120によって指示されたその領域に記入される情報の種別(以下、内容ともいう)を受け付ける。次に、情報の種別に対応付けられた分割数及び分割割合のいずれか一方にしたがって、領域を分割して部分領域(以下、サブ領域ともいう)を生成する。そして、生成した部分領域と、情報の種別毎に対応付けられた文字認識の条件とを関連付ける。分割数、文字認識の条件は、文字認識条件記憶モジュール140から取り出す。なお、領域の分割は、対象としている領域を分割数に応じて均等に分割するようにしてもよいし、分割数の他に分割割合(例えば、横方向の長さの比で規定したもの)が規定されており、その分割割合に応じた分割を行うようにしてもよい。
また、文字認識条件設定モジュール130は、文字認識の条件として、部分領域に記入される文字認識の対象となる第1の文字(手書き文字)の種類、その部分領域に予め記載されている第2の文字(その部分領域内に予め記載されている活字文字)、その第2の文字のその部分領域における位置、その部分領域の枠線の種類のいずれか1つ以上を設定するようにしてもよい。
なお、ここでの設定対象は、「部分領域に記入される文字認識の対象となる第1の文字の種類」、「その部分領域に予め記載されている第2の文字」、「その第2の文字のその部分領域における位置」、「その部分領域の枠線の種類」であるが、「第2の文字の部分領域における位置」は「部分領域に予め記載されている第2の文字」との組み合わせで用いるようにしてもよい。
文字認識条件記憶モジュール140は、文字認識条件設定モジュール130と接続されている。文字認識条件記憶モジュール140は、内容に対応付けられた文字認識の条件を記憶している。文字認識の条件として、少なくとも、領域を部分領域に分割する数(分割数)がある。そして、文字認識の条件として、部分領域に記入される文字認識の対象となる第1の文字の種類、その部分領域に予め記載されている第2の文字、その第2の文字のその部分領域における位置、その部分領域の枠線の種類のいずれか1つ以上を記憶している。具体的には、例えば、記入予定内容と文字認識条件の関連付け、サブ領域の文字種、サブ領域の組み合わせ・順番、各サブ領域の位置・サイズ、各サブ領域の事前挿入文字/文字列/枠、各サブ領域の推奨サイズ等を記憶している。
推奨サイズ警告提示モジュール150は、文字認識条件設定モジュール130と接続されている。推奨サイズ警告提示モジュール150は、部分領域の大きさが予め定められた条件に合致する場合は、その部分領域は文字を記入するのに適していない旨の警告をする。ここで「予め定められた条件」として、例えば、文字認識条件設定モジュール130によって生成されたサブ領域のサイズが、前述の文字認識条件記憶モジュール140内のサブ領域の推奨サイズ未満又は以下である場合が該当する。
文書生成モジュール160は、文字認識条件設定モジュール130と接続されている。文書生成モジュール160は、文字認識条件設定モジュール130によって生成された部分領域に、文字認識条件設定モジュール130によって設定された文字認識の条件にしたがって、第2の文字の記載、部分領域の枠線の記載のいずれか1つ以上を行って、文書を生成する。その後、生成した文書を出力する。ここで「文書を出力する」とは、例えば、プリンタ等の印刷装置で印刷すること、ディスプレイ等の表示装置に表示すること、ファックス等の画像送信装置で画像を送信すること、画像データベース等の画像記憶装置へ画像を書き込むこと、メモリーカード等の記憶媒体に記憶すること、他の情報処理装置へ渡すこと等が含まれる。
また、文書には、文字認識条件が対応付けられており(また、分割領域と文字認識条件が対応付けられており)、手書きされた文書を文字認識する場合には、その対応付けられた文字認識条件を用いるようにしてもよい。
また、文書には、オンライン手書き文字認識を行うための情報画像が印刷されていてもよい。この場合、情報画像には、例えば、その文書が印刷された用紙を一意に識別できる情報と、その情報画像の位置を示す情報が埋め込まれている。電子ペンを用いて筆記が行われ、その電子ペン内のセンサーでその情報画像を読み込み、筆記の位置を取り出して、ストロークを生成する。そのストロークを文字認識の対象とする。
図2は、本実施の形態を実現した場合のシステム構成を示す説明図である。
情報処理装置100、文字認識装置200A、文字認識装置200B、文字認識装置200Cは、通信回線290を介してそれぞれ接続されている。通信回線290は、無線、有線、これらの組み合わせであってもよく、例えば、通信インフラとしてのインターネット等であってもよい。情報処理装置100によって生成された帳票が印刷され、その帳票に手書き文字が記載される。手書き文字が記載された帳票を文字認識装置200が文字認識する。なお、文字認識装置200は、その帳票に対応付けられた文字認識条件を情報処理装置100から抽出して、その文字認識条件を用いて、文字認識処理を行うようにする。ここで「文字認識条件を用いて」とは、例えば、文字種に限定した認識用辞書を用いること、文字数を利用して、認識候補から認識結果を選択すること(例えば、サブ領域には1文字であることを利用して、2文字以上となった認識候補を削除する等)、事前挿入文字が記載されている部分は認識対象としないこと等がある。
図3は、本実施の形態による処理例を示すフローチャートである。
ステップS302では、手書き文字認識を行う帳票を指定する。
ステップS304では、帳票上の認識対象領域を指定する。
ステップS306では、記入予定内容を指示する。
ステップS302〜ステップS306は、ユーザーの操作に応じて処理を行う。
ステップS308では、指示された記入予定内容から、文字認識条件を読み込む。
ステップS310では、認識対象領域内のサブ領域を定義(位置・サイズ・組み合わせ・順番)する。
ステップS312では、各サブ領域に文字種を設定(文字種・組み合わせ・順番)する。
ステップS314では、各サブ領域に事前挿入文字/文字列/枠を定義(事前挿入文字/文字列/枠・組み合わせ・順番)する。
ステップS308〜ステップS314は、文字認識条件設定モジュール130による処理である。ステップS312、ステップS314の処理は、いずれの処理を先に行ってもよいし、並列的に行うようにしてもよい。
ステップS316では、各サブ領域のサイズをチェックし、推奨サイズ以下だった場合警告を提示する。警告に応じて、ステップS304又はステップS306からの処理を再度行う。また、警告があるにもかかわらず、操作者の操作に応じて、ステップS318に進んでもよい。
ステップS318では、文書生成モジュール160が、設定された文字認識条件に沿って、帳票を生成する。
図4は、文字認識条件記憶モジュール140に記憶されている文字認識条件テーブル400のデータ構造例を示す説明図である。
文字認識条件テーブル400は、内容欄410、種類欄415、記入形式欄420、分割数欄425、割合欄430、文字種欄435、事前挿入欄440、位置欄445、枠欄450、推奨サイズ(縦×横)欄455を有している。内容欄410は、対象としている領域内に記載されるべき内容を記憶している。ここでの内容は、領域の名称であってもよい。例えば、日付、時間、数値等がある。種類欄415は、その内容における種類を記憶している。例えば、内容が「日付」の場合は、種類として「年月日」、「月日」、「月」、「日」、「曜日」等がある。記入形式欄420は、その種類における記入形式を記憶している。例えば、種類が「月日」の場合は、記入形式として「MM月DD日(曜日)」、「MM月DD日」、「MM/DD(曜日)」、「MM/DD」等(なお、MM、DD、曜日は、手書きされる部分である)がある。分割数欄425は、その内容が記載される領域の分割数を記憶している。割合欄430は、その分割数で分割する場合の横長又は縦長の割合を記憶している。例えば、分割数が3であり、割合が3対2対2である場合は、第1のサブ領域の横長を領域の横長の3/7とし、第2のサブ領域の横長を領域の横長の2/7とし、第3のサブ領域の横長を領域の横長の2/7とすることを意味している。なお、横長であるか縦長であるかは、予め定められていてもよいし、対象としている領域で長い辺(縦辺、横辺)としてもよい。文字種欄435は、そのサブ領域に記載される手書き文字の文字種を記憶している。事前挿入欄440は、そのサブ領域に事前に挿入しておくべき文字を記憶している。位置欄445は、事前挿入欄440で指定された文字の記載すべき位置を記憶している。例えば、「右」、「左」等があり、サブ領域内の座標であってもよい。枠欄450は、そのサブ領域の枠の形態を記憶している。例えば、破線、実線等があり、この指定によって領域に線を描画し、手書きする人にサブ領域内に文字を記載すべきことを理解させるようにする。ここでの枠情報は、4辺をまとめて記憶してもよいし、外枠(認識対象領域全体)と内枠(サブ領域)の2種を記憶してもよいし、又は1辺毎に記憶してもよい。なお、線種だけでなく、サブ領域として示すことができるものであればよい。例えば、色であり、サブ領域をその色で塗り潰すようにしてもよい。推奨サイズ(縦×横)欄455は、そのサブ領域の推奨サイズ(縦×横)を記憶している。推奨サイズは、手書き文字を記載するのに適したサイズである。
なお、内容欄410、種類欄415、記入形式欄420は、記入予定内容(ユーザーが記入すべき情報)を指定している。
分割数欄425、割合欄430、文字種欄435、事前挿入欄440、位置欄445、枠欄450は、文字認識条件(文字認識条件設定モジュール130により認識対象の領域に設定される条件)を指定している。
推奨サイズ(縦×横)欄455は、推奨サイズ警告提示モジュール150による処理を行わない場合は、推奨サイズ(縦×横)欄455はなくてもよい。
なお、割合欄430以降の欄は、分割数欄425で指定された数の行がある。その上から下への順番は、対象としている領域内におけるサブ領域の順番通り(例えば、左から右、上から下等)に記憶される。
また、これらの項目以外にも、認識対象領域の定義に必要な情報を追加で蓄積しておいてもよい。例えば、サブ領域内で許容する文字数、事前挿入する文字(活字)のサイズ等を定義してもよい。
図5は、文字認識条件テーブル500のデータ構造例を示す説明図である。ここでの文字認識条件テーブル500は、図4の例に示した文字認識条件テーブル400内で記憶する具体的な値を示したものである。図4の例に示した内容:「日付」の他に、「時間」、「数値」、「ユーザー定義」の例を示した。ユーザー定義としては、例えば、社員番号等がある。
これらの文字認識条件は、認識データ等から学習して作成してもよいし、ユーザーが必要に応じて追加登録してもよい。
図6は、本実施の形態による処理例を示す説明図である。具体的には、図3の例のフローチャート内のステップS304の処理例を示すものである。
帳票600は、認識対象領域610を有している。ユーザーの操作に応じて、帳票600上の認識対象領域610を指定する。対象としている帳票データから、画像処理等を用いて矩形を抽出しておき、それを選択してもよいし、マウス等の操作によって矩形を選択してもよい。
図7は、本実施の形態による処理例を示す説明図である。具体的には、図3の例のフローチャート内のステップS306の処理例を示すものである。
ユーザーの操作に応じて、記入形式が指定される。記入形式を内容や種類に応じて分類しておいてもよい。例えば、図7(a)の例に示すように、内容リストから対象としている領域の内容が指定され、その内容に応じた種類リストからその内容に対応する種類が指定され、その種類に応じた記入形式リストからその種類に対応した記入形式が指定される。
図7(a)の例に示すようなユーザーの指定により、図7(b)の例に示す文字認識条件テーブル700(データ構造は文字認識条件テーブル400と同等である)で文字認識条件を設定する。この例では、記入形式欄720を「MM/DD」と指定されたことによって、分割数欄725以降がその領域における文字認識条件となる。
図8は、本実施の形態による処理例を示す説明図である。具体的には、図3の例のフローチャート内のステップS310の処理例を示すものである。
帳票800の日付欄810に対して、図7の例に示した文字認識条件テーブル700の分割数欄725、割合欄730によって、枠812、枠814、枠822、枠824(位置、サイズ)が設定される。日付欄810の1行目は、枠812、枠814の組み合わせであり、枠812、枠814の順番である。そして、日付欄810の2行目は、枠822、枠824の組み合わせであり、枠822、枠824の順番である。
図9は、本実施の形態による処理例を示す説明図である。具体的には、図3の例のフローチャート内のステップS312の処理例を示すものである。
帳票800の日付欄810に対して、図7の例に示した文字認識条件テーブル700の文字種欄735によって、枠812、枠814、枠822、枠824内に記載されるべき文字種が設定される。枠812、枠822は1〜12(又は01〜12)の数字であり、枠814、枠824は1〜31(又は01〜31)の数字である。
図10は、本実施の形態による処理例を示す説明図である。具体的には、図3の例のフローチャート内のステップS314の処理例を示すものである。
帳票800の日付欄810に対して、図7の例に示した文字認識条件テーブル700の事前挿入欄740、位置欄745によって、枠814、枠824内に記載すべき文字(活字)として「/」、その位置はサブ領域内の左側であることが設定される。なお、枠812、枠822は、事前挿入欄740、位置欄745では指定がないので、記載すべき文字はない。
図11は、本実施の形態による処理例を示す説明図である。具体的には、図3の例のフローチャート内のステップS314の処理例を示すものである。枠が指定された場合の処理を示している。
図11(a)に示す例は、帳票1160内の部署コード欄1170、社員番号欄1180が対象とする領域であることを示している。
図11(b)に示す例は、部署コード欄1170、社員番号欄1180に適用される文字認識条件テーブル1100を示している。文字認識条件テーブル1100のデータ構造は文字認識条件テーブル400と同等である。記入予定内容として「英数字(8文字)」を指示した場合のものであり、分割数欄1125以降のような文字認識条件が設定される。ここで、枠欄1150の枠情報は、外枠(部署コード欄1170、社員番号欄1180)の枠線は「なし」であり、内枠(サブ領域)の枠線として「破線」であることが指定されている。
図11(c)に示す例は、分割数欄1125、枠欄1150にしたがって、部署コード欄1170を、枠1171〜1178の8つのサブ領域に分け、その間を破線で描画しており、社員番号欄1180を、枠1181〜1188の8つのサブ領域に分け、その間を破線で描画していることを示している。
図12は、本実施の形態による処理例を示す説明図である。具体的には、図3の例のフローチャート内のステップS316の処理例を示すものである。つまり、各サブ領域のサイズをチェックし、推奨サイズ以下だった場合警告するものを示している。
図12(a)に示す例は、帳票1260の日付欄1270を対象の領域としていることを示している。
図12(b)に示す例は、日付欄1270に適用される文字認識条件テーブル1200を示している。文字認識条件テーブル1200のデータ構造は文字認識条件テーブル400と同等である。例えば、記入形式として「YYYY/MM/DD」が指示された場合であって、文字認識条件テーブル1200のような文字認識条件が設定される。なお、ここでの推奨サイズは、手書き可能な常識的なサイズを設定してもよいし、認識結果から学習して設定してもよい。
図12(c)に示す例は、文字認識条件テーブル1200にしたがって、日付欄1270は、枠1271〜枠1273の3つの枠に分かれ、枠1272内には、事前挿入文字1281(「/」)が記載され、枠1273内には、事前挿入文字1282(「/」)が記載されることを示している。
そして、推奨サイズ(縦×横)欄1255にしたがって、日付欄1270内の枠1271、枠1272、枠1273のサイズをチェックしていることを示している。この場合、枠1272、枠1273に対して、文字を記入するのに適していない旨の警告をする。
ここでは、単に枠1272のサイズと推奨サイズ(縦×横)欄1255内の値を比較するだけでなく、サブ領域内に文字(活字)が記載される場合(事前挿入欄1240で文字が指定されている場合)、その文字以外の領域(認識エリア)のサイズ(手書き文字が記載され得る領域のサイズ)を算出して、推奨サイズ(縦×横)欄1255内の値と比較することを行っている。実際に手書き文字が記載されるサイズとの比較によって判断するためである。
また、手書き(文字認識)するのに支障が出るくらい認識エリアが小さい場合、その枠を広げるか、文字認識条件を変更するよう警告をする。
図13は、本実施の形態による処理例を示す説明図である。
図13(a)に示す例は、文字認識条件設定モジュール130による処理が行われずに、サブ領域が設定されなかった場合の記載例を示している。図13(a)の例に示すように、小数点の異なった位置、単位の記載の有無等が混在している。
図13(b)に示す例は、ユーザーの操作によって、記入形式として「小数点(左寄り)+単位(ユーザー定義)」が指示された場合に、帳票600bに適用したものを示している。
帳票600bの測定値欄610bの各行は、枠622と枠624、枠632と枠634、枠642と枠644、枠652と枠654に分かれる。枠622内には事前挿入文字626(「.」)、枠624内には事前挿入文字628(「mm」)が記載されている。これによって、手書き文字であっても小数点位置は固定され、単位も固定されている。
図14は、本実施の形態による処理例を示す説明図である。
図14(a)に示す例は、帳票1400a内の日時欄1410を対象領域としたことを示している。そして、日時欄1410内には、「H.25/3/15 13時00分〜45分」、「平成25年3月15日 午後1:00〜1:45」等の記入が予想できる。
しかし、日時欄1410に対して、例えば、記入形式として「20YY年MM月DD日」+「(曜日)」+「開始〜終了(HH:MM)」と組み合わせて指示した場合は、図14(b)の例に示すように、帳票1400bの対象領域は、枠1420、枠1425、枠1430、枠1435、枠1440、枠1445、枠1450、枠1455、枠1460の9個のサブ領域に分けられる。そして、枠1420内には、事前挿入文字1421(「20」)と事前挿入文字1422(「年」)、枠1425内には、事前挿入文字1426(「月」)、枠1430内には、事前挿入文字1431(「日」)、枠1435内には、事前挿入文字1436(「(」)と事前挿入文字1437(「)」)、枠1445内には、事前挿入文字1446(「:」)、枠1450内には、事前挿入文字1451(「〜」)、枠1460内には、事前挿入文字1461(「:」)が記載される。これによって、手書き文字であっても年月日等の記載位置が固定され、年の下2桁等を記載しなければならないことが理解されるようになっている。
図15は、本実施の形態による処理例を示す説明図である。
図15(a)に示す例は、警告が提示された場合を示している。帳票1500aの日付欄1510a内は、枠1512a、枠1514a、枠1516aの3つのサブ領域に分かれ、枠1514a内には、事前挿入文字1515a(「/」)、枠1516a内には、事前挿入文字1517a(「/」)が記載されている。そして、枠1514、枠1516はサイズが小さくて警告されている。
図15(b)に示す例は、文字認識条件テーブル400の推奨サイズ(縦×横)欄455内の値にしたがって領域(サブ領域)を拡張したものである。
帳票1500b内の日付欄1510bは拡張されており、枠1512b、枠1514b、枠1516bの3つサブ領域は、文字認識条件テーブル400の推奨サイズ(縦×横)欄455内の値に示すサイズとなっている。ただし、枠1514b内には、事前挿入文字1515a(「/」)、枠1516a内には、事前挿入文字1517a(「/」)が記載されているので、その文字(活字)のサイズ分だけ推奨サイズ(縦×横)欄455内の値よりも大きくする。
このように、帳票上の認識対象領域に対し文字認識条件(特に、推奨サイズ(縦×横)欄455)を定義しているので、帳票の変更を行う場合にも推奨サイズ(縦×横)欄455の値を用いて再設定することができる。
なお、帳票のIDを表すコード等を当該帳票に合わせて印刷しておくと、記入後の帳票を読み取るときに当該コードから帳票IDが判定できるので、当該帳票IDと文字認識条件とを関連付けることができる。これにより、文字認識をする際に関連付けられた文字認識条件を参照でき、文字認識の精度が向上する。
図16を参照して、本実施の形態の情報処理装置のハードウェア構成例について説明する。図16に示す構成は、例えばパーソナルコンピュータ(PC)等によって構成されるものであり、スキャナ等のデータ読み取り部1617と、プリンタ等のデータ出力部1618を備えたハードウェア構成例を示している。
CPU(Central Processing Unit)1601は、前述の実施の形態において説明した各種のモジュール、すなわち、認識対象領域指定モジュール110、記入予定内容指示モジュール120、文字認識条件設定モジュール130、推奨サイズ警告提示モジュール150、文書生成モジュール160等の各モジュールの実行シーケンスを記述したコンピュータ・プログラムにしたがった処理を実行する制御部である。
ROM(Read Only Memory)1602は、CPU1601が使用するプログラムや演算パラメータ等を格納する。RAM(Random Access Memory)1603は、CPU1601の実行において使用するプログラムや、その実行において適宜変化するパラメータ等を格納する。これらはCPUバス等から構成されるホストバス1604により相互に接続されている。
ホストバス1604は、ブリッジ1605を介して、PCI(Peripheral Component Interconnect/Interface)バス等の外部バス1606に接続されている。
キーボード1608、マウス等のポインティングデバイス1609は、操作者により操作される入力デバイスである。ディスプレイ1610は、液晶表示装置又はCRT(Cathode Ray Tube)等があり、各種情報をテキストやイメージ情報として表示する。
HDD(Hard Disk Drive)1611は、ハードディスクを内蔵し、ハードディスクを駆動し、CPU1601によって実行するプログラムや情報を記録又は再生させる。ハードディスクには、文字認識条件、帳票データ等が格納される。さらに、その他の各種のデータ処理プログラム等、各種コンピュータ・プログラムが格納される。
ドライブ1612は、装着されている磁気ディスク、光ディスク、光磁気ディスク、又は半導体メモリ等のリムーバブル記録媒体1613に記録されているデータ又はプログラムを読み出して、そのデータ又はプログラムを、インタフェース1607、外部バス1606、ブリッジ1605、及びホストバス1604を介して接続されているRAM1603に供給する。リムーバブル記録媒体1613も、ハードディスクと同様のデータ記録領域として利用可能である。
接続ポート1614は、外部接続機器1615を接続するポートであり、USB、IEEE1394等の接続部を持つ。接続ポート1614は、インタフェース1607、及び外部バス1606、ブリッジ1605、ホストバス1604等を介してCPU1601等に接続されている。通信部1616は、通信回線に接続され、外部とのデータ通信処理を実行する。データ読み取り部1617は、例えばスキャナであり、ドキュメントの読み取り処理を実行する。データ出力部1618は、例えばプリンタであり、ドキュメントデータの出力処理を実行する。
なお、図16に示す情報処理装置のハードウェア構成は、1つの構成例を示すものであり、本実施の形態は、図16に示す構成に限らず、本実施の形態において説明したモジュールを実行可能な構成であればよい。例えば、一部のモジュールを専用のハードウェア(例えば特定用途向け集積回路(Application Specific Integrated Circuit:ASIC)等)で構成してもよく、一部のモジュールは外部のシステム内にあり通信回線で接続しているような形態でもよく、さらに図16に示すシステムが複数互いに通信回線によって接続されていて互いに協調動作するようにしてもよい。また、複写機、ファックス、スキャナ、プリンタ、複合機(スキャナ、プリンタ、複写機、ファックス等のいずれか2つ以上の機能を有している画像処理装置)等に組み込まれていてもよい。
なお、説明したプログラムについては、記録媒体に格納して提供してもよく、また、そのプログラムを通信手段によって提供してもよい。その場合、例えば、前記説明したプログラムについて、「プログラムを記録したコンピュータ読み取り可能な記録媒体」の発明として捉えてもよい。
「プログラムを記録したコンピュータ読み取り可能な記録媒体」とは、プログラムのインストール、実行、プログラムの流通等のために用いられる、プログラムが記録されたコンピュータで読み取り可能な記録媒体をいう。
なお、記録媒体としては、例えば、デジタル・バーサタイル・ディスク(DVD)であって、DVDフォーラムで策定された規格である「DVD−R、DVD−RW、DVD−RAM等」、DVD+RWで策定された規格である「DVD+R、DVD+RW等」、コンパクトディスク(CD)であって、読出し専用メモリ(CD−ROM)、CDレコーダブル(CD−R)、CDリライタブル(CD−RW)等、ブルーレイ・ディスク(Blu−ray(登録商標) Disc)、光磁気ディスク(MO)、フレキシブルディスク(FD)、磁気テープ、ハードディスク、読出し専用メモリ(ROM)、電気的消去及び書換可能な読出し専用メモリ(EEPROM(登録商標))、フラッシュ・メモリ、ランダム・アクセス・メモリ(RAM)、SD(Secure Digital)メモリーカード等が含まれる。
そして、前記のプログラム又はその一部は、前記記録媒体に記録して保存や流通等させてもよい。また、通信によって、例えば、ローカル・エリア・ネットワーク(LAN)、メトロポリタン・エリア・ネットワーク(MAN)、ワイド・エリア・ネットワーク(WAN)、インターネット、イントラネット、エクストラネット等に用いられる有線ネットワーク、又は無線通信ネットワーク、さらにこれらの組み合わせ等の伝送媒体を用いて伝送させてもよく、また、搬送波に乗せて搬送させてもよい。
さらに、前記のプログラムは、他のプログラムの一部分であってもよく、又は別個のプログラムと共に記録媒体に記録されていてもよい。また、複数の記録媒体に分割して記録されていてもよい。また、圧縮や暗号化等、復元可能であればどのような態様で記録されていてもよい。
100…情報処理装置
110…認識対象領域指定モジュール
120…記入予定内容指示モジュール
130…文字認識条件設定モジュール
140…文字認識条件記憶モジュール
150…推奨サイズ警告提示モジュール
160…文書生成モジュール
200…文字認識装置
290…通信回線

Claims (4)

  1. 文字認識の対象となる領域と、前記領域に記入される情報の種別と、を受け付ける受付手段と、
    前記情報の種別毎に対応付けられた少なくとも分割数及び分割割合のいずれか一方にしたがって、前記領域を分割して部分領域を生成する生成手段と、
    前記生成手段によって生成された部分領域と、前記情報の種別毎に対応付けられた文字認識の条件と、を関連付ける関連付手段と、
    前記部分領域の大きさが予め定められた条件に合致する場合に通知する通知手段
    を具備し、
    前記通知手段は、前記部分領域内に予め記載されている第2の文字がある場合は、該第2の文字以外の領域のサイズを算出し、手書き文字認識用の推奨サイズと比較することを行う、
    ことを特徴とする情報処理装置。
  2. 前記関連付手段が関連付ける文字認識の条件として、前記部分領域に記入される文字認識の対象となる第1の文字の種類、該部分領域に予め記載されている第2の文字、該第2の文字の該部分領域における位置、該部分領域の枠線の種類のいずれか1つ以上を設定する
    ことを特徴とする請求項1に記載の情報処理装置。
  3. 前記生成手段によって生成された部分領域に、前記関連付手段によって関連付けられた文字認識の条件にしたがって、前記第2の文字の記載、部分領域の枠線の記載のいずれか1つ以上を行って、文書を生成する文書生成手段
    をさらに具備することを特徴とする請求項2に記載の情報処理装置。
  4. コンピュータを、
    文字認識の対象となる領域と、前記領域に記入される情報の種別と、を受け付ける受付手段と、
    前記情報の種別毎に対応付けられた少なくとも分割数及び分割割合のいずれか一方にしたがって、前記領域を分割して部分領域を生成する生成手段と、
    前記生成手段によって生成された部分領域と、前記情報の種別毎に対応付けられた文字認識の条件と、を関連付ける関連付手段と、
    前記部分領域の大きさが予め定められた条件に合致する場合に通知する通知手段
    として機能させ
    前記通知手段は、前記部分領域内に予め記載されている第2の文字がある場合は、該第2の文字以外の領域のサイズを算出し、手書き文字認識用の推奨サイズと比較することを行う、
    情報処理プログラム。
JP2014191726A 2014-09-19 2014-09-19 情報処理装置及び情報処理プログラム Active JP6497012B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2014191726A JP6497012B2 (ja) 2014-09-19 2014-09-19 情報処理装置及び情報処理プログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2014191726A JP6497012B2 (ja) 2014-09-19 2014-09-19 情報処理装置及び情報処理プログラム

Publications (2)

Publication Number Publication Date
JP2016062476A JP2016062476A (ja) 2016-04-25
JP6497012B2 true JP6497012B2 (ja) 2019-04-10

Family

ID=55797860

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2014191726A Active JP6497012B2 (ja) 2014-09-19 2014-09-19 情報処理装置及び情報処理プログラム

Country Status (1)

Country Link
JP (1) JP6497012B2 (ja)

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3294995B2 (ja) * 1996-06-21 2002-06-24 三菱電機株式会社 帳票読取装置
JP2000132617A (ja) * 1998-10-23 2000-05-12 Nec Corp 帳票設計誘導方式
JP2004127059A (ja) * 2002-10-04 2004-04-22 Mantaro Yajima 情報処理方法および装置

Also Published As

Publication number Publication date
JP2016062476A (ja) 2016-04-25

Similar Documents

Publication Publication Date Title
CN102289667B (zh) 对经历光学字符识别(ocr)过程的文本文档中出现的错误的用户纠正
JP2005173730A (ja) 帳票ocrプログラム、方法及び装置
US10963717B1 (en) Auto-correction of pattern defined strings
JP2008204226A (ja) 帳票認識装置およびそのプログラム
JP2018063600A (ja) 情報処理装置、情報処理方法およびプログラム
JP5229102B2 (ja) 帳票検索装置、帳票検索プログラムおよび帳票検索方法
JP2009093305A (ja) 帳票認識装置
JP6080586B2 (ja) 文字認識システム、文字認識プログラム及び文字認識方法
JP6497012B2 (ja) 情報処理装置及び情報処理プログラム
JP6199641B2 (ja) 帳票読取装置およびプログラム
JP4518212B2 (ja) 画像処理装置及びプログラム
US20220197444A1 (en) Information processing apparatus and non-transitory computer readable medium
JP2019057115A (ja) 帳票情報認識装置および帳票情報認識方法
JP4517822B2 (ja) 画像処理装置及びプログラム
JP2022120308A (ja) 画像処理装置及びプログラム
JP6007720B2 (ja) 情報処理装置及び情報処理プログラム
JP6682827B2 (ja) 情報処理装置及び情報処理プログラム
EP3287952A1 (en) Input control program, input control device, input control method, character correction program, character correction device, and character correction method
JP2017228092A (ja) 審査業務支援装置および審査業務支援方法
JP2021152696A (ja) 情報処理装置及びプログラム
JP5510221B2 (ja) 情報処理装置及び情報処理プログラム
JP6303531B2 (ja) 画像処理装置及び画像処理プログラム
US11462014B2 (en) Information processing apparatus and non-transitory computer readable medium
JP6187307B2 (ja) 画像処理装置及び画像処理プログラム
JP2019057135A (ja) 帳票管理装置及びプログラム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20170905

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20180727

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20180828

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20181024

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20190212

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20190225

R150 Certificate of patent or registration of utility model

Ref document number: 6497012

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

S533 Written request for registration of change of name

Free format text: JAPANESE INTERMEDIATE CODE: R313533

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350