JP2008276677A - 文字認識支援装置、文字認識装置及びプログラム - Google Patents

文字認識支援装置、文字認識装置及びプログラム Download PDF

Info

Publication number
JP2008276677A
JP2008276677A JP2007122285A JP2007122285A JP2008276677A JP 2008276677 A JP2008276677 A JP 2008276677A JP 2007122285 A JP2007122285 A JP 2007122285A JP 2007122285 A JP2007122285 A JP 2007122285A JP 2008276677 A JP2008276677 A JP 2008276677A
Authority
JP
Japan
Prior art keywords
mark
recognition
character
character recognition
document
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2007122285A
Other languages
English (en)
Inventor
Etsuko Ito
悦子 伊藤
Katsuhiko Itonori
勝彦 糸乘
Hironari Konno
裕也 今野
Masahiro Kato
雅弘 加藤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujifilm Business Innovation Corp
Original Assignee
Fuji Xerox Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fuji Xerox Co Ltd filed Critical Fuji Xerox Co Ltd
Priority to JP2007122285A priority Critical patent/JP2008276677A/ja
Publication of JP2008276677A publication Critical patent/JP2008276677A/ja
Pending legal-status Critical Current

Links

Images

Landscapes

  • Character Input (AREA)

Abstract

【課題】原稿の原本性を確保しつつ、原稿が多くなっても、文字認識装置によって文字列が認識される対象となる、原稿内の領域を、効率よく指定することができるようにするための文字認識支援装置及びプログラムを提供する。
【解決手段】文字列が記入されている記入済原稿とレイアウトが共通する作業用原稿12に、所定の目印14を付す。この作業用原稿12をスキャンすることによって、生成される基準画像が生成される。この基準画像内の前記目印14の位置に基づいて、前記記入済原稿内の、文字列が記入された領域を示す、認識位置データを生成する。
【選択図】図2

Description

本発明は、文字認識支援装置、文字認識装置及びプログラムに関する。
近年、例えば、商品名、会社名、金額などの文字列が配置されている帳票などの原稿を読み取って生成した帳票画像から、所望の文字列だけ、例えば、会社名を示す文字列だけを文字認識装置により認識し、その文字列を帳票画像と関連付けて、ハードディスクなどの記憶装置に蓄積することがよく行われている。
こうすれば、原稿に記入された、例えば会社名などの文字列をキーとして画像の検索が行えるので、記憶装置に蓄積された画像が有効に活用されることが期待できる。
文字認識装置が所望の文字列を認識する対象となる、原稿内の領域を指定する方法は既にいくつか提案されている。
例えば、特許文献1には、紙原稿上に直接マーカーなどで目印を付すことによって当該領域を指定する方法が開示されている。
また、特許文献2には、紙原稿とは別の領域指定シートにマーカーなどで目印を付すことによって当該領域を指定する方法が開示されている。
特開2004−82473号公報 特開昭61−13867号公報
前記特許文献1に開示されている方法によれば、所望の文字列を認識する対象となる領域を容易に指定することができる。しかし、この方法によれば、原稿の原本性が確保されない。また、原稿毎に目印を付す必要があるため、処理の対象となる原稿が多くなるに従って手間がかかることとなる。
一方、前記特許文献2に開示されている方法によれば、原稿の原本性は確保されるが、原稿毎に領域指定シートを作成する手間がかかるため、処理の対象となる原稿が多くなるに従って、やはり手間がかかることとなる。
本発明は上記課題に鑑みてなされたものであって、その目的は、原稿の原本性を確保しつつ、原稿が多くなっても、文字認識装置によって文字列が認識される対象となる、原稿内の領域を、効率よく指定することができるようにするための文字認識支援装置及びプログラムを提供することにある。
上記目的を達成するために、請求項1に記載の文字認識支援装置は、文字列が記入されている記入済原稿とレイアウトが共通する原稿であって、所定の目印が付されている作業用原稿を読み取って生成される画像を取得する手段と、前記作業用原稿に付されている前記目印を識別する識別手段と、前記識別手段により識別される前記目印の位置に基づいて、前記記入済原稿内の、文字列が記入された領域を示す、認識位置データを生成する認識位置データ生成手段と、を含むことを特徴とする。
請求項2に記載の文字認識支援装置は、請求項1に記載の文字認識支援装置であって、前記作業用原稿には複数の種類の目印が付されており、前記識別手段は、前記作業用原稿に付された複数の種類の目印を識別し、前記認識位置データ生成手段は、前記識別手段により識別されたそれぞれの目印の位置に基づいて、前記記入済原稿内の、文字列が記入された複数の領域を示す、認識位置データを生成する、ことを特徴とする。
請求項3に記載の文字認識支援装置は、請求項1又は2に記載の文字認識支援装置であって、前記作業用原稿のレイアウトを解析する手段をさらに含む、ことを特徴とする。
請求項4に記載の文字認識支援装置は、請求項1乃至3に記載の文字認識支援装置であって、前記識別手段により識別される目印を示す目印データ生成用原稿を読み取って生成される目印データ生成用画像を取得する手段と、前記目印データ生成用画像に基づいて、前記識別手段により識別される前記目印を示す目印データを生成する目印データ生成手段をさらに含み、前記識別手段は、前記目印データが示す前記目印に基づいて、前記作業用原稿に付されている前記目印を識別する、ことを特徴とする。
請求項5に記載の文字認識支援装置は、請求項1乃至4に記載の文字認識支援装置であって、前記認識位置データ生成手段により生成される前記認識位置データが示す、前記記入済原稿内の、文字列が記入された領域が、前記作業用原稿内における位置によって表現される、ことを特徴とする。
請求項6に記載の文字認識装置は、請求項1に記載の文字認識支援装置において生成される認識位置データに基づいて、前記記入済原稿内の、文字列が記入されている領域を特定する手段と、前記記入済原稿内の前記文字列を認識する手段と、を含むことを特徴とする。
請求項7に記載のプログラムは、文字列が記入されている記入済原稿とレイアウトが共通する原稿であって、所定の目印が付されている作業用原稿を読み取って生成される画像を取得する手段、前記作業用原稿に付されている前記目印を識別する識別手段、前記識別手段により識別される前記目印の位置に基づいて、前記記入済原稿内の、文字列が記入された領域を示す、認識位置データを生成する認識位置データ生成手段、としてコンピュータを機能させることを特徴とする。
また、上記のプログラムはコンピュータ読み取り可能な情報記憶媒体に格納することもできる。
請求項1に記載の発明によれば、原稿の原本性を確保しつつ、原稿が多くなっても、文字認識装置によって文字列が認識される対象となる、原稿内の領域を、効率よく指定することができる。
請求項2に記載の発明によれば、文字認識装置によって文字列が認識される対象となる、原稿内の複数の領域を、それぞれ区別して指定できる。
請求項3に記載の発明によれば、原稿が微調整されたり、原稿から生成される画像に歪みや傾きが生じたりする場合でも、文字認識装置によって文字列が認識される対象となる、原稿内の領域を、精度よく指定することができる。
請求項4に記載の発明によれば、目印データ生成用原稿に基づいて、目印データを生成することができるので、目印データを容易に生成することができる。
請求項5に記載の発明によれば、文字認識装置において記入済原稿内の文字列を認識する際に、作業用原稿内の領域の位置の情報を利用することができる。
請求項6に記載の発明によれば、請求項1に記載の文字認識支援装置によって所定の目印が付されている作業用原稿を用いて生成された認識位置データに基づいて、文字列が認識される対象となる、原稿内の領域に、記入されている文字列を認識することができる。
請求項7に記載の発明によれば、原稿の原本性を確保しつつ、原稿が多くなっても、文字認識装置によって文字列が認識される対象となる、原稿内の領域を、効率よく指定するようコンピュータを機能させることができる。
以下、本発明の一実施形態について図面に基づき詳細に説明する。
まず、本発明の概要を説明する。
図1は、本発明の実施形態に係る文字認識支援装置と文字認識装置における文字認識処理の対象となる文字列が記入された記入済原稿10の一例である。
まず、図1に示した複数の記入済原稿10のうちの一枚の記入済原稿10を、本文字認識支援装置の利用者がコピーする。このコピーを作業用原稿と呼ぶこととする。そして、この作業用原稿内の所定の文字列に対して目印を付すことにより、文字列を認識する対象となる領域を利用者が指定する。例えば、図2に示すように、作業用原稿12にカラーマーカーなどにより、ラインを引くなどして、目印14を付すことにより領域を指定する。図2では白黒の模様により目印14が表現されているが、実際には、それぞれの目印14について、異なる色のカラーマーカーによる目印14(例えば、起票日は青、請求元は赤、金額は黄色)が付されている。
そして、本文字認識支援装置において、利用者がこの作業用原稿12をスキャンすることによって、図3に示す基準画像16が生成される。
そして、この基準画像16に基づいて、認識位置データが生成される。認識位置データの詳細は後述する。
そして、文字認識支援装置において生成された認識位置データは自動的に文字認識装置に入力される。文字認識支援装置と文字認識装置とは同一筐体で構成することができ、その場合は、上記の認識位置データの入力は不要となる。
最後に、文字認識装置において、図1に示す処理対象となる記入済原稿10を利用者が次々とスキャンすることによって、図4に示すように、各記入済原稿10に記入されている、例えば、起票日、請求元、金額を示す認識対象文字列18が、各記入済原稿10をスキャンすることによって生成された画像、及び、属性名20と関連付けられて文字認識装置内、またはデータベース内にデータとして蓄積される。
以下、本発明の実施形態に係る文字認識支援装置、及び、文字認識装置の詳細について説明する。
本発明の実施形態に係る文字認識支援装置は、例えば、スキャナとしての機能などを複合的に有するいわゆる複合機と一体的に構成される。また、文字認識装置も同様の構成である。先に述べたとおり、これらの文字認識支援装置と文字認識装置は一つの筐体で構成しても、複数の筐体で構成してもよい。図5に示す情報処理装置30は、一つの筐体で文字認識支援装置の機能と文字認識装置の機能を兼ね備えている。
図5に示すように、この情報処理装置30は、制御部32、ユーザインタフェース(UI)部34、スキャナ部36、記憶部38を含んで構成される。
制御部32は、CPU等のプログラム制御デバイスであり、記憶部38に格納されているプログラムに従って動作している。
UI部34は、液晶タッチパネルや、ディスプレイ、テンキーなどのキーパッドなどであり、利用者が行った操作の内容を制御部32に出力する。また、このUI部34は、制御部32から入力される指示に従って情報を表示出力する。
スキャナ部36は、フラットベッドスキャナなどであり、例えば、読み取り面に置かれた紙原稿を光学的に読み取って、その画像を生成し、制御部32に出力する。
記憶部38は、RAM(Random Access Memory)やROM(Read Only Memory)などの記憶素子を含んで構成される。また、この記憶部38は、例えばSRAM(static RAM)や、ハードディスク装置など、電源切断時にも記憶している情報を保持できる不揮発性の記憶手段を含んでもよい。この記憶部38には、制御部32によって実行されるプログラムが格納され、また、制御部32のワークメモリとしても動作する。記憶部38には、目印データなどのデータが記憶される。記憶されるデータの詳細は後述する。
次に、図6を参照しながら、文字認識支援装置40の制御部で実現される各機能を説明する。
図6は、文字認識支援装置40の制御部で実現される各機能の関係を示す機能ブロック図である。図6に示すように、文字認識支援装置40は、機能的には、目印データ生成部42、基準画像取得部44、目印分離部46、基準認識対象領域特定部48、認識位置データ生成部50、認識位置データ出力部52から構成される。
これらの要素は、コンピュータである文字認識支援装置40にインストールされた文字認識支援プログラムを、文字認識支援装置40に含まれるCPU等の制御部32で実行することにより実現されている。なお、この文字認識支援プログラムは、例えば、CD−ROM、DVD−ROM等の情報伝達媒体を介して、あるいは、インターネット等の通信ネットワークを介して文字認識支援装置40に供給される。
以下、各機能ブロックによって行われる処理を説明する。
目印データ生成部42では、例えば、図7に示す目印データ54が生成される。目印データ54は、カラーマーカーなどにより付された目印14と、この目印14に関連する関連文字列、例えば、属性名20とが関連付けられたデータである。この、属性名20は、例えばキーワードなどでもよい。図7では、複数の目印データ54をまとめた目印データ表56による表形式で目印データ54を表現している。もちろん、目印データ54の表現形式は表形式には限られない。
ここで、目印データ54の生成方法の一例を以下に示す。
まず、例えば、図8に示す、属性名20と、目印14とが関連付けられた表が記入された目印データ生成用原稿58を、スキャナ部36でカラースキャンして、目印データ生成用画像を生成する。図8では、白黒の模様により目印14が表現されているが、実際には、それぞれの目印14について、異なる色のカラーマーカーによる目印14(例えば、起票日は青、請求元は赤、金額は黄色)が付されている。このように、複数の種類の目印14について、目印データ54を生成しても構わない。
そして、この目印データ生成用画像を目印データ生成部42が取得する。そして、目印データ生成部42が、この目印データ生成用画像内の罫線で区切られた各領域の相対的な位置を示すレイアウトを解析して、その結果に基づいて、図7に示す、属性名20と目印14とが関連付けられた目印データ54を含む目印データ表56を生成する。
このようにして生成された目印データ54は文字認識支援装置40内の記憶部38に出力される。なお、目印データ54の生成方法は上記方法に限られない。
基準画像取得部44では、処理対象となる記入済原稿10(図1参照)のうちの一枚のコピー(すなわち、作業用原稿12(図2参照))をスキャナ部36において読み取って生成される基準画像16(図3参照)が取得される。図2に示すように、この作業用原稿12にはカラーマーカーにより目印14が付されている。
目印分離部46では、図9に示すように、例えば、限定色化や指定色抽出を使用することによって特定される、マーカー色が付された位置を示す目印画像60が基準画像16から分離される。なお、複数色のマーカーによって基準画像16に目印14が付されている(図3参照)場合は、それぞれの色毎に目印画像60を生成してもよい。このようにして、基準画像16から目印画像60が分離されることによって、図10に示す目印分離後基準画像62が生成される。このようにして、作業用原稿12(図2参照)に付された複数の種類の目印14を識別することができる。また、特に、本実施形態のように、異なる色のカラーマーカーによって各目印14が作業用原稿12に付されている場合には、各目印14を容易に識別することができる。
基準認識対象領域特定部48では、図9に示す目印画像60のレイアウト解析が行われ、図11に示すように、目印画像60内において目印が付されている目印領域64の座標が認識される。
また、図10に示す目印分離後基準画像62のレイアウト解析が行われ、目印分離後基準画像62内において文字列が記入されているそれぞれの領域(以下、基準領域66と呼ぶ)の座標が図12に示すように認識される。
そして、各基準領域66について、目印画像60内の目印領域64と交差している(例えば、一方の領域がもう一方の領域を包含している場合なども含む)か否かが判定され、交差していると判断された基準領域66が基準認識対象領域68として特定される。例えば、目印領域64と基準領域66とが重なっている面積の、目印領域64の面積に占める割合が閾値以上となっている基準領域66が基準認識対象領域68として特定される。
認識位置データ生成部50では、前記基準認識対象領域68を含む各前記基準領域66の位置を示す、図13に示す認識位置データ70が生成される。そして、認識位置データ生成部50において、認識位置データ70が示す基準認識対象領域68に、この基準認識対象領域68に対応する目印14と関連付けられた属性名20が関連付けられる。なお、図13に示す認識位置データ70は、各基準領域66の相対的な位置を示す表形式で表現されているが、表現方法はこの限りではない。例えば、各基準領域66の位置を示す他の方法を用いることができる。具体的には、表形式ではなく、例えばツリー構造など、各基準領域66の相対的な位置を示す論理構造により表現してもよい。また、各基準領域66の位置を絶対座標により表現してもよい。
認識位置データ出力部52では、基準認識対象領域68に属性名20が関連付けられた認識位置データ70が記憶部38に出力される。
次に、図6に示した、文字認識支援装置40の各機能により行われる処理のうち、基準画像16が取得されてから認識位置データ70が生成されるまでの処理の流れを図14に示すフロー図を参照しながら説明する。ここでは、目印データ生成部42において生成された目印データ54は、既に記憶部38に記憶されていることとする。
まず、基準画像取得部44が基準画像16を取得する(S101)。
次に、目印分離部46が、基準画像16を、目印画像60と目印分離後基準画像62に分離する(S102)。
次に、基準認識対象領域特定部48が、目印分離後基準画像62のレイアウトを解析し、目印分離後基準画像62内の基準領域66の座標を認識する(S103)。
並行して、基準認識対象領域特定部48が、目印画像60内の、目印14が付されている目印領域64の座標を認識する(S104)。もちろん、S103の処理とS104の処理の前後は問わず、並行に処理しても、順次処理しても構わない。
そして、基準認識対象領域特定部48が、基準領域66のうちから基準認識対象領域68を特定する(S105)。
基準認識対象領域68が特定されたら、認識位置データ生成部50が、認識位置データ70を生成する(S106)。
最後に、認識位置データ出力部52が、認識位置データを記憶部38に出力する(S107)。
ここで、S105における基準認識対象領域特定部48による処理の詳細を図15に示すフロー図を参照しながら説明する。
まず、目印領域64を一つ選択する(S201)。
次に、基準画像16に含まれる基準領域66のうちから一つを選択する(S202)。
次に、選択された基準領域66と選択された目印領域64とが重なっている部分の面積の、目印領域64の面積に対する割合を計算する(S203)。
次に、この割合が所定の閾値以上であるかどうかを判定する(S204)。
この割合が所定の閾値以上である場合は(S204:Y)、この基準領域66を基準認識対象領域68として特定する(S205)。
この割合が所定の閾値未満である場合には(S204:N)、まだ選択されていない基準領域66のうちから一つの基準領域66を選択(S206)して、S203の処理を再び行う。
S205において基準認識対象領域68が特定された場合は、まだ選択されていない目印領域64があるか否かの確認を行う(S207)。
まだ選択されていない目印領域64がある場合は(S207:Y)、まだ選択されていない目印領域64のうちから一つの目印領域64を選択して(S208)、S202の処理を再び行う。
まだ選択されていない目印領域64がない場合は(S207:N)、処理を終了する。
このようにして、基準領域66のうちから基準認識対象領域68が特定された後、S106の処理が行われることとなる。なお、上記の基準認識対象領域68を特定する方法は、一つの例にすぎず、他の方法によって基準認識対象領域68を特定しても構わない。
以上説明した文字認識支援装置40によれば、原稿の原本性を確保しつつ、原稿が多くなっても、文字認識装置が原稿内の文字列を認識する対象となる領域を効率よく指定することができる。
また、上記方法によって、複数の種類の帳票などについて、作業用原稿12に基づいて認識位置データ70を生成し、記憶部38に出力しても構わない。
次に、図16を参照しながら、文字認識装置72の制御部で実現される各機能を説明する。
図16は、文字認識装置72の制御部で実現される各機能の関係を示す機能ブロック図である。図16に示すように、文字認識装置72は、機能的には、読取画像取得部74、読取領域特定部76、読取領域データ生成部78、認識位置特定部80、認識対象文字列認識部82、認識対象文字列出力部84から構成される。
これらの要素は、コンピュータである文字認識装置72にインストールされた文字認識支援プログラムを、文字認識装置72に含まれるCPU等の制御部32で実行することにより実現されている。なお、この文字認識支援プログラムは、例えば、CD−ROM、DVD−ROM等の情報伝達媒体を介して、あるいは、インターネット等の通信ネットワークを介して文字認識装置72に供給される。
以下、各機能ブロックによって行われる処理のフローを図17に示すフロー図を参照しながら説明する。
なお、本実施形態では、レイアウトが異なる複数の認識位置データ70が記憶部38に記憶されていることとする。
まず、読取画像取得部74が、処理対象となる記入済原稿10(図1参照)をスキャナ部36において読み取って生成される読取画像86を取得する(S301)。図18に読取画像の一例を示す。
次に、読取領域特定部76が、図19に示す、読取画像86内の、文字列が記入されているそれぞれの領域(以下、読取領域88と呼ぶ)のレイアウトを解析し、読取領域88の座標を認識する(S302)。
次に、読取領域データ生成部78が、図20に示すように、前記読取領域88の位置を示す読取領域データ90を生成する(S303)。本実施形態では、各読取領域88の相対的な位置を示すよう表形式で表現するが、表現方法はこの限りではない。
次に、認識位置特定部80において、記憶部38に記憶されている認識位置データ70のうちから、この読取領域データ90にレイアウトが対応する認識位置データ70を特定する(S304)。
このように、レイアウトが異なる複数の認識位置データ70が記憶部38に記憶されており、S304において、読取領域データ90に対応するレイアウトを選択するようにすると、レイアウトが異なる複数の種類の記入済原稿10(例えば、帳票)に対しても、利用者はそれらの記入済原稿10を次々とスキャンして、まとめて処理することができるので、利用者の利便性はさらに向上する。
なお、本実施形態では、文字認識装置72と文字認識支援装置40は一つの筐体である情報処理装置30によって構成されているため、文字認識支援装置40において記憶部38に出力された認識位置データ70は、文字認識装置72において取得することができる。文字認識支援装置40と文字認識装置72が別々の筐体で構成されている場合は、事前に文字認識装置72に含まれる記憶部38に、前記認識位置データ70を入力しておく必要がある。
次に、認識位置特定部80が、図20に示すように、S304において特定された認識位置データ70が示す基準認識対象領域68の相対的な位置に対応する、読取領域データ90内の認識位置92を特定する(S305)。
次に、認識位置特定部80が、それぞれの認識位置92に対応する、基準認識対象領域68と関連付けられている属性名20を記憶部38から取得して、認識位置92に関連付ける(S306)。
次に、認識対象文字列認識部82が、認識位置92によって示される領域内の文字列を認識する(S307)。
次に、認識対象文字列出力部84において認識された文字列と、S306において取得した属性名20と、読取画像86を関連付けて記憶部38に出力する(S308)。本実施形態では、図4に示す表の「処理No.1」の行に示すように、「2006/08/23」という文字列が「起票日」という属性名20と、「(株)defgH」という文字列が「請求元」という属性名20と、「¥21,000」という文字列が「金額」という属性名20と関連付けられて記憶部38に出力される。
そして、すべての記入済原稿10について上記の処理を行ったか否かについて確認し(S309)、まだすべての記入済原稿10について上記の処理を行っていない場合は(S309:N)、まだ処理を行っていない記入済原稿10を読み取ることにより生成される読取画像86を取得する(S301)。すべての原稿について画像処理が完了している場合は(S309:Y)、処理を終了する。
ここで、S304における認識位置特定部80の処理の詳細を図21に示すフロー図を参照しながら説明する。
まず、記憶部38に記憶されている認識位置データ70のうちの一つを選択する(S401)。
そして、この選択された認識位置データ70が示す各基準領域66の配置と、読取領域データ90が示す各読取領域88の配置が対応しているかどうかを所定の基準に従って判断する(S402)。例えば、基準領域66と読取領域88の行数が等しく、基準領域66と読取領域88の列数が等しく、領域が連結されている箇所が対応している場合には、配置は対応していると判断するなどとすることができる。
領域の配置が対応していると判断した場合は(S402:Y)、この認識位置データ70が、読取領域データ90に対応する認識位置データ70として特定されたこととなるので、S304の処理を終了し、S305の処理へ進む。
領域の配置が対応していないと判断した場合は(S402:N)、領域の配置の比較を行っていない認識位置データ70を選択し(S403)、S402の処理を行う。
このようにして、読取領域データ90にレイアウトが対応する認識位置データ70が特定された後に、S305の処理が行われることとなる。なお、上記の認識位置データ70を特定する方法は、一つの例にすぎず、他の方法によって認識位置データ70を特定しても構わない。
以上説明した文字認識装置72によれば、文字認識支援装置40によって、所定の目印が付されている作業用原稿を用いて生成された認識位置データ70に基づいて、原稿内の領域に記入されている文字列を認識することができる。
また、上記の実施形態では、認識位置データ70が示す基準認識対象領域68の相対的な位置に対応する、読取領域データ90内の認識位置92を特定している。例えば文書作成ソフトウェアなどには、原稿内の各領域に記載される文字数に応じて、文字列を認識する対象となる領域が微調整されるものがある。また、紙原稿を読み取って生成された画像に歪みや傾きが生じることがある。このように原稿が微調整されたり、原稿から生成される画像に歪みや傾きが生じたりする場合には、文字列を認識する対象となる領域内に文字列が正しく示されない場合がある。このような場合においても、上記の実施形態では、認識位置92を精度よく指定できるため、所望の文字列を精度よく認識することができ、利用者の利便性が向上する。
また、上記の実施形態では、パーソナルコンピュータ等の機器を併用することなく、処理を行うことができる。
なお、本発明は上記実施形態に限定されるものではない。
例えば、上記実施形態の文字認識支援装置40では、カラーマーカーによる目印14を示す目印データ54を用いたが、四角や丸などの図形や、チェックマークなど、領域を特定しうる他の目印14を用いてもよい。この場合、目印分離部46において、公知のパターン認識技術などを用いて目印画像60を基準画像16から分離する必要がある。一方、カラーマーカーによって目印14を付すと、限定色化や指定色抽出などにより、基準画像16を、目印画像60と目印分離後基準画像62とに容易に分離できるので、基準認識対象領域特定部48が目印分離後基準画像62のレイアウト解析を容易に行うことができる。
上記実施形態の文字認識支援装置40の目印データ生成部42において、目印データ生成用原稿58をスキャナ部36で読み取ることによって目印データ54を生成したが、この方法は目印データ54を生成する方法の一例にすぎない。例えば、目印データ生成用原稿58内の属性名20を記した文字の近辺、(例えば、文字の上)に目印14を付す方法、目印データ生成用原稿58に属性名20を示す文字列を目印14のマーカーの色によって記入する方法、予め目印データ生成用原稿58内の定められた位置に属性名20を対応付けておき、その定められた位置にマーカーによって目印14を付す方法などの他の方法が挙げられる。
また、各目印14を示すRGB値や、Lab値などを、利用者がUI部34を介して入力して、その入力された値に基づいて目印データ生成部42において目印データ54が生成されるようにしてもよい。
また、各目印14を、一つの値(RGB値、Lab値など)によって示さず、値(RGB値、Lab値など)の範囲によって示すことも考えられる。
また、利用者がUI部34を介して色相を入力しておき、その後、利用者がスキャナ部36を介して目印データ生成用原稿58をスキャンして得られた画像に基づいて、前記色相を調整して求められた色値に基づいて目印データ54を生成してもよい。
上記実施形態では、文字認識支援装置40の基準画像取得部44において、作業用原稿12をカラースキャンすることによって基準画像16を生成したが、白黒多値スキャンによってそれぞれの目印14が識別可能な場合などは、白黒多値スキャンによって基準画像16を生成しても構わない。
上記実施形態において生成された目印データ54を記憶部38に記憶して、再利用することも考えられる。こうすれば、目印データ生成部42における目印データ54の生成処理の手間を省くことができる。
上記実施形態では、文字認識支援装置40の基準認識対象領域特定部48、及び、文字認識装置72の読取領域特定部76においてレイアウト解析処理を行ったが、これらの処理を行わず、目印領域64の絶対座標と読取領域88の絶対座標を比較して、認識位置92を特定する構成も考えられる。
上記実施形態では、文字認識支援装置40の目印分離部46において、基準画像16から目印画像60を分離したが、基準画像16から目印画像60を分離しないで、基準認識対象領域特定部48において、基準画像16のレイアウト解析を行う構成も考えられる。
上記実施形態において、文字認識支援装置40の目印分離部46において、基準画像16から目印14を識別することができず、目印画像60が生成できない場合も考えられる。この場合、目印画像60が生成できない旨を、UI部34を介して利用者に通知する構成や、目印データ54が示す目印14と色相が対応する目印を識別して、目印画像60を生成するという構成などが考えられる。
上記実施形態では、文字認識装置72の認識位置特定部80において、記憶部38に記憶されている認識位置データ70のうちから、この読取領域データ90にレイアウトが対応する認識位置データ70を特定する(S304)処理を行っているが、この処理において、読取領域データ90にレイアウトが対応する認識位置データ70が特定できない場合が考えられる。この場合、認識位置データ70が特定できない旨を利用者にUI部34を介して通知する構成や、所与の方法によって計算されるレイアウト類似度に基づいて、認識位置データ70を特定する構成も考えられる。
また、各認識位置データ70内の各基準領域66を、作業用原稿12において各基準領域66内に記入されている文字列と関連付けて記憶部38に記憶しておき、記入済原稿10内の各読取領域88内に記入されている文字列の形式(日付、英字、漢字、数字など)と、基準領域66内に記入されている文字列の形式が対応する認識位置データ70を特定するという構成も考えられる。
上記実施形態では、文字認識装置72の認識位置特定部80での、読取領域データ90にレイアウトが対応する認識位置データ70を特定する(S304)処理において、一つの認識位置データ70が特定された時点で処理を終了している。しかし、実際には、読取領域データ90にレイアウトが対応する認識位置データ70が複数特定されうる場合が考えられる。この場合、読取領域88内の文字列の形式が、記入済原稿10内の基準認識対象領域68と関連付けられている属性名20として適した形式となっているか否かを判断することなどによって、認識位置データ70を特定することができる。例えば、基準認識対象領域68と関連付けられている属性名20が「起票日」である読取領域88に、日付形式の文字列が記入されていればこの基準認識対象領域68を含む認識位置データ70が、読取領域データ90に対応する認識位置データ70として特定されるといったことができる。
あるいは、例えば、あらかじめ定められた指定方向(左右、あるいは、上下など)の行数(列数)が対応している認識位置データ70を優先して読取領域データ90に対応する認識位置データ70として特定するということも考えられる。
また、読取領域データ90内の各読取領域88の面積と対応する認識位置データ70を優先して読取領域データ90に対応する認識位置データ70として特定することも考えられる。この場合は、文字認識支援装置40の認識位置データ生成部50において認識位置データ70を生成する際に、認識位置データ70内の各基準領域66の面積を各基準領域66と関連付けておくことが必要となる。
記入済原稿の一例を示す図である。 作業用原稿の一例を示す図である。 基準画像の一例を示す図である。 文字認識装置内に蓄積されるデータの一例を示す図である。 本発明の一実施形態に係る情報処理装置を示す図である。 本発明の一実施形態に係る文字認識支援装置の機能ブロック図である。 目印データの一例を示す図である。 目印データ生成用原稿の一例を示す図である。 目印画像の一例を示す図である。 目印分離後基準画像の一例を示す図である。 目印領域の座標が認識された目印画像の一例を示す図である。 基準領域の座標が認識された目印分離後基準画像の一例を示す図である。 認識位置データの一例を示す図である。 基準画像を取得してから認識位置データを生成するまでの処理のフローを示す図である。 図14内のS105の処理の詳細のフローを示す図である。 本発明の一実施形態に係る文字認識装置の機能ブロック図である。 文字認識装置おいて行われる処理のフローを示す図である。 読取画像の一例を示す図である。 読取領域の座標が認識された読取画像の一例を示す図である。 読取領域データの一例を示す図である。 図17内のS304の処理の詳細のフローを示す図である。
符号の説明
10 記入済原稿、12 作業用原稿、14 目印、16 基準画像、18 認識対象文字列、20 属性名、30 情報処理装置、32 制御部、34 UI部、36 スキャナ部、38 記憶部、40 文字認識支援装置、42 目印データ生成部、44 基準画像取得部、46 目印分離部、48 基準認識対象領域特定部、50 認識位置データ生成部、52 認識位置データ出力部、54 目印データ、56 目印データ表、58 目印データ生成用原稿、60 目印画像、62 目印分離後基準画像、64 目印領域、66 基準領域、68 基準認識対象領域、70 認識位置データ、72 文字認識装置、74 読取画像取得部、76 読取領域特定部、78 読取領域データ生成部、80 認識位置特定部、82 認識対象文字列認識部、84 認識対象文字列出力部、86 読取画像、88 読取領域、90 読取領域データ、92 認識位置。

Claims (7)

  1. 文字列が記入されている記入済原稿とレイアウトが共通する原稿であって、所定の目印が付されている作業用原稿を読み取って生成される画像を取得する手段と、
    前記作業用原稿に付されている前記目印を識別する識別手段と、
    前記識別手段により識別される前記目印の位置に基づいて、前記記入済原稿内の、文字列が記入された領域を示す、認識位置データを生成する認識位置データ生成手段と、
    を含むことを特徴とする文字認識支援装置。
  2. 請求項1に記載の文字認識支援装置であって、
    前記作業用原稿には複数の種類の目印が付されており、
    前記識別手段は、前記作業用原稿に付された複数の種類の目印を識別し、
    前記認識位置データ生成手段は、前記識別手段により識別されたそれぞれの目印の位置に基づいて、前記記入済原稿内の、文字列が記入された複数の領域を示す、認識位置データを生成する、
    ことを特徴とする文字認識支援装置。
  3. 請求項1又は2に記載の文字認識支援装置であって、
    前記作業用原稿のレイアウトを解析する手段をさらに含む、
    ことを特徴とする文字認識支援装置。
  4. 請求項1乃至3に記載の文字認識支援装置であって、
    前記識別手段により識別される目印を示す目印データ生成用原稿を読み取って生成される目印データ生成用画像を取得する手段と、
    前記目印データ生成用画像に基づいて、前記識別手段により識別される前記目印を示す目印データを生成する目印データ生成手段をさらに含み、
    前記識別手段は、前記目印データが示す前記目印に基づいて、前記作業用原稿に付されている前記目印を識別する、
    ことを特徴とする文字認識支援装置。
  5. 請求項1乃至4に記載の文字認識支援装置であって、
    前記認識位置データ生成手段により生成される前記認識位置データが示す、前記記入済原稿内の、文字列が記入された領域が、前記作業用原稿内における位置によって表現される、
    ことを特徴とする文字認識支援装置。
  6. 請求項1に記載の文字認識支援装置において生成される認識位置データに基づいて、前記記入済原稿内の、文字列が記入されている領域を特定する手段と、
    前記記入済原稿内の前記文字列を認識する手段と、
    を含むことを特徴とする文字認識装置。
  7. 文字列が記入されている記入済原稿とレイアウトが共通する原稿であって、所定の目印が付されている作業用原稿を読み取って生成される画像を取得する手段、
    前記作業用原稿に付されている前記目印を識別する識別手段、
    前記識別手段により識別される前記目印の位置に基づいて、前記記入済原稿内の、文字列が記入された領域を示す、認識位置データを生成する認識位置データ生成手段、
    としてコンピュータを機能させることを特徴とするプログラム。
JP2007122285A 2007-05-07 2007-05-07 文字認識支援装置、文字認識装置及びプログラム Pending JP2008276677A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2007122285A JP2008276677A (ja) 2007-05-07 2007-05-07 文字認識支援装置、文字認識装置及びプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2007122285A JP2008276677A (ja) 2007-05-07 2007-05-07 文字認識支援装置、文字認識装置及びプログラム

Publications (1)

Publication Number Publication Date
JP2008276677A true JP2008276677A (ja) 2008-11-13

Family

ID=40054527

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2007122285A Pending JP2008276677A (ja) 2007-05-07 2007-05-07 文字認識支援装置、文字認識装置及びプログラム

Country Status (1)

Country Link
JP (1) JP2008276677A (ja)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010211465A (ja) * 2009-03-10 2010-09-24 Canon Inc 画像処理装置および画像処理方法及びプログラム
JP2010212957A (ja) * 2009-03-10 2010-09-24 Canon Inc 画像処理装置及びその制御方法並びにプログラム
JP2011135322A (ja) * 2009-12-24 2011-07-07 Canon Inc 画像処理装置及びその制御方法並びにプログラム
JP2018018303A (ja) * 2016-07-28 2018-02-01 京セラドキュメントソリューションズ株式会社 情報抽出装置及びこれを備えた画像形成装置
WO2019031020A1 (ja) * 2017-08-09 2019-02-14 株式会社DSi 計量システム、電子秤及び電子秤用マーカー
JP2019191725A (ja) * 2018-04-20 2019-10-31 京セラドキュメントソリューションズ株式会社 画像形成装置及び画像形成プログラム

Cited By (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010211465A (ja) * 2009-03-10 2010-09-24 Canon Inc 画像処理装置および画像処理方法及びプログラム
JP2010212957A (ja) * 2009-03-10 2010-09-24 Canon Inc 画像処理装置及びその制御方法並びにプログラム
US8320027B2 (en) 2009-03-10 2012-11-27 Canon Kabushiki Kaisha Image processing apparatus, data processing method executed by image processing apparatus, and computer-readable storage medium storing program for causing computer to execute data processing method
JP2011135322A (ja) * 2009-12-24 2011-07-07 Canon Inc 画像処理装置及びその制御方法並びにプログラム
JP2018018303A (ja) * 2016-07-28 2018-02-01 京セラドキュメントソリューションズ株式会社 情報抽出装置及びこれを備えた画像形成装置
CN107665346A (zh) * 2016-07-28 2018-02-06 京瓷办公信息系统株式会社 信息提取装置、具有信息提取装置的图像形成装置、信息提取装置的控制方法
US10452903B2 (en) 2016-07-28 2019-10-22 Kyocera Document Solutions Inc. Information extraction device, image forming apparatus including information extraction device and method of controlling information extraction device
WO2019031020A1 (ja) * 2017-08-09 2019-02-14 株式会社DSi 計量システム、電子秤及び電子秤用マーカー
JP2019032276A (ja) * 2017-08-09 2019-02-28 株式会社DSi 計量システム、電子秤及び電子秤用マーカー
US11460340B2 (en) 2017-08-09 2022-10-04 Dsi Corporation Weighing system, electronic scale, and electronic scale marker for performing inventory management
JP2019191725A (ja) * 2018-04-20 2019-10-31 京セラドキュメントソリューションズ株式会社 画像形成装置及び画像形成プログラム

Similar Documents

Publication Publication Date Title
JP4903034B2 (ja) 画像処理装置、画像処理方法及びコンピュータプログラム
US8213717B2 (en) Document processing apparatus, document processing method, recording medium and data signal
US7596271B2 (en) Image processing system and image processing method
JP5121599B2 (ja) 画像処理装置、画像処理方法およびそのプログラムならびに記憶媒体
US20090274369A1 (en) Image processing device, image processing method, program, and storage medium
JP2016139982A (ja) 画像処理装置、および画像形成システム
JP2008276677A (ja) 文字認識支援装置、文字認識装置及びプログラム
US9558433B2 (en) Image processing apparatus generating partially erased image data and supplementary data supplementing partially erased image data
JP6066108B2 (ja) 電子文書生成システムおよびプログラム
JP2007004621A (ja) 文書管理支援装置、文書管理支援方法およびプログラム
US10887491B2 (en) Image processing apparatus for processing of highlighted regions
JP5696394B2 (ja) 画像処理装置、画像処理方法、及び、画像処理プログラム
JP2009087270A (ja) 画像処理装置及びプログラム
JP5089524B2 (ja) 文書処理装置、文書処理システム、文書処理方法、及び、文書処理プログラム
JP2008282094A (ja) 文字認識処理装置
JP2007241355A (ja) 画像処理装置及び画像処理プログラム
JP2019029882A (ja) 画像処理装置
JP6617751B2 (ja) 文書データ加工装置、文書データ加工プログラム、及び文書データ加工方法
JP6561876B2 (ja) 情報処理装置及びプログラム
US20020031270A1 (en) Image processing apparatus, image processing method, and computer readable storage medium
JP2007028181A (ja) 画像処理装置
JP6489041B2 (ja) 情報処理装置及びプログラム
JP2012190357A (ja) 画像処理装置、画像処理方法、およびプログラム
WO2022097408A1 (ja) 画像処理装置及び画像形成装置
JP2009303149A (ja) 画像処理装置、画像処理方法及びコンピュータ制御プログラム