JP2017091419A - 情報処理装置、画像読み取り装置及びプログラム - Google Patents

情報処理装置、画像読み取り装置及びプログラム Download PDF

Info

Publication number
JP2017091419A
JP2017091419A JP2015224318A JP2015224318A JP2017091419A JP 2017091419 A JP2017091419 A JP 2017091419A JP 2015224318 A JP2015224318 A JP 2015224318A JP 2015224318 A JP2015224318 A JP 2015224318A JP 2017091419 A JP2017091419 A JP 2017091419A
Authority
JP
Japan
Prior art keywords
designated area
character
area
characters
designated
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2015224318A
Other languages
English (en)
Other versions
JP6696155B2 (ja
Inventor
紘幸 岸本
Hiroyuki Kishimoto
紘幸 岸本
和宏 大谷
Kazuhiro Otani
和宏 大谷
勝也 小柳
Katsuya Koyanagi
勝也 小柳
邦彦 小林
Kunihiko Kobayashi
邦彦 小林
岡田 茂
Shigeru Okada
茂 岡田
真太郎 安達
Shintaro Adachi
真太郎 安達
茜 吉崎
Akane Yoshizaki
茜 吉崎
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujifilm Business Innovation Corp
Original Assignee
Fuji Xerox Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fuji Xerox Co Ltd filed Critical Fuji Xerox Co Ltd
Priority to JP2015224318A priority Critical patent/JP6696155B2/ja
Publication of JP2017091419A publication Critical patent/JP2017091419A/ja
Application granted granted Critical
Publication of JP6696155B2 publication Critical patent/JP6696155B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Character Input (AREA)
  • Character Discrimination (AREA)

Abstract

【課題】原稿上で指定された指定領域内の文字の情報を取得する場合に、指定領域を移動させずに、指定領域を拡張した拡張領域での文字認識の結果を採用する構成と比較して、不要な文字を抽出する可能性を低減させる。【解決手段】画像処理装置の制御部10は、原稿に形成された画像の画像情報を取得し、取得された画像情報から、原稿上にて指定された領域である指定領域を拡張した拡張領域内に存在する文字を認識する。そして、画像処理装置の制御部10は、認識した文字の少なくとも1つが指定領域内に含まれるように指定領域を移動させて、移動後の指定領域内に含まれる文字の情報を出力する。【選択図】図3

Description

本発明は、情報処理装置、画像読み取り装置及びプログラムに関する。
特許文献1には、部分画像切り出しによる文字切れによる誤認識を補正し、妥当なOCR(Optical Character Recognition)出力をインデックスデータとして採用する処理を備える画像入力装置が開示されている。この画像入力装置は、スキャン入力した画像の部分領域を切り出し、その部分領域画像に対し、1回目のOCR処理と次に自動的に部分領域を拡張し2回目のOCR処理を実行し、「第1のOCR結果」と「第2のOCR結果」とを比較してインデックスデータを取得することが開示されている。
特開2008−40598号公報
例えば光学文字認識の技術であるOCRの処理により、原稿上で指定された領域内に含まれる文字を認識する場合がある。その際、例えば原稿を出力する際のプリントずれや原稿を読み取って(スキャンして)電子化する際のスキャンずれ等の位置ずれが発生したために、文字認識に失敗してしまう場合がある。このような場合に、文字認識を行う領域を単純に拡張するだけでは、不要な文字を抽出してしまう可能性がある。
本発明は、原稿上で指定された指定領域内の文字の情報を取得する場合に、指定領域を移動させずに、指定領域を拡張した拡張領域での文字認識の結果を採用する構成と比較して、不要な文字を抽出する可能性を低減させることを目的とする。
請求項1に記載の発明は、原稿に形成された画像の画像情報を取得する取得手段と、前記取得手段により取得された前記画像情報から、前記原稿上にて指定された領域である指定領域を拡張した拡張領域内に存在する文字を認識し、認識した文字の少なくとも1つが当該指定領域内に含まれるように当該指定領域を移動させる移動手段と、前記移動手段による移動後の前記指定領域内に含まれる文字の情報を出力する出力手段とを備える情報処理装置である。
請求項2に記載の発明は、前記移動手段は、移動後の前記指定領域内に途切れた文字が含まれないように、当該指定領域を移動させることを特徴とする請求項1に記載の情報処理装置である。
請求項3に記載の発明は、前記移動手段は、移動後の前記指定領域内に途切れた文字が含まれないように当該指定領域を移動させる場合に、当該指定領域の移動量が最も小さくなるようにすることを特徴とする請求項2に記載の情報処理装置である。
請求項4に記載の発明は、前記指定領域は矩形であり、また、前記拡張領域にて認識された文字には、当該文字を囲む矩形である文字矩形が文字毎に設定され、前記移動手段は、前記指定領域の四隅のうちのいずれか1つの第1の隅を、当該第1の隅に対応する各文字矩形の隅の中で当該第1の隅から最も近い第2の隅に合わせるように、当該指定領域を移動させることを特徴とする請求項1に記載の情報処理装置である。
請求項5に記載の発明は、前記移動手段は、前記指定領域の移動において、当該指定領域の四隅のそれぞれを、各文字矩形の隅に順番に移動させて、移動後の当該指定領域内に途切れた文字が含まれるか否かを判定することを特徴とする請求項4に記載の情報処理装置である。
請求項6に記載の発明は、前記移動手段は、原稿内に前記指定領域が複数ある場合に、それぞれの当該指定領域を拡張した拡張領域内の文字を認識し、認識した文字の少なくとも1つが各指定領域内に含まれるとともに各指定領域の移動量の差が予め定められた範囲内になるように、複数の当該指定領域を移動させることを特徴とする請求項1に記載の情報処理装置である。
請求項7に記載の発明は、原稿に形成された画像を読み取る画像読み取り手段と、前記画像読み取り手段により得られた画像情報から、前記原稿上にて指定された領域である指定領域を拡張した拡張領域内に存在する文字を認識し、認識した文字の少なくとも1つが当該指定領域内に含まれるように当該指定領域を移動させる移動手段と、前記移動手段による移動後の前記指定領域内に含まれる文字の情報を出力する出力手段とを備える画像読み取り装置である。
請求項8に記載の発明は、コンピュータに、原稿に形成された画像の画像情報を取得する機能と、取得された前記画像情報から、前記原稿上にて指定された領域である指定領域を拡張した拡張領域内に存在する文字を認識し、認識した文字の少なくとも1つが当該指定領域内に含まれるように当該指定領域を移動させる機能と、移動後の前記指定領域内に含まれる文字の情報を出力する機能とを実現させるためのプログラムである。
請求項1記載の発明によれば、原稿上で指定された指定領域内の文字の情報を取得する場合に、指定領域を移動せずに、指定領域を拡張した拡張領域での文字認識の結果を採用する構成と比較して、不要な文字を抽出する可能性を低減させることができる。
請求項2記載の発明によれば、指定領域内に途切れた文字が含まれないように、指定領域の位置を調整することができる。
請求項3記載の発明によれば、指定領域内に途切れた文字が含まれないようにするとともに、指定領域の移動量が最も小さくなるように指定領域の位置を調整することができる。
請求項4記載の発明によれば、指定領域の第1の隅に対応する文字矩形の隅の中で、第1の隅から最も近い第2の隅を有する文字が含まれるように、指定領域の位置を調整することができる。
請求項5記載の発明によれば、より確実に、指定領域内に途切れた文字が含まれないように、指定領域の位置を調整することができる。
請求項6記載の発明によれば、指定領域の移動に際して1つの指定領域の情報のみを用いる構成と比較して、指定領域内の文字の情報をより正確に取得することができる。
請求項7記載の発明によれば、原稿上で指定された指定領域内の文字の情報を取得する場合に、指定領域を移動させずに、指定領域を拡張した拡張領域での文字認識の結果を採用する構成と比較して、不要な文字を抽出する可能性を低減させることができる。
請求項8記載の発明によれば、原稿上で指定された指定領域内の文字の情報を取得する場合に、指定領域を移動させずに、指定領域を拡張した拡張領域での文字認識の結果を採用する構成と比較して、不要な文字を抽出する可能性を低減させる機能を、コンピュータにより実現できる。
本発明の実施の形態が適用される画像処理装置のハードウェア構成例を示した図である。 (a)、(b)は、指定領域にて文字認識を行う際に失敗する場合の一例を説明するための図である。 本実施の形態に係る画像処理装置が有する制御部の機能構成例を示したブロック図である。 制御部にて指定領域内の文字を特定する処理の具体例を説明するための図である。 (a)〜(c)は、制御部にて指定領域内の文字を特定する処理の具体例を説明するための図である。 (a)〜(c)は、移動後の指定領域内に途切れた文字が含まれる場合の一例を説明するための図である。 実施の形態1において、移動後の指定領域内に存在する文字を特定する処理の手順の一例を示すフローチャートである。 実施の形態1において、移動後の指定領域内に存在する文字を特定する処理の手順の一例を示すフローチャートである。 (a)、(b)は、1枚の原稿内に複数の指定領域が設けられている場合の一例を説明するための図である。 (a)〜(c)は、複数の指定領域が設けられている場合の処理の具体例を説明するための図である。 実施の形態2において、移動後の指定領域内に存在する文字を特定する処理の手順の一例を示すフローチャートである。 実施の形態2において、移動後の指定領域内に存在する文字を特定する処理の手順の一例を示すフローチャートである。 実施の形態2において、移動後の指定領域内に存在する文字を特定する処理の手順の一例を示すフローチャートである。
以下、添付図面を参照して、本発明の実施の形態について詳細に説明する。
[実施の形態1]
<画像処理装置のハードウェア構成>
まず、本発明の実施の形態が適用される画像処理装置1のハードウェア構成について説明する。図1は、本発明の実施の形態が適用される画像処理装置1のハードウェア構成例を示した図である。画像読み取り装置の一例としての画像処理装置1は、例えば、スキャン機能、プリント機能、コピー機能及びファクシミリ機能等の画像処理機能を備えた装置である。図1に示すように、画像処理装置1は、制御部10、操作部104、表示機構105、画像読み取り部106、画像形成部107、画像処理部108、通信部109、記憶装置110を備える。なお、これらの各機能部は、バス111に接続されており、このバス111を介してデータの授受を行う。
制御部10は、画像処理装置1の各部を制御する。制御部10は、CPU(Central Processing Unit)101、ROM(Read Only Memory)102、RAM(Random Access Memory)103により構成される。
ここで、CPU101は、OS(Operating System)やアプリケーション等の各種プログラムを実行する。また、ROM102は、CPU101により実行される制御プログラムを記憶するメモリである。RAM103は、CPU101の作業用メモリ等として用いられるメモリである。そして、CPU101は、ROM102に記憶されている制御プログラムを読み出し、RAM103を作業エリアにして制御プログラムを実行する。CPU101により制御プログラムが実行されると、画像処理装置1における各機能が実現される。
操作部104は、ユーザの操作を受け付ける。操作部104は、例えば、ハードウェアキーにより構成される。また、操作部104は、例えば、接触された位置に応じた制御信号を出力するタッチパネルにより構成される。接触を検知する手段としては、接触による圧力をもとに検知する手段や、接触した物の静電気をもとに検知する手段等、どのようなものが用いられても良い。
表示機構105は、例えば液晶ディスプレイにより構成され、画像処理装置1に関するデータを表示する。表示機構105は、例えば、ユーザが画像処理装置1を操作する際にユーザが参照する画面を表示する。
画像読み取り手段の一例としての画像読み取り部106は、原稿上に形成されている画像を読み取り、読み取った画像を示す画像データ(画像情報)を生成する。ここで、画像読み取り部106は、例えばスキャナであり、光源から原稿に照射した光に対する反射光をレンズで縮小してCCD(Charge Coupled Devices)で受光するCCD方式や、LED光源から原稿に順に照射した光に対する反射光をCIS(Contact Image Sensor)で受光するCIS方式のものを用いると良い。
画像形成部107は、用紙等の記録媒体に画像を形成する印刷機構を備えている。ここで、画像形成部107は、例えばプリンタであり、感光体に付着させたトナーを記録媒体に転写して像を形成する電子写真方式や、インクを記録媒体上に吐出して像を形成するインクジェット方式のものを用いると良い。
画像処理部108は、画像データが表す画像に色補正や階調補正等の画像処理を施す。
通信部109は、不図示の通信回線に接続されており、通信回線に接続されている他の装置との間で各種データの送受信を行う通信インタフェースとして機能する。例えば、通信部109を介して、他の装置との間で画像データの送受信が行われる。
記憶装置110は、ハードディスク装置などの記憶領域を具備しており、例えば通信部109で受信したデータや画像処理装置1で生成されたデータ等を記憶する。
ここで、本実施の形態に係る画像処理装置1は、画像読み取り部106にて原稿上の画像を読み取って生成された画像データに対して、例えばOCRの処理を行って文字認識を行う。OCRとは、画像データ上にある文字を解析し、コンピュータで扱われる文字データに変換する技術である。ここで、例えば、氏名や企業名、日付、原稿のタイトルなど、原稿に記載されている特定の文字を認識して、認識した文字の情報により原稿を管理する場合がある。その際には、原稿に記載されている特定の文字を認識するために、原稿の一部の領域が予め指定され、指定された領域内で文字認識が行われる。このような場合に、プリントずれやスキャンずれ等の位置ずれにより、同じ原稿であっても文字位置が変わってしまい、指定された領域内の文字を正確に認識できず文字認識に失敗してしまうことがある。
以下の説明では、原稿上の文字を認識するための領域として予め指定された、原稿内の一部の領域を、「指定領域」と称することとする。この指定領域は、原稿の種類や認識対象の文字などに応じて、ユーザ等により事前に設定されるものである。また、以下では、指定領域は矩形であるものとして説明を行う。
図2(a)、(b)は、指定領域にて文字認識を行う際に失敗する場合の一例を説明するための図である。
まず、図2(a)に示す例は、プリントずれやスキャンずれ等の位置ずれが発生していない原稿の画像(画像読み取り部106にて生成された画像データ)を示している。また、原稿に対しては、指定領域21が予め定められている。そして、指定領域21にて文字認識が行われることにより、3つの文字(図示の例では、「○○○」と記載)が認識される。
一方、図2(b)に示す例は、プリントずれやスキャンずれ等の位置ずれが発生した原稿の画像を示している、ここで、位置ずれにより、指定領域21からは3つの文字が外れている。その結果、指定領域21における文字認識は失敗し、正確に文字が認識されない。
そこで、以下では、文字認識の対象とする原稿にて位置ずれが発生していたとしても、指定領域内の文字をより正確に認識する手順について説明する。詳細は後述するが、本実施の形態に係る画像処理装置1は、まず、指定領域を少し拡張した領域(以下、拡張領域と称する)に対して文字認識を行う。そして、画像処理装置1は、拡張領域にて認識された文字の位置と指定領域の位置とに基づいて、位置ずれが生じていない場合に指定領域内で認識されるはずの文字を特定する。なお、文字認識では、例えば、文字、数字、記号、マーク等が認識されるが、以下では、単に「文字」と呼ぶこととする。
<制御部の機能構成>
次に、本実施の形態に係る画像処理装置1が有する制御部10の機能構成について説明する。図3は、本実施の形態に係る画像処理装置1が有する制御部10の機能構成例を示したブロック図である。
画像処理装置1の制御部10は、画像読み取り部106にて原稿上の画像を読み取って生成された画像データを取得する画像データ取得部11と、取得した画像データをもとに、指定領域を拡張した拡張領域に対して文字認識を行う文字認識部12と、認識された文字の位置と指定領域の位置とに基づいて指定領域を移動させて、移動後の指定領域内に存在する文字を特定する文字特定部13とを備える。
画像データ取得部11は、画像読み取り部106にて原稿上の画像を読み取って生成された画像データを取得する。
文字認識部12は、画像データ取得部11が取得した画像データをもとに、指定領域を少し拡張した拡張領域に対して文字認識を行う。具体的には、文字認識部12は、位置ずれにより指定領域内に収まっていない周囲の文字を認識するために、指定領域を例えば2倍に拡張した拡張領域にて文字認識を行う。ここで、指定領域をどれくらいの大きさに拡張するかを示す条件については、ユーザ等により予め設定されているものとする。
文字特定部13は、文字認識部12により拡張領域にて認識された文字の情報を取得し、認識された文字の位置と指定領域の位置とに基づいて、指定領域の位置を調整する。ここで、文字特定部13は、拡張領域にて認識された文字の少なくとも1つが指定領域内に含まれるように、指定領域を移動させる。
さらに説明すると、文字特定部13は、まず、拡張領域にて認識された文字のそれぞれについて、文字を囲む矩形(以下、文字矩形と称する)の位置情報を取得する。また、文字特定部13は、矩形である指定領域の位置情報も取得する。次に、文字特定部13は、各文字矩形の位置情報と指定領域の位置情報とを比較する。そして、文字特定部13は、指定領域の矩形の四隅(4つの頂点)のうちのいずれか1つの隅を選択して、選択した隅をいずれかの文字矩形の隅に合わせるように指定領域を移動させて、指定領域内に文字が収まるようにする。
文字特定部13は、指定領域を移動させると、移動後の指定領域内に含まれる文字を特定し、特定した文字の情報を文字認識の結果として出力する。
なお、図3に示す制御部10を構成する各機能部は、ソフトウェアとハードウェア資源とが協働することにより実現される。具体的には、CPU101が、画像データ取得部11、文字認識部12、文字特定部13等を実現するプログラムを、例えばROM102からRAM103に読み込んで実行することにより、これらの機能部が実現される。
また、本実施の形態において、画像データ取得部11は、取得手段の一例としての機能を有している。文字認識部12及び文字特定部13は、移動手段の一例としての機能を有している。また、文字特定部13は、出力手段の一例としての機能も有している。そして、制御部10は、情報処理装置の一例として捉えることができる。
<指定領域内の文字を特定する処理の具体例>
次に、制御部10にて指定領域内の文字を特定する処理について、具体例を示して説明する。図4及び図5(a)〜(c)は、制御部10にて指定領域内の文字を特定する処理の具体例を説明するための図である。
まず、図4に示す原稿22は、画像読み取り部106が原稿上の画像を読み取って生成した画像データを示している。原稿22では、矩形の指定領域23が定められている。ここで、文字認識部12は、指定領域23を拡張した拡張領域24において文字認識を行う。図示の例では、拡張領域24は、指定領域23を矢印の方向に拡張した領域である。
文字認識部12は、文字認識を行うにあたり、文字認識の対象とする原稿の全体において、画素をもとにした直交座標系を考える。図示の例では、原稿22の左上の隅を原点O(0,0)とし、原稿の横方向の座標をx座標、原稿の縦方向の座標をy座標としている。指定領域23の位置を表す座標は予め定められているため、文字認識部12は、原稿22における指定領域23の位置を特定し、特定した指定領域23を拡張した拡張領域24を設定する。そして、文字認識部12は、拡張領域24において文字認識を行う。
次に、図5(a)〜(c)を参照しながら、文字特定部13が指定領域を移動させて、移動後の指定領域内に存在する文字を特定する手順について説明する。まず、文字認識部12により、図4に示す拡張領域24において、「あ」、「い」、「う」、「え」の4つの文字が認識されたものとする。
ここで、文字特定部13は、まず、認識された文字を囲む文字矩形の位置情報(座標情報)を取得する。図5(a)に示す例では、文字特定部13は、「あ」、「い」、「う」、「え」のそれぞれの文字矩形の位置情報を取得する。また、文字特定部13は、指定領域23の位置情報(座標情報)も取得する。
図示の例では、「あ」の文字矩形の左上の隅の座標(x,y)を(0,0)として、他の位置の座標を示している。例えば、「あ」の文字矩形の右上の隅の座標は(10,0)、左下の隅の座標は(0,10)、右下の隅の座標は(10,10)である。また、「い」の文字矩形の左上の隅の座標は(11,0)、右上の隅の座標は(21,0)、左下の隅の座標は(11,10)、右下の隅の座標は(21,10)である。さらに、「う」の文字矩形の左上の隅の座標は(22,0)、右上の隅の座標は(32,0)、左下の隅の座標は(22,10)、右下の隅の座標は(32,10)である。
また、指定領域23の左上の隅の座標は(12,1)、右上の隅の座標は(33,1)、左下の隅の座標は(12,11)、右下の隅の座標は(33,11)である。
次に、文字特定部13は、指定領域23内に文字が収まるように、指定領域23の位置を調整する。ここで、文字特定部13は各文字矩形の座標情報と指定領域23の座標情報とを比較して、指定領域23から最も近い文字が指定領域23内に収まるように、指定領域23を移動させる。
図示の例では、まず、文字特定部13は、指定領域23の矩形の四隅のうちの「左上の隅」を選択する。そして、文字特定部13は、選択した指定領域23の「左上の隅」を、各文字矩形の対応する隅(「左上の隅」)の中で最も近い隅に合わせるように、指定領域23を移動させる。付言すると、指定領域23と文字矩形とは両者とも矩形であるため、指定領域23の「左上の隅」と、各文字矩形の「左上の隅」とは対応していると捉えることができる。
さらに説明すると、指定領域23の左上の隅の座標は(12,1)である。また、「あ」の文字矩形の左上の隅の座標は(0,0)、「い」の文字矩形の左上の隅の座標は(11,0)、「う」の文字矩形の左上の隅の座標は(22,0)である。ここで、指定領域23の左上の隅(12,1)を(0,0)へ移動する場合の移動量は、左に「12」、上に「1」である。指定領域23の左上の隅(12,1)を(11,0)へ移動する場合の移動量は、左に「1」、上に「1」である。指定領域23の左上の隅(12,1)を(22,0)へ移動する場合の移動量は、右に「10」、上に「1」である。
そのため、指定領域23の左上の隅(12,1)に最も近い文字矩形の左上座標は、(11,0)である。そこで、文字特定部13は、図5(b)に示すように、指定領域23を矢印の方向に移動させる。
その結果、図5(c)に示すように、移動後の指定領域23内には、「い」、「う」の文字が存在することになる。文字特定部13は、「い」、「う」の文字情報を、文字認識の結果として出力する。
付言すると、ここでは、指定領域23の左上の隅を、第1の隅の一例として用いている。また、「い」の文字矩形の左上の隅を、第2の隅の一例として用いている。
なお、図5に示す例では、指定領域23の左上の隅を、「い」の文字矩形の左上の隅に合わせることとしたが、指定領域23の左上の隅を、例えば「い」の文字矩形の左下の隅に合わせた場合、移動後の指定領域23内に「い」の文字は含まれない。同様に、指定領域23の左上の隅を、例えば「い」の文字矩形の右上の隅または右下の隅に合わせた場合、移動後の指定領域23内に「い」の文字は含まれない。即ち、指定領域23の左上の隅を移動させる場合、移動後の指定領域23内に「い」の文字を収めるためには、「い」の文字矩形の左上の隅に合わせる必要がある。
また、図5に示す例では、指定領域23の四隅のうちの「左上の隅」について言及したが、指定領域23を移動させる処理としてはこのような構成に限られるものではない。例えば、指定領域23の「右上の隅」を、各文字矩形の「右上の隅」の中で最も近い「右上の隅」に合わせても良い。また、例えば、指定領域23の「左下の隅」を、各文字矩形の「左下の隅」の中で最も近い「左下の隅」に合わせても良い。
ここで、指定領域は、特定の文字を認識するためにユーザ等により事前に設定されるものである。設定に際しては、指定領域内に含まれる文字が途切れることのないように、指定領域の位置や大きさを事前に設定しておくことも可能である。具体的には、図5に示す例では、移動後の指定領域23内に「い」、「う」の文字が途切れることなく文字全体が含まれている。言い換えると、移動後の指定領域23内に途切れた文字が含まれないようにするとともに、指定領域23の移動量が最も小さくなるように、指定領域23の移動が行われている。
しかし、位置ずれの状況によっては、移動量が小さくなるように指定領域を移動させた結果、移動後の指定領域内に途切れた文字が含まれてしまう場合もあり得る。本実施の形態では、このような場合に、移動後の指定領域の位置に誤りがあると判定することとしても良い。言い換えると、文字特定部13は、移動後の指定領域内に途切れた文字が含まれないように、指定領域を移動させることとしても良い。
図6(a)〜(c)は、移動後の指定領域内に途切れた文字が含まれる場合の一例を説明するための図である。
まず、図6(a)に示すように、文字認識部12により、「あ」、「い」、「う」の3つの文字が認識されたとする。ここで、「あ」の文字矩形の左上の隅の座標(x,y)は(0,0)、右上の隅の座標は(10,0)、左下の隅の座標は(0,10)、右下の隅の座標は(10,10)である。また、「い」の文字矩形の左上の隅の座標は(10,0)、右上の隅の座標は(20,0)、左下の隅の座標は(10,10)、右下の隅の座標は(20,10)である。さらに、「う」の文字矩形の左上の隅の座標は(24,0)、右上の隅の座標は(34,0)、左下の隅の座標は(24,10)、右下の隅の座標は(34,10)である。
また、指定領域25の左上の隅の座標は(6,2)、右上の隅の座標は(26,2)、左下の隅の座標は(6,12)、右下の隅の座標は(26,12)である。
ここで、指定領域25の「左上の隅」を、各文字矩形の「左上の隅」の中で最も近い「左上の隅」に合わせる場合、図6(b)に示すように、指定領域25の「左上の隅」は、「い」の文字矩形の「左上の隅」に移動する。その結果、移動後の指定領域25内では、「う」の文字が途切れてしまうことになる。
一方で、指定領域25の「左上の隅」を、2番目に近い「左上の隅」に合わせる場合、図6(c)に示すように、指定領域25の「左上の隅」は、「あ」の文字矩形の「左上の隅」に移動する。その結果、移動後の指定領域25内には、「あ」、「い」の文字全体が含まれることになり、途切れた文字は存在しない。
このように、移動量が小さくなるように指定領域を移動させた結果、移動後の指定領域内に途切れた文字が含まれてしまう場合がある。付言すると、本実施の形態では、指定領域を移動させる場合の条件として、「指定領域の移動量が小さいこと」、「移動後の指定領域内に途切れた文字が含まれないこと」の2つが挙げられる。
本実施の形態では、これら2つの条件のどちらを優先させるかにより、移動後の指定領域の位置が変わることになる。「指定領域の移動量が小さいこと」を優先させる場合には、移動後の指定領域内に途切れた文字が含まれていたとしても、移動が誤りとは判定されない。例えば、図6(b)の場合には、指定領域内に文字全体が含まれる「い」の情報が文字認識の結果として出力される。一方、「移動後の指定領域内に途切れた文字が含まれないこと」を優先させる場合には、図6(c)に示すように、指定領域内に途切れた文字が含まれない移動先の中で、最も移動量の小さいものが選ばれることになる。
なお、図6に示す例では、指定領域25の「左上の隅」を、各文字矩形の「左上の隅」の中で最も近い「左上の隅」に合わせる場合、「い」の文字矩形の左上の隅に移動する。一方、指定領域25の「右上の隅」を、各文字矩形の「右上の隅」の中で最も近い「右上の隅」に合わせる場合、図6(c)に示すように、指定領域25の「右上の隅」は、「い」の文字矩形の「右上の隅」に移動する。即ち、指定領域25の矩形の四隅のうちのどの隅を移動させるかにより、指定領域25の移動先が変わることになる。
そこで、文字特定部13は、指定領域25の四隅のそれぞれを、各文字矩形の隅に順番に移動させて、移動後の指定領域25内に途切れた文字が含まれるか否かを検査しても良い。このような検査の結果、指定領域25の「左上の隅」を移動させた場合には、図6(b)に示すように、途切れた文字が含まれることとなり、移動後の指定領域25の位置に誤りがあると判定される。一方、指定領域25の「右上の隅」を移動させた場合には、図6(c)に示すように、各文字は全体が含まれることとなり、途切れた文字は存在しない。そのため、指定領域25は正しく移動されたと判定される。
この検査において、文字特定部13は、指定領域25の移動量が小さくなる場合に限定するために、例えば、移動前の指定領域25と重なっている文字矩形に絞って検査することとしても良い。
<移動後の指定領域内の文字を特定する処理の手順>
次に、制御部10にて指定領域を移動させて、移動後の指定領域内に存在する文字を特定する処理の手順について説明する。図7及び図8は、実施の形態1において、移動後の指定領域内に存在する文字を特定する処理の手順の一例を示すフローチャートである。ここで、図7に示す処理手順は、「指定領域の移動量が小さいこと」を優先する場合を示している。また、図8に示す処理手順は、「移動後の指定領域内に途切れた文字が含まれないこと」を優先する場合を示している。
まず、図7を参照しながら、「指定領域の移動量が小さいこと」を優先する場合について説明する。画像データ取得部11は、画像読み取り部106にて原稿上の画像を読み取って生成された画像データを取得する(ステップ101)。次に、文字認識部12は、取得した画像データにおいて、予め定められた指定領域の位置を特定する(ステップ102)。次に、文字認識部12は、指定領域を拡張した拡張領域で文字認識を実行する(ステップ103)。次に、文字特定部13は、文字認識により認識された各文字の文字矩形の座標情報、及び指定領域の座標情報を取得する(ステップ104)。
次に、文字特定部13は、各文字矩形の座標情報と指定領域の座標情報とを比較して、指定領域から最も近い文字が指定領域23内に収まるように、指定領域23を移動させる(ステップ105)。ここで、文字特定部13は、指定領域の四隅のうちのいずれか1つの隅を選択する。次に、文字特定部13は、選択した隅に対応する各文字矩形の隅の中で、選択した隅に最も近い隅を抽出する。そして、文字特定部13は、選択した指定領域の隅を、抽出した文字矩形の隅に合わせるように、指定領域を移動させる。次に、文字特定部13は、移動後の指定領域内にある文字を特定し、文字認識の結果として出力する(ステップ106)。そして、本処理フローは終了する。
また、ステップ105において、選択した指定領域の隅に最も近い隅が複数抽出される場合には、指定領域の移動先の候補が複数あることになる。この場合、例えば、ステップ106では、複数の候補毎に文字認識の結果が出力される。また、例えば、移動後の指定領域内に含まれる文字数が最も多い候補を選択する等、何らかの基準で1つの候補を選択し、選択した候補に対応する文字認識の結果を出力しても良い。
次に、図8を参照しながら、「移動後の指定領域内に途切れた文字が含まれないこと」を優先する場合について説明する。ステップ201〜ステップ204の処理は、図7のステップ101〜ステップ104の処理と同様であるため、ここでは説明を省略する。
ステップ204において、各文字の文字矩形の座標情報及び指定領域の座標情報が取得された後、文字特定部13は、各文字矩形の座標情報と指定領域の座標情報とを比較して、指定領域から最も近い文字へ移動する場合の移動量を算出する(ステップ205)。ここで、文字特定部13は、指定領域の四隅のうちのいずれか1つの隅を選択する。次に、文字特定部13は、選択した隅に対応する各文字矩形の隅の中で、選択した隅に最も近い隅を抽出する。そして、文字特定部13は、選択した指定領域の隅を、抽出した文字矩形の隅に移動させる場合の移動量を算出する。
次に、文字特定部13は、算出した移動量に従って指定領域を移動させて、移動後の指定領域内に途切れた文字があるか否かを判定する(ステップ206)。移動後の指定領域内に途切れた文字がない場合(ステップ206でNo)、後述するステップ211へ移行する。一方、移動後の指定領域内に途切れた文字がある場合(ステップ206でYes)、文字特定部13は、指定領域に次に近い文字があるか否かを判定する(ステップ207)。ここで、文字特定部13は、拡張領域で認識された全ての文字のうち、ステップ205または後述するステップ208において選択されていない文字がまだ残っていれば、次に近い文字があると判定する。
ステップ207において、次に近い文字があると判定された場合(ステップ207でYes)、文字特定部13は、次に近い文字へ移動する場合の移動量を算出する(ステップ208)。ここで、文字特定部13は、ステップ205で選択した指定領域の隅に対応する、各文字矩形の隅の中で、選択した隅に対して次に近い隅を抽出する。そして、文字特定部13は、選択した指定領域の隅を、抽出した文字矩形の隅に移動させる場合の移動量を算出する。そして、ステップ206へ移行する。
一方、ステップ207において、次に近い文字がないと判定された場合(ステップ207でNo)、文字特定部13は、算出した移動量の中で最も小さい移動量を選択する(ステップ209)。ここでは、ステップ205で算出した移動量が選択される。次に、文字特定部13は、選択した移動量に従って指定領域を移動させる(ステップ210)。ステップ210の後、またはステップ206で否定の判断(No)がされた場合、文字特定部13は、移動後の指定領域内にある文字を特定し、文字認識の結果として出力する(ステップ211)。そして、本処理フローは終了する。
また、ステップ205において、選択した指定領域の隅に最も近い隅が複数抽出される場合には、指定領域の移動先の候補が複数あることになる。この場合、ステップ206では、全ての候補毎に判定が行われる。そして、全ての候補において途切れた文字が含まれる場合、ステップ206で肯定の判断(Yes)がされる。一方、途切れた文字が含まれない候補が1つでもあれば、ステップ206で否定の判断(No)がされ、途切れた文字が含まれないように指定領域の移動が行われる。ステップ208において、次に近い隅が複数抽出される場合も、同様の処理が行われる。
このように、本実施の形態に係る画像処理装置1は、指定領域を拡張した拡張領域にて認識された文字の位置と、指定領域の位置とを比較して、指定領域を移動させる。そして、画像処理装置1は、移動後の指定領域内に含まれる文字を文字認識の結果として出力する。本実施の形態に係る画像処理装置1を用いることにより、プリントずれやスキャンずれ等の位置ずれが発生したとしても、指定領域内で認識されるべき文字をより正確に特定する処理が行われる。
また、単純に指定領域を拡張した場合には、多くの文字を認識し易くなる一方で、不要な文字も認識してしまう可能性がある。本実施の形態では、指定領域を拡張して文字認識を行うが、認識された文字の位置と指定領域の位置とに基づいて指定領域の位置を調整するため、不要なオブジェクトを認識する可能性が低減される。
[実施の形態2]
次に、実施の形態2について説明する。実施の形態1では、1枚の原稿内に1つの指定領域が設けられている場合について説明した。しかし、1枚の原稿内に複数の指定領域が設けられている場合もある。
図9(a)、(b)は、1枚の原稿内に複数の指定領域が設けられている場合の一例を説明するための図である。まず、図9(a)に示す例は、プリントずれやスキャンずれ等の位置ずれが発生していない原稿の画像を示している。また、原稿に対しては、指定領域26a、指定領域26bが予め定められている。一方、図9(b)に示す例は、プリントずれやスキャンずれ等の位置ずれが発生した原稿の画像を示している。ここで、プリントずれやスキャンずれ等の位置ずれは、1枚の原稿の全体に対して生じるものであり、原稿内では位置ずれの方向や位置ずれの量は同等であるといえる。言い換えると、指定領域26a及び指定領域26bは、原稿の文字に対して同等にずれていると考えられる。
実施の形態2では、このように1枚の原稿内に複数の指定領域が設けられている場合に、文字認識の対象とする原稿にて位置ずれが発生していたとしても、指定領域内の文字をより正確に認識する手順について説明する。なお、画像処理装置1のハードウェア構成は、実施の形態1と同様である。また、本実施の形態において、実施の形態1と同様のものについては、同じ符号を付してその詳細な説明を省略する。
<指定領域内の文字を特定する処理の具体例>
図10(a)〜(c)は、複数の指定領域が設けられている場合の処理の具体例を説明するための図である。ここでは、図10(a)〜(c)を参照しながら、文字特定部13が各指定領域を移動させて、移動後の各指定領域内に存在する文字を特定する手順について説明する。図10に示す例では、図9(b)に示すような位置ずれが生じている原稿に対して文字認識が行われたものとする。具体的には、文字認識部12により、図9(b)に示す指定領域26aを拡張した拡張領域において、「あ」、「い」、「う」、「え」、「か」、「き」、「く」、「け」の8つの文字が認識されている。また、文字認識部12により、図9(b)に示す指定領域26bを拡張した拡張領域において、「さ」、「し」の2つの文字が認識されている。
ここで、文字特定部13は、実施の形態1の図5に示す処理と同様に、認識された文字を囲む文字矩形の位置情報(座標情報)を取得する。また、文字特定部13は、指定領域26a、26bの位置情報(座標情報)も取得する。
図示の例では、「あ」の文字矩形の左上の隅の座標(x,y)を(0,0)として、他の位置の座標を示している。例えば、「い」の文字矩形の左上の隅の座標は(11,0)、「う」の文字矩形の左上の隅の座標は(22,0)、「き」の文字矩形の左上の隅の座標は(11,12)、「く」の文字矩形の左上の隅の座標は(22,12)である。また、指定領域26aの左上の隅の座標は(12,6)である。
また、「さ」の文字矩形の左上の隅の座標は(40,100)、「し」の文字矩形の左上の隅の座標は(51,100)である。また、指定領域26bの左上の隅の座標は(41,106)である。
ここで、指定領域26aの左上の隅(12,6)を移動させる移動先の候補としては、例えば、「い」の文字矩形の左上の隅(11,0)、「う」の文字矩形の左上の隅(22,0)、「き」の文字矩形の左上の隅(11,12)、「く」の文字矩形の左上の隅(22,12)が考えられる。
さらに説明すると、指定領域26aの左上の隅(12,6)を(11,0)へ移動する場合の移動量は、左に「1」、上に「6」である。指定領域26aの左上の隅(12,6)を(22,0)へ移動する場合の移動量は、右に「10」、上に「6」である。指定領域26aの左上の隅(12,6)を(11,12)へ移動する場合の移動量は、左に「1」、下に「6」である。指定領域26aの左上の隅(12,6)を(22,12)へ移動する場合の移動量は、右に「10」、下に「6」である。
また、指定領域26bの左上の隅(41,106)を移動させる移動先の候補としては、例えば、「さ」の文字矩形の左上の隅(40,100)、「し」の文字矩形の左上の隅(51,100)が考えられる。指定領域26bの左上の隅(41,106)を(40,100)へ移動する場合の移動量は、左に「1」、上に「6」である。指定領域26bの左上の隅(41,106)を(51,100)へ移動する場合の移動量は、右に「10」、上に「6」である。
ここで、指定領域26aは、指定領域26aを拡張した拡張領域にて認識された文字の少なくとも1つが含まれるように移動する。また、指定領域26bは、指定領域26bを拡張した拡張領域にて認識された文字の少なくとも1つが含まれるように移動する。さらに、原稿内では等しく位置ずれが発生しているため、位置ずれを補正するためには、指定領域26a及び指定領域26bを移動させる移動量が同等になれば良いといえる。
そこで、文字特定部13は、複数の移動先の候補の中から、指定領域26a及び指定領域26bの移動量が一致するような候補を抽出する。付言すると、指定領域26a及び指定領域26bの移動量が一致するということは、指定領域26aの移動量と指定領域26bの移動量との差が、例えば数画素以内などの予め定められた範囲内である、と捉えることもできる。
具体的には、指定領域26aの左上の隅から最も近い移動先の候補は、「い」の文字矩形の左上の隅(11,0)、及び「き」の文字矩形の左上の隅(11,12)である。また、その場合の移動量はそれぞれ、左に「1」上に「6」、左に「1」下に「6」である。ここで、指定領域26bの左上の隅(41,106)を、「さ」の文字矩形の左上の隅(40,100)へ移動する場合の移動量は、左に「1」、上に「6」である。そこで、文字特定部13は、指定領域26aの左上の隅の移動先の候補として、「い」の文字矩形の左上の隅を抽出する。また、文字特定部13は、指定領域26bの左上の隅の移動先の候補として、「さ」の文字矩形の左上の隅を抽出する。
そして、文字特定部13は、図10(b)に示すように、指定領域26a、26bのそれぞれを矢印の方向に移動させる。次に、文字特定部13は、移動後の指定領域26a、26b内に存在する文字の情報を、文字認識の結果として出力する。図10(c)に示すように、移動後の指定領域26a内には、「い」、「う」の文字が存在している。また、移動後の指定領域26b内には、「さ」、「し」の文字が存在している。そのため、文字認識の結果としては、「い」、「う」の文字情報、及び「さ」、「し」の文字情報が出力される。
ここで、図10に示す例では、指定領域26aの左上の隅の移動先として、指定領域26aの左上の隅から最も近い候補を選択することとしたが、このような構成に限られるものではない。実施の形態1で説明したように、「移動後の指定領域内に途切れた文字が含まれないこと」を優先させても良い。この場合、文字特定部13は、指定領域26aの移動先の候補、指定領域26bの移動先の候補のうち、移動後の指定領域26a及び移動後の指定領域26b内に途切れた文字が含まれない候補を優先して選択する。
<移動後の指定領域内の文字を特定する処理の手順>
次に、制御部10にて指定領域を移動させて、移動後の指定領域内に存在する文字を特定する処理の手順について説明する。図11〜図13は、実施の形態2において、移動後の指定領域内に存在する文字を特定する処理の手順の一例を示すフローチャートである。ここで、図11に示す処理手順は、「指定領域の移動量が小さいこと」を優先する場合を示している。また、図12及び図13に示す処理手順は、「移動後の指定領域内に途切れた文字が含まれないこと」を優先する場合を示している。
まず、図11を参照しながら、「指定領域の移動量が小さいこと」を優先する場合について説明する。画像データ取得部11は、画像読み取り部106にて原稿上の画像を読み取って生成された画像データを取得する(ステップ301)。次に、文字認識部12は、取得した画像データにおいて、予め定められた指定領域の位置を特定する(ステップ302)。ここで、文字認識部12は、複数の指定領域の位置を特定する。次に、文字認識部12は、各指定領域を拡張した拡張領域のそれぞれで、文字認識を実行する(ステップ303)。次に、文字特定部13は、文字認識により認識された各文字の文字矩形の座標情報、及び各指定領域の座標情報を取得する(ステップ304)。
次に、文字特定部13は、複数の指定領域の中から1つの指定領域に着目する(ステップ305)。そして、文字特定部13は、各文字矩形の座標情報と着目した指定領域の座標情報とを比較して、着目した指定領域から最も近い文字へ移動する場合の移動量を算出する(ステップ306)。ここで、文字特定部13は、着目した指定領域の四隅のうちのいずれか1つの隅を選択する。次に、文字特定部13は、選択した隅に対応する各文字矩形の隅の中で、選択した隅に最も近い隅を抽出する。そして、文字特定部13は、選択した指定領域の隅を、抽出した文字矩形の隅に移動させる場合の移動量を算出する。次に、文字特定部13は、算出した移動量を記憶する(ステップ307)。ここで、図10に示す指定領域26aのように、最も近い隅が複数ある場合には、それぞれの場合の移動量が記憶される。
次に、文字特定部13は、まだ着目していない他の指定領域があるか否かを判定する(ステップ308)。他の指定領域があると判定された場合(ステップ308でYes)、ステップ305へ移行する。一方、他の指定領域がないと判定された場合(ステップ308でNo)、文字特定部13は、記憶した全ての移動量を比較する。そして、文字特定部13は、比較した移動量のうち最も数の多い移動量を1つ選択し、選択した移動量に従って各指定領域を移動させる(ステップ309)。次に、文字特定部13は、移動後の各指定領域内にある文字を特定し、文字認識の結果として出力する(ステップ310)。そして、本処理フローは終了する。
付言すると、上述したように、複数の指定領域は原稿の文字に対して同等にずれていると考えられる。そのため、ステップ309において、最も数の多い移動量を選択することにより、各指定領域における同等のずれ量が選択されることとなり、即ち、位置ずれを補正するための移動量が選択されるといえる。
次に、図12及び図13を参照しながら、「移動後の指定領域内に途切れた文字が含まれないこと」を優先する場合について説明する。ここで、図12のステップ401〜ステップ405の処理は、図11のステップ301〜ステップ305の処理と同様であるため、ここでは説明を省略する。
次に、ステップ406において、文字特定部13は、図11のステップ306と同様に、着目した指定領域から最も近い文字へ移動する場合の移動量を算出する。ここで、文字特定部13は、着目した指定領域の四隅のうちのいずれか1つの隅を選択する。次に、文字特定部13は、選択した隅に対応する各文字矩形の隅の中で、最も近い隅を抽出する。そして、文字特定部13は、選択した指定領域の隅を、抽出した文字矩形の隅に移動させる場合の移動量を算出する。
次に、文字特定部13は、算出した移動量に従って指定領域を移動させて、移動後の指定領域内に途切れた文字があるか否かを判定する(ステップ407)。移動後の指定領域内に途切れた文字がない場合(ステップ407でNo)、文字特定部13は、算出した移動量を記憶する(ステップ408)。そして、後述するステップ412へ移行する。
一方、移動後の指定領域内に途切れた文字がある場合(ステップ407でYes)、文字特定部13は、着目した指定領域に次に近い文字があるか否かを判定する(ステップ409)。ここで、文字特定部13は、着目した指定領域に対応する拡張領域で認識された全ての文字のうち、ステップ406または後述するステップ410において選択されていない文字がまだ残っていれば、次に近い文字があると判定する。
ステップ409において、次に近い文字があると判定された場合(ステップ409でYes)、文字特定部13は、次に近い文字へ移動させる場合の移動量を算出する(ステップ410)。ここで、文字特定部13は、ステップ406で選択した指定領域の隅に対応する、各文字矩形の隅の中で、選択した隅に対して次に近い隅を抽出する。そして、文字特定部13は、選択した指定領域の隅を、抽出した文字矩形の隅に移動させる場合の移動量を算出する。そして、ステップ407へ移行する。
一方、ステップ409において、次に近い文字がないと判定された場合(ステップ409でNo)、文字特定部13は、着目した指定領域に関して算出した移動量の中で、最も小さい移動量を記憶する(ステップ411)。
ステップ408またはステップ411の後、文字特定部13は、まだ着目していない他の指定領域があるか否かを判定する(ステップ412)。他の指定領域があると判定された場合(ステップ412でYes)、ステップ405へ移行する。
一方、他の指定領域がないと判定された場合(ステップ412でNo)、文字特定部13は、記憶した全ての移動量を比較する。そして、文字特定部13は、比較した移動量のうち最も数の多い移動量を選択し、選択した移動量に従って各指定領域を移動させる(ステップ413)。次に、文字特定部13は、移動後の各指定領域内にある文字を特定し、文字認識の結果として出力する(ステップ414)。そして、本処理フローは終了する。
また、ステップ406において、選択した指定領域の隅に最も近い隅が複数抽出される場合には、指定領域の移動先の候補が複数あることになる。この場合、ステップ407では、全ての候補毎に判定が行われる。そして、全ての候補について途切れた文字が含まれる場合、ステップ407で肯定の判断(Yes)がされる。一方、途切れた文字が含まれない候補が1つでもあれば、ステップ407で否定の判断(No)がされ、ステップ408では、途切れた文字が含まれない候補についての移動量が記憶される。ステップ410において、次に近い隅が複数抽出される場合も、同様の処理が行われる。
このように、本実施の形態に係る画像処理装置1は、1枚の原稿内に複数の指定領域が設けられている場合に、複数の指定領域の移動量が一致するように各指定領域を移動させる。本実施の形態に係る画像処理装置1を用いることにより、例えば、指定領域の移動に際して1つの指定領域の情報のみを用いる構成と比較して、より正確に、位置ずれの補正が行われて指定領域内の文字が特定されることとなる。
また、実施の形態1及び実施の形態2では、矩形の指定領域を用いたが、指定領域としては矩形に限定されるものではない。指定領域は、文字矩形が収まるように、矩形を組み合わせた形状であれば良く、例えば、大きさの異なる2つの矩形を上下に組み合わせたような形状であっても良い。この場合、文字特定部13は、例えば、指定領域の1つの隅を選択して、選択した隅に最も近い文字矩形の隅に合わせるように、指定領域を移動させる。また、文字特定部13は、移動後の指定領域内に途切れた文字が含まれないように、指定領域を移動させても良い。
また、実施の形態1及び実施の形態2では、画像処理装置1にて指定領域内の文字を特定する処理を行うこととしたが、画像処理装置1から不図示の通信回線を介して例えばサーバ装置(不図示)へ画像データを送信し、サーバ装置にて、指定領域内の文字を特定するようにしても良い。この場合、サーバ装置は、情報処理装置の一例として捉えることができる。
また、本発明の実施の形態を実現するプログラムは、通信手段により提供することはもちろん、CD−ROM等の記録媒体に格納して提供することも可能である。
なお、本発明を実施の形態を用いて説明したが、本発明の技術的範囲は上記実施の形態には限定されない。本発明の精神及び範囲から逸脱することなく様々に変更したり代替態様を採用したりすることが可能なことは、当業者に明らかである。
1…画像処理装置、10…制御部、11…画像データ取得部、12…文字認識部、13……文字特定部、106…画像読み取り部

Claims (8)

  1. 原稿に形成された画像の画像情報を取得する取得手段と、
    前記取得手段により取得された前記画像情報から、前記原稿上にて指定された領域である指定領域を拡張した拡張領域内に存在する文字を認識し、認識した文字の少なくとも1つが当該指定領域内に含まれるように当該指定領域を移動させる移動手段と、
    前記移動手段による移動後の前記指定領域内に含まれる文字の情報を出力する出力手段と
    を備える情報処理装置。
  2. 前記移動手段は、移動後の前記指定領域内に途切れた文字が含まれないように、当該指定領域を移動させること
    を特徴とする請求項1に記載の情報処理装置。
  3. 前記移動手段は、移動後の前記指定領域内に途切れた文字が含まれないように当該指定領域を移動させる場合に、当該指定領域の移動量が最も小さくなるようにすること
    を特徴とする請求項2に記載の情報処理装置。
  4. 前記指定領域は矩形であり、また、前記拡張領域にて認識された文字には、当該文字を囲む矩形である文字矩形が文字毎に設定され、
    前記移動手段は、前記指定領域の四隅のうちのいずれか1つの第1の隅を、当該第1の隅に対応する各文字矩形の隅の中で当該第1の隅から最も近い第2の隅に合わせるように、当該指定領域を移動させること
    を特徴とする請求項1に記載の情報処理装置。
  5. 前記移動手段は、前記指定領域の移動において、当該指定領域の四隅のそれぞれを、各文字矩形の隅に順番に移動させて、移動後の当該指定領域内に途切れた文字が含まれるか否かを判定すること
    を特徴とする請求項4に記載の情報処理装置。
  6. 前記移動手段は、原稿内に前記指定領域が複数ある場合に、それぞれの当該指定領域を拡張した拡張領域内の文字を認識し、認識した文字の少なくとも1つが各指定領域内に含まれるとともに各指定領域の移動量の差が予め定められた範囲内になるように、複数の当該指定領域を移動させること
    を特徴とする請求項1に記載の情報処理装置。
  7. 原稿に形成された画像を読み取る画像読み取り手段と、
    前記画像読み取り手段により得られた画像情報から、前記原稿上にて指定された領域である指定領域を拡張した拡張領域内に存在する文字を認識し、認識した文字の少なくとも1つが当該指定領域内に含まれるように当該指定領域を移動させる移動手段と、
    前記移動手段による移動後の前記指定領域内に含まれる文字の情報を出力する出力手段と
    を備える画像読み取り装置。
  8. コンピュータに、
    原稿に形成された画像の画像情報を取得する機能と、
    取得された前記画像情報から、前記原稿上にて指定された領域である指定領域を拡張した拡張領域内に存在する文字を認識し、認識した文字の少なくとも1つが当該指定領域内に含まれるように当該指定領域を移動させる機能と、
    移動後の前記指定領域内に含まれる文字の情報を出力する機能と
    を実現させるためのプログラム。
JP2015224318A 2015-11-16 2015-11-16 情報処理装置、画像読み取り装置及びプログラム Active JP6696155B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2015224318A JP6696155B2 (ja) 2015-11-16 2015-11-16 情報処理装置、画像読み取り装置及びプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2015224318A JP6696155B2 (ja) 2015-11-16 2015-11-16 情報処理装置、画像読み取り装置及びプログラム

Publications (2)

Publication Number Publication Date
JP2017091419A true JP2017091419A (ja) 2017-05-25
JP6696155B2 JP6696155B2 (ja) 2020-05-20

Family

ID=58767987

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2015224318A Active JP6696155B2 (ja) 2015-11-16 2015-11-16 情報処理装置、画像読み取り装置及びプログラム

Country Status (1)

Country Link
JP (1) JP6696155B2 (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110390323A (zh) * 2018-04-18 2019-10-29 富士施乐株式会社 信息处理装置以及计算机可读介质
WO2020045039A1 (ja) * 2018-08-27 2020-03-05 京セラドキュメントソリューションズ株式会社 Ocrシステム

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH07160809A (ja) * 1993-12-08 1995-06-23 Nec Corp Ocr装置
JP2005043995A (ja) * 2003-07-23 2005-02-17 Ricoh Co Ltd 情報処理装置、文字認識プログラム及び記録媒体
JP2005275950A (ja) * 2004-03-25 2005-10-06 Canon Inc 画像処理装置、画像処理方法、プログラム及び記憶媒体
JP2006146741A (ja) * 2004-11-24 2006-06-08 Hitachi Computer Peripherals Co Ltd 印字データ読取り方法
JP2010231541A (ja) * 2009-03-27 2010-10-14 Oki Electric Ind Co Ltd 情報処理装置、文字認識方法、およびプログラム

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH07160809A (ja) * 1993-12-08 1995-06-23 Nec Corp Ocr装置
JP2005043995A (ja) * 2003-07-23 2005-02-17 Ricoh Co Ltd 情報処理装置、文字認識プログラム及び記録媒体
JP2005275950A (ja) * 2004-03-25 2005-10-06 Canon Inc 画像処理装置、画像処理方法、プログラム及び記憶媒体
JP2006146741A (ja) * 2004-11-24 2006-06-08 Hitachi Computer Peripherals Co Ltd 印字データ読取り方法
JP2010231541A (ja) * 2009-03-27 2010-10-14 Oki Electric Ind Co Ltd 情報処理装置、文字認識方法、およびプログラム

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110390323A (zh) * 2018-04-18 2019-10-29 富士施乐株式会社 信息处理装置以及计算机可读介质
JP2019192959A (ja) * 2018-04-18 2019-10-31 富士ゼロックス株式会社 情報処理装置及びプログラム
JP7031465B2 (ja) 2018-04-18 2022-03-08 富士フイルムビジネスイノベーション株式会社 情報処理装置及びプログラム
CN110390323B (zh) * 2018-04-18 2023-09-05 富士胶片商业创新有限公司 信息处理装置以及计算机可读介质
WO2020045039A1 (ja) * 2018-08-27 2020-03-05 京セラドキュメントソリューションズ株式会社 Ocrシステム
JPWO2020045039A1 (ja) * 2018-08-27 2021-08-12 京セラドキュメントソリューションズ株式会社 Ocrシステム
JP7176566B2 (ja) 2018-08-27 2022-11-22 京セラドキュメントソリューションズ株式会社 Ocrシステム
US11972197B2 (en) 2018-08-27 2024-04-30 Kyocera Document Solutions Inc. OCR system

Also Published As

Publication number Publication date
JP6696155B2 (ja) 2020-05-20

Similar Documents

Publication Publication Date Title
US11295415B2 (en) Image forming apparatus, scanned image correction method thereof, and non-transitory computer-readable recording medium
JP6665498B2 (ja) 情報処理装置、画像処理システム及びプログラム
US10013606B2 (en) Image processing apparatus, non-transitory computer readable medium, and image processing method
JP2010034683A (ja) 画像処理装置及びプログラム
US10810383B2 (en) Image processing apparatus for comparing documents in different languages
JP6665595B2 (ja) 文字認識装置、方法およびプログラム
JP2022074466A (ja) 画像処理装置および画像形成装置
JP2017151493A (ja) 画像処理装置、画像読み取り装置及びプログラム
US10075614B2 (en) Image processing apparatus and non-transitory computer readable medium
US20180260363A1 (en) Information processing apparatus and non-transitory computer readable medium storing program
JP2018025885A (ja) 画像処理装置
JP6696155B2 (ja) 情報処理装置、画像読み取り装置及びプログラム
JP2017174030A (ja) 画像処理装置及び画像処理プログラム
JP2021077332A (ja) 情報処理装置、サーバ、システム、情報処理方法、およびプログラム
US10902223B2 (en) Image processing apparatus
US20190327389A1 (en) Image forming apparatus and non-transitory computer-readable storage medium suitable for extracting areas in images specified by handwritten marker by line marker such as highlighter pen or the like, and electronic marker by digital pen
US20210097271A1 (en) Character recognition using previous recognition result of similar character
JP2008040598A (ja) 画像入力装置
JP2006235786A (ja) 画像処理装置、および画像処理方法、並びにコンピュータ・プログラム
JP5673277B2 (ja) 画像処理装置およびプログラム
JP6639257B2 (ja) 情報処理装置及びその制御方法
JP2007011528A (ja) Ocr処理における認識対象項目の位置探索方法
WO2022097408A1 (ja) 画像処理装置及び画像形成装置
JP2018116424A (ja) 画像処理装置及びプログラム
US10484557B2 (en) Image processing apparatus and non-transitory computer readable medium for addition of different image data to acquired image data

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20181022

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20190906

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20190917

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20191114

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20200324

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20200406

R150 Certificate of patent or registration of utility model

Ref document number: 6696155

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

S533 Written request for registration of change of name

Free format text: JAPANESE INTERMEDIATE CODE: R313533

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350