JP2019193022A - 情報処理装置及びプログラム - Google Patents

情報処理装置及びプログラム Download PDF

Info

Publication number
JP2019193022A
JP2019193022A JP2018081778A JP2018081778A JP2019193022A JP 2019193022 A JP2019193022 A JP 2019193022A JP 2018081778 A JP2018081778 A JP 2018081778A JP 2018081778 A JP2018081778 A JP 2018081778A JP 2019193022 A JP2019193022 A JP 2019193022A
Authority
JP
Japan
Prior art keywords
area
size
information
rectangular area
image
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2018081778A
Other languages
English (en)
Inventor
清水 淳一
Junichi Shimizu
淳一 清水
茜 阿部
Akane Abe
茜 阿部
和宏 大谷
Kazuhiro Otani
和宏 大谷
小林邦彦
Kunihiko Kobayashi
邦彦 小林
岡田 茂
Shigeru Okada
茂 岡田
真太郎 安達
Shintaro Adachi
真太郎 安達
山口 聡之
Satoyuki Yamaguchi
聡之 山口
慎也 中村
Shinya Nakamura
慎也 中村
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujifilm Business Innovation Corp
Original Assignee
Fuji Xerox Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fuji Xerox Co Ltd filed Critical Fuji Xerox Co Ltd
Priority to JP2018081778A priority Critical patent/JP2019193022A/ja
Priority to US16/354,225 priority patent/US20190325245A1/en
Publication of JP2019193022A publication Critical patent/JP2019193022A/ja
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/40Document-oriented image-based pattern recognition
    • G06V30/41Analysis of document content
    • G06V30/414Extracting the geometrical structure, e.g. layout tree; Block segmentation, e.g. bounding boxes for graphics or text
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/20Image preprocessing
    • G06V10/22Image preprocessing by selection of a specific region containing or referencing a pattern; Locating or processing of specific regions to guide the detection or recognition
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/20Image preprocessing
    • G06V10/24Aligning, centring, orientation detection or correction of the image
    • G06V10/243Aligning, centring, orientation detection or correction of the image by compensating for image skew or non-uniform image deformations

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Computer Graphics (AREA)
  • Geometry (AREA)
  • Artificial Intelligence (AREA)
  • Editing Of Facsimile Originals (AREA)

Abstract

【課題】読取対象の画像から読取対象と異なるサイズの領域が切り出される場合であっても、読取対象を認識することが可能な情報処理装置及びプログラムを提供する。【解決手段】情報処理装置2は、予め定められたサイズを有する読取対象が含まれる画像からオブジェクト情報を抽出する抽出手段と、画像から読取対象の少なくとも一部を含む第1の領域を切り出す切り出し手段と、切り出し手段が切り出した第1の領域が予め定められたサイズと異なるサイズを有するとき、第1の領域から画像の背景色と異なる背景色を有する領域が含まれるように、第1の領域を変更する変更手段と、を備える。【選択図】図2

Description

本発明は、情報処理装置及びプログラムに関する。
近年、名刺やカード等の小紙片を読み取り画像化する情報処理装置が提案されている(例えば、特許文献1参照。)。
特許文献1に記載された情報処理装置は、画像中の図形の輪郭線を抽出する輪郭抽出手段と、前記輪郭抽出手段で抽出された輪郭線を構成する最長の直線を長辺とし、該輪郭線の全てを領域内に含む矩形領域の各頂点の座標を抽出する頂点抽出手段と、前記頂点抽出手段で抽出された座標に基づいて前記画像から矩形画像を切り出す画像切出手段と、前記画像切出手段で切り出された矩形画像を直立させる直立補正手段と、前記直立補正手段で直立させた矩形画像の天地を判定し、該判定結果に応じて該矩形画像を正方向に回転させる天地判定手段とを具備する。
特開第2013−26839号公報
本発明の課題は、読取対象の画像から読取対象と異なるサイズの領域が切り出される場合であっても、読取対象を認識することが可能な情報処理装置及びプログラムを提供することにある。
[1]予め定められたサイズを有する読取対象が含まれる画像からオブジェクト情報を抽出する抽出手段と、前記画像から前記読取対象の少なくとも一部を含む第1の領域を切り出す切り出し手段と、前記切り出し手段が切り出した前記第1の領域が前記予め定められたサイズと異なるサイズを有するとき、前記第1の領域から前記画像の背景色と異なる背景色を有する領域が含まれるように前記第1の領域を変更する変更手段と、を備える情報処理装置。
[2]前記変更手段は、前記第1の領域を基点として前記オブジェクト情報が含まれるように、前記第1の領域を変更する、前記[1]に記載の情報処理装置。
[3]前記変更手段は、前記第1の領域が前記予め定められたサイズよりも小さいサイズを有するとき、前記第1の領域を基点として前記オブジェクト情報が含まれるように、前記第1の領域を拡張する、前記[1]又は[2]に記載の情報処理装置。
[4]前記画像が複数の前記読取対象を含む場合に、前記切り出し手段は、前記複数の読取対象ごとに複数の第1の領域を切り出し、前記変更手段は、前記複数の第1の領域のうち複数の第1の領域が前記予め定められたサイズと異なるサイズを有するとき、前記複数の第1の領域からそれぞれ拡張された領域同士が互いに重ならないように前記複数の第1の領域をそれぞれ拡張する、前記[3]に記載の情報処理装置。
[5]前記変更手段は、前記画像において前記複数の第1の領域に対してそれぞれ予め定められた方向に位置する前記オブジェクト情報を含むように、前記複数の第1の領域をそれぞれ拡張する、前記[4]に記載の情報処理装置。
[6]前記変更手段は、前記第1の領域が前記予め定められたサイズよりも大きいサイズを有するとき、前記第1の領域を基点として前記オブジェクト情報が含まれるように、前記第1の領域を第2の領域に縮小する、前記[1]から[5]のいずれか1つに記載の情報処理装置。
[7]前記変更手段は、縮小前に係る前記第1の領域から前記第2の領域を除いた第3の領域が前記予め定められたサイズよりも大きいサイズを有するとき、前記第3の領域を基点として前記オブジェクト情報が含まれるように、前記第3の領域を第4の領域に縮小する、前記[6]に記載の情報処理装置。
[8]コンピュータを、予め定められたサイズを有する読取対象が含まれる画像からオブジェクト情報を抽出する抽出手段と、前記画像から前記読取対象の少なくとも一部を含む第1の領域を切り出す切り出し手段と、前記切り出し手段が切り出した前記第1の領域が前記予め定められたサイズと異なるサイズを有するとき、前記第1の領域から前記画像の背景色と異なる背景色を有する領域が含まれるように、前記第1の領域を変更する変更手段として機能させるプログラム。
請求項1、2、8に係る発明によれば、読取対象の画像から読取対象のサイズと異なるサイズの領域が切り出されるような場合であっても、読取対象を認識することが可能になる。
請求項3に係る発明によれば、読取対象の画像から読取対象のサイズよりも小さいサイズの領域が切り出されるような場合であっても、読取対象を認識することが可能になる。
請求項4、5に係る発明によれば、読取対象の画像に複数の読取対象の画像が含まれる場合において読取対象の画像から読取対象のサイズよりも小さいサイズの領域が切り出される場合であっても、それぞれの読取対象を個別に認識することが可能になる。
請求項6に係る発明によれば、読取対象の画像から読取対象のサイズよりも大きいサイズの領域が切り出されるような場合であっても、読取対象を認識することが可能になる。
請求項7に係る発明によれば、複数の読取対象が含まれる領域が切り出されるような場合であっても、それぞれの読取対象を個別に切り出すことが可能になる。
図1は、本発明の第1の実施の形態に係る情報処理システムの構成の一例を示す図である。 図2は、図1に示す情報処理装置の制御系の一例を示すブロック図である。 図3(a)〜(c)は、読取画像の一例を示す図である。 図4(a)〜(h)は、候補領域の一例を示す図である。 図5は、領域情報テーブルの一例を示す図である。 図6は、第1の実施の形態に係る情報処理装置の動作の一例を示すフローチャートである。 図7(a)〜(c)は、読取画像の一例を示す図である。 図8は、本発明の第2の実施の形態に係る情報処理装置の動作の一例を示すフローチャートである。 図9は、第2の矩形領域の変形例を示す図である。 図10(a)〜(h)は、候補領域の一例を示す図である。 図11は、第3及び第4の矩形領域の一例を示す図である。 図12は、本発明の第3の実施の形態に係る情報処理装置の動作の一例を示すフローチャートである。 図13(a),(b)は、読取画像の一例を示す図である。
以下、本発明の実施の形態について図面を参照して説明する。なお、各図中、実質的に同一の機能を有する構成については、同一の符号を付してその重複した説明を省略する。
[実施の形態の要約]
本実施の形態に係る情報処理装置は、予め定められたサイズを有する読取対象が含まれる画像からオブジェクト情報を抽出する抽出手段と、画像から読取対象の少なくとも一部を含む第1の領域を切り出す切り出し手段と、切り出し手段が切り出した第1の領域が予め定められたサイズと異なるサイズを有するとき、第1の領域から画像の背景色と異なる背景色を有する領域が含まれるように、第1の領域を変更する変更手段と、を備える。
情報処理装置は、例えば、複合機、スキャナ等の画像形成装置、パーソナルコンピュータ、多機能携帯電話機(スマートフォン)等が該当する。
読取対象は、予め定められたサイズを有する対象物である。読取対象には、たとえ名刺、運転免許証、社員証、IDカード、パスポート等の個人認証媒体や、クレジットカード、キャッシュカード、プリペイドカード等の取引媒体、伝票などの帳票やレシート等の定型サイズの紙媒体が含まれる。読取対象は、主に長方形を有しているものであるが、正方形を有しているものでもよく、その他の多角形状を有しているもの、あるいは曲線を含む形状を有しているものでもよい。また、読取対象には、4つの角部が丸く形成されているものも含まれる。
「オブジェクト情報」とは、読取対象を構成する構成要素の特徴を示す情報をいう。オブジェクト情報には、例えば、文字情報、図形情報、表情報等、及びこれらの画像における位置を示す位置情報が含まれる。
「第1の領域から画像の背景色と異なる背景色を有する領域が含まれるように、第1の領域を変更する」には、例えば、第1の領域を基点としてオブジェクト情報が含まれるように第1の領域を変更すること(例えば、第1の領域の拡張や縮小)や、分割された複数の領域を含まれるように第1の領域を変更することが含まれる。
[第1の実施の形態]
図1は、本発明の第1の実施の形態に係る情報処理システムの構成の一例を示す図である。図1に示すように、情報処理システム1は、情報処理装置2と、この情報処理装置2とネットワーク5を介して接続する端末装置3及び外部装置4とを有して構成されている。
端末装置3には、例えば、パーソナルコンピュータ、タブレット型端末、多機能携帯電話機(スマートフォン)等を用いることができる。外部装置4には、例えば、パーソナルコンピュータ、サーバ装置等が含まれる。ネットワーク5は、例えば、ローカルエリアネットワーク(LAN)、ワイドエリアネットワーク(WAN)、インターネット、イントラネット等であり、有線でも無線でもよい。
(情報処理装置2の構成)
図2は、図1に示す情報処理装置2の制御系の一例を示すブロック図である。以下、情報処理装置2として画像形成装置を例に挙げて説明するが、情報処理装置2は画像形成装置に限られない。この情報処理装置2は、各部を制御する制御部20と、各種のデータを記憶する記憶部21と、情報の入力及び表示を行う操作表示部23と、読取対象を読み取る画像読取部24と、端末装置3及び外部装置4との間でネットワーク5を介して通信する通信部25とを備える。
制御部20は、CPU(Central Processing Unit)、インターフェース等から構成されている。CPUは、記憶部21に記憶されたプログラム210に従って動作することにより、受付手段200、レイアウト解析手段201、分離処理手段202、変形手段203、傾き補正手段204、表示制御手段205等として機能する。変形手段203は、変更手段の一例である。レイアウト解析手段201は、抽出手段の一例である。分離処理手段202は、切り出し手段の一例である。各手段200〜205の詳細については後述する。
記憶部21は、ROM(Read Only Memory)、RAM(Random Access Memory)、ハードディスク等から構成され、プログラム210、領域情報テーブル211、サイズ情報212等の各種データを記憶する。領域情報テーブル211の詳細については後述する。サイズ情報212は、読取対象のサイズを示す情報である。読取対象のサイズは、予め定められたサイズの一例である。
操作表示部23は、例えば、タッチパネルディスプレイであり、液晶ディスプレイ等のディスプレイにタッチパネルを重合配置した構成を有する。
画像読取部24は、読取対象を光学的に読み取った読取対象の画像(以下、「読取画像」ともいう。)を形成する。通信部25は、ネットワーク5を介して、端末装置3及び外部装置4との間で信号を送受信する。
次に、制御部20の各手段200〜205の詳細について、図3及び図4を参照して説明する。図3(a)〜(c)は、読取画像の一例を示す図である。以下、読取対象6として長方形の定型サイズを有する名刺を例に挙げて説明する。また、読取画像7に1つの読取対象6が含まれる場合を例に挙げて説明する。なお、図3(a)〜(c)では、説明の便宜上、読取画像7に対して読取対象6を大きく描いているが、実際の読取画像7及び読取対象6の大きさの関係は、図3(a)〜(c)に示す例に限られない。
受付手段200は、画像読取部24が読み取った読取画像7を受け付ける。レイアウト解析手段201は、受付手段200が受け付けた読取画像7に含まれる読取対象6の特徴を示すオブジェクト情報60を抽出する(以下、「レイアウト解析」ともいう。)。ここで、オブジェクト情報60とは、文字情報、図形情報、表情報や、これら文字情報及び図形情報の位置を示す位置情報をいう。レイアウト解析には、例えば、読取画像7に対してOCR(Optical Character Recognition)を実行することにより読取対象6に含まれる文字情報等を取得する文字解析や、読取対象6を構成する構成要素の形状を特定する形状解析等が含まれる。
文字情報とは、文字の属性(大きさ、文字種等)を示す情報の他、文字の位置を示す情報をいう。文字情報には、例えば、会社名や部署名等の所属情報、役職、肩書、氏名等の個人情報、電話番号、FAX番号、メールアドレス、会社の住所等の連絡先情報等が含まれる。
図形情報とは、図形そのものを示す情報、図形や文字を含んで図案化されたものを示す情報、及びこれらの位置を示す情報をいう。図形情報には、例えば、商号や団体名を示すロゴマーク、キャッチコピーやスローガンを含む図形、登録されている資格や認定されている規格を示すシンボルマーク、所持者等を示す写真や似顔絵等が含まれる。なお、読取対象6そのものの形状を示す情報は、図形情報に含まれない。表情報とは、表を示す情報、及びその位置を示す情報をいう。
図3(a)は、オブジェクト情報60が抽出された読取画像7の一例を示す図である。レイアウト解析手段201は、図3(a)に示すように、例えば、オブジェクト情報60としての所属情報60a、URLを示すURL情報60b、氏名を示す氏名情報60c、会社の住所を示す住所情報60d等を抽出する。
また、レイアウト解析手段201は、読取画像7をレイアウト解析して抽出したオブジェクト情報60と、このオブジェクト情報60に対応する領域の位置情報とを関連付けて記憶部21の領域情報テーブル211に記憶する。オブジェクト情報60に対応する領域は、例えば、矩形状の領域とすることができる(図3(a)の各四角形枠参照)。
分離処理手段202は、受付手段200が受け付けた読取画像7から読取対象6の少なくとも一部を含む領域を切り出す。
具体的には、分離処理手段202は、読取画像7から読取対象6のエッジを検出して、読取対象6の輪郭線6aを抽出する処理(以下、「エッジ強調処理」ともいう。)を行う。また、分離処理手段202は、抽出した読取対象6の輪郭線6aに基づいて、読取対象6に番号(不図示)を採番するラベリング処理を行う。さらに、分離処理手段202は、ラベリング処理の結果に基づいて領域を切り出す切り出し処理を行う。これらエッジ強調処理、ラベリング処理及び切り出し処理には、公知のアルゴリズムを用いてよい。なお、以下では、分離処理手段202は、読取対象6の形状に応じて、読取画像7の頂点のうち少なくとも1つの頂点を頂点とする矩形領域61(以下、「第1の矩形領域61」ともいう。)を切り出す場合を例に挙げて説明する。第1の矩形領域61は、第1の領域の一例である。
図3(b)は、第1の矩形領域61の一例を模式的に示す図3(a)の拡大図である。分離処理手段202は、図3(b)に示すように、読取画像7から第1の矩形領域61(図3(b)の太破線枠参照)を切り出す。図3(b)に示す例では、第1の矩形領域61は、読取対象6のサイズよりも小さいサイズを有している。そのため、読取対象6の一部は、第1の矩形領域61から外れている。すなわち、第1の矩形領域61は、読取対象6の一部のみを含んでいる。なお、図3(b)の細破線枠は、読取対象6の外縁を示している(図3(a)の6aに相当する。)。
変形手段203は、分離処理手段202により切り出された第1の矩形領域61のサイズを求め、記憶部21のサイズ情報212から読取対象6のサイズを取得して、この第1の矩形領域61のサイズと読取対象6のサイズとを比較する。第1の矩形領域61のサイズが読取対象6のサイズと異なるとき、変形手段203は、この第1の矩形領域62を基点としてレイアウト解析手段201が抽出したオブジェクト情報60が含まれるように、この第1の矩形領域61を矩形領域62(以下、「第2の矩形領域62」ともいう。)に変形する。第2の矩形領域62は、第1の領域を基点として拡張された拡張後の領域の一例である。
なお、「サイズが異なる」とは、第1の矩形領域61のサイズと読取対象6のサイズとの差分が予め定められた特定の値以上であることをいい、「サイズが全く同じでない」ことを意味するものではない。また、「サイズが異ならない」とは、「サイズが全く同じである」ことを意味するものではない。
好ましくは、第2の矩形領域62は、読取対象6のサイズと略同一のサイズを有する。このようにすることにより、分離処理手段202により切り出されず第1の矩形領域61から外れた読取対象6の一部を第2の矩形領域62でカバーされる。なお、略同一のサイズは、「全く同じサイズ」に限定されるものではなく、例えば、対領域に応じた画素の数が数個のみしか異ならない場合も含む。
具体的には、第1の矩形領域61のサイズが読取対象6のサイズよりも小さいとき、変形手段203は、オブジェクト情報60が含まれるように、第1の矩形領域61を読取対象6のサイズと略同一のサイズを有する第2の矩形領域62に拡張する。なお、「サイズよりも小さい」とは、第1の矩形領域61のサイズと読取対象6のサイズとの差分が予め定められた特定の値以上であることをいい、第1の矩形領域61のサイズと読取対象6のサイズとの差分が特定の微小な値未満であることを意味するものではない。
図3(c)は、第2の矩形領域62の一例を模式的に示す図3(a)の拡大図である。図3(c)に示すように、例えば、第1の矩形領域61のサイズが読取対象6のサイズよりも小さいとき(図3(b)参照)、変形手段203は、第1の矩形領域61を第2の矩形領域62(図3(c)の一点鎖線枠参照)に拡張する。
また、変形手段203は、第2の矩形領域62の縁部62aによってオブジェクト情報60が分断されず、かつ、抽出されたオブジェクト情報60が過不足なく含まれるように第1の矩形領域61を第2の矩形領域62に拡張する。一例として、変形手段203は、第2の矩形領域62の候補となる少なくとも1つ以上の矩形状の領域(以下、「候補領域」ともいう。)から特定の候補領域を選択して第2の矩形領域62とし、第1の矩形領域61をこの選択された第2の矩形領域62に拡張する。
図4(a)〜(h)は、候補領域の一例を示す図である。具体的には、変形手段203は、図4(a)〜(h)に示すように、第2の矩形領域62の候補として、第1の矩形領域61の4つの頂点のうちいずれかの頂点を1つの基準点621とし、第1の矩形領域61を含むように囲まれた8つの候補領域620A〜620H(図4各図の一点鎖線枠参照。)を用意し、この8つの候補領域620A〜620Hの中から、オブジェクト情報60を分断せずにオブジェクト情報60を過不足なく含むものを選択して第2の矩形領域62とし、第1の矩形領域61をこの選択された第2の矩形領域62に拡張する。すなわち、変形手段203は、第1の矩形領域61を基点として第1の矩形領域61を第2の矩形領域62に変形する。
なお、変更手段は、画像読取部から読み取られた読取対象の少なくとも一部を含む第一の領域を拡張または縮小するだけでなく、第一の領域の頂点を変更することも含む。
図4各図に示す例では、図4(a)の候補領域620A、図4(c)の候補領域620C、図4(f)の候補領域620F、及び図4(g)の候補領域620Gは、一部のオブジェクト情報60が含まれない場合の一例である。また、図4(b)の候補領域620B、及び図4(e)の候補領域620Eは、各候補領域620B,620Eの縁部620Ba,620Eaによってオブジェクト情報60が分断される場合の一例である。図4(d)の候補領域620D、及び図4(h)の候補領域620Hは、オブジェクト情報60を分断せずにオブジェクト情報60を全て含む場合の一例である。変形手段203は、図4(d)の候補領域620D又は図4(h)の候補領域620Hを選択して第2の矩形領域62とする。
なお、図4各図において、太破線枠は、第1の矩形領域61を示し、細破線枠は、読取対象6の外縁を示す。また、説明の便宜上、第2の矩形領域62を示す一点鎖線枠の一部の辺が第1の矩形領域61を示す太破線枠よりも外側に位置するように描いているが、実際の一点鎖線枠は、太破線枠に重なってもよい。
なお、変形手段203は、領域情報テーブル211に記録されたオブジェクト情報60の位置情報と、候補領域620A〜620Hの位置情報とを照合することにより、候補領域620A〜620Hの縁部620Aa〜620Haがオブジェクト情報60を分断するか否か、及び抽出されたオブジェクト情報60の全てが候補領域620A〜620Hのうちいずれの候補領域に含まれるか否かを判定する。
傾き補正手段204は、第1の矩形領域61や第2の矩形領域62の傾きの程度を示す量(以下、「スキュー量」ともいう。)を求め、このスキュー量に基づいて第1の矩形領域61や第2の矩形領域62を回転して第1の矩形領域61や第2の矩形領域62の傾きを補正する(以下、「スキュー補正」ともいう。)。
表示制御手段205は、操作表示部23の表示面(不図示)に、読取画像7、第1の矩形領域61、第2の矩形領域62等を含む画面を表示するよう制御する。
(領域情報テーブル211の構成)
図5は、領域情報テーブル211の一例を示す図である。領域情報テーブル211には、読取画像7から抽出されたオブジェクト情報60に対応する領域(以下、単に「領域」ともいう。)の位置を示す位置情報と各領域に含まれる文字情報や図形情報とが関連付けて記憶されている。領域情報テーブル211には、例えば、「領域名称」欄と、「領域座標」欄と、「内容情報」欄とが設けられている。
「領域名称」欄には、抽出された領域の名称が記録されている。「領域座標」欄には、領域を示す座標として、例えば、領域の左上の頂点の座標及び右下の頂点の座標が記録されている。なお、「領域座標」欄には、領域の位置情報として、領域の特定の頂点の座標値と領域の高さ及び幅とが記載されていてもよい。「内容情報」欄には、当該領域に含まれる文字情報又は図面情報が記録されている。なお、本明細書において、テーブルに情報を書き込む場合に「記録」を用い、記憶部21に情報を書き込む場合に「記憶」を用いる。
(第1の実施の形態の動作)
次に、情報処理装置2の動作の一例について図3及び図6を参照して説明する。図6は、情報処理装置2の動作の一例を示すフローチャートである。画像読取部24は、読取対象6を読み取り(S1)、図3(a)〜(c)に示すように、読取画像7を形成し、読取画像7を制御部20の受付手段200に渡す。
受付手段200は、画像読取部24が読み取った読取画像7を受け付ける(S2)。次に、レイアウト解析手段201は、図3(a)に示すように、読取画像7に含まれる読取対象6のオブジェクト情報60を抽出する(S3)。また、レイアウト解析手段201は、抽出したオブジェクト情報60を、このオブジェクト情報60に対応する領域の位置情報と関連付けて記憶部21の領域情報テーブル211に記録する(S4)。
次に、分離処理手段202は、図3(b)に示すように、読取画像7にエッジ強調処理、ラベリング処理及び切り出し処理等を施し、読取対象6の少なくとも一部を含む第1の矩形領域61を切り出す(S5)。
次に、変形手段203は、分離処理手段202により切り出られた第1の矩形領域61のサイズを求め、記憶部21に記憶されたサイズ情報212から読取対象6のサイズを取得し、この第1の矩形領域61のサイズと読取対象6のサイズとを比較する(S6)。
第1の矩形領域61のサイズが読取対象6のサイズと異なる場合(S6:Yes)、変形手段203は、図3(c)に示すように、第1の矩形領域61を、オブジェクト情報60を分断せずにオブジェクト情報60を全て含むように第2の矩形領域62に変形する(S7)。具体的には、第1の矩形領域61のサイズが読取対象6のサイズよりも小さい場合、変形手段203は、図3(c)に示すように、第1の矩形領域61を第2の矩形領域62に拡張する。
傾き補正手段204は、第2の矩形領域62のスキュー補正を行う(S8)。表示制御手段205は、スキュー補正後の第2の矩形領域62を操作表示部23の表示面に表示するよう制御する(S9)。
第1の矩形領域61のサイズが読取対象6のサイズと異ならない場合(S6:Yes)、傾き補正手段204は、第1の矩形領域61のスキュー補正を行う(S10)。表示制御手段205は、スキュー補正後の第1の矩形領域61を操作表示部23の表示面に表示するよう制御する(S11)。
以上のようにして、例えば、読取対象6の一部の地が他部の地に対して濃色で着色されている等の理由によって、読取画像7から読取対象6のサイズよりも小さい領域が切り出された場合であっても、この読取対象6の全体を切り出して認識することができる。
[第2の実施の形態]
第2の実施の形態について図7及び図8を参照して説明する。図7(a)〜(c)は、読取画像7の一例を示す図である。第2の実施の形態では、変形手段203が第1の実施の形態で説明した機能に加えて、第1の矩形領域61から拡張された領域同士が互いに重ならないように第2の矩形領域62を選択する機能をさらに有する点で、第1の実施の形態と相違する。以下、第1の実施の形態と実質的に同一の機能を有する構成については、同一の符号を付してその重複した説明を省略するとともに、第1の実施の形態と異なる点を中心に説明する。なお、以下、読取画像7に複数の読取対象6が含まれる場合を例に挙げて説明する。
図7(a)は、複数の読取対象6が含まれる読取画像7の一例を示す図である。図7(a)に示すように、レイアウト解析手段201は、複数の読取対象6のオブジェクト情報60aA〜60dB(以下、これらを総称するときは単に「オブジェクト情報60」ともいう。)を抽出する。また、読取画像7に複数の読取対象6が含まれる場合、分離処理手段202は、各読取対象6に応じて複数の第1の矩形領域61を切り出す。
また、変形手段203は、分離処理手段202が切り出した複数の第1の矩形領域61のうち、読取対象6のサイズと異なるサイズを有する第1の矩形領域61を、第1の実施の形態で説明したように、第2の矩形領域62に変形する。このとき、分離処理手段202が切り出した複数の第1の矩形領域61のうち複数の第1の矩形領域61が読取対象6のサイズと異なるサイズを有する場合、変形手段203は、この読取対象6のサイズと異なるサイズを有する複数の第1の矩形領域61からそれぞれ拡張された領域同士が互いに重ならないような第2の矩形領域62の組み合わせを選択し、この複数の第1の矩形領域61をそれぞれ対応する第2の矩形領域62に拡張する。ここで、「第1の矩形領域61から拡張された領域」とは、拡張後に係る領域(すなわち、第2の矩形領域62)から拡張前に係る領域(すなわち、第1の矩形領域61)を除いた領域をいう。
第1の矩形領域61から拡張された領域同士が互いに重ならないようにするために、一例として、変形手段203は、読取画像7において当該第1の矩形領域61の位置に対して予め定められた特定の方向に位置するオブジェクト情報60が含まれるように複数の第2の矩形領域62の組み合わせを選択し、複数の第1の矩形領域61をそれぞれ対応する第2の矩形領域62に拡張してもよい。
具体的には、変形手段203は、先述した候補領域620A〜620H(図4参照)の中から、抽出された複数のオブジェクト情報60のうち読取画像7における座標の値が第1の矩形領域61の座標の値よりも小さいものを含むように候補領域620A〜620Hを選択して第2の矩形領域62とする。ここで、「オブジェクト情報60の読取画像7における座標」には、例えば、オブジェクト情報60に対応する領域、すなわち抽出されたオブジェクト情報60を囲む矩形状の領域における注目する特定の座標(例えば、図示左上の頂点の座標)を用いてよい。なお、読取画像7の左上を原点としてよい。
読取画像7に2つの読取対象6が含まれる場合を例に挙げてより具体的に説明する。変形手段203は、1つ目の第1の矩形領域61を、抽出された複数のオブジェクト情報60のうち小さい座標の値を有する一連のオブジェクト情報60が含まれるように1つ目の第2の矩形領域62に拡張するとともに、2つ目の第1の矩形領域61を、残りのオブジェクト情報60が含まれるように2つ目の第2の矩形領域62に拡張する。なお、読取対象6が3つ以上ある場合は、変形手段203は、上述の処理を複数の第1の矩形領域61に対して行い、各第1の矩形領域61をそれぞれ対応する第2の矩形領域62に拡張する。なお、「一連のオブジェクト情報60」とは、特定の範囲にまとまって位置する一群のオブジェクト情報60をいう。
図7(b)は、第2の矩形領域の一例を模式的に示す図7(a)の拡大図である。より具体的には、図7(b)に示すように、変形手段203は、相対的に図示左側に位置する第1の読取対象6Aから切り出された1つ目の第1の矩形領域61Aを、この第1の矩形領域61Aよりも図示左側に位置する一連のオブジェクト情報60aA,60bAを含む1つ目の第2の矩形領域62Aに拡張するとともに、第1の読取対象6Aよりも図示右側に位置する第2の読取対象6Bから切り出された2つ目の第1の矩形領域61Bを、残りの一連のオブジェクト情報60aB,60bBを含む2つ目の第2の矩形領域62Aに拡張する。
なお、図7(a),(b)において、太破線枠は、第1の矩形領域61を示し、細破線枠は、読対象6の外縁を示す。また、説明の便宜上、第2の矩形領域62を示す一点鎖線枠の各辺が第1の矩形領域61を示す太破線枠及び読取対象6の外縁を示す細破線枠よりも外側に位置するように描いているが、実際の一点鎖線枠は、太破線枠及び細破線枠に重なってもよい。
なお、読取画像7におけるオブジェクト情報60に対応する領域の位置の判定は、記憶部21の領域情報テーブル211に記録された位置情報に基づいて変形手段203が行ってもよい。また、読取画像7に1つの読取対象6が含まれるか複数の読取対象6が含まれるかの判定は、切り出された第1の矩形領域61の数に応じて、分離処理手段202が行ってもよい。
なお、上述の例では、分離処理手段202が切り出した複数の第1の矩形領域61のうち複数の第1の矩形領域61が読取対象6のサイズと異なるサイズを有する場合を例に挙げて説明したが、分離処理手段202が切り出した複数の第1の矩形領域61のうち1つのみの第1の矩形領域61が読取対象6のサイズと異なるサイズを有する場合であってもよい。この場合、変形手段203は、第1の実施の形態で説明したように、この1つの第1の矩形領域61を第2の矩形領域62に拡張する。また、分離処理手段202が切り出した複数の第1の矩形領域61に読取対象6のサイズと異なるサイズを有するものが含まれない場合、変形手段203は、いずれの第1の矩形領域61に対しても変形処理を行わない。
参考例として、複数の第2の矩形領域62が互いに重なる場合について説明する。図7(c)は、一例として、第2の矩形領域62A,62Bのうちそれぞれ第1の矩形領域61A,61Bから拡張された領域同士が互いに重なっている例を示している(図7(c)の記号「R」参照)。複数の第2の矩形領域62A,62Bが互いに重なるか否かの判定は、第2の矩形領域62A,62Bの位置情報に基づいて変形手段203が行ってもよい。
(第2の実施の形態の動作)
図8は、本発明の第2の実施の形態に係る情報処理装置2の動作の一例を示すフローチャートである。ステップS21からS24までは、第1の実施の形態のステップS1からS4と同様に動作する。すなわち、画像読取部24が読取対象6を読み取り(S21)、受付手段200が読取画像7を受け付け(S22)、レイアウト解析手段201が読取画像7に含まれる読取対象6のオブジェクト情報60を抽出し(S23)、このオブジェクト情報60に対応する領域の位置情報と関連付けて記憶部21の領域情報テーブル211に記録する(S24)。
次に、分離処理手段202は、各読取対象6に応じて複数の第1の矩形領域61を切り出す(S25)。変形手段203は、切り出された複数の第1の矩形領域61のうち複数の第1の矩形領域61が読取対象6のサイズよりも小さいサイズを有するとき、変形手段203は、この複数の第1の矩形領域61からそれぞれ拡張された領域同士が互いに重ならないような第2の矩形領域62の組み合わせを選択する(S26)。また、変形手段203は、各第1の矩形領域61をそれぞれ対応する第2の矩形領域62に拡張する(S27)。なお、ステップS25及びS26の間に行われる変形手段203による第1の矩形領域61のサイズと読取対象6のサイズとを比較する動作については、第1の実施の形態と同様につき詳細な説明は省略する。
次に、傾き補正手段204が第2の矩形領域62のスキュー補正を行い(S28)、表示制御手段205がスキュー補正後の第2の矩形領域62を操作表示部23の表示面に表示するよう制御する(S29)。なお、切り出された複数の第1の矩形領域61の中に、読取対象6のサイズよりも小さいサイズを有するものと、読取対象6のサイズと略同一のサイズを有するものが混在する場合、傾き補正手段204は、読取対象6のサイズよりも小さいサイズを有する第1の矩形領域61、及び読取対象6のサイズよりも小さいサイズを有する第1の矩形領域61を拡張した第2の矩形領域62をそれぞれスキュー補正する。また、表示制御手段205は、これら第1の矩形領域61と拡張した第2の矩形領域62とをそれぞれ操作表示部23の表示面に表示するよう制御する。
以上のようにして、読取画像7に複数の読取対象6が含まれる場合において読取画像から読取対象のサイズよりも小さいサイズの領域が切り出される場合であっても、それぞれの読取対象6を個別に切り出して認識することができる。
<変形例>
図9は、第2の矩形領域62の変形例を示す図である。複数の読取対象6が重なっている状態で読み取られた場合、変形手段203は、特定のオブジェクト情報60eの位置情報に基づいて、いずれの読取対象6が前面にあるか、すなわち、オブジェクト情報60がいずれの読取対象6に属するものかを判定してもよい。具体的には、変形手段203は、図8に示すように、2つの第2の矩形領域62A,62Bのうち、いずれか一方の第2の矩形領域62のみに含まれる特定のオブジェクト情報60eがあるとき、これらオブジェクト情報60が当該一方の第2の矩形領域62Bに対応する第2の読取対象6Bに含まれる、すなわち当該一方の第2の矩形領域62Bに対応する第2の読取対象6Bが他方の第2の矩形領域62Aに対応する第1の読取対象6Aよりも読取画像7における前面にあるものと判定してもよい。
なお、図9において、太破線枠は、第1の矩形領域61を示し、細破線枠は、読対象6の外縁を示す。また、説明の便宜上、第2の矩形領域62A,62Bを示す一点鎖線枠の一部の辺が第1の矩形領域61を示す太破線枠及び読取対象6の外縁を示す細破線枠よりも外側に位置するように描いているが、実際の一点鎖線枠は、太破線枠及び細破線枠に重なってもよい。
[第3の実施の形態]
第3の実施の形態について図10〜図12を参照して説明する。第3の実施の形態は、変形手段203が、第1の領域が読取対象6のサイズよりも大きいサイズを有するとき、第1の領域を基準としてオブジェクト情報60が含まれるようにこの第1の領域を第2の領域に縮小する機能を有する点で、第1の実施の形態と相違する。
以下、第1の実施の形態と実質的に同一の機能を有する構成については、同一の符号を付してその重複した説明を省略するとともに、第1の実施の形態と異なる点を中心に説明する。また、以下、切り出された第1の矩形領域61のサイズが読取対象6のサイズよりも大きい、すなわち、切り出された第1の矩形領域61に複数の読取対象6が含まれる場合を例に挙げて説明する。なお、説明の便宜上、一例として、読取画像7に3つの読取対象6が含まれる場合を例に挙げる。第2の矩形領域62は、第2の領域の一例である。
第1の矩形領域61のサイズが読取対象6のサイズよりも大きいとき、変形手段203は、第1の矩形領域61を基点としてオブジェクト情報60が含まれるように第1の矩形領域61を第2の矩形領域62に縮小する。なお、「サイズよりも大きい」とは、第1の矩形領域61のサイズと読取対象6のサイズとの差分が予め定められた特定の値以上であることをいい、第1の矩形領域61のサイズと読取対象6のサイズとの差分が特定の微小な値未満であることを意味するものではない。
図10は、図10(a)〜(h)は、候補領域620A〜620Hの一例を示す図である。変形手段203は、図10(a)〜(h)に示すように、第2の矩形領域62の候補として、第1の矩形領域61の4つの頂点のうちいずれかの頂点を1つの基準点621とし、抽出されたオブジェクト情報60のうち少なくとも一部を含むように囲まれた8つの候補領域620A〜620Hを用意し、この8つの候補領域620A〜620Hの中から、オブジェクト情報60を分断せずにオブジェクト情報60を含むものを選択して第2の矩形領域62とし、第1の矩形領域61をこの選択された第2の矩形領域62に縮小する。
図10各図に示す例では、図10(a)の候補領域620A、図10(b)の候補領域620B、図10(c)の候補領域620C、及び図10(d)の候補領域620Dは、オブジェクト情報60を分断せずにオブジェクト情報60を含む場合の一例である。これらに対して、図10(e)の候補領域620E、図10(f)の候補領域620F、図10(g)の候補領域620G、及び図10(h)の候補領域620Hは、各候補領域620E,620F,620G,620Hの縁部620Ea,620Fa,620Ga,620Haによってオブジェクト情報60のいくつかが分断される場合の一例である。変形手段203は、図10(a)の候補領域620A、図10(b)の候補領域620B、図10(c)の候補領域620C、又は図10(d)の候補領域620Dを選択して第2の矩形領域62とし、第1の矩形領域61を第2の矩形領域62に縮小する。
図11は、第3及び第4の矩形領域の一例を示す図である。なお、図11は、図10(a)に示す場合に対応させた図である。変形手段203は、縮小前に係る第1の矩形領域61(図11の細破線線枠参照)から第2の矩形領域62(図11の一点鎖線枠参照)を除いた第3の矩形領域63(図11の長破線枠参照)のサイズを求め、記憶部21のサイズ情報212から読取対象6のサイズを取得して、この第3の矩形領域63のサイズと読取対象6のサイズとを比較する。第3の矩形領域63は、第3の領域の一例である。
また、第3の矩形領域63のサイズが読取対象6のサイズよりも大きいとき、変形手段203は、第3の矩形領域63を第4の矩形領域64(図11の二点鎖線枠参照)にさらに縮小する。第4の矩形領域64は、第4の領域の一例である。なお、第3の矩形領域63を第4の矩形領域64に縮小する処理は、前述した第1の矩形領域61を第2の矩形領域62に縮小する処理と同一であるため、詳細な説明は省略する。
なお、図11において、説明の便宜上、各枠を互いに重ならないように描いているが、実際は、各枠は、第1の矩形領域61の図示両側において重なってもよい。
(第3の実施の形態の動作)
図12は、本発明の第3の実施の形態に係る情報処理装置2の動作の一例を示すフローチャートである。ステップS31からS35までは、第1の実施の形態のステップS1からS4と同様に動作する。すなわち、画像読取部24が読取対象6を読み取り(S31)、受付手段200が読取画像7を受け付け(S32)、レイアウト解析手段201が読取画像7に含まれる読取対象6のオブジェクト情報60を抽出し(S33)、このオブジェクト情報60に対応する領域の位置情報と関連付けて記憶部21の領域情報テーブル211に記録し(S34)、分離処理手段202が第1の矩形領域61を切り出す(S35)。
次に、変形手段203は、第1の矩形領域61のサイズを求め、記憶部21に記憶されたサイズ情報212から読取対象6のサイズを取得し、この第1の矩形領域61のサイズと読取対象6のサイズとを比較する(S36)。第1の矩形領域61のサイズが読取対象6のサイズよりも大きい場合(S36:Yes)、変形手段203は、第1の矩形領域61を、オブジェクト情報60を分断しないように第2の矩形領域62に縮小する(S37)。
次に、変形手段203は、縮小前に係る第1の矩形領域61から第2の矩形領域62を除いた第3の矩形領域63のサイズを求め、第3の矩形領域63のサイズと読取対象6のサイズとを比較する(S38)。第3の矩形領域63のサイズが読取対象6のサイズよりも大きい場合(S38:Yes)、変形手段203は、第3の矩形領域63を、オブジェクト情報60を分断しないように第4の矩形領域64にさらに縮小する(S39)。
変形手段203は、第(2×K+5)の矩形領域が読取対象6のサイズと略同一以下となるまで、上記のステップS38及びS39に係る動作を繰り返す。すなわち、変形手段203は、縮小前に係る第(2×K+3)の矩形領域61から第(2×K+4)の矩形領域62を除いた第(2×K+5)の矩形領域のサイズを求め(S40)、このサイズが読取対象6のサイズよりも大きい場合(S40:Yes)、変形手段203は、第(2×K+5)の矩形領域61を、オブジェクト情報60を分断しないように第(2×K+6)の矩形領域64にさらに縮小する(S41)。なお、Kは、0以上の整数である。
次に、傾き補正手段204が第2の矩形領域、第4の矩形領域、…、第(2×M+4)の矩形領域、及び第(2×M+5)の矩形領域のスキュー補正を行い(S42)、表示制御手段205がスキュー補正後の第2の矩形領域、第4)の矩形領域、…第(2×M+4)の矩形領域、及び第(2×M+5)の矩形領域をそれぞれ分けて操作表示部23の表示面に表示するよう制御する(S43)。なお、M=0、1、2、…Kである。Kは、上記ステップS40及びS41を行った回数である。
以上のようにして、第1の矩形領域61に複数の読取対象6が含まれる場合であっても、それぞれの読取対象6を個別に切り出して認識することができる。
<変形例2>
図13(a),(b)は、読取画像7の一例を示す図である。図13(b)に示すように、図13(a)に示す読取対象6が、第1の矩形領域61と第2の矩形領域62とに分割されて切り出される場合がある。
このような場合、変更手段は、読取画像7の背景の色(以下、単に「背景色」ともいう。)と異なる背景色を有する領域を含まれるように第1の矩形領域61を変更する。ここで、背景とは、読取画像7のうち読取対象6以外の部分をいう。なお、変更手段は、背景色を有する領域を含まれるように第2の矩形領域62を変更してもよい。また、図13(b)に示す例では、読取対象6が2つの部分領域に分割された場合を例に挙げて説明したが、3つ以上の部分領域に分割された場合であっても同様に処理してよい。
以上のようにすれば、読取対象が分割されて切り出されるような場合であっても、読取対象全体を認識することができる。
以上、本発明の実施の形態を説明したが、本発明の実施の形態は上記実施の形態に限定されるものではなく、本発明の要旨を変更しない範囲内で種々の変形、実施が可能である。例えば、サイズ情報212は、ユーザの操作に応じて読取対象6ごとに設定できるようにしてもよい。
また、例えば、上記の実施の形態では、情報処理装置2が画像読取部24を備える構成を例に挙げて説明したが、画像読取部24は必須の構成ではなく、情報処理装置2が、例えば上述した端末装置3等の外部の装置が読み取った読取画像7を受け付けて処理してもよい。また、レイアウト解析手段201によるレイアウト解析及び分離処理手段202による第1の領域の切り出し処理の順序を入れ替えてもよい。
また、情報処理装置2の制御部20に設けられている手段の一部をサーバ装置の制御部(不図示)に移動してもよく、情報処理装置2の記憶部21に記憶されている各種データをサーバ装置の記憶部(不図示)に記憶してもよい。すなわち、上述した読取画像7に対する処理をサーバ装置が担うようにしてもよい。また、読取画像7の処理の結果、すなわち個別に切り出された読取対象6は、情報処理装置2の操作表示部23ではなく、端末装置3の表示部(不図示)に表示してもよい。
制御部20の各手段は、それぞれ一部又は全部を再構成可能回路(FPGA:Field Programmable Gate Array)、特定用途向け集積回路(ASIC:Application Specific Integrated Circuit)等のハードウエア回路によって構成してもよい。
また、本発明の要旨を変更しない範囲内で、上記実施の形態の構成の一部を省くことや変更することが可能である。また、本発明の要旨を変更しない範囲内で、上記実施の形態のフローにおいて、ステップの追加、削除、変更、入替え等が可能である。また、上記実施の形態で用いたプログラムをCD−ROM等のコンピュータ読み取り可能な記録媒体に記録して提供することができ、クラウドサーバ等の外部サーバに格納しておき、ネットワークを介して利用することもできる。
1…情報処理システム、2…情報処理装置、20…制御部、200…受付手段、201…レイアウト解析手段、202…分離処理手段、203…変形手段、204…傾き補正手段、205…表示制御手段、21…記憶部、210…プログラム、211…領域情報テーブル、212…サイズ情報、23…操作表示部、24…画像読取部、25…通信部、3…端末装置、4…外部装置、5…ネットワーク、6…読取対象,6A…第1の読取対象,6B…第2の読取対象、6a…輪郭線、60…オブジェクト情報、60a,60aA,60aB…所属情報(オブジェクト情報)、60b,60bA,60bB…URL情報(オブジェクト情報)、60c,60cA,60cB…氏名情報(オブジェクト情報)、60d,60dA,60dB…住所情報(オブジェクト情報)、60e…特定のオブジェクト情報(オブジェクト情報)、61,61A,61B…第1の矩形領域、62,62A,62B…第2の矩形領域、62a…第2の矩形領域の縁部、620A,620B,620C,620D,620E,620F,620G,620H…候補領域、620Ba,620Fa,620Ga,620Ha…候補領域の縁部、621…基準点、63…第3の矩形領域、64…第4の矩形領域、7…読取画像

Claims (8)

  1. 予め定められたサイズを有する読取対象が含まれる画像からオブジェクト情報を抽出する抽出手段と、
    前記画像から前記読取対象の少なくとも一部を含む第1の領域を切り出す切り出し手段と、
    前記切り出し手段が切り出した前記第1の領域が前記予め定められたサイズと異なるサイズを有するとき、前記第1の領域から前記画像の背景色と異なる背景色を有する領域が含まれるように前記第1の領域を変更する変更手段と、
    を備える情報処理装置。
  2. 前記変更手段は、前記第1の領域を基点として前記オブジェクト情報が含まれるように、前記第1の領域を変更する、
    請求項1に記載の情報処理装置。
  3. 前記変更手段は、前記第1の領域が前記予め定められたサイズよりも小さいサイズを有するとき、前記第1の領域を基点として前記オブジェクト情報が含まれるように、前記第1の領域を拡張する、
    請求項1又は2に記載の情報処理装置。
  4. 前記画像が複数の前記読取対象を含む場合に、
    前記切り出し手段は、前記複数の読取対象ごとに複数の第1の領域を切り出し、
    前記変更手段は、前記複数の第1の領域のうち複数の第1の領域が前記予め定められたサイズと異なるサイズを有するとき、前記複数の第1の領域からそれぞれ拡張された領域同士が互いに重ならないように前記複数の第1の領域をそれぞれ拡張する、
    請求項3に記載の情報処理装置。
  5. 前記変更手段は、前記画像において前記複数の第1の領域に対してそれぞれ予め定められた方向に位置する前記オブジェクト情報を含むように、前記複数の第1の領域をそれぞれ拡張する、
    請求項4に記載の情報処理装置。
  6. 前記変更手段は、前記第1の領域が前記予め定められたサイズよりも大きいサイズを有するとき、前記第1の領域を基点として前記オブジェクト情報が含まれるように、前記第1の領域を第2の領域に縮小する、
    請求項1から5のいずれか1項に記載の情報処理装置。
  7. 前記変更手段は、縮小前に係る前記第1の領域から前記第2の領域を除いた第3の領域が前記予め定められたサイズよりも大きいサイズを有するとき、前記第3の領域を基点として前記オブジェクト情報が含まれるように、前記第3の領域を第4の領域に縮小する、
    請求項6に記載の情報処理装置。
  8. コンピュータを、
    予め定められたサイズを有する読取対象が含まれる画像からオブジェクト情報を抽出する抽出手段と、
    前記画像から前記読取対象の少なくとも一部を含む第1の領域を切り出す切り出し手段と、
    前記切り出し手段が切り出した前記第1の領域が前記予め定められたサイズと異なるサイズを有するとき、前記第1の領域から前記画像の背景色と異なる背景色を有する領域が含まれるように、前記第1の領域を変更する変更手段として機能させるプログラム。
JP2018081778A 2018-04-20 2018-04-20 情報処理装置及びプログラム Pending JP2019193022A (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2018081778A JP2019193022A (ja) 2018-04-20 2018-04-20 情報処理装置及びプログラム
US16/354,225 US20190325245A1 (en) 2018-04-20 2019-03-15 Information processing apparatus and non-transitory computer readable medium storing program

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2018081778A JP2019193022A (ja) 2018-04-20 2018-04-20 情報処理装置及びプログラム

Publications (1)

Publication Number Publication Date
JP2019193022A true JP2019193022A (ja) 2019-10-31

Family

ID=68237948

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2018081778A Pending JP2019193022A (ja) 2018-04-20 2018-04-20 情報処理装置及びプログラム

Country Status (2)

Country Link
US (1) US20190325245A1 (ja)
JP (1) JP2019193022A (ja)

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001109844A (ja) * 1999-10-06 2001-04-20 Internatl Business Mach Corp <Ibm> 文字列抽出方法、手書き文字列抽出方法、文字列抽出装置、および画像処理装置
JP2004127203A (ja) * 2002-07-30 2004-04-22 Ricoh Co Ltd 画像処理装置、画像処理方法、及びその方法をコンピュータに実行させるプログラム、並びにそのプログラムを記録したコンピュータ読み取り可能な記録媒体
JP2008113075A (ja) * 2006-10-27 2008-05-15 Canon Inc 画像処理装置およびその制御方法
JP2011139366A (ja) * 2009-12-28 2011-07-14 Canon Inc 画像処理装置、画像処理方法、及びプログラム

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001109844A (ja) * 1999-10-06 2001-04-20 Internatl Business Mach Corp <Ibm> 文字列抽出方法、手書き文字列抽出方法、文字列抽出装置、および画像処理装置
JP2004127203A (ja) * 2002-07-30 2004-04-22 Ricoh Co Ltd 画像処理装置、画像処理方法、及びその方法をコンピュータに実行させるプログラム、並びにそのプログラムを記録したコンピュータ読み取り可能な記録媒体
JP2008113075A (ja) * 2006-10-27 2008-05-15 Canon Inc 画像処理装置およびその制御方法
JP2011139366A (ja) * 2009-12-28 2011-07-14 Canon Inc 画像処理装置、画像処理方法、及びプログラム

Also Published As

Publication number Publication date
US20190325245A1 (en) 2019-10-24

Similar Documents

Publication Publication Date Title
JP4347578B2 (ja) 印刷文書を使用するシステムおよび方法
US20110157215A1 (en) Image output device, image output system and image output method
KR102090973B1 (ko) 정보 처리장치, 정보 처리방법, 및 기억매체
JP6826293B2 (ja) 情報処理システムと、その処理方法及びプログラム
JP6921522B2 (ja) 画像処理装置及びその制御方法並びにプログラム
JP4983464B2 (ja) 帳票画像処理装置及び帳票画像処理プログラム
JP2019193022A (ja) 情報処理装置及びプログラム
JP7031465B2 (ja) 情報処理装置及びプログラム
JP6950252B2 (ja) 画像処理装置及びプログラム
JP4474231B2 (ja) 文書リンク情報取得システム
JP2006184415A (ja) 画像処理装置、画像処理プログラム及び画像処理方法
JP2007011529A (ja) Ocr処理における文字認識位置の決定方法
JP7026386B2 (ja) 帳票画像処理システム、帳票画像処理方法、および帳票画像処理プログラム
JP6194781B2 (ja) 画像処理装置及びプログラム
JP5788736B2 (ja) 画像配信サーバ、画像配信システム、画像配信方法及びプログラム
JP6926536B2 (ja) 画像処理装置及びプログラム
JP6864827B2 (ja) 画像処理装置及びプログラム
JPH05303661A (ja) イメージデータ部分取得表示装置
JP6815712B1 (ja) 画像処理システム、画像処理方法、画像処理プログラム、画像処理サーバ、及び学習モデル
US10628713B2 (en) Mobile terminal, image processing method, and computer-readable recording medium
WO2021117128A1 (ja) 帳票画像処理システム
JP6743401B2 (ja) 帳票設計・読取設定支援装置、帳票設計・読取設定支援方法、及び、光学文字認識システム
JP2018121229A (ja) 画像補正装置、画像補正方法、およびコンピュータプログラム
JP5277750B2 (ja) 画像処理プログラム、画像処理装置及び画像処理システム
JP4431335B2 (ja) 文字列読み取りプログラム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20210319

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20211129

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20211207

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20220127

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20220628

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20221220