JP2019192959A - 情報処理装置及びプログラム - Google Patents

情報処理装置及びプログラム Download PDF

Info

Publication number
JP2019192959A
JP2019192959A JP2018079719A JP2018079719A JP2019192959A JP 2019192959 A JP2019192959 A JP 2019192959A JP 2018079719 A JP2018079719 A JP 2018079719A JP 2018079719 A JP2018079719 A JP 2018079719A JP 2019192959 A JP2019192959 A JP 2019192959A
Authority
JP
Japan
Prior art keywords
wide area
area
information
output
read image
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2018079719A
Other languages
English (en)
Other versions
JP7031465B2 (ja
Inventor
邦彦 小林
Kunihiko Kobayashi
邦彦 小林
真太郎 安達
Shintaro Adachi
真太郎 安達
岡田 茂
Shigeru Okada
茂 岡田
山口 聡之
Satoyuki Yamaguchi
聡之 山口
清水 淳一
Junichi Shimizu
淳一 清水
和宏 大谷
Kazuhiro Otani
和宏 大谷
慎也 中村
Shinya Nakamura
慎也 中村
茜 阿部
Akane Abe
茜 阿部
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujifilm Business Innovation Corp
Original Assignee
Fuji Xerox Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fuji Xerox Co Ltd filed Critical Fuji Xerox Co Ltd
Priority to JP2018079719A priority Critical patent/JP7031465B2/ja
Priority to US16/122,904 priority patent/US11163992B2/en
Priority to CN201910163323.5A priority patent/CN110390323B/zh
Publication of JP2019192959A publication Critical patent/JP2019192959A/ja
Application granted granted Critical
Publication of JP7031465B2 publication Critical patent/JP7031465B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • H04N1/00681Detecting the presence, position or size of a sheet or correcting its position before scanning
    • H04N1/00684Object of the detection
    • H04N1/00702Position
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/70Determining position or orientation of objects or cameras
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/98Detection or correction of errors, e.g. by rescanning the pattern or by human intervention; Evaluation of the quality of the acquired patterns
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/14Image acquisition
    • G06V30/1444Selective acquisition, locating or processing of specific regions, e.g. highlighted text, fiducial marks or predetermined fields
    • G06V30/1456Selective acquisition, locating or processing of specific regions, e.g. highlighted text, fiducial marks or predetermined fields based on user interactions
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/40Document-oriented image-based pattern recognition
    • G06V30/41Analysis of document content
    • G06V30/414Extracting the geometrical structure, e.g. layout tree; Block segmentation, e.g. bounding boxes for graphics or text
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/10Image acquisition modality
    • G06T2207/10004Still image; Photographic image
    • G06T2207/10008Still image; Photographic image from scanner, fax or copier
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/30Subject of image; Context of image processing
    • G06T2207/30176Document
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Signal Processing (AREA)
  • Artificial Intelligence (AREA)
  • Geometry (AREA)
  • Computer Graphics (AREA)
  • Human Computer Interaction (AREA)
  • Quality & Reliability (AREA)
  • Character Input (AREA)
  • Editing Of Facsimile Originals (AREA)

Abstract

【課題】複数の原稿を読み取る場合に、読取画像における出力対象の位置を示す位置情報によらなくても、出力対象を抽出することが可能な情報処理装置及びプログラムを提供する。【解決手段】情報処理装置は、第1の読取画像から出力領域とオブジェクト領域とを含む広域領域を指定する第1の指定手段と、指定された広域領域内から出力領域を指定する第2の指定手段と、第1の読取画像に対する広域領域の位置情報と広域領域に対する出力領域の位置情報とを取得する位置取得手段と、広域領域の位置情報と出力領域の位置情報とを記憶する記憶手段と、記憶手段により記憶された広域領域の位置情報から、第1の読取画像と同一の形式である第2の読取画像の広域領域の位置を特定し、広域領域の位置と記憶手段により記憶された出力領域の位置情報から第2の読取画像の出力領域を抽出する抽出手段と、を備える。【選択図】図1

Description

本発明は、情報処理装置及びプログラムに関する。
近年、帳票等の読取対象から対象物を切り出して出力する情報処理装置が提案されている(例えば、特許文献1参照。)。
特許文献1に記載された情報処理装置は、スキャン手段、フォーム登録手段、ゾーンOCR手段、インデックス補正手段、インデックス補正手段で取得したデータを文書のインデックスとするインデックス手段、画像とインデックスデータを文書として文書管理システムへ保存する保存手段を備えている。
特開2008−40598号公報
しかし、例えば複数の原稿を読み取る際に原稿から読み取られる位置に誤差が生じた場合、読取画像から予め指定した領域が抽出できない場合がある。そこで、本発明は、複数の原稿を読み取る場合に、読取画像における出力対象の位置を示す位置情報によらなくても、出力対象を抽出することが可能な情報処理装置及びプログラムを提供することを目的とする。
[1]第1の読取画像から出力領域とオブジェクト領域とを含む広域領域を指定する第1の指定手段と、
指定された前記広域領域内から前記出力領域を指定する第2の指定手段と、
前記第1の読取画像に対する前記広域領域の位置情報と前記広域領域に対する前記出力領域の位置情報とを取得する位置取得手段と、
前記広域領域の位置情報と前記出力領域の位置情報とを記憶する記憶手段と、
前記記憶手段により記憶された前記広域領域の位置情報から、前記第1の読取画像と同一の形式である前記第2の読取画像の広域領域の位置を特定し、前記広域領域の位置と前記記憶手段により記憶された前記出力領域の位置情報から前記第2の読取画像の出力領域を抽出する抽出手段と、
を備える、情報処理装置。
[2]前記抽出手段は、前記出力領域の位置情報として、前記広域領域において何行目に位置するかを示す特定行情報に基づいて前記出力領域を抽出する、
前記[1]に記載の情報処理装置。
[3]前記抽出手段は、前記広域領域に前記出力領域に応じた行がないとき、前記広域領域を予め定められた方向に拡張して広域領域を新たに抽出する、
前記[1]又は[2]に記載の情報処理装置。
[4]前記第2の指定手段は、共通の文字列を含む行として前記出力領域を指定する、
前記[1]から[3]のいずれか1つに記載の情報処理装置。
[5]前記抽出手段は、前記広域領域に前記出力領域に応じた前記共通の文字列がないとき、前記広域領域を予め定められた方向に拡張して広域領域を新たに抽出する、
前記[4]に記載の情報処理装置。
[6]出力領域とオブジェクト領域とを含む広域領域の位置情報と出力領域の位置情報とを記憶する記憶手段を備えるコンピュータを、
第1の読取画像から前記広域領域を指定する第1の指定手段と、
指定された前記広域領域内から前記出力領域を指定する第2の指定手段と、
前記第1の読取画像に対する前記広域領域の位置情報と前記広域領域に対する前記出力領域の位置情報とを取得する位置取得手段と、
前記記憶手段により記憶された前記広域領域の位置情報から、前記第1の読取画像と同一の形式である前記第2の読取画像の広域領域の位置を特定し、前記広域領域の位置と前記記憶手段により記憶された前記出力領域の位置情報から前記第2の読取画像の出力領域を抽出する抽出手段として
機能させるためのプログラム。
請求項1、6に係る発明によれば、複数の原稿を読み取る場合に、読取画像における出力対象の位置を示す位置情報によらなくても、出力対象を抽出することができる。
請求項2に係る発明によれば、広域領域において何行目に位置するかにより出力対象を抽出することができる。
請求項3に係る発明によれば、広域領域に指定された行がない場合であっても出力対象を抽出することができる。
請求項4に係る発明によれば、文字列の情報に基づいて広域領域から出力対象を抽出することができる。
請求項5に係る発明によれば、広域領域に共通の文字列がない場合であっても出力対象を抽出することができる。
図1は、本発明の実施の形態に係る情報処理装置の制御系の一例を示すブロック図である。 図2は、ゾーン指定データの一例を示す図である。 図3は、ゾーンの一例を示す図である。 図4は、ゾーン指定情報を設定する設定画面の一例を示す図である。 図5は、本実施の形態に係る情報処理装置のゾーン指定情報を設定する処理の動作の一例を示すフローチャートである。 図6は、本実施の形態に係る情報処理装置の出力対象を抽出する処理の動作の一例を示すフローチャートである。 図7は、広域領域の拡張の一例を示す図である。
以下、本発明の実施の形態について図面を参照して説明する。なお、各図中、実質的に同一の機能を有する要素については、同一の符号を付してその重複した説明を省略する。
[実施の形態の要約]
本実施の形態に係る情報処理装置は、第1の読取画像から出力領域とオブジェクト領域とを含む広域領域を指定する第1の指定手段と、指定された前記広域領域内から前記出力領域を指定する第2の指定手段と、前記第1の読取画像に対する前記広域領域の位置情報と前記広域領域に対する前記出力領域の位置情報とを取得する位置取得手段と、前記広域領域の位置情報と前記出力領域の位置情報とを記憶する記憶手段と、前記記憶手段により記憶された前記広域領域の位置情報から、前記第1の読取画像と同一の形式である前記第2の読取画像の広域領域の位置を特定し、前記広域領域の位置と前記記憶手段により記憶された前記出力領域の位置情報から前記第2の読取画像の出力領域を抽出する抽出手段と、を備える。
読取対象は、特に限定されるものではなく、例えば、伝票などの帳票や、各種請求書、あるいはレシート等が該当る。「広域領域」とは、出力する対象である出力対象を含む矩形状の出力領域と出力対象以外のオブジェクトを含む矩形状のオブジェクト領域とを含む矩形状の形状を有する領域である。
[実施の形態]
(情報処理装置の構成)
図1は、本発明の実施の形態に係る情報処理装置の制御系の一例を示すブロック図である。情報処理装置1には、例えば、画像形成装置、パーソナルコンピュータ、多機能携帯電話機(スマートフォン)等が含まれる。以下、情報処理装置1として画像形成装置を例に挙げて説明する。画像形成装置には、例えば、スキャナや複合機が含まれる。この情報処理装置1は、各部を制御する制御部2と、各種のデータを記憶する記憶部3と、情報の入力及び表示を行う操作表示部4と、読取対象を光学的に読み取り読取画像を形成する画像読取部5とを備える。
制御部2は、CPU(Central Processing Unit)、インターフェース等から構成されている。CPUは、記憶部3のプログラム格納部30に記録されたプログラム従って動作することにより、受付手段20、ゾーン設定手段21、OCR手段22、抽出手段23等として機能する。ゾーン設定手段21は、第1の指定手段、第2の指定手段及び位置情報取得手段の一例である。各手段20〜23の詳細については後述する。
記憶部3は、ROM(Read Only Memory)、RAM(Random Access Memory)、ハードディスク等から構成され、プログラムを格納するプログラム格納部30、ゾーン指定データ310(図2参照)を格納するゾーン指定データ格納部31、及びOCR結果を格納するOCR結果格納部32を備える。記憶部3は、記憶手段の一例である。
操作表示部4は、例えば、タッチパネルディスプレイであり、液晶ディスプレイ等のディスプレイにタッチパネルを重合配置した構成を有する。
画像読取部5は、原稿台上に設けられた自動原稿給紙装置(ADF、又は、DADF)と、スキャナとを備え、原稿台に配置された読取対象、又は自動原稿給紙装置により送られた読取対象を光学的に読み取り、読取画像を形成する。
(ゾーン指定データ310の構成)
図2は、ゾーン指定データ310の一例を示す図である。図2に示すように、ゾーン指定データ310は、ゾーン指定情報311と、帳票IDと、を関連付けたデータである。ここで、ゾーン指定情報311は、出力する対象(以下、「出力対象」ともいう。)を含む出力領域と出力対象以外のオブジェクトを含むオブジェクト領域とを含む矩形状の領域(以下、「広域領域」ともいう。)の位置及び大きさを示す領域特定情報311aと、この広域領域における出力対象の位置を示す位置情報とを含む。
「オブジェクト」とは、文字や文字列、記号や図形、表(表題を含む)、及びこれらを組み合わせた情報を含む画像の構成要素をいう。広域領域における出力対象の位置情報には、例えば、出力対象が広域領域内の何行目に位置するか(以下、「特定行」ともいう。)を示す情報311b(以下、「特定行情報311b」ともいう。)が含まれる。特定行情報311bは、位置情報の一例である。位置情報は、出力対象の属性情報の一例である。また、帳票IDは、読取対象としての帳票を識別する情報である。
領域特定情報311aは、例えば、広域領域を構成する4つの頂点のうちいずれか1つの頂点の座標値(x、y)、すなわち該1つの頂点についての読取画像の一端(例えば、左端)からの位置xを示す情報及びこの一端と隣り合う他端(例えば、上端)からの位置yを示す情報と、ゾーンの幅wを示す情報と、ゾーンの高さhを示す情報とを含む。なお、各位置x、y、幅w、及び高さhは、実際の距離(例えば、単位「mm」)で与えられてもよく、読取画像の画素値で与えられてもよい。
特定行情報311bは、例えば、1つの行を特定する形式(例えば、「何行目」等)で与えられてもよく、複数に亘る行を特定する形式(例えば、「何行目〜何行目」等)で与えられてもよい。
(ゾーン)
次に、ゾーンについて説明する。図3は、ゾーンの一例を示す図である。ゾーンは、出力対象を含む広域領域60と、この広域領域60における出力対象の位置とにより設定される。以下、読取対象の一例として請求書を読み取った請求書画像6に設定されたゾーンを例に挙げて説明する。なお、この請求書画像6は、広域領域(出力領域及びオブジェクト領域)を指定するためのサンプル画像である。すなわち、請求書画像6は、第1の読取画像の一例である。
図3に示すように、広域領域60は、請求書画像6に記載された特定の対象物及びこの特定の対象物の周囲に存在する余白の領域を含む矩形状の領域である。
図3で示す例では、広域領域60は、例えば、特定の対象物としての郵便番号情報611及び住所情報612を含む宛先情報61と、会社名情報621及び部署名情報622を含む宛名情報62と、これら宛先情報61及び宛名情報62の周囲の特定の余白の領域とを含む。この広域領域60には、出力対象が含まれている。
請求書画像6における出力対象の位置は、上述した特定行情報311bで設定される。具体的に、図3に示す例において、例えば、出力対象を会社名とするとき、特定行情報311bを「4行目」と設定してもよい。また、例えば、出力対象を住所とするとき、特定行情報311bは、会社名が記載されている「1行目から3行目」と設定してもよい。
(制御部2の構成)
次に、制御部2を構成する各手段20〜23について説明する。受付手段20は、操作表示部4に対する操作者の操作を受け付ける。また、受付手段20は、画像読取部5が読取対象を読み取って形成した読取画像を受け付ける。
ゾーン設定手段21は、受付手段20が受け付けた操作者の操作に応じて、ゾーン指定情報311の設定を行う。具体的には、ゾーン設定手段21は、操作者の操作に応じて、広域領域の領域特定情報311aの設定と、特定行情報311bの設定とを行う。また、ゾーン設定手段21は、設定されたゾーン指定情報311を記憶部3のゾーン指定データ格納部31にゾーン指定データ310として記録する。
なお、ゾーン設定手段21によるゾーン指定情報311の設定は、読取対象ごとに行ってもよい。また、一つの読取対象に対して、複数のゾーン指定情報311を設定してもよい。
OCR手段22は、受付手段20が受け付けた読取画像に対してOCR(Optical Character Recognition)処理を施し、OCR結果を取得する。OCR結果には、例えば、文字や文字列に記された内容に関する情報や、文字や文字列の位置を示す情報が含まれる。また、OCR手段22は、取得したOCR結果を記憶部3のOCR結果格納部32に格納する。
抽出手段23は、受付手段20が受け付けた読取画像から、ゾーン設定手段21によって読取対象に応じて設定された広域領域を抽出する。具体的には、抽出手段23は、記憶部3のゾーン指定データ格納部31に格納されたゾーン指定データ310のゾーン指定情報311を取得し、取得したゾーン指定情報311に基づいて広域領域に対応したOCR結果を記憶部3のOCR結果格納部32から取得する。また、抽出手段23は、取得した広域領域に対応したOCR結果から特定行に対応するOCR結果を取得して、当該OCR結果を出力対象として抽出する。
次に、図4を参照してゾーン指定情報を設定する画面について説明する。図4は、ゾーン指定情報を設定する設定画面の一例を示す図である。図4に示すように、設定画面7は、領域特定情報311aを設定する第1の部分画面71と、特定行情報311bを設定する第2の部分画面72とを含んで構成されている。
第1の部分画面71は、上述した、広域領域60の読取画像における位置、すなわち、左端から位置x、及び上端からの位置yを入力する第1の入力欄710と、広域領域60の幅w及び高さhを入力する第2の入力欄720とを含む。第2の部分画面72は、抽出する行の指定、すなわち、第1の部分画面71によって設定された広域領域60において出力対象が何行目に位置するかを示す情報を入力する第3の入力欄730を含む。
設定画面7に対して操作者により入力された情報は、記憶部3のゾーン指定データ格納部31に格納されるようになっている。
なお、広域領域60の設定、及び広域領域60における出力対象の位置の設定は、図4に示す設定画面7に座標値を入力する方法に限られない。例えば、操作表示部4に表示された読取画像が含まれる画面(以下、「UI画面」ともいう。)に対する操作により、広域領域60及び広域領域60における出力対象の位置を設定してもよい。
UI画面に対する操作には、例えば、操作表示部4に指を接触させること(以下、「タッチ」ともいう。)により、広域領域60を構成する特定の点(例えば、広域領域60の左上の座標と右下の座標の2点)を選択する操作、操作表示部4を指でなぞることにより広域領域60の外枠を指定する操作、出力対象を示す行(複数行に亘る場合は複数行)をタッチする操作等が含まれる。
(実施の形態の動作)
次に、本発明の実施の形態に係る情報処理装置1の動作の一例について図5及び図6を参照して説明する。図5は、ゾーン指定情報を設定する処理(以下、「ゾーン設定処理」ともいう。)の動作の一例を示すフローチャートである。図6は、本実施の形態に係る情報処理装置の出力対象を抽出する処理(以下、「抽出処理」ともいう。)の動作の一例を示すフローチャートである。なお、図5に示すゾーン指定情報の設定は、上述したようにサンプルとなる1つの読取画像(「第1の読取画像」)に対して実行される。また、図6に示す抽出処理は、この第1の読取画像と同一の形式を有する複数の読取画像に対して実行される。第1の読取画像と同一の形式を有する読取画像は、第2の読取画像の一例である。
(1)ゾーン設定処理
操作表示部4に対する操作者によるゾーン指定情報311を設定する操作が継続している場合(S1:Yes)、この操作に応じて、ゾーン設定手段21は、広域領域を設定する(S2)。
設定された広域領域に複数の行が含まれる場合、すなわち、出力対象の特定行情報311bを設定する必要がある場合(S3:Yes)、ゾーン設定手段21は、操作者の操作に応じて、特定行情報311bを設定する(S4)。
さらに別のゾーン指定情報311の設定が継続する場合、すなわち、操作者によるゾーンを設定する操作が継続している場合(S5:Yes)、上述したステップS2以降の処理を行う。「ゾーン指定情報311の設定が継続する場合」には、例えば、1つの読取対象に複数のゾーンを設定する場合が該当する。
(2)抽出処理
画像読取部5は、自動原稿給紙装置により送られた読取対象を読み取り(S11)、この読取対象に係る読取画像を形成して制御部2に送信する。受付手段20は、この読取画像を受け付ける。
OCR手段22は、受付手段20が受け付けた読取画像の全体にOCR処理を施し(S12)、OCR結果を取得する。また、OCR手段22は、OCR結果を記憶部3のOCR結果格納部32に格納する。
次に、抽出手段23は、記憶部3のゾーン指定データ格納部31に格納されたゾーン指定データ310のゾーン指定情報311を取得する(S13)。また、抽出手段23は、ゾーン指定情報311に基づいて広域領域に対応したOCR結果を取得する(S14)。すなわち、抽出手段23は、広域領域を抽出する。
また、抽出手段23は、取得した広域領域に対応したOCR結果から特定行に対応するOCR結果を取得し(S15)、当該OCR結果を出力対象として抽出する。
なお、1つの読取対象に複数(例えば、N個)のゾーンが設定されている場合、各ゾーンに対して前述したステップS14及びS15の処理を行う。
以上のようにすれば、複数(例えば、100枚以上)の原稿を連続的に読み取る場合に、例えば、自動原稿給紙装置の性能や読取対象の配置等によって読取対象の読み取り位置にズレが生じた場合であっても、読取画像における出力対象の位置を示す位置情報によらずに出力対象を抽出することが可能となる。
<変形例1>
上記実施の形態では、出力対象の属性情報として、広域領域内における出力対象の位置情報、具体的には、出力対象が広域領域内の何行目に位置するかを示す特定行情報311bを用いたが、これに限定されるものではない。出力対象の属性情報として、例えば、共通の文字列等の出力対象を識別する特定の構成要素を示す情報を用いてもよい。
特定の構成要素に係る情報には、例えば、出力対象に記載された共通の内容、出力対象文字の共通の属性、文字数の共通性等の情報が含まれる。出力対象に記載された内容を示す情報は、例えば、文字に関する情報(以下、「文字情報」ともいう。)や、記号に関する情報(以下、「記号情報」ともいう。)を含む。
文字情報には、例えば、出力対象に記載された内容の一例としての住所を識別する「都」、「道」、「府」、「県」、「市」、「町」、「村」、「丁」、「番」、「号」や、出力対象に記載された内容の一例としての会社名を識別する「株式会社」等の特定のキーワードを示す情報が含まれる。
また、記号情報には、例えば、出力対象に記載された内容の一例としての住所を識別する郵便番号を示す「〒」や、出力対象に記載された内容の一例としての金額を識別する「¥」、出力対象に記載された内容の一例としての会社名を識別する「(株)」等の記号を示す情報が含まれる。
抽出手段23は、上述の出力対象に記載された内容を示す情報に応じて、広域領域60から出力対象をさらに抽出する。
また、キーワードを示す情報や記号情報を用いて行を特定する方法は、特定行として複数に亘る行が設定される場合に特に有効である。例えば、図3に示す例において、出力対象を住所として特定行情報311bを「1行目から3行目」と設定されている場合において、住所が2行に亘って記載されているとき、3行目が住所と異なる情報であることを検出するためにキーワードを示す情報や記号情報を用いてもよい。具体的には、3行目に「有限会社」のキーワードが含まれている場合、「1行目から3行目」が上述のように住所であると予め設定されていたとしても、3行目は住所を示す情報ではないとして出力対象から除外してもよい。なお、これらの処理は、抽出手段23が行ってもよい。
また、抽出手段23は、文字の属性や、文字数に応じて、出力対象を抽出してもよい。例えば、抽出手段23は、文字の属性がとして文字が数字であると判断した場合、この文字には金額や郵便番号を示す情報を抽出してもよい。また、抽出手段23は、文字数に基づいて、出力対象の種類を特定してもよい。
<変形例2>
図7は、広域領域60の拡張の一例を示す図である。図7では、読取対象として帳票を読み取った帳票画像6Aを例に挙げて説明する。抽出手段23は、広域領域に出力対象の行に応じた行がない場合、広域領域を予め定められた方向に拡張して新たに広域領域を抽出する。
具体的には、抽出手段23が抽出した広域領域60Aに含まれる行数が特定行に係る行数未満のとき、特定行が含まれるように拡張された広域領域60Bを新たに抽出する。
一例として、特定行情報311bとして「3行目」が設定されている場合を例に説明する。図7に示すように、抽出手段23が抽出した広域領域60Aに含まれる行数が3行未満のとき、特定行である3行目を含むように拡張された広域領域60Bを新たに抽出する(図7の矢印参照)。
以上、本発明の実施の形態を説明したが、本発明の実施の形態は上記実施の形態に限定されるものではなく、本発明の要旨を変更しない範囲内で種々の変形、実施が可能である。例えば、上記の実施の形態では、情報処理装置1が画像読取部5を備える構成を例に挙げて説明したが、画像読取部5は必須の構成ではなく、情報処理装置1が外部の装置で読み取った読取画像を受け付けて処理してもよい。
例えば、上記の実施の形態では、読取画像の全体にOCR処理を施したが、これに限られず、抽出手段23により抽出された広域領域のみに対してOCR処理を施してもよい。また、上記の実施の形態では、横書きの読取対象を前提として行を特定する例を示したが、縦書きの読取対象に対して列を特定することも本発明の範疇に含まれる。
制御部2の各手段は、それぞれ一部又は全部を再構成可能回路(FPGA:Field Programmable Gate Array)、特定用途向け集積回路(ASIC:Application Specific Integrated Circuit)等のハードウエア回路によって構成してもよい。
また、本発明の要旨を変更しない範囲内で、上記実施の形態の要素の一部を省くことや変更することが可能である。また、本発明の要旨を変更しない範囲内で、上記実施の形態のフローにおいて、ステップの追加、削除、変更、入替え等が可能である。また、上記実施の形態で用いたプログラムをCD−ROM等のコンピュータ読み取り可能な記録媒体に記録して提供することができ、クラウドサーバ等の外部サーバに格納しておき、ネットワークを介して利用することもできる。
1…情報処理装置
2…制御部
20…受付手段
21…ゾーン設定手段
22…OCR手段
23…抽出手段
3…記憶部
30…プログラム格納部
31…ゾーン指定データ格納部
310…ゾーン指定データ
311…ゾーン指定情報
311a…領域特定情報
311b…特定行情報
32…結果格納部
4…操作表示部
5…画像読取部
6…請求書画像
6A…帳票画像
60,60A,60B…広域領域
61…宛先情報
611…郵便番号情報
612…住所情報
62…宛名情報
621…会社名情報
622…部署名情報
7…設定画面
71…第1の部分画面
72…第2の部分画面
710…第1の入力欄
720…第2の入力欄
730…第3の入力欄

Claims (6)

  1. 第1の読取画像から出力領域とオブジェクト領域とを含む広域領域を指定する第1の指定手段と、
    指定された前記広域領域内から前記出力領域を指定する第2の指定手段と、
    前記第1の読取画像に対する前記広域領域の位置情報と前記広域領域に対する前記出力領域の位置情報とを取得する位置取得手段と、
    前記広域領域の位置情報と前記出力領域の位置情報とを記憶する記憶手段と、
    前記記憶手段により記憶された前記広域領域の位置情報から、前記第1の読取画像と同一の形式である前記第2の読取画像の広域領域の位置を特定し、前記広域領域の位置と前記記憶手段により記憶された前記出力領域の位置情報から前記第2の読取画像の出力領域を抽出する抽出手段と、
    を備える、情報処理装置。
  2. 前記抽出手段は、前記出力領域の位置情報として、前記広域領域において何行目に位置するかを示す特定行情報に基づいて前記出力領域を抽出する、
    請求項1に記載の情報処理装置。
  3. 前記抽出手段は、前記広域領域に前記出力領域に応じた行がないとき、前記広域領域を予め定められた方向に拡張して広域領域を新たに抽出する、
    請求項1又は2に記載の情報処理装置。
  4. 前記第2の指定手段は、共通の文字列を含む行として前記出力領域を指定する、
    請求項1から3のいずれか1項に記載の情報処理装置。
  5. 前記抽出手段は、前記広域領域に前記出力領域に応じた前記共通の文字列がないとき、前記広域領域を予め定められた方向に拡張して広域領域を新たに抽出する、
    請求項4に記載の情報処理装置。
  6. 出力領域とオブジェクト領域とを含む広域領域の位置情報と出力領域の位置情報とを記憶する記憶手段を備えるコンピュータを、
    第1の読取画像から前記広域領域を指定する第1の指定手段と、
    指定された前記広域領域内から前記出力領域を指定する第2の指定手段と、
    前記第1の読取画像に対する前記広域領域の位置情報と前記広域領域に対する前記出力領域の位置情報とを取得する位置取得手段と、
    前記記憶手段により記憶された前記広域領域の位置情報から、前記第1の読取画像と同一の形式である前記第2の読取画像の広域領域の位置を特定し、前記広域領域の位置と前記記憶手段により記憶された前記出力領域の位置情報から前記第2の読取画像の出力領域を抽出する抽出手段として
    機能させるためのプログラム。
JP2018079719A 2018-04-18 2018-04-18 情報処理装置及びプログラム Active JP7031465B2 (ja)

Priority Applications (3)

Application Number Priority Date Filing Date Title
JP2018079719A JP7031465B2 (ja) 2018-04-18 2018-04-18 情報処理装置及びプログラム
US16/122,904 US11163992B2 (en) 2018-04-18 2018-09-06 Information processing apparatus and non-transitory computer readable medium
CN201910163323.5A CN110390323B (zh) 2018-04-18 2019-03-05 信息处理装置以及计算机可读介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2018079719A JP7031465B2 (ja) 2018-04-18 2018-04-18 情報処理装置及びプログラム

Publications (2)

Publication Number Publication Date
JP2019192959A true JP2019192959A (ja) 2019-10-31
JP7031465B2 JP7031465B2 (ja) 2022-03-08

Family

ID=68238017

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2018079719A Active JP7031465B2 (ja) 2018-04-18 2018-04-18 情報処理装置及びプログラム

Country Status (3)

Country Link
US (1) US11163992B2 (ja)
JP (1) JP7031465B2 (ja)
CN (1) CN110390323B (ja)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP6752864B2 (ja) * 2018-11-20 2020-09-09 キヤノン株式会社 画像処理装置及びその制御方法、プログラム

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008040598A (ja) * 2006-08-02 2008-02-21 Canon Inc 画像入力装置
JP2014044470A (ja) * 2012-08-24 2014-03-13 Rakuten Inc 画像処理装置、画像処理方法、及びプログラム
JP2016122404A (ja) * 2014-12-25 2016-07-07 キヤノン株式会社 情報処理装置、情報処理方法、プログラムおよび記憶媒体
JP2017091419A (ja) * 2015-11-16 2017-05-25 富士ゼロックス株式会社 情報処理装置、画像読み取り装置及びプログラム

Family Cites Families (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS63268081A (ja) * 1987-04-17 1988-11-04 インタ−ナショナル・ビジネス・マシ−ンズ・コ−ポレ−ション 文書の文字を認識する方法及び装置
JP2008052709A (ja) * 2006-07-26 2008-03-06 Canon Inc 画像処理装置、画像処理装置の制御方法およびプログラム
JP4840160B2 (ja) * 2007-01-26 2011-12-21 富士ゼロックス株式会社 印刷データ変換装置及びプログラム
JP2011237840A (ja) * 2010-04-30 2011-11-24 Murata Mach Ltd 文書処理装置
JP5833956B2 (ja) * 2012-03-06 2015-12-16 インターナショナル・ビジネス・マシーンズ・コーポレーションInternational Business Machines Corporation 文書を校正する情報処理装置、方法およびプログラム
JP2014137618A (ja) * 2013-01-15 2014-07-28 Oki Electric Ind Co Ltd 情報処理端末、情報処理システム、情報処理方法、及びプログラム
JP6230878B2 (ja) * 2013-11-06 2017-11-15 株式会社東芝 帳票読取装置、プログラムおよび帳票読取システム
JP2018018303A (ja) * 2016-07-28 2018-02-01 京セラドキュメントソリューションズ株式会社 情報抽出装置及びこれを備えた画像形成装置
JP7225548B2 (ja) * 2018-03-22 2023-02-21 セイコーエプソン株式会社 画像処理装置、画像処理方法および画像処理プログラム

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008040598A (ja) * 2006-08-02 2008-02-21 Canon Inc 画像入力装置
JP2014044470A (ja) * 2012-08-24 2014-03-13 Rakuten Inc 画像処理装置、画像処理方法、及びプログラム
JP2016122404A (ja) * 2014-12-25 2016-07-07 キヤノン株式会社 情報処理装置、情報処理方法、プログラムおよび記憶媒体
JP2017091419A (ja) * 2015-11-16 2017-05-25 富士ゼロックス株式会社 情報処理装置、画像読み取り装置及びプログラム

Also Published As

Publication number Publication date
CN110390323B (zh) 2023-09-05
US20190325210A1 (en) 2019-10-24
CN110390323A (zh) 2019-10-29
US11163992B2 (en) 2021-11-02
JP7031465B2 (ja) 2022-03-08

Similar Documents

Publication Publication Date Title
US20090106699A1 (en) Image processing device and image processing method
JP2007049388A (ja) 画像処理装置及びその制御方法、プログラム
US11907651B2 (en) Information processing apparatus, information processing method, and storage medium
JP2018098705A (ja) 画像処理装置及びその制御方法並びにプログラム
JP5623574B2 (ja) 帳票識別装置および帳票識別方法
JP2015167001A (ja) 情報処理プログラム、情報処理装置、情報処理システム、情報処理方法、画像処理装置及び画像処理システム
JP2022162908A (ja) 画像処理装置、画像処理方法、およびプログラム
JP6931168B2 (ja) 情報処理装置、制御方法、プログラム
JP2019192959A (ja) 情報処理装置及びプログラム
JP2018055256A (ja) 情報処理装置、情報処理方法及びプログラム
JP6322086B2 (ja) 表示制御装置、表示装置、プログラム、記録媒体
JP2009031937A (ja) 帳票画像処理装置及び帳票画像処理プログラム
US11206336B2 (en) Information processing apparatus, method, and non-transitory computer readable medium
US9400926B2 (en) Image processing apparatus, image processing method, and non-transitory computer readable medium
JP2007011529A (ja) Ocr処理における文字認識位置の決定方法
JP6947971B2 (ja) 情報処理装置、制御方法、プログラム
JPWO2016170690A1 (ja) 入力制御プログラム、入力制御装置、入力制御方法、文字修正プログラム、文字修正装置、及び文字修正方法
JP4823049B2 (ja) 文書画像検索装置及びプログラム
JP6682827B2 (ja) 情報処理装置及び情報処理プログラム
JP2008123446A (ja) ログ情報管理システム、ログ情報管理装置、ログ情報管理方法及びログ情報管理プログラム
JP6536542B2 (ja) 情報処理装置、制御方法、プログラム
US20190325245A1 (en) Information processing apparatus and non-transitory computer readable medium storing program
JP2017016290A (ja) 画像処理装置及び画像処理プログラム
JP6143705B2 (ja) 画像処理装置および画像形成装置
JP4241820B2 (ja) 文字認識方法および文字認識システム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20210319

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20211115

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20211124

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20220111

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20220125

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20220207

R150 Certificate of patent or registration of utility model

Ref document number: 7031465

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150