JP6950252B2 - 画像処理装置及びプログラム - Google Patents

画像処理装置及びプログラム Download PDF

Info

Publication number
JP6950252B2
JP6950252B2 JP2017078339A JP2017078339A JP6950252B2 JP 6950252 B2 JP6950252 B2 JP 6950252B2 JP 2017078339 A JP2017078339 A JP 2017078339A JP 2017078339 A JP2017078339 A JP 2017078339A JP 6950252 B2 JP6950252 B2 JP 6950252B2
Authority
JP
Japan
Prior art keywords
image
contour
images
reading
target
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2017078339A
Other languages
English (en)
Other versions
JP2018182504A (ja
Inventor
晋太郎 西岡
晋太郎 西岡
啓太 浅井
啓太 浅井
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujifilm Business Innovation Corp
Original Assignee
Fuji Xerox Co Ltd
Fujifilm Business Innovation Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fuji Xerox Co Ltd, Fujifilm Business Innovation Corp filed Critical Fuji Xerox Co Ltd
Priority to JP2017078339A priority Critical patent/JP6950252B2/ja
Publication of JP2018182504A publication Critical patent/JP2018182504A/ja
Application granted granted Critical
Publication of JP6950252B2 publication Critical patent/JP6950252B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Character Input (AREA)
  • Image Processing (AREA)
  • Editing Of Facsimile Originals (AREA)

Description

本発明は、画像処理装置及びプログラムに関する。
近年、分割された複数の画像を合成する画像処理装置が提案されている(例えば、特許文献1参照。)。
特許文献1に記載された画像合成装置は、スキャンする対象物を保持した状態でスキャナにセットされ対象物とともに複数回に分割してスキャンされるシートであって、スキャナへの位置決め用の基準位置を表す画像、および対象物の一部分の当該対象物上での位置を特定するための番号を表す位置判別画像が、複数の異なる位置に印刷されたシートから、対象物の一部分の画像と位置判別画像とを含む複数の分割画像を取得する画像取得部と、画像取得部により取得された分割画像毎に位置判別画像のパターン認識を行うパターン認識部と、パターン認識部による認識結果に基づいて、複数の分割画像を配列させた合成画像を生成する画像合成部と、を具備する。
特許第4901928号公報
本発明の課題の1つは、1つの原稿が2つ以上の画像に分けて読み取られた場合であっても、原稿内容を踏まえずに複数の画像を1つの原稿の画像に合成する場合よりも、合成画像の精度を向上させることが可能な画像処理装置及びプログラムを提供することにある。
[1]読取対象に対して、読取範囲から一部が外れて読み取られた第1の画像と、前記一部が含まれるように読み取られた第2の画像を取得する取得手段と、
前記第1及び第2の画像に対して文字認識処理を行う認識手段と、
前記文字認識処理により得られた文字情報に基づいて、前記第1及び前記第2の画像から前記読取対象に対応する合成画像を生成する生成手段と、を備え
前記生成手段は、前記第1及び前記第2の画像の記載内容が整合した場合として、前記第1及び前記第2の画像間で前記記載内容中の項目を合計した合計項目数が整合した場合に、前記第1及び前記第2の画像から前記合成画像を生成する画像処理装置。
]コンピュータを、読取対象に対して、読取範囲から一部が外れて読み取られた第1の画像と、前記一部が含まれるように読み取られた第2の画像を取得する取得手段と、
前記第1及び前記第2の画像に対して文字認識処理を行う認識手段と、
前記文字認識処理により得られた文字情報に基づいて、前記第1及び前記第2の画像から前記読取対象に対応する合成画像を生成する生成手段として、機能させるためのプログラムであって、
前記生成手段は、前記第1及び前記第2の画像の記載内容が整合した場合として、前記第1及び前記第2の画像間で前記記載内容中の項目を合計した合計項目数が整合した場合に、前記第1及び前記第2の画像から前記合成画像を生成するプログラム。
請求項1、に係る発明によれば、1つの原稿が2つ以上の画像に分けて読み取られた場合であっても、原稿内容を踏まえずに複数の画像を1つの原稿の画像に合成する場合よりも、合成画像の精度を向上させることが可能になり、また、レシートの場合に、記載内容に整合がない画像の合成を除くことで、合成画像の精度を向上させることが可能になる。
図1は、本発明の第1の本実施の形態に係る画像処理装置の制御系の一例を示すブロック図である。 図2(a)〜(c)は、読取対象とその読取画像の一例を示す図である。 図3は、読取画像の一例を示す図であり、(a)は、第1の読取画像の一例を示す図、(b)は、第2の読取画像の一例を示す図である。 図4(a)〜(c)は、第1の実施の形態に係る画像処理装置の結果の一例を示すテーブルである。 図5は、第1の実施の形態に係る画像処理装置の動作の一例を示すフローチャートである。 図6は、第2の実施の形態に係る画像処理装置の動作の一例を示すフローチャートである。
以下、本発明の実施の形態について図面を参照して説明する。なお、各図中、実質的に同一の機能を有する構成要素については、同一の符号を付してその重複した説明を省略する。
[実施の形態の要約]
本実施の形態に係る画像処理装置は、読取対象に対して、読取範囲から一部が外れて読み取られた第1の画像と、この一部が含まれるように読み取られた第2の画像を取得する取得手段と、第1及び第2の画像に対して文字認識処理を行う認識手段と、文字認識処理により得られた文字情報に基づいて、第1及び第2の画像から読取対象に対応する合成画像を生成する生成手段と、を備える。
画像処理装置は、画像を読み取る読取機能を有するものであれば、例えば、スキャナや、多機能携帯電話機(スマートフォン)等でもよい。
読取対象には、例えば、伝票などの帳票やレシート等が含まれる。読取対象は、主に長方形を有しているものであるが、正方形を有しているものでもよい。この読取対象には、読取範囲に収まらない大きさを有しているものが含まれる。読取範囲とは、画像処理装置の画像読取部が読み取る範囲をいう。読取範囲は、最大の場合(例えば、原稿台の読取面の全体の範囲)もあれば、操作者により設定されたA4、B5等の規格で表される範囲の場合もある。
文字認識処理とは、読取対象が含まれる画像に対して、例えば、OCR(Optical Character Recognition)を実行することにより、読取対象に含まれる文字情報を取得する処理をいう。
文字情報とは、文字認識処理により取得する文字に関する情報をいう。文字情報には、例えば、文字そのもの、文字列、文字数、どんな単語が記載されているか等の記載内容に関する情報や、文字の位置を示す位置情報等が含まれる。
[第1の実施の形態]
(画像処理装置の構成)
図1は、本発明の第1の実施の形態に係る画像処理装置1の制御系の一例を示すブロック図である。この画像処理装置1は、画像処理装置1の各部を制御する制御部10と、各種のデータを記憶する記憶部12と、情報の入力及び表示を行う操作表示部13、読取対象を読み取る画像読取部14と、端末装置2及び外部装置3との間でネットワーク4を介して通信する通信部15とを備える。
制御部10は、CPU(Central Processing Unit)、インターフェース等から構成されている。CPUは、プログラム格納部120に格納されたプログラムに従って動作することにより、受付手段100、輪郭検出手段101、外周接触部検出手段102、回転処理手段103、認識手段104、算出手段105、生成手段106、出力手段107、表示手段108等として機能する。受付手段100、輪郭検出手段101、外周接触部検出手段102、及び回転処理手段103は、取得手段の一例である。各手段100〜108の詳細については後述する。
記憶部12は、ROM(Read Only Memory)、RAM(Random Access Memory)、ハードディスク等から構成され、プログラムを格納するプログラム格納部120、画像データを格納する画像データ格納部121、結果情報を格納する結果情報格納部122等を有する。
画像読取部14は、読取対象を光学的に読み取り、読み取った画像(以下、「読取画像」ともいう。)を受付手段100に渡す。
通信部15は、ネットワーク4を介して、外部装置3との間で信号を送受信する。外部装置3には、例えば、パーソナルコンピュータ、サーバ装置等が含まれる。
ネットワーク4は、例えば、ローカルエリアネットワーク(LAN)、インターネット等であり、有線でも無線でもよい。
各手段100〜108の詳細について、図2を参照して説明する。図2は、読取対象とその読取画像の一例を示す図である。
図2(a)は、読取対象の一例を示す図である。図2(a)に示すように、読取対象20は、長方形の形状を有する帳票である。図2(b)は、読取対象20に対して、読取対象20の一部が読取範囲50から外れて読み取られた第1の読取画像30の一例を示す。図2(c)は、第1の読取画像30から外れた一部が含まれるように読み取られた第2の読取画像40の一例を示す。なお、この読取対象20には、金額等に関する情報が横書き(図示左右方向)で長手方向に並んで記載されているものとして説明するが、これに限定されるものではない。また、図2(b)に示す第1の読取画像30及び図2(c)に示す第2の読取画像40には、それぞれ読取対象20が1つの含まれる例を示しているが、これに限定されるものではなく、複数の読取対象が含まれるものでもよい。
受付手段100は、画像読取部14が読み取った読取画像を受け付ける。具体的には、受付手段100は、画像読取部14が読み取った第1の読取画像30を受け付けるとともに、画像読取部14が読み取った第2の読取画像40を受け付ける。
輪郭検出手段101は、受付手段100が受け付けた読取画像から読取対象20の輪郭を検出し、読取画像から読取対象20の輪郭で囲まれた領域の画像(以下、「輪郭画像」ともいう。)を切り出す。具体的には、輪郭検出手段101は、受付手段100が受け付けた第1の読取画像30から、読取対象20の第1の輪郭画像31(図2(b)の実線参照)を切り出すとともに、第2の読取画像40から、読取対象20の輪郭画像である第2の輪郭画像41(図2(c)の実線参照)を切り出す。
外周接触部検出手段102は、読取対象20の外周接触部を抽出する。ここで、外周接触部とは、読取範囲50の縁部で読み取られた読取対象20の部分をいう。具体的には、外周接触部検出手段102は、第1の輪郭画像31から第1の外周接触部33を抽出するとともに、第2の輪郭画像41から第2の外周接触部43を抽出する。
回転処理手段103は、輪郭検出手段101により切り出された輪郭画像の傾きの程度を示す量(以下、「スキュー量」ともいう。)を求め、このスキュー量に基づいて輪郭画像を回転して輪郭画像の傾きを補正する(以下、「スキュー補正」ともいう。)。具体的には、回転処理手段103は、輪郭検出手段101により切り出された第1の輪郭画像31のスキュー量を求め、このスキュー量に基づいて第1の輪郭画像31を回転して第1の輪郭画像31の傾きを補正するとともに、第2の輪郭画像41のスキュー量を求め、このスキュー量に基づいて第2の輪郭画像41を回転して第2の輪郭画像41の傾きをそれぞれ補正する。
スキュー補正後の第1の輪郭画像31は、読取対象20に対して、読取範囲50から一部21(図2(a)の破線枠参照)が外れて読み取られた第1の画像の一例である。また、スキュー補正後の第2の輪郭画像41は、読取対象20に対して、第1の輪郭画像31で読取範囲50から外れて読み取られた一部21が含まれるように読み取られた第2の画像の一例である。
認識手段104は、輪郭画像に対して文字認識処理を実行し、輪郭画像に含まれる読取対象に記載されている文字情報を取得する。具体的には、認識手段104は、第1の輪郭画像31について、OCR処理を実行し、第1の輪郭画像31に含まれる読取対象20に記載されている文字情報320(以下、「第1の文字情報320」ともいう。)を取得するとともに、第2の輪郭画像41について、OCR処理を実行し、第2の輪郭画像41に含まれる読取対象20に記載されている文字情報420(以下、「第2の文字情報420」ともいう。)を取得する。
認識手段104は、外周接触部検出手段102により抽出された外周接触部に最も近い位置に記載された文字列(以下、「最端の文字列」ともいう。)を抽出する。具体的には、認識手段104は、第1の輪郭画像31から第1の外周接触部33に最も近い位置に記載された文字列321(以下、「第1の最端の文字列321」ともいう。)を抽出するとともに、第2の輪郭画像41から第2の外周接触部43に最も近い位置にある最端の文字列421(以下、「第2の最端の文字列421」ともいう。)を抽出する。認識手段104は、図2(b)に示す例では、第1の最端の文字列321として「個数 3個」(2点鎖線枠参照)を抽出し、図2(c)に示す例では、第2の最端の文字列421として「ishiyama」(点線枠参照)を抽出する。
認識手段104は、異なる読取画像に含まれる2つの輪郭画像間において、一方の輪郭画像に含まれる最端の文字列が他方の輪郭画像に含まれるか否かを判断するとともに、他方の輪郭画像に含まれる最端の文字列が一方の輪郭画像に含まれるか否かを判断する。具体的には、認識手段104は、第2の輪郭画像41に第1の最端の文字列321と同じ文字列321Aが含まれるか否か、及び第1の輪郭画像31に第2の最端の文字列421と同じ文字列421Aが含まれるか否かを判断する。
認識手段104は、異なる読取画像に含まれる2つの輪郭画像間において、一方の輪郭画像に他方の輪郭画像の最端の文字列が含まれ、他方の輪郭画像に一方の輪郭画像の最端の文字列が含まれると判断したときに、この2つの輪郭画像を合成対象に決定する。具体的には、認識手段104は、第1の輪郭画像31に第2の文字列421と同じ文字列421A(例えば、「ishiyama」)が含まれ、かつ、第2の輪郭画像41に第1の文字列321と同じ文字列321A(例えば、「個数 3個」)が含まれれば、認識手段104は、この第1の輪郭画像31及び第2の輪郭画像を合成対象に決定する。
算出手段105は、異なる読取画像に含まれる2つの輪郭画像間において、互いに重複する範囲(以下、「重複範囲」ともいう。)に記載されている記載内容の一致の度合い(以下、「合成度」ともいう。)を算出する。ここで、重複範囲とは、2つの輪郭画像のうち一方の読取画像において、外周接触部の位置から他方の読取画像の最端の文字列が記載された位置までの範囲をいう。なお、重複範囲は、2つの輪郭画像のうち他方の読取画像において、外周接触部の位置から一方の読取画像の最端の文字列が記載された位置までの範囲としてもよい。また、記載内容の一致の度合いとは、例えば、重複範囲に記載されている文字列が2つの輪郭画像間で互いに一致する割合をいう。
算出手段105は、算出した合成度が予め定められた閾値(例えば、90%)以上か否かを判断する。予め定められた閾値は、操作者により与えられる。予め定められた閾値は、合成画像の精度の目的値に応じて定めればよい。
具体的には、算出手段105は、第1の輪郭画像31の長手方向において、第1の外周接触部33の位置から第2の文字列421と同じ文字列421A(「ishiyama」)が記載された位置までの第1の範囲32(図2(b)の1点鎖線枠参照)に記載されている文字列と、第2の輪郭画像41の長手方向において、第2の外周接触部43が記載された位置から第1の文字列321と同じ文字列321A(「個数 3個」)が記載された位置までの第2の範囲42(図2(c)の1点鎖線枠参照)に記載されている文字列との一致の割合を算出する。第1の範囲32及び第2の範囲42は、重複範囲の一例である。
算出手段105は、算出した合成度を結果情報格納部122に格納する。
生成手段106は、合成度が予め定められた閾値以上と判断した場合、認識手段104により得られた文字情報に基づいて、読取対象に対応する合成画像を生成する。具体的には、生成手段106は、算出手段105により算出された合成度が予め定められた閾値以上のときに、第1の輪郭画像31と第2の輪郭画像41とを合成して合成画像を生成する。
生成手段106は、合成画像を生成するとき、異なる読取画像に含まれる2つの輪郭画像間において、重複範囲に記載された文字同士の重なり合いや、輪郭同士の重なり合い、ロゴ情報の有無等の特徴量を抽出するとともに、2つの輪郭画像の罫線等を抽出するレイアウト解析を行う。生成手段106は、レイアウト解析の結果や抽出された特徴量に基づいて、2つの輪郭画像を合成する。
出力手段107は、生成手段106により合成された合成画像を外部装置3に出力する。出力手段107は、合成画像を画像データ格納部121に格納する。
表示手段108は、合成画像を生成する合成対象を操作表示部13に表示する。外部装置3がパーソナルコンピュータの場合は、表示手段108は、外部装置3の表示部(不図示)に合成対象を表示してもよい。表示手段108は、生成手段106により2つの輪郭画像が合成された場合、合成された合成画像を合成対象とともに操作表示部13に表示する。表示手段108は、生成手段106が合成画像を生成しなかった場合に、エラーの内容を示すエラーメッセージ(警告)を表示する。
(第1の実施の形態の動作)
次に、画像処理装置1の動作の一例について図3〜図5を参照して説明する。図5は、画像処理装置1の動作の一例を示すフローチャートである。
(1)読取対象の読み取り
操作者は、読取対象20を画像処理装置1の図示しない原稿台に配置し、例えば、操作表示部13のスタートボタンを押下する等のスキャン開始を画像処理装置1に指示する操作を行う。操作者は、読取対象20の一部が読取範囲50から外れるように読取対象20を配置してもよく、複数の読取対象20を並べて配置してもよい。
操作者によるスキャンを開始する指示を受け付けると、画像読取部14は、読取対象20を読み取り(S1)、読み取られた第1の読取画像30を受付手段100に渡す。
図3(a)は、第1の読取画像の一例を示す図である。図3(a)中の「A01」等の文字は、読取対象20A,20B,20CのIDを示す。図3(a)に示すように、読み取られた第1の読取画像30には、複数の読取対象20A,20B,20Cが含まれる。
次に、操作者は、再び、読取対象20を画像処理装置1の原稿台に配置し、スキャン開始を画像処理装置1に指示する操作を行う。なお、第1の読取画像30で読取対象20の一部が読取範囲50から外れて読み取られた場合は、操作者は、当該一部が読取範囲50に含まれるように読取対象20を配置する。また、複数の読取対象20のうちの一部は、第1の読取画像に含まれる複数の読取対象20と異なるものであってもよい。
操作者によるスキャンを開始する指示を受け付けると、画像読取部14は、読取対象20を読み取り(S1)、読み取られた第2の読取画像40を受付手段100に渡す。
図3(b)は、第2の読取画像の一例を示す図である。図3(b)中の「B01」等の文字は、読取対象20D,20EのIDを示す。図3(b)に示すように、読み取られた第2の読取画像40には、複数の読取対象20D,20Eが含まれる。
(2)輪郭画像の切り出し
次に、輪郭検出手段101は、受付手段100が受け付けた第1の読取画像30から読取対象20A,20B,20Cの第1の輪郭画像31A,31B,31Cをそれぞれ切り出すとともに、受付手段100が受け付けた第2の読取画像40から読取対象20D,20Eの第2の輪郭画像41D,41Eをそれぞれ切り出す(S2)。
次に、回転処理手段103は、第1の輪郭画像31A,31B,31Cのスキュー量をそれぞれ求め、スキュー量に基づいて第1の輪郭画像31A,31B,31Cをそれぞれ回転し、第1の輪郭画像31A,31B,31Cの傾きを補正するとともに、第2の輪郭画像41D,41Eのスキュー量をそれぞれ求め、スキュー量に基づいて第2の輪郭画像41D,41Eをそれぞれ回転し、第2の輪郭画像41D,41Eの傾きを補正する。
(3)外周接触部の抽出
次に、外周接触部検出手段102は、第1の輪郭画像31A,31B,31C及び第2の輪郭画像41D,41Eから外周接触部を抽出する(S3)。
図4(a)は、外周接触部検出手段102による、外周接触部の抽出の結果を示す外周接触部抽出結果テーブルを示す。「読取対象のID」の欄には、第1及び第2の輪郭画像に対応する読取対象のIDが示されている。「外周接触部」の欄には、外周接触部の抽出の有無が示されている。図4(a)に示すように、外周接触部検出手段102は、IDがA02,A03,B01,B02の読取対象20B,20C,20D,20Eで外周接触部を抽出し、一方、IDがA01の読取対象20Aでは外周接触部を抽出しない。
次に、外周接触部検出手段102が外周接触部を抽出すれば(S4:Yes)、外周接触部が抽出された読取対象20B,20Cを含む第1の輪郭画像31B,31C、及び外周接触部が抽出された読取対象20D,20Eを含む第2の輪郭画像41D,41Eについて、OCR処理を行う(S5)。そして、認識手段104は、読取対象20B,20C、20D,20Eに含まれる最端の文字列(不図示)をそれぞれ抽出する(S6)。
(4)合成対象の決定
次に、認識手段104は、外周接触部が検出された第1の輪郭画像31B,31C、及び外周接触部が検出された第2の輪郭画像41D,41E間において、互いの最端の文字列を含む一対の輪郭画像があるか否かを判断する(S7)。
互いの最端の文字列を含む一対の輪郭画像があれば(S7:Yes)、認識手段104は当該一対の輪郭画像を合成対象に決定する(S8)。
次に、表示手段108は、これら合成対象を操作表示部13に表示する。
次に、算出手段105は、合成対象に決定された一対の輪郭画像間の重複範囲の合成度を算出する(S9)。次に、算出手段105は、算出した合成度を結果情報格納部122に格納する。
図4(b)は、合成度の算出結果の一例を示す合成度結果テーブルを示す。図4(b)に示すように、IDが「A02」の読取対象20Bに対応する第1の輪郭画像31BとIDが「B01」の読取対象20Dに対応する第2の輪郭画像41Dとの間(以下、単に「A02−B01」ともいう。以下、同様)で算出された合成度は、93%、A03−B01で算出された合成度は、82%、A02−B02で算出された合成度は、78%、A03−B02で算出された合成度は、95%である。
合成対象となる一対の輪郭画像が複数検出されれば、算出手段105は、個々の合成度を組み合わせて、新たな合成度(以下、「組み合わせ合成度」ともいう。)を算出してもよい。図4(c)は、上記の合成度を組み合わせた結果の一例を示す合成度の組み合わせ結果テーブルを示す。「読取対象の組み合わせ」の欄には、合成対象となる一対の輪郭画像に対応する読取対象のIDが示されている。「合成度」の欄には、算出された組み合わせ合成度が示されている。算出手段105は、例えば、上記の合成度の結果の掛け算により組み合わせ合成度を算出してもよい。図4(c)に示すように、A02−B01及びA03−B02の組み合わせでは、合成度は、93%x95%=88%、A03−B01及びA02−B02の組み合わせでは、合成度は、82%x78%=64%である。
(5)合成画像の生成
次に、算出手段105は、上記の合成度(組み合わせ合成度が算出されている場合は、組み合わせ合成度)が予め定められた閾値(例えば、90%)以上か否かを判断する(S10)ことにより、合成対象を合成するか否かを判断する。
合成度が予め定められた閾値以上であれば(S10:Yes)、生成手段106は、合成対象を合成する(S11)。上述の例では、生成手段106は、第1の輪郭画像31B,31Cと第2の輪郭画像41D,41Eとを合成して合成画像を生成する。
(6)結果の出力
出力手段107は、合成画像を出力する(S12)。具体的には、出力手段107は、合成画像を外部装置3に出力するとともに、画像データ格納部121に格納する。表示手段108は、合成画像を操作表示部13に表示する。
表示手段108は、各種のエラーメッセージを操作表示部13に表示する(S13)。具体的には、互いの最端の文字列を含む輪郭画像の組がなければ(S7:No)、合成対象が無いことを表示する。また、算出手段105が算出した合成度が予め定められた閾値未満であれば(S10:No)、その旨を表示する。また、合成度が予め定められた閾値以上であったとしても、生成手段106が上述したレイアウト解析や特徴量に基づく合成ができなかった場合、その旨を表示する。
図2(a)、(b)に示すように、読取範囲から一部が外れて読み取られた第1の輪郭画像31、及び当該一部が含まれるように読み取られた第2の輪郭画像41については、図2(a)に示す読取対象20に対応する合成画像を生成することができる。
[第2の実施の形態]
第2の実施の形態について図6を参照して説明する。図6は、本発明の第2の実施の形態に係る画像処理装置の動作の一例を示すフローチャートである。第2の実施の形態では、算出手段105が2つの輪郭画像間で記載内容が整合するか否かの判断を行う点で、第1の実施の形態と相違する。以下、第1の実施の形態と異なる点を中心に説明する。なお、第2の実施の形態では、読取対象20をレシートとして説明する。また、画像処理装置1は、読取対象20がレシートであることは、例えば、操作者により入力操作により認識する。
算出手段105は、第1の実施の形態で説明した機能に加えて、異なる読取画像に含まれる2つの輪郭画像間において重複範囲の記載内容を抽出する。ここで、記載内容には、例えば、図2(b)、(c)に示すような、単価を示す単価情報323,423、単価を合計した金額、すなわち小計を示す小計情報324,424、消費税等の税情報325,425(内税で表示されたものでも外税で表示されたものでもよい)や、図示はないが、購入した商品の個数を示す個数情報等が含まれる。商品は、記載内容中の項目の一例である。
算出手段105は、抽出した記載内容に基づいて、第1の輪郭画像31に含まれる読取対象20における支払いの合計の金額(以下、「総計金額」ともいう。)を算出するとともに、第2の輪郭画像41に含まれる読取対象20における総計金額を算出する。
生成手段106は、認識手段104により得られた文字情報に基づいて、読取対象に対応する合成画像を生成する。具体的には、生成手段106は、算出手段105が算出した総計金額が一致する場合に、第1の輪郭画像31と第2の輪郭画像41と合成して合成画像を生成する。算出した総計金額が一致することは、記載内容が整合することの一例である。
(第2の実施の形態の動作)
第2の実施の形態に係る画像処理装置1の動作の一例について、図6に示すフローチャートに従って説明する。ステップS21からS28までは、第1の実施の形態におけるステップS1からS8までと同様に動作する。すなわち、画像読取部14により読取対象20が読み取られ(S21)、読取対象20の輪郭画像が切り出され(S22)、外周接触部が抽出される(S23)。外周接触部が抽出されれば(S24:Yes)、OCR処理が施され(S25)、最端の文字列が抽出される(S26)。第1の輪郭画像及び第2の輪郭画像に、互いの最端の文字列が含まれれば(S27:Yes)、第1の輪郭画像31及び第2の輪郭画像41は合成対象として決定される(S28)。
次に、算出手段105は、第1の範囲32及び第2の範囲42から、それぞれ金額、個数等の情報を抽出する(S29)。次に、算出手段105は、抽出した情報に基づいて総計金額を算出する。
次に、算出手段105は、算出した総計金額が第1の輪郭画像31及び第2の輪郭画像41間で一致するか否かを判断する(S30)。
次に、総計金額が第1の輪郭画像31及び第2の輪郭画像41間で一致すれば(S30:Yes)、以下、ステップS31及びS32で、第1の実施の形態におけるステップS11及びS12と同様に動作する。すなわち、合成対象が合成され(S31)、合成画像が出力される(S32)。
表示手段108は、各種のエラーメッセージを操作表示部13に表示する(S33)。第1の実施の形態で説明した内容に加えて、算出手段105が算出した総計金額が第1の輪郭画像31及び第2の輪郭画像41間で一致しなければ(S30:No)、その旨を操作表示部13に表示する。
<変形例>
上述の第2の実施の形態では、生成手段106は、第1の輪郭画像31及び第2の輪郭画像41間で総計金額一致する場合に合成対象を合成したが、これに限定されるものではなく、例えば、第1の輪郭画像31及び第2の輪郭画像41間で、商品の個数の合計数が一致した場合に合成対象を合成してもよい。商品の個数の合計数は、総計数の一例である。
以上、本発明の実施の形態を説明したが、本発明の実施の形態は上記実施の形態に限定されるものではなく、本発明の要旨を変更しない範囲内で種々の変形、実施が可能である。
制御部10の各手段は、それぞれ一部又は全部を再構成可能回路(FPGA:Field Programmable Gate Array)、特定用途向け集積回路(ASIC:Application Specific Integrated Circuit)等のハードウエア回路によって構成してもよい。
また、本発明の要旨を変更しない範囲内で、上記実施の形態の構成要素の一部を省くことや変更することが可能である。また、本発明の要旨を変更しない範囲内で、上記実施の形態のフローにおいて、ステップの追加、削除、変更、入替え等が可能である。また、上記実施の形態で用いたプログラムをCD−ROM等のコンピュータ読み取り可能な記録媒体に記録して提供することができ、クラウドサーバ等の外部サーバに格納しておき、ネットワークを介して利用することもできる。
1…画像処理装置、2…端末装置、3…外部装置、4…ネットワーク、
10…制御部、12…記憶部、13…操作表示部、
14…画像読取部、15…通信部、20…読取対象、
20,20A,20B,20C,20D,20E…読取対象、21…一部、
30…第1の読取画像、31,31A,31B,31C…第1の輪郭画像、
32…第1の範囲、33…第2の外周接触部、40…第2の読取画像、
41,41D,41E…第2の輪郭画像、42…第2の範囲、
43…第2の外周接触部、50…読取範囲、100…受付手段、
101…輪郭検出手段、102…外周接触部検出手段、103…回転処理手段、
104…認識手段、105…算出手段、106…生成手段、107…出力手段、
108…表示手段、120…プログラム格納部、121…画像データ格納部、
122…結果情報格納部、320…第1の文字情報、321…第1の最端の文字列、
321A,421A…文字列、323,423…単価情報、
324,424…小計情報、325,425…税情報、420…第2の文字情報、
421…第2の最端の文字列

Claims (2)

  1. 読取対象に対して、読取範囲から一部が外れて読み取られた第1の画像と、前記一部が含まれるように読み取られた第2の画像を取得する取得手段と、
    前記第1及び第2の画像に対して文字認識処理を行う認識手段と、
    前記文字認識処理により得られた文字情報に基づいて、前記第1及び前記第2の画像から前記読取対象に対応する合成画像を生成する生成手段と、を備え
    前記生成手段は、前記第1及び前記第2の画像の記載内容が整合した場合として、前記第1及び前記第2の画像間で前記記載内容中の項目を合計した合計項目数が整合した場合に、前記第1及び前記第2の画像から前記合成画像を生成する画像処理装置。
  2. コンピュータを、
    読取対象に対して、読取範囲から一部が外れて読み取られた第1の画像と、前記一部が含まれるように読み取られた第2の画像を取得する取得手段と、
    前記第1及び前記第2の画像に対して文字認識処理を行う認識手段と、
    前記文字認識処理により得られた文字情報に基づいて、前記第1及び前記第2の画像から前記読取対象に対応する合成画像を生成する生成手段として、機能させるためのプログラムであって、
    前記生成手段は、前記第1及び前記第2の画像の記載内容が整合した場合として、前記第1及び前記第2の画像間で前記記載内容中の項目を合計した合計項目数が整合した場合に、前記第1及び前記第2の画像から前記合成画像を生成するプログラム。
JP2017078339A 2017-04-11 2017-04-11 画像処理装置及びプログラム Active JP6950252B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2017078339A JP6950252B2 (ja) 2017-04-11 2017-04-11 画像処理装置及びプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2017078339A JP6950252B2 (ja) 2017-04-11 2017-04-11 画像処理装置及びプログラム

Publications (2)

Publication Number Publication Date
JP2018182504A JP2018182504A (ja) 2018-11-15
JP6950252B2 true JP6950252B2 (ja) 2021-10-13

Family

ID=64276105

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2017078339A Active JP6950252B2 (ja) 2017-04-11 2017-04-11 画像処理装置及びプログラム

Country Status (1)

Country Link
JP (1) JP6950252B2 (ja)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2020144451A (ja) * 2019-03-04 2020-09-10 株式会社Epark サービス提供装置、サービス提供方法およびプログラム
CN110933300B (zh) * 2019-11-18 2021-06-22 深圳传音控股股份有限公司 一种图像处理方法和电子终端设备

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3316445B2 (ja) * 1998-01-19 2002-08-19 三菱重工業株式会社 画像合成装置
JP3821267B2 (ja) * 1999-01-18 2006-09-13 富士通株式会社 文書画像結合装置、文書画像結合方法及び文書画像結合プログラムを記録した記録媒体
JP2005326972A (ja) * 2004-05-12 2005-11-24 Sun Corp 購入情報管理装置
JP2008288783A (ja) * 2007-05-16 2008-11-27 Ricoh Co Ltd 画像処理装置、画像読取装置、画像処理プログラム及び記録媒体
JP4901928B2 (ja) * 2009-09-14 2012-03-21 株式会社東芝 画像合成方法、画像合成装置及びプログラム
US9386235B2 (en) * 2013-11-15 2016-07-05 Kofax, Inc. Systems and methods for generating composite images of long documents using mobile video data

Also Published As

Publication number Publication date
JP2018182504A (ja) 2018-11-15

Similar Documents

Publication Publication Date Title
EP3570149B1 (en) Augmented reality system and method for displaying an item image in a contextual environment
US8655107B2 (en) Signal processing apparatus, signal processing method, computer-readable medium and computer data signal
JP5847117B2 (ja) 認識辞書作成装置及び認識辞書作成プログラム
JP6439566B2 (ja) 多言語表示装置、多言語表示システム、多言語表示方法及び多言語表示プログラム
US20150023555A1 (en) Commodity recognition apparatus and commodity recognition method
JP6921522B2 (ja) 画像処理装置及びその制御方法並びにプログラム
JP6950252B2 (ja) 画像処理装置及びプログラム
WO2011129113A1 (ja) 帳票処理装置及び帳票処理方法及び記録媒体
US20150304510A1 (en) Electronic document generation system and recording medium
JP2021043775A (ja) 情報処理装置及びプログラム
JP2023041760A (ja) 登録装置、登録方法及びプログラム
JP5802524B2 (ja) 画像処理装置、画像処理方法、および画像処理プログラム
US11436733B2 (en) Image processing apparatus, image processing method and storage medium
JP2021012589A (ja) 画像処理装置、画像処理方法及びプログラム
JP6201638B2 (ja) 帳票処理装置及びプログラム
CN110991451B (zh) 扫描图像的卡片区域图像的校正方法及装置
JP5223739B2 (ja) 携帯式文字認識装置、文字認識プログラム及び文字認識方法
JP6864827B2 (ja) 画像処理装置及びプログラム
JP6724547B2 (ja) 情報処理装置、情報処理方法及び情報処理プログラム
JP6926536B2 (ja) 画像処理装置及びプログラム
KR101561443B1 (ko) 히스토그램을 이용한 문서 이미지 보정 방법 및 장치
JP2015114806A (ja) 画像処理装置及びプログラム
JP5804430B2 (ja) 書籍情報処理装置、書籍情報処理方法、およびプログラム
JP6447755B2 (ja) 画像処理装置および画像処理方法
JP2018121229A (ja) 画像補正装置、画像補正方法、およびコンピュータプログラム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20200228

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20210121

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20210209

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20210406

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20210824

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20210906

R150 Certificate of patent or registration of utility model

Ref document number: 6950252

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150