JP6984440B2 - 画像処理装置、画像処理方法、及び画像処理プログラム - Google Patents

画像処理装置、画像処理方法、及び画像処理プログラム Download PDF

Info

Publication number
JP6984440B2
JP6984440B2 JP2018010767A JP2018010767A JP6984440B2 JP 6984440 B2 JP6984440 B2 JP 6984440B2 JP 2018010767 A JP2018010767 A JP 2018010767A JP 2018010767 A JP2018010767 A JP 2018010767A JP 6984440 B2 JP6984440 B2 JP 6984440B2
Authority
JP
Japan
Prior art keywords
area
region
image
image processing
representing
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2018010767A
Other languages
English (en)
Other versions
JP2019128840A (ja
JP2019128840A5 (ja
Inventor
チュン ヴヤ
秀智 磯田
国広 山村
陽輔 原野
寛之 橋本
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP2018010767A priority Critical patent/JP6984440B2/ja
Publication of JP2019128840A publication Critical patent/JP2019128840A/ja
Publication of JP2019128840A5 publication Critical patent/JP2019128840A5/ja
Application granted granted Critical
Publication of JP6984440B2 publication Critical patent/JP6984440B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Description

開示の技術は、画像処理装置、画像処理方法、及び画像処理プログラムに関する。
従来、カメラにより撮像された画像から対象を検出し追跡する対象領域判定装置が知られている。この対象領域判定装置は、対象物を含む領域を関心領域として取得し、対象物と対象領域とを対応付けて記録し、関心領域にどのように対象領域が配置されるかを判定する。
また、レイアウト情報を含んだ検索要求に対して目的の画像を素早く表示する画像検索方法が知られている。この画像検索方法においては、画像が同じ特性を有する領域に分割され、分割された領域毎に基準となるテンプレートを用いて領域毎に概略認識としての画素データレベルでのマッチングが行われ、対象物の候補の抽出と対象物の位置検出が行なわれる。そして、この画像検索方法では、特徴点マッチングが行われ各領域で誤抽出されている対象物候補が削除され、さらに基本レイアウト情報に基づいてレイアウト検証が行なわれ、あり得ないレイアウトの対象物の候補が削除される。そして、この画像検索方法では、画像データベースが、類似度、画像レイアウト情報、および原画像とで構成される。
特開2011‐43863号公報 特開平6‐68171号公報
画像処理によって画像から所定の領域を抽出する際には、検出対象に応じて適切な画像処理を行う必要がある。例えば、商品の価格情報を含む表示カードを画像から抽出する際には、背景の領域、数字の領域、商品名の領域等が画像内に含まれており、画像から表示カードの領域を抽出することは難しい。上記特許文献1の技術及び上記特許文献2の技術では、商品の価格情報を含む表示カードを抽出することについては考慮されておらず、表示カードを画像から適切に抽出することは難しい。
一つの側面では、開示の技術は、商品の価格情報を含む表示カードの領域を画像から適切に抽出することが目的である。
開示の技術は、一つの実施態様では、取得部が、画像を取得する。抽出部が、前記取得部によって取得された前記画像から、表示枠を表す第1の領域と数字を表す第2の領域とを抽出する。そして、認識部が、前記第1の領域内に前記第2の領域が含まれ、かつ前記第1の領域と前記第2の領域とが予め定められた関係である場合に、前記第1の領域を、商品の価格情報を含む表示カードの領域として認識する。
一つの側面として、商品の価格情報を含む表示カードの領域を画像から適切に抽出することができる、という効果を有する。
本実施形態に係る画像処理システムの概略ブロック図である。 商品棚の画像の一例を説明するための説明図である。 商品棚の画像の一例を説明するための説明図である。 学習用データの一例を示す図である。 各領域と各スコアとの関係を説明するための説明図である。 第1の領域内に第2の領域が含まれている領域の一例を説明するための説明図である。 第1の領域の位置と第2の領域の位置との間の関係を説明するための説明図である。 第1の領域の縦横比を説明するための説明図である。 第1の領域の縦横比を説明するための説明図である。 税抜き価格と税込み価格との間の位置関係を説明するための説明図である。 税抜き価格と税込み価格との間の位置関係を説明するための説明図である。 第2の領域と商品名の領域との間の位置関係を説明するための説明図である。 第2の領域とバーコードの領域との間の位置関係を説明するための説明図である。 実施形態に係る画像処理装置として機能するコンピュータの概略構成を示すブロック図である。 本実施形態の画像処理ルーチンの一例を示すフローチャートである。 本実施形態の認識処理ルーチンの一例を示すフローチャートである。
以下、図面を参照して開示の技術の実施形態の一例を詳細に説明する。
図1に示すように、実施形態に係る画像処理システム10は、カメラ12と、画像処理装置14と、出力装置30とを備えている。
カメラ12は、処理対象の画像を撮像する。例えば、カメラ12によって、商品が陳列された店内の商品棚の画像が撮像される。
例えば、商品棚に設置された表示カードを画像処理によって認識する場合、既存の画像処理方法を用いることが考えられる。この場合には、まず、画像処理によって対象領域を抽出し、対象領域に対して更なる画像処理を実施する。しかし、既存の画像処理を用いる場合には、様々な環境の変化に対応することが難しい。
図2に、商品棚の画像の一例を示す。図2に示されるように、商品棚を表す画像には、様々なものが含まれている。例えば、図2に示される画像Gには、表示カードHとは異なる位置に存在する文字M、及び表示カードと混同しやすい領域W等が含まれている。また、図3に示される画像Gには、表示カードHと並んで背景の商品Sが更に含まれている。このため、撮像された処理対象の画像から、商品の価格情報を含む表示カードの領域を認識することは難しい。
なお、表示カードの領域を認識するモデルを機械学習によって予め生成し、その学習済みモデルを用いて表示カードの認識率を向上させることが考えられる。しかし、学習済みモデルを用いる場合であっても、誤認識が発生する場合がある。
そこで、本実施形態では、処理対象の画像から表示枠の領域と数字の領域とを抽出し、表示枠の領域内に数字の領域が含まれている場合に、その領域を表示カードの領域として認識する。更に、本実施形態では、表示カードの領域を認識する際に、各領域であることの度合いを示すスコア、及び表示カードの枠を表す領域と数字を表す領域との間の位置関係を更に考慮する。また、本実施形態では、各領域の縦横比、表示カードの領域を認識する際には、表示カードの枠を表す領域内の数字の領域の個数、数字の領域とその他の領域との間の位置関係等を更に考慮する。以下、具体的に説明する。
画像処理装置14は、上記図1に示されるように、取得部20と、学習済みモデル記憶部21と、算出部22と、フィルタリング部23と、出力部28とを備えている。また、フィルタリング部23は、抽出部24と、認識部26とを備える。
取得部20は、カメラ12によって撮像された画像を取得する。
学習済みモデル記憶部21には、学習用の画像内における表示枠の領域の正解情報、及び学習用の画像内における数字の領域の正解情報が対応付けられた学習用データから予め生成された学習済みモデルが格納されている。学習済みモデルとしては、例えば、複数の学習用データに基づき、ディープラーニングによって学習されたニューラルネットワークモデル等を用いることができる。
図4に、学習用データの一例を示す。図4に示されるように、学習用データとしては、表示カードの枠の領域Aと数字の領域Bとを含む学習用の画像ILを用いる。なお、学習用画像ILには、商品名の領域Cも含まれている。数字の領域Bは、商品の価格情報に対応する。なお、括弧、円などの特徴点を更に含ませて学習用データとしてもよい。学習用データとしての画像の数は、例えば、300〜1000程度とすることができる。
図4に示される学習用データの画像ILには、領域Aが表示カードの領域であることを表す情報、及び領域Bが数字の領域であることを表す情報が予め付与されている。
学習済みモデルは学習用データに応じて予め学習されている。具体的には、学習用の画像が入力された際には、その画像内の表示枠の領域に対しては、表示枠の領域である度合いを表すスコアが高く出力されるようにモデルが学習される。また、学習用の画像が入力された際には、その画像内の数字の領域に対しては、数字の領域である度合いを表すスコアが高く出力されるようにモデルが学習される。
そのため、学習済みモデルは、処理対象の画像が入力された際に、表示枠の領域である度合いを表すスコア、及び数字の領域である度合いを表すスコアを出力する。
算出部22は、取得部20によって取得された画像の各部分領域について、表示枠の領域を表す第1の領域である度合いを表す第1のスコアと、数字の領域を表す第2の領域である度合いを表す第2のスコアとを算出する。具体的には、算出部22は、取得部20によって取得された画像を、学習済みモデル記憶部21に格納された学習済みモデルに入力して、画像の各部分領域についての第1のスコアと第2のスコアとを算出する。
抽出部24は、取得部20によって取得された画像から、算出部22によって算出された第1のスコアが予め設定された第1の閾値よりも大きい領域を第1の領域として抽出する。また、抽出部24は、取得部20によって取得された画像から、算出部22によって算出された第2のスコアが予め設定された第2の閾値よりも大きい領域を第2の領域として抽出する。なお、第1の閾値と第2の閾値とは、同一の値であってもよいし異なる値であってもよい。
図5に、各領域と各スコアとの関係を説明するための説明図を示す。例えば、予め設定された第1又は第2の閾値が0.8である場合、図5に示されるように、領域Aのスコアは0.9であるため、領域Aは第1の領域又は第2の領域として抽出される。
なお、抽出部24は、各領域を抽出する際には、その領域の位置情報と大きさ情報とを併せて出力する。例えば、抽出部24は、図5に示されるように、処理対象の画像I1内の領域Aの第1の領域である度合い又は第2の領域である度合いを表すスコア0.9と、領域Aの位置を表す座標(x,y)と、横方向の大きさwと、縦方向の大きさhとを出力する。
認識部26は、予め定められた条件に応じて、取得部20によって取得された画像内の表示カードの領域を認識する。
具体的には、以下の(1)〜(5)に示す条件に応じて、表示カードの候補に対してフィルタリングを行う。
(1)第1の領域内に第2の領域が含まれていること。
(2)第2の領域の個数が所定の範囲内の個数であること。
(3)第1の領域内における第2の領域の位置が予め定められた範囲内の位置であること。具体的には、第1の領域の枠を表す各座標と第2の領域の枠を表す各座標との間の差分が予め定められた範囲内であること。
(4)第1の領域の縦横比の値が予め定められた範囲内であること。
(5)第1の領域内の各第2の領域の位置関係が所定の位置関係であること。
まず、認識部26は、上記(1)の条件に基づき、第1の領域内に第2の領域が含まれている第1の領域を、表示カードの候補として特定する。例えば、図6に示されるように、第1の領域A内に第2の領域B1,B2,B3,B4が含まれている場合には、第1の領域Aと第2の領域B1〜B4とをグルーピングして、第2の領域B1〜B4を含む第1の領域Aを表示カードの候補として特定する。なお、以下の処理では、グルーピングされた表示カードの候補に対して処理が行われる。
次に、認識部26は、上記(1)の条件に基づき選択された表示カードの候補の各々から、上記(2)の条件を満たす候補を選択する。具体的には、認識部26は、上記(2)の条件に基づき、第1の領域内の第2の領域の個数が所定の範囲内の個数である表示カードの候補を、表示カードの次の候補として選択する。上記(2)の条件を満たさない表示カードの候補は除外される。
例えば、店内に陳列する商品の価格帯が100円〜9,999円の範囲である場合には、表示カード内に含まれる数字の個数が2個以下又は5個以上であるということはない。そのため、この場合には、所定の範囲内の個数として3〜4個が設定される。所定の範囲内の個数として3〜4個が設定された場合には、図6に示される領域Aは、上記(2)の条件を満たすため、表示カードの候補として選択される。
なお、認識部26は、上記(2)の条件を満たす候補を選択する際に、複数の第2の領域を連結して、連結された領域を新たな第2の領域として設定する。例えば、認識部26は、y座標がほぼ同一とみなせる所定範囲内の値で、かつx座標が数字一文字分を基準とした所定の間隔で並ぶ第2の領域を連結する。これにより、第2の領域は、商品の価格の表示領域とみなすことができる。
次に、認識部26は、上記(2)の条件に基づき選択された表示カードの候補の各々から、上記(3)の条件を満たす候補を選択する。具体的には、認識部26は、上記(3)の条件に基づき、第1の領域の枠を表す各座標と第2の領域の枠を表す各座標との間の差分が予め定められた範囲内である表示カードの候補を、表示カードの次の候補として選択する。上記(3)の条件を満たさない表示カードの候補は除外される。
例えば、図7に示されるように、第1の領域Aの所定の位置(例えば、左上角)を表す座標(x1,y1)と、第2の領域B5の所定の位置(例えば、左上角)を表す座標(x2,y2)との間の差分を算出する。この差分が所定範囲である候補が、上記(3)の条件を満たすものとして選択される。例えば、x1とx2との間のピクセル数が所定ピクセル数未満であること等が条件として設定される。
次に、認識部26は、上記(3)の条件に基づき選択された表示カードの候補の各々から、上記(4)の条件を満たす候補を選択する。具体的には、認識部26は、上記(4)の条件に基づき、第1の領域の縦横比の値が予め定められた範囲内である表示カードの候補を、表示カードの次の候補として選択する。上記(4)の条件を満たさない表示カードの候補は除外される。
例えば、縦横比w/hの予め定められた範囲として、1.3〜2が設定された場合を例に考える。この場合、例えば、図8に示される第1の領域Aは、横方向の大きさwが1000ピクセルであり縦方向の大きさhが600であるため、縦横比w/hは約1.67となる。そのため、図8に示される第1の領域の縦横比は予め定められた範囲内であるため、表示カードの次の候補として選択される。
一方、例えば図9に示される第1の領域Aは、横方向の大きさwが500ピクセルであり縦方向の大きさhが600であるため、縦横比w/hは約0.87となる。そのため、図9に示される第1の領域Aの縦横比は予め定められた範囲内ではないため、表示カードの次の候補として選択されずに除外される。
次に、認識部26は、上記(4)の条件に基づき選択された表示カードの候補の各々から、上記(5)の条件を満たす候補を選択する。具体的には、認識部26は、上記(5)の条件に基づき、第1の領域内の各第2の領域の位置関係が所定の位置関係である表示カードの候補を、表示カードとして選択する。上記(5)の条件を満たさない表示カードの候補は除外される。
具体的には、認識部26は、以下の(5−1)〜(5−3)に示す条件に応じて、表示カードの候補に対してフィルタリングを行う。なお、以下の(5−2)と(5−3)との処理順番は順不同である。
(5−1)税込み価格を表す第2の領域と税抜き価格を表す第2の領域との間の配置関係が予め定められた関係であること。
(5−2)第2の領域と商品名を表す領域との間の配置関係が予め定められた関係であること。
(5−3)第2の領域とバーコードを表す領域との間の配置関係が予め定められた関係であること。
まず、認識部26は、既存の文字認識手法を用いて、第1の領域内の第2の領域の各々についての文字認識結果を取得する。そして、認識部26は、第2の領域の各々についての文字認識結果に基づいて、税込み価格を表す第2の領域と税抜き価格を表す第2の領域とを認識する。例えば、認識部26は、数字の値が大きい方を税込み価格を表す第2の領域として認識し、数字の値が小さい方を税抜き価格を表す第2の領域として認識する。または、認識部26は、予め定められた領域のサイズの大小関係に基づいて、例えば、大きいサイズの第2の領域を、税抜き価格を表す領域として認識する。
そして、認識部26は、上記(5−1)の条件に基づき、税込み価格を表す第2の領域と税抜き価格を表す第2の領域との間の配置関係が予め定められた関係である場合に、第1の領域を表示カードの候補として選択する。
例えば、税抜き価格と税込み価格との間の予め定められた関係として、税抜き価格が左側であり、税込み価格が右側であると設定されている場合を考える。この場合には、税抜き価格を表す第2の領域B5と税込み価格を表す第2の領域B6との間の関係が、図10に示されるような関係であるときには、これらの第2の領域B5,B6を含む第1の領域Aが表示カードの次の候補として選択される。
または、例えば、税抜き価格と税込み価格との間の予め定められた関係として、税抜き価格が上側であり、税込み価格が下側であると設定されている場合を考える。この場合には、税抜き価格を表す第2の領域B5と税込み価格を表す第2の領域B6との間の関係が、図11に示されるような関係であるときには、これらの第2の領域B5,B6を含む第1の領域が表示カードの次の候補として選択される。
次に、認識部26は、既存の文字認識手法を用いて、第1の領域のうちの商品名を表す領域を認識する。例えば、認識部26は、予め登録された商品名の情報と、第1の領域のうちの商品名を表す領域とを照合して、第1の領域のうちの商品名を表す領域を認識する。そして、認識部26は、上記(5−2)の条件に基づき、第2の領域と商品名を表す領域との間の配置関係が予め定められた関係である場合に、これらの領域を含む第1の領域を表示カードの候補として選択する。
例えば、第2の領域と商品名を表す領域との間の予め定められた配置関係として、商品名を表す領域が上側であり、第2の領域が下側であると設定されている場合を考える。この場合には、商品名を表す領域Cと、税抜き価格を表す第2の領域B5及び税込み価格を表す第2の領域B6との間の関係が、図12に示されるような関係であるときには、第2の領域B5,B6を含む第1の領域Aが表示カードの次の候補として選択される。
次に、認識部26は、既存の画像処理手法を用いて、第1の領域のうちのバーコードを表す領域を認識する。そして、認識部26は、上記(5−3)の条件に基づき、第2の領域とバーコードを表す領域との間の配置関係が予め定められた関係である場合に、これらの領域を含む第1の領域を表示カードとして認識する。
例えば、第2の領域とバーコードを表す領域との間の予め定められた配置関係として、バーコードを表す領域Dが左側であり、第2の領域B5,B6が右側であると設定されている場合を考える。この場合には、バーコードを表す領域Dと、税抜き価格を表す第2の領域B5及び税込み価格を表す第2の領域B6との間の関係が、図13に示されるような関係であるときには、これらの第2の領域B5,B6を含む第1の領域Aが表示カードとして選択される。
出力部28は、認識部26によって認識された表示カードの領域を結果として出力する。なお、表示カードの領域から、商品名の領域、税抜き価格の領域、税込価格の領域、及びバーコードの領域のみを抽出して出力するようにしてもよい。出力部28の出力結果は、例えば出力形式はテキストデータ(csv、JSON等)である。
出力装置30には、出力部28によって出力された結果が出力される。出力装置30は、例えば、ディスプレイ等によって実現される。なお、出力装置30は、店内の商品を管理するサーバ等であってもよい。
画像処理装置14は、例えば、図14に示すコンピュータ50で実現することができる。コンピュータ50はCPU51、一時記憶領域としてのメモリ52、及び不揮発性の記憶部53を備える。また、コンピュータ50は、カメラ12、出力装置30等の入出力装置が接続される入出力interface(I/F)54、及び記録媒体59に対するデータの読み込み及び書き込みを制御するread/write(R/W)部55を備える。また、コンピュータ50は、インターネット等のネットワークに接続されるネットワークI/F56を備える。CPU51、メモリ52、記憶部53、入出力I/F54、R/W部55、及びネットワークI/F56は、バス57を介して互いに接続される。
記憶部53は、Hard Disk Drive(HDD)、Solid State Drive(SSD)、フラッシュメモリ等によって実現できる。記憶媒体としての記憶部53には、コンピュータ50を画像処理装置14として機能させるための画像処理プログラム60が記憶されている。画像処理プログラム60は、取得プロセス61と、算出プロセス62と、抽出プロセス63と、認識プロセス64と、出力プロセス65とを有する。学習済みモデル記憶領域66には、学習済みモデル記憶部21を構成する情報が記憶される。
CPU51は、画像処理プログラム60を記憶部53から読み出してメモリ52に展開し、画像処理プログラム60が有するプロセスを順次実行する。CPU51は、取得プロセス61を実行することで、図1に示す取得部20として動作する。また、CPU51は、算出プロセス62を実行することで、図1に示す算出部22として動作する。また、CPU51は、抽出プロセス63を実行することで、図1に示す抽出部24として動作する。また、CPU51は、認識プロセス64を実行することで、図1に示す認識部26として動作する。また、CPU51は、出力プロセス65を実行することで、図1に示す出力部28として動作する。また、CPU51は、学習済みモデル記憶領域66から情報を読み出して、学習済みモデル記憶部21をメモリ52に展開する。これにより、画像処理プログラム60を実行したコンピュータ50が、画像処理装置14として機能することになる。ソフトウェアである画像処理プログラム60を実行するCPU51はハードウェアである。
なお、画像処理プログラム60により実現される機能は、例えば半導体集積回路、より詳しくはApplication Specific Integrated Circuit(ASIC)やGraphics Processing Unit(GPU)等で実現することも可能である。
次に、本実施形態に係る画像処理装置14の作用について説明する。画像処理装置14は、カメラ12によって商品棚の画像の取得が開始されると、図15に示す画像処理ルーチンを実行する。図15に示す画像処理ルーチンは、商品棚の画像が取得される毎に繰り返し実行される。
ステップS100において、取得部20は、カメラ12によって撮像された画像を取得する。
ステップS102において、算出部22は、学習済みモデル記憶部21に格納された学習済みモデルを読み込む。
ステップS104において、算出部22は、上記ステップS100で取得された画像を、上記ステップS102で読み込まれた学習済みモデルに入力して、画像の各部分領域に対する第1のスコアと第2のスコアとを算出する。
ステップS105において、抽出部24は、上記ステップS100で取得された画像から、上記ステップS104で算出された第1のスコアが予め設定された第1の閾値よりも大きい領域を第1の領域として抽出する。また、抽出部24は、上記ステップS100で取得された画像から、上記ステップS104で算出された第2のスコアが予め設定された第2の閾値よりも大きい領域を第2の領域として抽出する。
ステップS106において、認識部26は、上記(1)〜(5)に示す条件に応じて、表示カードの候補のフィルタリングを行い、フィルタリングの結果得られた領域の各々を表示カードとして認識する。ステップS106は、図16に示す認識処理ルーチンによって実現される。
ステップS202において、認識部26は、上記(1)の条件に基づき、第1の領域と第2の領域との全ての組み合わせの各々について、第1の領域内に第2の領域が含まれている領域を、表示カードの候補として特定する。
ステップS204において、認識部26は、上記(2)の条件に基づき、上記ステップS202で特定された表示カードの候補の各々から、第1の領域内の第2の領域の個数が所定の範囲内の個数である表示カードの候補を、表示カードの次の候補として選択する。上記(2)の条件を満たさない表示カードの候補は除外される。
ステップS206において、認識部26は上記(3)の条件に基づき、表示カードの候補の各々から、第1の領域の枠を表す各座標と第2の領域の枠を表す各座標との間の差分が予め定められた範囲内である表示カードの候補を、表示カードの次の候補として選択する。上記(3)の条件を満たさない表示カードの候補は除外される。
ステップS208において、認識部26は、上記(4)の条件に基づき、表示カードの候補の各々から、第1の領域の縦横比の値が予め定められた範囲内である表示カードの候補を、表示カードの次の候補として選択する。上記(4)の条件を満たさない表示カードの候補は除外される。
ステップS210において、認識部26は、上記(5−1)の条件に基づき、表示カードの候補の各々から、税込み価格を表す第2の領域と税抜き価格を表す第2の領域との間の配置関係が予め定められた関係である領域を、表示カードの候補として選択する。上記(5−1)の条件を満たさない表示カードの候補は除外される。
ステップS212において、認識部26は、上記(5−2)の条件に基づき、表示カードの候補の各々から、第2の領域と商品名を表す領域との間の配置関係が予め定められた関係である場合に、これらの領域を含む第1の領域を表示カードの候補として選択する。
ステップS214において、認識部26は、上記(5−3)の条件に基づき、表示カードの候補の各々から、第2の領域とバーコードを表す領域との間の配置関係が予め定められた関係である場合に、これらの領域を含む第1の領域を表示カードとして認識する。
ステップS216において、上記ステップS202〜ステップS214の各処理を経て得られた表示カードの候補の各々を、表示カードの領域として出力する。
図15に示す画像処理ルーチンに戻り、ステップS108において、上記ステップS106によって取得された表示カードの領域を結果として出力して、画像処理ルーチンを終了する。
以上説明したように、実施形態に係る画像処理装置は、画像に対するスコアに応じて、画像から表示枠を表す第1の領域と数字を表す第2の領域とを抽出する。そして、画像処理装置は、上記(1)〜(5)に示される条件を満たす領域を、商品の価格情報を含む表示カードの領域として認識する。これにより、商品の価格情報を含む表示カードの領域を画像から適切に抽出することができる。
また、機械学習によって得られた学習済みモデルを用いる際には、例えば、画像認識に失敗した画像を用いて学習済みモデルを再学習することにより対応していたが、この場合であっても認識率には限界があった。そのため、本実施形態の画像処理装置では、表示カードの特徴を表す基本のパターンをパラメータ化することにより、表示カードの領域を精度よく抽出することができる。
なお、上記では、各プログラムが記憶部に予め記憶(インストール)されている態様を説明したが、これに限定されない。開示の技術に係るプログラムは、CD−ROM、DVD−ROM、USBメモリ等の記録媒体に記録された形態で提供することも可能である。
本明細書に記載された全ての文献、特許出願及び技術規格は、個々の文献、特許出願及び技術規格が参照により取り込まれることが具体的かつ個々に記された場合と同程度に、本明細書中に参照により取り込まれる。
次に、実施形態の変形例を説明する。
上記実施形態では、画像の各部分領域に対して第1のスコア及び第2のスコアを算出して、表示枠の領域を表す第1の領域及び数字の領域を表す第2の領域を特定する場合を例に説明したが、これに限定されるものではない。例えば、パターンマッチングなどの所定の画像処理によって、表示枠の領域を表す第1の領域及び数字の領域を表す第2の領域を抽出するようにしてもよい。
また、表示カードの領域を認識する際には、他の条件を更に考慮するようにしてもよい。例えば、認識部26は、第1の領域の面積と第2の領域の面積との面積比に基づいて、第1の領域と第2の領域との面積比が所定の範囲内である場合に、当該第1の領域を表示カードの領域として認識するようにしてもよい。
以上の実施形態に関し、更に以下の付記を開示する。
(付記1)
画像を取得する取得部と、
前記取得部によって取得された前記画像から、表示枠を表す第1の領域と数字を表す第2の領域とを抽出する抽出部と、
前記第1の領域内に前記第2の領域が含まれ、かつ前記第1の領域と前記第2の領域とが予め定められた関係である場合に、前記第1の領域を、商品の価格情報を含む表示カードの領域として認識する認識部と、
を含む画像処理装置。
(付記2)
前記取得部によって取得された前記画像に基づいて、前記画像の各部分領域について、前記第1の領域である度合いを表す第1のスコアと、前記第2の領域である度合いを表す第2のスコアとを算出する算出部を更に含み、
前記抽出部は、前記算出部によって算出された前記第1のスコアが予め設定された第1の閾値よりも大きい領域を前記第1の領域として抽出し、前記算出部によって算出された前記第2のスコアが予め設定された第2の閾値よりも大きい領域を前記第2の領域として抽出する、
付記1に記載の画像処理装置。
(付記3)
前記算出部は、前記取得部によって取得された前記画像の各部分領域について、学習用の画像内における前記第1の領域及び学習用の画像内における前記第2の領域が対応付けられた学習用データから予め生成された学習済みモデルに基づいて、前記第1のスコアと前記第2のスコアとを算出する、
付記2に記載の画像処理装置。
(付記4)
前記認識部は、前記第1の領域の縦横比の値が予め定められた範囲内である場合に、前記第1の領域を前記表示カードの領域として認識する、
付記2又は付記3に記載の画像処理装置。
(付記5)
前記認識部は、前記第1の領域の枠を表す各座標と前記第2の領域の枠を表す各座標との間の差分が予め定められた範囲内である場合に、該第1の領域を前記表示カードの領域として認識する、
付記1〜付記4の何れか1項に記載の画像処理装置。
(付記6)
前記認識部は、前記第1の領域内の前記第2の領域の個数が、所定の範囲内の個数である場合に、前記第1の領域を前記表示カードとして認識する、
付記1〜付記5の何れか1項に記載の画像処理装置。
(付記7)
前記認識部は、前記第2の領域の各々についての文字認識結果を取得し、前記第2の領域の各々についての前記文字認識結果に基づいて、税込み価格を表す前記第2の領域と、税抜き価格を表す前記第2の領域とを認識し、前記税込み価格を表す前記第2の領域と前記税抜き価格を表す前記第2の領域との間の配置関係が予め定められた関係である場合に、前記第1の領域を前記表示カードの領域として認識する、
付記1〜付記6の何れか1項に記載の画像処理装置。
(付記8)
前記認識部は、前記第1の領域の面積と前記第2の領域の面積との面積比が、所定の範囲内である場合に、前記第1の領域を前記表示カードとして認識する、
付記1〜付記7の何れか1項に記載の画像処理装置。
(付記9)
画像を取得し、
取得された前記画像から、表示枠を表す第1の領域と数字を表す第2の領域とを抽出し、
前記第1の領域内に前記第2の領域が含まれ、かつ前記第1の領域と前記第2の領域とが予め定められた関係である場合に、前記第1の領域を、商品の価格情報を含む表示カードの領域として認識する、
処理をコンピュータに実行させるための画像処理プログラム。
(付記10)
取得された前記画像に基づいて、前記画像の各部分領域について、前記第1の領域である度合いを表す第1のスコアと、前記第2の領域である度合いを表す第2のスコアとを算出し、
算出された前記第1のスコアが予め設定された第1の閾値よりも大きい領域を前記第1の領域として抽出し、前記算出部によって算出された前記第2のスコアが予め設定された第2の閾値よりも大きい領域を前記第2の領域として抽出する、
付記9に記載の画像処理プログラム。
(付記11)
取得された前記画像の各部分領域について、学習用の画像内における前記第1の領域及び学習用の画像内における前記第2の領域が対応付けられた学習用データから予め生成された学習済みモデルに基づいて、前記第1のスコアと前記第2のスコアとを算出する、
付記10に記載の画像処理プログラム。
(付記12)
前記第1の領域の縦横比の値が予め定められた範囲内である場合に、前記第1の領域を前記表示カードの領域として認識する、
付記10又は付記11に記載の画像処理プログラム。
(付記13)
前記第1の領域の枠を表す各座標と前記第2の領域の枠を表す各座標との間の差分が予め定められた範囲内である場合に、該第1の領域を前記表示カードの領域として認識する、
付記9〜付記12の何れか1項に記載の画像処理プログラム。
(付記14)
前記第1の領域内の前記第2の領域の個数が、所定の範囲内の個数である場合に、前記第1の領域を前記表示カードとして認識する、
付記9〜付記13の何れか1項に記載の画像処理プログラム。
(付記15)
前記第2の領域の各々についての文字認識結果を取得し、前記第2の領域の各々についての前記文字認識結果に基づいて、税込み価格を表す前記第2の領域と、税抜き価格を表す前記第2の領域とを認識し、前記税込み価格を表す前記第2の領域と前記税抜き価格を表す前記第2の領域との間の配置関係が予め定められた関係である場合に、前記第1の領域を前記表示カードの領域として認識する、
付記9〜付記14の何れか1項に記載の画像処理プログラム。
(付記16)
画像を取得し、
取得された前記画像から、表示枠を表す第1の領域と数字を表す第2の領域とを抽出し、
前記第1の領域内に前記第2の領域が含まれ、かつ前記第1の領域と前記第2の領域とが予め定められた関係である場合に、前記第1の領域を、商品の価格情報を含む表示カードの領域として認識する、
処理をコンピュータに実行させる画像処理方法。
(付記1
取得された前記画像に基づいて、前記画像の各部分領域について、前記第1の領域である度合いを表す第1のスコアと、前記第2の領域である度合いを表す第2のスコアとを算出し、
算出された前記第1のスコアが予め設定された第1の閾値よりも大きい領域を前記第1の領域として抽出し、前記算出部によって算出された前記第2のスコアが予め設定された第2の閾値よりも大きい領域を前記第2の領域として抽出する、
付記1に記載の画像処理方法。
(付記1
取得された前記画像の各部分領域について、学習用の画像内における前記第1の領域及び学習用の画像内における前記第2の領域が対応付けられた学習用データから予め生成された学習済みモデルに基づいて、前記第1のスコアと前記第2のスコアとを算出する、
付記1に記載の画像処理方法。
(付記1
前記第1の領域の縦横比の値が予め定められた範囲内である場合に、前記第1の領域を前記表示カードの領域として認識する、
付記1又は付記1に記載の画像処理方法。
(付記20
前記第1の領域の枠を表す各座標と前記第2の領域の枠を表す各座標との間の差分が予め定められた範囲内である場合に、該第1の領域を前記表示カードの領域として認識する、
付記1〜付記1の何れか1項に記載の画像処理方法。
(付記2
画像を取得し、
取得された前記画像から、表示枠を表す第1の領域と数字を表す第2の領域とを抽出し、
前記第1の領域内に前記第2の領域が含まれ、かつ前記第1の領域と前記第2の領域とが予め定められた関係である場合に、前記第1の領域を、商品の価格情報を含む表示カードの領域として認識する、
処理をコンピュータに実行させるための画像処理プログラムを記憶した記憶媒体。
10 画像処理システム
12 カメラ
14 画像処理装置
20 取得部
21 学習済みモデル記憶部
22 算出部
23 フィルタリング部
24 抽出部
26 認識部
28 出力部
30 出力装置
50 コンピュータ
51 CPU
53 記憶部
59 記録媒体
60 画像処理プログラム
61 取得プロセス
62 算出プロセス
63 抽出プロセス
64 認識プロセス
65 出力プロセス
66 学習済みモデル記憶領域

Claims (10)

  1. 画像を取得する取得部と、
    前記取得部によって取得された前記画像から、表示枠を表す第1の領域と数字を表す第2の領域とを抽出する抽出部と、
    前記第1の領域内に前記第2の領域が含まれ、かつ前記第1の領域と前記第2の領域とが予め定められた関係である場合に、前記第1の領域を、商品の価格情報を含む表示カードの領域として認識する認識部と、
    を含む画像処理装置。
  2. 前記取得部によって取得された前記画像に基づいて、前記画像の各部分領域について、前記第1の領域である度合いを表す第1のスコアと、前記第2の領域である度合いを表す第2のスコアとを算出する算出部を更に含み、
    前記抽出部は、前記算出部によって算出された前記第1のスコアが予め設定された第1の閾値よりも大きい領域を前記第1の領域として抽出し、前記算出部によって算出された前記第2のスコアが予め設定された第2の閾値よりも大きい領域を前記第2の領域として抽出する、
    請求項1に記載の画像処理装置。
  3. 前記算出部は、前記取得部によって取得された前記画像の各部分領域について、学習用の画像内における前記第1の領域及び学習用の画像内における前記第2の領域が対応付けられた学習用データから予め生成された学習済みモデルに基づいて、前記第1のスコアと前記第2のスコアとを算出する、
    請求項2に記載の画像処理装置。
  4. 前記認識部は、前記第1の領域の縦横比の値が予め定められた範囲内である場合に、前記第1の領域を前記表示カードの領域として認識する、
    請求項2又は請求項3に記載の画像処理装置。
  5. 前記認識部は、前記第1の領域の枠を表す各座標と前記第2の領域の枠を表す各座標との間の差分が予め定められた範囲内である場合に、該第1の領域を前記表示カードの領域として認識する、
    請求項1〜請求項4の何れか1項に記載の画像処理装置。
  6. 前記認識部は、前記第1の領域内の前記第2の領域の個数が、所定の範囲内の個数である場合に、前記第1の領域を前記表示カードとして認識する、
    請求項1〜請求項5の何れか1項に記載の画像処理装置。
  7. 前記認識部は、前記第2の領域の各々についての文字認識結果を取得し、前記第2の領域の各々についての前記文字認識結果に基づいて、税込み価格を表す前記第2の領域と、税抜き価格を表す前記第2の領域とを認識し、前記税込み価格を表す前記第2の領域と前記税抜き価格を表す前記第2の領域との間の配置関係が予め定められた関係である場合に、前記第1の領域を前記表示カードの領域として認識する、
    請求項1〜請求項6の何れか1項に記載の画像処理装置。
  8. 前記認識部は、前記第1の領域の面積と前記第2の領域の面積との面積比が、所定の範囲内である場合に、前記第1の領域を前記表示カードとして認識する、
    請求項1〜請求項7の何れか1項に記載の画像処理装置。
  9. 画像を取得し、
    取得された前記画像から、表示枠を表す第1の領域と数字を表す第2の領域とを抽出し、
    前記第1の領域内に前記第2の領域が含まれ、かつ前記第1の領域と前記第2の領域とが予め定められた関係である場合に、前記第1の領域を、商品の価格情報を含む表示カードの領域として認識する、
    処理をコンピュータに実行させるための画像処理プログラム。
  10. 画像を取得し、
    取得された前記画像から、表示枠を表す第1の領域と数字を表す第2の領域とを抽出し、
    前記第1の領域内に前記第2の領域が含まれ、かつ前記第1の領域と前記第2の領域とが予め定められた関係である場合に、前記第1の領域を、商品の価格情報を含む表示カードの領域として認識する、
    処理をコンピュータが実行する画像処理方法。
JP2018010767A 2018-01-25 2018-01-25 画像処理装置、画像処理方法、及び画像処理プログラム Active JP6984440B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2018010767A JP6984440B2 (ja) 2018-01-25 2018-01-25 画像処理装置、画像処理方法、及び画像処理プログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2018010767A JP6984440B2 (ja) 2018-01-25 2018-01-25 画像処理装置、画像処理方法、及び画像処理プログラム

Publications (3)

Publication Number Publication Date
JP2019128840A JP2019128840A (ja) 2019-08-01
JP2019128840A5 JP2019128840A5 (ja) 2021-03-18
JP6984440B2 true JP6984440B2 (ja) 2021-12-22

Family

ID=67472278

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2018010767A Active JP6984440B2 (ja) 2018-01-25 2018-01-25 画像処理装置、画像処理方法、及び画像処理プログラム

Country Status (1)

Country Link
JP (1) JP6984440B2 (ja)

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2893814B2 (ja) * 1990-03-15 1999-05-24 住友電気工業株式会社 車番自動読取装置におけるプレート切出し装置
JP6693059B2 (ja) * 2015-07-06 2020-05-13 日本電気株式会社 商品棚認識装置、商品棚認識方法、プログラム及び画像処理装置

Also Published As

Publication number Publication date
JP2019128840A (ja) 2019-08-01

Similar Documents

Publication Publication Date Title
US20150278167A1 (en) Automatic measure of visual similarity between fonts
JP7026165B2 (ja) テキスト認識方法及びテキスト認識装置、電子設備、記憶媒体
JP2004139484A (ja) 帳票処理装置、該装置実行のためのプログラム、及び、帳票書式作成プログラム
CN113065536B (zh) 处理表格的方法、计算设备和计算机可读存储介质
JP6003047B2 (ja) 画像処理装置及び画像処理プログラム
CN110582783B (zh) 训练装置、图像识别装置、训练方法和计算机可读信息存储介质
JP6874136B2 (ja) 画像認識装置、画像認識方法及びプログラム
JP4834351B2 (ja) 文字認識装置及び文字認識方法
JP5777390B2 (ja) 情報処理方法及び装置、パターン識別方法及び装置
CN109508716B (zh) 一种图像文字的定位方法及装置
JP2007213433A (ja) 文字検索装置
JP2015099566A (ja) 特徴算出装置、方法及びプログラム
CN113297963A (zh) 多人姿态的估计方法、装置、电子设备以及可读存储介质
JP6984440B2 (ja) 画像処理装置、画像処理方法、及び画像処理プログラム
JP5623574B2 (ja) 帳票識別装置および帳票識別方法
US20220406081A1 (en) Image processing apparatus, image processing method, and storage medium
JP2020198054A (ja) プログラム、情報処理システム、情報処理装置及び情報処理方法
JP6393495B2 (ja) 画像処理装置および物体認識方法
US20220019848A1 (en) Information processing apparatus, control method for information processing apparatus, and storage medium
CN115471849A (zh) 一种手写汉字图像评估方法及系统
CN110737364B (zh) 一种安卓系统下触摸书写加速的控制方法
JP2009223612A (ja) 画像認識装置及びプログラム
JP3680658B2 (ja) 画像認識方法及び画像認識装置
JP4853313B2 (ja) 文字認識装置
JP6201838B2 (ja) 情報処理装置及び情報処理プログラム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20201001

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20210202

A711 Notification of change in applicant

Free format text: JAPANESE INTERMEDIATE CODE: A712

Effective date: 20210823

RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20211007

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20211012

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20211026

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20211108

R150 Certificate of patent or registration of utility model

Ref document number: 6984440

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150