JP7842650B2 - 画像処理装置、画像処理方法、及びコンピュータプログラム - Google Patents

画像処理装置、画像処理方法、及びコンピュータプログラム

Info

Publication number
JP7842650B2
JP7842650B2 JP2022103796A JP2022103796A JP7842650B2 JP 7842650 B2 JP7842650 B2 JP 7842650B2 JP 2022103796 A JP2022103796 A JP 2022103796A JP 2022103796 A JP2022103796 A JP 2022103796A JP 7842650 B2 JP7842650 B2 JP 7842650B2
Authority
JP
Japan
Prior art keywords
document
region
feature points
image
unit
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2022103796A
Other languages
English (en)
Other versions
JP2024004231A (ja
Inventor
真 早崎
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sharp Corp
Original Assignee
Sharp Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sharp Corp filed Critical Sharp Corp
Priority to JP2022103796A priority Critical patent/JP7842650B2/ja
Publication of JP2024004231A publication Critical patent/JP2024004231A/ja
Application granted granted Critical
Publication of JP7842650B2 publication Critical patent/JP7842650B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Image Processing (AREA)
  • Image Analysis (AREA)

Description

本開示は、画像処理装置、画像処理方法、及びコンピュータプログラムに関する。
特許文献1には、書面の外形輪郭を検出可能な画像処理装置が記載されている。詳細には、画像処理装置では、撮像装置等から、書面が映った画像が取得される。その後、4本の仮想直線が画像の各頂点を始点として中心へと平行移動させられる。各仮想直線は、画像において直交し合う2辺に対して所定角度傾斜している。画像処理装置では更に、各仮想直線と、外形輪郭との交点が取得され、各交点に基づいて書面の外形輪郭の隅が取得される。
特許第4918167号公報
しかしながら、特許文献1の画像処理装置では、書面全体が画像に映っていなければ、書面の隅を検出することが難しいという問題点がある。詳細には、複数人での対話では書面が参照される場合がある。書面の隅を画像処理装置により検出する場合、各人は、書面上に手が置かないように注意を払う必要がある。他にも、撮像装置の画角内に書面全域が入るように画像処理装置の位置を調整したり、書面の隅が折れていないように注意を払ったりする必要がある。
本開示は、上記状況に鑑みてなされたものであり、書面全体が画像に映っていない場合であっても書面の隅を検出できる可能な技術を提供することにある。
本開示の一局面に係る画像処理装置は、領域特定部と、特徴点特定部と、判定部と、隅特定部とを備える。前記領域特定部は、背景及び書面を含む画像から、前記書面を表す第1領域と、前記書面及び前記背景以外の物体を表す第2領域とを特定する。前記特徴点特定部は、前記第1領域及び前記第2領域に基づいて、前記書面の隅である点、前記第1領域の外縁において前記第2領域の外縁と接する点、及び前記第1領域の外縁において前記画像の外縁と接する点のいずれかを少なくとも含む複数の特徴点を特定する。前記判定部は、前記複数の特徴点のうち、隣り合う2つの前記特徴点が前記書面における同一辺上にあるか否かを判定する。前記隅特定部は、前記同一辺上にあると判定された前記隣り合う2つの特徴点に基づいて、前記書面の4隅を特定する。
本開示の他の局面に係る画像処理方法は、背景及び書面を含む画像から、前記書面を表す第1領域と、前記書面及び前記背景以外の物体を表す第2領域とを特定するステップと、前記第1領域及び前記第2領域に基づいて、前記書面の隅である点、前記第1領域の外縁において前記第2領域の外縁と接する点、及び前記第1領域の外縁において前記画像の外縁と接する点のいずれかである複数の特徴点を特定するステップと、前記複数の特徴点のうち、隣り合う2つの前記特徴点が前記書面の辺上にあるか否かを判定するステップと、前記辺上にあると判定された前記隣り合う2つの特徴点に基づいて、前記書面の4隅を特定するステップとを含む。
本開示の更に他の局面に係るコンピュータプログラムは、コンピュータに、背景及び書面を含む画像から、前記書面を表す第1領域と、前記書面及び前記背景以外の物体を表す第2領域とを特定するステップと、前記第1領域及び前記第2領域に基づいて、前記書面の隅である点、前記第1領域の外縁において前記第2領域の外縁と接する点、及び前記第1領域の外縁において前記画像の外縁と接する点のいずれかである複数の特徴点を特定するステップと、前記複数の特徴点のうち、隣り合う2つの前記特徴点が前記書面の辺上にあるか否かを判定するステップと、前記辺上にあると判定された前記隣り合う2つの特徴点に基づいて、前記書面の4隅を特定するステップとを実行させる。
本開示によれば、書面全体が画像に映っていない場合であっても書面の隅を検出できる可能な技術を提供することができる。
本開示の一実施形態に係る情報処理装置を示す図である。 図1に示される情報処理装置の詳細な構成を示す図である。 図2に示される処理部のブロック構成を示す図である。 図1に示されるサーバ装置の詳細な構成を示す図である。 図3に示される処理部の処理手順を示すメインフローチャートである。 第1状況及び第2状況で撮影された処理前画像データが表す画像を示す図である。 図5に示されるステップS102の詳細な処理手順を示すフローチャートである。
本開示の実施形態について、図面を参照しながら説明する。なお、図中、同一又は相当部分については同一の参照符号を付して説明を繰り返さない。
図1は、本開示の一実施形態に係る情報処理装置100を示す図である。図1に示されるように、情報処理装置100は、通信ネットワーク200を介してサーバ装置300とデータ通信可能である。通信ネットワーク200は、インターネット、有線LAN(Local Area Network)、又は無線LANである。通信ネットワーク200は、インターネット、有線LAN、及び無線LANから選ばれた2つ以上の組み合わせでもよい。
図2は、図1に示される情報処理装置100の詳細な構成を示す図である。図2に示されるように、情報処理装置100は、撮像部12と、表示部13と、コネクタ部14と、通信インタフェース部15とを更に備える。なお、以下、「通信インタフェース部」を「通信IF部」と記載する。
画像処理装置11は、例えば、パーソナルコンピュータの本体装置である。画像処理装置11は、記憶部111と、処理部112とを備える。
記憶部111は、例えば、非一時的コンピュータ読取可能な記憶媒体である。詳細には、記憶部111は、RAM(Random Access Memory)、ROM(Read Only Memory)及び/又はフラッシュメモリを含む。記憶部111は、画像処理プログラム113を記憶する。画像処理プログラム113は、処理部112の処理手順を規定する。また、画像処理プログラム113は、本開示における「コンピュータプログラム」の一例である。画像処理プログラム113は、単一のプログラムであってもよいし、複数のプログラムモジュールの集まりであってもよい。
処理部112は、例えばCPU(Central Processing Unit)又はマイクロコンピュータである。処理部112は、画像処理プログラム113を実行することにより、画像取得部112A、特定部112B、変形部112C、文字認識部112D、及び合成部112Eとして機能する。その結果、処理部112は、撮像部12と、表示部13と、コネクタ部14に接続可能な記憶媒体16と、通信IF部15とを制御する。画像処理プログラム113の処理手順及び各部の制御については、後で詳説される。
撮像部12は、カメラ等の撮像装置である。撮像部12は、自身の画角内の画像を撮影して、撮影した画像を示す画像データを生成する。なお、撮像部12は、通信ケーブル又は無線リンクを介して画像処理装置11へと画像データを送信可能である。
表示部13は、液晶ディスプレイ等の表示装置である。表示部13は、各種画像を画面に表示する。表示部13は、通信ケーブル等を介して画像処理装置11と通信可能である。
コネクタ部14及び通信IF部15は、画像処理装置11に設けられる。
コネクタ部14は、記憶媒体16が接続可能なレセプタクルである。詳細には、記憶媒体16は、例えばUSBメモリである。記憶媒体16は、様々なデータを記憶可能である。
通信IF部15は、通信ネットワーク200(図1参照)を通じてサーバ装置300とデータ通信可能なインタフェースである。詳細には、通信IF部15は、サーバ装置300を送信先とするリクエストデータを通信ネットワーク200に送出する。実施形態では、リクエストデータは、AI(Artificial Intelligence)による物体認識処理(以下、単に「物体認識処理」と記載する。)を要求するための情報である。リクエストデータは、物体認識処理の対象となる画像データを含む。通信IF部15は更に、情報処理装置100を送信先とするレスポンスデータを、通信ネットワーク200から受信する。
図4は、図1に示されるサーバ装置300の詳細な構成を示す図である。図4に示されるように、サーバ装置300は、通信IF部31と、記憶部32と、処理部33とを記憶する。
通信IF部31は、通信ネットワーク200を通じて情報処理装置100とデータ通信可能なインタフェース等である。通信IF部31は、サーバ装置300を送信先とするリクエストデータを通信ネットワーク200から受信する。通信IF部31は、情報処理装置100を送信先とするレスポンスデータを通信ネットワーク200へ送出する。
記憶部32は、RAM(Random Access Memory)、ROM(Read Only Memory)及び/又はフラッシュメモリを含む。記憶部32は、物体モデルデータベース321を記憶する。以下、「物体モデルデータベース」を「物体モデルDB」と記載する。
処理部33は、例えばCPU又はマイクロコンピュータである。処理部33は、物体認識処理のために機械学習を実行する。即ち、処理部33は、画像データを取得する。画像データは、様々な物体を含む画像を示す。処理部33は、画像データが示す画像に含まれる各物体の局所特徴量を抽出する。処理部33は、局所特徴量と、物体を示す識別情報とを、互いに紐づけした状態で物体モデルDB321に登録する。
処理部33は、通信IF部31を通じて、情報処理装置100からのリクエストデータを受信する場合がある。処理部33は、リクエストデータの受信をトリガとして、物体認識処理を開始する。詳細には、処理部33は、受信したリクエストデータに含まれる画像データから局所特徴量を抽出する。処理部33は、抽出した局所特徴量に基づいて、物体モデルDB321を検索することにより、画像データが示す画像に映っている物体を認識する。なお、物体認識処理としては、例えばパノプティックセグメンテーションを用いることができる。パノプティックセグメンテーションでは、画像を構成する全画素に、物体を識別可能なラベルが個別的に割り当てられる。また、数えることが可能な物体に関しては、Detectron2等を用いることで、画素ごとに物体が区別される。
物体認識処理が終了したことに応じて、処理部33は、レスポンスデータを生成する。レスポンスデータは、認識した物体を示す情報を含む。また、レスポンスデータの送信先は、情報処理装置100と指定される。処理部33は、作成したレスポンスデータを、通信IF部31を通じて通信ネットワーク200に送出する。
実施形態では、情報処理装置100は、対話で参照される書面を電子化するために用いられる。書面は、折り目、切れ目及びカール等が無い状態では、矩形形状である。例えば、薬局では、薬剤師は、患者向けの書面を参照して、患者に対し服薬指導等を実施する。書面としては帳票が例示される。帳票の主面には、処方された医薬品の説明等が記載されている。情報処理装置100を薬局で用いる場合、画像処理装置11及び表示部13は、服薬指導時等に帳票が載置されるカウンター又はテーブルに設置される。撮像部12は、カウンター又はテーブル上の帳票を撮影可能に設置される。
図5は、図3に示される処理部112のメインフローチャートである。図5に示されるように、処理部112の処理は、ステップS101~S106を含む。
ステップS101は、画像取得処理である。ステップS101で、処理部112は、画像取得部112Aとして機能し、撮像部12から画像データ(以下、「処理前画像データ」と記載する。)を取得する。処理前画像データは、背景及び書面(帳票)を含む画像を示す。処理部112が撮像部12からの処理前画像データを処理対象とすることにより、対話中に書面を電子化することが容易となる。なお、記憶媒体16に記憶された処理前画像データを処理対象とする場合、記憶媒体16から処理部112への処理前画像データの転送が必要となるため、対話中に書面を電子化することが容易ではない。
ステップS102は、特定処理である。ステップS102で、処理部112は、特定部112Bとして機能し、処理前画像データが示す画像(以下、「処理前画像」と記載する。)を構成する全画素から、書面領域を特定する。書面領域は、書面を構成する画素の領域である。また、書面領域は、本開示における「第1領域」の一例である。処理部112は更に、処理前画像における書面の4隅を示す画素位置を特定する。
ステップS103は、変形処理である。ステップS103で、処理部112は、変形部112Cとして機能し、書面の4隅を示す画素位置に基づいて、書面領域を矩形に変形した矩形画像を生成する。
ステップS104は、文字認識処理である。ステップS104で、処理部112は、文字認識部112Dとして機能し、書面領域を対象に文字認識処理を実行する。文字認識処理により、処理部112は、書面領域に含まれる各文字を、予め定められた文字コードで示す文字データに変換する。
ステップS105は、合成処理である。ステップS105で、処理部112は、合成部112Eとして機能し、文字認識部112Dの認識結果を矩形画像に合成する。認識結果は、文字認識部112Dにより変換された文字データである。詳細には、矩形画像において、文字認識処理前の各文字がレイアウトされていた領域に認識結果が合成される。
ステップS101~S105の結果、処理後画像データが生成される。処理後画像データは、認識結果が書面領域上に合成された矩形画像を示す。ステップS105の次に、ステップS106が実行される。ステップS106は、表示処理である。ステップS106で、処理部112は、処理後画像データに基づいて、認識結果が合成された矩形画像を表示部13に表示させる。なお、処理後画像データは、保存処理又は印刷処理等の対象にもなる。保存処理では、処理部112は、処理後画像データを記憶部111に保存する。印刷処理では、処理部112は、処理後画像データに基づく矩形画像を、図示しないプリンタに印刷させる。
ところで、対話中、書面は、例えば第1状況、第2状況及び第3状況に置かれることがある。第1状況では、書面は、撮像部12の画角から外れる。第2状況では、書面上に手が置かれる。第3状況では、書面の隅に折り目が付いている。
図6は、第1状況及び第2状況で撮影された処理前画像データが表す画像、即ち、処理前画像400を示す図である。処理前画像400は、フルカラー画像等であり、二次元の画像座標系における座標値ごとに画素値を有する。図6に示されるように、処理前画像400は、書面41と、背景42と、不要物43とを含む。
書面41は、対話で参照される書面である。背景42は、書面41が載置される面である。詳細には、背景42は、カウンター又はテーブル等である。不要物43は、処理前画像400において書面41及び背景42以外の物体である。実施形態では、物体は、人体を含む概念である。図6の例では、不要物43は、書面41上に置かれた手である。なお、処理前画像400には、不要物43が映っていない場合もある。また、不要物43は、本開示における「書面及び背景以外の物体」の一例である。
図3中には、第1状況に関連して破線411が示されている。破線411は、書面41において撮像部12(図2参照)の画角から外れた部分を示している。実施形態では、画角は、処理前画像400の外縁414で囲まれる範囲である。図6には更に、第2状況に関連して不要物43が示されている。不要物43により、書面41の一部が処理前画像400には映らない。なお、図6には、第3状況に関連する折り目は示されていない。第3状況では、折り目による折り返しにより、書面41の一部は、処理前画像400には映らない。
画像処理装置11は、第1状況、第2状況、及び第3状況等のように、処理前画像400に書面41の主面全域が映らない状況であっても、下記の特定処理により、書面41の4隅を特定できる。
図7は、図5に示される特定処理(ステップS102)の詳細な処理手順を示すフローチャートである。図7に示されるように、処理部112による特定処理は、ステップS201~S205を含む。以下、図6及び図7を参照して、特定処理について詳説する。
ステップS201は、領域特定処理である。ステップS201を実行する処理部112は、本開示における「領域特定部」の一例である。ステップS201で、処理部112は、処理前画像400から、書面領域412と不要物領域431とを特定する。書面領域412は、書面41を表す画素が分布する領域である。不要物領域431は、不要物43を表す画素が分布する領域である。書面領域412及び不要物領域431は、本開示における「第1領域」及び「第2領域」の一例である。
詳細には、処理部112は、ステップS201でまず、不要物領域431を特定するために、肌色領域の特定処理を実行する。肌色領域の特定処理では、処理部112は、処理前画像400を構成する全画素の中から、第1特定範囲に含まれる画素を不要物領域431として特定する。第1特定範囲は、肌色として予め定められる画素値の範囲である。肌色領域の特定処理により、不要物領域431が特定可能であるため、情報処理装置100に追加のデバイスが不要となる。
処理部112は、ステップS201で更に、処理前画像を構成する全画素から、不要物領域431に含まれる画素を除いた画素群を、処理対象の画素群として決定する。処理部112は、処理対象の画素群の中から、第2特定範囲に含まれる画素を特定する。第2特定範囲は、書面領域412の色として予め定められる画素値の範囲である。書面領域412の色は、例えば白である。処理部112は、第2特定範囲に含まれる画素群を、書面領域412として特定する。なお、書面41には、文字及び/又は写真が記録されている。しかし、書面41の4隅を特定するには、書面領域412の外縁413を特定できれば足りる。従って、処理部112は、外縁413より内側に記録される文字又は写真を無視してもよい。
ステップS202は、基準点決定処理である。ステップS202を実行する処理部112は、本開示における「基準点決定部」の一例である。ステップS202で、処理部112は、書面領域412の外縁413における複数の特徴点P1を求める。詳細には、処理部112は、書面領域412を構成する全画素を対象に2値画像を生成する。処理部112は更に、2値画像に対して凸包処理を実行した後に、Douglas-Peuckerアルゴリズムを適用する。これにより、処理部112は、外縁413における複数の特徴点P1を取得する。図6には、6個の特徴点P1が例示されている。
処理部112は、取得した複数の特徴点P1に基づいて、基準点P2を決定する。従って、書面領域412の全画素に基づいて決定する場合と比較して演算量を低減することができる。基準点P2は、後述の判定処理(ステップS204)で必要となる周方向θの基準となる点である。詳細には、基準点P2は、複数の特徴点P1を頂点とする多角形に内包される。基準点P2としては、複数の特徴点P1の重心が例示される。基準点P2の他の例は、下記の通りである。複数の特徴点P1の各々は、画像座標系における座標値を有する。座標値は、x座標値及びy座標値の組み合わせである。この場合、基準点P2のx座標値は、複数の特徴点P1の各x座標値の平均値である。基準点P2のy座標値は、複数の特徴点P1の各y座標値の平均値である。
ステップS203は、特徴点特定処理である。ステップS203を実行する処理部112は、本開示における「特徴点特定部」の一例である。ステップS203で、処理部112は、書面領域412及び不要物領域431に基づいて、複数の特徴点P1が第1特徴点P11、第2特徴点P12、及び第3特徴点P13のいずれであるのかを特定する。第1特徴点P11は、書面41の隅を示す点である。第2特徴点P12は、書面領域412の外縁413において不要物領域431と接する点である。第3特徴点P13は、外縁413において処理前画像400の外縁414と接する点である。
ステップS204は、判定処理である。ステップS204を実行する処理部112は、本開示における「判定部」の一例である。ステップS204で、処理部112は、複数の特徴点P1の中から1つの特徴点P1を「注目特徴点」として選択する。処理部112は更に、注目特徴点を基準として、画像座標系において周方向θの一方側に隣り合う特徴点P1を「近傍特徴点」として選択する。周方向θは、画像座標系を規定する2つの座標軸に直交し、且つ基準点P2を通過するする軸に対する周方向である。
「注目特徴点」及び「近傍特徴点」は、本開示における「隣り合う2つの特徴点」の一例である。
次に、処理部112は、注目特徴点及び近傍特徴点が書面41における同一辺上にあるか否かを判定する。詳細には、処理部112はまず、注目特徴点が第1条件を満たすか否かを判定する。第1条件は、注目特徴点が第1特徴点P11であることである。第1条件を満たす場合、注目特徴点及び近傍特徴点が書面41における同一辺上にあると判定する。
注目特徴点が第1条件を満たさない場合、処理部112は、注目特徴点及び近傍特徴点が第2条件を満たすか否かを判定する。第2条件は、注目特徴点及び近傍特徴点の各々が第2特徴点P12であることである。第2条件を満たす場合、注目特徴点及び近傍特徴点が書面41における同一辺上にないと判定する。
第2条件を満たさない場合、処理部112は更に、注目特徴点及び近傍特徴点が第3条件を満たすか否かを判定する。第3条件は、注目特徴点及び近傍特徴点の各々が第3特徴点P13であることである。第3条件を満たす場合、注目特徴点及び近傍特徴点が書面41における同一辺上にないと判定する。
第3条件を満たさない場合、処理部112は更に、注目特徴点及び近傍特徴点が第4条件を満たすか否かを判定する。第4条件は、注目特徴点及び近傍特徴点の間のユークリッド距離が第1閾値以下であることである。第4条件を満たす場合、注目特徴点及び近傍特徴点が書面41における同一辺上にないと判定する。
なお、第4条件は、第5条件に変更されてもよい。第5条件は、注目特徴点、基準点P2及び近傍特徴点を順に線分で結んで形成される角度が第2閾値以下であることである。
第5条件を採用した場合、第4条件の場合と比較して、同一辺上にあるかないかの判定精度が向上する。詳細には、書面41から撮像部12までのユークリッド距離は、撮像部12の設置位置により大きく変わりうる。しかし、注目特徴点、基準点P2及び近傍特徴点から構成される角度は、撮像部12の設置位置により大きく変わらないからである。一方、第4条件を採用した場合、第5条件の場合と比較して、同一辺上にあるかないかの判定が簡素化される。
処理部112は、第2条件、第3条件及び第4条件のいずれも満たさない場合、注目特徴点及び近傍特徴点が書面41における同一辺上にあると判定する。ステップS204によれば、書面41における各辺上にある注目特徴点及び近傍特徴点が判定される。
ステップS205は、隅特定処理である。ステップS205を実行する処理部112は、本開示における「隅特定部」の一例である。ステップS205で、処理部112は、同一辺上にあると判定された注目特徴点及び近傍特徴点に基づいて、書面41の4隅を特定する。詳細には、処理部112は、ステップS205において判定された注目特徴点及び近傍特徴点の全組み合わせの中から1組を、第1特徴点組として選択する。処理部112は更に、注目特徴点及び近傍特徴点の全組み合わせの中から第2特徴点組を選択する。第2特徴点組は、第1特徴点組を基準として周方向θの一方側における隣に位置する、注目特徴点及び近傍特徴点の組みである。処理部112は、第1特徴点組における注目特徴点及び近傍特徴点を通過する直線と、第2特徴点組における注目特徴点及び近傍特徴点を通過する直線との交点を、書面41の4隅の1つとして求める。
図7に示される特定処理によれば、基準点決定処理(ステップS202)で、複数の特徴点P1が求められる。また、特徴点特定処理(ステップS203)で、複数の特徴点P1が、第1特徴点P11、第2特徴点P12、及び第3特徴点P13のいずれであるのかが特定される。また、判定処理(ステップS204)で、複数の特徴点P1のうち、隣り合う2つの特徴点P1が書面41における同一辺上にあるか否かが、第1条件乃至第4条件に基づいて判定される。その結果、書面41の主面全域が処理前画像400に映っていない場合であっても、隅特定処理(ステップS205)で、書面41の4隅が検出される。
以上、図面を参照して本開示の実施形態について説明した。ただし、本開示は、上記の実施形態に限られるものではなく、その要旨を逸脱しない範囲で種々の態様において実施できる。また、上記の実施形態に開示される複数の構成要素は適宜改変可能である。例えば、ある実施形態に示される全構成要素のうちのある構成要素を別の実施形態の構成要素に追加してもよく、又は、ある実施形態に示される全構成要素のうちのいくつかの構成要素を実施形態から削除してもよい。
また、図面は、発明の理解を容易にするために、それぞれの構成要素を主体に模式的に示しており、図示された各構成要素の厚さ、長さ、個数、間隔等は、図面作成の都合上から実際とは異なる場合もある。また、上記の実施形態で示す各構成要素の構成は一例であって、特に限定されるものではなく、本発明の効果から実質的に逸脱しない範囲で種々の変更が可能であることは言うまでもない。
(1)実施形態では、画像処理装置11は、撮像部12から取得した画像データを処理対象として、図5及び図7に示される処理を実行していた。しかし、これに限らず、画像処理装置11は、記憶媒体16に記憶された画像データを処理対象として、図5及び図7に示される処理を実行してもよい。
(2)実施形態では、画像処理装置11は、領域特定処理(ステップS201)で、肌色領域の特定処理により、不要物43としての手を表す画素が分布する不要物領域431を特定していた。しかし、不要物43は、手以外にも、例えば筆記具のような様々な物体も含む。
様々な不要物43を表す画素が分布する不要物領域431を特定するために、処理部122は、領域特定処理(ステップS201)において、リクエストデータをサーバ装置300に送信する。リクエストデータは、ステップS101で取得した処理前画像データを含む。サーバ装置300において、処理部33は、AIによる物体認識処理により、処理前画像データが示す処理前画像400を構成する全画素にラベルを割り当てる。処理部33は、画素ごとのラベルを含むレスポンスデータを情報処理装置100に送信する。
画像処理装置11において、処理部112は、レスポンスデータに含まれる各ラベルに基づいて、処理前画像400において書面領域412に含まれる画素と、不要物領域431に含まれる画素とを特定する。詳細には、複数の不要物43ごとに不要物領域431が特定される。AIによる物体認識処理により、様々な不要物43ごとに不要物領域431が特定可能となる。例えば距離センサにより不要物領域431が特定する場合には、紙片や定規のような薄い不要物43を検出することが難しい。しかし、AIによる物体認識処理によれば、薄い不要物43も検出可能である。
なお、AIによる物体認識処理は、画像処理装置11における処理部112で実行されてもよい。
(3)実施形態では、処理部112は、注目特徴点と、注目特徴点に対して周方向θの一方側において隣り合う近傍特徴点とに基づいて、判定処理(ステップS204)を実行していた。しかし、これに加えて、処理部112は更に、注目特徴点と、注目特徴点に対して周方向θの他方側において隣り合う近傍特徴点とに基づいて判定処理を実行してもよい。他にも、処理部112は、注目特徴点と、注目特徴点に対して周方向θの一方側において近接する複数の近傍特徴点とに基づいて、判定処理を実行してもよい。
本発明は、各種書面(帳票や名刺)の管理用のコンピュータプログラム、及びこれを実行可能なコンピュータ装置等に適用できる。
100 情報処理装置
11 画像処理装置
111 記憶部
112 処理部
112A 画像取得部
112B 特定部
112C 変形部
112D 文字認識部
112E 合成部
113 画像処理プログラム
12 撮像部
13 表示部
300 サーバ装置
31 通信IF部
32 記憶部
33 処理部

Claims (10)

  1. 背景及び書面を含む画像から、前記書面を表す第1領域と、前記書面及び前記背景以外の物体を表す第2領域とを特定する領域特定部と、
    前記第1領域及び前記第2領域に基づいて、前記書面の隅である点、前記第1領域の外縁において前記第2領域の外縁と接する点、及び前記第1領域の外縁において前記画像の外縁と接する点のいずれかを少なくとも含む複数の特徴点を特定する特徴点特定部と、
    前記複数の特徴点のうち、隣り合う2つの前記特徴点が前記書面における同一辺上にあるか否かを判定する判定部と、
    前記同一辺上にあると判定された前記隣り合う2つの特徴点に基づいて、前記書面の4隅を特定する隅特定部と
    を備える、画像処理装置。
  2. 前記複数の特徴点に基づいて基準点を決定する基準点決定部を備え、
    前記判定部は、前記基準点に基づいて、前記複数の特徴点の中から前記隣り合う2つの特徴点を特定し、前記隣り合う2つの特徴点が前記書面における同一辺上にあるか否かを判定する、請求項1に記載の画像処理装置。
  3. 前記判定部は、前記隣り合う2つの特徴点の間の距離が第1閾値以上である場合、前記隣り合う2つの特徴点が前記同一辺上にあると判定する、請求項1又は請求項2に記載の画像処理装置。
  4. 前記判定部は、前記隣り合う2つの特徴点の一方と、前記基準点と、前記隣り合う2つの特徴点の他方とで特定される角度が第2閾値以上である場合、前記隣り合う2つの特徴点が前記同一辺上にあると判定する、請求項2に記載の画像処理装置。
  5. 前記書面の4隅に基づいて、前記第1領域を矩形に変形した矩形画像を生成する変形部を備える、請求項1又は請求項2に記載の画像処理装置。
  6. 前記第1領域に対して文字認識処理を行う文字認識部と、
    前記文字認識部の認識結果を前記矩形画像に合成する合成部と
    を備える、請求項5に記載の画像処理装置。
  7. 前記合成部により前記認識結果が合成された前記矩形画像を表示部に表示させる、請求項6に記載の画像処理装置。
  8. 前記画像は、撮像装置により撮影される、請求項1又は請求項2に記載の画像処理装置。
  9. コンピュータが、背景及び書面を含む画像から、前記書面を表す第1領域と、前記書面及び前記背景以外の物体を表す第2領域とを特定するステップと、
    前記コンピュータが、前記第1領域及び前記第2領域に基づいて、前記書面の隅である点、前記第1領域の外縁において前記第2領域の外縁と接する点、及び前記第1領域の外縁において前記画像の外縁と接する点のいずれかである複数の特徴点を特定するステップと、
    前記コンピュータが、前記複数の特徴点のうち、隣り合う2つの前記特徴点が前記書面の辺上にあるか否かを判定するステップと、
    前記コンピュータが、前記辺上にあると判定された前記隣り合う2つの特徴点に基づいて、前記書面の4隅を特定するステップと
    を含む、画像処理方法。
  10. コンピュータに、
    背景及び書面を含む画像から、前記書面を表す第1領域と、前記書面及び前記背景以外の物体を表す第2領域とを特定するステップと、
    前記第1領域及び前記第2領域に基づいて、前記書面の隅である点、前記第1領域の外縁において前記第2領域の外縁と接する点、及び前記第1領域の外縁において前記画像の外縁と接する点のいずれかである複数の特徴点を特定するステップと、
    前記複数の特徴点のうち、隣り合う2つの前記特徴点が前記書面の辺上にあるか否かを判定するステップと、
    前記辺上にあると判定された前記隣り合う2つの特徴点に基づいて、前記書面の4隅を特定するステップと
    を実行させる、コンピュータプログラム。
JP2022103796A 2022-06-28 2022-06-28 画像処理装置、画像処理方法、及びコンピュータプログラム Active JP7842650B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2022103796A JP7842650B2 (ja) 2022-06-28 2022-06-28 画像処理装置、画像処理方法、及びコンピュータプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2022103796A JP7842650B2 (ja) 2022-06-28 2022-06-28 画像処理装置、画像処理方法、及びコンピュータプログラム

Publications (2)

Publication Number Publication Date
JP2024004231A JP2024004231A (ja) 2024-01-16
JP7842650B2 true JP7842650B2 (ja) 2026-04-08

Family

ID=89537886

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2022103796A Active JP7842650B2 (ja) 2022-06-28 2022-06-28 画像処理装置、画像処理方法、及びコンピュータプログラム

Country Status (1)

Country Link
JP (1) JP7842650B2 (ja)

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002057879A (ja) 2000-08-10 2002-02-22 Ricoh Co Ltd 画像処理装置と画像処理方法及びコンピュータ読み取り可能な記録媒体
JP2010258706A (ja) 2009-04-23 2010-11-11 Sharp Corp 画像処理装置、画像形成装置、画像処理装置の制御方法、プログラム、記録媒体
JP4918167B1 (ja) 2011-03-31 2012-04-18 パナソニック株式会社 画像処理装置およびこれを備えた原稿読取システム
JP2013192101A (ja) 2012-03-14 2013-09-26 Panasonic Corp 画像処理装置およびこれを備えた原稿読取システム
US20140270481A1 (en) 2012-03-30 2014-09-18 Daniel Kleinman System for determining alignment of a user-marked document and method thereof
JP2016149097A (ja) 2015-02-13 2016-08-18 シャープ株式会社 画像処理装置、画像処理方法、プログラム、記録媒体

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002057879A (ja) 2000-08-10 2002-02-22 Ricoh Co Ltd 画像処理装置と画像処理方法及びコンピュータ読み取り可能な記録媒体
JP2010258706A (ja) 2009-04-23 2010-11-11 Sharp Corp 画像処理装置、画像形成装置、画像処理装置の制御方法、プログラム、記録媒体
JP4918167B1 (ja) 2011-03-31 2012-04-18 パナソニック株式会社 画像処理装置およびこれを備えた原稿読取システム
JP2013192101A (ja) 2012-03-14 2013-09-26 Panasonic Corp 画像処理装置およびこれを備えた原稿読取システム
US20140270481A1 (en) 2012-03-30 2014-09-18 Daniel Kleinman System for determining alignment of a user-marked document and method thereof
JP2016149097A (ja) 2015-02-13 2016-08-18 シャープ株式会社 画像処理装置、画像処理方法、プログラム、記録媒体

Also Published As

Publication number Publication date
JP2024004231A (ja) 2024-01-16

Similar Documents

Publication Publication Date Title
CN110232311B (zh) 手部图像的分割方法、装置及计算机设备
US9684815B2 (en) Mobility empowered biometric appliance a tool for real-time verification of identity through fingerprints
CN111401266B (zh) 绘本角点定位的方法、设备、计算机设备和可读存储介质
JP4217664B2 (ja) 画像処理方法、画像処理装置
CN110674804A (zh) 文本图像的检测方法、装置、计算机设备和存储介质
US20110019243A1 (en) Stereoscopic form reader
EP2339507B1 (en) Head detection and localisation method
JPH10214346A (ja) ハンドジェスチャ認識システムおよび方法
WO2018234384A1 (en) Detecting artificial facial images using facial landmarks
CN107545223B (zh) 图像识别方法及电子设备
CN113792623A (zh) 安检ct目标物识别方法和装置
Stötzner et al. CNN based cuneiform sign detection learned from annotated 3D renderings and mapped photographs with illumination augmentation
JP7173197B2 (ja) 縞模様画像鑑定支援装置、縞模様画像鑑定支援方法及びプログラム
JP7842650B2 (ja) 画像処理装置、画像処理方法、及びコンピュータプログラム
US12230052B1 (en) System for mapping images to a canonical space
US12327387B2 (en) Image processing apparatus, image processing method, and recording medium
CN105096239A (zh) 图像配准方法及其装置以及图像拼接方法及其装置
JP2009025856A (ja) 帳票識別プログラム及び帳票識別装置
CN116052175B (zh) 文字检测方法、电子设备、存储介质及计算机程序产品
CN112329508A (zh) 手势识别方法、装置、设备及可读存储介质
CN117853440A (zh) 一种用于文本缺陷检测模型的训练方法以及电子设备
US11557108B2 (en) Polygon detection device, polygon detection method, and polygon detection program
JP3444171B2 (ja) 物品認識装置
CN112529013A (zh) 图像识别方法、装置、设备和计算机可读介质
JP7221919B2 (ja) 情報処理装置、情報処理方法及び情報処理プログラム

Legal Events

Date Code Title Description
RD03 Notification of appointment of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7423

Effective date: 20240603

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20250319

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20251210

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20251223

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20260115

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20260303

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20260327

R150 Certificate of patent or registration of utility model

Ref document number: 7842650

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150