JP2022184574A - 情報処理装置、情報処理方法、及びプログラム - Google Patents
情報処理装置、情報処理方法、及びプログラム Download PDFInfo
- Publication number
- JP2022184574A JP2022184574A JP2021092513A JP2021092513A JP2022184574A JP 2022184574 A JP2022184574 A JP 2022184574A JP 2021092513 A JP2021092513 A JP 2021092513A JP 2021092513 A JP2021092513 A JP 2021092513A JP 2022184574 A JP2022184574 A JP 2022184574A
- Authority
- JP
- Japan
- Prior art keywords
- area
- image
- information processing
- detection
- polygon
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 230000010365 information processing Effects 0.000 title claims abstract description 54
- 238000003672 processing method Methods 0.000 title claims description 3
- 238000001514 detection method Methods 0.000 claims abstract description 155
- 238000011156 evaluation Methods 0.000 claims description 35
- 238000000034 method Methods 0.000 claims description 33
- 238000004364 calculation method Methods 0.000 claims description 11
- 238000000605 extraction Methods 0.000 claims 1
- 238000012545 processing Methods 0.000 description 30
- 238000004458 analytical method Methods 0.000 description 27
- 238000005259 measurement Methods 0.000 description 26
- 238000010586 diagram Methods 0.000 description 16
- 230000008569 process Effects 0.000 description 10
- 230000008859 change Effects 0.000 description 8
- 238000013528 artificial neural network Methods 0.000 description 7
- 230000006870 function Effects 0.000 description 4
- 238000010191 image analysis Methods 0.000 description 4
- 238000012790 confirmation Methods 0.000 description 3
- 230000005484 gravity Effects 0.000 description 3
- 241001465754 Metazoa Species 0.000 description 2
- 238000003384 imaging method Methods 0.000 description 2
- 238000000691 measurement method Methods 0.000 description 2
- 238000003825 pressing Methods 0.000 description 2
- 230000004397 blinking Effects 0.000 description 1
- 239000003086 colorant Substances 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 230000008570 general process Effects 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 238000010801 machine learning Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000004044 response Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T11/00—2D [Two Dimensional] image generation
- G06T11/20—Drawing from basic elements, e.g. lines or circles
- G06T11/203—Drawing of straight lines or curves
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T11/00—2D [Two Dimensional] image generation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T11/00—2D [Two Dimensional] image generation
- G06T11/40—Filling a planar surface by adding surface attributes, e.g. colour or texture
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/60—Analysis of geometric attributes
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/60—Analysis of geometric attributes
- G06T7/62—Analysis of geometric attributes of area, perimeter, diameter or volume
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/70—Determining position or orientation of objects or cameras
- G06T7/73—Determining position or orientation of objects or cameras using feature-based methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2200/00—Indexing scheme for image data processing or generation, in general
- G06T2200/24—Indexing scheme for image data processing or generation, in general involving graphical user interfaces [GUIs]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/20—Special algorithmic details
- G06T2207/20084—Artificial neural networks [ANN]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/30—Subject of image; Context of image processing
- G06T2207/30196—Human being; Person
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Geometry (AREA)
- Image Analysis (AREA)
Abstract
【課題】少なくとも3つの検出対象の位置及び大きさに基づいて画像中の各位置に対応する検出対象の大きさを推定するためのパラメータを算出する情報処理装置において、パラメータを算出するために用いる検出対象を視覚的、直感的にわかりやすく設定する。【解決手段】画像中の少なくとも3つの検出対象の位置及び大きさに基づいて、画像中の各位置に対応する検出対象の大きさを推定するためのパラメータを算出する。画像上に、画像中の少なくとも3つの検出対象の候補の位置それぞれを頂点とする多角形を表示する。ユーザ入力に基づいて、少なくとも3つの検出対象の候補を、少なくとも3つの検出対象として決定する。前記決定された少なくとも3つの検出対象の位置及び大きさに基づいて、前記画像中の各位置に対応する検出対象の大きさを推定するためのパラメータを算出する算出する。【選択図】図6
Description
本実施形態に係る発明は、画像から物体を検出する技術に関する。
一般に、検出処理を行う画像処理装置では、検出対象の大きさを必要とするものが多い。特許文献1では、画像解析処理の結果に基づいて、その画像の1画素あたりが現実世界でどの程度の大きさに相当するかを設定する技術が開示されている。
画像上の位置に対応する検出対象の大きさを推定する場合、3以上の検出対象の位置及び大きさを用いてそれらの関係性を推定する技術がある。しかしながら、ここで用いる検出対象が密集している場合など、画像全体においての検出対象の位置と大きさとの関係性を推定するには適切性が低い場合が存在する。特許文献1に記載の技術では、画像解析によって検出された検出対象のうちのどれを用いてパラメータを算出しているのかが提示されないため、そのように適切性が低い場合であるか否かがユーザにとって視覚的、直感的に判別しにくい。
本発明は、少なくとも3つの検出対象の位置及び大きさに基づいて画像中の各位置に対応する検出対象の大きさを推定するためのパラメータを算出する情報処理装置において、パラメータを算出するために用いる検出対象を視覚的、直感的にわかりやすく設定することを目的とする。
本発明の目的を達成するために、例えば、一実施形態に係る情報処理装置は以下の構成を備える。すなわち、画像上に、前記画像中の少なくとも3つの検出対象の候補の位置それぞれを頂点とする多角形を表示する第1の表示手段と、ユーザ入力に基づいて、前記少なくとも3つの検出対象の候補を、前記少なくとも3つの検出対象として確定させるユーザ入力を取得する第2の取得決定する決定手段と、前記決定された少なくとも3つの検出対象の位置及び大きさに基づいて、前記画像中の各位置に対応する検出対象の大きさを推定するためのパラメータを算出する算出手段と、を備えることを特徴とする。
パラメータを算出するために用いる検出対象を視覚的、直感的にわかりやすく設定することができる。
以下、添付図面を参照して実施形態を詳しく説明する。なお、以下の実施形態は特許請求の範囲に係る発明を限定するものではない。実施形態には複数の特徴が記載されているが、これらの複数の特徴の全てが発明に必須のものとは限らず、また、複数の特徴は任意に組み合わせられてもよい。さらに、添付図面においては、同一若しくは同様の構成に同一の参照番号を付し、重複した説明は省略する。
[実施形態1]
本実施形態に係る情報処理装置は、画像中の少なくとも3つの検出対象の位置及び大きさに基づいて、画像中の各位置に対応する検出対象の大きさを推定するためのパラメータを算出する。そのために、本実施形態に係る情報処理装置100は、画像中の検出対象3つ以上の候補を指定するユーザ入力を取得し、指定された検出対象の各候補を頂点とする多角形を表示する。次いで情報処理装置100は、指定された検出対象の候補を、上述のパラメータの算出に用いる検出対象として確定させるユーザ入力を取得する。以下、単に「候補」と書く場合、このようなパラメータ設定に用いる少なくとも3つの検出対象の候補のことを指すものとする。
本実施形態に係る情報処理装置は、画像中の少なくとも3つの検出対象の位置及び大きさに基づいて、画像中の各位置に対応する検出対象の大きさを推定するためのパラメータを算出する。そのために、本実施形態に係る情報処理装置100は、画像中の検出対象3つ以上の候補を指定するユーザ入力を取得し、指定された検出対象の各候補を頂点とする多角形を表示する。次いで情報処理装置100は、指定された検出対象の候補を、上述のパラメータの算出に用いる検出対象として確定させるユーザ入力を取得する。以下、単に「候補」と書く場合、このようなパラメータ設定に用いる少なくとも3つの検出対象の候補のことを指すものとする。
以下、本実施形態に係る、人数カウントシステムにおいて用いられる情報処理装置100について説明を行う。ここで、人数カウントシステムとは、画像解析により画像中の検出対象を検出し、検出した検出対象の数のカウントを行うシステムであるものとする。検出対象は人体であるものとして説明を行うが、例えば動物又は車両など、検出可能であるならば特に限定はされず、また複数種類の検出対象の検出処理が同時に行われてもよい。本実施形態に係る人数カウントシステムでは、画像上の位置(遠近)を考慮した人体のサイズが、検出処理におけるパラメータとして用いられる。ここでは、画像全体に対して検出処理が行われてもよく、画像中の部分領域にのみ検出処理が行われてもよい。以下、「解析」とは、上述の人数カウントを行う処理のことを指すものとして説明を行う。
図1は、情報処理装置100のハードウェア構成の一例を示すブロック図である。情報処理装置100は、プロセッサ101、メモリ102、ネットワークインターフェース(I/F)103、表示装置104、及び入力装置105を備える。プロセッサ101は、例えばCPUであり、図2に示される情報処理装置100の有する各機能部による処理を行う。メモリ102は、例えばROM及びRAMであり、プロセッサ101が利用するデータ又はプログラム等を格納する。表示装置104は、液晶ディスプレイなどであり、プロセッサ101による処理の結果などを表示しユーザに提示する。入力装置105は、マウス及びキーボード、タッチパネル、又はボタンなどであり、ユーザの入力を取得する。I/F103は、情報処理装置100がネットワークに接続する際のインターフェースである。本実施形態においては、プロセッサ101がメモリ102に格納されたプログラムに基づいて処理を実行することにより、情報処理装置100の各機能部による機能が実現される。
図2は、本実施形態に係る情報処理装置100の機能構成の一例を示すブロック図である。情報処理装置100は、画像取得部201、表示部202、算出部203、設定部204、及び解析部205を有する。
画像取得部201は、処理対象とする画像を1つ以上取得する。画像取得部201はメモリ102に格納されている画像を取得してもよく、I/F103を介して画像を取得してもよく、不図示の撮像部を用いて画像を取得してもよい。画像取得部201は、撮像日時などの画像に関する情報を利用して、特定の条件に沿った画像の集合(例えば、同カメラによる所定時間おきの画像など)を取得することができる。
表示部202は、画像取得部201が取得した画像を表示する。次いで表示部202は、取得した画像上に対する、候補を指定するユーザ入力を取得する。例えば、表示部202は、候補の指定用のプレビュー画像を表示することができる。詳細な説明は図4~図7を参照して後述するが、表示部202は、画像上に、候補を指定する際に用いる指定子を重畳して表示してもよい。その場合、表示部202は、検出対象を指定する指定子を操作するユーザ入力を、マウスカーソルを介したクリック操作によって取得してもよく、タッチパネルへのタッチ操作によって取得してもよい。ここでは、ユーザ操作によって配置された指定子が重畳する検出対象が、ユーザ入力によって指定された検出対象であるものとする。この処理は候補を指定するユーザ入力を取得するのであれば特に限定されるわけではなく、例えば表示部202は、ユーザ入力として画像中の座標の指定を取得してもよい。表示部202は、3以上の所定数(例えば、3、4、5、又はそれ以上)の候補に対する指定を取得するものとするが、ユーザが候補の確定操作を行う前に任意の数の候補を指定できる構成であってもよい。
また、表示部202は、候補を指定するユーザ入力を、複数の画像にわたって取得してもよい。例えば表示部202は、時間的に連続する画像を複数取得し、そのうちの1つ以上に対するユーザ入力を取得することができる。そのために、表示部202は、候補の指定に用いる複数の画像を、切り替えて表示可能であってもよく、同時に表示してもよい。複数の画像に対して候補の指定が行われている場合、後述する補助用図形を表示する画像は、それらの複数の画像の代表画像(例えば、最新時刻の画像)であってもよく、複数の画像を合成した画像(例えば、各候補の指定子を同時に表示する画像)であってもよい
表示部202は、画像上に、指定された各候補の位置を頂点とする補助用図形(多角形)を表示する。ユーザは、この補助用図形を確認し、指定した候補が適切なものであるか否かの判断を下すことができる。例えば、表示部202は、3つの候補が指定された場合に、その各候補の位置を頂点とする三角形を、画像上に重畳して表示することができる。ここでは、各候補の位置として指定子の中心位置が用いられるものとするが、例えば検出された頭部の位置など任意の検出位置が用いられてもよく、また検出位置から上下所定幅に余裕を持たせた範囲内から取得される位置が用いられてもよい。また、補助用図形の各辺は基本的には直線であるが、例えば放物線などの曲線であってもよい。
表示部202は、指定された候補それぞれの位置に応じて候補としての適切性の評価情報を生成し、生成した評価情報に応じた態様で補助用図形を表示してもよい。本実施形態に係る表示部202は、各候補の位置に応じて決定される補助用図形の面積に応じて候補としての適切性の評価情報を生成する。表示部202は、補助用図形について、面積が大きいほど濃い色による表示を行うようにしてもよく、面積が所定の閾値を超えるか否かによって異なる色で表示を行うようにしてもよい。
図4~図6は、本実施形態に係る表示部202による表示の説明を行うための図である。図4は、表示部202が表示するプレビュー画像の一例を示している。画像群400は、候補を指定するためにユーザに提示される複数の画像である。画像401には人体402が映っており、これが検出処理によって検出される。画像群400は、検出対象を写していない画像を含んでいてもよい。
図5は、ユーザに候補を指定させるために表示部202が表示するGUIの一例を示す図である。設定画面500では、指定子502をユーザが用いて、画像501に写る人体のうちから候補とする人体が指定される。ここでは、候補を指定するために、人体の上半身と位置及びサイズが一致するように指定子を配置させるものとするが、例えば身長が一致するように指定子を全身に合わせてもよく、又は頭部幅が一致するように指定子を頭部に合わせてもよい。補助用図形503は、指定された各候補を頂点とする多角形であり、ここでは三角形である。また、設定画面500上の確定ボタン505が押下された場合に、その時点で指定されている候補が、検出対象の大きさを推定するためのパラメータを算出するために用いる人体として設定される。また、設定画面500は、表示する画像を変更する画像変更ボタン504を表示している。ユーザは、異なる画像から候補を指定する場合に、画像変更ボタン504を押下することにより、表示する画像を切り替えることができる。ここでは、表示する画像を変更する前に配置した指定子は消去され、新たに表示される画像において新規に候補の指定を行うものとする。一方で、画像の変更後にも画像上に配置された指定子が残り、複数の画像にわたって配置された全指定子に基づいて補助用図形503が形成されてもよい。
また、設定画面506は、設定画面500において確定ボタン505が押下されず、画像変更ボタン504が押下されてから候補の再選択が行われた場合の画面である。設定画面506においては、設定画面500とは異なる指定子502が3つ指定され、より大きな面積を有する補助用図形503が表示されている。表示する画像を変更する場合、画像変更ボタン504が押下されるたびに次の画像(例えば、時間的に連続している次の画像)へと表示の変更が行われてもよい。また、表示する画像を変更する場合、設定画面506に表示されるような「前の画像」ボタン又は「次の画像」ボタンの押下に応じて、それぞれ前の画像又は次の画像へと表示の変更が行われてもよい。
図6は、指定された候補によって算出される適切性の評価情報に応じた補助用図形の表示を行うGUIの一例を示す図である。ここでは、指定した候補が密集してしまうと位置による大きさの差に対して個体差の影響が大きくなってしまうことを考慮して、指定した各候補を頂点とする多角形の面積が大きくなるほど適切性が高く設定される。図6においては、その面積に応じた濃淡表示によって(面積が大きいほど色が濃くなるように)補助用図形が表示されている。設定画面601~603は、それぞれ補助用図形603~605を表示しており、その面積に応じて、補助用図形605、604、603の順に表示色が濃くなっている。表示部202は、表示色と適切性の度合いの関係を示すカラーパレット606を設定画面上に表示することにより、視覚的にわかりやすい表示を行ってもよい。なお、表示色の変更は補助用図形の塗りつぶし色の変更であってもよく、枠線の色の変更であってもよく、対応する補助用図形が判別可能であれば特にその箇所は限定されない。枠線の色を変更する場合、表示部202は、1つの補助用図形の全ての辺の色を統一してもよく、辺ごとに異なる色で表示を行ってもよい。例えば表示部202は、補助用図形の辺をその長さに応じた色で表示を行い、短い辺を形成する候補の再設定を促してもよい。辺の長さに応じた色は、補助用図形の面積に応じた色と同様に、長さに応じた濃淡表示による表示がされてもよく、所定の閾値を超えるか否かに応じて異なる色で表示がされてもよい。
なお、ここでは適切性の評価情報が色によって表示されるものとして説明を行うが、適切であるか否かがユーザに把握可能な表示であれば特にこれに限定されるわけではない。表示部202は、補助用図形の適切性の評価を、例えばメッセージによって表示してもよく、明滅表示(例えば、面積が閾値よりも高い場合には補助用図形が点滅する)によって表示してもよい。ここでは、例えば第1の閾値t1及び第2の閾値t2(t1<t2)が設定され、補助用図形の適切性の評価を、面積Sがt2よりも大きい場合には高いものとし、Sがt1より高くt2以下である場合には中程度とし、Sがt1以下であれば低いものとする。この場合表示部202は、適切性の評価に応じて「優」、「可」、又は「不可」の対応する文字表示を行ってもよく、候補として適切とするt2<Sの場合に「優」の表示を行ってもよく、S≦t1の場合に再設定を促すべきと判断して「不可」の表示を行ってもよい。ここで用いられる閾値の値は、予め設定されていてもよく、例えば解析処理を行う領域の面積の所定の割合など、設定に応じて変動してもよい。
また表示部202は、指定された候補の位置に応じて、(例えば確定ボタン505が押下されたタイミングで)警告を表示してもよい。例えば表示部202は、補助用図形の面積が所定の閾値よりも小さい場合に、再設定を促す旨の警告を表示してもよい。また、表示部202は、指定された候補の位置が一直線に並んでいる場合には、算出されるパラメータによって人体の大きさの推定ができる範囲が限定されてしまうため、再設定を促す旨の警告を表示してもよい。また、表示部202は、指定された候補が1つの直線の近傍に集中している(一直線に近いように並んでいる)場合には、その直線に対して垂直方向への解析処理の精度が低下してしまうことを考慮して、再設定を促す旨の警告を表示してもよい。ここでは、指定された候補の位置が、ある直線を中心として所定の幅を有する部分領域内に含まれている場合に、指定された候補が1つの直線の近傍に集中しているとして扱うものとする。なおここでは、表示部202は適切性の評価が低い場合には再設定を促す旨の警告を表示するものとしたが、適切性の評価が低い間には確定ボタンの表示を変更して押下操作を不可能としてもよい。
図7は、指定された候補の適切性の評価情報を表示する指標の一例を示す図である。この例では、画像中に解析を行う領域702が設定されており、領域702の面積をS1、補助用図形の面積をS2、領域702と補助用図形とが重複している領域の面積をS3とする。ここでは、表示部202は、その補助用図形の適切性の評価を、例えばS2がS1の所定の割合以下(X%以下)である場合には不可とし、S2がS1のX%を上回りS1以下である場合には可とし、S2がS1を上回る場合に良としてもよい。ここで、Xは0より大きく100以下である、所望の精度に応じて設定される値とする。このように評価を行う場合には、領域702の位置を設定する前に評価方法の設定を行うことができる。
また例えば、表示部202は、補助用図形の適切性の評価を、S3とS1とが一致する場合には優とし、0<S3<S1の場合には可とし、それ以外の場合には不可としてもよい。このように評価を行う場合には、領域702の位置の設定を考慮した上で評価を行うことができる。
また、図7において、領域704は画像の内縁部の領域であり、領域705は補助用図形702と領域704とが重複している領域であり面積はS5となる。広角レンズを用いた撮像では、領域704のような撮像画像の内縁部は歪が生じやすい。したがって、画像の周縁に寄るほど、人体の位置に対する大きさの関係性も歪んでしまうことが考えられるため、そのような位置の人体は候補としては不適切となりやすい。そのような観点から、表示部202は、領域702への領域705の重複度合いに応じて、補助用図形の適切性の評価情報を算出してもよい。この例では、表示部202は、適切性の評価を、S4が0の場合には優とし、0より大きく閾値以下である(0<S4≦Y)場合には可とし、Y<S4の場合には不可とするものとする。ここで、Yは、上述の重複度合いの判断に用いられる度合いであり、固定値であってもよく、領域704の面積に応じて(例えば、割合で)設定される値であってもよい。なお、ここで内縁部の領域とは、画像の縁から所定の幅(例えば、画像全体の幅の1/10の幅)を有する領域であってもよく、図7に示されるように、画像全体から画像に略内接する楕円などの図形を除いた領域であってもよい。
算出部203は、パラメータの算出に用いると確定した人体の位置及び大きさに基づいて、画像中の各位置に対応する人体の大きさを推定するためのパラメータを算出する。ここでは、算出部203は、画像中の人体の位置(x,y)に対する人体の大きさsを算出する関数におけるパラメータを算出する。例えば、算出部203は、位置と大きさとの関係をs=ax+by+cとして、パラメータa,b,及びcを算出することができる。この場合、未知のパラメータは3つであるので、少なくとも3つの人体iの位置(xi,yi)及び大きさsiが必要となる。このパラメータの算出処理は、例えば最小二乗法などの統計処理を用い画像内の座標と検出対象の大きさを対応付ける1つ以上の未知のパラメータを算出する、一般的な処理と同様に行うことが可能である。また、人体以外の検出対象について同様にパラメータを算出する場合、その検出対象の大きさは検出処理によって画像中から取得されてもよく、人体の大きさとの比率を用いて算出されてもよい。人体とそれ以外の検出対象との大きさの比率は、その種類に応じて予め設定されていてもよく、ユーザが設定できるように構成されていてもよく、検出処理中に自動で推定されてもよい。
設定部204は、解析の処理に必要な設定を行う。本実施形態に係る設定部204は、人体検出、追尾、及び人数のカウント処理に用いる設定の参照、編集、並びに登録を行う。また、上述の表示部202及び算出部203が行う処理の一部又は全てを設定部204が行ってもよい。解析部205は、画像取得部201が取得した画像に対して解析処理を行う。解析処理については実施形態2において詳細な説明を行う。
図3は、本実施形態に係る情報処理装置100が行う処理の一例を示すフローチャートである。S301で画像取得部201は、プレビュー用に1枚以上の画像を取得する。S302で表示部202は、S301で取得した画像のうちの1つを表示し、指定子と補助用図形とを画像に重畳して表示する。ここでは、初期設定として所定数(例えば3つ)の人体が候補として選択され、指定子と補助用図形の表示が行われるものとする。
S303で表示部202は、候補を指定するユーザ入力を取得する。続くS304で表示部202は、取得した候補の指定に応じた指定子と補助用図形との表示を行う。S305で表示部202は、指定されている候補をパラメータの算出に用いる人体として確定させるユーザ入力を取得する。次いで算出部203は、用いることが確定した人体の位置及び大きさに基づいて、画像中の各位置に対応する人体の大きさを推定するためのパラメータを算出して登録する。
このような構成によれば、少なくとも3つの検出対象の位置及び大きさに基づいて画像中の各位置に対応する検出対象の大きさを推定するためのパラメータを算出する情報処理装置において、検出対象の各候補を頂点とする多角形を表示することができる。次いで、それらの候補をパラメータを算出する際に用いる検出対象として確定させるユーザ入力を取得し、上述のパラメータを算出することができる。したがって、位置ごとの検出対象の大きさを推定するパラメータを算出する前に、その際に用いる検出対象の候補の位置関係を視覚的にわかりやすく提示することにより、適切な候補が選択されている場合にユーザからの確定指示を取得しやすくすることができる。
[実施形態2]
以下、本実施形態に係る交通量計測システムにおいて用いられる情報処理装置100について説明を行う。ここで、交通量計測システムとは、画像解析により画像中の検出対象を検出し、画像中に設けた検知線を通過した検出対象の数の計測を行うシステムであるものとする。検出対象は人体又は車両であるものとして説明を行うが、例えば動物など、検出可能な対象であれば特に限定はされない。この解析処理は、数の計測を行う検出対象ごとに行われる。なお、解析負荷の軽減のため、解析処理は画像全体ではなく検知線の近傍の領域のみ行うものとするが、例えば画像全体に対して行ってもよく、検知線近傍に加えて注目する部分領域に対しても行ってもよい。
以下、本実施形態に係る交通量計測システムにおいて用いられる情報処理装置100について説明を行う。ここで、交通量計測システムとは、画像解析により画像中の検出対象を検出し、画像中に設けた検知線を通過した検出対象の数の計測を行うシステムであるものとする。検出対象は人体又は車両であるものとして説明を行うが、例えば動物など、検出可能な対象であれば特に限定はされない。この解析処理は、数の計測を行う検出対象ごとに行われる。なお、解析負荷の軽減のため、解析処理は画像全体ではなく検知線の近傍の領域のみ行うものとするが、例えば画像全体に対して行ってもよく、検知線近傍に加えて注目する部分領域に対しても行ってもよい。
ここで、検知線とは、上述した交通量計測システムにおいて用いられる、検出対象の通過数を計測するために画像中に設けられる線分又は線分状の領域であるものとする。検知線、及び検知線近傍に設定される解析用の部分領域としては一般的な交通量計測システムにおいて用いられるものを任意に利用可能であり、公知技術に関する詳細な説明は省略する。ここで、動画像に含まれる複数の画像から、部分領域における部分画像がそれぞれ抽出され、抽出した部分画像に対して解析処理が行われて検出対象の流れが計測される。以下、このように部分領域に対応する部分画像も含めて部分領域と呼ぶものとする。
本実施形態に係る情報処理装置100は、実施形態1の図1に示されるハードウェア構成、及び図2に示される機能構成と同様の構成を有し、同様に処理を行うことができるため、重複する説明は省略する。
本実施形態に係る解析部205は、動画像に基づいて検出対象の流れを計測する。そのために、表示部202は、検出対象の流れを計測する位置を示す検知線の設定を画像上に行う。解析部205は、例えば検知線によって区切られる一方の領域から他方の領域へと、検知線を交差して移動した検出対象の流量、すなわち通過した検出対象の数を計測することができる。
流れの計測のためには様々な方法を利用することができる。例えば、検出対象の人物を検出して追尾する方法や、検出対象の人物の位置、移動方向、及び移動速度などを推定して流量を直接求める方法などが挙げられる。このような計測方法を実現するためのアルゴリズムとしては、例えば、マッチング法、オプティカルフローを用いた方法、機械学習を用いた方法、及びニューラルネットワークを用いた方法が挙げられる。また、これらの方法を複数組み合わせて用いることもできる。
流れの計測のためには、部分画像を単独で用いてもよいし、複数の部分画像を同時に用いてもよい。複数の部分画像を用いる場合は、同一時刻における部分画像を用いてもよいし、異なる時刻における部分画像を用いてもよい。
解析部205による具体的な処理方法としては、例えば以下の方法が挙げられる。まず、解析部205は、時刻t1における各部分画像をニューラルネットワークに入力することにより、時刻t1における検知線周辺の検出対象の位置を推定する。同様に、解析部205は、時刻t2における各部分画像をこのニューラルネットワークに入力することにより、時刻t2における検知線周辺の計測対象の位置も推定する。このニューラルネットワークは、画像から画像中の計測対象(例えば人物の頭部)の位置を推定するように学習しておくことができる。また、推定精度が向上する別の方法として、画像から画像中の計測対象の密度分布を推定するように学習されたニューラルネットワークと、密度分布から計測対象の位置を推定するように学習されたニューラルネットワークと、を組み合わせて用いてもよい。このような方法により、解析部205は、異なる領域のそれぞれについて独立に、この領域から抽出された部分画像を用いて、それぞれの領域における計測対象の位置を推定することができる。
次に、解析部205は、時刻t1における計測対象の推定位置と、時刻t2における計測対象の推定位置とのマッチングを行うことにより、時刻t1から時刻t2の間の計測対象の軌跡を推定する。マッチング手法としては、マッチングさせる計測対象間の距離に応じたコストを最小化する方法を用いることができ、例えばハンガリアンマッチング法を用いることができる。こうして推定された軌跡が検知線と交差する場合に、1つの計測対象が検知線を通過したと判定することができる。このようなマッチング処理及び軌跡の推定は、それぞれの部分画像から検出された計測対象の位置に基づいて、同時に行ってもよい。
もっとも、流れの計測方法は上記の方法には限定されない。解析部205は、異なる領域のそれぞれについて独立に、この領域から抽出された部分画像を用いて、それぞれの領域における計測対象の軌跡を推定し、又は計測対象の流れを計測してもよい。例えば、解析部205は、部分画像ごとに計測対象の位置を推定するだけでなく、部分画像ごとに計測対象の軌跡を推定してもよい。また、時刻t1及び時刻t2における同位置の部分画像をニューラルネットワークに入力し、計測対象の位置、移動方向、及び移動速度などを推定することにより、計測対象の流れを推定してもよい。
本実施形態に係る表示部202は、実施形態1と同様の処理に加えて、取得した画像を、検知線の設定用のプレビュー画像として表示することができる。表示部202は、画像上に、検知線を指定する際に用いる検知線指定子を重畳して表示してもよい。その場合、表示部202は、検知線を設定する指定子を操作するユーザ入力を、マウスカーソルを介したクリック操作によって取得してもよく、タッチパネルへのタッチ操作によって取得してもよい。ここでは、ユーザ操作によって、検知線の始点と終点とが配置され、その始点から終点までの線分がユーザによって入力された検知線として設定されるものとする。この処理は検知線を設定するユーザ入力を取得するのであれば特に限定されるわけではなく、例えば表示部202は、ユーザ入力として検知線の始点及び終点の座標の指定を取得してもよい。また設定部204は、始点と終点との区別なく2点の指定を取得してから検知線の向きを取得してもよく、始点、向き、及び長さの入力を取得してもよい。表示部202は、1以上の所定数(例えば、1、2、又はそれ以上)の検知線の設定を取得するものとし、その個数は任意に決定可能である。なお、検知線は基本的には直線であるものとして説明を行うが、例えば任意の折れ線、又は曲線などであってもよい。
本実施形態に係る表示部202は、検知線の近傍に解析用の部分領域(パッチ)を設定する。表示部202は、複数のパッチによって検知線の全体が含まれるようにパッチを設定する。ここで表示部202は、パッチの大きさを、実施形態1と同様の方法により算出部203が算出したパラメータを用いて、パッチの位置に対して推定される検出対象の大きさを用いて設定する。例えば表示部202は、それぞれが中心を検知線上に有するパッチの大きさを、その中心の位置から推定される検出対象の大きさに基づいて設定することができる。ここで、パッチは、パッチの中心の位置に対応する検出対象の大きさ(例えば、人体の肩幅)の6.5倍の長さを一辺の長さとする正方形の領域であるものとするが、その大きさ及び形状は特に限定はされず、例えば長方形、台形、又は円形などであってもよい。情報処理装置100は、このパッチ内の領域に対して解析処理を行い、検出対象の数の計測を行うことができる。
また、パッチを台形とする場合、表示部202は、そのパッチの中心(例えば、重心)の位置に対応する検出対象の大きさから、パッチの上底と下底との長さをそれぞれ設定することができる。例えば表示部202は、パッチの上底の長さを重心位置の検出対象の大きさの4倍とし、パッチの下底の長さを重心位置の検出対象の大きさの6.5倍としてもよい。パッチを台形とすることにより、遠近による検出対象が写る大きさの変化を考慮したパッチ内での解析処理を行うことができる。なお、台形のパッチは、画像内の遠近による奥行き方向が台形の上底及び下底と直交する向きに設定されるものとするが、所望の条件に応じて調整がなされてもよい。
なお、この検知線の端の近傍における計測漏れを抑制するために、表示部202は、検知線近傍に、上述のパッチに加えて、検出対象の数の計測は行わないが検出及び追尾処理は行う部分領域(検出パッチ)を設定してもよい。ここで、検出パッチは、パッチそれぞれに対して1つ設定される、対応するパッチを完全に包含する部分領域である。検出パッチの形状、大きさ、及び位置は、対応するパッチを完全に包含するのであれば限定はされない。ここではパッチと同様の形状を有する、パッチに対して所定の比率の大きさ(パッチの大きさ<検出パッチの大きさ)の、対応するパッチと中心座標を揃えて設定される部分領域からそのパッチを除いた領域であるものとする。以下、パッチは一片の長さが人体の肩幅の6.5倍の長さの正方形の領域である一方で、検出パッチは一片の長さが人体の肩幅の8倍の長さの正方形の領域からパッチを除いた領域であるものとして説明を行う。このような検出パッチを生成することで、パッチ内の解析処理で検出対象の数の計測を行う前に、パッチの外縁部の領域となる検出パッチ内で検出及び追尾処理を開始することにより、検出対象の計測漏れを抑制することが可能となる。
図8は、本実施形態に係る表示部202が表示するプレビュー画像の一例を示している。画像群800は、2以上の画像801の集合である。画像801には、検出対象である人体802と、車両803と、が写っており、これらが交通量計測システムにおける検出処理によって検出される。画像群800は、検出対象を写していない画像を含んでいてもよい。
図9は、本実施形態に係る情報処理装置100が行う、検知線に対してパッチを設定する処理の一例を説明するための図である。画像901では、検知線903が表示され、検知線903の全体を内側に包含するように、複数のパッチ902が検知線903の近傍に設定されている。ここでは、各パッチは中心が検知線903上にある正方形の領域であり、そのそれぞれの大きさが中心の位置に基づいて、上述の通りに設定されている。
画像904では、2つ存在する検知線906それぞれを包含するように、2つのパッチ905が検知線906の近傍に設定されている。ここでは、各パッチは重心が検知線上に存在する台形の領域であり、上底の長さと下底の長さとがその重心の座標に基づいて設定されている。また、この台形の上底の長さと下底の長さとが等しく設定されていてもよい。
このような構成によれば、実施形態1と同様の処理によって少なくとも3つの検出対象としてユーザが確定させた検出対象の位置及び大きさに基づいて、画像中の各位置に対応する検出対象の大きさを推定するためのパラメータを算出することができる。次いで、検出対象の流れを計測するための検知線を設定し、検知線の近傍に、各部分領域の位置から算出したパラメータを用いて推定される検出対象の大きさに基づく大きさを有する複数の部分領域を設定する。さらに、動画像から部分領域において抽出される部分画像を用いて、検知線を通る検出対象の流れを計測することができる。したがって、パラメータを算出するために用いる検出対象を視覚的、直感的にわかりやすく設定し、その設定に基づいて検出対象の流れを計測することが可能となる。
(その他の実施例)
本発明は、上述の実施形態の1以上の機能を実現するプログラムを、ネットワーク又は記憶媒体を介してシステム又は装置に供給し、そのシステム又は装置のコンピュータにおける1つ以上のプロセッサがプログラムを読出し実行する処理でも実現可能である。また、1以上の機能を実現する回路(例えば、ASIC)によっても実現可能である。
本発明は、上述の実施形態の1以上の機能を実現するプログラムを、ネットワーク又は記憶媒体を介してシステム又は装置に供給し、そのシステム又は装置のコンピュータにおける1つ以上のプロセッサがプログラムを読出し実行する処理でも実現可能である。また、1以上の機能を実現する回路(例えば、ASIC)によっても実現可能である。
発明は上記実施形態に制限されるものではなく、発明の精神及び範囲から離脱することなく、様々な変更及び変形が可能である。従って、発明の範囲を公にするために請求項を添付する。
201:画像取得部、202:表示部、203:算出部、204:設定部、205:解析部
Claims (18)
- 画像上に、前記画像中の少なくとも3つの検出対象の候補の位置それぞれを頂点とする多角形を表示する第1の表示手段と、
ユーザ入力に基づいて、前記少なくとも3つの検出対象の候補を、前記少なくとも3つの検出対象として決定する決定手段と、
前記決定された少なくとも3つの検出対象の位置及び大きさに基づいて、前記画像中の各位置に対応する検出対象の大きさを推定するためのパラメータを算出する算出手段と、
を備えることを特徴とする、情報処理装置。 - 前記画像上の前記検出対象を表示する第2の表示手段と、
前記第2の表示手段に表示される前記検出対象のうちから、前記少なくとも3つの検出対象の候補を指定するユーザ入力を取得する第1の取得手段と、
をさらに備えることを特徴とする、請求項1に記載の情報処理装置。 - 前記少なくとも3つの検出対象の候補の、前記少なくとも3つの検出対象としての適切性の評価を示す評価情報を取得する第2の取得手段をさらに備え、
前記第2の表示手段は、前記画像上に前記評価情報をさらに表示することを特徴とする、請求項2に記載の情報処理装置。 - 前記第2の取得手段は、前記多角形の面積に基づいて前記評価情報を取得することを特徴とする、請求項3に記載の情報処理装置。
- 前記評価情報において、前記多角形の面積が大きいほど前記適切性の評価が高くなることを特徴とする、請求項4に記載の情報処理装置。
- 前記検出対象の追尾を行う、前記画像上の第1の部分領域を設定する第1の設定手段をさらに備え、
前記第2の取得手段は、前記第1の部分領域と、前記多角形と、の面積に基づいて前記評価情報を取得することを特徴とする、請求項3に記載の情報処理装置。 - 前記第2の取得手段は、前記第1の部分領域の面積と、前記多角形の面積と、の比率に基づいて前記評価情報を取得することを特徴とする、請求項6に記載の情報処理装置。
- 前記第2の取得手段は、
前記多角形の面積が前記第1の部分領域の面積の所定の割合以下である場合には、前記適切性の評価を第1の程度に設定し、
前記多角形の面積が前記第1の部分領域の面積の前記所定の割合よりも大きく前記第1の部分領域の面積以下である場合には、前記適切性の評価を前記第1の程度より高い第2の程度に設定し、
前記多角形の面積が前記第1の部分領域の面積よりも大きい場合には、前記適切性の評価を前記第1の程度より高い第3の程度に設定することを特徴とする、請求項7に記載の情報処理装置。 - 前記第2の取得手段は、前記第1の部分領域及び前記多角形が重複する領域の面積に基づいて前記評価情報を取得することを特徴とする、請求項6に記載の情報処理装置。
- 前記第2の取得手段は、
前記第1の部分領域と前記多角形とが重複する領域を有しない場合に、前記適切性の設定を第1の程度に設定し、
前記第1の部分領域と前記多角形とが重複する領域を有する場合に、
前記重複する領域の面積が前記第1の部分領域の面積よりも小さい場合には、前記適切性の評価を前記第1の程度より高い第2の程度に設定し、
前記重複する領域の面積が前記第1の部分領域の面積と等しい場合には、前記適切性の評価を前記第2の程度より高い第3の程度に設定することを特徴とする、請求項9に記載の情報処理装置。 - 前記画像の内縁部に第2の部分領域を設定する第2の設定手段をさらに備え、
前記第2の取得手段は、前記第2の部分領域と前記多角形とが重複する領域の面積に基づいて前記評価情報を取得することを特徴とする、請求項3に記載の情報処理装置。 - 前記第2の取得手段は、
前記第2の部分領域と前記多角形とが重複する領域を有する場合に、
前記重複する領域の面積が、前記第2の部分領域の面積と前記多角形の面積とに基づいて定まる閾値よりも大きい場合には、前記適切性の設定を第1の程度に設定し、
前記重複する領域の面積が、前記第2の部分領域の面積と前記多角形の面積とに基づいて定まる閾値以下である場合には、前記適切性の評価を前記第1の程度より高い第2の程度に設定し、
前記第2の部分領域と前記多角形とが重複する領域を有しない場合に、前記適切性の評価を前記第2の程度より高い第3の程度に設定することを特徴とする、請求項11に記載の情報処理装置。 - 前記第2の取得手段は、前記少なくとも3つの検出対象の候補の全てが、前記画像を通る線分を中心として所定の幅を有する部分領域内に位置している場合に、そうでない場合よりも、前記適切性の評価を低く設定することを特徴とする、請求項3に記載の情報処理装置。
- 前記第2の表示手段は、前記評価情報が示す前記適切性の設定が所定の条件より低く設定されている場合に、ユーザに対する警告を表示することをさらに特徴とする、請求項3乃至13の何れか一項に記載の情報処理装置。
- 前記第2の表示手段は、前記適切性の評価に応じて前記多角形の塗りつぶしの色又は枠線の色を変更することを特徴とする、請求項3乃至14の何れか一項に記載の情報処理装置。
- 動画像に前記検出対象の流れを計測する位置を示す検知線を設定する第3の設定手段と、
前記検知線の近傍に設定された複数の部分画像を、前記動画像における複数の画像のそれぞれから抽出する抽出手段であって、
前記複数の部分画像の大きさが、前記パラメータを用いて推定した、前記部分画像の位置に対応する前記検出対象の大きさに基づいて設定される、抽出手段と、
前記部分画像を用いて、前記検知線を通る前記検出対象の流れを計測する計測手段と、
をさらに備えることを特徴とする、請求項1乃至15の何れか一項に記載の情報処理装置。 - 画像上に、前記画像中の少なくとも3つの検出対象の候補の位置それぞれを頂点とする多角形を表示する工程と、
ユーザ入力に基づいて、前記少なくとも3つの検出対象の候補を、前記少なくとも3つの検出対象として決定する工程と、
前記決定された少なくとも3つの検出対象の位置及び大きさに基づいて、前記画像中の各位置に対応する検出対象の大きさを推定するためのパラメータを算出する工程と、
を備えることを特徴とする、情報処理方法。 - コンピュータを、請求項1乃至16の何れか一項に記載の情報処理装置の各手段として機能させるためのプログラム。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2021092513A JP2022184574A (ja) | 2021-06-01 | 2021-06-01 | 情報処理装置、情報処理方法、及びプログラム |
US17/824,428 US11978138B2 (en) | 2021-06-01 | 2022-05-25 | Information processing apparatus, information processing method, and storage medium for estimating the size of a detection target |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2021092513A JP2022184574A (ja) | 2021-06-01 | 2021-06-01 | 情報処理装置、情報処理方法、及びプログラム |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2022184574A true JP2022184574A (ja) | 2022-12-13 |
Family
ID=84194180
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2021092513A Pending JP2022184574A (ja) | 2021-06-01 | 2021-06-01 | 情報処理装置、情報処理方法、及びプログラム |
Country Status (2)
Country | Link |
---|---|
US (1) | US11978138B2 (ja) |
JP (1) | JP2022184574A (ja) |
Family Cites Families (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US9165190B2 (en) * | 2012-09-12 | 2015-10-20 | Avigilon Fortress Corporation | 3D human pose and shape modeling |
JP6179132B2 (ja) * | 2013-03-05 | 2017-08-16 | 株式会社リコー | 画像処理装置、画像処理システム、画像処理方法、プログラム及び記録媒体 |
JP6726052B2 (ja) * | 2015-11-20 | 2020-07-22 | パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカPanasonic Intellectual Property Corporation of America | 画像処理方法およびプログラム |
WO2018011944A1 (ja) | 2016-07-14 | 2018-01-18 | 三菱電機株式会社 | 群集監視装置、および、群集監視システム |
JP6840492B2 (ja) * | 2016-08-30 | 2021-03-10 | キヤノン株式会社 | 情報処理装置、情報処理方法及びプログラム |
JP6977730B2 (ja) * | 2016-09-13 | 2021-12-08 | 日本電気株式会社 | 人流推定装置、人流推定方法およびプログラム |
US10762588B2 (en) * | 2018-04-17 | 2020-09-01 | One Concern, Inc. | Flood-recovery options tool |
JP7419999B2 (ja) * | 2020-07-15 | 2024-01-23 | オムロン株式会社 | 情報処理装置および情報処理方法 |
-
2021
- 2021-06-01 JP JP2021092513A patent/JP2022184574A/ja active Pending
-
2022
- 2022-05-25 US US17/824,428 patent/US11978138B2/en active Active
Also Published As
Publication number | Publication date |
---|---|
US11978138B2 (en) | 2024-05-07 |
US20220383568A1 (en) | 2022-12-01 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US9928411B2 (en) | Image processing apparatus, image processing system, image processing method, and computer program product | |
US9594948B2 (en) | Makeup supporting device, makeup supporting method, and non-transitory computer-readable recording medium | |
JP5791812B2 (ja) | 衣服画像処理装置、衣服画像表示方法、およびプログラム | |
JP6159179B2 (ja) | 画像処理装置、画像処理方法 | |
JP2017103602A (ja) | 位置検出装置、位置検出方法及びプログラム | |
CN102572257B (zh) | 图像处理装置和图像处理方法 | |
WO2006022184A1 (ja) | カメラキャリブレーション装置及びカメラキャリブレーション方法 | |
US20160370865A1 (en) | Operation Input Device, Operation Input Method, and Program | |
JP6723798B2 (ja) | 情報処理装置、方法、プログラム | |
JP2014071501A (ja) | 画像処理装置、方法、及びプログラム | |
JP2018195267A5 (ja) | ||
JP2020145594A5 (ja) | ||
JP6229554B2 (ja) | 検出装置および検出方法 | |
JP2022184574A (ja) | 情報処理装置、情報処理方法、及びプログラム | |
CN108604131A (zh) | 显示系统、信息处理装置、信息处理方法以及程序 | |
JP5876121B2 (ja) | 画像処理装置、方法、及びプログラム | |
TWI636425B (zh) | 介面運作方法及其手持裝置 | |
US10607503B2 (en) | Blush guide device and method thereof | |
JP5397103B2 (ja) | 顔位置検出装置、顔位置検出方法及びプログラム | |
JP6403447B2 (ja) | 情報処理装置、指標校正のための撮影案内方法、コンピュータプログラム | |
JP2022184576A (ja) | 画像処理装置、情報処理方法、及びプログラム | |
KR20100081099A (ko) | 아웃 포커싱 장치 및 방법 | |
JP2020201674A (ja) | 映像解析装置及びその制御方法及びプログラム | |
JP2020149565A (ja) | 画像処理装置、画像処理方法およびプログラム | |
JP6464569B2 (ja) | 角膜内皮細胞解析プログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20240531 |