JP6339489B2 - 画像分割方法および画像分割装置 - Google Patents

画像分割方法および画像分割装置 Download PDF

Info

Publication number
JP6339489B2
JP6339489B2 JP2014252236A JP2014252236A JP6339489B2 JP 6339489 B2 JP6339489 B2 JP 6339489B2 JP 2014252236 A JP2014252236 A JP 2014252236A JP 2014252236 A JP2014252236 A JP 2014252236A JP 6339489 B2 JP6339489 B2 JP 6339489B2
Authority
JP
Japan
Prior art keywords
image
video image
displacement
module configured
camera
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2014252236A
Other languages
English (en)
Other versions
JP2016091528A (ja
Inventor
クー、ジアウェイ
ユー、カイ
Original Assignee
バイドゥ オンライン ネットワーク テクノロジー (ベイジン) カンパニー リミテッド
バイドゥ オンライン ネットワーク テクノロジー (ベイジン) カンパニー リミテッド
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by バイドゥ オンライン ネットワーク テクノロジー (ベイジン) カンパニー リミテッド, バイドゥ オンライン ネットワーク テクノロジー (ベイジン) カンパニー リミテッド filed Critical バイドゥ オンライン ネットワーク テクノロジー (ベイジン) カンパニー リミテッド
Publication of JP2016091528A publication Critical patent/JP2016091528A/ja
Application granted granted Critical
Publication of JP6339489B2 publication Critical patent/JP6339489B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V40/00Recognition of biometric, human-related or animal-related patterns in image or video data
    • G06V40/10Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
    • G06V40/107Static hand or arm
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/20Image preprocessing
    • G06V10/26Segmentation of patterns in the image field; Cutting or merging of image elements to establish the pattern region, e.g. clustering-based techniques; Detection of occlusion
    • G06V10/267Segmentation of patterns in the image field; Cutting or merging of image elements to establish the pattern region, e.g. clustering-based techniques; Detection of occlusion by performing operations on regions, e.g. growing, shrinking or watersheds
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/01Input arrangements or combined input and output arrangements for interaction between user and computer
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/20Analysis of motion
    • G06T7/215Motion-based segmentation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/40Scenes; Scene-specific elements in video content
    • G06V20/46Extracting features or characteristics from the video content, e.g. video fingerprints, representative shots or key frames
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/10Image acquisition modality
    • G06T2207/10016Video; Image sequence

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Human Computer Interaction (AREA)
  • General Engineering & Computer Science (AREA)
  • Image Analysis (AREA)
  • Studio Devices (AREA)

Description

本開示は、インターネットの分野に関し、より詳細には、画像分割方法および画像分割装置に関する。
人工知能の分野において、いかにしてスマートウェアラブルデバイスまたはロボットに自然な対話形式で再構成および識別を行わせるかは、現在の研究において主要な課題となっており、その中で自然な人間対コンピュータの対話の構築はとりわけ重要である。人工知能デバイスおよびロボットは、人間生活の様々な面で広く適用されてきたものであり、人間の介入による機械視覚と認識もまた、新しい技術によってより便利かつ効率的になるべきであり、機械認識および画像識別を行うより自然な方法が求められる。
現在、画像識別および機械視覚認識のための入力は、まず写真を撮影しついで対象物を決定することにより行われる。この処理はしばしば、撮影内容の複雑さにより限定され、その結果として多くのステップが必要とされ、学習コストは高い。さらに、撮影された写真は人間の介入を必要とし、たとえば、写真は手動で区切られる必要がある。加えて、識別内容を機械によって正確に取得することができないため、識別の正確性が低くなり、不規則な物体を識別することは難しく、操作は不便であり、ユーザ体験は劣っている。
本開示の実施形態は、従来技術における問題の少なくとも一つを少なくともある程度解決することを目的とする。
本開示の第1の態様によると、画像分割方法が提供される。画像分割方法は、対象物の動的移動のビデオ画像を受信し、ビデオ画像のフル画像オプティカルフローを取得してビデオ画像内の各画素の第1の変位を推定し、ビデオ画像の背景画像オプティカルフローを取得してビデオ画像内の背景画素の第2の変位を推定することと、第1の変位を第2の変位と比較して対象物の前景領域を取得することと、対象物の前景領域におけるビデオ画像内の特徴点を抽出し、抽出された特徴点の確率密度を計算して対象物の数を決定することと、対象物の視覚追跡と移動軌跡分析を行って対象物を追跡することと、特徴点のフレーム間変位、フレーム間切開窓の類似性、追跡ボックススケーリングにしたがって対象物の静止判定と画像分割を行うこととから構成される。
本開示の実施形態に係る画像分割方法では、対象物の動的移動のビデオ画像が受信された後、フル画像オプティカルフローと背景画像オプティカルフローを取得することにより対象物の前景領域(つまり、対象物)が決定されてよく、対象物の動的移動の間対象物が追跡され、対象物の静止判定が行われて対象物が位置するビデオ画像の領域が分割される。したがって、識別される物体が識別される際、ユーザは、対象物の画像分割を素早く行うため、対象物を取るか振るかするだけでよく、これは対象物の後続の画像識別のための正確な識別入力として用いることができる。
本開示の第2の態様によると、画像分割装置が提供される。画像分割装置は、対象物の動的移動のビデオ画像を受信するよう構成された受信モジュールと、ビデオ画像のフル画像オプティカルフローを取得してビデオ画像内の各画素の第1の変位を推定するよう、またビデオ画像の背景画像オプティカルフローを取得してビデオ画像内の背景画素の第2の変位を推定するよう構成された取得モジュールと、第1の変位と第2の変位を比較して対象物の前景領域を取得するよう構成された比較モジュールと、対象物の前景領域におけるビデオ画像内の特徴点を抽出するよう構成された抽出モジュールと、抽出された特徴点の確率密度を計算して対象物の数を決定するよう構成された計算モジュールと、対象物の視覚追跡と移動軌跡分析を行って対象物を追跡するよう構成された追跡モジュールと、特徴点のフレーム間変位、フレーム間切開窓の類似性、および追跡ボックススケーリングにしたがって対象物の静止判定と画像分割を行うよう構成された分割モジュールとから構成される。
本開示の実施形態に係る画像分割装置では、受信モジュールが対象物の動的移動のビデオ画像を受信した後、フル画像オプティカルフローと背景画像オプティカルフローを取得することにより対象物の前景領域(つまり、対象物)が決定されてよく、対象物の動的移動の間対象物が追跡され、対象物の静止判定が行われて、対象物の位置するビデオ画像の領域が分割される。したがって、識別される物体が識別される際、対象物の画像分割を素早く行うために、ユーザは対象物を取るか振るかするだけでよく、これは後続の対象物の画像識別のための正確な識別入力として用いることができる。
本開示の第3の態様によると、コンピュータ読み取り可能な記憶媒体が提供される。コンピュータ読み取り可能な記憶媒体は、コンピュータ上で実行された際に本開示の第1の態様に係る画像分割方法を実行するコンピュータプログラムから構成される。
本開示の実施形態のさらなる態様や利点が、以下の説明において部分的に述べられ、以下の説明から部分的に明らかとなり、あるいは本開示の実施形態の実践により理解される。
本開示の実施形態のこれらまたは他の態様および利点が、図面を参照してなされる以下の説明により明らかとなり、より容易に理解されるであろう。
本開示の実施形態に係る画像分割方法のフローチャートである。 本開示の実施形態に係る画像分割方法の概略図である。 本開示の実施形態に係る画像分割装置のブロック図である。
本開示の実施形態について詳細に述べる。図面を参照して本明細書に記載される実施形態は、説明的かつ一例であり、本開示を一般的に理解するために用いられる。実施形態は、本開示を限定するものと解釈されてはならない。同一または同様の要素および同一または同様の機能を有する要素は、説明の全体にわたって同等の参照番号で示される。
図1は、本開示の実施形態に係る画像分割方法のフローチャートである。
図1に示されるように、画像分割方法は以下のステップから構成される。
ステップ101において、対象物の動的移動のビデオ画像が受信され、ビデオ画像のフル画像オプティカルフローが取得されてビデオ画像内の各画素の第1の変位が推定され、ビデオ画像の背景画像オプティカルフローが取得されてビデオ画像内の背景画素の第2の変位が推定される。
いくつかの実施形態においては、対象物の動的移動のビデオ画像を受信することは、カメラによって入力された対象物の動的移動のビデオ画像を受信することから構成される。
さらに、対象物の動的移動のビデオ画像が受信される前に、発話、タッチスクリーン、または動的センサを介して入力される画像識別要求が受信されてビデオ画像の受信操作が始動される。
つまり、本実施形態において、カメラ付きスマートデバイスが、発話、タッチスクリーン、または動的センサを介してユーザにより入力される画像識別要求を受信した後、スマートデバイスのカメラが起動する。ユーザが対象物を取ったり動かしたりする処理は、カメラにより撮影され、すなわち、ユーザが対象物を取ったり動かしたりする処理のビデオ画像はカメラによって受信され、後続の処理が実行される。
いくつかの実施形態においては、カメラ付きのスマートデバイスは、カメラ付きのスマート携帯端末、カメラ付きのヘッドセットウェアラブルデバイス(たとえば、グーグル・グラスまたはバイドゥアイ)、カメラ付きのスマートウォッチ、またはカメラ視覚入力付きのロボットであってよい。しかし、本開示はそれらに限定されない。
ステップ102において、第1の変位が第2の変位と比較され、対象物の前景領域が取得される。
具体的には、各画素の第1の変位は、「前景領域(対象物)+背景領域(環境)」を示し、一方で背景画素の第2の変位は、「背景領域(環境)」を示す。第1の変位が第2の変位と比較された後、対象物の前景領域が取得されてよい。用いられるアルゴリズム論理は、単に「(前景領域+背景領域)−背景領域=前景領域」と表されてよい。
ステップ103において、対象物の前景領域におけるビデオ画像内の特徴点が抽出され、抽出された特徴点の確率密度が計算されて対象物の数が決定される。
ステップ104において、対象物の視覚追跡および移動軌跡解析が行われて対象物が追跡される。
ステップ105において、特徴点のフレーム間変位、フレーム間切開窓の類似性、および追跡ボックススケーリングに基づいて対象物の静止判定および画像分割が行われる。
本実施形態において、対象物の画像分割が行われた後、これに基づいて画像識別が行われてよく、ついで識別結果がカメラ付きスマートデバイスの音声出力チャネルまたは画像出力チャネルを介してユーザに出力されて対象物の識別が完了される。
本開示の実施形態に係る画像分割方法では、対象物の動的移動のビデオ画像が受信された後、フル画像オプティカルフローおよび背景画像オプティカルフローを取得することにより対象物の前景領域(つまり、対象物)が決定されてよく、対象物の動的移動の間対象物が追跡され、対象物に静止判定が行われて対象物が位置するビデオ画像の領域が分割される。したがって、識別される物体が識別される際、ユーザは、対象物の画像分割を素早く行うために、対象物を取るか振るかするだけでよく、これはその後の対象物の画像識別のための正確な識別入力として用いることができる。
図2は、本開示の実施形態に係る画像分割方法の概略図である。図2に示されるように、ユーザが主観視点から手で物体を取るか、手で自然に物体を振るかすると、図1に示す方法で、手の動的移動がカメラによって捕捉され、フル画像オプティカルフローと背景画像オプティカルフローを取得することにより対象物の前景領域が決定されてよく、対象物が追跡され、対象物の静止判定および画像分割が行われて対象物が分割される、つまり、識別のための画像がボックスで選択される。
図3は、本開示の実施形態に係る画像分割装置のブロック図である。本実施形態の画像分割装置は、図1に示される画像分割方法を実現するために用いられてよい。
画像分割装置は、受信モジュール31と、取得モジュール32と、比較モジュール33と、抽出モジュール34と、計算モジュール35と、追跡モジュール36と、分割モジュール37とから構成される。
受信モジュール31は、対象物の動的移動のビデオ画像を受信するよう構成される。本実施形態において、受信モジュール31は、カメラ38によって入力された対象物の動的移動のビデオ画像を受信する。さらに、受信モジュール31は、対象物の動的移動のビデオ画像を受信する前に、発話、タッチスクリーン、または動的センサを介して入力される画像識別要求を受信してビデオ画像を受信する操作を始動するようさらに構成される。
つまり、本実施形態において、受信モジュール31が、発話、タッチスクリーン、または動的センサを介してユーザによって入力される画像識別要求を受信した後、カメラ38が起動する。ユーザが対象物を取ったり動かしたりする処理がカメラ38によって撮影される、つまり、ユーザが対象物を取ったり動かしたりする処理のビデオ画像がカメラ38によって受信され、それにより後続の処理が実行される。
取得モジュール32は、ビデオ画像のフル画像オプティカルフローを取得してビデオ画像内の各画素の第1の変位を推定するよう、およびビデオ画像の背景画像オプティカルフローを取得してビデオ画像内の背景画素の第2の変位を推定するよう構成される。
比較モジュール33は、第1の変位を第2の変位と比較し、対象物の前景領域を取得するよう構成される。具体的に、各画素の第1の変位は、「前景領域(対象物)+背景領域(環境)」を示し、一方で背景画素の第2の変位は、「背景領域(環境)」を示す。比較モジュール33が第1の変位を第2の変位と比較した後、対象物の前景領域が取得されてよい。比較モジュール33によって用いられるアルゴリズム論理は、単に「(前景領域+背景領域)−背景領域=前景領域」と表されてよい。
抽出モジュール34は、対象物の前景領域におけるビデオ画像内の特徴点を抽出するよう構成される。
計算モジュール35は、抽出モジュール34によって抽出された特徴点の確率密度を計算し、対象物の数を決定するよう構成される。
追跡モジュール36は、対象物の視覚追跡および移動軌跡分析を行い対象物を追跡するよう構成される。
分割モジュール37は、特徴点のフレーム間変位、フレーム間切開窓の類似性、および追跡ボックススケーリングにしたがって対象物の静止判定および画像分割を行うよう構成される。
本実施形態において、対象物の画像分割が行われた後、これに基づいて画像識別が行われてよく、識別結果が画像分割装置の音声出力チャネルまたは画像出力チャネルを介してユーザに出力されて対象物の識別が完了される。
本実施形態において、画像分割装置はカメラ付きスマートデバイスであってよく、カメラ付きスマートデバイスの一部であってもよい。いくつかの実施形態においては、カメラ付きスマートデバイスはカメラ付きスマート携帯端末、カメラ付きのヘッドセットウェアラブルデバイス(たとえば、グーグル・グラスまたはバイドゥアイ)、カメラ付きのスマートウォッチ、またはカメラ視覚入力付きのロボットであってよい。しかし、本開示はそれらに限定されない。
本開示の実施形態に係る画像分割装置では、受信モジュール31が対象物の動的移動のビデオ画像を受信した後、対象物の前景領域(つまり、対象物)がフル画像オプティカルフローおよび背景画像オプティカルフローを取得することにより決定されてよく、対象物の動的移動の間対象物が追跡され、対象物の静止判定が行われ、対象物が位置するビデオ画像の領域が分割される。したがって、識別される物体を識別する際、対象物の画像分割を素早く行うには、ユーザは対象物を取るか振るかするだけでよく、これは後続の対象物の画像識別のための正確な識別入力として用いることができる。
画像識別は、人工知能における最も重要な飛躍的前進であり、役立つ利用シーンの範囲は非常に広く、今後の検索分野において再優先されるものである。本開示は新しい人間とコンピュータ間の対話および自然なユーザインターフェイスを用いており、これは、まず写真を撮影しついで対象物を区切る従来の画像識別と比較してより自然でより便利である。スマートウェアラブル装置の画像識別機能において自然な対話はとりわけ重要であり、本開示において、ユーザは物体を取って検索結果を得ることができ、より自然な対話とより良いユーザ体験を実現することができる。
本開示の実施形態に係る画像分割方法は、視覚画像情報取り込みおよび第1の視点からの処理を行う多様なスマートデバイスに適用することができ、スマートウェアラブル視覚製品のジェスチャ認識についての基本的な技術支援を提供することができる。
本開示の実施形態に係る画像分割方法は、画像認識能力および視覚認識能力を有する人工知能製品またはロボットと対話するユーザに革新的な体験を提供するであろう。たとえば、物体がロボットの前で取られて振られると、ロボットは物体を認識し識別することができる。
本開示の実施形態に係るコンピュータ読み取り可能な記憶媒体もまた提供される。コンピュータ読み取り可能な記憶媒体は、コンピュータ上で実行された際に本開示の上記の実施形態に係る画像分割方法を実行するコンピュータプログラムから構成される。
「第1の」、「第2の」の用語は、本明細書では説明の目的で用いられ、相対的な重要性や意義を示したり暗示したりするものではなく、示された技術的特徴の数を暗示するものでもないことに留意するべきである。したがって、「第1」および「第2」で定義された特徴は、1または2以上の特徴から構成されてよい。本開示の説明において、「複数の」は特に断りのない限り、2または3以上を意味する。
フローチャート、またはその他の方法で本明細書に説明される任意の処理または方法が、特定の論理関数を実行する1または2以上の実行可能な命令から構成され、または進行ステップの1または2以上の実行可能な命令から構成される、モジュール、セグメント、またはコードの一部分を表すであろうことが理解されるであろう。フローチャートは具体的な実行の順番を示すが、実行の順番は描写されているものと異なってもよいことが理解される。たとえば、2または3以上のボックスの実行の順序は、示された順序に対して乱れていてもよい。
本明細書に他の方法で記載され、またはフローチャートに示される論理および/またはステップ、たとえば、論理機能を実現するための実行可能な命令の特定のシーケンステーブルは、任意のコンピュータ読み取り可能な媒体で具体的に実現され、命令実行システム、装置、または設備(コンピュータに基づくシステム、命令実行システム、装置、および設備からの命令を取得し命令を実行することができるプロセッサまたは他のシステムから構成されるシステムなど)によって用いられてもよく、命令実行システム、装置、および設備と組み合わせて用いられてもよい。明細書に関して、「コンピュータ読み取り可能な媒体」は、命令実行システム、装置、または設備によって、またはそれらと組み合わせて用いられる、プログラムを含み、記憶し、通信し、伝搬し、または転送することができる任意の装置であってよい。コンピュータ読み取り可能な媒体のより具体的な例は、1または複数のワイヤによる電子接続(電子デバイス)、携帯可能なコンピュータ筐体(磁気装置)、ランダムアクセスメモリ(RAM)、読み取り専用メモリ(ROM)、消去可能プログラム可能読み取り専用メモリ(EPROMまたはフラッシュメモリ)、光ファイバ装置および携帯コンパクトディスク読み取り専用メモリ(CDROM)から構成されるがこれに限定されない。加えて、コンピュータ読み取り可能媒体は、プログラムを印刷することのできる紙またはその他の適切な媒体であってもよい、なぜなら、たとえば、紙またはその他の適切な媒体は、プログラムを電気的に取得する必要がある時に、その他の適切な方法によって光学的に走査されて編集され、復号され、または処理されることができ、プログラムはコンピュータメモリに格納されることができるからである。
本開示の上記に例示される方法のステップの全体または部分が、プログラムを含む関連するハードウェアに命令することで実現できることを、当業者は理解するであろう。プログラムはコンピュータ読み取り可能な記憶媒体に格納されてよく、プログラムは、コンピュータ上で実行された際の本開示の方法実施形態の1ステップまたはステップの組み合わせから構成される。
加えて、本開示の実施形態の各機能セルは、処理モジュールに組み込まれてもよく、またはこれらのセルは単独の物理的存在であってもよく、または2または3以上のセルが処理モジュールに組み込まれている。統合モジュールは、ハードウェアの形で実現されてもよく、ソフトウェア機能モジュールの形で実現されてもよい。統合モジュールがソフトウェア機能モジュールの形で実現され、スタンドアロン型の製品として販売されたりまたは用いられたりした場合、統合モジュールはコンピュータ読み取り可能な記憶媒体に格納されてもよい。
上記の記憶媒体は、読み取り専用メモリ、磁気ディスク、CDなどであってよい。
本明細書の全体にわたって、「実施形態」、「いくつかの実施形態」、「一実施形態」、「他の例」、「例」、「具体例」、「いくつかの例」への言及は、実施形態または実施例に関連して説明された特定の特徴、構造、物質、または特性が、本開示の少なくとも一実施形態または一実施例に含まれていることを意味する。したがって、明細書の全体にわたって様々な箇所に出現する「いくつかの実施形態において」、「一実施形態において」、「実施形態において」、「他の実施例において」、「実施例において」、「具体例において」、または「いくつかの実施例において」などの表現は、必ずしも本開示の同じ実施形態または実施例について言及するものではない。さらに、特定の特徴、構造、材料、特性は任意の好適な方法で1または2以上の実施形態または実施例で組み合わされてもよい。
説明的な実施形態が示され説明されたが、上記の実施形態が本開示を制限すると解釈されるものではなく、本開示の精神、原理、および範囲から逸脱することなく実施形態の変更、代替、修正が可能であることを当業者は理解するであろう。

Claims (3)

  1. 発話、タッチスクリーン、または動的センサを介して入力される画像識別要求を受信し、カメラを起動して対象物の動的移動のビデオ画像を受信する操作を始動することと、
    前記カメラによって入力された前記対象物の前記動的移動の前記ビデオ画像を受信し、前記ビデオ画像のフル画像オプティカルフローを取得して前記ビデオ画像の各画素の第1の変位を推定し、前記ビデオ画像の背景画像オプティカルフローを取得して前記ビデオ画像の背景画素の第2の変位を推定することと、
    前記第1の変位を前記第2の変位と比較して前記対象物の前景領域を取得することと、
    前記対象物の前記前景領域における前記ビデオ画像内の特徴点を抽出し、抽出された前記特徴点の確率密度を計算して前記対象物の数を決定することと、
    前記対象物に視覚追跡と移動軌跡分析を行い前記対象物を追跡することと、
    前記特徴点のフレーム間変位、フレーム間切開窓の類似性、および追跡ボックススケーリングにしたがって前記対象物に静止判定と画像分割を行うこととから構成される、
    画像分割方法。
  2. 発話、タッチスクリーン、または動的センサを介して入力される画像識別要求を受信して、カメラを起動して対象物の動的移動のビデオ画像を受信する操作を始動させ、前記カメラによって入力された前記対象物の前記動的移動の前記ビデオ画像を受信するよう構成された受信モジュールと、
    前記ビデオ画像のフル画像オプティカルフローを取得し、前記ビデオ画像内の各画素の第1の変位を推定するよう、また前記ビデオ画像の背景画像オプティカルフローを取得し、前記ビデオ画像内の背景画素の第2の変位を推定するよう構成された取得モジュールと、
    前記第1の変位と前記第2の変位を比較して前記対象物の前景領域を取得するよう構成された比較モジュールと、
    前記対象物の前記前景領域における前記ビデオ画像内の特徴点を抽出するよう構成された抽出モジュールと、
    抽出された前記特徴点の確率密度を計算して前記対象物の数を決定するよう構成された計算モジュールと、
    前記対象物に視覚追跡と移動軌跡分析を行い前記対象物を追跡するよう構成された追跡モジュールと、
    前記特徴点のフレーム間変位、フレーム間切開窓の類似性、および追跡ボックススケーリングにしたがって前記対象物に静止判定と画像分割を行うよう構成された分割モジュールとから構成される、
    画像分割装置。
  3. コンピュータ上で実行された際に請求項1に記載の画像分割方法を実行するコンピュータプログラムから構成される、コンピュータ読み取り可能な記憶媒体。
JP2014252236A 2014-11-05 2014-12-12 画像分割方法および画像分割装置 Active JP6339489B2 (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
CN201410618207.5A CN104408743A (zh) 2014-11-05 2014-11-05 图像分割方法和装置
CN201410618207.5 2014-11-05

Publications (2)

Publication Number Publication Date
JP2016091528A JP2016091528A (ja) 2016-05-23
JP6339489B2 true JP6339489B2 (ja) 2018-06-06

Family

ID=52231839

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2014252236A Active JP6339489B2 (ja) 2014-11-05 2014-12-12 画像分割方法および画像分割装置

Country Status (5)

Country Link
US (1) US9418280B2 (ja)
EP (1) EP3023937A1 (ja)
JP (1) JP6339489B2 (ja)
KR (1) KR101706365B1 (ja)
CN (1) CN104408743A (ja)

Families Citing this family (34)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104915014A (zh) * 2015-07-07 2015-09-16 安徽瑞宏信息科技有限公司 一种基于移动终端的非接触式交互方法
CN106570557A (zh) * 2015-10-13 2017-04-19 富士通株式会社 运动物体的计数装置及方法
CN105511478B (zh) * 2016-02-23 2019-11-26 百度在线网络技术(北京)有限公司 应用于扫地机器人的控制方法、扫地机器人及终端
WO2017187723A1 (ja) * 2016-04-28 2017-11-02 パナソニックIpマネジメント株式会社 動画分割方法、動画分割装置および動画処理システム
US10380741B2 (en) * 2016-12-07 2019-08-13 Samsung Electronics Co., Ltd System and method for a deep learning machine for object detection
CN108230252B (zh) * 2017-01-24 2022-02-01 深圳市商汤科技有限公司 图像处理方法、装置以及电子设备
CN107009412B (zh) * 2017-04-12 2019-05-28 广东工业大学 一种证件照自动裁剪方法、装置以及系统
CN108961316B (zh) * 2017-05-23 2022-05-31 华为技术有限公司 图像处理方法、装置及服务器
DE102017212175A1 (de) * 2017-07-17 2019-01-17 Robert Bosch Gmbh Verfahren und Vorrichtung zum Ermitteln eines optischen Flusses anhand einer von einer Kamera eines Fahrzeugs aufgenommenen Bildsequenz
KR102059667B1 (ko) 2017-12-18 2019-12-26 서강대학교 산학협력단 동영상에서의 장소 추출 방법 및 장소 추출 시스템
CN108062761A (zh) * 2017-12-25 2018-05-22 北京奇虎科技有限公司 基于自适应跟踪框的图像分割方法、装置及计算设备
CN108111911B (zh) * 2017-12-25 2020-07-28 北京奇虎科技有限公司 基于自适应跟踪框分割的视频数据实时处理方法及装置
CN108320301B (zh) * 2018-01-26 2022-03-18 西安电子科技大学 一种基于跟踪学习检测的目标跟踪优化方法
CN108829248B (zh) * 2018-06-01 2020-11-20 中国科学院软件研究所 一种基于用户表现模型矫正的移动目标选择方法及系统
CN109165550B (zh) * 2018-07-13 2021-06-29 首都师范大学 一种基于无监督深度学习的多模态手术轨迹快速分割方法
CN113163133A (zh) * 2018-10-15 2021-07-23 华为技术有限公司 一种图像处理方法、装置与设备
CN109583391B (zh) * 2018-12-04 2021-07-16 北京字节跳动网络技术有限公司 关键点检测方法、装置、设备及可读介质
CN111382603B (zh) * 2018-12-28 2023-09-26 顺丰科技有限公司 一种轨迹计算装置、方法
US10311578B1 (en) * 2019-01-23 2019-06-04 StradVision, Inc. Learning method and learning device for segmenting an image having one or more lanes by using embedding loss to support collaboration with HD maps required to satisfy level 4 of autonomous vehicles and softmax loss, and testing method and testing device using the same
CN110321858B (zh) * 2019-07-08 2022-06-14 北京字节跳动网络技术有限公司 视频相似度确定方法、装置、电子设备及存储介质
US10977717B2 (en) * 2019-07-22 2021-04-13 Pickey Solutions Ltd. Hand actions monitoring device
CN111126807B (zh) * 2019-12-12 2023-10-10 浙江大华技术股份有限公司 行程切分方法和装置、存储介质及电子装置
CN111178224B (zh) * 2019-12-25 2024-04-05 浙江大华技术股份有限公司 物体规则判断方法、装置、计算机设备和存储介质
CN111179159B (zh) * 2019-12-31 2024-02-20 北京金山云网络技术有限公司 消除视频中目标影像的方法、装置、电子设备及存储介质
CN111494947B (zh) * 2020-04-20 2023-05-23 上海米哈游天命科技有限公司 摄像机移动轨迹确定方法、装置、电子设备及存储介质
CN111583283B (zh) * 2020-05-20 2023-06-20 抖音视界有限公司 图像分割方法、装置、电子设备及介质
CN114079725B (zh) * 2020-08-13 2023-02-07 华为技术有限公司 视频防抖方法、终端设备和计算机可读存储介质
CN112218136B (zh) * 2020-10-10 2021-08-10 腾讯科技(深圳)有限公司 视频处理方法、装置、计算机设备及存储介质
CN114494087A (zh) * 2020-11-12 2022-05-13 安霸国际有限合伙企业 无监督的多尺度视差/光流融合
CN112750146B (zh) * 2020-12-31 2023-09-12 浙江大华技术股份有限公司 目标对象跟踪方法和装置、存储介质及电子设备
CN113709559B (zh) * 2021-03-05 2023-06-30 腾讯科技(深圳)有限公司 视频划分方法、装置、计算机设备及存储介质
CN114973175A (zh) * 2022-05-24 2022-08-30 深圳市航盛电子股份有限公司 运动物体检测方法、装置、终端设备以及存储介质
WO2023231021A1 (zh) * 2022-06-02 2023-12-07 深圳市正浩创新科技股份有限公司 目标物归集方法、设备和存储介质
CN115905733B (zh) * 2022-10-28 2024-03-08 广州地铁集团有限公司 一种基于机器视觉的口罩佩戴异常检测及轨迹追踪方法

Family Cites Families (25)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5909251A (en) * 1997-04-10 1999-06-01 Cognitech, Inc. Image frame fusion by velocity estimation using region merging
JPH11213156A (ja) * 1998-01-29 1999-08-06 Canon Inc 画像処理装置および方法、記録媒体
JP3823767B2 (ja) * 2001-07-18 2006-09-20 日本電信電話株式会社 動画像の前景背景領域分離方法、及びその方法を用いた条件付画素補填による動画像符号化方法
US7266220B2 (en) * 2002-05-09 2007-09-04 Matsushita Electric Industrial Co., Ltd. Monitoring device, monitoring method and program for monitoring
JP4163914B2 (ja) * 2002-09-04 2008-10-08 日本放送協会 切り出し映像生成装置、切り出し映像生成方法及び切り出し映像生成プログラム
KR100738522B1 (ko) * 2004-12-21 2007-07-11 삼성전자주식회사 비디오 감시 시스템에서 카메라/물체 움직임 구분 및 객체추출 장치 및 그 방법
JP2009042796A (ja) * 2005-11-25 2009-02-26 Panasonic Corp ジェスチャー入力装置および方法
EP1916538A3 (en) * 2006-10-27 2011-02-16 Panasonic Electric Works Co., Ltd. Target moving object tracking device
JP2008171141A (ja) * 2007-01-10 2008-07-24 Omron Corp 画像処理装置および方法、並びに、プログラム
CN101312524B (zh) * 2007-05-23 2010-06-23 财团法人工业技术研究院 利用光迹分析的移动物体侦测装置与方法
JP2010016580A (ja) * 2008-07-03 2010-01-21 Sony Corp 画像処理装置および画像処理方法
KR101173559B1 (ko) * 2009-02-10 2012-08-13 한국전자통신연구원 비디오 동영상의 움직이는 다중 객체 자동 분할 장치 및 방법
TWI413024B (zh) * 2009-11-19 2013-10-21 Ind Tech Res Inst 物件偵測方法及系統
JP5499856B2 (ja) * 2010-04-08 2014-05-21 株式会社ニコン 画像評価装置
JP5612915B2 (ja) * 2010-06-18 2014-10-22 東芝アルパイン・オートモティブテクノロジー株式会社 移動体検出装置及び移動体検出方法
JP2012098771A (ja) * 2010-10-29 2012-05-24 Sony Corp 画像処理装置および方法、並びに、プログラム
US8682063B2 (en) * 2010-11-24 2014-03-25 Adobe Systems Incorporated Methods and apparatus for dynamic color flow modeling
JP5482672B2 (ja) * 2011-01-12 2014-05-07 株式会社デンソーアイティーラボラトリ 移動物体検出装置
CN102110297B (zh) * 2011-03-02 2012-10-10 无锡慧眼电子科技有限公司 一种基于累积光流和双背景滤波的移动物体的探测方法
KR101792501B1 (ko) * 2011-03-16 2017-11-21 한국전자통신연구원 특징기반의 스테레오 매칭 방법 및 장치
JP2013196047A (ja) * 2012-03-15 2013-09-30 Omron Corp ジェスチャ入力装置、制御プログラム、コンピュータ読み取り可能な記録媒体、電子機器、ジェスチャ入力システム、および、ジェスチャ入力装置の制御方法
JP5988161B2 (ja) * 2012-12-25 2016-09-07 アルパイン株式会社 ジェスチャ認識装置
CN103149939B (zh) * 2013-02-26 2015-10-21 北京航空航天大学 一种基于视觉的无人机动态目标跟踪与定位方法
US20140253785A1 (en) * 2013-03-07 2014-09-11 Mediatek Inc. Auto Focus Based on Analysis of State or State Change of Image Content
CN103745485A (zh) * 2013-12-31 2014-04-23 深圳泰山在线科技有限公司 判断物体静止或运动的方法及系统

Also Published As

Publication number Publication date
KR101706365B1 (ko) 2017-02-13
JP2016091528A (ja) 2016-05-23
US20160125235A1 (en) 2016-05-05
KR20160053729A (ko) 2016-05-13
CN104408743A (zh) 2015-03-11
EP3023937A1 (en) 2016-05-25
US9418280B2 (en) 2016-08-16

Similar Documents

Publication Publication Date Title
JP6339489B2 (ja) 画像分割方法および画像分割装置
JP6104227B2 (ja) 画像識別方法および画像識別装置
JP5950973B2 (ja) フレームを選択する方法、装置、及びシステム
US9471993B2 (en) Method and apparatus for sensor aided extraction of spatio-temporal features
JP6154075B2 (ja) オブジェクト検出及び分割の方法,装置,コンピュータプログラム製品
JP6007682B2 (ja) 画像処理装置、画像処理方法及びプログラム
WO2016187888A1 (zh) 基于字符识别的关键词通知方法及设备、计算机程序产品
JP2009053815A (ja) 被写体追跡プログラム、および被写体追跡装置
CN105242888A (zh) 一种系统控制方法及电子设备
CN108875506B (zh) 人脸形状点跟踪方法、装置和系统及存储介质
CN109711287B (zh) 人脸采集方法及相关产品
CN107357424B (zh) 一种手势操作的识别方法、设备及计算机可读存储介质
EP2959406B1 (en) Automatic image rectification for visual search
US11307668B2 (en) Gesture recognition method and apparatus, electronic device, and storage medium
JP2008299834A (ja) 被写体追跡プログラム、および被写体追跡装置
US10248853B2 (en) Image output device, image output method, and computer program product
KR101515845B1 (ko) 동작 인식 방법 및 동작 인식 장치
JP2015184743A (ja) 画像処理装置および物体認識方法
KR20180069312A (ko) 라이트 필드 동영상을 이용한 물체 추적 방법 및 장치
US11809997B2 (en) Action recognition apparatus, action recognition method, and computer-readable recording medium
JP2020042646A (ja) 動作抽出装置、動作抽出方法、及びプログラム
JP2015158745A (ja) 行動識別器生成装置、行動認識装置及びプログラム
TWI494772B (zh) 簡報操作系統及方法
CN111107259B (zh) 图像获取方法、装置及电子设备
CN111176438A (zh) 基于三维手势动作识别的智能音箱控制方法及智能音箱

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20160726

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20161024

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20161109

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20170308

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A821

Effective date: 20170308

A911 Transfer to examiner for re-examination before appeal (zenchi)

Free format text: JAPANESE INTERMEDIATE CODE: A911

Effective date: 20170329

A912 Re-examination (zenchi) completed and case transferred to appeal board

Free format text: JAPANESE INTERMEDIATE CODE: A912

Effective date: 20170502

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20180510

R150 Certificate of patent or registration of utility model

Ref document number: 6339489

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250