JP5973572B2 - 映像セグメンテーション方法 - Google Patents
映像セグメンテーション方法 Download PDFInfo
- Publication number
- JP5973572B2 JP5973572B2 JP2014525964A JP2014525964A JP5973572B2 JP 5973572 B2 JP5973572 B2 JP 5973572B2 JP 2014525964 A JP2014525964 A JP 2014525964A JP 2014525964 A JP2014525964 A JP 2014525964A JP 5973572 B2 JP5973572 B2 JP 5973572B2
- Authority
- JP
- Japan
- Prior art keywords
- segmentation
- video
- seam
- region
- value
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims description 68
- 230000011218 segmentation Effects 0.000 title claims description 61
- 230000006870 function Effects 0.000 claims description 47
- 238000012545 processing Methods 0.000 claims description 16
- 230000008569 process Effects 0.000 description 14
- 238000003709 image segmentation Methods 0.000 description 9
- 238000013467 fragmentation Methods 0.000 description 8
- 238000006062 fragmentation reaction Methods 0.000 description 8
- 238000004422 calculation algorithm Methods 0.000 description 5
- 238000003708 edge detection Methods 0.000 description 4
- 238000005457 optimization Methods 0.000 description 4
- 238000004458 analytical method Methods 0.000 description 3
- 230000002860 competitive effect Effects 0.000 description 3
- 238000002924 energy minimization method Methods 0.000 description 3
- 230000009471 action Effects 0.000 description 2
- 230000008859 change Effects 0.000 description 2
- 239000003086 colorant Substances 0.000 description 2
- 238000013461 design Methods 0.000 description 2
- 238000009826 distribution Methods 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 238000001914 filtration Methods 0.000 description 2
- 238000002156 mixing Methods 0.000 description 2
- 238000003909 pattern recognition Methods 0.000 description 2
- 230000009467 reduction Effects 0.000 description 2
- 238000013459 approach Methods 0.000 description 1
- 230000015572 biosynthetic process Effects 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 230000001143 conditioned effect Effects 0.000 description 1
- 238000012937 correction Methods 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 238000003384 imaging method Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 238000000638 solvent extraction Methods 0.000 description 1
- 208000024891 symptom Diseases 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/10—Segmentation; Edge detection
- G06T7/11—Region-based segmentation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/20—Image preprocessing
- G06V10/26—Segmentation of patterns in the image field; Cutting or merging of image elements to establish the pattern region, e.g. clustering-based techniques; Detection of occlusion
- G06V10/267—Segmentation of patterns in the image field; Cutting or merging of image elements to establish the pattern region, e.g. clustering-based techniques; Detection of occlusion by performing operations on regions, e.g. growing, shrinking or watersheds
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/40—Extraction of image or video features
- G06V10/42—Global feature extraction by analysis of the whole pattern, e.g. using frequency domain transformations or autocorrelation
- G06V10/422—Global feature extraction by analysis of the whole pattern, e.g. using frequency domain transformations or autocorrelation for representing the structure of the pattern or shape of an object therefor
- G06V10/426—Graphical representations
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/20—Special algorithmic details
- G06T2207/20016—Hierarchical, coarse-to-fine, multiscale or multiresolution image processing; Pyramid transform
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Multimedia (AREA)
- Image Analysis (AREA)
- Studio Devices (AREA)
- Image Processing (AREA)
Description
− 不安定な物体の二重輪郭および、場合によっては、映像中の移動物体の個数の重複
− 不安定な物体の半透明
− 映像の種々の領域の明るさおよびカラー・バランスの著しい不規則性。
− それぞれ、パノラマの一部のみを描く数ショットからパノラマ的映像を生成すること
− 数枚の初期のダイナミック・レンジの低い写真から高いダイナミック・レンジの映像を生成すること
−これらの方法は1つの基準映像のみに機能し得るという事実のために、得られたセグメンテーションをステッチ処理に適用できないこと(領域拡張方法、フラグメンテーション・ブレンディング、エッジ検出)
−移動装置について適用できないシステム資源要件−計算装置のメモリおよび動作速度(クラスタリング手法、領域拡張、フラグメンテーション・ブレンディング、マルコフ確率場、グラフ理論方法、最適化法)
−雑音の多い映像の場合の不十分な働き(クラスタリング手法、エッジ検出)
−点の空間配置を考慮しないこと(クラスタリング)。
−動作速度
−最適映像セグメンテーション−すなわち、シーム・コスト関数および映像データのコスト関数の合計のグローバル・ミニマムの達成に役立つセグメンテーション(色、輝度およびその他のパラメータに基づく)−および得られるセグメンテーションの絶対的最適フラグメンテーションとの近さ、最良の既知方法に類似している
−移動装置において追加メモリ資源を必要としないこと
−映像雑音に対する抵抗力。
縦軸は、グローバル・ミニマムからの%単位の偏差であり、横軸は、秒単位の対数時間軸である。これらのグラフは、以下を表す:
−マルコフ確率場の方法“Iterated Conditional Modes”
−グラフ・カット方法の変形“Loopy Belief Propagation”
−“Loopy Belief Propagation”方法に類似の方法、“Tree−reweighted Message Passing”の方法
−グローバル・ミニマムの下限の予測
−「グラフ・カット」方法の別の変形
−提案する方法、円は、全処理時間およびグローバル・ミニマムからの得られた偏差を示す。
2種類のコスト関数を使用する:
− 特定の映像ピクセルのセグメントの1つへの割り当ての適切さを示すデータのコスト関数。たとえば、ピクセルの色の数値とセグメントの色間の差異の絶対値。
− シームのコスト関数は、セグメントの境界軌跡の所与の場所における適切さを示す。
各後続反復は、前のものに比してより適切なセグメンテーションを見出す。
− データおよび所与の領域を囲むシームのコストを含むコスト関数の局部値を計算する。
− 所与の領域のすべての可能なセグメンテーション値についてコスト関数を計算する。
− 所与の領域のセグメンテーションの初期選択が最適でない場合(関数の値が他のどのセグメンテーションの場合より高い)、所与の領域の値を最適の値(コスト関数の最小値をもつ)により置き換える。
− データおよび所与の方形を囲むシームのコストを含むコスト関数の局部値を計算する。
− 所与の方形のすべての可能なセグメンテーション値についてコスト関数を計算する。
− 所与の領域のセグメンテーションの初期選択が最適でない場合(関数の値が他のどのセグメンテーションの場合より高い)、所与の方形の値を最適の値(コスト関数の最小値をもつ)により置き換える。
1. 動作速度 現在行き渡っている移動装置(2011年リリース)における合計処理時間−1秒以内
2. セグメンテーション品質(絶対/最適セグメンテーションとの接近度)は、既知の最も優れた方法と同様である。
3. この方法を実現する場合のメモリ資源の要求条件は非常に低い。
4. この方法は、ローカル・ミニマムにトラップが存在しないために映像雑音に強い。
Claims (4)
- コスト関数の最適値の探索を含む映像セグメンテーション方法において
前記探索が粗ら精へN個の映像詳細レベルで行われ、
各映像詳細レベルにおいて映像が領域に分割され、(セグメント化される)
各領域にn回の逐次反復の手段により単一のセグメンテーション値が割り当てられ、
各反復において、領域境界におけるシームのコスト関数の値が種々のバージョンの映像セグメンテーションについて計算され、
領域ごとに、シームおよびデータのコスト関数の組み合わせを最適化するセグメンテーション値が選択され、
データおよびシームのコスト関数の組み合わせへのシームのコスト関数の入力が反復の一部において低減される
ことを特徴とする方法。 - 請求項1に記載の方法において、各反復における最適値の探索が共通の境界をもたない映像領域の処理により行わること、および処理する領域の選択が各反復において変更されることを特徴とする方法。
- 請求項1に記載の方法において、コスト関数の最適値がコスト関数の最小値として探索されることを特徴とする方法。
- 請求項1に記載の方法において、シームおよびデータのコスト関数の組み合わせが算術的合計であることを特徴とする方法。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
RU2011134204/07A RU2489752C2 (ru) | 2011-08-15 | 2011-08-15 | Способ сегментации изображений |
RU2011134204 | 2011-08-15 | ||
PCT/RU2012/000478 WO2013025123A1 (ru) | 2011-08-15 | 2012-06-19 | Способ сегментации изображений |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2014527671A JP2014527671A (ja) | 2014-10-16 |
JP5973572B2 true JP5973572B2 (ja) | 2016-08-23 |
Family
ID=47715296
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2014525964A Active JP5973572B2 (ja) | 2011-08-15 | 2012-06-19 | 映像セグメンテーション方法 |
Country Status (8)
Country | Link |
---|---|
US (1) | US9076216B2 (ja) |
JP (1) | JP5973572B2 (ja) |
KR (1) | KR101807352B1 (ja) |
CN (1) | CN103733207B (ja) |
DE (1) | DE112012003377T5 (ja) |
IN (1) | IN2014DN01819A (ja) |
RU (1) | RU2489752C2 (ja) |
WO (1) | WO2013025123A1 (ja) |
Families Citing this family (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
RU2489752C2 (ru) * | 2011-08-15 | 2013-08-10 | Дмитрий Валерьевич Шмунк | Способ сегментации изображений |
US9021052B2 (en) * | 2012-09-28 | 2015-04-28 | Interactive Memories, Inc. | Method for caching data on client device to optimize server data persistence in building of an image-based project |
CN103996189B (zh) * | 2014-05-05 | 2017-10-03 | 小米科技有限责任公司 | 图像分割方法及装置 |
US9633444B2 (en) | 2014-05-05 | 2017-04-25 | Xiaomi Inc. | Method and device for image segmentation |
RU2550534C1 (ru) * | 2014-07-15 | 2015-05-10 | Федеральное государственное бюджетное образовательное учреждение высшего профессионального образования "Рыбинский государственный авиационный технический университет имени П.А. Соловьева" | Способ автоматического определения толщины слоя с нечеткими границами по изображению |
Family Cites Families (14)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5787194A (en) * | 1994-11-08 | 1998-07-28 | International Business Machines Corporation | System and method for image processing using segmentation of images and classification and merging of image segments using a cost function |
US6078688A (en) * | 1996-08-23 | 2000-06-20 | Nec Research Institute, Inc. | Method for image segmentation by minimizing the ratio between the exterior boundary cost and the cost of the enclosed region |
US6058210A (en) * | 1997-09-15 | 2000-05-02 | Xerox Corporation | Using encoding cost data for segmentation of compressed image sequences |
US6744923B1 (en) | 1999-08-30 | 2004-06-01 | Cornell Research Foundation, Inc. | System and method for fast approximate energy minimization via graph cuts |
KR100378351B1 (ko) * | 2000-11-13 | 2003-03-29 | 삼성전자주식회사 | 색-텍스추어 거리 측정 방법 및 장치와 이를 이용한영상의 영역 구분 방법 및 장치 |
US7349922B2 (en) * | 2001-11-14 | 2008-03-25 | Yeda Research And Development Co. Ltd. | Method and apparatus for data clustering including segmentation and boundary detection |
GB0130210D0 (en) | 2001-12-18 | 2002-02-06 | Caladrius Ltd | Segmentation of images using the watershed method |
JP2004258750A (ja) * | 2003-02-24 | 2004-09-16 | Fuji Photo Film Co Ltd | 画像の特徴ベクトルのクラスタリング方法および装置 |
US8428354B2 (en) * | 2009-06-23 | 2013-04-23 | Los Alamos National Security, Llc | Image segmentation by hierarchial agglomeration of polygons using ecological statistics |
US8345974B2 (en) | 2009-07-14 | 2013-01-01 | Hewlett-Packard Development Company, L.P. | Hierarchical recursive image segmentation |
CN102103744A (zh) * | 2011-01-28 | 2011-06-22 | 武汉大学 | 基于最小生成树与统计学习理论的图像分割方法 |
RU2489752C2 (ru) * | 2011-08-15 | 2013-08-10 | Дмитрий Валерьевич Шмунк | Способ сегментации изображений |
EP2637139A1 (en) * | 2012-03-05 | 2013-09-11 | Thomson Licensing | Method and apparatus for bi-layer segmentation |
US8792013B2 (en) * | 2012-04-23 | 2014-07-29 | Qualcomm Technologies, Inc. | Method for determining the extent of a foreground object in an image |
-
2011
- 2011-08-15 RU RU2011134204/07A patent/RU2489752C2/ru active
-
2012
- 2012-06-19 US US14/238,871 patent/US9076216B2/en active Active
- 2012-06-19 JP JP2014525964A patent/JP5973572B2/ja active Active
- 2012-06-19 DE DE112012003377.9T patent/DE112012003377T5/de not_active Withdrawn
- 2012-06-19 CN CN201280039682.6A patent/CN103733207B/zh active Active
- 2012-06-19 WO PCT/RU2012/000478 patent/WO2013025123A1/ru active Application Filing
- 2012-06-19 KR KR1020147006768A patent/KR101807352B1/ko active IP Right Grant
-
2014
- 2014-03-10 IN IN1819DEN2014 patent/IN2014DN01819A/en unknown
Also Published As
Publication number | Publication date |
---|---|
CN103733207A (zh) | 2014-04-16 |
CN103733207B (zh) | 2017-08-11 |
RU2489752C2 (ru) | 2013-08-10 |
DE112012003377T5 (de) | 2014-04-30 |
US9076216B2 (en) | 2015-07-07 |
US20140254935A1 (en) | 2014-09-11 |
JP2014527671A (ja) | 2014-10-16 |
KR101807352B1 (ko) | 2017-12-08 |
KR20140071367A (ko) | 2014-06-11 |
WO2013025123A1 (ru) | 2013-02-21 |
RU2011134204A (ru) | 2013-02-20 |
IN2014DN01819A (ja) | 2015-05-15 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
DE102019216136A1 (de) | Verfahren und system zur 3d-rekonstruktion mit volumenbasierter filterung zur bildverarbeitung | |
JP5973572B2 (ja) | 映像セグメンテーション方法 | |
US9478033B1 (en) | Particle-based tracking of objects within images | |
EP2811457B1 (en) | Image processing method and apparatus | |
US20200211271A1 (en) | Image processing apparatus that generates a virtual view image from multiple images captured from different directions and method controlling the same | |
CN111243071A (zh) | 实时三维人体重建的纹理渲染方法、系统、芯片、设备和介质 | |
US20150154467A1 (en) | Method for Extracting Planes from 3D Point Cloud Sensor Data | |
US9928574B2 (en) | Method and apparatus for generating superpixels | |
KR101969082B1 (ko) | 다수의 카메라를 이용한 최적의 구형 영상 획득 방법 | |
CN111553841B (zh) | 一种基于最佳缝合线更新的实时视频拼接方法 | |
KR20060019913A (ko) | 영상 분할 방법 | |
Xu et al. | Real-time stereo vision system at nighttime with noise reduction using simplified non-local matching cost | |
WO2022233252A1 (zh) | 图像处理方法、装置、计算机设备和存储介质 | |
Tallón et al. | Upsampling and denoising of depth maps via joint-segmentation | |
US20170171499A1 (en) | Method, system and apparatus for spatially arranging a plurality of video frames for display | |
JP5965764B2 (ja) | 映像領域分割装置及び映像領域分割プログラム | |
CN111179281A (zh) | 人体图像提取方法及人体动作视频提取方法 | |
JP6082607B2 (ja) | 物体特徴抽出装置、物体領域抽出装置及び物体追跡装置 | |
CN113256484B (zh) | 一种对图像进行风格化处理的方法及装置 | |
KR102233606B1 (ko) | 영상 처리 방법 및 그 장치 | |
CN114092498A (zh) | 用于对图像中的对象进行分割的方法 | |
Purohit et al. | Multi-planar geometry and latent image recovery from a single motion-blurred image | |
Shen et al. | Structure Preserving Large Imagery Reconstruction | |
KR101893142B1 (ko) | 객체 영역 추출 방법 및 그 장치 | |
Mattoccia | Improving the accuracy of fast dense stereo correspondence algorithms by enforcing local consistency of disparity fields |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20150213 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20151105 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20151110 |
|
A711 | Notification of change in applicant |
Free format text: JAPANESE INTERMEDIATE CODE: A711 Effective date: 20151118 |
|
RD02 | Notification of acceptance of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7422 Effective date: 20151228 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A821 Effective date: 20151228 |
|
RD04 | Notification of resignation of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7424 Effective date: 20160104 |
|
A601 | Written request for extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A601 Effective date: 20160121 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20160310 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20160705 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20160714 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5973572 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |