KR20190085756A - Image Segmentation Method - Google Patents

Image Segmentation Method Download PDF

Info

Publication number
KR20190085756A
KR20190085756A KR1020180004000A KR20180004000A KR20190085756A KR 20190085756 A KR20190085756 A KR 20190085756A KR 1020180004000 A KR1020180004000 A KR 1020180004000A KR 20180004000 A KR20180004000 A KR 20180004000A KR 20190085756 A KR20190085756 A KR 20190085756A
Authority
KR
South Korea
Prior art keywords
function
image
following equation
normalization
mathematical expression
Prior art date
Application number
KR1020180004000A
Other languages
Korean (ko)
Other versions
KR102007340B1 (en
Inventor
홍병우
구자경
Original Assignee
중앙대학교 산학협력단
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 중앙대학교 산학협력단 filed Critical 중앙대학교 산학협력단
Priority to KR1020180004000A priority Critical patent/KR102007340B1/en
Publication of KR20190085756A publication Critical patent/KR20190085756A/en
Application granted granted Critical
Publication of KR102007340B1 publication Critical patent/KR102007340B1/en

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/10Segmentation; Edge detection
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F17/00Digital computing or data processing equipment or methods, specially adapted for specific functions
    • G06F17/10Complex mathematical operations

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Mathematical Physics (AREA)
  • Mathematical Analysis (AREA)
  • Computational Mathematics (AREA)
  • Algebra (AREA)
  • Mathematical Optimization (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Pure & Applied Mathematics (AREA)
  • Databases & Information Systems (AREA)
  • Software Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Image Analysis (AREA)

Abstract

Disclosed by the present invention is an image segmentation method. According to an embodiment of the present invention, the image segmentation method, with which an image processing device segments an image, includes: a step of segmenting an image into a plurality of areas; and a step of applying, to each point, a relative weighting function between a data fidelity function and a normalization function, which are determined based on a residual between input data and an estimated value of the input data for each of the areas. The image segmentation method is able to segment images without user interaction or prior knowledge.

Description

영상 분할 방법{Image Segmentation Method}Image Segmentation Method [

본 발명은 영상 분할 방법에 관한 것으로, 특히 복수개의 영역으로 분할된 영상에서 영역 각각에 대해 입력 데이터와 상기 입력 데이터에 대한 추정치간의 잔차(residual)에 기초하여 결정된 데이터 피델리티(fidelity) 함수와 정규화 함수간의 상대적 가중 함수를 각 점(point)에 적용하여 영상을 분할하는 방법에 관한 것이다. The present invention relates to an image segmentation method and, more particularly, to a method and apparatus for segmenting an image segmented into a plurality of regions into a data fidelity function and a normalization function determined based on a residual between input data and an estimate for the input data, A method of dividing an image by applying a relative weight function between points to each point.

일반적으로, 영상 분할 기술은 종양과 질병의 검출, 혈관의 부피 측정, 컴퓨터의 도움을 받은 수술, 진단, 치료 계획, 해부학적 구조의 연구 등과 같은 의료 영상분야와, 위성 영상에서 도로, 숲 등과 같은 대상의 검출 등과 같은 지리 분야, 얼굴, 지문 등과 같은 생체 인식 분야, 법의학 분야, 과학 수사 분야, 정밀 계측 분야, 교량/건축물의 정밀 보수 분야 등과 같은 다양한 분야에서 컴퓨팅 기기를 이용하여 널리 응용하고 있다.In general, image segmentation techniques are used in medical imaging fields such as tumor and disease detection, blood vessel volume measurement, computer assisted surgery, diagnosis, treatment planning, and anatomical structure studies, and satellite images such as roads and forests And has been widely applied to a variety of fields such as biometrics such as detection of objects, biometrics such as faces and fingerprints, forensics, scientific investigation, precision measurement, and maintenance of bridges / buildings.

한편, 정규화는 부적절한 역 문제로 공식화된 몇 가지 이미지 분석 작업에서 솔루션의 허용 가능한 공간을 줄이기 위해 일반적으로 부과된다. 정규 표현식의 강도를 조절하는 관련 매개 변수는 일반적으로 공간 및 반복에서 일정하며 그리드 검색에 의해 결정된다. 어떤 경우에는, 잡음 변화가 사용되고 추정된 파라미터의 안정성이 분석된 영상 복원에서와 같이 매개 변수는 데이터에 묶여있다. 모델 선택으로 매개 변수의 선택을 모방하여 교차 검증이 사용되기도 한다. 또한, L- 곡선이라 불리는 잔차와 정규화의 로그-로그 플롯에 기초한 대안적인 접근법이 이용되었다. 그러나 이러한 방법은 계산 비용이 많이 들고 잡음의 분산이 작을 때 불안정한 문제가 있다. On the other hand, normalization is generally imposed to reduce the allowable space of the solution in some image analysis work formulated as an inadequate inverse problem. Relevant parameters that control the strength of the regular expression are usually constant in space and iteration and are determined by grid search. In some cases, parameters are tied to data, such as in image reconstruction where noise variation is used and the stability of the estimated parameters is analyzed. Cross-validation is also used to mimic the choice of parameters with model selection. In addition, an alternative approach based on log-log plots of residuals and normalization called L-curves has been used. However, this method is unstable when the calculation cost is high and the variance of noise is small.

종래의 이미징 작업에서 최적화는 이산 그래프 표현 또는 연속 이완 기법을 기반으로 광범위하게 수행되었다. Total Variation(TV)은 정규화의 볼록 형태로 사용되고 그것의 최적화는 primal-dual 알고리즘에 의해 수행된다. TV를 최소화하기 위해, 다중 라벨 문제에 기능적 리프팅 기법이 적용되었다. 다중 라벨 문제에 대한 대부분의 볼록 이완 접근법은 TV 정규화에 기반을 두었지만 L1 norm 또는 L2 norm과 같은 다른 데이터 충실도 용어가 사용되었다. In conventional imaging tasks, optimization has been performed extensively based on discrete graph representation or continuous relaxation techniques. Total Variation (TV) is used as the convex form of the normalization and its optimization is performed by the primal-dual algorithm. To minimize TV, a functional lifting technique was applied to the multiple label problem. Most convex relaxation approaches to multiple label problems are based on TV normalization, but other data fidelity terms such as L 1 norm or L 2 norm are used.

그러나, 종래의 다중 레이블 모델은 테두리 박스, 윤곽선, 낙서 또는 점 등의 사용자 상호 작용을 포함하는 작업이 발생하고, 이러한 사용자 상호 작용을 강제하는 많은 수의 레이블을 사용할 때 부정확하거나 중복된 분할 영역으로 인해 어려움이 있었다. However, the conventional multi-label model is inaccurate or redundant when using a large number of labels to force user interactions such as border boxes, outlines, graffiti or points, There was a difficulty.

따라서, 사용자 상호 작용이나 사전 지식이 없어도 영상을 분할할 수 있는 기술 개발이 요구되고 있다. Therefore, it is required to develop a technique that can divide images without user interaction or prior knowledge.

이에 관련하여, 발명의 명칭이 "텍스처 이미지 처리 장치 및 방법"인 한국공개특허 제10-2017-0081969호가 존재한다.In this regard, Korean Patent Laid-open No. 10-2017-0081969, entitled " Texture Image Processing Apparatus and Method ", is available.

본 발명이 해결하고자 하는 기술적 과제는 사용자 상호 작용이나 사전 지식이 없어도 영상을 분할할 수 있는 영상 분할 방법을 제공하는 것이다. An object of the present invention is to provide an image segmentation method capable of dividing an image without user interaction or prior knowledge.

본 발명의 기술적 과제들은 이상에서 언급한 기술적 과제들로 제한되지 않으며, 언급되지 않은 또 다른 기술적 과제들은 아래의 기재로부터 통상의 기술자에게 명확하게 이해될 수 있을 것이다.The technical problems of the present invention are not limited to the above-mentioned technical problems, and other technical problems which are not mentioned can be clearly understood by those skilled in the art from the following description.

상기 기술적 과제를 해결하기 위한 본 발명의 일 실시예에 따른 영상 분할 방법은, 영상 처리 장치가 영상을 분할하는 방법에 있어서, 영상을 복수개의 영역으로 분할하는 단계, 상기 복수개의 영역 각각에 대해 입력 데이터와 상기 입력 데이터에 대한 추정치간의 잔차에 기초하여 결정된 데이터 피델리티 함수와 정규화 함수간의 상대적 가중 함수를 각 점(point)에 적용하는 단계를 포함한다. According to an aspect of the present invention, there is provided an image segmentation method for an image processing apparatus, the method comprising: dividing an image into a plurality of regions; Applying a relative weight function between the data fidelity function and the normalization function to each point determined based on the residual between the data and the estimate for the input data.

바람직하게는, 상기 잔차(

Figure pat00001
)는 아래 수학식으로 산출될 수 있다. [수학식]Preferably, the residual (
Figure pat00001
) Can be calculated by the following equation. [Mathematical Expression]

Figure pat00002
Figure pat00002

여기서,

Figure pat00003
는 후버손실함수, f(x)는 입력 데이터,
Figure pat00004
는 각 영역 i의 특성함수, ci는 추정치임.here,
Figure pat00003
F (x) is the input data,
Figure pat00004
Is a characteristic function of each region i, and c i is an estimate.

바람직하게는, 상기 상대적 가중 함수(λ)는 아래 수학식으로 정의될 수 있다. Preferably, the relative weighting function ([lambda]) may be defined by the following equation.

[수학식] [Mathematical Expression]

Figure pat00005
Figure pat00005

여기서,

Figure pat00006
이고, ρ(u)는 잔차, β는 '0'보다 크고 잔차 ρ(u)의 변화와 관련된 제어 매개 변수, α는 0<α<1이고, 상대적 가중함수(λ)의 희박 정도를 제어하는 상수 매개 변수임.here,
Figure pat00006
Α is a control parameter related to the change of residual ρ (u), β is greater than 0 and α is 0 <α <1, and the degree of leaning of the relative weighting function (λ) is controlled It is a constant parameter.

바람직하게는, 상기 데이터 피델리티 함수(

Figure pat00007
)는 아래 수학식으로 정의될 수 있다. Preferably, the data fidelity function (
Figure pat00007
) Can be defined by the following equation.

[수학식][Mathematical Expression]

Figure pat00008
Figure pat00008

여기서,

Figure pat00009
는 상대적 가중 함수,
Figure pat00010
는 입력데이터와 추정치간의 잔차,
Figure pat00011
는 각 영역 i의 특성함수, Ci는 추정치임.here,
Figure pat00009
Is a relative weight function,
Figure pat00010
Is the residual between the input data and the estimate,
Figure pat00011
Is a characteristic function of each region i, and Ci is an estimate.

바람직하게는, 상기 정규화 함수(

Figure pat00012
)는 아래 수학식으로 정의될 수 있다. Preferably, the normalization function (
Figure pat00012
) Can be defined by the following equation.

[수학식][Mathematical Expression]

Figure pat00013
Figure pat00013

여기서,

Figure pat00014
임.here,
Figure pat00014
being.

바람직하게는, 상기 상대적 가중치를 각 점에 적용하는 단계 이후, 상기 복수개의 영역 사이에 상호 배타적 제약 조건(Mutually Exclusive Region Constraint)을 적용하는 단계를 더 포함할 수 있다. Preferably, the step of applying the relative weight to each point may further comprise applying a Mutually Exclusive Region Constraint between the plurality of regions.

바람직하게는, 상기 상호 배타적 제약 조건은 아래 수학식으로 정의될 수 있다.Preferably, the mutually exclusive constraint condition can be defined by the following equation.

[수학식] [Mathematical Expression]

Figure pat00015
이고,
Figure pat00015
ego,

상기 I, j는 분할 영역의 인덱스이고, ui, uj는 분할함수인 것을 특징으로 하는 Wherein I and j are indexes of the divided areas, and ui and uj are partition functions.

바람직하게는, 상기 데이터 피델리티 함수, 정규화 함수, 상대적 가중치 및 상호 배타적 제약 조건을 이용한 에너지 함수를 최적화하는 단계를 더 포함할 수 있다. Advantageously, optimizing the energy function using the data fidelity function, normalization function, relative weighting and mutually exclusive constraints may further comprise optimizing the energy function.

바람직하게는, 상기 에너지 함수는 아래 수학식으로 정의될 수 있다. Preferably, the energy function can be defined by the following equation.

[수학식] [Mathematical Expression]

Figure pat00016
Figure pat00016

여기서, ι는 0보다 큰 상호 배타성 제약 조건에 대한 가중치 매개 변수임.Where ι is a weight parameter for mutually exclusive constraints greater than zero.

바람직하게는, 상기 에너지 함수는 아래 기재된 수학식과 같이 제약받지 않은 확대된 라그랑지안(Lagrangian)으로 단순화될 수 있다. Preferably, the energy function can be simplified to an unconstrained expanded Lagrangian as shown in the equation described below.

[수학식][Mathematical Expression]

Figure pat00017
Figure pat00017

여기서,

Figure pat00018
,r i와 zi는 최소화 될 보조 변수,
Figure pat00019
임.here,
Figure pat00018
, r i and z i are the auxiliary variables to be minimized,
Figure pat00019
being.

바람직하게는, 상기 라그랑지안(Lagrangian)으로 단순화된 최종 에너지 함수는 그래디언트에 기반한 교대 방향 수 기법(ADMM)을 이용하여 최적화될 수 있다. Advantageously, the final energy function simplified to Lagrangian can be optimized using a gradient-based alternating-direction number technique (ADMM).

본 발명에 따르면, 잔차를 기반으로 한 상대적 가중 함수를 이용함으로써, 데이터 피델리티와 정규화간의 균형을 동적으로 결정할 수 있다. According to the present invention, a balance between data fidelity and normalization can be dynamically determined by using a relative weight function based on residuals.

또한, 사용자 상호 작용이나 사전 지식이 없어도 영상을 분할할 수 있다. Also, images can be segmented without user interaction or prior knowledge.

본 발명의 효과들은 이상에서 언급한 효과들로 제한되지 않으며, 언급되지 않은 또 다른 효과들은 아래의 기재로부터 통상의 기술자에게 명확하게 이해될 수 있을 것이다.The effects of the present invention are not limited to the effects mentioned above, and other effects not mentioned can be clearly understood to those of ordinary skill in the art from the following description.

도 1은 본 발명의 일 실시예에 따른 다중 영상 분할 방법을 나타낸 순서도이다.
도 2는 본 발명의 일 실시예에 따른 영상 분할을 설명하기 위한 예시도이다.
도 3은 본 발명의 일 실시예에 따른 F-측정 값(왼쪽)과 잔차 값(오른쪽)을 반복수의 함수로 사용하여 다른 에너지 모델의 정량적 비교 결과를 나타낸 도면이다.
도 4는 본 발명의 일 실시예에 따른 증가하는 수의 영역(5, 7, 9 위에서 아래로)에 대한 접합 테스트의 정성 비교 결과를 나타낸 도면이다.
도 5는 본 발명의 일 실시예에 따른 일정한 비 적응성 정규기의 함정과 최종 해결책에 대한 편견을 보여주는 정성적 비교 도면이다.
도 6은 본 발명의 일 실시예에 따른 서로 다른 알고리즘을 사용하여 Berkeley 데이터 세트에서 다중 라벨 세분화를 시각적으로 비교한 도면이다.
1 is a flowchart illustrating a method of dividing multiple images according to an exemplary embodiment of the present invention.
2 is an exemplary diagram for explaining image segmentation according to an embodiment of the present invention.
FIG. 3 is a graph showing the results of quantitative comparison of different energy models using F-measured values (left) and residual values (right) according to an embodiment of the present invention as a function of the number of repetitions.
4 is a diagram showing a qualitative comparison result of a joint test for an increasing number of regions (5 to 7, 9 to above) according to an embodiment of the present invention.
Figure 5 is a qualitative comparative diagram showing the prejudice of the trap of a certain non-adaptive regular machine and the final solution according to an embodiment of the present invention.
Figure 6 is a graphical comparison of multiple label segmentation in a Berkeley data set using different algorithms in accordance with an embodiment of the present invention.

본 발명은 다양한 변경을 가할 수 있고 여러 가지 실시예를 가질 수 있는 바, 특정 실시예들을 도면에 예시하고 상세한 설명에 상세하게 설명하고자 한다. 그러나, 이는 본 발명을 특정한 실시 형태에 대해 한정하려는 것이 아니며, 본 발명의 사상 및 기술 범위에 포함되는 모든 변경, 균등물 내지 대체물을 포함하는 것으로 이해되어야 한다. 각 도면을 설명하면서 유사한 참조부호를 유사한 구성요소에 대해 사용하였다.While the invention is susceptible to various modifications and alternative forms, specific embodiments thereof are shown by way of example in the drawings and will herein be described in detail. It should be understood, however, that the invention is not intended to be limited to the particular embodiments, but includes all modifications, equivalents, and alternatives falling within the spirit and scope of the invention. Like reference numerals are used for like elements in describing each drawing.

제1, 제2, A, B 등의 용어는 다양한 구성요소들을 설명하는데 사용될 수 있지만, 상기 구성요소들은 상기 용어들에 의해 한정되어서는 안 된다. 상기 용어들은 하나의 구성요소를 다른 구성요소로부터 구별하는 목적으로만 사용된다. 예를 들어, 본 발명의 권리 범위를 벗어나지 않으면서 제1 구성요소는 제2 구성요소로 명명될 수 있고, 유사하게 제2 구성요소도 제1 구성요소로 명명될 수 있다. 및/또는 이라는 용어는 복수의 관련된 기재된 항목들의 조합 또는 복수의 관련된 기재된 항목들 중의 어느 항목을 포함한다.The terms first, second, A, B, etc. may be used to describe various elements, but the elements should not be limited by the terms. The terms are used only for the purpose of distinguishing one component from another. For example, without departing from the scope of the present invention, the first component may be referred to as a second component, and similarly, the second component may also be referred to as a first component. And / or &lt; / RTI &gt; includes any combination of a plurality of related listed items or any of a plurality of related listed items.

어떤 구성요소가 다른 구성요소에 "연결되어" 있다거나 "접속되어" 있다고 언급된 때에는, 그 다른 구성요소에 직접적으로 연결되어 있거나 또는 접속되어 있을 수도 있지만, 중간에 다른 구성요소가 존재할 수도 있다고 이해되어야 할 것이다. 반면에, 어떤 구성요소가 다른 구성요소에 "직접 연결되어" 있다거나 "직접 접속되어" 있다고 언급된 때에는, 중간에 다른 구성요소가 존재하지 않는 것으로 이해되어야 할 것이다.It is to be understood that when an element is referred to as being "connected" or "connected" to another element, it may be directly connected or connected to the other element, . On the other hand, when an element is referred to as being "directly connected" or "directly connected" to another element, it should be understood that there are no other elements in between.

본 출원에서 사용한 용어는 단지 특정한 실시예를 설명하기 위해 사용된 것으로, 본 발명을 한정하려는 의도가 아니다. 단수의 표현은 문맥상 명백하게 다르게 뜻하지 않는 한, 복수의 표현을 포함한다. 본 출원에서, "포함하다" 또는 "가지다" 등의 용어는 명세서상에 기재된 특징, 숫자, 단계, 동작, 구성요소, 부품 또는 이들을 조합한 것이 존재함을 지정하려는 것이지, 하나 또는 그 이상의 다른 특징들이나 숫자, 단계, 동작, 구성요소, 부품 또는 이들을 조합한 것들의 존재 또는 부가 가능성을 미리 배제하지 않는 것으로 이해되어야 한다.The terminology used in this application is used only to describe a specific embodiment and is not intended to limit the invention. The singular expressions include plural expressions unless the context clearly dictates otherwise. In the present application, the terms "comprises" or "having" and the like are used to specify that there is a feature, a number, a step, an operation, an element, a component or a combination thereof described in the specification, But do not preclude the presence or addition of one or more other features, integers, steps, operations, elements, components, or combinations thereof.

다르게 정의되지 않는 한, 기술적이거나 과학적인 용어를 포함해서 여기서 사용되는 모든 용어들은 본 발명이 속하는 기술 분야에서 통상의 지식을 가진 자에 의해 일반적으로 이해되는 것과 동일한 의미를 가지고 있다. 일반적으로 사용되는 사전에 정의되어 있는 것과 같은 용어들은 관련 기술의 문맥 상 가지는 의미와 일치하는 의미를 가지는 것으로 해석되어야 하며, 본 출원에서 명백하게 정의하지 않는 한, 이상적이거나 과도하게 형식적인 의미로 해석되지 않는다.Unless defined otherwise, all terms used herein, including technical or scientific terms, have the same meaning as commonly understood by one of ordinary skill in the art to which this invention belongs. Terms such as those defined in commonly used dictionaries are to be interpreted as having a meaning consistent with the contextual meaning of the related art and are to be interpreted as either ideal or overly formal in the sense of the present application Do not.

이하, 본 발명에 따른 바람직한 실시예를 첨부된 도면을 참조하여 상세하게 설명한다.Hereinafter, preferred embodiments according to the present invention will be described in detail with reference to the accompanying drawings.

도 1은 본 발명의 일 실시예에 따른 다중 영상 분할 방법을 나타낸 순서도, 도 2는 본 발명의 일 실시예에 따른 영상 분할을 설명하기 위한 예시도이다. FIG. 1 is a flowchart illustrating a method for dividing multiple images according to an embodiment of the present invention. FIG. 2 is a diagram for explaining image division according to an exemplary embodiment of the present invention.

도 1을 참조하면, 영상 처리 장치는 영상을 복수 개의 영역으로 분할한다(S110). 이하에서는 설명의 편의를 위해 영상을 n개의 영역으로 분할하는 경우에 대해 설명하기로 한다. Referring to FIG. 1, the image processing apparatus divides an image into a plurality of regions (S110). Hereinafter, for convenience of description, a case of dividing an image into n regions will be described.

즉, 영상 처리 장치는 기설정된 개수(라벨수)로 영상을 양자화하여 N개의 영역으로 설정할 수 있다. 또한, 영상 처리 장치는 영상에서 랜덤수의 픽셀을 선택하여 N개의 영역을 설정할 수도 있다.That is, the image processing apparatus can quantize an image with a preset number (the number of labels) and set it as N regions. Also, the image processing apparatus may set N regions by selecting a random number of pixels from the image.

단계 S110이 수행되면, 영상 처리 장치는 n개의 영역 각각에 대해 입력 데이터와 입력 데이터에 대한 추정치간의 잔차에 기초하여 결정된 데이터 피델리티(fidelity) 함수와 정규화 함수간의 상대적 가중 함수를 각 점(point)에 적용한다(S120).When step S110 is performed, the image processing apparatus calculates a relative weight function between the data fidelity function and the normalization function determined based on the residual between the input data and the estimated value for the input data for each of the n regions at each point (S120).

일반적으로 데이터 충실도와 정규화 간의 절충은 공간(즉, 전체 영상 영역)과 시간(즉, 일반적으로 반복적인) 최적화의 전체 과정에서 일정하다고 가정한다. 그러나, 어느 쪽도 바람직하지 않다. 공간적으로 적응성이 있는 규칙성에 대해 도 2를 참조하여 설명하기로 한다. 입력 영상 (a)와 (a)가 분할된 분할 결과 (b) 사이의 잔차(residual)가 (c)와 같이 표시되고, 잔차의 분산은 (d)와 같이 표시된다. (c)와 (d)를 보면, 잔차나 분산(그레이 레벨 : 밝음은 크고, 어둡기는 작음)은 공간에서 일정하지 않다. 이는 잔차의 국부적 분산이 공간 및 최적화 과정에서 종종 달라지는 모션 추정(옵티컬 플로우) 및 영상 복원과 같은 다른 이미징 문제에도 적용할 수 있다. 따라서, 국부적인 명암 변화에서 연구된 바와 같이 정적 이미지 특징을 넘어 공간적으로 적응된 정규화가 필요하다. 이러한 작업의 정규화는 공간에 따라 다르지만 변형은 이미지 통계에 연결되므로 반복을 통해 일정하다. 이에, 본 발명은 반복동안 변화하는 잔차를 이용하여 공간 적응적인 정규화를 구현할 수 있다. In general, the trade-off between data fidelity and normalization is assumed to be constant over the entire process of space (ie, the entire image area) and time (ie, typically repetitive) optimization. However, neither is desirable. Spatially adaptive regularity will be described with reference to FIG. The residual between the input image (a) and the division result (b) in which (a) is divided is displayed as (c) and the variance of the residual is displayed as (d). Looking at (c) and (d), the residuals and variances (gray levels: bigger, less dark) are not constant in space. This can be applied to other imaging problems such as motion estimation (optical flow) and image reconstruction where the local variance of the residuals is often different in space and optimization. Thus, there is a need for spatially adapted normalization beyond the static image feature as studied in the local light and dark changes. Normalization of these tasks varies with space, but deformation is constant through repetition because it is linked to image statistics. Thus, the present invention can implement spatial adaptive normalization using varying residuals during iteration.

즉, 본 발명은 데이터 피델리티 항과 정규화 항 간의 가중치를 공간적으로 적응적이고, 반자동으로 결정할 수 있는 정규화 기법을 이용한다. 이 방법은 입력 데이터와 추정된 해 간의 잔차에 기반하여 상대적 가중 함수를 사전 정보 없이 결정한다.That is, the present invention uses a normalization technique that can spatially adaptively and semiautomatically determine the weight between the data fidelity term and the normalization term. This method determines the relative weighting function without prior knowledge based on the residual between the input data and the estimated solution.

즉, 상대적 가중 함수(λ)는 아래 기재된 수학식 1로 정의된다. That is, the relative weight function (?) Is defined by Equation 1 described below.

[수학식 1][Equation 1]

Figure pat00020
Figure pat00020

여기서,

Figure pat00021
이고, ρ(u)는 잔차, β는 '0'보다 크고 잔차 ρ(u)의 변화와 관련된 제어 매개 변수, α는 0<α<1이고, 상대적 가중함수(λ)의 희박 정도를 제어하는 상수 매개 변수를 의미할 수 있다. 상대적 가중 함수(λ)는 데이터 충실도와 정규화 간의 균형을 결정한다. 예를 들어, λ가 커지면 데이터 충실도가 더 중요한 것으로 간주되어 경계가 명확하게 유지되고, λ가 작아짐에 따라 정규화가 더 많이 부과되어 오버 스무딩 효과가 발생한다. here,
Figure pat00021
Α is a control parameter related to the change of residual ρ (u), β is greater than 0 and α is 0 <α <1, and the degree of leaning of the relative weighting function (λ) is controlled It can mean a constant parameter. The relative weight function (λ) determines the balance between data fidelity and normalization. For example, if λ is large, the data fidelity is regarded as more important, the boundary is clearly maintained, and as λ becomes smaller, more normalization is imposed, resulting in an over-smoothing effect.

데이터 충실도와 정규화 사이의 상대적 가중 함수(λ)는 모델에 대한 데이터의 로컬 적합성에 의해 결정되는 잔차 ρ(u(x))에 따라 각 점 x에서 적응적으로 적용된다. 상대적 가중 함수(λ)를 기반으로 한 적응성 규칙은 잔차가 클때 등화가 더 강하고, 등가적으로

Figure pat00022
가 작을 때 정규화가 강하며, 잔차가 작을 때 약하고 등가 적으로
Figure pat00023
가 큰 경우 에너지 최적화 프로세스 중에 설계되도록 설계된다. The relative weight function (lambda) between data fidelity and normalization is applied adaptively at each point x according to the residual? (U (x)) determined by the local fitness of the data for the model. The adaptive rule based on the relative weighting function (λ) is more robust and equiva- lent when the residual is large
Figure pat00022
Is small, the normalization is strong, and when the residual is small,
Figure pat00023
Is designed to be designed during the energy optimization process.

양의 라그랜지 승수(α)를 갖는

Figure pat00024
의 범위는 가중치 1-λ를 [α, 1) 정규화가 모든 곳에 부과되도록 데이터 충실도 ρ(u)와 정규화
Figure pat00025
의 정의에서 임계 파라미터 μ> 0을 갖는 강력한 후버 손실 함수(
Figure pat00026
)를 사용한다.Having a positive Lagrange multiplier &lt; RTI ID = 0.0 &gt;
Figure pat00024
(U) and normalization (i) such that the weighting 1 - [lambda], [1, 1)
Figure pat00025
A strong Hoover loss function with critical parameter μ> 0 (
Figure pat00026
) Is used.

후버 손실 함수는 아래 기재된 수학식 2로 정의될 수 있다. The Hober loss function can be defined by Equation (2) below.

[수학식 2]&Quot; (2) &quot;

Figure pat00027
Figure pat00027

L2 norm과 비교하여 후버 손실 함수를 사용하는 경우, 가장자리와 같은 기하학적 특징이 더 잘 유지되는 반면 계단 인공물로 이어지는 차별화되지 않는 L1 norm과는 달리 연속 파생 값을 갖는 장점이 있다. 또한, Huber 손실은 L1 norm의 근사 연산자(proximal operator)에 대한 등가성 때문에 효율적인 볼록 최적화를 가능하게 한다.Compared with the L 2 norm, the use of the Hoover loss function has the advantage of having a continuous derivative, unlike the non-differentiating L 1 norm leading to stair artifacts, while maintaining geometric features such as edges better. Huber loss also enables efficient convex optimization due to the equivalence of the L 1 norm to the proximal operator.

한편, 다중 영상 분할은 이미지 도메인(Ω)을 n개의 쌍으로 분리된 영역(Ωi)으로 나누는 것을 목표로 한다. 여기서,

Figure pat00028
이고
Figure pat00029
이면
Figure pat00030
이다. 분할은 라벨링 함수
Figure pat00031
로 표현되고,
Figure pat00032
Figure pat00033
인 레이블 집합을 나타낸다. 라벨링 함수 l(x)는
Figure pat00034
가 되도록 각 점 x∈Ω에 라벨을 할당한다.On the other hand, the multiple image segmentation aims at dividing the image domain (?) Into n number of pairs of separated areas (? I). here,
Figure pat00028
ego
Figure pat00029
If
Figure pat00030
to be. Split is a labeling function
Figure pat00031
Lt; / RTI &gt;
Figure pat00032
The
Figure pat00033
Lt; / RTI &gt; label set. The labeling function l (x)
Figure pat00034
Lt; / RTI &gt; to each point x &lt; RTI ID = 0.0 &gt;

분할된 각 영역(

Figure pat00035
)은 특성 함수(
Figure pat00036
)에 의해 표시되고,
Figure pat00037
일 수 있다. Each divided area (
Figure pat00035
) Is the characteristic function (
Figure pat00036
), &Lt; / RTI &gt;
Figure pat00037
Lt; / RTI &gt;

특성 함수(

Figure pat00038
)는 아래 기재된 수학식 3으로 정의될 수 있다. Characteristic function (
Figure pat00038
) Can be defined by the following equation (3).

[수학식 3]&Quot; (3) &quot;

Figure pat00039
Figure pat00039

Figure pat00040
은 도메인
Figure pat00041
를 갖는 실측 이미지라 하자. 영상(f(x))의 분할은 일련의 특성 함수 집합(
Figure pat00042
)에 대해 에너지 함수를 최소화하는 영역
Figure pat00043
을 찾음으로써 얻어진다.
Figure pat00040
Domain
Figure pat00041
. The partitioning of the image (f (x)) involves a set of characteristic functions (
Figure pat00042
) For minimizing the energy function
Figure pat00043
&Lt; / RTI &gt;

일반적으로 에너지 함수는 데이터 피델리티 함수와 정규화 함수를 이용하여 정의된다. 즉, 에너지 함수는 아래 기재된 수학식 4로 정의된다. In general, the energy function is defined using a data fidelity function and a normalization function. That is, the energy function is defined by Equation 4 described below.

[수학식 4]&Quot; (4) &quot;

Figure pat00044
Figure pat00044

데이터 충실도(data fidelity)는 추정치가 주어진 데이터를 얼마나 잘 설명하는지를 측정하는 것이고, 정규화는 추정된 영역 경계의 불연속성에 대한 척도를 의미할 수 있다. Data fidelity measures how well an estimate describes the given data, and normalization can mean a measure of the discontinuity of the estimated domain boundary.

데이터 충실도(data fidelity)를 위해, 추가적인 노이즈 프로세스를 가진 간단한 조각별 일정한 이미지 모델을 사용한다. 즉,

Figure pat00045
를 가지는
Figure pat00046
를 사용할 수 있다. 여기서,
Figure pat00047
는 중심이 가우시안 분포를 따르고 꼬리가 후버 손실 함수(
Figure pat00048
)에 이르는 라플라스 분포를 따르는 이항 분포를 따른다고 가정한다.For data fidelity, we use a simple piecewise constant image model with an additional noise process. In other words,
Figure pat00045
Having
Figure pat00046
Can be used. here,
Figure pat00047
The center follows the Gaussian distribution and the tail follows the Hoover loss function (
Figure pat00048
), Which follows the Laplace distribution.

그러면, 데이터 피델리티 함수(

Figure pat00049
)는 아래 기재된 수학식 5와 같이 정의될 수 있다. Then, the data fidelity function (
Figure pat00049
) Can be defined as shown in Equation (5) below.

[수학식 5]&Quot; (5) &quot;

Figure pat00050
Figure pat00050

여기서,

Figure pat00051
는 상대적 가중 함수로, 레이블(i)에 대한 상대 가중 함수
Figure pat00052
는 수학식 1에서 정의된 잔여
Figure pat00053
에 기반하여 결정된다.
Figure pat00054
는 각 영역 i의 특성함수, Ci는 추정치를 의미할 수 있다.
Figure pat00055
는 입력데이터와 추정치간의 잔차로, 아래 기재된 수학식 6으로 정의될 수 있다. here,
Figure pat00051
Is a relative weight function, and the relative weight function for label ( i)
Figure pat00052
Lt; RTI ID = 0.0 &gt; 1 &lt; / RTI &
Figure pat00053
.
Figure pat00054
Is a characteristic function of each region i, and Ci can be an estimate.
Figure pat00055
Is the residual between the input data and the estimate, and can be defined by Equation 6 below.

[수학식 6]&Quot; (6) &quot;

Figure pat00056
Figure pat00056

정규화를 위해 각 영역(Ωi)에 대해 표준 길이 페널티(standard length penalty)를 사용한다.A standard length penalty is used for each region (Ω i ) for normalization.

그러면, 정규화 함수(

Figure pat00057
)는 아래 기재된 수학식 7로 정의될 수 있다.Then, the normalization function (
Figure pat00057
) Can be defined by Equation (7) described below.

[수학식 7]&Quot; (7) &quot;

Figure pat00058
Figure pat00058

여기서,

Figure pat00059
는 아래 기재된 수학식 8로 정의될 수 있다. here,
Figure pat00059
Can be defined by the following equation (8).

[수학식 8]&Quot; (8) &quot;

Figure pat00060
Figure pat00060

여기서,

Figure pat00061
Figure pat00062
이고, Huber 함수(
Figure pat00063
)에 대한 임계값을 의미한다. here,
Figure pat00061
silver
Figure pat00062
, And the Huber function (
Figure pat00063
). &Lt; / RTI &gt;

특성 함수(

Figure pat00064
)의 수학식 4에서의 에너지 함수는 그것의 정수 제약
Figure pat00065
로 인해 볼록하지 않다. 이에, 고전적인 convex relaxation 방법을 사용하여 에너지 함수의 convex 형태를 도출할 수 있다. 즉,
Figure pat00066
는 바운드된 변이(bounded variation)의 연속 함수
Figure pat00067
로 대체하고, 정수 제약
Figure pat00068
는 볼록 집합
Figure pat00069
로 완화될 수 있다. Characteristic function (
Figure pat00064
) &Lt; / RTI &gt; of Equation (4)
Figure pat00065
So it is not convex. The convex shape of the energy function can be derived using the classic convex relaxation method. In other words,
Figure pat00066
Is a continuous function of the bounded variation
Figure pat00067
, And an integer constraint
Figure pat00068
A convex set
Figure pat00069
Lt; / RTI &gt;

이를 수학식으로 표현하면, 아래 기재된 수학식 9와 같을 수 있다. This can be expressed by the following equation (9).

[수학식 9]&Quot; (9) &quot;

Figure pat00070
Figure pat00070

여기서

Figure pat00071
은 스무스한(smooth) 함수이고, 데이터 피델리티
Figure pat00072
와 정규화
Figure pat00073
는 아래 기재된 수학식 10과 수학식 11로 정의된다.here
Figure pat00071
Is a smooth function, and the data fidelity
Figure pat00072
And normalization
Figure pat00073
Is defined by the following equations (10) and (11).

[수학식 10]&Quot; (10) &quot;

Figure pat00074
Figure pat00074

[수학식 11]&Quot; (11) &quot;

Figure pat00075
Figure pat00075

가중 함수

Figure pat00076
는 수학식 1에서 정의된 잔차
Figure pat00077
를 기반으로 결정되어 모델과 관측사이의 불일치가 발생하는 분할 함수에 더 높은 정규화를 부과한다. 대조적으로, 국부(로컬) 관측이 모델에 맞는 영역에 대해서는 보다 낮은 정규화가 부과된다.Weight function
Figure pat00076
Lt; RTI ID = 0.0 &gt; 1 &lt; / RTI &
Figure pat00077
And imposes a higher normalization on the partition function where the mismatch between the model and the observation occurs. In contrast, a lower normalization is imposed for regions where local (local) observations fit the model.

상기와 같은 과정을 통해 영상은 n개의 영역으로 분할되었으나, 수학식 (20)의 조건

Figure pat00078
은 특히 많은 수의 레이블을 가지고 이 제약 조건을 적용하는데 비효율적이다. Through the above process, the image is divided into n regions, but the condition of Equation (20)
Figure pat00078
Is particularly inefficient in applying this constraint with a large number of labels.

이에, 영상 처리 장치는 n개의 영역 사이에 상호 배타적 제약 조건(Mutually Exclusive Region Constraint)을 적용한다(S130). Accordingly, the image processing apparatus applies Mutually Exclusive Region Constraint between the n regions (S130).

즉, 영상 처리 장치는

Figure pat00079
가 모든
Figure pat00080
에 대해 최소화되도록 영역
Figure pat00081
에서 각 쌍의 조합의 공통 영역을 페널티하는 새로운 제약 조건을 도입한다. 영역
Figure pat00082
에서 각 쌍의 조합의 공통 영역을 페널티하는 상호 배타적 제약 조건(Mutually Exclusive Region Constraint)을 수학식 9의 에너지 함수에 적용하면, 아래 기재된 수학식 12와 같이 정의될 수 있다. That is, the image processing apparatus
Figure pat00079
All
Figure pat00080
Lt; RTI ID = 0.0 &gt;
Figure pat00081
Introduces a new constraint that penalizes the common area of each pair combination. domain
Figure pat00082
(Mutually Exclusive Region Constraint) that penalizes the common region of each pair combination in the energy function of Equation (9) can be defined as Equation (12) described below.

[수학식 12]&Quot; (12) &quot;

Figure pat00083
Figure pat00083

여기서 ι는 ι> 0이고, 상호 배타적 제약 조건에 대한 가중치 매개 변수이다.Where ι is ι> 0 and is a weight parameter for mutually exclusive constraints.

원하는 분할 결과는 분할 함수(ui)의 최적 집합에 의해 획득된다. 즉, 분할 결과는 아래 기재된 수학식 13으로 정의될 수 있다. The desired partitioning result is obtained by the optimal set of partitioning functions u i . That is, the division result can be defined by Equation (13) described below.

[수학식 13]&Quot; (13) &quot;

Figure pat00084
Figure pat00084

상기와 같은 과정을 통해 에너지 함수가 정의되면, 영상 처리 장치는 에너지 함수를 최적화한다(S140). If the energy function is defined through the above process, the image processing apparatus optimizes the energy function (S140).

수학식 12의 분할 제어에 대한 에너지 함수는 기대 최대화(EM) 프레임 워크에서 분할 함수 {ui}와 강도 추정치{ci}의 세트에 대해 최소화된다. 수학식 12의 에너지 함수에 ui = vi 분할 변수를 적용하면, 아래 기재된 수학식 14과 같이 제약받지 않은 확대된 라그랑지안(Lagrangian)으로 단순화할 수 있다. The energy function for the partitioning control of equation (12) is minimized for the set of partition function {u i } and intensity estimate {c i } in an expectation maximization (EM) framework. Applying the u i = v i dividing variable to the energy function of equation (12) can be simplified to unconstrained enlarged Lagrangian as shown in equation (14) below.

[수학식 14]&Quot; (14) &quot;

Figure pat00085
Figure pat00085

여기서, θ는 θ> 0인 스칼라 확대 계수이다. wi는 오리지널 제약 조건 ui∈[0, 1]과

Figure pat00086
을 간단한 제약 조건
Figure pat00087
Figure pat00088
로 분해할 수 있는 등가 제약 조건 ui = vi에 대한 이중 변수이다. 수학식 10의 데이터 충실도 ρ(ui, ci)와 수학식 11의 정규화
Figure pat00089
는 비 - 평활 함수
Figure pat00090
의 Moreau-Yosida 정규화에 의해 효율적으로 최적화 될 수있다. 즉, 데이터 충실도 ρ(ui, ci)와 정규화
Figure pat00091
는 정규화된 형식 ρ(ui, ci, ri)와
Figure pat00092
로 대체된다. Where θ is a scalar magnification factor with θ> 0. w i is the original constraint u i ∈ [0, 1]
Figure pat00086
To a simple constraint
Figure pat00087
and
Figure pat00088
Is the double variable for the equality constraint u i = v i that can be decomposed into. The data fidelity ρ (u i , c i ) of (10) and the normalization of
Figure pat00089
Is a non-smoothing function
Figure pat00090
Can be efficiently optimized by the Moreau-Yosida normalization of That is, the data fidelity ρ (u i , c i )
Figure pat00091
(U i , c i , r i ) and the normalized form ρ
Figure pat00092
.

그러면, 수학식 10은 아래 기재된 수학식 15와 같이 정의되고, 수학식 11은 아래 기재된 수학식 16과 같이 정의된다. Then, Equation (10) is defined as Equation (15) described below, and Equation (11) is defined as Equation (16) described below.

[수학식 15]&Quot; (15) &quot;

Figure pat00093
Figure pat00093

[수학식 16]&Quot; (16) &quot;

Figure pat00094
Figure pat00094

여기서, ri와 zi는 최소화 될 보조 변수이다. Here, r i and z i are auxiliary variables to be minimized.

수학식 14의 ui와 vi에 대한 제약 조건은 아래 수학식 17에 의해 정의된 집합 A의 표시 함수 δA(x)로 나타낼 수 있다.The constraint condition for u i and v i in Equation (14) can be represented by a display function 隆A (x) of the set A defined by Equation (17) below.

[수학식 17]&Quot; (17) &quot;

Figure pat00095
Figure pat00095

제약 조건

Figure pat00096
Figure pat00097
인 δA(ui)로 주어지며 제약 조건
Figure pat00098
Figure pat00099
Figure pat00100
로 주어진다. 데이터 충실도와 정규화의 정규화 된 형식과 제약 조건에 대한 지시자 함수는 레이블 i에 대해 아래 기재된 수학식 18과 같은 제한되지 않은 확장된 Lagrangian (
Figure pat00101
)을 유도한다. Constraint
Figure pat00096
The
Figure pat00097
Lt; RTI ID = 0.0 &gt; A &lt; / RTI &gt; (u i )
Figure pat00098
silver
Figure pat00099
sign
Figure pat00100
. The indicator function for the normalized form and constraint of data fidelity and normalization is the unlimited extended Lagrangian (&lt; RTI ID = 0.0 &gt;
Figure pat00101
).

[수학식 18]&Quot; (18) &quot;

Figure pat00102
Figure pat00102

수학식 18은 아래 기재된 수학식 19와 같은 최종 에너지 함수(

Figure pat00103
)를 유도한다. Equation (18) is the final energy function &lt; RTI ID = 0.0 &gt;
Figure pat00103
).

[수학식 19]&Quot; (19) &quot;

Figure pat00104
Figure pat00104

에너지 함수

Figure pat00105
을 최소화함으로써 최적의 분할 함수 세트가 얻어진다. 에너지 함수를 최적화하기 위해서 그래디언트에 기반한 교대 방향 수 기법(ADMM) 알고리즘을 이용할 수 있다. Energy function
Figure pat00105
The optimal set of partition functions is obtained. To optimize the energy function, we can use a gradient-based alternate-direction-counting (ADMM) algorithm.

ADDM 알고리즘은 표 1과 같다. The ADDM algorithm is shown in Table 1.

[표 1][Table 1]

Figure pat00106
Figure pat00106

표 1에 도시된 ADDM 알고리즘에 따라 수학식 (56)에서 각 레이블

Figure pat00107
에 대한 증가된 라그랑지안을 최소화하도록 진행한다. 획득된 중간 솔루션 ui 및 vi는 각각 A와 B에 반영된다. ADDM 알고리즘은 레이블링 함수 l(x)에 대한 주어진 초기화로부터의 수렴(convergence)까지 반복된다. According to the ADDM algorithm shown in Table 1,
Figure pat00107
Lt; / RTI &gt; to minimize the increased &lt; RTI ID = 0.0 &gt; Lagrangian &lt; / RTI & The obtained intermediate solutions u i and v i are reflected in A and B, respectively. The ADDM algorithm is repeated until convergence from a given initialization for the labeling function l (x).

이하, 본 발명에 따른 영상 분할에동적 정규화 기법의 견고함과 효과에 대해 실험 결과를 이용하여 설명하기로 한다. 실험에서는 Berkeley 분할 데이터 세트의 이미지와 단순하지만 예시적인 합성 이미지를 사용하였다. 그리고, 실험 전반에 걸쳐 모든 알고리즘에 대한 초기 레이블 지정 함수에 무작위 초기화를 사용하였다. Hereinafter, robustness and effect of the dynamic normalization method for image segmentation according to the present invention will be described using experimental results. In the experiment, we used an image of the Berkeley partitioned data set and a simple but exemplary composite image. We also used random initialization for the initial labeling function for all algorithms throughout the experiment.

도 3은 본 발명의 일 실시예에 따른 F-측정 값(왼쪽)과 잔차 값(오른쪽)을 반복수의 함수로 사용하여 다른 에너지 모델의 정량적 비교 결과를 나타낸 도면이다. TV-L1과 TV-L2 접근법을 본 발명의 Huber-Huber(H2) 모델에 비교한 것이다. TV-L1 및 TV-L2와 비교하여 Huber-Huber 모델의 견고성을 효과적으로 입증하기 위해 양분 분할 영역 이미지의 공통 영역에 대한 제약 조건의 영향을 무시하고 이중 분할 이미지 모델을 고려한다. 최적화를 위해 TV-L1 및 TV-L2 모델에 primal-dual 알고리즘을 적용한다. H2 모델은 양분할 이미지 모델에 적합한 이미지에서 양분 분할 문제에 대해 보다 정확하고 더 빠르게 수렴함을 알 수 있다. FIG. 3 is a graph showing the results of quantitative comparison of different energy models using F-measured values (left) and residual values (right) according to an embodiment of the present invention as a function of the number of repetitions. The TV-L 1 and TV-L 2 approaches are compared to the Huber-Huber (H2) model of the present invention. In order to effectively demonstrate the robustness of the Huber-Huber model as compared to TV-L1 and TV-L2, we consider the dual-partition image model ignoring the effect of constraints on the common area of the nu- Apply the primal-dual algorithm to TV-L1 and TV-L2 models for optimization. It can be seen that the H2 model converges more precisely and faster for the problem of the partitioning of nutrients in the image suitable for the binary image model.

도 4는 본 발명의 일 실시예에 따른 증가하는 수의 영역(5, 7, 9 위에서 아래로)에 대한 접합 테스트의 정성 비교 결과를 나타낸 도면이다. 정형화된 결과를 고전적 교차점 테스트에서 다른 수의 레이블과 질적으로 비교한다. 그러면 레이블의 수가 1보다 작게 고정된다. 입력 이미지의 영역 수 알고리즘은 주변 지역의 레이블로 중앙 디스크를 "inpaint"하도록 강제된다. 면적이 다른 교차점 프로토 타입 이미지의 세분화 결과는 (a)와 같이 입력 접합 이미지가 5(상단), 7(중간), 9(하단) 영역을 갖는다. (f)상호 독점 제약이 없는 H2 모델과 (g) 전체 H2 모델을 다음과 같은 알고리즘에 대한 제약 조건과 비교한다. (b)고속 레이블 (FL) [57], (c) primal-dual (TV)를 이용한 Total Variation에 기반한 볼록 이완[58], (d) Douglas-Rachford(VTV)[59]를 이용한 벡터적 총 변이, (e) paired calibration (PC) [7]이다. 이 실험은 특히 상호 배타성의 제약에 대한 필요성을 입증하기 위해 설계되었으므로 입력 이미지는 정확한 조각별 상수 모델에 적합하도록 만들어 비교 대상 알고리즘의 기본 이미지 모델이 적합하도록 만든다. 도 4에 도시 된 예시적인 결과는 영역의 수가 증가함에 따라(상부에서 하부로) 대부분의 알고리즘이 저하되는 반면, 본 발명에 따른 알고리즘은 일관되게 더 나은 결과를 산출한다는 것을 알 수 있다. 4 is a diagram showing a qualitative comparison result of a joint test for an increasing number of regions (5 to 7, 9 to above) according to an embodiment of the present invention. Qualified results are compared qualitatively with a different number of labels in a classical cross-point test. The number of labels is then fixed to less than one. The region number algorithm of the input image is forced to "inpaint" the central disc with labels in the surrounding area. As shown in (a), the input joint image has 5 (upper), 7 (middle) and 9 (lower) regions in the subdivision results of the intersection prototype images having different areas. (f) H2 model without mutual exclusive constraints and (g) all H2 models with constraints for the following algorithm. (d) Douglas-Rachford (VTV) [59] based on Total Variation using primitive-dual (TV) [58] (E) paired calibration (PC) [7]. This experiment was designed specifically to demonstrate the need for constraints of mutual exclusiveness, so that the input image is made to fit the correct piecewise constant model, making the base image model of the compared algorithm fit. It can be seen that the exemplary results shown in FIG. 4 show that the algorithm according to the present invention produces consistently better results, while the majority of algorithms are degraded as the number of regions increases (from top to bottom).

도 5는 본 발명의 일 실시예에 따른 일정한 비 적응성 정규기의 함정과 최종 해결책에 대한 편견을 보여주는 정성적 비교 도면이다. 이미지 (a)는 경계/모서리가 날카로운 3개의 영역과 다양한 공간적 가변성을 가지고 있다. 소량의 정규화 (d) (큰 λ)를 사용하면 경계가 명확해지지만 불규칙한 세 영역 (빨간색, 녹색 및 파란색)으로 구분되며 중앙 및 오른쪽 직사각형에 다른 레이블이 분산된다. 큰 정규화 가중치 (e) (작은 λ)를 사용하면 동종 영역이 생성되지만 경계가 흐려지고 왼쪽 영역(빨간색)에서도 모서리가 둥글게 된다. 본 발명에 따른 방법 (b)는 가능한 경우 데이터(왼쪽 영역, 날카로운 경계)에 의해 구동되고 데이터가 더 불확실한 정당화 장치(오른쪽 영역, 반올림 경계)가 계량되도록 한다. (a)에서 각각 다른 분산의 공간 통계를 나타내는 4 개의 영역을 갖는 예시적인 합성 이미지를 사용하여 제안 된 적응 정규화의 효과를 경험적으로 증명한다. 인공 노이즈는 흰색 배경에 추가된다. 왼쪽에는 빨간색 사각형, 가운데에는 녹색 사각형, 오른쪽에는 파란색 사각형이 차례로 늘어난다. 날카로운 경계를 유지하려면 작은 정규화를 수동으로 선택해야 한다. 그러나 일부 데이터의 강도 차이가 크면 영역간에 불규칙한 경계가 생기고 중간 및 오른쪽 직사각형 (d) 전체에 흩어져있는 빨간색과 파란색이 나타나지만 모서리가 날카롭다. 반면에 영역의 동질성을 확보하기 위해서는 대규모 정례화가 필요하며 모서리가 둥글게 된 최종 솔루션 (e), 미세한 경계 결정 (빨간색)을 허용하는 영역의 경우에도 마찬가지이다. 그러나 적응 정규화 (b)에 대한 우리의 접근법은 데이터 용어가 그것을 지원하는 경계가 뚜렷한 솔루션을 발견하고 (적색), 데이터가 더 불확실 할 때 솔루션에 가중치를 적용하게 한다(파란색). 모서리 주변의 해의 기하학적 특성을 강조하기 위해 (b)와 (e)의 표시된 영역에 대한 이미지 확대가 각각 (c)와 (f)에 표시된다. Figure 5 is a qualitative comparative diagram showing the prejudice of the trap of a certain non-adaptive regular machine and the final solution according to an embodiment of the present invention. Image (a) has three regions with sharp edges / edges and various spatial variabilities. Using a small normalization (d) (large λ), the boundaries are made clear but separated by three irregular regions (red, green, and blue), with different labels distributed in the center and right rectangles. Using a large normalization weight (e) (small λ) creates a homogeneous region, but the boundary is blurred and the edges round in the left region (red). The method (b) according to the present invention causes the justification device (right area, rounding boundary), which is driven by data (left area, sharp boundary) and data is more uncertain, to be metered. (a) empirically demonstrates the effect of the proposed adaptive normalization using an exemplary composite image with four regions representing spatial statistics of different variances. Artificial noise is added on a white background. A red rectangle on the left, a green rectangle in the middle, and a blue rectangle on the right. To maintain a sharp boundary, you must manually select a small normalization. However, if the intensity difference of some data is large, irregular boundaries are created between the regions, and the red and blue scattered throughout the middle and right rectangle (d) appear, but the edges are sharp. On the other hand, in order to ensure homogeneity of regions, large-scale regularization is required, and also in the case of the final solution (e) where the edges are rounded, and the regions that allow fine boundary crystals (red). However, our approach to adaptive normalization (b) allows the data term to find a well-defined solution to support it (red) and apply the weight to the solution when the data is more uncertain (blue). In order to emphasize the geometric properties of the solution around the edges, image enlargements for the areas indicated in (b) and (e) are shown in (c) and (f), respectively.

도 6은 본 발명의 일 실시예에 따른 서로 다른 알고리즘을 사용하여 Berkeley 데이터 세트에서 다중 라벨 세분화를 시각적으로 비교한 도면이다. 본 발명에 따른 알고리즘을 기본 모델이 공정한 비교를 위해 조각상의 상수 이미지를 가정하는 기존의 최첨단 기법(FL [57], TV [58], VTV [59], PC [7])과 비교한다. 입력 이미지가 (a)에 표시되고 세그먼테이션 결과가 모든 알고리즘에 동일한 수의 레이블이 적용되는 (b) - (f)에 표시된 도 6의 정성적 평가를 제공한다. 알고리즘의 파라미터는 정확도와 관련하여 최적화되어 있다. μ= 0.5, η= 0.5, α= 0.01, β = 10, τ = 0.5, θ = 1. 본 발명에 따른 방법이 다른 것보다 더 좋은 라벨을 산출하는 반면, 얻어진 결과는 일반적으로 텍스처 또는 조명 변화가있을 때 기본 이미지 모델의 제한으로 인해 일반적으로 불완전한 것처럼 보일 수 있다. 정량적 비교는 표 2에서 다양한 수의 라벨을 사용하여 정밀도와 회수율로 보고된다. Figure 6 is a graphical comparison of multiple label segmentation in a Berkeley data set using different algorithms in accordance with an embodiment of the present invention. The algorithms according to the present invention are compared with existing state-of-the-art techniques (FL [57], TV [58], VTV [59], PC [7]) which assume a constant image of a statue for a fair comparison of the base model. The input image is shown in (a) and the segmentation results provide the qualitative evaluation of Figure 6 shown in (b) - (f) where the same number of labels are applied to all algorithms. The parameters of the algorithm are optimized with respect to accuracy. 0.5,? = 0.5,? = 0.01,? = 10,? = 0.5,? = 1. While the method according to the present invention yields a better label than the other, , It may appear to be generally incomplete due to limitations of the underlying image model. Quantitative comparisons are reported in Table 2 with precision and recovery using a variable number of labels.

[표 2][Table 2]

Figure pat00108
Figure pat00108

특수 하드웨어(예 : 멀티 코어 GPU / CPU) 및 이미지 처리 기술이 없는 481_321_3 컬러 이미지의 기준선으로 계산된 비용(예 : 이미지 피라미드)은 표 3과 같다. Table 3 shows the costs (eg, image pyramid) calculated as the baseline for 481_321_3 color images without special hardware (eg, multicore GPU / CPU) and image processing technology.

[표 3][Table 3]

Figure pat00109
Figure pat00109

이제까지 본 발명에 대하여 그 바람직한 실시예들을 중심으로 살펴보았다. 본 발명이 속하는 기술 분야에서 통상의 지식을 가진 자는 본 발명이 본 발명의 본질적인 특성에서 벗어나지 않는 범위에서 변형된 형태로 구현될 수 있음을 이해할 수 있을 것이다. 그러므로 개시된 실시예들은 한정적인 관점이 아니라 설명적인 관점에서 고려되어야 한다. 본 발명의 범위는 전술한 설명이 아니라 특허청구범위에 나타나 있으며, 그와 동등한 범위 내에 있는 모든 차이점은 본 발명에 포함된 것으로 해석되어야 할 것이다.
The present invention has been described with reference to the preferred embodiments. It will be understood by those skilled in the art that various changes in form and details may be made therein without departing from the spirit and scope of the invention as defined by the appended claims. Therefore, the disclosed embodiments should be considered in an illustrative rather than a restrictive sense. The scope of the present invention is defined by the appended claims rather than by the foregoing description, and all differences within the scope of equivalents thereof should be construed as being included in the present invention.

Claims (11)

영상 처리 장치가 영상을 분할하는 방법에 있어서,
영상을 복수개의 영역으로 분할하는 단계; 및
상기 복수개의 영역 각각에 대해 입력 데이터와 상기 입력 데이터에 대한 추정치간의 잔차(residual)에 기초하여 결정된 데이터 피델리티(fidelity) 함수와 정규화 함수간의 상대적 가중 함수를 각 점(point)에 적용하는 단계;
를 포함하는 영상 분할 방법.
A method for an image processing apparatus to divide an image,
Dividing the image into a plurality of regions; And
Applying to each point a relative weight function between a data fidelity function and a normalization function determined based on a residual between input data and an estimate for the input data for each of the plurality of regions;
And an image segmentation method.
제1항에 있어서,
상기 잔차(
Figure pat00110
)는 아래 수학식으로 산출된 것을 특징으로 하는 영상 분할 방법
[수학식]
Figure pat00111

여기서,
Figure pat00112
는 후버손실함수, f(x)는 입력 데이터,
Figure pat00113
는 각 영역 i의 특성함수, ci는 추정치임.
The method according to claim 1,
The residual (
Figure pat00110
) Is calculated by the following equation
[Mathematical Expression]
Figure pat00111

here,
Figure pat00112
F (x) is the input data,
Figure pat00113
Is a characteristic function of each region i, and c i is an estimate.
제2항에 있어서,
상기 상대적 가중 함수(λ)는 아래 수학식으로 정의되는 것을 특징으로 하는 영상 분할 방법
[수학식]
Figure pat00114

여기서,
Figure pat00115
이고, ρ(u)는 잔차, β는 '0'보다 크고 잔차 ρ(u)의 변화와 관련된 제어 매개 변수, α는 0<α<1이고, 상대적 가중함수(λ)의 희박 정도를 제어하는 상수 매개 변수임.
3. The method of claim 2,
Wherein the relative weighting function (?) Is defined by the following equation
[Mathematical Expression]
Figure pat00114

here,
Figure pat00115
Α is a control parameter related to the change of residual ρ (u), β is greater than 0 and α is 0 <α <1, and the degree of leaning of the relative weighting function (λ) is controlled It is a constant parameter.
제3항에 있어서,
상기 데이터 피델리티 함수(
Figure pat00116
)는 아래 수학식으로 정의되는 것을 특징으로 하는 영상 분할 방법
[수학식]
Figure pat00117

여기서,
Figure pat00118
는 상대적 가중 함수,
Figure pat00119
는 입력데이터와 추정치간의 잔차,
Figure pat00120
는 각 영역 i의 특성함수, Ci는 추정치임.
The method of claim 3,
The data fidelity function (
Figure pat00116
) Is defined by the following equation:
[Mathematical Expression]
Figure pat00117

here,
Figure pat00118
Is a relative weight function,
Figure pat00119
Is the residual between the input data and the estimate,
Figure pat00120
Is a characteristic function of each region i, and Ci is an estimate.
제4항에 있어서,
상기 정규화 함수(
Figure pat00121
)는 아래 수학식으로 정의되는 것을 특징으로 하는 영상 분할 방법
[수학식]
Figure pat00122

여기서,
Figure pat00123
임.
5. The method of claim 4,
The normalization function (
Figure pat00121
) Is defined by the following equation:
[Mathematical Expression]
Figure pat00122

here,
Figure pat00123
being.
제1항에 있어서,
상기 상대적 가중치를 각 점에 적용하는 단계 이후,
상기 복수개의 영역 사이에 상호 배타적 제약 조건(Mutually Exclusive Region Constraint)을 적용하는 단계를 더 포함하는 것을 특징으로 하는 영상 분할 방법.
The method according to claim 1,
After applying the relative weight to each point,
Further comprising applying a mutually exclusive region constraint between the plurality of regions.
제6항에 있어서,
상기 상호 배타적 제약 조건은 아래 수학식으로 정의되는 것을 특징으로 하는 영상 분할 방법
[수학식]
Figure pat00124
이고,
상기 i, j는 분할 영역의 인덱스이고, ui, uj는 분할함수임.
The method according to claim 6,
Wherein the mutually exclusive constraint condition is defined by the following equation:
[Mathematical Expression]
Figure pat00124
ego,
I, j is an index of a partitioned area, and ui and uj are partition functions.
제7항에 있어서,
상기 데이터 피델리티 함수, 정규화 함수, 상대적 가중치 및 상호 배타적 제약 조건을 이용한 에너지 함수를 최적화하는 단계를 더 포함하는 것을 특징으로 하는 영상 분할 방법.
8. The method of claim 7,
Further comprising optimizing an energy function using the data fidelity function, the normalization function, the relative weight, and the mutually exclusive constraint.
제8항에 있어서,
상기 에너지 함수는 아래 수학식으로 정의되는 것을 특징으로 하는 영상 분할 방법
[수학식]
Figure pat00125

여기서, ι는 0보다 큰 상호 배타성 제약 조건에 대한 가중치 매개 변수임.
9. The method of claim 8,
Wherein the energy function is defined by the following equation:
[Mathematical Expression]
Figure pat00125

Where ι is a weight parameter for mutually exclusive constraints greater than zero.
제9항에 있어서,
상기 에너지 함수는 아래 기재된 수학식과 같이 제약받지 않은 확대된 라그랑지안(Lagrangian)으로 단순화되는 것을 특징으로 하는 영상 분할 방법
[수학식]
Figure pat00126

여기서,
Figure pat00127
,r i와 zi는 최소화 될 보조 변수,
Figure pat00128
임.
10. The method of claim 9,
Wherein the energy function is simplified to an unconstrained enlarged Lagrangian as shown in the following equation:
[Mathematical Expression]
Figure pat00126

here,
Figure pat00127
, r i and z i are the auxiliary variables to be minimized,
Figure pat00128
being.
제10항에 있어서,
상기 라그랑지안(Lagrangian)으로 단순화된 최종 에너지 함수는 그래디언트에 기반한 교대 방향 수 기법(ADMM)을 이용하여 최적화되는 것을 특징으로 하는 영상 분할 방법.

11. The method of claim 10,
Wherein the final energy function simplified to Lagrangian is optimized using a gradient-based alternating-direction-number technique (ADMM).

KR1020180004000A 2018-01-11 2018-01-11 Image Segmentation Method KR102007340B1 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020180004000A KR102007340B1 (en) 2018-01-11 2018-01-11 Image Segmentation Method

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020180004000A KR102007340B1 (en) 2018-01-11 2018-01-11 Image Segmentation Method

Publications (2)

Publication Number Publication Date
KR20190085756A true KR20190085756A (en) 2019-07-19
KR102007340B1 KR102007340B1 (en) 2019-08-06

Family

ID=67511962

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020180004000A KR102007340B1 (en) 2018-01-11 2018-01-11 Image Segmentation Method

Country Status (1)

Country Link
KR (1) KR102007340B1 (en)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112379348A (en) * 2020-11-17 2021-02-19 安徽四创电子股份有限公司 Multi-model estimation target maneuvering identification method based on Kalman filtering

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20150030231A1 (en) * 2013-07-23 2015-01-29 Mitsubishi Electric Research Laboratories, Inc. Method for Data Segmentation using Laplacian Graphs
KR101524944B1 (en) * 2013-11-27 2015-06-02 중앙대학교 산학협력단 Multi-region image segmentation method and apparatus
US20160225169A1 (en) * 2013-09-30 2016-08-04 Koninklijke Philips N.V. Method for local adjustment of regularization parameters for image quality optimization in fully 3d iterative ct reconstruction

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20150030231A1 (en) * 2013-07-23 2015-01-29 Mitsubishi Electric Research Laboratories, Inc. Method for Data Segmentation using Laplacian Graphs
US20160225169A1 (en) * 2013-09-30 2016-08-04 Koninklijke Philips N.V. Method for local adjustment of regularization parameters for image quality optimization in fully 3d iterative ct reconstruction
KR101524944B1 (en) * 2013-11-27 2015-06-02 중앙대학교 산학협력단 Multi-region image segmentation method and apparatus

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112379348A (en) * 2020-11-17 2021-02-19 安徽四创电子股份有限公司 Multi-model estimation target maneuvering identification method based on Kalman filtering
CN112379348B (en) * 2020-11-17 2024-04-09 安徽四创电子股份有限公司 Multi-model estimation target maneuvering recognition method based on Kalman filtering

Also Published As

Publication number Publication date
KR102007340B1 (en) 2019-08-06

Similar Documents

Publication Publication Date Title
De los Reyes et al. Bilevel parameter learning for higher-order total variation regularisation models
Gong et al. Weighted mean curvature
US10719937B2 (en) Automated detection and trimming of an ambiguous contour of a document in an image
Falcao et al. A 3D generalization of user-steered live-wire segmentation
US7502499B2 (en) System and method for filtering noise from a medical image
Wang et al. A cascaded approach for feature-preserving surface mesh denoising
JP4780106B2 (en) Information processing apparatus and information processing method, image processing apparatus and image processing method, and computer program
Provenzi et al. A wavelet perspective on variational perceptually-inspired color enhancement
Banić et al. Smart light random memory sprays Retinex: a fast Retinex implementation for high-quality brightness adjustment and color correction
Zhao et al. Gradient entropy metric and p-Laplace diffusion constraint-based algorithm for noisy multispectral image fusion
US10210636B2 (en) Automatic snap for digital sketch inking
Wei et al. Tfpnp: Tuning-free plug-and-play proximal algorithms with applications to inverse imaging problems
Chouhan et al. Enhancement of low-contrast images by internal noise-induced Fourier coefficient rooting
Zheng et al. Truncated low-rank and total p variation constrained color image completion and its moreau approximation algorithm
Wang et al. Total generalized variation-based Retinex image decomposition
Bui et al. A weighted difference of anisotropic and isotropic total variation for relaxed Mumford--Shah color and multiphase image segmentation
De los Reyes et al. Bilevel optimization methods in imaging
Gonzales et al. Fast Retinex for color image enhancement: methods and algorithms
Chavarín et al. Contrast enhancement in images by homomorphic filtering and cluster-chaotic optimization
KR20190085756A (en) Image Segmentation Method
Amstutz et al. Minimal partitions and image classification using a gradient-free perimeter approximation
Cyriac et al. A tone mapping operator based on neural and psychophysical models of visual perception
Zhuang et al. Image enhancement using divide-and-conquer strategy
Gong et al. Image filtering with generic geometric prior
Scharr et al. Accurate optical flow in noisy image sequences using flow adapted anisotropic diffusion

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant