KR20010043717A - 이미지 인식 및 상관 시스템 - Google Patents

이미지 인식 및 상관 시스템 Download PDF

Info

Publication number
KR20010043717A
KR20010043717A KR1020007012970A KR20007012970A KR20010043717A KR 20010043717 A KR20010043717 A KR 20010043717A KR 1020007012970 A KR1020007012970 A KR 1020007012970A KR 20007012970 A KR20007012970 A KR 20007012970A KR 20010043717 A KR20010043717 A KR 20010043717A
Authority
KR
South Korea
Prior art keywords
pixel
pixels
reference image
optimal
correlation
Prior art date
Application number
KR1020007012970A
Other languages
English (en)
Inventor
스와미 매닉캄
스코트 로쓰
토마스 부쉬맨
Original Assignee
데이터큐브, 인코포레이티드
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 데이터큐브, 인코포레이티드 filed Critical 데이터큐브, 인코포레이티드
Publication of KR20010043717A publication Critical patent/KR20010043717A/ko

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/74Image or video pattern matching; Proximity measures in feature spaces
    • G06V10/75Organisation of the matching processes, e.g. simultaneous or sequential comparisons of image or video features; Coarse-fine approaches, e.g. multi-scale approaches; using context analysis; Selection of dictionaries
    • G06V10/751Comparing pixel values or logical combinations thereof, or feature values having positional relevance, e.g. template matching
    • G06V10/7515Shifting the patterns to accommodate for positional errors
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/24Character recognition characterised by the processing or recognition method
    • G06V30/248Character recognition characterised by the processing or recognition method involving plural approaches, e.g. verification by template match; Resolving confusion among similar patterns, e.g. "O" versus "Q"
    • G06V30/2504Coarse or fine approaches, e.g. resolution of ambiguities or multiscale approaches

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • General Physics & Mathematics (AREA)
  • Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Evolutionary Computation (AREA)
  • Artificial Intelligence (AREA)
  • Databases & Information Systems (AREA)
  • Health & Medical Sciences (AREA)
  • Computing Systems (AREA)
  • General Health & Medical Sciences (AREA)
  • Medical Informatics (AREA)
  • Software Systems (AREA)
  • Evolutionary Biology (AREA)
  • General Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Image Analysis (AREA)

Abstract

상관관계 계산에 사용되는 화소 수를 줄이기 위하여 예비 상관관계와 이미지 피라미드를 결합한 디지털 이미지 인식 시스템은 기준 이미지 템플릿(100)의 모든 화소들 전체와의 상관관계를 구하지 않고도 기준 이미지 템플릿(100)을 효과적으로 인식할 수 있도록 한다. 최적의 예비 화소 세트(112)는 검색될 검색 이미지 신(102)에 대한 기준 이미지 템플릿(100)의 상관관계에 따라 기준 이미지 템플릿(100)의 화소들로부터 선택된다. 이러한 예비 화소 세트(112)는 기준 이미지 템플릿(100)의 상관관계에 민감한 특성들을 정의하기에 최적인 화소들을 포함한다. 최적의 지점에서 예비 화소들을 누적함으로써 인식의 정확성을 해하지 않으면서 성능은 최대화된다. 최종적인 최적의 예비 화소 세트는 검색 이미지 신(102) 중에서 기준 이미지 템플릿(100)과 매칭되는 것을 찾기 위한 일련의 변환들을 통한 검색 이미지 신의 화소들에 대한 상관 관계이다.

Description

이미지 인식 및 상관 시스템 {IMAGE RECOGNITION AND CORRELATION SYSTEM}
알려진대로 디지탈 이미지 인식 시스템은 더 큰 디지탈 검색 이미지 신(scene) 내에 있는 디지털 기준 이미지 템플릿의 위치를 지정하는 것이다. 본 발명에서 이러한 디지탈 이미지는 매트릭스 형태의 일련의 화소들로 구성되는데, 각 화소는 외관상보이는 그레이스케일값에 의해 표시된다. 디지털 기준 이미지 템플릿과 디지털 검색 이미지 신의 상대적 위치와 관련된 그레이스케일 값을 비교함으로 매칭을 수행한다. 디지털 검색 이미지 신에서 디지털 기준 이미지 템플릿과 같거나 비슷한 패턴이 찾아질 때 매칭이 된 것이다.
이러한 시스템은 보통 여러가지 생산용 로봇 설비에 이용되는 컴퓨터에 장착된다. 예를들면, 반도체 웨이퍼 취급 작업, 인쇄 회로 기판(PCB) 조립 작업에서 집어올렸다 놓는 기준점 인식, 트레이, 빠레트, 컨베이어 밸트 등에 물체를 올려 놓는 것을 보조하기 위한 시스템 제어나 정량화를 위한 기계 시야(machine vision), 또한 정렬작업에서의 기준마크 처럼 검사작업에 사용되는 프린트 물질의 자동 인식 등과 같은 자동화 작업에 이용될 수 있다. 디지탈 이미지를 표시하는 화소 매트릭스는 일반적으로 카티시안 좌표계(cartesian coordinate)나 육각형, 다이아몬드형 화소 같은 비직각 화소계에 배열된다. 인식 방식은 보통 검색된 기준 이미지 템플릿과 비교해 검색 이미지 신을 화소 단위로 스캔할 필요가 있다. 더욱이, 기존의 검색 기술은 검색 이미지 신 내에서 기준 이미지 템플릿을 회전 또는 스케일링 조정과 같은 변환을 허용하는데, 그러한 변환에 적용하기 위한 인식방법이 필요하다.
그런 인식 방법은 일반적으로 이미지를 화소 단위로 스캔하여, 기준 이미지 템플릿을 일련의 변환을 수행하기 때문에 계산과정에 관련된 화소가나 요소(elements)의 개수는 지수적으로 증가한다. 이런 정량화는 보통 O(nx)로 표시하는데, 여기서 x는 요소의 개수에 따라 증가하는 피연산 숫자의 제곱이다. 예를들어, 정렬 방식을 보면 매번 리스트에 있는 다른 모든 값들과 비교하고 반복적으로 리스트를 정렬하므로 O(n2) 이 될 것이다. 즉, 4개 요소를 정렬하려면 16번의 비교연산이 필요하고, 10개 요소의 경우 102즉, 100 번의 비교연산을 해야한다.
디지털 이미지 인식 방법은 검색 이미지 신의 모든 화소들에 대하여 기준 이미지 템플릿의 모든 화소들을 스캐닝하여야하므로, O(nx) 의 연산에서 보듯 피연산자의 개수는 중요한 의미가 있다. 또, 회전이나 스케일링 조정과 같은 변환은 각 화소별로 반복적으로 스캐닝하여야 하므로 O(nx)는 더욱 증가된다. 화소수가 증가할수록 해상도가 높아지고 시각적 이미지의 품질이 향상되기 때문에 화소 수를 많게 하는 것은 바람직하다.
코그넥스 코퍼레이션(Cognex Corporation)에 의해 출원되어 미국 특허 제 5,602,937호 에 개시된 "고선명 기계 시야 검색 방법 및 장치(Methods and Apparatus for Machine Vision High Accuracy Searching)"에서와 같이, 표준화된 그레이스케일 상관관계(NGC)는 디지털 이미지를 신뢰성 있고 정확하게 매치시키고 있다. 그러나 종래의 NGC는 그레이스케일에서 선형적 변화를 찾아내는 것에는 효과적이지만, 디지털 이미지의 다른 관점에서의 변화 즉 회전이나 스캐일, 원근감, 왜곡, 초점의 흐려짐 및 전례없는 그레이스케일의 변화와 같은 부분에서는 유연성이 거의 없다. 또한 NGC는 기준 이미지 템플릿에 있는 각각의 화소들이 검색 이미지 신에 있는 각각의 화소과 상관관계를 맺어야 하므로 O(n4)과 유사하게 되어 산술적으로 매우 고가이다.
다음은 상관관계 이미지 매칭에 대한 일반식이다. t(x,y) (1 ≤ x ≤ Xt, 1 ≤ y ≤ Yt)를 신 si(x,y) 내에 있는 사각 템플릿(신보다 작은)이라 하자. 신 si(x,y)의 N 세트(1 ≤ i ≤ N) 변환에 대한상관관계 R(i)는 다음과 같이 표시된다.
R(i) = f(t(x,y), si(x,y))
여기서 신 si(x,y)는 s(x,y)의 이동, 회전, 스케일링,또는 그밖의 다른 변환이 될 수 있고, f()는 상관관계 함수 표시이다. 템플릿 매칭에서 가장 흔한 변환은 x,y 방향이나 좌표축에 따른 이동이다. 이 경우에 대칭 검색 영역 -U ≤ u ≤ U , -V ≤ v ≤ V 의 대치식 s( x + u, y + v ) 는 N = (2U + 1) * (2V +1 ) 변환식 si(x,y), 1 ≤ i ≤ N 에 대응된다.
1초당 더 많은 화소를 처리하기 위하여 파이프라인 이미지 처리를 채용하는 속도가 더 빠른 하드웨어, RISC 프로세서, 속도가 더 빠른 메모리 사용 등 종래 NGC의 속도를 높이기 위한 다양한 방법이 사용되어 왔다. 그러나 이러한 마력 구동 방법도 NGC의 계산적 매트릭 O(n4)을 바꾸지는 못했다.
그레이스케일 상관관계의 계산적 매트릭을 감소시키기 위한 또다른 방식은 이미지 피라미드를 사용하는 것이다. 이미지 피라미드는 시퀀스의 각 레벨에서 화소의 밀도(즉, 해상도)가 다른 일련의 디지털 이미지의 복사본을 여러개 저장한다. 이 접근방식에서는, 피라미드의 최상위에서 대략 비슷한 것을 찾고, 힐 클라임 방법이 이미지 피라미드의 연속된 레벨을 지그재그로 처리하는데 사용된다. 이 방식은 상관관계에서 사용되는 화소의 수를 상당히 감소시킨다. 대략적 매칭에 대한 성능 향상에서는 효과적인 반면, 이러한 방식은 여전히 검색 이미지 신에 있는 모든 화소에 대해 기준 이미지 템플릿의 모든 화소를 포함하여야만 한다.
또다른 방법은 예비 상관관계이다. 종래의 NGC 방법이 기준 이미지 템플릿의 모든 화소들에 대하여 상관관계를 적용하는 반면, 예비 상관관계에서는 이 화소들의 서브세트를 선택한다. 각 상관관계 함수는 f()는 x,y 축에 대한 합계를 통합한다. 종래의 상관관계에 대하여 N 상관관계의 합계는 철저하게 전체 템플릿에 대해 수행된다. 즉,
그러나 , 예비 상관관계에 있어서, 합계는 모든 기준 이미지 템플릿의 화소들의 전체 세트에 대해 계산되는 것이 아니라 미리 정의된 K개의 화소 세트인 P = {(x1,y1),(x2,y2), ..., (xk,yk)}에 대해서만 계산된다.
K는 템플릿 내의 전체 화소 수에 비해 훨씬 적기 때문에, 이 방법은 계산의 코스트를 상당히 절감시킨다.
서브세트를 선택하기 위한 몇가지 방법들이 사용되어 왔는데, 한칸 건너 한칸씩 화소를 건너 띄거나 무작위로 화소를 고르는 것 등이 그것이다. 그러나 이러한 접근 방식들은 상관관계의 유효성과 결과적인 매칭 정확도를 상당히 저하시켰다.
포인트 상관관계라 불리는 예비 상관관계의 한 버전이 1994년 크래튼할러 등(Krattenhaler et al.)에 의해 제안되었는데, 여기서 매칭은 기준 이미지 템플릿의 미리 계산된 예비 포인트 세트를 이용해 수행된다. 이 방법에서는, 밀접한 상관관계가 있는 화소 세트가 선택되는데, 이 때 만약 한 화소의 템플릿 매칭에 대한 영향이 다른 화소들의 상관관계값에 비해 높다면 그 템플릿의 화소는 포인트 상관관계에 대해 상당히 적합하다고 간주된다. 밀접한 상관관계가 있는 이 화소 세트는 템플릿이 미리 결정된 가능한 조합을 통해 이동, 회전, 스케일 조정되는 학습 세션동안에 선택된다.
이러한 학습 과정은 대략 다음과 같다. 무작위로 선택한, 바람직하게는 모서리 부분에서 한쌍의 포인트를 선택함으로써 초기 포인트 M과 포인트 세트 PM을 계산한다. 초기 PL은 PM과 같게 하고, PL을 만들기 위해 기준 이미지 템플릿에 있는 화소를 가지고 반복 계산한다:
- L 포인트로 구성된 예비 포인트 세트 PL이 이미 계산되어 있다고 가정하자. 다음과 같은 방법으로 새로운 예비 포인트 세트 PL+1을 찾는다:
1. 템플릿에 있는 각 포인트 Xj=(xi, yi)에 대해 (이때 Xj PL이다)
- PL Xj조건을 만족하는 포인트 상관관계를 이용하여, 1 ≤ i≤ N을 만족하는 모든 변환 i에 대하여 상관관계 결과값 Rj(i)를 계산한다.
- 포인트 Xj의 품질을 결정하는상관관계 결과값 Rj(i)의 상관관계 측정값 Cmj를 계산한다.
2. 상관관계 측정값 Cmj이 극한값인 예비 포인트 세트 PL+1의 새 요소가 될 포인트Xj를 선택한다.
이러한 학습 프로시듀어는 연속된 검색의 성능을 향상시키는 반면 계산상으로는 고가이다. 가능성 있는 조합(회전, 스케일 조정 및 기타) O(n)이 주어지면, 단계 1에서 N 은 O(n3) 가 될 것이다. 만일 템플릿 화소의 수가 O(n2)라면, 단계 1은 O(n5)의 계산이 필요할 것이다. n개의 화소를 선택하기 위해서 필요한 계산의 횟수는 다음과 같다:
(1 + 2 + 3 + ... + n ) * O(n5), 이것은 O(n7)이 된다.
그러므로, O(n2) 화소를 선택하기 위해서는 계산의 복잡도는 O(n8)이 될 것이다.
그러나, O(n8)는 현대의 프로세서 성능의 위력에도 불구하고 많은 수의 화소로 이루어진 고해상도 이미지에 대해서는 현실적으로 실현 불가능하다. 따라서 최적의 밀접한 상관관계의 예비 화소 세트를 결정하는 것이 바람직하다. 만약 선택된 예비 화소 세트가 너무 적다면, 정확성은 떨어질 것이다. 반대로, 민감한 상관관계의 화소 수가 지나치게 많다면 성능이 떨어지게 된다. 한가지 방법은 단순하게 예비 포인트 세트에 고정된 수의 포인트를 누적하는 것이지만, 이러한 방법은 다양한 기준 이미지 템플릿과 검색 이미지 신의 조합에 적용될 수 없다.
따라서, 회전, 스케일 조정, 원근감, 밝기, 초점 등의 변화에 유연하고, 이미지 처리 전용 하드웨어 없이 소프트웨어에 장착될 수 있을만큼 충분히 빠르면서, 종래 철저한 NGC에 필적하는 정확도를 유지하는 그레이스케일 상관관계 매칭에 대한 최적의 예비 화소 세트를 계산하기 위한 새로운 방법을 개발하는 것이 좋을 것이다.
본 발명은 이미지 인식 및 상관 시스템에 관한 것으로, 1998년 5월 18일에 출원되고 발명의 명칭이 VS 검색 툴인 미국특허출원 제 60/085,862 호에 대한 35 U.S.C. 119(e) 하의 우선권을 주장한다.
도 1a는 다수의 수직 모서리들을 갖는 기준 이미지 템플릿을 도시하고;
도 1b는 다수의 수평 및 수직 모서리들을 갖는 기준 이미지 템플릿을 도시하며;
도 2a는 검색 이미지 신 내의 기준 이미지 템플릿을 도시하고;
도 2b는 검색 이미지 신 내에서 회전되고 스케일 조정된 기준 템플릿 이미지를 도시하며;
도 3은 본 발명의 데이터 구조의 블록 다이어그램을 도시하고;
도 4는 이미지 피라미드를 도시하며; 및
도 5는 디지털 이미지 패턴 매칭 툴의 순서도 및 이에 따른 방법을 도시한다.
상관관계 계산에 사용되는 화소 수를 줄이기 위하여 예비 상관관계와 이미지 피라미드를 결합한 디지털 이미지 인식 시스템은 기준 이미지 템플릿의 모든 화소들 전체와의 상관관계를 구하지 않고도 기준 이미지 템플릿을 효과적으로 인식할 수 있도록 한다. 최적의 예비 화소 세트는 검색될 검색 이미지 신에 대한 기준 이미지 템플릿의 상관관계에 따라 기준 이미지 템플릿의 화소들로부터 선택된다. 이러한 예비 화소 세트는 기준 이미지 템플릿과 밀접한 상관관계를 갖는 특성들을 정의하기에 최적인 화소들을 포함한다. 최적의 지점에서 예비 화소들을 누적함으로써 인식의 정확성을 해하지 않으면서 성능은 최대화된다.
실행에 있어서, 최종적인 최적의 예비 화소 세트는 검색 이미지 신 또는 프레임 그래버 및 카메라를 통해 포착되거나 또는 기록 가능한 매체로부터 로딩된 이미지 신 중에서 기준 이미지 템플릿과 매칭되는 것을 찾기 위한 일련의 변환들을 통하여 얻어진 검색 이미지 신의 화소들에 대한 상관관계이다.
찾아진 이미지를 나타내는 기준 이미지 템플릿과 찾아질 범위를 나타내는 검색 이미지 신은 디지털 이미지를 그레이스케일로 화소화하여 작성된다. 검색될 검색 이미지 신과 기준 이미지 템플릿 양자의 이미지 피라미드는 상관관계 프로세스에 사용되기 위하여 작성된다. 다음으로, 검색 이미지 신은 최적 예비 화소 세트를 생성하기 위한 학습 절차에서 기준 이미지 템플릿의 화소들의 서브세트와 관련된다. 학습 순서 동안 기준 이미지 템플릿은 이동되고, 회전되고, 스케일 조정되고, 왜곡(원근 변형)되어 지정된 검색 이미지 신 자체, 대상물들 및 배경과 구별된다. 학습 순서의 마지막 단계에서, 기준 이미지 템플릿은 임의의 변형된(이동, 회전, 스케일 및 원근 왜곡된) 검색 이미지 신 자체, 대상물들 및 배경으로부터 기준 이미지 템플릿을 구별할 수 있는 최적의 예비 화소 세트와 결합된다.
초기 예비 화소 세트는 기준 이미지 템플릿의 몇 개의 화소들을 선택함으로써 결정되어 최적 화소 누적 세트에 저장된다. 다음으로, 지금까지 누적된 최적 화소 누적 세트에 의해 표시된 기준 이미지 템플릿은 높은 값을 결정하도록 검색 이미지 신에 대한 상관 관계를 구한다. 검색 이미지의 각 위치에서, 기준 이미지 템플릿은 회전 및 스케일 조정을 통해 극한값을 갖도록 변환된다. 이러한 위치 및 변환에서, 아직 최적 화소 누적 세트가 아닌 기준 템플릿 화소들은 최적 화소 누적 세트에 추가되기 위한 다음 최적 화소가 될 때 테스트된다. 시험 가능한 최적 누적 세트 각각은 극한값을 갖도록 변환된 후에 검색 이미지 신에 대한 상관 관계를 구한다. 논리는 적은 양에 대한 시험적인 최적 화소 누적 세트를 회전 및 스케일링함으로써 선택된 화소가 모서리에 근접하거나 또는 모서리에 위치하는 것을 피하기 위해 사용된다. 예비 최적 화소는 최적 화소 누적 세트에 포함된 화소들 중 이전에 계산된 극한값으로부터 최고의 감소율을 갖는 화소로 정의된다. 이러한 예비 최적 화소는 최적 화소 누적 세트에 추가된다. 최적 화소 누적 세트의 생성은 관찰된 극한값의 이동평균이 뚜렷한 상승 특성을 나타내면 종료한다.
이러한 학습 과정에서 얻어진 최적 예비 화소 세트는 검색 이미지 신에 기준 이미지 템플릿이 필적하도록 전체 검색 이미지 신에 대한 상관 관계를 구하는데 사용된다. 최적의 예비 화소 세트는 원래 기준 이미지 템플릿보다 아주 적은 수의 포인트들을 포함하기 때문에 상관값의 계산에는 아주 적은 수의 화소들만 고려하면 된다.
기준 이미지 템플릿과 검색 이미지 신을 상관시키기 위하여 검색 이미지 신과 기준 이미지 템플릿의 이미지 피라미드가 생성된다. 전체적인 검색은 기준 이미지 템플릿 피라미드의 최상위 레벨에 대한 최적 예비 화소 세트를 사용하여 검색 이미지 신의 최상위 피라미드 데이터 범위 내에서 행해진다. 전체적인 검색은 모든 가능한 변환, 회전 및 스케일 범위에 대한 증가 단계를 포함한다. 각 위치, 회전 및 스케일 변환에 대하여, 가장 높은 상관값이 유지된다. 전체 검색의 마지막에, 모든 상관값들은 내림차순으로 정렬된다. 힐 클라임 방법이 위치, 회전 및 스케일의 최상위값으로부터 시작하여 사용되고 피라미드 레벨들에 대하여 연속적으로 적용된다. 피라미드의 최대 해상도 레벨에서, 정확성을 높이기 위해 선택된 추가의 예비 화소들은 기준 이미지 템플릿으로부터 최적 예비 화소 세트에 추가되고, 제 2 힐 클라임 동작이 서브-화소 공간에서 수행된다. 계산된 값이 사용자가 정의한 최대 해상도값보다 크다면, 매칭된 값이 찾아진 것으로 결론짓는다. 그렇지 않다면, 피라미드의 최상위에서 전체 검색으로부터 차선의 변환이 수행된다.
본 발명에 따른 디지털 이미지 매칭은 그레이스케일 및 상대적인 위치에 있어서 유사한 패턴을 찾기 위하여 검색 이미지 신의 화소들에 대하여 기준 템플릿 이미지의 화소들을 매칭시키는 패턴을 포함한다. 주어진 화소에서 이들 두 이미지들의 상관관계는 매칭 정도를 가리키는 0.0과 1.0 사이의 상관값을 생성하는데, 여기서 1.0은 완전히 일치하는 것을 의미한다. 찾아질 기준 템플릿 이미지는 이동되거나, 회전되거나, 스케일이 조정되거나, 원근이 왜곡될 수 있고, 만약 그렇지 않으면 검색 이미지 신으로 변환되는데, 이러한 상관관계는 정확히 인식되었더라도 1.0값을 가질 수는 없다. 기준 이미지 템플릿의 명백한 특징은 일치될 수 있는 후보로써의 템플릿의 강도를 가리키도록 하는 것이다. 확실한 특성은 인식의 정확도가 높은 경향이 있다는 것이다. 도 1a를 참조하면, 다수의 수직 모서리들을 갖지만 수평 모서리는 거의 없는 부적당한 템플릿(100)이 도시되어 있다. 이 템플릿은 수직 방향보다는 수평 방향에서 높은 정확도로 찾을 수 있을 것이다. 반대로, 도 1b는 다수의 직교하는 모서리들을 갖는 적당한 템플릿을 도시하는데, 그에 따라 양 방향으로 높은 정확성을 제공할 것이다.
도 2a를 참조하면, 기준 이미지 템플릿(14)과 검색 이미지 신(15)이 도시되어 있다. 상부 빗금 부분(16)은 하부(18)와 그레이스케일이 다르다. 기준 이미지 템플릿(14)으로 검색 이미지 신(15)을 검색하는 것은 검색 이미지 신(15)의 각 화소들을 스캐닝하여, 상관값을 결정하기 위하여 각 화소에 기준 이미지 템플릿과의 상관관계를 적용하는 것을 포함한다. 본 실시예에서, 매칭 이미지(24)는 점선 20 과 22에 의해 정의된 화소에서 찾아졌는데, 그 이유는 이 지점이 극대의 상관값을 갖기 때문이다.
도 2b를 참조하면, 유사한 매칭 동작이 회전되고 스케일 조정된 이미지(26)에 대하여 개시된다. 도 2a에서와 같이, 검색 이미지 신(26)이 기준 이미지 템플릿에 대하여 화소 단위로 스캐닝된다. 상기 설명한 바와 같이, 각 화소에 적용된 상관관계는 회전되고 스케일이 조정된 기준 이미지 템플릿과의 상관관계이다. 매칭 이미지(27)는 스케일을 두 배로 조정함으로써 스케일링된 이미지(30)를 얻은 후 θ만큼 회전시킨 이미지(32)를 얻으므로써 점선 34와 36에 의해 표시된 화소에서 찾을 수 있다.
도 3은 본 발명에 따른 주요 데이터 구조의 블록 다이어그램을 도시한다. 찾아질 이미지의 기준 이미지 템플릿은 100이고, 검색될 검색 이미지 신은 102이다. 104와 106으로 각각 표시된 기준 이미지 템플릿과 목표 이미지 신은 상관관계에 사용하기 위하여 이미지 피라미드 표현으로 변환된다.
종래에 알려져 있는 이미지 피라미드가 도 4에 도시되어 있다. 상기 지적한 바와 같이, 이미지 피라미드는 각 레벨마다 해상도가 감소하는데, 바닥에서 최대 화소 해상도로 시작하고 각 연속적인 레벨마다 해상도가 감소한다. 세부 묘사는 피라미드의 각 레벨마다 소멸된다. 높은 피라미드는 상부에 화소의 수가 거의 없고, 성능이 향상되는 반면, 세부묘사는 피라미드의 각 레벨에서 불명료하게 된다. 따라서, 큰 특징들을 갖는 커다란 이미지들은 중요한 세부 묘사를 포함하는 이미지들에 비하여 피라미드의 상위에 존재할 수 있다. 최저 레벨이 모든 화소들을 자세히 묘사하므로 피라미드의 높이는 검색의 정확성에 영향을 주지 않는다. 일반적인 피라미드의 높이는 4단이고, 이는 기준 이미지 템플릿과 검색 이미지 신의 품질에 따라 변경한다.
초기 예비 화소 세트는 108에서 만들어져, 기준 이미지 피라미드(104)와 이하에 상세히 설명될 목표 이미지 피라미드(106)의 상관관계에 의해 화소 상관 결과(110)를 계산하는데 사용된다. 템플릿 상관 결과를 계산하는 동안, 최적 예비 화소 세트는 112에 누적된다. 전체 기준 이미지 템플릿이 종래 상관관계에 사용되는데 비하여 최적 예비 화소 세트는 검색 상관 결과(114)를 계산하기 위하여 목표 이미지 피라미드(106)와의 그레이스케일 상관관계를 표준화하기 위하여 사용되는데, 여기서 극한 상관 결과는 검색 이미지 신 내에서 기준 이미지 템플릿의 포지션, 회전 및 스케일을 가리킨다.
도 5를 더욱 상세히 참조하면, 검색 이미지 신 내에 기준 이미지 템플릿을 찾는 단계들의 순서도가 도시되어 있다. 상기 지시된 바와 같이, 이미지 검색에는 두 개의 절차가 있다. 첫 번째 절차는 최적 예비 화소 세트를 계산하는데 사용되는 학습 절차이다. 두 번째 절차는 검색 이미지 신에서 기준 이미지 템플릿을 찾기 위하여 최적 예비 화소 세트로 매칭시키는 매칭 절차이다. 학습 및 매칭 절차가 이하에 설명될 것이다.
단계 200에서, 디스크로부터 로딩하거나 커다란 검색 이미지 신의 일부분을 발췌함으로써 기준 이미지 템플릿의 화소화된 그레이스케일 디지털 이미지가 작성된다. 단계 202에서, 검색될 검색 이미지 신의 화소화된 그레이스케일 디지털 이미지는 프레임 그래버 및 카메라를 통해 신의 이미지를 얻거나 디스크로부터 로딩함으로서 작성된다. 기준 이미지 템플릿의 화소화된 그레이스케일 디지털 이미지는 단계 204에서 이미지 피라미드 형태로 변환된다. 최대 피라미드 레벨의 수(206)는 사용자가 입력하거나 디폴트값에 의해 임의로 선택될 수 있다. 적당한 피라미드 레벨은 화소화된 그레이스케일 디지털 이미지의 화소수와 입도(粒度)에 의해 자동적으로 결정된다. 유사한 피라미드가 단계 208에서 검색 신 이미지를 나타내도록 생성된다. 기준 이미지 템플릿과 검색 이미지 신 둘 모두의 이미지 피라미드는 상위 레벨에서의 빠른 처리를 위해 상세 묘사를 생략하였지만, 하위 레벨에서는 상세 묘사를 그대로 유지함으로써, 정확성을 손상시키지 않고 성능을 향상시킨다.
단계 210에서, 학습 순서는 기준 이미지 템플릿을 정의하는 최적 예비 화소 세트를 결정하기 시작한다. 초기 예비 화소 세트 PM은 기준 이미지 템플릿으로부터 3개의 화소를 선택함으로써 결정된다(212). 최대 그레이스케일과 최소 그레이스케일을 나타내는 화소들이 선택되고, 마찬가지로 기준 이미지 템플릿의 정중앙의 화소가 선택된다. 한편, 다른 방법이 초기 최적 예비 화소 세트를 선택하기 위하여 사용될 수 있는데, 둘 또는 세 개의 임의의 포인트를 선택하는 것이다. 이러한 초기 최적 예비 화소 세트 PM은 최적 화소 누적 세트 PL를 초기화하는데 사용되고(224), 최적 화소 누적 세트 PL은 기준 이미지 템플릿의 상관관계에 민감한 특성들을 정의함으로써 최적이 되도록 찾아진 화소들을 누적하는데 사용될 것이다.
L개의 점으로 구성된 최적 화소 누적 세트 PL이 생성되었다. 여기서 L=3이다. 새로운 최적 화소 누적 세트 PL+1은 템플릿 상관 결과를 계산하기 위하여 검색 신 이미지의 각 위치에서 기준 이미지 템플릿의 일련의 변환을 반복함으로써 찾아진다(도 3, 110). 검색 이미지 신의 범위는 이러한 상관 검색으로부터 생략되는데, 예를 들면 기준 이미지 템플릿이 검색 신 이미지로부터 실제로 복사된 것이라면, 그에 따라 잘못된 상관 매칭을 촉발하게 될 것이다.
최적 예비 화소 세트를 생성하기 위하여, 최적 화소 누적 세트에 지금까지 저장된 화소들은 일정한 한계내에서 평행이동, 회전 및 스케일 조정의 모든 변환들에 의해 검색 이미지 신의 각 화소들과의 상관관계가 계산된다. 각 증가의 반복(226)은 스케일값의 범위 내에서 수행되고, 특정한 응용에 맞도록 변경될 수 있다. 각 스케일 반복동안, 기준 이미지 변환은 일련의 각도 증가, 일반적으로 0-360, 를 통해 추가로 회전된다(228). 각도 증가는 상관관계가 높게 나타나도록 선택될 수 있다.
초기 최적 화소 누적 세트에서 시작하여, 상관 결과 Rj(i)는 1≤i≤N를 만족하는 i에 대하여 모든 변환을 계산하고(230), 검색 이미지 신 I(x, y) 내의 최적 화소 누적 세트 PL에 의해 나타내진 바와 같은 템플릿 T(x, y)와의 포인트 상관관계를 사용한다(232):
R(i)=f(T(x, y), I(x, y))
양의 최대 오류 상관값을 계산하여 알아낸다(233). 위치(x,y), 회전, 스케일 및 화소 상관 결과(110)로서의 상관값을 저장한다(234).
Xj PL을 만족하는 기준 이미지 템플릿(236)의 각 화소 Xj=(xi, yi), 즉 최적 화소 누적 세트 PL에 아직 포함되지 않은 각 화소에 대하여 포인트 상관관계를 사용하여 화소 세트 T(x, y)= PL Xj와의 상관값을 계산한다(238). 여기서, 화소 세트 T(x, y)= PL Xj는 단계 234에서 구한 화소 상관관계 결과(110)를 사용하여 양의 최대 오류 예를 가진 검색 이미지 신 I(x, y)에서 그 단계에서 저장된 회전 및 스케일로 변환된 것이다. 다음과 같이 표시되는 중간(intermediate)값을 저장한다:
R(i)=f(T(x,y),I(x,y))
단계 230에서 사용된 회전 증가분의 ±반과 스케일 증가분의 약 반 범위 내에서 포인트 상관관계와 회전되고 스케일 조정되어 적당하게 변형된 화소들을 사용하여 상관관계를 구한다(239). 최저 상관값을 기록한다.
이제 이 후보 화소가 최적 화소 누적 세트 PL에 포함될 것인지를 결정하기 위하여 후보 화소를 테스트한다. 다음 수식을 사용하여 측정될 최상의 상관값을 계산하고(234): 최상의 상관값 = 최대 양의 오류값(232) - 중간값(238) + 최저값(239), 가장 큰 최상의 상관값을 기록한다(241). 가장 큰 최상의 상관값(242)이 얻어진 후보 화소는 최적 화소 누적 세트 PL+1에 저장된다(244). 후보 화소가 최적 화소 누적 세트로 선택되지 않았다면, 기준 이미지 템플릿으로부터 아직 선택되지 않은 다음 화소를 단계 238에서 테스트한다.
화소가 최적 화소 누적 세트에 저장되었다면, 최적 예비 화소 세트에 도달되었는지 검사한다(246). 더 많은 화소를 추가하여도 검색 이미지 신의 다른 화소들로부터 기준 이미지 템플릿을 더 이상 구별할 수 없는 경우 즉, 조사된 최상의 양의 오류값이 증가 성향을 보이는 경우에는 최적 화소 누적 세트가 얻어진 것으로 판단하고 종료한다(250). 이는 일련의 이전상태 상관값들을 저장하여 상관값이 소정량, 예를들면 0.001만큼 변하는 경우를 검사함으로서 판단할 수 있다. 이러한 경향은 예비 화소 누적 세트에 누적된 화소들이 기준 이미지 템플릿과 더 이상 구별되지 않는다는 것을 의미한다. 따라서, 이 단계에서 누적 예비 화소 세트는 최적 예비 화소 세트를 포함한다. 반면, 다음 후보 화소 248은 단계 226을 다시 시작하므로서 선택된다.
피라미드의 최상위에서 선택된 예비 화소 세트는 피라미드의 연속적인 각 레벨에서 이미 알고 있는 자료에 의하여 추정된다. 바닥 또는 최대 해상도 레벨에서, 추가의 예비 화소 세트는 정확성을 얻기 위하여 선택된다. 이는 +/- 한 화소만큼 이동, +/- atan(1/최대 해상도에서 템플릿의 반경)도만큼 회전 및 (1 +/- 1/기준 이미지 템플릿의 반경)만큼의 스케일 범위내에서 행해진다. 이 단계에서, 학습 상태가 완료되고, 최적 화소 누적 세트는 실행시간 검색 상태를 위해 저장된다.
이러한 방법으로 최적 예비 화소 세트를 생성하는 경우 계산의 복잡도는 O(n3)이다. 상기 정의된 최적 예비 화소 세트 학습 방법은 포인트 상관관계의 단계 1에서의 계산의 복잡성을 O(n5)에서 O(n3)+O(n2)로 감소시켰다. 피라미드는 추가로 O(n2)로 감소되었다. 이에 더하여, 모든 중간 상관 결과들이 저장되므로, ((1 + 2 + 3 + ... + n) * O(n2))에서 ((1 + 1 + 1 + ... + 1) * O(n2))로 감소되었다. 따라서, 계산의 복잡성는 종래의 포인트 상관관계 학습 방법과 비교하여 O(n8)에서 O(n3)로 감소될 수 있다.
실행 시간 검색 상태 동안, 기준 이미지 템플릿(252)과 검색 신 이미지(254)는 이미지 피라미드 형태로 다시 변환된다(256). 저장된 최적 예비 화소 세트는 검색 이미지 신 내에서 기준 이미지 템플릿에 매칭되는 것을 찾기 위해 사용된다. 회전, 스케일 조정 및 원근 변환된 단계 250으로부터의 최적 예비 화소 세트는 검색 이미지 신과의 종래 표준화된 그레이스케일 상관관계에 사용되었다(258). 최적 예비 화소 세트가 대응하는 기준 이미지 템플릿에 비하여 현저히 작은 수의 화소들을 포함하기 때문에, 동작을 위해서는 많은 소수 화소가 요구되는데, 그럼에도 불구하고 그레이스케일 상관관계는 O(n4)의 복잡성을 유지한다. 검색 이미지 신의 각 포지션에 대한 상관 결과는 내림차순으로 정렬된다(260). 최상의 상관값을 가지는 검색 이미지 신의 화소( 및 대응하는 변환)이 고려된다. 힐 클라임 방법은 사용자가 지정한 최대 해상도에 도달할 때까지 검색 이미지 신의 피라미드의 각 레벨에 걸쳐 적용된다(262). 정확성을 위한 화소들이 최적 화소 세트와 더욱 잘 구별되기 위하여 상기한 바와 같이 추가된다(266). 피라미드의 최상위에서 선택된 예비 화소 세트는 피라미드의 연속적인 각 레벨들에 대하여 이미 알고있는 값들을 근거로 추정된다. 바닥 또는 최대 해상도 레벨에서, 추가의 예비 화소 세트는 정확성을 얻기 위하여 선택된다(266). 이는 +/- 한 화소만큼 이동, +/- atan(1/최대 해상도에서 템플릿의 반경)도만큼 회전 및 (1 +/- 1/기준 이미지 템플릿의 반경)만큼의 스케일 범위내에서 행해진다. 이렇게 계산된 상관값은 사용자가 설정한 최대 해상도 상관값 문턱치보다 크다면(268), 매칭되는 이미지가 찾아진 것으로 판단하여 종료한다(270). 그렇지 않으면, 단계 260으로부터 얻은 다음 순서의 최상위 상관값에 대하여 시도된다(272).
상기 정의된 바와 같은 디지털 이미지 인식 시스템은 a) 기록 불가능한 저장매체(예를 들면, 컴퓨터의 입출력 장비를 사용하여 읽을 수 있는 ROM 또는 CD-ROM 디스크와 같은 컴퓨터 내의 비가역성 메모리)에 영구 저장된 정보, b)기록 가능한 저장 매체(예를 들면, 플로피 디스크, 하드 드라이버 또는 다른 자성 매체)에 변경할 수 있도록 저장된 정보 또는 c) 컴퓨터의 원격 소스로부터 인터넷 또는 모뎀 또는 다른 인터페이스를 거치는 전화 네트워크와 같은 통신 매체를 통해 컴퓨터로 운반되는 정보를 포함하지만 이에 한정되지 않고, 당업자가 다양한 형태의 컴퓨터에서 쉽게 적용할 수 있다. 또한, 본 발명은 컴퓨터 소프트웨어로 구현될 수 있음은 물론, 본 발명을 실행하는데 필요한 오퍼레이션들은 부분적으로 또는 전제적으로 하드웨어 부품을 사용하여 교체될 수 있도록 구현될 수 있다.
이상에서는 본 발명의 특정의 바람직한 실시예에 대하여 도시하고 또한 설명하였다. 그러나, 본 발명은 상술한 실시예에 한정되지 아니하며, 특허청구의 범위에서 청구하는 본 발명의 요지를 벗어남이 없이 당해 발명이 속하는 기술분야에서 통상의 지식을 가진 자라면 누구든지 다양한 변형실시가 가능할 것이다.

Claims (33)

  1. 그레이스케일 상관관계 방식 디지털 이미지 패턴 매칭에 적용되고 기준 이미지 템플릿을 지시하는 최적 예비 화소 세트를 계산하는 방법에 있어서,
    상기 기준 이미지 템플릿의 상기 화소들의 서브세트로부터 초기 예비 화소 세트를 계산하는 단계;
    최적 화소 누적 세트에 상기 초기 예비 화소 세트를 저장하므로 초기화하는 단계;
    상기 최적 화소 누적 세트에 아직 포함되지 않은 상기 기준 이미지 템플릿의 화소들의 서브세트로부터 상관값을 근거로 후보 최적 화소를 결정하기 위하여 상기 기준 이미지 템플릿 및 상기 검색 이미지 신과 상기 최적 화소 누적 세트 사이의 상관관계를 구하는 단계;
    상기 후보 최적 화소가 상기 상관값에 많은 영향을 준다면 상기 후보 최적 화소를 상기 최적 화소 누적 세트에 저장하는 단계;
    상기 기준 이미지 템플릿의 나머지 화소들에 대하여 상기 상관관계를 구하는 단계와 상기 저장단계를 반복함으로써 상기 최적 화소 누적 세트를 생성하는 단계;
    상기 누적 예비 화소 세트가 소정의 누적 최적화 논리에 따라 최적의 화소 세트를 포함하는 경우 상기 생성 단계를 종료하는 단계; 및
    상기 최적 예비 화소 세트에 상기 최적 화소 누적 세트를 저장하는 단계를 포함하는 것을 특징으로 하는 최적 예비 화소 세트를 계산하는 방법.
  2. 제 1 항에 있어서, 상기 초기 예비 화소 세트 계산 단계는 상기 기준 이미지 템플릿과 상기 검색 이미지 신을 이미지 피라미드 형태로 먼저 변환하는 것을 특징으로 하는 최적 예비 화소 세트 계산 방법.
  3. 제 1항에 있어서, 상기 소정의 누적 최적화 논리는 상기 최적 화소 누적 세트에 이미 누적된 다른 화소들보다 더 중요한 상관값을 갖는 화소를 결정하는 단계를 더 포함하는 것을 특징으로 하는 최적 예비 화소 세트 계산 방법.
  4. 제 3항에 있어서, 상기 소정의 누적 최적화 논리는 상기 상관값이 소정량만큼 변할 때 결정하는 단계를 더 포함하는 것을 특징으로 하는 최적 예비 화소 세트 계산 방법.
  5. 제 4항에 있어서, 상기 소정의 누적 최적화 논리는 상기 저장단계에서 선택된 화소들과 상기 저장단계에서 선택되지 않은 화소들의 상기 상관값들의 합이 소정량만큼 증가하는지를 결정하는 단계를 더 포함하는 것을 특징으로 하는 최적 예비 화소 세트 계산 방법.
  6. 제 5항에 있어서, 상기 소정량은 0.001인 것을 특징으로 하는 최적 예비 화소 세트 계산 방법.
  7. 제 1 항에 있어서, 높은 지시값을 갖는 상기 화소는 상기 최적 화소 누적 세트에 이미 누적된 다른 화소들보다 큰 상관값을 갖는 화소로 결정되는 것을 특징으로 하는 최적 예비 화소 세트 계산 방법.
  8. 제 1 항에 있어서, 상기 상관관계는 미리 결정된 일련의 변환을 통해 상기 기준 이미지 템플릿을 변환하는 단계를 더 포함하는 것을 특징으로 하는 최적 예비 화소 세트 계산 방법.
  9. 제 8항에 있어서, 상기 변환 단계는 회전 및 스케일 조정 단계를 더 포함하는 것을 특징으로 하는 최적 예비 화소 세트 계산 방법.
  10. 제 9항에 있어서, 상기 회전 및 스케일링 조정 단계는 소정 범위내에서 소정 간격으로 발생하는 것을 특징으로 하는 최적 예비 화소 세트 계산 방법.
  11. 제 1 항에 있어서, 상기 상관관계를 구하는 단계는 상기 기준 이미지 템플릿을 화소 단위로 스캐닝하는 단계를 더 포함하는 것을 특징으로 하는 최적 예비 화소 세트 계산 방법.
  12. 디지탈 기준 이미지 템플릿의 패턴 매칭에 적용되는 컴퓨터 시스템에 사용하기 위한 컴퓨터 프로그램 생성물에 있어서,
    기준 이미지 템플릿을 가리키는 최적 예비 화소 세트를 계산하기에 적합한 컴퓨터로 읽을 수 있는 프로그램 코드를 가진 컴퓨터 사용가능 매체;
    상기 기준 이미지 템플릿의 상기 화소들의 서브세트로부터 초기 예비 화소 세트를 계산하기 위한 컴퓨터로 읽을 수 있는 프로그램 코드;
    최적 화소 누적 세트에 상기 초기 예비 화소 세트를 저장하므로써 초기화하기 위한 컴퓨터로 읽을 수 있는 프로그램 코드;
    상기 최적 화소 누적 세트에 아직 포함되지 않은 상기 기준 이미지 템플릿의 화소들의 서브세트로부터 상관값을 근거로 후보 최적 화소를 결정하기 위하여 상기 기준 이미지 템플릿 및 상기 검색 이미지 신과 상기 최적 화소 누적 세트 사이의 상관관계를 구하기 위한 컴퓨터로 읽을 수 있는 프로그램 코드;
    상기 후보 최적 화소가 상기 상관값에 많은 영향을 준다면 상기 후보 최적 화소를 상기 최적 화소 누적 세트에 저장하기 위한 컴퓨터로 읽을 수 있는 프로그램 코드;
    상기 기준 이미지 템플릿의 나머지 화소들에 대하여 상기 상관관계와 상기 저장을 반복함으로써 상기 최적 화소 누적 세트를 생성하기 위한 컴퓨터로 읽을 수 있는 프로그램 코드;
    상기 누적 예비 화소 세트가 소정의 누적 최적화 논리에 따라 최적의 화소 세트를 포함하는 경우 상기 생성 단계를 종료하기 위한 컴퓨터로 읽을 수 있는 프로그램 코드; 및
    상기 최적 예비 화소 세트에 상기 최적 화소 누적 세트를 저장하기 위한 컴퓨터로 읽을 수 있는 프로그램 코드를 더 포함하는 것을 특징으로 하는 디지털 기준 이미지 템플릿의 패턴 매칭에 적당한 컴퓨터 시스템에 사용하는 컴퓨터 프로그램 생성물.
  13. 제 12 항에 있어서, 상기 프로그램 코드는 상기 기준 이미지 템플릿과 상기 검색 이미지 신을 이미지 피라미드 형태로 변환하기 위한 코드를 더 포함하는 것을 특징으로 하는 컴퓨터 프로그램 생성물.
  14. 제 12항에 있어서, 상기 소정의 누적 최적화 논리용 상기 프로그램 코드는 상기 최적 화소 누적 세트에 이미 누적된 다른 화소들보다 더 중요한 상관값을 갖는 화소를 결정하기 위한 프로그램 코드를 더 포함하는 것을 특징으로 하는 컴퓨터 프로그램 생성물.
  15. 제 14항에 있어서, 상기 소정의 누적 최적화 논리용 프로그램 코드는 상기 상관값들의 합이 소정량만큼 증가하는지를 결정하기 위한 프로그램 코드를 더 포함하는 것을 특징으로 하는 컴퓨터 프로그램 생성물.
  16. 제 15항에 있어서, 상기 소정의 누적 최적화 논리용 프로그램 코드는 상기 저장단계에서 선택된 화소들과 상기 저장단계에서 선택되지 않은 화소들의 상관값의 평균이 소정량만큼 증가하는지를 결정하기 위한 프로그램 코드를 더 포함하는 것을 특징으로 하는 컴퓨터 프로그램 생성물.
  17. 제 16항에 있어서, 상기 소정량은 약 0.001인 것을 특징으로 하는 컴퓨터 프로그램 생성물.
  18. 제 12항에 있어서, 높은 지시값을 갖는 화소를 결정하기 위한 상기 프로그램 코드는 상기 최적 화소 누적 세트에 이미 누적된 다른 화소들보다 큰 상관값을 갖는 화소로 결정하는 것을 특징으로 하는 컴퓨터 프로그램 생성물.
  19. 제 12항에 있어서, 상기 상관관계용 프로그램 코드는 미리 결정된 일련의 변환을 통해 상기 기준 이미지 템플릿을 변환하기 위한 프로그램 코드를 더 포함하는 것을 특징으로 하는 컴퓨터 프로그램 생성물.
  20. 제 19항에 있어서, 상기 변환용 프로그램 코드는 상기 기준 이미지 템플릿을 회전 및 스케일 조정하기 위한 프로그램 코드를 더 포함하는 것을 특징으로 하는 컴퓨터 프로그램 생성물.
  21. 제 20항에 있어서, 상기 회전 및 스케일 조정은 소정 범위에서 소정 간격으로 발생하는 것을 특징으로 하는 컴퓨터 프로그램 생성물.
  22. 제 19항에 있어서, 상기 상관관계용 프로그램 코드는 상기기준 이미지 템플릿을 화소 단위로 스캐닝하는 것을 더 포함하는 것을 특징으로 하는 컴퓨터 프로그램 생성물.
  23. 그레이스케일 상관관계 매칭을 통해 검색 이미지 신에서 기준 이미지 템플릿을 찾기 위한 디지털 이미지 인식 방법에 있어서,
    화소화된 그레이스케일 디지털 이미지로 표현되는 기준 이미지 템플릿을 제공하는 단계;
    화소화된 그레이스케일 디지털 이미지로 표현되는 검색 이미지 신을 제공하는 단계;
    상기 기준 이미지 템플릿을 지시하는 최적 예비 화소 세트를 계산하는 단계, 이 단계는:
    상기 기준 이미지 템플릿의 상기 화소들의 서브세트로부터 초기 예비 화소 세트를 계산하는 단계;
    상기 초기 예비 화소 세트를 최적 화소 누적 세트에 저장함으로써 초기화 하는 단계;
    상기 최적 화소 누적 세트에 아직 포함되지 않은 상기 기준 이미지 템플릿의 화소들의 서브세트로부터 상관값을 근거로 후보 최적 화소를 결정하기 우하여 상기 기준 이미지 템플릿 및 상기 검색 이미지 신과 상기 최적 화소 누적 세트와의 상관관계를 구하는 단계;
    상기 후보 최적 화소가 높은 상관관계를 가지면 상기 후보 최적 화소를 상기 최적 화소 누적 세트에 저장하는 단계;
    상기 기준 이미지 템플릿의 나머지 화소들에 대하여 상기 상관단계 및 상기 저장 단계를 반복함으로써 상기 최적 화소 누적 세트를 생성하는 단계;
    상기 누적 예비 화소 세트가 소정의 누적 최적화 논리에 따라 최적의 화소 세트를 포함하는 경우 상기 생성단계를 종료하는 단계; 및
    상기 최적 화소 누적 세트를 상기 최적 예비 화소 세트에 저장하는 단계를 포함하며;
    상기 최적 예비 화소 세트와 상기 검색 이미지 신의 상관관계에 의해 상기 검색 이미지 신 내에 상기 기준 이미지 템플릿을 위치시키는 단계를 포함하는 것을 특징으로 하는 디지털 이미지 인식 방법.
  24. 제 23항에 있어서, 상기 위치시키는 단계는 상기 검색 이미지 신을 화소 단위로 스캐닝하는 것을 특징으로 하는 디지털 이미지 인식 방법.
  25. 제 24항에 있어서, 상기 위치시키는 단계는 상기 최적 예비 화소 세트에 포함하기 위하여 상기 기준 이미지 템플릿으로부터 정확한 화소들의 추가 서브세트를 선택하는 단계를 더 포함하는 것을 특징으로 하는 디지털 이미지 인식 방법.
  26. 화소화된 디지탈 이미지의 패턴 매칭을 위한 컴퓨터 장치에 있어서,
    매트릭스 형태의 다수의 화소를 포함하는 화소화된 기준 이미지 템플릿을 저장하기 위한 기준 이미지 메모리;
    매트릭스 형태의 다수의 화소를 포함하는 화소화된 검색 이미지 템플릿을 저장하기 위한 검색 신 메모리를 포함하는데, 상기 각 화소들은 그레이스케일과 포지션을 가지며;
    상기 기준 이미지 템플릿의 상기 화소의 서브세트를 저장하기에 적합한 최적 예비 화소 메모리; 및
    다수의 화소들의 상관관계를 결정하기에 적합한 프로세서를 포함하는데, 상기 상관관계 결과는 상기 기준 이미지 템플릿과 상기 검색 신 이미지 사이의 패턴 매칭을 나타내고, 상기 상관관계 결과는 상기 그레이스케일값과 상기 포지션을 비교하기 위하여 상기 최적 예비 화소 메모리로부터의 다수의 상기 화소들과 상기 검색 이미지 메모리로부터의 다수의 화소들을 상기 프로세서로 순차적으로 복사함으로써 결정되며,
    상기 화소들은 상기 패턴 매칭을 결정하는데 지대한 영향을 주는 상관결과로서 상기 최적 예비 화소 메모리에 선택적으로 저장되는 것을 특징으로 하는 화소화된 디지털 이미지의 패턴 매칭을 위한 컴퓨터 장치.
  27. 제 26항에 있어서, 상기 기준 이미지 메몰리와 상기 검색 신 메모리는 피라미드의 각 레벨마다 해상도가 다른 다중레벨 피라미드에 상기 화소들을 저장하기에 적합한 피라미드 이미지 메모리를 더 포함하는 것을 특징으로 하는 화소화된 디지털 이미지의 패턴 매칭을 위한 컴퓨터 장치.
  28. 제 26항에 있어서, 상기 최적 예비 화소 메모리에 상기 화소들을 선택적으로 저장하는 것은 상기 화소들이 상기 패턴 매칭을 결정하기 위한 상기 기준 이미지 메모리의 상기 화소들보다 더 유사하도록 상기 상관값에 영향을 주는 화소에 의하여 결정되는 것을 특징으로 하는 화소화된 디지털 이미지의 패턴 매칭을 위한 컴퓨터 장치.
  29. 제 1항에 있어서, 상기 상관값은 높은 양의 오류값인 것을 특징으로 하는 최적 예비 화소 세트 계산 방법.
  30. 제 1항에 있어서, 상기 소정의 누적 최적화 논리는 상기 최적 화소 누적 세트에 추가된 화소들이 상기 검색 이미지 신으로부터 상기 기준 이미지 템플릿과 더 이상 구분되지 않을 때를 결정하는 단계를 더 포함하는 것을 특징으로 하는 최적 예비 화소 세트 계산 방법.
  31. 제 29항에 있어서, 상기 소정의 누적 최적화 논리는 상기 높은 양의 오류값이 증가 경향을 나타내는 때는 결정하는 단계를 포함하는 것을 특징으로 하는 최적 예비 화소 세트 계산 방법.
  32. 제 9항에 있어서, 상기 변환은 원근 왜곡을 조정하는 것을 더 포함하는 것을 특징으로 하는 최적 예비 화소 세트 계산 방법.
  33. 제 32항에 있어서, 상기 변환은 화소 단위로 수평 및 수직 방향의 이동을 더 포함하는 것을 특징으로 하는 최적 예비 화소 세트 계산 방법.
KR1020007012970A 1998-05-18 1999-05-18 이미지 인식 및 상관 시스템 KR20010043717A (ko)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US8586298P 1998-05-18 1998-05-18
US60/085,862 1998-05-18
PCT/US1999/010815 WO1999060517A1 (en) 1998-05-18 1999-05-18 Image recognition and correlation system

Publications (1)

Publication Number Publication Date
KR20010043717A true KR20010043717A (ko) 2001-05-25

Family

ID=22194461

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020007012970A KR20010043717A (ko) 1998-05-18 1999-05-18 이미지 인식 및 상관 시스템

Country Status (8)

Country Link
US (1) US6272247B1 (ko)
EP (1) EP1080444A4 (ko)
JP (1) JP2002516440A (ko)
KR (1) KR20010043717A (ko)
CN (1) CN1161710C (ko)
CA (1) CA2332118A1 (ko)
IL (1) IL139620A0 (ko)
WO (1) WO1999060517A1 (ko)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20170020114A (ko) 2015-08-13 2017-02-22 주식회사 슈프리마 지문 인증 방법 및 그 지문 인증 방법을 이용한 장치
KR20210147863A (ko) * 2020-05-28 2021-12-07 파나소닉 아이피 매니지먼트 가부시키가이샤 화상 처리 방법, 프로그램 및 화상 처리 시스템

Families Citing this family (48)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
AT413156B (de) * 1999-12-29 2005-11-15 Oesterr Forsch Seibersdorf Verfahren und anordnung zur prüfung von gegenständen
US6744913B1 (en) * 2000-04-18 2004-06-01 Semiconductor Technology & Instruments, Inc. System and method for locating image features
US6707932B1 (en) * 2000-06-30 2004-03-16 Siemens Corporate Research, Inc. Method for identifying graphical objects in large engineering drawings
US7039229B2 (en) * 2000-08-14 2006-05-02 National Instruments Corporation Locating regions in a target image using color match, luminance pattern match and hill-climbing techniques
US7062093B2 (en) * 2000-09-27 2006-06-13 Mvtech Software Gmbh System and method for object recognition
US6603882B2 (en) * 2001-04-12 2003-08-05 Seho Oh Automatic template generation and searching method
JP2002319028A (ja) * 2001-04-20 2002-10-31 Shinkawa Ltd 画像処理方法、同装置、およびボンディング装置
KR100976930B1 (ko) 2002-03-22 2010-08-18 브리티쉬 텔리커뮤니케이션즈 파블릭 리미티드 캄퍼니 패턴 비교 방법
US7546236B2 (en) 2002-03-22 2009-06-09 British Telecommunications Public Limited Company Anomaly recognition method for data streams
US20050037406A1 (en) * 2002-06-12 2005-02-17 De La Torre-Bueno Jose Methods and apparatus for analysis of a biological specimen
US7272252B2 (en) * 2002-06-12 2007-09-18 Clarient, Inc. Automated system for combining bright field and fluorescent microscopy
US7054492B2 (en) * 2002-09-24 2006-05-30 Lee Shih-Jong J Fast regular shaped pattern searching
US7142718B2 (en) * 2002-10-28 2006-11-28 Lee Shih-Jong J Fast pattern searching
US7149357B2 (en) * 2002-11-22 2006-12-12 Lee Shih-Jong J Fast invariant pattern search
GB0229625D0 (en) 2002-12-19 2003-01-22 British Telecomm Searching images
US7110603B2 (en) * 2003-04-16 2006-09-19 Lee Shih-Jong J Fast invariant matching using template decomposition and synthesis
JP3981658B2 (ja) * 2003-09-30 2007-09-26 松下電器産業株式会社 画像処理方法および画像処理装置
JP4517633B2 (ja) * 2003-11-25 2010-08-04 ソニー株式会社 対象物検出装置及び方法
US7463773B2 (en) * 2003-11-26 2008-12-09 Drvision Technologies Llc Fast high precision matching method
GB0328326D0 (en) 2003-12-05 2004-01-07 British Telecomm Image processing
DE602005008993D1 (de) 2004-09-17 2008-09-25 British Telecomm Public Ltd Co Analyse von mustern
US20060178833A1 (en) * 2005-02-04 2006-08-10 Bauer Kenneth D System for and method of providing diagnostic information through microscopic imaging
EP1732030A1 (en) 2005-06-10 2006-12-13 BRITISH TELECOMMUNICATIONS public limited company Comparison of patterns
CN101248457B (zh) 2005-07-28 2011-07-27 英国电讯有限公司 图像分析方法
JP4533273B2 (ja) * 2005-08-09 2010-09-01 キヤノン株式会社 画像処理装置及び画像処理方法、プログラム
US20070091109A1 (en) * 2005-09-13 2007-04-26 Roscoe Atkinson Image quality
EP1798961A1 (en) 2005-12-19 2007-06-20 BRITISH TELECOMMUNICATIONS public limited company Method for focus control
EP1914666A3 (en) * 2006-03-24 2008-05-07 MVTec Software GmbH System and methods for automatic parameter determination in machine vision
US7885455B2 (en) * 2006-04-14 2011-02-08 UTC Fire & Security Americas Corporation, Inc Method of combining images of multiple resolutions to produce an enhanced active appearance model
US8103061B2 (en) * 2006-10-02 2012-01-24 Johnson & Johnson Consumer Companies, Inc. Method and apparatus for identifying facial regions
US7831098B2 (en) * 2006-11-07 2010-11-09 Recognition Robotics System and method for visual searching of objects using lines
CN100463002C (zh) * 2006-12-07 2009-02-18 北京航空航天大学 基于像素跳跃的图像匹配方法
US7814443B2 (en) * 2007-01-16 2010-10-12 International Business Machines Corporation Graph-based pattern matching in L3GO designs
JP2008181216A (ja) * 2007-01-23 2008-08-07 Mitsubishi Electric Corp 判別器生成装置及び物体検出装置
JP5408128B2 (ja) * 2008-05-15 2014-02-05 株式会社ニコン 画像処理装置、画像処理方法、処理装置、およびプログラム
US8897601B2 (en) 2009-09-28 2014-11-25 Nec Corporation Image conversion parameter calculation device, image conversion parameter calculation method, and program
US8908937B2 (en) 2010-07-08 2014-12-09 Biomet Manufacturing, Llc Method and device for digital image templating
US8917290B2 (en) * 2011-01-31 2014-12-23 Biomet Manufacturing, Llc Digital image templating
CN102855251B (zh) * 2011-06-30 2015-07-01 北京百度网讯科技有限公司 一种需求识别的方法及装置
JP2013080326A (ja) * 2011-10-03 2013-05-02 Sony Corp 画像処理装置、画像処理方法及びプログラム
JP6422250B2 (ja) * 2014-07-08 2018-11-14 キヤノン株式会社 画像処理方法、画像処理装置、プログラム及び記録媒体
US10262229B1 (en) 2015-03-24 2019-04-16 Hrl Laboratories, Llc Wide-area salient object detection architecture for low power hardware platforms
US20170316311A1 (en) * 2015-03-24 2017-11-02 Hrl Laboratories, Llc Sparse inference modules for deep learning
US10503999B2 (en) 2015-03-24 2019-12-10 Hrl Laboratories, Llc System for detecting salient objects in images
US10010372B1 (en) 2016-01-06 2018-07-03 Paul Beck Marker Positioning Apparatus
US10004564B1 (en) 2016-01-06 2018-06-26 Paul Beck Accurate radiographic calibration using multiple images
CN109858504A (zh) * 2017-11-30 2019-06-07 阿里巴巴集团控股有限公司 一种图像识别方法、装置、系统以及计算设备
US11210551B2 (en) 2019-07-29 2021-12-28 Hong Kong Applied Science And Technology Research Institute Co., Ltd. Iterative multi-directional image search supporting large template matching

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS58130030A (ja) 1981-10-05 1983-08-03 工業技術院長 X線ディジタル画像処理装置
US4720871A (en) * 1986-06-13 1988-01-19 Hughes Aircraft Company Digital image convolution processor method and apparatus
US5067162A (en) 1986-06-30 1991-11-19 Identix Incorporated Method and apparatus for verifying identity using image correlation
US5146228A (en) 1990-01-24 1992-09-08 The Johns Hopkins University Coherent correlation addition for increasing match information in scene matching navigation systems
JP3549569B2 (ja) * 1993-04-27 2004-08-04 ソニー エレクトロニクス インコーポレイテッド 映像内の目標パターン探知方法
US5602937A (en) * 1994-06-01 1997-02-11 Cognex Corporation Methods and apparatus for machine vision high accuracy searching
US5642444A (en) * 1994-07-28 1997-06-24 Univ North Carolina Specialized image processing system architecture and method for image data arrays

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20170020114A (ko) 2015-08-13 2017-02-22 주식회사 슈프리마 지문 인증 방법 및 그 지문 인증 방법을 이용한 장치
KR20210147863A (ko) * 2020-05-28 2021-12-07 파나소닉 아이피 매니지먼트 가부시키가이샤 화상 처리 방법, 프로그램 및 화상 처리 시스템

Also Published As

Publication number Publication date
WO1999060517A1 (en) 1999-11-25
JP2002516440A (ja) 2002-06-04
CA2332118A1 (en) 1999-11-25
US6272247B1 (en) 2001-08-07
CN1301369A (zh) 2001-06-27
IL139620A0 (en) 2002-02-10
EP1080444A4 (en) 2002-02-13
EP1080444A1 (en) 2001-03-07
CN1161710C (zh) 2004-08-11

Similar Documents

Publication Publication Date Title
KR20010043717A (ko) 이미지 인식 및 상관 시스템
US6229921B1 (en) Pattern matching system and method with improved template image sampling using low discrepancy sequences
US6005978A (en) Robust search for image features across image sequences exhibiting non-uniform changes in brightness
US5875040A (en) Gradient based method for providing values for unknown pixels in a digital image
US7103218B2 (en) Image processing methods and apparatus for detecting human eyes, human face, and other objects in an image
Wei et al. Fast template matching based on normalized cross correlation with adaptive multilevel winner update
JP4907219B2 (ja) マシンビジョンにおける自動パラメータ決定のシステムおよび方法
JP4494427B2 (ja) 画像中のパターンを自動的に位置付けるベクトル相関システム
US6516087B1 (en) Method for real time correlation of stereo images
US6222940B1 (en) Pattern matching system and method which detects rotated and scaled template images
WO1997021189A1 (en) Edge peak boundary tracker
US6055334A (en) Image processing device and method for detecting the location of the feature of interest in an object image
JP2006523345A (ja) マルチメディアデータに索引付けをし、そして検索するための形状マッチング方法
Tombari et al. Full-search-equivalent pattern matching with incremental dissimilarity approximations
US6542639B2 (en) Region extraction apparatus, region extraction method and computer readable recording medium
US6249603B1 (en) Efficient search for a gray-level pattern in an image
US6219452B1 (en) Pattern matching system and method which performs local stability analysis for improved efficiency
CN111149101A (zh) 一种目标图案查找方法及计算机可读存储介质
JP2003162719A (ja) ディジタルイメージの中のパターンの検出
JP4130915B2 (ja) グラフィカルオブジェクトの境界情報の処理
US6650362B1 (en) Movement detecting apparatus with feature point extractor based on luminance gradient in current frame
CN113362390A (zh) 一种基于椭圆检测的快速圆形目标定位视频处理方法
US7400747B2 (en) Method and apparatus for representing moving objects in a sequence of images
GB2457584A (en) Template block matching using a similarity function and incremental threshold
Kawanishi et al. Dynamic active search for quick object detection with pan-tilt-zoom camera

Legal Events

Date Code Title Description
WITN Application deemed withdrawn, e.g. because no request for examination was filed or no examination fee was paid