KR100976930B1 - 패턴 비교 방법 - Google Patents
패턴 비교 방법 Download PDFInfo
- Publication number
- KR100976930B1 KR100976930B1 KR1020047015012A KR20047015012A KR100976930B1 KR 100976930 B1 KR100976930 B1 KR 100976930B1 KR 1020047015012 A KR1020047015012 A KR 1020047015012A KR 20047015012 A KR20047015012 A KR 20047015012A KR 100976930 B1 KR100976930 B1 KR 100976930B1
- Authority
- KR
- South Korea
- Prior art keywords
- elements
- array set
- image
- array
- comparison
- Prior art date
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/74—Image or video pattern matching; Proximity measures in feature spaces
- G06V10/75—Organisation of the matching processes, e.g. simultaneous or sequential comparisons of image or video features; Coarse-fine approaches, e.g. multi-scale approaches; using context analysis; Selection of dictionaries
- G06V10/757—Matching configurations of points or features
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- General Physics & Mathematics (AREA)
- Physics & Mathematics (AREA)
- Evolutionary Computation (AREA)
- Artificial Intelligence (AREA)
- Software Systems (AREA)
- Computing Systems (AREA)
- Multimedia (AREA)
- Medical Informatics (AREA)
- General Health & Medical Sciences (AREA)
- Databases & Information Systems (AREA)
- Health & Medical Sciences (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Evolutionary Biology (AREA)
- Bioinformatics & Computational Biology (AREA)
- General Engineering & Computer Science (AREA)
- Life Sciences & Earth Sciences (AREA)
- Data Mining & Analysis (AREA)
- Image Analysis (AREA)
- Holo Graphy (AREA)
- Eye Examination Apparatus (AREA)
- Character Discrimination (AREA)
Abstract
제 1 이미지(또는 달리는 패턴)는 각각 값을 갖는 제 1 배열 요소 세트(A)에 의해 표시되고, 제 2 패턴은 제 2 배열 요소 세트에 의해 표시된다. 두 요소 세트의 비교는, 상기 제 1 배열 세트의 복수의 요소(x)의 각각에 대해, 고려중인 요소 x의 근처의 복수의 요소 x'를 상기 제 1 배열 세트로부터 선택하는 단계(103)와, 상기 제 2 배열 세트의 요소 y를 선택하는 단계(102)와, 상기 제 1 배열 세트의 요소 x'와 상기 제 2 배열 세트의 요소 y'(각각은 제 1 배열 세트의 선택된 복수의 요소의 각각의 요소 x'가 고려중인 요소 x에 대해 가지는 위치와 같은 위치를 제 2 배열 세트의 선택된 요소 y'에 대해 갖는다)를 비교하는 단계를 실행한다. 비교 그 자체(106)는, 제 1 배열 세트의 복수의 요소가 제 2 배열 세트의 복수의 요소와 매칭한다고 판단하기 위한 소정의 매칭 기준에 따라서, 제 1 세트의 선택된 복수의 요소 x'의 각각의 값을 제 2 세트의 비슷한 복수의 요소의 상응되게 배치된 요소 y'의 값과 비교하는 단계를 포함한다. 그 다음 상기 비교는 제 1 세트의 복수의 요소 x'의 새로운 선택 및/또는 제 2 배열 세트의 요소 y의 새로운 선택을 가지고 반복되어 매칭의 회수의 함수로서 유사성 측정치 V를 생성한다. 바람직하게는, 매칭 판단으로 귀착되는 비교 이후에, 다음 비교는 제 1 세트의 복수의 요소 x'의 새로운 선택과 제 2 세트의 요소의 동일한 선택으로 실행된다.
Description
[배경 기술]
본 발명은 하나의 패턴을 다른 패턴과 비교하는 것에 관한 것으로서, 일차원 패턴 및 삼차원 또는 그 이상의 차원을 갖는 패턴에도 적용가능하나, 특히 시각 이미지와 같은 이차원 패턴을 비교하는 것에 관한 것이다. 패턴 인식에 대한 표준적 접근은 패턴을 인식 및 분류하는 템플릿을 사용한다(1). 이러한 템플릿은 다수의 형태를 취하나 그들은 보통 트레이닝 데이터의 통계적 분석에 의해 만들어지고 유사 측정을 사용하여 보이지 않는 데이터와 매칭된다(2). 통계적 분석은 보통 인식 작업의 요구를 만족시킬 수 있는 다수의 직관적으로 선택된 피처를 통해 실행된다. 예컨대, 음성 인식에서 템플릿은 주파수 도메인에서 파생된 히든 마르코프 모델(Hidden Markov Models)로서 캡슐화될 수 있고, 및 광학 문자 인식에서 템플릿은 문자 폰트 자체의 형태를 취한다. 안면 인식의 경우에, 피부 텍스처(texture), 피부 색상 및 안면 피처 등록과 같은 다수의 직관적으로 선택된 피처가 안면 템플릿을 정의하기 위해 사용된다. CCTV 감시 애플리케이션에서, 침입자는 보통 행동을 감지하고 프로세싱으로부터 배경 효과를 제거하는 프레임 제거 및 배경 템플릿 모델링의 프로세스를 통해 검출된다[3]. 많은 경우에, 피처의 수는 컴퓨터로 관리 불가능한 프로세스에 이르게 되고, 주성분 분석(Principal Components Analysis) 및 다른 기술이 중대한 성능 감소 없이 문제를 줄이기 위해 사용된다[http://www.partek.com/index.html]. 이러한 접근은 노이즈가 없는 환경에서는 큰 성공을 얻으나 패턴 변형 및 패턴 종류의 수가 증가하는 경우 실패한다.
본 발명은 하나의 패턴을 다른 패턴과 비교하는 것에 관한 것으로서, 일차원 패턴 및 삼차원 또는 그 이상의 차원을 갖는 패턴에도 적용가능하나, 특히 시각 이미지와 같은 이차원 패턴을 비교하는 것에 관한 것이다. 패턴 인식에 대한 표준적 접근은 패턴을 인식 및 분류하는 템플릿을 사용한다(1). 이러한 템플릿은 다수의 형태를 취하나 그들은 보통 트레이닝 데이터의 통계적 분석에 의해 만들어지고 유사 측정을 사용하여 보이지 않는 데이터와 매칭된다(2). 통계적 분석은 보통 인식 작업의 요구를 만족시킬 수 있는 다수의 직관적으로 선택된 피처를 통해 실행된다. 예컨대, 음성 인식에서 템플릿은 주파수 도메인에서 파생된 히든 마르코프 모델(Hidden Markov Models)로서 캡슐화될 수 있고, 및 광학 문자 인식에서 템플릿은 문자 폰트 자체의 형태를 취한다. 안면 인식의 경우에, 피부 텍스처(texture), 피부 색상 및 안면 피처 등록과 같은 다수의 직관적으로 선택된 피처가 안면 템플릿을 정의하기 위해 사용된다. CCTV 감시 애플리케이션에서, 침입자는 보통 행동을 감지하고 프로세싱으로부터 배경 효과를 제거하는 프레임 제거 및 배경 템플릿 모델링의 프로세스를 통해 검출된다[3]. 많은 경우에, 피처의 수는 컴퓨터로 관리 불가능한 프로세스에 이르게 되고, 주성분 분석(Principal Components Analysis) 및 다른 기술이 중대한 성능 감소 없이 문제를 줄이기 위해 사용된다[http://www.partek.com/index.html]. 이러한 접근은 노이즈가 없는 환경에서는 큰 성공을 얻으나 패턴 변형 및 패턴 종류의 수가 증가하는 경우 실패한다.
패턴이 동일 패턴의 다른 부분과 비교되는 이미지 또는 다른 패턴 분석을 위한 몇몇 기술은 다음과 같은 이전 특허 출원에 설명되어 있다.
유럽 특허 출원 00301262.2(공개 번호 1126411)(출원인 번호 A25904EP#);
유럽 특허 출원 00301262.2(공개 번호 1126411)(출원인 번호 A25904EP#);
국제특허출원 PCT/GB01/00504(공개번호 WO 01/61648)(출원인번호 A25904WO);
국제특허출원 PCT/GB01/03802(공개번호 WO 02/21446)(출원인번호 A25055WO);
2001년 10월 16일 출원된 미국특허출원 977,263/09(공개번호 20020081033) (출원인 번호 A25904US1);
또한, 발명자에 의해 출판된 다음의 논문: Stentiford F W M, "이미지 압축에 대한 애플리케이션을 갖는 경쟁 고안물을 통한 시각 주의에 대한 감정기", Proc. Picture Coding Symposium 2001, 서울, 4월 25-27, 페이지 101-104, 2001. Stentiford F W M, "시각 주의의 시뮬레이션에 대한 발전적인 프로그래밍 접근", Proc. Congress on Evolutionary Computation 2001, 서울, 5월 27-30, 페이지 851-858, 2001.
[발명의 상세한 설명]
[발명의 상세한 설명]
본 발명의 일 측면에 따르면, 각각이 값을 갖는 요소의 제 1 배열 세트에 의해 표시된 제 1 패턴과 각각이 값을 갖는 요소의 제 2 배열 세트에 의해 표시된 제 2 패턴을 비교하는 방법에 있어서, 상기 제 1 배열 세트의 복수의 요소의 각각에 대해,
(ⅰ) 상기 제 1 배열 세트로부터 고려중인 상기 요소의 근처의 복수의 요소를 선택하는 단계,
(ⅱ) 상기 제 2 배열 세트의 요소를 선택하는 단계,
(ⅲ) 상기 제 1 배열 세트의 선택된 복수의 요소와 상기 제 2 배열 세트의 비슷한 복수의 요소를 비교하는 단계,
(ⅳ) 상기 제 1 배열 세트의 상기 복수의 요소의 새로운 선택 및 상기 제 2 배열 세트의 하나의 요소의 새로운 선택 중 적어도 하나의 비교를 반복하는 단계,
(ⅴ) 상기 비교가 매칭을 표시하는 비교 횟수의 함수로서 유사성 측정치를 상기 고려중인 요소에 대하여 생성하는 단계를 포함하고,
상기 선택된 요소는 상기 배열 세트 내에서 고려중인 상기 요소에 대하여 각각 상호 다른 위치를 갖고, 상기 제 2 배열 세트의 비슷한 복수의 요소의 각각은 상기 제 1 배열 세트의 상기 선택된 복수의 요소의 각 하나가 고려중인 상기 요소에 대해 가지는 위치와 같은 위치를 상기 제 2 배열 세트 내에서 제 2 배열 세트의 선택된 요소에 대해 가지고, 상기 비교는 상기 제 1 배열 세트의 상기 복수의 요소가 상기 제 2 배열 세트의 상기 복수의 요소와 매칭한다는 판단을 내리기 위한 소정의 매칭 표준에 따라서, 상기 제 1 배열 세트의 상기 선택된 복수의 요소의 각각의 값과 상기 제 2 배열 세트의 상기 비슷한 복수의 요소의 상기 상응하여 배치된 요소의 값을 비교하는 것을 포함하는 것을 특징으로 하는 패턴 비교 방법이 제공된다.
본 발명의 다른 측면은 청구의 범위에서 한정된다.
[도면의 간단한 설명]
[도면의 간단한 설명]
본 발명의 몇몇 실시예가 첨부된 도면을 참조하여 설명될 것이다.
도 1은 본 발명을 실행하는 장치의 블록도이고,
도 2는 본 발명의 동작을 나타내는 다이어그램이고,
도 3은 본 발명의 일 실시예에 따른 도 1의 장치에 의해 실행되는 단계의 흐름도이다.
도 4 내지 도 9는 본 발명의 실시예에 의해 얻어진 몇몇 이미지 및 숫자 결과를 도시한다.
[실시예]
[실시예]
도 1은 본 발명의 제 1 실시예에 따른 이미지 분석을 실행하기 위해 프로그래밍된 일반용 컴퓨터로 구성된 장치를 도시한다. 이는 버스(1), 버스(1)에 연결된 CPU(2), 영상 디스플레이(3), 키보드(4), 영상의 입력을 위한 스캐너(5)(또는 다른 장치, 도시안됨), 및 메모리(6)를 구비한다.
메모리(6)에는 OS(601), 영상 분석을 실행하는 프로그램(602), 및 이미지 A 및 이미지 B로서 표시된 두 개의 이미지를 저장하는 저장영역(603, 604)이 저장된다. 각 이미지는 이차원 어레이 값으로서 저장되고, 각 값은 어레이 내의 영상 요소(picture element)의 밝기(brightness)를 표시한다.
이미지 어레이는 도 2a 및 도 2b에 개략적으로 도시되어 있다. 이미지 A는 영상 요소 x = (x1, x2)의 20 ×20 어레이로 구성되고, x1 및 x2는 이미지 내 요소의 수평 및 수직 성분이다. 각 요소는 각각의 값 a = a(x) 에 의해 표시된 밝기를 갖는다. 유사하게, 이미지 B는 밝기값 b 를 갖는 영상 요소 y = (y1, y2)의 20 ×20 어레이로 구성된다.
프로그램(602)에 의해 실행되는 이미지 분석 방법은 도 3에 도시된 흐름도에 따라 실행된다. 이미지 사이의 유사 측정 V 를 생성하는 것을 목적으로 한다; 더욱 상세하게는, 높은 V 값은 이미지 B가 이미지 A의 내용과 유사한 시각적인 요소를 포함한다는 것을 나타낸다.
이미지는 너비 xmax 1 및 ymax 1 와 높이 xmax 2 및 ymax 2 를 갖고, 영상 요소 좌표는 x 1 = 0 ... xmax 1-1, x 2 = 0...xmax 2-1인 것으로 가정된다.
단계(100)에서, 이미지 A에서 영상 요소 x 가 선택된다. 그들은 임의의 순서로 다루어질 수 있으나, 이미지 에지의 ε이내 즉, (xmax 1 - ε-1, xmax 2 - ε- 1)까지의 것들을 제외하고, 모든 것이 다루어질 때까지, 초기에 요소 x = (ε, ε)을 선택하고, 그다음 반복하여 래스터-스캔 양식으로 연속적인 요소를 선택하는 것이 편리하다.
단계(100)에서, 이미지 A에서 영상 요소 x 가 선택된다. 그들은 임의의 순서로 다루어질 수 있으나, 이미지 에지의 ε이내 즉, (xmax 1 - ε-1, xmax 2 - ε- 1)까지의 것들을 제외하고, 모든 것이 다루어질 때까지, 초기에 요소 x = (ε, ε)을 선택하고, 그다음 반복하여 래스터-스캔 양식으로 연속적인 요소를 선택하는 것이 편리하다.
단계(101)에서, 스코어 V 및 카운터 tries는 영으로 설정된다.
삭제
단계(102)에서, 요소 y = (y1, y2)는, 위치 x 의 최대 거리 s 내에서 이미지 B로부터 랜덤하게 선택된다. 즉 모든 i에 대해,
| xi - yi | ≤s
선택사항인 이 제한은 도 2b에서 점선 정사각형 S 에 의해 표시되어 있다. 그것은 두 개의 이미지에서 상응하는 오브젝트가 어느 하나의 좌표 방향으로 s보다 많은 영상 요소에 의해 위치가 이동되지 않는 것으로 알려진다면 효율을 개선한다: 사실상, s는 두 개의 영상 사이의 최대 오등록 또는 지역 왜곡(local distortion)을 나타낸다.
y 의 선택도 그것이 이미지의 에지로부터 ε를 초과하지 않고 위치하는 제한을 받는다. 즉 i = 1, 2 에 대해,
y 의 선택도 그것이 이미지의 에지로부터 ε를 초과하지 않고 위치하는 제한을 받는다. 즉 i = 1, 2 에 대해,
삭제
ε≤yi ≤ ymaxi - ε- 1
삭제
여기서, ymax i는 영상 요소 내의 이미지의 너비 또는 높이임(이 예에서는 20).
단계(103)에서, 영상 요소 x'의 세트 SX가 선택되고, 영상 요소 x 의 이웃 N에서 이미지 A로부터 랜덤하게 선택된 수로 m의 적어도 하나의 추가 요소를 더한 요소를 비교하며, 여기서 이웃 N은 x 에 중심을 둔 2ε+1 x 2ε+1의 정사각형이다. 즉, 요소 x' = (x 1', x 2')는 이하의 경우 N 내에 있다.
모든 i에 대해, | xi'- xi | < ε
이것은 실제로는 필수적인 것은 아니지만, 이웃 세트 Sx는 요소 x 그 자체를 포함하는 것이 더 좋다. 그 다음, 이미지 B에서 이웃 세트 Sy가 정의되고, m + 1 요소 y' = (y1', y2')는 각각이 요소 y 에 관해서 Sx의 상응하는 요소 x'가 x 로부터 갖는 위치와 동일한 위치를 갖는다. 즉, 모든 i에 대해,
이것은 실제로는 필수적인 것은 아니지만, 이웃 세트 Sx는 요소 x 그 자체를 포함하는 것이 더 좋다. 그 다음, 이미지 B에서 이웃 세트 Sy가 정의되고, m + 1 요소 y' = (y1', y2')는 각각이 요소 y 에 관해서 Sx의 상응하는 요소 x'가 x 로부터 갖는 위치와 동일한 위치를 갖는다. 즉, 모든 i에 대해,
yi'- yi = x i'- x i
삭제
(상기에서 언급된 에지 제한의 이유는 물론 이미지 영역 밖으로 확장하는 이웃을 선택하는 것을 피하기 위해서이다.) 단계(104)에서, 카운터 tries는 증가되고, 단계(105)에서 그 값은 충분한 비교가 실행되었는지의 여부를 알기 위해 확인된다.
당분간 그 경우가 아니라고 가정하면, 단계(106)에서 두 개의 세트 Sx, Sy 가 비교된다. 세트 Sx의 요소 x'의 값과 세트 Sy의 상응하게 배치된 요소 y'의 값 사이의 차이가 임계값 δ보다 작다면, 즉
| a( x ')- b( y ') | < δ
삭제
라면, 두 개의 요소는 매칭하는 것으로 간주한다. 두 개의 세트는, 세트 Sx 의 모든 요소 x'가 세트 Sy의 상응하는 요소 y'와 매칭하는 경우에만 매칭하는 것으로 고려된다.
세트가 매칭되지 않으면, 요소 y 는 추가 비교에 대한 후보로서 버려지고, 프로세스는 단계(102)에서 재개되고, 새로운 점 y 가 선택된다. 반대라면, 그들은 매칭되고, 그 다음 y 는 추가 반복을 위해 유지된다. 당분간, 단계(107)을 무시하고, 프로세스는 스코어 V 가 증가되는 단계(108)로 진행한다. 그 다음 다른 이웃세트가 단계(103)에서 생성되고 프로세스가 그 점으로부터 반복된다.
단계(105)에서, 비교 회수의 카운터 tries가 임계값을 초과하는 경우, 현재의 x 에 대한 프로세스는 종료된다: 단계(109)에서, V의 값은 메모리(6) 내에 저장되고, 그 다음 단계(110)에서, 모든 점 x 가 처리되었는가에 대한 체크가 실행된다. 만약 그렇다면, 먼저 (이미지 A의 영상 요소 x 에 대한 모든 개별 스코어 V의 평균인) 평균 스코어 Va가 단계(111)에서 계산되고 프로세스는 단계(112)에서 종료된다; 그렇지 않다면 전체 프로세스는 새로운 점 x 에 대해 단계(100)로부터 반복된다.
단계(105)에서 사용된 임계값은 원하는 비교의 횟수(t)로 설정될 수 있고, 단계(107)가 생략된다. 그러나, 실제상, 우리는 이전의 비교가 종종 매칭을 찾지 못하나, 일단 매칭이 발견되면 상당히 많은 다른 이웃 세트가 동일한 y 와 매칭을 나타낸다는 것을 안다. 쉽게 해석되는 스코어 V를 제공하기 위해, 처음 몇 번의 반복은 스코어가 증가되지 않는다; 도시된 프로세스는 스코어가 최초 init 비교 동안 증가되는 것을 막는 테스트(단계(107))를 포함한다. 따라서, 단계(105)에서 사용된 임계값은 init 만큼 증가되어 최대 포텐셜 스코어가 t가 된다. 이러한 방식으로, 우리는 매우 비슷하거나 동일한 이미지에 대한 높은 또는 최대 스코어를 얻는 기회가 크게 증가함을 알 수 있다.
테스트에서 사용된 다양한 파라미터에 대한 특정 값은 다음과 같다:
이미지 A 크기 xmax
1 x xmax
2: 20 x 20
이미지 B 크기 xmax
1 x xmax
2: 20 x 20
이웃 파라미터 ε: 4
이웃 세트 크기 m : 3
최대값 A - B 시프트 s : 7
비교 회수 t: 50
초기 비교 init : 20
통상, 고선명 이미지에 대해서는, 그에 상응하여ε및 s의 더 큰 값이 선택될 것이다.
동등하게 신뢰할 수 있고 통계적으로 중요한 결과를 얻기 위해 s가 증가함에 따라서, t 및 init 의 값도 증가되어야 한다.
이러한 테스트의 결과는 이후에 주어진다; 여기서, 사용된 매개변수는 상기에서 인용된 그러한 것들과 다르며, 이는 주의해야 한다.
랜덤하게 선택된 많은 Sx가 패턴 B 내에 주어진 y 에 대해 Sy와 매칭된다면, 패턴 A 내의 영상 요소 x 의 스코어는 높음을 알 수 있을 것이다. y 가 유지되지 않고 패턴 A로부터 랜덤하게 선택되는 경우 Sx가 Sy와 매칭되지 않는다면, 패턴 A 내의 영상 요소 x 의 시각적 주의(Visual Attention) 스코어(이전 특허 출원에서 논의됨)는 높다는 것을 유의해야할 가치가 있다. 반대로, 시각적 주의는 단일 이미지 A를 제외하고 메모리가 필요치 않으며, 본 방법은 또한 공통성을 검출하기 위해 패턴 B 내에 포함된 정보를 또한 필요로 한다.
t개의 이웃 세트 Sx의 시퀀스가 패턴 B에서 임의의 y 의 주변의 동일한 이웃의 높은 비율과 매칭된다면, 위치 x 는 인식 주의(cognitive attention)의 가치가 있을 것이다. 도 2에서, m = 3인 영상 요소 x'가 패턴 A의 영상 요소 x 의 이웃에서 선택되고, 패턴 B의 영상 요소 y 의 이웃에서 3개의 영상 요소와 매칭된다. 영상 요소의 각각은 세 개의 색상 휘도를 가질 수 있으므로, a = (ar, ag, ab)이고, 제 2 영상 요소 y 의 이웃 세트는 모든 m+1의 대응하는 영상 요소의 색의 휘도가 서로의 δ내의 값을 갖는다면 제 1에 매칭된다. 일정 범위의 t개의 이웃 세트 Sx에 대해 B의 y 주변의 이웃 세트와 많은 회수의 매칭이 달성되는 A의 영상 요소 x 에는 높은 스코어가 할당된다. 이는 B 내에 존재하는 구조를 갖는 A 내의 이웃 세트에 높은 스코어가 할당될 것임을 의미한다.
몇몇 영상 분석 기법은 모든 영상 요소가 사용되는 이웃인 패치를 사용하여 이미지 사이의 비교 계산을 실행한다. 패치는 상호관계의 측정이 특정 임계값을 초과하는 경우 매칭된다. 이 접근은 상호관계 측정이 특정 텍스쳐(texture)를 식별하기 위해 설계되는 경우를 제외하고 패치의 크기보다 더 작은 상세한 것들을 최적으로 이용하는 것이 불가능하다. 이 방법에서 사용된 랜덤 영상 요소 이웃 Sx는 이러한 단점을 갖지 않는다.
스코어링 메카니즘의 이득은, 매칭이 검출된다면 영상 요소 위치 y 를 유지함으로써, 및 t개의 이웃 세트의 다음 것과 비교를 위해 y 를 재사용함으로써 크게 증가된다. 매칭하는 영상 요소 구성이 생성된다면 다른 구성은 동일한 점에서 다시 매칭될 것이고, 한번 발견되고 재사용된 이러한 위치 y 는, 시퀀스가 잘못된 매칭에 의해 이후에 방해되지 않는다면 스코어의 증가를 가속할 것이다.
그러나, Sx가 그 위치에서 이후 불일치하면, 스코어는 증가되지 않고, 패턴 B 내의 완전히 새로운 위치 y 가 다음 비교를 위해 바로 랜덤하게 선택된다. 이 방식으로, 패턴 B 내의 경쟁하는 위치는, 그들이 패턴 A 내의 x 의 이웃과 공통성을 거의 포함하지 않는다면, 불리하게 선택된다.
이제 몇몇의 가능한 변형이 논의될 것이다.
a) 모든 영상 요소 x 가 분석되는 것은 필수적이지 않다: 따라서, 원한다면, 서브셋이 - 아마도 규칙적인 그리드 상의 - 선택될 수 있다.
b) 상기 방법은 영상 요소에 대한 단일(밝기)값을 가정한다. 컬러 이미지의 경우에, 이미지는 먼저 흑백으로 변환될 수 있다. 선택적으로, 각 영상 요소가 적, 녹 및 청과 같은 세가지 값, 또는 휘도(luminance) 플러스 색상차로 표현된다면, 매칭에 대한 테스트는 3차원의 요소 값들 사이의 거리의 고려를 포함할 수 있다. 예컨대, 컬러 성분 값이 두 개의 이미지에 대해 a = (ar, ag, ab), b = (br, bg, bb) 라면, 매칭에 대한 기준은 (ar - br) < δ및 |ag - bg| < δ 및 |ab - bb| < δ일 수 있다. 거리 측정의 추가 논의에 대해서는 아래를 참고하라.
c) y 를 랜덤하게 선택하는 전략은, 요소 x = (x1, x2)가 요소 y 에 대응하여높은 스코어 V를 생성하고, 및 이웃하는 요소 x (예컨대,(x1+1, x2))가 처리되어야 할 때에는, 이미지 B 내에서 선택되는 제 1 요소 y 는 상응하여 이웃하는 요소(예컨대,(y1+1, y2))가 된다고 가정함으로써 변형될 수 있다. y 의 추가 선택은 이전과 같이 랜덤일 수 있다. 요소 x 에 대한 높은 스코어가 하나 이상의 y 와 비교의 결과로서 생성되는 경우, 어떤 y 이든지 높은 스코어에 가장 큰 기여를 한 것에 이웃하는 요소를 선택할 것이다. 이것을 실현하는 것은, 다른 영상 요소 y 의 좌표 및 그들의 부분 스코어를 일시적으로 추적하는 것이 필요할 수 있다.
d) 프로세스는 반드시 전체 이미지에 대해 실행될 필요는 없다. 예컨대, 이미지 A의 영역이 - 아마도 상기에서 참조된 이전 특허 출원 중의 하나에 설명된 방법을 사용하여 - 특별히 관심이 있는 것으로서 식별된다면 다루어지는 영상 요소 x 는 식별된 영역 내에 놓일 수 있다.
여기서 랜덤은 의사-랜덤 프로세스를 사용한 선택의 가능성을 포함한다.
상기 방법은 이미지, 또는 삼차원 패턴뿐만 아니라, 1차원, 2차원, 3차원 또는 그 이상의 차원의 임의의 순서의 세트의 값에 대해서도 사용될 수 있다.
더욱 일반적으로, 두 개의 패턴 A 및 B 사이의 유사성의 측정치를 생성하길 원한다고 가정하자. 여기서 두 개의 패턴과 한 패턴 내의 개별 패턴 값은 1차원, 2차원 또는 그 이상의 차원을 가질 수 있다.
패턴 A 상의 측정치 a 의 세트를, 경계지워진 n-공간(x1, x2, x3,...,xn)의 A 내의 위치 x 에 상응시키자. 여기서,
x = (x1, x2, x3,..., xn) 및 a = (a1, a2, a3,..., ap)
a 가 존재하는 곳이면 어디에서든지, a = F(x)인 함수 F 를 정의한다. F 의 성질, 예컨대 연속성에 대해서 가정이 이루어질 필요가 없다는 것을 주목해야 하는 것이 중요하다.
다음의 경우에 x 의 이웃 N을 고려한다.
{ x
' ∈ N iff |xi - x'i|< εi ∀ i} .
다음의 경우에 N에서 m + 1의 랜덤 포인트의 세트 Sx 를 선택한다.
Sx = ( x' 1, x' 2, x '3,..., x 'm) 및 F(x' i )가 정의된다.
- 여기서 그러나 x'의 하나가 바람직하게는 x 와 동일하게 강제된다. 동일한 점을 두 번 선택하는 것을 피하기 위해 랜덤 선택을 강제하는 것이 실제로 필요한 것으로 실제로는 발견되지 않는다: 즉, x'i 는 구분될 필요는 없다. 실제로, x'i 는 x 또는 x'1 과 모두 일치할 수 있다.
F 가 정의되는 패턴 B 상의 측정치 b 의 세트에 상응하는 위치 y 를 선택한다.
세트 Sy = { y' 1, y' 2, y '3,..., y 'm}를 정의하며, 이때
x - x ' i = y - y ' i 및 F
(
y
'
i
)가 존재한다.
x 의 이웃 세트 Sx는, 만일
| Fj(x) - Fj(y) |< δj 및 | Fj(x'i) - Fj(y'i) |< δj ∀ i,j
| Fj(x) - Fj(y) |< δj 및 | Fj(x'i) - Fj(y'i) |< δj ∀ i,j
이라면, y 의 세트 Sy와 매칭하는 것으로 본다.
일반적으로, δj는 상수가 아니고 비교되는 측정치에 의존할 것이다. 즉
일반적으로, δj는 상수가 아니고 비교되는 측정치에 의존할 것이다. 즉
δj = fj (F(x), F(y)) j=1...p
몇몇 문제에 대해서는, 개별 구성요소 aj = FJ( )와 bj = FJ( )가 일치하는 것을 요구하는 것으로서 매칭을 정의하는 것보다는 차라리, 도시 블록 거리와 같은 a 와 b 사이의 벡터 거리에 임계값을 적용시키는 것을 더 좋아할 가능성이 있음을 유의해야 한다.
또는 유클리드 거리
도 3의 흐름도에서 설명된 방법의 동작은 다음의 테스트 결과에 의해 설명될 것이다.
테스트에서, 20 x 20 흑백 이미지가 사용되었다(즉, a 및 b의 값은 항상 0 또는 1 중의 하나였다). 그러나 테스트는 흑색 영상 요소만이 스코어 된다는 점에서 이전의 설명과 다르다. - 즉, 매칭 기준은 단지 a=b=1뿐만 아니라 |a-b|<δ이다.
각각의 경우에서, 첨부된 도면은 제 1 이미지(A), 그리고 제 1 이미지 A와 비교되는 B1, B2 등으로 표시된 몇 개의 제 2 이미지(B)를 도시한다(어떤 경우에는, 두 개의 제 1 이미지(A1, A2)가 하나의 이미지 B와 비교된다). 좌표 x1, y1는 좌에서 우로 측정되고, 좌표 x2, y2는 위에서 아래로 측정된다. 제 2 영상의 각각은 평균 스코어(Va)로 표시된다. 몇 개의 도면은 이미지 영역에 대해 개별 스코어 (V)의 삼차원 플롯을 도시한다: 각각의 경우에 우측의 축은 상기 표시의 수평축을 표시하고 정면의 축은 이미지의 수직축을 도시한다. 플롯의 수직축은 V의 값을 표시한다(예 2의 임베디드 인식의 경우에서, 및 다른 경우에서 50-V).
예 1. 광학 문자 인식(도 4)
문자 B의 이미지(A)는 문자 A, B, C, D 및 E의 이미지(B1 - B5)와 비교된다. 순위 분여 평균 스코어(Va)는 B, D, E, C, A에 일치한다. 결과는 t=50, s=3 및 ε= 2에서 생성되었다.
예 2. 임베디드 인식(도 5)
'X' 모양의 이미지(A)는 'X'를 포함하는 9 개의 더 작은 모양을 포함하는 다른 이미지(B1)와 비교된다. 'X' 모양은 변경되는 작은 'X'를 제외한 동일한 9개의 모양을 갖는 이미지(B2)와 다시 비교된다. 평균 스코어(Va)는 각각 27.5와 11.9이고, 전자에서는 'X' 피처의 존재를, 그리고 후자에서는 보다 작은 것을 표시한다. 각각의 비교에 대한 개별 스코어(V)는 차트에 도시되어 있다. 결과는 t=50, s=7 및 ε= 2에서 생성되었다. 임베디드 인식의 더 많은 복잡한 예는 한 무리의 사람중에서 기지의 안면의 식별이다.
예 3. 상표 찾기(도 6)
특별한 십자가 모양의 이미지(A)는 큰 십자가를 포함하는 4 개의 기본 모양 B1-B4 와 먼저 비교되고, 각각의 기본 패턴은 상호 간에 높은 스코어를 갖는 유사한 모양의 클러스터를 표시한다. 큰 십자가는 가장 큰 평균 스코어 Va(43.6)을 생성한다. 동일한 특수한 십자가는 다음에 최대 스코어 50을 얻는 그 자체(B5)의 작은 버전을 포함하는 4개의 다양한 십자가(B5-B8)와 비교된다. 차트는 큰 십자가와 의 비교에서 각 영상 요소에 대한 50-V라는 값을 제공한다 - 큰 칼럼은 십자가의 하부 각부(脚部)의 단부의 불균형을 표시한다. 결과는 t=50, s=7 및 ε= 2에서 생성되었다.
예 4. 지문 인식(도 7)
몇몇이 대량의 유사한 재료를 소유하는 더욱 복잡한 패턴은, 상표의 예에서와 같이 판별 검색될 수 있다. 단순화된 아치 A는 대표적인 아치 B4(49.3)와 가장 잘 매칭되고, 그 다음 다른 아치 중에서 동일한 패턴(49.9)과 매칭된다. 차트는 대표적인 아치 패턴과의 비교에서 각 영상 요소에 대해 (50 - V)의 값을 제공한다 - 키가 큰 칼럼은 융기 단부와의 그리고 경계선상에서의 불균형을 표시한다. 결과는 t=50, s=3 및 ε= 3에서 생성되었다.
예 5. 안면 인식(도 8)
데이터가 극단적으로 단순화되어 있지만, 이 예는 안면 인식의 실현을 나타낸다. 안면(A)는 4개의 대표적인 안면(B1 - B4)과 매칭되고, 그 다음 가장 적합한 대표적인 안면 B2(45.7)에 의해 표시된 서브-클러스터(B5-B8)의 네 개의 안면과 매칭된다. 가장 적합한 것은 서브 클러스터(49.6)의 일치하지 않는 안면(B7)이다. 차트는 두 번째로 가장 가까운 패턴 B6(48.2)와의 비교에서 각 영상 요소에 대해 (50 - V)의 값을 제공한다 - 키 큰 칼럼은 입의 영역에서 불균형을 표시한다. 결과는 t=50, s=3 및 ε= 2에서 생성되었다.
예 6. 감시(도 9)
이 예는 침입자가 가변적인 배경에 대해 어떻게 감지될 수 있는가를 표시한다. 이동하는 구름, 나무 및 펜스를 표시하는 패턴(A1)은 표준 배경(B)에 대해 높은 평균 스코어 Va(48.0)을 얻으나, 침입자가 존재하는 버전(A2)은 훨씬 낮은 스코어(33.1)를 얻는다. 차트는 침입자 이미지(33.1)에서 각 영상 요소에 대해 (50 - V)의 값을 제공한다 - 가장 키가 큰 칼럼은 침입자의 위치를 표시한다. 결과는 t=50, s=3 및 ε= 2에서 생성되었다.
이러한 방법은 척도의 차이에 의해, 국소적인 상대적인 왜곡 및 변형에 의해 영향을 받지 않고서 지각적으로 중대한 공통의 특징 및 차이를 식별하는 두 개의 이미지에 대한 분석을 실행한다. 이것은, 이 방법이, 인식되는 대상이 다른 이미지 내에 매립되어(embedding) 있는 인식의 문제에 적용 가능한 것을 의미한다. 그것은, 이미지가 서로 간의 특징의 유사성의 측정치에 따라 분류되고 및 이들 값들이 멀티클래스 인식 시스템 및 예에 의한 질의(Query By Example) 검색 시스템을 정의하는데 사용될 수도 있음을 의미한다. 마찬가지로, 이 방법은 침입자 감지 또는 위조 감지의 경우에서와 같이 비유사성을 감지하는데 사용될 수 있다. 그것은 또한 모션 또는 시차(視差)를 검출하기 위해 이미지 간의 불균형을 감지하는데 사용될 수도 있다. 그것은 반드시 이미지의 내용의 과거의 지식에 의존할 필요가 없으며 트레이닝 프로세스도 불필요하다. 알고리듬은 병렬 실현에 아주 적합하다.
이제 상술한 방법의 다양한 장점이 설명될 것이다.
패턴 인식
패턴 인식에 대한 표준적 접근은 분류기(classifier)를 위한 트레이닝 프로세스의 요구사항을 만족시키기 위해 모든 클래스로부터의 다수의 대표적 패턴을 필요로 한다. 이러한 분류기는 선택된 특징이 트레이닝 세트에서 적절히 표현되지 않은 보이지 않는 패턴에 특성을 부여하지 않는다면 여전히 실패할 것이다. 이 방법은 트레이닝 세트를 필요로 하지 않고, 비교되는 두 개의 이미지를 저장한다.
분류되는 패턴 사이의 척도 차이에 대한 특별한 대비를 하는 것이 패턴 인식 기법에는 보통이다. 시각 도메인에서의 이러한 차이는 지각적 요인 및 다른 요인 때문에 발생할 수 있고 보상하기 위해 이전 인식이 분류기에 포함되는 것은 일반적이다. 이는 ε이 너무 크지 않으면, 이 방법에서는 필수적이지 않다.
다른 장점은, 지수함수적으로 증가하는 계산 요구 또는 잡음의 영향을 겪지 않고 큰 데이터 구조 내에 삽입된 패턴을 식별하는 능력이다. 그러므로 이 방법은 저작물의의 일부가 거대한 작품(예컨대, 예술의)으로부터 절취된 저작권 침해를 감지하는 문제에, 그리고 복제가 성행하는 것으로 알려진 데이터 베이스의 크기를 줄이는 작업에 대해 적용된다. 그것은 전체적인 인쇄의 일부만이 매칭을 위해 이용가능한 범죄 현장에서 지문을 식별하는 문제에도 직접 적용된다. 안면 인식의 경우에, 방법은 모르는 안면의 제한된 부분에 기초한 탐색에 적합하다. 이 방법은, 예컨대, 탐색은 턱수염 및 콧수염이 모호할 수 있는 경우에 순수하게 단지 눈 및 코 영역에 기초하여 탐색이 실행될 수 있음을 의미한다.
특정의 패턴 내용에 대한 대비가 있지 않으면, 패턴 인식에 대한 표준 템플릿 접근은, 예컨대 와삭와삭 소리 나는 나무, 이동하는 구름, 얼굴 표정의 변화, 불규칙한 표면상의 범죄 현장의 지문, 또는 잡음 등의 시각적인 경우와 같은 지역적인 왜곡 또는 작은 이동 때문에 비교되는 패턴이 다른 때에는 실패한다. 이러한 대비에는 애플리케이션의 사전 지식을 필요로 하고, 눈에 보이지 않는 패턴 왜곡이 시스템 설계의 요구사항과 맞지 않는다면 시스템은 여전히 실패할 것이다. 이 방법은 왜곡의 형태에 대한 사전 지식 없이 지역적 왜곡의 영향을 무시할 수 있다.
방법은 일차원 오디오 신호, 삼차원 비디오 데이터(x, y, 시간), 또는 센서 어레이 등의 임의의 소스로부터의 n-차원 시간 종속 벡터 등의 임의의 차원의 패턴에 적용될 수 있다. 음성 인식의 경우에, 특수한 경험칙을 사용하지 않고 음성의 속도에서의 변동을 다룰 수 있다. 이러한 문제를 극복하기 위해 종래의 접근은 다이나믹 타임 워핑(Dynamic Time Warping)을 사용하지만, 큰 계산적인 노력과 특히 거대한 다중-분류(multi-class) 문제에서 오판별을 증가시키는 워핑 프로세스의 위험을 야기한다. 추가로 발화의 부분은, 그것들이 담화의 영역에서 고유하다면 본 발명을 사용한 워드 식별에 충분할 것이다(예컨대, 최후의 치찰음을 손실한, '예스(yes)' 대신에 '야(yeah)').
이 방법은 각 이미지에서 이웃 스코어를 측정함으로써 이 문제를 다룬다. 한 영상 요소는, (전술한 본인의 이전 특허 출원에서 설명된 것과 같이) 그 이웃이 동일 이미지의 대부분의 다른 부분과 크게 다르다면 단일의 이미지 내에서 중요하지만, 그 이웃이 제 2의 영상에서 한 이웃의 영상 요소와 크게 유사하다면, 그것은 인지적으로 중요하다. 오등록 및 지역적 왜곡의 영향은 스코어가 특정 한계 내에서 영향을 받지 않기 때문에 상당하게 감소된다.
스코어는 서로에 대해 상대적으로 높은 스코어를 소유하는 패턴의 그룹을 밀집시키는데 사용될 수 있다. 각 클러스터로부터 취해진 대표 패턴은 그들 자신이 수퍼-클러스터를 형성하기 위해 밀집될 수 있고 프로세스는 매우 큰 패턴 데이터 베이스를 구조화하기 위해 계속된다. 예에 의한 질의(Query-By-Example) 검색은 최정상 레벨의 대표적인 패턴의 각각에 대해서, 및 그 다음 이전 클러스터 내의 가장 높은 스코어를 얻은 대표적인 패턴에 상응하는 서브-클러스터 내의 대표적인 패턴의 각각에 대해서 스코어를 측정함으로써 실행될 수 있다. 몇몇 대표적인 패턴은, 이러한 대표적인 패턴에 의해 높은 스코어를 우연히 소유하는 패턴을 포함하는 오퍼랩핑(overlapping) 클러스터를 표시할 가능성이 있다. 이 방법은 패턴 내의 관심 영역을 신속히 한정하고 그 다음 이 제한된 영역과 레퍼런스 패턴(B 패턴)의 세트 사이에서 스코어를 도출하기 위해 시각적 주의 메커니즘과 조합하여 사용될 수 있다.
항공술의 상황(context)에서, 비행 물체는 시각적 주의를 사용하여 빠르게 검출될 수 있고, 이후 계산된 스코어는 물체가 새일 가능성이 있는지 또는 비행기 일 가능성이 있는지를 나타낼 수 있을 것이다.
불균형 검출
불균형 검출에 대한 표준적인 접근은, (전체 이미지의 작은 영역에 대해 구분적으로 실행될 수 있는) 뺄셈이 두 개의 이미지 내에 그려진 본래의 오브젝트 상의 동일점에 상응하는 영상 요소 사이에서 발생하도록, 상기 두 개의 이미지 사이의 정확한 등록(registration)에 크게 의존한다. 결과로서 발생한 차이-이미지는 본래의 이미지 내의 차이에 상응하는 그러한 영역을 강조 표시한다. 이것은, 불확실성이 정확한 등록 위치의 예측에 도입되고 그 결과 많은 스퓨리어스(spurious) 차이가 생성될 수 있기 때문에, 잡음이 존재한다면 아주 어렵게 될 것이다.
비록 잡음이 없다 하더라도, 지역적 왜곡 또는 미약한 피사체(subject)의 이동은 오등록(mis-registration)을 야기할 것이고, 왜곡 또는 이동 그 자체가 측정되지 않는다면 중요하지않은 차이의 영역이 강조 표시될 것이다. 뺄셈 전의 선형 또는 비선형 디지털 이미지 등록 기법은 이러한 문제를 부분적으로 보상하나 대부분의 경우[4] 이러한 문제를 제거하지는 않는다.
종래의 방법이 직면한 심각한 문제는 두 개의 이미지가 생성되는 다른 조건으로부터 발생한다. 이러한 차이는 빛, 기후 조건, 미약하게 다른 관찰점, 상이한 필름의 제조원, 또는 다른 광학 시스템을 갖는 다른 카메라로부터 발생할 수 있다. 이러한 간섭은 모두 내용과 관련이 없는 이미지 사이의 스퓨리어스 차이의 생성에 기여한다.
이미지 캡쳐의 조건에 의해 야기되는 두 개의 이미지 사이의 차이는, 이와 같은 차이가 이미지의 모든 부분에 걸쳐 동등하게 스코어에 영향을 미쳐 각각의 스코어의 순위 부여를 교란하지 않을 것이기 때문에, 이 방법에 의해 인자로서 제외된다. 두 개의 이미지 사이의 커다란 조명 차이는 영상 요소 매칭(δj 상기 참조)을 위해 큰 임계값을 사용함으로써 보상된다. 이는, 예컨대 X-레이 노출 시간이 두 개의 이미지 사이에서 다르다면 필수적일 수 있다.
이 방법은 또한 이미지 A가 이미지 B1, B2, B3 등과 비교되는 경우에 복수의 불균형을 검출하는 것이 가능한 장점을 갖는다. 이는 이미지 프레임 B1, B2, B3 등이 상이한 대기 조건 및 기타 통상의 배경 상태의 전형적인 예가 될 수 있고, 및 불균형이 모든 통상의 이미지 프레임 내에서 검출되는 경우에만 경보가 발생하는 CCTV 침입자 검출의 경우에 유용할 것이다.
이 방법들은 패턴 인식을 필요로 하는 이하의 거의 모든 응용에 관련된다:
이 방법들은 패턴 인식을 필요로 하는 이하의 거의 모든 응용에 관련된다:
안면 인식, 지문 인식, OCR, 이미지 검색, 상표 식별, 위조 검출, 감시, 의료적 진단, 및 기타
그들은 병상의 진행을 추적하기 위해 매우 변하기 쉽고 잡음이 있는 이미지의 비교가 필요한 의료 산업에 특히 관련된다. 예컨대, 유방 X선 사진에서 가능성 있는 암의 성장에 대한 식별은 다른 시간에 찍혀진 엑스레이로부터 종종 발견되고, 자동적 보조는 방사선 기사의 처리량을 증가시킬 것이다. 다른 예에서, 대조(contrast) 강화는 통상 대조 주입 이후에 촬영된 이미지로부터 통상의 흉부의 엑스레이 이미지를 뺌으로써 얻어지고, 적절한 등록(registration)을 얻는 것은 어려울 뿐만 아니라 프로세스의 성공에도 중요하다. 이상 설명한 방법은 수반되는 등록의 문제없이 더욱 깨끗한 결과를 제공할 수 있다.
유방 엑스선 사진에 대한 진보된 소프트웨어 검출시스템(예컨대, http://www.r2tech.com/prd/)은 암에 일반적으로 연관된 특정의 피처를 정확히 발견할 수 있으나, 시간적 비교의 문제는 대개 해결되지 않는다.
참고문헌
[1] Vailaya A et al., Image Classification for Content-Based Indexing, IEEE Trans on Image Processing, Vol 10, No 1, pp 117 - 130, Jan 2001.
[2] Santini S & Jain R, Similarity Matching, in Proc 2nd Asian Conf on Computer Vision, pages II 544 - 548, 1995.
[3] IEEE Trans PAMI - Special Section on Video Surveillance, vol 22 No 8, Aug 2000.
[4] Brown L G, A survey of image registration techniques, ACM Computing Surveys, Vol. 24, No. 4(Dec. 1992), pp. 325 - 376.
Claims (10)
- 각각이 값을 갖는 요소들의 제 1 배열 세트에 의해 표시된 제 1 패턴과 각각이 값을 갖는 요소들의 제 2 배열 세트에 의해 표시된 제 2 패턴을 비교하는 방법에 있어서,상기 제 1 배열 세트의 요소들 중의 각각의 요소에 대해,(ⅰ) 상기 제 1 배열 세트로부터, 상기 각각의 요소의 근처에서 복수의 요소들을 선택하되, 선택된 복수의 요소들은 상기 제 1 배열 세트 내에서 상기 각각의 요소에 대하여 각각 서로 다른 위치를 갖도록 선택하는 단계,(ⅱ) 상기 제 2 배열 세트로부터 요소를 선택하는 단계,(ⅲ) 상기 제 1 배열 세트로부터 선택된 복수의 요소들과 상기 제 2 배열 세트의 동일한 복수의 요소를 비교하되,상기 제 2 배열 세트의 동일한 복수의 요소들이 제 2 배열 세트에서 선택된 요소에 대해 각각 가지는 상기 제 2 배열 세트 내에서의 위치는 상기 제 1 배열 세트에서 선택된 복수의 요소들이 상기 각각의 요소에 대해 각각 가지는 위치와 같도록 하고,상기 제 1 배열 세트에서 선택된 복수의 요소들의 각각의 값과, 상기 제 1 배열 세트의 복수의 요소들의 각각과 서로 대응하는 위치에 배치된 상기 제 2 배열 세트의 동일한 복수의 요소들의 값을 미리 결정된 매칭 기준에 따라 비교하여, 상기 제 1 배열 세트의 복수의 요소들이 상기 제 2 배열 세트의 복수의 요소들과 매칭하는지의 판단을 생성하는 비교 단계,(ⅳ) 상기 단계 (i)의 결과로서, 상기 제 1 배열 세트의 상기 복수의 요소들을 새롭게 선택하는 것 및 상기 단계 (ii)의 결과로서, 상기 제 2 배열 세트의 요소를 새롭게 선택하는 것 중 적어도 하나를 실행하여 상기 비교 단계 (iii)을 반복하는 단계, 및(ⅴ) 상기 각각의 요소에 대하여, 상기 비교가 매칭을 표시하는 비교 횟수의 함수로서 유사성 측정치를 생성하는 단계를 포함하는 것을 특징으로 하는 패턴 비교 방법.
- 제 1 항에 있어서,상기 제 1 배열 세트의 상기 복수의 요소들은 상기 각각의 요소를 포함하는 것을 특징으로 하는 패턴 비교 방법.
- 제 1 항 또는 제 2 항 있어서,상기 제 1 배열 세트의 복수의 요소들의 선택은 랜덤 또는 의사-랜덤(pseudo-random)인 것을 특징으로 하는 패턴 비교 방법.
- 제 1 항에 있어서,상기 제 2 배열 세트의 요소의 선택은 랜덤 또는 의사-랜덤(pseudo-random)인 것을 특징으로 하는 패턴 비교 방법.
- 제 1 항에 있어서,매칭한다는 판단을 생성한 비교에 이어져서, 상기 제 1 배열 세트의 새롭게 선택된 복수의 요소들과 상기 제 2 배열 세트의 동일하게 선택된 요소를 비교하는 단계를 추가로 포함하는 것을 특징으로 하는 패턴 비교 방법.
- 제 1 항에 있어서,매칭이 없다는 판단을 생성한 비교에 이어져서, 상기 제 2 배열 세트의 새롭게 선택된 요소와 상기 제 1 배열 세트의 동일하게 선택된 상기 복수의 요소들을 비교하는 단계를 추가로 포함하는 것을 특징으로 하는 패턴 비교 방법.
- 제 1 항에 있어서,각각의 값은 하나 이상의 성분을 포함하는 것을 특징으로 패턴 비교 방법.
- 제 1 항에 있어서,상기 비교는 미리 결정된 횟수로 실행되는 것을 특징으로 하는 패턴 비교 방법.
- 제 1 항에 있어서,상기 유사성 측정치는 비교의 최초 횟수를 제외하는, 상기 비교가 매칭을 표시하는 비교 횟수의 함수인 것을 특징으로 하는 패턴 비교 방법.
- 제 1 항에 있어서,상기 각각의 요소 중 하나로부터 매칭이 다수 존재한다는 것을 표시하는 유사성 측정치가 생성되고, 상기 제 1 배열 세트의 추가 요소가 고려될 때,제 1 배열 세트의 추가 요소와의 비교를 위하여 상기 제 2 배열 세트에서 하나의 요소를 최초로 선택하는 것은,상기 제 1 배열 세트의 추가 요소가 이전의 상기 각각의 요소 중 하나에 대하여 상기 제 1 배열 세트에서 가지는 위치와, 상기 제 2 배열 세트에서 최초로 선택되는 요소가 상기 매칭이 다수 존재한다는 것을 발생시킨 상기 제 2 배열 세트의 요소에 대하여 제 2 배열 세트 내에서 가지는 위치가 동일하도록 선택되는 것을 특징으로 하는 패턴 비교 방법.
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
EP02252097 | 2002-03-22 | ||
EP02252097.7 | 2002-03-22 | ||
PCT/GB2003/001209 WO2003081523A1 (en) | 2002-03-22 | 2003-03-21 | Comparing patterns |
Publications (2)
Publication Number | Publication Date |
---|---|
KR20040105793A KR20040105793A (ko) | 2004-12-16 |
KR100976930B1 true KR100976930B1 (ko) | 2010-08-18 |
Family
ID=28051832
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020047015012A KR100976930B1 (ko) | 2002-03-22 | 2003-03-21 | 패턴 비교 방법 |
Country Status (11)
Country | Link |
---|---|
US (1) | US7570815B2 (ko) |
EP (1) | EP1488371B1 (ko) |
JP (1) | JP4202271B2 (ko) |
KR (1) | KR100976930B1 (ko) |
CN (1) | CN1322471C (ko) |
AT (1) | ATE315257T1 (ko) |
AU (1) | AU2003215755A1 (ko) |
CA (1) | CA2479223C (ko) |
DE (1) | DE60303138T2 (ko) |
ES (1) | ES2256768T3 (ko) |
WO (1) | WO2003081523A1 (ko) |
Families Citing this family (20)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CA2478243C (en) | 2002-03-22 | 2012-07-24 | British Telecommunications Public Limited Company | Anomaly recognition |
KR100976930B1 (ko) | 2002-03-22 | 2010-08-18 | 브리티쉬 텔리커뮤니케이션즈 파블릭 리미티드 캄퍼니 | 패턴 비교 방법 |
GB0229625D0 (en) | 2002-12-19 | 2003-01-22 | British Telecomm | Searching images |
GB0328326D0 (en) | 2003-12-05 | 2004-01-07 | British Telecomm | Image processing |
EP1789910B1 (en) | 2004-09-17 | 2008-08-13 | British Telecommunications Public Limited Company | Analysis of patterns |
US8156116B2 (en) | 2006-07-31 | 2012-04-10 | Ricoh Co., Ltd | Dynamic presentation of targeted information in a mixed media reality recognition system |
US7702673B2 (en) * | 2004-10-01 | 2010-04-20 | Ricoh Co., Ltd. | System and methods for creation and use of a mixed media environment |
EP1732030A1 (en) * | 2005-06-10 | 2006-12-13 | BRITISH TELECOMMUNICATIONS public limited company | Comparison of patterns |
US8135210B2 (en) * | 2005-07-28 | 2012-03-13 | British Telecommunications Public Limited Company | Image analysis relating to extracting three dimensional information from a two dimensional image |
EP1798961A1 (en) * | 2005-12-19 | 2007-06-20 | BRITISH TELECOMMUNICATIONS public limited company | Method for focus control |
US8208764B2 (en) * | 2006-01-21 | 2012-06-26 | Elizabeth Guckenberger | Photo automatic linking system and method for accessing, linking, and visualizing “key-face” and/or multiple similar facial images along with associated electronic data via a facial image recognition search engine |
US20080049969A1 (en) * | 2006-08-25 | 2008-02-28 | Jason David Koziol | Methods And Systems For Generating A Symbol Identification Challenge For An Automated Agent |
US20100284598A1 (en) * | 2008-01-18 | 2010-11-11 | Koninklijke Philips Electronics N.V. | Image registration alignment metric |
KR101375186B1 (ko) * | 2009-07-14 | 2014-04-01 | 삼성테크윈 주식회사 | 감시 카메라 교란 검출 방법 |
US8724910B1 (en) * | 2010-08-31 | 2014-05-13 | Google Inc. | Selection of representative images |
US9058331B2 (en) | 2011-07-27 | 2015-06-16 | Ricoh Co., Ltd. | Generating a conversation in a social network based on visual search results |
US9674543B2 (en) | 2012-11-14 | 2017-06-06 | Samsung Electronics Co., Ltd. | Method for selecting a matching block |
US9245192B2 (en) | 2013-09-20 | 2016-01-26 | Here Global B.V. | Ad collateral detection |
US9818205B2 (en) * | 2016-02-19 | 2017-11-14 | Ppg Industries Ohio, Inc. | Simplified texture comparison engine |
CN108362504B (zh) * | 2018-01-09 | 2019-10-29 | 北京荣之联科技股份有限公司 | 车辆平稳性评估方法及装置 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH06245064A (ja) * | 1992-12-25 | 1994-09-02 | Omron Corp | 画像処理装置及びシステム並びにそれを用いた複写機 |
JPH0727537A (ja) * | 1993-07-14 | 1995-01-27 | Matsushita Electric Ind Co Ltd | 形状検出方法 |
JP2000512790A (ja) | 1997-04-15 | 2000-09-26 | インターバル リサーチ コーポレイション | データ処理システムおよび方法 |
Family Cites Families (47)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
DE2256617C3 (de) | 1971-11-19 | 1978-08-31 | Hitachi, Ltd., Tokio | Einrichtung zur Analyse einer Vorlage |
WO1982001434A1 (en) | 1980-10-20 | 1982-04-29 | Rockwell International Corp | Fingerprint minutiae matcher |
AU567678B2 (en) | 1982-06-28 | 1987-12-03 | Nec Corporation | Device for matching finerprints |
US5113454A (en) | 1988-08-19 | 1992-05-12 | Kajaani Electronics Ltd. | Formation testing with digital image analysis |
GB8821024D0 (en) | 1988-09-07 | 1988-10-05 | Etherington H J | Image recognition |
JPH03238533A (ja) | 1990-02-15 | 1991-10-24 | Nec Corp | マイクロコンピュータ |
US5200820A (en) | 1991-04-26 | 1993-04-06 | Bell Communications Research, Inc. | Block-matching motion estimator for video coder |
JP3106006B2 (ja) | 1992-06-24 | 2000-11-06 | キヤノン株式会社 | 電子スチルカメラ |
US5303885A (en) | 1992-12-14 | 1994-04-19 | Wade Lionel T | Adjustable pipe hanger |
US5790413A (en) | 1993-03-22 | 1998-08-04 | Exxon Chemical Patents Inc. | Plant parameter detection by monitoring of power spectral densities |
US6169995B1 (en) | 1994-03-17 | 2001-01-02 | Hitachi, Ltd. | Link information maintenance management method |
JP3333839B2 (ja) * | 1994-04-19 | 2002-10-15 | 松下電器産業株式会社 | 補間ライン検出方法及び補間ライン検出装置 |
US5613014A (en) * | 1994-10-12 | 1997-03-18 | Martin Marietta Corp. | Fingerprint matching system |
JPH08248303A (ja) | 1995-03-07 | 1996-09-27 | Minolta Co Ltd | 焦点検出装置 |
CA2148340C (en) | 1995-05-01 | 2004-12-07 | Gianni Di Pietro | Method and apparatus for automatically and reproducibly rating the transmission quality of a speech transmission system |
GB2305050A (en) | 1995-09-08 | 1997-03-26 | Orad Hi Tec Systems Ltd | Determining the position of a television camera for use in a virtual studio employing chroma keying |
JP3002721B2 (ja) | 1997-03-17 | 2000-01-24 | 警察庁長官 | 図形位置検出方法及びその装置並びにプログラムを記録した機械読み取り可能な記録媒体 |
JP3580670B2 (ja) | 1997-06-10 | 2004-10-27 | 富士通株式会社 | 入力画像を基準画像に対応付ける方法、そのための装置、及びその方法を実現するプログラムを記憶した記憶媒体 |
US6078680A (en) | 1997-07-25 | 2000-06-20 | Arch Development Corporation | Method, apparatus, and storage medium for detection of nodules in biological tissue using wavelet snakes to characterize features in radiographic images |
JPH11306022A (ja) * | 1998-04-16 | 1999-11-05 | Matsushita Electric Ind Co Ltd | エージェント知識利用方法及び装置 |
WO1999060517A1 (en) | 1998-05-18 | 1999-11-25 | Datacube, Inc. | Image recognition and correlation system |
US6240208B1 (en) | 1998-07-23 | 2001-05-29 | Cognex Corporation | Method for automatic visual identification of a reference site in an image |
ATE475260T1 (de) | 1998-11-25 | 2010-08-15 | Iridian Technologies Inc | Schnelles fokusbeurteilungssystem und -verfahren zur bilderfassung |
US6512850B2 (en) * | 1998-12-09 | 2003-01-28 | International Business Machines Corporation | Method of and apparatus for identifying subsets of interrelated image objects from a set of image objects |
US6282317B1 (en) | 1998-12-31 | 2001-08-28 | Eastman Kodak Company | Method for automatic determination of main subjects in photographic images |
US6480629B1 (en) * | 1999-04-06 | 2002-11-12 | Koninklijke Philips Electronics N.V. | Motion estimation method using orthogonal-sum block matching |
US6483937B1 (en) * | 1999-06-17 | 2002-11-19 | International Business Machines Corporation | Process for inspecting an object |
US6389417B1 (en) | 1999-06-29 | 2002-05-14 | Samsung Electronics Co., Ltd. | Method and apparatus for searching a digital image |
US6839454B1 (en) | 1999-09-30 | 2005-01-04 | Biodiscovery, Inc. | System and method for automatically identifying sub-grids in a microarray |
AU1047901A (en) | 1999-10-22 | 2001-04-30 | Genset | Methods of genetic cluster analysis and use thereof |
US6499009B1 (en) | 1999-10-29 | 2002-12-24 | Telefonaktiebolaget Lm Ericsson | Handling variable delay in objective speech quality assessment |
US7142689B2 (en) * | 2000-01-31 | 2006-11-28 | Canon Kabushiki Kaisha | Image processing apparatus for determining specific images |
US20010013895A1 (en) | 2000-02-04 | 2001-08-16 | Kiyoharu Aizawa | Arbitrarily focused image synthesizing apparatus and multi-image simultaneous capturing camera for use therein |
EP1126411A1 (en) * | 2000-02-17 | 2001-08-22 | BRITISH TELECOMMUNICATIONS public limited company | Visual attention location system |
CA2400085C (en) | 2000-02-17 | 2008-02-19 | British Telecommunications Public Limited Company | Visual attention system |
US6778699B1 (en) | 2000-03-27 | 2004-08-17 | Eastman Kodak Company | Method of determining vanishing point location from an image |
JP2002050066A (ja) | 2000-08-01 | 2002-02-15 | Nec Corp | 光ピックアップ回路及び光ピックアップ方法 |
CA2421292C (en) * | 2000-09-08 | 2008-02-12 | British Telecommunications Public Limited Company | Analysing a moving image |
US6670963B2 (en) | 2001-01-17 | 2003-12-30 | Tektronix, Inc. | Visual attention model |
WO2002098137A1 (en) | 2001-06-01 | 2002-12-05 | Nanyang Technological University | A block motion estimation method |
EP1286539A1 (en) | 2001-08-23 | 2003-02-26 | BRITISH TELECOMMUNICATIONS public limited company | Camera control |
CA2478243C (en) | 2002-03-22 | 2012-07-24 | British Telecommunications Public Limited Company | Anomaly recognition |
KR100976930B1 (ko) | 2002-03-22 | 2010-08-18 | 브리티쉬 텔리커뮤니케이션즈 파블릭 리미티드 캄퍼니 | 패턴 비교 방법 |
DE10251787A1 (de) | 2002-11-05 | 2004-05-19 | Philips Intellectual Property & Standards Gmbh | Verfahren, Vorrichtung und Computerprogramm zur Erfassung von Punktkorrespondenzen in Punktmengen |
GB0229625D0 (en) | 2002-12-19 | 2003-01-22 | British Telecomm | Searching images |
GB0328326D0 (en) | 2003-12-05 | 2004-01-07 | British Telecomm | Image processing |
EP1789910B1 (en) | 2004-09-17 | 2008-08-13 | British Telecommunications Public Limited Company | Analysis of patterns |
-
2003
- 2003-03-21 KR KR1020047015012A patent/KR100976930B1/ko active IP Right Grant
- 2003-03-21 WO PCT/GB2003/001209 patent/WO2003081523A1/en active IP Right Grant
- 2003-03-21 US US10/507,598 patent/US7570815B2/en active Active
- 2003-03-21 AU AU2003215755A patent/AU2003215755A1/en not_active Abandoned
- 2003-03-21 EP EP03744905A patent/EP1488371B1/en not_active Expired - Lifetime
- 2003-03-21 AT AT03744905T patent/ATE315257T1/de not_active IP Right Cessation
- 2003-03-21 JP JP2003579167A patent/JP4202271B2/ja not_active Expired - Lifetime
- 2003-03-21 CA CA2479223A patent/CA2479223C/en not_active Expired - Fee Related
- 2003-03-21 DE DE60303138T patent/DE60303138T2/de not_active Expired - Lifetime
- 2003-03-21 CN CNB038067366A patent/CN1322471C/zh not_active Expired - Fee Related
- 2003-03-21 ES ES03744905T patent/ES2256768T3/es not_active Expired - Lifetime
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH06245064A (ja) * | 1992-12-25 | 1994-09-02 | Omron Corp | 画像処理装置及びシステム並びにそれを用いた複写機 |
JPH0727537A (ja) * | 1993-07-14 | 1995-01-27 | Matsushita Electric Ind Co Ltd | 形状検出方法 |
JP2000512790A (ja) | 1997-04-15 | 2000-09-26 | インターバル リサーチ コーポレイション | データ処理システムおよび方法 |
Also Published As
Publication number | Publication date |
---|---|
JP2005521165A (ja) | 2005-07-14 |
EP1488371B1 (en) | 2006-01-04 |
EP1488371A1 (en) | 2004-12-22 |
ATE315257T1 (de) | 2006-02-15 |
US20050169535A1 (en) | 2005-08-04 |
US7570815B2 (en) | 2009-08-04 |
DE60303138T2 (de) | 2006-08-31 |
DE60303138D1 (de) | 2006-03-30 |
JP4202271B2 (ja) | 2008-12-24 |
CN1322471C (zh) | 2007-06-20 |
KR20040105793A (ko) | 2004-12-16 |
WO2003081523A1 (en) | 2003-10-02 |
CA2479223C (en) | 2012-09-04 |
AU2003215755A1 (en) | 2003-10-08 |
CN1643540A (zh) | 2005-07-20 |
ES2256768T3 (es) | 2006-07-16 |
CA2479223A1 (en) | 2003-10-02 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR100976930B1 (ko) | 패턴 비교 방법 | |
Ehret et al. | Image anomalies: A review and synthesis of detection methods | |
JP4479478B2 (ja) | パターン認識方法および装置 | |
KR100361497B1 (ko) | 얼굴영역 추출방법 | |
Paclík et al. | Building road-sign classifiers using a trainable similarity measure | |
US8116534B2 (en) | Face recognition apparatus and face recognition method | |
US7376270B2 (en) | Detecting human faces and detecting red eyes | |
Wang et al. | An effective method for plate number recognition | |
US20110044536A1 (en) | Pixel-level based micro-feature extraction | |
US7620249B2 (en) | Analysis of patterns | |
WO2009109127A1 (en) | Real-time body segmentation system | |
Jayaraman et al. | An efficient color and texture based iris image retrieval technique | |
Vijayalakshmi | Comparison of viola-jones and kanade-lucas-tomasi face detection algorithms | |
Andiani et al. | Face recognition for work attendance using multitask convolutional neural network (MTCNN) and pre-trained facenet | |
Atrish et al. | An automated hierarchical framework for player recognition in sports image | |
Cho et al. | A comparison of rule-based, k-nearest neighbor, and neural net classifiers for automated industrial inspection | |
Nezhadian et al. | Palmprint verification based on textural features by using Gabor filters based GLCM and wavelet | |
Akinyemi et al. | A computational face alignment method for improved facial age estimation | |
Hadjkacem et al. | Multi-shot human re-identification using a fast multi-scale video covariance descriptor | |
Huang et al. | Detecting both superimposed and scene text with multiple languages and multiple alignments in video | |
Goldmann et al. | Robust face detection based on components and their topology | |
Bhatia et al. | Pattern recognition by cluster accumulation | |
CN117372953A (zh) | 基于二次目标跟踪算法的离岗检测方法 | |
Qin et al. | Adaptable models and semantic filtering for object recognition in street images | |
Lee et al. | Tracking and Face Recognition of Multiple People Based on GMM, LKT and PCA |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A201 | Request for examination | ||
E902 | Notification of reason for refusal | ||
E701 | Decision to grant or registration of patent right | ||
GRNT | Written decision to grant | ||
FPAY | Annual fee payment |
Payment date: 20130801 Year of fee payment: 4 |
|
FPAY | Annual fee payment |
Payment date: 20150730 Year of fee payment: 6 |
|
FPAY | Annual fee payment |
Payment date: 20160804 Year of fee payment: 7 |
|
FPAY | Annual fee payment |
Payment date: 20170803 Year of fee payment: 8 |
|
FPAY | Annual fee payment |
Payment date: 20180802 Year of fee payment: 9 |