KR20120138635A - 영상 처리 방법, 영상 처리 장치 및 스캐너 - Google Patents

영상 처리 방법, 영상 처리 장치 및 스캐너 Download PDF

Info

Publication number
KR20120138635A
KR20120138635A KR1020120050398A KR20120050398A KR20120138635A KR 20120138635 A KR20120138635 A KR 20120138635A KR 1020120050398 A KR1020120050398 A KR 1020120050398A KR 20120050398 A KR20120050398 A KR 20120050398A KR 20120138635 A KR20120138635 A KR 20120138635A
Authority
KR
South Korea
Prior art keywords
foreground
edge map
pixel
image
boundary
Prior art date
Application number
KR1020120050398A
Other languages
English (en)
Inventor
슈후 시에
유안 헤
준 선
하오 유
사또시 나오이
Original Assignee
후지쯔 가부시끼가이샤
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 후지쯔 가부시끼가이샤 filed Critical 후지쯔 가부시끼가이샤
Publication of KR20120138635A publication Critical patent/KR20120138635A/ko

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/10Segmentation; Edge detection
    • G06T7/12Edge-based segmentation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • H04N1/387Composing, repositioning or otherwise geometrically modifying originals

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Image Analysis (AREA)
  • Image Processing (AREA)
  • Editing Of Facsimile Originals (AREA)

Abstract

영상 처리 방법은 영상에서의 전경 객체(foreground object)의 에지 맵(edge map)을 결정하는 단계, 에지 맵으로부터 경계선에 대한 후보들을 획득하고 경계선에 대한 후보들 중에서 경계선을 결정하는 단계 - 경계선은 전경 객체에서의 특정의 객체의 경계를 정의함 -, 및 특정의 객체 이외에 경계선을 넘어선 전경 객체를 제거하는 단계를 포함한다. 이 방법은 특정의 객체의 경계를 넘어선 캡처된 영상에서의 다른 객체(예컨대, 손, 기타)의 영상을 제거하는 것에 적용될 수 있다. 본 발명의 실시예에 따른 영상 처리 방법에 의해, 경계를 넘어선 다른 객체를 제거하고 후속하는 다른 영상 처리를 용이하게 해주기 위해 영상에서의 특정의 객체의 경계가 정확하게 결정될 수 있다.

Description

영상 처리 방법, 영상 처리 장치 및 스캐너{IMAGE PROCESSING METHOD, IMAGE PROCESSING DEVICE AND SCANNER}
본 발명은 일반적으로 영상 처리 분야에 관한 것으로서, 상세하게는 특정의 객체의 경계를 넘어선 다른 객체를 캡처된 영상으로부터 제거하는 방법에 관한 것이다.
두꺼운 문서의 영상이 카메라 또는 스캐너로 캡처될 때, 사용자는, 도 1(a)에 나타낸 바와 같이, 문서의 양면을 손으로 누르거나 또는 어떻게든 문서를 평평하게 유지하려는 경향이 있다. 문서의 영상에 손 또는 어떤 다른 것이 존재하는 것은 어떤 후속 프로세스 - 예를 들어, 문서의 상단을 위치 확인하는 것, 문서의 영상을 보정하는 것 등 - 의 결과에 영향을 줄지도 모른다. 도 1(b)에 예시된 바와 같이, 손의 존재로 인해 책의 코너 지점의 검출에 대한 영향이 있음으로써 위치 확인된 코너 지점이 실제의 코너 지점으로부터 얼마간 벗어나게 된다. 따라서, 손의 존재로 인한 후속 프로세스의 결과에 대한 영향을 최소화하기 위해, 특정의 객체[예컨대, 도 1(b)의 책 등]의 경계를 넘어선 영상 내의 손이 제거되어야만 한다.
종래의 손 검출 방법은 2가지 일반 카테고리에 속하며, 그 중 하나는 많은 훈련 데이터로부터 피부색 모델을 생성하고 영상의 픽셀을 분류하여 손의 영역을 검출하는 것이고, 다른 하나는 많은 훈련 데이터로부터 통계적 모델을 생성하고 손을 검출하며 손의 영역이 검출된 후에 피부색 모델을 사용하여 정확하게 손의 경계를 추가로 위치 확인하는 것이다. 제1 카테고리의 방법은 영상에서의 손의 색상이 피부색 모델로 충분히 모델링되어 테스트될 수 없거나 손의 영역 이외에 피부의 색상과 유사한 색상의 많은 영역이 있는 경우에 실패할 가능성이 많을 정도로 훈련 데이터의 영향을 많이 받는다는 단점을 가지며, 제2 카테고리의 방법은 강한 분류 능력을 갖는 분류기를 학습시키는 데 많은 훈련 데이터를 필요로 하고 아주 다양한 손의 모습으로 인해 그의 유효성이 보장될 수 없다는 단점을 가진다.
이상의 문제점을 고려하여, 본 발명의 실시예는, 손의 영역 또는 특정의 객체 이외의 다른 객체를 영상으로부터 간접적으로 제거하기 위해, 영상에서 특정의 객체의 경계 내에 있는 영역을 보존하는 것을 제안한다. 본 발명의 실시예에 따르면, 인기가 높은 편리하고 신속한 프로세스를 수행하기 위해 모델을 생성하는 데 많은 오프라인 훈련 데이터를 필요로 하지 않고 문서의 경계가 현재의 영상으로부터 적합화(fitting)된다. 게다가, 다른 객체의 영역을 제거하는 이 기법에 의해 영상 처리의 효율성 및 정확성이 상당히 개선될 수 있다.
본 발명의 일 실시예에 따르면, 영상 처리 방법이 제공되며, 이 영상 처리 방법은 영상에서의 전경 객체(foreground object)의 에지 맵(edge map)을 결정하는 단계, 에지 맵으로부터 경계선에 대한 후보들을 획득하고 경계선에 대한 후보들 중에서 경계선을 결정하는 단계 - 경계선은 전경 객체에서의 특정의 객체의 경계를 정의함 -, 및 특정의 객체 이외에 경계선을 넘어선 전경 객체를 제거하는 단계를 포함한다.
본 발명의 다른 실시예에 따르면, 영상 처리 장치가 제공되며, 이 영상 처리 장치는 영상에서의 전경 객체의 에지 맵을 결정하는 에지 맵 결정 수단, 에지 맵으로부터 경계선에 대한 후보들을 획득하고 경계선에 대한 후보들 중에서 경계선을 결정하는 경계선 결정 수단 - 경계선은 전경 객체에서의 특정의 객체의 경계를 정의함 -, 및 특정의 객체 이외에 경계선을 넘어선 전경 객체를 제거하는 제거 수단을 포함한다.
본 발명의 또 다른 실시예에 따르면, 기계에 의해 판독되어 실행될 때 상기 영상 처리 방법을 수행하는 기계 판독가능 명령어 코드가 저장되어 있는 프로그램 제품이 제공된다.
본 발명의 추가적인 실시예에 따르면, 본 발명의 실시예에 따른 상기 프로그램 제품이 구현되어 있는 저장 매체가 제공된다.
동일하거나 유사한 기술적 특징 또는 구성요소가 동일하거나 유사한 참조 번호로 표시되어 있는 도면을 참조하여, 본 발명의 상기한 및 기타 목적 및 이점에 대해 그의 실시예와 관련하여 이하에서 더 기술할 것이다.
도 1(a)는 책을 평평하게 유지하기 위해 책의 양면을 손으로 누르는 것을 나타낸 개략도.
도 1(b)는 책의 경계 상에 손이 존재하는 것으로 인해 코너 지점을 잘못 판단하는 것을 나타낸 개략도.
도 2는 본 발명의 일 실시예에 따른, 도 1(a)에 예시된 경계를 넘어선 손을 제거하는 프로세스의 개략도.
도 3은 입력 영상으로부터 에지 맵을 결정하는 프로세스를 나타낸 플로우차트.
도 4(a) 및 도 4(b)는 원시 영상(raw image)과 이진 마스킹된 영상(binary masked image) 사이의 비교를 나타낸 예시적인 도면.
도 5(a) 및 도 5(b)는 획득된 좌측 및 우측 에지 맵을 나타낸 예시적인 도면이고, 도 5(c) 및 도 5(d)는 좌측 및 우측 에지 맵으로부터 적합화(fitting)에 의해 획득된 경계선에 대한 후보를 나타낸 예시적인 도면.
도 6a 및 도 6b는 에지 맵으로부터 경계선을 결정하는 프로세스를 나타낸 플로우차트.
도 7(a)는 적합화된 선의 2개의 측면에서 취해진 특정의 폭의 영역을 얻는 것을 나타낸 예시적인 도면이고, 도 7(b)는 적합화된 선의 2개의 측면에서 특징 벡터를 획득하는 것을 나타낸 예시적인 도면.
도 8(a) 및 도 8(b)는 원시 영상과 손이 제거된 영상 사이의 비교를 나타낸 예시적인 도면.
도 9는 본 발명의 다른 실시예에 따른 영상 처리 장치의 구성 블록도.
도 10a 및 도 10b는, 각각, 본 발명의 다른 실시예에 따른, 영상 처리 장치에서의 에지 맵 결정 수단을 나타낸 구성 블록도.
도 11은 본 발명의 다른 실시예에 따른, 영상 처리 장치에서의 경계선 결정 수단을 나타낸 구성 블록도.
도 12는 본 발명의 실시예에 따른 영상 처리 방법이 구현될 수 있는 범용 컴퓨터 시스템을 나타낸 개략 구조도.
본 발명의 실시예가 도면을 참조하여 이하에서 기술될 것이다. 주목할 점은, 본 발명의 해결책과 밀접한 관련이 있는 장치 구조 및/또는 프로세스만이 도면에 예시되어 있는 반면, 본 발명에 덜 관련되어 있는 다른 상세가 불필요한 상세로 인해 본 발명을 모호하게 하지 않기 위해 생략되어 있다는 것이다. 도면 전체에 걸쳐, 동일하거나 유사한 성분 요소 또는 구성요소가 동일하거나 유사한 참조 번호로 표시될 것이다.
본 발명의 일 실시예에 따르면, 영상 처리 방법이 제공되고, 이 영상 처리 방법은 영상에서의 전경 객체의 에지 맵을 결정하는 단계(S210), 에지 맵으로부터 경계선에 대한 후보들을 획득하고 경계선에 대한 후보들 중에서 경계선을 결정하는 단계 - 경계선은 전경 객체에서의 특정의 객체의 경계를 정의함 - (S220), 및 특정의 객체 이외에 경계선을 넘어선 전경 객체를 제거하는 단계(S230)를 포함한다.
본 발명의 실시예가 영상에서의 불특정의 객체 - 즉, 도 1(a)에 예시된 책의 경계를 넘어선 손 - 가 제거되어 있는 일례로서 도면을 참조하여 이하에서 상세히 논의될 것이다. 책 및 손 둘다가 도 1(a)에서 전경 객체이다. 물론, 당업자라면 본 발명의 실시예에 따른 영상 처리 방법이 또한 손 이외에 책의 경계를 넘어선 다른 객체를 제거하는 데 적용가능할 수 있다는 것을 잘 알 것이다. 게다가, 다른 객체의 영역을 제거하기 위해 경계가 결정되어야 하는 특정의 객체가 책으로 제한되지 않을 것이고 필요에 따라 영상에서의 어떤 전경 객체라도 될 수 있다.
이 실시예에서, 책의 좌측 및 우측 경계가 결정될 필요가 있고 좌측 및 우측 경계를 넘어선 손의 영역이 제거되어야 하는 것으로 가정된다. 그렇지만, 당업자라면 본 발명의 실시예에 따른 영상 처리 방법이 이와 유사하게 영상에서의 책의 상부 및 하부 경계 상에 있는 손 또는 다른 객체에도 적용가능할 수 있다는 것을 잘 알 것이다.
도 2에서의 각자의 프로세스의 다양한 구현에 대해 이하에서 상세히 논의할 것이다.
먼저, 에지 맵이 결정되는 S210에서의 프로세스의 특정의 구현이 도 3을 참조하여 기술될 것이다.
도 3에 예시된 바와 같이, 먼저 S310에서 입력 영상으로부터 이진 마스킹된 영상이 결정된다. 이진 마스킹된 영상을 획득하는 것의 특정의 일례가 이하에서 간략히 기술될 것이다.
입력 영상 f(x, y)(0≤x≤w-1 및 0≤y≤h-1)(w 및 h는, 각각, 입력 영상의 폭 및 높이를 나타냄)이 주어진 경우, 영상의 배경 영역의 색상 f background 의 평균이 영상의 경계 영역으로부터 추정된다. 여기서, 영상의 배경 영역은 균일한 텍스처 영역으로서 가정되고, 따라서 배경의 색상의 평균이 영상의 배경 영역으로부터 용이하게 추정될 수 있다. 이어서, 수학식 1에 나타낸 배경의 색상의 추정된 평균에 따라 원시 영상으로부터 거리 영상(distance image)이 계산될 수 있다:
Figure pat00001
여기서,
Figure pat00002
는 2개의 벡터 사이의 L1 거리(블록 거리)를 나타낸다. L1 거리는 2개의 벡터 사이의 차이를 나타내기 위해 업계에서 흔히 사용되는 파라미터이고, 그의 개념 및 해를 구하는 방법이 당업자에게 공지되어 있으며, 따라서 그의 상세에 대한 반복된 설명이 여기서 생략될 것이다. 거리 영상 dist(x, y)(0≤x≤w-1 및 0≤y≤h-1)에 대해, 임계값 T가 Otsu 알고리즘에 의해 획득될 수 있고, 수학식 2에 나타낸 바와 같이, 입력 영상이 임계값에 의해 이진화된다:
Figure pat00003
도 4(a) 및 도 4(b)는, 각각, 입력 영상 및 그의 이진 마스킹된 영상을 나타낸 것이다. 명백할 수 있는 바와 같이, 도 4(b)에서의 마스킹된 영상에서의 전경 픽셀(즉, 흑색 픽셀)은 손 및 책을 포함한다.
다시 도 3을 참조하면, 이진 마스킹된 영상으로부터 에지 맵을 획득하는 프로세스는 이진 마스킹된 영상이 획득된 후에 시작된다. 구체적으로는, S320에서 마스킹된 영상의 중심의 좌측 영역에서 전경 픽셀이 선택되고, 이어서 S330에서 그의 좌측 이웃 픽셀이 배경(백색) 픽셀인지가 판정되며, 그러한 경우, S340에서 전경 픽셀이 좌측 에지 맵의 픽셀로서 선택되고, 그렇지 않은 경우, S350에서 픽셀이 거부된다. 도 3은 좌측 에지 맵의 픽셀을 획득하는 프로세스를 예시적으로 나타낸 것이며, 이와 유사하게 이진 마스킹된 영상으로부터 우측 에지 맵을 계산하는 프로세스는 다음과 같다: 마스킹된 영상의 중심의 우측 영역에서, 현재의 픽셀이 전경(흑색) 픽셀이고 그의 우측 이웃 픽셀이 배경(백색) 픽셀인 경우, 전경 픽셀은 우측 에지 맵의 픽셀이다. 상기 프로세스가 도 4(b)에 예시된 마스킹된 영상의 상부 경계 l1과 하부 경계 l2 사이에서 또는 전체 화상의 상부 경계 m1과 하부 경계 m2 사이에서 수행될 수 있고, 본 발명이 이 점에서 제한되지 않을 것이다. 마스킹된 영상의 중심과 상부 및 하부 경계가 종래 기술에서와 같이 획득될 수 있고, 그의 설명은 본 발명에서 생략될 것이다. 도 5(a) 및 도 5(b)는, 각각, 이진 마스킹된 영상의 이와 같이 획득된 좌측 에지 맵 및 우측 에지 맵을 나타낸 것이다.
원시 문서 영상으로부터 에지 맵을 획득하는 방법이 이상에서 기술된 것으로 제한되지 않고 다른 방식으로 수행될 수 있다. 예를 들어, 좌측 에지 맵을 획득하기 위해, 원시 영상 상의 전경 픽셀과 그의 좌측 이웃 픽셀 사이의 휘도 차이가 사전 설정된 임계값을 초과하는 경우, 픽셀이 좌측 에지 맵의 픽셀인 것으로 판정되고, 이와 유사하게 원시 영상 상의 각각의 전경 픽셀과 그의 우측 이웃 픽셀 사이의 휘도 차이가 사전 설정된 임계값을 초과하는 경우, 픽셀이 우측 에지 픽셀인 것으로 판정된다. 임계값은 실제의 조건(예를 들어, 원시 영상의 전경 픽셀과 배경 픽셀 사이의 휘도 차이 등)에 따라 또는 실험적으로 또는 경험적으로 설정될 수 있다.
이제 다시 도 2를 참조하면, 에지 맵이 원시 영상으로부터 결정되는 S210에서의 프로세스 이후에, S220에서의 그 다음 프로세스가 시작되며, 경계선에 대한 후보가 에지 맵으로부터 획득되고 경계선이 경계선에 대한 후보들 중에서 결정된다. S220에서의 프로세스의 특정의 구현이 도 6을 참조하여 이하에서 상세히 논의될 것이다.
에지 맵으로부터 경계선에 대한 후보들을 획득하고 경계선에 대한 후보들 중에서 경계선을 결정하는 것(S220)은 먼저 적합화를 통해 에지 맵으로부터 경계선에 대한 후보들을 획득하고(도 6a) 이어서 경계선에 대한 후보들 중에서 경계선을 결정하는 것(도 6b)을 포함할 수 있다.
먼저, 적합화를 통해 에지 맵으로부터 경계선에 대한 후보들을 획득하는 특정의 일례의 프로세스가 도 6a를 참조하여 기술될 것이다. 이하의 설명은 좌측 에지 맵을 일례로 하여 제시될 것이지만, 우측 에지 맵에도 똑같이 적용될 것이다. S610에서, 좌측 에지 맵은 수평 방향(즉, 문서의 상부 및 하부 에지의 방향)으로 미리 결정된 크기의 몇개의 영역(예를 들어, 소정의 폭의 몇개의 직사각형 영역 등)으로 분할되고, 각각의 영역에서의 전경 픽셀의 수가 카운팅된다. S620에서, 사전 설정된 임계값을 초과하는 전경 픽셀의 수를 갖는 영역이 선택되고(즉, 사전 설정된 임계값을 초과하는 전경 픽셀의 수를 갖는 영역만이 보존되고), S630에서, 영역에서의 전경 픽셀을 사용하여 선이 적합화된다. 선 적합화 방법(line fitting method)이, 예를 들어, 재귀적 최소자승법(recursive least square method)일 수 있고, 물론 선 적합화 결과는 다른 대안으로서 종래 기술에서의 임의의 적절한 선 적합화 방법에서 획득될 수 있다. S640에서, 적합화 선(fitting line)이 경계선에 대한 후보로서 획득된다. 도 5(a) 및 도 5(b)는, 각각, 좌측 에지 맵 및 우측 에지 맵에 대한 적합화에 의해 얻어진 선을 나타낸다. 도 5(a) 및 도 5(b)에 예시된 바와 같이, 점선은 적합화에 의해 획득되는 얻어진 경계선 후보를 나타낸다. 각각의 도면이 단지 2개의 후보만을 나타내고 있지만, 이들은 단지 예시적인 것이며, 실제로는 더 많거나 더 적은 수의 후보가 획득될 수 있다. 물론, 실제의 경계선이 이 단계에서 결정되지 않았다.
도 6b는 적합화된 선들 중에서 경계선을 선택하는 프로세스의 일례를 나타낸다. 구체적으로는, S650에서, 도 7(a)에 예시된 바와 같이, 각각의 적합화된 선(즉, 경계선의 각각의 후보)의 각각의 측면에서 특정의 폭의 영역이 각각 취해진다. 주목할 점은, 특정의 폭의 영역이 원시 영상으로부터 추출된다는 것이다. 도 7(a)는 직사각형 영역이 영상 내의 특정의 객체로부터, 즉 책의 상부 경계 l1과 하부 경계 l2 사이에서 취해지는 시나리오를 예시한 것이지만, 본 발명이 그것으로 제한되지 않을 것인데, 그 이유는 영역이 다른 대안으로서 특정의 조건 하에서 필요에 따라 전체 영상의 상부 경계 m1과 하부 경계 m2 사이에서 취해질 수 있기 때문이다. 이어서, S660에서 2개의 영역의 특징 표현 사이의 차이가 계산된다. 이 차이는 L1 거리, 유클리드 거리 등을 사용하여 계산될 수 있고, 본 발명은 이 점에서 제한되지 않는다. S670에서, 2개의 측면 상의 영역들 사이의 차이가 가장 큰 선이 좌측 및 우측 에지 맵으로부터의 적합화된 선들 중에서 선택된다. S680에서 선택된 선의 2개의 측면 상의 영역들 사이의 차이가 사전 설정된 거리를 초과하는지가 판정되고, 그러한 경우, S690에서 그 선이 책의 경계로서 채택되고, 그렇지 않은 경우, S685에서 그 선이 거부된다. 대안의 실시예에서, S680에서 최종적인 판정을 수행하는 일 없이, 특징 표현들 사이의 차이가 가장 큰 경계선에 대한 후보가 얻어진 실제 경계선으로서 채택될 수 있다.
S680에서의 판정이 행해진 경우, 추가적인 이점이 획득될 수 있고, 즉, 오류 판정률(rate of false determination)이 최소로 저하될 수 있다. 오류 판정은 책의 중심선을 경계선으로 오인하는 것 등에 의해, 그렇지 않았으면 제거되지 않을 콘텐츠(예컨대, 책 자체의 콘텐츠 등)를 후속 프로세스에서 제거하는 것을 말한다.
S660에서 2개의 영역의 특징 표현 사이의 차이가 계산된다. 2개의 측면 상의 특징 표현 사이의 차이를 어떻게 계산하는지의 특정의 일례가 도 7(b)를 참조하여 이하에서 기술될 것이다. 도 7(b)에 예시된 바와 같이, 각각의 선택된 영역은 서브영역 - 즉, 영역이 수평 및 수직 방향으로, 각각, 몇개의 서브영역으로 분할됨 - 의 히스토그램 특징 표현에 의해 특징지워지고, 각각의 서브영역에서의 각자의 픽셀의 R, G 및 B의 값이, 각각, 사전 설정된 양자화 구간(quantization interval)에 기초하여 상이한 양자화 구간으로 양자화되며, 이어서 각각의 서브영역의 색상 히스토그램(color histogram)이 3개의 R, G 및 B 색상 채널(color channel)에 걸쳐 각각 계산되고, 3개의 히스토그램이 서브영역의 색상 히스토그램 표현으로 연결되며, 마지막으로 이들 서브영역의 색상 히스토그램 표현이 전체 영역의 색상 히스토그램 표현으로 연결된다. 처리될 경계선에 대한 후보의 2개의 측면 상의 특징 표현 사이의 차이가 획득될 수 있는 한, 특징 표현이 히스토그램 표현 이외의 것일 수 있다. 색상 히스토그램은 각각의 색상의 공간 위치에 상관없이 전체 영상에서의 상이한 색상의 비율을 나타내기 위해 기술 분야에서 흔히 사용되는 개념이다. 히스토그램에서의 모든 값은 통계를 통해 획득되고, 이들은 영상에서의 색상의 측면에서의 양 특징(quantity feature)을 나타내며, 색상 히스토그램에의 영상 색상의 통계적 분포 및 기본적인 색조를 반영할 수 있다. 색상 히스토그램의 상세에 대해서는, Shapiro, Linda G. 및 Stockman, George C.의 "Computer Vision", Prentice Hall, 2003 ISBN 0130307963, 및 "Color Histogram" http://en.wikipedia.org/wiki/Color_histogram을 참조할 수 있다.
이상에서 특징 표현들 사이의 차이를 계산하기 위해 색상 히스토그램 특징이 사용되고 있지만, 특징 표현이 경계선에 대한 후보의 2개의 측면 상의 특정의 영역(이 일례에서, 특정의 폭의 직사각형 영역) 사이의 차이를 표현하는 데 충분하기만 하다면, 임의의 다른 적절한 특징 표현이 적용될 수 있다. 게다가, 특징 표현 사이의 차이의 계산을 위한 영역이 꼭 직사각형일 필요는 없을 것이며, 임의의 적절한 형상이 사용될 수 있다.
명백할 수 있는 바와 같이, 특정의 일례에서, 상기 프로세스에서 경계선에 대한 단지 하나의 후보가 획득되는 경우, 이 후보가 최종적인 실제 경계선으로서 곧바로 취해질 수 있다.
다시 도 2를 참조하면, 특정의 객체 이외에 경계선을 넘어선 전경 객체 - 즉, 이 실시예에서 책의 경계를 넘어선 손 - 를 제거하기 위해 S230에서의 프로세스가 S220 후에 수행된다. 따라서, 손이 제거된 책의 영상이 획득된다. 도 8(a) 및 도 8(b)는, 각각, 원시 영상 및 손이 제거된 예시적인 영상을 나타낸 것이다.
주목할 점은, 상기 프로세스에서, 특정의 객체인 책이, 예를 들어, 영상의 수직 방향에 대해 특정의 범위(예컨대, -15° 내지 15° 등)를 초과하여 상당히 경사져 있는 경우, 바람직한 실시예에서, 처리될 영상의 방향이 종래의 기술에서와 같이 추정되고 처리될 영상에서의 책의 객체가 소정의 범위 내에서 경사져 있도록 보정됨으로써 앞서 기술한 영상 처리의 정밀도를 추가적으로 향상시킨다는 것이다. 종래 기술에서 영상의 방향을 추정하고 보정하는 것의 상세에 대해서는, 예를 들어, 문서 분석 및 인식에 관한 제4차 국제 컨퍼런스에서의 Sun Changming 및 Si Deyi의 "Skew and Slant Correction for Document Images Using Gradient Direction(기울기 방향을 사용한 문서 영상의 스큐 및 경사 보정)" 등을 참조할 수 있다.
이상의 상세한 설명이 책의 영상의 경계를 넘어선 손의 영상이 제거되는 일례로서 제시되어 있지만, 당업자라면 이러한 영상 처리 해결책이 책의 영상의 경계를 넘어선 다양한 다른 객체의 영상(여기에서 열거되지 않을 것임)을 제거하는 것에 똑같이 적용될 수 있다는 것을 잘 알 것이다.
게다가, 각자의 실시예 및 전술한 특정의 일례에서 경계를 넘어선 손의 영역을 제거하기 위해 특정의 객체(예컨대, 책 등)의 좌측 경계와 우측 경계 사이의 영상 내의 영역이 결정되지만, 본 발명의 실시예에 따른 프로세스는 경계를 넘어선 다른 객체의 영역을 제거하기 위해 특정의 객체의 상부 경계와 하부 경계 사이의 영상 내의 영역을 결정하는 것에 똑같이 적용될 수 있고, 그의 프로세스가 유사하며, 따라서 간결함을 위해 그의 반복된 설명이 여기에서 생략될 것이다.
본 발명의 실시예에 따른 영상 처리 방법에 대응하여, 본 발명의 실시예는 도 9에 예시된 영상 처리 장치를 제공하고, 이 영상 처리 장치는
영상에서의 전경 객체의 에지 맵을 결정하는 에지 맵 결정 수단(901),
에지 맵으로부터 경계선에 대한 후보들을 획득하고 경계선에 대한 후보들 중에서 경계선을 결정하는 경계선 결정 수단(902) - 경계선은 전경 객체에서의 특정의 객체의 경계를 정의함 -, 및
특정의 객체 이외에 경계선을 넘어선 전경 객체를 제거하는 제거 수단(903)을 포함한다.
특정의 일례에서, 에지 맵은 이진 마스크(binary mask)를 사용하여 결정될 수 있고, 도 10a를 참조하면, 에지 맵 결정 수단(901)은
배경 객체가 전경 객체와 구별되어 있는 캡처된 영상에 대한 이진 마스크를 결정하는 이진 마스크 결정 수단(9011)을 포함하고, 에지 맵 결정 수단(901)은 이진 마스크 결정 수단(9011)에 의해 결정된 이진 마스크에 따라 에지 맵을 결정한다.
다른 특정의 일례에서, 에지 맵이 다른 대안으로서 휘도 차이로부터 결정될 수 있고, 도 10b를 참조하면, 에지 맵 결정 수단(901)은
영상에서의 전경 객체의 전경 픽셀과, 전경 픽셀에 인접하고 전경 픽셀보다 전경 객체의 중심으로부터 더 멀리 있는, 전경 픽셀의 한쪽 측면 상의 전경 픽셀의 이웃 픽셀 사이의 휘도 차이를 계산하고, 차이가 소정의 제1 임계값을 초과하는 경우, 전경 픽셀을 에지 맵의 픽셀로서 결정하는 휘도 차이 계산 수단(9012)을 추가로 포함할 수 있다.
다른 특정의 일례에서, 도 11을 참조하면, 경계선 결정 수단(902)은
획득된 에지 맵에서 미리 결정된 크기의 영역을 단위로서 차지하는 전경 픽셀의 수를 획득하고 - 전경 픽셀의 수는 미리 결정된 크기의 영역에 포함되어 있는 에지 맵에서의 전경 픽셀을 카운팅함으로써 획득됨 - 소정의 제2 임계값을 초과하는 전경 픽셀의 수를 갖는 영역을 선택하는 영역 획득 수단(9021),
경계선에 대한 후보들에 대해 선택된 영역에 포함되어 있는 전경 픽셀을 적합화하는 후보 적합화 수단(9022), 및
경계선에 대한 후보에 인접해 있는 경계선에 대한 각각의 후보의 2개의 측면에서의 특정의 폭의 영역의 특징 표현을, 원시 영상으로부터 획득하고, 2개의 측면에서의 영역의 특징 표현들 간의 차이를 결정하며, 특징 표현들 간의 차이가 가장 큰 경계선에 대한 후보를 경계선으로서 선택하는 특징 표현 획득 수단(9023)을 포함할 수 있다.
도 9 내지 도 11을 참조하여 전술한 본 발명의 실시예에 따른 영상 처리 장치 및 그의 각자의 구성 수단은, 예를 들어, 도 2 내지 도 8을 참조하여 기술된 본 발명의 실시예에 따른 영상 처리 방법을 수행하도록 구성될 수 있고, 유사한 이점을 달성할 수 있다. 그의 상세에 대해서는, 상기 관련 설명을 참조할 수 있으며, 그의 반복된 설명이 여기에서 생략될 것이다.
본 발명의 실시예(들)에 따른 장치 및/또는 방법의 각종의 구현을 기술하기 위해 상기의 상세한 설명이 블록도, 플로우차트 및/또는 실시예로 제시되었다. 당업자라면 이들 블록도, 플로우차트 및/또는 실시예에서의 각자의 기능 및/또는 동작이 각종의 하드웨어, 소프트웨어, 펌웨어 또는 본질적으로 이들의 임의의 조합으로 개별적으로 및/또는 전체적으로 수행될 수 있다는 것을 잘 알 것이다. 일 실시예에서, 본 명세서에 기술된 발명 요지의 몇가지 측면이 ASIC(Application Specific Integrated Circuit), FPGA(Field Programmable Gate Array), DSP(Digital Signal Processor), 또는 다른 집적 형태로 구현될 수 있다. 그렇지만, 당업자라면 본 명세서에 기술된 구현의 몇몇 측면이, 하나 이상의 컴퓨터 상에서 실행되는 하나 이상의 컴퓨터 프로그램의 형태로(예컨대, 하나 이상의 컴퓨터 시스템 상에서 실행되는 하나 이상의 컴퓨터 프로그램의 형태로), 하나 이상의 프로세서 상에서 실행되는 하나 이상의 프로그램의 형태로(예컨대, 하나 이상의 마이크로프로세서 상에서 실행되는 하나 이상의 프로그램의 형태로), 펌웨어의 형태로 또는 등가적으로 본질적으로 이들의 임의의 조합의 형태로 전체적으로 또는 부분적으로 집적 회로에 구현될 수 있다는 것을 잘 알 것이며, 당업자는 본 명세서에서의 개시 내용을 바탕으로 이 개시 내용에 대한 회로를 설계할 수 있고 및/또는 이 개시 내용의 소프트웨어 및/또는 펌웨어에 대한 코드를 작성할 수 있다.
예를 들어, 도 2, 도 3 및 도 6에 예시된 바와 같이, 책의 경계를 넘어선 손을 제거하는 프로세스의 플로우차트에서의 각자의 프로세스가 소프트웨어, 펌웨어, 하드웨어 또는 이들의 임의의 조합으로 수행될 수 있다. 소프트웨어 또는 펌웨어로 수행되는 경우에, 소프트웨어를 구성하는 프로그램이 저장 매체 또는 네트워크로부터 특수한 하드웨어 구조를 갖는 컴퓨터[예컨대, 도 12에 예시된 범용 컴퓨터(1200)] - 각종의 프로그램이 설치되어 있을 때 다양한 기능을 수행할 수 있음 - 에 설치될 수 있다.
도 12는 본 발명의 실시예에 따른 영상 처리 방법이 구현될 수 있는 범용 컴퓨터 시스템의 일반 구조도를 나타낸 것이다. 컴퓨터 시스템(1200)은 단지 예시적인 것이며 본 발명에 따른 방법 및 장치의 응용 또는 기능의 범위의 어떤 제한을 제안하기 위한 것이 아니다. 게다가, 컴퓨터 시스템(1200)은 예시적인 운영 시스템(1200)에 예시된 구성요소들 중 임의의 구성요소 또는 그의 임의의 조합에 의존하거나 그를 필요로 하는 것으로 해석되어서는 안된다.
도 12에서, CPU(Central Processing Unit)(1201)는 ROM(Read Only Memory)(1202)에 저장되어 있거나 저장 부분(1208)으로부터 RAM(Random Access Memory)(1203)에 로드되는 프로그램에 따라 다양한 프로세스를 수행하며, 여기서 CPU(1201)가 다양한 프로세스를 수행할 때 필요한 데이터도 역시 필요에 따라 저장된다. CPU(1201), ROM(1202) 및 RAM(1203)은 입/출력 인터페이스(1205)도 역시 연결되어 있는 버스(1204)를 통해 서로에 연결되어 있다.
하기의 구성요소가 또한 입/출력 인터페이스(1205)에 연결되어 있다: 입력 부분(1206)(키보드, 마우스 등을 포함함), 출력 부분(1207)[디스플레이, 예컨대, CRT(Cathode-Ray Tube) 및 LCD(Liquid Crystal Display) 등 및 스피커 등을 포함함], 저장 부분(1208)(하드 디스크 등을 포함함), 및 통신 부분(1209)(네트워크 인터페이스 카드, 예컨대, LAN 카드, 모뎀 등을 포함함). 통신 부분(1209)은 네트워크(예컨대, 인터넷)를 통해 통신 프로세스를 수행한다. 드라이브(1210)도 역시 필요에 따라 입/출력 인터페이스(1205)에 연결될 수 있다. 이동식 매체(1211)(예컨대, 자기 디스크, 광 디스크, 광 자기 디스크, 반도체 메모리 등)는 필요에 따라 드라이브(1210) 상에 설치될 수 있고, 따라서 그로부터 페치된 컴퓨터 프로그램이 필요에 따라 저장 부분(1208)에 설치될 수 있다.
상기한 일련의 프로세스가 소프트웨어로 수행되는 경우, 소프트웨어를 구성하는 프로그램이 네트워크(예컨대, 인터넷 등) 또는 저장 매체[예컨대, 이동식 매체(1211) 등]로부터 설치된다.
당업자라면 이러한 저장 매체가 도 12에 예시된 이동식 매체(1211) - 프로그램이 저장되고 사용자에게 프로그램을 제공하기 위해 장치로부터 개별적으로 배포됨 - 로 제한되지 않을 것임을 잘 알 것이다. 이동식 매체(1211)의 일례는 자기 디스크(플로피 디스크를 포함함), 광 디스크[CD-ROM(Compact Disk-Read Only memory) 및 DVD(Digital Versatile Disk)를 포함함], 광자기 디스크[MD(Mini Disk)(등록 상표)를 포함함] 및 반도체 메모리를 포함한다. 다른 대안으로서, 저장 매체는 ROM(1202), 저장 부분(1208)에 포함된 하드 디스크 등 - 프로그램이 저장되고 프로그램을 포함하는 장치와 함께 사용자에게 배포됨 - 일 수 있다.
따라서, 본 발명은 또한 기계에 의해 판독되어 실행될 때 본 발명의 실시예에 따른 상기 영상 처리 방법을 수행할 수 있는 기계 판독가능 명령어 코드가 저장되어 있는 프로그램 제품을 제안한다. 그에 대응하여, 프로그램 제품이 구현되는 앞서 열거한 다양한 저장 매체도 역시 본 발명의 범위 내에 속할 것이다.
본 발명의 실시예의 상기 설명에서, 실시예에 기술되고 및/또는 예시된 특징이, 다른 실시예(들)에서의 특징과 결합하여 또는 그 대신에, 하나 이상의 다른 실시예에서 동일하게 또는 유사하게 사용될 수 있다.
주목할 점은, "포함한다/구비한다"라는 용어가, 이와 관련하여 사용되는 바와 같이, 특징, 요소, 프로세스 또는 구성요소의 존재를 말하지만 하나 이상의 다른 특징, 요소, 프로세스 또는 구성요소의 존재 또는 추가를 배제하지 않는다는 것이다. 용어 "제1", "제2" 등의 관련 서수는 이들 용어로 정의되는 특징, 요소, 프로세스 또는 구성요소의 임의의 실행 순서 또는 임의의 중요도를 의미하지 않고 단지 설명의 명확함을 위해 이들 특징, 요소, 프로세스 또는 구성요소를 식별하기 위한 것이다.
게다가, 본 발명의 각자의 실시예에 따른 방법은 명세서에 기술되거나 도면에 예시된 시간 순서로 수행되는 것으로 제한되지 않고 다른 시간 순서로, 동시에 또는 개별적으로 수행될 수 있다. 따라서, 명세서에 기술된 본 발명이 수행되는 순서는 발명의 범위를 제한하지 않을 것이다.
이하의 첨부가 또한 상기 실시예를 포함하는 구현예와 관련하여 개시되어 있다.
첨부 1. 영상에서의 전경 객체의 에지 맵을 결정하는 단계,
에지 맵으로부터 경계선에 대한 후보들을 획득하고 경계선에 대한 후보들 중에서 경계선을 결정하는 단계 - 경계선은 전경 객체에서의 특정의 객체의 경계를 정의함 -, 및
특정의 객체 이외에 경계선을 넘어선 전경 객체를 제거하는 단계를 포함하는 영상 처리 방법.
첨부 2. 첨부 1에 있어서, 영상에서의 전경 객체의 에지 맵을 결정하는 프로세스는, 배경 객체가 전경 객체와 구별되어 있는 캡처된 영상에 대한 이진 마스크를 획득하고, 이진 마스크에 따라 에지 맵을 결정하는 단계를 포함하는 영상 처리 방법.
첨부 3. 첨부 2에 있어서, 이진 마스크에 따라 에지 맵을 결정하는 프로세스는, 이진 마스킹된 영상의 중심의 한쪽 측면 상의 영역에서 전경 픽셀을 선택하고, 전경 픽셀보다 전경 객체의 중심으로부터 더 멀리 있고 전경 픽셀에 인접해 있는 픽셀이 배경 픽셀인 경우, 전경 픽셀을 에지 맵의 픽셀로서 결정하는 단계를 포함하는 영상 처리 방법.
첨부 4. 첨부 1에 있어서, 영상에서의 전경 객체의 에지 맵을 결정하는 프로세스는, 전경 객체의 전경 픽셀과, 전경 픽셀에 인접하고 전경 픽셀보다 전경 객체의 중심으로부터 더 멀리 있는, 전경 픽셀의 한쪽 측면 상의 전경 픽셀의 이웃 픽셀 사이의 휘도 차이를 계산하고, 차이가 미리 결정된 제1 임계값을 초과하는 경우, 전경 픽셀을 에지 맵의 픽셀로서 결정하는 단계를 포함하는 영상 처리 방법.
첨부 5. 첨부 1 내지 첨부 4 중 어느 하나에 있어서, 에지 맵으로부터 경계선에 대한 후보들을 획득하는 프로세스는,
획득된 에지 맵에서 미리 결정된 크기의 영역을 단위로서 차지하는 전경 픽셀의 수를 획득하고 - 전경 픽셀의 수는 미리 결정된 크기의 영역에 포함되어 있는 에지 맵에서의 전경 픽셀을 카운팅함으로써 획득됨 -, 전경 픽셀들의 수가 미리 결정된 제2 임계값을 초과하는 영역을 선택하는 단계, 및
선택된 영역에 포함되어 있는 전경 픽셀을 적합화하여 경계선에 대한 후보들을 획득하는 단계를 포함하는 영상 처리 방법.
첨부 6. 첨부 1 내지 첨부 5 중 어느 하나에 있어서, 경계선에 대한 후보들 중에서 경계선을 결정하는 프로세스는,
경계선에 대한 각각의 후보에 대해, 경계선에 대한 후보에 인접해 있는 경계선에 대한 후보의 2개의 측면에서의 특정의 폭의 영역들의 특징 표현을, 원시 영상으로부터 획득하는 단계, 및
2개의 측면에서의 영역들의 특징 표현들 간의 차이를 결정하고 특징 표현들 간의 차이가 가장 큰 경계선에 대한 후보를 경계선으로서 선택하는 단계를 포함하는 영상 처리 방법.
첨부 7. 첨부 6에 있어서, 특징 표현들 간의 가장 큰 차이가 사전 설정된 임계값을 초과하는 후보가 경계선으로서 선택되는 영상 처리 방법.
첨부 8. 첨부 6에 있어서, 특징 표현은 2개의 측면에서의 영역에 각각 대응하는 색상 히스토그램 또는 그레이 레벨 히스토그램을 포함하고, 2개의 측면에서의 각각의 영역들은 몇개의 서브영역으로 분할되고, 색상 히스토그램 또는 그레이 레벨 히스토그램은 각자의 서브영역에서의 카운팅으로부터 획득되고, 이들 서브영역의 히스토그램들이 연결되어 영역의 특징 표현을 획득하는 영상 처리 방법.
첨부 9. 첨부 1 내지 첨부 8 중 어느 하나에 있어서, 에지 맵은 좌측 에지 맵 및 우측 에지 맵을 포함하고, 경계선은 좌측 경계선 및 우측 경계선을 포함하는 영상 처리 방법.
첨부 10. 첨부 1 내지 첨부 9 중 어느 하나에 따른 방법을 수행하는 영상 처리 장치로서,
영상에서의 전경 객체의 에지 맵을 결정하는 에지 맵 결정 수단,
에지 맵으로부터 경계선에 대한 후보들을 획득하고 경계선에 대한 후보들 중에서 경계선을 결정하는 경계선 결정 수단 - 경계선은 전경 객체에서의 특정의 객체의 경계를 정의함 -, 및
특정의 객체 이외에 경계선을 넘어선 전경 객체를 제거하는 제거 수단을 포함하는 영상 처리 장치.
첨부 11. 첨부 10에 있어서, 에지 맵 결정 수단은 배경 객체가 전경 객체와 구별되어 있는 캡처된 영상에 대한 이진 마스크를 결정하는 이진 마스크 결정 수단을 포함하는 영상 처리 장치.
첨부 12. 첨부 10 또는 첨부 11에 있어서, 에지 맵 결정 수단은 영상에서의 전경 객체의 전경 픽셀과, 전경 픽셀에 인접하고 전경 픽셀보다 전경 객체의 중심으로부터 더 멀리 있는, 전경 픽셀의 한쪽 측면 상의 전경 픽셀의 이웃 픽셀 사이의 휘도 차이를 계산하고, 차이가 미리 결정된 제1 임계값을 초과하는 경우, 전경 픽셀을 에지 맵의 픽셀로서 결정하는 휘도 차이 계산 수단을 더 포함하는 영상 처리 장치.
첨부 13. 첨부 10 내지 첨부 12 중 어느 하나에 있어서, 경계선 결정 수단은,
획득된 에지 맵에서 미리 결정된 크기의 영역을 단위로서 차지하는 전경 픽셀의 수를 획득하고 - 전경 픽셀들의 수는 미리 결정된 크기의 영역에 포함되어 있는 에지 맵에서의 전경 픽셀을 카운팅함으로써 획득됨 -, 전경 픽셀의 수가 미리 결정된 제2 임계값을 초과하는 영역을 선택하는 영역 획득 수단,
선택된 영역에 포함되어 있는 전경 픽셀을 적합화하여 경계선에 대한 후보들을 획득하는 후보 적합화 수단, 및
경계선에 대한 후보에 인접해 있는 경계선에 대한 각각의 후보의 2개의 측면에서의 특정의 폭의 영역들의 특징 표현을, 원시 영상으로부터 획득하고, 2개의 측면에서의 영역의 특징 표현들 간의 차이를 결정하며, 특징 표현들 간의 차이가 가장 큰 경계선에 대한 후보를 경계선으로서 선택하는 특징 표현 획득 수단을 포함하는 영상 처리 장치.
첨부 14. 첨부 10 내지 첨부 13 중 어느 하나에 따른 영상 처리 장치를 포함하는 스캐너.
첨부 15. 기계에 의해 판독되어 실행될 때 상기 영상 처리 방법을 수행하는 기계 판독가능 명령어 코드를 포함하는 프로그램 제품.
첨부 16. 첨부 15에 따른 프로그램 제품을 포함하는 저장 매체.
본 발명이 본 발명의 실시예의 설명에서 앞서 개시되어 있지만, 발명의 사상 및 범위를 벗어나지 않고 당업자가 발명에 대한 다양한 수정, 개조, 또는 등가물을 고안할 수 있다는 것을 잘 알 것이다. 이들 수정, 개조 또는 등가물은 또한 발명의 범위 내에 속하는 것으로 해석되어야 한다.

Claims (18)

  1. 영상에서의 전경 객체(foreground object)의 에지 맵(edge map)을 결정하는 단계,
    상기 에지 맵으로부터 경계선에 대한 후보들을 획득하고 상기 경계선에 대한 후보들 중에서 상기 경계선을 결정하는 단계 - 상기 경계선은 상기 전경 객체에서의 특정의 객체의 경계를 정의함 -, 및
    상기 특정의 객체 이외에 상기 경계선을 넘어선 상기 전경 객체를 제거하는 단계를 포함하는 영상 처리 방법.
  2. 제1항에 있어서, 상기 영상에서의 전경 객체의 에지 맵을 결정하는 프로세스는, 배경 객체가 상기 전경 객체와 구별되어 있는 캡처된 영상에 대한 이진 마스크(binary mask)를 획득하고, 상기 이진 마스크에 따라 상기 에지 맵을 결정하는 단계를 포함하는 영상 처리 방법.
  3. 제2항에 있어서, 상기 이진 마스크에 따라 상기 에지 맵을 결정하는 프로세스는, 이진 마스킹된 영상(binary masked image)의 중심의 한쪽 측면 상의 영역에서 전경 픽셀을 선택하고, 상기 전경 픽셀보다 상기 전경 객체의 중심으로부터 더 멀리 있고 상기 전경 픽셀에 인접해 있는 픽셀이 배경 픽셀인 경우, 상기 전경 픽셀을 상기 에지 맵의 픽셀로서 결정하는 단계를 포함하는 영상 처리 방법.
  4. 제1항에 있어서, 상기 영상에서의 전경 객체의 에지 맵을 결정하는 프로세스는, 상기 전경 객체의 전경 픽셀과, 상기 전경 픽셀에 인접하고 상기 전경 픽셀보다 상기 전경 객체의 중심으로부터 더 멀리 있는, 상기 전경 픽셀의 한쪽 측면 상의 상기 전경 픽셀의 이웃 픽셀 사이의 휘도 차이를 계산하고, 상기 차이가 미리 결정된 제1 임계값을 초과하는 경우, 상기 전경 픽셀을 상기 에지 맵의 픽셀로서 결정하는 단계를 포함하는 영상 처리 방법.
  5. 제1항 내지 제4항 중 어느 한 항에 있어서, 상기 에지 맵으로부터 경계선에 대한 후보들을 획득하는 프로세스는,
    획득된 에지 맵에서 미리 결정된 크기의 영역을 단위로서 차지하는 전경 픽셀들의 수를 획득하고 - 상기 전경 픽셀들의 수는 상기 미리 결정된 크기의 영역에 포함되어 있는 상기 에지 맵에서의 전경 픽셀을 카운팅함으로써 획득됨 -, 상기 전경 픽셀들의 수가 미리 결정된 제2 임계값을 초과하는 영역을 선택하는 단계, 및
    상기 선택된 영역에 포함되어 있는 상기 전경 픽셀을 적합화(fitting)하여 상기 경계선에 대한 후보들을 획득하는 단계를 포함하는 영상 처리 방법.
  6. 제1항 내지 제5항 중 어느 한 항에 있어서, 상기 경계선에 대한 후보들 중에서 상기 경계선을 결정하는 프로세스는,
    상기 경계선에 대한 각각의 후보에 대해, 상기 경계선에 대한 후보에 인접해 있는 상기 경계선에 대한 후보의 2개의 측면에서의 특정의 폭의 영역들의 특징 표현(feature representation)들을, 원시 영상(raw image)으로부터 획득하는 단계, 및
    상기 2개의 측면에서의 영역들의 특징 표현들 간의 차이를 결정하고 상기 특징 표현들 간의 차이가 가장 큰 경계선에 대한 후보를 상기 경계선으로서 선택하는 단계를 포함하는 영상 처리 방법.
  7. 제6항에 있어서, 상기 특징 표현들 간의 가장 큰 차이가 사전 설정된 임계값을 초과하는 후보가 상기 경계선으로서 선택되는 영상 처리 방법.
  8. 제6항에 있어서, 상기 특징 표현은 상기 2개의 측면에서의 영역들에 각각 대응하는 색상 히스토그램(color histogram)들 또는 그레이 레벨 히스토그램(gray-level histogram)들을 포함하고, 상기 2개의 측면에서의 각각의 영역들은 몇개의 서브영역으로 분할되고, 색상 히스토그램들 또는 그레이 레벨 히스토그램들은 각자의 서브영역들에서의 카운팅으로부터 획득되고, 이들 서브영역들의 히스토그램들이 연결되어 상기 영역의 특징 표현을 획득하는 영상 처리 방법.
  9. 제1항 내지 제8항 중 어느 한 항에 있어서, 상기 에지 맵은 좌측 에지 맵 및 우측 에지 맵을 포함하고, 상기 경계선은 좌측 경계선 및 우측 경계선을 포함하는 영상 처리 방법.
  10. 영상에서의 전경 객체의 에지 맵을 결정하는 에지 맵 결정 수단,
    상기 에지 맵으로부터 경계선에 대한 후보들을 획득하고 상기 경계선에 대한 후보들 중에서 상기 경계선을 결정하는 경계선 결정 수단 - 상기 경계선은 상기 전경 객체에서의 특정의 객체의 경계를 정의함 -, 및
    상기 특정의 객체 이외에 상기 경계선을 넘어선 상기 전경 객체를 제거하는 제거 수단을 포함하는 영상 처리 장치.
  11. 제10항에 있어서, 상기 에지 맵 결정 수단은 배경 객체가 상기 전경 객체와 구별되어 있는 캡처된 영상에 대한 이진 마스크를 결정하는 이진 마스크 결정 수단을 포함하는 영상 처리 장치.
  12. 제11항에 있어서, 상기 에지 맵 결정 수단은, 이진 마스킹된 영상의 중심의 한쪽 측면 상의 영역에서 전경 픽셀을 선택하고, 상기 전경 픽셀보다 상기 전경 객체의 중심으로부터 더 멀리 있고 상기 전경 픽셀에 인접해 있는 픽셀이 배경 픽셀인 경우, 상기 전경 픽셀을 상기 에지 맵의 픽셀로서 결정함으로써 상기 이진 마스크에 따라 상기 에지 맵을 결정하도록 구성되어 있는 영상 처리 장치.
  13. 제10항 내지 제12항 중 어느 한 항에 있어서, 상기 에지 맵 결정 수단은, 상기 영상에서의 상기 전경 객체의 전경 픽셀과, 상기 전경 픽셀에 인접하고 상기 전경 픽셀보다 상기 전경 객체의 중심으로부터 더 멀리 있는, 상기 전경 픽셀의 한쪽 측면 상의 상기 전경 픽셀의 이웃 픽셀 사이의 휘도 차이를 계산하고, 상기 차이가 미리 결정된 제1 임계값을 초과하는 경우, 상기 전경 픽셀을 상기 에지 맵의 픽셀로서 결정하는 휘도 차이 계산 수단을 더 포함하는 영상 처리 장치.
  14. 제10항 내지 제13항 중 어느 한 항에 있어서, 상기 경계선 결정 수단은,
    획득된 에지 맵에서 미리 결정된 크기의 영역을 단위로서 차지하는 전경 픽셀들의 수를 획득하고 - 상기 전경 픽셀들의 수는 상기 미리 결정된 크기의 영역에 포함되어 있는 상기 에지 맵에서의 전경 픽셀을 카운팅함으로써 획득됨 -, 상기 전경 픽셀들의 수가 미리 결정된 제2 임계값을 초과하는 영역을 선택하는 영역 획득 수단, 및
    상기 선택된 영역에 포함되어 있는 상기 전경 픽셀들을 적합화하여 상기 경계선에 대한 후보들을 획득하는 후보 적합화 수단을 포함하는 영상 처리 장치.
  15. 제10항 내지 제14항 중 어느 한 항에 있어서, 상기 경계선 결정 수단은,
    상기 경계선에 대한 후보에 인접해 있는 상기 경계선에 대한 각각의 후보의 2개의 측면에서의 특정의 폭의 영역들의 특징 표현들을, 원시 영상으로부터 획득하고, 상기 2개의 측면에서의 영역들의 특징 표현들 간의 차이를 결정하며, 상기 특징 표현들 간의 차이가 가장 큰 경계선에 대한 후보를 상기 경계선으로서 선택하는 특징 표현 획득 수단을 포함하는 영상 처리 장치.
  16. 제15항에 있어서, 상기 특징 표현 획득 수단은, 상기 특징 표현들 간의 가장 큰 차이가 사전 설정된 임계값을 초과하는 후보를 상기 경계선으로서 선택하도록 구성되어 있는 영상 처리 장치.
  17. 제15항에 있어서, 상기 특징 표현은 상기 2개의 측면에서의 영역들에 각각 대응하는 색상 히스토그램들 또는 그레이 레벨 히스토그램들을 포함하고, 상기 2개의 측면에서의 각각의 영역들은 몇개의 서브영역으로 분할되고, 색상 히스토그램들 또는 그레이 레벨 히스토그램들은 각자의 서브영역들에서의 카운팅으로부터 획득되고, 이들 서브영역들의 히스토그램들이 연결되어 상기 영역의 특징 표현을 획득하는 영상 처리 장치.
  18. 제10항 내지 제17항 중 어느 한 항에 따른 영상 처리 장치를 포함하는 스캐너.
KR1020120050398A 2011-06-15 2012-05-11 영상 처리 방법, 영상 처리 장치 및 스캐너 KR20120138635A (ko)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
CN2011101599261A CN102833459A (zh) 2011-06-15 2011-06-15 图像处理方法、图像处理装置及扫描仪
CN201110159926.1 2011-06-15

Publications (1)

Publication Number Publication Date
KR20120138635A true KR20120138635A (ko) 2012-12-26

Family

ID=46049176

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020120050398A KR20120138635A (ko) 2011-06-15 2012-05-11 영상 처리 방법, 영상 처리 장치 및 스캐너

Country Status (5)

Country Link
US (1) US20120320433A1 (ko)
EP (1) EP2535868A1 (ko)
JP (1) JP2013004089A (ko)
KR (1) KR20120138635A (ko)
CN (1) CN102833459A (ko)

Families Citing this family (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9870517B2 (en) * 2011-12-08 2018-01-16 Excalibur Ip, Llc Image object retrieval
US8818030B2 (en) * 2011-12-13 2014-08-26 Xerox Corporation Post-processing a multi-spectral image for enhanced object identification
CN104184918B (zh) * 2013-05-27 2017-07-07 富士通株式会社 图像处理装置和方法以及上置式图像扫描装置
US9177383B2 (en) * 2013-08-29 2015-11-03 Analog Devices Global Facial detection
CN106469432A (zh) * 2015-08-13 2017-03-01 富士通株式会社 对象提取方法和对象提取设备
CN105528333B (zh) * 2015-12-15 2019-06-07 网易(杭州)网络有限公司 一种文档优化显示的方法和装置
CN108737875B (zh) * 2017-04-13 2021-08-17 北京小度互娱科技有限公司 图像处理方法及装置
TWI749370B (zh) * 2019-09-16 2021-12-11 緯創資通股份有限公司 臉部辨識方法及其相關電腦系統

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH10336439A (ja) * 1997-05-28 1998-12-18 Minolta Co Ltd 画像読取り装置
CN1685373B (zh) * 2003-03-14 2011-03-02 富士通株式会社 钞票的识别方法和识别装置
US20110142335A1 (en) * 2009-12-11 2011-06-16 Bernard Ghanem Image Comparison System and Method

Also Published As

Publication number Publication date
CN102833459A (zh) 2012-12-19
JP2013004089A (ja) 2013-01-07
EP2535868A1 (en) 2012-12-19
US20120320433A1 (en) 2012-12-20

Similar Documents

Publication Publication Date Title
KR20120138635A (ko) 영상 처리 방법, 영상 처리 장치 및 스캐너
KR102146560B1 (ko) 영상 보정 방법 및 장치
US9311533B2 (en) Device and method for detecting the presence of a logo in a picture
CN108830873B (zh) 深度图像物体边缘提取方法、装置、介质及计算机设备
US9179038B2 (en) Image processing device, and image processing method and program
US8548247B2 (en) Image processing apparatus and method, and program
US20100166257A1 (en) Method and apparatus for detecting semi-transparencies in video
JP6547386B2 (ja) 画像処理装置及び方法
US10748023B2 (en) Region-of-interest detection apparatus, region-of-interest detection method, and recording medium
JP2012517774A5 (ko)
JPWO2008129643A1 (ja) ショットサイズ識別装置及び方法、電子機器、並びにコンピュータプログラム
WO2021109697A1 (zh) 字符分割方法、装置以及计算机可读存储介质
CN103455994A (zh) 图像模糊度的确定方法和设备
JP6720845B2 (ja) 画像処理装置、画像処理方法及びプログラム
KR101377910B1 (ko) 화상 처리 방법 및 화상 처리 장치
EP2821935A2 (en) Vehicle detection method and device
JP2008210387A (ja) 文書画像の2値化性能を改善するノイズ除去装置及びノイズ除去プログラム
JP2011165170A (ja) 対象物検出装置及びプログラム
US20140285662A1 (en) Image processing apparatus, and method
JP2014238789A (ja) 画像処理プログラム、画像処理方法及び画像処理装置
CN113569859B (zh) 一种图像处理方法、装置、电子设备及存储介质
KR101582800B1 (ko) 적응적으로 컬러 영상 내의 에지를 검출하는 방법, 장치 및 컴퓨터 판독 가능한 기록 매체
CN108665500B (zh) 一种棋盘格角点检测方法及装置
CN107491746B (zh) 一种基于大梯度像素分析的人脸预筛选方法
US20130201404A1 (en) Image processing method

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E601 Decision to refuse application