KR101280920B1 - 화상인식장치 및 방법 - Google Patents

화상인식장치 및 방법 Download PDF

Info

Publication number
KR101280920B1
KR101280920B1 KR1020110010882A KR20110010882A KR101280920B1 KR 101280920 B1 KR101280920 B1 KR 101280920B1 KR 1020110010882 A KR1020110010882 A KR 1020110010882A KR 20110010882 A KR20110010882 A KR 20110010882A KR 101280920 B1 KR101280920 B1 KR 101280920B1
Authority
KR
South Korea
Prior art keywords
subject
image
registered
recognition
input
Prior art date
Application number
KR1020110010882A
Other languages
English (en)
Other versions
KR20110093659A (ko
Inventor
료스케 쓰지
Original Assignee
캐논 가부시끼가이샤
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 캐논 가부시끼가이샤 filed Critical 캐논 가부시끼가이샤
Publication of KR20110093659A publication Critical patent/KR20110093659A/ko
Application granted granted Critical
Publication of KR101280920B1 publication Critical patent/KR101280920B1/ko

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V40/00Recognition of biometric, human-related or animal-related patterns in image or video data
    • G06V40/10Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
    • G06V40/16Human faces, e.g. facial parts, sketches or expressions
    • G06V40/172Classification, e.g. identification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T1/00General purpose image data processing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/98Detection or correction of errors, e.g. by rescanning the pattern or by human intervention; Evaluation of the quality of the acquired patterns
    • G06V10/993Evaluation of the quality of the acquired pattern

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Quality & Reliability (AREA)
  • Multimedia (AREA)
  • Health & Medical Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Oral & Maxillofacial Surgery (AREA)
  • Human Computer Interaction (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Image Analysis (AREA)
  • Studio Devices (AREA)

Abstract

화상인식장치는, 처리 대상의 화상으로부터 특정의 피사체 화상을 검출하고, 피사체 화상의 피사체 인식가능성 상태와 등록 화상 정보에 있어서의 피사체의 피사체 인식가능성 상태 간의 일치도를 산출하며, 피사체 화상의 화상특징과 등록 화상 정보의 화상특징 간의 유사도를 산출한다. 이 유사도와 일치도에 의거하여, 화상인식장치는 피사체 화상의 피사체가 등록 화상 정보의 피사체인지 여부를 인식한다. 유사도가 제1의 임계값보다도 낮고, 일치도가 제2의 임계값 이상인 경우에는, 화상인식장치는 피사체 화상의 피사체가 등록 화상 정보의 피사체와 다르다고 인식한다.

Description

화상인식장치 및 방법{IMAGE RECOGNITION APPARATUS AND METHOD}
본 발명은, 비디오 카메라 등의 촬상장치에 적합한 화상인식장치 및 방법에 관한 것이다.
최근, 화상 중에 포함되는 특정의 피사체를 인식하는 피사체 인식 기능을 갖는 촬상장치가 제안되어 있다. 피사체 인식 기능에 의해, 촬상장치는 인식된 피사체에 대하여 우선적으로 초점이나 노출을 제어하는 것이 가능하다. 이러한 피사체 인식 기능을 갖는 촬상장치는, 우선, 촬상장치가 피사체 인식 처리에 의해 취득한 화상 데이터로부터, 특정의 피사체를 포함하는 피사체 화상 영역을 검출한다. 다음에, 촬상장치는 검출된 피사체 화상 영역의 화상 데이터로부터, 그 피사체 영역을 인식 대상으로서 식별하기 위한 특징 정보를 추출한다. 촬상장치는 추출한 특징정보와 미리 데이터베이스에 등록된 화상의 특징정보를 비교한다. 그리고, 이 비교에 의해 취득된 유사도에 근거하여, 촬상장치는 인식 대상에 해당하는 등록 대상을 인식하거나 또는 상기 해당하는 등록 대상이 없는지 여부를 판정한다.
예를 들면, 일본국 공개특허공보 특개2003-187352호에서는, 특정의 피사체 영역으로서 인물의 얼굴을 검출하고, 이 얼굴의 특징정보를 추출하고, 이 얼굴이 누구일지를 판정하는 개인인식을 행하는 시스템이 제안되어 있다. 또한, 본 명세서에서는, 검출된 얼굴 등의 화상에 대해서, 그것이 누구의 것인지를 식별하는 처리를 "인식"이라고 칭한다.
상기한 바와 같이, 피사체 인식에서는, 인식 대상과 미리 등록되어 있는 데이터베이스 내의 대상과의 비교에 의해 유사도를 산출한다. 그리고, 산출되는 유사도에 대하여 소정의 임계값을 설정한다. 산출된 유사도가 소정의 임계값 이상인 경우에, 인식 대상이 등록 데이터베이스 내의 대상과 일치한다고 판정한다.
여기에서, 인식 대상의 화상과 등록 데이터베이스 내의 대상의 화상으로부터 취득된 특징량이 유사한 경우에는, 유사도가 높다. 그렇지만, 인식 대상과 데이터베이스 내의 등록 대상이 같은 피사체를 나타내는 경우에도, 피사체의 방향이나 밝기 등과 같은 피사체의 상태에 변화가 있으면, 대상의 화상으로부터 취득된 특징량(즉, 비교되는 피사체와 대상의 특징)이 서로 달라, 유사도가 낮게 된다. (1) 인식대상이 데이터베이스 내의 등록 대상과 일치하지 않거나, 또는, (2) 데이터베이스 내의 등록 대상의 상태가 인식 대상으로서 기능하는 피사체의 상태와 일치하지 않기 때문에, 유사도가 소정의 임계값 미만이 된다. 즉, 유사도의 값만으로부터는 인식 대상이 데이터베이스 내의 미등록 피사체라고 판정할 수 없다.
본 발명은 전술한 과제를 감안하여 이루어진 것으로서, 본 발명의 실시예는, 화상으로부터 검출된 피사체가 데이터베이스에 등록되어 있지 않다는 것을 더 정확하게 판별할 수 있는 화상인식장치 및 방법을 제공한다.
본 발명의 일 국면에 의하면, 입력 화상에서 피사체를 인식하는 화상인식장치는 피사체를 촬영해서 얻은 화상 또는 화상 특징과, 피사체의 피사체 인식가능성(recognizability) 상태를, 등록 화상 정보로서 피사체의 ID(identification)와 관련지어 등록한 데이터베이스와, 입력 피사체 화상의 피사체 인식가능성 상태와 상기 등록 화상 정보에 있어서의 피사체 인식가능성 상태 간의 일치도를 산출하는 제1 산출 수단과, 상기 입력 피사체 화상의 화상 특징과 상기 등록 화상 정보의 화상특징 간의 유사도를 산출하는 제2 산출 수단과, 상기 유사도와 상기 일치도에 의거하여, 상기 입력 피사체 화상의 피사체가 상기 등록 화상 정보의 피사체와 같은 피사체인지의 여부를 인식하는 인식 처리를 실행하는 인식 수단을 구비하고, 상기 제2 산출 수단이, 상기 유사도가 제1의 임계값보다도 낮다는 것을 산출하고, 상기 제1 산출 수단이, 상기 일치도가 제2의 임계값 이상이라는 것을 산출하는 경우에, 상기 인식수단은 상기 입력 피사체 화상의 피사체가 상기 등록 화상 정보의 피사체와 다르다고 인식한다.
본 발명의 또 다른 국면에 의하면, 입력 화상에서 피사체를 인식하는 화상인식장치의 제어방법은 피사체를 촬영해서 얻은 화상 또는 화상특징과, 이 피사체에 관한 피사체 인식가능성 상태를, 등록 화상 정보로서 상기 피사체의 ID(identification)와 관련지어 데이터베이스에 등록하는 등록 단계와, 입력 피사체 화상의 피사체 인식가능성 상태와 상기 등록 화상 정보에 있어서의 피사체 인식가능성 상태 간의 일치도를 산출하는 제1 산출 단계와, 상기 입력 피사체 화상의 화상 또는 화상 특징과 상기 등록 화상 정보의 화상 특징 간의 유사도를 산출하는 제2 산출 단계와, 상기 유사도와 상기 일치도에 의거하여, 상기 입력 피사체 화상의 피사체가 상기 등록 화상 정보의 피사체와 같은 피사체인지 여부를 인식하는 인식 처리를 실행하는 인식 단계를 포함하고, 상기 유사도가 제1의 임계값보다도 낮고, 상기 일치도가 제2의 임계값 이상이라고 산출한 경우에, 상기 인식 단계에서는 상기 입력 피사체 화상의 피사체가 상기 등록 화상 정보의 피사체와 다르다고 인식한다.
본 발명의 그 외의 특징들은 첨부도면을 참조하면서 이하의 예시적인 실시예의 상세한 설명으로부터 밝혀질 것이다.
도 1은, 제1 실시예에 의한 촬상장치의 구성 예를 나타내는 블럭도다.
도 2는, 제1 실시예에 의한 인식 처리를 나타내는 플로차트다.
도 3은, 제1 실시예에 의한 인식 처리 예를 도시한 도면이다.
도 4는, 제2 실시예에 의한 촬상장치의 구성 예를 도시한 도면이다.
도 5는, 제2 실시예에 의한 인식 처리를 나타내는 플로차트다.
도 6은, 제2 실시예에 의한 인식 처리 예를 도시한 도면이다.
이하, 첨부의 도면을 참조하면서 본 발명의 적합한 실시예에 관하여 설명한다
[제1 실시예]
도 1은, 제1 실시예에 따른 화상인식장치를 구비한 촬상장치(100)의 개략적인 구성을 나타내는 블럭도다. 촬상장치(100)는, 촬영해서 얻은 화상 데이터로부터 특정의 피사체 영역으로서 인물의 얼굴을 검출하고, 이 얼굴의 특징정보를 추출하며, 그 얼굴이 누구인지를 식별하는 개인인식을 행하는 기능을 갖는다.
촬상 렌즈(101)를 통해서 피사체 상을 나타내는 광선이 집광되고, CCD(charge-coupled device) 이미지 센서나 CMOS(complementary metal-oxide semiconductor) 이미지 센서와 같은 촬상소자(102)에 입사한다. 촬상소자(102)는, 입사한 광선의 강도에 따른 전기신호를 각 화소에 대하여 출력한다. 이 전기신호가 영상신호다. 아날로그 신호 처리부(103)는 촬상소자(102)로부터 출력된 영상신호에 대해서 상관 이중 샘플링(CDS) 등의 아날로그 신호 처리를 행한다.
A/D 변환부(104)는 아날로그 신호 처리부(103)로부터 출력된 영상신호를, 디지털 데이터로 변환해서, 디지털 화상을 생성한다. 디지털 화상은 처리 대상의 화상으로서 촬영 제어부(105) 및 화상 처리부(106)에 입력된다. 화상 처리부(106)는, 입력된 처리 대상의 화상에 대해서 감마 보정 및 화이트 밸런스 처리 등의 화상처리를 행한다. 또한, 화상 처리부(106)는, 일반적인 화상처리에 더해, (후술하는) 피사체 검출부(109) 및 피사체 인식부(111)로부터 공급되는 화상 중의 특정의 피사체 영역에 관한 정보를 이용한 화상처리를 행하는 기능을 갖는다. 화상 처리부(106)로부터 출력된 영상신호는, 표시부(107)에 전해진다. 표시부(107)는, 예를 들면 LCD(liquid crystal display)나 유기 EL(electroluminescent) 디스플레이이며, 영상신호를 표시한다. 표시부(107)는 시계열적으로 검출되는 화상을 순차 표시하기 위해서 전자 뷰파인더(viewFinder)(EVF)로서 기능할 수 있다. 또한, 영상신호는 기록 매체(108)(예를 들면, 착탈가능한 메모리 카드)에 기록된다. 또한, 기록처는 카메라의 내장 메모리나 카메라에 삽입된 메모리여도 되고, 통신 가능하게 접속된 외부장치여도 된다.
화상 처리부(106)로부터 출력된 영상신호(처리 대상의 입력 화상)는, 피사체 검출부(109)에도 공급된다. 피사체 검출부(109)는 화상에서 특정의 피사체를 검출하고, 피사체의 수와 피사체 영역을 특정한다. 상기한 바와 같이, 본 실시예에 있어서의 대상 피사체는, 인물의 얼굴이다. 검출 방법으로서는 공지의 얼굴검출 방법을 이용할 수 있다. 얼굴 검출의 공지기술에는, 예를 들면 얼굴에 관한 지식(피부색 정보, 눈·코·입 등의 부품)을 이용하는 방법과, 뉴럴 네트(neural net)로 대표되는 학습 알고리즘에 의거해 얼굴 검출을 위한 식별 유닛을 구성하는 방법 등이 있다. 또한, 검출 정밀도 향상을 위해, 복수의 얼굴 검출 방법을 조합해서 얼굴검출을 행하는 것이 일반적이다. 구체적으로는, 일본국 공개특허공보 특개2002-251380호에 기재된 바와 같이, 웨이브렛 변환과 화상 특징량을 이용해서 얼굴 검출을 행하는 방법 등을 들 수 있다. 피사체 검출부(109)로부터 출력되는 정보는, 검출된 피사체의 수만큼 피사체 위치, 크기, 경사, 검출 결과 신뢰도 등을 포함한다.
상태 판정부(110)는, 데이터베이스(112)에 액세스하여, (후술하는) 피사체 인식부(111)의 인식 대상의 상태(인식가능성(recognizability))와, 미리 데이터베이스(112)에 등록되어 있는 대상의 상태가 서로 일치하는지 아닌지 판정하거나, 또는 그 일치도를 판정한다. 상태 판정부(110)의 상세에 관해서는 후술한다.
피사체 인식부(111)는, 피사체 검출부(109)에 의해 검출된 피사체의 화상 데이터(피사체 화상)로부터, 그 피사체 영역을 인식 대상으로서 식별하기 위한 특징정보를 추출한다. 그리고, 피사체 인식부(111)는, 추출한 특징정보와 미리 데이터베이스(112)에 등록되어 있는 피사체의 화상의 특징정보를 비교한다. 즉, 피사체 인식부(111)는, 피사체 화상의 화상특징과 데이터베이스(112)에 등록된 피사체의 화상특징을 비교한다. 예를 들면, 피사체 인식부(111)는, 얼굴 검출시 추출된 얼굴 부품에 관한 정보를 이용해서, 우안과 좌안의 중심(예를 들면, 동공) 사이의 거리, 우안과 좌안의 크기의 평균, 우안과 좌안의 중심을 연결하는 직선에 대한 눈의 중심과 눈의 가장자리를 연결하는 직선의 경사도, 입의 폭, 우안과 좌안의 중심 사이의 2등분점으로부터 코끝까지의 거리, 및 우안과 좌안의 중심 사이의 2등분점으로부터 턱 끝까지의 거리 등의 복수 종류의 아이템의 값을 취득한다. 피사체 인식부(111)는, 어떤 아이템(예를 들면, 우안과 좌안의 중심 사이의 거리)의 값이 소정의 값과 일치하도록 각 아이템의 값을 표준화한다. 피사체 인식부(111)는, 각 아이템의 값을, 미리 준비된 테이블을 이용해서 포인트(points)로 변환한다. 피사체 인식부(111)는, 예를 들면, 우안과 좌안의 크기의 평균의 포인트들에 대한 우안과 좌안의 중심 사이의 거리의 포인트들의 비율과, 우안과 좌안의 중심 사이의 2등분점으로부터 턱 끝까지의 거리의 포인트들에 대한 입의 폭의 포인트들의 비율을 포함하는 다양한 아이템의 조합에 대하여 상이한 아이템의 포인트들의 비율을 산출한다. 피사체 인식부(111)는, 데이터베이스(112)에 미리 등록되어 있는 인물들의 비율 데이터 중에서 한 인물의 비율 데이터를 판독하고, 판독한 비율 데이터에 대하여 각 산출된 비율의 퍼센티지(%)를 취득한다. 피사체 인식부(111)는, 다양한 아이템의 조합에 대해 산출된 퍼센티지(%)의 평균을 취득하여 인물의 인식 평가값으로서 설정한다. 당업자는 인식 평가값을 취득하는 다른 방법이 있다는 것과 상기의 예가 몇 개의 가능성으로부터의 하나의 예라는 것을 이해할 것이다. 이 비교에 의해 취득된 유사도를 나타내는 인식 평가값에 근거하여, 피사체 인식부(111)는, 인식 대상에 해당하는 등록 대상을 인식하거나, 또는 해당하는 등록 대상이 없는지를 판정한다. 예를 들면, 인식 평가값에 대하여 소정의 임계값을 설정한다. 취득한 인식 평가값이 소정의 임계값 이상인 경우에, 인식 대상이 데이터베이스(112)에 등록되어 있는 대상이라고 판정할 수 있다. 인식 평가값은 이하의 두 경우에 소정의 임계값보다 작게 된다.
(1) 인식 대상이 데이터베이스(112)에 등록되어 있는 대상과는 다른 경우, 또는,
(2) 인식 대상이 등록 데이터베이스 내의 대상과는 일치하지만, 소정의 임계값 이상인 인식 평가값을 취득할 수 없는 경우.
인식 대상이 데이터베이스(112)에 등록되어 있는 대상과는 일치하지만, 소정의 임계값 이상의 인식 평가값을 취득할 수 없는 현상은, 예를 들면 화상 중의 피사체의 상태(예를 들면, 얼굴 방향)가 다를 때 발생한다. 즉, 입력 피사체가 데이터베이스에 등록된 대상과 유사하다고 인식할 수 없다. 이 때문에, 인식 평가값이 소정의 임계값 미만이고 상태 판정부(110)가 2개의 대상의 상태가 서로 일치한다고 판정되었을 경우(또는 상태의 일치도가 소정의 임계값 이상인 것은, 2개의 대상이 동일한 피사체이면 이것을 검출할 수 있을 정도로 충분히 피사체의 인식가능성이 비슷하다는 것을 의미한다)에, 피사체 인식부(1111)는 인식 대상을 해당 데이터베이스와는 다른 피사체라고 판정한다. 즉, 인식되고 있는 얼굴들 중 하나의 얼굴이 돌려져 있기에 때문에 피사체 인식부(111)가 입력의 얼굴과 데이터베이스의 얼굴이 유사하다는 것을 찾아내지 못한다는 것은 단순한 것이 아니다. 오히려, 얼굴이 실제로 서로 다르다는 사실을 더 확실하게 결론내린다.
상태 판정부(110)에 있어서의 상태는, 피사체 인식부(111)의 정밀도를 저하시키는 요인에 의해 정의된다. 피사체 인식부(111)의 정밀도를 저하시키는 요인은, 피사체 인식부(111)의 알고리즘 등에 의존하기 때문에, 피사체 인식부(111)의 특성에 의거하여 상태 판정부(110)의 상태가 정의된다. 이 상태 또는 인식가능성 상태의 예로서는, 얼굴의 방향, 밝기, 표정, 은폐도(예를 들면, 피사체가 안경을 쓰고 있거나, 수염이 나 있는지 여부), 및 피사체 영역의 크기 등을 들 수 있다.
데이터베이스(112)에는, 대상 피사체의 화상 혹은 피사체 인식용의 화상 특징량 및 피사체의 인가 가능성 상태가, 해당 피사체와 관련지어 등록되어 있다. "피사체 인식가능성 상태"가 무슨 의미인가는 화상의 합성이 등록되어 있다는 것이다. 이 합성은 인물이 (즉, 직접 화상을 촬영하는 카메라에서, 혹은 한 측면에, 혹은 프로파일에서) 대면하고 있는 방향을 포함할 수도 있다. 피사체 인식가능성 상태는 이미지화되고 있는 피사체가 부분적으로 분명하지 않은 경우를 나타낼 수도 있다. 즉, 피사체 인식가능성 상태는 상기 설명한 피사체 "상태"와 같다. 데이터베이스(112)에는 복수의 피사체가 등록되어도 된다. 또한, 같은 피사체의 데이터를 데이터베이스에 복수 등록할 수 있다. 그 경우, 복수의 상이한 상태로 피사체를 등록할 수 있다. 또한, 데이터베이스(112)에 피사체 인식용의 화상을 등록해도 된다. 본 명세서에서는, 데이터베이스(112)에 있어서 피사체와 관련지어서 등록된 화상 특징량 및 피사체 인식가능성 상태 또는 화상을 총칭해서 "등록 화상 정보"라고 칭한다.
촬영 제어부(105)는, A/D 변환부(104)로부터 출력된 영상신호에 의거하여 촬상 렌즈의 (도면에 나타나 있지 않은) 초점 제어기구와 노출 제어기구를 제어한다. 촬영 제어부(105)는, 이 초점 제어기구와 노출 제어기구를 제어할 때, 피사체 검출부(109)와 피사체 인식부(111)로부터 공급되는 대상 피사체 영역의 추출 결과의 정보를 이용할 수 있다. 따라서, 촬상장치(100)는, 촬영화상에 있어서의 특정의 피사체 영역의 정보를 고려한 촬영 처리를 행하는 기능을 갖는다. 촬영 제어부(105)는, 촬상소자(102)의 출력 타이밍, 출력 화소 등의 제어도 행한다.
제1의 실시예에 따른 피사체 인식 처리의 시퀀스에 대해서 도 2를 참조해서 설명한다.
화상 처리부(106)는, 촬상소자(102)를 통해서 취득된 촬영화상을 A/D 변환부(104)에 의해 디지털화해서 취득한 화상을 입력 화상으로서 판독한다(스텝 S201). 다음에, 피사체 검출부(109)는, 입력 화상 중의 피사체 영역을 검출한다(스텝 S202). 상태 판정부(110) 및 피사체 인식부(111)는, 피사체 검출부(109)가 검출한 피사체 영역의 화상을 인식 대상의 피사체 화상으로서 취득한다. 또한, 피사체 검출부(109)에 의한 검출 결과의 정보로서, 검출 결과의 개수, 각 검출 결과의 화상 중의 위치 및 크기, 검출 결과의 신뢰도 등을 얻을 수 있다. 상태 판정부(110) 및 피사체 인식부(111)는, 피사체 검출부(109)에 의해 인식 대상으로서 추출된 피사체의 각각에 대해서 스텝 S203로부터 스텝 S209까지의 처리를 실행한다. 또한, 피사체 검출부(109)에 의해 추출된 복수의 피사체로부터 메인 피사체를 선택하고, 선택된 피사체만을 인식 대상으로 해서, 스텝 S203로부터 스텝 S209까지의 처리를 실행하는 것도 가능하다. 선택되는 메인 피사체로서는, 피사체 영역(피사체 화상)의 검출에 있어서 가장 평가값이 큰 피사체 혹은 피사체 영역의 면적이 가장 큰 피사체 등을 들 수 있다.
상태 판정부(110)는, 피사체 검출부(109)에 의해 추출된 피사체의 상태가 데이터베이스(112)에 등록되어 있는 피사체의 상태와 어느 정도 일치하는지를 판정하기 위한 상태 일치도를 산출한다(스텝 S203(제1 산출 처리)). 여기에서는, 상태 일치도가 높을수록, 상태가 유사하다는 것을 나타낸다.
상태 일치 판정 요소의 예로서 얼굴의 방향을 들 수 있다. 얼굴의 방향의 일치도를 판정할 경우에는, 인식 대상의 화상 및 데이터베이스에 등록되어 있는 대상의 화상으로부터, 눈과 입 등의 얼굴 부품의 특징점을 추출하고, 추출된 특징점의 기하학적 관계로부터 얼굴 방향을 추정한다. 추정된 인식 대상의 얼굴 방향(즉, 인식 대상의 피사체 화상)과 데이터베이스에 등록되어 있는 대상(즉, 피사체)의 얼굴 방향을 비교함으로써, 상태 일치도를 판정할 수 있다. 또한, 상태 일치 판정에 있어서의 상태는, 피사체 인식부(111)의 정밀도에 영향을 주는 요인이면 충분하고, 얼굴의 방향에 한정되는 것이 아니다. 즉, 여기에서 이용하는 상태는, 피사체 인식부(111)의 시스템 및 알고리즘에 따라 정의되며, 얼굴 방향 이외에, "밝기", "표정", "은폐도", 및 "크기" 등을 포함한다. 각 상태의 일치도 판정 방법의 예에 대해서 이하에 설명한다. "밝기"를 상태로서 이하는 경우에는, 인식 대상의 화상에 있어서의 휘도값의 평균과 데이터베이스에 등록되어 있는 대상의 화상에 있어서의 휘도값의 평균을 산출하고, 그 평균의 차가 데이터베이스 화상으로부터 산출한 평균의 20% 이하인 경우에, 휘도 상태가 서로 일치한다고 판정하고, 보다 낮은 퍼센티지에 대해서는 보다 높은 상태 일치도가 주어진다. 화상이 어두울수록, 피사체 인식부(111)가 인식 평가값을 취득하기 위해 이용한 얼굴 부품에 관한 정보를 추출하는 것이 더 어려워진다. 따라서, 20%의 기준값은 더 낮은 데이터베이스 화상 휘도에 대해서 더 엄격한(즉, 더 낮은) 값으로 변경되어도 된다. "표정"을 이용하는 경우에는, 인식 대상의 화상 및 데이터베이스에 등록되어 있는 대상의 화상으로부터, 눈과 입 등의 얼굴 부품의 특징점을 추출하고, 각 화상에 있어서의 얼굴 표현을, 눈을 뜬 정도(눈의 폭에 대한 눈 높이), 입 모양(입의 두 가장자리가 입의 중심보다 높은지), 눈의 가장자리의 위치 등으로부터 판정한다. 예를 들면, 눈의 가장자리가 아래에 있고, 눈을 뜬 정도가 낮으며, 입의 두 가장자리가 위에 있는 경우에는, 인물이 웃고 있다고 판정한다. 이 표현에 대해서는, 판정된 표현이 서로 일치하는 경우에만 상태가 서로 일치한다고 판정한다. "은폐도"를 이용하는 경우에는, 인식 대상의 화상 및 데이터베이스에 등록되어 있는 대상의 화상으로부터 마스크나 안경 등의 은폐 특징을 검출하고, 각각의 화상에서 검출한 은폐 특징의 면적(또는 실제로 피사체의 은폐된 부분)에 대한 피사체(얼굴 등)의 면적의 비율의 차가 피사체(즉, 얼굴)에 대한 데이터베이스 화상에 있어서의 은폐 특징의 면적의 비율의 5%이하이면, 은폐 특징 상태가 서로 일치한다고 판정하고, 더 낮은 퍼센티지에 대해서 더 높은 상태 일치도가 주어진다. "크기"를 이용하는 경우에, 피사체 검출부(109)로부터 출력되는 피사체의 크기가 데이터베이스에 등록되어 있는 얼굴 크기의 1/2이하이면, 크기 상태가 서로 일치하지 않는다고 판정한다. 한편, 크기가 서로 유사한 경우에는 더 높은 상태 일치도가 주어진다.
다음에, 피사체 인식부(111)는, 피사체 검출부(109)에 의해 추출된 피사체 화상의 화상 특징과 데이터베이스(112)에 등록되어 있는 피사체의 화상 특징을 비교하고, 제2 산출 처리에서 인식 평가값의 산출을 행한다(스텝 S204). 인식 평가값은, 인식 대상의 피사체 화상과 데이터베이스(112)에 등록되어 있는 피사체와의 유사도를 나타낸다. 인식 평가값이 높을수록 인식 대상과 데이터베이스(112)에 등록되어 있는 피사체가 일치할 가능성이 높다는 것을 나타낸다. 여기에서, 데이터베이스(112)에 복수의 피사체가 존재할 경우에는, 상태 판정부(110)에 의한 처리(스텝 S203) 및 피사체 인식부(111)에 의한 처리(스텝 S204)가, 데이터베이스(112)에 등록되어 있는 피사체의 개수만큼 행해진다. 즉, 1개의 인식 대상에 대하여, 데이터베이스(112)에 등록되어 있는 피사체의 개수만큼 상태 일치도 및 인식 평가값이 취득된다.
피사체 인식부(111)는, 인식 평가값과 제1의 임계값을 비교하고, 인식 평가값이 제1의 임계값 이상인 경우에는, 해당 인식 대상을 데이터베이스(112)에 등록된 피사체와 일치하는 피사체라고 판정한다(스텝 S205에서 YES → 스텝 S206). 한편, 인식 평가값이 제1의 임계값 미만인 경우(스텝 S205에서 NO), 피사체 인식부(111)는, 상태 일치도와 제2의 임계값을 비교한다. 그리고, 상태 일치도가 제2의 임계값 이상인 경우, 즉 인식 대상의 피사체의 상태가 데이터베이스에 등록된 피사체의 상태와 일치하는 경우, 피사체 인식부(111)는, 인식 대상이 데이터베이스(112)에 등록된 피사체와 다른 피사체라고 판정한다(스텝 S207에서 YES → 스텝 S208). 또한, 상태 일치도가 소정의 임계값 미만인 경우(스텝 S207에서 NO), 피사체 인식부(111)는, 인식 대상이 해당 데이터베이스의 피사체와 다른지 또는 일치하는지의 판정은 행하지 않고, 판정 불가라고 판정하여, 판정이 불가능하게 된다(스텝 S207에서 NO → 스텝 S209).
이상에서 설명한 제1 실시예에 따른 피사체 인식의 처리 예에 대해서 도 3을 참조해서 설명한다. 또한, 도 3에서는, 상태 판정부(110)는 얼굴의 방향의 일치도를 판정한다. 도 3에 있어서, 참조번호 301은 데이터베이스의 등록 화상, 302 내지 304는 입력 화상을 나타낸다. 등록 화상 301과 입력 화상 302의 인식 평가값은 제1의 임계값 이상이기 때문에, 인식 대상은 데이터베이스와 동일한 피사체라고 판정된다. 등록 화상 301과 입력 화상 303의 인식 평가값은 제1의 임계값 미만이고, 상태 일치도는 제2의 임계값 이상이기 때문에(즉, 양쪽 화상이 같은 방식으로 대향하고 있는 얼굴을 갖기 때문에, 인식 평가값의 차이는 상태의 차이에 의한 것이 아니다), 인식 대상은 데이터베이스에 등록되어 있는 대상과 다른 피사체라고 판정된다. 등록 화상 301과 입력 화상 304의 인식 평가값이 제1의 임계값 미만이고, 상태 일치도가 제2의 임계값 미만이기 때문에, 인식 대상이 데이터베이스에 등록된 대상과 같거나 다른 피사체인지를 판정하지 못한다. 즉, 입력 화상으로부터의 피사체가 기억되어 있는 피사체 화상과 같은지의 판정이 불가능하다.
이상과 같이, 제1 실시예에 의하면, 인식 대상인 피사체 화상에 대해서 데이터베이스에 등록된 피사체와 비교했을 때 피사체 인식에 의해 취득된 인식 평가값과, 피사체의 상태에 관한 상태 일치도가 취득된다. 그리고, 인식 평가값이 소정의 임계값 미만인 경우에는, 상태 일치도를 참조하는 것에 의해 인식 대상이 등록된 피사체와 다른지의 여부를 판정한다. 즉, 인식 대상이, 피사체 인식용의 데이터베이스에 등록되지 않은 피사체인 것을 더 정확하게 판별할 수 있다.
도 2에 나타낸 것과 같은 스텝 S207에 있어서는, 상태 일치도만을 이용한 판정을 행하지만, 본 발명은 이것에 한정되는 것이 아니다. 예를 들면, 스텝 S204에서 취득한 인식 평가값이 제3의 임계값(제3의 임계값은 제1의 임계값보다도 작다)보다도 작고, 또 상태 일치도가 제2의 임계값보다 높은 경우에(S207), 인식 대상이 데이터베이스에 등록된 피사체와 다르다고(스텝 S208) 판정해도 된다. 또한, 인식 평가값이 제1의 임계값 이상이고, 상태 일치도가 제4의 임계값 이상인 경우에만, 처리가 스텝 S205로부터 스텝 S206으로 진행되어도 된다. 이때, 제4의 임계값은 제2의 임계값과 같아도 되고 달라도 되지만, 양쪽 S205 및 S207이 긍정이라고 하는 S206의 결과에 대해서 충족되어야 하는 실시예에 포함되어도 된다. 이렇게 설정하면, 유사도가 높고 어느 정도 상태가 일치하고 있는 경우에만, 인식 대상 피사체가 데이터베이스에 등록된 피사체와 일치한다고 판단할 수 있다. 데이터베이스(112)에 피사체 화상을 등록하기 위해서는, 유저가 인물에 ID(identification)를 할당하고, 취득한 화상으로부터 그 ID에 대응하는 화상을 선택하여 데이터베이스(112)에 저장하면 된다. 피사체 인식부(111)가 소정의 값 이상 제1의 임계값보다 큰 인식 평가값을 취득할 때, 자동으로 인식 평가값을 갖는 화상을, 그 인식 평가값을 갖는 특정 인물의 화상으로서 데이터베이스(112)에 부가하는 것이 가능하다.
[제2 실시예]
도 4는, 제2 실시예에 따른 촬상장치의 블럭도다. 제2 실시예에 따른 촬상장치(100)의 구성 및 동작을, 제1 실시예와의 차이를 중심으로 설명한다. 도 4에 있어서, 도 1과 동일한 참조부호는 제1 실시예와 같은 구성을 갖고, 같은 동작 및 처리를 행하는 유닛을 나타낸다.
피사체 추적부(401)는, 연속하는 프레임에 관해서 피사체 검출부(109)로부터 공급되는 검출 결과의 위치 및 크기의 유사성에 근거하여, 연속하는 프레임 사이에서 동일한 피사체를 추정한다. 동화상(moving image)에 있어서 동일한 피사체를 특정함으로써, 해당 피사체에 대한 과거의 피사체 인식부(111)의 결과를 유지, 유용할 수 있다.
실행 판정부(402)는, 피사체 검출부(109)에 의해 추출된 각 피사체에 대해서, 피사체 인식부(111)가 인식 처리를 실행할지 여부를 판정한다. 또한, 실행 판정부(402)는, 데이터베이스(112)에 등록되어 있는 피사체로부터, 인식 대상에 대하여 인식 처리를 실행해야 할 피사체를 선택한다. 도 4에 나타낸 것처럼 실행 판정부(402)를 배치하는 것에 의해, 상태 판정부(110)의 결과 및 과거의 피사체 인식부(111)의 결과를 이용하는 동시에, 데이터베이스(112)에 등록되어 있는 피사체로부터 (피사체 인식부(111)에 의한) 인식 처리를 실행해야 할 피사체를 선택할 수 있다.
시계열적으로 연속한 동화상에 있어서, 피사체 추적부(401)가 동일한 피사체를 특정할 수 있으면, 과거의 피사체 인식부(111)의 결과를 이어받는 것에 의해, 피사체 인식부(111)에 의한 인식 처리를 생략할 수 있다. 즉, 인식 평가값이 소정의 임계값을 충족시키고, 데이터베이스(112)에 피사체가 등록되어 있다고 판정되면, 이후의 프레임에서는 피사체 추적부(401)에 의한 피사체의 특정에 의해, 그 판정을 계속할 수 있다.
상술한 제1 실시예에서는, 피사체 인식부(111)에 의해 취득된 인식 평가값이 소정의 임계값 미만이며, 상태 판정부(110)에 의해 취득된 일치도가 높은 경우에는, 인식 대상이 데이터베이스(112)에 등록된 피사체와 다르다고 판정한다. 본 실시예에서는, 그 이후의 프레임에 있어서, 동일한 인식 대상에 대하여, 데이터베이스(112)에 등록된 피사체와의 인식 처리를 생략할 수 있다. 또한, 데이터베이스(112)에 같은 피사체(즉, 같은 ID의 피사체)에 대해서 복수 종류의 화상특징과 상태가 등록되어 있고, 화상특징들 중의 하나 및/또는 상태와의 대조에 의해, 인식 대상이 등록된 피사체와 다르다고 판정된다고 가정한다. 이 경우, 해당 피사체에 관해서 데이터베이스(112)에 등록되어 있는 화상특징과 상태의 모두에 대하여, 해당 인식 대상과의 인식 처리를 생략할 수 있다. 또한, 피사체 인식부(111)에 의한 인식 처리를 실행해야 하는 피사체가 존재하지 않게 되는 경우에는, 해당 인식 대상을 데이터베이스에 미등록된 피사체라고 판정할 수 있다.
제2 실시예에 따른 전술한 피사체 인식 처리의 시퀀스에 대해서 도 5를 참조해서 설명한다.
도 2의 스텝 S201 및 S202와 같은 스텝 S501 및 S502에서는, 촬영화상을 디지털화해서 취득한 입력 화상으로부터, 피사체 검출부(109)가 피사체 영역(피사체 화상)을 얻는다. 스텝 S503∼S513은, 피사체 검출부(109)에 의해 추출된 피사체의 각각에 대해서 실행된다. 피사체 추적부(401)는, 시계열적으로 연속하는 프레임 사이에 있어서 동일한 피사체를 추적한다(S503). 즉, 피사체 추적부(401)는, 피사체 검출부(109)가 검출한 피사체 중에서 시계열적으로 연속한 프레임 사이에 있어서 위치 및 크기의 유사도가 소정의 기준을 충족하는 피사체가 존재하면, 같은 피사체가 존재한다고 판정한다. 연속한 프레임 사이에 있어서, 위치 및 크기의 유사도가 소정의 기준을 충족시키는 피사체가 존재하지 않으면, 피사체 추적부(401)는 그 피사체를 신규로 출현한 피사체로서 간주한다.
실행 판정부(402)는, 피사체 추적부(401)에 의해 신규 피사체가 아니라고 판정된 피사체(인식 대상)에 대해서, 과거의 프레임에 있어서, 피사체가 데이터베이스(112)에 등록되어 있는 특정의 피사체와 일치한다고 판정되었는지 아닌지 또는 과거의 프레임에 있어서 피사체가 데이터베이스에 등록되어 있지 않다고 판정되었는지 아닌지(피사체가 데이터베이스(112)에 등록되어 있는 모든 피사체와 다르다고 판정되었는지 아닌지)를 판정한다(S504). 인식 대상이 특정의 피사체와 일치한다고 판정되면, 또는, 인식 대상이 데이터베이스에 등록되어 있지 않다고 판정되면, 실행 판정부(402)는, 처리를 스텝 S501로 되돌려(스텝 S504에서 YES), 해당 피사체에 대해서 상태 일치도 판정과 피사체 인식의 처리를 생략한다. 한편, 인식 대상이 데이터베이스에 등록되어 있는 특정의 피사체와 일치한다고 판정되지 않은 경우, 또 인식 대상이 데이터베이스에 등록된 모든 피사체와 다르다고 판정되지 않은 경우, 피사체 인식부(111)는, 해당 인식 대상에 대해서 피사체 인식을 실행해야 하는 등록 화상 정보가 데이터베이스(112)에 남아있는지를 판정한다(스텝 S504에서 NO → 스텝 S505). 피사체 인식을 실행해야 하는 등록 화상 정보가 데이터베이스(112)에 존재하지 않으면, 해당 인식 대상은, 데이터베이스(112)에 등록되어 있는 모든 피사체와는 다른 것이다. 따라서, 피사체 인식부(111)는, 해당 인식 대상이 데이터베이스에 등록되어 있지 않다고 판정한다(스텝 S505에서 NO → 스텝 S506). 그 후에, 처리는 스텝 S501로 되돌아온다.
한편, 대상 피사체(인식 대상)에 대해서, 피사체 인식을 실행해야 하는 등록 화상 정보가 데이터베이스(112)에 남아있으면, 스텝 S507 ∼S513에 나타낸 처리가 실행된다. 또한, 스텝 S507∼S513은, 스텝 S505에서 인식 대상에 대해서 피사체 인식을 실행해야 한다고 판정된(스텝 S505에서 YES) 데이터베이스(112)에 등록된 화상의 모두에 대해서 실행된다. 우선, 상태 판정부(110)는 피사체 인식을 실행해야 하는 인식 대상의 상태 일치도를 판정한다(스텝 S507). 스텝 S507 내지 S513의 처리는, 도 2의 스텝 S203 내지 S209의 처리와 같다. 따라서, 스텝 S507 내지 S513의 처리에 의해, 이하의 결과 중 하나를 취득한다.
· 인식 대상이 데이터베이스에 등록되어 있는 피사체와 일치한다(스텝 S510)
· 인식 대상이 데이터베이스에 등록되어 있는 피사체와 다르다(스텝 S512)
· 판정 불가(스텝 S513). 스텝 S512에 있어서 인식 대상이 데이터베이스에 등록되어 있는 피사체와 다르다고 판정되었을 경우, 해당 등록되어 있는 피사체와 관련된 등록 화상 정보는 해당 인식 대상에 대해서 인식을 실행해야 하는 피사체로부터 제외된다. 스텝 S510에 있어서, 인식 대상과 일치한다고 판정된 피사체와 관련된 등록 화상 정보를, 다른 인식 대상에 대하여 인식을 실행해야 하는 등록 화상 정보로부터 제외해도 된다. 예를 들면, 얼굴 인식 등을 행한 하나의 화상에 복수의 인식 대상이 존재할 가능성이 거의 없는 경우에, 불필요한 인식 처리를 삭감할 수 있다. 이렇게 해서, 이들의 결과를 다음 프레임에 이어받아(스텝 S503), 피사체 인식을 실행할 것인지 아닌지를 판정하고(스텝 S504), 피사체 인식을 실행하는 데이터베이스 내의 피사체를 선택한다(스텝 S505). 이렇게 함으로써 제2의 실시예는 처리 시간을 단축할 수 있다.
제2의 실시예에 따른 피사체 인식의 결과의 예에 대해서 도 6을 참조해서 설명한다. 도 6에서는, 상태 판정부(110)는, 얼굴의 방향의 일치도를 판정한다. 도 6에서, 참조번호 601 내지 603은 데이터베이스에 등록되어 있는 피사체의 등록 화상을 나타낸다. 등록 화상 601과 등록 화상 602는 얼굴 방향이 다른 동일 피사체(대상 A)를 나타내고, ID(identification) A-1 및 A-2가 각각 주어진다. 등록 화상 603은, 등록 화상 601 및 602의 피사체와는 다른 피사체(ID B-1의 대상 B)를 나타낸다. 참조번호 604 내지 607은 장면(scene) 1에서의 입력 화상을 나타내고, 참조번호 608 내지 611은 장면 2에서의 입력 화상을 나타낸다. 참조번호 612는 장면 1에서의 피사체 인식의 실행 결과 테이블을 나타내고, 참조번호 613은 장면 2에서의 피사체 인식의 실행 결과 테이블을 나타낸다. 실행 결과 테이블 612, 613은, 스텝 S510, 스텝 S512, 및 스텝 S513에 있어서 갱신된다.
우선, 장면 1에 있어서의 실행 결과에 관하여 설명한다. 프레임 1에 있어서는, 데이터베이스 ID:A-1과의 화상에 대한 인식 대상의 인식 평가값이 임계값 이상이기 때문에, 인식 대상이 데이터베이스의 대상과 일치한다고 판정된다. 데이터베이스 ID:A-2과의 화상에 대한 인식 처리에 있어서는, 인식 평가값이 임계값 미만이고, 상태 일치도가 임계값 미만이기 때문에, 판정 불가라고 판정된다. 데이터베이스 ID:B-1과의 화상에 대한 인식 처리에 있어서는, 인식 평가값이 임계값 미만이고, 상태 일치도가 임계값 이상이기 때문에, 인식 대상이 대상 B와 다른 피사체라고 판정된다. 프레임 1에 있어서, 인식 대상은, 데이터베이스 ID:A-1이 나타내는 대상 A라고 판정되기 때문에, 프레임 2 이후의 프레임에 있어서는, 그 결과를 이어받아, 피사체 인식 및 상태 일치도 판정의 처리는 실행되지 않는다(스텝 S504에서 NO). 이것은 결과 테이블 612에서 공백으로서 표시되어 있다. 제1 입력 화상(604)은 ID:A-1의 등록 화상과 같다고 판정되었고, 그래서 이 레퍼런스를, 동일한 얼굴이 이미지화되어 있는 프레임 2-4의 나머지에 대해서 이용할 수 있다.
다음에 장면 2에 있어서의 실행 결과에 관하여 설명한다. 프레임 1에 있어서는 데이터베이스 ID:A-1, ID:A-2 및 ID:B-1에 대한 인식 대상의 인식 평가값이 임계값 미만이라고 판정되고, 상태 일치도가 임계값 미만이며, 판정 불가라고 판정되어 있다. 그 때문에, 프레임 2에 있어서도, 데이터베이스에 등록되어 있는 피사체의 모두에 대하여, 피사체 인식 및 상태 일치도 판정이 실행된다. 프레임 2의 결과로서, 데이터베이스 ID:A-1 및 ID:B-1에 대하여는, 인식 평가값이 임계값 미만이고, 상태 일치도가 임계값 미만이기 때문에 판정 불가라고 판정된다. 한편, 데이터베이스 ID:A-2에 대하여는, 인식 평가값이 임계값 미만이고, 상태 일치도가 임계값 이상이기 때문에, 인식 대상은 데이터베이스 ID:A-2가 나타내는 대상 A와는 다른 피사체라고 판정된다. 이 결과(인식 대상은 대상 A는 아니다)를 이어받아, 프레임 3에서는, 데이터베이스 ID:A-1 및 ID:A-2에 대한 피사체 인식 및 상태 일치도 판정이 실행되지 않는다. 따라서, 입력 화상의 프레임 3에서는 데이터베이스 ID:B-1에 대해서만 피사체 인식 및 상태 일치도 판정이 실행되게 된다. 프레임 3의 결과로서, 데이터베이스 ID:B-1에 대한 인식 평가값이 임계값 미만이고 상태 일치도가 임계값 이상이기 때문에, 인식 대상은 데이터베이스 ID:B-1이 나타내는 대상 B와는 다른 피사체라고 판정되어 있다. 장면 2에 있어서의 인식 대상은 데이터베이스 내의 모든 대상(본 예에서는 대상 A, B)과 다르다고 판정되었기 때문에, 인식 대상이 데이터베이스에 등록되어 있지 않다고 판정된다(스텝 S506). 프레임 4 및 이후의 프레임에서는, 프레임에 있어서의 피사체가 데이터베이스의 피사체 중의 하나가 아니라고 알려져 있기 때문에, 피사체에 대해서는 피사체 인식 및 상태 일치도 판정이 실행되지 않는다.
이상과 같이, 제2 실시예에 의하면, 과거의 프레임에서 동일한 인식 대상에 대한 피사체 인식 및 상태 일치도 판정에 의해 취득된 판정 결과를 이어받는 것에 의해, 처리의 효율을 증가시킬 수 있다.
이상, 본 발명의 바람직한 실시예에 관하여 설명했지만, 본 발명은 이들 실시예에 한정되지 않고, 본 발명의 범위로부터 벗어나지 않고 다양하게 변형 및 변경이 가능하다. 본 발명의 가능한 변형 예를 이하에 나타낸다.
전술한 실시예에 있어서, 한층 더 상태 판정부(110)의 결과에 근거하여, 처리를 효율화시킬 수 있다. 예를 들면, 인식 대상과 데이터베이스의 대상과의 상태 일치도가 낮은 경우에는, 피사체 인식부(111)가 소정의 임계값을 충족시키는 인식 평가값을 취득할 가능성이 낮다. 그 때문에, 인식 대상과 데이터베이스의 대상과의 상태 일치도가 낮은 경우에는, 그 프레임에 대해서는 해당 데이터베이스에 근거한 피사체 인식부(111)에 의한 처리를 생략해도 된다.
또한, 전술한 실시예에서는, 피사체로서 인물의 얼굴을 검출한다. 그렇지만, 본 발명은 인물의 얼굴에 한정하는 것이 아니고, 애완동물 등의 동물의 얼굴에도 적용가능하다. 또한, 본 발명은 얼굴에 한정하지 않고, 대상 피사체를 추출해 특정하기 위해서 피사체 인식을 행하는 것이면, 인물, 동물, 자동차 등에도 적용 가능하다.
또한, 전술한 실시예는 촬상장치에 관해서 설명했지만, 본 발명은 촬상장치에 한정하는 것이 아니고, 프린터 또는 표시 화면 등의 재생장치에도 적용가능하다. 재생 데이터를 피사체 인식 처리의 데이터로서 이용해서 본 발명을 재생장치에 적용할 수 있다.
상술한 실시예는, 단순히 입력 화상과 데이터베이스 화상을 비교하는 것과 비교해서 화상으로부터 검출된 피사체가 데이터베이스에 등록되어 있지 않다는 것을 더 정확하게 판별할 수 있다
본 발명의 실시예들은, 상술한 실시예(들)의 기능들을 행하도록 메모리 디바이스 상에 기록된 프로그램을 판독 및 실행하는 시스템 또는 장치의 컴퓨터(또는 CPU 혹은 MPU와 같은 디바이스)에 의해서도 실현될 수 있고, 또 예를 들면 상술한 실시예의 기능을 행하도록 메모리 디바이스 상에 기록된 프로그램을 판독 및 실행함으로써 시스템 또는 장치의 컴퓨터에 의해 행해지는 방법의 스텝들에 의해 실현될 수 있다. 이 목적을 위해서, 이 프로그램을, 예를 들면 메모리 디바이스(예를 들면, 컴퓨터 판독가능한 매체)로서 기능을 하는 다양한 형태의 기록매체로부터 또는 네트워크를 통해서 컴퓨터에 제공한다.
본 발명은 예시적인 실시 예를 참조하면서 설명되었지만, 본 발명은 이 개시된 예시적인 실시 예에 한정되는 것이 아니라는 것이 이해될 것이다. 이하의 특허청구범위의 범주는 모든 변형 및 균등구조 및 기능을 포함하도록 가장 넓게 해석되어야 할 것이다.

Claims (11)

  1. 입력 화상에서 피사체를 인식하는 화상인식장치로서,
    피사체를 촬영해서 얻은 화상 또는 화상 특징과, 피사체의 피사체 인식가능성(recognizability) 상태를, 등록 화상 정보로서 피사체의 ID(identification)와 관련지어 등록한 데이터베이스와,
    입력 피사체 화상의 피사체 인식가능성 상태와 상기 등록 화상 정보에 있어서의 피사체 인식가능성 상태 간의 일치도를 산출하는 제1 산출 수단과,
    상기 입력 피사체 화상의 화상 특징과 상기 등록 화상 정보의 화상특징 간의 유사도를 산출하는 제2 산출 수단과,
    상기 유사도와 상기 일치도에 의거하여, 상기 입력 피사체 화상의 피사체가 상기 등록 화상 정보의 피사체와 같은 피사체인지의 여부를 인식하는 인식 처리를 실행하는 인식 수단을 구비하고,
    상기 제2 산출 수단이, 상기 유사도가 제1의 임계값보다도 낮다는 것을 산출하고, 상기 제1 산출 수단이, 상기 일치도가 제2의 임계값 이상이라는 것을 산출하는 경우에, 상기 인식수단은 상기 입력 피사체 화상의 피사체가 상기 등록 화상 정보의 피사체와 다르다고 인식하는, 화상인식장치.
  2. 제 1 항에 있어서,
    상기 제2 산출 수단이, 상기 유사도가 상기 제1의 임계값 이상이라는 것을 산출한 경우에는, 상기 인식 수단은 상기 입력 피사체 화상의 피사체가 상기 등록 화상 정보의 피사체라고 인식하는, 화상인식장치.
  3. 제 1 항 또는 제 2 항에 있어서,
    상기 제2 산출 수단이, 상기 유사도가 상기 제1의 임계값보다 낮다는 것을 산출하고, 상기 제1 산출 수단이, 상기 일치도가 상기 제2의 임계값보다 낮다는 것을 산출한 경우에는, 상기 인식 수단은 상기 입력 피사체 화상의 피사체가 상기 등록 화상 정보의 피사체인지의 여부에 관한 판정이 불가능하다고 판정하는, 화상인식장치.
  4. 제 1 항 또는 제 2 항에 있어서,
    동화상을 구성하는 연속한 화상을 입력 화상으로서 입력하는 입력 수단과,
    상기 동화상의 적어도 2개의 프레임에 대하여 입력 피사체 화상을 추적하는 추적수단과,
    상기 추적 수단에 의해 추적된 상기 입력 피사체 화상과 상기 데이터베이스에 등록되어 있는 상기 등록 화상 정보에 대해서 상기 인식 수단이 인식 처리를 실행할 것인지 아닌지를 결정하는 결정 수단을 더 구비하고,
    상기 결정 수단은, 상기 인식 수단이 상기 데이터베이스에 등록되어 있는 상기 등록 화상 정보로부터, 피사체가 이미 상기 입력 피사체 화상의 피사체와 다르다고 판정된 등록 화상 정보를 제외한 등록 화상 정보를 이용하여, 상기 추적 수단에 의해 추적된 입력 피사체 화상에 대하여 인식 처리를 실행할 것인지 아닌지를 결정하는, 화상인식장치.
  5. 제 4 항에 있어서,
    상기 데이터베이스는, 하나의 피사체에 대해서 복수의 등록 화상 정보를 포함하고,
    상기 결정 수단은, 상기 인식 수단이 상기 데이터베이스에 등록되어 있는 등록 화상 정보로부터, 이미 상기 입력 피사체 화상의 피사체와 다르다고 판정된 피사체에 관한 모든 등록 화상 정보를 제외한 등록 화상 정보를 이용하여, 상기 추적 수단에 의해 추적된 입력 피사체 화상의 적어도 한 개의 프레임에 대해서 인식 처리를 실행할 것인지 아닌지를 결정하는, 화상인식장치.
  6. 제 4 항에 있어서,
    상기 인식 수단은, 모든 등록 화상 정보가, 상기 입력 피사체 화상과 다른 피사체를 갖는다고 판정되었을 경우에, 상기 입력 피사체 화상의 피사체를 미등록의 피사체라고 판정하는, 화상인식장치.
  7. 제 4 항에 있어서,
    상기 결정 수단은, 상기 입력 피사체 화상의 피사체가 이미 상기 등록 화상 정보의 피사체와 같은 것이라고 판정되었을 경우에, 상기 인식 수단이, 상기 추적 수단에 의해 추적된 입력 피사체 화상에 대해서 인식 처리를 실행하지 않는다고 결정하는, 화상인식장치.
  8. 제 1 항 또는 제 2 항에 있어서,
    상기 제2 산출 수단은, 상기 일치도가 상기 제2의 임계값보다도 높은 등록 화상 정보에 대해서만 상기 입력 피사체 화상과의 유사도를 산출하는, 화상인식장치.
  9. 제 1 항 또는 제 2 항에 있어서,
    상기 피사체 인식가능성 상태는, 피사체의 방향, 피사체의 밝기, 피사체의 은폐도, 및 피사체가 얼굴인 얼굴 표정 중 적어도 하나를 포함하는, 화상인식장치.
  10. 입력 화상에서 피사체를 인식하는 화상인식장치의 제어방법으로서,
    피사체를 촬영해서 얻은 화상 또는 화상특징과, 이 피사체에 관한 피사체 인식가능성 상태를, 등록 화상 정보로서 상기 피사체의 ID(identification)와 관련지어 데이터베이스에 등록하는 등록 단계와,
    입력 피사체 화상의 피사체 인식가능성 상태와 상기 등록 화상 정보에 있어서의 피사체 인식가능성 상태 간의 일치도를 산출하는 제1 산출 단계와,
    상기 입력 피사체 화상의 화상 또는 화상 특징과 상기 등록 화상 정보의 화상 특징 간의 유사도를 산출하는 제2 산출 단계와,
    상기 유사도와 상기 일치도에 의거하여, 상기 입력 피사체 화상의 피사체가 상기 등록 화상 정보의 피사체와 같은 피사체인지 여부를 인식하는 인식 처리를 실행하는 인식 단계를 포함하고,
    상기 유사도가 제1의 임계값보다도 낮고, 상기 일치도가 제2의 임계값 이상이라고 산출한 경우에, 상기 인식 단계에서는 상기 입력 피사체 화상의 피사체가 상기 등록 화상 정보의 피사체와 다르다고 인식하는, 화상인식장치의 제어방법.
  11. 입력 화상에서 피사체를 인식하는 화상인식장치의 제어방법을 컴퓨터에 실행시키는 프로그램을 기억한 비일시(non-transitory) 컴퓨터 판독가능한 기억매체로서, 상기 방법은,
    피사체를 촬영해서 얻은 화상 또는 화상특징과, 이 피사체에 관한 피사체 인식가능성 상태를, 등록 화상 정보로서 상기 피사체의 ID(identification)와 관련지어 데이터베이스에 등록하는 등록 단계와,
    입력 피사체 화상의 피사체 인식가능성 상태와 상기 등록 화상 정보에 있어서의 피사체의 인식가능성 상태 간의 일치도를 산출하는 제1 산출 단계와,
    상기 입력 피사체 화상의 화상 또는 화상 특징과 상기 등록 화상 정보의 화상 특징 간의 유사도를 산출하는 제2 산출 단계와,
    상기 유사도와 상기 일치도에 의거하여, 상기 입력 피사체 화상의 피사체가 상기 등록 화상 정보의 피사체와 같은 피사체인지 여부를 인식하는 인식 처리를 실행하는 인식 단계를 포함하고,
    상기 유사도가 제1의 임계값보다도 낮고, 상기 일치도가 제2의 임계값 이상이라는 것을 산출한 경우에, 상기 인식 단계에서는 상기 입력 피사체 화상의 피사체가 상기 등록 화상 정보의 피사체와 다르다고 인식하는, 비일시 컴퓨터 판독가능한 기억매체.
KR1020110010882A 2010-02-10 2011-02-08 화상인식장치 및 방법 KR101280920B1 (ko)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JPJP-P-2010-028207 2010-02-10
JP2010028207A JP5567853B2 (ja) 2010-02-10 2010-02-10 画像認識装置および方法

Publications (2)

Publication Number Publication Date
KR20110093659A KR20110093659A (ko) 2011-08-18
KR101280920B1 true KR101280920B1 (ko) 2013-07-02

Family

ID=44226083

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020110010882A KR101280920B1 (ko) 2010-02-10 2011-02-08 화상인식장치 및 방법

Country Status (5)

Country Link
US (1) US8559722B2 (ko)
EP (1) EP2357589B1 (ko)
JP (1) JP5567853B2 (ko)
KR (1) KR101280920B1 (ko)
CN (2) CN103353933B (ko)

Families Citing this family (49)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2010101227A1 (ja) * 2009-03-04 2010-09-10 日本電気株式会社 物体位置推定用情報作成装置、物体位置推定用情報作成方法およびプログラム
JP5918996B2 (ja) * 2011-12-27 2016-05-18 キヤノン株式会社 被写体認識装置および辞書データ登録方法
US20150088625A1 (en) * 2012-01-30 2015-03-26 Nokia Corporation Method, an apparatus and a computer program for promoting the apparatus
JP5939705B2 (ja) * 2012-02-08 2016-06-22 カシオ計算機株式会社 被写体判定装置、被写体判定方法及びプログラム
JP6003124B2 (ja) * 2012-03-15 2016-10-05 オムロン株式会社 認証装置、認証装置の制御方法、制御プログラム、および記録媒体
JP5959923B2 (ja) * 2012-04-26 2016-08-02 キヤノン株式会社 検出装置、その制御方法、および制御プログラム、並びに撮像装置および表示装置
US8948568B2 (en) 2012-07-31 2015-02-03 Google Inc. Customized video
US20140036152A1 (en) * 2012-07-31 2014-02-06 Google Inc. Video alerts
CN103900712A (zh) * 2012-12-27 2014-07-02 杭州美盛红外光电技术有限公司 热像选择装置和热像选择方法
WO2014101802A1 (zh) * 2012-12-27 2014-07-03 Wang Hao 热像挑选装置和热像挑选方法
CN114923581A (zh) * 2012-12-27 2022-08-19 杭州美盛红外光电技术有限公司 红外挑选装置和红外挑选方法
JP6025557B2 (ja) * 2012-12-27 2016-11-16 キヤノン株式会社 画像認識装置、その制御方法及びプログラム
CN103902967A (zh) * 2012-12-27 2014-07-02 杭州美盛红外光电技术有限公司 图像识别控制装置和图像识别控制方法
US20150334314A1 (en) * 2012-12-27 2015-11-19 Mission Infrared Electro Optics Technology Co., Ltd Device and method for detecting thermal images
WO2014101803A1 (zh) * 2012-12-27 2014-07-03 Wang Hao 红外选择装置和红外选择方法
US9201499B1 (en) * 2013-02-11 2015-12-01 Amazon Technologies, Inc. Object tracking in a 3-dimensional environment
US9501684B1 (en) * 2013-12-13 2016-11-22 Google Inc. Providing non-destructive editing reconciliation
US9614724B2 (en) 2014-04-21 2017-04-04 Microsoft Technology Licensing, Llc Session-based device configuration
US9639742B2 (en) * 2014-04-28 2017-05-02 Microsoft Technology Licensing, Llc Creation of representative content based on facial analysis
US9773156B2 (en) 2014-04-29 2017-09-26 Microsoft Technology Licensing, Llc Grouping and ranking images based on facial recognition data
US10111099B2 (en) 2014-05-12 2018-10-23 Microsoft Technology Licensing, Llc Distributing content in managed wireless distribution networks
US9874914B2 (en) 2014-05-19 2018-01-23 Microsoft Technology Licensing, Llc Power management contracts for accessory devices
JP6362085B2 (ja) * 2014-05-21 2018-07-25 キヤノン株式会社 画像認識システム、画像認識方法およびプログラム
US10037202B2 (en) 2014-06-03 2018-07-31 Microsoft Technology Licensing, Llc Techniques to isolating a portion of an online computing service
US9367490B2 (en) 2014-06-13 2016-06-14 Microsoft Technology Licensing, Llc Reversible connector for accessory devices
US9717006B2 (en) 2014-06-23 2017-07-25 Microsoft Technology Licensing, Llc Device quarantine in a wireless network
US9934563B2 (en) 2015-10-29 2018-04-03 Empire Technology Development Llc 3D object rotation-based mechanical parts selection through 2D image processing
US10275684B2 (en) * 2015-11-04 2019-04-30 Samsung Electronics Co., Ltd. Authentication method and apparatus, and method and apparatus for training a recognizer
US10546185B2 (en) * 2015-12-01 2020-01-28 Casio Computer Co., Ltd. Image processing apparatus for performing image processing according to privacy level
JP6378664B2 (ja) * 2015-12-02 2018-08-22 株式会社オプティム 情報特定システム、情報特定方法及びそのプログラム
US10482681B2 (en) 2016-02-09 2019-11-19 Intel Corporation Recognition-based object segmentation of a 3-dimensional image
US10373380B2 (en) 2016-02-18 2019-08-06 Intel Corporation 3-dimensional scene analysis for augmented reality operations
US10359806B2 (en) * 2016-03-28 2019-07-23 Sony Interactive Entertainment Inc. Pressure sensing to identify fitness and comfort of virtual reality headset
CN105976027A (zh) * 2016-04-29 2016-09-28 北京比特大陆科技有限公司 数据处理方法和装置、芯片
CN105956658A (zh) * 2016-04-29 2016-09-21 北京比特大陆科技有限公司 数据处理方法、数据处理装置及芯片
JP6840478B2 (ja) * 2016-07-07 2021-03-10 キヤノン株式会社 電子機器
US10573018B2 (en) * 2016-07-13 2020-02-25 Intel Corporation Three dimensional scene reconstruction based on contextual analysis
KR101855990B1 (ko) * 2016-10-31 2018-05-10 (주)노바코스 차량 통과 감지 장치 및 방법
CN109272006A (zh) * 2017-07-18 2019-01-25 北京柯斯元科技有限公司 随机纹理防伪标识图案判定系统及判定方法
US11361547B2 (en) 2017-12-08 2022-06-14 Nec Communication Systems, Ltd. Object detection apparatus, prediction model generation apparatus, object detection method, and program
CN109635703A (zh) * 2018-12-05 2019-04-16 成都牧云慧视科技有限公司 一种可间断登记并持续进行基准数据更新的识别方法
CN109886145B (zh) * 2019-01-29 2021-09-03 浙江泽曦科技有限公司 宠物脸部识别方法及系统
TWI704505B (zh) * 2019-05-13 2020-09-11 和碩聯合科技股份有限公司 人臉辨識系統、建立人臉辨識之資料之方法及其人臉辨識之方法
JP7235119B2 (ja) * 2019-08-08 2023-03-08 日本電気株式会社 処理装置、会計装置、処理方法及びプログラム
JP7293039B2 (ja) * 2019-08-16 2023-06-19 キヤノン株式会社 撮像装置およびその制御方法
CN110928216B (zh) * 2019-11-14 2020-12-15 深圳云天励飞技术有限公司 人工智能装置
CN111696184B (zh) * 2020-06-10 2023-08-29 上海米哈游天命科技有限公司 骨骼蒙皮融合确定方法、装置、设备和存储介质
KR102464196B1 (ko) * 2022-05-25 2022-11-09 주식회사 유투에스알 빅데이터 기반 영상 감시시스템
KR102464197B1 (ko) * 2022-05-25 2022-11-09 주식회사 유투에스알 빅데이터 기반 영상 감시 방법

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5450504A (en) 1992-05-19 1995-09-12 Calia; James Method for finding a most likely matching of a target facial image in a data base of facial images
KR20070026080A (ko) * 2005-08-29 2007-03-08 소니 가부시끼 가이샤 화상 처리 장치 및 방법, 및 프로그램
KR20070075644A (ko) * 2006-01-13 2007-07-24 삼성전자주식회사 보상적 특징에 기반한 확장형 얼굴 인식 방법 및 장치
US20090309702A1 (en) 2008-06-16 2009-12-17 Canon Kabushiki Kaisha Personal authentication apparatus and personal authentication method

Family Cites Families (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4143305B2 (ja) * 2001-01-30 2008-09-03 日本電気株式会社 ロボット装置、照合環境判定方法、及び照合環境判定プログラム
JP2002251380A (ja) 2001-02-22 2002-09-06 Omron Corp 利用者照合システム
JP2003187352A (ja) 2001-12-14 2003-07-04 Nippon Signal Co Ltd:The 特定人物検出システム
JP2005056004A (ja) * 2003-08-07 2005-03-03 Omron Corp 顔照合装置、顔照合方法、および顔照合プログラム
JP2005084815A (ja) * 2003-09-05 2005-03-31 Toshiba Corp 顔認識装置、顔認識方法および通行制御装置
US8868555B2 (en) * 2006-07-31 2014-10-21 Ricoh Co., Ltd. Computation of a recongnizability score (quality predictor) for image retrieval
US20060120571A1 (en) * 2004-12-03 2006-06-08 Tu Peter H System and method for passive face recognition
JP2006236255A (ja) * 2005-02-28 2006-09-07 Mitsubishi Electric Corp 人物追跡装置および人物追跡システム
JP4845715B2 (ja) * 2006-12-22 2011-12-28 キヤノン株式会社 画像処理方法、画像処理装置、プログラム、及び記憶媒体
JP4952920B2 (ja) * 2007-06-04 2012-06-13 カシオ計算機株式会社 被写体判定装置、被写体判定方法及びそのプログラム
CN100481112C (zh) * 2007-06-11 2009-04-22 湖北东润科技有限公司 一种人脸识别系统与识别方法
CN100463000C (zh) * 2007-09-27 2009-02-18 上海交通大学 基于级联分类和哈夫圆变换的人眼状态检测方法
JP2009163555A (ja) * 2008-01-08 2009-07-23 Omron Corp 顔照合装置
US8180112B2 (en) * 2008-01-21 2012-05-15 Eastman Kodak Company Enabling persistent recognition of individuals in images
CN100557625C (zh) * 2008-04-18 2009-11-04 清华大学 人脸部件特征和Gabor人脸特征融合的人脸识别方法及其装置

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5450504A (en) 1992-05-19 1995-09-12 Calia; James Method for finding a most likely matching of a target facial image in a data base of facial images
KR20070026080A (ko) * 2005-08-29 2007-03-08 소니 가부시끼 가이샤 화상 처리 장치 및 방법, 및 프로그램
KR20070075644A (ko) * 2006-01-13 2007-07-24 삼성전자주식회사 보상적 특징에 기반한 확장형 얼굴 인식 방법 및 장치
US20090309702A1 (en) 2008-06-16 2009-12-17 Canon Kabushiki Kaisha Personal authentication apparatus and personal authentication method

Also Published As

Publication number Publication date
JP2011165008A (ja) 2011-08-25
EP2357589B1 (en) 2019-06-12
CN103353933A (zh) 2013-10-16
CN103353933B (zh) 2016-12-28
US8559722B2 (en) 2013-10-15
KR20110093659A (ko) 2011-08-18
EP2357589A2 (en) 2011-08-17
US20110194732A1 (en) 2011-08-11
CN102147856B (zh) 2013-06-05
EP2357589A3 (en) 2012-01-25
JP5567853B2 (ja) 2014-08-06
CN102147856A (zh) 2011-08-10

Similar Documents

Publication Publication Date Title
KR101280920B1 (ko) 화상인식장치 및 방법
US8314854B2 (en) Apparatus and method for image recognition of facial areas in photographic images from a digital camera
US8879802B2 (en) Image processing apparatus and image processing method
US8243159B2 (en) Image capturing device, image processing device, image analysis method for the image capturing device and the image processing device, and program for facial attribute detection
JP6049448B2 (ja) 被写体領域追跡装置、その制御方法及びプログラム
JP6564271B2 (ja) 撮像装置及び画像処理方法、プログラム、並びに記憶媒体
US11036966B2 (en) Subject area detection apparatus that extracts subject area from image, control method therefor, and storage medium, as well as image pickup apparatus and display apparatus
JP6025557B2 (ja) 画像認識装置、その制御方法及びプログラム
US10013632B2 (en) Object tracking apparatus, control method therefor and storage medium
US9571740B2 (en) Image recognition device that recognizes specific object area, method of controlling the device, and storage medium, as well as image pickup apparatus, and display device
JP2009123081A (ja) 顔検出方法及び撮影装置
CN108259769B (zh) 图像处理方法、装置、存储介质及电子设备
JP5539565B2 (ja) 撮像装置及び被写体追跡方法
US10140503B2 (en) Subject tracking apparatus, control method, image processing apparatus, and image pickup apparatus
JP2011159030A (ja) 被写体認証装置、被写体認証方法及びプログラム
JP5995610B2 (ja) 被写体認識装置及びその制御方法、撮像装置、表示装置、並びにプログラム
JP5374612B2 (ja) 画像データの識別方法及び撮像装置、プログラム、及び記憶媒体
JP5247419B2 (ja) 撮像装置および被写体追跡方法
JP5002311B2 (ja) 撮像装置、撮像装置の制御方法、プログラム、及び記憶媒体
JP5500934B2 (ja) 撮像装置及びその制御方法、プログラム並びに記憶媒体

Legal Events

Date Code Title Description
A201 Request for examination
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20160525

Year of fee payment: 4

FPAY Annual fee payment

Payment date: 20170526

Year of fee payment: 5

FPAY Annual fee payment

Payment date: 20180525

Year of fee payment: 6

FPAY Annual fee payment

Payment date: 20190618

Year of fee payment: 7