KR20150047060A - 명함 이미지 여부를 판별하는 장치 및 방법 - Google Patents

명함 이미지 여부를 판별하는 장치 및 방법 Download PDF

Info

Publication number
KR20150047060A
KR20150047060A KR1020130126843A KR20130126843A KR20150047060A KR 20150047060 A KR20150047060 A KR 20150047060A KR 1020130126843 A KR1020130126843 A KR 1020130126843A KR 20130126843 A KR20130126843 A KR 20130126843A KR 20150047060 A KR20150047060 A KR 20150047060A
Authority
KR
South Korea
Prior art keywords
image
business card
histogram
pixels
present
Prior art date
Application number
KR1020130126843A
Other languages
English (en)
Inventor
박기범
김재원
Original Assignee
주식회사 디오텍
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 주식회사 디오텍 filed Critical 주식회사 디오텍
Priority to KR1020130126843A priority Critical patent/KR20150047060A/ko
Publication of KR20150047060A publication Critical patent/KR20150047060A/ko

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • G06F18/2411Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on the proximity to a decision surface, e.g. support vector machines
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T5/00Image enhancement or restoration
    • G06T5/20Image enhancement or restoration using local operators
    • G06T5/30Erosion or dilatation, e.g. thinning

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • General Physics & Mathematics (AREA)
  • Artificial Intelligence (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • General Engineering & Computer Science (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Character Input (AREA)

Abstract

본 발명은 명함 이미지 여부를 판별하는 장치 및 방법에 관한 것으로서, 전술한 바와 같은 과제를 해결하기 위하여 본 발명의 일 실시예에 따른 명함 이미지 여부를 판별하는 방법은, 대상물에 대한 이미지를 획득하는 단계; 이미지의 일부 또는 전부에 대한 이진화 처리를 수행하는 단계; 복수의 픽셀로 분할된 이미지의 일부 또는 전부에 대한 히스토그램을 추출하는 단계; 및 히스토그램을 기반으로 이미지가 명함 이미지인지 여부를 판별하는 단계를 포함하는 것을 특징으로 한다.

Description

명함 이미지 여부를 판별하는 장치 및 방법 {METHOD OF IDENTIFING BUSINESS CARD AND APPARATUS THEREOF}
본 발명은 명함 이미지 여부를 판별하는 장치 및 방법에 관한 것으로서, 보다 구체적으로는, 획득된 이미지로부터 추출된 히스토그램을 기반으로 획득된 이미지가 명함 이미지인지 아닌지 판별하는 장치 및 방법에 관한 것이다.
근래에 들어, 이미지 내에 포함된 한글, 영어, 숫자 등을 인식하여 편집 가능하게 텍스트로 표시해주는 광학 문자 인식 (OCR: Optical Character Recognition) 서비스가 널리 이용되고 있다. 특히, 스마트폰이 빠르게 보급됨에 따라, 스마트폰에 탑재된 카메라로 촬영된 이미지 내에서 문자를 인식하여 디스플레이에 표시하여 주는 OCR 어플리케이션이 널리 이용되고 있다.
이러한 OCR 어플리케이션은 스마트폰의 카메라로 명함을 촬영하는 경우에 매우 유용할 수 있다. 왜냐하면, 사용자가 명함을 분실할 우려로부터 벗어날 수 있을 뿐 아니라, 사용자가 명함 내에 포함된 문자열을 한 문자씩 입력할 필요 없이 디스플레이에 표시된 상기 문자열을 복사하여 주소록에 저장하기만 하면 고객 정보를 쉽게 관리할 수 있기 때문이다.
이러한 장점을 적극적으로 활용하여 최근에는 주소록 어플리케이션과 연동하는 OCR을 이용한 명함 인식 어플리케이션이 등장하였다. 이러한 어플리케이션은 고객의 성함, 이메일 주소, 휴대폰 번호, 회사의 직위 같은 명함 내에 포함된 수많은 정보들을 인식하여 분류하고, 주소록의 각 영역에 자동으로 저장해주는 기능을 수행한다. 결과적으로, 사용자는 카메라로 명함을 촬영하기만 하여 명함 내에 포함된 고객의 정보들을 자동으로 저장할 수 있는 것이다.
그러나, 종래의 어플리케이션들은 일반 문서 이미지와 명함 이미지 (명함이 포함된 이미지) 를 구별해낼 수 없다. 따라서, 사용자가 위와 같은 서비스를 이용하기 위해서는 스마트폰으로 명함을 촬영하기 이전에 반드시 명함 인식 모드를 작동시켜야만 한다. 이러한 제약은 사용자에게 불편함을 야기할 뿐만 아니라 사용자로 하여금 위와 같은 서비스의 적극적인 이용을 기피하게 하는 주요한 원인이 되었다.
이에 카메라를 통해 획득된 이미지가 명함 이미지인지 여부를 자동으로 판별할 수 있는 기술에 대한 요구가 계속되고 있는 실정이다.
본 발명이 해결하고자 하는 과제는, 카메라를 통해 획득된 이미지가 명함 이미지인지 여부를 빠르고 정확하게 판별할 수 있는 장치 및 방법을 제공하는 것이다.
본 발명이 해결하고자 하는 과제는, 사용자가 명함 인식 프로그램을 작동시킬 필요 없이 명함 내에 포함된 고객 정보를 자동으로 저장할 수 있는 장치 및 방법을 제공하는 것이다.
본 발명이 해결하고자 하는 과제는, 사용자가 시간 효율적으로 고객에 관한 정보를 관리할 수 있는 장치 및 방법을 제공하는 것이다.
본 발명의 과제들은 이상에서 언급한 과제들로 제한되지 않으며, 언급되지 않은 또 다른 과제들은 아래의 기재로부터 당업자에게 명확하게 이해될 수 있을 것이다.
전술한 바와 같은 과제를 해결하기 위하여 본 발명의 일 실시예에 따른 명함 이미지 여부를 판별하는 방법은, 대상물에 대한 이미지를 획득하는 단계; 이미지의 일부 또는 전부에 대한 이진화 처리를 수행하는 단계; 복수의 픽셀로 분할된 이미지의 일부 또는 전부에 대한 히스토그램을 추출하는 단계; 및 히스토그램을 기반으로 이미지가 명함 이미지인지 여부를 판별하는 단계를 포함하는 것을 특징으로 한다.
본 발명의 다른 특징에 따르면, 이미지가 명함 이미지로 판별되는 경우, 이미지 내에 포함된 문자열의 적어도 일부가 저장될 수 있다.
본 발명의 다른 특징에 따르면, 히스토그램은 가로 히스토그램 및 세로 히스토그램으로 구성될 수 있다.
본 발명의 다른 특징에 따르면, 이진화 처리를 수행하는 단계 이전에, 이미지의 일부 또는 전부를 그레이-스케일 이미지로 변환시키는 단계를 더 포함할 수 있다.
본 발명의 다른 특징에 따르면, 이진화 처리를 수행하는 단계 이전에, 이미지의 일부 또는 전부의 치수를 조정하는 단계를 더 포함할 수 있다.
본 발명의 다른 특징에 따르면, 이진화 처리를 수행하는 단계 이전에, 이미지 내의 명함 영역을 검출하는 단계를 더 포함할 수 있다.
본 발명의 다른 특징에 따르면, 명함 영역은 직사각형 형태의 영역일 수 있다.
본 발명의 다른 특징에 따르면, 이미지 내의 명함 영역을 검출하는 단계는, 이미지에 대한 침식 연산 및 팽창 연산을 수행하는 단계를 포함할 수 있다.
본 발명의 다른 특징에 따르면, 이미지 내의 명함 영역을 검출하는 단계는, 허프 변환 (hough transform) 알고리즘에 기초하여 이미지 내의 직선들을 검출하는 단계; 및 직선들 간의 교점들에 기초하여 명함 영역을 검출하는 단계를 포함할 수 있다.
본 발명의 다른 특징에 따르면, 이미지 내에서 명함 영역이 검출되는 경우, 복수의 픽셀로 분할된 명함 영역으로부터 히스토그램이 추출될 수 있다.
본 발명의 다른 특징에 따르면, 이미지 내에서 명함 영역이 검출되지 아니하는 경우, 복수의 픽셀로 분할된 이미지 전부로부터 히스토그램이 추출될 수 있다.
본 발명의 다른 특징에 따르면, 이미지가 명함 이미지인지 여부를 판별하는 단계는, 미리 알려진 명함 이미지들 및 비-명함 이미지들로부터 특성 값을 추출하는 단계; 특성 값을 정규화하여 SVM (Support Vector Machine) 에 학습시키는 단계; 및 SVM을 이용하여 이미지가 명함 이미지인지 비-명함 이미지인지 판별하는 단계를 포함하며, 특성 값은 히스토그램을 포함할 수 있다.
본 발명의 다른 특징에 따르면, 특성 값은 명함 영역 검출 여부 및 명함 영역의 선분들의 길이를 더 포함할 수 있다.
전술한 바와 같은 과제를 해결하기 위하여 본 발명의 일 실시예에 따른 명함 이미지 여부를 판별하는 장치로서, 대상물에 대한 이미지를 획득하기 위한 이미지 획득부; 이미지의 일부 또는 전부에 대한 이진화 처리를 수행하기 위한 이진화 처리부; 복수의 픽셀로 분할된 이미지의 일부 또는 전부에 대한 히스토그램을 추출하기 위한 히스토그램 추출부; 및 히스토그램을 기반으로 이미지가 명함 이미지인지 여부를 판별하기 위한 명함 이미지 판별부를 포함하는 것을 특징으로 한다.
전술한 바와 같은 과제를 해결하기 위하여 본 발명의 일 실시예에 따른 명령어 세트들을 저장하는 컴퓨터 판독가능매체로서, 명령어 세트들은, 컴퓨팅 장치에 의해 실행되는 경우에 컴퓨팅 장치로 하여금, 대상물에 대한 이미지를 획득하도록 하고, 이미지의 일부 또는 전부에 대한 이진화 처리를 수행하도록 하고, 복수의 픽셀로 분할된 이미지의 일부 또는 전부에 대한 히스토그램을 추출하도록 하고, 그리고 히스토그램을 기반으로 이미지가 명함 이미지인지 여부를 판별하도록 하는 것을 특징으로 한다.
기타 실시예의 구체적인 사항들은 상세한 설명 및 도면들에 포함되어 있다.
본 발명은 카메라를 통해 획득된 이미지가 명함 이미지인지 여부를 빠르고 정확하게 판별할 수 있는 효과가 있다.
본 발명은 사용자가 명함 인식 프로그램을 작동시킬 필요 없이 명함 내에 포함된 고객 정보를 자동으로 저장할 수 있는 효과가 있다.
본 발명은 사용자가 시간 효율적으로 고객에 관한 정보를 관리할 수 있는 효과가 있다.
본 발명에 따른 효과는 이상에서 예시된 내용에 의해 제한되지 않으며, 더욱 다양한 효과들이 본 명세서 내에 포함되어 있다.
도 1은 본 발명의 일 실시예에 따른, 명함 이미지 여부 판별 장치의 전체 구성을 개략적으로 나타내는 도면이다.
도 2는 본 발명의 일 실시예에 따른, 명함 이미지 여부 판별 방법에 관한 흐름도이다.
도 3a는 본 발명의 일 실시예에 따른, 명함 영역을 검출하는 방법을 나타내는 흐름도이다.
도 3b는 본 발명의 일 실시예에 따른, 허프 변환 알고리즘을 이용하여 이미지 내의 직선들을 검출하는 모습을 나타내는 도면이다.
도 4a는 일반적인 명함 이미지와 일반 문서 이미지를 비교하여 나타내는 도면이다.
도 4b는 대상 이미지로부터 히스토그램을 추출하기 위한 원리를 설명하기 위한 도면이다.
도 4c는 명함 이미지와 일반 문서 이미지로부터 실제로 히스토그램을 추출한 모습을 나타내는 도면이다.
도 5a는 복수의 블록들로 분할된 대상 이미지를 나타내는 도면이다.
도 5b는 명함 이미지 및 일반 문서 이미지의 블록 내에 존재하는 각각의 검은 픽셀의 수를 나타내는 도면이다.
도 6은 본 발명의 일 실시예에 따른, SVM을 이용한 명함 이미지 여부 판별 방법에 관한 흐름도이다.
본 발명의 이점 및 특징, 그리고 그것들을 달성하는 방법은 첨부되는 도면과 함께 상세하게 후술되어 있는 실시예들을 참조하면 명확해질 것이다. 그러나, 본 발명은 이하에서 개시되는 실시예들에 한정되는 것이 아니라 서로 다른 다양한 형태로 구현될 것이며, 단지 본 실시예들은 본 발명의 개시가 완전하도록 하며, 본 발명이 속하는 기술분야에서 통상의 지식을 가진 자에게 발명의 범주를 완전하게 알려주기 위해 제공되는 것이며, 본 발명은 청구항의 범주에 의해 정의될 뿐이다.
본 발명의 이점 및 특징, 그리고 그것들을 달성하는 방법은 첨부되는 도면과 함께 상세하게 후술되어 있는 실시예들을 참조하면 명확해질 것이다. 그러나, 본 발명은 이하에서 개시되는 실시예들에 한정되는 것이 아니라 서로 다른 다양한 형태로 구현될 것이며, 단지 본 실시예들은 본 발명의 개시가 완전하도록 하며, 본 발명이 속하는 기술분야에서 통상의 지식을 가진 자에게 발명의 범주를 완전하게 알려주기 위해 제공되는 것이며, 본 발명은 청구항의 범주에 의해 정의될 뿐이다.
명세서 전체에 걸쳐 동일 참조 부호는 동일 구성 요소를 지칭한다.
본 발명의 여러 실시예들의 각각 특징들이 부분적으로 또는 전체적으로 서로 결합 또는 조합 가능하며, 당업자가 충분히 이해할 수 있듯이 기술적으로 다양한 연동 및 구동이 가능하며, 각 실시예들이 서로에 대하여 독립적으로 실시 가능할 수도 있고 연관 관계로 함께 실시 가능할 수도 있다.
본 명세서에서 명함 이미지란 명함이 포함되어 있는 이미지를 말한다. 따라서, 해당 이미지가 명함 만을 포함하고 있는 경우는 물론이고, 해당 이미지가 명함 외에 다른 배경을 포함하고 있는 경우 역시도 본 발명의 명함 이미지로 간주될 수 있다.
이하, 첨부된 도면을 참조하여 본 발명의 다양한 실시예들을 상세히 설명한다.
도 1은 본 발명의 일 실시예에 따른, 명함 이미지 여부 판별 장치 (100) 의 전체 구성을 개략적으로 나타내는 도면이다.
도 1을 참조하면, 본 발명의 명함 이미지 여부 판별 장치 (100) 는, 이미지 획득부 (110), 이진화 처리부 (140), 히스토그램 추출부 (150) 및 명함 이미지 판별부 (180) 를 포함한다. 나아가, 본 발명의 명함 이미지 여부 판별 장치 (100) 는 명함 영역 검출부 (120), 치수 조정부 (130), 블록 분할부 (160), 픽셀 카운트부 (170), 제어부 (190) 및 메모리 (200) 를 더 포함할 수 있다.
본 발명의 이미지 획득부 (110) 는 대상물에 대한 이미지를 획득하는 기능을 수행한다. 바람직하게는, 본 발명의 이미지 획득부 (110) 는 휴대용 통신 기기에 탑재될 수 있는 CCD 카메라를 의미할 수 있으나, 반드시 이에 한정되는 것은 아니고, 이미지 획득 기능을 수행할 수 있는 본 기술분야의 모든 촬영 기기를 포함할 수 있다.
본 발명의 명함 영역 검출부 (120) 는 획득된 이미지 내에서 명함 영역을 검출하는 기능을 수행한다. 여기서, 본 발명의 명함 영역이란, 획득된 이미지 내에 존재하는, 사용자에 의해 기설정된 명함 형태의 영역으로서, 일반적으로 사각형 형태의 영역을 의미할 수 있다. 이러한 의미에서, 이하에서는 본 발명의 명함 영역이 사각형 형태의 영역인 것으로 가정하여 설명하도록 하겠다. 한편, 본 발명의 명함 영역 검출부 (120) 는 이미지 내에서 다양한 방법으로 명함 영역을 검출해낼 수 있는데, 이에 대해서는 후술하기로 한다.
본 발명의 치수 조정부 (130) 는 이미지의 일부 또는 전부가 명함의 형태, 이를 테면 직사각형의 형태가 되도록, 이미지의 일부 또는 전부의 치수를 조정하는 기능을 수행한다.
본 발명의 이진화 처리부 (140) 는 이미지의 일부 또는 전부에 대한 이진화 처리를 수행한다. 여기서 이진화 처리란 이미지 내에 나타나는 모든 픽셀들이 흑 또는 백으로만 표시되도록 처리하여 데이터 양을 감소시키는 것을 의미한다. 여기서, 이진화 처리부 (140) 는 이미지의 일부 또는 전부에 대한 이진화 처리를 수행하기 위해 다양한 방법을 이용할 수 있으나, 바람직하게는 기설정된 임계값 (threshold-value) 을 기준으로 픽셀들을 흑 또는 백으로 표시하는 “Otsu threshold” 알고리즘을 이용하여 이미지의 일부 또는 전부에 대한 이진화 처리를 수행할 수 있다.
본 발명의 히스토그램 추출부 (150) 는 복수의 픽셀로 분할되어 있는 이미지의 일부 또는 전부에 대한 히스토그램 (histogram) 을 추출하는 기능을 수행한다. 히스토그램 추출부 (150) 가 히스토그램을 추출하는 구체적인 방법에 관해서는 후술하도록 하겠다.
본 발명의 블록 변환부 (160) 는 이진화 처리된 이미지의 일부 또는 전부를, 각각이 복수의 픽셀을 포함하는 복수의 블록으로 분할하는 기능을 수행할 수 있다.
앞서 설명한 바와 같이, 본 발명의 치수 조정부 (130), 히스토그램 추출부 (150) 및 블록 변환부 (160) 는 이미지 획득부 (110) 에 의해 획득되는 이미지의 일부 또는 전부를 처리한다. 이미지 획득부 (110) 에 의해 획득되는 최초 이미지가 명함 영역 검출부 (120) 에 의해 어떻게 변화되는지와는 무관하게, 본 발명에서는 치수 조정부 (130), 히스토그램 추출부 (150) 및 블록 변환부 (160) 에 의해 처리되는, 즉 치수가 조정되고, 히스토그램이 추출되고, 복수의 블록으로 분할되는 최초 이미지 내의 일부 또는 전부를 '대상 이미지'로 정의한다. 여기서, 최초 획득된 이미지의 어떤 부분이 대상 이미지가 될 것인지는 명함 영역 검출부 (120) 에 의해 명함 영역으로 정의된 영역이 검출되는지 여부에 따라 달라질 수 있다. 보다 구체적으로, 명함 영역 검출부 (120) 에 의해 명함 영역이 검출되는 경우에는 명함 영역 자체가 대상 이미지가 되고, 명함 영역 검출부 (120) 에 의해 명함 영역이 검출되지 아니하는 경우에는 이미지 획득부 (110) 에 의해 획득된 전체 이미지가 대상 이미지가 될 수 있다.
본 발명의 픽셀 카운트부 (170) 는 복수의 블록 내에 포함되는 각각의 검은 픽셀의 수 또는 일정 수 이하의 검은 픽셀을 가지는 블록의 수를 카운트하는 기능을 수행한다. 여기서, 일정 수는 '0'을 포함할 수 있으며, 그 크기는 본 발명을 이용하는 사용자에 의해 적절하게 조절될 수 있다.
본 발명의 명함 이미지 판별부 (180) 는 히스토그램 추출부 (150) 에 의해 추출된 히스토그램을 기반으로 이미지 획득부 (110) 에 의해 획득된 이미지가 명함 이미지인지 판별할 수 있다. 명함 이미지 판별부 (180) 는 바람직하게는 SVM (Support Vector Machine) 을 이용하여 획득된 이미지가 명함 이미지인지 아닌지 판별할 수 있는데, 이에 대해서는 후술하도록 하겠다.
본 발명의 제어부 (190) 는 이미지 획득부 (110), 명함 영역 검출부 (120), 치수 조정부 (130), 이진화 처리부 (140), 히스토그램 추출부 (150), 블록 분할부 (160), 픽셀 카운트부 (170), 명함 이미지 판별부 (180) 및 메모리 (200) 의 데이터의 흐름을 제어하는 기능을 수행한다. 제어부 (190) 는 외부로부터의 또는 명함 이미지 여부 판별 장치 (100) 의 각 구성요소 간의 데이터의 흐름을 제어함으로써, 이미지 획득부 (110), 명함 영역 검출부 (120), 치수 조정부 (130), 이진화 처리부 (140), 히스토그램 추출부 (150), 블록 분할부 (160), 픽셀 카운트부 (170), 명함 이미지 판별부 (180) 및 메모리 (200) 에서 각각 고유 기능이 수행되도록 제어한다.
본 발명의 메모리 (200) 는 SVM 학습에 이용되는 데이터 세트들이 저장되는 수단으로 기능할 수 있다. 본 발명의 구현 방법에 따라, 메모리 (200) 가 SVM 학습에 이용되는 데이터 세트들을 외부의 서버로부터 실시간 다운로드 하는 것도 가능하다. 한편, 획득된 이미지가 명함 이미지로 판별되는 경우 명함 내에 포함되어 있는 문자열 데이터 중 적어도 일부가 메모리 (200) 에 저장될 수 있다. 본 발명의 명함 이미지 여부 판별 장치 (100) 가 디스플레이 수단을 구비하는 경우, 문자열의 저장과 동시에 상기 문자열이 디스플레이 수단에 출력될 수도 있을 것이다. 메모리 (200) 는 램 (RAM; random access memory), 롬 (ROM; read-only memory), 자기 디스크 (magnetic disk) 장치, 광 디스크 (optical disk) 장치, 플래시 메모리 등을 포함할 수 있으나, 반드시 이에 제한되는 것은 아니다.
도 2는 본 발명의 일 실시예에 따른, 명함 이미지 여부 판별 방법에 관한 흐름도이다.
먼저, 이미지 획득부 (110) 에 의해 대상물에 대한 최초 이미지가 획득된다 (S201).
다음으로, 최초 이미지 내에서 명함 영역, 이를 테면 사각형 형태의 영역을 검출해낼 수 있다 (S203). 이러한 단계는 선택적으로 수행될 수 있으며, 명함 영역을 검출해내는 구체적인 방법에 대해서는 후술한다.
다음으로, 명함 영역이 검출되는 경우 상기 명함 영역을 대상 이미지로 선택할 수 있다 (S205). 앞서 설명한 바와 같이, 명함 영역이 검출되지 아니하는 경우에는 최초 이미지 전체를 대상 이미지로 선택할 수 있다 (S207).
다음으로, 대상 이미지의 치수를 명함 형태가 되도록 조정할 수 있다 (S209). 획득된 이미지 내에 명함 영역이 존재한다고 하더라도, 이미지를 촬영하는 각도에 따라 명함 영역의 가로 및 세로 비율은 사용자가 원하는 형태가 아닐 수 있다. 이를 테면, 사용자가 명함을 비스듬하게 촬영함에 따라, 직선과 직선이 이루는 각도가 90도가 아닌 상태로 명함 영역이 획득될 수도 있고, 이미지 내의 명함 영역의 윗변과 아랫변의 길이가 상이할 수도 있는 것이다. 추후에 수행될 히스토그램 추출 및 블록화 작업을 원활하게 수행하기 위해서는 대상 이미지의 치수가 일반적인 명함의 치수에 근접한 것이 매우 유리하다. 따라서, 단계 209에서는 대상 이미지의 치수를 사용자가 미리 설정한 명함 치수에 근접하도록 조정할 수 있다. 이러한 단계 209는 왜곡 보정과 사이즈 보정을 모두 포함할 수 있다.
다음으로, 대상 이미지에 대한 이진화 처리를 수행한다 (S211). 대상 이미지에 대한 이진화 처리를 수행하기 위해, 앞서 설명한 바와 같은 “Otsu threshold” 알고리즘을 이용될 수 있다. 앞서 수행된 단계 209가 대상 이미지 자체의 보정이라면, 이진화 처리 단계 211은 이미지의 데이터를 처리하는 것이라 볼 수 있다.
다음으로, 대상 이미지를 복수의 픽셀로 분할하고, 복수의 픽셀로 분할된 대상 이미지로부터 히스토그램을 추출한다 (S213). 대상 이미지로부터 히스토그램을 추출하는 구체적인 원리 및 방법에 대해서는 후술한다.
다음으로, 대상 이미지를 복수의 픽셀을 포함하는 복수의 블록으로 분할하고 (S215), 대상 이미지 내에서 복수의 블록 내에 존재하는 각각의 검은 픽셀의 수 또는 일정 수 이하의 검은 픽셀을 가지는 블록의 수를 카운트할 수 있다 (S217). 이러한 단계는 선택적으로 수행될 수 있으며, 단계 215 및 단계 217를 수행하는 구체적인 방법에 대해서는 후술한다.
다음으로, 추출된 히스토그램을 기반으로 획득된 이미지의 명함 이미지 여부를 판별한다 (S219). 본 발명에서는 명함 이미지 여부를 판별하기 위해 SVM을 이용할 수 있는데, 이에 대해서는 후술한다.
다음으로, 획득된 이미지가 명함 이미지로 판별되는 경우, 명함 이미지 내에 포함된 고객 정보들이 분류되어 메모리 (200) 내에 자동으로 저장될 수 있다 (S221). 여기서, 고객의 성함, 이메일 주소, 휴대폰 번호, 회사의 직위 같은 수많은 고객 정보들은 각 카테고리 별로 분류되어, 명함 이미지 판별 장치 (100) 의 각 카테고리 영역에 저장될 수 있다. 또한, 명함 이미지 내에 포함된 고객 정보를 추출해내기 위해, 바람직하게는 광학 문자 인식 (OCR) 기법이 적용될 수 있다. 또한, 명함 이미지 여부 판별 장치가 디스플레이 수단을 구비하는 경우, 문자열의 저장과 동시에 상기 문자열이 편집 가능하도록 텍스트 형태로 디스플레이 수단에 출력될 수도 있을 것이다.
이상 살펴본 바와 같은, 본 발명에 따른 명함 이미지 여부 판별 방법의 각 단계들을 아래에서 상세하게 살펴보기로 한다.
명함 영역의 검출
이하에서는 본 발명에서 선택적으로 수행되는 명함 영역을 검출하는 방법에 관하여 상세하게 살펴보기로 한다.
도 3a는 본 발명의 일 실시예에 따른, 명함 영역을 검출하는 방법을 나타내는 흐름도이다.
먼저, 최초 이미지에 대한 침식 (erosion) 연산 및 팽창 (dilation) 연산을 수행할 수 있다 (S301). 여기서, 침식 연산은 객체 영역에 대해 배경을 확장시키고 객체 영역의 크기를 축소하는 연산일 수 있으며, 팽창 연산은 축소된 객체 영역의 크기를 원래 크기로 복원하는 연산일 수 있다. 침식 연산과 팽창 연산을 수행하기 이전에 각 연산들이 수행되는 객체 영역의 모양을 미리 결정해 줄 필요가 있는데, 검출해내고자 하는 명함 영역이 사각형 형태인 경우, 각 연산들이 수행되는 객체 영역을 사각형으로 설정할 수 있다. 침식 연산과 팽창 연산을 수행한 결과 최초 이미지에서 잡음이 제거되고 객체 영역 (명함 영역) 의 테두리 라인이 정리될 수 있다.
다음으로, 객체 영역의 테두리 라인이 명확하게 나타나도록 이미지를 그레이 이미지로 변환시킬 수 있다 (S303). 이미지를 그레이 이미지로 변환시키기 위해, 색상의 변화가 얼마나 되는지 파악할 수 있는 “Gradient Magnitude” 알고리즘을 이용할 수 있다. 이를 테면, 2006년 3월 Yangxing Liu 등에 의해 발표된 논문 “A Contour-Based Robust Algorithm for Text Detection in Color Images” 에 개시된 “Gradient Magnitude” 알고리즘을 이용할 수 있다 (상기 논문의 내용은 그 전체로서 본 발명에 편입되는 것으로 간주된다).
다음으로, 이미지를 이진화 처리할 수 있다 (S305). 이는 명함 영역을 검출해내기 위한 것으로서, 히스토그램을 추출하기 위해 대상 이미지에 대해 수행하는 이진화 처리 단계 (S211) 와 구별될 수 있다. 이미지에 대한 이진화 처리를 수행하기 위해, 앞서 설명한 바와 같은 “Otsu threshold” 알고리즘이 이용될 수 있다.
다음으로, 이미지 내에서 직선들을 검출할 수 있다 (S307). 여기서, 이미지 내의 직선들을 검출하기 위해 허프 변환 (Hough Transform) 알고리즘을 이용할 수 있다. 허프 변환 알고리즘은 이차원 평면 내에 존재하는 모든 직선은 극좌표계 (polar coordinate) 에서 r과 θ의 두 개의 변수로 표현 가능하다는 점 (즉, r = x·cosθ + y·sinθ 로 표현 가능하다는 점) 을 이용한다. 모든 θ에 대해 r 값을 계산하여 rθ 평면에 그리면 그 형태는 곡선이 되는데, 이러한 좌표 변화를 모든 점에 대해 실행하면 동일한 직선에 포함되는 점들은 rθ 평면에서 한 점에 누적되게 되며, 누적 빈도 수가 일정 수준 이상이라면 직선이라고 판단할 수 있다.
도 3b은 본 발명의 일 실시예에 따른, 허프 변환 알고리즘을 이용하여 이미지 내의 직선들을 검출하는 모습을 나타내는 도면이다.
도 3b를 참조하면, 이미지 내에 존재하는 모든 직선들 중 해당 직선 상에 존재하는 검은 픽셀의 누적 개수가 일정 값 이상인 직선을 이미지 내의 존재하는 직선이라고 판단하고, 이러한 직선을 이미지 내에서 적색으로 표시하는 것을 확인할 수 있다.
다음으로, 검출된 직선들 간의 교점들에 기초하여 최초 이미지 내에서 명함 영역을 검출할 수 있다 (S309). 보다 구체적으로, 검출된 직선들 간의 교점들 중 불필요한 교점들을 제거하고, 명함 영역, 이를 테면 다각형 영역을 이루는 교점들 (명함 영역이 사각형인 경우 네 개의 꼭짓점들) 을 분리해내어, 명함 영역을 검출해내는 것이다.
도 3c는 본 발명의 일 실시예에 따른, 직선들 간의 교점에 기초하여 이미지 내에서 명함 영역을 검출해내는 모습을 나타내는 도면이다.
도 3c를 참조하면, 직선들의 교점들 중 불필요한 교점들이 제거되고, 사각형 형태의 명함 영역을 이루는 네 개의 꼭짓점들이 추출되어, 명함 영역이 검출되는 것을 확인할 수 있다.
히스토그램의 추출
이하에서는 본 발명의 주요 구성인 대상 이미지로부터의 히스토그램의 추출 관하여 상세하게 살펴보기로 한다.
일반적으로 명함 이미지는 일반 문서 이미지와는 달리, 명함 영역 내에 글자가 존재하지 아니하는 여백 부분이 많을 뿐 아니라 명함 영역 내에서도 글자의 배치가 일정하지 아니하다.
도 4a는 일반적인 명함 이미지와 일반 문서 이미지를 비교하여 나타내고 있다.
도 4a에 도시된 바와 같이, 명함 이미지는 글자가 존재하지 아니하는 여백 부분이 많을 뿐 아니라 좌측 아랫부분과 우측 윗부분에는 글자가 적게 배치되고 좌측 윗부분과 우측 아랫부분에는 글자가 많이 배치되는 등 글자의 배치도 일정하지 아니하다. 이에 반하여, 일반 문서 이미지에는 글자가 존재하지 아니하는 여백이 실질적으로 없으며 이미지의 세로 부분과 가로 부분으로 글자가 일정하게 배치된다.
본 발명에서는 위와 같은 명함의 일반적인 특징을 이용하여, 획득된 이미지로부터 히스토그램을 추출해내고, 추출된 히스토그램이 명함 이미지에 가까운지 아니면 일반 문서 이미지에 가까운지 결정하여, 획득된 이미지가 명함 이미지인지 여부를 판별한다.
도 4b는 대상 이미지로부터 히스토그램을 추출하기 위한 원리를 설명하기 위한 도면이다.
도 4b에 도시된 바와 같이, 본 발명에서는 대상 이미지로부터 히스토그램을 추출하기 위해 우선 대상 이미지를 복수의 픽셀들 (410) 로 분할한다. 여기서, 복수의 픽셀들 (410) 은 사각형 형태로 설정되며 서로 동일한 크기를 가진다. 한편, 설명의 편의를 위해 도 4b에서는 픽셀들 (410) 의 치수를 크게 도시하였으나, 픽셀들 (410) 의 치수는 사용자의 필요에 따라 다양하게 설정될 수 있다.
다음으로, 같은 행 (row) 에 존재하는 복수의 픽셀들 중 검은 픽셀의 수를 해당 행의 변량으로 하여 도수로 표현하고, 또는 같은 열 (column) 에 존재하는 복수의 픽셀들 중 검은 픽셀의 수를 해당 열의 변량으로 하여 도수로 표현한다. 이를 테면, 도 4b에 도시된 바와 같이, 위에서 네 번째 행 (420) 에 존재하는 12개의 픽셀 중 4개의 픽셀만 검은 픽셀이므로 위에서 네 번째 행 (420) 의 도수 (422) 는 4로 표현하고, 위에서 다섯 번째 행 (430) 에 존재하는 12개의 픽셀 중 6개의 픽셀만 검은 픽셀이므로 위에서 다섯 번째 행 (430) 의 도수 (432) 는 6으로 표현하는 것이다.
이렇게 모든 행 또는 모든 열에 대한 도수 분포를 획득하면, 이미지의 우측 또는 좌측으로 각 열 내에 검은 픽셀이 얼마나 있는지에 관한 정보를 포함하고 있는 가로 히스토그램 (440) 을 얻을 수 있고, 또는 이미지의 상측 또는 하측으로 각 열 내에 검은 픽셀이 얼마나 있는지에 관한 정보를 포함하고 있는 세로 히스토그램 (450) 을 얻을 수 있다. 참고로, 설명의 편의를 위해 도 4b에서는 픽셀의 크기를 크게 표현하였지만, 픽셀의 크기를 매우 축소하는 경우, 도 4b에 도시된 바와 같은 가로 히스토그램 (440) 및 세로 히스토그램 (450) 이 실제로 획득될 수 있다.
도 4c는 명함 이미지와 일반 문서 이미지로부터 실제로 히스토그램을 추출한 모습을 나타내는 도면이다.
도 4c로부터도 알 수 있듯이, 명함 이미지는 일반적으로 여백 부분을 많이 포함하고 있을 뿐 아니라 글자 배치가 일정하지 아니한 구성적 특징을 가지기 때문에, 명함 이미지의 가로 및 세로 히스토그램은 일정하지 아니한 도수 분포를 나타낸다. 반면에, 일반 문서 이미지는 여백 부분이 적을 뿐 아니라 글자 배치가 일정하기 때문에 일반 문서 이미지의 가로 및 히스토그램은 일정한 도수 분포를 나타낸다. 이러한 차이점, 즉 명함 이미지의 (가로 또는 세로) 히스토그램 형태와 일반 문서 이미지의 (가로 또는 세로) 히스토그램은 형태가 전혀 상이한 점을 이용하여서, 획득된 이미지의 (가로 또는 세로) 히스토그램 형태를 분석하면, 획득된 이미지가 명함 이미지인지 아니면 일반 문서 이미지인지 쉽게 판별할 수 있게 된다.
검은 픽셀의 수 또는 블록의 수의 카운트
이하에서는 본 발명에서 선택적으로 수행될 수 있는 대상 이미지 내에서 복수의 블록 내에 존재하는 각각의 검은 픽셀의 수 또는 일정 수 이하의 검은 픽셀을 가지는 블록의 수를 카운트하는 방법에 관하여 상세하게 살펴보기로 한다.
앞서 설명한 바와 같이, 일반적으로 명함 이미지는 일반 문서 이미지와는 달리, 명함 영역 내에 글자가 존재하지 아니하는 여백 부분이 많을 뿐 아니라 명함 영역 내에서도 글자의 배치가 일정하지 아니하다.
본 발명에서는 위와 같은 명함의 일반적인 특징을 이용하여, 획득된 대상 이미지를 복수의 블록으로 분할하고, 분할된 대상 이미지 내에서 복수의 블록 내에 존재하는 각각의 검은 픽셀의 수 또는 일정 수 이하의 검은 픽셀을 가지는 블록의 수를 카운트하여, 상기 구해진 검은 픽셀의 수 또는 블록의 수가 일반적인 명함 이미지의 검은 픽셀의 수 또는 블록의 수와 가까운지 아니면 일반 문서 이미지의 검은 픽셀의 수 또는 블록의 수와 가까운지 결정하여, 획득된 이미지가 명함 이미지인지 여부를 판별할 수 있다.
도 5a는 복수의 블록들 (510a 내지 510p) 로 분할된 대상 이미지를 나타내는 도면이다.
도 5a에 도시된 바와 같이, 복수의 블록들 (510a 내지 510p) 은 사각형의 형태일 수 있으며, 서로 동일한 형태를 가질 수 있다. 도 5a에는 복수의 블록들 (510a 내지 510p) 이 16 개인 것으로 도시되어 있으나, 그 개수는 사용자의 필요에 따라 적절하게 조절될 수 있다.
도 5a에 도시된 바와 같이, 복수의 블록들 (510a 내지 510p) 각각은 복수의 픽셀들 (520) 을 포함한다. 앞서 히스토그램의 추출과 관련해서 설명한 바와 같이, 복수의 픽셀들 (520) 은 사각형 형태로 설정되며 서로 동일한 크기를 가진다.
여기서 각 블록 (510a 내지 510p) 이 구별될 수 있도록 각 블록 (510a 내지 510p) 에는 블록 번호가 할당될 수 있다. 이를 테면, 도 5a의 왼쪽 상측으로부터 제 1 블록 (510a), 제 2 블록 (510b), 제 3 블록 (510c), 제 4 블록 (510d), 제 5 블록 (510e), 제 6 블록 (510f), 제 7 블록 (510g), 제 8 블록 (510h), 제 9 블록 (510i), 제 10 블록 (510j), 제 11 블록 (510k), 제 12 블록 (510l), 제 13 블록 (510m), 제 14 블록 (510n), 제 15 블록 (510o) 및 제 16 블록 (510p) 순으로 블록 번호가 할당될 수 있다.
복수의 블록으로 분할된 대상 이미지 내에서 복수의 블록 내에 존재하는 각각의 검은 픽셀의 수 또는 일정 수 이하의 검은 픽셀을 가지는 블록의 수를 카운트한다.
먼저, 복수의 블록으로 분할된 대상 이미지 내에서 복수의 블록 내에 존재하는 각각의 검은 픽셀의 수를 카운트하는 경우에 대해서 살펴보기로 한다.
도 5b에서는 명함 이미지 및 일반 문서 이미지의 블록 내에 존재하는 각각의 검은 픽셀의 수가 도시되고 있다.
도 5b를 참조하면, 명함 이미지의, 제 1 블록에는 9 개의 검은 픽셀이, 제 2 블록에는 12 개의 검은 픽셀이, 제 3 블록에는 3 개의 검은 픽셀이, 제 4 블록에는 0 개의 검은 픽셀이, 제 5 블록에는 5 개의 검은 픽셀이, 제 6 블록에는 0 개의 검은 픽셀이, 제 7 블록에는 2 개의 검은 픽셀이, 제 8 블록에는 0 개의 검은 픽셀이, 제 9 블록에는 0 개의 검은 픽셀이, 제 10 블록에는 4 개의 검은 픽셀이, 제 11 블록에는 16 개의 검은 픽셀이, 제 12 블록에는 7 개의 검은 픽셀이, 제 13 블록에는 0 개의 검은 픽셀이, 제 14 블록에는 3 개의 검은 픽셀이, 제 15 블록에는 12 개의 검은 픽셀이, 제 16 블록에는 2 개의 검은 픽셀이 존재하는 것을 확인할 수 있다. 반면에, 도 5b를 더 참조하면, 일반 문서 이미지의, 제 1 블록에는 12 개의 검은 픽셀이, 제 2 내지 4 블록 및 제 13 내지 15 블록에는 8개의 검은 픽셀이, 제 5 내지 제 12 블록에는 16개의 검은 픽셀이, 제 16 블록에는 4 개의 검은 픽셀이 존재하는 것을 확인할 수 있다.
일반적으로 특정 문자들이 명함에 배치되는 패턴은 대체로 유사하다. 이를 테면, 명함의 좌측 윗부분에는 이름 또는 회사의 명칭이 일정 크기 이상으로 배치되고, 명함의 아랫부분에는 주소, 이메일 주소, 휴대폰 번호 등이 일정 크기 이하로 배치되는 것이 일반적이다.
따라서, 명함 이미지 내에서는 복수의 블록 내에 존재하는 각각의 검은 픽셀의 수가 서로 일정하지 아니할 뿐 아니라, 명함 이미지의 복수의 블록의 각각의 검은 픽셀의 개수 역시 일정한 패턴 (이를 테면, 제 4 블록에는 검은 픽셀이 실질적으로 없고 제 11 블록에는 검은 픽셀이 다수 배치되는 패턴) 을 가지게 된다. 반면에, 일반 문서 이미지 내에서는 복수의 블록 내에 존재하는 각각의 검은 픽셀의 수가 서로 일정하고, 일반 문서 이미지의 복수의 블록의 각각의 검은 픽셀의 개수도 명함 이미지와 구별될 수 있는 일정한 패턴 (이를 테면, 제 5 블록이나 제 9 블록에 검은 픽셀이 16개 배치되는 패턴) 을 가지게 된다.
이는 복수의 블록 내에 존재하는 각각의 검은 픽셀의 수가 일정한지 여부, 또는 복수의 블록에 존재하는 각각의 검은 픽셀의 개수 패턴은 명함 이미지와 일반 문서 이미지에서 상이하다는 것을 의미한다. 결과적으로, 획득된 이미지의 복수의 블록 내에 존재하는 각각의 검은 픽셀의 수를 분석하면, 획득된 이미지가 명함 이미지인지 아니면 일반 문서 이미지인지 쉽게 판별할 수 있게 된다.
다음으로, 복수의 블록으로 분할된 대상 이미지 내에서 일정 수 이하의 검은 픽셀을 가지는 블록의 수를 카운트하는 경우에 대해서 살펴보기로 한다.
도 5b를 더 참조하면, 명함 이미지의 경우 0 개 이하의 검은 픽셀을 가지는 블록의 수가 5개이고, 일반 문서 이미지의 경우 0 개 이하의 검은 픽셀을 가지는 블록의 수가 없는 것을 확인할 수 있다.
앞서 설명한 바와 같이, 명함 이미지 내에는 글자가 존재하지 아니하는 여백 부분이 많을 뿐 아니라 명함 이미지 내에서의 글자의 배치도 일정하지 아니하기 때문에, 명함 이미지는 대개 0개 이하의 검은 픽셀을 가지는 블록을 다수 가진다. 반면에 일반 문서 이미지 내에서는 글자가 일정하게 배치되기 때문에 0 개 이하의 검은 픽셀을 가지는 블록을 가지지 않거나 적게 가진다. 따라서, 0 개 이하의 검은 픽셀을 가지는 블록의 수를 분석하면, 획득된 이미지가 명함 이미지인지 아니면 일반 문서 이미지인지 쉽게 판별할 수 있게 된다.
설명의 편의를 위해, 0 개 이하의 검은 픽셀을 가지는 블록의 수를 카운트하는 것으로 설명하였으나, 몇 개 이하의 검은 픽셀을 가지는 블록의 수를 카운트할 것인지는 사용자의 필요에 따라 다양하게 설정될 수 있을 것이다.
명함 이미지 여부의 판별
앞서 설명한 바와 같이, 본 발명에서는 명함 이미지 여부를 판별하기 위해 공지의 다양한 판별 장치를 이용할 수 있으나, 바람직하게는 SVM을 이용할 수 있다.
도 6은 본 발명의 일 실시예에 따른, SVM을 이용한 명함 이미지 여부 판별 방법에 관한 흐름도이다.
먼저, 미리 알려진 명함 이미지들 및 비-명함 이미지들로부터 특성 값들을 추출해낼 수 있다 (S601). 여기서, 특성 값들이란 명함 이미지가 비-명함 이미지와 구별될 수 있게끔 하는 임의의 파라미터를 일컫는다. 본 발명에서 특성 값은 히스토그램, 이를 테면 가로 히스토그램 및 세로 히스토그램을 포함한다. 또한, 특성 값은 복수의 블록 내에 존재하는 각각의 검은 픽셀의 수, 일정 수 이하의 검은 픽셀을 가지는 블록의 수, 명함 영역 검출 여부 및 (명함 영역이 검출되는 경우) 명함 영역의 선분들의 길이 중 하나 이상을 더 포함할 수 있다. 이러한 특성 값들을 추출하기 위해, 앞서 설명된 명함 영역 검출 방법, 히스토그램 추출 방법, 복수의 블록 내에 존재하는 각각의 검은 픽셀의 수 및 일정 수 이하의 검은 픽셀을 가지는 블록의 수 카운트 방법이 동일하게 이용될 수 있다. 한편, 비-명함 이미지는 일반 문서 이미지를 포함할 수 있다.
다음으로, 미리 알려진 명함 이미지들 및 비-명함 이미지들로부터 추출된 특성 값들을 정규화하여 SVM에 학습시킬 수 있다 (S603). 여기서, 추출된 특성 값들은 정규화되어 데이터 세트 형태로 메모리 (200) 에 저장될 수 있다. 이를 테면, 일 명함 이미지에 관한 특성 값들의 데이터 세트가 메모리 (200) 에 저장되고, 일 비-명함 이미지에 관한 특성 값들의 데이터 세트가 메모리 (200) 에 저장될 수 있는 것이다. 이러한 특성 값들의 데이터 세트에는 사용자에 의해 선택된 특성 값들이 포함될 수 있다. 이를 테면, 앞서 설명된 모든 특성 값들이 사용자에 의해 선택되는 경우, 특성 값들의 데이터 세트는, 'DATA SET = {명함 영역 검출 여부, 명함 영역의 선분들의 길이, 가로 히스토그램, 세로 히스토그램, 각 복수의 블록 내에 존재하는 검은 픽셀의 수, 일정 수 이하의 검은 픽셀을 가지는 블록의 수}' 의 형태일 수 있다. 한편, 비-명함 이미지로부터의 특성 값들의 데이터 세트는 0의 분류 값을 가진 상태로, 그리고 명함 이미지로부터의 특성 값들의 데이터 세트는 1의 분류 값을 가진 상태로 SVM에 학습될 수 있다. 이렇게 SVM 학습을 반복하여 수행하는 경우, SVM은 분류 기준이 되는 초평면의 데이터를 얻을 수 있게 되고, 분류 값을 알 수 없는 이미지의 특성 값들의 데이터 세트를 분석하여 상기 이미지의 분류 값이 0에 가까운지 1에 가까운지 결정할 수 있다.
다음으로, 학습된 SVM을 이용하여 획득된 이미지가 명함 이미지인지 비-명함 이미지인지 판별할 수 있다 (S605). 보다 구체적으로, 획득된 이미지의 특성 값들의 데이터 세트가 SVM에 입력되고, SVM이 학습된 데이터 세트를 기초로 획득된 이미지의 분류 값을 결정함으로써, 획득된 이미지가 명함 이미지인지 비-명함 이미지인지 판별할 수 있다. 이를 테면, 획득된 이미지의 분류 값이 0에 가까운 경우 상기 이미지를 비-명함 이미지로 판별하고, 획득된 이미지의 분류 값이 1에 가까운 경우 상기 이미지를 명함 이미지로 판별할 수 있다.
아래의 표 1은 본 발명의 일 실시예에 따른, SVM을 이용하여 명함 이미지 및 비-명함 이미지에 대한 판별을 수행한 결과를 나타내는 도면이다.
평균 처리
시간 (ms)
오류 개수/ 이미지 개수 판별률 (%)
명함 이미지 482 21개/ 401개 94.76%
비-명함 이미지 581 3개/ 191개 98.43%
표 1의 결과를 도출하기 위해, Open CV-SVM을 이용하고 RBF Kernel type에서 Gammar = 0.001을 설정해 학습을 수행하였다. 그리고, 특성 값들의 데이터 세트는, DATA SET = {명함 영역 검출 여부, 명함 영역의 선분들의 길이, 가로 히스토그램, 세로 히스토그램, 각 복수의 블록 내에 존재하는 검은 픽셀의 수, 일정 수 이하의 검은 픽셀을 가지는 블록의 수} 로 설정하여, 명함 이미지와 비-명함 이미지 (일반 문서 이미지) 를 각각 202장씩 SVM에 학습시켰다. 테스트에 사용된 컴퓨터의 성능 및 재원은 “i5 CPU 760 @ 2.80GHz, 6.00GB RAM, Windows 8 x64”이었다. SVM 학습이 완료된 이후에는, 상기 SVM을 이용하여 명함 이미지 401장과 비-명함 이미지 191장에 대한 판별을 수행하였다.
표 1을 참조하면, 본 발명의 일 실시예에 따른 SVM이, 명함 이미지의 경우 94.76%의 높은 판별률을, 비-명함 이미지의 경우 98.43%의 높은 판별률을 보이는 것을 확인할 수 있다.
본 명세서에 첨부된 블록도의 각 블록과 흐름도의 각 단계의 조합들은 컴퓨터 프로그램 인스트럭션들에 의해 수행될 수도 있다. 이들 컴퓨터 프로그램 인스트럭션들은 범용 컴퓨터, 특수용 컴퓨터 또는 기타 프로그램 가능한 데이터 프로세싱 장비의 프로세서에 탑재될 수 있으므로, 컴퓨터 또는 기타 프로그램 가능한 데이터 프로세싱 장비의 프로세서를 통해 수행되는 그 인스트럭션들이 블록도의 각 블록 또는 흐름도의 각 단계에서 설명된 기능들을 수행하는 수단을 생성하게 된다. 이들 컴퓨터 프로그램 인스트럭션들은 특정 방식으로 기능을 구현하기 위해 컴퓨터 또는 기타 프로그램 가능한 데이터 프로세싱 장비를 지향할 수 있는 컴퓨터 이용 가능 또는 컴퓨터 판독 가능 메모리에 저장되는 것도 가능하므로, 그 컴퓨터 이용가능 또는 컴퓨터 판독 가능 메모리에 저장된 인스트럭션들은 블록도의 각 블록 또는 흐름도 각 단계에서 설명된 기능을 수행하는 인스트럭션 수단을 내포하는 것도 가능하다. 컴퓨터 프로그램 인스트럭션들은 컴퓨터 또는 기타 프로그램 가능한 데이터 프로세싱 장비 상에 탑재되는 것도 가능하므로, 컴퓨터 또는 기타 프로그램 가능한 데이터 프로세싱 장비 상에서 일련의 동작 단계들이 수행되어 컴퓨터로 실행되는 프로세스를 생성해서 컴퓨터 또는 기타 프로그램 가능한 데이터 프로세싱 장비를 수행하는 인스트럭션들은 블록도의 각 블록 및 흐름도의 각 단계에서 설명된 기능들을 실행하기 위한 단계들을 제공하는 것도 가능하다.
본 명세서에서, 각 블록은 특정된 논리적 기능 (들) 을 실행하기 위한 하나 이상의 실행 가능한 인스트럭션들을 포함하는 모듈, 세그먼트 또는 코드의 일부를 나타낼 수 있다. 또, 몇 가지 대체 실행 예들에서는 블록들에서 언급된 기능들이 순서를 벗어나서 발생하는 것도 가능함을 주목해야 한다. 예컨대, 잇달아 도시되어 있는 두 개의 블록들은 사실 실질적으로 동시에 수행되는 것도 가능하고 또는 그 블록들이 때때로 해당하는 기능에 따라 역순으로 수행되는 것도 가능하다.
본 명세서에 개시된 실시예들과 관련하여 설명된 방법 또는 알고리즘의 단계는 프로세서에 의해 실행되는 하드웨어, 소프트웨어 모듈 또는 그 2 개의 결합으로 직접 구현될 수도 있다. 소프트웨어 모듈은 RAM 메모리, 플래시 메모리, ROM 메모리, EPROM 메모리, EEPROM 메모리, 레지스터, 하드 디스크, 착탈형 디스크, CD-ROM 또는 당업계에 알려진 임의의 다른 형태의 저장 매체에 상주할 수도 있다. 예시적인 저장 매체는 프로세서에 커플링 되며, 그 프로세서는 저장 매체로부터 정보를 판독할 수 있고 저장 매체에 정보를 기입할 수 있다. 다른 방법으로, 저장 매체는 프로세서와 일체형일 수도 있다. 프로세서 및 저장 매체는 주문형 집적회로 (ASIC) 내에 상주할 수도 있다. ASIC는 사용자 단말기 내에 상주할 수도 있다. 다른 방법으로, 프로세서 및 저장 매체는 사용자 단말기 내에 개별 컴포넌트로서 상주할 수도 있다.
이상으로 실시예를 들어 본 발명을 더욱 상세하게 설명하였으나, 본 발명은 반드시 이러한 실시예로 국한되는 것은 아니고, 본 발명의 기술사상을 벗어나지 않는 범위 내에서 다양하게 변형 실시될 수 있다. 따라서 본 발명에 개시된 실시예들은 본 발명의 기술 사상을 한정하기 위한 것이 아니라 설명하기 위한 것이고, 이러한 실시예에 의하여 본 발명의 기술 사상의 범위가 한정되는 것은 아니다. 본 발명의 보호 범위는 아래의 청구범위에 의하여 해석되어야 하며, 그와 동등한 범위 내에 있는 모든 기술 사상은 본 발명의 권리범위에 포함되는 것으로 해석되어야 할 것이다.
100: 명함 이미지 여부 판별 장치
110: 이미지 획득부
120: 명함 영역 검출부
130: 치수 조정부
140: 이진화 처리부
150: 히스토그램 추출부
160: 블록 분할부
170: 픽셀 카운트부
180: 명함 이미지 판별부
190: 제어부
200: 메모리

Claims (15)

  1. 명함 이미지 여부를 판별하는 방법으로서,
    대상물에 대한 이미지를 획득하는 단계;
    상기 이미지의 일부 또는 전부에 대한 이진화 처리를 수행하는 단계;
    복수의 픽셀로 분할된 상기 이미지의 일부 또는 전부에 대한 히스토그램을 추출하는 단계; 및
    상기 히스토그램을 기반으로 상기 이미지가 명함 이미지인지 여부를 판별하는 단계를 포함하는, 명함 이미지 여부를 판별하는 방법.
  2. 제 1 항에 있어서,
    상기 이미지가 명함 이미지로 판별되는 경우, 상기 이미지 내에 포함된 문자열의 적어도 일부가 저장되는, 명함 이미지 여부를 판별하는 방법.
  3. 제 1 항에 있어서,
    상기 히스토그램은 가로 히스토그램 및 세로 히스토그램으로 구성되는, 명함 이미지 여부를 판별하는 방법.
  4. 제 1 항에 있어서,
    상기 이진화 처리를 수행하는 단계 이전에, 상기 이미지의 일부 또는 전부를 그레이-스케일 이미지로 변환시키는 단계를 더 포함하는, 명함 이미지 여부를 판별하는 방법.
  5. 제 1 항에 있어서,
    상기 이진화 처리를 수행하는 단계 이전에, 상기 이미지의 일부 또는 전부의 치수를 조정하는 단계를 더 포함하는, 명함 이미지 여부를 판별하는 방법.
  6. 제 1 항에 있어서,
    상기 이진화 처리를 수행하는 단계 이전에, 상기 이미지 내의 명함 영역을 검출하는 단계를 더 포함하는, 명함 이미지 여부를 판별하는 방법.
  7. 제 6 항에 있어서,
    상기 명함 영역은 직사각형 형태의 영역인, 명함 이미지 여부를 판별하는 방법.
  8. 제 6 항에 있어서,
    상기 이미지 내의 명함 영역을 검출하는 단계는, 상기 이미지에 대한 침식 연산 및 팽창 연산을 수행하는 단계를 포함하는, 명함 이미지인지 여부를 판별하는 방법.
  9. 제 6 항에 있어서,
    상기 이미지 내의 명함 영역을 검출하는 단계는,
    허프 변환 (hough transform) 알고리즘에 기초하여 상기 이미지 내의 직선들을 검출하는 단계; 및
    상기 직선들 간의 교점들에 기초하여 상기 명함 영역을 검출하는 단계를 포함하는, 명함 이미지 여부를 판별하는 방법.
  10. 제 6 항에 있어서,
    상기 이미지 내에서 명함 영역이 검출되는 경우, 복수의 픽셀로 분할된 상기 명함 영역으로부터 상기 히스토그램이 추출되는, 명함 이미지 여부를 판별하는 방법.
  11. 제 6 항에 있어서,
    상기 이미지 내에서 명함 영역이 검출되지 아니하는 경우, 복수의 픽셀로 분할된 상기 이미지 전부로부터 상기 히스토그램이 추출되는, 명함 이미지 여부를 판별하는 방법.
  12. 제 1 항에 있어서,
    상기 이미지가 명함 이미지인지 여부를 판별하는 단계는,
    미리 알려진 명함 이미지들 및 비-명함 이미지들로부터 특성 값을 추출하는 단계;
    상기 특성 값을 정규화하여 SVM (Support Vector Machine) 에 학습시키는 단계; 및
    상기 SVM을 이용하여 상기 이미지가 명함 이미지인지 비-명함 이미지인지 판별하는 단계를 포함하며,
    상기 특성 값은 상기 히스토그램을 포함하는, 명함 이미지인지 여부를 판별하는 방법.
  13. 제 12 항에 있어서,
    상기 특성 값은 명함 영역 검출 여부 및 상기 명함 영역의 선분들의 길이를 더 포함하는, 명함 이미지인지 여부를 판별하는 방법.
  14. 명함 이미지 여부를 판별하는 장치로서,
    대상물에 대한 이미지를 획득하기 위한 이미지 획득부;
    상기 이미지의 일부 또는 전부에 대한 이진화 처리를 수행하기 위한 이진화 처리부;
    복수의 픽셀로 분할된 상기 이미지의 일부 또는 전부에 대한 히스토그램을 추출하기 위한 히스토그램 추출부; 및
    상기 히스토그램을 기반으로 상기 이미지가 명함 이미지인지 여부를 판별하기 위한 명함 이미지 판별부를 포함하는, 명함 이미지 여부를 판별하는 장치.
  15. 명령어 세트들을 저장하는 컴퓨터 판독가능매체로서,
    상기 명령어 세트들은, 컴퓨팅 장치에 의해 실행되는 경우에 상기 컴퓨팅 장치로 하여금,
    대상물에 대한 이미지를 획득하도록 하고,
    상기 이미지의 일부 또는 전부에 대한 이진화 처리를 수행하도록 하고,
    복수의 픽셀로 분할된 상기 이미지의 일부 또는 전부에 대한 히스토그램을 추출하도록 하고, 그리고
    상기 히스토그램을 기반으로 상기 이미지가 명함 이미지인지 여부를 판별하도록 하는, 컴퓨터 판독가능 매체.
KR1020130126843A 2013-10-23 2013-10-23 명함 이미지 여부를 판별하는 장치 및 방법 KR20150047060A (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020130126843A KR20150047060A (ko) 2013-10-23 2013-10-23 명함 이미지 여부를 판별하는 장치 및 방법

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020130126843A KR20150047060A (ko) 2013-10-23 2013-10-23 명함 이미지 여부를 판별하는 장치 및 방법

Publications (1)

Publication Number Publication Date
KR20150047060A true KR20150047060A (ko) 2015-05-04

Family

ID=53386202

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020130126843A KR20150047060A (ko) 2013-10-23 2013-10-23 명함 이미지 여부를 판별하는 장치 및 방법

Country Status (1)

Country Link
KR (1) KR20150047060A (ko)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101701249B1 (ko) 2015-08-21 2017-02-01 영남대학교 산학협력단 형광 현미경 이미지를 이용한 기도 표면액 깊이 측정 방법
US10127471B2 (en) 2015-10-30 2018-11-13 Xiaomi Inc. Method, device, and computer-readable storage medium for area extraction

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101701249B1 (ko) 2015-08-21 2017-02-01 영남대학교 산학협력단 형광 현미경 이미지를 이용한 기도 표면액 깊이 측정 방법
US10127471B2 (en) 2015-10-30 2018-11-13 Xiaomi Inc. Method, device, and computer-readable storage medium for area extraction

Similar Documents

Publication Publication Date Title
US11144753B1 (en) Character count determination for a digital image
CN105095900B (zh) 一种提取标准卡片中特定信息的方法和装置
TWI619080B (zh) 指紋重疊區域面積的計算方法及電子裝置
JP5775225B2 (ja) マルチレイヤ連結成分をヒストグラムと共に用いるテキスト検出
US20220224816A1 (en) Real-time glare detection inside a dynamic region of an image
US11216685B2 (en) Dynamically optimizing photo capture for multiple subjects
CN107368829B (zh) 确定输入图像中的矩形目标区域的方法和设备
US20180082456A1 (en) Image viewpoint transformation apparatus and method
KR20130066819A (ko) 촬영 이미지 기반의 문자 인식 장치 및 방법
CN114283156B (zh) 一种用于去除文档图像颜色及手写笔迹的方法及装置
US20180184012A1 (en) Image processing apparatus, control method, and storage medium
US11455783B2 (en) Image recognition method and apparatus, device and non-volatile computer storage medium
KR101732359B1 (ko) 이미지 내의 텍스트를 검출하는 방법 및 장치
US20150112853A1 (en) Online loan application using image capture at a client device
JP6542230B2 (ja) 投影ひずみを補正するための方法及びシステム
KR20150047060A (ko) 명함 이미지 여부를 판별하는 장치 및 방법
CN103366165B (zh) 图像处理装置、图像处理方法以及设备
KR20150028631A (ko) 영상에 포함된 표의 구조를 생성하는 방법 및 이를 위한 장치
JP2016053763A (ja) 画像処理装置、画像処理方法及びプログラム
KR20150047059A (ko) 명함 이미지 여부를 판별하는 장치 및 방법
JP6082312B2 (ja) テンプレート画像候補領域決定装置、テンプレート画像候補領域決定方法、及びプログラム
CN105825161A (zh) 图像的肤色检测方法及其系统
Datta Credit Card Processing Using Cell Phone Images
US20230137300A1 (en) Advanced hough-based on-device document localization
CN111898602B (zh) 一种图像中的凭证号码区域识别方法、装置及设备

Legal Events

Date Code Title Description
WITN Application deemed withdrawn, e.g. because no request for examination was filed or no examination fee was paid