KR101085699B1 - 문자 획 너비 계산을 이용한 문자 영역 추출 장치 및 방법 - Google Patents

문자 획 너비 계산을 이용한 문자 영역 추출 장치 및 방법 Download PDF

Info

Publication number
KR101085699B1
KR101085699B1 KR1020100014280A KR20100014280A KR101085699B1 KR 101085699 B1 KR101085699 B1 KR 101085699B1 KR 1020100014280 A KR1020100014280 A KR 1020100014280A KR 20100014280 A KR20100014280 A KR 20100014280A KR 101085699 B1 KR101085699 B1 KR 101085699B1
Authority
KR
South Korea
Prior art keywords
character
outline
stroke width
pixel
representative
Prior art date
Application number
KR1020100014280A
Other languages
English (en)
Other versions
KR20110094713A (ko
Inventor
오상욱
설상훈
김명훈
이훈재
정순홍
윤준식
Original Assignee
고려대학교 산학협력단
삼성전자주식회사
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 고려대학교 산학협력단, 삼성전자주식회사 filed Critical 고려대학교 산학협력단
Priority to KR1020100014280A priority Critical patent/KR101085699B1/ko
Priority to US13/029,845 priority patent/US8744189B2/en
Publication of KR20110094713A publication Critical patent/KR20110094713A/ko
Application granted granted Critical
Publication of KR101085699B1 publication Critical patent/KR101085699B1/ko

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/60Type of objects
    • G06V20/62Text, e.g. of license plates, overlay texts or captions on TV images
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Character Input (AREA)

Abstract

본 발명은 문자의 문자 획 너비 계산을 이용한 문자 영역 추출 장치 및 방법 에 관한 것이다.
이를 위해 본 발명은 원본 영상으로부터 문자 후보 영역을 포함하는 이진화 영상을 생성하고, 문자 후보 영역에서 문자의 외곽선을 추출하여 추출된 외곽선에 대한 문자 외곽선 정보를 획득한 후 획득한 문자 외곽선 정보를 이용하여 외곽선을 구성하는 각 픽셀에서의 대표 문자 획 너비와 대표 문자 각도를 설정하며, 외곽선의 전체 길이에 대비하여 유효한 대표 문자 획 너비와 유효한 각도의 비율을 확인하여 문자 후보 영역에서 문자가 존재하는 영역을 판단함으로써 문자 후보 영역에 실제 문자가 포함되는지 여부를 효과적으로 판단할 수 있게 된다.

Description

문자 획 너비 계산을 이용한 문자 영역 추출 장치 및 방법{APPARATUS AND METHOD FOR EXTRACTING TEXT REGION USING TEXT STROKE WIDTH CALCULATION}
본 발명은 영상에서의 문자 영역의 검출에 관한 것으로, 특히 문자 획의 너비 계산을 기반으로 하는 영상의 문자 영역 추출 장치 및 방법을 제공한다.
일반적으로 문자 추출 방법은 영상에 포함되는 문자를 인지하고, 인지된 문자 영역을 추출하는 방법이다.
이러한 영상 내에 존재하는 문자는 해당 영상에 대한 다양한 정보를 제공한다. 따라서, 영상 내 문자를 인식하고 이와 관련된 정보를 이용하여 사용자에게 제공하는 응용 및 서비스에 대한 연구가 활발히 진행되고 있다. 이를 위해 먼저, 영상 내 문자가 위치하는 영역을 검출 할 필요성이 있다.
문자의 영역을 검출하기 위해서 문자 영역의 에지나 칼라, 명암 대비 특성에 기반하여 문자 영역을 검출하고, 검출된 영역이 실제 문자를 포함하는 영역인지 확인한다. 이를 위해 문자 획의 너비를 계산하여 문자 획의 너비가 일정할 경우 최종 문자 영역으로 검출한다. 복잡한 디자인이 적용된 일부 글꼴 및 간판을 제외하면 문자 획의 너비가 일정하다는 특징을 이용하여 문자 영역 검출에 이용하는 것이다.
상기와 같이 종래에는 문자 에지나 칼라, 명암 대비 특성을 이용하여 문자영역을 검출하는데, 주로 영상 영역 내에 주사선 (scan line)을 따라 가면서 문자 획의 너비를 계산하였다
하지만 종래에는 주사선이 문자를 통과하는 위치 또는 문자의 기울어짐에 의해서 주사선이 문자 획을 수직으로 관통하지 않아 획의 너비가 잘못 계산되는 경우가 발생하여 정확한 문자 획의 너비를 구하는데 한계가 있다는 문제점이 있다.
따라서, 본 발명은 영상 내 문자 영역을 검출하기 위한 정확한 문자 획의 너비 계산하여 문자 영역을 판별하는 장치 및 방법을 제공한다.
상술한 바를 달성하기 위한 본 발명은 문자 영역 추출 장치에 있어서, 원본 영상으로부터 문자 후보 영역을 포함하는 이진화 영상을 생성하는 문자 후보 영역 검출부와, 상기 문자 후보 영역에서 문자의 외곽선을 추출하고, 상기 추출된 외곽선에 대한 문자 외곽선 정보를 획득하는 문자 외곽선 정보 획득부와, 상기 문자 외곽선 정보를 이용하여 상기 외곽선을 구성하는 각 픽셀에서의 대표 문자 획 너비와 대표 문자 각도를 설정하는 문자 영역 정보 획득부와, 상기 외곽선의 전체 길이에 대비하여 유효한 대표 문자 획 너비와 유효한 각도의 비율을 확인하여 상기 문자 후보 영역에서 문자가 존재하는 영역을 판단하는 문자 영역 판단부를 포함하는 것을 특징으로 한다.
또한, 본 발명은 문자 영역 추출 방법에 있어서, 원본 영상으로부터 문자 후보 영역을 포함하는 이진화 영상을 생성하는 과정과, 상기 문자 후보 영역에서 문자의 외곽선을 추출하는 과정과, 상기 추출된 외곽선에 대한 문자 외곽선 정보를 획득하는 과정과, 상기 문자 외곽선 정보를 이용하여 상기 외곽선을 구성하는 각 픽셀에서의 대표 문자 획 너비와 대표 문자 각도를 설정하는 과정과, 상기 외곽선의 전체 길이에 대비하여 유효한 대표 문자 획 너비와 유효한 각도의 비율을 확인하여 상기 문자 후보 영역에서 문자가 존재하는 영역을 판단하는 과정을 포함함을 특징으로 한다.
본 발명은 문자 외곽선과 양자화된 대표 각도값을 이용하여 문자 외곽선을 구성하는 각 픽셀의 문자 획 너비와 각도를 설정함으로써 문자 획 너비를 정확하게 산출하여 문자 후보 영역에 실제 문자가 포함되는지 여부를 효과적으로 판단할 수 있다는 이점이 있다.
도 1은 본 발명의 실시 예에 따라 문자 추출을 위한 장치의 구성도,
도 2는 본 발명의 실시 예에 따라 문자 외곽선 정보 획득부가 문자의 외곽선을 추출하고, 추출된 외곽선에 대한 문자 외곽선 정보를 설정하는 과정을 설명하기 위한 예시도들,
도 3은 본 발명의 실시 예에 따른 문자 추출을 위한 장치가 문자를 추출하기 위한 과정을 나타내는 흐름도,
도 4는 본 발명의 실시 예에서 문자 외곽선 정보 획득부과 문자 외곽선을 추출하는 과정을 나타내는 흐름도,
도 5는 본 발명의 실시 예에 따라 문자 외곽선 정보 획득부에서 문자 외곽선의 픽셀들에 대한 수직 방향 각도를 양자화하는 과정을 나타내는 흐름도,
도 6은 본 발명의 실시 예에 따라 문자 영역 정보 획득부가 문자 외곽선을 구성하는 각 픽셀에서의 문자 획 너비와 각도를 설정하는 과정을 나타내는 흐름도,
도 7은 본 발명의 실시 예에 따라 문자 영역 정보 획득부가 문자 외곽선을 구성하는 각 픽셀에서의 문자 획 너비와 각도를 설정하는 과정을 설명하기 위한 예시도들,
도 8은 본 발명의 실시 예에 따라 문자 영역 추출부에서 문자 후보 영역 내에서 문자 영역을 판단하기 위한 과정을 설명하기 위한 예시도들.
이하 본 발명의 바람직한 실시 예를 첨부한 도면을 참조하여 상세히 설명한다. 하기 설명 및 첨부 도면에서 본 발명의 요지를 불필요하게 흐릴 수 있는 공지 기능 및 구성에 대한 상세한 설명은 생략한다.
도 1은 본 발명의 실시 예에 따라 문자 추출을 위한 장치의 구성도를 나타내는 도면이다.
본 발명의 실시 예에서는 문자가 명도값 0을 가지는 것을 예를 들어 설명하도록 한다.
본 발명의 실시 예에 따른 문자 추출 장치는 문자 후보 영역 검출부(100), 문자 외곽선 정보 획득부(110), 문자 영역 정보 획득부(120), 문자 영역 판단부(130)를 포함한다.
문자 후보 영역 검출부(100)는 원본 영상으로부터 문자 후보 영역을 포함하는 이진화 영상을 출력한다. 여기서 문자 후보 영역이란 문자 영역으로 추측되는 영역을 의미한다.
문자 외곽선 정보 획득부(110)는 이진화 영상 내의 문자 후보 영역에서 문자의 외곽선을 추출하고, 추출된 외곽선을 구성하는 각 픽셀들에 대한 수직 방향 각도를 설정한다.
구체적으로, 문자 외곽선 정보 획득부(110)는 이진화 영상에서 외곽선을 추출하기 위해서 사용되는 비교 마스크를 미리 설정한다. 이때, 비교 마스크는 도 2의 (a)와 같이 도시되며, 비교 마스크에서 x는 연산에 관여하지 않는 픽셀을 나타내고, 0는 연산에 관여하는 픽셀을 나타낸다.
문자 외곽선 정보 획득부(110)는 이진화 영상에 존재하는 모든 픽셀에 대해서 비교 마스크와 비교하여 문자 영역의 외곽선을 추출한다.
즉, 문자 외곽선 정보 획득부(110)는 도 2의 (a)에서 참조번호 200과 같이 비교 마스크의 정중앙에 위치하는 기준 픽셀과 비교하고자 하는 이진화 영상 내의 특정 픽셀을 매칭하여 특정 픽셀의 명도값이 0인지 판단하고, 특징 픽셀의 명도값이 0이면 특정 픽셀의 상하좌우에 위치하는 주변 픽셀들에 대한 명도값이 기준 픽셀의 상하좌우에 위치하는 주변 픽셀들에 대한 명도값과 같은 0인지를 판단한다.
예를 들어, 도 2의 (b)와 같은 이진화 영상 내의 특정 픽셀 영역에서 각 픽셀을 (c)와 같은 비교 마스크와 비교하여 참조부호 201에 대응하는 픽셀이 0이고, 참조부호 201 픽셀의 상하좌우 픽셀이 모두 0이면 (d)와 같은 외곽선을 추출할 수 있다.
비교 결과 특정 픽셀의 주변 픽셀들에 대한 명도값이 0이면 문자 외곽선 정보 획득부(110)는 기준 픽셀에 매칭되는 특정 픽셀의 명도값을 0에서 255로 변경한다.
상기의 동작을 이진화 영상 내의 마지막 픽셀까지 수행한 후 문자 외곽선 정보 획득부(110)는 문자 외곽선을 포함하는 이진화 영상을 생성한다.
이후 문자 외곽선 정보 획득부(110)는 문자 외곽선을 구성하는 각 픽셀에 대한 수직 방향 각도를 검출하고, 검출된 각도들을 미리 설정된 대표값으로 양자화한다.
구체적으로, 문자 외곽선 정보 획득부(110)는 외곽선 상의 특정 픽셀을 기준 픽셀로 설정하고, 설정된 기준 픽셀을 중심으로 미리 설정된 크기의 블록 영역을 설정한다. 이후 문자 외곽선 정보 획득부(110)는 도 2의 (e)와 같이 블록 영역 내에서 기준 픽셀과 명도값 0인 픽셀간의 방향 벡터를 산출하고, 산출된 방향 벡터들을 모두 합한 벡터값을 기준 픽셀의 수직 방향 각도로 설정한다.
문자 외곽선 정보 획득부(110)는 도 2의 (f)와 같이 양자화를 위한 360도를 n 등분하여 n 개의 대표 각도값을 미리 설정하고, 상기의 동작에서 설정된 수직 방향 각도가 미리 설정된 각 대표 각도값 중 어떤 대표 각도값의 임계범위 내에 포함되는지 판단한다. 이때, n은 자연수이다.
이후 문자 외곽선 정보 획득부(110)는 설정된 수직 방향 각도가 포함되는 임계범위에 해당하는 대표 각도값으로 양자화한 후 문자 외곽선에 포함된 모든 픽셀들에 대한 벡터를 산출하여 미리 설정된 대표 각도값으로 양자화한다.
문자 영역 정보 획득부(120)는 문자 외곽선 정보 획득부(110)로부터 획득된 문자 외곽선 정보를 이용하여 문자 외곽선을 구성하는 각 픽셀에서의 문자 획 너비와 각도를 설정한다. 여기서 문자 획 너비는 획 너비는 특정 픽셀로부터 대표 각도값의 방향으로 대응되어 위치하는 외곽선 상의 픽셀까지의 거리를 의미한다.
구체적으로 문자 영역 정보 획득부(120)는 문자 외곽선을 구성하는 픽셀들 중 특정 픽셀에 해당하는 대표 각도값의 방향으로 대응되어 위치하는 외곽선 상의 픽셀까지의 거리인 제1 문자 획 너비와, 대표 각도값을 기준으로 양 옆의 대표 각도값들의 방향으로 대응되어 위치하는 외곽선 상의 각 픽셀까지의 거리인 제2, 3 문자 획 너비를 산출한다.
문자 영역 정보 획득부(120)는 산출된 3개의 문자 획 너비 중에서 가장 짧은 획 너비를 해당 픽셀의 문자 획 너비로 설정하고, 설정된 문자 획 너비에 해당하는 대표 각도값을 해당 픽셀의 각도값으로 설정한다.
이후 문자 영역 정보 획득부(120)는 상기와 같은 동작으로 통해서 문자 외곽선을 구성하는 모든 픽셀들에 대한 문자 획 너비와 각도 값을 설정한다.
문자 영역 판단부(130)는 문자 후보 영역에서 실제로 문자가 존재하는지 여부를 판단한다. 즉, 문자 영역 판단부(130)는 전체 문자 외곽선의 길이에 대비하여 유효한 문자 획 너비의 비율을 판단하여 문자의 존재 여부를 판단하게 된다.
이와 같이 본 발명은 문자 외곽선과 양자화된 대표 각도값을 이용하여 문자 외곽선을 구성하는 각 픽셀의 문자 획 너비와 각도를 설정함으로써 문자 획 너비를 정확하게 산출하여 문자 후보 영역에 실제 문자가 포함되는지 여부를 효과적으로 판단할 수 있게 된다.
도 3은 본 발명의 실시 예에 따른 문자 추출을 위한 장치가 문자를 추출하기 위한 과정을 나타내는 흐름도이다.
300단계에서 문자 후보 영역 검출부(100)는 문자 후보 영역을 포함하는 이진화 영상을 생성하여 문자 외곽선 정보 획득부로 출력한다.
310단계에서 문자 외곽선 정보 획득부(110)는 문자 후보 영역에서 문자 외곽선을 추출한다. 이에 대해서 구체적으로 도 4를 참조하여 살펴보도록 한다.
도 4는 본 발명의 실시 예에서 문자 외곽선 정보 획득부과 문자 외곽선을 추출하는 과정을 나타내는 흐름도이다.
본 발명의 실시 예에서는 문자 영역의 명도값이 0인 것을 가정하여 설명하도록 한다.
400단계에서 문자 외곽선 정보 획득부(110)는 이진화 영상에 존재하는 모든 픽셀 중 특정 픽셀을 비교 마스크와 비교한다. 이때, 비교 마스크는 도 2의 (a), (c)와 같은 마스크를 의미한다.
410단계에서 문자 외곽선 정보 획득부(110)는 비교 마스크의 기준 픽셀에 대응하는 특정 픽셀의 명도값이 0인지 판단하여 0이면 420단계로 진행하고, 그렇지 않으면 400단계로 진행하여 다른 특정 픽셀과 비교 마스크를 계속적으로 비교한다.
420단계에서 문자 외곽선 정보 획득부(110)는 기준 픽셀의 주변 픽셀들과 특정 픽셀의 주변 픽셀들을 비교한다. 즉, 문자 외곽선 정보 획득부(110)는 기준 픽셀의 상하좌우에 위치하는 픽셀들의 명도값이 0이고, 특정 픽셀의 상하좌우에 위치하는 픽셀들의 명도값도 0인지를 비교한다.
주변 픽셀들의 명도값이 0으로 일치하는지 여부를 판단하여 일치하면 440단계로 진행하고, 그렇지 않으면 400단계로 진행하여 다른 특정 픽셀과 비교 마스크를 계속적으로 비교한다.
440단계에서 문자 외곽선 정보 획득부(110)는 특정 픽셀의 명도값을 255로 변경한다. 본 발명에서는 명도값을 255로 변경하는 것을 예로 설명하였으나, 미리 설정된 명도값 또는 임의의 명도값으로 변경할 수도 있다.
450단계에서 문자 외곽선 정보 획득부(110)는 최종 픽셀까지 비교 마스크와의 비교가 완료되었는지 확인하여 완료되면 460단계로 진행하고, 그렇지 않으면 400단계로 진행하여 계속적으로 특정 픽셀을 비교 마스크와 비교한다.
460단계에서 문자 외곽선 정보 획득부(110)는 문자 외곽선을 포함하는 이진화 영상을 생성한다.
이후 도 3의 320단계로 돌아와서, 320단계에서 문자 외곽선 정보 획득부(110)는 문자 외곽선을 구성하는 각 픽셀에 대한 수직 방향 각도를 설정한 후 양자화한다. 이에 대해서 구체적으로 도 5를 참조하여 살펴보도록 한다.
도 5는 본 발명의 실시 예에 따라 문자 외곽선 정보 획득부에서 문자 외곽선의 픽셀들에 대한 수직 방향 각도를 양자화하는 과정을 나타내는 흐름도이다.
500단계에서 문자 외곽선 정보 획득부(110)는 문자 외곽선상의 픽셀들 중 특정 픽셀을 중심으로 미리 설정된 크기의 블록 영역을 설정한다.
510단계에서 문자 외곽선 정보 획득부(110)는 블록 영역 내에서 특정 픽셀과 명도값이 0인 픽셀들 간의 방향 벡터를 산출한다. 여기서, 본 발명의 실시 예에서는 명도값을 0으로 가정하여 설명하지만 사용자에 의해서 설정되거나 미리 설정된 명도값을 이용할 수도 있다.
520단계에서 문자 외곽선 정보 획득부(110)는 산출된 방향 벡터들을 모두 합한 벡터값을 특정 픽셀의 수직 방향 각도로 설정한다. 상기에서 설명한 바와 같이 도 2의 (e)와 같이 참조부호 202에 해당하는 픽셀과 명도값이 0인 다른 픽셀들 간의 방향 벡터를 산출하고, 산출된 방향 벡터들을 모두 합한 수직 방향 각도를 산출할 수 있다.
530단계에서 문자 외곽선 정보 획득부(110)는 설정된 수직 방향 각도가 포함되는 미리 설정된 각 대표 각도값의 임계 범위를 판단한다. 540단계에서는 확인된 임계 범위의 대표 각도 값으로 수직 방향 각도를 양자화한다.
예를 들어, 수직 방향 각도가 임계범위가 28°~ 53°일 경우 대표 각도 값을 45°로 양자화 한다고 가정하는 경우, 산출된 수직 방향 각도가 47.5 °라면 문자 외곽선 정보 획득부(110)는 산출된 수직 방향 각도가 47.5 °가 어떤 임계범위에 포함되는지 확인하여 수직 방향 각도를 45°로 양자화한다.
550단계에서 최종 픽셀의 수직 방향 각도까지 모두 양자화가 완료되었는지 여부를 판단하여 완료되면 동작을 종료하고, 그렇지 않으면 500단계로 진행하여 510~550단계를 진행한다.
다시 도 3의 330단계로 돌아와서, 330단계에서 문자 영역 정보 획득부(120)는 추출된 외곽선과 양자화된 각도 값을 이용하여 문자 외곽선을 구성하는 각 픽셀에서는 문자 획 너비와 각도를 설정한다. 이에 대해서 구체적으로 도 6을 참조하여 살펴보도록 한다.
도 6은 본 발명의 실시 예에 따라 문자 영역 정보 획득부가 문자 외곽선을 구성하는 각 픽셀에서의 문자 획 너비와 각도를 설정하는 과정을 나타내는 흐름도이다.
600단계에서 문자 영역 정보 획득부(120)는 문자 외곽선 상의 특정 픽셀의 대표 각도값 방향으로 대응되어 위치하는 문자 외곽선 상의 픽셀까지의 획 너비를 산출한다. 이때, 획 너비는 획 너비를 구하고자 하는 픽셀을 기준으로 대표 각도 방향의 위치에 있는 외곽선 픽셀 중 가장 가까운 외곽선 픽셀까지의 거리로 한다.
610단계에서 문자 영역 정보 획득부(120)는 특정 픽셀의 대표 각도값을 중심으로 양 옆의 대표 각도값들 방향으로 대응되어 위치하는 외곽선상의 각 픽셀까지의 획 너비 산출한다.
예를 들어, 원본 영상에서 문자 후보 영역을 이진화하면 도 7의 (a), (d)와 같은 2개의 반전된 영상이 생성되며, 문자가 배경에 비해 밝거나 어두울 수 있으므로 문자 영역 정보 획득부(120)는 두 영상 모드에 대한 문자 획 너비를 산출한다.
다시 말해서, 문자 영역 정보 획득부(120)는 도 7의 (a), (d)와 같은 이진화 영상에서 도 7의 (b), (e)와 같은 문자 외곽선을 산출하고, 추출된 외곽선에서 도 7의 (d), (f)와 같이 획 내부로 3가지 각도 방향으로 획 너비를 산출한다.
예를 들어, 종래에는 문자가 "ㅇ" , "ㅅ", "ㅈ"과 같은 문자에서 산출된 수직 방향의 획 너비가 최단 거리로 선택되지 않을 수 있어서 정확한 획 너비를 측정하기 어려웠지만, 본 발명과 같이 3가지 방향을 이용하여 상기의 "ㅇ" , "ㅅ", "ㅈ"과 같은 문자의 최단 획 너비를 측정할 수 있게 된다.
다만, 상기의 방법으로 획 너비를 측정하는 경우 "ㅣ", "ㅡ"와 같은 문자에서는 가로 또는 세로로 긴 획 너비가 측정될 수 있는데, 이러한 경우 문자 영역 정보 획득부(120)는 문자 후보 영역의 크기와 비교하여 문자 후보 영역의 크기보다 큰 경우 획 너비에서 제외시킨다.
620단계에서 문자 영역 정보 획득부(120)는 산출된 문자 획 너비들 중 가장 짧은 획 너비를 특정 픽셀의 문자 획 너비로 설정하고, 그에 대응되는 대표 각도값을 특정 픽셀의 대표 각도값으로 설정한다.
630단계에서 문자 영역 정보 획득부(120)는 문자 외곽선상의 최종 픽셀까지의 획 너비와 대표 각도값 설정이 완료되었는지 확인하여 확인되면 동작을 종료하고, 그렇지 않으면 600단계로 진행하여 획 너비 산출 과정을 수행하고, 610~630단계를 진행한다.
다시 도 3의 340단계로 돌아와서, 340단계에서 문자 영역 판단부(130)는 문자 후보 영역 내에서 문자가 실제도 존재하는 영역을 판단한다.
구체적으로, 문자 영역 판단부(130)는 전체 문자 외곽선의 길이에 대비하여 유효한 획 너비뿐만 아니라 각도 정보가 존재하는 비율을 판단하여 실제로 문자가 존재하는지 여부를 판단하게 된다.
일반적으로 획 너비의 경우, 도 8의 (a)와 같이 값이 일정하게 유지되는 구간과 심하게 변하는 구간이 존재한다. 문자가 존재하는 경우 전체 외곽선에서 획 너비 값이 일정하게 유지되는 구간이 차지하는 비율이 높지만 문자가 아닌 오브젝트의 경우에도 획 너비 값이 일정하게 유지되는 구간이 존재한다.
문자가 일정한 너비를 가진 획들의 조합이라고 가정할 경우, 획은 일정 방향을 가진 하나의 선이라고 정의할 수 있다. 즉, 획이 있는 문자는 도 8의 (b)와 같이 외곽선의 각도가 일정하게 유지되는 구간들이 빈번히 나타나게 된다.
따라서, 본 발명에서는 유효한 획 너비만으로 문자의 존재를 판단하는 것이 아니라 도 8의 (b)와 같이 각도 정보를 함께 이용하여 도 8의 (c)와 같이 유효한 획만을 남긴 후 이를 이용하여 문자 존재 여부를 판단한다.
이에 대해서 구체적으로, 문자 영역 판단부(130)는 도 8의 (b)d와 같이 외곽선 전체에서 일정한 각도가 나타나는 구간을 검출한다.
이후 문자 영역 판단부(130)는 도 8의 (a)와 같이 획 너비가 오차범위인 ±1 픽셀 범위에서 일정하며, 검출된 구간 내에서 최대 획 너비와 최소 획 너비의 차이가 구간 길이의 반 이하인 구간만을 제외한 나머지 획 너비를 0으로 재정의한다. 이와 같이 재정의된 결과는 도 8의 (c)와 같이 도시될 수 있다.
이후 문자 영역 판단부(130)는 유효한 획 너비만 남은 영역의 유효한 획 너비 구간의 길이와 전체 외곽선의 길이의 비율이 미리 설정된 비율 이상일 경우 유효한 영역이라고 판단한다.
이와 같이 본 발명은 문자 외곽선과 양자화된 대표 각도값을 이용하여 문자 외곽선을 구성하는 각 픽셀의 문자 획 너비와 각도를 설정함으로써 문자 획 너비를 정확하게 산출하여 문자 후보 영역에 실제 문자가 포함되는지 여부를 효과적으로 판단할 수 있게 된다.

Claims (14)

  1. 문자 영역 추출 장치에 있어서,
    원본 영상으로부터 문자 후보 영역을 포함하는 이진화 영상을 생성하는 문자 후보 영역 검출부와,
    상기 문자 후보 영역에서 문자의 외곽선을 추출하고, 상기 추출된 외곽선에 대한 문자 외곽선 정보를 획득하는 문자 외곽선 정보 획득부와,
    상기 문자 외곽선 정보를 이용하여 상기 외곽선을 구성하는 각 픽셀에서의 대표 문자 획 너비와 대표 문자 각도를 설정하는 문자 영역 정보 획득부와,
    상기 외곽선의 전체 길이에 대비하여 유효한 대표 문자 획 너비와 유효한 각도의 비율을 확인하여 상기 문자 후보 영역에서 문자가 존재하는 영역을 판단하는 문자 영역 판단부를 포함하는 것을 특징으로 하는 문자 획 너비 계산을 이용한 문자 영역 추출 장치.
  2. 제1항에 있어서, 상기 문자 외곽선 정보 획득부는,
    상기 이진화 영상 내의 모든 픽셀과 미리 설정된 비교 마스크를 비교하여 비교 조건을 만족하는 픽셀에 대한 명도값을 미리 설정된 제1 명도값으로 변환하여 상기 외곽선을 추출하는 것을 특징으로 하는 문자 획 너비 계산을 이용한 문자 영역 추출 장치.
  3. 제2항에 있어서, 상기 문자 외곽선 정보 획득부는,
    상기 비교 마스크의 정중앙에 위치하는 기준 픽셀과 이진화 영상 내의 각 픽셀을 매칭하여 상기 기준 픽셀에 대응되는 픽셀의 명도값이 미리 설정된 제2 명도값을 가지고, 상기 기준 픽셀에 대응되는 픽셀의 근접 픽셀들에 대한 명도값이 상기 기준 픽셀의 근접 픽셀들에 대한 명도값과 동일하면 상기 비교 조건을 만족하는 픽셀로 판단하는 것을 특징으로 하는 문자 획 너비 계산을 이용한 문자 영역 추출 장치.
  4. 제3항에 있어서, 상기 문자 외곽선 정보 획득부는,
    상기 추출된 외곽선을 구성하는 각 픽셀에 대한 수직 방향 각도를 설정하여 상기 설정된 수직 방향 각도를 미리 설정된 대표 각도값으로 양자화하는 것을 특징으로 하는 문자 획 너비 계산을 이용한 문자 영역 추출 장치.
  5. 제4항에 있어서, 상기 문자 외곽선 정보 획득부는,
    상기 외곽선 상의 각 픽셀을 중심으로 미리 설정된 크기의 블록 영역을 설정하고, 상기 설정된 블록 영역 내에서 상기 외곽선 상의 각 픽셀과 주변 픽셀들간의 방향 벡터를 산출하고, 상기 산출된 방향 벡터들을 모두 합한 벡터값을 상기 수직 방향 각도로 설정하는 것을 특징으로 하는 문자 획 너비 계산을 이용한 문자 영역 추출 장치.
  6. 제5항에 있어서, 상기 문자 영역 정보 획득부는,
    상기 외곽선 상의 각 픽셀에 해당하는 대표 각도값의 방향으로 대응되어 위치하는 상기 외곽선 상의 제1 픽셀까지의 거리인 제1 문자 획 너비와, 상기 대표 각도값을 기준으로 제1 각도 방향으로 대응되어 위치하는 상기 외곽선 상의 제2 픽셀까지의 거리인 제2 문자 획 너비와, 상기 대표 각도값을 기준으로 제2 각도 방향으로 대응되어 위치하는 상기 외곽선 상의 제3 픽셀까지의 거리인 제3 문자 획 너비를 산출하고, 상기 산출된 제1 문자 획 너비, 제2 문자 획 너비, 제3 문자 획 너비 중에서 최단 문자 획 너비를 상기 대표 문자 획 너비로 설정하고, 상기 설정된 대표 문자 획 너비에 해당하는 대표 각도값을 상기 대표 문자 각도로 설정하는 것을 특징으로 하는 문자 획 너비 계산을 이용한 문자 영역 추출 장치.
  7. 제6항에 있어서, 상기 문자 영역 판단부는,
    상기 외곽선의 전체에서 상기 대표 각도값이 일정하게 유지되는 제1 구간을 검출하고, 상기 검출된 제1 구간 내에서 상기 대표 문자 획 너비의 값이 일정하게 유지되는 제2 구간을 검출한 후 상기 외곽선의 전체 길이와 상기 검출된 제2 구간의 길이에 대한 비율이 미리 설정된 임계 비율 이상이면 상기 검출된 제2 구간을 상기 문자가 존재하는 영역으로 판단하는 것을 특징으로 하는 문자 획 너비 계산을 이용한 문자 영역 추출 장치.
  8. 문자 영역 추출 방법에 있어서,
    원본 영상으로부터 문자 후보 영역을 포함하는 이진화 영상을 생성하는 과정과,
    상기 문자 후보 영역에서 문자의 외곽선을 추출하는 과정과,
    상기 추출된 외곽선에 대한 문자 외곽선 정보를 획득하는 과정과,
    상기 문자 외곽선 정보를 이용하여 상기 외곽선을 구성하는 각 픽셀에서의 대표 문자 획 너비와 대표 문자 각도를 설정하는 과정과,
    상기 외곽선의 전체 길이에 대비하여 유효한 대표 문자 획 너비와 유효한 각도의 비율을 확인하여 상기 문자 후보 영역에서 문자가 존재하는 영역을 판단하는 과정을 포함함을 특징으로 하는 문자 획 너비 계산을 이용한 문자 영역 추출 방법.
  9. 제8항에 있어서, 상기 외곽선을 추출하는 과정은,
    상기 이진화 영상 내의 모든 픽셀과 미리 설정된 비교 마스크를 비교하는 과정과,
    비교 조건을 만족하는 픽셀에 대한 명도값을 미리 설정된 제1 명도값으로 변환하는 과정을 포함함을 특징으로 하는 문자 획 너비 계산을 이용한 문자 영역 추출 방법.
  10. 제9항에 있어서, 상기 이진화 영상 내의 모든 픽셀과 미리 설정된 비교 마스크를 비교하는 과정은,
    상기 비교 마스크의 정중앙에 위치하는 기준 픽셀과 이진화 영상 내의 각 픽셀을 매칭하는 과정과,
    상기 기준 픽셀에 매칭되는 픽셀의 명도값이 미리 설정된 제2 명도값을 가지고, 상기 기준 픽셀에 대응되는 픽셀의 근접 픽셀들에 대한 명도값이 상기 기준 픽셀의 근접 픽셀들에 대한 명도값과 동일한지 판단하는 과정을 포함함을 특징으로 하는 문자 획 너비 계산을 이용한 문자 영역 추출 방법.
  11. 제10항에 있어서, 상기 문자 외곽선 정보를 획득하는 과정은,
    상기 추출된 외곽선을 구성하는 각 픽셀에 대한 수직 방향 각도를 설정하는 과정과,
    상기 설정된 수직 방향 각도를 미리 설정된 대표 각도값으로 양자화하는 과정을 포함함을 특징으로 하는 문자 획 너비 계산을 이용한 문자 영역 추출 방법.
  12. 제11항에 있어서, 상기 수직 방향 각도를 설정하는 과정과,
    상기 외곽선 상의 각 픽셀을 중심으로 미리 설정된 크기의 블록 영역을 설정하는 과정과,
    상기 설정된 블록 영역 내에서 상기 외곽선 상의 각 픽셀과 주변 픽셀들간의 방향 벡터를 산출하는 과정과,
    상기 산출된 방향 벡터들을 모두 합한 벡터값을 상기 수직 방향 각도로 설정하는 과정을 포함함을 특징으로 하는 문자 획 너비 계산을 이용한 문자 영역 추출 방법.
  13. 제12항에 있어서, 상기 양자화하는 과정은,
    상기 외곽선 상의 각 픽셀에 해당하는 대표 각도값의 방향으로 대응되어 위치하는 상기 외곽선 상의 제1 픽셀까지의 거리인 제1 문자 획 너비와, 상기 대표 각도값을 기준으로 제1 각도 방향으로 대응되어 위치하는 상기 외곽선 상의 제2 픽셀까지의 거리인 제2 문자 획 너비와, 상기 대표 각도값을 기준으로 제2 각도 방향으로 대응되어 위치하는 상기 외곽선 상의 제3 픽셀까지의 거리인 제3 문자 획 너비를 산출하는 과정과,
    상기 산출된 제1 문자 획 너비, 제2 문자 획 너비, 제3 문자 획 너비 중에서 최단 문자 획 너비를 상기 대표 문자 획 너비로 설정하는 과정과,
    상기 설정된 대표 문자 획 너비에 해당하는 대표 각도값을 상기 대표 문자 각도로 설정하는 과정을 포함함을 특징으로 하는 문자 획 너비 계산을 이용한 문자 영역 추출 방법.
  14. 제13항에 있어서, 상기 문자 후보 영역에서 문자가 존재하는 영역을 판단하는 과정은,
    상기 외곽선의 전체에서 상기 대표 각도값이 일정하게 유지되는 제1 구간을 검출하는 과정과,
    상기 검출된 제1 구간 내에서 상기 대표 문자 획 너비의 값이 일정하게 유지되는 제2 구간을 검출하는 과정과,
    상기 외곽선의 전체 길이와 상기 검출된 제2 구간의 길이에 대한 비율이 미리 설정된 임계 비율인지 판단하는 과정과,
    상기 판단결과, 상기 임계 비율 이상이면 상기 검출된 제2 구간을 상기 문자가 존재하는 영역으로 판단하는 과정을 포함함을 특징으로 하는 문자 획 너비 계산을 이용한 문자 영역 추출 방법.
KR1020100014280A 2010-02-17 2010-02-17 문자 획 너비 계산을 이용한 문자 영역 추출 장치 및 방법 KR101085699B1 (ko)

Priority Applications (2)

Application Number Priority Date Filing Date Title
KR1020100014280A KR101085699B1 (ko) 2010-02-17 2010-02-17 문자 획 너비 계산을 이용한 문자 영역 추출 장치 및 방법
US13/029,845 US8744189B2 (en) 2010-02-17 2011-02-17 Character region extracting apparatus and method using character stroke width calculation

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020100014280A KR101085699B1 (ko) 2010-02-17 2010-02-17 문자 획 너비 계산을 이용한 문자 영역 추출 장치 및 방법

Publications (2)

Publication Number Publication Date
KR20110094713A KR20110094713A (ko) 2011-08-24
KR101085699B1 true KR101085699B1 (ko) 2011-11-23

Family

ID=44369690

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020100014280A KR101085699B1 (ko) 2010-02-17 2010-02-17 문자 획 너비 계산을 이용한 문자 영역 추출 장치 및 방법

Country Status (2)

Country Link
US (1) US8744189B2 (ko)
KR (1) KR101085699B1 (ko)

Families Citing this family (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101692401B1 (ko) * 2011-01-21 2017-01-03 삼성전자주식회사 영상 처리 방법 및 장치
CN103455816B (zh) * 2012-05-28 2017-04-19 阿里巴巴集团控股有限公司 一种笔画宽度提取方法、装置及一种文字识别方法、系统
US9569679B1 (en) * 2012-12-04 2017-02-14 A9.Com, Inc. Adaptive image sampling for text detection
US9552527B1 (en) 2015-08-27 2017-01-24 Lead Technologies, Inc. Apparatus, method, and computer-readable storage medium for determining a rotation angle of text
US10997424B2 (en) 2019-01-25 2021-05-04 Gracenote, Inc. Methods and systems for sport data extraction
US11087161B2 (en) 2019-01-25 2021-08-10 Gracenote, Inc. Methods and systems for determining accuracy of sport-related information extracted from digital video frames
US11805283B2 (en) 2019-01-25 2023-10-31 Gracenote, Inc. Methods and systems for extracting sport-related information from digital video frames
US11010627B2 (en) * 2019-01-25 2021-05-18 Gracenote, Inc. Methods and systems for scoreboard text region detection
CN114495117A (zh) * 2022-02-15 2022-05-13 甘肃政法大学 一种中文手写汉字的笔划提取方法

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH10187886A (ja) 1996-12-26 1998-07-21 Toshiba Corp 文字認識装置および文字認識方法
JPH11175659A (ja) 1997-12-17 1999-07-02 Oki Electric Ind Co Ltd 文字認識装置

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7010166B2 (en) * 2000-11-22 2006-03-07 Lockheed Martin Corporation Character recognition system and method using spatial and structural feature extraction
US8290274B2 (en) 2005-02-15 2012-10-16 Kite Image Technologies Inc. Method for handwritten character recognition, system for handwritten character recognition, program for handwritten character recognition and storing medium
KR100902491B1 (ko) 2007-04-27 2009-06-10 금오공과대학교 산학협력단 숫자 영상 처리 시스템 및 그 방법

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH10187886A (ja) 1996-12-26 1998-07-21 Toshiba Corp 文字認識装置および文字認識方法
JPH11175659A (ja) 1997-12-17 1999-07-02 Oki Electric Ind Co Ltd 文字認識装置

Also Published As

Publication number Publication date
US20110200257A1 (en) 2011-08-18
US8744189B2 (en) 2014-06-03
KR20110094713A (ko) 2011-08-24

Similar Documents

Publication Publication Date Title
KR101085699B1 (ko) 문자 획 너비 계산을 이용한 문자 영역 추출 장치 및 방법
KR100651753B1 (ko) 객체의 대칭 특성과 모멘트 특성을 이용한 눈 검출 방법 및그 장치
CN106557764B (zh) 一种基于二进制编码字符水尺和图像处理的水位识别方法
JP5837205B2 (ja) 画像領域を使用するテキスト検出
CN107093172B (zh) 文字检测方法及系统
US8331670B2 (en) Method of detection document alteration by comparing characters using shape features of characters
EP2945096A1 (en) Character recognition method
KR101279712B1 (ko) 실시간 차선 검출 장치 및 방법과 이에 관한 기록매체
JP2008198157A (ja) 表認識プログラム、表認識方法および表認識装置
RU2015134095A (ru) Способ и устройство для обнаружения прямой линии
CA2797240A1 (en) Malignant mass detection and classification in radiographic images
KR101932214B1 (ko) 이미지 처리 기법을 이용하여 균열을 측정하기 위한 장치 및 그 방법
CN109376740A (zh) 一种基于视频的水尺读数检测方法
EP3471058A1 (en) Method and apparatus for detecting human body gender in microwave image
KR20120126677A (ko) 음란 이미지 자동 인식 방법, 장치 및 그 방법을 실행하기 위한 프로그램 기록매체
US20170277943A1 (en) Hand-raising detection device, non-transitory computer readable medium, and hand-raising detection method
KR100923935B1 (ko) Ocr을 위한 문서 영상의 자동 평가 방법 및 시스템
CN104281850B (zh) 一种文字区域识别方法和装置
CN106530273B (zh) 高精度fpc直线线路检测与缺陷定位方法
JP5971108B2 (ja) 画像処理装置、画像処理方法および画像処理プログラム
KR20160087600A (ko) 불량 검사 장치 및 방법
US20170277982A1 (en) Character recognition device, character recognition method and program
KR100726473B1 (ko) 이미지 분별 장치 및 그 방법
KR101380329B1 (ko) 영상의 변화를 검출하는 방법
KR100194583B1 (ko) 얼굴 구성요소 추출시스템 및 그 추출방법

Legal Events

Date Code Title Description
A201 Request for examination
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20141030

Year of fee payment: 4

FPAY Annual fee payment

Payment date: 20151029

Year of fee payment: 5

FPAY Annual fee payment

Payment date: 20161028

Year of fee payment: 6

FPAY Annual fee payment

Payment date: 20171030

Year of fee payment: 7

FPAY Annual fee payment

Payment date: 20181030

Year of fee payment: 8

FPAY Annual fee payment

Payment date: 20191030

Year of fee payment: 9