KR101176996B1 - 문자열의 라인 생성 방법 및 장치 - Google Patents

문자열의 라인 생성 방법 및 장치 Download PDF

Info

Publication number
KR101176996B1
KR101176996B1 KR1020100061789A KR20100061789A KR101176996B1 KR 101176996 B1 KR101176996 B1 KR 101176996B1 KR 1020100061789 A KR1020100061789 A KR 1020100061789A KR 20100061789 A KR20100061789 A KR 20100061789A KR 101176996 B1 KR101176996 B1 KR 101176996B1
Authority
KR
South Korea
Prior art keywords
line
string
window
character
voting
Prior art date
Application number
KR1020100061789A
Other languages
English (en)
Other versions
KR20120001138A (ko
Inventor
이귀상
Original Assignee
전남대학교산학협력단
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 전남대학교산학협력단 filed Critical 전남대학교산학협력단
Priority to KR1020100061789A priority Critical patent/KR101176996B1/ko
Priority to PCT/KR2010/008597 priority patent/WO2012002626A1/ko
Publication of KR20120001138A publication Critical patent/KR20120001138A/ko
Application granted granted Critical
Publication of KR101176996B1 publication Critical patent/KR101176996B1/ko

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/40Document-oriented image-based pattern recognition
    • G06V30/41Analysis of document content
    • G06V30/414Extracting the geometrical structure, e.g. layout tree; Block segmentation, e.g. bounding boxes for graphics or text

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Computer Graphics (AREA)
  • Geometry (AREA)
  • Artificial Intelligence (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Character Input (AREA)

Abstract

본 발명에 따른 문자열의 라인을 형성하는 방법은 상기 문자열에 포함된 문자들의 중심점을 검출하는 과정과, 상기 중심점을 입력토근으로 사용하여, 상기 문자에 텐서 보팅을 적용하는 과정과, 상기 텐서 보팅이 적용된 문자를 사용하여 상기 문자열의 라인을 생성하는 과정을 포함한다.

Description

문자열의 라인 생성 방법 및 장치{METHOD FOR DETECTING TEXT LINE SEGMENTATION AND APPARATUS FOR THE SAME}
본 발명은 문자 인식 방법 및 장치에 관한 것으로써, 특히 종이 상에 기입된 문자열의 라인을 검출하는 방법 및 장치에 관한 것이다.
최근 디지털 카메라나 휴대폰 카메라를 통해 막대한 양의 이미지 자료들이 생성되고 있다. 이미지에서 문자를 이해하는 것은 시각 장애인용 보조장치 또는 외국인을 위한 통역 시스템간은 매우 중요한 용도로서 활용될 수 있다.
사용자에 의해 문자가 손으로 기입되는 경우, 문자를 기입하는 사용자의 필기 습관에 따라, 동일한 문자라도 다양한 형태의 포맷(예컨대, 폰트), 크기, 방향 으로 표현될 수 있다. 이에 따라, 사용자에 의해 다양하게 표현된 문자를 포함하는 이미지에서, 문자를 추출하는 것이 쉽지않다.
손으로 기입된 문자를 포함하는 이미지에서, 문자열의 라인을 기준으로 문자 인식을 처리하게 되면, 문자의 인식률을 현저하게 높일 수 있다. 따라서, 손으로 기입된 문자를 포함하는 이미지에서, 문자 인식률을 높이기 위해, 문자열의 라인을 보다 정확하게 생성 및 검출하기 위한 기술의 개발이 요구된다.
본 발명은 전술한 점을 고려하여 안출된 것으로서, 문자의 크기와 방향이 일정하지 않은 조건에서 문자열의 라인 검출의 정밀도를 높일 수 있는 문자열의 라인 생성 방법 및 장치를 제안하는데 그 목적이 있다.
상기한 목적을 달성하기 위하여 본 발명의 일 측면에 따른 문자열의 라인을 형성하는 방법은 상기 문자열에 포함된 문자들의 중심점을 검출하는 과정과, 상기 중심점을 입력토근으로 사용하여, 상기 문자에 텐서 보팅을 적용하는 과정과, 상기 텐서 보팅이 적용된 문자를 사용하여 상기 문자열의 라인을 생성하는 과정을 포함한다.
본 발명의 다른 측면에 따른 문자열의 라인을 형성하는 장치는 상기 문자열에 포함된 문자들의 중심점을 검출하는 중심점 검출부와, 상기 중심점을 입력토근으로 사용하여, 상기 문자에 텐서 보팅을 적용하는 텐서 보팅 처리부와, 상기 텐서 보팅이 적용된 문자를 사용하여 상기 문자열의 라인을 생성하는 문자열 라인 생성부를 포함한다.
본 발명의 문자열의 라인 형성 방법 및 장치에 따르면, 문자의 크기와 방향이 일정하지 않은 조건에서 보다 정확한 문자열의 라인 형성을 보장할 수 있다.
또한, 문자열의 라인 형성에 텐서 보팅을 적용하여 문자열의 라인의 위치 탐색, 노이즈 제거, 검출률을 높이는데 필요한 정보를 생성하고, 이를 이용함으로써 문자열 라인의 검출 정밀도를 높일 수 있고, 나아가 문자열 라인을 사용한 문자의 검출률을 증대시킬 수 있다.
도 1은 본 발명의 일 실시예에 따른 문자열의 라인 생성 장치의 대략적인 구성을 도시하는 블록도,
도 2는 본 발명의 일 실시예에 따른 문자열의 라인 생성 장치에 입력되는 이미지의 예시도,
도 3은 본 발명의 일 실시예에 따른 문자열의 라인 생성 장치에 의해 검출된 중심점을 예시하는 도면,
도 4는 본 발명의 일 실시예에 따른 문자열의 라인 생성 장치에 의해 생성된 스틱 보팅 커널을 예시하는 도면,
도 5는 본 발명의 일 실시예에 따른 문자열의 라인 생성 장치에 의해 생성된 문자열의 라인을 예시하는 도면,
도 6은 도 1의 중심점 검출부의 상세 구성을 도시하는 블록도,
도 7a는 도 6의 중심점 검출부에 의해 생성된 팽창 이미지를 예시하는 도면,
도 7b는 도 6의 중심점 검출부에 의해 분리된 문자 영역을 예시하는 도면,
도 7c는 도 6의 중심점 검출부에 의해 생성된 중심점을 예시하는 도면,
도 8은 도 1의 문자열 라인 생성부의 상세 구성을 도시하는 블록도,
도 9a는 도 8의 문자열 라인 생성부에 의해 생성된 스틱 보팅 커널을 예시하는 도면,
도 9b는 도 9a의 스틱 보팅 커널에서 노이즈가 제거된 이미지를 예시하는 도면,
도 10a는 도 8의 문자열 라인 생성부에 의해 형성된 윈도우 및 종료점을 예시하는 도면,
도 10b는 도 8의 문자열 라인 생성부에 의해 형성된 문자열 라인의 일부분을 예시하는 도면,
도 10c는 도 8의 문자열 라인 생성부에 의해 형성 및 연결된 문자열 라인을 예시하는 도면,
도 10d는 도 8의 문자열 라인 생성부에 의해 형성된 문자열 라인을 예시하는 도면,
도 11a는 본 발명의 일 실시예에 따른 문자열의 라인 생성 장치에 입력되는 이미지의 일 예시도,
도 11b는 본 발명의 일 실시예에 따른 문자열의 라인 생성 장치에 의해 생성된 문자열 라인의 제1예시도,
도 11c는 본 발명의 일 실시예에 따른 문자열의 라인 생성 장치에 의해 생성된 문자열 라인의 제2예시도,
도 11d는 본 발명의 일 실시예에 따른 문자열의 라인 생성 장치에 의해 생성된 문자열 라인의 제3예시도,
도 12는 본 발명의 일 실시예에 따른 문자열의 라인 생성 방법의 순서를 도시하는 흐름도,
도 13은 도 12의 1201단계의 상세 과정을 도시하는 흐름도,
도 14는 도 12의 1203단계의 상세 과정을 도시하는 흐름도.
이하 본 발명에 따른 바람직한 실시예를 첨부한 도면을 참조하여 상세히 설명한다. 하기 설명에서는 구체적인 구성 소자 등과 같은 특정 사항들이 나타나고 있는데 이는 본 발명의 보다 전반적인 이해를 돕기 위해서 제공된 것일 뿐 이러한 특정 사항들이 본 발명의 범위 내에서 소정의 변형이나 혹은 변경이 이루어질 수 있음은 이 기술분야에서 통상의 지식을 가진 자에게는 자명하다 할 것이다.
그리고 후술되는 용어들은 본 발명에서의 기능을 고려하여 정의된 용어들로서 이는 사용자, 운용자의 의도 또는 관례 등에 따라 달라질 수 있다. 그러므로 그 정의는 본 명세서 전반에 걸친 내용을 토대로 내려져야 할 것이다.
도 1은 본 발명의 일 실시예에 따른 문자열의 라인 생성 장치의 대략적인 구성을 도시하는 블록도이다. 도 1을 참조하면, 본 발명의 일 실시예에 따른 문자열의 라인 생성 장치는 텐서 보팅의 입력 토큰으로 사용하기 위한 문자의 중심점을 검출하는 중심점 검출부(110), 상기 입력토큰을 사용하여 각 문자에 대한 텐서 보팅을 처리하는 텐서 보팅 처리부(120), 및 텐서 보팅 처리된 문자의 라인을 형성하는 문자열 라인 생성부(130)를 포함한다.
중심점 검출부(110)는 도2에서 예시되는 문자열을 포함하는 이미지(201)를 입력받고, 상기 이미지(201)에 포함된 적어도 하나의 문자의 중심점(도 3의 301참조)을 검출한다. 그리고, 상기 검출된 적어도 하나의 중심점(301)은 상기 텐서 보팅 처리부(120)에 제공된다.
텐서 보팅 처리부(120)는 상기 적어도 하나의 중심점을 입력 토큰으로 적용하여 텐서 보팅 프레임 웍을 처리한다. 텐서 보팅 프레임웍은 USC(University of Southern California)의 컴퓨터 비젼 그룹에 의해 개발된 통합 프레임웍으로써, 그 구체적인 설명은 생략한다. 텐서 보팅 처리부(120)는 텐서 보팅 처리에 대한 결과물로서 상기 적어도 하나의 문자의 상기 곡선 돌출도 및 법선 벡터를 확인하고, 상기 곡선 돌출도(saliency) 및 법선 벡터에 의한, 상기 문자들의 스틱 보팅 커널을 생성한다. 상기 문자들의 스틱 보팅 커널(403)은 도 4에 예시된다.
문자열 라인 생성부(130)는 문자열에 포함된 적어도 하나의 문자의 중심점을 이용하여, 도 5에 예시되는 문자열의 라인(501)을 생성한다.
도 6은 본 발명의 일 실시예에 따른 문자열의 라인 생성 장치에 구비된 중심점 검출부(110)의 상세 구성을 도시하는 블록도이다. 도 6을 참조하면, 중심점 검출부(110)는 입력된 이미지를 이진화 처리하는 이진화 처리부(111), 이진화 처리된 이미지로부터 문자영역을 확인하는 문자영역 확인부(112), 및 상기 문자영역의 중심점을 확인하는 중심점 확인부(113)를 구비한다.
이진화 처리부(111)는 입력된 이미지(도 2의 201 참조)에 포함된 문자와 배경이 명확하게 구분되도록 입력된 이미지를 이진화 처리하고, 이진화 처리된 이미지를 문자영역 확인부(112)로 제공한다.
문자영역 확인부(112)는 이진화된 이미지로부터 문자영역을 확인하기 위해, 우선적으로, 상기 문자로 추정되는 영역, 즉 이진화된 이미지에서 흑색부분을 팽창(dilate)시켜 도 7a에 예시되는 팽창 이미지(701)를 생성한다. 그리고, 문자영역 확인부(112)는 상기 팽창 이미지(701)에 포함된 문자열(703)을 도 7b에 예시되는 바와 같이 각각의 문자(705)로 분리한다. 이를 위해, 문자영역 확인부(112)는 상기 팽창 이미지(701)에서, 세로 방향의 흑색 픽셀의 일부를 제거하게 되며, 흑색 픽셀이 연결된 요소들을 각각 문자가 존재하는 영역으로 인식하게 된다.
중심점 확인부(113)는 분리된 상기 문자(705)에서 중심점(707)을 각각 확인한다. 상기 중심점(707)은 상기 문자가 존재하는 영역의 수직 및 수평 방향의 중심이 되는 점으로 설정될 수 있다.
도 8은 본 발명의 일 실시예에 따른 문자열의 라인 생성 장치에 구비된 문자열 라인 생성부(130)의 상세 구성을 도시하는 블록도이다. 도 8을 참조하면, 문자열 라인 생성부(130)는 문자열의 최초 시작점을 검출하는 시작점 검출부(132), 라인 생성을 위한 윈도우를 설정하는 윈도우 설정부(133), 상기 윈도우 내에서 종료점을 검출하는 종료점 검출부(134), 및 상기 윈도우 단위로, 문자열의 라인을 생성하는 라인 생성부(135)를 구비한다.
나아가, 상기 문자열 라인 생성부(130)는, 상기 텐서 보팅 처리부(120)의 결과를 확인하고, 문자가 존재하는 영역이 아닌 부분(도 9의 901)을 확인하고, 문자가 존재하는 영역이 아닌 부분으로 확인된 영역을 텐서 보팅의 결과값으로부터 제거하여, 도 9b와 같이 노이즈가 제거된 이미지(903)를 생성하는 노이즈 제거부(131)를 더 포함할 수 있다.
상기 노이즈 제거부(131)는 스틱 보팅 커널(403)의 법선 벡터 길이가 미리 정해진 값보다 상대적으로 작으면, 상기 스틱 보팅 커널(403)을 노이즈로 확인하여 제거할 수 있다. 상기 미리 정해진 값은 상기 스틱 보팅 커널(403)들의 최대 법선벡터의 길이를 고려하여 설정될 수 있다.
구체적으로, 상기 노이즈 제거부(131)는 각 스틱 보팅 커널(403)에 대해 하기의 수학식 1의 조건을 만족하면, 상기 스틱 보팅 커널(403)은 노이즈로 추정하여 제거할 수 있다.
Figure 112010041846817-pat00001
|X|는 텐서의 법선 벡터의 길이이고, max(xi)에서 xi는 각 텐서의 법선 벡터의 길이를 지시하며, max(xi)는 법선 벡터의 길이의 최대값을 지시한다.
나아가, 본 발명의 일 실시예에서, 상기 수학식1이 법선 벡터의 길이의 최대값을 3으로 나누는 것을 예시하였으나 본 발명이 이를 한정하는 것은 아니며, 문자와 텐서들의 특성을 고려하여, 본 발명의 기술 분야에서 통상의 지식을 가진 자에 의해 다양하게 변경될 수 있음은 물론이다.
또한, 상기 노이즈 제거부(131)는 각 스틱 보팅 커널(403)에 대해 하기의 수학식 2의 조건을 만족하면, 상기 스틱 보팅 커널(403)은 노이즈로 추정하여 제거할 수 있다.
Figure 112010041846817-pat00002
X는 토큰x의 법선 벡터이고, UP는 세로 방향을 지시하는 단위벡터이다.
또한, 본 발명의 일 실시예에서, 상기 수학식2가 기준값이 π/4임을 예시하였으나, 본 발명이 이를 한정하는 것은 아니며, 문자와 스틱 보팅 커널(403)들의 특성을 고려하여, 본 발명의 기술 분야에서 통상의 지식을 가진 자에 의해 다양하게 변경될 수 있음은 물론이다.
한편, 시작점 검출부(132)는 이미지에 포함된 문자열의 라인별 시작점을 검출하고, 검출된 시작점을 윈도우 설정부(133)에 제공한다. 이미지에 포함된 문자열의 라인별 시작점은 텐서 보팅 처리된 이미지(901) 또는 노이즈가 제거된 이미지(905)에서, 각 문자열의 최초 중심점으로 검출될 수 있다.
윈도우 설정부(133)는 문자열의 소정의 구간 별로 라인을 형성하기 위해, 미리 정해진 크기의 윈도우를 설정한다. 상기 미리 정해진 크기는 문자열 전체의 길이보다 상대적으로 작게 설정될 수 있다. 상기 윈도우의 기준은 상기 시작점 검출부(132)에서 제공되는 시작점 또는 상기 종료점 검출부(134)에서 제공되는 종료점일 수 있다. 구체적으로, 상기 윈도우 설정부(133)는 시작점을 기준으로 제1윈도우를 설정하고, 설정된 왼도우를 상기 종료점 검출부(134)에 제공한다. 이에 대응하여, 상기 종료점 검출부(134)가 제1윈도우 내에서의 제1종료점을 검출하여 제공하면, 상기 윈도우 설정부(133)는 다시 상기 제1종료점을 기준으로 제2윈도우를 설정하여, 상기 종료점 검출부(134)에 제공한다. 상기 윈도우 설정부(133)는 다시 상기 제2윈도우를 기준으로 한 제2종료점을 제공받고, 전술한 바와 같은 과정을 통해 윈도우를 다시 설정하여 제공할 수 있으며, 문자열 전체에 대한 윈도우가 설정될 때까지 전술한 바와 같은 과정을 반복적으로 수행하게 된다.
종료점 검출부(134)는 상기 윈도우 설정부(133)로부터 윈도우를 제공받고, 상기 윈도우의 기준점, 즉 시작점 또는 제1종료점 등을 기준으로 수평선을 생성한다. 그리고, 종료점 검출부(134)는 상기 윈도우 내에서 상기 수평선과 가장 근접한 중심점을 종료점으로 설정하게 된다.
그리고, 라인 생성부(135)는 상기 윈도우의 기준점과 종료점 검출부(134)에 의해 검출된 종료점을 서로 연결하여 문자열의 라인을 생성한다.
예컨대, 도 10a 내지 도 10d를 참조하면, 상기 윈도우 설정부(133)가 시작점(P)을 중심으로한 윈도우(1001)를 설정하여 종료점 검출부(134)에 제공하면, 종료점 검출부(134)는 윈도우의 기준이 되는 시작점(P)을 기준으로 수평선(1003)을 생성한다. 그리고, 종료점 검출부(134)는 복수의 중심점들 중, 상기 수평선(1003)과 최근접한 점(Q)을 종료점으로 설정하여, 윈도우 설정부(133) 및 라인 생성부(135)에 제공한다. 이에 대응하여, 라인 생성부(135)는 도 10b에 도시된 바와 같이, 상기 윈도우의 기준이 되는 시작점(P)와 종료점(Q)을 서로 연결하여 문자열의 라인(1005)을 생성하게 된다. 또한, 윈도우 설정부(133)는 상기 종료점(Q)을 기준으로 다시 미리 정해진 크기의 윈도우를 설정하여 종료점 검출부(134)에 제공하고, 종료점 검출부(134) 및 라인 생성부(135)는, 문자열 전체의 라인이 생성될 때까지 전술한 과정을 반복적으로 진행하게 된다. 이와 같이, 윈도우 설정부(133), 종료점 검출부(134), 및 라인 생성부(135)의 반복적인 동작을 통해, 도 10c에 도시된 바와 같이 문자열에서 부분적인 라인들을 서로 연결하게 되고, 최종적으로 도 10d에 도시된 바와 같이, 각 문자열의 라인을 생성한다.
나아가, 텐서 보팅 처리부(1120)는 보팅 범위(δ)를 변경하여 적용할 수 있다. 보팅 범위(δ)의 값이 클 수록 곡선 돌출도 값은 크게 생성될 수 있으나, 보팅 범위(δ)의 값들 사이의 상관값은 동일하게 유지된다. 도11a는 입력 이미지를 예시하고, 도11b 내지 도11d는 보팅 범위(δ)의 값을 각각 30, 50, 100으로 설정하여 문자열의 라인을 검출한 결과를 도시하는 도면이다. 보팅 범위(δ)의 값이 다르게 설정되더라도, 문자열의 라인을 검출한 결과는 유사하게 드러남을 알 수 있다. 따라서, 보팅 범위(δ)의 값은 토큰들 사이의 지원을 제공할 수 있을 만큼 크게 설정되는 것이 바람직하다.
이하, 본 발명의 일 실시예에 따른 문자열의 라인을 형성하는 방법의 순서를 설명함으로써, 전술한 본 발명의 일 실시예에 따른 문자열의 라인을 형성하는 장치의 동작을 설명한다.
도 12는 본 발명의 일 실시예에 따른 문자열의 라인을 형성하는 방법의 순서를 도시하는 흐름도이다. 도 12를 참조하면, 문자열의 라인을 형성하는 방법은 중심점을 검출하는 단계(1201)와, 상기 중심점을 입력 토큰으로 사용하여 텐서 보팅을 처리하는 단계(1202)와, 상기 텐서 보팅처리를 통해 형성된 스틱 보팅 커널을 사용하여 문자열의 라인을 생성하는 단계(1203)를 포함한다.
구체적으로, 1201단계는, 중심점 검출부(110)에 의해 수행될 수 있다. 1201단계에서, 중심점 검출부(110)는 도2에서 예시되는 문자열을 포함하는 이미지(201)를 입력받고, 상기 이미지(201)에 포함된 적어도 하나의 문자의 중심점(도 3의 301참조)을 검출한다. 그리고, 상기 검출된 적어도 하나의 중심점(301)은 상기 텐서 보팅 처리부(120)에 제공된다.
나아가, 도13은 중심점 검출을 수행하는 상세 과정을 예시하는 흐름도이다. 도 13을 참조하면, 중심점 검출부(110)의 이진화 처리부(111)는 입력된 이미지(도 2의 201참조)에 포함된 문자와 배경이 명확하게 구분되도록 입력된 이미지를 이진화 처리하고, 이진화 처리된 이미지를 문자영역 확인부(112)로 제공한다. 그러면, 문자영역 확인부(112)는 이진화된 이미지로부터 문자영역을 확인하기 위해, 우선적으로, 상기 문자로 추정되는 영역, 즉 이진화된 이미지에서 흑색부분을 팽창(dilate)시켜 도 7a에 예시되는 팽창 이미지(701)를 생성한다. 그리고, 문자영역 확인부(112)는 상기 팽창 이미지(701)에 포함된 문자열(703)을 도 7b에 예시되는 바와 같이 각각의 문자(705)로 분리한다. 문자(705)로 분리된 영역은 중심점 확인부(113)로 제공되며, 중심점 확인부(113)는 분리된 상기 문자(705)에서 중심점(707)을 각각 확인한다.
텐서 보팅을 처리하는 단계(1202)는 텐서 보팅 처리부(120)에 의해 수행된다. 텐서 보팅 처리부(120)는 상기 적어도 하나의 중심점을 입력 토큰으로 적용하여 텐서 보팅 프레임 웍을 처리한다. 즉, 텐서 보팅 처리부(120)는 상기 입력 토큰을 처리하여, 상기 적어도 하나의 문자의 상기 곡선 돌출도 및 법선 벡터를 확인하고, 상기 곡선 돌출도(saliency) 및 법선 벡터에 의한, 상기 문자들의 스틱 보팅 커널(도 4의 403 참조)을 생성한다. 상기 문자들의 스틱 보팅 커널(403)은 도 4에 예시된다.
한편, 문자열의 라인을 생성하는 단계(1203)는 문자열 라인 생성부(130)에 의해 수행될 수 있다.
도 14는 문자열의 라인을 생성하는 단계(1203)의 구체적인 과정은 도시하는 흐름도이다. 도 14를 참조하면, 1402단계에서, 문자열 라인 생성부(130)에 구비된 시작점 검출부(132)는 텐서 보팅 처리된 이미지(901)에서, 각 문자열의 최초 중심점을, 문자열의 라인별 시작점(도 10a의 P참조)으로 검출하고, 검출된 시작점(P)을 윈도우 설정부(133)에 제공한다.
다음으로, 1403단계에서, 윈도우 설정부(133)는 문자열의 소정의 구간 별로 라인을 형성하기 위해, 미리 정해진 크기의 윈도우를 설정한다. 상기 미리 정해진 크기는 문자열 전체의 길이보다 상대적으로 작게 설정될 수 있다. 우선, 윈도우 설정부(133)는 상기 시작점 검출부(132)에서 제공되는 시작점을 기준으로 미리 정해진 크기의 제1윈도우(예컨대, 도 10a의 1001참조)를 설정한다.
다음으로, 1404단계에서, 상기 종료점 검출부(134)는 윈도우 설정부(133)로부터 상기 미리 정해진 크기의 제1윈도우(1001)를 제공받고, 상기 윈도우의 기준점(도 10a의 P), 즉 시작점(P)을 기준으로 수평선(도 10a의 1003)을 생성한다. 그리고, 종료점 검출부(134)는 상기 제1윈도우 내에 분포된 복수의 중심점들 중에서 상기 수평선(1003)과 가장 근접한 중심점(도 10a의 Q)을 제1종료점으로 설정하게 된다. 상기 제1중심점(Q)은 윈도우 설정부(133) 및 라인 생성부(135)에 제공된다.
1405단계에서, 라인 생성부(135)는 도 10b에 도시된 바와 같이, 상기 윈도우의 기준이 되는 시작점(P)과 제1종료점(Q)을 서로 연결하여 문자열의 라인(1005)을 생성한다.
다음으로, 1406단계에서는 현재 라인을 형성하고 있는 문자열의 전체 라인이 형성되었는지를 확인하고, 문자열 전체의 라인이 형성되었을 경우 1407단계를 진행하고, 문자열 전체의 라인이 형성되지 않았을 경우 문자열 전체의 라인이 형성될 때까지 1403 내지 1405단계를 반복적으로 수행한다. 구체적으로, 윈도우 설정부(133)는 상기 종료점 검출부(134)로부터 제공되는 제1종료점을 기준으로, 미리 정해진 크기의 제2윈도우를 형성하여, 상기 종료점 검출부(134)로 제공한다. 그러면, 종료점 검출부(134)는 다시 상기 제2윈도우를 기준으로 한 제2종료점을 제공받고, 전술한 바와 같은 과정을 통해 윈도우를 다시 설정하여 종료점 검출부(134) 및 라인 생성부(135)에 제공한다. 라인 생성부(135)는 반복적인 동작을 통해, 도 10c에 도시된 바와 같이 문자열에서 부분적인 라인들을 서로 연결하게 되고, 최종적으로 도 10d에 도시된 바와 같이, 각 문자열의 라인을 생성한다.
나아가, 1407단계에서는 현재 라인을 형성하고 있는 이미지에 포함된 모든 문자열의 라인이 형성되었는지를 확인한다. 이미지에 포함된 모든 문자열의 라인이 형성되었을 경우 문자열의 라인 생성 단계를 종료하고, 이미지에 포함된 모든 문자열의 라인이 형성되지 않았을 경우, 이미지에 포함된 모든 문자열의 라인이 형성될 때까지 시작점 검출부(132), 윈도우 설정부(133), 종료점 검출부(134), 및 라인 생성부(135)는 1402 내지 1406단계를 반복적으로 수행한다.
나아가, 문자열의 라인을 생성하는 단계(1203)는, 문자가 존재하는 영역이 아닌 부분(도 9의 901), 즉 노이즈를 제거하는 단계(1401)를 더 포함할 수 있다. 상기 1401단계는 시작점을 검출하는 단계(1402)가 수행되기 전에 처리되며, 상기 1402단계는 노이즈가 제거된 이미지로부터 시작점을 검출하게 된다. 구체적으로, 1401단계는 노이즈 제거부(131)에 의해 수행될 수 있다. 상기 노이즈 제거부(131)는 법선 벡터 길이가 미리 정해진 값보다 상대적으로 작은 상기 스틱 보팅 커널(403)을 노이즈로 확인하여 제거하거나, 또는 법선 벡터의 수직 각도가 미리 정해진 범위를 벗어난 상기 스틱 보팅 커널(403)을 노이즈로 확인하여 제거할 수 있다.
본 발명에 따른 문자열의 라인 형성 방법은 컴퓨터로 읽을 수 있는 기록 매체에 컴퓨터가 읽을 수 있는 코드로서 구현될 수 있다. 컴퓨터가 읽을 수 있는 기록매체는 컴퓨터 시스템에 의하여 읽혀질 수 있는 데이터가 저장되는 모든 종류의 기록 장치를 포함한다. 컴퓨터가 읽을 수 있는 기록 매체의 예로는 ROM, RAM, CD-ROM, 자기 테이프, 플로피 디스크, 광 디스크 등이 있으며, 또한 캐리어 웨이브(예를 들어, 인터넷을 통한 전송)의 형태로 구현되는 것을 포함한다. 또한, 컴퓨터가 읽을 수 있는 기록 매체는 네트워크로 연결된 컴퓨터 시스템에 분산되어, 분산 방식으로 컴퓨터가 읽을 수 있는 코드로 저장되고 실행될 수 있다.
이상에서 본 발명은 비록 한정된 실시예와 도면에 의해 설명되었으나, 본 발명은 이것에 의해 한정되지 않으며 본 발명이 속하는 기술분야에서 통상의 지식을 가진 자에 의해 다양한 수정 및 변형이 가능함은 물론이다.

Claims (20)

  1. 이미지에 포함된 문자열의 라인을 형성하는 방법에 있어서,
    상기 문자열에 포함된 문자들의 중심점을 검출하는 과정과,
    상기 중심점을 입력토근으로 사용하여, 상기 문자에 텐서 보팅을 적용하는 과정과,
    상기 텐서 보팅이 적용된 문자를 사용하여 상기 문자열의 라인을 생성하는 과정을 포함하며,
    상기 문자열의 라인을 생성하는 과정은,
    상기 문자열의 각 라인별 시작점을 검출하는 과정과,
    상기 시작점을 기준으로 미리 정해진 범위의 제1윈도우를 설정하는 과정과,
    상기 제1윈도우 내에서, 상기 라인 생성을 위한 제1종료점을 확인하는 과정과,
    상기 시작점과 상기 제1종료점을 연결하는 과정을 포함함을 특징으로 하는 방법.
  2. 제1항에 있어서, 상기 문자들의 중심점을 검출하는 과정은,
    상기 이미지를 이진화하는 과정과,
    상기 이미지로부터 문자열이 포함된 문자영역을 확인하는 과정과,
    상기 문자의 중심점을 검출하는 과정을 포함함을 특징으로 하는 방법.
  3. 제1항에 있어서, 상기 텐서 보팅이 적용된 문자로부터 노이즈를 제거하는 과정을 더 포함함을 특징으로 하는 방법.
  4. 제1항에 있어서, 상기 텐서 보팅을 적용하는 과정은,
    상기 문자의 중심점을 입력토근으로 사용하고, 상기 문자의 곡선 돌출도 및 법선 벡터를 확인하는 과정과,
    상기 곡선 돌출도 및 법선 벡터에 의한, 상기 문자들의 스틱 보팅 커널을 생성하는 과정을 포함함을 특징으로 하는 방법.
  5. 제4항에 있어서,
    상기 문자들의 스틱 보팅 커널로부터 노이즈를 제거하는 과정을 더 포함함을 특징으로 하는 방법.
  6. 제5항에 있어서, 상기 노이즈를 제거하는 과정은,
    상기 법선 벡터의 길이가 미리 정해진 임계값보다 상대적으로 작은 값을 갖는 스틱 보팅 커널을 제거하는 과정을 포함함을 특징으로 하는 방법.
  7. 제6항에 있어서, 상기 임계값은
    상기 법선 벡터의 길이의 최대값을 갖는 스틱 보팅 커널의 길이를 미리 정해진 수로 나눈 값임을 특징으로 하는 방법.
  8. 제5항에 있어서, 상기 노이즈를 제거하는 과정은,
    상기 법선 벡터의 각도가 미리 정해진 임계값보다 상대적으로 작은 값을 갖는 스틱 보팅 커널을 제거하는 과정을 더 포함함을 특징으로 하는 방법.
  9. 삭제
  10. 제1항에 있어서,
    상기 제1종료점을 기준으로 미리 정해진 범위의 제2윈도우를 설정하는 과정과,
    상기 제2윈도우 내에서, 상기 라인 생성을 위한 제2종료점을 확인하는 과정과,
    상기 제1종료점과 상기 제2종료점을 연결하는 과정을 포함함을 특징으로 하는 방법.
  11. 이미지에 포함된 문자열의 라인을 형성하는 장치에 있어서,
    상기 문자열에 포함된 문자들의 중심점을 검출하는 중심점 검출부와,
    상기 중심점을 입력토근으로 사용하여, 상기 문자에 텐서 보팅을 적용하는 텐서 보팅 처리부와,
    상기 텐서 보팅이 적용된 문자를 사용하여 상기 문자열의 라인을 생성하는 문자열 라인 생성부를 포함하며,
    상기 문자열 라인 생성부는,
    상기 문자열의 각 라인별 시작점을 검출하는 시작점 검출부와,
    상기 시작점을 기준으로 미리 정해진 범위의 윈도우를 설정하는 윈도우 설정부와,
    상기 윈도우 설정부로부터 윈도우를 제공받고, 상기 윈도우 내에서의 상기 라인 생성을 위한 종료점을 확인하는 종료점 검출부와,
    상기 시작점과 상기 종료점을 연결하여 라인을 생성하는 라인 생성부를 포함함을 특징으로 하는 장치.
  12. 제11항에 있어서, 상기 중심점 검출부는,
    상기 이미지를 이진화 처리하는 이진화 처리부와,
    상기 이미지로부터 문자열이 포함된 문자영역을 확인하는 문자영역 확인부와,
    상기 문자의 중심점을 검출하는 중심점 확인부를 포함함을 특징으로 하는 장치.
  13. 제11항에 있어서, 상기 텐서 보팅 처리부는,
    상기 문자의 중심점을 입력토근으로 사용하고, 상기 문자의 곡선 돌출도 및 법선 벡터를 확인하고, 상기 곡선 돌출도 및 법선 벡터에 의한, 상기 문자들의 스틱 보팅 커널을 생성하는 것을 특징으로 하는 장치.
  14. 삭제
  15. 제11항에 있어서,
    상기 윈도우 설정부는 상기 문자열의 전체의 길이보다 상대적으로 작은 크기의 윈도우를 설정하며,
    상기 종료점 검출부는 상기 문자열에서 적어도 하나의 종료점을 검출하고, 상기 종료점을 상기 윈도우 설정부 및 라인 생성부에 제공하는 것을 특징으로 하는 장치.
  16. 제15항에 있어서,
    상기 윈도우 설정부는 시작점을 기준으로 설정된 제1윈도우와, 제1종료점을 기준으로 설정된 제2윈도우를 상기 종료점 검출부로 제공하고,
    상기 종료점 검출부는 상기 제1윈도우로부터 검출된 상기 제1종료점을 상기 윈도우 설정부 및 라인 생성부에 제공하는 것을 특징으로 하는 장치.
  17. 제13항에 있어서, 상기 문자열 라인 생성부는,
    상기 텐서 보팅이 적용된 문자로부터 노이즈를 제거하는 노이즈 제거부를 포함함을 특징으로 하는 장치.
  18. 제17항에 있어서, 상기 노이즈 제거부는,
    상기 텐서 보팅이 적용된 문자의 법선 벡터 길이가 미리 정해진 임계값보다 상대적으로 작은 값을 갖는 스틱 보팅 커널을 제거하는 것을 특징으로 하는 장치.
  19. 제18항에 있어서, 상기 임계값은,
    상기 법선 벡터의 길이의 최대값을 갖는 스틱 보팅 커널의 길이를 미리 정해진 수로 나눈 값임을 특징으로 하는 장치.
  20. 제17항에 있어서, 상기 노이즈 제거부는,
    상기 법선 벡터의 각도가 미리 정해진 임계값보다 상대적으로 작은 값을 갖는 스틱 보팅 커널을 제거하는 것을 특징으로 하는 장치.
KR1020100061789A 2010-06-29 2010-06-29 문자열의 라인 생성 방법 및 장치 KR101176996B1 (ko)

Priority Applications (2)

Application Number Priority Date Filing Date Title
KR1020100061789A KR101176996B1 (ko) 2010-06-29 2010-06-29 문자열의 라인 생성 방법 및 장치
PCT/KR2010/008597 WO2012002626A1 (ko) 2010-06-29 2010-12-02 문자열의 라인 생성 방법 및 장치

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020100061789A KR101176996B1 (ko) 2010-06-29 2010-06-29 문자열의 라인 생성 방법 및 장치

Publications (2)

Publication Number Publication Date
KR20120001138A KR20120001138A (ko) 2012-01-04
KR101176996B1 true KR101176996B1 (ko) 2012-08-24

Family

ID=45402307

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020100061789A KR101176996B1 (ko) 2010-06-29 2010-06-29 문자열의 라인 생성 방법 및 장치

Country Status (2)

Country Link
KR (1) KR101176996B1 (ko)
WO (1) WO2012002626A1 (ko)

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7856125B2 (en) * 2006-01-31 2010-12-21 University Of Southern California 3D face reconstruction from 2D images

Also Published As

Publication number Publication date
KR20120001138A (ko) 2012-01-04
WO2012002626A1 (ko) 2012-01-05

Similar Documents

Publication Publication Date Title
CN107122806B (zh) 一种敏感图像识别方法及装置
US11106891B2 (en) Automated signature extraction and verification
US10152648B2 (en) Method and apparatus for determining a document type of a digital document
US8494273B2 (en) Adaptive optical character recognition on a document with distorted characters
US8306327B2 (en) Adaptive partial character recognition
US10643094B2 (en) Method for line and word segmentation for handwritten text images
TW201636900A (zh) 文本行分類器的生成方法及裝置
US20160198065A1 (en) Method and apparatus for authenticating printed documents that contains both dark and halftone text
US9098759B2 (en) Image processing apparatus, method, and medium for character recognition
WO2011128777A2 (en) Segmentation of textual lines in an image that include western characters and hieroglyphic characters
CN112070649B (zh) 一种去除特定字符串水印的方法及系统
WO2017141802A1 (ja) 画像処理装置、文字認識装置、画像処理方法及びプログラム記録媒体
JP2019016350A (ja) 電子文書における強調テキストの識別
US9818028B2 (en) Information processing apparatus for obtaining a degree of similarity between elements
KR20230030907A (ko) 가짜 영상 탐지 방법 및 이를 수행하기 위한 장치
US9684844B1 (en) Method and apparatus for normalizing character included in an image
KR101176996B1 (ko) 문자열의 라인 생성 방법 및 장치
KR101498546B1 (ko) 문서 디지털 복원 시스템 및 방법
KR101048399B1 (ko) 문자 검출 방법 및 장치
CN107330470B (zh) 识别图片的方法和装置
CN111626244A (zh) 图像识别方法、装置、电子设备和介质
US10223618B1 (en) Method and apparatus for transformation of dot text in an image into stroked characters based on dot pitches
CN111783780A (zh) 图像处理方法、装置及计算机可读存储介质
KR102646428B1 (ko) 인공지능 학습 모델을 이용한 유사 글자 추출 방법 및 장치
JP2012113433A (ja) 文字認識装置、文字認識方法及びプログラム

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20150729

Year of fee payment: 4

FPAY Annual fee payment

Payment date: 20160722

Year of fee payment: 5

LAPS Lapse due to unpaid annual fee