KR101345925B1 - 이미지 블록에서 문자의 방향을 식별하는 방법 및 장치 - Google Patents

이미지 블록에서 문자의 방향을 식별하는 방법 및 장치 Download PDF

Info

Publication number
KR101345925B1
KR101345925B1 KR1020120073938A KR20120073938A KR101345925B1 KR 101345925 B1 KR101345925 B1 KR 101345925B1 KR 1020120073938 A KR1020120073938 A KR 1020120073938A KR 20120073938 A KR20120073938 A KR 20120073938A KR 101345925 B1 KR101345925 B1 KR 101345925B1
Authority
KR
South Korea
Prior art keywords
character
sub
image blocks
image block
directions
Prior art date
Application number
KR1020120073938A
Other languages
English (en)
Other versions
KR20130011921A (ko
Inventor
준 선
사또시 나오이
Original Assignee
후지쯔 가부시끼가이샤
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 후지쯔 가부시끼가이샤 filed Critical 후지쯔 가부시끼가이샤
Publication of KR20130011921A publication Critical patent/KR20130011921A/ko
Application granted granted Critical
Publication of KR101345925B1 publication Critical patent/KR101345925B1/ko

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/40Extraction of image or video features
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/14Image acquisition
    • G06V30/146Aligning or centring of the image pick-up or image-field
    • G06V30/1463Orientation detection or correction, e.g. rotation of multiples of 90 degrees
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/10Image acquisition
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/88Image or video recognition using optical means, e.g. reference filters, holographic masks, frequency domain filters or spatial domain filters
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/14Image acquisition
    • G06V30/148Segmentation of character regions
    • G06V30/153Segmentation of character regions using recognition of characters or words
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition

Abstract

본 발명은 이미지 블록에서의 문자의 방향을 식별하는 방법 및 장치를 개시하고 있다. 이 방법은 각각의 가정된 방향에서의 서브 이미지 블록, 인식된 문자, 및 정확성 척도를 획득하기 위해 다양한 방향을 가정된 문자 방향으로서 가정함으로써 이미지 블록에 대해 광학 문자 인식 처리를 수행하는 단계; 서브 이미지 블록에서 180° 상호 관계를 갖는 가정된 방향에서, 최소 정합 쌍을 검색하는 단계; 최소 정합 쌍에서의 각각의 가정된 방향에서 하나의 서브 이미지 블록이 있고 최소 정합 쌍에 속하는 인식된 문자가 동일한 회전 불변 문자이거나 동일한 회전 불변 문자 쌍에 속할 때, 정확성 척도를 동일한 것으로 조정하는 단계; 조정된 결과에 기초하여 각각의 가정된 방향에서의 누적 정확성 척도를 계산하는 단계; 및 상기 누적 정확성 척도에 따라 상기 이미지 블록에서의 문자의 방향을 식별하는 단계를 포함한다.

Description

이미지 블록에서 문자의 방향을 식별하는 방법 및 장치{METHOD OF AND DEVICE FOR IDENTIFYING DIRECTION OF CHARACTERS IN IMAGE BLOCK}
본 발명은 일반적으로 문서 이미지를 처리하는 것에 관한 것으로서, 상세하게는 이미지 블록에서의 문자의 방향을 식별하는 방법 및 장치에 관한 것이다.
사용자가 스캐너 등을 사용하여 많은 문서를 스캔할 때, 각각의 문서의 모든 페이지가 이상적인 입력을 위해 똑바로 놓여진다. 문서가 똑바로 놓여 있는 경우, 사용자는 문서를 쉽게 읽을 수 있고, 문서의 스캔된 이미지가 그의 방향을 조정함이 없이 사용자에 의해 읽혀질 수 있다. 그렇지만, 실제의 응용에서, 사용자에 의해 스캔될 문서가, 다른 대안으로서, 0°(똑바로) 및 180°(거꾸로)는 물론, 90° 및 270°(가로로)의 각도로 놓이는 경향이 있다. 사용자가 문서를 스캐닝하기에 앞서 페이지마다 문서의 배치 방향을 검사하고 조정하는 것은 번거롭고 시간이 많이 걸릴 것이다. 따라서, 문서 이미지의 방향을 자동으로 판단하는 기능을 갖는 스캐너가 설계되어 있다. 문서 이미지의 방향을 자동으로 판단하는 기능에 의해, 스캔된 문서 이미지가 똑바로 놓이도록 조정될 수 있고, 그로써 사용자의 부담을 덜어주고 사용자의 사용 효율을 향상시킨다.
문서 이미지의 방향을 자동으로 판단하는 종래의 방법에서, 문서 이미지 내의 텍스트 라인이 위치 확인되고, 4개의 가능한 방향에서의 인식된 문자 및 그의 대응하는 신뢰도 또는 인식 거리를 획득하기 위해 광학 문자 인식 처리가 4개의 가능한 방향에서 각각 수행되고, 텍스트 라인의 평균 신뢰도 또는 평균 인식 거리가 계산된다. 가장 큰 평균 신뢰도 또는 가장 작은 평균 인식 거리를 갖는 방향이 텍스트 라인의 방향으로서 판단되고, 문서 이미지의 방향이 또한 텍스트 라인의 방향으로부터 판단된다. 텍스트 라인의 방향은 텍스트 라인의 똑바른 방향(upside-up direction)을 말하고, 문서 이미지의 방향은 문서 이미지의 똑바른 방향을 말한다. 이후부터, 문자 방향(또는 문자의 방향)은 문자의 똑바른 방향을 말한다.
이하는 본 발명의 몇몇 측면에 대한 기본적인 이해를 용이하게 해주기 위한 본 발명의 요약이다. 그렇지만, 이 요약이 본 발명의 전반적인 개요가 아니고 본 발명의 어떤 필수적인 또는 중요한 요소를 확인하거나 본 발명의 범위를 정하기 위한 것이 아님을 잘 알 것이다. 오히려, 이 요약의 주된 목적은 나중에 제공되는 보다 상세한 설명에 앞서 본 명세서의 몇몇 개념을 간략화된 형태로 제공하는 데 있다.
도 1에 예시된 바와 같이, 텍스트 라인 “TIP AMOUNT”의 이미지 블록이 가정된 0° 방향으로 입력되고, 180° 방향에서의 텍스트 라인의 이미지 블록을 획득하기 위해 180°만큼 회전된다. 90° 및 270°의 방향에서의 프로세스가 0° 및 180°의 방향에서의 프로세스와 유사하기 때문에, 0° 및 180°의 방향에서의 프로세스에 대해서만 일례로서 여기에서 기술할 것이다. 도 1에 예시된 바와 같이, 0° 및 180°의 방향에서 텍스트 라인의 이미지 블록에 대해 광학 문자 인식 처리가, 각각, 수행되어, 서브 이미지 블록, 서브 이미지 블록에 대응하는 인식된 문자, 및 2개의 방향에서의 그의 신뢰도를 획득하게 된다.
종래의 방법에서, 0° 방향에서의 인식된 문자의 평균 신뢰도는 (0.59+0.36+0.53+0.61+0.61+0.61+0.53+0.72)/8=0.57이고, 180° 방향에서의 인식된 문자의 평균 신뢰도는 (0.62+0.58+0.65+0.67+0.60+0.46+0.50+0.58)/8=0.5825이다. 0.57이 0.5825보다 작기 때문에, 종래의 방법에서는 180° 방향(즉, 보다 높은 평균 신뢰도를 갖는 방향)이 텍스트 라인의 이미지 블록에서의 문자의 방향으로서 잘못 판단될 수 있다.
상기 오류가 일어나는 이유들 중 하나는 180° 이미지가 0° 이미지를 회전시킴으로써 획득되고, 인식된 문자 중에 다수의 회전 불변 문자 또는 회전 불변 문자 쌍(예컨대, N, O, p-d, U-n 등)이 있기 때문이다. 동일한 이미지가 2개의 정반대 방향에서 동일한 회전 불변 문자로서 또는 동일한 회전 불변 문자 쌍에 속하는 것으로 인식되는 경우, 대응하는 인식 신뢰도가 일관성이 있을 것인데, 그 이유는 2개의 정반대 방향에서의 식별 결과 둘 다가 동일한 형상의 정확한 인식 결과에 관련되어 있기 때문이다. 회전 불변의 특성이 평균 인식 신뢰도로부터 텍스트 라인의 방향을 판단하는 종래의 방법에서는 무시되었으며, 따라서 그의 성능이 어느 정도 열화된다.
회전 불변 문자는 180°의 회전 대칭을 갖는 문자를 포함한다 - 즉, 회전 불변 문자는 180° 회전된 후에 그 자신이 된다(예컨대, ”I”, “O”, “Z”, “N”, “$”, “%” 등) -.
회전 불변 문자 쌍은 2개의 문자를 포함하고, 그 중 어느 한쪽 문자가 180° 회전된 후에 다른쪽 문자와 일치하거나 모양이 다른쪽 문자와 높은 유사성을 가진다(예컨대, “W-M”, “U-n”, “P-d”등).
본 발명의 목적은 이미지 블록에서의 문자의 방향을 정확하게 식별하는 방법 및 장치를 제안함으로써 상기 문제점을 해결하는 데 있다. 이 해결책은 회전 불변 특성을 고려하고, 이로써 인식된 문자에 대응하는 정확성 척도(신뢰도 또는 인식 거리)를 조정함으로써 문서 이미지의 방향을 자동으로 판단하는 정확도를 향상시킬 수 있다.
상기 목적을 달성하기 위해, 본 발명의 측면에 따르면, 이미지 블록에서의 문자의 방향을 식별하는 방법이 제공되며, 이 방법은 각각의 가정된 문자 방향에서의 서브 이미지 블록, 서브 이미지 블록에 대응하는 인식된 문자, 및 그의 정확성 척도를 획득하기 위해 다양한 방향을 가정된 문자 방향으로서, 각각, 가정함으로써 이미지 블록에 대해 광학 문자 인식 처리를 수행하는 단계; 서브 이미지 블록에서 서로 간에 180° 상호 관계를 갖는 가정된 문자 방향에서, 서브 이미지 블록의 최소 정합 쌍(minimum matching pair)을 검색하는 단계 - 최소 정합 쌍은 서로 간에 180° 상호 관계를 갖는 가정된 문자 방향에서의 2개의 서브 이미지 블록 세트(대응하는 위치, 동일한 크기 및 최소 수의 서브 이미지 블록을 가짐)임 -; 최소 정합 쌍에서의 2개의 가정된 문자 방향 각각에서 하나의 서브 이미지 블록이 있고 최소 정합 쌍에 속하는 2개의 서브 이미지 블록에 대응하는 인식된 문자가 동일한 회전 불변 문자이거나 동일한 회전 불변 문자 쌍에 속할 때, 2개의 서브 이미지 블록에 대응하는 정확성 척도를 동일한 수치로 조정하는 단계; 조정된 서브 이미지 블록에 기초하여 각각의 가정된 문자 방향에서의 누적 정확성 척도를 계산하는 단계; 및 누적 정확성 척도에 따라 이미지 블록에서의 문자의 방향을 식별하는 단계를 포함한다.
본 발명의 일 실시예에 따르면, 회전 불변 문자는 180°의 회전 대칭을 갖는 문자를 포함하고 - 즉, 회전 불변 문자는 180° 회전된 후에 그 자신이 됨 -, 회전 불변 문자 쌍은 2개의 문자를 포함하고, 그 중 어느 한쪽 문자가 180° 회전된 후에 다른쪽 문자와 일치하거나 모양이 다른쪽 문자와 높은 유사성을 가진다.
본 발명의 일 실시예에 따르면, 2개의 서브 이미지 블록에 대응하는 정확성 척도를 동일한 수치로 조정하는 단계는 2개의 서브 이미지 블록에 대응하는 정확성 척도를 2개의 서브 이미지 블록에 대응하는 정확성 척도의 평균값으로 조정하는 단계를 포함한다.
본 발명의 일 실시예에 따르면, 2개의 서브 이미지 블록에 대응하는 정확성 척도를 동일한 수치로 조정하는 단계는 2개의 서브 이미지 블록에 대응하는 정확성 척도를 2개의 서브 이미지 블록에 대응하는 정확성 척도 중 하나로 조정하는 단계를 포함한다.
본 발명의 일 실시예에 따르면, 정확성 척도가 신뢰도 및 인식 거리를 포함하고, 다양한 방향이 이미지 블록의 2개의 가로 방향 및 2개의 세로 방향을 포함한다.
본 발명의 일 실시예에 따르면, 조정된 서브 이미지 블록에 기초하여 각각의 가정된 문자 방향에서의 누적 정확성 척도를 계산하는 단계가 각각의 가정된 문자 방향에서의 조정된 서브 이미지 블록의 정확성 척도의 합을 각자의 가정된 문자 방향에서의 최소 정합 쌍의 수로 나눈 결과를 각자의 가정된 문자 방향에서의 누적 정확성 척도로서 취하는 단계를 포함한다.
본 발명의 다른 측면에 따르면, 이미지 블록에서의 문자의 방향을 식별하는 장치가 제공되고, 이 장치는 각각의 가정된 문자 방향에서의 서브 이미지 블록, 서브 이미지 블록에 대응하는 인식된 문자, 및 그의 정확성 척도를 획득하기 위해 다양한 방향을 가정된 문자 방향으로서, 각각, 가정함으로써 이미지 블록에 대해 광학 문자 인식 처리를 수행하도록 구성된 광학 문자 인식 처리 유닛; 서브 이미지 블록에서 서로 간에 180° 상호 관계를 갖는 가정된 문자 방향에서, 서브 이미지 블록의 최소 정합 쌍을 검색하도록 구성된 최소 정합 쌍 검색 유닛 - 최소 정합 쌍은 서로 간에 180° 상호 관계를 갖는 가정된 문자 방향에서의 2개의 서브 이미지 블록 세트(대응하는 위치, 동일한 크기 및 최소 수의 서브 이미지 블록을 가짐)임 -; 최소 정합 쌍에서의 2개의 가정된 문자 방향 각각에서 하나의 서브 이미지 블록이 있고 최소 정합 쌍에 속하는 2개의 서브 이미지 블록에 대응하는 인식된 문자가 동일한 회전 불변 문자이거나 동일한 회전 불변 문자 쌍에 속할 때, 2개의 서브 이미지 블록에 대응하는 정확성 척도를 동일한 수치로 조정하도록 구성되어 있는 서브 이미지 블록 조정 유닛; 조정된 서브 이미지 블록에 기초하여 각각의 가정된 문자 방향에서의 누적 정확성 척도를 계산하도록 구성된 누적 정확성 척도 계산 유닛; 및 누적 정확성 척도에 따라 이미지 블록에서의 문자의 방향을 식별하도록 구성된 문자 방향 식별 유닛을 포함한다.
본 발명의 일 실시예에 따르면, 서브 이미지 블록 조정 유닛은, 최소 정합 쌍에서의 2개의 가정된 문자 방향 각각에서 하나의 서브 이미지 블록이 있고 최소 정합 쌍에 속하는 2개의 서브 이미지 블록에 대응하는 인식된 문자가 동일한 회전 불변 문자이거나 동일한 회전 불변 문자 쌍에 속할 때, 2개의 서브 이미지 블록에 대응하는 정확성 척도를 2개의 서브 이미지 블록에 대응하는 정확성 척도의 평균값으로 조정하도록 구성되어 있다.
본 발명의 일 실시예에 따르면, 서브 이미지 블록 조정 유닛은, 최소 정합 쌍에서의 2개의 가정된 문자 방향 각각에서 하나의 서브 이미지 블록이 있고 최소 정합 쌍에 속하는 2개의 서브 이미지 블록에 대응하는 인식된 문자가 동일한 회전 불변 문자이거나 동일한 회전 불변 문자 쌍에 속할 때, 2개의 서브 이미지 블록에 대응하는 정확성 척도를 2개의 서브 이미지 블록에 대응하는 정확성 척도 중 하나로 조정하도록 구성되어 있다.
본 발명의 일 실시예에 따르면, 누적 정확성 척도 계산 유닛은 각각의 가정된 문자 방향에서의 조정된 서브 이미지 블록의 정확성 척도의 합을 각자의 가정된 문자 방향에서의 최소 정합 쌍의 수로 나눈 결과를 각자의 가정된 문자 방향에서의 누적 정확성 척도로서 취하도록 구성되어 있다. 본 발명의 다른 측면에 따르면, 이미지 블록에서의 문자의 방향을 식별하는 상기한 장치를 포함하는 스캐너가 제공된다.
게다가, 본 발명의 다른 측면에 따르면, 정보 처리 장치 상에서 실행될 때, 정보 처리 장치로 하여금 본 발명에 따른 상기 방법을 수행하게 하는 기계 판독가능 프로그램 코드를 포함하는 저장 매체가 제공된다.
게다가, 본 발명의 또 다른 측면에 따르면, 정보 처리 장치 상에서 실행될 때, 정보 처리 장치로 하여금 본 발명에 따른 상기 방법을 수행하게 하는 기계 실행가능 명령어를 포함하는 프로그램 제품이 제공된다.
본 발명의 상기 및 기타 목적, 특징 및 이점이 첨부 도면과 관련하여 이하에 제공되는 본 발명의 실시예의 상세한 설명으로부터 보다 명백하게 될 것이며, 첨부 도면에서 그 구성요소들은 단지 본 발명의 원리를 설명하기 위한 것에 불과하며 그 전체에 걸쳐 동일하거나 유사한 기술적 특징 또는 구성요소가 동일하거나 유사한 참조 번호로 표시되어 있다.
도 1은 텍스트 라인의 이미지 블록의 광학 문자 인식 처리로부터 얻어지는 0° 및 180°의 방향에서의 서브 이미지 블록, 인식된 문자 및 신뢰도를 나타낸 도면;
도 2는 텍스트 라인의 이미지 블록의 광학 문자 인식 처리로부터 얻어지는 0° 및 180°의 방향에서의 서브 이미지 블록, 인식된 문자 및 인식 거리를 나타낸 도면;
도 3은 본 발명의 제1 실시예에 따른, 이미지 블록에서의 문자의 방향을 식별하는 방법의 플로우차트;
도 4는 본 발명의 제2 실시예에 따른, 이미지 블록에서의 문자의 방향을 식별하는 방법의 플로우차트;
도 5는 본 발명의 일 실시예에 따른, 이미지 블록에서의 문자의 방향을 식별하는 식별 장치의 구조 블록도;
도 6은 본 발명의 실시예에 따른 방법 및 장치를 구현하는 데 사용될 수 있는 컴퓨터의 개략 블록도.
본 발명의 예시적인 실시예에 대해 첨부 도면과 관련하여 이하에서 상세히 기술할 것이다. 명확함 및 간결함을 위해, 실제 구현의 특징들 모두가 명세서에 기술되지는 않을 것이다. 그렇지만, 임의의 이러한 실제 구현을 개발하는 동안, 개발자의 특정의 목표를 달성하기 위해, 예를 들어, 구현마다 다를 수 있는 그 시스템-관련 및 사업-관련 제약 조건에 부합하기 위해 수많은 구현-관련 결정이 행해질 것임을 잘 알 것이다. 게다가, 이러한 개발 작업이 복잡하고 시간이 많이 걸릴 수 있지만, 본 개시 내용으로부터 혜택을 보는 당업자에게는 일상적인 작업일 수 있는 것도 잘 알 것이다.
또한, 주목할 점은, 본 발명의 해결책과 밀접한 관련이 있는 그 장치 구조 및/또는 프로세스 단계만이 도면에 예시되어 있는 반면, 본 발명에 덜 관련되어 있는 다른 상세가 그 불필요한 상세로 인해 본 발명을 모호하게 하지 않도록 생략되어 있다는 것이다. 게다가, 또한 주목할 점은, 본 발명의 도면 또는 구현 중 하나에 기술된 요소 및 특징이 하나 이상의 다른 도면 또는 구현에 예시된 요소 및 특징과 결합될 수 있다.
본 발명의 실시예에 따른 이미지 블록에서의 문자의 방향을 식별하는 방법의 흐름에 대해 도 3 내지 도 4를 참조하여 이하에서 기술할 것이다.
이와 관련하여 가정된 바와 같이, 텍스트 라인이 문서 이미지에서 위치 확인되었고, 텍스트 라인을 포함하는 이미지 블록이 문서 이미지로부터 크로핑되었다. 본 발명은, 문서 이미지에서의 텍스트 라인을 어떻게 위치 확인하는지가 아니라, 텍스트 라인을 포함하는 이미지 블록에서의 문자의 방향을 어떻게 정확하게 식별하는지에 중점을 두고 있다.
일반적으로 4개의 주 방향을 가정된 문자 방향 - 즉, 이미지 블록 자체의 방향(0° 방향), 180° 회전된 이미지 블록의 방향, 90° 회전된 이미지 블록의 방향 및 270° 회전된 이미지 블록의 방향(이미지 블록의 2개의 가로 방향 및 2개의 세로 방향이라고도 함) - 으로서 간주하는 것이 통상적이다. 90° 및 270°의 방향은 일반적으로, 예컨대, 중국어, 일본어 등의 어쩌면 수직으로 쓰여진 문자에 적용된다. 0° 및 180°의 방향에서의 시나리오가 90° 및 270°의 방향에서의 시나리오와 유사하기 때문에, 0° 및 180°의 방향에서의 시나리오에 대해서만 일례로서 이하에서 기술할 것이다.
본 발명의 제1 실시예에 따른 이미지 블록에서의 문자의 방향을 식별하는 방법의 흐름에 대해 도 3을 참조하여 이하에서 기술할 것이다.
먼저, 0° 및 180°의 방향에서의 서브 이미지 블록, 서브 이미지 블록에 대응하는 인식된 문자, 및 그의 신뢰도를 획득하기 위해 0° 및 180°를 가정된 문자 방향으로서 가정함으로써 이미지 블록에 대해 광학 문자 인식 처리가 수행된다(S301). 도 1은 0° 및 180°의 방향에서 번호가 부여되어 있는 서브 이미지 블록, 인식된 문자 및 신뢰도의 일례를 나타낸 것이다. 광학 문자 인식의 인식 결과는 일반적으로 광학 문자 인식을 거친 이미지 블록으로부터 분리된 서브 이미지 블록, 서브 이미지 블록에 대응하는 인식된 문자, 및 인식된 문자의 정확성 척도를 포함한다. 정확성 척도는 인식된 문자의 신뢰성을 반영하고, 통상적으로 신뢰도 또는 인식 거리이다. 신뢰도가 높을수록, 인식된 문자가 정확할 가능성이 더 높고, 인식 거리가 짧을수록, 인식된 문자가 정확할 가능성이 더 높다. 신뢰도를 포함하는 인식 결과를 일례로서 취한 제1 실시예에서의 설명이 제공될 것이다. 인식 결과가 인식 거리를 포함하는 상황에 대한 제2 실시예에서의 설명이 제공될 것이다.
그 다음에, 서브 이미지 블록의 최소 정합 쌍이 있는지 0° 및 180°의 방향에서의 서브 이미지 블록이 검색된다(S302). 최소 정합 쌍은 서로 간에 180° 상호 관계를 갖는 가정된 문자 방향에서의 2개의 서브 이미지 블록 세트 - 대응하는 위치, 동일한 크기 및 최소 수의 서브 이미지 블록을 가짐- 를 말한다. 최소 정합 쌍은 2개의 서브 이미지 블록 세트에 포함된 서브 이미지 블록이 서로 간에 180° 상호 관계를 갖는 2개의 가정된 문자 방향에서 각각 위치 확인되고 2개의 서브 이미지 블록 세트가 대응하는 위치 및 동일한 크기를 갖도록 되어 있는 2개의 서브 이미지 블록 세트를 포함한다 - 즉, 서브 이미지 블록이 위치 확인된 텍스트 라인을 따라 180° 회전된 후의 2개의 서브 이미지 블록 세트 중 임의의 한쪽 세트가 동일한 최소 정합 쌍에 속하는 다른쪽 서브 이미지 블록 세트에 중첩할 것이다 -. 2개의 서브 이미지 블록 세트가 최소 수의 서브 이미지 블록을 포함할 때, 2개의 서브 이미지 블록 세트는 최소 정합 쌍을 구성한다고 말해진다. 예를 들어, 도 1에서 P1 및 N8은 최소 정합 쌍을 구성한다. 이와 유사하게, P2 및 N7, P3 및 N6, P4 및 N5, P5 및 N4, P6 및 N3, P7 및 N2 그리고 P8 및 N1은, 각각, 최소 정합 쌍을 구성한다. 최소 정합 쌍이 있는지 검색하는 수많은 방법이 있다 - 예를 들어, 최소 정합 쌍의 정의에 따라 2개의 방향의 대응하는 측면으로부터 순차적으로 최소 정합 쌍이 있는지 검색하는 것이 가능하다 -. 구체적으로는, 도 1에 예시된 바와 같이, 제1 서브 이미지 블록(P1 및 N8)은, 각각, 0° 방향의 가장 좌측 측면 및 180° 방향의 가장 우측 측면에서, 각각, 위치 확인되고, 2개의 서브 이미지 블록이 동일한 크기를 갖는 것으로 판단되며, 따라서 P1 및 N8은 최소 정합 쌍인 것으로 판정된다. 이어서, 그 다음 서브 이미지 블록(P2 및 N7)이 2개의 방향에서 추가로 위치 확인되고, 2개의 서브 이미지 블록이 동일한 크기를 갖는 것으로 판단되며, 따라서 P2 및 N7이 최소 정합 쌍인 것으로 판정된다. 이 프로세스는 서로 간에 180° 상호 관계를 갖는 2개의 가정된 문자 방향에서 모든 최소 정합 쌍을 위치 확인할 때까지 반복된다.
이상에서 기술한 바와 같이, 오류가 일어나는 이유들 중 하나는, 문자의 회전 불변 특성을 고려함이 없이, 동일한 회전 불변 문자이거나 동일한 회전 불변 문자 쌍에 속하는 2개의 방향에서의 식별 결과에 대해 상이한 신뢰도가 결정되기 때문이다. S302에서 판정된 최소 정합 쌍이 텍스트 라인의 이미지 블록을 세분한 결과로서 간주될 수 있다.
따라서, 최소 정합 쌍에서의 2개의 가정된 문자 방향 각각에서 하나의 서브 이미지 블록이 있고 최소 정합 쌍에 속하는 2개의 서브 이미지 블록에 대응하는 인식된 문자가 동일한 회전 불변 문자이거나 동일한 회전 불변 문자 쌍에 속하는지가 판정된다(S303). 기지의 회전 불변 문자 및 회전 불변 문자 쌍이 기록되어 있는 회전 불변 특성을 갖는 문자의 사전이 미리 잘 정의되어 있을 수 있다. S303에서의 판정이 어휘 목록을 이용하여 행해질 수 있다. S303에서의 판정의 결과가 "아니오"인 경우, 흐름은, 어떤 조정도 수행함이 없이, S305에서의 차후의 처리로 바로 간다. S303에서의 판정의 결과가 "예"인 경우, 흐름은 최소 정합 쌍에서의 서브 이미지 블록에 대응하는 신뢰도를 조정하는 S304로 간다.
최소 정합 쌍에서의 서브 이미지 블록에 대응하는 신뢰도가 주로 회전 불변 문자 및 회전 불변 문자 쌍의 회전 불변의 특성을 고려하여 조정된다. 상세하게는, S304에서 최소 정합 쌍에서의 2개의 서브 이미지 블록에 대응하는 신뢰도가 동일한 수치로 조정된다. 동일한 수치로서 선택될 수 있는 다양한 값이 있다. 몇가지 예시적인 방식이 여기에서 제공될 것이다.
제1 방식에서, 최소 정합 쌍에서의 2개의 서브 이미지 블록에 대응하는 신뢰도가 2개의 서브 이미지 블록에 대응하는 신뢰도의 평균값으로 조정된다.
도 1에 예시된 바와 같이, 회전 불변 문자 또는 회전 불변 문자 쌍은 P1-N8, P2-N7, P5-N4 및 P7-N2를 포함한다. 따라서, P1 및 N8의 신뢰도가 (0.59+0.58)/2=0.585로 조정될 수 있고, P2 및 N7의 신뢰도가 (0.36+0.50)/2=0.43로 조정될 수 있으며, P5 및 N4의 신뢰도가 (0.61+0.67)/2=0.64로 조정될 수 있고, P7 및 N2의 신뢰도가 (0.53+0.58)/2=0.555로 조정될 수 있다.
제2 방식에서, 최소 정합 쌍에서의 2개의 서브 이미지 블록에 대응하는 신뢰도가 2개의 서브 이미지 블록에 대응하는 신뢰도 중 하나로 조정된다.
예를 들어, P1 및 N8의 신뢰도가 0.59로 조정될 수 있고, P2 및 N7의 신뢰도가 0.36으로 조정될 수 있으며, P5 및 N4의 신뢰도가 0.61로 조정될 수 있고, P7 및 N2의 신뢰도가 0.53으로 조정될 수 있다.
S304에서, 2개의 가정된 문자 방향 각각에서 하나의 서브 이미지 블록이 있고 2개의 서브 이미지 블록에 대응하는 인식된 문자가 동일한 회전 불변 문자이거나 동일한 회전 불변 문자 쌍에 속하는 최소 정합 쌍에서의 2개의 서브 이미지 블록에 대응하는 신뢰도가 조정됨으로써, 조정된 신뢰도를 획득하고, 흐름은 조정된 신뢰도에 기초하여 각각의 가정된 문자 방향에서의 누적 신뢰도를 계산하고 누적 신뢰도에 따라 텍스트 라인의 이미지 블록에서의 문자의 방향을 식별하는 S305로 간다.
누적 신뢰도는 전체로서 어떤 방향에서의 텍스트 라인의 이미지 블록의 식별 결과를 특징지우는 정확성 척도이다. 누적 신뢰도는 일반적으로 2개의 특정의 방식에서 계산된다. 가정된 문자 방향에서의 모든 서브 이미지 블록에 대응하는 신뢰도의 합이 그 방향에서의 누적 신뢰도로서 취해질 수 있다. 다른 대안으로서, 가정된 문자 방향에서의 모든 서브 이미지 블록에 대응하는 신뢰도의 산술 평균값이 그 방향에서의 누적 신뢰도로서 취해질 수 있다. 보다 높은 누적 신뢰도를 갖는 방향이 정확한 식별 결과일 가능성이 더 많다.
S304에서, 전체로서 최소 정합 쌍의 조정된 신뢰도가 제1 및 제2 방식 둘 다에서 보다 적당하도록 최소 정합 쌍에서의 신뢰도를 조정함으로써 회전 불변의 특성을 갖는 인식된 문자에 대해 보다 적당한 신뢰도가 제공될 수 있다. S305에서 다양한 방법으로 누적 신뢰도가 계산될 수 있다. 일례로서, 누적 신뢰도가 가정된 문자 방향에서의 모든 신뢰도의 합으로서 또는 가정된 문자 방향에서의 모든 신뢰도의 평균으로서 계산될 수 있다. 신뢰도의 평균을 계산하기 위해, 가정된 문자 방향에서의 최소 정합 쌍의 수를 분모로 취하고 가정된 문자 방향에서의 모든 신뢰도의 합을 분자로서 취하는 것이 바람직하고, 이는 물리적으로 최소 정합 쌍에서의 서브 이미지 블록 세트가 텍스트 라인의 이미지 블록을 분할한 결과에서의 기본 단위로서 취해지고 최소 정합 쌍에서의 전체로서 2개의 서브 이미지 블록 세트의 겉보기 신뢰도가 조정된다는 것을 의미한다. 분명하게도, 신뢰도의 평균을 계산하기 위해 여기서 최소 정합 쌍의 수를 분모로서 취하는 것이 바람직하다. 물론, 또한 신뢰도의 평균을 계산하기 위해 가정된 문자 방향에서의 모든 신뢰도의 합을 분자로서 취하고 가정된 문자 방향에서의 서브 이미지 블록의 수를 분모로서 취하는 것도 가능하다. 이 경우에, 각자의 가정된 문자 방향에서 상이한 수의 서브 이미지 블록이 있는 경우, 각자의 가정된 문자 방향에서의 신뢰도의 평균을 계산하기 위해 동일한 가정된 문자 방향에서의 서브 이미지 블록의 수를 동일한 분모로서 취하는 것이 바람직하다.
분명하게도, 각자의 가정된 문자 방향 중에서 가장 높은 누적 신뢰도를 갖는 것이 정확한 식별 결과의 방향으로서 판단될 것이다.
가정된 문자 방향에서의 모든 신뢰도의 평균이 누적 신뢰도로서 취해지는 경우, S304에서 제1 및 제2 방식에서 계산된 누적 신뢰도는 각각 다음과 같다:
제1 방식에서:
0° 방향에서의 누적 신뢰도는 (0.585+0.43+0.53+0.61+0.64+0.61+0.555+0.72)/8=0.585이다.
180° 방향에서의 누적 신뢰도는 (0.62+0.555+0.65+0.64+0.60+0.46+0.43+0.585)/8=0.5675이다.
제2 방식에서:
0° 방향에서의 누적 신뢰도는 (0.59+0.36+0.53+0.61+0.61+0.61+0.53+0.72)/8=0.57이다.
180° 방향에서의 누적 신뢰도는 (0.62+0.53+0.65+0.61+0.60+0.46+0.36+0.59)/8=0.5525이다.
분명하게도, 2가지 방식 둘 다에서 신뢰도가 조정된 후에 0° 방향에서의 누적 신뢰도가 180° 방향에서의 누적 신뢰도보다 높고, 따라서 보다 정확한 판정 결과를 제공한다.
본 발명의 제2 실시예에 따른 이미지 블록에서의 문자의 방향을 식별하는 방법의 흐름에 대해 도 4를 참조하여 이하에서 기술할 것이다.
이상에서 기술한 바와 같이, 광학 문자 인식의 인식 결과는 일반적으로 분할된 서브 이미지 블록, 서브 이미지 블록에 대응하는 인식된 문자, 및 인식된 문자의 정확성 척도를 포함한다. 정확성 척도는 인식된 문자의 신뢰성을 반영하고, 통상적으로 신뢰도 또는 인식 거리이다. 신뢰도를 포함하는 식별 결과를 일례로서 취한 제1 실시예에서의 설명이 이상에 제공되었다. 식별 결과가 인식 거리를 포함하는 것에 대한 제2 실시예에서의 설명이 제공될 것이다. 도 2는 0° 및 180°의 방향에서 번호가 부여되어 있는 서브 이미지 블록, 인식된 문자 및 인식 의 일례를 나타낸 것이다.
도 2에서, 종래의 방법에서, 0° 방향에서의 인식된 문자의 평균 인식 거리는 (828+1279+934+774+778+789+940+595)/8=864.625이고, 180° 방향에서의 인식된 문자의 평균 인식 거리는 (759+840+704+669+802+1087+1005+790)/8=832이다. 832이 864.625보다 짧기 때문에, 종래의 방법에서는 180° 방향(즉, 보다 짧은 평균 인식 거리를 갖는 방향)이 텍스트 라인의 이미지 블록에서의 문자의 방향으로서 잘못 판단될 수 있다. 이 오류의 이유들 중 하나는, 문자의 회전 불변 특성을 고려함이 없이, 동일한 회전 불변 문자이거나 동일한 회전 불변 문자 쌍에 속하는 2개의 방향에서의 식별 결과에 대해 상이한 인식 거리가 결정되기 때문이다.
문제점이 발생하는 이유는 문자의 회전 불변의 특성을 무시한 것으로 인한 것이고, 본 발명의 방법은 회전 불변 문자 또는 회전 불변 문자 쌍의 정확성 척도를 동일한 값으로 조정하는 것이고, 따라서, 제1 실시예에서 전술한 고안이 식별 결과가 신뢰도 대신에 인식 거리를 포함하는 시나리오에 똑같이 적용가능할 것이다.
본 발명의 제1 실시예에 따른 방법과 유사한 본 발명의 제2 실시예에 따른 이미지 블록에서의 문자의 방향을 식별하는 방법의 흐름에 대해 도 4를 참조하여 이하에서 기술할 것이다.
먼저, 0° 및 180°의 방향에서의 서브 이미지 블록, 서브 이미지 블록에 대응하는 인식된 문자, 및 그의 인식 거리를 획득하기 위해 0° 및 180°를 가정된 문자 방향으로서 가정함으로써 이미지 블록에 대해 광학 문자 인식 처리가 수행된다(S401).
그 다음에, 서브 이미지 블록의 최소 정합 쌍이 있는지 0° 및 180°의 방향에서의 서브 이미지 블록이 검색된다(S402). 예를 들어, 도 1에서 P1 및 N8은 최소 정합 쌍을 구성한다. 이와 유사하게, P2 및 N7, P3 및 N6, P4 및 N5, P5 및 N4, P6 및 N3, P7 및 N2 그리고 P8 및 N1은, 각각, 최소 정합 쌍을 구성한다.
S403에서, 최소 정합 쌍에서의 2개의 가정된 문자 방향 각각에서 하나의 서브 이미지 블록이 있고 최소 정합 쌍에 속하는 2개의 서브 이미지 블록에 대응하는 인식된 문자가 동일한 회전 불변 문자이거나 동일한 회전 불변 문자 쌍에 속하는지가 판정된다. 기지의 회전 불변 문자 및 회전 불변 문자 쌍이 기록되어 있는 회전 불변 특성을 갖는 문자의 사전이 미리 잘 정의되어 있을 수 있다. S403에서의 판정이 사전을 이용하여 행해질 수 있다. 판정의 결과가 "아니오"인 경우, 흐름은, 어떤 조정도 수행함이 없이, S405에서의 차후의 처리로 바로 간다. 판정의 결과가 "예"인 경우, 흐름은 최소 정합 쌍에서의 서브 이미지 블록에 대응하는 인식 거리를 조정하는 S404로 간다.
최소 정합 쌍에서의 서브 이미지 블록에 대응하는 인식 거리가 주로 회전 불변 문자 및 회전 불변 문자 쌍의 회전 불변의 특성을 고려하여 조정된다. 상세하게는, 최소 정합 쌍에서의 2개의 서브 이미지 블록에 대응하는 인식 거리가 동일한 수치로 조정된다. 동일한 수치로서 선택될 수 있는 다양한 값이 있다. 몇가지 예시적인 방식이 여기에서 제공될 것이다.
제1 방식에서, 최소 정합 쌍에서의 2개의 서브 이미지 블록에 대응하는 인식 거리가 2개의 서브 이미지 블록에 대응하는 인식 거리의 평균값으로 조정된다.
도 1에 예시된 바와 같이, 회전 불변 문자 또는 회전 불변 문자 쌍은 P1-N8, P2-N7, P5-N4 및 P7-N2를 포함한다. 따라서, P1 및 N8의 인식 거리가 (828+790)/2=809로 조정될 수 있고, P2 및 N7의 인식 거리가 (1279+1005)/2=1142로 조정될 수 있으며, P5 및 N4의 인식 거리가 (778+669)/2=723.5로 조정될 수 있고, P7 및 N2의 인식 거리가 (940+840)/2=890로 조정될 수 있다.
제2 방식에서, 최소 정합 쌍에서의 2개의 서브 이미지 블록에 대응하는 인식 거리가 2개의 서브 이미지 블록에 대응하는 인식 거리 중 하나로 조정된다.
예를 들어, P1 및 N8의 인식 거리가 828로 조정될 수 있고, P2 및 N7의 인식 거리가 1279으로 조정될 수 있으며, P5 및 N4의 인식 거리가 778로 조정될 수 있고, P7 및 N2의 인식 거리가 940으로 조정될 수 있다.
S404에서, 2개의 가정된 문자 방향 각각에서 하나의 서브 이미지 블록이 있고 2개의 서브 이미지 블록에 대응하는 인식된 문자가 동일한 회전 불변 문자이거나 동일한 회전 불변 문자 쌍에 속하는 최소 정합 쌍에서의 2개의 서브 이미지 블록에 대응하는 인식 거리가 조정됨으로써, 조정된 인식 거리를 획득하고, 흐름은 조정된 인식 거리에 기초하여 각각의 가정된 문자 방향에서의 누적 인식 거리를 계산하고 누적 인식 거리에 따라 텍스트 라인의 이미지 블록에서의 문자의 방향을 식별하는 S405로 간다.
누적 인식 거리는 전체로서 어떤 방향에서의 텍스트 라인의 이미지 블록의 식별 결과를 특징지우는 정확성 척도이다. 누적 인식 거리는 일반적으로 2개의 특정의 방식에서 계산된다. 가정된 문자 방향에서의 모든 서브 이미지 블록에 대응하는 인식 거리의 합이 그 방향에서의 누적 인식 거리로서 취해질 수 있다. 다른 대안으로서, 가정된 문자 방향에서의 모든 서브 이미지 블록에 대응하는 인식 거리의 산술 평균값이 그 방향에서의 누적 인식 거리로서 취해질 수 있다. 보다 짧은 누적 인식 거리를 갖는 방향이 정확한 식별 결과일 가능성이 더 많다.
S404에서, 전체로서 최소 정합 쌍의 조정된 인식 거리가 제1 및 제2 방식 둘 다에서 보다 적당하도록 최소 정합 쌍에서의 인식 거리를 조정함으로써 회전 불변의 특성을 갖는 인식된 문자에 대해 보다 적당한 인식 거리가 제공될 수 있다. S405에서 다양한 방법으로 누적 인식 거리가 계산될 수 있다. 일례로서, 누적 인식 거리가 가정된 문자 방향에서의 모든 인식 거리의 합으로서 또는 가정된 문자 방향에서의 모든 인식 거리의 평균으로서 계산될 수 있다. 인식 거리의 평균을 계산하기 위해, 가정된 문자 방향에서의 최소 정합 쌍의 수를 분모로 취하고 가정된 문자 방향에서의 모든 인식 거리의 합을 분자로서 취하는 것이 바람직하고, 이는 물리적으로 최소 정합 쌍에서의 서브 이미지 블록 세트가 텍스트 라인의 이미지 블록을 분할한 결과에서의 기본 단위로서 취해지고 최소 정합 쌍에서의 전체로서 2개의 서브 이미지 블록 세트의 겉보기 인식 거리가 조정된다는 것을 의미한다. 분명하게도, 인식 거리의 평균을 계산하기 위해 여기서 최소 정합 쌍의 수를 분모로서 취하는 것이 바람직하다.
분명하게도, 각자의 가정된 문자 방향 중에서 가장 짧은 누적 인식 거리를 갖는 것이 정확한 식별 결과의 방향으로서 판단될 것이다.
가정된 문자 방향에서의 인식 거리의 평균이 누적 인식 거리로서 취해지는 경우, S404에서 제1 및 제2 방식에서 계산된 누적 인식 거리는 각각 다음과 같다:
제1 방식에서:
0° 방향에서의 누적 인식 거리는 (809+1142+934+774+723.5+789+890+595)/8=832.0625이다.
180° 방향에서의 누적 인식 거리는 (759+890+704+723.5+802+1087+1142+ 809)/8=864.5625이다.
제2 방식에서:
0° 방향에서의 누적 인식 거리는 (828+1279+934+774+778+789+940+595)/8=864.625이다.
180° 방향에서의 누적 인식 거리는 (759+940+704+778+802+1087+1279+ 828)/8=897.125이다.
분명하게도, 2가지 방식 둘 다에서 인식 거리가 조정된 후에 0° 방향에서의 누적 인식 거리가 180° 방향에서의 누적 인식 거리보다 짧고, 따라서 보다 정확한 판정 결과를 제공한다.
본 발명의 일 실시예에 따른 이미지 블록에서의 문자의 방향을 식별하는 식별 장치의 구조에 대해 도 5를 참조하여 이하에서 기술할 것이다. 도 5에 예시된 바와 같이, 실시예에 따른, 이미지 블록에서 문자의 방향을 식별하는 식별 장치(500)는 각각의 가정된 문자 방향에서의 서브 이미지 블록, 서브 이미지 블록에 대응하는 인식된 문자, 및 그의 정확성 척도를 획득하기 위해 다양한 방향을 가정된 문자 방향으로서, 각각, 가정함으로써 이미지 블록에 대해 광학 문자 인식 처리를 수행하도록 구성된 광학 문자 인식 처리 유닛(501); 서브 이미지 블록에서 서로 간에 180° 상호 관계를 갖는 가정된 문자 방향에서, 서브 이미지 블록의 최소 정합 쌍을 검색하도록 구성된 최소 정합 쌍 검색 유닛(502) - 최소 정합 쌍은 서로 간에 180° 상호 관계를 갖는 가정된 문자 방향에서의 2개의 서브 이미지 블록 세트(대응하는 위치, 동일한 크기 및 최소 수의 서브 이미지 블록을 가짐)임 -; 최소 정합 쌍에서의 2개의 가정된 문자 방향 각각에서 하나의 서브 이미지 블록이 있고 최소 정합 쌍에 속하는 2개의 서브 이미지 블록에 대응하는 인식된 문자가 동일한 회전 불변 문자이거나 동일한 회전 불변 문자 쌍에 속할 때, 2개의 서브 이미지 블록에 대응하는 정확성 척도를 동일한 수치로 조정하도록 구성되어 있는 서브 이미지 블록 조정 유닛(503); 조정된 서브 이미지 블록에 기초하여 각각의 가정된 문자 방향에서의 누적 정확성 척도를 계산하도록 구성된 누적 정확성 척도 계산 유닛(504); 및 누적 정확성 척도에 따라 이미지 블록에서의 문자의 방향을 식별하도록 구성된 문자 방향 식별 유닛(505)을 포함한다.
본 발명에 따른 식별 장치(500)에 포함되어 있는 광학 문자 인식 처리 유닛(501), 최소 정합 쌍 검색 유닛(502), 서브 이미지 블록 조정 유닛(503), 누적 정확성 척도 계산 유닛(504), 및 문자 방향 식별 유닛(505)에서의 처리가, 각각, 전술한 이미지 블록에서의 문자의 방향을 식별하는 방법의 S301 내지 S305 및 S401 내지 S405에서의 처리와 유사하기 때문에, 이들 유닛에 대한 상세한 설명이 간결함을 위해 여기에서 생략될 것이다.
게다가, 주목할 점은, 상기 장치에서의 각자의 구성 모듈 및 유닛이 소프트웨어, 펌웨어, 하드웨어 또는 이들의 조합으로서 구성될 수 있다는 것이다. 이용가능한 구체적인 구성 수단 또는 방식이 당업자에게 공지되어 있으며, 그에 대한 반복된 설명이 여기에서 생략될 것이다. 소프트웨어 또는 펌웨어로 구현되는 경우에, 소프트웨어를 구성하는 프로그램이 저장 매체 또는 네트워크로부터 전용 하드웨어 구조를 갖는 컴퓨터[예컨대, 도 6에 예시된 범용 컴퓨터(600) 등] - 다양한 프로그램이 설치되어 있을 때 다양한 기능을 수행할 수 있음 - 에 설치되어 있다.
도 6에서, CPU(Central Processing Unit)(601)는 ROM(Read Only Memory)(602)에 저장되어 있거나 저장 부분(608)으로부터 RAM(Random Access Memory)(603)에 로드되는 프로그램에 따라 다양한 프로세스를 수행하며, 여기에 CPU(601)가 다양한 프로세스를 수행할 때 필요한 데이터도 역시 필요에 따라 저장된다. CPU(601), ROM(602) 및 RAM(603)은 입/출력 인터페이스(605)도 역시 연결되어 있는 버스(604)를 통해 서로에 연결되어 있다.
하기의 구성요소가 입/출력 인터페이스(605)에 연결되어 있다: 입력 부분(606)(키보드, 마우스 등을 포함함), 출력 부분(607)[디스플레이, 예컨대, CRT(Cathode-Ray Tube) 및 LCD(Liquid Crystal Display) 등, 스피커 등을 포함함], 저장 부분(608)(하드 디스크 등을 포함함), 및 통신 부분(609)(네트워크 인터페이스 카드, 예컨대, LAN 카드, 모뎀 등을 포함함). 통신 부분(609)은 네트워크(예컨대, 인터넷)를 통해 통신 프로세스를 수행한다. 드라이브(610)도 역시 필요에 따라 입/출력 인터페이스(605)에 연결될 수 있다. 이동식 매체(611)(예컨대, 자기 디스크, 광 디스크, 광 자기 디스크, 반도체 메모리 등)는 필요에 따라 드라이브(610) 상에 설치될 수 있고, 따라서 그로부터 페치된 컴퓨터 프로그램이 필요에 따라 저장 부분(608)에 설치될 수 있다.
상기한 일련의 프로세스가 소프트웨어로 수행되는 경우, 소프트웨어를 구성하는 프로그램이 네트워크(예컨대, 인터넷 등) 또는 저장 매체[예컨대, 이동식 매체(611) 등]으로부터 설치된다.
당업자라면 이러한 저장 매체가 도 6에 예시된 이동식 매체(611) - 프로그램이 저장되고 사용자에게 프로그램을 제공하기 위해 장치로부터 개별적으로 배포됨 - 로 제한되지 않을 것임을 잘 알 것이다. 이동식 매체(611)의 일례는 자기 디스크(플로피 디스크(등록 상표)를 포함함), 광 디스크[CD-ROM(Compact Disk-Read Only memory) 및 DVD(Digital Versatile Disk)를 포함함], 광자기 디스크[MD(Mini Disk)(등록 상표)를 포함함] 및 반도체 메모리를 포함한다. 다른 대안으로서, 저장 매체는 ROM(602), 저장 부분(608)에 포함된 하드 디스크 등 - 프로그램이 저장되고 프로그램을 포함하는 장치와 함께 사용자에게 배포됨 - 일 수 있다.
본 발명은 또한 기계에 의해 판독되어 실행될 때 본 발명의 실시예에 따른 상기 방법을 수행할 수 있는 기계 판독가능 명령어 코드가 저장되어 있는 프로그램 제품을 제안한다.
그에 대응하여, 기계 판독가능 명령어 코드가 저장되어 있는 프로그램 제품이 구현되어 있는 저장 매체도 역시 본 발명의 개시 내용에 포함될 것이다. 저장 매체는 플로피 디스크, 광 디스크, 광 자기 디스크, 메모리 카드, 메모리 스틱 등을 포함하지만, 이들로 제한되지 않는다.
본 발명의 실시예에 개시되어 있는, 이미지 블록에서의 문자의 방향을 식별하는 식별 장치, 이미지 블록에서의 문자의 방향을 식별하는 식별 방법, 및 대응하는 프로그램 제품이 스캔된 문서에서의 문자의 방향을 식별하기 위해 스캐너 또는 기타 이미지 스캐닝 장치에 적용가능할 수 있다.
본 발명의 실시예의 상기 설명에서, 실시예와 관련하여 기술되고 및/또는 예시된 특징이, 다른 실시예(들)에서의 특징과 결합하여 또는 그 대신에, 하나 이상의 다른 실시예에서 동일하게 또는 유사하게 사용될 수 있다.
강조할 점은, "포함한다/구비한다"라는 용어 및 이와 관련하여 사용되는 그의 변형이 특징, 요소, 단계 또는 구성요소의 존재를 말하지만 하나 이상의 다른 특징, 요소, 단계 또는 구성요소의 존재 또는 추가를 배제하지 않는다는 것이다.
게다가, 본 발명에 따른 방법은 명세서에 기술된 시간 순서로 수행되는 것으로 제한되지 않고, 다른 대안으로서, 다른 시간 순서로, 동시에 또는 개별적으로 수행될 수 있다. 따라서, 방법이 명세서에 기술된 바와 같이 수행되는 순서가 발명의 기술적 범위를 제한하지 않을 것이다.
상기 실시예에 따르면, 본 발명은 하기의 첨부를 추가로 개시하고 있다.
첨부 1. 이미지 블록에서의 문자의 방향을 식별하는 방법으로서,
각각의 가정된 문자 방향에서의 서브 이미지 블록, 서브 이미지 블록에 대응하는 인식된 문자, 및 그의 정확성 척도를 획득하기 위해 다양한 방향을 가정된 문자 방향으로서, 각각, 가정함으로써 이미지 블록에 대해 광학 문자 인식 처리를 수행하는 단계;
서브 이미지 블록에서 서로 간에 180° 상호 관계를 갖는 가정된 문자 방향에서, 서브 이미지 블록의 최소 정합 쌍(minimum matching pair)을 검색하는 단계 - 최소 정합 쌍은 서로 간에 180° 상호 관계를 갖는 가정된 문자 방향에서의 2개의 서브 이미지 블록 세트(대응하는 위치, 동일한 크기 및 최소 수의 서브 이미지 블록을 가짐)임 -;
최소 정합 쌍에서의 2개의 가정된 문자 방향 각각에서 하나의 서브 이미지 블록이 있고 최소 정합 쌍에 속하는 2개의 서브 이미지 블록에 대응하는 인식된 문자가 동일한 회전 불변 문자이거나 동일한 회전 불변 문자 쌍에 속할 때, 2개의 서브 이미지 블록에 대응하는 정확성 척도를 동일한 수치로 조정하는 단계;
조정된 서브 이미지 블록에 기초하여 각각의 가정된 문자 방향에서의 누적 정확성 척도를 계산하는 단계; 및
누적 정확성 척도에 따라 이미지 블록에서의 문자의 방향을 식별하는 단계를 포함하는 방법.
첨부 2. 첨부 1에 있어서,
회전 불변 문자가 180°의 회전 대칭을 갖는 문자를 포함하고 - 즉, 회전 불변 문자는 180° 회전된 후에 그 자신이 됨 -,
회전 불변 문자 쌍이 2개의 문자를 포함하며, 그 중 어느 한쪽 문자가 180° 회전된 후에 다른쪽 문자와 일치하거나 모양이 다른쪽 문자와 높은 유사성을 가지는 방법.
첨부 3. 첨부 1에 있어서, 2개의 서브 이미지 블록에 대응하는 정확성 척도를 동일한 수치로 조정하는 상기 단계가 2개의 서브 이미지 블록에 대응하는 정확성 척도를 2개의 서브 이미지 블록에 대응하는 정확성 척도의 평균값으로 조정하는 단계를 포함하는 방법.
첨부 4. 첨부 1에 있어서, 2개의 서브 이미지 블록에 대응하는 정확성 척도를 동일한 수치로 조정하는 상기 단계가 2개의 서브 이미지 블록에 대응하는 정확성 척도를 2개의 서브 이미지 블록에 대응하는 정확성 척도 중 하나로 조정하는 단계를 포함하는 방법.
첨부 5. 첨부 1 내지 첨부 4 중 어느 하나에 있어서, 정확성 척도가 신뢰도 및 인식 거리를 포함하고, 다양한 방향이 이미지 블록의 2개의 가로 방향 및 2개의 세로 방향을 포함하는 방법.
첨부 6. 첨부 1 내지 첨부 4 중 어느 하나에 있어서, 조정된 서브 이미지 블록에 기초하여 각각의 가정된 문자 방향에서의 누적 정확성 척도를 계산하는 상기 단계가 각각의 가정된 문자 방향에서의 조정된 서브 이미지 블록의 정확성 척도의 합을 각자의 가정된 문자 방향에서의 최소 정합 쌍의 수로 나눈 결과를 각자의 가정된 문자 방향에서의 누적 정확성 척도로서 취하는 단계를 포함하는 방법.
첨부 7. 이미지 블록에서의 문자의 방향을 식별하는 장치로서,
각각의 가정된 문자 방향에서의 서브 이미지 블록, 서브 이미지 블록에 대응하는 인식된 문자, 및 그의 정확성 척도를 획득하기 위해 다양한 방향을 가정된 문자 방향으로서, 각각, 가정함으로써 이미지 블록에 대해 광학 문자 인식 처리를 수행하도록 구성된 광학 문자 인식 처리 유닛;
서브 이미지 블록에서 서로 간에 180° 상호 관계를 갖는 가정된 문자 방향에서, 서브 이미지 블록의 최소 정합 쌍을 검색하도록 구성된 최소 정합 쌍 검색 유닛 - 최소 정합 쌍은 서로 간에 180° 상호 관계를 갖는 가정된 문자 방향에서의 2개의 서브 이미지 블록 세트(대응하는 위치, 동일한 크기 및 최소 수의 서브 이미지 블록을 가짐)임 -;
최소 정합 쌍에서의 2개의 가정된 문자 방향 각각에서 하나의 서브 이미지 블록이 있고 최소 정합 쌍에 속하는 2개의 서브 이미지 블록에 대응하는 인식된 문자가 동일한 회전 불변 문자이거나 동일한 회전 불변 문자 쌍에 속할 때, 2개의 서브 이미지 블록에 대응하는 정확성 척도를 동일한 수치로 조정하도록 구성되어 있는 서브 이미지 블록 조정 유닛;
조정된 서브 이미지 블록에 기초하여 각각의 가정된 문자 방향에서의 누적 정확성 척도를 계산하도록 구성된 누적 정확성 척도 계산 유닛; 및
누적 정확성 척도에 따라 이미지 블록에서의 문자의 방향을 식별하도록 구성된 문자 방향 식별 유닛을 포함하는 장치.
첨부 8. 첨부 7에 있어서, 서브 이미지 블록 조정 유닛이, 최소 정합 쌍에서의 2개의 가정된 문자 방향 각각에서 하나의 서브 이미지 블록이 있고 최소 정합 쌍에 속하는 2개의 서브 이미지 블록에 대응하는 인식된 문자가 동일한 회전 불변 문자이거나 동일한 회전 불변 문자 쌍에 속할 때, 2개의 서브 이미지 블록에 대응하는 정확성 척도를 2개의 서브 이미지 블록에 대응하는 정확성 척도의 평균값으로 조정하도록 구성되어 있는 장치.
첨부 9. 첨부 7에 있어서, 서브 이미지 블록 조정 유닛이, 최소 정합 쌍에서의 2개의 가정된 문자 방향 각각에서 하나의 서브 이미지 블록이 있고 최소 정합 쌍에 속하는 2개의 서브 이미지 블록에 대응하는 인식된 문자가 동일한 회전 불변 문자이거나 동일한 회전 불변 문자 쌍에 속할 때, 2개의 서브 이미지 블록에 대응하는 정확성 척도를 2개의 서브 이미지 블록에 대응하는 정확성 척도 중 하나로 조정하도록 구성되어 있는 장치.
첨부 10. 첨부 7에 있어서, 누적 정확성 척도 계산 유닛이 각각의 가정된 문자 방향에서의 조정된 서브 이미지 블록의 정확성 척도의 합을 각자의 가정된 문자 방향에서의 최소 정합 쌍의 수로 나눈 결과를 각자의 가정된 문자 방향에서의 누적 정확성 척도로서 취하도록 구성되어 있는 장치.
첨부 11. 첨부 7 내지 첨부 10 중 어느 하나에서의 이미지 블록에서의 문자의 방향을 식별하는 장치를 포함하는 스캐너.
본 발명이 이상에서 본 발명의 실시예에 대한 설명에 개시되어 있지만, 전술한 모든 실시예 및 일례가 제한하는 것이 아니라 예시적인 것임을 잘 알 것이다. 당업자는, 첨부된 특허청구범위의 사상 및 범위를 벗어나지 않고, 본 발명에 대한 다양한 수정, 개조, 또는 등가물을 고안할 수 있다. 이들 수정, 개조 또는 등가물은 또한 발명의 범위 내에 속하는 것으로 해석되어야 한다.

Claims (11)

  1. 이미지 블록에서의 문자들의 방향을 식별하는 방법으로서,
    각각의 가정된 문자 방향들에서의 서브 이미지 블록들, 상기 서브 이미지 블록들에 대응하는 인식된 문자들, 및 상기 인식된 문자들의 정확성 척도들을 획득하기 위해 다양한 방향들을 가정된 문자 방향들로서 각각 가정함으로써 상기 이미지 블록에 대해 광학 문자 인식 처리를 수행하는 단계;
    상기 서브 이미지 블록들에서 서로 간에 180° 상호 관계를 갖는 가정된 문자 방향들에서, 대응하는 위치들, 동일한 크기들 및 최소 수의 서브 이미지 블록들을 갖는, 상기 서브 이미지 블록들의 최소 정합 쌍(minimum matching pair)을 검색하는 단계 - 상기 최소 정합 쌍은 서로 간에 180° 상호 관계를 갖는 가정된 문자 방향들에서의 서브 이미지 블록들의 2개의 세트임 -;
    상기 최소 정합 쌍에서의 2개의 가정된 문자 방향들 각각에서 하나의 서브 이미지 블록이 있고 상기 최소 정합 쌍에 속하는 2개의 서브 이미지 블록들에 대응하는 인식된 문자들이 동일한 회전 불변 문자이거나 동일한 회전 불변 문자 쌍에 속할 때, 상기 2개의 서브 이미지 블록들에 대응하는 정확성 척도들을 동일한 수치로 조정하는 단계;
    상기 조정된 서브 이미지 블록들에 기초하여 각각의 가정된 문자 방향들에서의 누적 정확성 척도를 계산하는 단계; 및
    상기 누적 정확성 척도들에 따라 상기 이미지 블록에서의 문자들의 방향을 식별하는 단계
    를 포함하는 방법.
  2. 제1항에 있어서,
    상기 회전 불변 문자는 180°의 회전 대칭을 갖는 문자를 포함하고 - 즉, 상기 회전 불변 문자는 180° 회전된 후에 그 자신이 됨 -,
    상기 회전 불변 문자 쌍은 2개의 문자를 포함하고, 그 중 어느 한쪽 문자가 180° 회전된 후에 다른쪽 문자와 일치하거나 다른쪽 문자와 형상이 유사해지는 방법.
  3. 제1항에 있어서,
    상기 2개의 서브 이미지 블록에 대응하는 정확성 척도들을 동일한 수치로 조정하는 단계는 상기 2개의 서브 이미지 블록에 대응하는 정확성 척도들을 상기 2개의 서브 이미지 블록에 대응하는 정확성 척도들의 평균값으로 조정하는 단계를 포함하는 방법.
  4. 제1항에 있어서,
    상기 2개의 서브 이미지 블록에 대응하는 정확성 척도들을 동일한 수치로 조정하는 단계는 상기 2개의 서브 이미지 블록에 대응하는 정확성 척도들을 상기 2개의 서브 이미지 블록에 대응하는 정확성 척도들 중 하나로 조정하는 단계를 포함하는 방법.
  5. 제1항 내지 제4항 중 어느 한 항에 있어서,
    상기 정확성 척도는 신뢰도 및 인식 거리를 포함하고, 상기 다양한 방향들은 상기 이미지 블록의 2개의 가로 방향 및 2개의 세로 방향을 포함하는 방법.
  6. 제1항 내지 제4항 중 어느 한 항에 있어서,
    조정된 서브 이미지 블록들에 기초하여 각각의 가정된 문자 방향들에서의 누적 정확성 척도를 계산하는 상기 단계는, 각각의 가정된 문자 방향들에서의 상기 조정된 서브 이미지 블록들의 정확성 척도들의 합을 각자의 가정된 문자 방향에서의 최소 정합 쌍들의 수로 나눈 결과를 상기 각자의 가정된 문자 방향에서의 누적 정확성 척도로서 취하는 단계를 포함하는 방법.
  7. 이미지 블록에서의 문자들의 방향들을 식별하는 장치로서,
    각각의 가정된 문자 방향들에서의 서브 이미지 블록들, 상기 서브 이미지 블록들에 대응하는 인식된 문자들, 및 상기 인식된 문자들의 정확성 척도들을 획득하기 위해 다양한 방향들을 상기 가정된 문자 방향들로서 각각 가정함으로써 상기 이미지 블록에 대해 광학 문자 인식 처리를 수행하도록 구성된 광학 문자 인식 처리 유닛;
    상기 서브 이미지 블록들에서 서로 간에 180° 상호 관계를 갖는 가정된 문자 방향들에서, 상기 서브 이미지 블록들의 최소 정합 쌍을 검색하도록 구성된 최소 정합 쌍 검색 유닛 - 상기 최소 정합 쌍은 대응하는 위치들, 동일한 크기들 및 최소 수의 서브 이미지 블록들을 갖는, 서로 간에 180° 상호 관계를 갖는 가정된 문자 방향들에서의 서브 이미지 블록들의 2개의 세트임 -;
    상기 최소 정합 쌍에서의 2개의 가정된 문자 방향 각각에서 하나의 서브 이미지 블록이 있고 상기 최소 정합 쌍에 속하는 2개의 서브 이미지 블록에 대응하는 인식된 문자들이 동일한 회전 불변 문자이거나 동일한 회전 불변 문자 쌍에 속할 때, 상기 2개의 서브 이미지 블록에 대응하는 정확성 척도들을 동일한 수치로 조정하도록 구성된 서브 이미지 블록 조정 유닛;
    상기 조정된 서브 이미지 블록들에 기초하여 각각의 가정된 문자 방향들에서의 누적 정확성 척도를 계산하도록 구성된 누적 정확성 척도 계산 유닛; 및
    상기 누적 정확성 척도들에 따라 상기 이미지 블록에서의 문자들의 방향을 식별하도록 구성된 문자 방향 식별 유닛
    을 포함하는 장치.
  8. 제7항에 있어서,
    상기 서브 이미지 블록 조정 유닛은, 최소 정합 쌍에서의 상기 2개의 가정된 문자 방향 각각에 하나의 서브 이미지 블록이 있고 상기 최소 정합 쌍에 속하는 상기 2개의 서브 이미지 블록에 대응하는 인식된 문자들이 동일한 회전 불변 문자이거나 동일한 회전 불변 문자 쌍에 속할 때, 상기 2개의 서브 이미지 블록에 대응하는 정확성 척도들을 상기 2개의 서브 이미지 블록에 대응하는 정확성 척도들의 평균값으로 조정하도록 구성되는 장치.
  9. 제7항에 있어서,
    상기 서브 이미지 블록 조정 유닛은, 최소 정합 쌍에서의 상기 2개의 가정된 문자 방향 각각에 하나의 서브 이미지 블록이 있고 상기 최소 정합 쌍에 속하는 상기 2개의 서브 이미지 블록에 대응하는 인식된 문자들이 동일한 회전 불변 문자이거나 동일한 회전 불변 문자 쌍에 속할 때, 상기 2개의 서브 이미지 블록에 대응하는 정확성 척도들을 상기 2개의 서브 이미지 블록에 대응하는 정확성 척도들 중 하나로 조정하도록 구성되는 장치.
  10. 제7항에 있어서,
    상기 누적 정확성 척도 계산 유닛은, 상기 각각의 가정된 문자 방향들에서의 조정된 서브 이미지 블록들의 정확성 척도들의 합을 각자의 가정된 문자 방향에서의 최소 정합 쌍들의 수로 나눈 결과를 상기 각자의 가정된 문자 방향에서의 누적 정확성 척도로서 취하도록 구성되는 장치.
  11. 제7항 내지 제10항 중 어느 한 항에 따른 이미지 블록에서의 문자들의 방향을 식별하는 장치를 포함하는 스캐너.
KR1020120073938A 2011-07-20 2012-07-06 이미지 블록에서 문자의 방향을 식별하는 방법 및 장치 KR101345925B1 (ko)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
CN201110209833.5A CN102890784B (zh) 2011-07-20 2011-07-20 识别图像块中文字的方向的方法和装置
CN201110209833.5 2011-07-20

Publications (2)

Publication Number Publication Date
KR20130011921A KR20130011921A (ko) 2013-01-30
KR101345925B1 true KR101345925B1 (ko) 2013-12-27

Family

ID=46679100

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020120073938A KR101345925B1 (ko) 2011-07-20 2012-07-06 이미지 블록에서 문자의 방향을 식별하는 방법 및 장치

Country Status (5)

Country Link
US (1) US8787674B2 (ko)
EP (1) EP2549407B1 (ko)
JP (1) JP5910365B2 (ko)
KR (1) KR101345925B1 (ko)
CN (1) CN102890784B (ko)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106778733A (zh) * 2015-11-25 2017-05-31 中兴通讯股份有限公司 调整图片文字的显示方法及装置
US10210384B2 (en) * 2016-07-25 2019-02-19 Intuit Inc. Optical character recognition (OCR) accuracy by combining results across video frames
CN108345827B (zh) * 2017-01-24 2021-11-30 富士通株式会社 识别文档方向的方法、系统和神经网络
CN107220640B (zh) * 2017-05-23 2020-07-17 广州绿怡信息科技有限公司 字符识别方法、装置、计算机设备和计算机可读存储介质
CN114842464A (zh) * 2022-05-13 2022-08-02 北京百度网讯科技有限公司 图像方向识别方法、装置、设备、存储介质及程序产品

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5031225A (en) 1987-12-09 1991-07-09 Ricoh Company, Ltd. Character recognition method for recognizing character in an arbitrary rotation position
US5508810A (en) 1991-10-17 1996-04-16 Ricoh Company, Ltd. Image recorder for properly orienting output images
JP2002125114A (ja) 2000-10-13 2002-04-26 Ricoh Co Ltd 画像読取装置

Family Cites Families (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH04195485A (ja) 1990-11-28 1992-07-15 Hitachi Ltd 画像情報入力装置
JP3727971B2 (ja) * 1995-02-01 2005-12-21 キヤノン株式会社 文書処理装置、及び文書処理方法
JPH08293000A (ja) * 1995-04-21 1996-11-05 Canon Inc 画像処理装置及び方法
JPH09282413A (ja) 1996-04-16 1997-10-31 Canon Inc 文書方向獲得方法とその装置並びに文字認識方法とその装置
JP3728040B2 (ja) * 1996-12-27 2005-12-21 キヤノン株式会社 画像形成装置及び方法
JPH11213089A (ja) * 1998-01-23 1999-08-06 Canon Inc 画像処理装置及びその方法
US6151423A (en) 1998-03-04 2000-11-21 Canon Kabushiki Kaisha Character recognition with document orientation determination
US6804414B1 (en) * 1998-05-01 2004-10-12 Fujitsu Limited Image status detecting apparatus and document image correcting apparatus
JPH11338974A (ja) * 1998-05-28 1999-12-10 Canon Inc 文書処理方法及び装置、記憶媒体
TW457458B (en) * 1998-06-01 2001-10-01 Canon Kk Image processing method, device and storage medium therefor
US6993205B1 (en) * 2000-04-12 2006-01-31 International Business Machines Corporation Automatic method of detection of incorrectly oriented text blocks using results from character recognition
JP2004013704A (ja) * 2002-06-10 2004-01-15 Sumitomo Denko Systems Kk 文字認識処理における原稿方向判別方法
JP2004272798A (ja) * 2003-03-11 2004-09-30 Pfu Ltd 画像読み取り装置
US8200043B2 (en) 2008-05-01 2012-06-12 Xerox Corporation Page orientation detection based on selective character recognition
US8023770B2 (en) * 2008-05-23 2011-09-20 Sharp Laboratories Of America, Inc. Methods and systems for identifying the orientation of a digital image
CN101833648B (zh) * 2009-03-13 2012-05-02 汉王科技股份有限公司 文本图像的校正方法
JP4927122B2 (ja) * 2009-06-15 2012-05-09 シャープ株式会社 画像処理方法、画像処理装置、画像形成装置、プログラムおよび記録媒体

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5031225A (en) 1987-12-09 1991-07-09 Ricoh Company, Ltd. Character recognition method for recognizing character in an arbitrary rotation position
US5508810A (en) 1991-10-17 1996-04-16 Ricoh Company, Ltd. Image recorder for properly orienting output images
JP2002125114A (ja) 2000-10-13 2002-04-26 Ricoh Co Ltd 画像読取装置

Also Published As

Publication number Publication date
KR20130011921A (ko) 2013-01-30
EP2549407B1 (en) 2020-06-10
JP2013025800A (ja) 2013-02-04
EP2549407A2 (en) 2013-01-23
CN102890784B (zh) 2016-03-30
US20130022271A1 (en) 2013-01-24
CN102890784A (zh) 2013-01-23
EP2549407A3 (en) 2014-06-04
JP5910365B2 (ja) 2016-04-27
US8787674B2 (en) 2014-07-22

Similar Documents

Publication Publication Date Title
KR101272445B1 (ko) 이미지 블록 내 문자들의 방향을 식별하는 방법 및 장치
US8942484B2 (en) Text detection using image regions
KR101345925B1 (ko) 이미지 블록에서 문자의 방향을 식별하는 방법 및 장치
CN102982330B (zh) 文字图像中字符识别方法和识别装置
US10049096B2 (en) System and method of template creation for a data extraction tool
US9466010B2 (en) Image similarity determining device and method, and an image feature acquiring device and method
CN107368829B (zh) 确定输入图像中的矩形目标区域的方法和设备
JP2011216070A (ja) 隠蔽された文字の復元方法及び画像処理装置
KR101265022B1 (ko) 이미지 블록 내의 문자들의 방향을 식별하기 위한 방법 및 장치
JP6085999B2 (ja) 画像中の文字列を認識する方法及び装置
RU2597163C2 (ru) Сравнение документов с использованием достоверного источника
US9483818B2 (en) Bleed-through detection method and bleed-through detection apparatus
JP2005275830A (ja) 帳票認識方法
US20220215683A1 (en) Method and system for keypoint extraction from images of documents
JP2002123815A (ja) ファイリング装置
JP2010122749A (ja) 情報処理装置、文字認識方法、文字認識プログラム、および、文字認識プログラムを記録した、コンピュータ読取り可能な記録媒体
JP2008146413A (ja) 方向判定装置、画像処理装置、画像方向判別方法、および画像方向判別プログラム

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20161123

Year of fee payment: 4

FPAY Annual fee payment

Payment date: 20171117

Year of fee payment: 5

FPAY Annual fee payment

Payment date: 20181115

Year of fee payment: 6