KR20100019961A - 문자 인식 장치, 문자 인식 프로그램, 및 문자 인식 방법 - Google Patents

문자 인식 장치, 문자 인식 프로그램, 및 문자 인식 방법 Download PDF

Info

Publication number
KR20100019961A
KR20100019961A KR1020090070357A KR20090070357A KR20100019961A KR 20100019961 A KR20100019961 A KR 20100019961A KR 1020090070357 A KR1020090070357 A KR 1020090070357A KR 20090070357 A KR20090070357 A KR 20090070357A KR 20100019961 A KR20100019961 A KR 20100019961A
Authority
KR
South Korea
Prior art keywords
character
length
recognition
standard
characters
Prior art date
Application number
KR1020090070357A
Other languages
English (en)
Other versions
KR101050866B1 (ko
Inventor
토모요시 아이자와
Original Assignee
오므론 가부시키가이샤
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 오므론 가부시키가이샤 filed Critical 오므론 가부시키가이샤
Publication of KR20100019961A publication Critical patent/KR20100019961A/ko
Application granted granted Critical
Publication of KR101050866B1 publication Critical patent/KR101050866B1/ko

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/20Image preprocessing
    • G06V10/26Segmentation of patterns in the image field; Cutting or merging of image elements to establish the pattern region, e.g. clustering-based techniques; Detection of occlusion
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/14Image acquisition
    • G06V30/148Segmentation of character regions
    • G06V30/158Segmentation of character regions using character size, text spacings or pitch estimation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Multimedia (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Artificial Intelligence (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Data Mining & Analysis (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • General Engineering & Computer Science (AREA)
  • Character Discrimination (AREA)
  • Character Input (AREA)

Abstract

과제
접촉문자, 및 종횡비 변형문자에 의한 문자열이라도, 올바르게 문자 인식할 수 있는 문자 인식 장치, 문자 인식 프로그램, 및 문자 인식 방법을 제공한다.
해결 수단
문자 인식 장치에, 문자열 화상을 취득하는 문자열 화상 취득 수단과, 문자열 방향의 문자 길이를 측정한 측정문자 길이를 상기 문자열 화상 취득 수단에서 취득한 문자열 화상으로부터 복수의 문자에 관해 취득하는 측정문자 길이 취득 수단과, 취득한 측정문자 길이 내의 문자를 임시매칭 처리에 의해 임시인식하는 문자 임시인식 수단과, 임시인식을 할 수 있게 된 문자의 상기 측정문자 길이에 의거하여 표준문자 길이를 결정하는 표준문자 길이 결정 수단과, 결정한 표준문자 길이에 의거하여 상기 문자열 화상으로부터 인식 대상의 모든 문자를 잘라내는 문자 절출 수단과, 잘라낸 문자를 본매칭 처리에 의해 본인식하는 문자 인식 수단을 구비하였다.

Description

문자 인식 장치, 문자 인식 프로그램, 및 문자 인식 방법{CHARACTER RECOGNITION DEVICE, PROGRAM, AND METHOD}
본 발명은, 예를 들면 문자를 인식하는 문자 인식 장치, 문자 인식 프로그램, 및 문자 인식 방법에 관한 것이다.
종래, 디지털 카메라 등의 촬상 수단, 또는 디지털 스캐너 등에 의해 문자 화상 데이터를 취득하고, 이 문자 화상 데이터 내의 문자를 인식하는 문자 인식 기술이 이용되고 있다.
이 문자 인식 기술에서는, 문자열로부터 문자를 잘라내고, 잘라낸 문자를 사전 데이터와 매칭함으로써 문자를 인식한다.
이와 같은 문자 인식에서는, 예를 들면 문자와 문자가 접촉하고 있는 경우나, 문자열 방향으로 분리한 복수의 문자 요소로 이루어지는 분리문자(예를 들면, 가로쓰기 문자열에 있어서의 「주(州)」와 「천(川)」, 세로쓰기 문서에 있어서의 「이(二)」와 「삼(三)」 등), 본래 단독의 문자 요소로 이루어지는 문자가 긁힘에 의해 복수의 문자 요소로 분리하여 버린 문자 등, 정확한 문자의 잘라냄이 곤란한 경우가 생긴다.
이와 같은 접촉문자나 분리문자가 포함되는 문자열로부터도 정확한 문자 잘라냄을 행할 수 있도록, 문자폭을 추정한 다음 문자 잘라냄을 행하는 수법이, 몇가지 제안되어 있다(특허 문헌 1 내지 5 참조).
그러나, 이들의 특허 문헌 기재의 기술에는, 아직도 문제점이 남아 있다.
상세히 기술하면, 특허 문헌 1 기재의 문자 인식 장치는, 문자폭이 고정이라는 전제로 문자 잘라냄을 행하는 것이다. 이 때문에, 이 문자 인식 장치는, 전각문자와 반각문자가 혼합하고 있는 문자열에 능숙하게 대응할 수가 없는 것이다.
특허 문헌 2 기재의 문자 인식 장치는, 전각문자와 반각문자의 각각에 관해 소정의 문자폭을 준비하여해 두고, 문자 잘라냄을 행하는 것이다. 이 때문에, 전각 문자와 반각문자가 혼합하여 있는 문자열에 대응할 수가 있다. 그러나, 중국에서 사용되는 것과 같은 종횡비 변형문자에는 대응할 수가 없는 것이다. 즉, 예를 들면 중국의 안내판이나 간판, 음식점의 메뉴 등에서는, 도 10의 (A)에 도시하는 바와 같이, 세로로 길게 변형된 종장문자(縱長文字)로 구성되는 문자열이나, 도 l0의 (B)에 도시하는 바와 같이 가로로 굵게 변형된 횡장문자(橫長文字)로 구성된 문자열 등, 다양한 종횡비 변형문자가 사용되고 있다. 그리고, 특허 문헌 2 기재의 문자 인식 장치는, 소정의 문자폭인 것이 전제이기 때문에, 이와 같은 종횡비 변형문자에 능숙하게 대응할 수가 없다는 문제점이 있다.
또한, 특허 문헌 3 기재의 문자 인식 장치는, 소정의 문자폭을 전제로 하고, 추출된 문자가 1문자인 경우와 2문자인 경우의 양쪽에 관해 고려한다는 것이다. 그러나, 이것도 상기 특허 문헌 2의 경우와 마찬가지로 소정의 문자폭이 전제이기 때 문에, 종장문자로 구성되는 문자열이나 횡장문자로 구성되는 문자열 등 종횡비 변형문자에 의한 문자열에 능숙하게 대응할 수가 없다.
또한, 상기 특허 문헌 4 기재의 문자 인식 장치는, 전각문자의 종횡비가 거의 1:1에 가까운 것을 가정하고 있다. 이 때문에, 상기 특허 문헌 2, 3과 마찬가지로, 종장문자로 구성되는 문자열이나 횡장문자로 구성되는 문자열 등 종횡비 변형문자에 의한 문자열에 능숙하게 대응할 수가 없다.
또한, 상기 특허 문헌 5 기재의 문자 인식 장치는, 문자열과 수직한 방향에 흑화소(문자에 상당하는 화소)를 투영시킨 데이터로부터 투영문자폭의 히스토그램을 작성하고, 그 피크 값을 문자폭으로 한다. 이 때문에, 종장문자로 구성되는 문자열이나 횡장문자로 구성되는 문자열 등 종횡비 변형문자에 의한 문자열에 대응할 수 있는 가능성은 있다. 그러나, 예를 들면, 도 l0의 (C)에 도시하는 바와 같이 접촉문자가 있는 경우, 접촉문자의 영향으로 피크 값이 W2가 되고, 실제의 문자폭(W1)의 배(倍)의 사이즈(W2)가 문자폭으로서 추정되어 버린다.
특허 문헌 1 : 일본 특개평5-128308호 공보
특허 문헌 2 : 일본 특개평5-128307호 공보
특허 문헌 3 : 일본 특개평3-53393호 공보
특허 문헌 4 : 일본 특개평7-271911호 공보
특허 문헌 5 : 일본 특개평1-78395호 공보
본 발명은, 상술한 종래의 문제점에 착안하여 이루어진 것이고, 접촉문자, 및 종횡비 변형문자에 의한 문자열이라도, 올바르게 문자 인식할 수 있는 문자 인식 장치, 문자 인식 프로그램, 및 문자 인식 방법을 제공하는 것을 목적으로 한다.
본 발명은, 문자열 화상을 취득하는 문자열 화상 취득 수단과, 문자열 방향의 문자 길이를 측정한 측정문자 길이를 상기 문자열 화상 취득 수단에서 취득한 문자열 화상으로부터 복수의 문자에 관해 취득하는 측정문자 길이 취득 수단과, 취득한 측정문자 길이 내의 문자를 임시매칭 처리에 의해 임시인식하는 문자 임시인식 수단과, 임시인식을 할 수 있게 된 문자의 상기 측정문자 길이에 의거하여 표준문자 길이를 결정하는 표준문자 길이 결정 수단과, 결정한 표준문자 길이에 의거하여 상기 문자열 화상으로부터 인식 대상의 모든 문자를 잘라내는 문자 절출(切出) 수단과, 잘라낸 문자를 본매칭 처리에 의해 본인식하는 문자 인식 수단을 구비한 문자 인식 장치인 것을 특징으로 한다.
상기 문자열 화상 취득 수단은, 예를 들면 CCD 카메라나 CM0S 카메라 등의 촬상 수단으로 하는, 또는, 이와 같은 촬상 수단으로 촬상한 문자열 화상의 데이터를 해당 촬상 수단으로부터 수신하는 인터페이스로 하는 등, 화상을 취득 가능한 적절한 수단으로 구성할 수 있다.
상기 문자열 방향은, 문자가 종방향으로 나열하여 있으면 종방향, 문자가 횡 방향으로 나열하여 있으면 횡방향으로 하는 등, 문자가 나열하여 있는 적절한 방향으로 할 수 있다.
상기 문자 길이는, 문자열 방향의 1문자의 길이를 가리키고, 예를 들면 1문자에 있어서의 문자열 방향의 화소수(畵素數)로 할 수 있다.
상기 문자 임시인식 수단은, 예를 들면, 문자 화상으로부터 특징 데이터를 추출하고 해당 특징 데이터를 사전 데이터의 특징 데이터와 매칭하여, 어느 문자인지를 인식하는 수단으로 할 수 있다. 또한, 임시인식을 할 수 있게 됐다는 것은, 올바른 문자가 인식할 수 있게 되어 있다고 생각될 정도로 매칭 신뢰도가 얻어져 있는 경우로 할 수 있다.
상기 표준문자 길이 결정 수단은, 복수의 측정문자 길이의 평균치를 표준문자 길이로 하는 평균문자 길이 연산 수단으로 구성하는, 또는, 복수의 측정문자 길이가 가장 집중하고 있는 값을 추출하는 집중치 추출 수단으로 구성하는 등, 표준문자 길이를 결정하는 적절한 수단으로 구성할 수 있다.
상기 문자 인식 수단은, 예를 들면, 문자 화상으로부터 특징 데이터를 추출하고 해당 특징 데이터를 사전 데이터의 특징 데이터와 매칭하여, 어느 문자인지를 인식하는 수단으로 할 수 있다.
상기 문자 인식 장치는, 정보 처리를 실행하는 CPU 등의 정보 처리부와 정보 기억을 행하는 메모리 등의 정보 기억부와 외부 장치에 접속하는 접속단자 등의 인터페이스부를 갖는 반도체 칩 등의 장치로 구성하는, 또는, 촬상 수단과 제어 수단과 기억 수단을 구비한 휴대 전화기나 PDA 등의 정보 처리 단말로 구성하는 등, 적 절한 장치로 구성할 수 있다.
본 발명에 의해, 접촉문자, 및 종횡비 변형문자에 의한 문자열이라도, 올바르게 문자 인식하는 것이 가능해진다.
본 발명의 양태로서, 상기 임시매칭 처리에 의해 임시인식한 문자가, 상기 문자열 화상의 문자열 방향으로 배치된 2개의 부품문자를 결합하여 만들어지는 하나의 결합문자인 경우, 상기 표준문자 길이 결정 수단은, 상기 표준문자 길이의 결정에 이용하는 측정문자 길이로부터 해당 결합문자의 측정문자 길이를 제외하는 구성으로 할 수 있다.
상기 결합문자는, 문자열 방향이 좌우 방향인 경우에 편(偏; 왼쪽)과 방(旁; 오른쪽)으로 이루어지는 문자, 또는, 문자열 방향이 상하 방향인 경우에 관(冠;윗쪽)과 각(脚;아랫쪽)으로 이루어지는 문자로 할 수 있다.
상기 부품 문자는, 문자열 방향이 좌우 방향인 경우의 상기 결합문자의 편(偏) 또는 방(旁)에 해당하는 문자, 또는, 문자열 방향이 상하 방향인 경우의 상기 결합문자의 관(冠) 또는 각(脚)으로 이루어지는 문자로 할 수 있다.
이로써, 2문자분의 문자 길이를 1문자의 문자 길이로서 이용하는 것을 방지할 수 있다. 상세히 기술하면, 예를 들면 「日(일)」의 문자와 「月(월)」의 문자가 이 순서로 2개 나열하여 있는 문자열에 관해, 실수하여 「日(일)」과 「月(월)」을 결합한 「明(명)」의 1문자로 임시인식하여 버리는 케이스가 생각된다. 이와 같은 경우에, 임시인식한 「明(명)」이 결합문자이기 때문에 「明(명)」의 측정문자 길이를 제외할 수 있다. 이 때문에, 「日(일)」와 「月(월)」의 2문자분의 문자 길이를 「明(명)」 1문자의 측정문자 길이로서 잘못 채용하는 것을 방지할 수 있다.
또한 본 발명의 양태로서, 상기 임시매칭 처리에 의해 임시인식한 문자가, 해당 문자에 대해 문자열 방향의 전후 어느 하나의 문자를 결합하면 하나의 결합문자를 형성할 수 있는 부품문자인 경우, 상기 표준문자 길이 결정 수단은, 상기 표준문자 길이의 결정에 이용하는 측정문자 길이로부터 해당 부품문자의 측정문자 길이를 제외하는 구성으로 할 수 있다.
이로써, 결합문자의 부품문자의 측정문자 길이를 1문자의 측정문자 길이로서 실수하여 채용하는 것을 방지할 수 있다. 상세히 기술하면, 「明(명)」의 1문자를 임시인식할 때에, 실수하여 「日(일)」과 「月(월)」의 2문자라고 임시인식하는 케이스가 생각된다. 이와 같은 경우에, 부품문자가 될 수 있는 「日(일)」이나 「月(월)」의 측정문자 길이를 제외할 수 있다. 이 때문에, 부품문자의 측정문자 길이를 1문자분의 측정문자 길이로서 잘못 채용하는 것을 방지할 수 있다.
상기 문자 절출 수단은, 상기 문자열 화상을 문자열 방향과 수직한 방향으로 투사한 사영 데이터를 작성하고, 해당 사영 데이터의 단락 또는 골짜기로부터 다음의 단락 또는 골짜기까지의 임시문자 길이가 상기 표준문자 길이에 대해 소정 오차 내에 있는 문자를 잘라내는 제 1 절출 처리를 실행하는 구성으로 하고, 상기 문자 인식 수단은, 상기 본매칭 처리로서, 자라낸 문자에 관해 전각문자와 매칭하는 전각문자 본매칭 처리를 행하는 구성으로 하고, 해당 전각문자 본매칭 처리에서의 매칭 신뢰도가 소정의 임계치보다 낮은 경우, 상기 문자 절출 수단은, 상기 표준문자 길이중 문자열 전방부터 소정의 범위와 문자열 후방부터 상기 소정 오차를 잘라버린 축소문자 길이 내에 있는 문자를 잘라내는 제 2 절출 처리를 실행하는 구성으로 하고, 상기 문자 인식 수단은, 상기 본매칭 처리로서, 잘라낸 문자에 관해 반각문자와 매칭하는 반각문자 본매칭 처리를 행하는 구성으로 할 수 있다.
이로써, 전각문자와 반각문자를 올바르게 인식할 수 있다.
또한 본 발명의 양태로서, 상기 소정 오차를 상기 표준문자 길이의 4분의1로 할 수 있다.
이로써, 전각문자끼리의 문자폭의 편차에 적절히 대응할 수 있다. 즉, 예를 들면 문자 「と(토)」와 문자 「ど(도)」에서는, 탁점(濁点)분만큼 문자폭이 조금 다르지만, 이와 같은 문자폭의 편차에 적절히 대응할 수 있다.
또한 본 발명의 양태로서, 상기 소정의 범위를 상기 표준문자 길이의 16분의1로 할 수 있다.
이로써, 「I」나 「1」 등의 문자폭이 작은 문자에 대해서도 적절히 대응할 수 있다.
또한 본 발명은, 문자열 화상을 문자열 화상 취득 수단에 의해 취득하는 문자열 취득 스텝과, 문자열 방향의 문자 길이를 측정한 측정문자 길이를 상기 문자열 화상으로부터 복수의 문자에 관해 취득하는 측정문자 길이 취득 스텝과, 취득한 측정문자 길이 내의 문자를 임시매칭 처리에 의해 임시인식하는 문자 임시인식 스텝과, 임시인식을 할 수 있게 된 문자의 상기 측정문자 길이에 의거하여 표준문자 길이를 결정하는 표준문자 길이 결정 스텝과, 결정한 표준문자 길이에 의거하여 상 기 문자열 화상으로부터 인식 대상의 모든 문자를 잘라내는 문자 절출 스텝과, 잘라낸 문자를 본배칭 처리에 의해 본인식하는 문자 인식 스텝을 컴퓨터에 실행시키는 문자 인식 프로그램으로 할 수 있다.
상기 문자 인식 프로그램은, CD(Compact Disc), DVD(Digital Versatile Disk), 플렉시블리 디스크, 메모리, 칩, 또는 하드 디스크 등, 적절한 기억 매체에 격납할 수 있다. 또한, 상기 문자 인식 프로그램은, 인터넷 등의 전기통신 회선에 접속된 서버의 기억 수단에 기억하여 두고, 전기통신 회선을 통하여 다운로드 가능하게 하는, 또는 전기통신 회선을 통하여 ASP(Application Service Provider)의 서비스로서 이용 가능하게 하는 구성으로 하여도 좋다.
본 발명에 의해, 접촉문자, 및 종횡비 변형문자에 의한 문자열이라도, 올바르게 문자 인식하는 것이 적절한 하드웨어로 실행 가능해진다.
또한 본 발명은, 문자열 화상을 문자열 화상 취득 수단에 의해 취득하는 문자열 취득 스텝과, 문자열 방향의 문자 길이를 측정한 측정문자 길이를 상기 문자열 화상으로부터 복수의 문자에 관해 취득하는 측정문자 길이 취득 스텝과, 취득한 측정문자 길이 내의 문자를 임시매칭 처리에 의해 임시인식하는 문자 임시인식 스텝과, 임시인식을 할 수 있게 된 문자의 상기 측정문자 길이에 의거하여 표준문자 길이를 결정하는 표준문자 길이 결정 스텝과, 결정한 표준문자 길이에 의거하여 상기 문자열 화상으로부터 인식 대상의 모든 문자를 잘라내는 문자 절출 스텝과, 잘라낸 문자를 본매칭 처리에 의해 본인식하는 문자 인식 스텝을 실행하는 문자 인식 방법으로 할 수 있다.
본 발명에 의해, 접촉문자, 및 종횡비 변형문자에 의한 문자열이라도, 올바르게 문자인식할 수 있는 문자 인식 장치, 문자 인식 프로그램, 및 문자 인식 방법을 제공할 수 있다.
본 발명의 한 실시 형태를 이하 도면과 함께 설명한다.
도 1은, 휴대 단말(1)의 사시도를 도시하고, 도 2은, 휴대 단말(1)의 구성의 블록도를 도시한다.
휴대 단말(1)은, 도 1에 도시하는 바와 같이, 화상 입력부(3), 조작부(5), 및 화면 표시부(7)가 마련되어 있다. 화상 입력부(3)는, 화상을 촬상하는 디지털 카메라이고, 조작부(5)는, 압하 조작되는 버튼이고, 화면 표시부(7)는, 화상을 표시하는 액정 디스플레이 또는 유기 EL 디스플레이이다.
도 2에 도시하는 바와 같이, 휴대 단말(1)은, 화상 입력부(3), 조작부(5), 및 화면 표시부(7)에 더하여, CPU(11), R0M(12), 및 RAM(13)과, 버스(16)에 접속하여 마련되어 있다.
화상 입력부(3)는, CCD 카메라 또는 CM0S 카메라 등의 디지털 카메라이고, 버스(16)에 접속되어 있다. 화상 입력부(3)가 촬상하여 얻은 촬상 화상은, 디지털 화상 데이터로서 CPU(11)에 송신된다. 이 디지털 화상 데이터는, 최종적으로 별도의 기억 장치(불휘발성 메모리 등)에 기억하여도 좋다. 또한, 화상 입력부(3)는, CPU(11)로부터 촬상 신호를 받아 촬상을 시작한다.
조작부(5)는, 버스(16)에 접속되어 있다. 이 조작부(5)는, 이용자에게 압하 조작된 압하 신호를, 버스(16)를 통하여 CPU(11)에 송신한다.
화면 표시부(7)는, 조작 화면을 표시하는 조작 화면 표시부(7a)로서의 기능과, 문자 인식한 인식 결과를 표시하는 인식 결과 표시부(7b)로서의 기능을 갖고 있다. 이 조작 화면 표시부(7)는, 버스(16)에 접속되어 있다. CPU(11)로부터 화상 데이터가 보내 오면, 이 화상 데이터의 화상을 조작 화면 표시부(7a) 또는 인식 결과 표시부(7b)에 표시한다.
CPU(11)는, R0M(12)에 기억된 프로그램에 따라 RAM(13)을 일시 기억 영역에 사용하여 각종 동작을 행하는 프로세서이고, 각 부분을 제어하는 제어 기능(21)과, 문자 인식 기능(22)을 갖고 있다.
이 문자 인식 기능(22)은, 사영 데이터 취득부(31), 문자 길이 후보 추출 처리부(32), 표준문자 길이 산출부(33), 문자 절출 처리부(34), 및 문자 인식 처리부(35)를 갖고 있다.
사영 데이터 취득부(31)는, 문자열 화상을 2치화하여 문자열 방향과 수직한 방향의 흑화소수(문자를 구성하는 화소의 수)를 문자열 방향으로 나열한 히스토그램인 사영 데이터를 취득한다.
문자 길이 후보 추출 처리부(32)는, 사영 데이터로부터 흑화소가 없는 부분이나 적은 부분을 문자의 단락(切目)이라고 추측하여 표준문자 길이의 후보가 되는 측정문자 길이를 추출한다.
표준문자 길이 산출부(33)는, 측정문자 길이로부터 표준문자 길이를 산출한 다.
문자 절출 처리부(34)는, 상기 표준문자 길이로 문자열을 잘라내어 1문자 단위로 분리한다.
문자 인식 처리부(35)는, 잘라내여진 문자로부터 해당 문자의 특징 데이터를 취득하고, 이 특징 데이터가 R0M(12)의 사전 데이터(25)에 기억되어 있는 각 문자의 특징 데이터와 일치 또는 근사하는지 매칭한다.
R0M(12)은, 문자 인식 프로그램(23), 설정 데이터(24), 및 사전 데이터(25)를 기억하고 있다. 설정 데이터(24)는, 예를 들면, 임시매칭 처리를 행한 문자가 표준문자 길이를 구할 때에 사용 가능한 문자인지의 여부를 판정하는 조건을 정한 표준문자 길이 산출 조건 등이 기억되어 있다.
RAM(13)은, CPU(11)가 각종 제어나 연산에 사용하는 데이터를 일시 기억함과 함께, 화상 메모리(14)에 문자열 화상 등의 화상을 기억한다.
또한, 휴대 단말(1)에는, 무선 통신을 행하는 통신 안테나, 음성 출력을 행하는 스피커, 및 집음(集音)을 행하는 마이크로폰 등도 마련되어 있다. 이로써, 휴대 전화기로서 이용할 수 있도록 구성되어 있다.
또한, 도면에 가상선으로 도시하는 바와 같이, CPU(11)와 R0M(12)은, 하나의 칩(15)에 탑재하여 전자 부품으로서 구성하여도 좋다. 이 경우, 칩(15)을 휴대 단말(1)에 구비하면, 간단하게 문자 인식 기능을 추가할 수 있다.
도 3은, 문자의 매칭에 사용하는 사전 데이터(25)의 구성도를 도시한다.
사전 데이터(25)는, 문자 코드, 매칭 정보, 전각/반각 구별, 결합문자 구별, 및 좌부품(左部品)문자 구별 등의 각 항목에 의해 구성되어 있다.
문자 코드는, 각 문자에 관해 SHIFT-JIS나 UTF-8 등의 적절한 문자 코드를 기억한다.
매칭 정보는, 각 문자에 관해 특징량 데이터를 기억하고 있다.
전각/반각 구별은, 전각문자인지 반각문자인지의 구별을 "1"/"0"으로 기억하고 있다.
결합문자 구별은, 결합문자인지의 여부의 구별을 "1"/"0"으로 기억하고 있다.
좌부품문자 구별은, 좌측의 부품문자인지의 여부의 구별을 "1"/"0"으로 기억하고 있다.
도 4는, 화면 표시부(7)에 표시하는 인식 화면(40)의 화면 구성도를 도시한다.
인식 화면(40)은, 화상 입력부(3)에서 취득한 화상을 화면중에 크게 표시하고, 그중에서 인식하고 싶은 문자열 화상(P)을 인식 대상 특정 테두리(41)로 둘러싸서 표시하고 있다. 또한, 도시하는 예에서는, 문자가 가로나열이기 때문에, 문자 길이는 일반적으로 말하는 문자폭이 된다.
화면 하방에는, 되돌림 버튼(42), 인식 버튼(43), 및 서브메뉴 버튼(44)이 마련되어 있다.
되돌림 버튼(42)은, 압하되면 전의 화면으로 되돌리는 버튼이다.
인식 버튼(43)은, 압하되면 문자 인식을 시작하는 버튼이다.
서브메뉴 버튼(44)은, 압하되면 여러가지의 기능을 구비한 서브메뉴를 표시하는 버튼이다. 또한, 이 서브메뉴에서는, 인식 대상 특정 테두리(41)의 위치나 범위를 이용자의 조작에 의해 임의로 변경할 수 있는 인식 대상 지정 기능도 표시한다.
도 5는, 문자열 화상으로부터 사영 데이터를 취득하고 측정문자 길이를 추출하는 구조를 설명하는 설명도이다.
도 5의 (A)에 도시하는 문자열 화상(51)을, 문자 부분이 검게 되도록 2치화하고, 문자열 방향에 수직한 방향(도시하는 예에서는 상하 방향)의 흑화소의 수를, 문자열 방향으로 비트 단위로 나열하면, 도 5의 (B)에 도시하는 바와 같이 흑화소를 투영시킨 사영 데이터(52)를 얻을 수 있다.
이 사영 데이터(52)는, 종축을 흑화소수, 횡축을 문자열 방향의 위치로 하는 히스토그램이다.
이 사영 데이터(52)는, 도시하는 바와 같이, 문자열 방향에서의 문자와 문자의 사이 위치의 값이 0 또는 미소치(微小値)로 되어 있고, 이 0 또는 미소치 부분이 문자와 문자의 경계선일 가능성이 있다.
이와 같은 문자와 문자의 경계선으로부터, 도 5의 (C)에 도시하는 바와 같이, 다양한 측정문자 길이의 후보를 얻을 수 있다. 도 5의 (C)에서 최상단에 표시하고 있는 측정문자 길이(L)는, 흑화소수가 소정 수(임계치(B1)) 이하이면 문자의 단락이라고 추정한 경우의 것이다. 최하단에 표시하고 있는 측정문자 길이(L)는, 흑화소수가 0(임계치(B6))인 경우만을 문자의 단락이라고 추정한 경우의 것이다. 이들 사이의 측정문자 길이(L)는, 문자의 단락이라고 추정한 흑화소수의 값(임계치(B2 내지 B5))을 다르게 한 예이다.
이와 같이 하여, 문자의 단락으로 하는 흑화소수의 임계치(B)를 변화시킴에 의해, 어느 정도의 정밀도의 측정문자 길이(L)를 얻을 수 있다. 단, 얻어진 측정문자 길이(L)가 완전히 올바르다고는 한할 수 없음은, 도시하는 바와 같다. 이와 같이 하여 어느 정도의 신뢰성이 있는 측정문자 길이(L)를 얻어서, 더욱 확실성이 높은 문자 인식을 행하기 위한 처리를 다음에 설명한다.
도 6 내지 도 7은, R0M(12)에 기억되어 있는 문자 인식 프로그램(23)에 따라 CPU(11)가 실행하는 문자 인식 기능(22)에 관한 플로우 차트를 도시한다.
CPU(11)는, 화상 입력부(3)로부터 문자 화상을 취득한다(스텝 S1). 이 문자 화상의 취득은, 조작부(5)로부터 이용자의 촬상 조작을 접수하고, 이 촬상 조작에 의거하여 화상 입력부(3)에 의한 촬상을 실행하고, 화상 입력부(3)가 취득한 촬상 화상을 문자 화상으로서 데이터 수신함으로써 취득한다.
CPU(11)는, 화면 표시부(7)에 인식 화면(40)을 표시하고, 이용자에게 조작부(5)로 인식 대상 특정 테두리(41)를 이동 조작시켜서 인식 대상 범위의 지정을 접수한다(스텝 S2). 이 이후의 설명은, 도 8의 (A)에 도시하는 바와 같이, 「육월적연회요리(六月的宴會料理) …」의 문자 화상을 인식 대상 범위로서 지정된 경우를 예로 들어서 행한다.
CPU(11)는, 사영 데이터 취득부(31)로서의 기능을 발휘하고, 지정된 인식 대상 범위의 문자열에 관해 사영 데이터(52)를 취득한다(스텝 S3).
CPU(11)는, 문자 길이 후보 추출 처리부(32)로서의 기능을 발휘하고, 사영 데이터(52)로부터 측정문자 길이를 추출한다(스텝 S4). 이 때, 도 8의 (B)에 도시하는 바와 같이, 「六(육)」 「月(월)」 「白(백)」 「勺(작)」 「宴(연)」 「會(회)」 「米(미)」 「斗(두)」 「理(리)」 …,의 문자 후보 단위로 구분하여 측정문자 길이를 추출한 것으로 한다. 또한, 구분한 문자 후보 및 측정문자 길이는, 문자열이 가로나열이면 왼쪽부터 순번대로 번호를 붙이고, 문자열이 세로나열이면 위로부터 순번대로 번호를 붙이면 좋다.
CPU(11)는, 변수「i」에 "0"를 설정하여 초기화하고(스텝 S5), i번째의 측정문자 길이 내에 존재하는 문자 후보에 관해 임시매칭 처리를 행하여 매칭 신뢰도를 산출한다(스텝 S6). 이 매칭 신뢰도는, 문자 후보로부터 특징량을 산출하고, 이 특징량을 사전 데이터(25)의 각 문자의 매칭 정보와 비교함으로써 산출한다. 이 때, 전각문자의 매칭 정보만과 비교하고, 반각문자는 사용하지 않는다. 이로써, 최종적으로 산출하는 표준문자 길이를 전각문자의 문자 길이로 할 수 있고, 정밀도를 높일 수 있다. 또한 이 때, 임시매칭 처리에 의해 문자를 임시인식할 수 있고, 이 임시인식한 문자를 일시적으로 기억하여하여 두는 것이 바람직하다.
CPU(11)는, 산출한 매칭 신뢰도가 미리 정하여진 표준문자 길이 산출 조건을 충족하는지의 여부를 판정한다(스텝 S7). 이 표준문자 길이 산출 조건은, 다음에 나타내는 조건 1 내지 조건 3를 전부 충족시킨다는 조건이다.
「표준문자 길이 산출 조건」
조건 1 : 매칭 신뢰도가 소정의 기준치 이상일 것
조건 2 : 매칭에 의해 인식한 문자가, 부품문자에 해당하지 않을 것
조건 3 : 매칭에 의해 인식한 문자가, 결합문자에 해당하지 않을 것
조건 1에서의 소정의 기준치는, 올바른 문자를 인식할 수 있게 되어 있다고 생각되는 기준치로 적절히 정할 수 있다.
조건 2의 부품문자는, 예를 들면 문자열 방향 전방(편(偏), 또는, 관(冠))이 될 수 있는 전방부품문자로 하는, 문자열 방향 후방(방(旁), 또는, 각(脚))이 될 수 있는 후방부품문자로 하는, 또는 그 양쪽으로 할 수 있다.
또한, 전방부품문자를 제외 대상으로 하는 경우는, 문자의 임시인식의 결과, 해당 전방부품문자와 후방부품문자를 합쳐서 하나의 결합문자가 되는 경우에만 제외 대상으로 하는 것이 바람직하다. 이와 같이 함으로써, 효율 및 정밀도를 높일 수 있다.
또한, 후방부품문자를 제외 대상으로 하는 경우는, 문자의 임시인식의 결과, 그 전방에 나열하여 있는 문자의 인식 결과가 해당 후방부품문자와 결합함으로써 하나의 결합문자가 되는 경우에만 제외 대상으로 하는 것이 바람직하다. 이로써, 효율 및 정밀도를 높일 수 있다.
조건 3의 결합문자는, 문자열 방향이 횡방향이면, 「편(偏)」과 「방(旁)」으로 이루어지는 문자로 하고, 문자열 방향이 종방향이면, 「관(冠)」와 「각(脚)」으로 이루어지는 문자로 할 수 있다.
도 8의 (C)에 도시하는 예에서는, 표준문자 길이 산출 조건을 충족시키는 것으로서 채용할 수 있는 문자는, 「六(육)」 「宴(연)」 「會(회)」이다. 다른 「 月(월)」 「白(백)」 「勺(작)」 「米(미)」 「斗(두)」 「理(리)」는, 부품문자 또는 결합문자에 해당할 수 있는 것으로서 조건을 충족시키지 않는다.
표준문자 길이 산출 조건을 충족시키는 경우(TMXPQ S7 : Yes), CPU(11)는, 해당 측정문자 길이를 표준 산출용 문자 길이로 하고, 초기치를 "0"로 하고 있는 변수「문자수」를 1 카운트업한다(스텝 S8).
표준문자 길이 산출 조건을 충족시키지 않는 경우(스텝 S7 : N0), CPU(11)는, 그대로 처리를 스텝 S9로 진행한다.
CPU(11)는, 필요 수(예를 들면 4문자분)의 표준 산출용 문자 길이를 수집하였는지, 즉 변수「문자수」가 소정 수(예를 들면 4개)에 달하였는지의 여부를 판정한다(스텝 S9).
필요 수의 표준 산출용 문자 길이를 수집한 경우(스텝 S9 : Yes), CPU(11)는, 취득한 소정 수(예를 들면 4문자)의 표준 산출용 문자 길이로부터 표준문자 길이를 산출하고(스텝 S10), 스텝 S14로 처리를 진행한다. 이 표준문자 길이는, 소정 수의 표준 산출용 문자 길이의 평균치로 하는 것이 바람직하다. 또한, 산출한 표준문자 길이는, 전각문자의 표준문자 길이로 한다.
필요 수의 표준 산출용 문자 길이를 수집하지 않은 경우(스텝 S9 : N0), CPU(11)는, 변수「i」를 1 카운트업하고(스텝 S11), 이 변수「i」가 표준 산출용 문자 길이의 수(즉 변수「문자수」)에 달할 때까지(스텝 S12 : Yes), 스텝 S6으로 처리를 되돌려서 반복한다.
변수「i」가 표준 산출용 문자 길이의 수에 달한 경우(스텝 S12 : N0), 표준 산출용 문자 길이가 필요 수 모여지지 않았다고 인식할 수 있다. 이 때문에, CPU(11)는, 표준 산출용 문자 길이가 하나 이상 모였는지의 여부를 판정한다(스텝 S13).
표준 산출용 문자 길이가 하나 이상 모여 있은 경우(스텝 S13 : Yes), CPU(11)는, 스텝 S10으로 처리를 진행하고, 모여진 표준 산출용 문자 길이의 평균치를 산출하고, 이것을 표준문자 길이로 정한다(스텝 S10)
표준 산출용 문자 길이가 하나도 모여지지 않은 경우(스텝 S13 : N0), CPU(11)는, 표준문자 길이를 디폴트 설정에 의거하여 산출한다(스텝 S14).
이 디폴트 설정에 의거한 표준문자 길이는, 판독 대상의 문자의 종횡비율이 1대1이라고 상정하고, 문자열 방향과 수직 방향의 문자의 길이(이 실시례라면 문자 높이)를 표준문자 길이로 한다. 이와 같이 종횡비율을 1대1로 하는 것은, 일반적으로 종횡비율 1대1의 문자가 그 이외의 종횡비율의 문자보다도 많기 때문이다.
여기까지의 스텝 S6부터 S14를 실행하는 CPU(11)는, 표준문자 길이 산출부(33)로서 기능한다.
CPU(11)는, 정한 표준문자 길이에 따라, 문자열 화상의 1문자째에 대한 절출 시작 위치를 설정한다(스텝 S15).
그리고, CPU(11)는, 문자 절출 처리부(34)로서 기능하여, 도 9의 (A)에 도시하는 바와 같이 절출 시작 위치로부터 소정의 절출 범위의 화상을 잘라내는 전각문자 절출 처리를 실행한다(스텝 S16). 여기서의 소정의 절출 범위는, 표준문자 길이(La±α)로 한다. 즉, 전각문자 절출 처리는, 절출 시작 위치로부터 표준문자 길 이(La)의 위치를 중심으로 하는 α 내지 +α를 서치 범위로 하고, 이 서치 범위에 있는 사영 데이터(52)의 단락 또는 골짜기를 문자 종단측 컷트 위치로 정한다. 그리고, 절출 시작 위치로부터 문자 종단측 컷트 위치까지의 절출 범위로 화상을 잘라낸다. 또한, α는, 문자 종단 허용 오차이고, 표준문자 길이(La)의 1/4로 하는 것이 바람직하다.
그리고, CPU(11)는, 문자 인식 처리부(35)로서 기능하여, 전각문자 절출 처리에서 잘라낸 화상 내의 문자에 관해 전각문자 인식 처리를 실행한다(스텝 S17). 이 전각문자 인식 처리는, 사전 데이터(25)에 기억되어 있는 매칭 정보중 전각/반각 구별이 전각으로 되어 있는 매칭 정보만을 사용한다. 또한, 전각문자 인식 처리는, 잘라낸 문자 화상으로부터 특징량을 산출하고, 이 특징량과 일치 또는 가장 근사한 매칭 정보를 사전 데이터(25)로부터 검색하는 처리이다.
CPU(11)는, 전각문자 인식 처리에서 얻어진 매칭 신뢰도가 기준치 이상으로 높은지의 여부를 판정한다(스텝 S18). 이 기준치는, 인식한 문자가 올바른 것일 가능성이 높은 값으로 설정한다. 그리고, 매칭 신뢰도가 상기 기준치보다도 높으면(스텝 S18 : Yes), CPU(11)는, 해당 문자를 채용한다(스텝 S19).
매칭 신뢰도가 일정(一定)보다 낮으면(스텝 S18 : N0), CPU(11)는, 문자 절출 처리부(34)로서 기능하여, 반각문자 절출 처리를 실행한다(스텝 S20). 이 반각문자 절출 처리는, 도 9의 (B)에 도시하는 바와 같이, 「β<절출 범위<표준문자 길이(La-α)」가 되도록 화상을 잘라낸다. 즉, 전각문자로의 절출 시작 위치부터 문자 시작단(端) 컷트 범위(β)분을 컷트하고, 또한 표준문자 길이(La)로부터 문자 종단 허용 오차(α)만큼 짧은 부분에서 컷트함으로써, 반각문자를 정밀도 좋게 잘라낼 수 있다.
여기서, 문자 시작단 컷트 범위(β)분의 화상의 컷트는, 전각문자의 절출 시작 위치부터 문자 시작단 컷트 범위(β)의 위치에서 항상 컷트하는, 또는, 전각문자의 절출 시작 위치부터 문자 시작단 컷트 범위(β)까지의 사이에서 사영 데이터(52)의 단락 또는 골짜기에서 컷트하면 좋다. 또한, 문자 시작단 컷트 범위(β)는, 표준문자 길이의 1/16로 하는 것이 바람직하다.
또한, 문자 종단측 컷트 위치가 되는 「표준문자 길이(La-α)」로의 화상의 컷트는, 전각문자의 절출 시작 위치로부터 「표준문자 길이(La-α)」의 위치에서 컷트하는, 또는, 전각문자의 절출 시작 위치로부터 「표준문자 길이(La-α)」의 위치로부터 표준문자 길이(La)의 위치까지를 서치 범위로 하고, 이 서치 범위에 있는 사영 데이터(52)의 단락 또는 골짜기에서 컷트하면 좋다.
이와 같이 하여 반각문자 절출 처리를 한 후, CPU(11)는, 문자 인식 처리부(35)로서 기능하여, 반각문자 인식 처리를 실행한다(스텝 S21). 이 반각문자 인식 처리는, 사전 데이터(25)에 기억되어 있는 매칭 정보중 전각/반각 구별이 반각으로 되어 있는 매칭 정보만을 사용한다. 또한, 반각문자 인식 처리는, 잘라낸 문자 화상으로부터 특징량을 산출하고, 이 특징량과 일치 또는 가장 근사한 매칭 정보를 사전 데이터(25)로부터 검색하는 처리이다.
CPU(11)는, 매칭 처리의 신뢰도가 높으면, 매칭하는 문자를 채용하고, 해당 문자에 관해 인식 성공이라고 한다(스텝 S22).
CPU(11)는, 문자열 화상의 최후미(最後尾)의 문자인지의 여부를 판정하고(스텝 S23), 최후미의 문자가 아니면(스텝 S23 : N0), 다음 문자의 절출 시작 위치를 설정하고(스텝 S24), 스텝 S20으로 처리를 되돌려서 반복한다. 다음 문자의 절출 시작 위치는, 예를 들면 스텝 S16의 전각 문자 절출 처리 또는 스텝 S20의 반각문자 절출 처리에서 결정한 문자 종단측의 컷트 위치로 하면 좋다.
상기 스텝 S23에서 최후미의 문자였은 경우(스텝 S23 : Yes), CPU(11)는, 판독 대상의 모든 문자의 문자 인식이 완료된 것으로 하여 처리를 종료한다. 여기서, 문자 인식한 문자는, 인식 결과 표시부(7b)가 되는 화면 표시부(7)에 표시하는, 또는, 번역 어플리케이션 등 별도의 프로그램에 건네주는 등, 적절한 출력 수단에 의해 출력하면 좋다.
이상의 구성 및 동작에 의해, 접촉문자, 및 종횡비 변형문자에 의한 문자열이라도, 올바르게 문자 인식할 수 있다.
표준문자 길이(La)를 정할 때에, 매칭 신뢰도가 어느 임계치보다 좋다는 조건을 부과하였기 때문에, 올바르게 문자 인식할 수가 없는 문자, 즉 접촉문자였거나 문자가 도중에 끊어져 있거나 문자 이외의 노이즈가 찍히여 있거나 하는 화상을 표준문자 길이(La)의 산출로부터 배제할 수 있다.
또한, 매칭 신뢰도가 높을 뿐만 아니라, 부품문자가 될 수 있는 문자나, 결합문자가 될 수 있는 문자를 제외하여 표준문자 길이(La)의 산출을 행하는 것으로 하였기 때문에, 문자 길이를 잘못하여 인식하는 것을 방지할 수 있다. 즉, 예를 들면, 「日(일)」이나 「月(월)」 등, 다른 문자(「明(명)」 등)의 요소가 되는 확률 이 큰 문자가, 실제로 다른 문자의 요소로 되어 있는 경우, 「明(명)」으로부터 「日(일)」이나 「月(월)」의 부분만을 잘라내어 문자 길이의 후보가 되어 버린 경우에도, 이들을 제외하여 표준문자 길이(La)를 추정할 수 있다.
또한, 복수의 문자 길이의 평균치를 채용하는 것으로 하였기 때문에, 문자 길이의 추정 정밀도를 높일 수가 있다.
또한, 사영 데이터(52)로부터의 문자 절출 처리에 있어서, 사영 데이터(52)의 단락 또는 골짜기가 되는 곳을 문자 절출 좌표의 후보로 함으로써, 문자의 접촉이 빈발하고 있는 문자열이라도, 올바르게 1문자를 잘라내어 정밀도 좋게 문자 인식할 수 있다.
또한, 문자 종단 허용 오차(α)와 문자 시작단 컷트 범위(β)를 이용하여, 전각문자 인식 처리로 올바르게 인식할 수가 없는 경우에 반각문자 인식 처리를 실행함으로써, 전각문자와 반각문자를 모두 판독할 수 있다.
또한, 문자 종단 허용 오차(α)와 문자 시작단 컷트 범위(β)의 값을 표준문자 길이(La)에 대한 비율로 결정하고 있기 때문에, 판독 대상의 문자열이 세로로 긴(도 8의 (D) 참조)든지 가로로 긴(도 8의 (E) 참조) 등의 크기(종횡비) 의 차이에 관계 없이 적절히 문자를 인식할 수 있다.
또한, 문자 시작단 컷트 범위(β)를 표준문자 길이의 1/16로 함으로써, 「I」나 「1」 등의 문자폭이 작은 문자에 대해서도 적절히 대응할 수 있다.
또한, 채용할 수 있는 측정문자 길이를 소정 수(예를 들면 4개) 취득한 시점에서 표준문자 길이(La)를 결정하여 그 이후의 임시인식을 행하지 않고, 이후는 표 준문자 길이(La)를 사용하여 본인식을 행함으로써, 문자 인식에 필요로 하는 시간의 단축과, 문자 인식의 정밀도 향상을 실현할 수가 있다.
본 발명의 구성과, 상술한 실시 형태와의 대응에 있어서,
본 발명의 문자 인식 장치는, 실시 형태의 휴대 단말(1) 또는 칩(15)에 대응하고,
이하 마찬가지로,
문자열 화상 취득 수단은, 스텝 S1을 실행하는 CPU(11)에 대응하고,
측정문자 길이 취득 수단은, 문자 길이 후보 추출 처리부(32)에 대응하고,
문자 임시인식 수단은, 스텝 S6을 실행하는 표준문자 길이 산출부(33)에 대응하고,
표준문자 길이 결정 수단은, 표준문자 길이 산출부(33)에 대응하고,
문자 절출 수단은 문자 절출 처리부(34)에 대응하고,
문자 인식 수단은, 문자 인식 처리부(35)에 대응하고,
임시문자 길이는, 절출 범위(E1)에 대응하고,
축소문자 길이는, 절출 범위(E2)에 대응하고,
소정 오차는, 문자 종단 허용 오차(α)에 대응하고,
소정의 범위는, 문자 시작단 컷트 범위(β)에 대응하고,
소정의 임계치는, 기준치에 대응하고,
문자열 취득 스텝은, 스텝 S1에 대응하고,
측정문자 길이 취득 스텝은, 스텝 S4에 대응하고,
임시매칭 처리, 임시인식, 및 문자 임시인식 스텝은, 스텝 S6에 대응하고,
표준문자 길이 결정 스텝은, 스텝 S6 내지 S14에 대응하고,
제 1 절출 처리는, 스텝 S16에 대응하고,
전각문자 본매칭 처리는, 스텝 S17에 대응하고,
문자 절출 스텝은, 스텝 S16, S20에 대응하고,
문자 인식 스텝 및 본매칭 처리는, 스텝 S17, S21에 대응하고,
제 2 절출 처리는, 스텝 S20에 대응하고,
반각문자 본매칭 처리는, 스텝 S21에 대응하지만,
본 발명은, 상술한 실시 형태의 구성만으로 한정되는 것이 아니고, 많은 실시의 형태를 얻을 수 있다.
도 1은 휴대 단말의 사시도.
도 2는 휴대 단말의 구성의 블록도.
도 3은 문자의 매칭에 사용하는 사전 데이터의 구성도.
도 4는 화면 표시부에 표시하는 인식 화면의 화면 구성도.
도 5는 측정문자 길이를 추출하는 구조의 설명도.
도 6은 문자 인식 기능에 관한 플로우 차트.
도 7은 문자 인식 기능에 관한 플로우 차트.
도 8은 표준문자 길이를 결정하는 과정의 설명도.
도 9는 절출 시작 위치로부터 소정의 절출 범위의 화상을 잘라내는 전각문자 절출 처리.
도 10은 중국에서 음식점 메뉴 등에 사용되는 변형문자의 설명도.
부호의 설명
1 : 휴대 단말
11 : CPU
15 : 칩
23 : 문자 인식 프로그램
32 : 문자 길이 후보 추출 처리부
33 : 표준문자 길이 산출부
34 : 문자 절출 처리부
35 : 문자 인식 처리부
52 : 사영 데이터
E1 : 절출 범위
E2 : 절출 범위
L : 측정문자 길이
La : 표준문자 길이
P : 문자열 화상
a : 문자 종단 허용 오차
β : 문자 시작단 컷트 범위

Claims (8)

  1. 문자열 화상을 취득하는 문자열 화상 취득 수단과,
    문자열 방향의 문자 길이를 측정한 측정문자 길이를 상기 문자열 화상 취득 수단에서 취득한 문자열 화상으로부터 복수의 문자에 관해 취득하는 측정문자 길이 취득 수단과,
    취득한 측정문자 길이 내의 문자를 임시매칭 처리에 의해 임시인식하는 문자 임시인식 수단과,
    임시인식을 할 수 있게 된 문자의 상기 측정문자 길이에 의거하여 표준문자 길이를 결정하는 표준문자 길이 결정 수단과,
    결정한 표준문자 길이에 의거하여 상기 문자열 화상으로부터 인식 대상의 모든 문자를 잘라내는 문자 절출 수단과,
    잘라낸 문자를 본매칭 처리에 의해 본인식하는 문자 인식 수단을 구비한 것을 특징으로 하는 문자 인식 장치.
  2. 제 1항에 있어서,
    상기 임시매칭 처리에 의해 임시인식한 문자가, 상기 문자열 화상의 문자열 방향으로 배치된 2개의 부품문자를 결합하여 만들어지는 하나의 결합문자인 경우, 상기 표준문자 길이 결정 수단은, 상기 표준문자 길이의 결정에 이용하는 측정문자 길이로부터 해당 결합문자의 측정문자 길이를 제외하는 구성으로 한 것을 특징으로 하는 문자 인식 장치.
  3. 제 1항 또는 제 2항에 있어서,
    상기 임시매칭 처리에 의해 임시인식한 문자가, 해당 문자에 대해 문자열 방향의 전후 어느 하나의 문자를 결합하면 하나의 결합문자를 형성할 수 있는 부품문자인 경우, 상기 표준문자 길이 결정 수단은, 상기 표준문자 길이의 결정에 이용하는 측정문자 길이로부터 해당 부품문자의 측정문자 길이를 제외하는 구성으로 한 것을 특징으로 하는 문자 인식 장치.
  4. 제 1항, 제 2항 또는 제 3항에 있어서,
    상기 문자 절출 수단은,
    상기 문자열 화상을 문자열 방향과 수직한 방향으로 투사한 사영 데이터를 작성하고, 해당 사영 데이터의 단락 또는 골짜기로부터 다음의 단락 또는 골짜기까지의 임시문자 길이가 상기 표준문자 길이에 대해 소정 오차 내에 있는 문자를 잘라내는 제 1 절출 처리를 실행하는 구성으로 하고,
    상기 문자 인식 수단은, 상기 본매칭 처리로서, 잘라낸 문자에 관해 전각문자와 매칭하는 전각문자 본매칭 처리를 행하는 구성으로 하고,
    해당 전각문자 본매칭 처리에서의 매칭 신뢰도가 소정의 임계치보다 낮은 경우,
    상기 문자 절출 수단은, 상기 표준문자 길이중 문자열 전방부터 소정의 범위 와 문자열 후방부터 상기 소정 오차를 잘라버린 축소문자 길이 내에 있는 문자를 잘라내는 제 2 절출 처리를 실행하는 구성으로 하고,
    상기 문자인식 수단은, 상기 본매칭 처리로서, 잘라낸 문자에 관해 반각문자와 매칭하는 반각문자 본매칭 처리를 행하는 구성으로 한 것을 특징으로 하는 문자 인식 장치.
  5. 제 4항에 있어서,
    상기 소정 오차를 상기 표준문자 길이의 4분의1로 한 것을 특징으로 하는 문자 인식 장치.
  6. 제 4항 또는 제 5항에 있어서,
    상기 소정의 범위를 상기 표준문자 길이의 16분의1로 한 것을 특징으로 하는 문자 인식 장치.
  7. 문자열 화상을 문자열 화상 취득 수단에 의해 취득하는 문자열 취득 스텝과,
    문자열 방향의 문자 길이를 측정한 측정문자 길이를 상기 문자열 화상으로부터 복수의 문자에 관해 취득하는 측정문자 길이 취득 스텝과,
    취득한 측정문자 길이 내의 문자를 임시매칭 처리에 의해 임시인식하는 문자 임시인식 스텝과,
    임시인식을 할 수 있게 된 문자의 상기 측정문자 길이에 의거하여 표준문자 길이를 결정하는 표준문자 길이 결정 스텝과,
    결정한 표준문자 길이에 의거하여 상기 문자열 화상으로부터 인식 대상의 모든 문자를 잘라내는 문자 절출 스텝과,
    잘라낸 문자를 본매칭 처리에 의해 본인식하는 문자 인식 스텝을 컴퓨터에 실행시키는 것을 특징으로 하는 문자 인식 프로그램.
  8. 문자열 화상을 문자열 화상 취득 수단에 의해 취득하는 문자열 취득 스텝과,
    문자열 방향의 문자 길이를 측정한 측정문자 길이를 상기 문자열 화상으로부터 복수의 문자에 관해 취득하는 측정문자 길이 취득 스텝과,
    취득한 측정문자 길이 내의 문자를 임시매칭 처리에 의해 임시인식하는 문자 임시인식 스텝과,
    임시인식을 할 수 있게 된 문자의 상기 측정문자 길이에 의거하여 표준문자 길이를 결정하는 표준문자 길이 결정 스텝과,
    결정한 표준문자 길이에 의거하여 상기 문자열 화상으로부터 인식 대상의 모든 문자를 잘라내는 문자 절출 스텝과,
    잘라낸 문자를 본매칭 처리에 의해 본인식하는 문자 인식 스텝을 실행하는 것을 특징으로 하는 문자 인식 방법.
KR1020090070357A 2008-08-11 2009-07-31 문자 인식 장치, 문자 인식 프로그램, 및 문자 인식 방법 KR101050866B1 (ko)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JPJP-P-2008-206722 2008-08-11
JP2008206722A JP5146190B2 (ja) 2008-08-11 2008-08-11 文字認識装置、文字認識プログラム、および文字認識方法

Publications (2)

Publication Number Publication Date
KR20100019961A true KR20100019961A (ko) 2010-02-19
KR101050866B1 KR101050866B1 (ko) 2011-07-20

Family

ID=41347204

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020090070357A KR101050866B1 (ko) 2008-08-11 2009-07-31 문자 인식 장치, 문자 인식 프로그램, 및 문자 인식 방법

Country Status (4)

Country Link
EP (1) EP2154632B1 (ko)
JP (1) JP5146190B2 (ko)
KR (1) KR101050866B1 (ko)
CN (1) CN101650779B (ko)

Families Citing this family (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8494284B2 (en) * 2011-11-21 2013-07-23 Nokia Corporation Methods and apparatuses for facilitating detection of text within an image
JP5906788B2 (ja) 2012-02-17 2016-04-20 オムロン株式会社 文字切り出し方法、およびこの方法を用いた文字認識装置およびプログラム
JP6078953B2 (ja) * 2012-02-17 2017-02-15 オムロン株式会社 文字認識方法、およびこの方法を用いた文字認識装置およびプログラム
JP6055297B2 (ja) * 2012-12-07 2016-12-27 株式会社日立情報通信エンジニアリング 文字認識装置及び方法、文字認識プログラム
CN103020621B (zh) * 2012-12-25 2016-02-24 深圳深讯和科技有限公司 中英文混排文字图像的切割方法及装置
CN104134064B (zh) * 2013-05-02 2018-05-04 百度国际科技(深圳)有限公司 文字识别方法和装置
CN104143093B (zh) * 2013-05-10 2018-01-09 百度在线网络技术(北京)有限公司 文字识别方法和装置
CN105631450A (zh) * 2015-12-28 2016-06-01 小米科技有限责任公司 字符识别方法及装置
JP6804292B2 (ja) * 2016-12-28 2020-12-23 オムロンヘルスケア株式会社 端末装置
JP2019159633A (ja) * 2018-03-12 2019-09-19 セイコーエプソン株式会社 画像処理装置、画像処理方法および画像処理プログラム
CN111626038A (zh) * 2019-01-10 2020-09-04 北京字节跳动网络技术有限公司 背诵文本的提示方法、装置、设备及存储介质
CN112215216A (zh) * 2020-09-10 2021-01-12 中国东方电气集团有限公司 一种图像识别结果的字符串模糊匹配系统及方法

Family Cites Families (19)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2548579B2 (ja) 1987-09-19 1996-10-30 富士通株式会社 文字認識装置
JP2976445B2 (ja) 1989-07-21 1999-11-10 セイコーエプソン株式会社 文字認識装置
JPH0415776A (ja) * 1990-05-01 1992-01-21 Fuji Facom Corp 文字のサイズ情報抽出方法
EP0539158A2 (en) * 1991-10-21 1993-04-28 Canon Kabushiki Kaisha Method and apparatus for character recognition
JPH05128307A (ja) 1991-10-31 1993-05-25 Toshiba Corp 文字認識装置
JPH05128308A (ja) 1991-11-08 1993-05-25 Sumitomo Electric Ind Ltd 文字認識装置
JPH05166009A (ja) * 1991-12-13 1993-07-02 Sumitomo Electric Ind Ltd 文字切出し・認識方法及び装置
JPH05290211A (ja) * 1992-04-09 1993-11-05 Matsushita Electric Ind Co Ltd 文字種等の判別方法
US5680479A (en) * 1992-04-24 1997-10-21 Canon Kabushiki Kaisha Method and apparatus for character recognition
JP3236732B2 (ja) 1994-03-28 2001-12-10 松下電器産業株式会社 文字認識装置
JPH09106437A (ja) * 1995-10-11 1997-04-22 Ricoh Co Ltd 文字切出し装置および文字切出し方法
JP3639126B2 (ja) * 1998-01-22 2005-04-20 富士通株式会社 住所認識装置及び住所認識方法
KR100593986B1 (ko) * 2002-09-11 2006-07-03 삼성전자주식회사 영상화면 내의 글자 이미지를 인식하는 장치 및 방법
JP4346942B2 (ja) * 2003-04-14 2009-10-21 キヤノン株式会社 文字認識方法
KR20060050729A (ko) * 2004-08-31 2006-05-19 엘지전자 주식회사 카메라로 촬영된 문서 영상 처리 방법과 장치
KR101128185B1 (ko) * 2005-04-01 2012-03-23 엘지전자 주식회사 카메라 폰에서의 문자 인식 장치 및 방법
CN100347723C (zh) * 2005-07-15 2007-11-07 清华大学 基于几何代价与语义-识别代价结合的脱机手写汉字字符的切分方法
JP5041775B2 (ja) * 2006-09-28 2012-10-03 沖電気工業株式会社 文字切出方法及び文字認識装置
JP5361574B2 (ja) * 2009-07-01 2013-12-04 キヤノン株式会社 画像処理装置、画像処理方法、及びプログラム

Also Published As

Publication number Publication date
EP2154632A3 (en) 2012-03-21
EP2154632B1 (en) 2018-05-23
JP2010044485A (ja) 2010-02-25
CN101650779A (zh) 2010-02-17
JP5146190B2 (ja) 2013-02-20
EP2154632A2 (en) 2010-02-17
CN101650779B (zh) 2013-01-23
KR101050866B1 (ko) 2011-07-20

Similar Documents

Publication Publication Date Title
KR101050866B1 (ko) 문자 인식 장치, 문자 인식 프로그램, 및 문자 인식 방법
KR101805090B1 (ko) 영역 인식 방법 및 장치
CN111062312A (zh) 手势识别方法、手势控制方法、装置、介质与终端设备
JP5896245B2 (ja) テキスト画像のトリミング方法
CN105517679B (zh) 用户地理位置的确定
US9607394B2 (en) Information processing method and electronic device
CN107977394B (zh) 绘本识别方法及电子设备
US20190297297A1 (en) Video playing method and device
WO2018184255A1 (zh) 图像校正的方法和装置
CN111222397A (zh) 一种绘本识别方法、装置及机器人
US20230316529A1 (en) Image processing method and apparatus, device and storage medium
CN111104813A (zh) 二维码图像关键点检测方法、装置、电子设备及存储介质
CN113297986A (zh) 手写字符识别方法、装置、介质及电子设备
CN115131693A (zh) 文本内容识别方法、装置、计算机设备和存储介质
JP6171660B2 (ja) 情報処理装置、情報処理システム及びプログラム
KR101483611B1 (ko) 이미지에서 객체를 추출하기 위한 방법 및 단말기
CN112188108A (zh) 拍摄方法、终端和计算机可读存储介质
US11747914B2 (en) System and method for providing electric book based on reading type
JP2012226085A (ja) 電子機器、制御方法、および制御プログラム
CN115004245A (zh) 目标检测方法、装置、电子设备和计算机存储介质
JP6244887B2 (ja) 情報処理装置、画像探索方法、及びプログラム
JP5223739B2 (ja) 携帯式文字認識装置、文字認識プログラム及び文字認識方法
CN112784663A (zh) 一种文字识别方法及装置
CN110765994B (zh) 一种书本内容定位方法、装置、电子设备及存储介质
CN113420176B (zh) 搜题方法、题目框绘制方法和装置、设备及存储介质

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20140626

Year of fee payment: 4

FPAY Annual fee payment

Payment date: 20150619

Year of fee payment: 5

FPAY Annual fee payment

Payment date: 20160617

Year of fee payment: 6

FPAY Annual fee payment

Payment date: 20170616

Year of fee payment: 7

FPAY Annual fee payment

Payment date: 20180619

Year of fee payment: 8

FPAY Annual fee payment

Payment date: 20190619

Year of fee payment: 9