KR101078086B1 - 문자 인식 장치, 문자 인식 프로그램, 및 문자 인식 방법 - Google Patents

문자 인식 장치, 문자 인식 프로그램, 및 문자 인식 방법 Download PDF

Info

Publication number
KR101078086B1
KR101078086B1 KR1020100010816A KR20100010816A KR101078086B1 KR 101078086 B1 KR101078086 B1 KR 101078086B1 KR 1020100010816 A KR1020100010816 A KR 1020100010816A KR 20100010816 A KR20100010816 A KR 20100010816A KR 101078086 B1 KR101078086 B1 KR 101078086B1
Authority
KR
South Korea
Prior art keywords
character
recognition
category
characters
character recognition
Prior art date
Application number
KR1020100010816A
Other languages
English (en)
Other versions
KR20100103351A (ko
Inventor
토모요시 아이자와
Original Assignee
오므론 가부시키가이샤
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 오므론 가부시키가이샤 filed Critical 오므론 가부시키가이샤
Publication of KR20100103351A publication Critical patent/KR20100103351A/ko
Application granted granted Critical
Publication of KR101078086B1 publication Critical patent/KR101078086B1/ko

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/14Image acquisition
    • G06V30/148Segmentation of character regions
    • G06V30/153Segmentation of character regions using recognition of characters or words
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/22Matching criteria, e.g. proximity measures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Artificial Intelligence (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • General Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Character Discrimination (AREA)

Abstract

과제
문자가 포함되어 있는 화상 데이터에 대해, 간단한 조작으로 고속의 문자 인식을 실현하는 문자 인식 장치, 문자 인식 프로그램, 및 문자 인식 방법을 제공한다.
해결 수단
휴대 단말(1)에 의해, 주로 영수문자로 이루어지는 제 1 인식용 영수 문자부(24a) 및 카테고리용 문자로 이루어지는 제 1 인식 용카테고리 문자부(24b)과, 이 이외의 문자를 포함하고 이들의 문자보다도 문자수가 많은 제 2 인식용 문자에 관한 제 2 인식용 문자부(24c)를 구별 가능하게 기억하여 두고, 제 1 인식용 영수 문자부(24a) 및 제 1 인식용 카테고리 문자부(24b)에 의한 제 1 문자 인식 처리를 실행하고(스텝 S4), 그 처리에서의 매칭 신뢰도가 낮은 경우에(스텝 S5 내지 S6), 적어도 제 2 인식용 문자부(24c)에 의해 문자 인식을 실행하는 제 2 문자 인식 처리(스텝 S7)를 실행한다.

Description

문자 인식 장치, 문자 인식 프로그램, 및 문자 인식 방법{CHARACTER RECOGNITION APPARATUS, CHARACTER RECOGNITION PROGRAM AND CHARACTER RECOGNITION METHOD}
본 발명은, 예를 들면 화상 데이터에 포함되어 있는 문자를 인식하는 문자 인식 장치, 문자 인식 프로그램, 및 문자 인식 방법에 관한 것이다.
일본어나 중국어의 문자수는, 영어 등에 비하여 매우 많고, 각각 제 1 수준 한자만 3000문자 이상, 제 2 수준 한자도 합치면 6000문자 이상 있다. 이 때문에고, 일본어나 중국어 등의 문자를 인식하려고 하면, 각각의 문자의 인식 처리에서 들 3000 내지 6Q00 이상의 문자라고 대조하는 처리가 필요해진다. 이 결과, CPU에 부하가 걸리는 무거운 처리가 되고, 특히 휴대 기기와 같은 빈약한 CPU 환경하에 있어서, 처리 시간의 장시간화가 심각한 문제로 된다.
한편, 문자 인식하는 대상으로서, 예를 들면 명함 등, 기재 내용이 어느 정도 정해저 있는 문자 인쇄 매체가 존재하고 있다. 이와 같은 문자 인쇄 매체의 문자를 판독하는 장치로서, 명함의 문자를 인식하는 장치가 제안되어 있다(특허 문헌 1 내지 3 참조).
특허 문헌 1의 명함 인식 장치는, 인식 화상 범위를 유저에게 펜으로 지정시키고, 이 범위의 인식 문자를 어느 속성(이름, 회사명, 주소 등)에 등록하는지 지정시키는 것이다.
특허 문헌 2의 문자 인식 장치는, 문자 인식이 필요한 에어리어를 템플릿으로서 복수 등록하여 두고, 이 템플릿을 선택시킨 다음, 템플릿으로 정해지는 에어리어 내의 문자를 인식하는 것이다.
특허 문헌 3의 문자 인식 장치는, 키보드에 의해 인식 대상 영역을 지정시키고, 이 대상 영역에 대해 문자를 인식하는 것이다.
어느 장치도, 명함 전체를 한번에 처리하는 것은 아니고, 영역 지정한 카테고리분(分)에 대해서만 처리하는 것이다. 이 때문에, 유저가 소망하는 카테고리분에 대해 신속하게 인식 처리를 할 수 있다. 즉, 인식 처리를 행하는 범위가 유저가 소망하는 카테고리로 좁혀져 있기 때문에, 인식 처리를 빨리 할 수 있고, CPU에 걸리는 부하를 억제할 수 있다.
그러나, 이와 같은 종래 기술은, 문자 인식 범위를 좁힘으로써 인식 처리에 필요로 하는 시간을 단축하고 있지만, 그 좁힌 범위에서의 문자 인식 처리 그 자체에 관해서는 시간 단축이되어 있지 않다.
또한, 상기 종래 기술에는, 작업시간을 필요로 하고 번거롭다는 문제점이 있다. 상세히 기술하면, 상기 종래 기술은, 명함 1장마다 문자 인식시키는 범위(또는 템플릿)를 유저에게 지정시키고, 그 범위의 문자를 어느 카테고리에 대응시키는지를 설정할 필요가 있다. 이 때문에, 입력하고 싶은 명함의 수가 많으면 많을수록, 유저에게 있어서 복잡한 작업을 몇번이나 요구하게 된다.
한편, 단말 장치에 의해 명함을 화상 데이터로서 받아들이고, 받아들인 화상 데이터를 통신 네트워크를 통하여 서버에 송신하고, 서버에서 문자 인식을 행하고, 인식 결과를 서버로부터 재차 통신 네트워크를 통하여 단말 장치에 송신하는 명함 0CR 처리 시스템이 제안되어 있다(특허 문헌 4 참조).
이 방법에 의하면, 단말 장치의 CPU가 빈약해도, 서버의 CPU가 처리 능력이 높은 것이라면, 인식 처리에 필요로 하는 시간을 단축할 수 있다.
그러나, 이와 같은 통신 네트워크를 이용하는 방법은, 통신 시간이 걸린다. 이 때문에, 회선의 혼잡 정도에 따라서는 통신 시간이 장시간화된다는 문제점이 있다. 또한, 통신하는 것이 필수가 되기 때문에, 예를 들면 휴대 전화기와 같이 무선 통신을 행하는 휴대 단말로는, 지하 등 전파가 도달하지 않는 장소에서 사용할 수 없다는 문제도 생긴다.
일본국특개평10-55413호공보 일본국특개2001-202475호공보 일본국특개평2-240787호공보 일본국특개2003-296353호공보
본 발명은, 상술한 문제를 감안하여, 문자가 포함되어 있는 화상 데이터에 대해, 간단한 조작으로 고속의 문자 인식을 실현하는 문자 인식 장치, 문자 인식 프로그램, 및 문자 인식 방법을 제공하고, 이용자의 만족도를 향상시키는 것을 목적으로 하고 있다.
본 발명은, 문자 인식용의 매칭 데이터를 기억하는 기억 수단과, 화상 데이터를 취득하는 화상 데이터 취득 수단과, 상기 매칭 데이터에 의거하여 상기 화상 데이터 내의 문자를 인식하는 문자 인식 수단을 구비하는 문자 인식 장치로서, 상기 매칭 데이터는, 미리 정해진 제 1 인식 문자에 관한 제 1 인식용 매칭 데이터와, 상기 제 1 인식용 문자 이외의 문자를 포함하고 해당 제 1 인식용 문자보다도 문자수가 많은 제 2 인식용 문자에 관한 제 2 인식용 매칭 데이터를 구별 가능하게 구성되고, 상기 문자 인식 수단은, 상기 제 1 인식용 매칭 데이터에 의해 상기 화상 데이터에 관해 문자 인식을 실행하는 제 1 문자 인식 처리와, 해당 제 1 문자 인식 처리의 결과가 재인식 조건에 해당하는지의 여부를 판별하는 재인식 필요여부 판별 처리와, 해당 재인식 필요여부 판별 처리에 의해 재인식을 필요로 한다고 판별한 재인식 대상에 대해, 상기 제 2 인식용 매칭 데이터에 의해 문자 인식을 실행하는 제 2 문자 인식 처리를 실행하는 구성인 문자 인식 장치인 것을 특징으로 한다.
상기 매칭 데이터는, 문자의 특징을 나타내는 특징 데이터로 구성하는 등, 문자 인식의 매칭에 이용하는 데이터로 구성할 수 있다.
상기 기억 수단은, 하드 디스크나 불휘발성 메모리 등, 데이터를 기억하는 수단으로 구성할 수 있다.
상기 화상 데이터는, 컬러 화상이나 그레이 스케일 화상이나 모노클로 2계조 화상 등, 적절한 화상의 데이터로 할 수 있다.
상기 화상 데이터 취득 수단은, 예를 들면 CCD 카메라나 CMOS 카메라 등의 촬상 수단으로 하는, 또는, 이와 같은 촬상 수단으로 촬상한 문자열 화상의 데이터를 해당 촬상 수단으로부터 수신하는 USB(Universal Serial Bus)나 LAN(Local Area Network) 등의 통신 인터페이스로 하는 등, 화상 데이터를 취득 가능한 적절한 수단으로 구성할 수 있다.
상기 문자 인식 수단은, 예를 들면, 화상 데이터 중의 문자 화상으로부터 특징 데이터를 추출하고 해당 특징. 데이터를 매칭 데이터의 특징 데이터와 매칭하고, 어느 문자인지를 인식하는 수단으로 할 수 있다.
상기 제 1 인식용 문자는, 예를 들면 영수(英數) 문자, 카테고리 판별용 문자, 또는 이들의 복수(複數) 등, 미리 정한 적절의 문자로 할 수 있다.
상기 제 2 인식용 문자는, 예를 들면 히라가나, 가타카나, 한자, 또는 이들의 복수 등, 미리 정한 적절한 문자로 할 수 있다.
상기 문자 인식 장치는, 정보 처리를 실행하는 CPU 등의 정보 처리부와 정보 기억을 행하는 메모리 등의 정보 기억부와 외부 장치에 접속하는 접속단자 등의 인터페이스부를 갖는 반도체 칩 등의 장치로 구성하는, 또는, 촬상 수단과 제어 수단과 기억 수단을 구비한 휴대 전화기나 PDA(Porsonal Digital Assistants)나 퍼스널 컴퓨터 등의 정보 처리 단말로 구성하는 등, 적절한 장치로 구성할 수 있다.
본 발명에 의해, 화상 데이터에 대해 간단한 조작으로 고속의 문자 인식을 실현할 수 있고, 이용자의 만족도를 향상시킬 수 있다.
본 발명의 양태로서, 상기 문자 인식 수단은, 상기 화상 데이터 내의 문자군의 카테고리를 판별하는 카테고리 판별 처리를 실행하는 구성이고, 상기 제 1 인식용 매칭 데이터는, 상기 카테고리 판별에 사용되는 카테고리 판별용 문자가 포함된 구성으로 할 수 있다.
상기 카테고리 판별용 문자는,. 예를 들면 E-Mai1」, 「URL」, 「TEL」, 「FAX」, 「우편번호」, 또는 이들의 복수에 사용되는 문자 등, 카테고리 판별에 사용하는 문자로 구성할 수 있다.
이 양태에 의해, 제 1 문자 인식 처리할 때에 카테고리 판별도 실행하는 것이 가능해진다.
또한 본 발명의 양태로서, 상기 제 1 인식용 매칭 데이터는, 상기 카테고리 판별용 문자 중 2 이상의 부품으로 나누어지는 결합 문자에 대해서는 해당 결합를 요소별로 분리한 부품 문자가 포함된 구성으로 할 수 있다.
상기 결합 문자는, 문자열 방향이 좌우 방향인 경우에 편(偏)과 방(旁)으로 이루어지는 문자, 또는, 문자열 방향이 상하 방향인 경우에 관(冠))과 각(脚)으로 이루어지는 문자로 할 수 있다. 구체적으로는, 예를 들면 「話(화)」나 「住(주) 나 「所(소)」 등으로 할 수 있다.
상기 부품 문자는, 문자열 방향이 좌우 방향인 경우의 상기 결합 문자의 변(偏) 또는 방(旁)에 해당하는 문자, 또는, 문자열 방향이 상하 방향인 경우의 상기 결합 문자의 관(冠) 또는 각(脚)으로 이루어지는 문자로 할 수가 있다. 구체적으로는, 예를 들면 「言(언)」과 「舌(설)」, 「人(인)」과 「主(주)」, 「戶(호)」와 「斤(근)」 등으로 할 수 있다.
이로써, 1문자의 결합 문자를 2문자의 부품 문자라고 오인식한 경우에도, 그 오인식한 상태에서 카테고리를 올바르게 판별할 수 있다. 상세히 기술하면, 예를 들면 하나의 결합 문자인 「話(화)」를, 2개의 부품 문자 「言(언)」과 「舌(설)」로서 인식하고, 문자열을 「電言舌(전언설)」로 인식한 경우에도, 「전화(電話)」의 카테고리라고 인식할 수 있다.
또한 본 발명의 양태로서, 상기 문자 인식 수단은, 상기 카테고리 판별 처리에서 카테고리가 판별된 문자군 내에 해당 카테고리에서 사용되지 않아야 할 오인(誤認) 문자가 포함되어 있는지의 여부를 판별하고, 포함되어 있는 경우에 해당 오인 문자를 카테고리에서 사용되는 문자로 보정하는 보정 처리를 실행하는 구성으로 할 수 있다.
이로써, 예를 들면 「전화번호」의 카테고리에서 알파벳의 「Z」로 인식한 문자를 숫자의 「2」로 보정한다는 것을 할 수가 있고, 효율 좋게 인식 정밀도를 높일 수가 있다.
또본 발명의 양태로서, 상기 보정 처리는, 상기 오인 문자가 포함되어 있는 경우에, 카테고리에서 사용되는 문자만을 인식 대상으로 하여 재차 문자 인식을 실행함에 의해 보정하는 구성으로 할 수 있다.
이로써, 매칭 데이터중 카테고리에서 사용되는 문자의 데이터만을 이용하여 문자 인식할 수 있기 때문에, 고속이면서 고정밀도로 문자 인식을 실행할 수 있다.
또한 본 발명의 양태로서, 상기 제 1 문자 인식 처리는, 매칭 신뢰도가 높은 것부터 복수의 문자 후보를 구하여 놓아 가장 매칭 신뢰도가 높은 문자를 채용하는 구성이고, 상기 보정 처리는, 상기 오인 문자가 포함되어 있는 경우에, 해당 오인 문자의 문자 후보 중, 해당 카테고리에 사용되는 문자중에서 가장 매칭 신뢰도가 높은 문자로 보정하는 구성으로 할 수가 있다.
이로써, 매칭 데이터에 의한 재차의 문자 인식을 실행하지 않고서 올바른 문자로 보정할 수 있고, 고속이면서 고정밀도로 문자 인식을 완료할 수 있다.
또한 본 발명은, 미리 정하여진 제 1 인식용 문자에 관한 제 1 인식용 매칭 데이터와, 상기 제 1 인식용 문자 이외의 문자를 포함하고 해당 제 1 인식용 문자보다도 문자수가 많은 제 2 인식용 문자에 관한 제 2 인식용 매칭 데이터를 구별 가능하게 구성된 매칭 데이터를 기억 수단에 기억하여 두고, 화상 데이터 취득 수단에 의해 화상 데이터를 취득하는 화상 데이터 취득 스텝과, 상기 제 1 인식용 매칭 데이터에 의해 상기 화상 데이터에 관해 문자 인식 수단에서 문자 인식을 실행하는 제 1 문자 인식 스텝과, 해당 제 1 문자 인식 처리의 결과가 재인식 조건에 해당하는지의 여부를 상기 문자 인식 수단에서 판별하는 재인식 필요여부 판별 스텝과, 해당 재인식 필요여부 판별 처리에 의해 재인식을 필요로 한다고 판별한 재인식 대상에 대해, 상기 제 2 인식용 매칭 데이터에 의해 상기 문해 인식 수단에서 문자 인식을 실행하는 제 2 문자 인식 스텝을 컴퓨터에 실행시키는 문자 인식 프로그램으로 할 수 있다.
상기 문자 인식 프로그램은, CD(Commpact Disc), DVD(Digital Versatile Disk), 플렉시블 디스크, 메모리, 칩, 또는 하드 디스크 등, 적절한 기억 매체에 격납할 수 있다.
본 발명에 의해, 컴퓨터에 문자 인식 프로그램을 인스톨하면, 화상 데이터에 대해 간단한 조작으로 고속의 장자 인식을 실현할 수 있다.
또한 본 발명은, 미리 정해진 제 1 인식용 문자에 관한 제 1 인식용 매칭 데이터와, 상기 제 1 인식용 문자 이외의 문자를 포함하고 해당 제 1 인식용 문자보다도 문자수가 많은 제 2 인식용 문자에 관한 제 2 인식용 매칭 데이터를 구별 가능하게 구성된 매칭 데이터를 기억 수단에 기억하여 두고, 화상 데이터 취득 수단에 의해 화상 데이터를 취득하는 화상 데이터 취득 스텝과, 상기 제 1 인식용 매칭 데이터에 의해 상기 화상 데이터에 관해 문자 인융 수단에서 문자 인식을 실행하는 제 1 문자 인식 스텝과, 해당 제 1 문자 인식 처리의 결과가 재인식 조건에 해당하는지의 여부를 상기 문자 인식 수단에서 판별하는 재인식 필요여부 판별 스텝과, 해당 재인식 여부 판별 처리에 의해 재인식을 필요로 한다고 판별한 재인식 대상에 대해, 상기 제 2 인식용 매칭 데이터에 의해 상기 문자 인식 수단에서 문자 인식을 실행하는 제 2 문자 인식 스텝을 실행하는 문자 인식 방법으로 할 수 있다.
이로써, 화상 데이터에 대해 간단한 조작으로 고속의 문자 인식을 실행할 수 있다.
본 발명에 의해, 촬영된 명함 화상 등의 화상 데이터에 대해, 간단한 조작으로 고속의 문자 인식을 실현하는 문자 인식 장치, 문자 인식 프로그램, 및 문자 인식 방법을 제공하고, 이용자의 만족도를 향상시킬 수 있다.
도 1은 휴대 단말의 사시도.
도 2는 휴대 단말의 구성을 도시하는 블록도.
도 3은 사전 데이터의 구성을 설명하는 설명도,
도 4는 문자 인식 프로그램에 의한 문자 인식 처리의 플로우 차트.
도 5는 문자 인식하는 촬영 화상이나 인식 문자의 설명도.
본 발명의 한 실시 형태를 이하 도면과 함께 설명한다.
[실시예]
도 1은, 휴대 단말(1)의 사시도를 도시하고, 도 2는, 휴대 단말(1)의 구성의 블록도를 도시하고, 도 3은 사전(辭典) 데이터의 구성도를 도시한다.
휴대 단말(1)은, 도 1에 도시하는 바와 같이, 화상 입력부(3), 조작부(5), 및 화면 표시부(7)가 마련되어 있다. 화상 입력부(3)는, 화상을 촬상하는 디지털 카메라이고, 조작부(5)는, 압하 조작되는 버튼이고, 화면 표시부(7)는, 화상을 표시하는 액정 디스플레이 또는 유기 EL 디스플레이이다.
도 2에 도시하는 바와 같이, 휴대 단말(1)은, 화상 입력부(3), 조작부(5), 및 화면 표시부(7)에 더하여, CPU(11), R0M(12), 및 RAM(13)이, 버스(16)에 접속하여 마련되어 있다.
화상 입력부(3)는, CCD 카메라 또는 CMOS 카메라 등의 디지털 카메라이고, 버스(16)에 접속되어 있다. 화상 입력부(3)가 촬상하여 얻은 촬상 화상은, 디지털 화상 데이터로서 CPU(11)에 송신된다. 이 디지털 화상 데이터는, 최종적으로 별도의 기억 장치(불휘발성 메모리 등)에 기억하여도 좋다. 또한, 화상 입력부(3)는, CPU(11)로부터 촬상 신호를 받아 촬상을 시작한다.
조작부(5)는, 버스(16)에 접속되어 있다. 이 조작부(5)는, 이용자에 의해 압하 조작된 압하 신호를, 버스(16)를 통하여 CPU(11)에 송신한다.
화면 표시부(7)는, 조작 화면을 표시하는 조작 화면 표시부(7a)로서의 기능과, 문자 인식한 인식 결과를 표시하는 인식 결과 표시부(7b)로서의 기능을 갖고 있다, 이 조작 화면 표시부(7)는, 버스(16)에 접속되어 있다. CPU(11)로부터 화상 데이터가 보내 오면, 이 화상 데이터의 화상을 조작 화면 표시부(7a) 또는 인식 결과 표시부(7b)에 표시한다,
CPU(11)는, R0M(12)에 기억된 프로그램에 따라 RAM(13)을 일시 기억 영역으로 사용하여 각종 동작을 행하는 프로세서이고, 각 부분을 제어하는 제어 기능(21)과, 문자 인식 기능(22)을 갖고 있다,
이 문자 인식 기능(22)은, 문자열 추출 처리부(31), 문자 추출 처리부(32), 문자 인식 처리부(33), 인식 신뢰도 판정 처리부(34), 카테고리 판별 처리부(35), 및 인식 결과 보정 처리부(36)를 갖고 있다.
문자열 추출 처리부(31)는, 화상 데이터로부터 문자열을 추출하는 처리를 실행한다. 이 문자열의 추출은, 예를 들면 화상 데이터를 2치화하여 사영 데이터를 취득하고, 이 사영 데이터로부터 문자열과 여백을 구별하는 등, 적절한 방법에 의해 실행한다. 구체적으로는, 예를 들면 명함 등의 가로쓰기 문자에 대해 화소행 별(別)의 흑화소수로부터 상하 방향의 히스토그램을 산출하고, 소정수 이상의 흑화소의 행이 연속하여 있는 범위를 문자열로 하는, 또는 엽서의 수신인 등의 세로쓰기 문자에 대해 화소열 별의 흑화소수로부터 좌우 방향의 히스토그램을 산출하고, 소정수 이상의 흑화소의 열이 연속하여 있는 범위를 문자열로 하는 등, 적절한 방법에 의해 실행한다.
문자 추출 처리부(32)는, 상기 문자열로부터 문자를 추출하는 처리를 실행한다. 이 문자의 추출은, 가로쓰기 문자에 대해 화소열 별의 흑화소수로부터 좌우 방향의 히스토그램을 산출하고, 소정수 이상의 흑화소가 연속하고 있는 범위를 1문자로 하는, 또는 세로쓰기 문자에 대해 화소행 별의 흑화소수로부터 상하 방향의 히스토그램을 산출하고, 소정수 이상의 흑화소가 연속하고 있는 범위를 1문자로 하는 등, 적절한 방법에 의해 실행한다.
문자 인식 처리부(33)는, 매칭용 사전 데이터(24)의 매칭 정보를 이용하여 어느 문자의 매칭 정보와 일치 또는 근사하는지 판별함으로써 문자를 인식하는 처리와 함께, 매칭 신뢰도를 구하는 처리를 실행한다. 이 문자를 인식하는 처리에는, 영수자(英數字)를 중심으로 하는 특정 문자만을 고속으로 인식하는 특정 문자 인식 처리와, 모든 문자를 인식하는 전(全)문자 인식 처리가 있다.
인식 신뢰도 판정 처리부(34)는, 문자 인식 처리부(33)에서 구한 매칭 신뢰도(인식 신뢰도)가 소정의 임계치를 초과하고 있는지의 여부를 판정하는 처리를 실행한다.
카테고리 판별 처리부(35)는, 카테고리 판별용 사전 데이터(25)를 이용하여 문자열이 어느 카테고리에 속하는지를 판별하는 처리를 실행한다.
인식 결과 보정 처리부(36)는, 문자열중에 그 카테고리에서 사용되지 않는 문자가 있으면, 이 문자를 카테고리 내에서 사용되는 문자로 보정하는 처리를 실행한다.
R0M(12)은, 문자 인식 프로그램(23), 매칭용 사전 데이터(24), 및 카테고리 판별용 사전 데이터(25)를 기억하고 있다.
매칭용 사전 데이터(24)는, 도 3(A)에 도시하는 바와 같이, 문자 코드, 매칭 정보, 및 대상 카테고리에 의해 구성되어 있다.
문자 코드는, 예를 들면 Shift-JIS 등의 적절한 방식의 문자 코드이다.
매칭 정보는, 문자의 특징 데이터를 문자별로 기억하고 있다.
대상 카테고리는, 하나의 문자에 대해 복수 종류 등록되어 있다. 구체적으로는, 대상 카테고리로서 「E-Mai1」, 「URL」, 「TEL」, 「FAX」, 「우편번호」 등이 등록되어 있다.
이 매칭용 사전 데이터(24)에 기억되어 있는 데이터는, 제 1 인식용 영수 문자부(24a), 제 1 인식용 카테고리 문자부(24b), 및 제 2 인식용 문자부(24c)로 구별 가능하게 기억되어 있다.
제 1 인식용 영수 문자부(24a)는, 주로 영어, 숫자, 기호 등의 구미계 문자로 구성되어 있다.
제 1 인식용 카테고리 문자부(24b)는, 카테고리의 식별에 사용되는 문자, 즉, 매칭용 사전 데이터(24)의 대상 카테고리로서 등록된 「E-Mai1」, 「URL」, 「TEL」, 「FAX」, 「우편번호」의 어느 하나에서 사용되는 문자로 구성되어 있다.
구체적으로는, 대상 카테고리인 것을 나타내는 키 코드가 되는 「メ(메)」, 「-」, 「ル(루)」, 「ホ(호)」, 「ム(무)」, 「ぺ(페)」, 「ジ(지)」, 「電(전)」, 「話(화)」, 「フ(후)」, 「ァ(아)」, 「ッ(추)」, 「ク(쿠)」, 「ス(스)」, 「郵(우)」, 「便(편)」, 「番(번)」, 「ホ(호)」 등의 문자가 포함되어 있다. 또한, 이 문자중 「話(화)」, 「便(편)」 등의 결합 문자에 관해서는, 그 부품으로 되는 변(便)이나 방(旁)을 1문자로 한 「言(언)」, 「舌(설)」, 「人(인)」, 「更(갱)」 등의 부품 문자도 포함되어 있다.
또한, 결합 문자를 분리한 부품 문자는, 적어도 인식하고 싶은 문자열 방향으로 부품 문자가 나열하여 있는 결합 문자로 하는 것이 바람직하다. 이 문자열 방향은, 문자가 종방향으로 나열하여 있으면 종방향, 문자가 횡방향으로 나열하여 있으면 횡방향이라고 하는 등, 문자가 나열하여 있는 적절한 방향으로 할 수 있다.
제 2 인식용 문자부(24c)는, 제 1 인식용 영수 문자부(24a)와 제 1 인식용 카테고리 문자부(24b)의 어느 것에도 들어가지 않는 문자(주로 일본어문자)로 구성되어 있다.
또한, 이 제 2 인식용 문자부(24c)는, 제 1 인식용 카테고리 문자부(24b)를 포함하지 않는 구성으로 하고 있지만, 제 2 인식용 문자부(24c)의 일부를 제 1 식재용 카테고리 문자부(24b)로 하는 구성으로 하여도 좋다.
카테고리 판별용 사전 데이터(25)는, 도 3(B)에 도시하는 바와 같이, 카테고리별의 복수 파일에 의해 구성되어 있고, 각 파일에는, 그 카테고리로서 판별하는 문자열이 기억되어 있다. 문자열에는, 「電話(전화)」와 「電言舌(전언설)」을 등록하는 등, 결합 문자를 부품 문자로 한 문자열도 기억되어 있다. 또한, 카테고리 판별용 사전 데이터(25)에 기억하는 문자열은, 문자 코드의 나열로 하여도 좋다.
RAM(13)은, CPU(11)가 각종 제어나 연산에 사용하는 데이터를 일시 기억함과 함께, 화상 메모리(14)에 문장열 화상 등의 화상을 기억한다.
또한, 휴대 단말(1)에는, 무선 통신을 행하는 통신 안테나, 음성 출력을 행하는 스피커, 및 집음(集音)을 행하는 마이크로폰 등도 마련되어 있다. 이로써, 휴대 전화기로서 이용할 수 있도록 구성되어 있다.
또한, 도 2에 가상선으로 도시하는 바와 같이, CPU(11)과 R0M(12)은, 하나의 칩(15)에 탑재하여 전자 부품으로서 구성하여도 좋다. 이 경우, 칩(15)를 휴대 단말(1)에 구비하면, 간단하게 문자 인식 기능을 추가할 수 있다.
도 4는, 휴대 단말(1)의 CPU(11)가 문자 인식 프로그램(23)에 따라 실행하는 문자 인식 처리의 플로우 차트이고, 도 5는 문자 인식한 촬영 화상이나 인식 문자의 설명도이다.
우선 사전 준비로서, CPU(11)는, 이용자의 조작 입력에 응하여 명함 판독 모드 등의 문자 인식 처리가 선택되면, 화상 입력부(3)에 의해 화상 촬영이 가능한 상태로 하고, 화면 표시부(7)에 도 5(A)에 도시하는 조작 화면 표시부(7a)를 표시한다.
이 조작 화면 표시부(7a)에는, 문자 인식을 행하는 화면인 것을 나타내는 인식 화면 표시부(71), 화상 입력부(3)(카메라)에 의해 촬영하고 있는 프레뷰 화상을 동화 표시하는 프레뷰 화상 표시부(72), 앞(前)화면으로 되돌리기 위한 되돌림 버튼(73), 인식 처리를 시작하기 위한 인식 버튼(74), 및 서브메뉴를 표시하기 위한 서브메뉴 버튼(75)가 마련되어 있다.
이용자에게 인식 버튼(74)이 선택되면, CPU(11)는, 화상 입력부(3)에 의한 화상 촬영을 실행하여 문자 화상을 취득한다(스텝 S1).
CPU(11)는, 문자열 추출 처리부(31)에 의한 문자열 추출 처리를 실행하고, 문자 화상으로부터 문자열을 추출한다(스텝 52). 이 때, 회사명 표시 부분의 문자열, 성명 표시 부분의 문자열, 주소 표시 부분의 문자열 등, 복수의 문자열을 취득한다.
CPU(11)는, 변수 「i」에 「0」을 대입하여 초기화하고(스텝 S3), i번째의 추출 문자열에 관해, 문자 인식 처리부(33)에 의해 제 1 문자 인식 처리를 실행한다(스텝 S4). 이 제 1 문자 인식 처리에서는, 문자 추출 처리부(32)에 의해 문자열로부터 추출한 각 문자에 관해, 매친용 사전 데이터(24)중 제 1 인식용 영수 문자부(24a)와 제 1 인식용 카테고리 문자부(24b)만을 이용하여 문자 인식을 실행한다.
또한, 문자 추출 처리부(32)에 의한 문자 추출은, 문자와 문자의 경계를 추출하는 처리에 상당한다. 예를 들면, 문자열 화상에 관해, 문자 부분이 흑(黑)이 되도록 2치화되고, 문자열에 수직 방향으로 흑화소가 사영되고, 그 사영 데이터의 잘린 곳을 문자와 문자의 경계의 후보로 한다.
제 1 인식용 영수 문자부(24a)은, 영수문자를 중심으로 하여 구성되어 있고, 제 1 인식용 카테고리 문자부(24b)는 카테고리 판별에 사용되는 문자를 중심으로 구성되어 있기 때문에, 매칭용 사전 데이터(24)의 전(全) 문자수에 비하여 매우 양이 적다. 이 때문에, 제 1 문자 인식 처리는, 후에 설명하는 제 2 문자 인식 처리보다도 매우 고속으로 완료한다.
CPU(11)는, 인식 신뢰도 판정 처리부(34)에 의해 제 1 인식 처리에서의 매칭 신뢰도의 판정을 행한다(스텝 S5). 여기서 매칭 신뢰도의 판정은, 예를 들면 문자 단위의 매칭 신뢰리를 확인하고, 매칭 신뢰도가 가장 낮은 문자에 관해, 그 매칭 신뢰도가 재인식 조건으로서의 소정의 임계치 이상이면 문자열의 매칭 신뢰도를 0K로 하고, 그렇지 않으면 NG로 할 수 있다. 그 밖에도, 문자열 내의 각 문자의 매칭 신뢰도의 평균치를 구하교, 이 평균치가 소정의 재인식 조건으로서의 임계치 이상이면 문자열의 매칭 신뢰도를 0K로 하고, 그렇지 않으면 NG로 할 수도 있다.
또한, 이 매칭 신뢰도의 판정할 때, 각 문자에 관해, 복수의 문자 후보를 매칭 신뢰도가 높은 순서로 소정 개수 기억하여 두어도 좋다.
CPU(11)는, 매칭 신뢰도의 판정이 0K이면(스텝 S6 : Yes), 스텝 S8로 처리를 진행한다.
매칭 신뢰도의 판정이 NG이면(스텝 S6 : No), CPU(11)는, i번째의 추출 문자열에 관해, 문자 인식 처리부(33)에 의해 제 2 문자 인식 처리를 실행한다(스텝 S7). 이 제 2 문자 인식 처리에서는, 매칭용 사전 데이터(24)의 모든 데이터를 이용하여 문자 인식을 실행한다.
또한, 제 2 인식용 문자부(24c)만에 의한 문자 인식을 행하고, 제 1 문자 인식 처리에서의 매칭 신뢰도도 포함하여 가장 매칭 신뢰도가 높은 문자를 인식한 문자로 하는 구성으로 하여도 좋다.
또한, 이 제 2 문자 인식 처리에서는, 문자열로부터 문자를 추출할 때에, 결합 문자를 복수의 부품 문자로 오인식하지 않도록, 문자의 경계 후보를 검토하고, 제 1 문자 인식 처리보다도 1문자를 정밀도 좋게 잘라내는 구성으로 하여도 좋다. 이 경우, 1문자의 문자 길이를 인식하고, 해당 문자 길이 단위로 경계를 인식하면 좋다. 이 문자 길이는, 문자열 방향의 1문자의 길이를 가리키고, 예를 들면 1문자에 있어서의 문자열 방향의 화소수라고 할 수가 있다. 이로써, 문자의 인식 정밀도를 더욱 향상할 수 있다.
CPU(11)는, 변수 「i」에 1을 가산하고(스텝 S8), 「i」가 추출 문자열수에 달할 때까지(스텝 S9 : Yes), 스텝 S4로 처리를 되돌려서 반복한다.
「i」가 추출 문자열수에 달하면(스텝 S9 : N0), CPU(11)는, 변수 「i」에 「0」을 대입하여 초기화하고(스텝 S10), i번째의 추출 문자열에 관해 카테고리 판별 처리부(35)에 의해 카테고리 판별 처리를 실행한다(스텝 S11).
이 카테고리 판별 처리는, 스텝 S4, S7에서 인식한 문자의 나열이, 카테고리 판별용 사전 데이터(25)에 기억되어 있는 각 카테고리의 문자의 나열과 일치하는지 판별함에 의해 실행한다. 일치하면(매칭 신뢰도가 소정의 임계치보다 높으면), 그 카테고리라고 판별한다.
CPU(11)는, 인식 결과 보정 처리부(36)에 의해 인식 결과 보정 처리를 실행한다(스텝 S12). 이 인식 결과 보정 처리는, i번째의 추출 문자열에, 스텝 S11에서 판별한 카테고리에서 사용되지 않는 문자가 포함되어 있지 않은지 판별하고, 포함되어 있으면 보정한다.
이 보정을 행하는 인식 결과 보정 처리부(36)은, 스텝 S5 삶고 기억하고 있던 복수의 문자 후보의 매칭 신액도를 기초로, 그 카테고리에서 사용되는 문자로 가장 매칭 신뢰도가 높은 문자로 보정한다. 그 카테고리에서 사용되는 문자로 매칭 신뢰도가 높은 문자가 없으면, 그 카테고리에서 사용되는 문자만을 대상으로 하여 재차 문자 인식 처리를 행하고, 인식한 문자로 보정한다.
또한, 이 보정은, 매칭용 사전 데이터(24)중 그 카테고리의 문자만을 사용하여 재차 문자 인식 처리를 실행하는 등, 적절한 방법에 의해 실행하면 좋다.
CPU(11)는, 변수 「i」에 1을 가산하고(스텝 S13), 「i」가 추출 문자열수에 달할 때까지(스텝 S14 : Yes), 스텝 S11로 처리를 되돌려서 반복한다. 「i」가 추출 문자열수에 달하면(스텝 S14 : N0), CPU(11)는, 도 5(B)에 도시하는 인식 결과 표시부(7b)를 화면 표시부 7에 표시하고 처리를 종료한다.
이 문자 인식 처리에 의해, 도 5에 도시한 예이라면, 다음과 같이 처리된다.
우선, 문자열 추출 처리(스텝 S2)에 의해, 도 5(B)에 도시하는 바와 같이, (1) 내지 (9)의 각 문자열이 인식된다.
이 (1) 내지 (9)의 각 문자열에 대해 순번대로 제 1 문자 인식 처리(스텝 S4)를 실행함으로써, 제 1 인식용 영기문자부(24a)와 제 1 인식용 카테고리 문자부(24b)에서 문자 인식할 수 있는 카테고리의 문자 인식을 할 수 있다. 즉, (4)의 우편번호, (6)의 전화 번호, (7)의 FAX, (8)의 E-mai1, 및 (9)의 URL를 인식할 수 있다.
이 때, 제 1 인식용 카테고리 문자부(24b)에는, 결합 문자를 부품으로 분리한 부품 문자도 등록하고 있기 때문에, 도 5(C)에 도시하는 바와 같이, 정함 문자 「話(화)」를 「言(언)」과 「舌(설)」로 분리하여 문자를 잘라내고 있던 경우에도, 그대로 「言(언)」과 「舌(설)」로서 인식한다.
도 5(B)의 (1) (2) (3) (5)는 매칭 신뢰도가 낮기 때문에, 제 2 문자 인식 처리(스텝 S7)를 실행하여 모든 문자를 사용한 문자 인식을 행한다. 이로써, 도 5(B)의 (1) (2) (3) (5)에관해서도 문자 인식을 할 수 있다,
그 후, 카테고리 판별 처리(스텝 S11)에 의해, 각 문자열의 카테고리를 판별할 수 있다. 이 카테고리 판별시에, 「電話(전화)」와 같이 결합 문자가 포함되는 카테고리는, 「電言舌(전언설)」과 같이 결합 문자를 부품 문자로 한 문자열도 카테고리 판별용 사전 데이터(25)에 등록되어 있기 때문에, 올바른 카테고리를 정밀도 좋게 용이하게 인식할 수 있다.
즉, 가령 결합 문자를 정확하게 인식하려고 하면, 문자 추출할 때에 2문자로 하여 버리지 않기 위해 문자의 경계 후보를 검토하는 처리가 필요하게 되어 계산량이 많아진다. 그러나, 이와 같은 처리를 하지 않아도, 2문자로 하여 그대로 인식하여 카테고리를 판별하기 때문에, 문자의 경계가 대충 정해지고, 그만큼 고속으로 처리할 수 있다. 이 경계 처리의 시간 삭감량은, 결합 문자를 부품 문자의 모임이라고 인식하기 위한 비교 대상의 증가에 의한 시간 증가량보다 훨씬 크기 때문에, 전체의 처리 시간을 단축할 수 있다.
또한, 인식 결과 보정 처리(스텝 S12)에 의해, 판별한 카테고리의 문자열에 대해, 그 카테고리에서 사용되지 않는 문자를 배제한 인식으로 보정하기 때문에, 정밀도가 좋은 문자 인식을 할 수 있다.
구체적으로는, 예를 들면, 도 5(B)의 (6)의 「電話(전화) ; (075) 1234-5678」는, 카테고리가 「TEL」의 문자열이다. 이것을, 제 1 문자 인식 처리에 「電話(전화) : (075)1Z34-5678」로 오인식한 경우, 「Z」는 카테고리 「TEL」에서는 사용되는 일가 없는 문자이기 때문에, 이에 대해 보정 처리를 행하고, 카테고리 「TEL」에서 사용되는 「2」로 보정한다. 이로서 인식 정밀도를 향상함과 함께, 유저가 위화감을 느끼는 인식 결과의 출력을 억제할 수 있다.
이상의 구성 및 동작에 의해, 화상 데이터에 대해 간단한 조작으로 고속의 문자 인식을 실현할 수 있고, 이용자의 만족도를 향상시킬 수 있다.
한정된 문자로의 제 1 문자 인식 처리를 실행한 후에, 매칭 신뢰도가 임계치보다 낮은 문자열만 제 2 문자 인식 처리를 실행하기 때문에, 연산 처리의 부하를 경감할 수 있고, 일본어나 중국어라는 문자수가 많은 언어라도 전체로서 고속으로 문자 인식할 수 있다. 특히, 빈약한 CPU라도 충분히 고속으로 문자 인식할 수 있다.
상세히 기술하면, 제 1 문자 인식 처리에서는, 제 1 인식용 영수 문자부(24a)로서 영어, 숫자, 기호 등의 구미계의 문자만(약 100문자)과, 더욱 적은 제 1 인식용 카테고리 문자부(24b)만을 이용하기 때문에, 전(全)문자에서의 대조를 행하는 경우보다도 수배 이상 고속으로 처리할 수 있다.
또한, 명함의 판독에서는, 「E-Mail」, 「URL」, 「TEL」, 「FAX」 , 「우편번호」를 나타내는 문자열은, 대강 영어, 삭우, 기호 등의 구미계의 문자로 구성되어 있다. 그 중 특히 「E-Mail」, 「URL」는, 「성명」, 「회사명」 등 다른 것을 나타내는 문자열과 비교하여, 길은 문자열인 것이 많다. 따라서, 명함중에 있어서, 영어, 숫자, 기호 등의 구미계의 문자가 차지하는 비율이 큰 것이 일반적이다. 이 비율이 큰 영어, 숫자, 기호 등의 구미계의 문자만을 대상으로 한 가벼운 제 1 문자 인식 처리를 최초에 실행함에 의해, 그들의 문자로 구성되는 「E-Mail」, 「URL」, 「TEL」, 「FAX」, 「우편번호」를 나타내는 문자열을 확정하여 버릴 수 있다. 그리고, 그 밖의 문자열에 관해서만, 일본어나 중국어 등도 대상으로 한 무거운 제 2 문자 인식 처리를 함으로써, 결과, 전체로서 명함 판독의 처리 속도를 향상할 수 있다.
또한, 제 1 문자 인식 처리에서, 제 1 인식용 카테고리 문자부(24b)에 의해, 카테고리를 나타내는 키워드의 문자도 대상으로 하기 때문에, 「E-Mail」, 「URL」, 「TEL」, !FAX」, 「우편번호」를 나타내는 문자열을 제 1 문자 인식 처리에서 확실하게 인식할 수 있다.
상세히 기술하면, 「E-Mai1」, 「URL」, 「TEL」, 「FAX」, 「우편번호」 등의 카테고리를 나타내는 키워드로서, 「メ(메)」, 「-」, 「ル(루)」, 「ホ(호)」,
「ム(무)」, 「ぺ(페)」, 「ジ(지)」와 같은 구미계 이외의 문자가 명함에 포함되어 있는 경우가 있다. 예를 들면, 「メ-ル(메일) : abc@****,co.jp」, 「ホ-ムぺ-ジ(홈페이지) : http;//www,****,co.jp」 등이 해당한다.
이 때문에, 가령 제 1 문자 인식 처리할 때에 제 1 인식용 카테고리 문자부(24b)의 문자가 없으면, 인식할 때의 매칭 신뢰도가 나빠지고, 「E-Mai1」, 「URL」, 「TEL」, 「FAX」, 「우편번호」를 나타내는 문자열을 최초에 확정할 수가 없는 경우가 발생한다. 이에 대해, 제 1 인식용 카테고리 문자부(24b)를 이용함으로써, 이 문제를 해소할 수 있다.
또한, 문자의 경계를 검토할 필요성을 삭감하고, 처리를 고속으로 할 수 있다. 상세히 기술하면, 편(偏)과 방(旁)으로 이루어지는 「화(話)」 등의 결합 문자에 관해서는, 올바르게 인식하려고 하면, 일반적으로 각각의 부품으로 분리한 부품 문자 「言(언)」 「혀」의 2문자로서 인식하지 않도록 경계를 검토하는 처리가 필요해진다. 그러나, 영어, 삭우, 기호 등의 구미계의 문자는, 이와 같은 결합 문자가 없기 때문에, 경계를 검토할 필요가 없음에도 불구하고 「E-Mai1」, 「URL」, 「TEL」, 「FAX」, 「우편번호」라는 카테고리의 문자를 인식하기 위해, 드물게 섞이는 일이 있는 「電話(전화)」 등의 결합 문자를 위해, 모든 문자에 대해 경계 검토의 처리를 실행한다면 처리 시간이 길어진다.
이에 대해, 제 1 문자 인식 처리에서는, 결합 문자를 부품에 분리한 부품 문자도 등록하고 있기 때문에, 문자의 경계를 검토할 필요가 없고, 고속으로 처리할 수 있다.
특히, 결합 문자가 포함되는 것은, 예를 들면 「電話(전화)」나 「우편번호」의 표시 등, 카테고리를 나타내는 표시 부분으로 한정되고, 카테고리의 내용의 정보(실제의 전화번호나 우편번호 등)에는 포함되어 있지 않다. 그리고, 이 카테고리의 표시 부분은, 「電言舌(전언설)」로 인식하여도, 「電話(전화)」카테고리인 것으로 인식할 수 있다면 좋다. 이 특성을 이용하여, 결합 문자를 분리한 부품 문자도 등록하여 인식하고 있기 때문에, 결합 문자를 부품 문자로서 인식함에 의한 폐해를 발생시키는 일 없이(예를 들면 「電言舌(전언설)」로 인식하여도 문자 「電言舌(전언설)」을 등록하는 것이 아니다), 고속으로 처리할 수 있다.
또한, 카테고리를 인식한 문자열에 관해서는, 남정 처리를 실행할 수 있기 때문에, 인식 정밀도를 향상함과 함께, 유저가 위화감을 느끼는 인식 결과의 출력을 억제할 수 있다.
또한, 문자열 추출 처리부(31)에 의해 문자열을 추출하고, 카테고리 판별 처리부(35)에서 카테고리까지 판별하기 때문에, 이용자가 문자 인식 영역을 조작에 의해 지정하는 수고나, 지정한 영역의 카테고리를 선택 조작하는 수고를 삭감할 수 있고, 편리성을 향상할 수 있다.
또한, 문자 인식 프로그램(23)은, 인터넷 등의 전기통신 회선에 접속된 서버의 기억 수단에 기억하여 두고, 전기통신 회선을 통하여 다운코드 가능하게 하는, 또는 전기통신 회선을 통하여 ASP(App1imtim Service Provider)의 서비스로서 이용 가능하게 하는 구성으로 하는 것도 가능하다. 이 경우, 통신 부하가 걸리지만, 서버의 연산 처리의 부하를 경감할 수 있다.
본 발명의 구성과, 상술한 실시 형태의 대응에 있어서,
본 발명의 문자 인식 장치 및 컴퓨터는, 실시 형태의 휴대단말(1)에 대응하고,
이하 마찬가지로,
화상 데이터 취득 수단은, 화상 입력부(3)에 대응하고,
문자 인식 수단은, CPU(11)에 대응하고,
기억 수단은, R0M(12)에 대응하고,
매칭 데이터는, 매칭용 사전 데이터(24)에 대응하고,
제 1 인식용 매칭 데이터는, 제 1 인식용 영수 문자부(24a) 및 제 1 인식용 카테고리 문자부(24b)에 대응하고,
제 2 인식용 매칭 데이터는, 제 1 인식용 영수 문자부(24a), 제 1 인식용 카테고리 문자부(24b), 및 제 2 인식용 문자부(24c)에 대응하고,
카테고리 판별용 문자은, 제 1 인식용 카테고리 문자부(24b)에 대응하고,
화상 데이터제 취들 스텝은, 스텝 S1에 대응하고,
제 1 문자 인식 처리 및 제 1 문자 인식 스텝은, 스텝 S4에 대응하고,
재인식 필요여부 판별 처리 및 재인식 필요여부 판별 스텝은, 스텝 S5 내지 S6에 대응하고,
제 2 문자 인식 처리 및 제 2 문자 인식 스텝은, 스텝 S7에 대응하고,
카테고리 판별 처리는, 스텝 S11에 대응하고,
보정 처리는, 스텝 S12에 대응하고,
제 1 인식용 문자는, 영어, 숫자, 기호, 카테고리용 문자에 대응하고,
제 2 인직용 문자는, 전문자에 대응하지만,
본 발명은, 상술한 실시 형태의 구성만으로 한정되는 것이 아니고, 많은 실시의 형태를 얻을 수 있다.
본 발명은, 문자를 인식하는 장치에 이용할 수 있고, 특히, 명함의 판독, 엽서나 봉투의 수신자 명의 판독 등, 어느 정도 기재 항목(카테고리)이 정해져 있는 문자 표시 매체로부터 문자를 인식하는 장치에 이용할 수 있다.
1 : 휴대 단말
3 : 화상 입력부
11 : CPU
13 : RAM
2 요 : 문자 인식 프로그램
24 : 매칭용 사전 데이터
24a : 제 1 인식용 영수 문자부
24b : 제 1 인식용 카테고리 문자부
24c : 제 2 인식용 문자부

Claims (8)

  1. 문자 인식용의 매칭 데이터를 기억하는 기억 수단과,
    화상 데이터를 취득한 화상 데이터 취득 수단과,
    상기 매칭 데이터에 의거하여 상기 화상 데이터 내의 문자를 인식하는 문자 인식 수단을 구비한 문자 인식 장치로서,
    상기 매칭 데이터는,
    미리 정해진 제 1 인식용 문자에 관한 제 1 인식용 매칭 데이터와,
    상기 제 1 인식용 문자 이외의 문자를 포함하고 해당 제 1 인식용 문자보다도 문자수가 많은 제 2 인식용 문자에 관한 제 2 인식용 매칭 데이터를 구별 가능하게 구성되고,
    상기 문자 인식 수단은,
    상기 제 1 인식용 매칭 데이터에 의해 상기 화상 데이터에 관해 문자 인식을 실행하는 제 1 문자 인식 처리와,
    해당 제 1 문자 인식 처리의 결과가 재인식 조건에 해당하는지의 여부를 판별하는 재인식 필요여부 판별 처리와,
    해당 재인식 필요여부 판별 처리에 의해 재인식을 필요로 한다고 판별한 재인식 대상에 대해, 상기 제 2 인식용 매칭 데이터에 의해 문자 인식을 실행하는 제 2 문자인 식 처리를 실행하는 구성인 것을 특징으로 하는 문자 인식 장치.
  2. 제 1항에 있어서,
    상기 문자 인식 수단은, 상기 화상 데이터 내의 문자군의 카테고리를 판별하는 카테고리 판별 처리를 실행하는 구성이고,
    상기 제 1 인식용 매칭 데이터는, 상기 카테고리 판별에 사용되는 카테고리 판별용 문자가 포함된 구성인 것을 특징으로 하는 문자 인식 장치.
  3. 제 2항에 있어서,
    상기 제 1 인식용 매칭 데이터는, 상기 카테고리 판별용 문자중 2 이상의 부품으로 나누어지는 결합 문자에 관해서는 해당 결합을 요소별로 분리한 부품 문자가 포함된 구성인 것을 특징으로 하는 문자 인식 장치
  4. 제 2항 또는 제 3항에 있어서,
    상기 문자 인식 수단은,
    상기 카테고리 판별 처리에서 카테고리가 판별된 문자군 내에 해당 카테고리에서 사용되지 않아야 할 오인 문자가 포함되어 있는지의 여부를 판별하고, 포함되어 있는 경우에 해당 오인 문자를 카테고리에서 사용되는 문자로 보정하는 보정 처리를 실행하는 구성으로 한 것을 특징으로 하는 문자 인식 장치.
  5. 제 4항에 있어서,
    상기 보정 처리는,
    상기 오인 문자가 포함되어 있는 경우에, 카테고리에서 사용되는 문자만을 인식 대상으로 하여 재차 문자 인식을 실행함에 의해 보정하는 구성인 것을 특징으로 하는 문자 인식 장치.
  6. 제 4항에 있어서,
    상기 제 1 문자 인식 처리는, 매칭 신뢰도가 높은 것부터 복수의 문자 후보를 구하여 놓아 가장 매칭 신뢰도가 높은 문자를 채용하는 구성이고,
    상기 보정 처리는,
    상기 오인 문자가 포함되어 있는 경우에, 해당 오인 문자의 문자 후보 중, 해당 카테고리에 사용되는 문자중에서 가장 매칭 신뢰도가 높은 문자로 보정하는 구성인 것을 특징으로 하는 문자 인식 장치.
  7. 미리 정해진 제 1 인식용 문자에 관한 제 1 인식용 매칭 데이터와, 상기 제 1 인식용 문자 이외의 문자를 포함하고 해당 제 1 인식용 문자보다도 문자수가 많은 제 2 인식용 문자에 관한 제 2 인식용 매칭 데이터를 구별 가능하게 구성된 매칭 데이터를 기억 수단에 기억하여 두고,
    화상 데이터 취득 수단에 의해 화상 데이터를 취득하는 화상 데이터 취득 스텝과,
    상기 제 1 인식용 매칭 데이터에 의해 상기 화상 데이터에 관해 문자 인식 수단에서 문자 인식을 실행하는 제 1 문자 인식 스텝과,
    해당 제 1 문자 인식 처리의 결과가 재인식 조건에 해당하는지의 여부를 상기 문자 인식 수단에서 판별하는 재인식 필요여부 판별 스텝과,
    해당 재인식 필요여부 판별 처리에 의해 재인식을 필요로 한다고 판별한 재양식 대상에 대해, 상기 제 2 인식용 매칭 데이터에 의해 상기 문자 인식 수단에서 문자 인식을 실행하는 제 2 문자 인식 스텝을 컴퓨터에 실행시키는 것을 특징으로 하는 문자 인식 프로그램이 기록된 기록 매체.
  8. 미리 정해진 제 1 인식용 문자에 관한 제 1 인식용 매칭 데이터와, 상기 제 1 인식용 문자 이외의 문자를 포함하고 해당 제 1 인식용 문자보다도 문자수가 많은 제 2 인식용 문자에 관한 제 2 인식용 매칭 데이터를 구별 가능하게 구성된 매칭 데이터를 기억 수단에 기억하여 두고,
    화상 데이터 취득 수단에 의해 화상 데이터를 취득하는 화상 데이터 취득 스텝과,
    상기 제 1 인식용 매칭 데이터에 의해 상기 화상 데이터에 관해 문자 인식 수단에서 문자 인식을 실행하는 제 1 문자 인식 스텝과,
    해당 제 1 문자 인식 처리의 결과가 재인식 조건에 해당하는지의 여부를 상기 문자 인식 수전에서 판별하는 재인식 필요여부 판별 스텝과,
    해당 재인식 필요여부 판별 처리에 의해 재인식을 필요로 한다고 판별한 재인식 대상에 대해, 상기 제 2 인식용 매칭 데이터에 의해 상기 문자 인식 수단에서 문자 인식을 실행하는 제 2 문자 인식 스텝을 실행하는 것을 특징으로 하는 문자 인식 방법.
KR1020100010816A 2009-03-13 2010-02-05 문자 인식 장치, 문자 인식 프로그램, 및 문자 인식 방법 KR101078086B1 (ko)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP2009061148A JP2010217996A (ja) 2009-03-13 2009-03-13 文字認識装置、文字認識プログラム、および文字認識方法
JPJP-P-2009-061148 2009-03-13

Publications (2)

Publication Number Publication Date
KR20100103351A KR20100103351A (ko) 2010-09-27
KR101078086B1 true KR101078086B1 (ko) 2011-10-28

Family

ID=42717725

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020100010816A KR101078086B1 (ko) 2009-03-13 2010-02-05 문자 인식 장치, 문자 인식 프로그램, 및 문자 인식 방법

Country Status (3)

Country Link
JP (1) JP2010217996A (ko)
KR (1) KR101078086B1 (ko)
CN (1) CN101833661A (ko)

Families Citing this family (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5143291B2 (ja) * 2011-04-20 2013-02-13 株式会社東芝 画像処理装置、方法、および立体画像表示装置
JP6472218B2 (ja) * 2014-11-17 2019-02-20 株式会社日立情報通信エンジニアリング 文字認識システム及び文字認識方法
CN106372634A (zh) * 2015-07-21 2017-02-01 无锡天脉聚源传媒科技有限公司 一种繁体字的识别方法及装置
JP6878034B2 (ja) 2017-02-10 2021-05-26 キヤノン株式会社 情報処理装置、制御方法、およびプログラム
CN110135425B (zh) * 2018-02-09 2021-02-26 北京世纪好未来教育科技有限公司 样本标注方法及计算机存储介质
GB2571530B (en) 2018-02-28 2020-09-23 Canon Europa Nv An image processing method and an image processing system
CN108564079B (zh) * 2018-05-08 2022-07-19 东华大学 一种便携式字符识别装置及方法
JP7492226B2 (ja) 2018-12-13 2024-05-29 成典 田中 移動物追跡装置
JP7338158B2 (ja) * 2019-01-24 2023-09-05 富士フイルムビジネスイノベーション株式会社 情報処理装置及びプログラム
JP7274322B2 (ja) * 2019-03-25 2023-05-16 東芝テック株式会社 プログラム及び文字認識方法

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH1055413A (ja) 1996-08-09 1998-02-24 Matsushita Electric Ind Co Ltd 名刺認識装置
JP2001202475A (ja) 2000-01-19 2001-07-27 Sharp Corp 文字認識装置及び文字認識装置の制御方法

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3452774B2 (ja) * 1997-10-16 2003-09-29 富士通株式会社 文字認識方法
JP4704601B2 (ja) * 2000-11-01 2011-06-15 富士通株式会社 文字認識方法,プログラム及び記録媒体
JP4597644B2 (ja) * 2003-11-28 2010-12-15 シャープ株式会社 文字認識装置、プログラムおよび記録媒体
JP2006065477A (ja) * 2004-08-25 2006-03-09 Fuji Xerox Co Ltd 文字認識装置
JP4759963B2 (ja) * 2004-09-22 2011-08-31 沖電気工業株式会社 複数の認識辞書を利用した文字認識装置
JP4800144B2 (ja) * 2006-08-08 2011-10-26 シャープ株式会社 文字列判定装置、文字列判定方法、文字列判定プログラムおよびコンピュータ読み取り可能な記録媒体

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH1055413A (ja) 1996-08-09 1998-02-24 Matsushita Electric Ind Co Ltd 名刺認識装置
JP2001202475A (ja) 2000-01-19 2001-07-27 Sharp Corp 文字認識装置及び文字認識装置の制御方法

Also Published As

Publication number Publication date
KR20100103351A (ko) 2010-09-27
JP2010217996A (ja) 2010-09-30
CN101833661A (zh) 2010-09-15

Similar Documents

Publication Publication Date Title
KR101078086B1 (ko) 문자 인식 장치, 문자 인식 프로그램, 및 문자 인식 방법
US11170248B2 (en) Video capture in data capture scenario
US9589198B2 (en) Camera based method for text input and keyword detection
JP4364914B2 (ja) 画像文書処理装置、画像文書処理方法、プログラム、及び記録媒体
US8965126B2 (en) Character recognition device, character recognition method, character recognition system, and character recognition program
US8208765B2 (en) Search and retrieval of documents indexed by optical character recognition
US8160402B2 (en) Document image processing apparatus
TWI231920B (en) Character recognition apparatus and method
US20150213333A1 (en) Method and device for realizing chinese character input based on uncertainty information
JP5146190B2 (ja) 文字認識装置、文字認識プログラム、および文字認識方法
US20050268231A1 (en) Method and device for inputting Chinese phrases
CN108564079B (zh) 一种便携式字符识别装置及方法
JP2006092027A (ja) 文字認識装置、文字認識方法および文字認識プログラム
JP7206729B2 (ja) 情報処理装置及びプログラム
US10217020B1 (en) Method and system for identifying multiple strings in an image based upon positions of model strings relative to one another
US20150261735A1 (en) Document processing system, document processing apparatus, and document processing method
JP4597644B2 (ja) 文字認識装置、プログラムおよび記録媒体
JP4800144B2 (ja) 文字列判定装置、文字列判定方法、文字列判定プログラムおよびコンピュータ読み取り可能な記録媒体
US20210182477A1 (en) Information processing apparatus and non-transitory computer readable medium storing program
JP5298830B2 (ja) 画像処理プログラム、画像処理装置及び画像処理システム
JP2010218043A (ja) 文字情報取得装置、文字情報取得プログラム、および文字情報取得方法
JP5277750B2 (ja) 画像処理プログラム、画像処理装置及び画像処理システム
US11210564B2 (en) Information processing apparatus for character recognition and non-transitory computer readable medium
JP4431335B2 (ja) 文字列読み取りプログラム
US20190318190A1 (en) Information processing apparatus, and non-transitory computer readable medium

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20141007

Year of fee payment: 4

FPAY Annual fee payment

Payment date: 20150917

Year of fee payment: 5

FPAY Annual fee payment

Payment date: 20160921

Year of fee payment: 6

FPAY Annual fee payment

Payment date: 20170920

Year of fee payment: 7

FPAY Annual fee payment

Payment date: 20181004

Year of fee payment: 8

FPAY Annual fee payment

Payment date: 20191002

Year of fee payment: 9