KR20150116821A - 문자인식 시스템, 문자인식 프로그램 및 문자인식방법 - Google Patents

문자인식 시스템, 문자인식 프로그램 및 문자인식방법 Download PDF

Info

Publication number
KR20150116821A
KR20150116821A KR1020157018711A KR20157018711A KR20150116821A KR 20150116821 A KR20150116821 A KR 20150116821A KR 1020157018711 A KR1020157018711 A KR 1020157018711A KR 20157018711 A KR20157018711 A KR 20157018711A KR 20150116821 A KR20150116821 A KR 20150116821A
Authority
KR
South Korea
Prior art keywords
character
recognition
display
dictionary
information
Prior art date
Application number
KR1020157018711A
Other languages
English (en)
Other versions
KR102024127B1 (ko
Inventor
데루오 아이바라
Original Assignee
가부시키가이샤 파인덱스
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 가부시키가이샤 파인덱스 filed Critical 가부시키가이샤 파인덱스
Publication of KR20150116821A publication Critical patent/KR20150116821A/ko
Application granted granted Critical
Publication of KR102024127B1 publication Critical patent/KR102024127B1/ko

Links

Images

Classifications

    • G06K9/344
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/14Image acquisition
    • G06V30/148Segmentation of character regions
    • G06V30/153Segmentation of character regions using recognition of characters or words
    • G06K9/342
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T1/00General purpose image data processing
    • G06T1/60Memory management
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T11/002D [Two Dimensional] image generation
    • G06T11/60Editing figures and text; Combining figures or text
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/20Image preprocessing
    • G06V10/26Segmentation of patterns in the image field; Cutting or merging of image elements to establish the pattern region, e.g. clustering-based techniques; Detection of occlusion
    • G06V10/267Segmentation of patterns in the image field; Cutting or merging of image elements to establish the pattern region, e.g. clustering-based techniques; Detection of occlusion by performing operations on regions, e.g. growing, shrinking or watersheds
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/22Character recognition characterised by the type of writing
    • G06V30/224Character recognition characterised by the type of writing of printed characters having additional code marks or containing code marks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/24Character recognition characterised by the processing or recognition method
    • G06V30/242Division of the character sequences into groups prior to recognition; Selection of dictionaries
    • G06V30/244Division of the character sequences into groups prior to recognition; Selection of dictionaries using graphical properties, e.g. alphabet type or font
    • G06V30/245Font recognition
    • GPHYSICS
    • G09EDUCATION; CRYPTOGRAPHY; DISPLAY; ADVERTISING; SEALS
    • G09GARRANGEMENTS OR CIRCUITS FOR CONTROL OF INDICATING DEVICES USING STATIC MEANS TO PRESENT VARIABLE INFORMATION
    • G09G5/00Control arrangements or circuits for visual indicators common to cathode-ray tube indicators and other visual indicators
    • G09G5/36Control arrangements or circuits for visual indicators common to cathode-ray tube indicators and other visual indicators characterised by the display of a graphic pattern, e.g. using an all-points-addressable [APA] memory
    • G09G5/39Control of the bit-mapped memory

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Multimedia (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Computer Hardware Design (AREA)
  • Character Discrimination (AREA)

Abstract

(과제) 본 발명은, 컴퓨터의 디스플레이 상에 표시되는 문자를 높은 확률로 인식할 수 있는 문자인식 시스템을 제공한다.
(해결수단) 문자인식 시스템(1)은, 컴퓨터의 디스플레이(30) 상에 표시되는 문자를 인식하기 위한 문자인식 시스템(1)에 있어서, 소정의 표시 폰트 및 문자 사이즈의 조합에 대하여, 당해 표시 폰트 및 문자 사이즈를 갖는 각 문자의 구성 도트의 배치에 관한 정보를 갖는 인식사전을 기록하여 두는 기억장치(12)와, 인식사전을 참조하여 디스플레이(30) 상에 표시되는 인식대상문자의 구성 도트의 배치에 관한 정보와 완전하게 일치하는 문자를 추출함으로써 인식대상문자를 특정하는 문자인식부(25)를 구비한다.

Description

문자인식 시스템, 문자인식 프로그램 및 문자인식방법{CHARACTER RECOGNITION SYSTEM, CHARACTER RECOGNITION PROGRAM AND CHARACTER RECOGNITION METHOD}
본 발명은 문자인식 시스템(文字認識 system)에 관한 것이다.
종이에 인쇄된 문자를 광학적(光學的)으로 읽어내어 인식하기 위한 광학문자인식 시스템이 종래부터 제공되고 있으며, 예를 들면 다음의 특허문헌1, 2에 개시되어 있다.
한편 다음의 특허문헌3에 개시되어 있는 바와 같이 시스템 사이나 애플리케이션(application) 사이에서 데이터 교환(data 交換)을 하기 위하여 컴퓨터(computer)의 디스플레이(display) 상에 표시된 문자를, 화면 캡처(畵面 capture)에 의한 화상 데이터(畵像 data)를 통하여 인식하겠다는 수요가 있다.
: 일본국 공개특허 특개2008-305126호 공보 : 일본국 공개특허 특개2010-26805호 공보 : 일본국 공개특허 특개2011-81537호 공보
그러나 종이에 인쇄된 문자와 비교하여, 디스플레이 상의 표시문자는 도트 해상도(dot 解像度)가 조잡하기 때문에, 종래의 광학문자인식의 방법을 채용하더라도 인식률(認識率)이 크게 저하되어 버리는 경우가 있었다. 특히 표시 데이터량(表示 data量)을 늘리기 위하여 사용되는 작은 사이즈의 문자에 대해서는, 인식률이 극단적으로 낮아져 버린다.
본 발명은, 이러한 과제를 고려하여 이루어진 것으로서, 컴퓨터의 디스플레이 상에 표시되는 문자를 높은 확률로 인식할 수 있는 문자인식 시스템을 제공하는 것을 목적으로 한다.
상기 과제를 해결하기 위하여 본 발명에 관한 문자인식 시스템은, 컴퓨터의 디스플레이 상에 표시되는 문자를 인식하기 위한 문자인식 시스템에 있어서, 소정의 표시 폰트 및 문자 사이즈의 조합에 대하여, 당해 표시 폰트 및 문자 사이즈를 갖는 각 문자의 구성 도트의 배치에 관한 정보를 갖는 인식사전을 기록하여 두는 기억장치와, 상기 인식사전을 참조하여, 상기 디스플레이 상에 표시되는 인식대상문자의 구성 도트의 배치에 관한 정보와 완전하게 일치하는 문자를 추출함으로써 상기 인식대상문자를 특정하는 문자인식부를 구비하는 것을 특징으로 한다.
또한 본 발명에 관한 문자인식 프로그램은, 디스플레이 상에 표시되는 문자를 컴퓨터에 인식시키기 위한 문자인식 프로그램에 있어서, 소정의 표시 폰트 및 문자 사이즈의 조합에 대하여, 당해 표시 폰트 및 문자 사이즈를 갖는 각 문자의 구성 도트의 배치에 관한 정보를 갖는 인식사전을 작성하는 인식사전 작성스텝과, 상기 인식사전을 참조하여, 상기 디스플레이 상에 표시되는 인식대상문자의 구성 도트의 배치에 관한 정보와 완전하게 일치하는 문자를 추출함으로써 상기 인식대상문자를 특정하는 문자인식스텝을 상기 컴퓨터에 실행시키는 것을 특징으로 한다.
또한 본 발명에 관한 문자인식방법은, 컴퓨터의 디스플레이 상에 표시되는 문자를 인식하기 위한 문자인식방법에 있어서, 소정의 표시 폰트 및 문자 사이즈의 조합에 대하여, 당해 표시 폰트 및 문자 사이즈를 갖는 각 문자의 구성 도트의 배치에 관한 정보를 갖는 인식사전을 작성하는 인식사전 작성공정과, 상기 인식사전을 참조하여, 상기 디스플레이 상에 표시되는 인식대상문자의 구성 도트의 배치에 관한 정보와 완전하게 일치하는 문자를 추출함으로써 상기 인식대상문자를 특정하는 문자인식공정을 구비하는 것을 특징으로 한다.
본 발명에 의하면, 컴퓨터의 디스플레이 상에 표시된 해상도가 낮은 문자이더라도 고정밀도로 문자인식을 할 수 있다.
도1은, 본 발명의 실시형태에 관한 문자인식 시스템의 구성을 개략적으로 나타내는 모식도이다.
도2는, 본 발명의 실시형태에 관한 인식사전의 내용을 나타내는 도면이다.
도3은, 본 발명의 실시형태에 관한 문자인식 시스템의 기능을 개략적으로 나타내는 블럭도이다.
도4는, 본 발명의 실시형태에 관한 인식사전의 작성처리의 흐름을 나타내는 플로우 차트이다.
도5는, 본 발명의 실시형태에 관한 문자인식의 처리의 흐름을 나타내는 플로우 차트이다.
도6은, 본 발명의 실시형태에 관한 문자인식의 처리를 설명하기 위한 도면이다.
이하에서는, 도면을 참조하면서 본 발명의 실시형태인 문자인식 시스템(文字認識 system)에 대하여 상세하게 설명한다. 도1은, 본 실시형태에 관한 문자인식 시스템의 구성을 개략적으로 나타내는 모식도이다. 도2는, 본 실시형태에 관한 인식사전(認識辭典)의 내용을 나타내는 도면이다. 도3은, 본 실시형태에 관한 문자인식 시스템의 기능을 개략적으로 나타내는 블럭도이다.
도1에 나타내는 바와 같이 문자인식 시스템(1)은, 컴퓨터 본체(10)와, 컴퓨터 본체(10)로부터의 출력정보를 표시하는 표시장치인 디스플레이(display)(30)와, 컴퓨터 본체(10)에 정보를 입력하기 위한 키보드(key board)나 마우스(mouse) 등의 입력장치(入力裝置)(32)를 구비한다.
본 실시형태에 관한 문자인식 시스템(1)은, 디스플레이(30) 상에 표시된 문자를 인식하기 위한 시스템으로서, 문자인식을 할 때에 광학적(光學的)인 문자인식이 아니라, 문자를 구성하는 구성 도트(構成 dot)의 배치에 관한 정보가 완전하게 일치하는가 아닌가에 의하여 문자를 특정(特定)하는 것을 특징으로 하고 있다. 본 실시형태에서는, 애플리케이션(application)(A)에 의한 디스플레이(30) 상의 표시 윈도우(表示 window) 내의 소정의 인식대상영역에 표시된 표시문자를 인식하는 경우를 예로 들어 설명한다.
컴퓨터 본체(10)는, 각종 연산을 하기 위한 CPU(Central Processing Unit) 등의 연산장치(演算裝置)(11)와, 각종 정보를 기억하기 위한 HDD(Hard Disc Drive)나 연산처리의 워크 에리어(work area)로서 사용되는 RAM(Random Access Memory) 등의 기억장치(記憶裝置)(12)를 구비하고 있다.
기억장치(12)는, 컴퓨터 본체(10)에 인스톨(install)되어 있는 OS(오퍼레이팅 시스템(operating system)), 문자인식 프로그램, 인식사전작성 프로그램(認識辭典作成 program), 폰트체크 프로그램(font check program), 애플리케이션(A) 등의 각종 프로그램을 저장하여 두는 프로그램 저장부(program 貯藏部)(121)와, 문자인식을 할 때에 사용되는 인식사전을 저장하여 두는 인식사전DB(認識辭典 Data Base)(122)와, 폰트체크를 위한 폰트체크용 사전DB(123)와, 디스플레이(30) 상에 표시되는 화면내용을 일시적으로 유지하는 비디오 메모리(video memory)(125)를 구비하고 있다.
프로그램 저장부(121)에 관하여, 문자인식 프로그램은 후술하는 문자인식처리를 실행하기 위한 프로그램, 인식사전작성 프로그램은 후술하는 인식사전의 작성처리를 실행하기 위한 프로그램이다. 또한 폰트체크 프로그램은, 인식사전의 작성이나 문자인식을 할 때에 인식대상문자의 표시 폰트(表示 font) 및 문자 사이즈(文字 size)의 정보를 취득하기 위한 프로그램이다.
인식사전DB(122)에는, 표시 폰트 및 문자 사이즈의 조합별로 인식사전이 작성되어 기록되어 있다. 인식사전의 인식사전 레코드(認識辭典 record)의 내용에 대하여 도2를 참조하면서 설명한다. 인식사전DB(122) 내의 각 레코드는, 「사전 ID」, 「표시 폰트」, 「문자 사이즈」, 「문자 코드」, 「외측 프레임 내 도트 배치」, 「외측 프레임 사이즈」, 「외측 프레임 위치」의 항목을 구비하고 있다.
「사전 ID」는, 각 인식사전의 식별자(識別子)로서, 동일한 표시 폰트 및 문자 사이즈의 조합이면 동일한 식별자로 되고, 표시 폰트와 문자 사이즈 중에서 적어도 일방이 다르면 다른 식별자로 된다. 「표시 폰트」, 「문자 사이즈」 및 「문자 코드」는, 당해 레코드의 작성 소스(作成 source)로 된 문자의 폰트, 사이즈, 문자 코드이다.
「외측 프레임 내 도트 배치」는, 사전 작성 소스(辭典 作成 source)의 문자를 구성하는 모든 구성 도트를 포함하는 최소 사각형 외측 프레임 내의 도트배치위치(dot配置位置)의 정보이다. 예를 들면 흑색 도트가 배치된 장소를 「1」, 배치되어 있지 않은 공백장소를 「0」으로 하고, 사각형 외측 프레임 내의 좌측 위로부터 우측 아래를 향하여 각 행별로 「00110101110000」이라는 형식으로 기록된다.
「외측 프레임 사이즈」는, 상기 최소 사각형 외측 프레임의 가로·세로의 사이즈 정보(도트 수(dot 數))이다. 「외측 프레임 위치」는, 베이스 라인(base line)(표준 최하(最下)의 선(線))으로부터 상기 최소 사각형 외측 프레임의 하변(下邊)까지의 거리이다. 본 실시형태에서는 「외측 프레임 내 도트 배치」, 「외측 프레임 사이즈」, 「외측 프레임 위치」의 항목이, 문자의 구성 도트의 배치에 관한 정보에 상당한다.
폰트체크용 사전DB(123) 내에 기록되어 있는 폰트체크용 사전은, 인식사전의 작성이나 문자인식을 할 때에 인식대상문자의 표시 폰트 및 문자 사이즈의 정보를 취득하기 위한 사전이다. 폰트체크용 사전은, 예를 들면 「아, 이, 우, 에, 오」 등의 소정의 체크용의 몇 종류의 문자에 대해서만, 컴퓨터 본체(10)에 인스톨되어 있는 모든 폰트의 모든 사이즈에 관한 상기 인식사전과 동일한 정보를 갖고 있다.
계속하여 도3을 참조하면서, 문자인식 시스템(1)의 기능에 대하여 설명한다. 동(同) 도면에 나타내는 바와 같이 문자인식 시스템(1)은, 디스플레이(30) 상에 표시되는 표시문자의 표시 폰트 및 문자 사이즈를 인식하는 기능을 갖는 폰트체크부(font check部)(20)와, 상기한 인식사전을 미리 작성하는 기능을 갖는 사전작성부(辭典作成部)(21)와, 문자인식을 하는 기능을 갖는 문자인식부(文字認識部)(25)를 구비하고 있다.
이들 각 부의 기능은, 연산장치(11)가, 프로그램 저장부(121)에 저장되어 있는 폰트체크 프로그램, 인식사전작성 프로그램, 문자인식 프로그램을 실행함으로써 실현된다.
계속하여 인식사전DB(122)에 기록되는 인식사전의 작성처리의 흐름에 대하여 도4를 참조하면서 더 설명한다. 도4는, 본 실시형태에 관한 인식사전의 작성처리의 흐름을 나타내는 플로우 차트이다.
인식사전의 작성은 후술하는 문자인식처리에 앞서 이루어지고, 사전작성부(21)는 이것으로부터 인식하는 인식대상문자의 표시 폰트 및 문자 사이즈의 조합에 관한 인식사전을 작성한다. 물론 동일한 표시 폰트 및 문자 사이즈의 조합에 관하여 이미 인식사전이 작성되어 있는 경우에는, 다시 사전을 작성할 필요는 없으며, 이미 등록되어 있는 인식사전을 사용하면 된다.
인식사전을 작성할 때에는, 컴퓨터 본체(10)에 있어서 인식사전작성 프로그램이 실행된다. 우선 S11에 있어서, 인식사전을 작성하는 표시 폰트 및 문자 사이즈의 취득이 이루어진다. 이 문자 사이즈 등의 취득은 폰트체크 프로그램을 기동하여 이루어진다.
여기에서 작성되는 인식사전은, 애플리케이션(A)의 표시 윈도우 내의 소정의 인식대상영역 내에 표시되는 인식대상문자의 표시 폰트 및 문자 사이즈의 조합의 인식사전이기 때문에, 폰트체크 프로그램은, 폰트체크용 사전DB(123) 내에 기록되어 있는 폰트체크용 사전을 참조하면서 이 인식대상문자의 표시 폰트 및 문자 사이즈를 자동적으로 특정한다.
구체적으로는 폰트체크부(20)가 화면 캡처(畵面 capture)에 의하여 비디오 메모리(125)로부터 인식대상문자의 화상 데이터를 취득하고, 폰트체크용 사전DB(123)를 참조하면서 인식대상문자를 구성하는 도트의 배치정보와 완전하게 일치하는 문자를 추출한다. 이에 따라 인식대상문자와 동일 폰트 및 동일 사이즈의 문자가 특정되어, 인식대상영역에 표시되는 문자의 표시 폰트 및 문자 사이즈의 정보를 취득할 수 있다.
또 이 폰트체크용 사전DB(123)를 참조하여 문자를 추출하는 처리는, 후술하는 문자인식의 처리와 동일하기 때문에 상세한 설명은 생략한다. 또한 폰트체크용 사전은 체크용의 몇 종류의 문자만에 대한 사전이기 때문에, 폰트체크를 할 때에는, 인식대상문자로서 이 체크용의 문자가 인식대상영역 내에 표시되도록 미리 오퍼레이터(operator)가 문자를 입력하여 두는 등의 작업이 필요하다.
종래의 광학문자인식과 달리, 본 실시형태에서는 문자의 구성 도트의 배치위치가 동일한가 아닌가에 의하여 문자의 인식을 하고 있어, 표시 폰트나 문자 사이즈가 다르면 별도의 문자로 인식되어 버린다. 이 때문에 인식사전도 표시 폰트 및 문자 사이즈의 조합별로 각각의 인식사전을 작성할 필요가 있다. 또 S11의 폰트체크는, 가능하다면 오퍼레이터가 수동으로 설정하더라도 좋다.
계속하여 S12로 진행하여, S11에서 취득한 표시 폰트 및 문자 사이즈의 문자를 순차적으로 디스플레이(30)(비디오 메모리(125)) 상에 표시시킨다. 여기에서 표시시키는 문자는, 당해 표시 폰트 및 문자 사이즈를 가지고 컴퓨터 본체(10)에 인스톨되어 있는 모든 문자이다. 구체적으로는 표시 폰트에 따라 서로 다르지만, 예를 들면 JIS 비한자(非漢字), JIS 제1한자(第1漢字), JIS 제2한자에 포함되는 모든 문자이다.
최초의 문자가 표시되면, S13에 있어서 외측 프레임의 설정이 이루어진다. 이 외측 프레임은, 표시된 문자를 구성하는 모든 구성 도트를 포함하는 최소의 사각형 외측 프레임이다. 계속하여 S14에 있어서, 외측 프레임 내의 도트의 배치에 관한 정보와 함께 인식사전 레코드가 인식사전DB(122) 내에 등록된다. 구체적인 인식사전 레코드의 내용은, 상기한 「사전 ID」, 「표시 폰트」, 「문자 사이즈」, 「문자 코드」, 「외측 프레임 내 도트 배치」, 「외측 프레임 사이즈」, 「외측 프레임 위치」의 정보로 된다.
계속하여 S15에서는, 당해 표시 폰트 및 문자 사이즈의 조합에 관한 모든 문자에 대하여 사전등록이 종료된 것인지 아닌지가 판정되며, 아직 등록되어 있지 않은 문자가 있는 경우에는, S12로 되돌아가서 S12∼S14의 처리를 반복하여 다음의 문자에 대하여 사전등록을 한다. S15에 있어서, 모든 문자에 대하여 사전등록이 되었다고 판단된 경우에는, 당해 표시 폰트 및 문자 사이즈의 조합에 관한 인식사전의 등록이 종료된다.
이 인식사전의 작성은, 컴퓨터 본체(10)의 OS가 갖는 모든 표시 폰트의 모든 문자 사이즈에 관하여 미리 하여 둘 필요는 없고, 문자인식을 할 때에, 인식대상영역 내에 표시되는 문자의 표시 폰트 및 문자 사이즈의 조합을 갖는 문자의 모든 것에 대하여 인식사전을 작성하면 된다.
계속하여 본 실시형태에 있어서의 문자인식의 처리의 흐름에 대하여 도5 및 도6을 참조하면서 설명한다. 도5는, 본 실시형태에 관한 문자인식의 처리의 흐름을 나타내는 플로우 차트이다. 도6은, 본 실시형태에 관한 문자인식의 처리를 설명하기 위한 도면이다.
우선 S21에 있어서, 인식대상문자의 표시 폰트 및 문자 사이즈의 취득이 이루어진다. 이 문자 사이즈 등의 취득은, 폰트체크 프로그램을 기동하여 이루어지며, 상기한 S11과 동일한 처리이다. 또한 인식사전의 작성에 연속하여 문자인식처리를 하는 경우에는, S11에 의하여 이미 표시 폰트 및 문자 사이즈의 취득이 이루어져 있기 때문에, S21을 생략하더라도 좋다.
이 표시 폰트 및 문자 사이즈의 취득에 의하여, 인식사전DB(122) 내에 기록되어 있는 인식사전 중에서 금회(今回)의 문자인식에서 사용되는 인식사전이 결정된다.
계속하여 S22에 있어서, 인식대상문자의 외측 프레임 설정이 이루어진다. 구체적으로는, 비디오 메모리(125)로부터 애플리케이션(A)의 인식대상영역의 화상 데이터를 취득하고, 당해 영역 내에 표시되어 있는 문자별로 분할한 후에, 문자별로 각 문자의 모든 구성 도트가 포함되는 최소의 사각형 외측 프레임을 설정한다. 도6은, 문자별로 최소 사각형 외측 프레임을 설정한 모양을 나타내고 있다.
S23에서는, 「외측 프레임 사이즈」의 정보에 의한 문자의 압축(narrowing-down)(1차 스크리닝(1次 screening))이 이루어진다. 즉 인식사전에 포함되는 문자 중에서 인식대상문자로 설정된 외측 프레임의 사이즈와 동일한 사이즈를 구비하는 문자가 추출된다.
계속하여 S24에서는, S23에서의 스크리닝에 의하여 문자가 1개로 특정된 것인지 아닌지가 판정된다. 1차 스크리닝에 의하여 하나의 문자로 압축된 경우에는, 인식대상문자가 그 문자라고 특정하는 것이 가능하기 때문에 문자인식처리는 종료된다.
S24에 있어서, 특정되어 있지 않다라고 판단된 경우에는, S25로 진행하여 「외측 프레임 내 도트 배치」의 정보에 의한 문자의 압축(2차 스크리닝)이 이루어진다. 즉 1차 스크리닝에 의하여 추출된 문자 중에서 인식대상문자로 설정된 외측 프레임 내의 도트배치위치와 동일한 배치위치를 갖는 문자가 추출된다.
계속하여 S26에서는, S25에서의 스크리닝에 의하여 문자가 1개로 특정된 것인지 아닌지가 판정되고, 특정된 경우에는 문자인식은 종료되고, 그렇지 않은 경우에는 S27로 진행하여 3차 스크리닝이 이루어진다. 예를 들면 인식대상문자가 「'」 또는 「,」의 문자인 경우에는, 「외측 프레임 사이즈」 및 「외측 프레임 내 도트 배치」가 동일하게 되기 때문에, S27로 진행하게 된다. S27에서는, 「외측 프레임 위치」의 정보에 의하여 문자의 압축이 이루어져서 문자가 특정된다.
인식대상영역 내에 복수의 문자가 포함되어 있는 경우에는, 문자별로 S23∼S27을 반복하여 하면 된다. 또한 S21의 폰트체크에 의하여 인식대상영역 내에 복수의 표시 폰트 및 문자 사이즈의 조합이 있었을 경우에는, 복수의 인식사전을 참조하면서 문자인식을 하면 된다.
또한 상기한 스크리닝의 순서는 적절하게 변경하더라도 좋다. 또한 상기 실시형태에서는, 최소 사각형 외측 프레임을 설정한 후에, 「외측 프레임 사이즈」, 「외측 프레임 위치」, 「외측 프레임 내 도트 배치」를 사용하여 문자인식을 하였지만, 문자인식을 위한 「문자를 구성하는 도트의 배치에 관한 정보」로서는 다양한 다른 정보를 사용할 수 있으며, 예를 들면 외측 프레임 내의 1라인째의 흑색 도트의 수 등을 사용할 수 있다.
이상에서는 본 실시형태에 관한 문자인식 시스템에 대하여 설명하였지만, 본 실시형태에 의하면, 디스플레이(30) 상에 표시된 표시문자의 인식을, 문자를 구성하는 도트의 배치정보에 의거하여 함으로써 거의 100%의 인식률에 의하여 문자인식을 할 수 있다.
본 실시형태에 관한 인식문자의 대상은, 컴퓨터의 디스플레이(30)(비디오 메모리(125)) 상에 표시되는 문자이며, 종이에 인쇄된 문자와 같이 더러워지거나 깨지거나 하지 않기 때문에, 도트의 배치정보에 의거하면 확실하게 문자를 특정할 수 있다.
다만 문자의 표시 폰트나 문자 사이즈가 다르면 도트 배치도 달라지기 때문에, 본 실시형태에 의한 문자인식의 경우에는, 미리 인식대상문자의 표시 폰트 및 문자 사이즈를 파악한 후에, 동일한 표시 폰트 및 문자 사이즈의 조합에 의한 인식사전을 작성하여 문자인식처리를 실행할 필요가 있다.
또한 본 실시형태와 같이 문자를 구성하는 도트의 배치정보를 복수 사용하여 단계적으로 스크리닝을 함으로써, 문자인식의 처리부하를 감소시켜서 고속으로 효율적인 문자인식을 할 수 있다.
계속하여 본 실시형태에 변형예에 대하여 설명한다. 우선 디스플레이(30) 상의 표시문자가 안티 에일리어스 처리(anti-alias 處理)되어 있는 문자인 경우에는, 상기한 폰트체크, 인식사전의 작성, 문자인식 등의 처리를 하기 전에, 문자의 화상 데이터로부터 지정채도(指定彩度) 이외, 지정명도(指定明度) 이외의 도트를 동일한 기준에 의하여 감산(減算)하도록 하면, 안티 에일리어스 처리의 영향을 제외한 문자인식을 하는 것이 가능하다.
또한 디스플레이(30) 상의 표시문자가, 밑줄, 굵은 문자 등의 문자수식(文字修飾)이 실시된 문자의 경우에는, 인식사전 및 폰트체크용 사전을 작성할 때에, 동일한 문자수식을 실시한 문자의 인식사전 레코드도 추가로 작성하여 둠으로써 수식된 문자에 대해서도 확실하게 문자인식을 할 수 있다.
또한 반각문자(半角文字)가 포함되어 있는 경우이더라도 반각문자의 인식사전을 작성하여 둠으로써 확실하게 문자인식을 하는 것이 가능하다.
이상에서는 본 발명의 실시형태에 대하여 설명하였지만, 본 발명의 실시형태는 상기 실시형태에 한정되는 것이 아니라, 본 발명의 주지를 일탈하지 않는 범위 내에서 더 다양한 변형이 가능하다. 예를 들면 상기 실시형태에서는, 단일의 컴퓨터에 의하여 문자인식 시스템을 실현하고 있지만, 복수의 컴퓨터에 의한 분산처리에 의하여 실현하더라도 좋다.
1 : 문자인식 시스템
10 : 컴퓨터 본체
11 : 연산장치
12 : 기억장치
121 : 프로그램 저장부
122 : 인식사전DB
123 : 폰트체크용 사전DB
125 : 비디오 메모리
20 : 폰트체크부
21 : 사전작성부
25 : 문자인식부
30 : 디스플레이
32 : 입력장치

Claims (6)

  1. 컴퓨터(computer)의 디스플레이(display) 상에 표시되는 문자를 인식하기 위한 문자인식 시스템(文字認識 system)에 있어서,
    소정의 표시 폰트(表示 font) 및 문자 사이즈(文字 size)의 조합에 대하여, 상기 표시 폰트 및 문자 사이즈를 갖는 각 문자의 구성 도트(構成 dot)의 배치에 관한 정보를 갖는 인식사전(認識辭典)을 기록하여 두는 기억장치(記憶裝置)와,
    상기 인식사전을 참조하여, 상기 디스플레이 상에 표시되는 인식대상문자의 구성 도트의 배치에 관한 정보와 완전하게 일치하는 문자를 추출함으로써 상기 인식대상문자를 특정(特定)하는 문자인식부(文字認識部)를
    구비하는 것을 특징으로 하는 문자인식 시스템.
  2. 제1항에 있어서,
    상기 표시 폰트 및 상기 문자 사이즈를 갖는 문자를 비디오 메모리(video memory) 상에 순차적으로 표시시키면서, 각 문자의 구성 도트의 배치에 관한 정보를 취득하여 상기 인식사전을 작성하는 사전작성부(辭典作成部)를 구비하는 것을 특징으로 하는 문자인식 시스템.
  3. 제1항 또는 제2항에 있어서,
    상기 문자인식부는, 미리 취득한 상기 인식대상문자의 표시 폰트 및 문자 사이즈의 조합과 동일한 조합에 대한 인식사전을 참조하여 문자인식을 하는 것을 특징으로 하는 문자인식 시스템.
  4. 제1항 내지 제3항 중의 어느 하나의 항에 있어서,
    상기 구성 도트의 배치에 관한 정보는, 각 문자의 구성 도트의 모든 것을 포함하는 사각형 외측 프레임 내의 도트배치위치(dot配置位置)의 정보인 것을 특징으로 하는 문자인식 시스템.
  5. 디스플레이 상에 표시되는 문자를 컴퓨터에 인식시키기 위한 문자인식 프로그램에 있어서,
    소정의 표시 폰트 및 문자 사이즈의 조합에 대하여, 상기 표시 폰트 및 문자 사이즈를 갖는 각 문자의 구성 도트의 배치에 관한 정보를 갖는 인식사전을 작성하는 인식사전 작성스텝과,
    상기 인식사전을 참조하여, 상기 디스플레이 상에 표시되는 인식대상문자의 구성 도트의 배치에 관한 정보와 완전하게 일치하는 문자를 추출함으로써 상기 인식대상문자를 특정하는 문자인식스텝을
    상기 컴퓨터에 실행시키는 것을 특징으로 하는 문자인식 프로그램.
  6. 컴퓨터의 디스플레이 상에 표시되는 문자를 인식하기 위한 문자인식방법에 있어서,
    소정의 표시 폰트 및 문자 사이즈의 조합에 대하여, 상기 표시 폰트 및 문자 사이즈를 갖는 각 문자의 구성 도트의 배치에 관한 정보를 갖는 인식사전을 작성하는 인식사전 작성공정과,
    상기 인식사전을 참조하여, 상기 디스플레이 상에 표시되는 인식대상문자의 구성 도트의 배치에 관한 정보와 완전하게 일치하는 문자를 추출함으로써 상기 인식대상문자를 특정하는 문자인식공정을
    구비하는 것을 특징으로 하는 문자인식방법.
KR1020157018711A 2013-02-13 2013-03-29 문자인식 시스템, 문자인식 프로그램 및 문자인식방법 KR102024127B1 (ko)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
JP2013025232A JP6080586B2 (ja) 2013-02-13 2013-02-13 文字認識システム、文字認識プログラム及び文字認識方法
JPJP-P-2013-025232 2013-02-13
PCT/JP2013/059508 WO2014125658A1 (ja) 2013-02-13 2013-03-29 文字認識システム、文字認識プログラム及び文字認識方法

Publications (2)

Publication Number Publication Date
KR20150116821A true KR20150116821A (ko) 2015-10-16
KR102024127B1 KR102024127B1 (ko) 2019-09-23

Family

ID=51353681

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020157018711A KR102024127B1 (ko) 2013-02-13 2013-03-29 문자인식 시스템, 문자인식 프로그램 및 문자인식방법

Country Status (8)

Country Link
US (1) US9639970B2 (ko)
EP (1) EP2958055A4 (ko)
JP (1) JP6080586B2 (ko)
KR (1) KR102024127B1 (ko)
CN (1) CN104981819A (ko)
MY (1) MY173006A (ko)
SG (1) SG11201506275XA (ko)
WO (1) WO2014125658A1 (ko)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20230074182A (ko) * 2020-10-29 2023-05-26 닛폰세이테츠 가부시키가이샤 식별 장치, 식별 방법 및 프로그램

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP6269256B2 (ja) * 2014-03-31 2018-01-31 京セラドキュメントソリューションズ株式会社 情報処理装置、画像形成装置、情報処理方法、及び情報処理プログラム
JP7087829B2 (ja) * 2018-08-27 2022-06-21 富士通株式会社 情報処理装置、書込制御プログラム、及び書込制御方法

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008305126A (ja) 2007-06-07 2008-12-18 Seiko Epson Corp 文字認識方法および文字認識システム
US20090110287A1 (en) * 2007-10-26 2009-04-30 International Business Machines Corporation Method and system for displaying image based on text in image
JP2010026805A (ja) 2008-07-18 2010-02-04 Denso Corp 文字認識装置及び文字認識方法
WO2010060043A2 (en) * 2008-11-24 2010-05-27 Jan Scott Zwolinski Personal dictionary and translator device
JP2011081537A (ja) 2009-10-06 2011-04-21 Psc:Kk データ受渡方法及び汎用データ取得方法

Family Cites Families (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS63106882A (ja) * 1986-10-24 1988-05-11 Tokyo Keiki Co Ltd 活字文字認識装置の文字フオント決定方式
JPH03214377A (ja) * 1990-01-19 1991-09-19 Sony Corp 文字認識装置
US5781914A (en) * 1995-06-30 1998-07-14 Ricoh Company, Ltd. Converting documents, with links to other electronic information, between hardcopy and electronic formats
JPH0922442A (ja) * 1995-07-04 1997-01-21 Advantest Corp イメージ・ドキュメント資料の電子管理システム
JP3382071B2 (ja) * 1995-09-13 2003-03-04 株式会社東芝 文字コード取得装置
JPH1196289A (ja) * 1997-09-19 1999-04-09 Nec Corp 画面データ変換装置及び方法
US6151423A (en) * 1998-03-04 2000-11-21 Canon Kabushiki Kaisha Character recognition with document orientation determination
US6473517B1 (en) * 1999-09-15 2002-10-29 Siemens Corporate Research, Inc. Character segmentation method for vehicle license plate recognition
AU2003252263A1 (en) * 2002-08-07 2004-02-25 Matsushita Electric Industrial Co., Ltd. Character recognition processing device, character recognition processing method, and mobile terminal device
JP3990253B2 (ja) * 2002-10-17 2007-10-10 埼玉日本電気株式会社 携帯電話装置
JP3945778B2 (ja) * 2004-03-12 2007-07-18 インターナショナル・ビジネス・マシーンズ・コーポレーション 設定装置、プログラム、記録媒体、及び設定方法
CN100356390C (zh) * 2004-09-24 2007-12-19 北京中星微电子有限公司 一种显示操作终端进行光符识别的方法
JP2008071214A (ja) * 2006-09-15 2008-03-27 Kochi Univ Of Technology 文字認識辞書作成方法及びその装置及び文字認識方法及びその装置及びプログラムを格納した記憶媒体
US20080310721A1 (en) * 2007-06-14 2008-12-18 John Jinhwan Yang Method And Apparatus For Recognizing Characters In A Document Image
US7929764B2 (en) * 2007-06-15 2011-04-19 Microsoft Corporation Identifying character information in media content
JP5493807B2 (ja) * 2009-02-04 2014-05-14 株式会社リコー 画像通信装置、画像通信システム及び制御プログラム
JP5343617B2 (ja) * 2009-02-25 2013-11-13 富士通株式会社 文字認識プログラム、文字認識方法および文字認識装置

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008305126A (ja) 2007-06-07 2008-12-18 Seiko Epson Corp 文字認識方法および文字認識システム
US20090110287A1 (en) * 2007-10-26 2009-04-30 International Business Machines Corporation Method and system for displaying image based on text in image
JP2010026805A (ja) 2008-07-18 2010-02-04 Denso Corp 文字認識装置及び文字認識方法
WO2010060043A2 (en) * 2008-11-24 2010-05-27 Jan Scott Zwolinski Personal dictionary and translator device
US20100128994A1 (en) * 2008-11-24 2010-05-27 Jan Scott Zwolinski Personal dictionary and translator device
JP2011081537A (ja) 2009-10-06 2011-04-21 Psc:Kk データ受渡方法及び汎用データ取得方法

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20230074182A (ko) * 2020-10-29 2023-05-26 닛폰세이테츠 가부시키가이샤 식별 장치, 식별 방법 및 프로그램

Also Published As

Publication number Publication date
US9639970B2 (en) 2017-05-02
KR102024127B1 (ko) 2019-09-23
JP2014154066A (ja) 2014-08-25
WO2014125658A1 (ja) 2014-08-21
EP2958055A4 (en) 2016-09-21
JP6080586B2 (ja) 2017-02-15
US20150356764A1 (en) 2015-12-10
SG11201506275XA (en) 2015-09-29
CN104981819A (zh) 2015-10-14
EP2958055A1 (en) 2015-12-23
MY173006A (en) 2019-12-18

Similar Documents

Publication Publication Date Title
JP2005173730A (ja) 帳票ocrプログラム、方法及び装置
US20090226090A1 (en) Information processing system, information processing apparatus, information processing method, and storage medium
US8189921B2 (en) Character recognition device
US10417516B2 (en) System and method for preprocessing images to improve OCR efficacy
CN106202058B (zh) 反映排印文字中的手写体属性的设备和方法
CN104809099A (zh) 文档文件生成装置及文档文件生成方法
KR20150116821A (ko) 문자인식 시스템, 문자인식 프로그램 및 문자인식방법
CN109726369A (zh) 一种基于标准文献的智能模板化题录技术实现方法
US8824806B1 (en) Sequential digital image panning
US20170061665A1 (en) Information processing device, program, and recording medium
KR20180126352A (ko) 이미지로부터 텍스트 추출을 위한 딥러닝 기반 인식장치
CN109409370B (zh) 一种远程桌面字符识别方法和装置
JP4347675B2 (ja) 帳票ocrプログラム、方法及び装置
US20210042555A1 (en) Information Processing Apparatus and Table Recognition Method
JP2008027133A (ja) 帳票処理装置及び帳票処理方法ならびに帳票処理方法を実行するプログラムと記憶媒体
JP2014154066A5 (ko)
JP6325218B2 (ja) 文字認識結果検証装置及び文字読取システム
CN102855291A (zh) 一种向输入法词库中添加词条的方法及装置
KR20220137645A (ko) 핸드라이팅에서의 구조 분해
WO2011027113A1 (en) Method and apparatus for segmenting images
US20150339279A1 (en) Typing error detecting device and recording medium
JP5169648B2 (ja) 原画像探索装置及び原画像探索プログラム
JP2013182459A (ja) 情報処理装置、情報処理方法及びプログラム
US11462014B2 (en) Information processing apparatus and non-transitory computer readable medium
WO2014203905A2 (ja) 符号抽出方法、符号抽出装置及びプログラム

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant