KR20000047428A - 문자 인식 장치 및 방법 - Google Patents

문자 인식 장치 및 방법 Download PDF

Info

Publication number
KR20000047428A
KR20000047428A KR1019990026823A KR19990026823A KR20000047428A KR 20000047428 A KR20000047428 A KR 20000047428A KR 1019990026823 A KR1019990026823 A KR 1019990026823A KR 19990026823 A KR19990026823 A KR 19990026823A KR 20000047428 A KR20000047428 A KR 20000047428A
Authority
KR
South Korea
Prior art keywords
character
pattern
feature
handwritten
characters
Prior art date
Application number
KR1019990026823A
Other languages
English (en)
Other versions
KR100658119B1 (ko
Inventor
가시오까준지
나오이사또시
Original Assignee
아끼구사 나오유끼
후지쯔 가부시끼가이샤
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 아끼구사 나오유끼, 후지쯔 가부시끼가이샤 filed Critical 아끼구사 나오유끼
Publication of KR20000047428A publication Critical patent/KR20000047428A/ko
Application granted granted Critical
Publication of KR100658119B1 publication Critical patent/KR100658119B1/ko

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/10Image acquisition
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/24Character recognition characterised by the processing or recognition method
    • G06V30/242Division of the character sequences into groups prior to recognition; Selection of dictionaries
    • G06V30/244Division of the character sequences into groups prior to recognition; Selection of dictionaries using graphical properties, e.g. alphabet type or font
    • G06V30/2445Alphabet recognition, e.g. Latin, Kanji or Katakana
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/24Character recognition characterised by the processing or recognition method
    • G06V30/242Division of the character sequences into groups prior to recognition; Selection of dictionaries
    • G06V30/244Division of the character sequences into groups prior to recognition; Selection of dictionaries using graphical properties, e.g. alphabet type or font
    • G06V30/2455Discrimination between machine-print, hand-print and cursive writing

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Character Discrimination (AREA)
  • Character Input (AREA)

Abstract

문서, 장부 등으로부터 판독하는 화상 데이터로부터 문자 패턴을 추출하고, 수기/활자 문자 판별부에 의해 수기 문자와 활자 문자를 판별한다. 수기/활자 문자 판별부는 상기 문자 패턴으로부터 적어도 문자 패턴의 복잡성과 직선성을 나타내는 특징을 포함하는 N개의 특징 벡터를 구하고; 상기 특징 벡터를 사용하여 상기 문자 패턴이 수기 문자인지 활자 문자인지를 판별한다. 문자 인식부는 상기 문자 데이터가 수기 문자인지 활자 문자인지를 판별한 상기 결과를 바탕으로 문자 인식 처리를 수행한다. 상술한 문자 패턴의 특징으로서, 선 폭의 분산(variance), 문자 위치의 분산 등도 사용할 수 있다.

Description

문자 인식 장치 및 방법{Apparatus and Method for Recognizing Character}
최근, 주변 입력 기기의 문자 인식 기술의 개발에 대한 수요가 매우 증가하고 있다. 본 발명은 문자 인식 장치 및 방법, 및 문자 인식 프로그램을 저장하는 기록 매체에 관한 것이다. 특히, 본 발명은 더욱 정밀한 문자 인식을 위하여 문서에서 수기 문자와 활자 문자를 구별하는 문자 인식 장치 및 방법; 및 문자 인식 프로그램을 저장하는 기록 매체에 관한 것이다.
종래 기술에서는 수기 문자와 활자 문자가 혼재하는 문서를 인식하기 위하여, 두 가지 처리, 즉 수기 문자를 인식하기 위한 처리와 활자 문자를 인식하기 위한 처리를 먼저 실시하였다. 그리고 나서, 상기 두 처리 결과를 서로 비교하여 신뢰도가 높은 처리 결과를 얻어서 문서를 인식하였다.
상술한 종래 기술은 두 가지 처리(수기 문자와 활자 문자를 분리해서 인식함)를 실시하고 나서, 두 처리의 인식 결과를 비교하여 신뢰도가 높은 인식 결과를 얻었다. 따라서, 종래 기술은 인식 처리에 오랜 시간이 걸린다는 문제점이 있었다.
본 발명은 상술한 종래 기술의 문제점을 해결하기 위하여 개발되었으며, 수기 문자와 활자 문자를 높은 정밀도로 인식하고, 문자 인식 처리에 필요한 시간을 단축시키는 것을 목적으로 한다.
도 1은 본 발명의 제1 실시예에 따른 문자 인식 장치의 구성을 나타내는 블록도.
도 2는 본 발명의 제2 실시예에 따른 문자 인식 장치의 구성을 나타내는 블록도.
도 3은 본 발명이 적용되는 시스템 구성의 일례를 나타내는 도.
도 4는 본 발명의 제3 실시예에 따른 문자 인식 장치의 구성을 나타내는 블록도.
도 5는 본 발명의 실시예에 따른 수기/활자 문자 판별부의 구성도.
도 6은 수기/활자 문자 판별부에 의해 수행되는 처리의 플로우 차트.
도 7은 각 문자 종류/글자체와 특징 파라미터 사이의 관계를 나타내는 도.
도 8은 수기 문자와 활자 문자를 판별하는 방법을 나타내는 도.
도 9는 명조체에서 선 폭의 분산을 나타내는 도.
도 10은 본 발명의 1실시예에 따른 복잡성 추출 처리의 플로우 차트.
도 11은 복잡성(선 밀도) 추출 처리의 개념도.
도 12는 본 발명의 1실시예에 따른 직선성 추출 처리의 플로우 차트.
도 13은 직선성 추출 처리의 개념도.
도 14는 본 발명의 1실시예에 따른 선 폭 분산 추출 처리의 플로우 차트.
도 15는 선 폭 분산 추출 처리의 개념도.
도 16은 수기 문자와 활자 문자의 최하행 좌표 위치의 분산, 및 분산 추출 처리의 편차를 나타내는 도.
도 17은 문자 위치의 분산 추출 처리의 플로우 차트.
상술한 문제점을 해결하기 위하여, 본 발명은 패턴의 특징을 인식하고, 패턴의 특징이 수기 문자를 의미하면 수기 문자를 인식하는 처리를 수행하고, 패턴의 특징이 활자 문자를 의미하면 활자 문자를 인식하는 처리를 수행한다.
따라서, 문서에 수기 문자와 활자 문자가 혼재해 있더라도, 수기 문자 인식 처리와 활자 문자 인식 처리 중 하나만을 수행하면 정밀한 인식 결과를 얻을 수 있어서, 문자 인식의 정밀도를 저하시키지 않으면서 문자 인식 처리에 필요한 시간을 단축시킬 수 있다.
본 발명의 한 양태에 따르면, 패턴의 형상 또는 규칙성을 바탕으로 수기 문자 또는 활자 문자를 판별할 수 있다.
활자 문자가 수기 문자보다 패턴 형상 및 배열에 있어서 더 규칙적이기 때문에, 패턴 형상이나 배열의 규칙성을 조사하면 활자 문자와 수기 문자를 구별할 수 있으므로 그 이후의 처리를 수행하는데 걸리는 시간을 단축할 수 있다.
실시예
첨부된 도면을 참조하여 본 발명의 실시예에 따른 문자 인식 장치를 이하에서 설명한다. 도 1은 본 발명의 제1 실시예에 따른 문자 인식 장치의 구성을 나타내는 블록도이다. 도 1에서, 특징 식별부(111)는 입력 화상으로부터 추출된 패턴의 특징을 식별한다. 예컨대, 특징 식별부(111)는 패턴의 규칙성을 바탕으로 패턴이 수기 문자인지 활자 문자인지를 판별한다. 즉, 활자 문자가 수기 문자보다 높은 규칙성을 가지기 때문에, 특징 식별부(111)는 패턴의 규칙성이 높으면 패턴이 활자 문자인 것으로 판정하고, 패턴의 규칙성이 낮으면 패턴이 수기 문자인 것으로 판정한다.
특징 식별부(111)에 의해 식별되는 패턴의 특징은 패턴의 복잡성, 패턴의 직선성, 패턴의 선 폭의 분산, 패턴 배열 위치의 분산, 패턴 기울기의 분산, 패턴 크기의 분산 등이다. 패턴의 복잡성은 패턴의 선 밀도, 흑색 화소의 밀도, 오일러(Euler) 수, 외형 길이 등을 바탕으로 식별할 수 있다. 패턴의 특징은 판별 분석 등을 통하여 복수의 특징을 결합함으로써 식별할 수 있다.
수기 문자 인식부(113)는 수기 문자를 인식한다. 활자 문자 인식부(114)는 활자 문자를 인식한다. 활자 문자는 인쇄 문자, 타자 문자, 워드 프로세서에 의한 입력 문자 등을 말한다.
문자 인식 선택부(112)는 특징 식별부(111)에 의한 판별 결과를 바탕으로 수기 문자 인식부(113) 또는 활자 문자 인식부(114)를 선택한다. 즉, 특징 식별부(111)가 인식 대상의 패턴이 수기 문자라고 판정하면, 문자 인식 선택부(112)는 수기 문자 인식부(113)를 선택하여, 수기 문자 인식부(113)로 하여금 인식 대상의 패턴의 문자를 인식하도록 지시한다. 특징 식별부(111)가 인식 대상의 패턴이 활자 문자라고 판정하면, 문자 인식 선택부(112)는 활자 문자 인식부(114)를 선택하여 활자 문자 인식부(114)로 하여금 인식 대상 패턴의 문자를 인식하도록 한다.
이렇게 하여, 수기 문자 인식부(113) 또는 활자 문자 인식부(114)를 사용하여 문자 인식 처리를 수행할 수 있으며, 이에 따라 문자 인식 처리에 걸리는 시간을 단축할 수 있고, 또한 수기 문자 인식부(113)와 활자 문자 인식부(114) 중의 하나만을 문자 인식 처리에 사용하더라도 인식의 정밀도가 저하되는 것을 방지할 수 있다.
도 2는 본 발명의 제2 실시예에 따른 문자 인식 장치의 구성을 나타내는 블록도이다. 도 2에 나타낸 바와 같이, 제2 실시예는 상술한 문제점을 해결한다.
문자 패턴 추출부(1)는 문서나 장부의 화상으로부터 문자 패턴을 추출한다. 이어서, 복잡성 추출부(2a) 및 직선성 추출부(2b)는 적어도 문자 패턴의 복잡성과 직선성을 나타내는 특징을 포함하는 N차의 특징 벡터를 구한다. 다음에, 수기/활자 문자 판별부(2f)는 상술한 특징 벡터를 사용하여 문자 패턴이 수기 문자인지 활자 문자인지를 판별한다. 판별 결과를 바탕으로, 문자 인식부(3)는 수기 문자 인식 처리 또는 활자 문자 인식 처리를 수행한다. 문자 패턴의 복잡성을 나타내는 특징으로는 선 밀도를 사용할 수 있다. 선 폭 분산 추출부(2c)는 문자 패턴 추출부(1)에 의해 추출된 문자 패턴으로부터 문자 패턴에 포함된 문자 스트로크(stroke)의 끝점, 교점 및 변곡점으로부터 일정 거리 내의 패턴을 제거하여 구한 선 폭의 분산을 나타내는 특징량을 추출한다. 그리고, 상기 특징량에 따라 문자 패턴이 수기 문자인지 활자 문자인지를 판별한다. 상기 판별 결과를 바탕으로 수기 문자 인식 처리 또는 활자 문자 인식 처리를 수행한다.
활자 문자도 각 스트로크 방향마다 선 폭이 다른 명조체와 같은 폰트로 표시할 수 있기 때문에, 선 폭 분산 추출부(2c)는 각 스트로크 또는 각 스트로크 방향마다 선 폭의 분산을 구할 수 있다.
문자 위치 분산 추출부(2d)는 문자 위치의 분산을 구한다. 문자 패턴이 큰 분산의 문자 위치를 나타내면, 수기/활자 문자 판별부(2f)는 상기 패턴을 수기 문자로 판정하여 수기 문자 인식부(3a)로 하여금 상기 패턴의 문자를 인식하도록 지시한다. 한편, 문자 패턴이 작은 분산의 문자 위치를 나타내면, 수기/활자 문자 판별부(2f)는 상기 패턴을 활자 문자로 판정하여, 활자 문자 인식부(3b)로 하여금 상기 패턴의 문자를 인식하도록 지시한다.
문자 위치의 분산 이외에, 문자의 기울기, 크기 등의 분산을 조사하여 문자 패턴이 수기 문자인지 활자 문자인지를 판별할 수도 있다.
본 실시예에서는, 문자를 수기 문자와 활자 문자로 판별하여 인식하기 위하여, 적어도 문자 패턴의 복잡성을 나타내는 특징과 문자 패턴의 직선성을 나타내는 특징을 포함하는 N차의 특징 벡터를 구한다. 따라서, 수기 문자와 활자 문자를 높은 정밀도로 판별할 수 있으며, 단시간 내에 문자 인식 처리를 수행할 수 있다. 또한, 선 밀도를 문자 패턴의 복잡성을 나타내는 특징으로 사용함으로써, 상기 특징량을 용이하고 고속으로 구할 수 있다.
문자 패턴에 포함된 문자 스트로크의 끝점, 교점 및 변곡점으로부터 일정 거리 내의 패턴을 제거하여 구한 선 폭의 분산을 나타내는 특징량을 사용하여 수기 문자와 활자 문자를 판별함으로써, 명조체에 대한 장식 등의 영향이 없는 선 폭의 분산을 구할 수 있어서 수기 문자와 활자 문자를 정확히 판별할 수 있다.
또한, 각 스트로크 또는 각 스트로크 방향마다 선 폭의 분산을 구함으로써, 명조체의 스트로크 방향에 따른 선 폭 차이의 영향 없이 선 폭의 분산을 구할 수 있어서 수기 문자와 활자 문자를 정확히 판별할 수 있다.
도 3은 본 발명이 적용되는 시스템 구성의 일례를 나타내는 도면이다.
도 3에서, 11은 버스(10)가 접속되는 CPU이다. 버스(10)에는 RAM(12), ROM(13), 통신 인터페이스(14), 외부 기억 장치(15), 기록 매체 판독 장치(16), 화상 판독용 스캐너(17), 디스플레이, 키보드 등의 입출력 장치(18)가 접속되어 있다. ROM(13)은 OS 등을 저장하며, RAM(12)은 본 실시예에 따라 처리하는 프로그램, 데이터 등을 저장한다.
스캐너(17)는 인식 대상의 문자 등이 저장된 화상을 판독한다. 입출력 장치(18)는 키보드, 마우스 등의 입력 장치와 디스플레이 모니터, 프린터 등의 출력 장치를 구비하며, 데이터 처리를 위한 데이터를 입력하고, 처리된 데이터를 출력한다.
문자 인식 처리를 위한 프로그램, 데이터 등은 하드 디스크 등의 외부 기억 장치(15) 또는 CD-ROM, 플로피 디스크 등의 기록 매체에 저장되며, 데이터 처리시에 외부 기억 장치(15)로부터 판독하거나 또는 스캐너에 의해 기록 매체로부터 판독하여 RAM(12)에 저장하고, CPU(11)에 의해 실행된다. 버스(10)에는 통신 인터페이스(14)가 접속되며, 통신 회선을 통하여 데이터나 프로그램을 주고받을 수 있다.
도 4는 본 발명의 제3 실시예에 따른 문자 인식 장치에 의해 수행되는 기능을 나타내는 블록도이다. 도 4에 나타낸 바와 같이, 본 실시예에 따른 문자 인식 장치는 화상 데이터를 전처리하는 전처리부(21); 문자 추출부(22); 수기/활자 문자 판별부(23); 및 문자 인식 처리를 수행하는 문자 인식부(24)로 되어 있다. 전처리부(21), 문자 추출부(22) 및 문자 인식부(24)는 종래의 공지된 기술에 의해 실현할 수 있다.
도 4에서 노이즈 제거 처리, 기울기 보정 처리 등의 전처리는 스캐너(17) 등의 화상 입력 장치에 의해 문서 또는 장부로부터 판독한 화상 데이터에 대하여 수행되며, 전처리된 데이터는 문자 추출부(22)에 전송된다. 문자 추출부(22)는 전처리된 화상 데이터로부터 문자 데이터를 꺼낸다. 수기/활자 문자 판별부(23)는 꺼낸 문자 데이터가 수기 문자인지 활자 문자인지를 판별하여, 상기 데이터를 수기 문자와 활자 문자로 구분한다.
문자 인식부(24)는 문자 데이터가 수기 문자인지 활자 문자인지에 따라서 대응하는 문자 인식 처리를 수행한다. 즉, 문자 인식부(24)는 수기 문자를 인식하기 위한 수기 문자 인식부 및 활자 문자를 인식하기 위한 활자 문자 인식부로 되어 있다. 수기/활자 문자 판별부(23)가 문자 화상 데이터를 수기 문자라고 인식하면, 상술한 수기 문자 인식부가 문자를 인식한다. 수기/활자 문자 판별부(23)가 문자 화상 데이터를 활자 문자라고 인식하면, 상술한 활자 문자 인식부가 문자를 인식한다. 이렇게 하여, 문자 패턴이 수기 문자인지 활자 문자인지 미리 판별하고, 상기 판별 결과를 바탕으로 문자 인식부(24)에 의해 인식 처리를 수행함으로써 문자 인식에 필요한 시간을 단축시킬 수 있다.
상술한 문자 추출 처리 및 수기/활자 문자 판별 처리에서는, 문자 데이터를 각 문자마다 꺼내고, 이렇게 꺼낸 문자마다 수기/활자 문자 판별 처리를 수행하여도 좋다. 그렇지 않으면, 복수의 문자를 꺼내서 수기/활자 문자 판별 처리를 일괄해서 집단적으로 처리하여도 좋다.
도 5는 수기/활자 문자 판별부(23)의 구성을 나타낸다. 도 6은 수기/활자 문자 판별부(23)에 의해 수행되는 처리의 개요를 나타내는 플로우 차트이다.
도 5에 나타낸 바와 같이, 수기/활자 문자 판별부(23)는 꺼낸 문자 데이터를 정규화하는 정규화 처리부(31); 꺼낸 문자 데이터로부터 특징 파라미터를 추출하는 특징 파라미터 추출부(32); 및 수기 문자인지 활자 문자인지를 식별하는 판별 처리부(33)로 되어 있다.
특징 파라미터 추출부(32)는 복잡성 추출부(32), 직선성 추출부(35), 선 폭 분산 추출부(36) 및 문자 위치 분산 추출부(37)로 되어 있다.
수기/활자 문자 판별부(23)는 하기와 같이 수기/활자 문자 판별 처리를 수행한다.
우선, 정규화 처리부(31)는 화상의 크기를 정규화한다(스텝 S1).
이어서, 특징 파라미터 추출부(32)는 정규화된 문자 데이터로부터 예컨대 문자의 복잡성, 문자 데이터의 직선성, 문자의 선 폭의 분산, 문자 위치의 분산 등을 나타내는 특징 파라미터를 추출하여 특징 벡터를 구한다(스텝 S2).
다음에, 판별 처리부(33)는 판별 함수에 특징 벡터를 대입하여 수기 문자인지 활자 문자인지를 판별하고, 그 식별 결과를 저장한다(스텝 S3).
판별 처리부(33)는 미리 특징 파라미터를 요소로 포함하는 특징 벡터 공간에서 판별 및 분석 처리를 수행함으로써 수기 문자와 활자 문자를 판별하는 경계를 구하고, 문자 데이터로부터 추출된 특징 파라미터에 따라 특징 벡터가 경계의 어느 쪽에 위치하는지를 결정하여 문자를 판별함으로써 수기 문자와 활자 문자의 판별 처리를 수행한다.
도 7은 각 문자 종류/글자체와 특징 파라미터 간의 관계를 나타낸다. 도 7에서 "대", "중" 및 "소"라는 용어는 특징 파라미터를 수치화할 경우의 문자 종류/글자체의 상대적인 값이다.
(1) "복잡성"을 나타내는 특징 파라미터는 수기 문자와 활자 문자에 무관하게 한자가 크고, 다른 문자(영자, 숫자, 히라카나, 가다카나)는 작다.
(2) "직선성"을 나타내는 특징 파라미터는 수기 문자가 작고, 활자 문자는 중간 크기이거나 크다.
(3) "선 폭의 분산"을 나타내는 특징 파라미터는 일반적으로 수기 문자가 크고, 활자 문자는 작다. 활자 문자에서도, 명조체의 선 폭의 분산은 문자가 끝점 또는 변곡점을 포함할 경우에 크다. 그러나, 후술하는 바와 같이, 끝점 또는 변곡점을 제외한 문자의 선 폭의 분산은 도 7에 나타낸 바와 같이 작다. 또한, 명조체 문자의 선 폭이 방향마다 다르기 때문에, 각 방향별로 선 폭의 분산을 구하면 선 폭의 분산이 작아진다.
(4) "문자 위치의 분산"을 나타내는 특징 파라미터는 일반적으로 수기 문자가 크고, 활자 문자는 작다.
상술한 바와 같이, 일반적으로 수기 문자는 직선 성분이 적고, 활자 문자는 직선 성분이 많다. 특히, 한자에는 직선 성분이 많고, 영자, 숫자, 히라카나 및 가다카나와 같은 다른 문자에는 직선 성분이 적다.
따라서, 한자와 다른 종류의 문자를 분리하는 특징량인 문자의 복잡성 및 활자 문자의 특징인 직선성을 바탕으로 수기 문자와 활자 문자를 정밀하게 판별할 수 있다.
복잡성을 나타내는 파라미터는 스트로크 등이 있지만, 후술하는 바와 같이 고속 처리를 위하여 문자 패턴의 선 밀도를 사용하는 것이 바람직하다.
도 8은 상술한 판별 방법을 나타낸다. 도 8은 특징 파라미터로서 "복잡성 X1"과 "직선성 X2"를 선택하고, "복잡성 X1"과 "직선성 X2"를 횡축과 종축으로 설정한 2차원 평면 상의 수기 문자와 활자 문자를 판별하는 판별 함수의 일례를 나타내고 있다.
여러 가지 수기 문자와 활자 문자에 대하여 복잡성과 직선성을 구한다. 그 결과를 상술한 2차원 평면 위에 플롯하면, 도 8에 나타낸 바와 같이 활자 문자의 숫자, 영자, 히라카나, 가다카나 및 한자는 일반적으로 2차원 평면 상의 좌측상부(41,42,43)에 분포한다. 반면, 수기 문자의 숫자, 영자, 히라카나, 가다카나 및 한자는 일반적으로 우측하부(44,45,46)에 분포한다.
따라서, 이 경우에는 판별 함수 Z를 도 8에 나타낸 바와 같이 정의함으로써 상술한 2개의 특징 파라미터에 따라 수기 문자와 활자 문자를 판별할 수 있다.
활자 문자의 그룹을 G1로 표시하고, 수기 문자의 그룹을 G2로 표시하면, 각 변화량의 분산 및 변화량 간의 상관을 고려한 중력 벡터의 중심으로부터 각 그룹의 거리(마할라노비스 거리, Mahalanobis distance)는 하기 식(1) 및 (2)로 구한다:
G1의 마할라노비스 거리:
G2의 마할라노비스 거리:
: 그룹 k의 중력 벡터의 중심
Σk: 그룹 k의 분산-공분산 행렬
미지의 벡터에 대해서는, 각 그룹에 대한 마할라노비스 거리를 구하여 보다 가까운 그룹으로 판별할 수 있다.
따라서, 판별 함수는 상기 식(3)을 풀어서 얻으며, Z가 양인지 음인지에 따라 그룹을 판별할 수 있다. 예컨대, 미지의 패턴의 특징 벡터가 2차원 평면 상의 점 P에 위치할 경우에는, 점 P를 판별 함수 Z 상에 투영하여 얻은 점 P'가 양인지 음인지를 조사한다. 점 P'가 양이면, 미지의 패턴을 활자 문자로 판별한다. 점 P'가 음이면, 미지의 패턴을 수기 문자로 판별한다.
도 8에서는, 복잡성과 직선성의 2개의 특징량을 사용한 2차원 평면으로 설명하였으나, 일반적으로 N차원 특징 벡터 공간 상에서 도 8을 참조하여 설명한 판별 및 분석 방법에 의해 수기 문자 또는 활자 문자를 판별하면, 보다 높은 정밀도로 문자 패턴을 판별할 수 있다.
즉 상술한 바와 같이, 복잡성, 직선성, 선 폭의 분산, 문자 위치의 분산 등의 특징량은 수기 문자, 활자 문자, 문자 종류 또는 문자체에 따라 다르다. 따라서 복수의 특징 파라미터를 적절히 조합하면, 수기 문자와 활자 문자를 높은 정밀도로 판별할 수 있다.
후술하는 바와 같이, 각 스트로크마다 또는 스트로크의 각 방향마다 복잡성, 직선성, 선 폭의 분산 등의 특징량을 구하고, 이 특징량을 사용하여 수기 문자인지 활자 문자인지를 판별하면, 보다 높은 정밀도로 문자를 식별할 수 있다. 또 다른 특징량으로서 문자 기울기의 특징량을 병용할 수 있다.
도 7에서, 선 폭의 분산을 나타내는 특징량은 수기 문자가 크고 활자 문자는 작다. 이와 같이, 수기 문자와 활자 문자 사이의 아주 다른 특징량을 갖는 단독 또는 복수의 특징 파라미터를 사용하여 수기 문자인지 활자 문자인지를 판별할 수 있다.
명조체에서는 도 9a에 나타낸 바와 같이 문자의 끝점(51)과 변곡점(52)에 장식이 첨가되어 있다. 따라서, 선 폭의 분산을 계산할 때 명조체의 끝점(51)과 변곡점(52)을 포함하면, 선 폭의 분산이 커져서, 활자 문자를 수기 문자로 오판하게 된다.
후술하는 바와 같이, 스트로크의 끝점(51), 교점(53) 및 변곡점(52)을 구하고, 이들 점으로부터 일정 길이를 감하여 스트로크의 선 폭의 분산을 구한다. 명조체에서는 스트로크(61,62)의 방향에 따라 도 9b에 나타낸 바와 같이 선 폭이 다르다. 따라서, 스트로크의 선 폭의 분산은 스트로크(61,62)별 또는 스트로크(61,62)의 방향에 따라 구한다.
이와 같이, 선 폭의 분산을 나타내는 특징량을 구한다. 구한 특징량을 바탕으로 수기 문자와 활자 문자를 식별하여, 높은 정밀도로 판별 처리를 수행한다.
이하, 상술한 여러 가지 특징 파라미터의 추출 처리에 대하여 설명한다.
(1) 복잡성(선 밀도)의 추출
문자의 복잡성은 상술한 바와 같이 한자와 다른 문자의 판별에 사용되는 특징량을 나타내는 유용한 파라미터이다. 문자의 복잡성은 스트로크 등의 수로부터 구할 수 있지만, 보다 용이하고 고속 처리를 위하여 선 밀도를 바탕으로 문자의 복잡성을 구하는 것이 바람직하다. 이하, 선 밀도를 바탕으로 복잡성의 추출 처리에 대하여 설명한다.
도 10은 본 발명의 실시예에 따른 복잡성 추출 처리의 플로우 차트이다. 도 11은 복잡성(선 밀도) 추출 처리의 개념을 나타낸다.
문자 화상 데이터로부터 복잡성을 추출하기 위하여, 도 10 및 11에 나타낸 바와 같이 문자 데이터의 선 밀도를 0°, 45° 및 90°방향으로 투영한다(스텝 S11). 이어서, 0°, 45° 및 90°방향으로 투영된 선 밀도의 평균을 구하여 저장한다(스텝 S12).
예컨대, 45°방향의 선 밀도를 구하기 위해서는, 문자 화상 데이터의 화소를 사선 방향으로 주사하여 백색 화소가 흑색 화소로 변하는 화소 수를 구한다. 도 11의 경우에는, 백색 화소가 흑색 화소로 변하는 화소 수는 문자 "十"(71)의 중심 부분을 제외하고 2이다. 문자의 중심 부분은 1이기 때문에, 처리는 도 11에 나타낸 바와 같이 수행한다.
상술한 바와 같이, 각 방향별로 선 밀도를 구하고, 얻어진 선 밀도의 평균을 구함으로써, 문자 화상 데이터의 복잡성에 해당하는 특징 파라미터를 추출한다.
(2) 직선성의 추출
활자 문자는 직선 성분이 많으며, 이 직선성은 수기 문자와 활자 문자의 판별에 유용한 파라미터이다.
도 12는 본 발명의 실시예에 따른 직선성 추출 처리의 플로우 차트이다. 도 13은 직선성 추출 처리의 개념을 나타낸다.
문자 화상 데이터로부터 직선성을 추출하기 위해서는, 우선 문자 화상 데이터의 가장자리를 추출한다(스텝 S21). 예컨대, 도 13에 나타낸 문자 화상 "十"(81)의 경우에는, 흑색 테두리의 백색 문자로 표시된 가장자리 화상(82)을 추출한다.
이어서, 수평 방향의 연속선(horizontal run)의 길이를 측정하고, 일정 길이 이상의 연속선의 개수를 저장한다(스텝 S22). 도 13에 나타낸 예에서, 수평 방향으로 일정 길이 이상의 연속선(83)을 추출하고, 이 연속선의 개수를 저장한다.
마찬가지로, 수직 방향의 연속선의 길이를 측정하고, 일정 길이 이상의 연속선의 개수를 저장한다(스텝 S23). 도 13에 나타낸 예에서는, 수직 방향으로 일정 길이 이상의 연속선(84)을 추출하고, 그 개수를 저장한다.
상술한 바와 같이, 수평 및 수직 방향으로 소정 길이 이상의 연속선을 추출하고 그 개수를 구함으로써, 각 방향마다의 직선성에 해당하는 특징 파라미터를 추출한다.
(3) 선 폭의 분산의 추출
스트로크의 선 폭의 분산은 수기 문자와 활자 문자의 판별에 유용한 파라미터이다. 상술한 바와 같이, 일반적으로 수기 문자는 선 폭의 분산이 크고, 활자 문자는 선 폭의 분산이 작다. 그러나, 명조체에서는 스트로크의 끝점과 변곡점에 장식이 첨가되어 있다. 선 폭의 분산을 계산할 때 상기 장식을 포함시키면, 선 폭의 분산이 커져서, 상기 활자 문자를 수기 문자로 오판하게 된다. 또한, 명조체에서는 선 폭이 상술한 바와 같이 스트로크의 방향에 따라 다르다.
본 실시예에 따르면, 스트로크의 끝점, 교점 및 변곡점을 구하고, 이들 점으로부터 일정 길이 내의 부분을 제외하여 스트로크의 선 폭의 분산을 구하며, 각 스트로크별 또는 각 스트로크 방향별로 선 폭의 분산을 구한다.
도 14는 본 발명의 실시예에 따른 선 폭 분산 추출 처리의 플로우 차트이다. 도 15는 선 폭 분산 추출 처리의 개념을 나타낸다.
문자 화상 데이터로부터 선 폭의 분산을 추출하기 위해서는, 우선 문자 화상의 선을 가늘게 하여 세선화 화상을 얻는다(스텝 S31). 예컨대, 도 15에 나타낸 예에서, 원래 화상(91)의 선을 가늘게 하여 세선화 화상(92)을 얻을 수 있다.
이어서, 세선화 화상(92)으로부터 끝점(93~96), 교점(97) 및 변곡점을 구한다. 세선화 화상(92)으로부터 끝점(93~96), 교점(97) 및 변곡점 부근의 화소를 제거하여 세선화 화상(98)을 얻는다(스텝 S32 및 S33).
이어서, 스텝 S33에서 얻은 세선화 화상에 남아있는 각 점마다 벡터를 구하고, 벡터에 수직인 방향의 선 폭을 구한다(스텝 S34). 도 15에 나타낸 예에서는, 세선화 화상(98)에 남아있는 각 점마다 수평 방향의 선 폭(H)과 수직 방향의 선 폭(V)을 구한다.
벡터의 각 방향마다 선 폭(H,V)의 분산(표준 편차)을 구하고, 평균값을 저장한다(스텝 S35).
상술한 바와 같이, 얻어진 특징 파라미터에 의해 수기 문자와 활자 문자를 판별함으로써, 수기 문자와 활자 문자를 높은 정밀도로 식별한다. 또한, 명조체에서는 상술한 바와 같이 스트로크으로부터 스트로크의 끝점, 교점 및 변곡점을 제거하여 선 폭의 분산을 구하고, 각 벡터 방향별로 선 폭의 분산을 구함으로써, 보다 높은 정밀도로 수기 문자와 활자 문자를 판별할 수 있다.
(4) 문자 위치의 분산 추출
각 문자마다 최하행 좌표 위치의 분산은 도 16a에 나타낸 바와 같이 활자 문자의 경우에는 작고, 도 16b에 나타낸 바와 같이 수기 문자의 경우에는 크다. 따라서, 상기 분산은 수기 문자와 활자 문자의 식별에 유용한 파라미터이다. 특히, 이 방법은 예컨대, 숫자가 기입되는 장부의 금액란에 대하여 유효하다.
도 17은 본 발명의 실시예에 따른 문자 위치의 분산 추출 처리의 플로우 차트이다.
문자 화상 데이터로부터 선 폭의 분산을 추출하기 위해서는, 영역 내의 연결 흑색 화소에 대한 외접 직사각형을 구한다(스텝 S41). 예컨대, 도 16b에 나타낸 연결 화소에 대해서는 도 16c에 나타낸 바와 같이 외접 직사각형(101~106)이 얻어진다.
이어서, 외접 직사각형(101~106)의 최하행 좌표(Y1~Y6)의 분산(표준 편차)을 구하여 저장한다(스텝 S42).
상술한 처리를 수행함으로써, 문자 위치의 분산에 관한 특징 파라미터를 구할 수 있다. 상기 특징 파라미터를 사용함으로써, 예컨대 금액란 등의 숫자가 기입되는 영역에서 수기 문자와 활자 문자를 높은 정밀도로 판별할 수 있다.
상술한 실시예에 따르면, 하기 효과를 얻을 수 있다.
(1) 적어도 문자 패턴의 복잡성과 직선성을 나타내는 특징량을 포함하는 특징 벡터를 사용하여 수기 문자와 활자 문자를 식별하기 때문에, 높은 정밀도로 단시간 내에 식별 처리를 수행할 수 있다.
(2) 복잡성을 나타내는 특징으로서 선 밀도를 사용함으로써, 복잡성을 나타내는 특징을 고속으로 용이하게 구할 수 있다.
(3) 문자 패턴에 포함된 문자 스트로크의 끝점, 교점 및 변곡점으로부터 일정 거리 내의 패턴을 제거하여 구한 선 폭의 분산을 특징량으로 사용하여 수기 문자와 활자 문자를 식별함으로써 명조체 등의 폰트의 장식에 영향을 받지 않으면서 보다 정밀하게 수기 문자와 활자 문자를 판별할 수 있다.
(4) 각 스트로크별 또는 각 스트로크 방향별로 선폭의 분산을 구함으로써, 명조체에서 볼 수 있는 스트로크의 방향에 따른 선 폭의 차이에 영향을 받지 않으면서 선 폭의 분산을 추출할 수 있어서 보다 정밀하게 수기 문자와 활자 문자를 식별할 수 있다.

Claims (15)

  1. 문서 또는 장부의 화상으로부터 문자 패턴을 추출하는 단계;
    상기 문자 패턴으로부터 적어도 문자 패턴의 복잡성과 직선성을 나타내는 특징을 포함하는 N개의 특징 벡터를 구하는 단계; 및
    상기 특징 벡터를 사용하여 상기 문자 패턴이 수기 문자인지 활자 문자인지를 판별하고, 그 판별 결과를 바탕으로 문자 인식 처리를 수행하는 단계
    를 포함하는 것을 특징으로 하는 문자 인식 방법.
  2. 제 1항에 있어서,
    복잡성을 나타내는 특징으로서 선 밀도를 사용하는 것을 특징으로 하는 문자 인식 방법.
  3. 문서 또는 장부의 화상으로부터 문자 패턴을 추출하는 단계;
    상기 문자 패턴에 포함된 문자 스트로크의 끝점, 교점 및 변곡점으로부터 일정 거리 내의 패턴을 문자 패턴으로부터 제거하여 구한 선 폭의 분산을 나타내는 특징량을 추출하는 단계;
    적어도 상기 특징량을 바탕으로 수기 문자와 활자 문자를 판별하는 단계; 및
    상기 판별 결과를 바탕으로 문자를 인식하는 단계
    를 포함하는 것을 특징으로 하는 문자 인식 방법.
  4. 제 3항에 있어서,
    상기 선 폭의 분산을 각 스트로크별 또는 스트로크 방향별로 구하는 것을 특징으로 하는 문자 인식 방법.
  5. 문서 또는 장부의 화상으로부터 문자 패턴을 추출하는 문자 패턴 추출 수단;
    상기 문자 패턴이 수기 문자인지 활자 문자인지를 판별하는 수기/활자 문자 판별 수단; 및
    상기 판별 결과를 바탕으로 문자를 인식하는 문자 인식 수단
    을 포함하며,
    상기 수기/활자 문자 판별 수단이
    상기 문자 패턴으로부터 문자 패턴의 복잡성을 나타내는 특징을 추출하는 복잡성 추출 수단;
    직선성을 나타내는 특징을 추출하는 직선성 추출 수단; 및
    적어도 복잡성을 나타내는 특징과 직선성을 나타내는 특징을 포함하는 N개의 특징 벡터를 바탕으로 상기 문자 패턴이 수기 문자인지 활자 문자인지를 판별하는 판별 수단
    을 구비한 것을 특징으로 하는 문자 인식 장치.
  6. 제 5항에 있어서,
    상기 복잡성 추출 수단은 문자 패턴으로부터 선 밀도를 구함으로써 복잡성을 나타내는 특징을 추출하는 것을 특징으로 하는 문자 인식 장치.
  7. 문서 또는 장부의 화상으로부터 문자 패턴을 추출하는 문자 패턴 추출 수단;
    상기 문자 패턴이 수기 문자인지 활자 문자인지를 판별하는 수기/활자 문자 판별 수단; 및
    상기 판별 결과를 바탕으로 문자를 인식하는 문자 인식 수단
    을 포함하며,
    상기 수기/활자 문자 판별 수단이
    상기 문자 패턴에 포함된 문자 스트로크의 끝점, 교점 및 변곡점으로부터 일정 거리 내의 패턴을 문자 패턴으로부터 제거하여 구한 선 폭의 분산을 나타내는 특징량을 추출하는 선 폭 분산 추출 수단; 및
    적어도 상기 선 폭의 분산을 나타내는 특징량을 바탕으로 상기 문자 패턴이 수기 문자인지 활자 문자인지를 판별하는 판별 수단
    을 구비한 것을 특징으로 하는 문자 인식 장치.
  8. 제 7항에 있어서,
    상기 선 폭 분산 추출 수단은 각 스트로크별 또는 각 스트로크 방향별로 선 폭의 분산을 구하는 것을 특징으로 하는 문자 인식 장치.
  9. 입력 화상으로부터 추출된 패턴의 특징을 식별하는 특징 식별 수단;
    수기 문자를 문자 인식하는 수기 문자 인식 수단;
    활자 문자를 문자 인식하는 활자 문자 인식 수단; 및
    상기 특징 식별 수단에 의한 식별 결과를 바탕으로 상기 수기 문자 인식 수단과 상기 활자 문자 인식 수단 중 하나를 선택하는 문자 인식 선택 수단
    을 포함하는 것을 특징으로 하는 문자 인식 장치.
  10. 제 9항에 있어서,
    상기 특징 식별 수단은 패턴의 규칙성을 바탕으로 상기 패턴이 수기 문자인지 활자 문자인지를 판별하는 것을 특징으로 하는 문자 인식 장치.
  11. 제 9항에 있어서,
    패턴의 특징은 패턴의 복잡성, 직선성, 선 폭의 분산, 배열 위치의 분산, 기울기의 분산 및 크기의 분산 중 적어도 하나를 포함하는 것을 특징으로 하는 문자 인식 장치.
  12. 제 11항에 있어서,
    상기 복잡성은 선 밀도, 흑색 화소의 밀도, 오일러(Euler) 수 및 외형 길이 중 적어도 하나를 포함하는 것을 특징으로 하는 문자 인식 장치.
  13. 제 11항에 있어서,
    상기 직선성을 패턴에서 일정 길이 이상의 선의 개수를 바탕으로 계산하는 것을 특징으로 하는 문자 인식 장치.
  14. 문서 또는 장부의 화상으로부터 추출된 문자 패턴을 인식하는 문자 인식 프로그램을 저장하는 컴퓨터 판독용 기록 매체에 있어서,
    상기 문자 인식 프로그램은 컴퓨터로 하여금
    상기 문자 패턴으로부터 적어도 문자 패턴의 복잡성과 직선성을 나타내는 특징을 포함하는 N개의 특징 벡터를 구하는 단계; 및
    상기 특징 벡터를 사용하여 상기 문자 패턴이 수기 문자인지 활자 문자인지를 판별하는 단계
    를 수행하도록 하는 것을 특징으로 하는 컴퓨터 판독용 기록 매체.
  15. 문서 또는 장부의 화상으로부터 추출된 문자 패턴을 인식하는 문자 인식 프로그램을 저장하는 컴퓨터 판독용 기록 매체에 있어서,
    상기 문자 인식 프로그램은 컴퓨터로 하여금
    상기 문자 패턴에 포함된 문자 스트로크의 끝점, 교점 및 변곡점으로부터 일정 거리 내의 패턴을 문자 패턴으로부터 제거하여 구한 선 폭의 분산을 나타내는 특징량을 추출하는 단계; 및
    적어도 상기 특징량을 바탕으로 수기 문자와 활자 문자를 판별하는 단계
    를 수행하도록 하는 것을 특징으로 하는 컴퓨터 판독용 기록 매체.
KR1019990026823A 1998-12-16 1999-07-05 문자 인식 장치 및 방법 KR100658119B1 (ko)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP98-357701 1998-12-16
JP10357701A JP2000181993A (ja) 1998-12-16 1998-12-16 文字認識方法および装置

Publications (2)

Publication Number Publication Date
KR20000047428A true KR20000047428A (ko) 2000-07-25
KR100658119B1 KR100658119B1 (ko) 2006-12-15

Family

ID=18455477

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1019990026823A KR100658119B1 (ko) 1998-12-16 1999-07-05 문자 인식 장치 및 방법

Country Status (4)

Country Link
US (1) US6643401B1 (ko)
JP (1) JP2000181993A (ko)
KR (1) KR100658119B1 (ko)
CN (1) CN1163846C (ko)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100718139B1 (ko) * 2005-11-04 2007-05-14 삼성전자주식회사 영상에 포함된 문자 인식장치 및 방법

Families Citing this family (143)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8645137B2 (en) 2000-03-16 2014-02-04 Apple Inc. Fast, language-independent method for user authentication by voice
US7024042B2 (en) * 2000-10-04 2006-04-04 Fujitsu Limited Word recognition device, word recognition method, and storage medium
US6909805B2 (en) * 2001-01-31 2005-06-21 Matsushita Electric Industrial Co., Ltd. Detecting and utilizing add-on information from a scanned document image
US6940617B2 (en) * 2001-02-09 2005-09-06 Matsushita Electric Industrial Co., Ltd. Printing control interface system and method with handwriting discrimination capability
US20020141643A1 (en) * 2001-02-15 2002-10-03 Denny Jaeger Method for creating and operating control systems
KR100518744B1 (ko) * 2002-11-21 2005-10-05 한국전자통신연구원 비수직 분할선을 가지는 붙은 필기체 숫자열의 분할방법
JP2006092346A (ja) * 2004-09-24 2006-04-06 Fuji Xerox Co Ltd 文字認識装置、文字認識方法および文字認識プログラム
JP2007058622A (ja) * 2005-08-25 2007-03-08 Konica Minolta Business Technologies Inc 文書管理装置及び文書管理方法
JP4172478B2 (ja) * 2005-08-25 2008-10-29 コニカミノルタビジネステクノロジーズ株式会社 文書管理装置及び文書管理方法
US8677377B2 (en) 2005-09-08 2014-03-18 Apple Inc. Method and apparatus for building an intelligent automated assistant
JP4420877B2 (ja) * 2005-09-22 2010-02-24 シャープ株式会社 画像処理方法、画像処理装置、及び画像出力装置
US9318108B2 (en) 2010-01-18 2016-04-19 Apple Inc. Intelligent automated assistant
CN101149804B (zh) * 2006-09-19 2010-11-10 北京三星通信技术研究有限公司 自适应手写识别系统和方法
US8633930B2 (en) * 2007-03-26 2014-01-21 Apple Inc. Non-linear text flow
US8977255B2 (en) 2007-04-03 2015-03-10 Apple Inc. Method and system for operating a multi-function portable electronic device using voice-activation
KR100926823B1 (ko) 2007-12-05 2009-11-12 황병익 문자 인식 방법
US9330720B2 (en) 2008-01-03 2016-05-03 Apple Inc. Methods and apparatus for altering audio output signals
US8996376B2 (en) 2008-04-05 2015-03-31 Apple Inc. Intelligent text-to-speech conversion
US10496753B2 (en) 2010-01-18 2019-12-03 Apple Inc. Automatically adapting user interfaces for hands-free interaction
US20100030549A1 (en) 2008-07-31 2010-02-04 Lee Michael M Mobile device having human language translation capability with positional feedback
WO2010067118A1 (en) 2008-12-11 2010-06-17 Novauris Technologies Limited Speech recognition involving a mobile device
US8319665B2 (en) 2009-02-20 2012-11-27 Appareo Systems, Llc Adaptive instrument and operator control recognition
US8319666B2 (en) 2009-02-20 2012-11-27 Appareo Systems, Llc Optical image monitoring system and method for vehicles
JP5517028B2 (ja) * 2009-03-16 2014-06-11 株式会社リコー 画像処理装置
US10241752B2 (en) 2011-09-30 2019-03-26 Apple Inc. Interface for a virtual digital assistant
US20120309363A1 (en) 2011-06-03 2012-12-06 Apple Inc. Triggering notifications associated with tasks items that represent tasks to perform
US10241644B2 (en) 2011-06-03 2019-03-26 Apple Inc. Actionable reminder entries
US9858925B2 (en) 2009-06-05 2018-01-02 Apple Inc. Using context information to facilitate processing of commands in a virtual assistant
US9431006B2 (en) 2009-07-02 2016-08-30 Apple Inc. Methods and apparatuses for automatic speech recognition
US8649600B2 (en) * 2009-07-10 2014-02-11 Palo Alto Research Center Incorporated System and method for segmenting text lines in documents
JP5363591B2 (ja) 2009-12-15 2013-12-11 富士通フロンテック株式会社 文字認識方法、文字認識装置および文字認識プログラム
US10679605B2 (en) 2010-01-18 2020-06-09 Apple Inc. Hands-free list-reading by intelligent automated assistant
US10705794B2 (en) 2010-01-18 2020-07-07 Apple Inc. Automatically adapting user interfaces for hands-free interaction
US10553209B2 (en) 2010-01-18 2020-02-04 Apple Inc. Systems and methods for hands-free notification summaries
US10276170B2 (en) 2010-01-18 2019-04-30 Apple Inc. Intelligent automated assistant
DE202011111062U1 (de) 2010-01-25 2019-02-19 Newvaluexchange Ltd. Vorrichtung und System für eine Digitalkonversationsmanagementplattform
US8682667B2 (en) 2010-02-25 2014-03-25 Apple Inc. User profiling for selecting user specific voice input processing information
CN102402693B (zh) * 2010-09-09 2014-07-30 富士通株式会社 处理包含字符的图像的方法和设备
US10762293B2 (en) 2010-12-22 2020-09-01 Apple Inc. Using parts-of-speech tagging and named entity recognition for spelling correction
US9262612B2 (en) 2011-03-21 2016-02-16 Apple Inc. Device access using voice authentication
JP5182902B2 (ja) * 2011-03-31 2013-04-17 京セラコミュニケーションシステム株式会社 文書イメージ出力装置
US10057736B2 (en) 2011-06-03 2018-08-21 Apple Inc. Active transport based notifications
US8977059B2 (en) * 2011-06-03 2015-03-10 Apple Inc. Integrating feature extraction via local sequential embedding for automatic handwriting recognition
US8994660B2 (en) 2011-08-29 2015-03-31 Apple Inc. Text correction processing
JP5935324B2 (ja) * 2012-01-04 2016-06-15 富士ゼロックス株式会社 情報処理装置及び情報処理プログラム
US10607424B2 (en) 2012-02-10 2020-03-31 Appareo Systems, Llc Frequency-adaptable structural health and usage monitoring system (HUMS) and method with smart sensors
EP2812661B1 (en) 2012-02-10 2019-11-27 Appareo Systems, LLC Frequency-adaptable structural health and usage monitoring system
US10134385B2 (en) 2012-03-02 2018-11-20 Apple Inc. Systems and methods for name pronunciation
US9483461B2 (en) 2012-03-06 2016-11-01 Apple Inc. Handling speech synthesis of content for multiple languages
US9280610B2 (en) 2012-05-14 2016-03-08 Apple Inc. Crowd sourcing information to fulfill user requests
US9721563B2 (en) 2012-06-08 2017-08-01 Apple Inc. Name recognition system
US9495129B2 (en) 2012-06-29 2016-11-15 Apple Inc. Device, method, and user interface for voice-activated navigation and browsing of a document
US9576574B2 (en) 2012-09-10 2017-02-21 Apple Inc. Context-sensitive handling of interruptions by intelligent digital assistant
US9547647B2 (en) 2012-09-19 2017-01-17 Apple Inc. Voice-based media searching
DE212014000045U1 (de) 2013-02-07 2015-09-24 Apple Inc. Sprach-Trigger für einen digitalen Assistenten
US9368114B2 (en) 2013-03-14 2016-06-14 Apple Inc. Context-sensitive handling of interruptions
US10652394B2 (en) 2013-03-14 2020-05-12 Apple Inc. System and method for processing voicemail
CN105027197B (zh) 2013-03-15 2018-12-14 苹果公司 训练至少部分语音命令系统
WO2014144579A1 (en) 2013-03-15 2014-09-18 Apple Inc. System and method for updating an adaptive speech recognition model
WO2014197336A1 (en) 2013-06-07 2014-12-11 Apple Inc. System and method for detecting errors in interactions with a voice-based digital assistant
US9582608B2 (en) 2013-06-07 2017-02-28 Apple Inc. Unified ranking with entropy-weighted information for phrase-based semantic auto-completion
WO2014197334A2 (en) 2013-06-07 2014-12-11 Apple Inc. System and method for user-specified pronunciation of words for speech synthesis and recognition
WO2014197335A1 (en) 2013-06-08 2014-12-11 Apple Inc. Interpreting and acting upon commands that involve sharing information with remote devices
US10176167B2 (en) 2013-06-09 2019-01-08 Apple Inc. System and method for inferring user intent from speech inputs
AU2014278592B2 (en) 2013-06-09 2017-09-07 Apple Inc. Device, method, and graphical user interface for enabling conversation persistence across two or more instances of a digital assistant
EP3008964B1 (en) 2013-06-13 2019-09-25 Apple Inc. System and method for emergency calls initiated by voice command
WO2015020942A1 (en) 2013-08-06 2015-02-12 Apple Inc. Auto-activating smart responses based on activities from remote devices
US9620105B2 (en) 2014-05-15 2017-04-11 Apple Inc. Analyzing audio input for efficient speech and music recognition
US10592095B2 (en) 2014-05-23 2020-03-17 Apple Inc. Instantaneous speaking of content on touch devices
US9502031B2 (en) 2014-05-27 2016-11-22 Apple Inc. Method for supporting dynamic grammars in WFST-based ASR
AU2015266863B2 (en) 2014-05-30 2018-03-15 Apple Inc. Multi-command single utterance input method
US9785630B2 (en) 2014-05-30 2017-10-10 Apple Inc. Text prediction using combined word N-gram and unigram language models
US9430463B2 (en) 2014-05-30 2016-08-30 Apple Inc. Exemplar-based natural language processing
US10078631B2 (en) 2014-05-30 2018-09-18 Apple Inc. Entropy-guided text prediction using combined word and character n-gram language models
US9633004B2 (en) 2014-05-30 2017-04-25 Apple Inc. Better resolution when referencing to concepts
US9715875B2 (en) 2014-05-30 2017-07-25 Apple Inc. Reducing the need for manual start/end-pointing and trigger phrases
US10289433B2 (en) 2014-05-30 2019-05-14 Apple Inc. Domain specific language for encoding assistant dialog
US10170123B2 (en) 2014-05-30 2019-01-01 Apple Inc. Intelligent assistant for home automation
US9734193B2 (en) 2014-05-30 2017-08-15 Apple Inc. Determining domain salience ranking from ambiguous words in natural speech
US9842101B2 (en) 2014-05-30 2017-12-12 Apple Inc. Predictive conversion of language input
US9760559B2 (en) 2014-05-30 2017-09-12 Apple Inc. Predictive text input
US9338493B2 (en) 2014-06-30 2016-05-10 Apple Inc. Intelligent automated assistant for TV user interactions
US10659851B2 (en) 2014-06-30 2020-05-19 Apple Inc. Real-time digital assistant knowledge updates
US10446141B2 (en) 2014-08-28 2019-10-15 Apple Inc. Automatic speech recognition based on user feedback
US9818400B2 (en) 2014-09-11 2017-11-14 Apple Inc. Method and apparatus for discovering trending terms in speech requests
US10789041B2 (en) 2014-09-12 2020-09-29 Apple Inc. Dynamic thresholds for always listening speech trigger
US9646609B2 (en) 2014-09-30 2017-05-09 Apple Inc. Caching apparatus for serving phonetic pronunciations
US10074360B2 (en) 2014-09-30 2018-09-11 Apple Inc. Providing an indication of the suitability of speech recognition
US10127911B2 (en) 2014-09-30 2018-11-13 Apple Inc. Speaker identification and unsupervised speaker adaptation techniques
US9886432B2 (en) 2014-09-30 2018-02-06 Apple Inc. Parsimonious handling of word inflection via categorical stem + suffix N-gram language models
US9668121B2 (en) 2014-09-30 2017-05-30 Apple Inc. Social reminders
US10552013B2 (en) 2014-12-02 2020-02-04 Apple Inc. Data detection
US9711141B2 (en) 2014-12-09 2017-07-18 Apple Inc. Disambiguating heteronyms in speech synthesis
CN105787415B (zh) * 2014-12-18 2020-04-07 富士通株式会社 文档图像的处理装置、方法以及扫描仪
US9865280B2 (en) 2015-03-06 2018-01-09 Apple Inc. Structured dictation using intelligent automated assistants
US9886953B2 (en) 2015-03-08 2018-02-06 Apple Inc. Virtual assistant activation
US10567477B2 (en) 2015-03-08 2020-02-18 Apple Inc. Virtual assistant continuity
US9721566B2 (en) 2015-03-08 2017-08-01 Apple Inc. Competing devices responding to voice triggers
US9899019B2 (en) 2015-03-18 2018-02-20 Apple Inc. Systems and methods for structured stem and suffix language models
US9842105B2 (en) 2015-04-16 2017-12-12 Apple Inc. Parsimonious continuous-space phrase representations for natural language processing
US10083688B2 (en) 2015-05-27 2018-09-25 Apple Inc. Device voice control for selecting a displayed affordance
US10127220B2 (en) 2015-06-04 2018-11-13 Apple Inc. Language identification from short strings
US10101822B2 (en) 2015-06-05 2018-10-16 Apple Inc. Language input correction
US9578173B2 (en) 2015-06-05 2017-02-21 Apple Inc. Virtual assistant aided communication with 3rd party service in a communication session
US10255907B2 (en) 2015-06-07 2019-04-09 Apple Inc. Automatic accent detection using acoustic models
US11025565B2 (en) 2015-06-07 2021-06-01 Apple Inc. Personalized prediction of responses for instant messaging
US10186254B2 (en) 2015-06-07 2019-01-22 Apple Inc. Context-based endpoint detection
KR101584045B1 (ko) * 2015-09-02 2016-01-11 주식회사 시큐브 세그먼트 기반 수기서명 인증 시스템 및 방법
US10671428B2 (en) 2015-09-08 2020-06-02 Apple Inc. Distributed personal assistant
US10747498B2 (en) 2015-09-08 2020-08-18 Apple Inc. Zero latency digital assistant
US9697820B2 (en) 2015-09-24 2017-07-04 Apple Inc. Unit-selection text-to-speech synthesis using concatenation-sensitive neural networks
US11010550B2 (en) 2015-09-29 2021-05-18 Apple Inc. Unified language modeling framework for word prediction, auto-completion and auto-correction
US10366158B2 (en) 2015-09-29 2019-07-30 Apple Inc. Efficient word encoding for recurrent neural network language models
US11587559B2 (en) 2015-09-30 2023-02-21 Apple Inc. Intelligent device identification
US10691473B2 (en) 2015-11-06 2020-06-23 Apple Inc. Intelligent automated assistant in a messaging environment
US10049668B2 (en) 2015-12-02 2018-08-14 Apple Inc. Applying neural network language models to weighted finite state transducers for automatic speech recognition
US10223066B2 (en) 2015-12-23 2019-03-05 Apple Inc. Proactive assistance based on dialog communication between devices
US10446143B2 (en) 2016-03-14 2019-10-15 Apple Inc. Identification of voice inputs providing credentials
US9934775B2 (en) 2016-05-26 2018-04-03 Apple Inc. Unit-selection text-to-speech synthesis based on predicted concatenation parameters
US9972304B2 (en) 2016-06-03 2018-05-15 Apple Inc. Privacy preserving distributed evaluation framework for embedded personalized systems
US10249300B2 (en) 2016-06-06 2019-04-02 Apple Inc. Intelligent list reading
US10049663B2 (en) 2016-06-08 2018-08-14 Apple, Inc. Intelligent automated assistant for media exploration
DK179309B1 (en) 2016-06-09 2018-04-23 Apple Inc Intelligent automated assistant in a home environment
US10490187B2 (en) 2016-06-10 2019-11-26 Apple Inc. Digital assistant providing automated status report
US10067938B2 (en) 2016-06-10 2018-09-04 Apple Inc. Multilingual word prediction
US10586535B2 (en) 2016-06-10 2020-03-10 Apple Inc. Intelligent digital assistant in a multi-tasking environment
US10192552B2 (en) 2016-06-10 2019-01-29 Apple Inc. Digital assistant providing whispered speech
US10509862B2 (en) 2016-06-10 2019-12-17 Apple Inc. Dynamic phrase expansion of language input
DK179415B1 (en) 2016-06-11 2018-06-14 Apple Inc Intelligent device arbitration and control
DK179049B1 (en) 2016-06-11 2017-09-18 Apple Inc Data driven natural language event detection and classification
DK179343B1 (en) 2016-06-11 2018-05-14 Apple Inc Intelligent task discovery
DK201670540A1 (en) 2016-06-11 2018-01-08 Apple Inc Application integration with a digital assistant
US10043516B2 (en) 2016-09-23 2018-08-07 Apple Inc. Intelligent automated assistant
US10593346B2 (en) 2016-12-22 2020-03-17 Apple Inc. Rank-reduced token representation for automatic speech recognition
DK201770439A1 (en) 2017-05-11 2018-12-13 Apple Inc. Offline personal assistant
DK179745B1 (en) 2017-05-12 2019-05-01 Apple Inc. SYNCHRONIZATION AND TASK DELEGATION OF A DIGITAL ASSISTANT
DK179496B1 (en) 2017-05-12 2019-01-15 Apple Inc. USER-SPECIFIC Acoustic Models
DK201770431A1 (en) 2017-05-15 2018-12-20 Apple Inc. Optimizing dialogue policy decisions for digital assistants using implicit feedback
DK201770432A1 (en) 2017-05-15 2018-12-21 Apple Inc. Hierarchical belief states for digital assistants
DK179560B1 (en) 2017-05-16 2019-02-18 Apple Inc. FAR-FIELD EXTENSION FOR DIGITAL ASSISTANT SERVICES
KR102075299B1 (ko) * 2019-07-03 2020-02-07 서정현 선 인식 장치 및 방법
JP7532171B2 (ja) 2020-09-18 2024-08-13 株式会社Pfu 画像判定装置、画像判定方法、及びプログラム
CN116434250B (zh) * 2023-06-13 2023-08-25 深圳宏途教育网络科技有限公司 一种手写字符图像相似度确定模型训练方法

Family Cites Families (20)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4259661A (en) * 1978-09-01 1981-03-31 Burroughs Corporation Apparatus and method for recognizing a pattern
JPS5837779A (ja) * 1981-08-31 1983-03-05 Ricoh Co Ltd 文書処理装置
JPH0632070B2 (ja) * 1983-11-28 1994-04-27 株式会社東芝 文字認識装置
JPS60118985A (ja) 1983-11-30 1985-06-26 Ricoh Co Ltd 文字種識別方式
US4700400A (en) * 1985-10-10 1987-10-13 The Palantir Corporation Feature extraction technique for use in a pattern recognition system
JPS6379193A (ja) 1986-09-22 1988-04-09 Toshiba Corp 文字読取装置
JP3038344B2 (ja) * 1987-02-24 2000-05-08 株式会社東芝 郵便物読取処理装置
JPS63261486A (ja) * 1987-04-20 1988-10-28 Nec Corp 書体識別装置
JPS63298494A (ja) * 1987-05-29 1988-12-06 Hitachi Ltd パタ−ン認識装置
JP2713911B2 (ja) * 1987-07-08 1998-02-16 株式会社東芝 郵便物処理装置
JP2868134B2 (ja) * 1990-09-03 1999-03-10 キヤノン株式会社 画像処理方法及び装置
WO1992006448A1 (de) * 1990-09-27 1992-04-16 Cgk Computer Gesellschaft Konstanz Mbh Verfahren zur extrahierung von einzelzeichen aus rasterbildvorlagen einer gelesenen hand- oder maschinenschriftlichen zeichenfolge freier teilung
JPH05189604A (ja) * 1992-01-14 1993-07-30 Toshiba Corp 光学的文字読取装置
US5521985A (en) * 1992-08-13 1996-05-28 International Business Machines Corporation Apparatus for recognizing machine generated or handprinted text
US5872864A (en) * 1992-09-25 1999-02-16 Olympus Optical Co., Ltd. Image processing apparatus for performing adaptive data processing in accordance with kind of image
JP2933801B2 (ja) * 1993-06-11 1999-08-16 富士通株式会社 文字の切り出し方法及びその装置
JPH08123904A (ja) * 1994-10-21 1996-05-17 Matsushita Electric Ind Co Ltd 書体種類処理装置
JP4176175B2 (ja) 1996-09-27 2008-11-05 富士通株式会社 パターン認識装置
JPH10162102A (ja) 1996-12-03 1998-06-19 Ricoh Co Ltd 文字認識装置
JPH10162103A (ja) 1996-12-04 1998-06-19 Oki Electric Ind Co Ltd 文字認識装置

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100718139B1 (ko) * 2005-11-04 2007-05-14 삼성전자주식회사 영상에 포함된 문자 인식장치 및 방법

Also Published As

Publication number Publication date
CN1258894A (zh) 2000-07-05
KR100658119B1 (ko) 2006-12-15
US6643401B1 (en) 2003-11-04
JP2000181993A (ja) 2000-06-30
CN1163846C (zh) 2004-08-25

Similar Documents

Publication Publication Date Title
KR100658119B1 (ko) 문자 인식 장치 및 방법
Spitz Determination of the script and language content of document images
JP4006224B2 (ja) 画像品質判定方法、判定装置、判定プログラム
JP5379085B2 (ja) スキャンされた文書画像内の前景画素群の連結グループをマーキング種類に基づき分類する方法及びシステム
Pal et al. Identification of different script lines from multi-script documents
KR19980023917A (ko) 패턴 인식 장치 및 방법
US11823497B2 (en) Image processing system and an image processing method
JP2000315247A (ja) 文字認識装置
US6272238B1 (en) Character recognizing method and apparatus
CN115311666A (zh) 图文识别方法、装置、计算机设备及存储介质
US11756321B2 (en) Information processing apparatus and non-transitory computer readable medium
Dhandra et al. Word-wise script identification from bilingual documents based on morphological reconstruction
JP3276555B2 (ja) フォーマット認識装置及び文字読取り装置
Lee et al. Combining macro and micro features for writer identification
JPH02116987A (ja) 文字認識装置
JP2000331122A (ja) 文字認識方法および装置
JP2917427B2 (ja) 図面読取装置
JP2906758B2 (ja) 文字読取装置
KR100317653B1 (ko) 대용량인쇄체문자인식을위한특징추출방법
JP3428504B2 (ja) 文字認識装置
JP2974145B2 (ja) 文字認識結果の修正方法
Eglin et al. Visual exploration and functional document labeling
Soua et al. Efficient multiscale and multifont optical character recognition system based on robust feature description
JP2022051199A (ja) 画像判定装置、画像判定方法、及びプログラム
CN116958995A (zh) 一种基于字符在平面位置信息的分段方法

Legal Events

Date Code Title Description
A201 Request for examination
AMND Amendment
E902 Notification of reason for refusal
AMND Amendment
E601 Decision to refuse application
J201 Request for trial against refusal decision
AMND Amendment
B701 Decision to grant
GRNT Written decision to grant
LAPS Lapse due to unpaid annual fee