KR100658119B1 - 문자 인식 장치 및 방법 - Google Patents
문자 인식 장치 및 방법 Download PDFInfo
- Publication number
- KR100658119B1 KR100658119B1 KR1019990026823A KR19990026823A KR100658119B1 KR 100658119 B1 KR100658119 B1 KR 100658119B1 KR 1019990026823 A KR1019990026823 A KR 1019990026823A KR 19990026823 A KR19990026823 A KR 19990026823A KR 100658119 B1 KR100658119 B1 KR 100658119B1
- Authority
- KR
- South Korea
- Prior art keywords
- character
- change
- string pattern
- feature
- pattern
- Prior art date
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/10—Image acquisition
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/24—Character recognition characterised by the processing or recognition method
- G06V30/242—Division of the character sequences into groups prior to recognition; Selection of dictionaries
- G06V30/244—Division of the character sequences into groups prior to recognition; Selection of dictionaries using graphical properties, e.g. alphabet type or font
- G06V30/2455—Discrimination between machine-print, hand-print and cursive writing
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/24—Character recognition characterised by the processing or recognition method
- G06V30/242—Division of the character sequences into groups prior to recognition; Selection of dictionaries
- G06V30/244—Division of the character sequences into groups prior to recognition; Selection of dictionaries using graphical properties, e.g. alphabet type or font
- G06V30/2445—Alphabet recognition, e.g. Latin, Kanji or Katakana
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Multimedia (AREA)
- Theoretical Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Character Discrimination (AREA)
- Character Input (AREA)
Abstract
문서, 장부 등으로부터 판독하는 화상 데이터로부터 문자열 패턴을 추출하고, 수기/활자 문자 판별부에 의해 수기 문자와 활자 문자를 판별한다. 수기/활자 문자 판별부는 상기 문자열 패턴으로부터 적어도 문자열 패턴의 복잡성과 직선성을 나타내는 특징을 포함하는 N개의 특징 벡터를 구하고; 상기 특징 벡터를 사용하여 상기 문자열 패턴이 수기 문자인지 활자 문자인지를 판별한다. 문자 인식부는 상기 문자 데이터가 수기 문자인지 활자 문자인지를 판별한 상기 결과에 기초하여 문자 인식 처리를 수행한다. 상술한 문자열 패턴의 특징으로서, 선 폭의 변화(variance), 문자 위치의 변화 등도 사용할 수 있다.
문자 인식 장치, 문자 인식 방법, 문자 인식 프로그램
Description
도 1은 본 발명의 제1 실시예에 따른 문자 인식 장치의 구성을 나타내는 블록도.
도 2는 본 발명의 제2 실시예에 따른 문자 인식 장치의 구성을 나타내는 블록도.
도 3은 본 발명이 적용되는 시스템 구성의 일례를 나타내는 도.
도 4는 본 발명의 제3 실시예에 따른 문자 인식 장치의 구성을 나타내는 블록도.
도 5는 본 발명의 실시예에 따른 수기/활자 문자 판별부의 구성도.
도 6은 수기/활자 문자 판별부에 의해 수행되는 처리의 플로우 차트.
도 7은 각 문자 종류/글자체와 특징 파라미터 사이의 관계를 나타내는 도.
도 8은 수기 문자와 활자 문자를 판별하는 방법을 나타내는 도.
도 9는 명조체에서 선 폭의 변화를 나타내는 도.
도 10은 본 발명의 1실시예에 따른 복잡성 추출 처리의 플로우 차트.
도 11은 복잡성(선 밀도) 추출 처리의 개념도.
도 12는 본 발명의 1실시예에 따른 직선성 추출 처리의 플로우 차트.
도 13은 직선성 추출 처리의 개념도.
도 14는 본 발명의 1실시예에 따른 선 폭 변화 추출 처리의 플로우 차트.
도 15는 선 폭 변화 추출 처리의 개념도.
도 16은 수기 문자와 활자 문자의 최하행 좌표 위치의 변화, 및 변화 추출 처리의 편차를 나타내는 도.
도 17은 문자 위치의 변화 추출 처리의 플로우 차트.
최근, 주변 입력 기기의 문자 인식 기술의 개발에 대한 수요가 매우 증가하고 있다. 본 발명은 문자 인식 장치 및 방법, 및 문자 인식 프로그램을 저장하는 기록 매체에 관한 것이다. 특히, 본 발명은 더욱 정밀한 문자 인식을 위하여 문서에서 수기 문자와 활자 문자를 구별하는 문자 인식 장치 및 방법; 및 문자 인식 프로그램을 저장하는 기록 매체에 관한 것이다.
종래 기술에서는 수기 문자와 활자 문자가 혼재하는 문서를 인식하기 위하여, 두 가지 처리, 즉 수기 문자를 인식하기 위한 처리와 활자 문자를 인식하기 위한 처리를 먼저 실시하였다. 그리고 나서, 상기 두 처리 결과를 서로 비교하여 신뢰도가 높은 처리 결과를 얻어서 문서를 인식하였다.
상술한 종래 기술은 두 가지 처리(수기 문자와 활자 문자를 분리해서 인식함)를 실시하고 나서, 두 처리의 인식 결과를 비교하여 신뢰도가 높은 인식 결과를 얻었다. 따라서, 종래 기술은 인식 처리에 오랜 시간이 걸린다는 문제점이 있었다.
본 발명은 상술한 종래 기술의 문제점을 해결하기 위하여 개발되었으며, 수기 문자와 활자 문자를 높은 정밀도로 인식하고, 문자 인식 처리에 필요한 시간을 단축시키는 것을 목적으로 한다.
상술한 문제점을 해결하기 위하여, 본 발명은 패턴의 특징을 인식하고, 패턴의 특징이 수기 문자를 의미하면 수기 문자를 인식하는 처리를 수행하고, 패턴의 특징이 활자 문자를 의미하면 활자 문자를 인식하는 처리를 수행한다.
따라서, 문서에 수기 문자와 활자 문자가 혼재해 있더라도, 수기 문자 인식 처리와 활자 문자 인식 처리 중 하나만을 수행하면 정밀한 인식 결과를 얻을 수 있어서, 문자 인식의 정밀도를 저하시키지 않으면서 문자 인식 처리에 필요한 시간을 단축시킬 수 있다.
본 발명의 한 양태에 따르면, 패턴의 형상 또는 규칙성에 기초하여 수기 문자 또는 활자 문자를 판별할 수 있다.
활자 문자가 수기 문자보다 패턴 형상 및 배열에 있어서 더 규칙적이기 때문에, 패턴 형상이나 배열의 규칙성을 조사하면 활자 문자와 수기 문자를 구별할 수 있으므로 그 이후의 처리를 수행하는데 걸리는 시간을 단축할 수 있다.
실시예
첨부된 도면을 참조하여 본 발명의 실시예에 따른 문자 인식 장치를 이하에서 설명한다. 도 1은 본 발명의 제1 실시예에 따른 문자 인식 장치의 구성을 나타내는 블록도이다. 도 1에서, 특징 식별부(111)는 입력 화상으로부터 추출된 패턴의 특징을 식별한다. 예컨대, 특징 식별부(111)는 패턴의 규칙성에 기초하여 패턴이 수기 문자인지 활자 문자인지를 판별한다. 즉, 활자 문자가 수기 문자보다 높은 규칙성을 가지기 때문에, 특징 식별부(111)는 패턴의 규칙성이 높으면 패턴이 활자 문자인 것으로 판정하고, 패턴의 규칙성이 낮으면 패턴이 수기 문자인 것으로 판정한다.
특징 식별부(111)에 의해 식별되는 패턴의 특징은 패턴의 복잡성, 패턴의 직선성, 패턴의 선 폭의 변화, 패턴 배열 위치의 변화, 패턴 기울기의 변화, 패턴 크기의 변화 등이다. 패턴의 복잡성은 패턴의 선 밀도, 흑색 화소의 밀도, 오일러(Euler) 수, 외형 길이 등에 기초하여 식별할 수 있다. 패턴의 특징은 판별 분석 등을 통하여 복수의 특징을 결합함으로써 식별할 수 있다.
수기 문자 인식부(113)는 수기 문자를 인식한다. 활자 문자 인식부(114)는 활자 문자를 인식한다. 활자 문자는 인쇄 문자, 타자 문자, 워드 프로세서에 의한 입력 문자 등을 말한다.
문자 인식 선택부(112)는 특징 식별부(111)에 의한 판별 결과에 기초하여 수기 문자 인식부(113) 또는 활자 문자 인식부(114)를 선택한다. 즉, 특징 식별부(111)가 인식 대상의 패턴이 수기 문자라고 판정하면, 문자 인식 선택부(112)는 수기 문자 인식부(113)를 선택하여, 수기 문자 인식부(113)로 하여금 인식 대상의 패턴의 문자를 인식하도록 지시한다. 특징 식별부(111)가 인식 대상의 패턴이 활자 문자라고 판정하면, 문자 인식 선택부(112)는 활자 문자 인식부(114)를 선택하여 활자 문자 인식부(114)로 하여금 인식 대상 패턴의 문자를 인식하도록 한다.
이렇게 하여, 수기 문자 인식부(113) 또는 활자 문자 인식부(114)를 사용하여 문자 인식 처리를 수행할 수 있으며, 이에 따라 문자 인식 처리에 걸리는 시간을 단축할 수 있고, 또한 수기 문자 인식부(113)와 활자 문자 인식부(114) 중의 하나만을 문자 인식 처리에 사용하더라도 인식의 정밀도가 저하되는 것을 방지할 수 있다.
도 2는 본 발명의 제2 실시예에 따른 문자 인식 장치의 구성을 나타내는 블록도이다. 도 2에 나타낸 바와 같이, 제2 실시예는 상술한 문제점을 해결한다.
문자열 패턴 추출부(1)는 문서나 장부의 화상으로부터 문자열 패턴을 추출한다. 이어서, 복잡성 추출부(2a) 및 직선성 추출부(2b)는 적어도 문자열 패턴의 복잡성과 직선성을 나타내는 특징을 포함하는 N차의 특징 벡터를 구한다. 다음에, 수기/활자 문자 판별부(2f)는 상술한 특징 벡터를 사용하여 문자열 패턴이 수기 문자인지 활자 문자인지를 판별한다. 판별 결과에 기초하여 문자 인식부(3)는 수기 문자 인식 처리 또는 활자 문자 인식 처리를 수행한다. 문자열 패턴의 복잡성을 나타내는 특징으로는 선 밀도를 사용할 수 있다. 선 폭 변화 추출부(2c)는 문자열 패턴 추출부(1)에 의해 추출된 문자열 패턴으로부터 문자열 패턴에 포함된 문자 스트로크(stroke)의 끝점, 교점 및 변곡점으로부터 일정 거리 내의 패턴을 제거하여 구한 선 폭의 변화를 나타내는 특징량을 추출한다. 그리고, 상기 특징량에 따라 문자열 패턴이 수기 문자인지 활자 문자인지를 판별한다. 상기 판별 결과에 기초하여 수기 문자 인식 처리 또는 활자 문자 인식 처리를 수행한다.
활자 문자도 각 스트로크 방향마다 선 폭이 다른 명조체와 같은 폰트로 표시할 수 있기 때문에, 선 폭 변화 추출부(2c)는 각 스트로크 또는 각 스트로크 방향마다 선 폭의 변화를 구할 수 있다.
문자 위치 변화 추출부(2d)는 문자 위치의 변화를 구한다. 문자열 패턴이 큰 변화의 문자 위치를 나타내면, 수기/활자 문자 판별부(2f)는 상기 패턴을 수기 문자로 판정하여 수기 문자 인식부(3a)로 하여금 상기 패턴의 문자를 인식하도록 지시한다. 한편, 문자열 패턴이 작은 변화의 문자 위치를 나타내면, 수기/활자 문자 판별부(2f)는 상기 패턴을 활자 문자로 판정하여, 활자 문자 인식부(3b)로 하여금 상기 패턴의 문자를 인식하도록 지시한다.
문자 위치의 변화 이외에, 문자의 기울기, 크기 등의 변화를 조사하여 문자열 패턴이 수기 문자인지 활자 문자인지를 판별할 수도 있다.
본 실시예에서는, 문자를 수기 문자와 활자 문자로 판별하여 인식하기 위하여, 적어도 문자열 패턴의 복잡성을 나타내는 특징과 문자열 패턴의 직선성을 나타내는 특징을 포함하는 N차의 특징 벡터를 구한다. 따라서, 수기 문자와 활자 문자를 높은 정밀도로 판별할 수 있으며, 단시간 내에 문자 인식 처리를 수행할 수 있다. 또한, 선 밀도를 문자열 패턴의 복잡성을 나타내는 특징으로 사용함으로써, 상기 특징량을 용이하고 고속으로 구할 수 있다.
문자열 패턴에 포함된 문자 스트로크의 끝점, 교점 및 변곡점으로부터 일정 거리 내의 패턴을 제거하여 구한 선 폭의 변화를 나타내는 특징량을 사용하여 수기 문자와 활자 문자를 판별함으로써, 명조체에 대한 장식 등의 영향이 없는 선 폭의 변화를 구할 수 있어서 수기 문자와 활자 문자를 정확히 판별할 수 있다.
또한, 각 스트로크 또는 각 스트로크 방향마다 선 폭의 변화를 구함으로써, 명조체의 스트로크 방향에 따른 선 폭 차이의 영향 없이 선 폭의 변화를 구할 수 있어서 수기 문자와 활자 문자를 정확히 판별할 수 있다.
도 3은 본 발명이 적용되는 시스템 구성의 일례를 나타내는 도면이다.
도 3에서, 11은 버스(10)가 접속되는 CPU이다. 버스(10)에는 RAM(12), ROM(13), 통신 인터페이스(14), 외부 기억 장치(15), 기록 매체 판독 장치(16), 화상 판독용 스캐너(17), 디스플레이, 키보드 등의 입출력 장치(18)가 접속되어 있다. ROM(13)은 OS 등을 저장하며, RAM(12)은 본 실시예에 따라 처리하는 프로그램, 데이터 등을 저장한다.
스캐너(17)는 인식 대상의 문자 등이 저장된 화상을 판독한다. 입출력 장치(18)는 키보드, 마우스 등의 입력 장치와 디스플레이 모니터, 프린터 등의 출력 장치를 구비하며, 데이터 처리를 위한 데이터를 입력하고, 처리된 데이터를 출력한다.
문자 인식 처리를 위한 프로그램, 데이터 등은 하드 디스크 등의 외부 기억 장치(15) 또는 CD-ROM, 플로피 디스크 등의 기록 매체에 저장되며, 데이터 처리시에 외부 기억 장치(15)로부터 판독하거나 또는 스캐너에 의해 기록 매체로부터 판독하여 RAM(12)에 저장하고, CPU(11)에 의해 실행된다. 버스(10)에는 통신 인터페 이스(14)가 접속되며, 통신 회선을 통하여 데이터나 프로그램을 주고받을 수 있다.
도 4는 본 발명의 제3 실시예에 따른 문자 인식 장치에 의해 수행되는 기능을 나타내는 블록도이다. 도 4에 나타낸 바와 같이, 본 실시예에 따른 문자 인식 장치는 화상 데이터를 전처리하는 전처리부(21); 문자 추출부(22); 수기/활자 문자 판별부(23); 및 문자 인식 처리를 수행하는 문자 인식부(24)로 되어 있다. 전처리부(21), 문자 추출부(22) 및 문자 인식부(24)는 종래의 공지된 기술에 의해 실현할 수 있다.
도 4에서 노이즈 제거 처리, 기울기 보정 처리 등의 전처리는 스캐너(17) 등의 화상 입력 장치에 의해 문서 또는 장부로부터 판독한 화상 데이터에 대하여 수행되며, 전처리된 데이터는 문자 추출부(22)에 전송된다. 문자 추출부(22)는 전처리된 화상 데이터로부터 문자 데이터를 꺼낸다. 수기/활자 문자 판별부(23)는 꺼낸 문자 데이터가 수기 문자인지 활자 문자인지를 판별하여, 상기 데이터를 수기 문자와 활자 문자로 구분한다.
문자 인식부(24)는 문자 데이터가 수기 문자인지 활자 문자인지에 따라서 대응하는 문자 인식 처리를 수행한다. 즉, 문자 인식부(24)는 수기 문자를 인식하기 위한 수기 문자 인식부 및 활자 문자를 인식하기 위한 활자 문자 인식부로 되어 있다. 수기/활자 문자 판별부(23)가 문자 화상 데이터를 수기 문자라고 인식하면, 상술한 수기 문자 인식부가 문자를 인식한다. 수기/활자 문자 판별부(23)가 문자 화상 데이터를 활자 문자라고 인식하면, 상술한 활자 문자 인식부가 문자를 인식한다. 이렇게 하여, 문자열 패턴이 수기 문자인지 활자 문자인지 미리 판별하고, 상기 판별 결과에 기초하여 문자 인식부(24)에 의해 인식 처리를 수행함으로써 문자 인식에 필요한 시간을 단축시킬 수 있다.
상술한 문자 추출 처리 및 수기/활자 문자 판별 처리에서는, 문자 데이터를 각 문자마다 꺼내고, 이렇게 꺼낸 문자마다 수기/활자 문자 판별 처리를 수행하여도 좋다. 그렇지 않으면, 복수의 문자를 꺼내서 수기/활자 문자 판별 처리를 일괄해서 집단적으로 처리하여도 좋다.
도 5는 수기/활자 문자 판별부(23)의 구성을 나타낸다. 도 6은 수기/활자 문자 판별부(23)에 의해 수행되는 처리의 개요를 나타내는 플로우 차트이다.
도 5에 나타낸 바와 같이, 수기/활자 문자 판별부(23)는 꺼낸 문자 데이터를 정규화하는 정규화 처리부(31); 꺼낸 문자 데이터로부터 특징 파라미터를 추출하는 특징 파라미터 추출부(32); 및 수기 문자인지 활자 문자인지를 식별하는 판별 처리부(33)로 되어 있다.
특징 파라미터 추출부(32)는 복잡성 추출부(32), 직선성 추출부(35), 선 폭 변화 추출부(36) 및 문자 위치 변화 추출부(37)로 되어 있다.
수기/활자 문자 판별부(23)는 하기와 같이 수기/활자 문자 판별 처리를 수행한다.
우선, 정규화 처리부(31)는 화상의 크기를 정규화한다(스텝 S1).
이어서, 특징 파라미터 추출부(32)는 정규화된 문자 데이터로부터 예컨대 문자의 복잡성, 문자 데이터의 직선성, 문자의 선 폭의 변화, 문자 위치의 변화 등을 나타내는 특징 파라미터를 추출하여 특징 벡터를 구한다(스텝 S2).
다음에, 판별 처리부(33)는 판별 함수에 특징 벡터를 대입하여 수기 문자인지 활자 문자인지를 판별하고, 그 식별 결과를 저장한다(스텝 S3).
판별 처리부(33)는 미리 특징 파라미터를 요소로 포함하는 특징 벡터 공간에서 판별 및 분석 처리를 수행함으로써 수기 문자와 활자 문자를 판별하는 경계를 구하고, 문자 데이터로부터 추출된 특징 파라미터에 따라 특징 벡터가 경계의 어느 쪽에 위치하는지를 결정하여 문자를 판별함으로써 수기 문자와 활자 문자의 판별 처리를 수행한다.
도 7은 각 문자 종류/글자체와 특징 파라미터 간의 관계를 나타낸다. 도 7에서 "대", "중" 및 "소"라는 용어는 특징 파라미터를 수치화할 경우의 문자 종류/글자체의 상대적인 값이다.
(1) "복잡성"을 나타내는 특징 파라미터는 수기 문자와 활자 문자에 무관하게 한자가 크고, 다른 문자(영자, 숫자, 히라카나, 가다카나)는 작다.
(2) "직선성"을 나타내는 특징 파라미터는 수기 문자가 작고, 활자 문자는 중간 크기이거나 크다.
(3) "선 폭의 변화"를 나타내는 특징 파라미터는 일반적으로 수기 문자가 크고, 활자 문자는 작다. 활자 문자에서도, 명조체의 선 폭의 변화는 문자가 끝점 또는 변곡점을 포함할 경우에 크다. 그러나, 후술하는 바와 같이, 끝점 또는 변곡점을 제외한 문자의 선 폭의 변화는 도 7에 나타낸 바와 같이 작다. 또한, 명조체 문자의 선 폭이 방향마다 다르기 때문에, 각 방향별로 선 폭의 변화를 구하면 선 폭의 변화가 작아진다.
(4) "문자 위치의 변화"를 나타내는 특징 파라미터는 일반적으로 수기 문자가 크고, 활자 문자는 작다.
상술한 바와 같이, 일반적으로 수기 문자는 직선 성분이 적고, 활자 문자는 직선 성분이 많다. 특히, 한자에는 직선 성분이 많고, 영자, 숫자, 히라카나 및 가다카나와 같은 다른 문자에는 직선 성분이 적다.
따라서, 한자와 다른 종류의 문자를 분리하는 특징량인 문자의 복잡성 및 활자 문자의 특징인 직선성에 기초하여 수기 문자와 활자 문자를 정밀하게 판별할 수 있다.
복잡성을 나타내는 파라미터는 스트로크 등이 있지만, 후술하는 바와 같이 고속 처리를 위하여 문자열 패턴의 선 밀도를 사용하는 것이 바람직하다.
도 8은 상술한 판별 방법을 나타낸다. 도 8은 특징 파라미터로서 "복잡성 X1"과 "직선성 X2"를 선택하고, "복잡성 X1"과 "직선성 X2"를 횡축과 종축으로 설정한 2차원 평면 상의 수기 문자와 활자 문자를 판별하는 판별 함수의 일례를 나타내고 있다.
여러 가지 수기 문자와 활자 문자에 대하여 복잡성과 직선성을 구한다. 그 결과를 상술한 2차원 평면 위에 플롯하면, 도 8에 나타낸 바와 같이 활자 문자의 숫자, 영자, 히라카나, 가다카나 및 한자는 일반적으로 2차원 평면 상의 좌측상부(41,42,43)에 분포한다. 반면, 수기 문자의 숫자, 영자, 히라카나, 가다카나 및 한자는 일반적으로 우측하부(44,45,46)에 분포한다.
따라서, 이 경우에는 판별 함수 Z를 도 8에 나타낸 바와 같이 정의함으로써 상술한 2개의 특징 파라미터에 따라 수기 문자와 활자 문자를 판별할 수 있다.
활자 문자의 그룹을 G1로 표시하고, 수기 문자의 그룹을 G2로 표시하면, 각 변화량의 분산 및 변화량 간의 상관을 고려한 중력 벡터의 중심으로부터 각 그룹의 거리(마할라노비스 거리, Mahalanobis distance)는 하기 식(1) 및 (2)로 구한다:
G1의 마할라노비스 거리:
G2의 마할라노비스 거리:
Σk: 그룹 k의 분산-공분산 행렬
미지의 벡터에 대해서는, 각 그룹에 대한 마할라노비스 거리를 구하여 보다 가까운 그룹으로 판별할 수 있다.
따라서, 판별 함수는 상기 식(3)을 풀어서 얻으며, Z가 양인지 음인지에 따라 그룹을 판별할 수 있다. 예컨대, 미지의 패턴의 특징 벡터가 2차원 평면 상의 점 P에 위치할 경우에는, 점 P를 판별 함수 Z 상에 투영하여 얻은 점 P'가 양인지 음인지를 조사한다. 점 P'가 양이면, 미지의 패턴을 활자 문자로 판별한다. 점 P'가 음이면, 미지의 패턴을 수기 문자로 판별한다.
도 8에서는, 복잡성과 직선성의 2개의 특징량을 사용한 2차원 평면으로 설명하였으나, 일반적으로 N차원 특징 벡터 공간 상에서 도 8을 참조하여 설명한 판별 및 분석 방법에 의해 수기 문자 또는 활자 문자를 판별하면, 보다 높은 정밀도로 문자열 패턴을 판별할 수 있다.
즉, 상술한 바와 같이, 복잡성, 직선성, 선 폭의 변화, 문자 위치의 변화 등의 특징량은 수기 문자, 활자 문자, 문자 종류 또는 문자체에 따라 다르다. 따라서 복수의 특징 파라미터를 적절히 조합하면, 수기 문자와 활자 문자를 높은 정밀도로 판별할 수 있다.
후술하는 바와 같이, 각 스트로크마다 또는 스트로크의 각 방향마다 복잡성, 직선성, 선 폭의 변화 등의 특징량을 구하고, 이 특징량을 사용하여 수기 문자인지 활자 문자인지를 판별하면, 보다 높은 정밀도로 문자를 식별할 수 있다. 또 다른 특징량으로서 문자 기울기의 특징량을 병용할 수 있다.
도 7에서, 선 폭의 변화를 나타내는 특징량은 수기 문자가 크고 활자 문자는 작다. 이와 같이, 수기 문자와 활자 문자 사이의 아주 다른 특징량을 갖는 단독 또는 복수의 특징 파라미터를 사용하여 수기 문자인지 활자 문자인지를 판별할 수 있다.
명조체에서는 도 9a에 나타낸 바와 같이 문자의 끝점(51)과 변곡점(52)에 장식이 첨가되어 있다. 따라서, 선 폭의 변화를 계산할 때 명조체의 끝점(51)과 변곡점(52)을 포함하면, 선 폭의 변화가 커져서, 활자 문자를 수기 문자로 오판하게 된다.
후술하는 바와 같이, 스트로크의 끝점(51), 교점(53) 및 변곡점(52)을 구하고, 이들 점으로부터 일정 길이를 감하여 스트로크의 선 폭의 변화를 구한다. 명조체에서는 스트로크(61,62)의 방향에 따라 도 9b에 나타낸 바와 같이 선 폭이 다르다. 따라서, 스트로크의 선 폭의 변화는 스트로크(61,62)별 또는 스트로크(61,62)의 방향에 따라 구한다.
이와 같이, 선 폭의 변화를 나타내는 특징량을 구한다. 구한 특징량에 기초하여 수기 문자와 활자 문자를 식별하여, 높은 정밀도로 판별 처리를 수행한다.
이하, 상술한 여러 가지 특징 파라미터의 추출 처리에 대하여 설명한다.
(1) 복잡성(선 밀도)의 추출
문자의 복잡성은 상술한 바와 같이 한자와 다른 문자의 판별에 사용되는 특징량을 나타내는 유용한 파라미터이다. 문자의 복잡성은 스트로크 등의 수로부터 구할 수 있지만, 보다 용이하고 고속 처리를 위하여 선 밀도에 기초하여 문자의 복잡성을 구하는 것이 바람직하다. 이하, 선 밀도에 기초하여 복잡성의 추출 처리에 대하여 설명한다.
도 10은 본 발명의 실시예에 따른 복잡성 추출 처리의 플로우 차트이다. 도 11은 복잡성(선 밀도) 추출 처리의 개념을 나타낸다.
문자 화상 데이터로부터 복잡성을 추출하기 위하여, 도 10 및 11에 나타낸 바와 같이 문자 데이터의 선 밀도를 0°, 45° 및 90°방향으로 투영한다(스텝 S11). 이어서, 0°, 45° 및 90°방향으로 투영된 선 밀도의 평균을 구하여 저장한다(스텝 S12).
예컨대, 45°방향의 선 밀도를 구하기 위해서는, 문자 화상 데이터의 화소를 사선 방향으로 주사하여 백색 화소가 흑색 화소로 변하는 화소 수를 구한다. 도 11의 경우에는, 백색 화소가 흑색 화소로 변하는 화소 수는 문자 "十"(71)의 중심 부분을 제외하고 2이다. 문자의 중심 부분은 1이기 때문에, 처리는 도 11에 나타낸 바와 같이 수행한다.
상술한 바와 같이, 각 방향별로 선 밀도를 구하고, 얻어진 선 밀도의 평균을 구함으로써, 문자 화상 데이터의 복잡성에 해당하는 특징 파라미터를 추출한다.
(2) 직선성의 추출
활자 문자는 직선 성분이 많으며, 이 직선성은 수기 문자와 활자 문자의 판별에 유용한 파라미터이다.
도 12는 본 발명의 실시예에 따른 직선성 추출 처리의 플로우 차트이다. 도 13은 직선성 추출 처리의 개념을 나타낸다.
문자 화상 데이터로부터 직선성을 추출하기 위해서는, 우선 문자 화상 데이터의 가장자리를 추출한다(스텝 S21). 예컨대, 도 13에 나타낸 문자 화상 "十"(81)의 경우에는, 흑색 테두리의 백색 문자로 표시된 가장자리 화상(82)을 추출한다.
이어서, 수평 방향의 연속선(horizontal run)의 길이를 측정하고, 일정 길이 이상의 연속선의 개수를 저장한다(스텝 S22). 도 13에 나타낸 예에서, 수평 방향으로 일정 길이 이상의 연속선(83)을 추출하고, 이 연속선의 개수를 저장한다.
마찬가지로, 수직 방향의 연속선의 길이를 측정하고, 일정 길이 이상의 연속 선의 개수를 저장한다(스텝 S23). 도 13에 나타낸 예에서는, 수직 방향으로 일정 길이 이상의 연속선(84)을 추출하고, 그 개수를 저장한다.
상술한 바와 같이, 수평 및 수직 방향으로 소정 길이 이상의 연속선을 추출하고 그 개수를 구함으로써, 각 방향마다의 직선성에 해당하는 특징 파라미터를 추출한다.
(3) 선 폭의 변화의 추출
스트로크의 선 폭의 변화는 수기 문자와 활자 문자의 판별에 유용한 파라미터이다. 상술한 바와 같이, 일반적으로 수기 문자는 선 폭의 변화가 크고, 활자 문자는 선 폭의 변화가 작다. 그러나, 명조체에서는 스트로크의 끝점과 변곡점에 장식이 첨가되어 있다. 선 폭의 변화를 계산할 때 상기 장식을 포함시키면, 선 폭의 변화가 커져서, 상기 활자 문자를 수기 문자로 오판하게 된다. 또한, 명조체에서는 선 폭이 상술한 바와 같이 스트로크의 방향에 따라 다르다.
본 실시예에 따르면, 스트로크의 끝점, 교점 및 변곡점을 구하고, 이들 점으로부터 일정 길이 내의 부분을 제외하여 스트로크의 선 폭의 변화를 구하며, 각 스트로크별 또는 각 스트로크 방향별로 선 폭의 변화를 구한다.
도 14는 본 발명의 실시예에 따른 선 폭 변화 추출 처리의 플로우 차트이다. 도 15는 선 폭 변화 추출 처리의 개념을 나타낸다.
문자 화상 데이터로부터 선 폭의 변화를 추출하기 위해서는, 우선 문자 화상의 선을 가늘게 하여 세선화 화상을 얻는다(스텝 S31). 예컨대, 도 15에 나타낸 예에서, 원래 화상(91)의 선을 가늘게 하여 세선화 화상(92)을 얻을 수 있다.
이어서, 세선화 화상(92)으로부터 끝점(93~96), 교점(97) 및 변곡점을 구한다. 세선화 화상(92)으로부터 끝점(93~96), 교점(97) 및 변곡점 부근의 화소를 제거하여 세선화 화상(98)을 얻는다(스텝 S32 및 S33).
이어서, 스텝 S33에서 얻은 세선화 화상에 남아있는 각 점마다 벡터를 구하고, 벡터에 수직인 방향의 선 폭을 구한다(스텝 S34). 도 15에 나타낸 예에서는, 세선화 화상(98)에 남아있는 각 점마다 수평 방향의 선 폭(H)과 수직 방향의 선 폭(V)을 구한다.
벡터의 각 방향마다 선 폭(H,V)의 변화(표준 편차)를 구하고, 평균값을 저장한다(스텝 S35).
상술한 바와 같이, 얻어진 특징 파라미터에 의해 수기 문자와 활자 문자를 판별함으로써, 수기 문자와 활자 문자를 높은 정밀도로 식별한다. 또한, 명조체에서는 상술한 바와 같이 스트로크로부터 스트로크의 끝점, 교점 및 변곡점을 제거하여 선 폭의 변화를 구하고, 각 벡터 방향별로 선 폭의 변화를 구함으로써, 보다 높은 정밀도로 수기 문자와 활자 문자를 판별할 수 있다.
(4) 문자 위치의 변화 추출
각 문자마다 최하행 좌표 위치의 변화는 도 16a에 나타낸 바와 같이 활자 문자의 경우에는 작고, 도 16b에 나타낸 바와 같이 수기 문자의 경우에는 크다. 따라서, 상기 변화는 수기 문자와 활자 문자의 식별에 유용한 파라미터이다. 특히, 이 방법은 예컨대, 숫자가 기입되는 장부의 금액란에 대하여 유효하다.
도 17은 본 발명의 실시예에 따른 문자 위치의 변화 추출 처리의 플로우 차트이다.
문자 화상 데이터로부터 선 폭의 변화를 추출하기 위해서는, 영역 내의 연결 흑색 화소에 대한 외접 직사각형을 구한다(스텝 S41). 예컨대, 도 16b에 나타낸 연결 화소에 대해서는 도 16c에 나타낸 바와 같이 외접 직사각형(101~106)이 얻어진다.
이어서, 외접 직사각형(101~106)의 최하행 좌표(Y1~Y6)의 변화(표준 편차)를 구하여 저장한다(스텝 S42).
상술한 처리를 수행함으로써, 문자 위치의 변화에 관한 특징 파라미터를 구할 수 있다. 상기 특징 파라미터를 사용함으로써, 예컨대 금액란 등의 숫자가 기입되는 영역에서 수기 문자와 활자 문자를 높은 정밀도로 판별할 수 있다.
상술한 실시예에 따르면, 하기 효과를 얻을 수 있다.
(1) 적어도 문자열 패턴의 복잡성과 직선성을 나타내는 특징량을 포함하는 특징 벡터를 사용하여 수기 문자와 활자 문자를 식별하기 때문에, 높은 정밀도로 단시간 내에 식별 처리를 수행할 수 있다.
(2) 복잡성을 나타내는 특징으로서 선 밀도를 사용함으로써, 복잡성을 나타내는 특징을 고속으로 용이하게 구할 수 있다.
(3) 문자열 패턴에 포함된 문자 스트로크의 끝점, 교점 및 변곡점으로부터 일정 거리 내의 패턴을 제거하여 구한 선 폭의 변화를 특징량으로 사용하여 수기 문자와 활자 문자를 식별함으로써 명조체 등의 폰트의 장식에 영향을 받지 않으면서 보다 정밀하게 수기 문자와 활자 문자를 판별할 수 있다.
(4) 각 스트로크별 또는 각 스트로크 방향별로 선 폭의 변화를 구함으로써, 명조체에서 볼 수 있는 스트로크의 방향에 따른 선 폭의 차이에 영향을 받지 않으면서 선 폭의 변화를 추출할 수 있어서 보다 정밀하게 수기 문자와 활자 문자를 식별할 수 있다.
Claims (16)
- 문서 또는 장부의 화상으로부터 문자열 패턴을 추출하는 단계;상기 문자열 패턴의 복잡성을 나타내는 특징(feature)을 추출하는 단계;상기 문자열 패턴의 직선성을 나타내는 특징을 추출하는 단계;상기 문자열 패턴의 문자 위치의 변화를 나타내는 특징을 추출하는 단계;적어도 상기 문자열 패턴의 복잡성, 직선성 및 문자 위치의 변화를 나타내는 특징을 포함하는 N개의 특징 벡터를 구하는 단계; 및상기 특징 벡터를 사용하여 상기 문자열 패턴이 수기 문자(hand-written character)인지 활자 문자(typed character)인지를 판별하고, 그 판별 결과에 기초하여 문자 인식 처리를 수행하는 단계를 포함하고,상기 복잡성을 나타내는 특징으로서 선 밀도를 사용하고,상기 선밀도로부터 산출되는 복잡성은 문자 데이터를 3방향에서 투영하였을 때 백색 화소가 흑색 화소로 변하는 빈도의 평균값에 의거하는 것이고,상기 문자 위치의 변화는 상기 문자열 패턴의 최하행 좌표의 변화에 의거하는 것임을 특징으로 하는 문자 인식 방법.
- 삭제
- 문서 또는 장부의 화상으로부터 문자열 패턴을 추출하는 단계;상기 문자열 패턴에 포함된 문자 스트로크(stroke)의 끝점, 교점 및 변곡점(corner point)으로부터 일정 거리 내의 패턴을 문자열 패턴으로부터 제거하여 구한 선 폭의 변화를 나타내는 특징량, 및 상기 문자열 패턴의 문자 위치 변화를 나타내는 특징량을 추출하는 단계;적어도 상기 특징량에 기초하여 수기 문자와 활자 문자를 판별하는 단계; 및상기 판별 결과에 기초하여 문자를 인식하는 단계를 포함하고,상기 선 폭의 변화를 각 스트로크별 또는 스트로크 방향별로 구하는 문자 인식 방법.
- 삭제
- 문서 또는 장부의 화상으로부터 문자열 패턴을 추출하는 문자열 패턴 추출 수단;상기 문자열 패턴이 수기 문자인지 활자 문자인지를 판별하는 수기/활자 문자 판별 수단; 및상기 판별 결과에 기초하여 문자를 인식하는 문자 인식 수단을 포함하며,상기 수기/활자 문자 판별 수단은,상기 문자열 패턴으로부터 문자열 패턴의 복잡성을 나타내는 특징을 추출하는 복잡성 추출 수단;상기 문자열 패턴의 직선성을 나타내는 특징을 추출하는 직선성 추출 수단;상기 문자열 패턴의 문자 위치 변화를 나타내는 특징을 추출하는 문자 위치 변화 수단; 및적어도 상기 문자열 패턴의 복잡성을 나타내는 특징, 직선성을 나타내는 특징 및 문자 위치의 변화를 나타내는 특징을 포함하는 N개의 특징 벡터에 기초하여 상기 문자열 패턴이 수기 문자인지 활자 문자인지를 판별하는 판별 수단을 포함하고,상기 복잡성 추출 수단은 상기 문자열 패턴의 선 밀도를 사용하고,상기 선밀도로부터 산출되는 복잡성은 문자 데이터를 3방향에서 투영하였을 때 백색 화소가 흑색 화소로 변하는 빈도의 평균값을 구함으로써 상기 복잡성을 나타내는 특징을 추출하는 것이고,상기 문자 위치 변화 수단은 상기 문자열 패턴의 최하행 좌표의 변화로부터 문자 위치의 변화를 나타내는 특징을 추출하는 것임을 특징으로 하는 문자 인식 장치.
- 삭제
- 문서 또는 장부의 화상으로부터 문자열 패턴을 추출하는 문자열 패턴 추출 수단;상기 문자열 패턴이 수기 문자인지 활자 문자인지를 판별하는 수기/활자 문자 판별 수단; 및상기 판별 결과에 기초하여 문자를 인식하는 문자 인식 수단을 포함하며,상기 수기/활자 문자 판별 수단은,상기 문자열 패턴에 포함된 문자 스트로크의 끝점, 교점 및 변곡점으로부터 일정 거리 내의 패턴을 문자열 패턴으로부터 제거하여 구한 선 폭의 변화를 나타내는 특징량을 추출하는 선 폭 변화 추출 수단;상기 문자열 패턴의 문자 위치 변화를 나타내는 특징을 추출하는 문자 위치 변화 수단; 및적어도 상기 선 폭의 변화를 나타내는 특징량 및 상기 문자열 패턴의 문자 위치의 변화에 기초하여 상기 문자열 패턴이 수기 문자인지 활자 문자인지를 판별하는 판별 수단을 포함하고,상기 선 폭 변화 추출 수단은 각 스트로크별 또는 각 스트로크 방향별로 선 폭의 변화를 구하는 문자 인식 장치.
- 삭제
- 입력 화상으로부터 추출된 문자열 패턴의 특징을 식별하는 특징 식별 수단;수기 문자를 문자 인식하는 수기 문자 인식 수단;활자 문자를 문자 인식하는 활자 문자 인식 수단; 및상기 특징 식별 수단으로부터의 식별 결과에 기초하여 상기 수기 문자 인식 수단과 상기 활자 문자 인식 수단 중 하나를 선택하는 문자 인식 선택 수단을 포함하고,상기 특징 식별 수단은 패턴의 규칙성에 기초하여 상기 패턴이 수기 문자인지 활자 문자인지를 판별하고,패턴의 특징은 패턴의 복잡성, 직선성, 선 폭의 변화, 배열 위치의 변화, 기울기의 변화, 크기의 변화, 문자 위치의 변화 중 적어도 하나를 포함하고,상기 복잡성은 선 밀도, 흑색 화소의 밀도, 오일러(Euler) 수 및 외형 길이 중 적어도 하나를 포함하고,상기 선밀도로부터 산출되는 복잡성은 무자 데이터를 3방향에서 투영하였을 때 백색 화소가 흑색 화소로 변하는 빈도의 평균값에 의거하여 산출되는 것이고,상기 직선성은 패턴에서 일정 길이 이상의 선의 개수를 기초로 계산하는 것이고,상기 문자 위치의 변화는 상기 문자열 패턴의 최하행 좌표의 변화를 포함하는 것임을 특징으로 하는 문자 인식 장치.
- 삭제
- 삭제
- 삭제
- 삭제
- 문서 또는 장부의 화상으로부터 추출된 문자열 패턴을 인식하는 문자 인식 프로그램을 저장하는 컴퓨터 판독용 기록 매체에 있어서,상기 문자 인식 프로그램은상기 문자열 패턴의 복잡성을 나타내는 특징을 추출하는 기능;상기 문자열 패턴의 직선성을 나타내는 특징을 추출하는 기능;상기 문자열 패턴의 문자 위치 변화를 나타내는 특징을 추출하는 기능;적어도 상기 문자열 패턴의 복잡성, 직선성 및 문자 위치 변화를 나타내는 특징을 포함하는 N개의 특징 벡터를 구하는 기능; 및상기 특징 벡터를 사용하여 상기 문자열 패턴이 수기 문자인지 활자 문자인지를 판별하는 기능을 컴퓨터가 수행하도록 명령하며,상기 복잡성을 나타내는 특징으로서 선 밀도를 사용하고,상기 선밀도로부터 산출되는 복잡성은 문자 데이터를 3방향에서 투영하였을 때 백색 화소가 흑색 화소로 변하는 빈도의 평균값에 의거하여 산출되는 것이고,상기 문자 위치 변화를 나타내는 특징으로서 상기 문자열 패턴의 최하행 좌표의 변화를 사용하는 것임을 특징으로 하는 컴퓨터 판독용 기록 매체.
- 문서 또는 장부의 화상으로부터 추출된 문자열 패턴을 인식하는 문자 인식 프로그램을 저장하는 컴퓨터 판독용 기록 매체에 있어서,상기 문자 인식 프로그램은상기 문자열 패턴에 포함된 문자 스트로크의 끝점, 교점 및 변곡점으로부터 일정 거리 내의 패턴을 문자열 패턴으로부터 제거하여 구한 선 폭의 변화를 나타내는 특징량, 및 상기 문자열 패턴의 문자 위치 변화를 나타내는 특징량을 추출하는 기능; 및적어도 상기 특징량에 기초하여 수기 문자와 활자 문자를 판별하는 기능을 컴퓨터가 수행하도록 명령하며,상기 선 폭 변화는 각 스트로크별 또는 각 스트로크 방향별로 구해지는 컴퓨터 판독용 기록 매체.
- 화상으로부터 문자열 패턴을 추출하는 단계;상기 화상으로부터 추출된 문자열 패턴의 특징을 식별하는 단계; 및적어도 상기 식별된 특징에 기초하여 문자가 수기 문자인지 활자 문자인지를 판별하는 단계를 포함하고,상기 식별 단계는,상기 문자열 패턴에 포함된 문자 스트로크의 끝점, 교점 및 변곡점으로부터 일정 거리 내의 패턴을 문자열 패턴으로부터 제거하여 구한 선 폭의 변화를 나타내는 특징량을 추출하는 단계;상기 문자열 패턴의 복잡성을 나타내는 특징을 추출하는 단계;상기 문자열 패턴의 직선성을 나타내는 특징을 추출하는 단계;상기 문자열 패턴의 문자 위치 변화를 나타내는 특징을 추출하는 단계; 및상기 문자열 패턴의 복잡성, 직선성 및 문자 위치 변화를 나타내는 특징을 포함하는 특징 벡터를 구하는 단계를 포함하고,상기 판별 단계는 상기 특징 벡터를 사용하여 수행되는 문자 인식 방법.
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP98-357701 | 1998-12-16 | ||
JP10357701A JP2000181993A (ja) | 1998-12-16 | 1998-12-16 | 文字認識方法および装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
KR20000047428A KR20000047428A (ko) | 2000-07-25 |
KR100658119B1 true KR100658119B1 (ko) | 2006-12-15 |
Family
ID=18455477
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1019990026823A KR100658119B1 (ko) | 1998-12-16 | 1999-07-05 | 문자 인식 장치 및 방법 |
Country Status (4)
Country | Link |
---|---|
US (1) | US6643401B1 (ko) |
JP (1) | JP2000181993A (ko) |
KR (1) | KR100658119B1 (ko) |
CN (1) | CN1163846C (ko) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR100926823B1 (ko) | 2007-12-05 | 2009-11-12 | 황병익 | 문자 인식 방법 |
KR102075299B1 (ko) * | 2019-07-03 | 2020-02-07 | 서정현 | 선 인식 장치 및 방법 |
Families Citing this family (142)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8645137B2 (en) | 2000-03-16 | 2014-02-04 | Apple Inc. | Fast, language-independent method for user authentication by voice |
US7024042B2 (en) * | 2000-10-04 | 2006-04-04 | Fujitsu Limited | Word recognition device, word recognition method, and storage medium |
US6909805B2 (en) * | 2001-01-31 | 2005-06-21 | Matsushita Electric Industrial Co., Ltd. | Detecting and utilizing add-on information from a scanned document image |
US6940617B2 (en) * | 2001-02-09 | 2005-09-06 | Matsushita Electric Industrial Co., Ltd. | Printing control interface system and method with handwriting discrimination capability |
US20020141643A1 (en) * | 2001-02-15 | 2002-10-03 | Denny Jaeger | Method for creating and operating control systems |
KR100518744B1 (ko) * | 2002-11-21 | 2005-10-05 | 한국전자통신연구원 | 비수직 분할선을 가지는 붙은 필기체 숫자열의 분할방법 |
JP2006092346A (ja) * | 2004-09-24 | 2006-04-06 | Fuji Xerox Co Ltd | 文字認識装置、文字認識方法および文字認識プログラム |
JP4172478B2 (ja) * | 2005-08-25 | 2008-10-29 | コニカミノルタビジネステクノロジーズ株式会社 | 文書管理装置及び文書管理方法 |
JP2007058622A (ja) * | 2005-08-25 | 2007-03-08 | Konica Minolta Business Technologies Inc | 文書管理装置及び文書管理方法 |
US8677377B2 (en) | 2005-09-08 | 2014-03-18 | Apple Inc. | Method and apparatus for building an intelligent automated assistant |
JP4420877B2 (ja) * | 2005-09-22 | 2010-02-24 | シャープ株式会社 | 画像処理方法、画像処理装置、及び画像出力装置 |
KR100718139B1 (ko) * | 2005-11-04 | 2007-05-14 | 삼성전자주식회사 | 영상에 포함된 문자 인식장치 및 방법 |
US9318108B2 (en) | 2010-01-18 | 2016-04-19 | Apple Inc. | Intelligent automated assistant |
CN101149804B (zh) * | 2006-09-19 | 2010-11-10 | 北京三星通信技术研究有限公司 | 自适应手写识别系统和方法 |
US8633930B2 (en) * | 2007-03-26 | 2014-01-21 | Apple Inc. | Non-linear text flow |
US8977255B2 (en) | 2007-04-03 | 2015-03-10 | Apple Inc. | Method and system for operating a multi-function portable electronic device using voice-activation |
US9330720B2 (en) | 2008-01-03 | 2016-05-03 | Apple Inc. | Methods and apparatus for altering audio output signals |
US8996376B2 (en) | 2008-04-05 | 2015-03-31 | Apple Inc. | Intelligent text-to-speech conversion |
US10496753B2 (en) | 2010-01-18 | 2019-12-03 | Apple Inc. | Automatically adapting user interfaces for hands-free interaction |
US20100030549A1 (en) | 2008-07-31 | 2010-02-04 | Lee Michael M | Mobile device having human language translation capability with positional feedback |
WO2010067118A1 (en) | 2008-12-11 | 2010-06-17 | Novauris Technologies Limited | Speech recognition involving a mobile device |
US8319665B2 (en) | 2009-02-20 | 2012-11-27 | Appareo Systems, Llc | Adaptive instrument and operator control recognition |
US8319666B2 (en) | 2009-02-20 | 2012-11-27 | Appareo Systems, Llc | Optical image monitoring system and method for vehicles |
JP5517028B2 (ja) * | 2009-03-16 | 2014-06-11 | 株式会社リコー | 画像処理装置 |
US10241752B2 (en) | 2011-09-30 | 2019-03-26 | Apple Inc. | Interface for a virtual digital assistant |
US9858925B2 (en) | 2009-06-05 | 2018-01-02 | Apple Inc. | Using context information to facilitate processing of commands in a virtual assistant |
US10706373B2 (en) | 2011-06-03 | 2020-07-07 | Apple Inc. | Performing actions associated with task items that represent tasks to perform |
US10241644B2 (en) | 2011-06-03 | 2019-03-26 | Apple Inc. | Actionable reminder entries |
US9431006B2 (en) | 2009-07-02 | 2016-08-30 | Apple Inc. | Methods and apparatuses for automatic speech recognition |
US8649600B2 (en) * | 2009-07-10 | 2014-02-11 | Palo Alto Research Center Incorporated | System and method for segmenting text lines in documents |
EP2515257A4 (en) * | 2009-12-15 | 2016-12-07 | Fujitsu Frontech Ltd | METHOD, DEVICE AND PROGRAM FOR CHARACTER RECOGNITION |
US10553209B2 (en) | 2010-01-18 | 2020-02-04 | Apple Inc. | Systems and methods for hands-free notification summaries |
US10705794B2 (en) | 2010-01-18 | 2020-07-07 | Apple Inc. | Automatically adapting user interfaces for hands-free interaction |
US10276170B2 (en) | 2010-01-18 | 2019-04-30 | Apple Inc. | Intelligent automated assistant |
US10679605B2 (en) | 2010-01-18 | 2020-06-09 | Apple Inc. | Hands-free list-reading by intelligent automated assistant |
DE202011111062U1 (de) | 2010-01-25 | 2019-02-19 | Newvaluexchange Ltd. | Vorrichtung und System für eine Digitalkonversationsmanagementplattform |
US8682667B2 (en) | 2010-02-25 | 2014-03-25 | Apple Inc. | User profiling for selecting user specific voice input processing information |
CN102402693B (zh) * | 2010-09-09 | 2014-07-30 | 富士通株式会社 | 处理包含字符的图像的方法和设备 |
US10762293B2 (en) | 2010-12-22 | 2020-09-01 | Apple Inc. | Using parts-of-speech tagging and named entity recognition for spelling correction |
US9262612B2 (en) | 2011-03-21 | 2016-02-16 | Apple Inc. | Device access using voice authentication |
JP5182902B2 (ja) * | 2011-03-31 | 2013-04-17 | 京セラコミュニケーションシステム株式会社 | 文書イメージ出力装置 |
US10057736B2 (en) | 2011-06-03 | 2018-08-21 | Apple Inc. | Active transport based notifications |
US8977059B2 (en) * | 2011-06-03 | 2015-03-10 | Apple Inc. | Integrating feature extraction via local sequential embedding for automatic handwriting recognition |
US8994660B2 (en) | 2011-08-29 | 2015-03-31 | Apple Inc. | Text correction processing |
JP5935324B2 (ja) * | 2012-01-04 | 2016-06-15 | 富士ゼロックス株式会社 | 情報処理装置及び情報処理プログラム |
US10607424B2 (en) | 2012-02-10 | 2020-03-31 | Appareo Systems, Llc | Frequency-adaptable structural health and usage monitoring system (HUMS) and method with smart sensors |
WO2013120103A1 (en) | 2012-02-10 | 2013-08-15 | Appareo Systems, Llc | Frequency-adaptable structural health and usage monitoring system |
US10134385B2 (en) | 2012-03-02 | 2018-11-20 | Apple Inc. | Systems and methods for name pronunciation |
US9483461B2 (en) | 2012-03-06 | 2016-11-01 | Apple Inc. | Handling speech synthesis of content for multiple languages |
US9280610B2 (en) | 2012-05-14 | 2016-03-08 | Apple Inc. | Crowd sourcing information to fulfill user requests |
US9721563B2 (en) | 2012-06-08 | 2017-08-01 | Apple Inc. | Name recognition system |
US9495129B2 (en) | 2012-06-29 | 2016-11-15 | Apple Inc. | Device, method, and user interface for voice-activated navigation and browsing of a document |
US9576574B2 (en) | 2012-09-10 | 2017-02-21 | Apple Inc. | Context-sensitive handling of interruptions by intelligent digital assistant |
US9547647B2 (en) | 2012-09-19 | 2017-01-17 | Apple Inc. | Voice-based media searching |
KR20240132105A (ko) | 2013-02-07 | 2024-09-02 | 애플 인크. | 디지털 어시스턴트를 위한 음성 트리거 |
US10652394B2 (en) | 2013-03-14 | 2020-05-12 | Apple Inc. | System and method for processing voicemail |
US9368114B2 (en) | 2013-03-14 | 2016-06-14 | Apple Inc. | Context-sensitive handling of interruptions |
WO2014144579A1 (en) | 2013-03-15 | 2014-09-18 | Apple Inc. | System and method for updating an adaptive speech recognition model |
AU2014233517B2 (en) | 2013-03-15 | 2017-05-25 | Apple Inc. | Training an at least partial voice command system |
WO2014197334A2 (en) | 2013-06-07 | 2014-12-11 | Apple Inc. | System and method for user-specified pronunciation of words for speech synthesis and recognition |
WO2014197336A1 (en) | 2013-06-07 | 2014-12-11 | Apple Inc. | System and method for detecting errors in interactions with a voice-based digital assistant |
US9582608B2 (en) | 2013-06-07 | 2017-02-28 | Apple Inc. | Unified ranking with entropy-weighted information for phrase-based semantic auto-completion |
WO2014197335A1 (en) | 2013-06-08 | 2014-12-11 | Apple Inc. | Interpreting and acting upon commands that involve sharing information with remote devices |
KR101772152B1 (ko) | 2013-06-09 | 2017-08-28 | 애플 인크. | 디지털 어시스턴트의 둘 이상의 인스턴스들에 걸친 대화 지속성을 가능하게 하기 위한 디바이스, 방법 및 그래픽 사용자 인터페이스 |
US10176167B2 (en) | 2013-06-09 | 2019-01-08 | Apple Inc. | System and method for inferring user intent from speech inputs |
EP3008964B1 (en) | 2013-06-13 | 2019-09-25 | Apple Inc. | System and method for emergency calls initiated by voice command |
DE112014003653B4 (de) | 2013-08-06 | 2024-04-18 | Apple Inc. | Automatisch aktivierende intelligente Antworten auf der Grundlage von Aktivitäten von entfernt angeordneten Vorrichtungen |
US9620105B2 (en) | 2014-05-15 | 2017-04-11 | Apple Inc. | Analyzing audio input for efficient speech and music recognition |
US10592095B2 (en) | 2014-05-23 | 2020-03-17 | Apple Inc. | Instantaneous speaking of content on touch devices |
US9502031B2 (en) | 2014-05-27 | 2016-11-22 | Apple Inc. | Method for supporting dynamic grammars in WFST-based ASR |
US10289433B2 (en) | 2014-05-30 | 2019-05-14 | Apple Inc. | Domain specific language for encoding assistant dialog |
US9430463B2 (en) | 2014-05-30 | 2016-08-30 | Apple Inc. | Exemplar-based natural language processing |
US9734193B2 (en) | 2014-05-30 | 2017-08-15 | Apple Inc. | Determining domain salience ranking from ambiguous words in natural speech |
US9715875B2 (en) | 2014-05-30 | 2017-07-25 | Apple Inc. | Reducing the need for manual start/end-pointing and trigger phrases |
US9785630B2 (en) | 2014-05-30 | 2017-10-10 | Apple Inc. | Text prediction using combined word N-gram and unigram language models |
US10170123B2 (en) | 2014-05-30 | 2019-01-01 | Apple Inc. | Intelligent assistant for home automation |
US10078631B2 (en) | 2014-05-30 | 2018-09-18 | Apple Inc. | Entropy-guided text prediction using combined word and character n-gram language models |
US9842101B2 (en) | 2014-05-30 | 2017-12-12 | Apple Inc. | Predictive conversion of language input |
CN110797019B (zh) | 2014-05-30 | 2023-08-29 | 苹果公司 | 多命令单一话语输入方法 |
US9633004B2 (en) | 2014-05-30 | 2017-04-25 | Apple Inc. | Better resolution when referencing to concepts |
US9760559B2 (en) | 2014-05-30 | 2017-09-12 | Apple Inc. | Predictive text input |
US10659851B2 (en) | 2014-06-30 | 2020-05-19 | Apple Inc. | Real-time digital assistant knowledge updates |
US9338493B2 (en) | 2014-06-30 | 2016-05-10 | Apple Inc. | Intelligent automated assistant for TV user interactions |
US10446141B2 (en) | 2014-08-28 | 2019-10-15 | Apple Inc. | Automatic speech recognition based on user feedback |
US9818400B2 (en) | 2014-09-11 | 2017-11-14 | Apple Inc. | Method and apparatus for discovering trending terms in speech requests |
US10789041B2 (en) | 2014-09-12 | 2020-09-29 | Apple Inc. | Dynamic thresholds for always listening speech trigger |
US9886432B2 (en) | 2014-09-30 | 2018-02-06 | Apple Inc. | Parsimonious handling of word inflection via categorical stem + suffix N-gram language models |
US10127911B2 (en) | 2014-09-30 | 2018-11-13 | Apple Inc. | Speaker identification and unsupervised speaker adaptation techniques |
US9646609B2 (en) | 2014-09-30 | 2017-05-09 | Apple Inc. | Caching apparatus for serving phonetic pronunciations |
US9668121B2 (en) | 2014-09-30 | 2017-05-30 | Apple Inc. | Social reminders |
US10074360B2 (en) | 2014-09-30 | 2018-09-11 | Apple Inc. | Providing an indication of the suitability of speech recognition |
US10552013B2 (en) | 2014-12-02 | 2020-02-04 | Apple Inc. | Data detection |
US9711141B2 (en) | 2014-12-09 | 2017-07-18 | Apple Inc. | Disambiguating heteronyms in speech synthesis |
CN105787415B (zh) * | 2014-12-18 | 2020-04-07 | 富士通株式会社 | 文档图像的处理装置、方法以及扫描仪 |
US9865280B2 (en) | 2015-03-06 | 2018-01-09 | Apple Inc. | Structured dictation using intelligent automated assistants |
US10567477B2 (en) | 2015-03-08 | 2020-02-18 | Apple Inc. | Virtual assistant continuity |
US9721566B2 (en) | 2015-03-08 | 2017-08-01 | Apple Inc. | Competing devices responding to voice triggers |
US9886953B2 (en) | 2015-03-08 | 2018-02-06 | Apple Inc. | Virtual assistant activation |
US9899019B2 (en) | 2015-03-18 | 2018-02-20 | Apple Inc. | Systems and methods for structured stem and suffix language models |
US9842105B2 (en) | 2015-04-16 | 2017-12-12 | Apple Inc. | Parsimonious continuous-space phrase representations for natural language processing |
US10083688B2 (en) | 2015-05-27 | 2018-09-25 | Apple Inc. | Device voice control for selecting a displayed affordance |
US10127220B2 (en) | 2015-06-04 | 2018-11-13 | Apple Inc. | Language identification from short strings |
US10101822B2 (en) | 2015-06-05 | 2018-10-16 | Apple Inc. | Language input correction |
US9578173B2 (en) | 2015-06-05 | 2017-02-21 | Apple Inc. | Virtual assistant aided communication with 3rd party service in a communication session |
US11025565B2 (en) | 2015-06-07 | 2021-06-01 | Apple Inc. | Personalized prediction of responses for instant messaging |
US10255907B2 (en) | 2015-06-07 | 2019-04-09 | Apple Inc. | Automatic accent detection using acoustic models |
US10186254B2 (en) | 2015-06-07 | 2019-01-22 | Apple Inc. | Context-based endpoint detection |
KR101584045B1 (ko) * | 2015-09-02 | 2016-01-11 | 주식회사 시큐브 | 세그먼트 기반 수기서명 인증 시스템 및 방법 |
US10747498B2 (en) | 2015-09-08 | 2020-08-18 | Apple Inc. | Zero latency digital assistant |
US10671428B2 (en) | 2015-09-08 | 2020-06-02 | Apple Inc. | Distributed personal assistant |
US9697820B2 (en) | 2015-09-24 | 2017-07-04 | Apple Inc. | Unit-selection text-to-speech synthesis using concatenation-sensitive neural networks |
US11010550B2 (en) | 2015-09-29 | 2021-05-18 | Apple Inc. | Unified language modeling framework for word prediction, auto-completion and auto-correction |
US10366158B2 (en) | 2015-09-29 | 2019-07-30 | Apple Inc. | Efficient word encoding for recurrent neural network language models |
US11587559B2 (en) | 2015-09-30 | 2023-02-21 | Apple Inc. | Intelligent device identification |
US10691473B2 (en) | 2015-11-06 | 2020-06-23 | Apple Inc. | Intelligent automated assistant in a messaging environment |
US10049668B2 (en) | 2015-12-02 | 2018-08-14 | Apple Inc. | Applying neural network language models to weighted finite state transducers for automatic speech recognition |
US10223066B2 (en) | 2015-12-23 | 2019-03-05 | Apple Inc. | Proactive assistance based on dialog communication between devices |
US10446143B2 (en) | 2016-03-14 | 2019-10-15 | Apple Inc. | Identification of voice inputs providing credentials |
US9934775B2 (en) | 2016-05-26 | 2018-04-03 | Apple Inc. | Unit-selection text-to-speech synthesis based on predicted concatenation parameters |
US9972304B2 (en) | 2016-06-03 | 2018-05-15 | Apple Inc. | Privacy preserving distributed evaluation framework for embedded personalized systems |
US10249300B2 (en) | 2016-06-06 | 2019-04-02 | Apple Inc. | Intelligent list reading |
US10049663B2 (en) | 2016-06-08 | 2018-08-14 | Apple, Inc. | Intelligent automated assistant for media exploration |
DK179588B1 (en) | 2016-06-09 | 2019-02-22 | Apple Inc. | INTELLIGENT AUTOMATED ASSISTANT IN A HOME ENVIRONMENT |
US10509862B2 (en) | 2016-06-10 | 2019-12-17 | Apple Inc. | Dynamic phrase expansion of language input |
US10067938B2 (en) | 2016-06-10 | 2018-09-04 | Apple Inc. | Multilingual word prediction |
US10490187B2 (en) | 2016-06-10 | 2019-11-26 | Apple Inc. | Digital assistant providing automated status report |
US10586535B2 (en) | 2016-06-10 | 2020-03-10 | Apple Inc. | Intelligent digital assistant in a multi-tasking environment |
US10192552B2 (en) | 2016-06-10 | 2019-01-29 | Apple Inc. | Digital assistant providing whispered speech |
DK179415B1 (en) | 2016-06-11 | 2018-06-14 | Apple Inc | Intelligent device arbitration and control |
DK201670540A1 (en) | 2016-06-11 | 2018-01-08 | Apple Inc | Application integration with a digital assistant |
DK179049B1 (en) | 2016-06-11 | 2017-09-18 | Apple Inc | Data driven natural language event detection and classification |
DK179343B1 (en) | 2016-06-11 | 2018-05-14 | Apple Inc | Intelligent task discovery |
US10043516B2 (en) | 2016-09-23 | 2018-08-07 | Apple Inc. | Intelligent automated assistant |
US10593346B2 (en) | 2016-12-22 | 2020-03-17 | Apple Inc. | Rank-reduced token representation for automatic speech recognition |
DK201770439A1 (en) | 2017-05-11 | 2018-12-13 | Apple Inc. | Offline personal assistant |
DK179496B1 (en) | 2017-05-12 | 2019-01-15 | Apple Inc. | USER-SPECIFIC Acoustic Models |
DK179745B1 (en) | 2017-05-12 | 2019-05-01 | Apple Inc. | SYNCHRONIZATION AND TASK DELEGATION OF A DIGITAL ASSISTANT |
DK201770431A1 (en) | 2017-05-15 | 2018-12-20 | Apple Inc. | Optimizing dialogue policy decisions for digital assistants using implicit feedback |
DK201770432A1 (en) | 2017-05-15 | 2018-12-21 | Apple Inc. | Hierarchical belief states for digital assistants |
DK179549B1 (en) | 2017-05-16 | 2019-02-12 | Apple Inc. | FAR-FIELD EXTENSION FOR DIGITAL ASSISTANT SERVICES |
JP7532171B2 (ja) | 2020-09-18 | 2024-08-13 | 株式会社Pfu | 画像判定装置、画像判定方法、及びプログラム |
CN116434250B (zh) * | 2023-06-13 | 2023-08-25 | 深圳宏途教育网络科技有限公司 | 一种手写字符图像相似度确定模型训练方法 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS60116078A (ja) * | 1983-11-28 | 1985-06-22 | Toshiba Corp | 文字認識装置 |
JPH05189604A (ja) * | 1992-01-14 | 1993-07-30 | Toshiba Corp | 光学的文字読取装置 |
JPH08123904A (ja) * | 1994-10-21 | 1996-05-17 | Matsushita Electric Ind Co Ltd | 書体種類処理装置 |
JPH10162102A (ja) * | 1996-12-03 | 1998-06-19 | Ricoh Co Ltd | 文字認識装置 |
Family Cites Families (16)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US4259661A (en) * | 1978-09-01 | 1981-03-31 | Burroughs Corporation | Apparatus and method for recognizing a pattern |
JPS5837779A (ja) * | 1981-08-31 | 1983-03-05 | Ricoh Co Ltd | 文書処理装置 |
JPS60118985A (ja) | 1983-11-30 | 1985-06-26 | Ricoh Co Ltd | 文字種識別方式 |
US4700400A (en) * | 1985-10-10 | 1987-10-13 | The Palantir Corporation | Feature extraction technique for use in a pattern recognition system |
JPS6379193A (ja) | 1986-09-22 | 1988-04-09 | Toshiba Corp | 文字読取装置 |
JP3038344B2 (ja) * | 1987-02-24 | 2000-05-08 | 株式会社東芝 | 郵便物読取処理装置 |
JPS63261486A (ja) * | 1987-04-20 | 1988-10-28 | Nec Corp | 書体識別装置 |
JPS63298494A (ja) * | 1987-05-29 | 1988-12-06 | Hitachi Ltd | パタ−ン認識装置 |
JP2713911B2 (ja) * | 1987-07-08 | 1998-02-16 | 株式会社東芝 | 郵便物処理装置 |
JP2868134B2 (ja) * | 1990-09-03 | 1999-03-10 | キヤノン株式会社 | 画像処理方法及び装置 |
CA2092529A1 (en) * | 1990-09-27 | 1992-03-28 | Wolfgang Lellmann | Process for extracting individual characters from raster images of a read-in handwritten or typed series of characters in free distribution |
US5521985A (en) * | 1992-08-13 | 1996-05-28 | International Business Machines Corporation | Apparatus for recognizing machine generated or handprinted text |
US5872864A (en) * | 1992-09-25 | 1999-02-16 | Olympus Optical Co., Ltd. | Image processing apparatus for performing adaptive data processing in accordance with kind of image |
JP2933801B2 (ja) * | 1993-06-11 | 1999-08-16 | 富士通株式会社 | 文字の切り出し方法及びその装置 |
JP4176175B2 (ja) | 1996-09-27 | 2008-11-05 | 富士通株式会社 | パターン認識装置 |
JPH10162103A (ja) | 1996-12-04 | 1998-06-19 | Oki Electric Ind Co Ltd | 文字認識装置 |
-
1998
- 1998-12-16 JP JP10357701A patent/JP2000181993A/ja active Pending
-
1999
- 1999-06-24 US US09/339,200 patent/US6643401B1/en not_active Expired - Fee Related
- 1999-07-05 KR KR1019990026823A patent/KR100658119B1/ko not_active IP Right Cessation
- 1999-07-28 CN CNB991107101A patent/CN1163846C/zh not_active Expired - Fee Related
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS60116078A (ja) * | 1983-11-28 | 1985-06-22 | Toshiba Corp | 文字認識装置 |
JPH05189604A (ja) * | 1992-01-14 | 1993-07-30 | Toshiba Corp | 光学的文字読取装置 |
JPH08123904A (ja) * | 1994-10-21 | 1996-05-17 | Matsushita Electric Ind Co Ltd | 書体種類処理装置 |
JPH10162102A (ja) * | 1996-12-03 | 1998-06-19 | Ricoh Co Ltd | 文字認識装置 |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR100926823B1 (ko) | 2007-12-05 | 2009-11-12 | 황병익 | 문자 인식 방법 |
KR102075299B1 (ko) * | 2019-07-03 | 2020-02-07 | 서정현 | 선 인식 장치 및 방법 |
Also Published As
Publication number | Publication date |
---|---|
US6643401B1 (en) | 2003-11-04 |
CN1163846C (zh) | 2004-08-25 |
JP2000181993A (ja) | 2000-06-30 |
KR20000047428A (ko) | 2000-07-25 |
CN1258894A (zh) | 2000-07-05 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR100658119B1 (ko) | 문자 인식 장치 및 방법 | |
Roy et al. | HMM-based Indic handwritten word recognition using zone segmentation | |
Spitz | Determination of the script and language content of document images | |
US7302099B2 (en) | Stroke segmentation for template-based cursive handwriting recognition | |
US5410611A (en) | Method for identifying word bounding boxes in text | |
JP4006224B2 (ja) | 画像品質判定方法、判定装置、判定プログラム | |
Pal et al. | Identification of different script lines from multi-script documents | |
KR19980023917A (ko) | 패턴 인식 장치 및 방법 | |
JPH08180139A (ja) | 拘束のない手書き英数字のオンライン認識の方法及び装置 | |
US11823497B2 (en) | Image processing system and an image processing method | |
JP4280355B2 (ja) | 文字認識装置 | |
Sánchez et al. | Automatic line and word segmentation applied to densely line-skewed historical handwritten document images | |
CN115311666A (zh) | 图文识别方法、装置、计算机设备及存储介质 | |
US11756321B2 (en) | Information processing apparatus and non-transitory computer readable medium | |
Dhandra et al. | Word-wise script identification from bilingual documents based on morphological reconstruction | |
Lee et al. | Combining macro and micro features for writer identification | |
JP3276555B2 (ja) | フォーマット認識装置及び文字読取り装置 | |
JP2000331122A (ja) | 文字認識方法および装置 | |
JPH02116987A (ja) | 文字認識装置 | |
JP2917427B2 (ja) | 図面読取装置 | |
JP2906758B2 (ja) | 文字読取装置 | |
KR100317653B1 (ko) | 대용량인쇄체문자인식을위한특징추출방법 | |
JP3428504B2 (ja) | 文字認識装置 | |
Soua et al. | Efficient multiscale and multifont optical character recognition system based on robust feature description | |
Saeed et al. | Intelligent feature extract system for cursive-script recognition |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A201 | Request for examination | ||
AMND | Amendment | ||
E902 | Notification of reason for refusal | ||
AMND | Amendment | ||
E601 | Decision to refuse application | ||
J201 | Request for trial against refusal decision | ||
AMND | Amendment | ||
B701 | Decision to grant | ||
GRNT | Written decision to grant | ||
LAPS | Lapse due to unpaid annual fee |