KR940024625A - 원고라인, 워드 및 문자셀 공간특징 자동판정방법 및 장치 - Google Patents

원고라인, 워드 및 문자셀 공간특징 자동판정방법 및 장치 Download PDF

Info

Publication number
KR940024625A
KR940024625A KR1019940004751A KR19940004751A KR940024625A KR 940024625 A KR940024625 A KR 940024625A KR 1019940004751 A KR1019940004751 A KR 1019940004751A KR 19940004751 A KR19940004751 A KR 19940004751A KR 940024625 A KR940024625 A KR 940024625A
Authority
KR
South Korea
Prior art keywords
line
determining
character
document
generating
Prior art date
Application number
KR1019940004751A
Other languages
English (en)
Other versions
KR970002420B1 (ko
Inventor
스피쯔 로렌스
Original Assignee
가또 마사오
후지제록스 가부시끼가이샤
존. 이백
제록스 코오포레이션
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 가또 마사오, 후지제록스 가부시끼가이샤, 존. 이백, 제록스 코오포레이션 filed Critical 가또 마사오
Publication of KR940024625A publication Critical patent/KR940024625A/ko
Application granted granted Critical
Publication of KR970002420B1 publication Critical patent/KR970002420B1/ko

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/20Image preprocessing
    • G06V10/26Segmentation of patterns in the image field; Cutting or merging of image elements to establish the pattern region, e.g. clustering-based techniques; Detection of occlusion
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/14Image acquisition
    • G06V30/148Segmentation of character regions
    • G06V30/158Segmentation of character regions using character size, text spacings or pitch estimation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition

Abstract

자동문자셀 판정장치는 문서의 원고화상내의 문자셀들을 자동으로 판정하고, 문자구성요소 발생수단은 원고화상을 포함하는 화소들로부터 문자구성요소를 생성한다.
경계박스 발생수단은 각각의 문자구성요소를 둘러싸는 경계박스를 생성하고, 하나 이상의 문자구성요소들을 포함하는 문자셀들을 위치 설정하는 문자셀 판정수단은 라인들과 문자구성요소들간에 백색간격들을 보장하기 위한 수직 및 수평 스플래잉 수단과, 한 라인의 수직위치를 판정하는 수직프로필 수단과, 2이상의 문자구성요소들의 연자들을 분할하는 수단과, 하나 이상의 문자구성요소들을 함께 모아 문자셀들을 생성하는 수단을 구비한다.

Description

원고라인, 워드 및 문자셀 공간특징 자동판정방법 및 장치
본 내용은 요부공개 건이므로 전문내용을 수록하지 않았음
제1도는 광학문자인식 시스템의 개통도, 제2도는 원고(text)의 샘플과 수직 스플래잉(splaying) 전후의 수직 프로필(profile)을 나타낸 도면.

Claims (38)

  1. 문서내 화상의 스플래이않된 원고부의 원고특징을 판정하는 자동원고 특징 판정장치에 있어서, 상기 스플래이않된 원고부를 나타내는 디지탈 데이타 신호를 입력하는 입력수단과, 상기 디지탈 데이타 신호는 복수의 신호부분들을 포함하며, 상기 각 신호부분은 복수의 화소들중 하나에 상응하며, 상기 복수의 신호부분들로부터 복수의 문자구성요소들을 생성하는 문자구성요소 발생수단과, 상기 복수의 문자구성요소들중 상응하는 것을 각각 둘러싸는 복수의 경계박스들을 생성하는 경계박스 발생수단과, 상기 스플래이않된 원고부의 원고의 각 라인의 공간특징을 판정하며, 상기 원고의 각 라인은 복수의 문자구성요소들중 적어도 하나를 포함하는 라인공간 특징 판정수단을 포함하는 것이 특징인 자동원고 특징 판정장치.
  2. 제1항에 있어서, 상기 라인공간 특징 판정수단은 상기 스플래이않된 원고로부터 수직으로 스플래이된 원고부를 생성하는 수직 스플래잉 수단과, 상기 수직으로 스플래인된 원고부의 수직프로필을 생성하는 수직프로필 수단을 포함하는 것이 특징인 자동원고 특징 판정장치.
  3. 제2항에 있어서, 상기 라인공간 특징 판정수단은 상기 복수의 문자구성요소들중 어느것들이 상기 스플래이된 원고부의 각 라인에 상응하는지를 판정하는 라인내용 판정수단을 더 포함하는 것이 특징인 자동원고 특징 판정장치.
  4. 제3항에 있어서, 상기 수직프로필 수단은 상기 스플래이않된 원고부의 각 라인마다 복수의 문자구성요소들중 상응하는 것들에 근거하여 상부위치 및 하부위치와 기준라인위치와 X-라인위치중 적어도 하나를 판정하는 수직위치 판정수단을 더 포함하는 것이 특징인 자동원고 특징 판정장치.
  5. 제4항에 있어서, 상기 수직위치 판정수단은 각 라인에 상응하는 수직프로필의 0에서 영이 아닌 값으로의 변환들에 근거하여 적어도 한 라인의 상부 및 하부위치들을 판정하는 것이 특징인 자동원고 특징 판정장치.
  6. 제4항에 있어서, 상기 수직프로필 수단은 상기 복수의 문자구성요소들중 상응하는 것들의 상부위치들의 상부위치수직프로필과 하부위치들의 하부위치수직프로필을 생성하는 수직프로필 발생수단을 더 포함하는 것이 특징인 자동원고 특징 판정장치.
  7. 제6항에 있어서, 상기 수직프로필 수단은 각 라인에 제각기 상응하는 상부위치와 하부위치 수직프로필들의 피이크로부터 스플래이않된 원고의 각 라인의 기준라인과 X-라인 위치들을 판정하는 것이 특징인 자동원고 특징 판정장치.
  8. 제1항에 있어서, 상기 라인공간 특징 판정수단은 각 라인의 워드공간 특징을 판정하는 워드공간 특징 판정수단을 포함하는 것이 특징인 자동원고 특징 판정장치.
  9. 제8항에 있어서, 상기 공간특징 판정수단은 스플래이않된 원고부의 적어도 하나의 라인을 수평으로 스플래잉하는 수평 스플래잉 수단과, 각 라인의 인접한 문자구성요소들간의 수평으로 스플래이된 원고부의 간격폭들을 판정하는 간격폭 판정수단과, 수평으로 스플래이된 원고를 근거로 스플래이않된 원고부의 각 라인내의 적어도 한 문자셀을 생성하는 문자셀 발생수단을 포함하며, 상기 각 문자셀은 수평으로 스플래이된 원고부의 적어도 하나의 수직으로 정렬된 문자구성요소의 일군을 포함하는 것이 특징인 자동원고 특징 판정장치.
  10. 제8항에 있어서, 워드공간 특징 판정수단은 각각의 적어도 한 라인마다 모달 스트로크폭을 판정하는 스트로크폭 판정수단과, 상응하는 라인에 대한 소정수의 모달 스트로크폭보다 큰 폭을 갖는 넓은 문자구성요소들을 위치설정하는 수단과, 각각의 넓은 문자구성요소마다 코스트 분포를 생성하는 수단과, 넓은 문자구성요소들중 하나의 소정부분에 각각 상응하는 코스트 분포들내에 미니멈들을 위치설정하는 수단과, 적어도 하나의 미니멈이 위치설정된 각각의 넓은 문자구성요소를 스플래이않된 원고부의 2개별 문자구성요소들로 분할하는 수단을 포함하는 것이 특징인 자동원고 특징 판정장치.
  11. 제10항에 있어서, 상기 소정수는 3인 것이 특징인 자동원고 특징 판정수단.
  12. 제10항에 있어서, 상기 각각의 넓은 문자구성요소의 소정부분은 넓은 문자구성요소의 최좌 위치의 우측으로의 모달 스트로크폭의 제2소정수인 제1지점으로 부터 넓은 문자구성요소의 최우위치의 좌측으로의 평균스트로크폭의 제2소정수인 제2지점까지 연장되는 것이 특징인 자동원고 특징 판정장치.
  13. 제12항에 있어서, 상기 제2소정수는 1.5인 것이 특징인 자동원고 특징 판정장치.
  14. 제10항에 있어서, 상기 미니멈은 소정값 이하인 것이 특징인 자동원고 특징 판정장치.
  15. 제14항에 있어서, 상기 소정값은 모달 스트로크폭과 동일한 것이 특징인 자동원고 특징 판정장치.
  16. 제10항에 있어서, 상기 수평 스플래잉 수단은 넓은 문자구성요소에 상응하는 경계박스의 인접 컬럼들을 앤드연산함으로써 코스트 분폴를 생성하는 것이 특징인 자동원고 특징 판정장치.
  17. 제9항에 있어서, 상기 문자셀 발생수단은 각 문자셀마다, 적어도 하나의 수직정렬된 문자구성요소의 상응하는 그룹의 최좌위치와 최우위치를 판정하고, 각 라인의 각 문자셀의 경계들은 수직정렬된 문자구성요소들의 상응하는 구룹의 최좌위치 및 최우위치와 상응하는 라인의 상하위치들을 포함하는 것이 특징인 자동원고 특징 판정장치.
  18. 제9항에 있어서, 상기 라인공간 특징 판정수단은 인트라워드와 인터워드 가격을 판정하는 워드간격판정수단을 더 포함하며, 상기 워드간격 판정수단은 라인시작위치와 라인종료위치를 판정하는 수단과, 상기 스플래이된 원고의 각 라인의 문자구성요소들간의 간격들의 칫수를 판정하는 수단과, 공간 칫수의 분포를 판정하는 수단과, 간격칫수를 분포내에 적어도 하나의 피이크를 위치설정하는 수단을 포함하는 것이 특징인 자동원고 특징 판정장치.
  19. 제18항에 있어서, 상기 워드간격 판정수단은 각 라인마다 적어도 하나의 피이크가 인터워드 간격과 인트라워드 간격중 하나를 나타내는지를 판정하는 수단과, 상응하는 피이크판정을 근거하여 각 라인내의 적어도 한 간격이 인터워드 가격과 인트라워드 간격중 하나를 나타내는지를 판정하는 수단을 더 포함하는 것이 특징인 자동원고 특징 판정장치.
  20. 문서의 화상의 스플래이않된 원고부의 원고특징들을 자동으로 판정하는 방법에 있어서, 상기 스플래이않된 원고부를 나타내는 디지탈 데이타 신호를 입력하는 단계와, 상기 디지탈 데이타 신호는 복수의 신호부분들을 포함하며, 상기 각 신호부분은 복수의 화소들중 하나에 상응하며, 상기 복수의 신호부분으로부터 복수의 문자구성요소들을 생성하는 단계와, 상기 복수의 문자구성요소들중 상응하는 것을 각각 둘러싸는 복수의 경계박스들을 생성하는 단계와, 상기 스플래이않된 원고부의 원고의 각 라인의 공간특징을 판정하는 단계를 포함하며, 상기 원고의 각 라인은 복수의 문자구성요소들중 적어도 하나를 포함하는 것이 특징인 자동원고 특징 판정방법.
  21. 제20항에 있어서, 상기 스플래이않된 원고부로부터 수직 스플래이된 원고부를 생성하는 단계와, 상기 수직 스플래이된 원고부의 수직프로필을 생성하는 단계를 더 포함하는 것이 특징인 자동원고 특징 판정방법.
  22. 제21항에 있어서, 상기 수직 스플래이 단계는 복수의 문자구성요소들중 어느것들이 원고부의 각 라인에 상응하는지를 판정하는 단계를 포함하는 것이 특징인 자동원고 특징 판정방법.
  23. 제22항에 있어서, 상기 수직프로필 생성단계는 원고부마다 각 라인에 대한 복수의 문자구성요소들중 상응하는 것들을 근거로 상부 및 하부위치와 기준위치와 X-선 위치중 적어도 하나를 판정하는 단계를 포함하는 것이 특징인 자동원고 특징 판정방법.
  24. 제23항에 있어서, 상기 판정단계는 각 라인에 상응하는 수직프로필에 관해 제각기 맥시멈 피이크와 미니멈 피이크로부터 각 라인의 상부와 하부위치들을 판정하는 것이 특징인 자동원고 특징 판정방법.
  25. 제23항에 있어서, 상기 수직프로필 생성단계는 상기 복수의 문자구성요소들중 상응하는 것들의 상부위치들의 상부위치수직프로필과 하부위치들의 하부위치수직프로필을 생성하는 단계를 더 포함하는 것이 특징인 자동원고 특징 판정방법.
  26. 제23항에 있어서, 상기 판정단계는 각 라인에 상응하는 각각의 상부위치와 하부위치 수직프로필들의 피이크로부터 각 라인의 X-라인과 기준라인 위치들을 판정하는 것이 특징인 자동원고 특징 판정방법.
  27. 제20항에 있어서, 각 라인의 워드공간 특징들을 판정하는 단계를 더 포함하는 것이 특징인 자동원고 특징 판정방법.
  28. 제27항에 있어서, 상기 스플래이않된 원고부의 적어도 한 라인을 수평으로 스플래잉하는 단계와, 각 라인의 인접한 문자구성요소들간의 수평으로 스플래이된 원고부의 간격폭들을 판정하는 단계와, 상기 수평으로 스플래이된 원고를 근거로 스플래이않된 원고부의 각 라인의 적어도 한 문자셀을 생성하는 단계를 포함하며, 상기 각 문자셀은 수평으로 스플래이된 원고부의 적어도 하나의 수직정렬된 문자구성요소 한 구룹을 포함하는 것이 특징인 자동원고 특징 판정방법.
  29. 제28항에 있어서, 상기 수평으로 스플래잉하는 단계는 적어도 한 라인마다 모달 스트로크폭을 판정하는 단계와, 상응하는 라인에 대해 모달 스트로크폭의 소정수보다 큰 폭들을 갖는 넓은 문자구성요소들을 위치설정하는 단계와, 상기 넓은 문자구성요소들중 하나의 소정부분에 각각 상응하는 코스트 분포들내의 코스트 미니멈들을 위치설정하는 단계와, 적어도 하나의 코스트 미니멈이 위치설정된 각각의 넓은 문자구성요소를 2개별 문자구성요소들로 분할하는 단계를 더 포함하는 것이 자동원고 특징인 자동원고 특징 판정방법.
  30. 제29항에 있어서, 상기 소정수는 3인 것이 특징인 자동원고 특징 판정방법.
  31. 제29항에 있어서, 상기 각각의 넓은 문자구성요소의 소정부분은 넓은 문자구성요소의 최좌위치의 우측으로의 모달 스트로크폭의 제2소정수인 제1지점으로부터 넓은 문자구성요소의 최우위치의 좌측으로의 평균스트로크폭의 제2소정수인 제2지점까지 연장되는 것이 특징인 자동원고 특징 판정방법.
  32. 제31항에 있어서, 상기 제2소정수는 1.5인 것이 특징인 자동원고 특징 판정방법.
  33. 제29항에 있어서, 상기 미니멈은 소정값 이하인 것이 특징인 자동원고 특징 판정방법.
  34. 제33항에 있어서, 상기 소정값은 모달 스트로크폭과 동일한 것이 특징인 자동원고 특징 판정방법.
  35. 제29항에 있어서, 상기 수평 스플래잉 단계는 넓은 문자구성요소에 상응하는 경계박스의 인접컬럼들을 앤드연산함으로써 코스트 분포를 생성하는 것이 특징인 자동원고 특징 판정방법.
  36. 제28항에 있어서, 상기 문자셀 발생단계는 각 문자셀마다, 적어도 하나의 수직정렬된 문자구성요소의 상응하는 구룹의 최좌위치와 최우위치를 판정하고, 각 라인의 각 문자셀의 경계들은 수직정렬된 문자구성요소들의 상응하는 구룹의 최좌위치 및 최우위치와 상응하는 라인의 상하위치들을 포함하는 것이 특징인 자동원고 특징 판정방법.
  37. 제28항에 있어서, 상기 간격폭들 판정단계는 라인시작위치와 라인종료위치를 판정하는 단계와, 공간칫수의 분포를 판정하는 단계와, 간격 칫수분포내에 적어도 하나의 피이크를 위치설정하는 단계를 포함하는 것이 특징인 자동원고 특징 판정방법.
  38. 제37항에 있어서, 상기 간격폭 판정단계는 각 라인마다 적어도 하나의 피이크가 인터워드 간격과 인트라워드 간격중 하나를 나타내는지를 판정하는 단계와, 상응하는 피이크판정을 근거하여 각 라인내의 적어도 한 간격이 인터워드 간격과 인트라워드 간격중 하나를 나타내는지를 판정하는 단계를 더 포함하는 것이 특징인 자동원고 특징 판정방법.
    ※ 참고사항 : 최초출원 내용에 의하여 공개하는 것임.
KR1019940004751A 1993-04-19 1994-03-11 원고라인, 워드 및 문자셀 공간특징 자동판정방법 및 장치 KR970002420B1 (ko)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US08/047,514 1993-04-19
US08/047,514 US5384864A (en) 1993-04-19 1993-04-19 Method and apparatus for automatic determination of text line, word and character cell spatial features
US8/047,514 1993-04-19

Publications (2)

Publication Number Publication Date
KR940024625A true KR940024625A (ko) 1994-11-18
KR970002420B1 KR970002420B1 (ko) 1997-03-05

Family

ID=21949404

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1019940004751A KR970002420B1 (ko) 1993-04-19 1994-03-11 원고라인, 워드 및 문자셀 공간특징 자동판정방법 및 장치

Country Status (5)

Country Link
US (1) US5384864A (ko)
EP (1) EP0621554B1 (ko)
JP (1) JPH0713995A (ko)
KR (1) KR970002420B1 (ko)
DE (1) DE69425084T2 (ko)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20190011422A (ko) 2017-07-25 2019-02-07 주식회사 한글과컴퓨터 셀 자동 분할 장치

Families Citing this family (46)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE69330423T2 (de) * 1993-01-11 2002-05-16 Canon Kk Gerät und Verfahren zur Bildverarbeitung
US5513304A (en) * 1993-04-19 1996-04-30 Xerox Corporation Method and apparatus for enhanced automatic determination of text line dependent parameters
US5517578A (en) * 1993-05-20 1996-05-14 Aha! Software Corporation Method and apparatus for grouping and manipulating electronic representations of handwriting, printing and drawings
US6535897B1 (en) 1993-05-20 2003-03-18 Microsoft Corporation System and methods for spacing, storing and recognizing electronic representations of handwriting printing and drawings
JP3042945B2 (ja) * 1993-07-07 2000-05-22 富士通株式会社 画像抽出装置
EP0634704B1 (en) * 1993-07-16 2000-04-26 Sharp Kabushiki Kaisha Image processor
EP0702322B1 (en) * 1994-09-12 2002-02-13 Adobe Systems Inc. Method and apparatus for identifying words described in a portable electronic document
CA2154952A1 (en) * 1994-09-12 1996-03-13 Robert M. Ayers Method and apparatus for identifying words described in a page description language file
JP3805005B2 (ja) * 1994-11-09 2006-08-02 キヤノン株式会社 画像処理装置及び光学的文字認識装置及びそれらの方法
EP0807297B1 (en) * 1995-01-31 1999-09-29 United Parcel Service Of America, Inc. Method and apparatus for separating foreground from background in images containing text
US5999647A (en) * 1995-04-21 1999-12-07 Matsushita Electric Industrial Co., Ltd. Character extraction apparatus for extracting character data from a text image
MY121607A (en) * 1995-07-10 2006-02-28 Hyundai Curitel Inc Grid moving method of object image and apparatus using the same and compaction/motion estimation method using the same and apparatus thereof
US5867597A (en) * 1995-09-05 1999-02-02 Ricoh Corporation High-speed retrieval by example
US5737442A (en) * 1995-10-20 1998-04-07 Bcl Computers Processor based method for extracting tables from printed documents
US5892842A (en) * 1995-12-14 1999-04-06 Xerox Corporation Automatic method of identifying sentence boundaries in a document image
US5850476A (en) * 1995-12-14 1998-12-15 Xerox Corporation Automatic method of identifying drop words in a document image without performing character recognition
US5848191A (en) * 1995-12-14 1998-12-08 Xerox Corporation Automatic method of generating thematic summaries from a document image without performing character recognition
US5683586A (en) * 1996-02-05 1997-11-04 Harcourt; Gregory A. Method and apparatus for magnetically treating a fluid
US5909510A (en) * 1997-05-19 1999-06-01 Xerox Corporation Method and apparatus for document classification from degraded images
US6687404B1 (en) 1997-06-20 2004-02-03 Xerox Corporation Automatic training of layout parameters in a 2D image model
JP4320064B2 (ja) * 1998-07-10 2009-08-26 富士通株式会社 画像処理装置及び記録媒体
JP3897272B2 (ja) * 1999-09-28 2007-03-22 富士フイルム株式会社 画像解析装置
US8682077B1 (en) 2000-11-28 2014-03-25 Hand Held Products, Inc. Method for omnidirectional processing of 2D images including recognizable characters
US7239747B2 (en) * 2002-01-24 2007-07-03 Chatterbox Systems, Inc. Method and system for locating position in printed texts and delivering multimedia information
US7120297B2 (en) 2002-04-25 2006-10-10 Microsoft Corporation Segmented layered image system
US7110596B2 (en) 2002-04-25 2006-09-19 Microsoft Corporation System and method facilitating document image compression utilizing a mask
US7263227B2 (en) 2002-04-25 2007-08-28 Microsoft Corporation Activity detector
US7024039B2 (en) 2002-04-25 2006-04-04 Microsoft Corporation Block retouching
US7043079B2 (en) 2002-04-25 2006-05-09 Microsoft Corporation “Don't care” pixel interpolation
US7164797B2 (en) 2002-04-25 2007-01-16 Microsoft Corporation Clustering
US7392472B2 (en) 2002-04-25 2008-06-24 Microsoft Corporation Layout analysis
JP2004038321A (ja) * 2002-06-28 2004-02-05 Fujitsu Ltd 文書レイアウト解析プログラム、文書レイアウト解析装置および文書レイアウト解析方法
US7302098B2 (en) * 2004-12-03 2007-11-27 Motorola, Inc. Character segmentation method and apparatus
WO2006066325A1 (en) * 2004-12-21 2006-06-29 Canon Kabushiki Kaisha Segmenting digital image and producing compact representation
US7602972B1 (en) * 2005-04-25 2009-10-13 Adobe Systems, Incorporated Method and apparatus for identifying white space tables within a document
US7650041B2 (en) 2006-02-24 2010-01-19 Symbol Technologies, Inc. System and method for optical character recognition in an image
WO2009094446A1 (en) * 2008-01-22 2009-07-30 Digital Business Processes, Inc. Method and apparatus for cropping images
US8620080B2 (en) * 2008-09-26 2013-12-31 Sharp Laboratories Of America, Inc. Methods and systems for locating text in a digital image
EP2275972B1 (en) * 2009-07-06 2018-11-28 AO Kaspersky Lab System and method for identifying text-based spam in images
US9003531B2 (en) 2009-10-01 2015-04-07 Kaspersky Lab Zao Comprehensive password management arrangment facilitating security
US8526732B2 (en) * 2010-03-10 2013-09-03 Microsoft Corporation Text enhancement of a textual image undergoing optical character recognition
US8571270B2 (en) * 2010-05-10 2013-10-29 Microsoft Corporation Segmentation of a word bitmap into individual characters or glyphs during an OCR process
US9237255B1 (en) 2014-08-25 2016-01-12 Xerox Corporation Methods and systems for processing documents
CN106446896B (zh) * 2015-08-04 2020-02-18 阿里巴巴集团控股有限公司 一种字符分割方法、装置及电子设备
US20170068868A1 (en) * 2015-09-09 2017-03-09 Google Inc. Enhancing handwriting recognition using pre-filter classification
US9842251B2 (en) * 2016-01-29 2017-12-12 Konica Minolta Laboratory U.S.A., Inc. Bulleted lists

Family Cites Families (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US3613080A (en) * 1968-11-08 1971-10-12 Scan Data Corp Character recognition system utilizing feature extraction
US4206442A (en) * 1974-07-03 1980-06-03 Nippon Electric Co., Ltd. Letter segmenting apparatus for OCR comprising multi-level segmentor operable when binary segmenting fails
US4173015A (en) * 1978-08-16 1979-10-30 Recognition Equipment Incorporated System and method for character presence detection
JPS56129981A (en) * 1980-03-14 1981-10-12 Toshiba Corp Optical character reader
US4377803A (en) * 1980-07-02 1983-03-22 International Business Machines Corporation Algorithm for the segmentation of printed fixed pitch documents
EP0120334B1 (en) * 1983-03-01 1989-12-06 Nec Corporation Letter pitch detection system
US4918740A (en) * 1985-10-01 1990-04-17 Palantir Corporation Processing means for use in an optical character recognition system
US4899394A (en) * 1986-05-09 1990-02-06 Prodigy Systems Corporation Apparatus and method for image compression
US5001766A (en) * 1988-05-16 1991-03-19 At&T Bell Laboratories Apparatus and method for skew control of document images
US5062141A (en) * 1988-06-02 1991-10-29 Ricoh Company, Ltd. Method of segmenting characters in lines which may be skewed, for allowing improved optical character recognition
JPH0816918B2 (ja) * 1989-04-18 1996-02-21 シャープ株式会社 行抽出方法
US5253307A (en) * 1991-07-30 1993-10-12 Xerox Corporation Image analysis to obtain typeface information

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20190011422A (ko) 2017-07-25 2019-02-07 주식회사 한글과컴퓨터 셀 자동 분할 장치

Also Published As

Publication number Publication date
JPH0713995A (ja) 1995-01-17
DE69425084D1 (de) 2000-08-10
KR970002420B1 (ko) 1997-03-05
EP0621554A2 (en) 1994-10-26
DE69425084T2 (de) 2000-11-09
EP0621554A3 (en) 1995-05-24
US5384864A (en) 1995-01-24
EP0621554B1 (en) 2000-07-05

Similar Documents

Publication Publication Date Title
KR940024625A (ko) 원고라인, 워드 및 문자셀 공간특징 자동판정방법 및 장치
JP4483909B2 (ja) 翻訳装置及びプログラム
US5526443A (en) Method and apparatus for highlighting and categorizing documents using coded word tokens
DE69532847T2 (de) System zur Seitenanalyse
US5425110A (en) Method and apparatus for automatic language determination of Asian language documents
EP0024521A1 (en) Apparatus incorporating a linear array scanner for correcting deformities in electronic images produced by the scanner and method of correcting deformities in electronic images produced by linear array scanners
EP0138445A2 (en) Method and apparatus for segmenting character images
CN100349454C (zh) 图像形成装置、图像形成方法及其程序以及存储介质
JPH10228473A (ja) 文書画像処理方法、文書画像処理装置および記憶媒体
CN104504717A (zh) 一种图像信息检测方法及装置
US5399029A (en) Method of kerning in the processing of documents written in European languages
CN105260352A (zh) 一种流式文本的自动排版方法
CN111062365A (zh) 识别混合排版文字的方法、设备、芯片电路和计算机可读存储介质
JP2015170982A (ja) 画像処理装置
JP2000123169A (ja) 画像処理装置及び画像処理方法
US7532216B2 (en) Method of scaling a graphic character
JP3852218B2 (ja) 画像処理方法および画像処理装置
CN102096903B (zh) 一种页面光栅化文字平滑处理方法及系统
JPH08255160A (ja) レイアウト装置および表示装置
JP3796276B2 (ja) 自動テキスト特徴決定システム
Okun et al. Robust text detection from binarized document images
JPH0766413B2 (ja) 文書文字方向検出装置
JP2000067158A (ja) 文書画像処理方法および文書画像処理方法をコンピュータに実行させるプログラムを記録した機械読み取り可能な記録媒体
JP3100825B2 (ja) 線認識方法
CN116861849A (zh) 一种富文本设置多倍行距的方法及其系统

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
G160 Decision to publish patent application
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20000222

Year of fee payment: 4

LAPS Lapse due to unpaid annual fee