KR940024626A - 자동문자 스크립트 판정방법 및 장치 - Google Patents
자동문자 스크립트 판정방법 및 장치 Download PDFInfo
- Publication number
- KR940024626A KR940024626A KR1019940004752A KR19940004752A KR940024626A KR 940024626 A KR940024626 A KR 940024626A KR 1019940004752 A KR1019940004752 A KR 1019940004752A KR 19940004752 A KR19940004752 A KR 19940004752A KR 940024626 A KR940024626 A KR 940024626A
- Authority
- KR
- South Korea
- Prior art keywords
- script
- determining
- feature
- bounding box
- spatial distribution
- Prior art date
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/24—Character recognition characterised by the processing or recognition method
- G06V30/242—Division of the character sequences into groups prior to recognition; Selection of dictionaries
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/40—Extraction of image or video features
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Multimedia (AREA)
- Theoretical Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Character Discrimination (AREA)
- Character Input (AREA)
Abstract
자동 스크립트 판정장치는 문서의 원고화상의 그로스 스크립트형을 자동으로 판정한다. 연결요소 발생수단은 원고화상을 구성하는 화소들로부터 연결요소들을 발생한다. 경계박스 발생수단은 각각의 연결요소를 둘러싸는 경계박스를 발생한다.
중심판정수단은 각각의 경계박스마다 중심을 판정한다. 스크립트 특징 판정수단은 각각의 경계박스마다 하나 이상의 소정형의 특징들이 중심에 상관하는 위치들을 판정한다. 스크립트 판정수단은 전체 원고화상에 대해 위치된 스크립트 특징들의 분포를 판정하여 판정된 공간분포를 적어도 하나의 스크립트형에 대한 소정의 분포와 비교하여 원고화상의 스크립트형을 판정한다.
Description
본 내용은 요부공개 건이므로 전문내용을 수록하지 않았음
제1도는 한쌍의 샘플원고 스크립트, 즉 로마어 스크립트와 아시아어 스크립트로 된 문서의 화상을 나타내는 도면, 제2도는 제1도에 보인 문서의 연결요소를 박스로 테두른 도면.
Claims (24)
- 문서상의 화상의 원고부분의 스크립트형을 판정하는 자동스크립트 판정장치에 있어서, 상기 문서를 주사하여 상기 문서상의 화상을 나타내며 또한 각 신호부분이 상기 화상의 복수의 화소들중 상응하는 것을 나타내는 데이타를 구성하는 복수의 신호부분들로 구성되는 디지탈 데이타 신호를 출력하는 스캐너와, 상기 디지탈 데이타 신호를 기억하기 위한 메모리와, 상기 화상의 원고부분의 스크립트형을 판정하기 위한 콘트롤러를 포함하되 상기 콘트롤러는 상기 복수의 신호부분들로부터 복수의 연결요소들을 판정하는 연결요소 발생수단과, 상기 복수의 연결요소들 개개마다 복수의 신호부분들 주위의 상응하는 경계박스를 판정하는 경계박스 판정수단과, 각각의 상응하는 경계박스의 중심을 판정하는 중심판정수단과, 각각의 상응하는 경계박스마다 적어도 하나의 소정형의 스크립트 특징에 상응하는 스크립트 특징을 위치시키는 특징판정수단과, 상기 위치된 스크립트 특징들의 공간분포를 판정하는 공간분포 판정수단과, 상기 판정된 공간분포를 상기 소정의 공간분포와 비교하는 비교수단과, 상기 문서의 판정된 스크립트형을 나타내는 신호를 출력하는 출력수단을 구비하는 것이 특징인 자동문자 스크립트 판정장치.
- 제1항에 있어서, 적어도 하나의 소정형의 스크립트 특징은 적어도 하나의 요면체들, 블랙 패스들, 화이트 패스들, 블랙 및 화이트 패스들, 형상측정들, 연결요소 모집단들, 경계박스 종횡비, 경계박스영역 모집단들, 연결요소위치들 및 연결요소 투영윤곽들을 포함하는 것이 특징인 자동문자 스크립트 판정장치.
- 제1항에 있어서, 적어도 하나의 소정형의 스크립트 특징은 상향개방 요면체인 것이 특징인 자동문자 스크립트 판정장치.
- 제3항에 있어서, 상기 공간분포 판정수단은 각 상응하는 경계박스에 상관하는 원고부분의 상향개방요면체들의 수직분포를 판정하는 것이 특징인 자동문자 스크립트 판정장치.
- 제3항에 있어서, 상기 공간분포 판정수단은 복수의 연결요소들중 상응하는 것의 중심에 상관하는 상향개방 요면체들의 수직분포를 판정하는 것이 특징인 자동문자 스크립트 판정장치.
- 제1항에 있어서, 상기 적어도 하나의 소정형의 스크립트 특징은 블랙패스인 것이 특징인 자동문자 스크립트 판정장치.
- 제6항에 있어서, 상기 공간분포 판정수단은 각각의 연결요소에 대해 상응하는 경계박스에 상관하는 블랙패스들의 수직분포를 판정하는 것이 특징인 자동문자 스크립트 판정장치.
- 제7항에 있어서, 상기 공간분포 판정수단은 각각의 연결요소의 중심에 상관하는 블랙패스들의 수직분포를 판정하는 것이 특징인 자동문자 스크립트 판정장치.
- 제1항에 있어서, 상기 공간분포 판정수단은 각각의 연결요소마다 상응하는 경계박스에 상관하는 적어도 하나의 소정의 스크립트 특징의 공간분포를 판정하는 것이 특징인 자동문자 스크립트 판정장치.
- 제9항에 있어서, 상기 공간분포 판정수단은 상응하는 연결요소의 중심에 상관하는 적어도 하나의 소정의 스크립트 특징의 공간분포를 판정하는 것이 특징인 자동문자 스크립트 판정장치.
- 복수의 화소들을 포함하는 화상을 포함하며, 원고부분을 갖는 문서의 스크립트형을 판정하는 자동 스크립트 판정장치에 있어서, 원고부분을 나타내는 디지탈 데이타 신호를 입력하기 위한 수단으로서, 상기 디지탈 데이타 신호는 복수의 신호부분들을 포함하며, 각 신호부분은 상기 복수의 화소들중 하나에 상응하는 입력수단과, 상기 복수의 신호부분들로부터 복수의 연결요소들을 발생하기 위한 연결요소 발생수단과, 적어도 하나의 연결요소에 근거하여 적어도 하나의 소정형의 스크립트 특징에 상응하는 원고부분내의 스크립트 특징들을 확인하는 특징판정수단과, 상기 확인된 스크립트 특징들의 분포를 적어도 하나의 소정형의 스크립트 특징분포와 비교하여 그 비교결과에 따라 원고부분의 스크립트형을 판정하는 스크립트 판정수단을 포함하는 것이 특징인 자동문자 스크립트 판정장치.
- 제11항에 있어서, 적어도 하나의 소정형의 스크립트 특징은 복수의 연결요소들내의 상향개방 요면체들인 것이 특징인 자동문자 스크립트 판정장치.
- 제11항에있어서, 상기 특징판정수단은 복수의 연결요소들의 개개마다 복수의 신호부분들의 경계박스를 판정하는 경계박스 판정수단을 포함하는 것이 특징인 자동문자 스크립트 판정장치.
- 제13항에 있어서, 적어도 하나의 소정형의 스크립트 특징은 복수의 연결요소들의 경계박스들내의 블랙패스들인 것이 특징인 자동문자 스크립트 판정장치.
- 제13항에 있어서, 상기 특징판정수단은 각각의 경계박스마다 중심을 판정하는 중심판정수단과, 각각의 경계박스의 중심에 상관하는 각각의 경계박스내에 확인된 스크립트 특징들을 위치시키는 특징위치 수단을 더 포함하는 것이 특징인 자동문자 스크립트 판정장치.
- 제15항에 있어서, 상기 스크립트 판정수단은 중심에 맞춰위치된 특징들의 공간분포를 판정하는 공간 분포 수단을 포함하는 것이 특징인 자동문자 스크립트 판정장치.
- 제16항에 있어서, 상기 적어도 하나의 소정형의 스크립트 특징은 복수의 연결요소들의 상향개방 요면체들을 포함하는 것이 특징인 자동문자 스크립트 판정장치.
- 제16항에 있어서, 상기 적어도 하나의 소정형의 스크립트 특징은 복수의 연결요소들의 경계박스들내의 블랙패스들을 포함하는 것이 특징인 자동문자 스크립트 판정장치.
- 제11항에 있어서, 상기 적어도 하나의 소정형의 스크립트 특징은 연결요소 요면체들, 블랙패스들, 화이트패스들, 블랙 및 화이트 패스들, 형상측정들 연결요소 모집단들, 경계박스 종횡비들, 경계박스 영역 모집단들, 연결요소위치들 및 연결요소 투영윤곽들중 적어도 하나를 포함하는 것이 특징인 자동문자 스크립트 판정장치.
- 문서의 원고부분의 스크립트형을 자동판정하는 방법에 있어서, 상기 원고부분을 포함하는 복수의 화소들로부터 복수의 연결요소들을 판정하는 단계와, 적어도 하나의 기선택된 스크립트형의 특징에 상응하는 복수의 연결요소들에 근거하여 원고부분의 스크립트 특징들의 위치들을 판정하는 단계와, 위치된 스크립트 특징들의 공간분포를 적어도 하나의 소정 스크립트 특징 공간분포와 비교하는 단계와, 상기 비교에 근거하여 상기 스크립트형을 판정하는 단계를 포함하는 것이 특징인 자동문자 스크립트 판정방법.
- 제20항에 있어서, 상기 적어도 하나의 기선택된 스크립트 특징은 복수의 연결요소들내의 상향개방 요면체들인 것이 특징인 자동문자 스크립트 판정방법.
- 제20항에 있어서, 상기 스크립트 특징의 위치들을 판정하는 단계는 상기 복수의 연결요소들 각각마다 상기한 연결요소를 둘러싸는 상응하는 경계박스를 판정하는 단계와, 각각의 상응하는 경계박스마다 중심을 판정하는 단계와, 상기 상응하는 경계박스의 중심에 상관하는 복수의 연결요소들 각각마다의 스크립트 특징들을 위치시키는 단계를 포함하는 것이 특징인 자동문자 스크립트 판정방법.
- 제22항에 있어서, 상기 적어도 하나의 기선택된 스크립트 특징은 각각의 경계박스내의 블랙패스인 것이 특징인 자동문자 스크립트 판정방법.
- 제20항에 있어서, 상기 적어도 하나의 기선택된 스크립트 특징으로서, 연결요소 요면체들, 블랙패스들, 화이트패스들, 블랙 및 화이트 패스들, 형상측정들, 연결요소 모집단들, 경계박스 종횡비들, 경계박스영역 모집단들, 연결요소위치들 및 연결요소 투영윤곽들을 포함하는 구룹으로부터 적어도 하나의 스크립트 특징을 선택하는 단계를 더 포함하는 것이 특징인 자동문자 스크립트 판정방법.※ 참고사항 : 최초출원 내용에 의하여 공개하는 것임.
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US08/047,515 US5444797A (en) | 1993-04-19 | 1993-04-19 | Method and apparatus for automatic character script determination |
US08/047,515 | 1993-04-19 | ||
US8/047,515 | 1993-04-19 |
Publications (2)
Publication Number | Publication Date |
---|---|
KR940024626A true KR940024626A (ko) | 1994-11-18 |
KR970002421B1 KR970002421B1 (ko) | 1997-03-05 |
Family
ID=21949410
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1019940004752A KR970002421B1 (ko) | 1993-04-19 | 1994-03-11 | 자동문자 스크립트 판정방법 및 장치 |
Country Status (6)
Country | Link |
---|---|
US (1) | US5444797A (ko) |
EP (1) | EP0621552B1 (ko) |
JP (1) | JPH0721320A (ko) |
KR (1) | KR970002421B1 (ko) |
DE (1) | DE69423926T2 (ko) |
TW (1) | TW248600B (ko) |
Families Citing this family (29)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
DE69435133D1 (de) * | 1993-12-10 | 2008-10-09 | Ricoh Kk | Bildextrahierungsverfahren und Gerät, und Bilderkennungsverfahren und Gerät, zum Extrahieren und Erkennen eines bestimmten Bildes aus einem Bildeingabesignal |
US5699453A (en) * | 1994-09-30 | 1997-12-16 | Xerox Corporation | Method and apparatus for logically tagging of document elements in the column by major white region pattern matching |
US5757963A (en) * | 1994-09-30 | 1998-05-26 | Xerox Corporation | Method and apparatus for complex column segmentation by major white region pattern matching |
JP3400151B2 (ja) * | 1994-12-08 | 2003-04-28 | 株式会社東芝 | 文字列領域抽出装置および方法 |
DK0807297T3 (da) * | 1995-01-31 | 2000-04-10 | United Parcel Service Inc | Fremgangsmåde og anordning til adskillelse af forgrund fra baggrund i billeder, der indeholder tekst |
US5844991A (en) * | 1995-08-07 | 1998-12-01 | The Regents Of The University Of California | Script identification from images using cluster-based templates |
US5848191A (en) * | 1995-12-14 | 1998-12-08 | Xerox Corporation | Automatic method of generating thematic summaries from a document image without performing character recognition |
US5892842A (en) * | 1995-12-14 | 1999-04-06 | Xerox Corporation | Automatic method of identifying sentence boundaries in a document image |
US5850476A (en) * | 1995-12-14 | 1998-12-15 | Xerox Corporation | Automatic method of identifying drop words in a document image without performing character recognition |
JP2738383B2 (ja) * | 1996-02-29 | 1998-04-08 | 日本電気株式会社 | 宛名読み取り装置 |
US5955506A (en) * | 1996-04-03 | 1999-09-21 | Centaur Pharmaceuticals, Inc. | Benzamides for neurodegenerative disorder treatment |
US5909510A (en) * | 1997-05-19 | 1999-06-01 | Xerox Corporation | Method and apparatus for document classification from degraded images |
US6005986A (en) * | 1997-12-03 | 1999-12-21 | The United States Of America As Represented By The National Security Agency | Method of identifying the script of a document irrespective of orientation |
US6064767A (en) * | 1998-01-16 | 2000-05-16 | Regents Of The University Of California | Automatic language identification by stroke geometry analysis |
JP4320064B2 (ja) * | 1998-07-10 | 2009-08-26 | 富士通株式会社 | 画像処理装置及び記録媒体 |
EP1393148B1 (en) | 2001-05-02 | 2010-03-03 | Bitstream Inc. | Methods, systems, and programming for producing and displaying subpixel-optimized font bitmaps using non-linear color balancing |
DE10126835B4 (de) * | 2001-06-01 | 2004-04-29 | Siemens Dematic Ag | Verfahren und Vorrichtung zum automatischen Lesen von Adressen in mehr als einer Sprache |
US7020338B1 (en) | 2002-04-08 | 2006-03-28 | The United States Of America As Represented By The National Security Agency | Method of identifying script of line of text |
US20040183817A1 (en) * | 2002-12-03 | 2004-09-23 | Bitstream Inc. | Methods, systems, and programming for scaled display of web pages |
US7512273B2 (en) * | 2004-10-21 | 2009-03-31 | Microsoft Corporation | Digital ink labeling |
JP2006253842A (ja) * | 2005-03-08 | 2006-09-21 | Ricoh Co Ltd | 画像処理装置、画像形成装置、プログラム、記憶媒体および画像処理方法 |
US7796837B2 (en) * | 2005-09-22 | 2010-09-14 | Google Inc. | Processing an image map for display on computing device |
JP5139716B2 (ja) * | 2007-05-16 | 2013-02-06 | キヤノン株式会社 | 画像検索装置及び画像検索方法 |
US8340430B2 (en) * | 2007-07-10 | 2012-12-25 | Sharp Laboratories Of America, Inc. | Methods and systems for identifying digital image characteristics |
US8160365B2 (en) * | 2008-06-30 | 2012-04-17 | Sharp Laboratories Of America, Inc. | Methods and systems for identifying digital image characteristics |
US8744171B1 (en) | 2009-04-29 | 2014-06-03 | Google Inc. | Text script and orientation recognition |
US7965894B2 (en) * | 2009-06-30 | 2011-06-21 | Konica Minolta Systems Laboratory, Inc. | Method for detecting alterations in printed document using image comparison analyses |
US8151186B1 (en) * | 2011-03-11 | 2012-04-03 | Google Inc. | Comparing text pages using image features based on word positions |
US20170068868A1 (en) * | 2015-09-09 | 2017-03-09 | Google Inc. | Enhancing handwriting recognition using pre-filter classification |
Family Cites Families (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US3755780A (en) * | 1971-06-28 | 1973-08-28 | Pattern Analysis & Recognition | Method for recognizing characters |
JPS5837779A (ja) * | 1981-08-31 | 1983-03-05 | Ricoh Co Ltd | 文書処理装置 |
JPS58222384A (ja) * | 1982-06-18 | 1983-12-24 | Ricoh Co Ltd | フオント識別方式 |
JPS5960574A (ja) * | 1982-09-30 | 1984-04-06 | Fujitsu Ltd | 文字認識方式 |
US4802230A (en) * | 1987-03-13 | 1989-01-31 | Gtx Corporation | Method and apparatus for generating size and orientation invariant shape features |
JPS63261486A (ja) * | 1987-04-20 | 1988-10-28 | Nec Corp | 書体識別装置 |
US5048100A (en) * | 1988-12-15 | 1991-09-10 | Michael Kuperstein | Self organizing neural network method and system for general classification of patterns |
US5181259A (en) * | 1990-09-25 | 1993-01-19 | The United States Of America As Represented By The Administrator Of The National Aeronautics And Space Administration | General method of pattern classification using the two domain theory |
US5253307A (en) * | 1991-07-30 | 1993-10-12 | Xerox Corporation | Image analysis to obtain typeface information |
JPH0540846A (ja) * | 1991-08-06 | 1993-02-19 | Oki Electric Ind Co Ltd | 文書画像の和文・欧文判定方法 |
-
1993
- 1993-04-19 US US08/047,515 patent/US5444797A/en not_active Expired - Lifetime
-
1994
- 1994-03-11 KR KR1019940004752A patent/KR970002421B1/ko not_active IP Right Cessation
- 1994-04-08 JP JP6070295A patent/JPH0721320A/ja not_active Withdrawn
- 1994-04-11 TW TW083103166A patent/TW248600B/zh active
- 1994-04-18 DE DE69423926T patent/DE69423926T2/de not_active Expired - Lifetime
- 1994-04-18 EP EP94302739A patent/EP0621552B1/en not_active Expired - Lifetime
Also Published As
Publication number | Publication date |
---|---|
KR970002421B1 (ko) | 1997-03-05 |
TW248600B (ko) | 1995-06-01 |
EP0621552B1 (en) | 2000-04-12 |
JPH0721320A (ja) | 1995-01-24 |
DE69423926T2 (de) | 2000-08-17 |
EP0621552A3 (en) | 1995-05-17 |
US5444797A (en) | 1995-08-22 |
DE69423926D1 (de) | 2000-05-18 |
EP0621552A2 (en) | 1994-10-26 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR940024626A (ko) | 자동문자 스크립트 판정방법 및 장치 | |
KR960015594B1 (ko) | 아시아어 자동판정방법 및 장치 | |
US4300123A (en) | Optical reading system | |
KR100394202B1 (ko) | 화상 보정 장치 | |
US5642202A (en) | Scan image target locator system for calibrating a printing system | |
JP2000196879A (ja) | 画像パラメ―タを表示する方法および装置 | |
KR920005020A (ko) | 수서 정보의 기계적 판독을 위한 개선된 분할 프로세스 | |
US5659404A (en) | Image reading apparatus for reading book-like documents | |
KR960002545B1 (ko) | 프린트기판상의 랜드의 최소고리폭 검사 방법 및 장치 | |
KR100668029B1 (ko) | 탄성 모델을 이용한 인쇄 품질의 자동 검사 방법 | |
DE102005041304B4 (de) | Automatisches Objektebenenerfassungssystem und -Verfahren | |
EP0719032A2 (en) | Apparatus for reading image and method therefor | |
US20100085611A1 (en) | Image processing apparatus, image forming apparatus and image processing method | |
JP5757931B2 (ja) | 画像処理装置および画像読取装置 | |
US5034825A (en) | High quality image scanner | |
KR100260923B1 (ko) | 화상의 국부 이치화 장치 및 방법 | |
Boiangiu et al. | Target Validation and Image Color Calibration | |
JPH0480885A (ja) | カラー画像形成装置 | |
JPS6310277A (ja) | 画質検査装置 | |
JPS6343037B2 (ko) | ||
JPH04331563A (ja) | 画像読み取り装置 | |
JPS629956B2 (ko) | ||
KR930000935A (ko) | 패턴 인식 장치 | |
JPS63179748A (ja) | 階調記録方式 | |
KR970019538A (ko) | 칼라 디스플레이의 색번짐 식별방법 및 상기 방법에 의한 자동식별장치 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A201 | Request for examination | ||
E902 | Notification of reason for refusal | ||
G160 | Decision to publish patent application | ||
E701 | Decision to grant or registration of patent right | ||
GRNT | Written decision to grant | ||
FPAY | Annual fee payment |
Payment date: 20000222 Year of fee payment: 4 |
|
LAPS | Lapse due to unpaid annual fee |