KR100923935B1 - Ocr을 위한 문서 영상의 자동 평가 방법 및 시스템 - Google Patents
Ocr을 위한 문서 영상의 자동 평가 방법 및 시스템 Download PDFInfo
- Publication number
- KR100923935B1 KR100923935B1 KR1020070121819A KR20070121819A KR100923935B1 KR 100923935 B1 KR100923935 B1 KR 100923935B1 KR 1020070121819 A KR1020070121819 A KR 1020070121819A KR 20070121819 A KR20070121819 A KR 20070121819A KR 100923935 B1 KR100923935 B1 KR 100923935B1
- Authority
- KR
- South Korea
- Prior art keywords
- document image
- character
- image
- scanner
- degree
- Prior art date
Links
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N1/00—Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
- H04N1/00795—Reading arrangements
- H04N1/00798—Circuits or arrangements for the control thereof, e.g. using a programmed control device or according to a measured quantity
- H04N1/00822—Selecting or setting a particular reading mode, e.g. from amongst a plurality of modes, simplex or duplex, or high or low resolution
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Character Input (AREA)
- Character Discrimination (AREA)
Abstract
Description
Claims (18)
- 문자가 포함된 이미지 파일인 문서 영상에 대하여 OCR(Optical Character Recognition) 기술을 사용하여 인식 과정을 수행하기 전에 문자에 대한 예상 인식률을 구하기 위한 방법으로서,(a) 상기 OCR의 문자 인식률과 관련된 상기 문서 영상의 속성을 나타내는 적어도 하나의 특징 데이터를 상기 문서 영상으로부터 추출하고, 상기 추출된 특징 데이터마다 상기 특징 데이터가 상기 OCR에 의한 문자 인식에 있어서 어느 정도 적합한 상태인지를 수치화한 항목별 점수를 획득하는 단계,(b) 상기 항목별 점수마다 가중치 - 상기 가중치는 상기 특징 데이터의 속성 자체가 상기 문서 영상에 대한 문자 인식을 행함에 있어서 영향력이 클수록 큰 수치로 결정됨 - 를 적용하는 단계, 및(c) 상기 가중치가 적용된 항목별 점수를 가산하여 상기 예상 인식률을 제공하는 단계를 포함하는 방법.
- 삭제
- 제1항에 있어서,상기 문서 영상은,디지털 데이터가 아닌 원본문서를 스캐닝하여 생성되는 것을 특징으로 하는 방법.
- 제1항에 있어서,(d) 상기 예상 인식률 및 상기 항목별 점수를 참조로, 상기 문서 영상을 재생성하기 위한 스캐너가 재설정되는 단계를 더 포함하는 것을 특징으로 하는 방법.
- 제1항에 있어서,(d) 상기 예상 인식률 및 상기 항목별 점수에 따라 스캐너를 재설정하도록 사용자에게 스캐너 제어 방법을 제시하는 단계를 더 포함하는 것을 특징으로 하는 방법.
- 제4항 또는 제5항에 있어서,상기 스캐너의 재설정은 상기 스캐너의 자동급지장치에 대한 제어, 상기 스캐너의 밝기에 대한 조정, 상기 스캐너의 해상도에 대한 조정 중 적어도 하나를 포함하는 것을 특징으로 하는 방법.
- 제1항에 있어서,(d) 상기 예상 인식률이 기설정된(predetermined) 임계값 이상이면, OCR 과정이 수행되는 단계를 더 포함하는 것을 특징으로 하는 방법.
- 제1항에 있어서,(d) 상기 예상 인식률이 사용자에게 제공된 후, 상기 사용자로부터 OCR 과정 수행 여부에 대한 판단을 입력 받는 단계를 더 포함하는 것을 특징으로 하는 방법.
- 제1항에 있어서,상기 (a) 단계에서,상기 특징 데이터는 영상의 기울기 정도(skew), 영상의 이진화시 클러스터링 반복 정도(BI), 영상에 포함된 잡음의 비율(NR), 영상의 텍스트 영역의 설정 정도(ZD), 텍스트 영역에서의 문자분할 정도(SD), 문자분할영역에서의 명도대비 정도(SC), 문자 세선화 과정에서의 반복 정도(TI), ‘ㅇ’과 같은 루프 문자의 크기(SLC) 중 적어도 어느 하나를 포함하는 것을 특징으로 하는 방법.
- 제9항에 있어서,상기 문서 영상의 기울기 정도(skew)는 상기 문서 영상의 4 부분(Left, Right, Top, Bottom)의 각도를 검출하고 이들 각도의 평균을 참조하여 판단되는 것을 특징으로 하는 방법.
- 제9항에 있어서,상기 문서 영상의 이진화시 클러스터링 반복 정도(BI)는 FBC를 이용한 이진화 과정에서 클러스터링 반복 횟수를 참조하여 판단되는 것을 특징으로 하는 방법.
- 제9항에 있어서,상기 문서 영상에 포함된 잡음의 비율(NR)은 상기 문서 영상의 전체 영상 중 잡음이 차지하는 비율을 참조하여 판단되는 것을 특징으로 하는 방법.
- 제9항에 있어서,상기 문서 영상의 텍스트 영역의 설정 정도(ZD)는 상기 문서 영상의 분류 결과 설정된 영역의 폭과 높이가 기준치 이하인 영역들이 전체 영역에서 차지하는 비율을 참조하여 판단되는 것을 특징으로 하는 방법.
- 제9항에 있어서,상기 문서 영상의 텍스트 영역에서의 문자분할 정도(SD)는,상기 텍스트 영역에서 문자 분할을 수행한 후, 상기 분할된 문자 영역의 폭 또는 높이가 상기 문서 영상에 포함된 문자의 평균 글자 폭 또는 높이와 비교하여 기설정된 임계치 이상의 차이를 보이면 비정상적인 문자 분할 영역으로 판단한다고 할 때, 상기 비정상적인 문자 분할 영역의 비율을 참조하여 판단되는 것을 특징으로 하는 방법.
- 제9항에 있어서,상기 문서 영상의 문자 세선화 과정에서의 반복 정도(TI)는,문자의 두께를 1로 만들기 위해 반복되는 세선화의 횟수를 참조하여 판단되는 것을 특징으로 하는 방법.
- 제9항에 있어서,상기 문서 영상의 루프 문자의 크기(SLC)는,문자를 연결요소(connected component) 분석을 통해 자소 단위로 분할하여 상기 루프 부분을 추출한 후 판단되는 것을 특징으로 하는 방법.
- 제1항, 제3항 내지 제5항, 및 제7항 내지 제17항 중 어느 한 항에 따른 방법을 실행하기 위한 컴퓨터 프로그램을 기록하는 컴퓨터 판독 가능 매체.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020070121819A KR100923935B1 (ko) | 2007-11-28 | 2007-11-28 | Ocr을 위한 문서 영상의 자동 평가 방법 및 시스템 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020070121819A KR100923935B1 (ko) | 2007-11-28 | 2007-11-28 | Ocr을 위한 문서 영상의 자동 평가 방법 및 시스템 |
Publications (2)
Publication Number | Publication Date |
---|---|
KR20090055087A KR20090055087A (ko) | 2009-06-02 |
KR100923935B1 true KR100923935B1 (ko) | 2009-10-29 |
Family
ID=40986806
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020070121819A KR100923935B1 (ko) | 2007-11-28 | 2007-11-28 | Ocr을 위한 문서 영상의 자동 평가 방법 및 시스템 |
Country Status (1)
Country | Link |
---|---|
KR (1) | KR100923935B1 (ko) |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US10719178B2 (en) | 2017-08-03 | 2020-07-21 | Samsung Electronics Co., Ltd. | Fingerprint recognizing sensor and touch screen device including the same |
US10824893B2 (en) | 2017-08-16 | 2020-11-03 | Samsung Electronics Co., Ltd. | Method of evaluating performance of bio-sensor, authentication method using bio-image, and electronic apparatus adopting the authentication method |
KR20220013187A (ko) * | 2020-07-24 | 2022-02-04 | 엄춘호 | 문서 인식 시스템 및 방법 |
KR20220088569A (ko) * | 2020-12-18 | 2022-06-28 | 동국대학교 산학협력단 | 신경망 기반 디지털 문서의 위아래 방향 판단 장치 및 방법 |
Families Citing this family (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112149673A (zh) * | 2020-08-18 | 2020-12-29 | 新丰电器(深圳)有限公司 | 一种基于光学识别技术的多功能测试机架 |
CN112434668A (zh) * | 2020-12-14 | 2021-03-02 | 北京一起教育科技有限责任公司 | 一种评价整洁度的方法、装置及电子设备 |
KR20220089872A (ko) * | 2020-12-22 | 2022-06-29 | 주식회사 펍플 | 디지털 변환 콘텐츠 검수방법 및 장치 |
CN117877038B (zh) * | 2024-03-12 | 2024-06-04 | 金现代信息产业股份有限公司 | 基于文字检测的文档图像纠偏方法、系统、设备及介质 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR100242458B1 (ko) * | 1993-12-21 | 2000-02-01 | 고오노 모토히로 | 패턴인식 방법 및 장치와 패턴인식 사전을 작성하는 방법 |
KR100313991B1 (ko) * | 1993-07-12 | 2002-02-19 | 구자홍 | 문서영상의기울기검출방법 |
-
2007
- 2007-11-28 KR KR1020070121819A patent/KR100923935B1/ko active IP Right Grant
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR100313991B1 (ko) * | 1993-07-12 | 2002-02-19 | 구자홍 | 문서영상의기울기검출방법 |
KR100242458B1 (ko) * | 1993-12-21 | 2000-02-01 | 고오노 모토히로 | 패턴인식 방법 및 장치와 패턴인식 사전을 작성하는 방법 |
Cited By (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US10719178B2 (en) | 2017-08-03 | 2020-07-21 | Samsung Electronics Co., Ltd. | Fingerprint recognizing sensor and touch screen device including the same |
US10976875B2 (en) | 2017-08-03 | 2021-04-13 | Samsung Electronics Co., Ltd. | Fingerprint recognizing sensor and touch screen device including the same |
US10824893B2 (en) | 2017-08-16 | 2020-11-03 | Samsung Electronics Co., Ltd. | Method of evaluating performance of bio-sensor, authentication method using bio-image, and electronic apparatus adopting the authentication method |
KR20220013187A (ko) * | 2020-07-24 | 2022-02-04 | 엄춘호 | 문서 인식 시스템 및 방법 |
KR102391068B1 (ko) * | 2020-07-24 | 2022-04-28 | 엄춘호 | 문서 인식 시스템 및 방법 |
KR20220088569A (ko) * | 2020-12-18 | 2022-06-28 | 동국대학교 산학협력단 | 신경망 기반 디지털 문서의 위아래 방향 판단 장치 및 방법 |
KR102455883B1 (ko) * | 2020-12-18 | 2022-10-19 | 동국대학교 산학협력단 | 신경망 기반 디지털 문서의 위아래 방향 판단 장치 및 방법 |
Also Published As
Publication number | Publication date |
---|---|
KR20090055087A (ko) | 2009-06-02 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR100923935B1 (ko) | Ocr을 위한 문서 영상의 자동 평가 방법 및 시스템 | |
US10552705B2 (en) | Character segmentation method, apparatus and electronic device | |
US11004194B2 (en) | Inspection device, image forming apparatus, and inspection method | |
US20070253040A1 (en) | Color scanning to enhance bitonal image | |
US7715628B2 (en) | Precise grayscale character segmentation apparatus and method | |
US8331670B2 (en) | Method of detection document alteration by comparing characters using shape features of characters | |
US20080199082A1 (en) | Method and apparatus for recognizing boundary line in an image information | |
KR20190088089A (ko) | 용접 표면 결점 검출 장치 및 방법 | |
JP6075190B2 (ja) | 画像処理方法及び装置 | |
CN106326895B (zh) | 图像处理装置和图像处理方法 | |
JP2002133426A (ja) | 多値画像から罫線を抽出する罫線抽出装置 | |
Kumar et al. | Power-law transformation for enhanced recognition of born-digital word images | |
RU2581786C1 (ru) | Определение преобразований изображения для повышения качества оптического распознавания символов | |
CN103093185B (zh) | 字符识别装置、图像处理装置及其方法 | |
KR20210005690A (ko) | 정보 처리 장치, 정보 처리 방법, 컴퓨터 프로그램 | |
KR20170087817A (ko) | 얼굴 검출 방법 및 장치 | |
KR102167433B1 (ko) | 다중 패턴 문자 영상 자동 생성 기반 문자 인식 장치 및 그 방법 | |
US8891822B2 (en) | System and method for script and orientation detection of images using artificial neural networks | |
JPH10307889A (ja) | 文字認識方法、装置及び文字認識プログラムを記録した記録媒体 | |
JP3215163B2 (ja) | 罫線識別方法及び領域識別方法 | |
JP5424694B2 (ja) | 画像認識装置、及びプログラム | |
JP2007206963A (ja) | 画像処理装置及び画像処理方法及びプログラム及び記憶媒体 | |
CN113537253A (zh) | 一种红外图像目标检测方法、装置、计算设备及存储介质 | |
US8903175B2 (en) | System and method for script and orientation detection of images | |
JP2009259190A (ja) | 文字認識プログラムおよび文字認識装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A201 | Request for examination | ||
E902 | Notification of reason for refusal | ||
E701 | Decision to grant or registration of patent right | ||
GRNT | Written decision to grant | ||
FPAY | Annual fee payment |
Payment date: 20121011 Year of fee payment: 4 |
|
FPAY | Annual fee payment |
Payment date: 20130926 Year of fee payment: 5 |
|
FPAY | Annual fee payment |
Payment date: 20140925 Year of fee payment: 6 |
|
FPAY | Annual fee payment |
Payment date: 20151008 Year of fee payment: 7 |
|
FPAY | Annual fee payment |
Payment date: 20161010 Year of fee payment: 8 |
|
FPAY | Annual fee payment |
Payment date: 20181008 Year of fee payment: 10 |
|
FPAY | Annual fee payment |
Payment date: 20191001 Year of fee payment: 11 |