KR100247970B1 - 문서 영상의 방향 교정방법 - Google Patents

문서 영상의 방향 교정방법 Download PDF

Info

Publication number
KR100247970B1
KR100247970B1 KR1019970032913A KR19970032913A KR100247970B1 KR 100247970 B1 KR100247970 B1 KR 100247970B1 KR 1019970032913 A KR1019970032913 A KR 1019970032913A KR 19970032913 A KR19970032913 A KR 19970032913A KR 100247970 B1 KR100247970 B1 KR 100247970B1
Authority
KR
South Korea
Prior art keywords
reliability
document
character
recognition reliability
average
Prior art date
Application number
KR1019970032913A
Other languages
English (en)
Other versions
KR19990010215A (ko
Inventor
정성우
Original Assignee
윤종용
삼성전자주식회사
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 윤종용, 삼성전자주식회사 filed Critical 윤종용
Priority to KR1019970032913A priority Critical patent/KR100247970B1/ko
Priority to CN98105597A priority patent/CN1108582C/zh
Priority to US09/042,649 priority patent/US6169822B1/en
Priority to JP10070615A priority patent/JPH1139428A/ja
Publication of KR19990010215A publication Critical patent/KR19990010215A/ko
Application granted granted Critical
Publication of KR100247970B1 publication Critical patent/KR100247970B1/ko

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/20Image preprocessing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/20Image preprocessing
    • G06V10/24Aligning, centring, orientation detection or correction of the image
    • G06V10/242Aligning, centring, orientation detection or correction of the image by image rotation, e.g. by 90 degrees

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Character Input (AREA)

Abstract

본 발명은 문서 영상의 방향 교정 방법에 관한 것으로서, 특히 문자 인식을 이용하여 방향이 틀린 문서를 자동으로 교정해주는 방법에 관한 것이다. 본 발명의 목적을 위하여 상기 문서 영상에서 문자 영역의 일정 부분을 검출하는 제1과정; 상기 제1과정의 문자 영역중 일정 부분의 인식 신뢰도에 따라서 문서의 기울기를 결정하는 제2과정; 상기 제2과정에서 결정된 기울기 만큼 문서를 회전하여 문자 인식하는 제3과정을 포함한다. 본 발명에 의하면, 문서 인식기에서 방향이 틀린 문서를 자동으로 교정해줌으로서 많은 양의 문서를 자동으로 처리할 수가 있고 문서 영상을 인지할 수 없는 시각 장애인들도 문서 인식을 올바르게 인식할 수있다.

Description

문서 영상의 방향 교정 방법{Direction correction method of document image}
본 발명은 문서 영상의 방향 교정 방법에 관한 것으로서, 특히 문자 인식을 이용하여 방향이 틀린 문서를 자동으로 교정해주는 방법에 관한 것이다.
일반적으로 스캐너(Scanner), 카메라등의 영상 입력 장치를 통해 문서 영상을 읽고, 컴퓨터를 이용하여 문자 영역에서 문자를 추출, 인식하여 텍스트 정보를 얻는 것을 문자 인식이라한다. 그러나 문서 영상의 문자 인식을 함에 있어 종종 문서 영상 방향이 위, 아래가 바뀌거나 좌우 90도 만큼 돌아간 경우가 있다. 이러한 경우 기존에는 사용자가 직접 문서의 방향을 먼저 수작업으로 교정한 후 문자 인식을 다시 시작해야 하며, 또한 방향이 틀린 영상 문서를 포함한 많은 양의 문서를 자동으로 처리할 경우 방향이 틀린 영상 문서의 내용은 인식할 수 없다는 문제점이 있었다.
본 발명이 이루고자하는 기술적과제는 방향이 틀린 영상 문서를 자동으로 교정함으로써 많은 양의 문서를 자동으로 처리할 수가 있고 문서의 방향을 틀리게 입력해도 문서 인식을 수행 할 수 있는 방법을 제공하는 데있다.
도 1은 본 발명에 따른 문서 영상의 방향 교정 장치의 블록도이다.
도 2는 도 1의 문서 각도 인식부에서의 문서 영상의 방향 교정 방법을 보이는 흐름도이이다.
상기의 기술적 과제를 해결하기 위하여 본 발명은 문서 영상중 문서 각도를 자동으로 인식하는 방법에 있어서, 상기 문서 영상에서 문자 영역의 일정 부분을 검출하는 제1과정; 상기 제1과정의 문자 영역중 일정 부분의 인식 신뢰도에 따라서 문서의 기울기를 결정하는 제2과정; 상기 제2과정에서 결정된 기울기 만큼 문서를 회전하여 문자 인식하는 제3과정을 포함하는 것을 특징으로 하는 문서 영상의 방향 교정 방법이다.
이하에서 첨부된 도면을 첨부하여 본 발명의 바람직한 실시예를 상세히 설명한다.
도 1은 본 발명에 따른 문서 영상의 방향 교정 장치의 블록도이며, 문서 영상을 입력하는 스캐너부(110), 입력된 문서 영상을 저장하는 제1메모리부(120), 문서 구조 분석부(124), 문서 영상의 각도를 인식하는 문서 각도 인식부(130), 인식된 문서 영상을 저장하는 제2메모리부(140)로 이루어진다.
도 2는 도 1의 문서 각도 인식부에서의 문서 영상의 방향 교정 방법을 보이는 흐름도이이다.
도 1의 장치 및 도 2의 흐름도를 결합시켜 본 발명의 작용 및 효과를 설명하면 다음과 같다.
우선, 스캐너부(110)는 문서 영상의 전체 이미지를 읽어들이고, 제1메모리부(120)는 스캐너로 입력된 문서 영상을 저장한다. 문서 구조 분석부(124)는 제1메모리(120)에서 독출된 전체 이미지에서 텍스트 영역과 비텍스트 영역을 분석하며, 문서각도 인식부(130)는 텍스트 또는 문자 영역(R)의 일정 텍스트 부분(R') 즉, 문자열중 최소한 2줄이상을 인식하여 인식 신뢰도(인식의 정확성을 나타내는 수치)에 따라 문서의 방향(각도)을 자동으로 감지한다. 즉, 문서 영상에서 문자 영역의 일정 부분(R')을 검출한다(210과정). 여기서 인식 신뢰도는 통상적으로 문자 하나하나에 대한 수치화된 등급으로 표시된다. 예를 들면, 어떤 소정 영역(예를 들면 최소한 2줄이상)의 문자 영역이 판별되면 제1단계로서, 이 문자 영역에 대해서 문자 하나하나를 구획하여 검출하는 절출 처리를 행한다. 이것은 문자의 구형(블록)을 추출하며, 흑화소 연속성의 상태를 검출해서 구해진다. 제2단계로서, 1문자를 m×n(예를 들면 64×64)의 화소 블록으로 절출한다. 그래서 그중 3×3화소의 윈도우를 이용해서, 흑화소의 분포 방향을 추출한다. 또한 상기 3×3화소의 윈도우를 비켜가며 방향 정보를 수십개 얻는다. 이 벡터 정보가 문자의 특징으로 된다. 이 특징 벡터와 미리기억되어 있는 문자인식사서 내용을 비교해서 특징 벡터에 특징이 가장 근접한 문자로부터 순번으로 문자를 추출한다. 이 경우, 특징 벡터에 특징이 근접한 순번으로 제1후보, 제2후보,... 로 된다. 이 특징 벡터에 대한 특징 정도가 그 문자에 대한 거리의 정도, 즉 문자 인식신뢰도의 수치로된다.
다음 검출된 R'와 평균 인식 신뢰도(C1)와 인식 신뢰도에 대한 기준치(C)를 판별하여(212과정) C1이 C 이상이면 문서 영상의 기울기(d)를 0。로 판별하여 현재의 방향으로 전체 영상을 인식한다(214과정). 여기서 평균 인식 신뢰도(C1)는 R'에 포함되는 전체 문자 신뢰도의 합 / R'에 포함되는 전체 문자수이며, 문서 각도 인식부(130)는 인식 신뢰도에 대한 기준치를 실험에 의하여 정해 놓는다. 다음 C1이 C 이상이아니면 R'를 90。 회전한 후의 평균 인식 신뢰도(C2)와 C를 판별하며(216과정), C2가 C 이상이면 문서 영상의 기울기(d)를 90。로 판별하여 전체 영상을 90。 방향으로 인식한다(220과정). 다음 C2가 C 이상이아니면 R'를 180。 회전한 후의 평균 인식 신뢰도(C3)와 C를 판별하며(220과정), C3가 C 이상이면 문서 영상의 기울기(d)를 180。로 판별하여 전체 영상을 180。 방향으로 인식한다(220과정). 다음 C3가 C 이상이아니면 R'를 270。 회전한 후의 평균 인식 신뢰도(C4)와 C를 판별하며(224과정), C4가 C 이상이면 문서 영상의 기울기(d)를 270。로 판별하여 전체 영상을 270。 방향으로 인식한다(220과정). 다음 C4가 C 이상이 아니면 C1,C2,C3,C4중에서 가장 좋은 평균 신뢰도를 선택하여 해당하는 각도만큼 전체 영상을 회전하여 문서 영상의 각도로서 인식한다. 문서 각도 인식부(130)에서 방향이 교정된 문서 영상은 제2메모리(140)에 저장되어 최종적으로 문서로서 인식된다.
상술한 바와 같이 본 발명에 의하면, 문서 인식기에서 방향이 틀린 문서를 자동으로 교정해줌으로서 많은 양의 문서를 자동으로 처리할 수가 있고 문서 영상을 인지할 수 없는 시각 장애인들도 문서 인식을 올바르게 인식할 수 있다.

Claims (3)

  1. 문서 영상중 문서 각도를 자동으로 인식하는 방법에 있어서,
    상기 문서 영상에서 텍스트 영역의 일정 부분을 검출하는 제1과정;
    상기 제1과정의 문자 영역중 일정 부분의 인식 신뢰도와 기준인식신뢰도를 비교하여, 일정부분의 문자평균인식신뢰도가 기준 인식 신뢰도보다 크면 현재의 문서각도를 기울기로 결정하며, 또 문자평균인식신뢰도가 기준 인식 신뢰도보다 적으면 상기 일정부분을 소정각도만큼 회전시킨 후 그 일정 부분의 문자평균인식신뢰도와 기준 인식 신뢰도를 비교하는 제2과정;
    상기 제2과정에서 결정된 기울기 만큼 문서를 회전하여 문자 인식하는 제3과정을 포함하는 것을 특징으로 하는 문서 영상의 방향 교정 방법.
  2. 제1항에 있어서, 상기 제2과정은 일정부분의 문자평균인식신뢰도가 기준이되는 인식신뢰도보다 적으면 그 일정부분을 소정각도만큼 회전시킨 제1방향의 문자평균신뢰도가 기준되는 인식신뢰도보다 적은가 아닌가를 판정하며, 그 제1방향의 문자평균신뢰도가 기준되는 인식신뢰도보다 적다면 그 일정부분을 제1방향으로부터 소정각도만큼 회전시킨 제2방향의 문자평균신뢰도가 기준되는 인식신뢰도보다 적은가 아닌가를 판정하며, 그 제2방향의 문자평균신뢰도가 기준되는 인식신뢰도보다 적다면 그 일정부분을 제2방향으로부터 소정각도만큼 회전시킨 제3방향의 문자평균신뢰도가 기준되는 인식신뢰도보다 적은가 아닌가를 판정하며, 그 제3방향의 문자평균신뢰도가 기준되는 인식신뢰도보다 적다면 복수개의 기울기중에 평균인식신뢰도가 가장큰 각도를 기울기로 결정하는 과정을 더 포함하며,
    상기 일정부분의 문자평균인식신뢰도가 기준되는 인식신뢰도보다큰 방향을 판정한 시점에서, 그 각도를 기울기로 결정하여 상기 제3과정으로 진행하는 것을 것을 특징으로 하는 문서 영상의 방향 교정 방법.
  3. 제2항에 있어서, 상기 평균 인식 신뢰도는 문자 영역중 일정 부분에 포함되는 전체 문자 신뢰도의 합 ÷ 문자 영역중 일정 부분에 포함되는 전체 문자수임을 특징으로 하는 문서 영상의 방향 교정 방법.
KR1019970032913A 1997-07-15 1997-07-15 문서 영상의 방향 교정방법 KR100247970B1 (ko)

Priority Applications (4)

Application Number Priority Date Filing Date Title
KR1019970032913A KR100247970B1 (ko) 1997-07-15 1997-07-15 문서 영상의 방향 교정방법
CN98105597A CN1108582C (zh) 1997-07-15 1998-03-16 用于校正文件图像方向的方法
US09/042,649 US6169822B1 (en) 1997-07-15 1998-03-17 Method for correcting direction of document image
JP10070615A JPH1139428A (ja) 1997-07-15 1998-03-19 文書映像の方向修正方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1019970032913A KR100247970B1 (ko) 1997-07-15 1997-07-15 문서 영상의 방향 교정방법

Publications (2)

Publication Number Publication Date
KR19990010215A KR19990010215A (ko) 1999-02-05
KR100247970B1 true KR100247970B1 (ko) 2000-03-15

Family

ID=19514563

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1019970032913A KR100247970B1 (ko) 1997-07-15 1997-07-15 문서 영상의 방향 교정방법

Country Status (4)

Country Link
US (1) US6169822B1 (ko)
JP (1) JPH1139428A (ko)
KR (1) KR100247970B1 (ko)
CN (1) CN1108582C (ko)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100405636B1 (ko) * 2000-05-23 2003-11-15 이성환 시각 장애인용 착용 가능 보행 안내 장치 및 방법

Families Citing this family (26)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
RU2003108433A (ru) * 2003-03-28 2004-09-27 Аби Софтвер Лтд. (Cy) Способ предварительной обработки изображения машиночитаемой формы
US20110188759A1 (en) * 2003-06-26 2011-08-04 Irina Filimonova Method and System of Pre-Analysis and Automated Classification of Documents
JP4350414B2 (ja) 2003-04-30 2009-10-21 キヤノン株式会社 情報処理装置及び情報処理方法ならびに記憶媒体、プログラム
RU2635259C1 (ru) 2016-06-22 2017-11-09 Общество с ограниченной ответственностью "Аби Девелопмент" Способ и устройство для определения типа цифрового документа
JP2005311766A (ja) * 2004-04-22 2005-11-04 Fuji Xerox Co Ltd 画像読み取り装置
CN100382097C (zh) * 2004-08-10 2008-04-16 明基电通股份有限公司 文件倾斜角度的估算方法及其装置
CN100338618C (zh) * 2004-09-30 2007-09-19 致伸科技股份有限公司 一种倾斜图像自动校正方法
CN100361140C (zh) * 2005-12-14 2008-01-09 北京北大方正电子有限公司 一种检测文档扫描图像旋转角度和缩放比例的方法
US8144989B2 (en) * 2007-06-21 2012-03-27 Sharp Laboratories Of America, Inc. Methods and systems for identifying text orientation in a digital image
US8208725B2 (en) * 2007-06-21 2012-06-26 Sharp Laboratories Of America, Inc. Methods and systems for identifying text orientation in a digital image
US8340430B2 (en) * 2007-07-10 2012-12-25 Sharp Laboratories Of America, Inc. Methods and systems for identifying digital image characteristics
US8023741B2 (en) 2008-05-23 2011-09-20 Sharp Laboratories Of America, Inc. Methods and systems for detecting numerals in a digital image
US8023770B2 (en) 2008-05-23 2011-09-20 Sharp Laboratories Of America, Inc. Methods and systems for identifying the orientation of a digital image
US8160365B2 (en) * 2008-06-30 2012-04-17 Sharp Laboratories Of America, Inc. Methods and systems for identifying digital image characteristics
US20110176154A1 (en) * 2010-01-18 2011-07-21 Canon Kabushiki Kaisha Image processing apparatus, image processing method, and storage medium
CN101847209B (zh) * 2010-06-01 2012-06-06 福建新大陆电脑股份有限公司 一种字符图像校正方法
CN102855477B (zh) 2011-06-29 2014-12-17 富士通株式会社 识别图像块中文字的方向的方法和装置
CN102902947B (zh) * 2011-07-27 2015-05-27 阿里巴巴集团控股有限公司 一种图像识别显示方法、装置及用户设备
US9092667B2 (en) 2012-08-27 2015-07-28 Symbol Technologies, Llc Arrangement for and method of reading forms in correct orientation by image capture
CN103793903B (zh) * 2012-10-29 2018-07-27 方正国际软件(北京)有限公司 一种利用条形码识别的图像分割方法及系统
US9076058B2 (en) 2013-01-29 2015-07-07 Sharp Laboratories Of America, Inc. Methods, systems and apparatus for determining orientation in a document image
CN104915648B (zh) * 2015-06-02 2018-07-20 北京天创征腾信息科技有限公司 文档/单证方向检测方法和检测装置
KR102424691B1 (ko) * 2015-11-16 2022-07-26 삼성전자주식회사 조리장치 및 그 제어방법
CN105894526A (zh) * 2016-04-29 2016-08-24 广东小天才科技有限公司 图片的校正方法及装置
US10121250B2 (en) 2016-12-01 2018-11-06 International Business Machines Corporation Image orientation detection
CN107194397A (zh) * 2017-05-09 2017-09-22 珠海赛纳打印科技股份有限公司 卡片放置方向的识别方法、装置以及图像处理装置

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH06103411A (ja) * 1992-09-24 1994-04-15 Hitachi Ltd 文書読取装置

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP0325233B1 (en) * 1988-01-18 1994-07-27 Kabushiki Kaisha Toshiba Character string recognition system
JP2716980B2 (ja) 1988-09-16 1998-02-18 株式会社日立製作所 画像情報装置の正常画像判定方法
US5077811A (en) * 1990-10-10 1991-12-31 Fuji Xerox Co., Ltd. Character and picture image data processing system
JPH04195485A (ja) * 1990-11-28 1992-07-15 Hitachi Ltd 画像情報入力装置
US5235651A (en) * 1991-08-06 1993-08-10 Caere Corporation Rotation of images for optical character recognition
JP3727971B2 (ja) 1995-02-01 2005-12-21 キヤノン株式会社 文書処理装置、及び文書処理方法

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH06103411A (ja) * 1992-09-24 1994-04-15 Hitachi Ltd 文書読取装置

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100405636B1 (ko) * 2000-05-23 2003-11-15 이성환 시각 장애인용 착용 가능 보행 안내 장치 및 방법

Also Published As

Publication number Publication date
CN1108582C (zh) 2003-05-14
CN1205485A (zh) 1999-01-20
US6169822B1 (en) 2001-01-02
JPH1139428A (ja) 1999-02-12
KR19990010215A (ko) 1999-02-05

Similar Documents

Publication Publication Date Title
KR100247970B1 (ko) 문서 영상의 방향 교정방법
US5889897A (en) Methodology for OCR error checking through text image regeneration
KR100448038B1 (ko) 카메라부착 펜형 입력장치
US5539841A (en) Method for comparing image sections to determine similarity therebetween
EP0472313B1 (en) Image processing method and apparatus therefor
CA2162609C (en) Method for recognizing handwritten input
KR101015663B1 (ko) 문자인식장치에서의 문자인식방법 및 그 장치
US5276742A (en) Rapid detection of page orientation
EP0621553A2 (en) Methods and apparatus for inferring orientation of lines of text
JP2001043310A (ja) 文書画像補正装置および補正方法
JPH0721320A (ja) 自動スクリプト決定装置
JP2835178B2 (ja) 文書読取装置
US6771842B1 (en) Document image skew detection method
JPH0721310A (ja) 文書認識装置
JP2000113106A (ja) 文書画像処理装置
JPH0490083A (ja) 文字認識装置
JPH0969136A (ja) 文書方向判定方法及び装置及び文字認識装置、及びコンピュータ制御装置
EP0601730A1 (en) Image processing method for correcting character slant
JP2000187705A (ja) 文書読取装置および方法および記憶媒体
JPH04276888A (ja) 文字読取装置
CN115995082A (zh) 一种图像处理方法、装置、电子设备及存储介质
JPH10124610A (ja) 光学式文字読取装置
CN115100672A (zh) 文字检测识别方法、装置、设备与计算机可读存储介质
JP2022019257A (ja) 情報処理装置、情報処理方法及びプログラム
JPH03219384A (ja) 文字認識装置

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20080918

Year of fee payment: 10

LAPS Lapse due to unpaid annual fee