JPH01156887A - 文字認識装置 - Google Patents

文字認識装置

Info

Publication number
JPH01156887A
JPH01156887A JP62316711A JP31671187A JPH01156887A JP H01156887 A JPH01156887 A JP H01156887A JP 62316711 A JP62316711 A JP 62316711A JP 31671187 A JP31671187 A JP 31671187A JP H01156887 A JPH01156887 A JP H01156887A
Authority
JP
Japan
Prior art keywords
character string
character
image
input
width
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP62316711A
Other languages
English (en)
Inventor
Mikio Aoki
三喜男 青木
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Seiko Epson Corp
Original Assignee
Seiko Epson Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Seiko Epson Corp filed Critical Seiko Epson Corp
Priority to JP62316711A priority Critical patent/JPH01156887A/ja
Publication of JPH01156887A publication Critical patent/JPH01156887A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Character Input (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 〔産業上の利用分野〕 本発明は、文字あるいは文書といった情報を画像として
入力し、文字コードに変換して出力する文字認識装置に
関する。
〔従来の技術〕
従来、文字画像データ中から文字列を取り出す方法には
、周辺分布を調べる方法及び、抽出文字列をマークする
方法等がある。周辺分布を調べる方法は、文字画像デ、
−夕を縦方向、横方向に投影をとる方法である。この方
法により、文字画像データ中のどの位置に文字が存在す
るか、また文字列の方向を知ることが可能となる。また
抽出文字列を蛍光ペン等でマークすることにより、画像
入力時の反射率の変化により領域を認識でき、文字列を
抽出することが可能となる。また、文字列中からの単語
の抽出においては、単語と単語の問隔を何らかの方法で
認識することにより、その間を単語領域とみなす方法が
とられている。例えば、特開昭59−35279に述べ
られているように、文字画像の空白時間をハード的に計
測し、文字間か単語間かの区別をする方法がある。また
ソフト的には、特開昭57−180783に述べられて
いる様に、文字の垂直方向の周辺分布をとり、その結果
から切り出す方法がある。
〔発明が解決しようとする問題点〕
文書画像を入力する場合、入力時において原稿等を正確
にセットしない限り取り込まれる画像は斜めに入ってし
まう。特に、入力手段がハンディ型のスキャナであった
場合には、その程度ははなはだしく、何か特定の治具を
使って注意深く入力しない限り正確に画像を入力するこ
とは不可能である。もし、入力された画像が、ハンディ
型のスキャナーでもって、無雑作に入力された画像であ
った場合、該画像データから文字列を抽出する際に次の
ような問題点が生じる。蛍光ペン等で文字列の領域を指
定した場合、文字列の抽出は可能であろう。しかしなが
ら、抽出文字列中から文字を抽し出す際に、文字を捜せ
ない場合が生じる。また偶然に文字を捜し出せたとして
も、文字画像データが斜めであるために、文字認識の際
に誤認識の原因となる。また、周辺分布より文字列を抽
出する場合には、文字画像が斜めに入ると、隣接する文
字列の周辺分布どおしが重ってしまい、文字列の領域の
認識が不可能となる。たとえ、文字列を抽出できても、
認識の際に誤認識を生じやすい。
そこで本発明はこのような問題点を解決するもので、そ
の目的とするところは、斜めに入力された文書画像から
も容易に文字列を抽出する手段、また斜めに入力された
ことによって生じる誤認識を無くすことであり。
〔問題点を解決するための手段〕
本発明は、文字画像を記憶手段に取り込む画像入力手段
と、入力画像から雑音等を除去する画像処理手段と、処
理画像から文字列を抽出する文字列抽出手段と、抽出文
字列から文字を抽出する文字抽出手段と、該抽出文字を
認識する文字認識手段と、該認識文字を表示する文字表
示手段とからなる文字認識装置において、文字列抽出手
段に、文字列の傾き検出手段及び文字列の傾きを補正す
る傾き補正手段を設けることを特徴とする。
〔実施例〕
以下本発明について実施例に基づいて詳細に説明する。
実施例−1 本発明の文字認識 H置は、第1図のブロック図に示す
様に、画像入力手段A1入力された画像から雑音等を取
り除く画像処理手段B1画像中から文字列を抽出する文
字列抽出手段01文字列から文字を抽出する文字抽出手
段D1抽出された文字を認識する文字認識手段E1該認
識結果を表示する文字表示手段Fとから構成されている
第2図は、文字列抽出手段Cのブロック図である。画像
処理手段Bから送られてきた画像デー、夕を、CPU2
がROM5中のプログラムに従って文字列の抽出を行う
以下、文字列抽出手段Cの動作を第4図に示すフローチ
ャートに基づいて説明する。
画像処理手段Bより送られてきた画像データは、第3図
(a)に示す吠籾にある。また該画像データは、ハンデ
ィ型のスキャナーによって無雑作に入力されたものであ
る。このとき、文字画像の傾きθは明らかでない。文字
抽出手段Cは最初に文字入力走査方向■の周辺分布■を
求める。
本実施例の場合、主走査方向(第3図(a)では上下の
方向)に1〜nまでのn本のラインがならんでいる。こ
の時に各ラインについては入力走査方向に1〜mまでの
mコのビットがあり、このmコのビットのうち文字を表
わすビット(黒い画像)が何コ存在しているかを計算し
、n本のラインについて行ったものが周辺分布である。
したがって、周辺分布の図の高さは、黒ビットの数に相
当する。該周辺分布■より文字列の位置、文字列の幅W
、を推定することが可能となる。しかしながら、第3図
(a)に示した様に入力文字画像が傾いた状態であった
場合、文字列の位置及び文字列の幅を誤って推定してし
まう。そこで次の段階として、文字入力走査方向■から
任意の角度θだけ傾けた方向■の周辺分布■を求める。
この場合、傾ける角度θは小さいほど正確な傾きが求ま
るが、あまり小さいと処理時間が長くなるので崖当な大
きさにするとよい。■の方向の周辺分布■より、文字列
の方向が■であった場合の文字列幅W、が求まる。こう
して求められた文字列幅W。
が入力走査方向■の周辺分布6より得られた文字列幅W
、よりも小さければ、さらにθだけ角度を傾けて周辺分
布を計算し、文字列幅Wの最も小さい文字列幅Wnを捜
し出す。また文字列幅W、が文字列幅W、よりも小さい
場合には、逆方向にθだけ傾いた方向の周辺分布を計算
し、最も小さい文字列幅Wnを求める。こうして求めら
れた最小文字列幅の存在する方向θnは第3図(a)か
らもわかる様に入力画像の文字列の傾きを表わしている
。次に該傾きθnを補正して画像データを書き直すと第
3図(b)に示すとおりになる。第3図すの状態におい
て、文字画像は傾きなく書かれているため、この後の処
理が非常に簡単である。
水平方向の周辺分布[相]を求めることにより文字列幅
及び文字列の中心位置Oを推定することが容易となり、
文字列領域[相]を抽出することが可能となる。こうし
て求められた抽出文字列は文字抽出手段りに送られ文字
の抽出が行なわれる。その後該抽出文字は文字認識手段
Eによって認識された後に文字表示手段Fによって表示
される。
実施例−2 ハンディ型のスキャナーによって入力された画像データ
の文字を同一の画像に対して傾き補正した場合としない
場合とで認職率の違いを測定したところ、表−1に示す
結果を得た。尚入力文字数は500文字である。
表  −1 表−1から、入力画像データの傾きを補正した場合とし
ない場合とでは、認識結果に大きな違いが表れることは
明らかである。
以上のように、本発明によると文字列を正確にしかも容
易に抽出でき、また文字画像の傾きによって生じる誤認
識を防ぐことができる。また本発明の実施例は、横方向
に書かれた文書を入力した際の行の傾きであるが実際に
は縦書きの文書でもかまわない。また本実施例は、ハン
ディ型のスキャナにて画像入力し、傾き補正を行ったが
、固定型の大きなスキャナー等で入力した画像において
も傾き補正が容易にでき、しかも誤認識を減らすという
効果をも仔する。
〔発明の効果〕
以上述べた様に本発明によれば、さまざまな方向の周辺
分布を求め、周辺分布の結果より文字列幅及び最小文字
列幅を求めることによって、入力文字画像の傾きを求め
ることができるので、該文字画像の傾きの補正を行うこ
とにより、正確な文字列中心、文字列幅を容易に求める
ことが可能となる。また、傾き補正をした画像データを
用いて文字認識を行うことにより、文字の傾きによる誤
認識を防ぐことが可能となる。
【図面の簡単な説明】
第1図に本発明の文字認識装置のブロック図、第2図に
本発明の文字列抽出手段のブロック図、第3図(a)(
b)に本発明の文字列抽出過程を示した図、第4図に本
発明の文字列抽出手段のフローチャートを示す。 A・・・画像入力手段 B・・・画像処理手段 C・・・文字列抽出手段 D・・・文字抽出手段 E・・・文字認識手段 F・・・認識文字表示手段 ■・・・文字列抽出手段 2・・・CPU 3・・・ROM 4・・・RAM 第3図(a)・・・入力画像及び、θn方向の周通分布 第3図(b)・・・傾き補正後画像 θn・・・文字入力走査方向に対する傾きWn・・・θ
n傾いた方向の周辺分布から推定される文字列幅 ■・・・入力走査方向 ■・・・■よりθ傾いた方向 ■・・・■と逆方向にθ傾いた方向 ■・・・■方向の周辺分布 ■・・・■方向の周辺分布 ■・・・■方向の周辺分布 Wn・・・n方向の周辺分布より得られた文字列幅 [相]・・・傾き補正後の周辺分布 ■・・・文字列中心 [相]・・・文字列領域 以  上 出願人 セイコーエプソン株式会社 汀1図 第2図 第3図 (シ)

Claims (2)

    【特許請求の範囲】
  1. (1)文字画像と記憶手段に取り込む画像入力手段と、
    入力画像から雑音等を除去する画像処理手段と、処理画
    像から文字列を抽出する文字列抽出手段と、抽出文字列
    から文字を抽出する文字抽出手段と、該抽出文字を認識
    する文字認識手段と、該認識文字を表示する文字表示手
    段とからなる文字認識装置において、文字列抽出手段に
    、文字列の傾き検出手段及び文字列の傾きを補正する傾
    き補正手段を設けることを特徴とする文字認識装置。
  2. (2)傾き補正手段は、文字入力走査方向に対して任意
    の傾きをもった方向の入力文字画像の周辺分布の幅を比
    べることにより文字列の傾きを検出し、傾き分だけ入力
    文字画像を回転させることを特徴とする特許請求の範囲
    第1項記載の文字認識装置。
JP62316711A 1987-12-15 1987-12-15 文字認識装置 Pending JPH01156887A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP62316711A JPH01156887A (ja) 1987-12-15 1987-12-15 文字認識装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP62316711A JPH01156887A (ja) 1987-12-15 1987-12-15 文字認識装置

Publications (1)

Publication Number Publication Date
JPH01156887A true JPH01156887A (ja) 1989-06-20

Family

ID=18080049

Family Applications (1)

Application Number Title Priority Date Filing Date
JP62316711A Pending JPH01156887A (ja) 1987-12-15 1987-12-15 文字認識装置

Country Status (1)

Country Link
JP (1) JPH01156887A (ja)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH03142980A (ja) * 1989-10-30 1991-06-18 Mitsubishi Electric Corp 放電型パルスレーザ装置
JPH0512960U (ja) * 1991-07-30 1993-02-19 三洋電機株式会社 画像情報入力装置
US5243668A (en) * 1990-01-31 1993-09-07 Hitachi, Ltd. Method and unit for binary processing in image processing unit and method and unit for recognizing characters
US5781660A (en) * 1994-07-28 1998-07-14 Seiko Epson Corporation Image processing method and apparatus

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH03142980A (ja) * 1989-10-30 1991-06-18 Mitsubishi Electric Corp 放電型パルスレーザ装置
JP2738077B2 (ja) * 1989-10-30 1998-04-08 三菱電機株式会社 放電型パルスレーザ装置
US5243668A (en) * 1990-01-31 1993-09-07 Hitachi, Ltd. Method and unit for binary processing in image processing unit and method and unit for recognizing characters
JPH0512960U (ja) * 1991-07-30 1993-02-19 三洋電機株式会社 画像情報入力装置
US5781660A (en) * 1994-07-28 1998-07-14 Seiko Epson Corporation Image processing method and apparatus

Similar Documents

Publication Publication Date Title
JPH1139428A (ja) 文書映像の方向修正方法
CN107992869B (zh) 用于倾斜文字校正的方法、装置及电子设备
CN112528776B (zh) 文本行校正方法和装置
US9171218B2 (en) Image processing apparatus, image processing method, and computer readable medium that recognize overlapping elements in handwritten input
CN110008960B (zh) 一种检测字符片段完整性的方法及终端
JPH01156887A (ja) 文字認識装置
CN112036232A (zh) 一种图像表格结构识别方法、系统、终端以及存储介质
JP2007011529A (ja) Ocr処理における文字認識位置の決定方法
JP2000113106A (ja) 文書画像処理装置
JP5844698B2 (ja) 文字認識装置
JPH07152857A (ja) 運転免許証認識装置
JPH07220023A (ja) 表認識方法及びその装置
JPH07220081A (ja) 画像認識装置の図形の切出し方法
JP2786044B2 (ja) 光学的文字読み取り装置
US20210073567A1 (en) Systems and methods for separating ligature characters in digitized document images
JP2963474B2 (ja) 類似文字識別方法
JPH11250179A (ja) 文字認識装置および文字認識方法
CN113139445A (zh) 表格识别方法、设备及计算机可读存储介质
JP3606218B2 (ja) 文書分類装置、文字読み取り装置及び真贋判定装置、並びにこれらの方法
JP3000480B2 (ja) 文字領域区切り検出方法
KR20220168787A (ko) 만주어의 글자 추출 방법 및 이를 수행하는 시스템
JP4270767B2 (ja) 罫線情報処理方法と罫線情報処理プログラムと画像処理装置及び記憶媒体
JPH09288714A (ja) 表認識方法および装置
JPS63250787A (ja) 文字切出し方法
JPH1021398A (ja) 方向特徴ベクトル抽出方法