JPS6343788B2 - - Google Patents

Info

Publication number
JPS6343788B2
JPS6343788B2 JP55189041A JP18904180A JPS6343788B2 JP S6343788 B2 JPS6343788 B2 JP S6343788B2 JP 55189041 A JP55189041 A JP 55189041A JP 18904180 A JP18904180 A JP 18904180A JP S6343788 B2 JPS6343788 B2 JP S6343788B2
Authority
JP
Japan
Prior art keywords
character
line
characters
circuit
document
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired
Application number
JP55189041A
Other languages
English (en)
Other versions
JPS57111679A (en
Inventor
Akira Sakurai
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ricoh Co Ltd
Original Assignee
Ricoh Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ricoh Co Ltd filed Critical Ricoh Co Ltd
Priority to JP55189041A priority Critical patent/JPS57111679A/ja
Publication of JPS57111679A publication Critical patent/JPS57111679A/ja
Publication of JPS6343788B2 publication Critical patent/JPS6343788B2/ja
Granted legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/24Character recognition characterised by the processing or recognition method
    • G06V30/242Division of the character sequences into groups prior to recognition; Selection of dictionaries

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Character Discrimination (AREA)
  • Character Input (AREA)

Description

【発明の詳細な説明】 本発明は、画素情報の形で与えられる文書上の
文字が活字文字か手書き文字であるかを識別する
方式に関する。
文書の文字認識処理やデータ圧縮処理などを行
なう場合、文書を走査して画素単位でサンプリン
グして得た画素情報を文書画情報として処理装置
に入力するのが普通である。このような処理装置
では、文書上の文字が活字文字であるか手書き文
字であるかが予め分つていれば、一般に有利であ
る。
そこで従来の斯種処理装置には、オペレータが
文書を入力する際に、活字文字の文書か手書き文
字の文書かを指定できるようにしたものもある。
しかし、文書の文字が活字文字であるか手書き文
字であるかを識別する手段は備えていない。した
がつて、活字文字と手書き文字とが混在する文書
の処理については、効率の低下ないしは処理の信
頼度の低下を伴うことが多かつた。
本発明は叙上の実情に鑑み、文書の文字が活字
文字であるか手書き文字であるかを識別するため
の方式を提供しようとするものである。
しかして本発明の方式によれば、画素情報とし
て与えられる文書の画情報について、主走査方向
と副走査方向の黒画素の個数を計数することによ
り該文書の各文字行上の文字領域を切り出す。切
り出した文字領域の文字行方向の配列ピツチを求
め、この配列ピツチのバラツキの程度から、各文
字行毎または複数文字行毎(文書中の全文字行の
場合もある)に文字領域の文字が活字文字である
か手書き文字であるかを判定する。すなわち、活
字文字の場合は、その配列ピツチのバラツキは小
さいが、手書き文字の場合はそのバラツキが相当
に大きくなるのが普通であることに着目して、手
書き文字と活字文字とを識別するわけである。
以下、図面によつて本発明を詳細に説明する。
第1図は、本発明の一実施例を示すブロツク図
である。
文書を図示しないスキヤナで走査して得た画素
情報は、図示しない2値化回路によつて2値化さ
れて画情報として2次元メモリ1および累算回路
2に入力される。なお、本実施例では、上記スキ
ヤナは文書の文字行方向に主走査するものとす
る。画情報は、行アドレス制御回路3および列ア
ドレス制御回路4で指定される2次元メモリ1内
の番地に順次書き込まれる。
一方、累算回路2は、入力される画情報中の黒
画素を累積加算し、各ライン(主走査ライン)毎
の黒画素数を出力する。判定回路5は、累算回路
2から与えられる各ラインの黒画素数がK1個以
上であれば、そのラインを文字行ラインと判定す
る。たゞし、連続して文字行ラインと判定された
一連のラインの本数がM1本未満またはN1本を超
える場合は、そのライン群を文字行ラインとは判
定しない。なお、上記のK1、M1、N1は扱う文書
に応じて決められるものであり、例えばK1=2
〜4、M1=10、N1=60である。
このようにしてある文字行(文字行jとする)
のライン群が判定されると、その中の最初のライ
ンの行アドレスAjと最後のラインの行アドレス
Bjが判定回路5から出力され、記憶回路6に書
き込まれる。なお、行アドレスAj,Bjは2次元
メモリ1の行アドレスと対応していることは勿論
である。
以上のようにして文書1ページ分(これに限る
ものではないが)の画情報が2次元メモリ1に格
納され、また全文字行の最初のラインと最後のラ
インの行アドレスが記憶回路6に格納されると、
2次元メモリ1を読み出すことによつて、以下の
処理が行なわれる。
列アドレス制御回路4によつて2次元メモリ1
の第1列がアドレス指定されている期間に、行ア
ドレス制御回路3が記憶回路6を参照して1番目
の文字行の最初のラインの行アドレスから最後の
ラインの行アドレスまで順番にアドレス指定す
る。これにより、2次元メモリ1から、1番目の
文字行のライン群の第1列(副走査方向の列)目
の画情報が順次読み出され、そのうちの黒画素の
個数が累算回路7によつて求められ、判定回路8
に送られる。次に、列アドレスが+1され、行ア
ドレスが上記の範囲内で更新される。これによ
り、第1文字行の第2列目の画情報が順次読み出
され、そのうちの黒画素の個数が累算回路7で求
められ、判定回路8に送られる。つまり、2次元
メモリ1上において、第1文字行上の画情報が副
走査方向に順番に走査され、各副走査ライン毎の
黒画素の個数が求められる。なお、第1文字行の
走査時に、その最初のライン(主走査ライン)の
行アドレスA1がアドレス出力線11から送出さ
れる。
第1文字行の走査が終了すると、行アドレス制
御回路3は、記憶回路6を参照して第2文字行の
最初と最後のライン(主走査ライン)の範囲で行
アドレスを順次更新させ、列アドレス制御回路4
を列アドレスを順番に更新する。これによつて、
第2文字行も副走査方向に走査され、各副走査ラ
イン上の黒画素の個数が累算回路7で求められ
る。以下同様にして、2次元メモリ1内の最終文
字行まで走査される。
判定回路8は、累算回路7から与えられる各副
走査ライン毎の黒画素数がK2個以上であれば、
その副走査ラインが文字領域内にあると判定す
る。たゞし、この一連の副走査ラインの本数が
M2本未満またはN2本を超える場合は、判定回路
8は当該副走査ライン群を文字領域とは判定しな
い。上記のK2、M2、N2は扱う文書に応じて決め
られるもので、例えばK2=1〜3、M2=2〜
4、N2=60である。
判定回路8は、文字領域と判定した一連の副走
査ラインの最初と最後の列アドレスを出力する。
例えば第2図に略示するように、文字行j(行ア
ドレスはAjからBj)上の文字領域iの左端の列
アドレスSiと右端の列アドレスEiが、判定回路8
から出力される。したがつて、文字領域iが切り
出されることになる。他の文字領域についても同
様である。
演算回路9は、判定回路8から与えられる各文
字領域の左端と右端の列アドレスから、その文字
領域の中心の列アドレスを求める。第2図の例で
は、中心の列アドレスCi=(Si+Ei)/2を求め
る。そして、その前の文字領域i−1の中心列ア
ドレスCi-1から、両文字領域間の文字行方向の配
列ピツチPi=Ci−Ci-1を求める。たゞし、演算回
路9は上記のようにして求めた文字領域の配列ピ
ツチがその文字領域の高さHの1/2以下または3/2
以上である場合は、その配列ピツチを棄却する
(1/2以下の場合は両文字領域が本来1つの文字領
域であるのに2つの文字領域として誤つて切り出
されたとみなし、また3/2以上の場合は間にブラ
ンクが介在しているとみなしている)。なお、上
記の文字領域の高さHは該当文字行の幅に相当
し、記憶回路6を参照することによつて認識され
る。
演算回路9は、1文字行の文字領域の全てにつ
いて配列ピツチを求めると、配列ピツチの平均
μpと標準偏差σpを算出し、ついでσp/μpの値を
算出して判定回路10に出力する。判定回路10
は、演算回路9から与えられる値σp/μpと閾値
Tを比較し、Tより大きい場合(配列ピツチのバ
ラツキがある程度を超える場合)は当該文字行の
各文字領域の文字が手書き文字であると判定し、
判定出力線12に“1”を出力する。そうでない
場合(配列ピツチのバラツキが上記の程度以下の
場合)は、判定回路10は“0”を出力する。上
記のTは、例えば0.25に設定される。
なお13は、前記各部のシーケンス制御を行な
うシーケンス制御回路である。このシーケンス制
御回路13からは、他の各部に必要な各種のタイ
ミング信号類が供給されるが、その詳細は詳略す
る。
さて前記実施例では、入力手書の主走査方向に
文字行が延在しているものとした。しかしこれに
限られるものではなく、文字行方向に副走査方向
を選んでも、本発明を実施できる。たゞし、前記
実施例のようにした方が、一般にハードウエアを
簡略化する上で有利であろう。また前記実施例で
は、文字行の判定を1処理単位(前例では1ペー
ジ)の画情報に対して完了してから、各文字行の
文字領域の切り出しと活字/手書きの判定を実行
したが、両者を並行して実行する構成も容易に実
現できる。さらに、活字文字と手書き文字の識別
を1文字行を単位として行なつたが、複数文字行
単位さらには1処理単位の全文字行を単位として
識別することも可能である。またさらに、2次元
メモリには、文字行の画情報のみを格納するよう
に構成してもよい。
本発明は以上に詳述した如くであり、入力文書
の文字が活字文字か手書き文字かを識別すること
ができ、またそれを実現するためのハードウエア
類も比較的簡単なもので足りる。したがつて本発
明を文字認識処理装置やデータ圧縮装置などに適
用すれば、文字認識の正確度や処理速度、データ
圧縮率の向上などに大きく貢献でき、その効果は
顕著である。
【図面の簡単な説明】
第1図は本発明の一実施例を示すブロツク図、
第2図は同実施例における文字領域の切出しおよ
び配列ピツチの算出などを説明するための図であ
る。 1……2次元メモリ、2,7……累算回路、3
……行アドレス制御回路、4……列アドレス制御
回路、5,8,10……判定回路、9……演算回
路、11……アドレス出力線、12……判定出力
線、13……シーケンス制御回路。

Claims (1)

    【特許請求の範囲】
  1. 1 画素情報として与えられる文書の画情報につ
    いて、主走査方向と副走査方向の黒画素の個数を
    計数することによつて該文書の各文字行上の文字
    領域を切り出し、切り出した文字領域の文字行方
    向の配列ピツチを求め、求めた配列ピツチのバラ
    ツキの程度から、各文字行毎または複数文字行毎
    に文字領域の文字が活字文字であるか手書き文字
    であるかを判定することを特徴とする、活字文字
    と手書き文字の識別方式。
JP55189041A 1980-12-26 1980-12-26 Discrimination system for discrimination between type character and handwritten character Granted JPS57111679A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP55189041A JPS57111679A (en) 1980-12-26 1980-12-26 Discrimination system for discrimination between type character and handwritten character

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP55189041A JPS57111679A (en) 1980-12-26 1980-12-26 Discrimination system for discrimination between type character and handwritten character

Publications (2)

Publication Number Publication Date
JPS57111679A JPS57111679A (en) 1982-07-12
JPS6343788B2 true JPS6343788B2 (ja) 1988-09-01

Family

ID=16234298

Family Applications (1)

Application Number Title Priority Date Filing Date
JP55189041A Granted JPS57111679A (en) 1980-12-26 1980-12-26 Discrimination system for discrimination between type character and handwritten character

Country Status (1)

Country Link
JP (1) JPS57111679A (ja)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS6278690A (ja) * 1985-10-02 1987-04-10 Fujitsu Ltd 文字認識装置
JPH0721817B2 (ja) * 1986-03-26 1995-03-08 株式会社日立製作所 文書画像処理方法
JP4909311B2 (ja) 2008-03-31 2012-04-04 富士通フロンテック株式会社 文字認識装置

Also Published As

Publication number Publication date
JPS57111679A (en) 1982-07-12

Similar Documents

Publication Publication Date Title
US4562594A (en) Method and apparatus for segmenting character images
GB2190778A (en) Character recognition with variable subdivision of a character region
JPS63158678A (ja) 単語間スペ−ス検出方法
US4901365A (en) Method of searching binary images to find search regions in which straight lines may be found
JP3209746B2 (ja) 文字認識システムで用いる文字位置確認装置および方法
JPS6343788B2 (ja)
JP3058489B2 (ja) 文字列抽出方法
JPH07230525A (ja) 罫線認識方法及び表処理方法
JP3020662B2 (ja) 文字行切り出し装置及び文字認識装置
JP2902097B2 (ja) 情報処理装置及び文字認識装置
JPH03142691A (ja) 表形式文書認識方式
JPH0797390B2 (ja) 文字認識装置
JP2954218B2 (ja) 画像処理方法及び装置
JP2812705B2 (ja) 文字切出し装置
JP2867382B2 (ja) 文字認識装置におけるフォント決定方法
JPH09128478A (ja) 画像処理装置
JP3226355B2 (ja) 認識結果評価方法
JPH0222427B2 (ja)
JP2626084B2 (ja) 文字認識装置
JPH0433074B2 (ja)
George Wavelets for dealing with super-imposed objects in recognition of music notation
JPH11232381A (ja) 文字読取装置
JPH05266250A (ja) 文字列検出装置
JPH04267494A (ja) 文字切り出し方法および文字認識装置
JPH08235311A (ja) 文字認識装置