JPH0147828B2 - - Google Patents

Info

Publication number
JPH0147828B2
JPH0147828B2 JP57029653A JP2965382A JPH0147828B2 JP H0147828 B2 JPH0147828 B2 JP H0147828B2 JP 57029653 A JP57029653 A JP 57029653A JP 2965382 A JP2965382 A JP 2965382A JP H0147828 B2 JPH0147828 B2 JP H0147828B2
Authority
JP
Japan
Prior art keywords
line
block
character
cutting
image information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired
Application number
JP57029653A
Other languages
English (en)
Other versions
JPS58146973A (ja
Inventor
Morisumi Kurose
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ricoh Co Ltd
Original Assignee
Ricoh Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ricoh Co Ltd filed Critical Ricoh Co Ltd
Priority to JP57029653A priority Critical patent/JPS58146973A/ja
Publication of JPS58146973A publication Critical patent/JPS58146973A/ja
Publication of JPH0147828B2 publication Critical patent/JPH0147828B2/ja
Granted legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/20Image preprocessing

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Character Input (AREA)

Description

【発明の詳細な説明】 発明の技術分野 本発明は、光学的文字読取装置(以下OCRと
いう)において、読取つた文字行および文字を1
行ずつおよび1文字ずつ切出す切出し方法に関す
る。
発明の技術的背景 OCR、フアクシミリ等の文字認識機能を有す
る装置においては、読取つた文字画像の認識処理
の過程において、2値化された文字画像のパター
ンを射影して1文字ずつ切出すという処理が行わ
れる。この切出し処理にあつては装置での絶対的
画面に対して、文字の並び(以下文字行という)
が傾斜していないことが条件となる。このため、
原稿が傾いたまま装置に入れられることのないよ
う、原稿挿入の際原稿を装置に設けられたガイド
に沿つて装入する方法、透明なプラスチツクケー
ス等よりなるキヤリアに入れて読取装置に挿入す
る方法などが採られている。
背景技術の問題点 ところがOCR専用の原稿用紙を使用しないい
わゆるフリーフオーマツト原稿では原稿用紙に対
する文字行の印刷の傾きは一定していない。この
ため、従来のように原稿用紙の外形に対する規制
のみでは、傾いて印刷された原稿については行の
切出しができず、読取りが不可能であつた。
最近OCRの入力としてワードプロセツサで出
力した原稿をそのまま使用することが行われてい
るが、これもフリーフオーマツト原稿であるため
上記問題が生じていた。
発明の目的 そこで、本発明は文字行が傾いて印刷された原
稿を読取る場合、傾いてOCRに挿入された原稿
を読取る場合等、OCR装置の絶対的画面に対し
て一定の傾きを有する文字行および文字の切出し
を可能とする切出し法を提供することを目的とす
る。
発明の概要 本発明は上記目的達成のため、OCR装置内に
おいて、次のような過程により文字行および文字
を切出すものである。
すなわち、 (1) CCDイメージセンサ等により認識された画
面を画素ごとに2値化したものを文字の行方向
に垂直な適当な領域でブロツク化し、 (2) 画面をラインごとに走査して画像情報を検出
し、 (3) 最初の画像情報のあつたブロツクをマスター
ブロツクとし、 (4) マスターブロツクの左又は右のブロツクで画
像情報を発見することにより、行の傾き傾向を
決定し、 (5) この行の傾き方向からマスターブロツクとつ
ながつた最後のブロツクを求めて文字行を切出
し、 (6) この切り出された文字行において行の始まり
のブロツクおよび行の終りのブロツクにおける
最初の走査ラインおよび最後の走査ラインから
行の傾きを求め、 (7) この傾き線の延長線付近で同一行に属する他
の部分が存在するか否かを確認して行が弧立し
ているか否かを定め、 (8) 以上の過程により切出すべき行全体の位置お
よび範囲を認識して切出し、 (9) 切出された行の中で画像情報を含むブロツク
を求め、 (10) 文字の切出し枠幅としてほぼ1文字分にあた
る画素幅を隣りのブロツクに重複した画素幅と
定めて、この切出し枠幅で文字の切出しを行う ことを内容とする。
実施例 以下図面に従つて本発明の1実施例を説明す
る。
第1図は本発明を実現するOCRの構成を表わ
すブロツク図である。
OCRの作用を説明すると、CCDイメージセン
サ等によつて構成されるスキヤナ1によつて1ラ
インごとに読取られた画像信号は2値化回路2に
よつて2値化され、データ用バスラインBに送り
出される。この2値化信号は判定回路3によつて
黒画素の有無を判断され、その結果は中央処理装
置(以下CPUという)4に送られる。この画像
データは、CPU4の指令によりバスライン切換
スイツチ5がバスラインBに切換えられると、メ
モリコントロール回路6を経て画像メモリ回路7
に記憶される。
スキヤナ1が読取つたラインに黒画素のあるも
のが連続した後黒画素が全くなく白画素のみが存
在することが、判定回路3により判定された場合
には、CPU4はバスライン切換スイツチ5をバ
スラインCに切換え、画像メモリ回路7に記憶さ
れた画像情報を受け取つて、本発明にかかる切出
し方法を実行して、行および文字の切出しを行
う。
切出された行、文字は、インターフエース回路
8を通過した後シフトレジスタC1〜Coで構成さ
れるバツフアメモリ9により送り出し速度を調整
されながら文字認識回路10に送られ、文字の認
識がされる。なおAはコントロール用バスライ
ン、Dは外部バスラインである。
次に本発明の主要部である文字行および文字の
切出し方法について説明する。
第2図は、本発明にかかる文字行および文字の
切出し方法をステツプ順に図示したブロツク図で
あり、ステツプ1からステツプ8までよりなる行
切出しとステツプ1からステツプ3までよりなる
文字切出しの2段階に分けられている。
各ステツプの内容は次のとおりである。
「行切出し」 ステツプ1 画面のブロツク化 ステツプ2 画面走査 ステツプ3 マスターブロツクの決定 ステツプ4 行傾き傾向検出 ステツプ5 マスターブロツクとつながつた行の
切出し ステツプ6 行傾き計算 ステツプ7 行の弧立性確認 ステツプ8 同一行全体の切出し 「文字切出し」 ステツプ1 画像情報を含むブロツク選択 ステツプ2 切出し枠決定 ステツプ3 文字切出し 次に各ステツプの内容を詳細に説明する。
(1) 行切出し方法 <ステツプ1> 画面のブロツク化 第3図はCCDイメージセンサ等の画像情報
変換器を用いて得た画像情報を閾値処理によつ
て2値化した画面11を表わし、主走査方向で
ある行方向に画素幅Xで画面を分割してブロツ
クを行つている。
それぞれのブロツクは、左からB1,B2,…
…Bx,……と定義する。
第4図はブロツク間にまたがる画像情報の処
理を行うために設けられるブロツクの重複部1
2を表わす。この重複部は、後述するように、
文字の切出しの際、例えば画素幅Xのブロツク
B1に対して画素幅Yの重複部12を隣りのブ
ロツクB2内に設け、画素幅(X+Y)のブロ
ツクとして使用するためのものである。
いま、8本/mmの割合で配列された画素を
1728持つCCDイメージセンサを使用したとす
れば、この20等分にあたる87画素は10ポイント
活字で4〜5字分にあたりブロツクの画素幅X
として適当となる。重複部の画素幅はほぼ1文
字分あればよいので、Yは33程度にすればよ
い。
<ステツプ2> 走査 行の傾きを求めるためには、まず黒画素を発
見する必要がある。このためスキヤナ1は主走
査方向にラインを走査し、判定回路3により黒
画素が発見されなければ副走査方向に1ライン
移動し同様に走査をしていく。
<ステツプ3> マスターブロツク決定 このようにして、黒画素が発見できるまでラ
インを走査していき、黒画素が最初に発見され
たとき黒画素の属するブロツクをマスターブロ
ツクBmとする。第5図はハツチングを施した
黒画素部13とマスターブロツクBmとの関係
を示しB7がマスターブロツクにあたる。
マスターブロツク内での黒画素の開始ライン
番号S(m)及び終了ライン番号E(m)は画像
メモリ回路7に記憶される。
この際E(m)−S(m)が小さい値であると
きは文字ではない可能性が高いから、ノイズと
見るのが適当である。例えば、E(m)−S(m)
が一定値P(例えば5)より小さいような場合
には、ノイズと考えてよい。また地肌のノイズ
が充分に除去されている場合にはより小さい数
をもつて、ノイズの判定基準とすることができ
る。
<ステツプ4> 行傾き傾向検出 次に行の傾き傾向を検出する。第5図に示す
ように、マスターブロツクBmの1つ右のブロ
ツクB(m+1)または1つ左のブロツクB
(m-1)において、ラインを進めた位置に画像
情報があるかどうかを判定回路3によつて検出
し、黒画素が発見された場合にはステツプ3の
マスターブロツクの場合と同様にそのブロツク
内の黒画素の開始ライン番号S(m+1)若しく
はS(m-1)および終了ライン番号E(m+1)若
しくはE(m-1)を画像メモリ回路7に記憶す
る。この場合においても(E(m+1)−S
(m+1))又は(E(m-1)−S(m-1))が一定値
Pより小さければノイズとみなすこととする。
第5図では左側のブロツクで黒画素がある場合
を示している。
このようにしてマスターブロツクより右のブ
ロツクで黒画素が発見されたときは行の傾き傾
向はマイナス(−)であり、左のブロツクで黒
画素が発見されたときは行の傾きはプラス
(+)である。なお、マスターブロツクの終了
ライン番号から1定ライン数Q(例えば10)下
つたライン番号までのラインで黒画素が発見さ
れないときは、マスターブロツクは弧立したブ
ロツクと認められるので、これを切出し、スキ
ヤナ1で新たな黒画素を探索することになる。
また、同一ライン上に多くの画素が発見され
る場合は傾き傾向は0であるので、そのまま次
のステツプに移ればよい。
<ステツプ5> マスターブロツクとつながつ
た行の切出し 次には、マスターブロツクに連結した行の全
体を把握する。このため、走査ラインを進めて
マスターブロツクの両側で黒画素を発見し、連
続していると認められる行の終端までのブロツ
クとそのブロツク内の黒画素の開始ライン番号
S(n)および終了ライン番号E(n)を求め画
像メモリ回路7に記憶する。
ここで、行全体の把握を行うためにマスター
ブロツクの両側で画像情報を探索するのは、第
6図に示すようにマスターブロツクの境界で文
字の高さが非常に異なることがあり、このた
め、隣りのブロツクB(m+1)にある同一走査
ライン上の黒画素を異なる行に属するものと判
断してしまうことを防止するためである。
行の傾き傾向が+又は−方向であることが確
定した後は、+の場合はマスターブロツクの左
のブロツク、−の場合はマスターブロツクの右
のブロツクのみで行全体の把握を行えば良く、
その情報はCPU4に連絡される。
なお行の終端を発見するためには、黒画素の
あるブロツクの終了ラインより一定のライン数
Q(例えば10)下つた位置までの範囲で隣りの
ブロツクを探索する。
そして、次々と黒画素のあるブロツクを発見
してゆき、それぞれのブロツク内での黒画素開
始ラインS(l)および終了ラインE(l)を記憶す
る。E(l)−S(l)が一定数R(例えば5)より小
さく、かつ黒画素の発見された最後のラインよ
りRライン下つた位置までの範囲でいずれのブ
ロツクにも黒画素がない場合には最後の黒画素
のあるラインが属するブロツクをブロツクnと
してそのブロツク内での黒画素の開始ライン番
号S(n)および終了ライン番号E(n)が決定
され、これらは画像メモリ回路7に記憶され
る。
以上のマスターブロツクBmと終端ブロツク
Bnとの関係は、第7図に示されている。
<ステツプ6> 行傾きの計算 次に文字行の基準線の傾きαを求める。
αは第8図において、マスターブロツクBm
と終端ブロツクの中点を結んだ線分の傾きとし
て求められるから、 α=S(n)+E(n)/2−S(m)+E(m
)/2/n−m=(S(n)−S(m))+(E(n)
−E(m))/2(n−m) である。
これらの計算は、画像メモリ回路7に記憶さ
れたS(m),E(m),S(n),E(n),m,n
をもとにCPU4により行われる。
<ステツプ7> 同一行全体の切出し 次にこの行傾きαを用いマスターブロツクと
同じ行に属すると思われるブロツクを探索す
る。
このために、マスターブロツクにつながつた
行の端の属するブロツクをBnとすると、この
ブロツク内での黒画素の開始ライン番号S(n)
と終了ライン番号E(n)をもとに次の範囲で
画像情報をさがす。
探索開始ライン番号;S(n)+K(n−m)α
−S 探索終了ライン番号;E(n)+K(n−m)α
+S ここでKは行端ブロツクから隔つたブロツク
数であつて整数であり、Sはαが現実の行傾き
と差がある場合の誤差を吸収するための一定値
(例えば5)である。
Kを1、2、……と変えてゆき、このライン
の範囲に黒画素がある場合には、マスターブロ
ツクにつながつた行と同じ行に属すると考えら
れる。以上の操作を用紙の端のブロツクまで行
い、同一行であるかどうかの認識が完了する。
<ステツプ8> 同一行全体の切出し これまでの操作を各行についてくり返す。発
見された画像情報は、画像メモリ回路7に記憶
される。
第9図は記憶された画像情報の1例を示す図
であり、ある行に属し、ブロツクNの位置にあ
る画像情報を示している。すなわち、主走査方
向に走査開始位置からX*(N−1)+1画素
よりX*N画素までの幅で副走査方向に開始ラ
インS(N)から終了ラインE(N)までの範囲での黒
画素の分布アドレスが記憶された状態となつて
おり、ブロツク単位で行が切出されている。
このようなブロツクが画面全体に分布してお
り、結局各行の全体が切出されたことになる。
(2) 文字切出し方法 <ステツプ1> 画像情報を含むブロツク選択 まず、各ブロツクについて黒画素の開始ライ
ン番号及び終了ライン番号を画像メモリ回路7
に記憶された内容から引き出す。なお、以下の
過程においては画像情報が全くないブロツクに
ついては無視される。
<ステツプ2> 文字切出し枠決定 次に、文字の切出し対象域を決定する。
主走査方向の切出しの幅は、第10図に示す
重複部12を含めるものとし、第11図に示す
ように画素幅(X+Y)のブロツク幅とする。
このように重複部12を含めて切出しブロツク
幅とするのは第12図に示す場合のように当初
のブロツク幅のみで切出しを行うと、ブロツク
の端の文字(第12図の例ではスラツシユ)が
途中で切れてしまうのを防止するためである。
このため、重複部12の幅は約1文字分の幅
があれば十分である。
副走査方向の切出しの幅は、重複部12を主
走査方向の切出し幅としたため、重複部12が
属する隣りのブロツクを含めて決定しなければ
ならない。
いま、切出そうとするブロツクBNが右上り
の傾きを持つ行に属しているとする。この場合
第12図に示すように切出し開始ライン番号は
S(N+1)、切出し終了ライン番号はE(N)とすばよ
い。
同様に切出そうとするブロツクBNが右下り
の傾きを持つ行に属しているとすれば、切出し
開始ライン番号はS(N)、切出し終了ライン番号
はE(N+1)とすればよい。
<ステツプ3> 文字切出し 文字の切出しはそれぞれの切出し枠の中で射
影法により行われる。
以上、本発明の構成を横書き原稿を例にとつ
て説明したが、これに限られるものではなく、
縦書き原稿にも同様に適用されうる。
また、主走査方向の切出し幅は本実施例では
右側のブロツクBN+1のみを考慮したが、これ
に限るものではなく、左側のブロツクを含める
ようにしてもよい。この場合の副走査方向の切
出し枠幅は、右上り行については切出し開始ラ
イン番号S(N)、切出し終了ライン番号E(N-1)、右
下り行については切出し開始ライン番号E(N-1)
切出し終了ライン番号S(N)とすばよい。
さらに本実施例においては切出し枠を決定す
るのに行の傾きαの値は用いていないが、隣り
のブロツクにおけるY画素分についての副走査
方向の拡大ライン数はYsinαであるから、これ
を考慮して切出し枠を決定することもできる。
また、行が連続しているかどうかの判断には
本実施例では最初に判明した連続行での傾き角
度αをそのまま用いたが、同じ行に属する他の
連続部分を発見した場合にはそれらを用いて傾
き角度αの補正を行えば、より精度を向上させ
ることができる。
発明の効果 本発明によつて、従来読み取りがそのままはで
きなかつた傾斜印刷された原稿および傾いたまま
装置に挿入された原稿についても特別な手段を施
すことなく、CCDイメージセンサ等により認識
された画像情報を処理するのみで行、文字の切出
しができるという顕著な効果が得られる。
【図面の簡単な説明】
第1図は本発明を実現するOCRの構成を表わ
すブロツク図、第2図は切出しのステツプを示す
ブロツク図、第3図は画面全体をブロツク化して
いることを表わす説明図、第4図はブロツクの重
複部を表わす説明図、第5図は黒画素のあるブロ
ツクの連続状態を示す説明図、第6図はブロツク
の境界で文字の大きさが著しく異る場合を示す説
明図、第7図はある行についてのマスターブロツ
クと終端ブロツクを表わす説明図、第8図は行の
傾きを表わす説明図、第9図は画像情報のあるブ
ロツクを表わす説明図、第10図はブロツクの境
界で画像情報のはみ出しが見られる例を示す説明
図、第11図は文字切出し範囲の大きさを表わす
説明図、第12図はブロツクの端に文字がある場
合を示す説明図である。 1……スキヤナ、2……2値化回路、3……判
定回路、4……CPU、7……画像メモリ回路、
10……文字認識回路、11……ブロツク、12
……重複部分、13……黒画素部、14……行傾
き基準線、B1,B2,B3,Bx,Bn-I,Bm,Bn+I
Bn,BN-I,B(N),BN+I……ブロツク、S(m),S
(n),S(m−I),S(N),S(N+1)……ブロツク内の
黒画素開始ライン番号、E(m),E(n),E(m
−I),E(N),E(N+I)……ブロツク内の黒画素終了
ライン番号、X,X……画素幅。

Claims (1)

  1. 【特許請求の範囲】 1 光−電気変換素子により画素変換された画像
    から文字行および文字を切出して認識する文字読
    取方法において、 2値化した画面を画素のライン方向と垂直な方
    向に分割してブロツク化し、 画面を画素のラインごとに走査して画像情報を
    検出し、 最初に一定ライン範囲で画像情報が存在した最
    初のブロツクを求め、 前記最初のブロツクから一定ライン進めた位置
    での画像情報を検出することをくり返すことによ
    つて前記最初のブロツク内の画像情報につながつ
    た画像情報を有する最後のブロツクを求め、 前記最初のブロツク及び前記最後のブロツクに
    おける最初の走査ライン番号及び最後の走査ライ
    ン番号とから文字行の傾きを求め、 前記行傾き線の延長線付近で同一文字行に属す
    る他の文字の存在を確認して切出すべき文字行の
    位置および範囲を認識して文字行をブロツクごと
    に切出し、 前記切出された文字行内で画像情報を含むブロ
    ツクを求め、 文字行方向の文字切出し枠幅として、切出そう
    とするブロツクに略1文字分にあたる隣りのブロ
    ツクを重複させた画素幅を用い、文字行方向に垂
    直な方向の文字切出し幅として、前記重複した部
    分を含めた最小画素ライン数から最大画素ライン
    数までを用いて、 前記切出し枠幅よりなる切出し枠内で射影法に
    より各文字を切出す ことを特徴とする文字行および文字の切出し方
    法。
JP57029653A 1982-02-25 1982-02-25 文字行および文字の切出し方法 Granted JPS58146973A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP57029653A JPS58146973A (ja) 1982-02-25 1982-02-25 文字行および文字の切出し方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP57029653A JPS58146973A (ja) 1982-02-25 1982-02-25 文字行および文字の切出し方法

Publications (2)

Publication Number Publication Date
JPS58146973A JPS58146973A (ja) 1983-09-01
JPH0147828B2 true JPH0147828B2 (ja) 1989-10-17

Family

ID=12282061

Family Applications (1)

Application Number Title Priority Date Filing Date
JP57029653A Granted JPS58146973A (ja) 1982-02-25 1982-02-25 文字行および文字の切出し方法

Country Status (1)

Country Link
JP (1) JPS58146973A (ja)

Families Citing this family (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS60254382A (ja) * 1984-05-31 1985-12-16 Toshiba Corp 文字行検出方式
JPS62219087A (ja) * 1986-03-19 1987-09-26 Matsushita Electric Ind Co Ltd 文字認識装置
JPH0679348B2 (ja) * 1986-12-23 1994-10-05 シャープ株式会社 行切り出し方法
JPS63223988A (ja) * 1987-03-13 1988-09-19 Fujitsu Ltd 文字列領域設定方式
JPH0827818B2 (ja) * 1987-04-08 1996-03-21 富士電機株式会社 文字列の回転角検出方法
JPS63268081A (ja) * 1987-04-17 1988-11-04 インタ−ナショナル・ビジネス・マシ−ンズ・コ−ポレ−ション 文書の文字を認識する方法及び装置
JP2610881B2 (ja) * 1987-07-07 1997-05-14 日本電気株式会社 文字列内の文字大きさ測定方式
JP2569151B2 (ja) * 1988-10-07 1997-01-08 富士電機株式会社 文字サイズ抽出方法
JPH02268388A (ja) * 1989-04-10 1990-11-02 Hitachi Ltd 文字認識方法
JP4658848B2 (ja) * 2006-03-30 2011-03-23 日本電産サンキョー株式会社 文字列認識方法及び文字列認識装置
CN106651869B (zh) * 2016-09-21 2019-12-10 电子科技大学 一种基于局部投影的ito分割方法

Also Published As

Publication number Publication date
JPS58146973A (ja) 1983-09-01

Similar Documents

Publication Publication Date Title
EP0081767B1 (en) Character and image processing apparatus
US6364209B1 (en) Data reading apparatus
JP3727971B2 (ja) 文書処理装置、及び文書処理方法
JPS60262284A (ja) イメ−ジ処理方法
JPH0147828B2 (ja)
US4686577A (en) Original reading apparatus with positioning check
JPH1173500A (ja) イメージ処理方法及びイメージ処理装置
JPH0335372A (ja) 画像判別装置
JP2003046731A (ja) 画像読取方法、装置、プログラム及びプログラムを記憶した媒体
JPS6325391B2 (ja)
JPH08204912A (ja) 原稿サイズ検知装置
JPS5824265A (ja) フアクシミリ送信機を用いたマ−ク読取方式
JP2000251010A (ja) 帳票読み取り方法
JPS61289476A (ja) 文字読取装置のフオ−マツト生成方式
JPH11288453A (ja) 再生用のスキャン環境における原稿画像のスキュ―角度および黒い境界線を検出する方法およびシステム
JP3538939B2 (ja) 原稿サイズ検知装置
JPH0119193B2 (ja)
JP2877548B2 (ja) 文書画像の属性判別方法
JPH0234232B2 (ja)
JPS63116282A (ja) 画像入力付きocr
JP3014257B2 (ja) 文書読み取り装置
JPH11161739A (ja) 文字認識装置
JPS6327751B2 (ja)
JPH0762859B2 (ja) 文字パターン認識修正装置
JPS60254382A (ja) 文字行検出方式