JPS6236274B2 - - Google Patents

Info

Publication number
JPS6236274B2
JPS6236274B2 JP54145152A JP14515279A JPS6236274B2 JP S6236274 B2 JPS6236274 B2 JP S6236274B2 JP 54145152 A JP54145152 A JP 54145152A JP 14515279 A JP14515279 A JP 14515279A JP S6236274 B2 JPS6236274 B2 JP S6236274B2
Authority
JP
Japan
Prior art keywords
character
line
counter
pattern
memory
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired
Application number
JP54145152A
Other languages
English (en)
Other versions
JPS5668871A (en
Inventor
Hiromi Nanba
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Tokyo Shibaura Electric Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tokyo Shibaura Electric Co Ltd filed Critical Tokyo Shibaura Electric Co Ltd
Priority to JP14515279A priority Critical patent/JPS5668871A/ja
Publication of JPS5668871A publication Critical patent/JPS5668871A/ja
Publication of JPS6236274B2 publication Critical patent/JPS6236274B2/ja
Granted legal-status Critical Current

Links

Landscapes

  • Character Input (AREA)

Description

【発明の詳細な説明】 本発明は光学的文字読取装置において読み取つ
た文字パターンを1文字毎に分離するための文字
検出切出装置に関する。
従来の文字検出切出装置における切出方法を第
1図を参照して説明する。いまメモリにたとえば
第1図aに示すように文字パターンが格納されて
いるとする。先ず文字パターンの縦方向射影(以
下水平射影と云う。)を作成し、文字パターンの
予定切出位置(帳票上での文字枠の境界位置に相
当する)P1,P2,P3…における黒,白(パターン
存在の有無。)を判定する。予定切出位置P1,P3
のように白である場合はその位置における垂直線
分を区切り線として切出しを行う。また、予定切
出位置P2のように黒である場合は水平射影の切れ
目すなわち文字間ギヤツプを探し、ギヤツプがあ
つたらギヤツプを通る垂直線分l1を区切り線とす
る。したがつて第1図bに示すように水平射影が
連続している場合には、文字切出が不能であり、
文字認識ができなかつた。この場合、予定切出位
置P2で強制的に区切つて文字認識を行なう方法も
あるが、第1図bの場合にパターン「5」は認識
可能であるが、パターン「6」は左上方に不要ブ
ロツク(パターン「5」の一部)が存在し認識不
能になり、あるいは誤つて認識するおそれがある
ため認識の信頼性確保の点から認識不能として取
扱うのが一般的であつた。
一方、最近の文字読取装置は、不特定多数の人
間により書かれたいわゆる自由手書き文字や最近
普及し始めている80欄コーデイングシート(文字
ピツチが小さい。)の文字のようにパターン射影
が重なり易い文字を高精度で読取り可能な性能が
要求されている。そしてこのような手書き文字等
は検出切出装置の切出性能が読取率(認識率)を
大きく左右するのであるが、たとえば第1図bに
示したような手書き文字のパターンを従来の装置
で切出したのでは読取不能となる欠点があつた。
本発明は上記従来の欠点を除去すべくなされた
もので、隣接する文字パターンの境界領域を2次
元的に観察し、必要があれば折れ線によつて左右
の文字パターンを区切ることによつて、自由手書
き文字等の読取率の向上を図り得る文字検出切出
装置を提供するものである。
以下図面を参照して本発明の一実施例を詳細に
説明する。第2図において、1は各種の判断・制
御機能を備えたデータ処理装置(以下PPU…
PATTERN PROCESSING UNITの略…と言
う。)である。2は1文字切出しを行うための区
切り線情報を蓄える区切り線メモリであり、この
メモリ2のアドレス指定用としてAカウンタ3、
XLカウンタ4、YLカウンタ5、XRカウンタ
6、YRカウンタ7が設けられており、これらの
カウンタには前記PPU1の出力データがロード
される。8は文字パターン一行分の走査信号を格
納する行文字パターンメモリであり、このメモリ
8のラインXアドレス、コラムYアドレス指定用
としてX1カウンタ9、Y1カウンタ10が設けら
れている。11は切出された文字パターンを格納
する切出文字パターンメモリであり、このメモリ
11のXアドレス、Yアドレス指定用としてX2
カウンタ12、Y2カウンタ13が設けられてい
る。14は前記X1カウンタ9へのロードデータ
としてPPU1の出力もしくは区切り線メモリ2
の出力を選択するマルチプレクサである。15は
上記X1カウンタ9の出力と前記区切り線メモリ
2の出力とを比較する第1比較器である。16は
上記比較器15の出力により状態制御され、出力
がアンドゲート17の開閉を制御するフリツプフ
ロツプ回路である。このアンドゲート17の入力
として前記行文字パターンメモリ8の出力が導か
れ、アンドゲート17の出力は切出文字パターン
メモリ11の入力となる。また18は前記X2
ウンタ12の出力と区切り線メモリ2の出力とを
比較する第2比較器であり、19は前記Y2カウ
ンタ13の出力と区切り線メモリ2の出力とを比
較する第3比較器である。なお上記各メモリ2,
8,11はそれぞれたとえばランダムアクセスメ
モリよりなる。
次に本発明装置の動作の概要を説明する。
(A) PPU1による区切り線情報作成動作。第3
図aに行文字パターンメモリ8に格納された一
行分の文字の水平射影を調べ、予定切出位置ま
たはその近傍において白ブロツク(文字パター
ン相互間のギヤツプに対応する。)が存在する
か否かを判定する。もし存在する場合はその白
ブロツクを通る垂直線分を区切り線として文字
切出制御に利用する。これに対して予定切出位
置近傍において水平射影内の黒ブロツク(文字
パターン部分に対応する。)が連続している場
合は、当該予定切出位置P2を中心として文字ピ
ツチの数分の一程度の幅を持つ領域dを図中矢
印で示す如く水平X、垂直Y方向に順次走査
し、垂直方向に分離したブロツク単位に水平射
影を作成する。このようにして求まつた各水平
射影を調べ、白ブロツクが存在するものの黒ブ
ロツクが予定切出位置P2に対して水平方向の一
方(左または右)へ偏在している場合は、第3
図bに示すように領域d内の白ブロツクを通る
垂直線分l1,l2を接続して折れ線状の区切り線
を作成する。これに対して各水平射影の中に白
ブロツクの存在しないものがある場合は、白ブ
ロツクが存在するようになるまで領域dの水平
方向の幅を広げるかまたは読取不能とするかま
たは強制切出を行う。
以上のようにしてPPU1は各予定切出位置
P1,P2,…において区切り線を求め、1行分の
各文字の区切り線情報を蓄えている。この区切
り線の表現形式は垂直線分の始点座標および区
切り線の終点座標の系列で表わし、第3図bの
例ではS1―S2―S3と表わす。
(B) パターンの切出動作。第4図aに示すように
行文字パターンメモリ8に格納された文字パタ
ーンのうち中央の「5」を切出す場合を例にと
つて説明する。文字「5」の左右両側の区切り
線がそれぞれ折れ線である場合、左側の折れ線
L1―SL2―SL3の各X,Y座標を(SL1X,S
L1Y),(SL2X,SL2Y),(SL3X,SL3Y)、右側
の折れ線SR1―SR2―SR3)の各X,Y座標を
(SR1X,SR1Y),(SR2X,SR2Y),(SR3X,SR
3Y)とする。
そしてPPU1により左側の折れ線の最左端座
標XL、左右の折れ線相互間の最大幅WMAXおよび
パターン転送の最大高さ(これは上方から転送を
開始する場合の最下端座標YMAXにより示され
る。)を求める。
次にPPU1は上述したように求めて蓄えてい
る1行分の各文字の区切り線情報のうち、これか
ら切出そうとする文字の左右の折れ線座標データ
系列を第4図cに示すように区切り線メモリ2に
格納する。この場合、このメモリ2のA領域には
折れ線の最左端座標XL、左右折れ線相互の最大
幅MMAX、転送最大高さYMAXを順次格納し、この
A領域のアドレス指定のポインタとして前記Aカ
ウンタ3を選択して使用する。また上記メモリ2
のXL領域には左端折れ線のX座標SL1X,SL2
,…を順次格納し、このXL領域のアドレス指
定のポインタとして前記XLカウンタ4を選択し
て使用する。また上記メモリ2のYL領域には左
端折れ線のY座標SL1Y,SL2Y…を順次格納し、
このYL領域のアドレス指定のポインタとして前
記YLカウンタ5を選択して使用する。また上記
メモリ2のXR領域には右端折れ線のX座標SR1
,SR2X…を順次格納し、このXR領域のアドレ
ス指定のポインタとして前記XRカウンタ6を選
択して使用する。また上記メモリ2のYR領域に
は右端折れ線のY座標SR1Y,SR2Y…を順次格納
し、このYR領域のアドレス指定のポインタとし
て前記YRカウンタ7を選択して使用する。なお
上記各カウンタ3,4,5,6,7はそれぞれ出
力段がたとえば3ステートゲートあるいはオープ
ンコレクタ回路になつていて択一的に出力を発生
してメモリ2のアドレス指定を行うことが可能に
なつている。
次に第4図aに示す矢印のように行文字パター
ンメモリ8の最大幅WMAX内の最左端座標XL位置
から水平(左右)にライン走査し、この走査パタ
ーンを第4図bに示すように切出して前記切出文
字パターンメモリ11に転送する。この転送の
際、左右の折れ線に挾まれる区間以外(第4図b
中斜線部分)は白パターンを転送し、最大幅MMA
の範囲で転送を行う。すなわちX1カウンタ9、
Y1カウンタ10で行文字パターンメモリ8のX
アドレス,Yアドレスを指定し、X2カウンタ1
2、Y2カウンタ13で切出文字パターンメモリ
11のXアドレス,Yアドレスを指定し、行文字
パターンメモリ8から切出文字パターンメモリ1
1へ転送する。そして転送位置が左右の折れ線の
中間にあるか否(外側にある)かを第1比較器1
5で判定し、中間にある間はフリツプフロツプ回
路16をセツトしてアンドゲート17を開き転送
パターンをそのまま転送させ、外側にあるときは
フリツプフロツプ回路16をリセツトしてアンド
ゲート17を閉じ転送パターンの転送を禁止し結
果的に白パターンを転送させる。
このような一ライン走査を上方から下方へ順次
移動し、最下端YMAXまで転送して1文字の切出
しが完了する。この場合、第2比較器18、第3
比較器19でそれぞれ一ライン転送終了 (X2=WMAX)、一文字転送終了 (Y2=YMAX)が検知される。
次に第5図のフローチヤートを参照して第2図
の装置の文字切出転送動作を詳細に説明する。な
お以下の動作はPPU1の制御に基ずいて行われ
る。第1段階ではXLカウンタ4、YLカウンタ
5、XRカウンタ6、YRカウンタ7にそれぞれ座
標系列の先頭番地をセツトし、Y1カウンタ1
0、Y2カウンタ13をそれぞれクリアする。第
2段階では、Aカウンタ3、X2カウンタ12を
クリアし、Aカウンタ3のアドレス指定により区
切り線メモリ2から最初のXLデータを読み出し
てマルチプレクサ14によりX1カウンタ9にロ
ードさせ、YLカウンタ5、YRカウンタ7、Aカ
ウンタ3をそれぞれインクリメント(+1)す
る。第3段階ではX1カウンタ9の内容がXLカウ
ンタ4によりアドレス指定された区切り線メモリ
2の内容(左端折れ線X座標)よりも小さいか否
かを第1比較器15で判定する。この判定結果が
イエス(Y)の場合(転送位置が左端折れ線より
外側の場合。)には、第4A段階としてフリツプフ
ロツプ回路16をリセツトしてアンドゲート17
を閉じ、切出文字パターンメモリ11へ白パター
ンの1ビツト分を転送させ、X1カウンタ9、X2
カウンタ12をそれぞれインクリメント(+1)
してライン走査を進めたのち前記第3段階へ戻
る。これに対して前記判定結果がノー(N)の場
合(転送位置が左右折れ線の中間の場合。)に
は、第4B段階としてフリツプフロツプ回路16
をセツトしてアンドゲート17を開き、行文字パ
ターンメモリ8から切出文字パターンメモリ11
へ転送パターンの1ビツト分転送し、X1カウン
タ9、X2カウンタ12をそれぞれインクリメン
ト(+1)してライン走査を進める。次に第5段
階としてX1カウンタ9の内容がXRカウンタ6に
よりアドレス指定された区切り線メモリ2の内容
(右端折れ線X座標)より大きいか否かを第1比
較器15で判定する。この判定結果がノーの場合
(転送位置が左右折れ線の中間の場合。)には、上
記第4B段階へ戻りライン転送を進めていく。こ
れに対して前記判定結果がイエスの場合(転送位
置が右端折れ線の外側の場合。)には、第6段階
として第2比較器18でX2カウンタ12の内容
とAカウンタ3によりアドレス指定された区切り
線メモリ2の内容(左右折れ線の最大幅WMAX
とが等しいか否かを判定する。この判定結果がノ
ーの場合(ライン走査が最大幅WMAXに達してい
ない場合。)には、第7A段階としてフリツプフロ
ツプ回路16をリセツトしてアンドゲート17を
閉じ、切出文字パターンメモリ11へ白パターン
の1ビツト分を転送させ、X1カウンタ9、X2
ウンタ12をそれぞれインクリメント(+1)し
てライン走査を進めたのち前記第6段階へ戻る。
これに対して前記判定結果がイエスの場合(ライ
ン走査が最大幅WMAXに達した場合。)には、第
7B段階としてY1カウンタ10、Y2カウンタ13
をそれぞれインクリメント(+1)してパターン
高さ方向走査を進めるとともにAカウンタ3をイ
ンクリメント(+1)しておく。次に第8段階と
してY2カウンタ13の内容とYLカウンタ5によ
りアドレス指定された区切り線メモリ2の内容
(左端折れ線Y座標)とが等しいか否かを第3比
較器19で判定する。この判定結果がイエスの場
合(転送高さ位置が左端折れ線の終点位置に達し
た場合。)には、坪9段階としてXLカウンタ4、
YLカウンタ5をそれぞれインクリメント(+
1)し区切り線メモリ2の新たな左端折れ線デー
タを指定したのち第10段階へ移る。また前記判定
結果がノーの場合(転送高さ位置が左端折れ線の
終点位置に達していない場合。)にも上記第10段
階へ移る。この第10段階ではY2カウンタ13の
内容とYRカウンタ7によりアドレス指定された
区切り線メモリ2の内容(右端折れ線Y座標)と
が等しいか否かを第3比較器19で判定する。こ
の判定結果がイエスの場合(転送高さ位置が右端
折れ線の分岐点または終点位置に達した場合。)
には、第11段階としてXRカウンタ6、YRカウン
タ7をそれぞれインクリメント(+1)し区切り
線メモリ2の新たな右端折れ線データを指定した
のち第12段階へ移る。また前記判定結果がノーの
場合(転送高さ位置が右端折れ線の分岐点または
終点位置に達した場合。)には上記第12段階へ移
る。この第12段階ではY2カウンタ13の内容と
Aカウンタ3によりアドレス指定された区切り線
メモリ2の内容(転送高さYMAX)とが等しいか
否かを第3比較器19で判定する。この判定結果
がノーの場合(1文字の切出転送が未完了の場
合。)には前記第2段階へ戻り第9段階、第11段
階で指定された左右折れ線に関連するライン走査
を進める。これに対して上記判定結果がイエスの
場合(1文字の切出転送が完了した場合。)には
切出転送ルーチンが終了し、切出文字パターンメ
モリ11の格納データが図示しない文字認識回路
へ導かれて認識処理されるようになる。
上述したような文字検出切出装置は、行文字パ
ターンメモリ内に格納された文字パターンについ
て予定切出位置の近傍の一定領域内で縦方向に分
離したブロツク単位に縦方向射影を作成する手段
と、この手段により作成された各ブロツク単位の
縦方向射影における白部分(非パターン射影部
分)を通る縦方向線分群により構成される折れ線
の位置情報を作成する手段と、この手段により求
められた上記折れ線によつて挾まれる1文字分の
パターンを切出す手段とを具備するものである。
したがつてこのような文字検出切出装置によれ
ば、自由手書きの文字とかピツチが小さい文字な
どのように縦方向射影が重なり易い文字のパター
ンに対しても1文字パターン毎に正しく切出すこ
とができるので、文字読取装置の文字読取精度を
高めることができ、文字読取率を向上させること
ができる。
なお上記実施例では、区切り線メモリ2および
このアドレス指定用のカウンタ3〜7を設けて制
御データの書込み,読出しを行つているが、予め
上記制御データをPPU1の制御プログラムに入
れておけば上記メモリ2およびカウンタ3〜7の
機能をPPU1のプログラム処理に置き代えるこ
とも可能である。
本発明は上述したように、パターンの水平射影
が重なり易い手書き文字等の読取率の向上を図り
得る文字検出切出装置を提供できる。
【図面の簡単な説明】
第1図a,bは従来の文字検出切出方法を説明
する図、第2図は本発明に係る文字検出切出装置
の一実施例を示すブロツクダイヤグラム、第3図
aは第2図の装置における区切り線情報作成動作
を説明するためにパターン格納状態およびパター
ン射影の一例を示す図、第3図bは同図aの走査
領域におけるパターン格納状態を示す図、第4図
a,bは第2図の装置における文字切出動作を説
明するために行文字パターンメモリおよび切出文
字パターンメモリにおけるパターン格納状態の一
例を示す図、第4図cは第2図の区切り線メモリ
における切出転送制御データの格納状態を示す
図、第5図は第2図の装置の動作を詳細に説明す
るために示すフローチヤートである。 1……PPU(データ処理装置)、2……区切り
線メモリ、8……行文字パターンメモリ、11…
…切出文字パターンメモリ、3〜7,9,10,
12,13……カウンタ、15,18,19……
比較器、16……フリツプフロツプ回路、17…
…アンドゲート。

Claims (1)

  1. 【特許請求の範囲】 1 パターンメモリに格納された文字パターン列
    に対して作成された水平射影に基づいて前記文字
    パターン列から1文字毎の文字パターンを切出す
    文字検出切出装置において、 前記文字パターン列の文字間において予定切出
    し位置を含む所定領域における垂直射影を作成す
    る垂直射影作成手段と、 この垂直射影作成手段により作成された垂直射
    影に基づいて前記所定領域内で黒ブロツクが存在
    する垂直方向の領域毎に水平射影を作成する水平
    射影作成手段と、 この水平射影作成手段により作成された各水平
    射影における白ブロツク部を通過する縦方向線分
    群により構成される折れ線の位置情報を作成する
    折れ線位置情報作成手段と、 この折れ線位置情報作成手段により作成された
    折れ線の位置情報に基づいて前記折れ線を切出し
    位置として前記パターンメモリから1文字分のパ
    ターンを切出す切出手段とを具備したことを特徴
    とする文字検出切出装置。
JP14515279A 1979-11-09 1979-11-09 Character detecting and cutting-out device Granted JPS5668871A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP14515279A JPS5668871A (en) 1979-11-09 1979-11-09 Character detecting and cutting-out device

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP14515279A JPS5668871A (en) 1979-11-09 1979-11-09 Character detecting and cutting-out device

Publications (2)

Publication Number Publication Date
JPS5668871A JPS5668871A (en) 1981-06-09
JPS6236274B2 true JPS6236274B2 (ja) 1987-08-06

Family

ID=15378616

Family Applications (1)

Application Number Title Priority Date Filing Date
JP14515279A Granted JPS5668871A (en) 1979-11-09 1979-11-09 Character detecting and cutting-out device

Country Status (1)

Country Link
JP (1) JPS5668871A (ja)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS5953983A (ja) * 1982-09-21 1984-03-28 Toshiba Corp 文字の検出切出方法
JPH083833B2 (ja) * 1987-08-05 1996-01-17 富士通株式会社 文字分離方法

Also Published As

Publication number Publication date
JPS5668871A (en) 1981-06-09

Similar Documents

Publication Publication Date Title
JP2003308480A (ja) オンライン手書き文字パターン認識編集装置及び方法並びに当該方法を実現するコンピュータ実行可能なプログラム
US3925760A (en) Method of and apparatus for optical character recognition, reading and reproduction
JP3795238B2 (ja) 文書画像処理装置及び文書画像処理方法
JP2008108114A (ja) 文書処理装置および文書処理方法
JPS6236274B2 (ja)
JP2000322417A (ja) 画像ファイリング装置及び方法及び記憶媒体
JPH01114984A (ja) 画像情報蓄積検索装置
JP2595399B2 (ja) 文書処理方法
JPS61198376A (ja) 光学的文字読取装置
JP2578747B2 (ja) 手書情報処理方法
JPH0388086A (ja) 文書読取装置
JP2578748B2 (ja) 手書情報処理方法
JPS61198378A (ja) 光学的文字読取装置
JPH04156694A (ja) 文字認識方式
JPH0459669B2 (ja)
JPS63293690A (ja) 文字認識システム
JPH0473193B2 (ja)
JPS6326789A (ja) 文字認識装置
JPH07192081A (ja) 手書き文字入力装置
JPH04255088A (ja) 光学式文字読取装置
JPS641827B2 (ja)
JPH01245376A (ja) 文字読取装置の文字切出し装置
JPH02166580A (ja) 光学的文字読取装置及び同装置の文字読取方法
JPH09146947A (ja) 文字領域の順序付け方法及び装置
JPH09146930A (ja) 光学式文字認識装置