JPS5866174A - 行抽出方法 - Google Patents

行抽出方法

Info

Publication number
JPS5866174A
JPS5866174A JP56164581A JP16458181A JPS5866174A JP S5866174 A JPS5866174 A JP S5866174A JP 56164581 A JP56164581 A JP 56164581A JP 16458181 A JP16458181 A JP 16458181A JP S5866174 A JPS5866174 A JP S5866174A
Authority
JP
Japan
Prior art keywords
character
line
projection
block
character line
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP56164581A
Other languages
English (en)
Inventor
Mamoru Maeda
護 前田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ricoh Co Ltd
Original Assignee
Ricoh Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ricoh Co Ltd filed Critical Ricoh Co Ltd
Priority to JP56164581A priority Critical patent/JPS5866174A/ja
Publication of JPS5866174A publication Critical patent/JPS5866174A/ja
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/14Image acquisition
    • G06V30/146Aligning or centring of the image pick-up or image-field
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Character Input (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 本発明は、文字1Iii像から文字行を抽出する行抽出
方法KrRする。
従来の行抽出方法の一つとして、文字画像?−夕に基い
て、行の始めの部分の射影および行の終りの部分の射影
を求め、これらが互いに電なっているとき、上記始めの
部分と、上記終りの部分とが、同一の行のものであると
判定する方法がある、しかるに、この方法では、行の傾
きが大きいとき、または行が長いときに、1つの行の始
めの部分が隣接する行の終ねの部分と重なって、行の切
出しに失敗するおそれがある。
本発明の目的は、行が傾きが大きいとき、ま几は行が長
いときにも行の抽出を正しく行なうことができる行抽出
方法を提供することにある。
本発明によれば、文字m1(IIを文字−偉が延びるべ
き方向、例えば第1図に示すように横書きの場合には横
方向、に対して略垂直な方向に延びる仮想線OVa、O
Vbにより複数のブロックBLa。
BLb、BLcに分割し、各ブロック内における各文字
行の射影Pla、Plb、PIC,P2a、P2b、P
2O,−・−を求め、隣接するブロックの射影(例えば
PlaとPlb)とが互いに重なっているかどうかを判
定し、重なっていると判定されたときはこれらの射影(
Pla、Plb )を形成する文字行部分Lla。
Llbが同一の文字行CLIKIiするものと判定する
、 各ブロック内における各文字行の射影を求めるKは、例
えば各ブロック内の各文字行部分について起点(5N、
Sla、5jBa、S2b、S2c、S2a’。
S2b’、 S2c’、 S3a 、 SSC,S3a
’、 S3c’ )を定め、この起点から所定の距離H
までの範囲について文字1會のデータを走査することと
すればよい。
第2図は、本発明に係る方法の実施に用いられる装置の
一例を示したものである3N図において、Paは画素信
号で、11i儂をマトリックス状に配列され念多数の画
素に分解し、それぞれの画素の濃淡を2値化して得られ
る信号であり、上方の行から下方の行へ、各行を左から
右へという順序でlIi像ダータメモリから与えられる
lは先端検出回路で画素信号ps@受け、―儂の上端を
探す、この場合、1lllil素めみの黒点は、無視し
、2−素以上の愚テンが見つかったときにその部分を先
端81として記憶する。
2は起点設定回路で、先端検出回路lから先端S1の縦
方向の位置に関するデータを受けるとともに、後述の射
影検出回路3から射影の上端νよび下罐に関するデータ
を受けて、これらのデータに基いて起点を設定する。
射影検出回路3は、各ブロック内における各文字行の射
影を求める。、これは、起点から所定の距離81での範
囲内の画素信号を順次走査することKよシ行なわれる。
距離Hまでの範囲の下端まで走査を行なう前に、射影の
下端が検出されたとき、即ち射影の下側に空白の部分が
現われたときは、その箇所までで走査を終える。
そ[7て、射影の上端および下端についてのデータを起
点設定回路2に送る。
起点設定回路2は、文字amrsの最初の文字行の射影
を求めるときKは、最初1儂の先端を起点と定める、射
影検出回路3は、上記の起点S1から所定の距離Hの範
囲内に、各ブロック内における文字行の射影が収まって
いるかどうかを調べる。これは、距離81での上記範囲
の下端までに、射影の下端が検出されたかどうかに基い
て調べられる。射影が上記範−内に収まっていないと判
定されたときは、射影の上端(sxa’)関するデータ
を起点設定回路2に与える。起点設定回路2は、このデ
ータに基いて、今度は射影の上端を起点と足める。射影
検出回路3は、新たに定められた起点S1m’  から
所定の距離Hまでの範囲について、1儂データの走査を
行ないそのブロック内の射影を再び求める。新たに定め
られた起点311′から所定の距J1181での範囲内
にも各ブロック内における文字行の射影が収まっていな
いと判定されたときは、文字行の傾斜が過大または、文
字が過大であって、このため一つの文字行の射影と次の
文字行の射影とが互いに重なっていると判断し、原稿を
リジェクトする。
起点設定回路2ti、上記のよ゛うに射影検出回路3か
ら射影の下端に関するデータを受け、最初の文字行以外
の文字行の射影を求める友めの起点を定める。即ち、各
ブロック内における文字行の射影の下端92a、S2b
、S2c、S3a、S3b、lcを次の文字行CL2.
CL3の各ブロック内における射影検出のための走査範
囲の起点とする。この場合にも、射影検出回路3は上記
の起点5laa、S2b、・・・・・からの所定の距1
11HIでの範囲内に、各ブロック内における文字行の
射影が収まっているかどうかを調べる。収まっていない
と判定されると、射影の上端!!2m’、 Sob’・
・・・・K関するデータを起点設定回路2に与えるっ起
点設定回路2はこの詳細夕を受け、射影の上端を起点と
定めて、上記の走査をヤ   ゛り直す。
所定の距sHは、第3図に示すように、許容される最大
傾斜(傾斜角αmIx)時における文字行の各ブロック
内における射影の高さPrnaxよりも大きく、pma
xと行間のスペースSml nとの和Pmax + S
m1nよりも小さくなるように定められる。
電なり検定回路4は、射影検出回路3から射影に関する
データを受け、隣接するブロック(例えばBLaとst
b )の射影(例えばPlaと1P1b )が互いに重
なっているかどうかを調べる。そして重なっているとき
には、これらの射影を形成する文字行部分(Lla、L
xb )が同一の文字行(CLIIK属するものとの判
定をする。、1つのブロック(例えばBLa )内に文
字行の射影(P3a )が存在し、隣接するブロック(
BLb)内の対応する調査範囲内に文字行の射影が存在
しないとき、上記1つのブロック(8La )内の文字
行部分L3畠と同一の文字行CL3に属する文字行部分
が上記隣接するブロック内にも存在するものと擬制的に
判定する、このよう圧するととKより、空白のブロック
によシ隔てられた同一文字行の文字行部分(L3a、L
sc)を、同一の文字行に属するものとしてg、i*す
ることができる。
小・9タ一/位置検出回路5は、射影検出回路4から射
影に関するデータを受け、射影が所定値よりも短いとき
1画像データルsに基いてその文字行の延びる方向にお
ける黒画素の拡がりt−調べ、それが所定値よりも短い
とき、即ち、ピリオド「、」のような小さいノ々ターン
であるときには、その・臂ターンがブロック内のどちら
側に位置するかを示すデータを発生する。
このデータが与えられたときは、重なり検定回路4は、
上記小・母ターンの位置する側で隣接するブロック内の
射影との重なりを検定するに当たっては、通常と同様に
行ない、反対側で隣接するブロック内の射影との電なり
を検定するに当たっては、上記した、射影が存在しない
場合と同様に処理を行なう。
いずれのブロック内にも、互いに対応する走査範囲に射
影が存在しないときには、一連のmar−タが終端した
ものと判定し、同じ紙面上であっても、次に?mr−夕
が検知されたときは、Im儂?−夕の先端として上記と
同様の処理を行なう。
行検出lal路6は、重なり検定回路4での検定の結果
、同一の文字行に属すると判定された文字行部分の1儂
データを、一つの文字行の詳細夕としてまとめて発生す
る この−性分のデータは、例えば文字切り出し部に送
られる。
以上のように本発明によれば、文字−儂を複数のブロッ
クに分割し、ブロック毎の射影に基いて文字行を抽出す
ることとし九ので、行の傾きが大きい場合にも、また行
が長い場合にも行の抽出を正しく行なうことができる。
【図面の簡単な説明】
第1図1a)および(m)は本発明に係る行抽出方法に
よる文字meの!ロン2分けおよび文字行のゾロツク毎
の射影を示す図、第2図は本発明に係る行抽出方法の実
施に用いられる装置を示すブロック図、第3図は最大傾
斜時における射影の高さと傾斜角が零のときの射影の高
さおよび行間のスペースを示す図である。 1・・・先端検出回路、2・・・起点設定回路、3・・
・射影検出回路%4・・・重なり検定(ロ)路。 5・・・小・臂々−ン位置検出回路、6・・・行検出回
路。 出願人代理人  猪  股   清 (0) (b) 馬2図 市3図

Claims (1)

  1. 【特許請求の範囲】 1、文字画嘗を文字行の砥びるべき方向に対して略垂直
    な方向に延びる仮想@によp、複数のブロックに分割し
    、各ブロック内における各文字行の射影を求め、隣接す
    るブロックの前記射影が互いに重なっているとき、これ
    らの射影を形成する文字行部分が同一の文字行に属する
    ものと判定する行抽出方法。 2 各ブロック内の各文字行部分圧ついて起点を定め、
    この起点から所定の距1IItでの範囲について、文字
    画像のデータを走査することにより、各ブロック内の各
    文字行の射影を求めることを特徴とする特許請求の範囲
    第2項記載の行抽出方法。 3、文字11i1ilの最初の文字行については、文字
    画骨の先端を前記起点とすることを特徴とする特許請求
    の範S第2項記載の行抽出方法。 4、@記最初の文字行力各ブロック内における射影が、
    前記文字Li!ii儂の先端を前記起点とする前記所定
    の距離までの範囲内に収まっていないとき、そのブロッ
    ク内の射影の先端を起点として、七のブロックにつき前
    記文字画像データの走査を再び行なうことt−特徴とす
    る特許請求の範囲第3項記載の行抽出方法。 5、文字画像の最初の文字行以外の文字行の前記文字画
    fJle、f’−夕の走査に際しては、1つ前の文字行
    の各ブロック内における射影の後端t″前記起点とする
    ことを特徴とする特許請求の範囲第2項記載の行抽出方
    法。 6、前記最初の文字行以外の文字行の各ブロック内にお
    ける射影が、1つ前の行の文字行の各ブロック内におけ
    る射影の後端t−前記起点とする前記所定の距離までの
    範囲内に収まっていないとき、そのブロック内の射影の
    先端を起点としてそのブロックにつき前記文字画像r−
    夕の走査を再び行なうことを特徴とする特許請求の範白
    糖5項記載の行抽出方法。 7. 1つのブロック内に文字行の射影が存在し、1I
    llII接するブロック内の対応する走査範囲内に文字
    行の射影が存在しないとき、前記1つのブロック内の文
    字行部分と同一の文字行に属する文字行部分が前記隣接
    するブロック内にも存在するものと判定することt−特
    徴とする特許請求の範囲第2項記載の行抽出方法。
JP56164581A 1981-10-15 1981-10-15 行抽出方法 Pending JPS5866174A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP56164581A JPS5866174A (ja) 1981-10-15 1981-10-15 行抽出方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP56164581A JPS5866174A (ja) 1981-10-15 1981-10-15 行抽出方法

Publications (1)

Publication Number Publication Date
JPS5866174A true JPS5866174A (ja) 1983-04-20

Family

ID=15795884

Family Applications (1)

Application Number Title Priority Date Filing Date
JP56164581A Pending JPS5866174A (ja) 1981-10-15 1981-10-15 行抽出方法

Country Status (1)

Country Link
JP (1) JPS5866174A (ja)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS60254382A (ja) * 1984-05-31 1985-12-16 Toshiba Corp 文字行検出方式
JPS6324382A (ja) * 1986-07-16 1988-02-01 Sumitomo Electric Ind Ltd 光学文字読取装置
JPS63158677A (ja) * 1986-12-23 1988-07-01 Sharp Corp 行切り出し方法
JPS6413686A (en) * 1987-07-07 1989-01-18 Nec Corp System for measuring character size in character string
JPH0233686A (ja) * 1988-07-25 1990-02-02 Fuji Electric Co Ltd 文字列抽出方法

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS60254382A (ja) * 1984-05-31 1985-12-16 Toshiba Corp 文字行検出方式
JPS6324382A (ja) * 1986-07-16 1988-02-01 Sumitomo Electric Ind Ltd 光学文字読取装置
JPS63158677A (ja) * 1986-12-23 1988-07-01 Sharp Corp 行切り出し方法
JPS6413686A (en) * 1987-07-07 1989-01-18 Nec Corp System for measuring character size in character string
JPH0233686A (ja) * 1988-07-25 1990-02-02 Fuji Electric Co Ltd 文字列抽出方法

Similar Documents

Publication Publication Date Title
EP0843275A2 (en) Pattern extraction apparatus and method for extracting patterns
US9747507B2 (en) Ground plane detection
CN100530219C (zh) 图像处理装置
JPH096914A (ja) 画像処理方法及び装置
CN112036232A (zh) 一种图像表格结构识别方法、系统、终端以及存储介质
JPS5866174A (ja) 行抽出方法
JP4224328B2 (ja) 車番認識装置
JPH04270485A (ja) 印刷文字認識装置
CN112215784B (zh) 图像去污方法、装置、可读存储介质及计算机设备
JPH06274788A (ja) ナンバープレート読み取り装置
JP2868134B2 (ja) 画像処理方法及び装置
JPS6325391B2 (ja)
JPS5824265A (ja) フアクシミリ送信機を用いたマ−ク読取方式
JPH02273884A (ja) 文書画像の歪検出補正方法
JPH1196296A (ja) 帳票イメージ処理方法および装置
JPH0799532B2 (ja) 文字切出し装置
JPH0679348B2 (ja) 行切り出し方法
JP2670074B2 (ja) 車両番号認識装置
JP3196755B2 (ja) 文字の傾き検出補正方法ならびに装置
CN117495799A (zh) 一种由边缘成像引起的缺陷检测方法、装置及电子设备
JP4439054B2 (ja) 文字認識装置及び文字枠線の検出方法
JP2000339408A (ja) 文字切り出し装置
JPS6343788B2 (ja)
JPH0632077B2 (ja) 図形認識装置
JPS63101983A (ja) 文字列抽出方式