JPS5866174A - 行抽出方法 - Google Patents
行抽出方法Info
- Publication number
- JPS5866174A JPS5866174A JP56164581A JP16458181A JPS5866174A JP S5866174 A JPS5866174 A JP S5866174A JP 56164581 A JP56164581 A JP 56164581A JP 16458181 A JP16458181 A JP 16458181A JP S5866174 A JPS5866174 A JP S5866174A
- Authority
- JP
- Japan
- Prior art keywords
- character
- line
- projection
- block
- character line
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/14—Image acquisition
- G06V30/146—Aligning or centring of the image pick-up or image-field
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
Landscapes
- Engineering & Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Multimedia (AREA)
- Theoretical Computer Science (AREA)
- Character Input (AREA)
Abstract
(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。
め要約のデータは記録されません。
Description
【発明の詳細な説明】
本発明は、文字1Iii像から文字行を抽出する行抽出
方法KrRする。
方法KrRする。
従来の行抽出方法の一つとして、文字画像?−夕に基い
て、行の始めの部分の射影および行の終りの部分の射影
を求め、これらが互いに電なっているとき、上記始めの
部分と、上記終りの部分とが、同一の行のものであると
判定する方法がある、しかるに、この方法では、行の傾
きが大きいとき、または行が長いときに、1つの行の始
めの部分が隣接する行の終ねの部分と重なって、行の切
出しに失敗するおそれがある。
て、行の始めの部分の射影および行の終りの部分の射影
を求め、これらが互いに電なっているとき、上記始めの
部分と、上記終りの部分とが、同一の行のものであると
判定する方法がある、しかるに、この方法では、行の傾
きが大きいとき、または行が長いときに、1つの行の始
めの部分が隣接する行の終ねの部分と重なって、行の切
出しに失敗するおそれがある。
本発明の目的は、行が傾きが大きいとき、ま几は行が長
いときにも行の抽出を正しく行なうことができる行抽出
方法を提供することにある。
いときにも行の抽出を正しく行なうことができる行抽出
方法を提供することにある。
本発明によれば、文字m1(IIを文字−偉が延びるべ
き方向、例えば第1図に示すように横書きの場合には横
方向、に対して略垂直な方向に延びる仮想線OVa、O
Vbにより複数のブロックBLa。
き方向、例えば第1図に示すように横書きの場合には横
方向、に対して略垂直な方向に延びる仮想線OVa、O
Vbにより複数のブロックBLa。
BLb、BLcに分割し、各ブロック内における各文字
行の射影Pla、Plb、PIC,P2a、P2b、P
2O,−・−を求め、隣接するブロックの射影(例えば
PlaとPlb)とが互いに重なっているかどうかを判
定し、重なっていると判定されたときはこれらの射影(
Pla、Plb )を形成する文字行部分Lla。
行の射影Pla、Plb、PIC,P2a、P2b、P
2O,−・−を求め、隣接するブロックの射影(例えば
PlaとPlb)とが互いに重なっているかどうかを判
定し、重なっていると判定されたときはこれらの射影(
Pla、Plb )を形成する文字行部分Lla。
Llbが同一の文字行CLIKIiするものと判定する
、 各ブロック内における各文字行の射影を求めるKは、例
えば各ブロック内の各文字行部分について起点(5N、
Sla、5jBa、S2b、S2c、S2a’。
、 各ブロック内における各文字行の射影を求めるKは、例
えば各ブロック内の各文字行部分について起点(5N、
Sla、5jBa、S2b、S2c、S2a’。
S2b’、 S2c’、 S3a 、 SSC,S3a
’、 S3c’ )を定め、この起点から所定の距離H
までの範囲について文字1會のデータを走査することと
すればよい。
’、 S3c’ )を定め、この起点から所定の距離H
までの範囲について文字1會のデータを走査することと
すればよい。
第2図は、本発明に係る方法の実施に用いられる装置の
一例を示したものである3N図において、Paは画素信
号で、11i儂をマトリックス状に配列され念多数の画
素に分解し、それぞれの画素の濃淡を2値化して得られ
る信号であり、上方の行から下方の行へ、各行を左から
右へという順序でlIi像ダータメモリから与えられる
。
一例を示したものである3N図において、Paは画素信
号で、11i儂をマトリックス状に配列され念多数の画
素に分解し、それぞれの画素の濃淡を2値化して得られ
る信号であり、上方の行から下方の行へ、各行を左から
右へという順序でlIi像ダータメモリから与えられる
。
lは先端検出回路で画素信号ps@受け、―儂の上端を
探す、この場合、1lllil素めみの黒点は、無視し
、2−素以上の愚テンが見つかったときにその部分を先
端81として記憶する。
探す、この場合、1lllil素めみの黒点は、無視し
、2−素以上の愚テンが見つかったときにその部分を先
端81として記憶する。
2は起点設定回路で、先端検出回路lから先端S1の縦
方向の位置に関するデータを受けるとともに、後述の射
影検出回路3から射影の上端νよび下罐に関するデータ
を受けて、これらのデータに基いて起点を設定する。
方向の位置に関するデータを受けるとともに、後述の射
影検出回路3から射影の上端νよび下罐に関するデータ
を受けて、これらのデータに基いて起点を設定する。
射影検出回路3は、各ブロック内における各文字行の射
影を求める。、これは、起点から所定の距離81での範
囲内の画素信号を順次走査することKよシ行なわれる。
影を求める。、これは、起点から所定の距離81での範
囲内の画素信号を順次走査することKよシ行なわれる。
距離Hまでの範囲の下端まで走査を行なう前に、射影の
下端が検出されたとき、即ち射影の下側に空白の部分が
現われたときは、その箇所までで走査を終える。
下端が検出されたとき、即ち射影の下側に空白の部分が
現われたときは、その箇所までで走査を終える。
そ[7て、射影の上端および下端についてのデータを起
点設定回路2に送る。
点設定回路2に送る。
起点設定回路2は、文字amrsの最初の文字行の射影
を求めるときKは、最初1儂の先端を起点と定める、射
影検出回路3は、上記の起点S1から所定の距離Hの範
囲内に、各ブロック内における文字行の射影が収まって
いるかどうかを調べる。これは、距離81での上記範囲
の下端までに、射影の下端が検出されたかどうかに基い
て調べられる。射影が上記範−内に収まっていないと判
定されたときは、射影の上端(sxa’)関するデータ
を起点設定回路2に与える。起点設定回路2は、このデ
ータに基いて、今度は射影の上端を起点と足める。射影
検出回路3は、新たに定められた起点S1m’ から
所定の距離Hまでの範囲について、1儂データの走査を
行ないそのブロック内の射影を再び求める。新たに定め
られた起点311′から所定の距J1181での範囲内
にも各ブロック内における文字行の射影が収まっていな
いと判定されたときは、文字行の傾斜が過大または、文
字が過大であって、このため一つの文字行の射影と次の
文字行の射影とが互いに重なっていると判断し、原稿を
リジェクトする。
を求めるときKは、最初1儂の先端を起点と定める、射
影検出回路3は、上記の起点S1から所定の距離Hの範
囲内に、各ブロック内における文字行の射影が収まって
いるかどうかを調べる。これは、距離81での上記範囲
の下端までに、射影の下端が検出されたかどうかに基い
て調べられる。射影が上記範−内に収まっていないと判
定されたときは、射影の上端(sxa’)関するデータ
を起点設定回路2に与える。起点設定回路2は、このデ
ータに基いて、今度は射影の上端を起点と足める。射影
検出回路3は、新たに定められた起点S1m’ から
所定の距離Hまでの範囲について、1儂データの走査を
行ないそのブロック内の射影を再び求める。新たに定め
られた起点311′から所定の距J1181での範囲内
にも各ブロック内における文字行の射影が収まっていな
いと判定されたときは、文字行の傾斜が過大または、文
字が過大であって、このため一つの文字行の射影と次の
文字行の射影とが互いに重なっていると判断し、原稿を
リジェクトする。
起点設定回路2ti、上記のよ゛うに射影検出回路3か
ら射影の下端に関するデータを受け、最初の文字行以外
の文字行の射影を求める友めの起点を定める。即ち、各
ブロック内における文字行の射影の下端92a、S2b
、S2c、S3a、S3b、lcを次の文字行CL2.
CL3の各ブロック内における射影検出のための走査範
囲の起点とする。この場合にも、射影検出回路3は上記
の起点5laa、S2b、・・・・・からの所定の距1
11HIでの範囲内に、各ブロック内における文字行の
射影が収まっているかどうかを調べる。収まっていない
と判定されると、射影の上端!!2m’、 Sob’・
・・・・K関するデータを起点設定回路2に与えるっ起
点設定回路2はこの詳細夕を受け、射影の上端を起点と
定めて、上記の走査をヤ ゛り直す。
ら射影の下端に関するデータを受け、最初の文字行以外
の文字行の射影を求める友めの起点を定める。即ち、各
ブロック内における文字行の射影の下端92a、S2b
、S2c、S3a、S3b、lcを次の文字行CL2.
CL3の各ブロック内における射影検出のための走査範
囲の起点とする。この場合にも、射影検出回路3は上記
の起点5laa、S2b、・・・・・からの所定の距1
11HIでの範囲内に、各ブロック内における文字行の
射影が収まっているかどうかを調べる。収まっていない
と判定されると、射影の上端!!2m’、 Sob’・
・・・・K関するデータを起点設定回路2に与えるっ起
点設定回路2はこの詳細夕を受け、射影の上端を起点と
定めて、上記の走査をヤ ゛り直す。
所定の距sHは、第3図に示すように、許容される最大
傾斜(傾斜角αmIx)時における文字行の各ブロック
内における射影の高さPrnaxよりも大きく、pma
xと行間のスペースSml nとの和Pmax + S
m1nよりも小さくなるように定められる。
傾斜(傾斜角αmIx)時における文字行の各ブロック
内における射影の高さPrnaxよりも大きく、pma
xと行間のスペースSml nとの和Pmax + S
m1nよりも小さくなるように定められる。
電なり検定回路4は、射影検出回路3から射影に関する
データを受け、隣接するブロック(例えばBLaとst
b )の射影(例えばPlaと1P1b )が互いに重
なっているかどうかを調べる。そして重なっているとき
には、これらの射影を形成する文字行部分(Lla、L
xb )が同一の文字行(CLIIK属するものとの判
定をする。、1つのブロック(例えばBLa )内に文
字行の射影(P3a )が存在し、隣接するブロック(
BLb)内の対応する調査範囲内に文字行の射影が存在
しないとき、上記1つのブロック(8La )内の文字
行部分L3畠と同一の文字行CL3に属する文字行部分
が上記隣接するブロック内にも存在するものと擬制的に
判定する、このよう圧するととKより、空白のブロック
によシ隔てられた同一文字行の文字行部分(L3a、L
sc)を、同一の文字行に属するものとしてg、i*す
ることができる。
データを受け、隣接するブロック(例えばBLaとst
b )の射影(例えばPlaと1P1b )が互いに重
なっているかどうかを調べる。そして重なっているとき
には、これらの射影を形成する文字行部分(Lla、L
xb )が同一の文字行(CLIIK属するものとの判
定をする。、1つのブロック(例えばBLa )内に文
字行の射影(P3a )が存在し、隣接するブロック(
BLb)内の対応する調査範囲内に文字行の射影が存在
しないとき、上記1つのブロック(8La )内の文字
行部分L3畠と同一の文字行CL3に属する文字行部分
が上記隣接するブロック内にも存在するものと擬制的に
判定する、このよう圧するととKより、空白のブロック
によシ隔てられた同一文字行の文字行部分(L3a、L
sc)を、同一の文字行に属するものとしてg、i*す
ることができる。
小・9タ一/位置検出回路5は、射影検出回路4から射
影に関するデータを受け、射影が所定値よりも短いとき
1画像データルsに基いてその文字行の延びる方向にお
ける黒画素の拡がりt−調べ、それが所定値よりも短い
とき、即ち、ピリオド「、」のような小さいノ々ターン
であるときには、その・臂ターンがブロック内のどちら
側に位置するかを示すデータを発生する。
影に関するデータを受け、射影が所定値よりも短いとき
1画像データルsに基いてその文字行の延びる方向にお
ける黒画素の拡がりt−調べ、それが所定値よりも短い
とき、即ち、ピリオド「、」のような小さいノ々ターン
であるときには、その・臂ターンがブロック内のどちら
側に位置するかを示すデータを発生する。
このデータが与えられたときは、重なり検定回路4は、
上記小・母ターンの位置する側で隣接するブロック内の
射影との重なりを検定するに当たっては、通常と同様に
行ない、反対側で隣接するブロック内の射影との電なり
を検定するに当たっては、上記した、射影が存在しない
場合と同様に処理を行なう。
上記小・母ターンの位置する側で隣接するブロック内の
射影との重なりを検定するに当たっては、通常と同様に
行ない、反対側で隣接するブロック内の射影との電なり
を検定するに当たっては、上記した、射影が存在しない
場合と同様に処理を行なう。
いずれのブロック内にも、互いに対応する走査範囲に射
影が存在しないときには、一連のmar−タが終端した
ものと判定し、同じ紙面上であっても、次に?mr−夕
が検知されたときは、Im儂?−夕の先端として上記と
同様の処理を行なう。
影が存在しないときには、一連のmar−タが終端した
ものと判定し、同じ紙面上であっても、次に?mr−夕
が検知されたときは、Im儂?−夕の先端として上記と
同様の処理を行なう。
行検出lal路6は、重なり検定回路4での検定の結果
、同一の文字行に属すると判定された文字行部分の1儂
データを、一つの文字行の詳細夕としてまとめて発生す
る この−性分のデータは、例えば文字切り出し部に送
られる。
、同一の文字行に属すると判定された文字行部分の1儂
データを、一つの文字行の詳細夕としてまとめて発生す
る この−性分のデータは、例えば文字切り出し部に送
られる。
以上のように本発明によれば、文字−儂を複数のブロッ
クに分割し、ブロック毎の射影に基いて文字行を抽出す
ることとし九ので、行の傾きが大きい場合にも、また行
が長い場合にも行の抽出を正しく行なうことができる。
クに分割し、ブロック毎の射影に基いて文字行を抽出す
ることとし九ので、行の傾きが大きい場合にも、また行
が長い場合にも行の抽出を正しく行なうことができる。
第1図1a)および(m)は本発明に係る行抽出方法に
よる文字meの!ロン2分けおよび文字行のゾロツク毎
の射影を示す図、第2図は本発明に係る行抽出方法の実
施に用いられる装置を示すブロック図、第3図は最大傾
斜時における射影の高さと傾斜角が零のときの射影の高
さおよび行間のスペースを示す図である。 1・・・先端検出回路、2・・・起点設定回路、3・・
・射影検出回路%4・・・重なり検定(ロ)路。 5・・・小・臂々−ン位置検出回路、6・・・行検出回
路。 出願人代理人 猪 股 清 (0) (b) 馬2図 市3図
よる文字meの!ロン2分けおよび文字行のゾロツク毎
の射影を示す図、第2図は本発明に係る行抽出方法の実
施に用いられる装置を示すブロック図、第3図は最大傾
斜時における射影の高さと傾斜角が零のときの射影の高
さおよび行間のスペースを示す図である。 1・・・先端検出回路、2・・・起点設定回路、3・・
・射影検出回路%4・・・重なり検定(ロ)路。 5・・・小・臂々−ン位置検出回路、6・・・行検出回
路。 出願人代理人 猪 股 清 (0) (b) 馬2図 市3図
Claims (1)
- 【特許請求の範囲】 1、文字画嘗を文字行の砥びるべき方向に対して略垂直
な方向に延びる仮想@によp、複数のブロックに分割し
、各ブロック内における各文字行の射影を求め、隣接す
るブロックの前記射影が互いに重なっているとき、これ
らの射影を形成する文字行部分が同一の文字行に属する
ものと判定する行抽出方法。 2 各ブロック内の各文字行部分圧ついて起点を定め、
この起点から所定の距1IItでの範囲について、文字
画像のデータを走査することにより、各ブロック内の各
文字行の射影を求めることを特徴とする特許請求の範囲
第2項記載の行抽出方法。 3、文字11i1ilの最初の文字行については、文字
画骨の先端を前記起点とすることを特徴とする特許請求
の範S第2項記載の行抽出方法。 4、@記最初の文字行力各ブロック内における射影が、
前記文字Li!ii儂の先端を前記起点とする前記所定
の距離までの範囲内に収まっていないとき、そのブロッ
ク内の射影の先端を起点として、七のブロックにつき前
記文字画像データの走査を再び行なうことt−特徴とす
る特許請求の範囲第3項記載の行抽出方法。 5、文字画像の最初の文字行以外の文字行の前記文字画
fJle、f’−夕の走査に際しては、1つ前の文字行
の各ブロック内における射影の後端t″前記起点とする
ことを特徴とする特許請求の範囲第2項記載の行抽出方
法。 6、前記最初の文字行以外の文字行の各ブロック内にお
ける射影が、1つ前の行の文字行の各ブロック内におけ
る射影の後端t−前記起点とする前記所定の距離までの
範囲内に収まっていないとき、そのブロック内の射影の
先端を起点としてそのブロックにつき前記文字画像r−
夕の走査を再び行なうことを特徴とする特許請求の範白
糖5項記載の行抽出方法。 7. 1つのブロック内に文字行の射影が存在し、1I
llII接するブロック内の対応する走査範囲内に文字
行の射影が存在しないとき、前記1つのブロック内の文
字行部分と同一の文字行に属する文字行部分が前記隣接
するブロック内にも存在するものと判定することt−特
徴とする特許請求の範囲第2項記載の行抽出方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP56164581A JPS5866174A (ja) | 1981-10-15 | 1981-10-15 | 行抽出方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP56164581A JPS5866174A (ja) | 1981-10-15 | 1981-10-15 | 行抽出方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
JPS5866174A true JPS5866174A (ja) | 1983-04-20 |
Family
ID=15795884
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP56164581A Pending JPS5866174A (ja) | 1981-10-15 | 1981-10-15 | 行抽出方法 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JPS5866174A (ja) |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS60254382A (ja) * | 1984-05-31 | 1985-12-16 | Toshiba Corp | 文字行検出方式 |
JPS6324382A (ja) * | 1986-07-16 | 1988-02-01 | Sumitomo Electric Ind Ltd | 光学文字読取装置 |
JPS63158677A (ja) * | 1986-12-23 | 1988-07-01 | Sharp Corp | 行切り出し方法 |
JPS6413686A (en) * | 1987-07-07 | 1989-01-18 | Nec Corp | System for measuring character size in character string |
JPH0233686A (ja) * | 1988-07-25 | 1990-02-02 | Fuji Electric Co Ltd | 文字列抽出方法 |
-
1981
- 1981-10-15 JP JP56164581A patent/JPS5866174A/ja active Pending
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS60254382A (ja) * | 1984-05-31 | 1985-12-16 | Toshiba Corp | 文字行検出方式 |
JPS6324382A (ja) * | 1986-07-16 | 1988-02-01 | Sumitomo Electric Ind Ltd | 光学文字読取装置 |
JPS63158677A (ja) * | 1986-12-23 | 1988-07-01 | Sharp Corp | 行切り出し方法 |
JPS6413686A (en) * | 1987-07-07 | 1989-01-18 | Nec Corp | System for measuring character size in character string |
JPH0233686A (ja) * | 1988-07-25 | 1990-02-02 | Fuji Electric Co Ltd | 文字列抽出方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
EP0843275A2 (en) | Pattern extraction apparatus and method for extracting patterns | |
US9747507B2 (en) | Ground plane detection | |
CN100530219C (zh) | 图像处理装置 | |
JPH096914A (ja) | 画像処理方法及び装置 | |
CN112036232A (zh) | 一种图像表格结构识别方法、系统、终端以及存储介质 | |
JPS5866174A (ja) | 行抽出方法 | |
JP4224328B2 (ja) | 車番認識装置 | |
JPH04270485A (ja) | 印刷文字認識装置 | |
CN112215784B (zh) | 图像去污方法、装置、可读存储介质及计算机设备 | |
JPH06274788A (ja) | ナンバープレート読み取り装置 | |
JP2868134B2 (ja) | 画像処理方法及び装置 | |
JPS6325391B2 (ja) | ||
JPS5824265A (ja) | フアクシミリ送信機を用いたマ−ク読取方式 | |
JPH02273884A (ja) | 文書画像の歪検出補正方法 | |
JPH1196296A (ja) | 帳票イメージ処理方法および装置 | |
JPH0799532B2 (ja) | 文字切出し装置 | |
JPH0679348B2 (ja) | 行切り出し方法 | |
JP2670074B2 (ja) | 車両番号認識装置 | |
JP3196755B2 (ja) | 文字の傾き検出補正方法ならびに装置 | |
CN117495799A (zh) | 一种由边缘成像引起的缺陷检测方法、装置及电子设备 | |
JP4439054B2 (ja) | 文字認識装置及び文字枠線の検出方法 | |
JP2000339408A (ja) | 文字切り出し装置 | |
JPS6343788B2 (ja) | ||
JPH0632077B2 (ja) | 図形認識装置 | |
JPS63101983A (ja) | 文字列抽出方式 |