JP2623844B2 - 文字行抽出装置 - Google Patents

文字行抽出装置

Info

Publication number
JP2623844B2
JP2623844B2 JP1198770A JP19877089A JP2623844B2 JP 2623844 B2 JP2623844 B2 JP 2623844B2 JP 1198770 A JP1198770 A JP 1198770A JP 19877089 A JP19877089 A JP 19877089A JP 2623844 B2 JP2623844 B2 JP 2623844B2
Authority
JP
Japan
Prior art keywords
character
block
blocks
line
extracting
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP1198770A
Other languages
English (en)
Other versions
JPH0362284A (ja
Inventor
善丈 辻
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Priority to JP1198770A priority Critical patent/JP2623844B2/ja
Publication of JPH0362284A publication Critical patent/JPH0362284A/ja
Application granted granted Critical
Publication of JP2623844B2 publication Critical patent/JP2623844B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Character Input (AREA)
  • Document Processing Apparatus (AREA)

Description

【発明の詳細な説明】 (産業上の利用分野) 本発明は文字行抽出装置に関し、特に印刷文書や郵便
物上の住所名等を読み取る文字認識装置等に利用して有
益で紙面上等に記載された複数個の文字行を抽出する文
字行抽出装置に関する。
(従来の技術) 既存印刷文書や郵便物上の住所名の各文字を文字認識
技術を利用して読み取るためには、紙面上に手書きまた
は印刷された文字を光学的に走査し、通常、2値量子化
処理を施した後、最初に紙面上に記載された文字行領域
を抽出する処理を行う必要がある。この文字行抽出処理
において、郵便物の如く、手書き文字サイズの変動等に
起因して文字行の傾きが生じたり、紙面上の傾きが生じ
ると、文字行抽出精度が劣化したり、あるいは文字行抽
出処理が困難となる場合が生じる。
従来、このような文字行抽出方法として、例えば「書
式指定情報によらない紙面構成要素抽出法」(電子情報
通信学会論文誌D Vol.J66−D No.1,pp111〜113 19
83年)に示されているように、印刷文書を対象に周辺分
布等により文字行を抽出する方法(第1の従来方法)が
ある。
また、別の文字行抽出方法として、例えば「対象文書
に関する知識を援用した手書き文書からの文字切り出し
の一提案」(電子情報通信学会 パターン認識と学習研
究報告PRL85−63)に示されているように、ラベリング
処理等により抽出された文字塊領域を囲む最小矩形ブロ
ックからマージ処理により近隣する矩形ブロック間の統
合、更には、傾き検出等を行う方法(第2の方法)があ
る。
(発明が解決しようとする課題) 以上述べた従来方法のうち、第1の従来方法では、予
め傾き補正処理を行う必要があり、処理速度の面でもコ
ストパフォーマンスが十分ではない。また郵便物上の手
書きで記載された住所行等を対象とすると、文字サイズ
の変動等が原因となり、文字行抽出処理が困難となる場
合が生じる。
一方、第2の従来方法においても、例えば、手書き文
字サイズの変動、漢字等に見られる分離文字の存在等に
より文字行や文字行の傾き精度が劣化することがある。
本発明の目的は、従来の文字行の傾きや手書き文字サ
イズの変動、更には分離文字が存在しても、文字行を精
度良く抽出するために、ラベリング処理等により抽出さ
れた複数個の文字塊ブロック間の配置関係に着目して文
字行の抽出を行うとともに文字行の傾きを精度良く検出
するようにした文字行抽出装置を提供することにある。
(課題を解決するための手段) 前述の課題を解決するために本発明が提供する第1の
文字行抽出装置は、紙面等の背景と分離可能な複数個の
文字塊ブロックを抽出する手段と、任意の2つの文字塊
ブロック間の上下および左右の方向に関する距離または
重なり具合を求め、前記距離または重なり具合に従って
各文字塊ブロック間の上下および左右方向のつながり関
係を表す複数個の文字塊ブロック間の配置関係を抽出す
る配置関係抽出手段と、複数個の文字塊ブロック間の配
置関係を用いて、上下または左右いづれか所定方向に並
ぶ複数個の文字塊ブロックを検出し、所定方向の複数個
の文字行を生成する行分類手段と、生成された各文字行
内の複数個の文字塊ブロックのうち、前記所定方向と異
なる方向の配置関係を有する複数個の文字塊ブロックを
統合するブロック統合手段と、前記文字行内の統合され
た前記複数個の文字塊ブロックの中心等の所定の特徴値
に基づいて、前記文字行の傾き値を抽出する手段とを備
える。
また、前述の課題を解決するために本発明が提供する
第2の文字行抽出装置は、紙面等の背景と分離可能な複
数個の文字塊ブロックを抽出する手段と、任意の2つの
文字塊ブロック間の上下および左右の方向に関する距離
または重なり具合を求め、前記距離または重なり具合に
従って各文字塊ブロック間の上下および左右方向のつな
がり関係を表す複数個の文字塊ブロック間の配置関係を
抽出する配置関係抽出手段と、複数個の文字塊ブロック
間の配置関係を用いて、上下または左右いづれか所定方
向に並ぶ複数個の文字塊ブロックを検出し、所定方向の
複数個の文字行を生成する行分類手段と、生成された各
文字行内の複数個の文字塊ブロックのうち、前記所定方
向と異なる方向の配置関係を有する複数個の文字塊ブロ
ックを統合するブロック統合手段と、前記文字行内の複
数個の文字塊ブロックの中心、下端等の複数の特徴値に
基づいて、前記文字行の前記複数の特徴に対する傾き値
および推定誤差を有する傾きを選択することによって前
記文字行の傾き値を抽出する手段とを備える。
(実施例) 以下、本発明の実施例について図面を参照しながら説
明する。
第1図(a)〜(d)は、本発明における各文字塊ブ
ロック間の配置関係に基づいて各文字塊を分類する原理
を示す一例である。
第1図(a)において、斜線部は文字列イメージを示
し、記号bi(i=1,2,…6)は文字部分のイメージを囲
む矩形ブロック(以下、文字塊ブロック)を示してい
る。ここで、このような文字塊ブロックの抽出は、ラベ
リング処理や輪郭追跡等の公知の技術を用いて実現でき
る。尚、第1図(a)の点線で示した文字塊ブロック図
b6は、文字塊b4に包含されるため、文字塊ブロックb4
統合されるものとする。
第1図(b)は、2つの文字塊ブロック図b1,b2の左
右方向の配置関係の検査方法を説明するための図であ
る。
尚、第1図(b)を用いて左右方向の配置関係検査方
法について説明するが、上下方向についても同様であ
る。
第1図(b)において、記号d1,2は文字塊ブロックb
1,b2間の距離を示している。また、記号l1およびl2は、
それぞれ文字塊ブロック図の高さ、即ち、図中x軸方向
への射影を示している。更に、図中点線で示したl1∩l2
は、文字塊ブロックb1,b2の左右方向の重なり量を示し
ている。
そこで、文字塊ブロックb1,b2の左右方向への重なり
具合を示す尺度の一例として、例えば、2つの文字塊ブ
ロックb1,b2のx軸方向への射影のうち、最小となる
値、即ちmin(l1,l2)と文字塊ブロックb1,b2の左右方
向への重なり量l1∩l2との比l1∩l2/min(l1,l2)(以
下、重なり尺度と呼ぶ)を用いることができる。上記文
字塊ブロックb1,とb2との重なり尺度S1,2は、0から1
の範囲を示し、0の場合には全く左右方向に重なりを持
たないことを示す。
尚、2つの文字塊ブロックが重なりを持つか否かの判
定は、上記重なり尺度を予め定められた固定的なしきい
値Ts(但し、0<Ts<1)により決定しても良いし、前
記しきい値Tsを上記文字塊ブロック間の距離dにより動
的に変更させながら決定しても良い。
次に、上下または左右の配置関係の有無は、上記重な
り尺度αおよび文字塊ブロック間の距離dをそれぞれし
きい値TsおよびTdにより判定する。即ち、2つの文字塊
ブロックbi,bjの所定方向(上下または左右方向)に対
して、重なり尺度α=li∩lj/min(li,lj)が、しきい
値Tsより大きく、且つ文字塊ブロック間距離di,jがし
きい値Tdより小さい時、所定方向の配置関係が成立する
とする。
第1図(c)は、第1図(a)で示した文字塊ブロッ
クb1,b2,b3,b4,b5に対する上下方向および左右方向の配
置関係を抽出し、マトリックスとして表現したものであ
る。
尚、第1図(a)における上下方向および左右方向の
配置関係は、2つの文字塊ブロックbi,bj(i=j,i,j=
1,2,…5)の重なり尺度αi,jのしきい値Tsを0.9程度、
文字塊間距離di,jのしきい値Tdを第1図(a)の1文
字程度に設定した場合の一例であるが、上記しきい値以
外に限定されるものではない。
第1図(c)のマトリックス内の値1(または−1)
は、マトリックスの列上の文字ブロックbiに対して、マ
トリックスの行上の文字ブロックがそれぞれ下方向(ま
た上方向)に配置されていることを示す。同様に、マト
リックス内の値2(または−2)は、それぞれ左方向ま
たは(右方向)に配置されることを示す。例えば、第1
図(c)から文字塊ブロックb1とb4は上下方向の配置関
係を満足し、文字塊ブロックb1とb2は左右方向の配置関
係を満足することがわかる。ここで、上記マトリックス
は、配置関係の有無を示す値1と−1あるいは2と−2
が対象形をとるから、マトリックスの対角線から下半分
は省略できる。尚、第1図(c)で示した2つの文字塊
ブロックbi,bj(i=j,i,j=1,2,…5)の配置関係抽出
時の関連した特徴量として、文字塊ブロック間距離d
i,jや重なり尺度αi,j等も抽出されるものとする。
第1図(d)は、第1図(a)で示した縦書き文字行
Lを第1図(c)から抽出する一例を示したものであ
る。
最初に第1図(c)の配置関係から部分文字行L1,L2,
L3,L4が容易に算出できる。即ち、文字ブロックb1とb4
は上下関係が成立するため、文字塊ブロックb1,b4から
構成される部分文字行L1が抽出できる。(L1∈(b1,
b4))、同様に文字塊ブロックb2,b4から構成される部
分文字行L2(L2∈(b2,b4))、部分文字行L3∈(b3,
b4,b5)L4∈(b4,b5)となる。
次に、上述して求めた部分文字行L1,L2,L3,L4に対し
て、共通する文字塊ブロックを含む部分文字行を順次統
合することにより、第1図(a)で示した文字行Lを抽
出することができる。即ち、部分文字行L1とL2では共通
する文字ブロックb4を持ち、統合された部分文字行と部
分文字行L3では共通する文字ブロックb4をもつ。その結
果として、文字塊ブロックb1,b2,b3,b4,b5を含むブロッ
ク即ち第1図(a)の点線で示す縦書きの文字行Lが抽
出できる。ここで、第1図(c)で示した各文字塊ブロ
ック間の配置関係を用いることによって、第1図(a)
の点線で示す縦書きの文字行Lを抽出する機能は、第4
図ないし第5図に示す本願発明の一実施例における配置
関係抽出部11および行分類部8で実現される。
次に、文字行L内の各文字塊を用いて安定に文字行の
傾きを抽出するためのブロック統合処理について説明す
る。そこで、文字行Lに含まれる文字塊ブロックb1,b2,
b3,b4,b5を対象として、左右の配置関係を有する文字塊
ブロックを同様に第1図(c)で示したマトリックスを
用いて算出する。即ち、文字塊ブロックb1,b2,b3が左右
関係を満足し、それらの文字塊ブロックを統合したブロ
ックとして、第1図(a)の図中、点線で示した文字塊
ブロックcを生成することができる。
文字塊ブロックcの抽出は、文字行Lの傾き検出を安
定に行うために導入したものであり、第1図(a)で示
す文字行2の傾き検出は、文字塊ブロックb1,b2,b3の代
わりに、文字塊ブロックc,b4,b5を用いて行われること
になる。
第2図は、第1図を用いて説明した文字行抽出方法を
適用して、手書きされた文字行を抽出した一例を示して
いる。尚、第2図は、横書きの手書きされた文字列であ
るために、左右方向の配置関係によって分類されて文字
行が抽出されることになる。
第2図において、各文字塊ブロック間の左右方向の配
置関係を第1図で説明した重なり尺度のしきい値Tsおよ
び文字塊ブロック間距離のしきい値Tdを用いて求め、各
文字塊ブロックb1(i=1…17)を分類すると、(b1,b
2,b3,b4),(b4,b5,b6),(b5,b7),(b6,b7),(b
7,b8,b9),(b8,b10),(b9,b10),(b11,b12),
(b12,b13),(b13,b14,b15),(b14,b15,b16),(b
15,b16,b17),(b16,b17)が得られ、共通する文字塊
ブロックを検出し、統合処理を行うと、図中、点線で示
す2つの文字行L1∈(b1,b2,b3,b4,b5,b6,b7,b8,b9,
b10),L2∈(b11,b12,b13,b14,b15,b14,b17)が得られ
る。
即ち、第2図の点線で示した2つの文字行L1,L2の如
く、傾きが生じたり、文字サイズの変動が生じても安定
に文字行の抽出が行える。
次に、抽出された各文字行の傾きが安定に検出するた
めに、文字行を形成する各文字塊ブロックを対象にし
て、上下方向の配置関係を有する文字塊ブロックを求
め、統合される。そこで、第2図で示した文字行L1に含
まれる各文字塊ブロックbi(i=1…10)のうち、上下
方向の配置関係を有する文字塊ブロック図は、文字塊ブ
ロック図b5とb6およびb8とb9があり、2つの文字塊ブロ
ックb18,b19が生成される。そこで、文字行Lの傾き検
出には、第2図における文字塊ブロックb1,b2,b3,b4,b
18,b7,b19,b10が用いられることになる。
第3図は、第1の実施例の文字行抽出装置で利用され
る文字行傾き検出処理、即ち、第5図本発明の実施例で
示すブロック中心算出部14、傾き算出部15に相当する機
能を説明するための図である。
第3図における座標値(x1,y1),(x2,y2),(x3,y
3),(x4,y4),(x5,y5),(x6,y6),(x7,y7),
(x8,y8)はそれぞれ、第2図で説明した文字行L1の各
文字塊ブロックb1,b2,b3,b4,b18,b7,b19,b10の中心座標
とする。尚、本発明における傾き検出は、各文字塊ブロ
ックの中心座標に限定されるものではなく、下端座標や
上端座標を用いることもできる。
傾き検出方法は、通常統計処理等の分野で用いられる
最小2乗法による直線のあてはめ問題として求めること
かできる。即ち、n個の座標(xi,yi)(i=1,2…n)
に対して、これらの座標値を直線Y=θx+ε(但し、
θは傾き、ξはy切片)にあてはめる時、誤差 が最小になるように、θ,ξの値を定められば良い。こ
のような最小2乗法による直線のあてはめを行った場
合、θ,ξの値は、n個の座標(xi,yi)を用いて次の
式で表される。
ξ=−θ (2) 但し、 そこで第3図で示した8個の文字塊ブロックの中心座
標に対する傾き値θの検出は、式(1)および式
(3),(4),(5),(6)(但し、n=8)を適
用することによって求められる。更に、式(2)を用い
てy切片ξも算出すれば、第3図の実線で示す直線を検
出することができる。
第4図は、本発明の第2の実施例の文字行抽出装置で
利用される文字行傾き検出処理、即ち、第6図本発明の
実施例で示すブロック中心算出部14、ブロック下端算出
部18、傾き算出部16、誤差比較部17に相当する機能を説
明するために用いた図である。
図中、矩形で示した文字塊ブロック図bi(i=1,…
6)は、第2図で述べたように、各文字塊ブロックの左
右方向の配置関係検査により横書き文字行の形成および
上下方向の配置関係検査による統合が終了しているもの
とする。また、第3図の図中黒丸●は、各文字塊ブロッ
クの中心座標値を表し、図中白丸○は各文字塊ブロック
の下端座標値を示すものとする。
第4図は、文字行の傾き検出が、各文字塊ブロックの
特徴量として、中心座標値よりも下端座標値を用いる方
がより安定に抽出される一例であるが、第3図で示した
如く、中心座標値を用いた方が良い場合もある。そこ
で、各文字塊ブロックの中心座標値を用いて得られた傾
き値θと各文字塊ブロックの下端座標値を用いて得ら
れた傾き値θのどちらか一方精度の良い方を選択すれ
ば良い。そこで、前述した誤差Seが小さい方の傾き値θ
(j=1または2)を選択することができる。尚、前
述した誤差Seは、式(7)を用いて算出することができ
る。
Se=Sy−ξ・Sxy (7) 但し、 第4図の例では、式(7)で示した誤差Seに関して、
傾き値θを持つ直線の方が傾きθを持つ直線の方よ
り大きくなるために、傾きθを持つ直線が選択される
ことになる。
第5図は、第1の実施例の文字行抽出装置の一例を示
す機能ブロック図である。1は、画像メモリであり、紙
面上に記載された複数個の文字行を光学的に走査し、2
値量子化後、複数個の文字行イメージとして記憶する。
2は、文字塊ブロック抽出部であり、第1図(a)で示
したように、複数個の文字部イメージを囲む矩形ブロッ
ク、即ち、文字塊ブロックを抽出し、文字塊ブロック記
憶部3に順次格納する。11は、配置関係抽出部であり、
重なり計測部4および距離計測部5および配置関係判定
部6から構成される。
配置関係抽出部10では、文字塊ブロック記憶部3から
複数個の文字塊ブロックを読み出し、最初に重なり計測
部4および距離計測部5によって、第1図(b)で示し
たように文字塊ブロック間の重なり尺度および距離が順
次計測される。次に判定部6において予め設定された重
なり尺度及び距離に関するしきい値Ts,Tdと比較され、
第1図(c)で説明したように、上下および左右方向に
おける文字塊ブロック間の配置関係情報を算出し、配置
関係記憶部7に格納する。
尚、第1図(a)で示した包含関係を満たす文字塊ブ
ロックは、配置関係抽出部10において、通常の統合処理
を行うものとする。
8は行分類部であり、第1図(d)で説明したよう
に、方向パラメータ記憶部9に格納された所定方向(上
下または左右方向)に対する文字塊ブロック間の配置関
係情報を配置関係記憶部7から読み出し、これを用いて
所定方向の文字行を形成する文字塊ブロック毎に分類
し、分類された各文字塊ブロックの位置・大きさ等の情
報を行分類結果記憶部10に格納する。ブロック統合部12
は、各文字行に属する複数個の文字塊ブロックを対象と
して、上述した所定方向と異なる方向に対する文字塊ブ
ロック間の配置関係情報を配置関係記憶部7から読み出
し、これを用いて上記異なる方向の配置関係を有する複
数個の文字塊ブロックを統合し、統合処理の結果得られ
る複数個の各文字塊ブロックの位置・大きさから形成で
きる文字行ブロックとそれに属する各文字塊ブロックを
文字行記憶部13に転送する。
次に、各文字行ブロック毎に文字行の傾きが算出され
る。
まず、ブロック中心算出部14は文字塊ブロックの位置
・大きさにより第3図で示したように文字塊ブロックの
中心座標値(xi,yi)を算出する。尚、前述した文字塊
ブロックの中心座標位置の代わりに文字塊ブロックの下
端や上端座標値を用いても良い。
次に、傾き値算出部15は、各文字行ブロック内の複数
個の文字塊ブロックの中心座標値(xi,yi)(i=1,2,
…n)に対して前述した式(1)および式(3),式
(4),式(5),式(6)を用いて傾き値θおよび式
(2)を用いて直線のy座標の切片ξを算出し、各文字
行の傾き情報として文字行記憶部13に格納する。
第6図は、第2の実施例の文字行抽出装置の一例を示
す機能ブロック図である。画像メモリ1、文字塊ブロッ
ク抽出部2、文字塊ブロック記憶部3、配置関係記憶部
7、行分類部8、方向パラメータ記憶部9、行分類結果
記憶部10、配置関係抽出部11、ブロック統合部12、文字
行記憶部13、ブロック中心算出部14は第5図の文字行抽
出装置で述べた機能と同等な機能を有する。
上記実施例の文字行抽出装置では、各文字行ブロック
に属する複数個の文字塊ブロックに対して、ブロック中
心部14において、各文字塊ブロックの中心座標値を算出
し、更にブロック下端算出部18において各文字塊ブロッ
クの下端座標値が算出される。尚、傾き値算出を行う各
文字塊ブロックの特徴として、中心座標値や下端座標値
を取り上げたが、重心や上端等の複数の特徴を適用して
も良い。
次に、傾き算出部16は、各文字行ブロック内の複数個
の文字塊ブロックの中心座標値および下端座標値のそれ
ぞれに対して、式(1)、式(2)、式(3)、式
(4)、式(5)、式(6)、式(7)および式(8)
を用いて、中心座標値に対する傾き値θ、直線y座標
切片ξ、誤差Se1および下端座標値に対する傾き値θ
、直線のy座標切片ξ、誤差Se2を算出する。
誤差比較部17において、中心座標値と下端座標値のそ
れぞれに対する誤差Se1およびSe2のうち、いずれか小さ
い方を検出することによって、最小となる誤差を有する
傾き値θ(i=1または2)および直線のy座標切片
ξ(i=1または2)が選択され、各文字行の傾き情
報として文字行記憶部13に格納される。
(発明の効果) 以上説明したように、本発明によれば、文字行の傾き
や手書き文字サイズの変動、更には分離文字が存在して
も、安定にしかも精度良く、文字行の傾き情報を含めて
文字行が抽出できる装置を提供できる。
【図面の簡単な説明】
第1図は本発明における各文字塊ブロック間の配置関係
に基づいて各文字塊ブロック図を分類し、文字行を抽出
する原理を示す図、第2図は傾きを有する文字行の抽出
例を示す図、第3図は第1の実施例の文字行抽出装置で
利用される文字行傾き検出を説明する図、第4図は第2
の実施例の文字行抽出装置で利用される文字行傾き検出
を説明する図、第5図は第1の実施例の文字行抽出装置
の一例を示す機能ブロック図、第6図は第2の実施例の
文字行抽出装置の一例を示す機能ブロック図である。 1……画像メモリ、2……文字塊ブロック抽出部、3…
…文字塊ブロック記憶部、4……重なり計測部、5……
距離計算部、6……判定部、7……配置関係記憶部、8
……行分類部、9……方向パラメータ記憶部、10……行
分類結果記憶部、11……配置関係抽出部、12……ブロッ
ク統合部、13……文字行記憶部、14……ブロック中心算
出部、15……第1の実施例の傾き算出部、16……第2の
実施例の傾き算出部、17……誤差比較部、18……ブロッ
ク下端算出部。

Claims (2)

    (57)【特許請求の範囲】
  1. 【請求項1】紙面等の背景と分離可能な複数個の文字塊
    ブロックを抽出する手段と、任意の2つの文字塊ブロッ
    ク間の上下および左右の方向に関する距離または重なり
    具合を求め、前記距離または重なり具合に従って各文字
    塊ブロック間の上下および左右方向のつながり関係を表
    す複数個の文字塊ブロック間の配置関係を抽出する配置
    関係抽出手段と、複数個の文字塊ブロック間の配置関係
    を用いて、上下または左右いづれか所定方向に並ぶ複数
    個の文字塊ブロックを検出し、所定方向の複数個の文字
    行を生成する行分類手段と、生成された各文字行内の複
    数個の文字塊ブロックのうち、前記所定方向と異なる方
    向の配置関係を有する複数個の文字塊ブロックを統合す
    るブロック統合手段と、前記文字行内の統合された前記
    複数個の文字塊ブロックの中心等の所定の特徴値に基づ
    いて、前記文字行の傾き値を抽出する手段とを備えるこ
    とを特徴とする文字行抽出装置。
  2. 【請求項2】紙面等の背景と分離可能な複数個の文字塊
    ブロックを抽出する手段と、任意の2つの文字塊ブロッ
    ク間の上下および左右の方向に関する距離または重なり
    具合を求め、前記距離または重なり具合に従って各文字
    塊ブロック間の上下および左右方向のつながり関係を表
    す複数個の文字塊ブロック間の配置関係を抽出する配置
    関係抽出手段と、複数個の文字塊ブロック間の配置関係
    を用いて、上下または左右いづれか所定方向に並ぶ複数
    個の文字塊ブロックを検出し、所定方向の複数個の文字
    行を生成する行分類手段と、生成された各文字行内の複
    数個の文字塊ブロックのうち、前記所定方向と異なる方
    向の配置関係を有する複数個の文字塊ブロックを統合す
    るブロック統合手段と、前記文字行内の複数個の文字塊
    ブロックの中心、下端等の複数の特徴値に基づいて、前
    記文字行の前記複数の特徴に対する傾き値および推定誤
    差を有する傾きを選択することによって前記文字行の傾
    き値を抽出する手段とを備えることを特徴とする文字行
    抽出装置。
JP1198770A 1989-07-31 1989-07-31 文字行抽出装置 Expired - Fee Related JP2623844B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP1198770A JP2623844B2 (ja) 1989-07-31 1989-07-31 文字行抽出装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP1198770A JP2623844B2 (ja) 1989-07-31 1989-07-31 文字行抽出装置

Publications (2)

Publication Number Publication Date
JPH0362284A JPH0362284A (ja) 1991-03-18
JP2623844B2 true JP2623844B2 (ja) 1997-06-25

Family

ID=16396642

Family Applications (1)

Application Number Title Priority Date Filing Date
JP1198770A Expired - Fee Related JP2623844B2 (ja) 1989-07-31 1989-07-31 文字行抽出装置

Country Status (1)

Country Link
JP (1) JP2623844B2 (ja)

Families Citing this family (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2778437B2 (ja) * 1993-12-27 1998-07-23 日本電気株式会社 文書画像傾き検出装置
JP3823379B2 (ja) * 1996-07-10 2006-09-20 松下電工株式会社 画像処理方法
JP2009251872A (ja) * 2008-04-04 2009-10-29 Fuji Xerox Co Ltd 情報処理装置及び情報処理プログラム
JP5062076B2 (ja) * 2008-07-17 2012-10-31 富士ゼロックス株式会社 情報処理装置及び情報処理プログラム
JP5321109B2 (ja) * 2009-02-13 2013-10-23 富士ゼロックス株式会社 情報処理装置及び情報処理プログラム
JP5280337B2 (ja) * 2009-11-18 2013-09-04 株式会社神戸製鋼所 文字認識方法及び文字認識装置
KR20220014569A (ko) * 2020-07-29 2022-02-07 휴렛-팩커드 디벨롭먼트 컴퍼니, 엘.피. 문서 데이터에 대한 속독 프로파일 적용

Also Published As

Publication number Publication date
JPH0362284A (ja) 1991-03-18

Similar Documents

Publication Publication Date Title
US6778703B1 (en) Form recognition using reference areas
US7418126B2 (en) Image distortion correcting method and apparatus, and storage medium
JP3124296B2 (ja) 基準マークの位置および方向の検出方法
US7440618B2 (en) Apparatus for extracting rules line from multiple-valued image
CN107452035B (zh) 车道线图像分析方法、装置及其计算机可读取式媒体
JP4098845B2 (ja) テキストのバイナリー画像から抽出されたシンボルを比較する方法
JP4594952B2 (ja) 文字認識装置及び文字認識方法
CN112419260A (zh) 一种pcb文字区域缺陷检测方法
JP2623844B2 (ja) 文字行抽出装置
JP2007179307A (ja) 帳票識別装置
JP3728224B2 (ja) 文書処理装置及び方法
JP4919171B2 (ja) 文字読取り装置、文字読取り方法及び該文字読取り装置に用いられる文字読取り制御プログラム
CN116363654A (zh) 文本图像任意倾斜角度检测与校正算法
JP3558493B2 (ja) 用紙位置合わせ装置、用紙位置合わせ方法及び用紙位置合わせプログラムを記録したコンピュータ読み取り可能な記録媒体
EP0076332A1 (en) Optical character reader with pre-scanner
JP2018067096A (ja) 文字認識装置及び文字認識方法
JP2669661B2 (ja) 文書画像処理方法
JP4552757B2 (ja) 画像処理装置、画像処理方法、および画像処理プログラム
JP5476884B2 (ja) 画像処理装置及び画像処理プログラム
JP2000331122A (ja) 文字認識方法および装置
JP4309881B2 (ja) 身分証認識装置及び身分証認識方法
JPH07230526A (ja) 文字読取装置
JP2715930B2 (ja) 線分検出方法
JP3311551B2 (ja) イメージデータ入力処理方法およびその装置
JP4792117B2 (ja) 文書画像処理装置、文書画像処理方法および文書画像処理プログラム

Legal Events

Date Code Title Description
FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080411

Year of fee payment: 11

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090411

Year of fee payment: 12

LAPS Cancellation because of no payment of annual fees