JPH0721310A - 文書認識装置 - Google Patents

文書認識装置

Info

Publication number
JPH0721310A
JPH0721310A JP5162109A JP16210993A JPH0721310A JP H0721310 A JPH0721310 A JP H0721310A JP 5162109 A JP5162109 A JP 5162109A JP 16210993 A JP16210993 A JP 16210993A JP H0721310 A JPH0721310 A JP H0721310A
Authority
JP
Japan
Prior art keywords
rectangle
circumscribed
horizontal
ruled line
character
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP5162109A
Other languages
English (en)
Inventor
Yumiko Ikemure
由美子 池牟禮
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Holdings Corp
Original Assignee
Matsushita Electric Industrial Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Matsushita Electric Industrial Co Ltd filed Critical Matsushita Electric Industrial Co Ltd
Priority to JP5162109A priority Critical patent/JPH0721310A/ja
Priority to US08/245,261 priority patent/US5502777A/en
Publication of JPH0721310A publication Critical patent/JPH0721310A/ja
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/40Document-oriented image-based pattern recognition
    • G06V30/41Analysis of document content
    • G06V30/412Layout analysis of documents structured with printed lines or input boxes, e.g. business forms or tables

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Artificial Intelligence (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Character Input (AREA)
  • Image Analysis (AREA)

Abstract

(57)【要約】 【目的】 互いに交わる水平・垂直線を複数含む図形を
正しく認識することができる信頼性に優れた文書認識装
置の提供。 【構成】 外接矩形を検出する外接矩形検出部と、縦・
横の長さの比がしきい値よりも大きい外接矩形を罫線矩
形として抽出する罫線矩形抽出部と、短辺の長さがしき
い値よりも短い外接矩形を文字矩形として抽出する文字
矩形抽出部5と、外接矩形中から水平・垂直線を検出し
これらの数と線毎の交点数から図形矩形を抽出する図形
矩形抽出部6と、外接矩形中の水平・垂直線に含まれる
全黒画素数と外接矩形に内接する黒画素に連結した黒画
素数との比から図形矩形と表矩形とを判別する図形・表
矩形判別部8と、矩形情報に基づいて各領域を抽出する
領域抽出部10と、各領域の属性に応じて認識処理を行
う認識処理部11とを備えた構成からなる。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は文字,表,図形,罫線が
混在する印刷・手書きの認識対象文書から文字,表,図
形,罫線の各領域を自動的に抽出し、各領域の属性に応
じた認識処理を行うことのできる文書認識装置に関する
ものである。
【0002】
【従来の技術】近年、文書参照等の際の作業性向上,文
書保管スペースの節約等のため、文書の電子化が広く行
われるようになった。その際のコンピュータ等への入力
装置として、文字,表,図形等をそのままデータ化する
ことのできる文書認識装置が種々開発されている。
【0003】以下に従来の文書認識装置について説明す
る。従来の文書認識装置は、初めに、認識対象文書をス
キャナ等を用いて取り込んで2値画像を得る。次に、領
域抽出処理に要する時間を短縮するために、得られた2
値画像を解像度が100DPI程度となるように縮小し
て縮小済2値画像データを出力する。次に、出力された
縮小済2値画像データから黒画素が水平,垂直,斜めの
8方向の近傍で連結している部分を抽出し、この連結し
た黒画素に外接する矩形(以下外接矩形と略す)を検出
して、その位置と大きさの情報を記憶する。次に、検出
された外接矩形の内、縦・横の長さの比が罫線しきい値
よりも大きい外接矩形を罫線に外接する矩形(以下罫線
矩形と略す)と判断して、この外接矩形に罫線属性を設
定する。次に、検出された外接矩形の内、縦・横の短い
方の長さが文字しきい値よりも小さい外接矩形を文字に
外接する矩形(以下文字矩形と略す)と判断して、この
外接矩形に文字属性を設定する。次に、この文字矩形の
位置等から、文字組み方向の判定を行い、文字行の抽出
を行う。次に、前述の処理で属性が設定されなかった外
接矩形から、矩形中に存在する水平・垂直線を抽出し、
これらの数と各線毎の交点数を計数して、水平・垂直線
の内多い方の数が表罫線数しきい値よりも大きく、更に
これらの線の内少なくとも一本の線の他の線との交点数
が表交点数しきい値以上であった外接矩形を表に外接す
る矩形(以下表矩形と略す)と判断して、この外接矩形
に表属性を設定する。次に、前述の処理によって属性が
設定されなかった外接矩形を、図形に外接する矩形(以
下図形矩形と略す)と見なして、この外接矩形に図形属
性を設定する。次に、前述の処理によって各属性が設定
された外接矩形を基に各領域を抽出する。次に、抽出さ
れた領域に応じた認識処理を行って、文書の認識を行っ
ている。
【0004】
【発明が解決しようとする課題】しかしながら上記従来
の構成では、外接矩形が表矩形であるか図形矩形である
かの判別を行う際に、外接矩形中の水平・垂直線の本数
及びそれらの交点の数のみによって判別を行っているた
めに、認識対象文書中に互いに交わる水平・垂直線を複
数含む図形が存在した場合に、この図形に対する外接矩
形を表矩形として誤判別してしまい、この図形を正しく
認識することができず信頼性に欠けるという問題点を有
していた。
【0005】本発明は上記従来の問題点を解決するもの
で、互いに交わる水平・垂直線を複数含む図形に対する
外接矩形を、図形矩形として正しく判別することがで
き、この図形を正しく認識することができる信頼性に優
れた文書認識装置を提供することを目的とする。
【0006】
【課題を解決するための手段】この目的を達成するため
に本発明の文書認識装置は、認識対象文書から得られる
2値画像データを入力する画像入力部と、前記画像入力
部から出力された2値画像データから連結した黒画素に
外接する矩形を外接矩形として検出する外接矩形検出部
と、前記外接矩形検出部で検出された外接矩形の内縦・
横の長さの比が罫線しきい値よりも大きい外接矩形を罫
線矩形として抽出する罫線矩形抽出部と、前記外接矩形
検出部で検出された外接矩形の内前記罫線矩形抽出部で
抽出されなかった外接矩形から縦・横の短い方の長さが
文字しきい値より小さい外接矩形を文字矩形として抽出
する文字矩形抽出部と、前記外接矩形抽出部で抽出され
た外接矩形の内前記罫線矩形抽出部と前記文字矩形抽出
部とのいずれでも抽出されなかった外接矩形中から水平
・垂直線を抽出しこれらの数と線毎の交点を計数してそ
れを基に図形矩形を抽出する図形矩形抽出部と、前記外
接矩形抽出部で抽出された外接矩形の内前記罫線矩形抽
出部と前記文字矩形抽出部と前記図形矩形抽出部とのい
ずれでも抽出されなかった外接矩形中から前記図形抽出
部で抽出された水平・垂直線に含まれる黒画素数と外接
矩形に内接する黒画素に連結した黒画素数とを計数して
この2つの値の比に基づいて図形矩形と表矩形とを判別
する図形・表矩形判別部と、前記罫線矩形抽出部,前記
文字矩形抽出部,前記図形矩形抽出部,前記図形・表矩
形判別部から出力される矩形情報に基づいて前記画像入
力部から出力された2値画像データ中から罫線,文字,
図形,表の各領域を抽出する領域抽出部と、前記領域抽
出部で抽出された各領域の属性に応じて前記画像入力部
から出力された2値画像データに対する認識処理を行う
認識処理部とを備えた構成を有している。
【0007】
【作用】この構成によって、図形矩形抽出部で従来例と
同様にして図形矩形を抽出した後に、この処理で抽出さ
れなかった外接矩形に対して、図形・表矩形判別部でこ
の外接矩形中から図形矩形抽出部で検出された水平・垂
直線に含まれる黒画素数と外接矩形に内接する黒画素に
連結する黒画素数とを計数し、この2つの値の比をとる
ことにより、2値画像データ中の表は、表の枠を表す連
続したほとんど水平・垂直線のみからなる罫線と、この
罫線の内側に罫線と分離して記入された文字からなり、
この表に対する外接矩形に表の最も外側の罫線が外接す
るため、外接矩形が表矩形であれば、2つの中の水平・
垂直線に含まれる黒画素数及び外接矩形に内接する黒画
素に連結する黒画素数として、表の罫線に含まれる黒画
素と略等しい値が得られ、この2つの値の比が略1とな
るのに対し、2値画像データ中の図形は、略連続した図
形要素からなり、ほとんどの場合この図形要素中に水平
・垂直線以外の図形要素を含むため、外接矩形が図形矩
形であれば、この中の水平・垂直線に含まれる黒画素数
として図形の水平・垂直線部分の黒画素数のみが得られ
て、外接矩形に内接する黒画素数として図形の略全体の
黒画素数が得られ、この2つの値の間に差が生じるため
に、この値の比に基づいて外接矩形が表矩形であるか図
形矩形であるかを正確に判別することができ、認識対象
文書中に互いに交わる水平・垂直線を複数含む図形があ
る場合でも、この図形に対する外接矩形を図形矩形とし
て正しく判別して、この図形を正しく認識することがで
きる。
【0008】
【実施例】以下本発明の一実施例における文書認識装置
について、図面を参照しながら説明する。図1は本発明
の一実施例における文書認識装置の機能ブロック図であ
り、図2は本発明の一実施例における文書認識装置の回
路ブロック図である。1は認識対象文書を取り込んで2
値画像を入力する画像入力部、2は画像入力部1から出
力される2値画像を従来例と同様に縮小して縮小済2値
画像データを出力する画像縮小部、3は画像縮小部2か
ら出力される縮小済2値画像データから連結する黒画素
に外接する矩形を外接矩形として検出する外接矩形検出
部、4は外接矩形検出部3で検出された外接矩形の内縦
・横の長さの比が罫線しきい値よりも大きい外接矩形を
罫線矩形として抽出する罫線矩形抽出部、5は罫線矩形
抽出部4で抽出されなかった外接矩形の内縦・横の短い
方の長さが文字しきい値より小さい外接矩形を文字矩形
として抽出する文字矩形抽出部、6は文字矩形抽出部5
で抽出されなかった外接矩形中から水平・垂直線を抽出
しこれらの内多い方の数と線毎の交点数を基に図形矩形
を抽出する図形矩形抽出部、7は文字矩形抽出部5で抽
出された文字矩形から文字組み方向を検出して文字行を
抽出する文字行抽出部、8は図形矩形抽出部6で抽出さ
れなかった外接矩形中の図形矩形抽出部6で検出された
水平・垂直線に含まれる黒画素数と外接矩形に内接する
黒画素と連結する黒画素数とを計数しこの2つの値の比
を求めこの比に基づいてその外接矩形が図形矩形である
か表矩形であるかを判別する図形・表矩形判別部、9は
図形・表矩形判別部8で判別された表矩形内に含まれる
文字行抽出部7で抽出された文字行があるか調べこれを
削除する文字行包含検査部、10は各外接矩形に設定さ
れた諸属性を基にして縮小済2値画像データから罫線,
文字,図形,表等の各領域を抽出する領域抽出部、11
は画像入力部1から出力される2値画像データに対して
領域抽出部10で抽出された領域に応じた認識処理を行
う認識処理部である。図2において、12は文書認識装
置全体を制御するCPU、13は画像入力部1から出力
された2値画像を2値画像データとして記憶するima
ge領域14と外接矩形検出部3で検出された全ての外
接矩形の大きさ,位置を記憶するrect領域15と図
形・表矩形判別部8において判別対象となった外接矩形
中の図形矩形抽出部6で検出された水平・垂直線に含ま
れる黒画素数を記憶するlinepix領域16と図形
・表矩形判別部8において判別対象となった外接矩形に
内接する黒画素と連結する黒画素数を記憶するcirc
umpix領域17とを有するランダムアクセスメモリ
(以下RAMと略す)、18はCPU12へ与える指示
等が記載された制御プログラム等を記憶するリードオン
リメモリ(以下ROMと略す)、19は画像入力部1を
構成し認識対象文書を取り込んで2値画像を得るスキャ
ナ、20は文書認識装置へ認識開始の指示等を与えるた
めのキーボード、21は文書認識結果等を表示するため
の表示装置、22は上記のデバイスを接続するためのバ
スである。
【0009】以上のように構成された本発明の一実施例
における文書認識装置について、以下その動作を説明す
る。図3は本発明の一実施例における文書認識装置のフ
ローチャートであり、図4は認識対象文書中の表に対す
る外接矩形に内接する黒画素と連結する黒画素及びその
外接矩形内から検出された水平・垂直線の一例を示す図
であり、図5は認識対象文書中の図形に対する外接矩形
に内接する黒画素と連結する黒画素及びその外接矩形内
から検出された水平・垂直線の一例を示す図である。図
4において、a1乃至a4は抽出された水平線、b1乃
至b4は水平線a1と同様な垂直線である。図5におい
て、cは水平線a1と同様な水平線、d1乃至d4は水
平線a1と同様な垂直線である。
【0010】初めに、画像入力部1によって、スキャナ
19を用いて認識対象文書を取り込んで2値画像を得
て、その2値画像データをRAM13のimage領域
14に記憶する(S1)。次に、画像縮小部2によっ
て、S1で取り込まれた2値画像を処理速度の向上のた
めに、解像度が100DPI程度の大きさとなるように
縮小し、縮小済2値画像及びその縮小済2値画像データ
を得る(S2)。次に、外接矩形検出部3によって、S
2で得られた縮小済2値画像から連結した黒画素に外接
する矩形を外接矩形として検出し、その縮小済2値画像
データ上での位置座標及び大きさをRAM13のrec
t領域15に記憶する(S3)。次に、罫線矩形抽出部
4によって、S3で検出された外接矩形の縦・横方向の
長さの比が罫線しきい値よりも大きいか調べる(S
4)。Yesである場合は、罫線矩形抽出部4によっ
て、この外接矩形を罫線矩形と判断し、罫線属性を設定
し記憶して、S16へjumpし(S5)、Noである
場合は、文字矩形抽出部5によって、S4で抽出されな
かった外接矩形の縦・横の短い方の長さが文字しきい値
以下か調べる(S6)。Yesである場合は、文字矩形
抽出部5によって、この外接矩形を文字矩形と判断し、
文字属性を設定し記憶して、S15へjumpし(S
7)、Noである場合は、図形矩形抽出部6によって、
S6で抽出されなかった外接矩形の内部に存在する水平
線と垂直線とを抽出し、水平線,垂直線毎の数を計数
し、各々の線について他の線との交点数を計数する(S
8)。ここで、認識対象文書が表である場合には、図4
に示すように、この処理によって、水平線がa1乃至a
4の4本,垂直線がb1乃至b4の4本検出され、その
交点数の最大値は例えば水平線a2が垂直線b2,b3
と直交するため2個となる。一方、認識対象文書が図形
である場合には、図5に示すように、水平線がcの1
本,垂直線がd1乃至d4の4本検出され、その交点数
の最大値は水平線cが垂直線d1乃至d4と直交するた
め4個となる。次に、図形矩形抽出部6によって、S8
で計数された水平線,垂直線の本数の内多い方が表罫線
数しきい値よりも大きく、更にS8で計数された交点数
の最大値が表交点数しきい値よりも大きいか調べる(S
9)。Noである場合は、図形矩形抽出部6によって、
この外接矩形を図形矩形と判断し、図形属性を設定し記
憶して、S16へjumpし(S10)、Yesである
場合は、この外接矩形が表矩形である可能性があるもの
として、図形・表矩形判別部8によって、S9で抽出さ
れなかった外接矩形に内接する黒画素に連結する黒画素
の数を計数して変数circumpixに代入し、RA
M13のcircumpix領域17に記憶する(S1
1)。ここで、認識対象文書中の表に対しては、外接矩
形に内接する黒画素に連結する黒画素として図4に示す
ようなものが得られる。図4から明らかなように、この
処理によって、表の、ほとんど水平・垂直線のみからな
る、一体となった罫線部分が抽出され、この罫線の内部
に分離して記入された文字は抽出されない。一方、認識
対象文書中の図形に対しては、同様に図5に示すような
ものが得られる。図5から明らかなように、図形は略連
続した図形要素から構成されており、この処理によっ
て、図形の図形要素のほとんど全てが抽出される。ま
た、この図形要素に水平・垂直線以外の図形要素を含ん
でいる。次に、図形・表矩形判別部8によって、S8で
検出された外接矩形内の水平・垂直線に含まれる黒画素
数を計数して変数linepixに代入し、RAM13
のlinepix領域16に記憶する(S12)。ここ
で、図4から明らかなように、認識対象文書中の表は、
その罫線がほとんど水平・垂直線のみからなっているた
めに、S11で計数されたcircumpixの値とS
12で計数されたlinepixの値は略同一となる。
これに対して、図5から明らかなように、認識対象文書
中の図形からは、その図形要素の水平・垂直線部分のみ
がlinepixの値として計数されるため、この値は
S11で計数されたcircumpixの値よりも小さ
くなる。次に、図形・表矩形判別部8によって、S12
で計数されたlinepixをS11で計数されたci
rcumpixで割って比を求め、この比が表しきい値
以上であるか調べる(S13)。Noである場合は、図
形・表矩形判別部8によって、この外接矩形が図形矩形
であると判別して、S10へjumpし、Noである場
合は、図形・表矩形判別部8によって、この外接矩形が
表矩形であると判別し、表属性を設定し記憶して、S1
6へとjumpする(S14)。ここで、前述のよう
に、認識対象文書中の表に対しては、linepixと
circumpixとがほとんど同一の値となるため
に、これらの値の比は略1となって、表しきい値よりも
大きくなり表矩形と判別される。一方、前述のように、
認識対象文書中の図形に対しては、linepixがc
ircumpixよりも小さくなるために、これらの比
が表しきい値よりも小さくなり、正確に図形矩形と判別
される。次に、文字行抽出部7によって、S7で記憶さ
れた文字矩形を基にして、文字組み方向を検出し、文字
矩形から文字行矩形を抽出する(S15)。次に、文字
行包含検査部9によって、S15で抽出された文字行矩
形の中に、S14で記憶された表矩形に包含される文字
行矩形が存在するか検査して、表矩形に包含される文字
行矩形を削除する(S16)。次に、領域抽出部10に
よって、上記の処理で設定された個々の外接矩形の属性
を基にして、罫線・文字・図形・表の各領域を抽出する
(S17)。次に、認識処理部11によって、S17で
抽出された各領域の属性に応じて、画像入力部1から出
力される2値画像に対する認識処理を行う(S18)。
【0011】
【発明の効果】以上のように本発明は、図形矩形抽出部
で従来例と同様にして図形矩形を抽出した後に、この処
理で抽出されなかった外接矩形に対して、図形・表矩形
判別部でこの外接矩形中から図形矩形抽出部で検出され
た水平・垂直線に含まれる黒画素数と外接矩形に内接す
る黒画素に連結する黒画素数とを計数し、この2つの値
の比をとることにより、2値画像データ中の表は、表の
枠を表す連続したほとんど水平・垂直線のみからなる罫
線と、この罫線の内側に罫線と分離して記入された文字
からなり、この表に対する外接矩形に表の最も外側の罫
線が外接するため、外接矩形が表矩形であれば、この中
の水平・垂直線に含まれる黒画素数及び外接矩形に内接
する黒画素に連結する黒画素数として、表の罫線に含ま
れる黒画素と略等しい値が得られ、この2つの値の比が
略1となるのに対し、2値画像データ中の図形は、略連
続した図形要素からなり、ほとんどの場合この図形要素
中に水平・垂直線以外の図形要素を含むため、外接矩形
が図形矩形であれば、この中の水平・垂直線に含まれる
黒画素数として図形の水平・垂直線部分の黒画素数のみ
が得られ、外接矩形に内接する黒画素数として図形の略
全体の黒画素数が得られて、この2つの値の間に差が生
じるために、この値の比に基づいて外接矩形が表矩形で
あるか図形矩形であるかを正確に判別することができ、
認識対象文書中に互いに交わる水平・垂直線を複数含む
図形がある場合でも、この図形に対する外接矩形を図形
矩形として正しく判別して、この図形を正しく認識する
ことができる信頼性に優れた文書認識装置を実現できる
ものである。
【図面の簡単な説明】
【図1】本発明の一実施例における文書認識装置の機能
ブロック図
【図2】本発明の一実施例における文書認識装置の回路
ブロック図
【図3】本発明の一実施例における文書認識装置のフロ
ーチャート
【図4】認識対象文書中の表に対する外接矩形に内接す
る黒画素と連結する黒画素及びその外接矩形内から検出
された水平・垂直線の一例を示す図
【図5】認識対象文書中の図形に対する外接矩形に内接
する黒画素と連結する黒画素及びその外接矩形内から検
出された水平・垂直線の一例を示す図
【符号の説明】
1 画像入力部 2 画像縮小部 3 外接矩形検出部 4 罫線矩形抽出部 5 文字矩形抽出部 6 図形矩形抽出部 7 文字行抽出部 8 図形・表矩形判別部 9 文字行包含検査部 10 領域抽出部 11 認識処理部 12 CPU 13 ランダムアクセスメモリ(RAM) 14 image領域 15 rect領域 16 linepix領域 17 circumpix領域 18 リードオンリメモリ(ROM) 19 スキャナ 20 キーボード 21 表示装置 22 バス

Claims (1)

    【特許請求の範囲】
  1. 【請求項1】認識対象文書から得られる2値画像データ
    を入力する画像入力部と、前記画像入力部から出力され
    た2値画像データから連結した黒画素に外接する矩形を
    外接矩形として検出する外接矩形検出部と、前記外接矩
    形検出部で検出された外接矩形の内縦・横の長さの比が
    罫線しきい値よりも大きい外接矩形を罫線矩形として抽
    出する罫線矩形抽出部と、前記外接矩形検出部で検出さ
    れた外接矩形の内前記罫線矩形抽出部で抽出されなかっ
    た外接矩形から縦・横の短い方の長さが文字しきい値よ
    り小さい外接矩形を文字矩形として抽出する文字矩形抽
    出部と、前記外接矩形抽出部で抽出された外接矩形の内
    前記罫線矩形抽出部と前記文字矩形抽出部とのいずれで
    も抽出されなかった外接矩形中から水平・垂直線を抽出
    しこれらの数と線毎の交点を計数してそれを基に図形矩
    形を抽出する図形矩形抽出部と、前記外接矩形抽出部で
    抽出された外接矩形の内前記罫線矩形抽出部と前記文字
    矩形抽出部と前記図形矩形抽出部とのいずれでも抽出さ
    れなかった外接矩形中から前記図形抽出部で抽出された
    水平・垂直線に含まれる黒画素数と外接矩形に内接する
    黒画素に連結した黒画素数とを計数してこの2つの値の
    比に基づいて図形矩形と表矩形とを判別する図形・表矩
    形判別部と、前記罫線矩形抽出部,前記文字矩形抽出
    部,前記図形矩形抽出部,前記図形・表矩形判別部から
    出力される矩形情報に基づいて前記画像入力部から出力
    された2値画像データ中から罫線,文字,図形,表の各
    領域を抽出する領域抽出部と、前記領域抽出部で抽出さ
    れた各領域の属性に応じて前記画像入力部から出力され
    た2値画像データに対する認識処理を行う認識処理部と
    を備えたことを特徴とする文書認識装置。
JP5162109A 1993-06-30 1993-06-30 文書認識装置 Pending JPH0721310A (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP5162109A JPH0721310A (ja) 1993-06-30 1993-06-30 文書認識装置
US08/245,261 US5502777A (en) 1993-06-30 1994-05-18 Method and apparatus for recognizing table and figure having many lateral and longitudinal lines

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP5162109A JPH0721310A (ja) 1993-06-30 1993-06-30 文書認識装置

Publications (1)

Publication Number Publication Date
JPH0721310A true JPH0721310A (ja) 1995-01-24

Family

ID=15748218

Family Applications (1)

Application Number Title Priority Date Filing Date
JP5162109A Pending JPH0721310A (ja) 1993-06-30 1993-06-30 文書認識装置

Country Status (2)

Country Link
US (1) US5502777A (ja)
JP (1) JPH0721310A (ja)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6337355B1 (en) 1997-01-23 2002-01-08 Sunstar Giken Kabushiki Kaisha Two-pack urethane foam composition
JP2012060465A (ja) * 2010-09-09 2012-03-22 Fuji Xerox Co Ltd 画像処理装置及び画像処理プログラム
CN110084117A (zh) * 2019-03-22 2019-08-02 中国科学院自动化研究所 基于二值图分段投影的文档表格线检测方法、系统
JP2023038894A (ja) * 2021-09-07 2023-03-17 株式会社リコー 表示装置、表示プログラム、表示方法

Families Citing this family (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP0657839B1 (en) * 1993-12-10 2002-02-20 Ricoh Company, Ltd Methodsand apparatus for recognizing a specific image from an imput image signal
JPH09259219A (ja) * 1996-03-26 1997-10-03 Sharp Corp 文字認識方法
US6006240A (en) * 1997-03-31 1999-12-21 Xerox Corporation Cell identification in table analysis
US6038351A (en) * 1997-10-28 2000-03-14 Cash Management Solutions Apparatus and method for multi-entity, mixed document environment document identification and processing
US6442575B2 (en) * 1998-06-17 2002-08-27 Microsoft Corporation Method and system for merging cells in a table and for adding an integrated header and a nested table to a table in an electronic document
JP3842006B2 (ja) * 2000-03-30 2006-11-08 グローリー工業株式会社 帳票類判別装置、帳票類判別方法、およびこれらの方法をコンピュータに実行させるプログラムを記録したコンピュータ読み取り可能な記録媒体
JP3995185B2 (ja) * 2000-07-28 2007-10-24 株式会社リコー 枠認識装置及び記録媒体
DE60204066T2 (de) * 2001-02-22 2006-02-02 Oce Print Logic Technologies S.A. Automatische Lokalisierung von Tabellen in Dokumenten
JP2002300408A (ja) * 2001-03-30 2002-10-11 Toshiba Corp 画像ファイリング装置及び方法、並びに画像復元装置及び方法
CN101452523B (zh) * 2007-12-07 2011-01-26 汉王科技股份有限公司 一种识别手写表格的方法及装置
JP2013500527A (ja) 2009-07-30 2013-01-07 オセ−テクノロジーズ・ベー・ヴエー 文書内の表の自動的な位置特定
US11341383B2 (en) * 2019-08-18 2022-05-24 Kyocera Document Solutions Inc. Methods and apparatus to detect effective tiling area and fill tiles efficiently
CN111507230A (zh) * 2020-04-11 2020-08-07 创景未来(北京)科技有限公司 一种文档和表格数据的识别和提取方法及系统

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5235653A (en) * 1984-08-31 1993-08-10 Hitachi, Ltd. Document analysis system
JPS62137974A (ja) * 1985-12-12 1987-06-20 Ricoh Co Ltd 画像処理方式
US5144682A (en) * 1987-03-05 1992-09-01 Ricoh Company, Ltd. Method and an apparatus for isolating an area corresponding to a character or word
US5195147A (en) * 1989-05-02 1993-03-16 Ricoh Company, Ltd. Image forming apparatus
KR930009639B1 (ko) * 1989-07-09 1993-10-08 가부시끼가이샤 히다찌세이사꾸쇼 화상데이타를 이용하는 문서데이타 처리방법 및 장치
JPH03150672A (ja) * 1989-11-08 1991-06-27 Toshiba Corp ナンバプレート検出装置

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6337355B1 (en) 1997-01-23 2002-01-08 Sunstar Giken Kabushiki Kaisha Two-pack urethane foam composition
US6866804B2 (en) 1997-01-23 2005-03-15 Sunstar Suisse Sa Two-pack urethane foam composition, and two-pack urethane foam composition injecting apparatus and method
US7459107B2 (en) 1997-01-23 2008-12-02 Sunstar Suisse Sa Two-pack urethane foam composition, and two-pack urethane foam composition injecting apparatus and method
JP2012060465A (ja) * 2010-09-09 2012-03-22 Fuji Xerox Co Ltd 画像処理装置及び画像処理プログラム
CN110084117A (zh) * 2019-03-22 2019-08-02 中国科学院自动化研究所 基于二值图分段投影的文档表格线检测方法、系统
CN110084117B (zh) * 2019-03-22 2021-07-20 中国科学院自动化研究所 基于二值图分段投影的文档表格线检测方法、系统
JP2023038894A (ja) * 2021-09-07 2023-03-17 株式会社リコー 表示装置、表示プログラム、表示方法

Also Published As

Publication number Publication date
US5502777A (en) 1996-03-26

Similar Documents

Publication Publication Date Title
JPH0721310A (ja) 文書認識装置
US8428356B2 (en) Image processing device and image processing method for generating electronic document with a table line determination portion
US6798906B1 (en) Image processing apparatus and method including line segment data extraction
JPH0721309A (ja) 文書認識装置
JPH06187489A (ja) 文字認識装置
JPH06180771A (ja) 英文字認識装置
JPH0548510B2 (ja)
JPH07160810A (ja) 文字認識装置
JP7043667B1 (ja) 情報処理装置、プログラム、及び情報処理方法
JPH0628520A (ja) 文字認識装置
EP0767941B1 (en) Automatic determination of landscape scan in binary images
JP3019897B2 (ja) 行切出し方法
JP3122476B2 (ja) 自動文書清書装置
JPH0916713A (ja) 画像領域分割方法
JPH0822507A (ja) 文書認識装置
JPH07168911A (ja) 文書認識装置
JP3502130B2 (ja) 表認識装置および表認識方法
JPH06150055A (ja) 文字認識装置
JP2917394B2 (ja) 文字認識装置及び文字切り出し方法
JP2872757B2 (ja) 行方向判定装置
JPH08185473A (ja) 文字認識装置
JPH0855185A (ja) 文字認識装置
JPH06150062A (ja) 文字認識装置
JPH05298483A (ja) 文字認識装置
JPH05274472A (ja) 画像認識装置