JPH04303278A - 圧縮映像の文字列分離方式 - Google Patents

圧縮映像の文字列分離方式

Info

Publication number
JPH04303278A
JPH04303278A JP3346137A JP34613791A JPH04303278A JP H04303278 A JPH04303278 A JP H04303278A JP 3346137 A JP3346137 A JP 3346137A JP 34613791 A JP34613791 A JP 34613791A JP H04303278 A JPH04303278 A JP H04303278A
Authority
JP
Japan
Prior art keywords
character string
area
coordinate
information
character
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP3346137A
Other languages
English (en)
Inventor
Sangi Tei
鄭 燦義
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
LG Electronics Inc
Original Assignee
Gold Star Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Gold Star Co Ltd filed Critical Gold Star Co Ltd
Publication of JPH04303278A publication Critical patent/JPH04303278A/ja
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/14Digital output to display device ; Cooperation and interconnection of the display device with other functional units
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/40Document-oriented image-based pattern recognition
    • G06V30/41Analysis of document content
    • G06V30/413Classification of content, e.g. text, photographs or tables
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/20Image preprocessing

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Artificial Intelligence (AREA)
  • Human Computer Interaction (AREA)
  • General Engineering & Computer Science (AREA)
  • Character Input (AREA)
  • Facsimile Image Signal Circuits (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、文書を認識するとき、
圧縮された文書映像から文字領域と図形領域とを抽出し
分離させる方法に係るもので、詳しくは、文書映像を圧
縮して個別領域を抽出する際、その圧縮により図形領域
に連結された文字列を分離させて認識し得るようにした
圧縮映像の文字列分離方式に関するものである。
【0002】
【従来の技術】一般に、文書を認識すべく文書映像の領
域を分割するとき、処理時間を短縮するため元来の映像
を圧縮した後、個別領域に抽出し、図形(又は写真)領
域及び文字列に夫々分離して文書の認識処理を行うよう
になっていた。そして、通常、殆どの文書は、文書の左
側又は右側に図形(又は写真)領域が位置し、該図形(
又は写真)領域に隣接して各文字列が位置するようにな
っていた。
【0003】然るに、このような文書を認識するため文
書映像を圧縮すると、図形領域と文字列との余白(ギャ
ップ)が文書映像の圧縮率よりも小さい場合、それら図
形と文字とが連結して表われ、よって、文書認識にエラ
ーが生じ易いという不都合な点があった。
【0004】
【発明が解決しようとする課題】そこで、このような問
題点を解決するため、本発明者は研究を重ねた結果次の
ような圧縮映像の文字列分離方式を提供しようとするも
のである。本発明の目的は、図形領域(又は写真領域)
と文字列とが混合された文書を認識するとき、該図形領
域に文字領域が連結して表われると、強制にそれら二つ
の領域を分離して各個別領域を正確に抽出させ、文書認
識を明確に行い得るようにした圧縮映像の文字別分離方
式を提供しようとするものである。
【0005】
【課題を解決するための手段】このような本発明の目的
は、文書映像の入力を受けて文書映像を圧縮し、領域を
分離して個別領域に抽出するとき、現在検索中のブロッ
クが図形又は写真領域の場合、左側面を検索して該左側
面に文字列が連結されているか否かを判別し、以後、右
側面を検索して該右側面に文字列が連結されているか否
かを判別し、それら左右側面全てに文字列が連結されて
いたり又は連結されていない場合を除去し、それら左右
側面中何れ一方側面のみに文字列が連結されている場合
は、その文字列の連結を検索するとき抽出した文字列位
置情報を利用してそれらを分離させ、文書を認識するこ
とにより達成される。
【0006】
【実施例】以下、本発明の実施例について図面を用いて
詳細に説明する。図1に示したように、本発明に係る文
書認識システムブロックにおいては、ホストインターフ
ェース7、ホストコンピューター8、モニター9、補助
記憶装置10及びキーボード11を具備し文書認識処理
をする汎用コンピューターAと、ディジタル信号処理素
子DSP1、アドレスディコーダー2、メモリ3及びバ
ッファー4を具備し前記汎用コンピューターAの制御に
より文書認識のための映像圧縮及び領域分離を行う専用
ハードウエア部Bと、スキャナー6及びスキャナーイン
ターフェース5を具備し前記汎用コンピューターAの制
御により該汎用コンピューターA及び前記専用ハードウ
エア部Bに文書映像データを伝送する文書映像入力部C
とにより構成されている。
【0007】図中、未説明符号DSはデータ選択信号、
ISは入出力選択信号、PSはプログラム選択信号、I
NTはインタラップト信号、IACKはインタラップト
認識信号、ENBはイネーブル信号、Aはアドレス、D
はデータ、Sは選択信号を夫々示したものである。この
ように構成された文書認識システムブロックの作用及び
本発明に係る圧縮映像の文字列分離方式を説明すると次
のようである。
【0008】図1及び図2に示したように、先ず、キー
ボード11を押して汎用コンピューターAのホストコン
ピューター8に命令を与えると、該ホストコンピュータ
ー8はホストインターフェース7を通してディジタル信
号処理素子1及びスキャナーインターフェース5をイネ
ーブルENBさせ、該スキャナーインターフェース5に
よりスキャナー6が動作して文書映像が入力aされる。 次いで、それら文書映像データD0−D7はメモリ3に
貯蔵されバッファー4を通ってディジタル信号処理素子
1に入力された後、映像が圧縮され該圧縮映像データは
メモリ3に貯蔵されて圧縮領域の種類が判別dされ、そ
の後、文字領域は文字に認識され、図形及び写真領域は
コーディング処理eされる。
【0009】且つ、図3(A)、(B)は本発明に係る
文字列の連結及び分離状態を示した例示図で、(A)は
図形(又は写真)領域と文字列との間の余白(ギャップ
)が文書映像の圧縮率よりも小さいため、文書映像の圧
縮結果、それら図形領域と文字列とが分離されずに連結
して表示された状態を示した例示図、(B)は本発明の
方式により右側の文字列を強制に分離させた状態を示し
た例示図である。ここで、図3(A)に示した図形領域
と文字列とが連結した状態において、図2に示したよう
に、個別領域の抽出段階dを経た後、処理段階eで本発
明に係る圧縮映像の文字列分離処理を行うと、図3(B
)に示したように右側の文字列が図形又は写真領域から
分離された状態になる。
【0010】又、図4(A)、(B)は文字列が連結さ
れた状態を示した説明図で(A)は左側に文字列が連結
された状態を示したもので、(B)は右側に文字列が連
結された状態を示したものであって、文字列の連結され
る状態は左側又は右側連結される二通りがあるので、先
ず、図形(又は写真)領域の輪郭を認識してそれら二通
り中何れの状態であるかを判別した後強制分離させる過
程を行うようになる。
【0011】図5(A)〜(E)は本発明に係る文字列
分離方式を説明した図面であって、図5(A)に示した
ように、図形(又は写真)領域Grと該図形(又は写真
)領域の左側に文字領域TLが配置され、それら文字列
情報領域TL間の余白(ギャップ)領域ELの大きさよ
りも該文字列情報領域TLと前記図形(又は写真)領域
との間の余白(ギャップ)Hの大きさが小さい場合は、
その映像データを圧縮した後個別領域に分離すると、図
5(B)に示したように左側に文字列が連結された一つ
の図形(又は写真)領域に分離される。即ち、図2に示
したように、文書映像データの入力aを受け圧縮映像化
した後b、領域分離cして個別領域処理dをすると、図
5(B)に示したように、一つの図形(又は写真)領域
に分離され、その図形(又は写真)領域に文字領域が連
結して存在するようになる。従って、このように二個の
領域が一個の図形(又は写真)領域に処理されるブロッ
クの左側、又は右側の文字列を本発明の方式により強制
に分離させるものである。
【0012】本発明に係る圧縮映像の文字列分離方式に
おいては、圧縮され領域分割された文書映像のブロック
を順次スキャニングし図形(又は写真)領域のブロック
を検出する図形(又は写真)領域検出ステップS1と、
該図形(又は写真)領域検出ステップS1で検出された
図形(又は写真)領域ブロックの左側面を検索し該左側
面に文字列が連結される(L←T)か又は連結されない
(L←F)かを判別する左側面検索ステップS2と前記
図形(又は写真)領域検出ステップS1で検出された図
形(又は写真)領域ブロックの右側面を検索して該右側
面に文字列が連結される(R←T)か又は連結されない
(R←F)かを判別する右側面検索ステップS3と、そ
れら左・右側面検索ステップS2、S3の結果、左・右
側面全てに文字列が連結され(L,R←T)たり又は連
結されない(L,R←F)場合には前記図形(又は写真
)領域検出ステップS1に戻るフィードバックステップ
S4と、前記左右側面検索ステップS2、S3の結果、
左右側面中何れ一方側面にのみ文字列が連結された場合
該文字列を検索するとき抽出した文字列位置情報を利用
し各個別領域に分離した後前記図形(又は写真)領域検
出ステップS1に戻る文字列分離ステップS5とを行う
ことにより文字列の連結した図形(又は写真)領域から
強制にその文字列を分離して正確な情報領域に処理する
ようになっている。
【0013】且つ、図6は本発明に係る圧縮映像の文字
列分離方式の制御フローチャートであって、図示された
ように、マイクロコンピューターにおいては、文書映像
データが領域別に分離された圧縮ブロックの総数TBL
OCK をセッチングし、現在処理しようとする圧縮ブ
ロックK=1が図形(又は写真)領域であるかを判別す
るため、その圧縮ブロックKを順次選択K=K+1しな
がら圧縮ブロック総数TBlock に至るまで検索し
て図形(又は写真)領域の与否を判断する。
【0014】この場合、各ブロックが文字列の連結され
た図形(又は写真)領域であるかを識別するため、それ
らブロックの左側面と右側面の輪郭状態を検索する。即
ち、現在の圧縮ブロックKが図形(又は写真)領域であ
ると、該ブロックKの左側面を検索し、再び右側面を検
索して図4に示したように、左側面又は右側面に文字列
が連結された状態であるかを判別する。若し、左側面又
は右側面に文字列が連結されていると各プラグをセット
〔L←T(FLAGL ←TRUE),R←T(FLA
GR ←TRUE)〕させ、左側面又は右側面が文字列
に連結されていないと、正常の図形(又は写真)領域に
判別してプラグをリセット〔L←F(FLAGL ←F
ALSE),R←F(FLAGLR ←FALSE)〕
させる。
【0015】このような左右側面検索をした結果、左右
側面全てに文字列が連結された(L=T,R=T)場合
と、左右側面全てに文字列が連結されていない(L=F
,R=F)場合とには無視し、次のブロック(K=K+
1)の処理を行う。その後、左側面又は右側面の何れ一
方側面にのみ文字列が連結〔(L=T,R=F)又は(
L=F,R=T)〕されているとそれら左右側面を検索
するとき検出した文字列情報領域の位置情報によりその
連結された文字列を強制に分離させた後、次のブロック
(K=K+1)の処理を行う。
【0016】ここで、左側面又は右側面に文字列が連結
されているのを判別する方法においては、図5(B)に
示したように左側面に文字列が連結されたブロックの場
合、図5(C)に示したように、該当ブロックの左側上
方端の座標(SX,SY)と右側下方端の座標(EX,
EY)とにより表示して正四方形の領域を取り、この場
合左側面検索であるので、左側から右側に、上方から下
方向きにラスター方式により検索を行う。即ち、図7の
左側面検索制御フローチャートに示したように、文字列
情報領域ライン数TL,1ラインの白画素累積数TP、
文字列間の余白領域数EL及び文字列幅WXのx座標最
大値を初期化させ、図形(又は写真)領域に判別したブ
ロックの左側上方端座標(SX,SY)をx,y座標に
セッチング(X=SX,Y=SY)した後、画素別に左
側から右側に、上方から下方向きに検索を行う。
【0017】ここで、本発明者達が提供した韓国特許第
89−17630号記載の“文書映像で領域を抽出する
方法”によれば、個別領域の輪郭線に該当する最小の値
を“2”に代置してその輪郭線の画素を検索するように
なっている。そこで、左側から右側に各画素別の最小値
を検索して輪郭線値2の画素が検出されるまで検索を行
うが、検索した画素値〔P(X,Y)〕が輪郭線値(“
2”)でなく文字画素値(“1”)である場合には無視
し、空白画素の白画素値(“0”)が検出されると、そ
の白画素数(TP)を累積(TP=TP+1)しながら
x座標の終わり(X=EX)になるまでそのx座標を増
加(X=X+1)させながら輪郭線画素を検索する。
【0018】以後、輪郭線画素が検出されると、ブロッ
クのx方向開始座標SXからどれ程離れた位置で輪郭線
画素が検出されたかという情報を探知すべきであるが、
これは、左側面に文字列が連結されている場合、その文
字列を強制分離させるとき、その文字列の幅を決めるた
めである。即ち、x方向の開始座標SXから最も遠い位
置で検出された輪郭線画素のx軸座標までをその幅とみ
なし、図5(B)及び(D)に示したWX座標となる。 該WX値はy方向座標値が増加するとき輪郭線画素が検
出されるので、その都度、現在のx座標とWX値とを比
較して大きい値をWX値に設定する。
【0019】従って、輪郭線値(“2”)に該当する画
素が検出されると、該輪郭線画素の検出したx座標が終
わり(X=EX)であるか、又は現在x座標が文字列x
座標幅(WX)よりも小さい場合は現在のx座標幅(W
X)を維持し、そのx座標が終わりでなく(X≠EX)
、x座標(X)が文字列幅(WX)のx座標よりも大き
い(X>WX)場合は、現在のx座標(X)を文字列x
座標幅(WX=X)にセッチングする。
【0020】このように、x座標の終わり又ははx座標
の幅をセッチングした後、そのラインが文字領域である
か又は余白領域であるかを判別するが、ここで、文書上
で文字列間の上下方側間隔が殆ど同様であるので文字列
間の間隔余白の領域ELは殆ど同様である。よって、現
在検索したラインが文字列情報領域TLであるか又は余
白領域ELであるかの判断は、最小値“0”の画素数T
Pを累積した値が所定設定値よりも大きいと、余白領域
ELに判断する。
【0021】一方、文字列を強制分離する場合、文字列
のx方向幅(WX)以外に各文字列のy方向の位置情報
も必要である。即ち、図5(D)に示したように、各文
字列の開始y座標と終わりy座標とが必要である。従っ
て、余白領域ELが検出される場合にy座標を比較する
が、1番目の余白領域(EL=1)が検出された場合、
当時のy軸座標をその時まで検出された文字列情報領域
(TL)の終わりy座標に指定する。文字列情報領域(
TL)の開始y軸座標は新しい情報領域(TL)が検出
される都度、当時のy軸座標に指定し該座標値を2次元
配列coord〔TL〕〔1〕に貯蔵する。
【0022】即ち、図7に示したように、現在白画素累
積値(TP)が設定値よりも大きい場合は、文字列間の
余白領域(EL)に判別して該余白領域の数を累積(E
L=EL+1)し、現在の余白領域(EL)の数が1番
目(EL=1)であるかを判別して1番目の場合は、そ
の時のy軸座標をその時まで検出された文字列情報領域
(TL)の終わりy座標として2次元配列coord〔
TL〕
〔0〕に貯蔵する。
【0023】且つ、前記余白領域(EL)が1番目でな
い場合(EL=1)及び前記文字列情報の終わりy座標
を貯蔵した後にはy座標が終わり(Y=EY)であるか
を判別する。一方、現在累積された白画素数TPが設定
値よりも小さい(TP<設定値)場合は、そのラインを
文字列に属した情報ラインの文字情報領域(TL)に判
別し、現在まで累積された余白領域(EL)数を設定値
と比較して余白領域が連続的に幾ライン検出されたかを
判別した後、その余白領域累積値が設定値以上であれば
、余白領域(EL)が検出されたものであるとみなし、
以下であれば無視する。即ち、文字情報領域(TL)で
ある場合は現在までの余白領域(EL)が所定設定値以
上(EL>設定値)であるかを判別し、その結果余白領
域累積値が設定値よりも小さい場合はy座標が終わり(
Y=EY)であるかを判別するステップに移行し、その
余白領域の累積値が設定値以上(EL>設定値)であれ
ば、文字情報領域(TL)開始y軸座標を新しいy軸座
標として2次元配列coord〔TL〕〔1〕に貯蔵す
る。次いで、文字情報領域(TL)数を増加(TL=T
L+1)させ、余白領域(EL)数を初期化(EL=0
)した後、前記y座標が終わり(Y=RY)であるかを
判別するステップに移行する。
【0024】以後、y座標が終わり(Y=RY)である
かを判別し、y座標が終わりでないと、y座標を増加(
Y=Y+1)させ、x座標を開始座標(X=SX)にセ
ッチングして白画素数(TP)を初期化(TP=0)し
た後、次のラインの検索を行う。このようにブロックの
左側上方から右側に、上方から下方向きに検索して右側
下方端のy座標が終わり(Y=EY)になるまで検索を
した後、現在までの文字列情報領域(TL)数を設定値
と比較し一つの図形(又は写真)領域に文字列と余白領
域とが左側面に連結された領域であるかを判別する。 その結果文字情報領域(TL)の累積値が設定値以上で
あれば、文字列左側連結にセッチング(L←T)し、文
字情報領域(TL)の累積値が設定値よりも小さいと、
文字列が左側面に連結されていないものであるとセッチ
ング(L←F)して一つのブロックの左側面検索を完了
する。
【0025】そして、右側面検索ステップ(S3)は、
右側から左側に検索を行いながら輪郭線検出座標のx方
向座標値を最小値に選択し、該最小値を文字列連結幅(
WX)に検出する過程のみ異なり、その以外の過程は前
述した左側面検索と同様な過程で行われる。従って、右
側から左側に検索が行われ、その結果、図5(D)に示
したような左側面検索による抽出情報と同様な情報が求
められる。
【0026】このように左側面と右側面の文字列連結状
態を検索しブロックの左側面に文字列が連結された状態
(L=F),(R=F)の場合においては、左側面検索
過程で抽出した文字列の位置情報である文字列幅(WX
)、開始y軸座標及び終わりy軸座標を利用して新しい
ブロックに分離させる。即ち、図8の文字列連結ブロッ
クの文字列分離制御フローチャートに示したように、先
ず、連結された文字情報領域TLをブロックに分離する
ための変数Pを初期化(P=0)させ、現在ブロック数
値(TBLOCK )を増加(TBLOCK =TBL
OCK +1)させて、該ブロックを2次元配列により
各位置座標を前記の過程で求めた座標値にセッチングす
る。
【0027】例えば、図5(D)に示したように、文字
情報領域(TL)数が3で、1番目の文字列情報領域の
開始y座標がSYであり、終わりy座標が前記過程で貯
蔵されたcoord
〔0〕
〔0〕値であると仮定する。 ここで、前記“coord”は2次元配列を意味し、初
めの括弧〔  〕は文字列情報領域(TL)の1番目の
領域を意味し、後の括弧
〔0〕は文字列情報領域(TL
)のy座標を意味し、
〔0〕は終わりy座標を表し、〔
1〕は開始y座標を表わす。
【0028】従って、coord
〔0〕
〔0〕は1番目
TLの終わりy座標で、coord〔1〕〔1〕は2番
目TLの開始y座標で、coord〔1〕
〔0〕は2番
目TLの終わりy座標である。且つ、coord〔2〕
〔1〕は3番目TLの開始y座標、EYは終わり(3番
目)文字列情報領域の終わりy座標を示し、WX+SX
は文字列情報領域のx方向座標を意味する。
【0029】そこで、図8に示したように、総ブロック
数が増加(TBLOCK =TBLOCK +1)した
後、該ブロックを1番目文字列情報領域(TL)の位置
情報にセッチングして一つのブロックに分離する。   即ち、  BLOCK〔TBLOCK 〕〔1〕=
SY                       
         〔2〕=coord〔P〕
〔0〕 
                         
      〔3〕=SX             
                   〔4〕=WX
+SXにセッチングする。
【0030】ここで、〔TBLOCK 〕は総ブロック
数に増加させた新しいブロックを意味し、〔1〕は文字
列ブロックの開始y座標即ち、1番目TLの開始y座標
(SY)でり、「2」は終わりy座標即ち、1番目TL
の終わりy座標coord〔P〕
〔0〕で(但し〔P〕
は1番目TLであるので
〔0〕値)〔3〕は開始x座標
SXであり、〔4〕は文字列終わりx座標WX+SXで
ある。
【0031】このように、1番目文字列情報領域(TL
=0)の開始y座標、終わりy座標、開始x座標、終わ
りx座標(WX+SX)をセッチングして新しいブロッ
ク(TBLOCK )を分離し、文字列情報領域(TL
)が終わり(P=TL−1)であるかを判別して(但し
、TLの1番目値が0であるので終わりはTL−1)終
わりでなければ、ブロック数を増加(TBLOCK =
TBLOCK +1)させた後、           BLOCK〔TBLOCK 〕〔
1〕=coord〔P〕〔1〕           
                     〔2〕=
coord〔P〕
〔0〕              
                  〔3〕=SX 
                         
      〔4〕=WX+SXに位置情報をセッチン
グする。ここで、coord〔P〕〔1〕はTLの開始
y座標、coord〔P〕
〔0〕は〔P〕番目TLの終
わりy座標である。
【0032】以後、次のTLをブロックに分離するため
現在TLの数値(P)を増加(P=P+1)させ、文字
列情報領域(TL)の終わり(P=TL−1)になるま
で反復遂行して各TLを夫々ブロックにし、最後のTL
になる(P=TL−1)と、ブロック数を増加(TBL
OCK =TBLOCK +1)させた後、該ブロック
を最終の文字列情報領域(TL)の位置情報にセッチン
グする。
【0033】   即ち、  BLOCK〔TBLOCK 〕〔1〕=
coord〔P〕〔1〕              
                  〔2〕=EY 
                         
      〔3〕=SX             
                   〔4〕=WX
+SXになる。
【0034】一方、文字列が右側面に連結されたブロッ
クの右側面の分離においては、検索により求められた右
側面連結文字列情報の位置情報を利用し、図8に示した
ようにブロック化して分離させる。従って、最終には図
5(E)に示したように独自のブロックに分離し得るよ
うになる。
【0035】
【発明の効果】以上説明したように、本発明に係る圧縮
映像の文字列分離方式においては、文書映像を圧縮して
ブロックに分離し個別領域に抽出するとき、図形領域に
文字列が連結されると、該文字列を強制に分離させて抽
出するようになっているため、明確な文書認識を行い得
る効果がある。
【図面の簡単な説明】
【図1】本発明に係る文書認識システムブロック図であ
る。
【図2】本発明に係る文書認識処理系統図である。
【図3】本発明に係る文字列の連結及び分離状態を示し
た例示図である。
【図4】本発明に係る文字列の連結した状態を示した説
明図である。
【図5】本発明に係る文字列分離方式説明図である。
【図6】本発明に係る文字列分離方式の制御フローチャ
ートである。
【図7】本発明に係る左側面文字列連結検索制御フロー
チャートである。
【図8】本発明に係る文字列強制分離制御フローチャー
トである。
【符号の説明】
A  汎用コンピューター B  専用ハードウエア部 C  文書映像入力部 1  ディジタル信号処理素子 2  アドレスディコーダー 3  メモリ 4  バッファー 5  スキャナーインターフェース 6  スキャナー 7  ホストインターフェース 8  ホストコンピューター 9  モニター 10  補助記憶装置 11  キーボード

Claims (4)

    【特許請求の範囲】
  1. 【請求項1】  圧縮し領域分離した文書映像のブロッ
    クを順次スキャニングして図形(又は写真)領域のブロ
    ックを検出する図形(又は写真)領域検出ステップ(S
    1)と、該図形(又は写真)領域検出ステップ(S1)
    で検出した図形(又は写真)領域のブロックの左側面を
    検索し該左側面に文字列が連結され(L←T)るか又は
    連結されない(L←F)かを判別する左側面検索ステッ
    プ(S2)と、前記図形(又は写真)領域検出ステップ
    (S1)で検出した図形(又は写真)領域のブロックの
    右側面を検索して該右側面に文字列が連結され(R←T
    )るか又は連結されない(R←F)かを判別する右側面
    検索ステップ(S3)と、それら左・右側面検索ステッ
    プ(S2),(S3)の結果、左・右側面全てに文字列
    が連結され(L,R←T)たり又は連結されない(L,
    R←F)場合は、前記図形(又は写真)領域検出ステッ
    プ(S1)に戻るフィードバックステップ(S4)と、
    前記左・右側面検索ステップ(S2),(S3)の結果
    、左・右側面中何れ一方側面のみに文字列が連結される
    場合、その文字列の連結を検索するとき抽出した文字列
    位置情報を利用してそれらを個別領域に分離した後前記
    図形(又は写真)領域検出ステップ(S1)に戻る文字
    列分離ステップ(S5)と、を行うようになる圧縮映像
    の文字列分離方式。
  2. 【請求項2】  前記左側面検索ステップ(S2)は、
    図形(又は写真)領域に判別されるブロックを左側から
    右側に、上方から下方に画素別にスキャニングしながら
    白画素数(TP)を累積し、ラインの開始でない輪郭線
    画素が検出されるまで各ラインの輪郭線画素を検出する
    輪郭線検出ステップ(S2−1)と、該輪郭線検出ステ
    ップ(S2−1)の結果、ラインの終わりでない輪郭線
    画素が検出されるライン別x座標の最大値を該ライン文
    字列の幅(WX)に設定する文字列幅設定ステップ(S
    2−2)と、該文字列幅設定ステップ(S2−2)で文
    字列幅が設定された各ラインの累積した白画素数(TP
    )により文字列の情報領域(TL)か又は余白(ギャッ
    プ)領域(EL)であるかを判別する情報/余白領域判
    別ステップ(S2−3)と、前記情報/余白領域判別ス
    テップ(S2−3)で判別した連続される情報領域(T
    L)の数を累積しながら該連続される情報領域(TL)
    の開始y座標及び終わりy座標を求めるy座標検出ステ
    ップ(S2−4)と、前記連続される情報領域(TL)
    の数が所定設定値以上であれば、左側面文字列連結(L
    ←T)に判別し、以上でないと文字列連結でない(L←
    F)と判別する文字列連結判定ステップ(S2−5)と
    、を行うようになる請求項(1)記載の圧縮映像の文字
    列分離方式。
  3. 【請求項3】  前記右側面検索ステップ(S3)は、
    図形(又は写真)領域に判別されるブロックを右側から
    左側に、上方から下方向きに画素別にスキャニングしな
    がら白画素数(TP)を累積しラインの終わりでない輪
    郭線画素が検出されるまで各ラインの輪郭線画素を検出
    する輪郭線検出ステップ(S3−1)と、該輪郭線検出
    ステップ(S3−1)の結果、ラインの開始でない輪郭
    線画素が検出されるライン別x座標の最小値を該ライン
    文字列の幅(WX)に設定する文字列幅設定ステップ(
    S3−2)と、該文字列幅設定ステップで文字列幅が設
    定された各ラインの累積した白画素数(TP)により、
    文字列の情報領域(TL)又は余白領域(EL)の与否
    を判別する情報/余白領域判別ステップ(S3−3)と
    、該情報/余白領域判別ステップ(S3−3)で判別し
    た連続される情報領域(TL)の数を累積しながら連続
    される情報領域(TL)の開始y座標及び終わりy座標
    を求めるy座標検出ステップ(S3−4)と、前記連続
    される情報領域(TL)の数が所定設定値以上であれば
    、右側面文字列連結(R←T)に判別し、以上でなけれ
    ば、文字列が連結されない(R←F)ものであると判別
    する文字列連結判定ステップ(S3−5)と、を行うよ
    うになる請求項(1)記載の圧縮映像の文字列分離方式
  4. 【請求項4】  連続される情報領域(TL)で開始y
    座標及び終わりy座標を検出するy座標検出ステップは
    、現在検索したラインが文字列情報領域(TL)である
    場合、現在までの余白領域(EL)ライン数累積値が所
    定設定値以下であれば連続される情報領域(TL)に判
    別し、以上であれば新しい文字列情報領域(TL)に判
    別して文字列情報領域(TL)数を累積しながら余白領
    域(EL)ライン数累積値を初期化させると共に現在y
    座標を開始y座標で求め、現在検索したラインが余白領
    域(EL)であると該余白領域(EL)ライン数を累積
    し、1番目(EL=1)余白領域(EL)ラインの検出
    により終わりy座標を求めるようになる請求項(2)又
    は(3)記載の圧縮映像の文字列分離方式。
JP3346137A 1990-12-29 1991-12-27 圧縮映像の文字列分離方式 Pending JPH04303278A (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
KR22456/1990 1990-12-29
KR1019900022456A KR930002349B1 (ko) 1990-12-29 1990-12-29 압축영상의 문자열 분리방법

Publications (1)

Publication Number Publication Date
JPH04303278A true JPH04303278A (ja) 1992-10-27

Family

ID=19308960

Family Applications (1)

Application Number Title Priority Date Filing Date
JP3346137A Pending JPH04303278A (ja) 1990-12-29 1991-12-27 圧縮映像の文字列分離方式

Country Status (3)

Country Link
US (1) US5313526A (ja)
JP (1) JPH04303278A (ja)
KR (1) KR930002349B1 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2003030584A (ja) * 2001-07-12 2003-01-31 Ricoh Co Ltd 文書認識装置、文書画像の領域識別方法、プログラム及び記憶媒体

Families Citing this family (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5680479A (en) * 1992-04-24 1997-10-21 Canon Kabushiki Kaisha Method and apparatus for character recognition
JPH06236367A (ja) * 1992-11-12 1994-08-23 Ricoh Co Ltd 文書作成装置の制御方法
JP3373008B2 (ja) * 1993-10-20 2003-02-04 オリンパス光学工業株式会社 画像像域分離装置
US5588072A (en) * 1993-12-22 1996-12-24 Canon Kabushiki Kaisha Method and apparatus for selecting blocks of image data from image data having both horizontally- and vertically-oriented blocks
US5889886A (en) * 1995-11-28 1999-03-30 Xerox Corporation Method and apparatus for detecting running text in an image
US6512848B2 (en) 1996-11-18 2003-01-28 Canon Kabushiki Kaisha Page analysis system
US5893127A (en) * 1996-11-18 1999-04-06 Canon Information Systems, Inc. Generator for document with HTML tagged table having data elements which preserve layout relationships of information in bitmap image of original document
JP4189654B2 (ja) * 2003-04-18 2008-12-03 セイコーエプソン株式会社 画像処理装置

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS61296481A (ja) * 1985-06-24 1986-12-27 Mitsubishi Electric Corp 文書読取装置
JPH01253077A (ja) * 1988-03-25 1989-10-09 Internatl Business Mach Corp <Ibm> 文字列検出方法

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE3019836A1 (de) * 1980-05-23 1982-01-21 Siemens AG, 1000 Berlin und 8000 München Verfahren zum automatischen erkennen von bild- und text- oder graphikbereichen auf druckvorlagen
DE3113555A1 (de) * 1981-04-03 1982-10-21 Siemens AG, 1000 Berlin und 8000 München Verfahren zum automatischen erkennen von weissbloecken sowie text-, graphik- und/oder graubildbereichen auf druckvorlagen
US4741046A (en) * 1984-07-27 1988-04-26 Konishiroku Photo Industry Co., Ltd. Method of discriminating pictures
US4577235A (en) * 1984-08-20 1986-03-18 The Mead Corporation Text/continuous tone image decision processor
JPH0738681B2 (ja) * 1987-03-20 1995-04-26 富士ゼロックス株式会社 領域認識装置

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS61296481A (ja) * 1985-06-24 1986-12-27 Mitsubishi Electric Corp 文書読取装置
JPH01253077A (ja) * 1988-03-25 1989-10-09 Internatl Business Mach Corp <Ibm> 文字列検出方法

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2003030584A (ja) * 2001-07-12 2003-01-31 Ricoh Co Ltd 文書認識装置、文書画像の領域識別方法、プログラム及び記憶媒体
JP4616522B2 (ja) * 2001-07-12 2011-01-19 株式会社リコー 文書認識装置、文書画像の領域識別方法、プログラム及び記憶媒体

Also Published As

Publication number Publication date
KR930002349B1 (ko) 1993-03-29
KR920013107A (ko) 1992-07-28
US5313526A (en) 1994-05-17

Similar Documents

Publication Publication Date Title
JP3338537B2 (ja) 画像傾き検出装置
US9430704B2 (en) Image processing system with layout analysis and method of operation thereof
US9256792B2 (en) Image processing apparatus, image processing method, and program
JPH04303278A (ja) 圧縮映像の文字列分離方式
JP3866600B2 (ja) 画像処理装置及び画像処理方法
JPH0721310A (ja) 文書認識装置
JP2000112599A (ja) 文書画像処理装置及び文書画像処理方法
JP2938490B2 (ja) 領域指定方法および領域指定装置
JP2803736B2 (ja) 文字認識方式
JP4164976B2 (ja) 文字認識装置
JP3095470B2 (ja) 文字認識装置
JP7043667B1 (ja) 情報処理装置、プログラム、及び情報処理方法
JP7459151B2 (ja) 情報処理装置、情報処理システム、情報処理方法、及びプログラム
JP4159071B2 (ja) 画像処理方法,画像処理装置および該処理方法を実現させるためのプログラムを記録したコンピュータ読み取り可能な記録媒体
JPH03142691A (ja) 表形式文書認識方式
JP4810995B2 (ja) 画像処理装置、方法及びプログラム
JP2008258980A (ja) 画像情報処理装置および画像傾斜角度算出方法
JPH07160810A (ja) 文字認識装置
JPH05114048A (ja) 文字認識方法及びその装置
JP2803735B2 (ja) 罫線を含んだ文字認識装置
JPH07168911A (ja) 文書認識装置
JP2890307B2 (ja) 表領域分離装置
JPH0394393A (ja) 文字認識装置
JPH05114047A (ja) 文字切り出し装置
JP2926842B2 (ja) 文字切出し回路

Legal Events

Date Code Title Description
A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 19960422