JPH05250409A - ページ方向の高速検出 - Google Patents

ページ方向の高速検出

Info

Publication number
JPH05250409A
JPH05250409A JP4302725A JP30272592A JPH05250409A JP H05250409 A JPH05250409 A JP H05250409A JP 4302725 A JP4302725 A JP 4302725A JP 30272592 A JP30272592 A JP 30272592A JP H05250409 A JPH05250409 A JP H05250409A
Authority
JP
Japan
Prior art keywords
image
character
document
orientation
ascenders
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP4302725A
Other languages
English (en)
Inventor
Lakshmi Dasari
ダサーリ ラクシュミ
Dan S Bloomberg
ダン・エス・ブルームバーグ
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Xerox Corp
Original Assignee
Xerox Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Xerox Corp filed Critical Xerox Corp
Publication of JPH05250409A publication Critical patent/JPH05250409A/ja
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/14Image acquisition
    • G06V30/146Aligning or centring of the image pick-up or image-field
    • G06V30/1463Orientation detection or correction, e.g. rotation of multiples of 90 degrees
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Character Input (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

(57)【要約】 (修正有) 【目的】走査画像の自動ページ方向検出、補正装置、方
法の改良に関する。 【構成】段階47で計数された文字アセンダ画素Naの
数を段階50で計数された文字デセンダ画素Ndの数と
段階51で比較して画像が正しい向きにあるかまたは9
0°の向きにあるかまたは180°方向がずれているか
を検出する。本法および本装置は文字アセンダおよびデ
センダの分離のために構成要素を用いて走査画像のビッ
トマップを形態的に処理することを含む。ページ方向が
不適切な場合、段階68又は段階62で走査画像のビッ
トマップ画像は回転されて方向の不整合を補正する。

Description

【発明の詳細な説明】
【0001】本発明は画像処理のための方法ならびにそ
の装置の改良に関するもので、より特定すれば、文書処
理のための画像の方向を自動的に検出し補正する、特に
位置合わせから90°または180°の位置にある文書
の画像の方向を検出し補正するための方法ならびに装置
の改良に関する。
【0002】本発明は在来の光学式文字認識処理および
走査画像処理の双方において文書画像処理で広汎な用途
を有する。光学式文字認識(OCR)処理において、一
般に光学式スキャナにより生成されたビットマップ表現
の画像が通常は入力として受け入れられている。該シス
テムの操作において、利用者は用手的に文書スキャナへ
走査するページまたは複数ページを供給するのが常であ
る。しかし、利用者がページを間違った方向、例えばペ
ージ上で予想される文字の方向に対してそのページ上の
画像の上部がが90°(時計回りまたは反時計回りに)
または180°(天地が逆)のいずれかに回転した状態
で供給した場合重大かつ一般的な問題がしばしば発生す
る。
【0003】今日の商用OCRシステムはこのような方
向を間違えた条件を検査しないのが通例である。むしろ
その文書を通常の通りページを分割して処理しまた個々
の文字のビットマップを文字分類モジュールへ送出する
ため、結果は芳しくない。幾つかの文字は通常通り認識
され、認識された文字は一般に間違えた分類がなされ
る。さらに、パターンが分類モジュールにとって見慣れ
ないもので通常は動作させるとは思われない遅いサブル
ーチンをいくつも試行するのが普通であるから間違った
結果に到達するまでに長い時間が必要になる。結局、結
果が悪いとの警告が利用者には提供されない。
【0004】リード(Reed)の米国特許第2,905,
927号では3回の走査を用いて識別すべき語の特徴ま
たはパターンを決定するようになした単語認識のための
方法ならびに装置が開示されている。上側走査で全高シ
ンボルの位置と数を表わす情報を取得し、下側走査で基
準線以下に延在するシンボルを表わす情報を導出する。
中央部走査で単語内のシンボル数とシンボル間隔に関す
る情報を獲得する。
【0005】クロセ(Kurose)の米国特許第4,95
3,230では文書画像の歪曲を処理しまた補正するた
めのシステムが開示されている。このシステムは文書を
走査し最初に出現する黒い画素の位置を求めるものであ
る。この後の連続した走査で走査中に黒い画素がまった
く検出されなかった場合、文字線の右側端部が発見され
たものと決定する。文書歪曲の数学的決定は、水平(ま
たは垂直)走査に対して文字線の歪曲又は傾きを求める
ため文字線の線数および線幅を用いて決定される。
【0006】ポストル(Postl)の米国特許第4,72
3,297号では、取得した元本文書における文字歪曲
の自動補正のための方法を開示している。元本文書はデ
ジタル走査の結果の形状にあり、本法は「歪曲位置の認
識」段階と「電子的回転]段階を含む。歪曲位置の認識
は検索走査法または検索掃引法によって求めうる。歪曲
検出における検索走査法は、XY平面上のY=0で始ま
る走査検索線間の走査結果の加算および比較による。歪
曲検出における検索掃引法は走査した領域の加算にフー
リエ変換を用いている。角度αがどちらの歪曲検出段階
においても決定され、走査画像の電子的回転で画像の位
置合わせ補正が行われる。
【0007】マノ(Mano)の米国特許第4,926,4
90号では、スキャナなどの典型的な分割装置の軸に対
して文書が歪曲しているかまたは位置が揃っていない場
合にも文書上の文字を識別するための方法およびその装
置が開示されている。それぞれの文字画像を包囲するよ
うに複数の方形が形成され、それぞれの方形についての
位置データが第1の表に保存され、第1の表では、方形
の複数の位置データが画像バッファ内のXY軸のX方向
において最も左の方形から最も右の方形への順番で構成
される。第1のリスト内のひとつの文字列に属する方形
を求めさらに方形の底部左隅の位置を計算することによ
って、文書の歪曲が計算される。Y方向の歪曲によって
補正された方形の縦位置が計算されて、第1の文字列に
属する方形の位置データが第2の表に転送される。第2
のリスト内の位置データによって指定された方形により
包囲される画像データが順次文字認識ユニットへ供給さ
れる。
【0008】上記に鑑み、本発明の目的は画像処理のた
めの方法および装置の改良を提供することである。
【0009】本発明の別の目的は文書画像処理における
ページ方向を調べるための方法および装置を提供するこ
とである。
【0010】本発明のさらなる目的は正しい位置から9
0°および180°の方向にある文書の画像の方向を調
べ又補正するための方法および装置を提供することであ
る。
【0011】本発明のさらなる目的は光学式文字認識処
理技術ならびに走査画像処理技術と共に使用可能な上述
の形式の文書処理のための方法ならびに装置を提供する
ことである。
【0012】本発明のさらなる目的は処理すべき文書の
画像の文字の方向を迅速に調べうる画像処理のための上
述の形式の方法ならびに装置を提供することである。
【0013】本発明の別の目的は文書画像からの画像ビ
ットマップを自動的に回転させることで走査装置の動作
速度を低下させることなく不適切なページ方向の問題を
克服する装置ならびに方法を提供することである。
【0014】本発明のさらに別の目的は2進形態処理を
用いる高速ページ方向のための装置ならびに方法を提供
することである。
【0015】本発明にかかる上述のおよびその他の目
的、特徴、および利点は添付の図面および請求の範囲と
併せて以下の本発明の詳細な説明を読み進むことで当業
者には理解されよう。
【0016】本発明の一実施例の広汎な態様では、処理
のために文書の画像の方向を調べる方法が提示される。
本法により、該文書の画像の電子的表現が生成され、電
子的表現内部での文字のアセンダ(アルファベットの上
部に飛び出している部分)およびデセンダ(アルファベ
ットの基準線以下に飛び出している部分)の数の差から
画像方向が決定される。アセンダ数が所定量以上にデセ
ンダ数より大きければ、文書は正しい方向に向いてい
る。アセンダ数が所定量のデセンダ数より小さければ文
書は180°回転しており、所定量のアセンダ数とデセ
ンダ数が大きくも小さくもなければ画像は90°回転し
ている。本法は所定のシーケンスで順次プログラムの命
令を実行するデータ処理システム内から実行することが
できる。
【0017】本発明の一実施例の広汎な態様では、ロー
マ字の走査画像を方向付ける方法が提示される。本法に
おいて、走査画像は水平方向の構成要素に拡大される。
拡大画像は次に構成要素のパターン・アセンダの組で侵
食され、第1の侵食画像を形成し、アセンダ画素の統合
性を提供するパターン・アセンダと第1の侵食画像内の
「オン」画素の数Na が計数される。拡大画像は次に構
成要素のパターン・デセンダの組で侵食され、第2の侵
食画像を形成し、デセンダがその統合性を提供するパタ
ーン/デセンダと第二の侵食された画像内の「オフ」画
素の数Nd が計数される。|Na −Nd |≦3((√N
a +√Nd )/√2)の場合、ビットマップは90°回
転している。|Na −Nd |>3((√Na +√Nd )
/√2)の場合、ビットマップは180°回転してい
る。
【0018】本発明のさらに別の広汎な態様では、文書
上の文字の方向を調べるための装置が提供される。本装
置の一実施例では、スキャナ装置が文書を走査して文書
上の文字の電子的表現を生成する。データ処理システム
はデータ駆動型処理を実行し、メモリ手段内に含まれる
所定の順序のプログラム命令を実行することによって関
数を実行するための処理手段を順次実行することを含
む。プログラム命令は順次実行される処理手段に上記電
子的表現内の文字アセンダおよびデセンダの数の差から
方向を決定するよう指令する。本装置の一実施例では、
スキャナ装置は文書を走査するための手段を有する電子
写真式複写装置からなる。プログラム命令は順次実行さ
れる処理手段に文字のアセンダとデセンダの数の差から
画像方向を決定し、さらにアセンダ数がデセンダ数より
少ない場合はビットマップを回転するように指令する。
アセンダ数がデセンダ数より所定量以上少ない場合、ビ
ットマップは180°回転され、アセンダ数の差がデセ
ンダ数より所定以上多くも少なくもない場合ビットマッ
プは90°回転される。
【0019】本発明は添付の図面に図示される。
【0020】図1は本発明の好適実施例におけるページ
方向法の流れ図である。
【0021】図2は本発明の好適実施例において図1の
方法を実現するための装置である。
【0022】図3は本発明の方法を実施する上で拡大動
作を実行するための水平構造を示す。
【0023】図4のA−A’、B−B’、C−C’のそ
れぞれは本発明の方法を実行する際に使用する文字アセ
ンダ照合のための構成要素の対を示す。
【0024】図5のA−A’、B−B’、C−C’は本
発明の方法を実行する際に使用する文字デセンダ照合の
ための構成要素の対を示す。
【0025】図6はデジタル式コンピュータをプログラ
ムして文書文字のアセンダおよびデセンダの数を決定す
るためのコンピュータプログラム命令の一覧である。
【0026】本発明の方法の好適実施例は、図1の流れ
図およびこれに関連して図2に示す本法を実現するため
の装置に図示されている。
【0027】より特定すれば、画像を含む文書は第1に
例えば、光学的文字認識技術により復号されて処理する
ため、または本件の参考に含まれるヒュッテンロッヒャ
ー(Huttenlocher) らの「文書内の選択された意味のあ
る画像成分の自動的変更を文書画像の復号なしに行なう
ための方法ならびにその装置」と題する出願番号JAO
26775,D/91231号として現在申請中の特許
出願に示してあるような、または本件の参考に含まれる
ウィズゴット(Withgott) らの「文書画像の復号なしに
文書を要約するための方法ならびにその装置」と題する
出願番号JAO26779,D/91235号として現
在申請中の特許出願に示すような非復号処理技術によっ
て処理するためまたは同様なほかの処理を行なうために
走査される。文書画像10の電子的形態を生成する目的
の走査は、光学的スキャナおよびセンサーによるなどの
走査手段によって実施しうる。使用される特定の走査手
段は電子ビームまたは同様のものによる場合があり、ま
たは図示してあるようにデータ処理システム13によっ
てアクセスしうるメモリ15内に保存されるデジタル化
したビットマップ画像などの文書画像のデジタル化電子
的表現を形成しうるような、走査すべき画像を検出する
のに適した受容器またはセンサー手段(図示していな
い)を含む電子写真式複写装置12の場合もある。デー
タ処理システム13はメモリ15などのメモリ内に格納
された所定の順序でプログラム命令を実行することによ
り関数を実行するための順次実行処理手段16を含むデ
ータ駆動型処理システムの場合もある。
【0028】メモリ15内のビットマップは本法によっ
て以下に詳細を示すように文書画像の方向を調べるため
に処理される。例えばメモリ15またはその他の保存手
段などの出力装置へ供給するか、または例えばこの場合
ファクシミリ装置、CRTディスプレイ装置17、印刷
装置19またはその他でありうる出力表示装置へ供給す
るために、画像は所望すればさらに処理されまた出力が
生成される。これ意外にデータ処理システム16からの
出力は電子写真式複写装置12へもハードコピー紙出力
のために供給しうる。
【0029】本発明は多くのローマ字のデセンダよりア
センダが多いという統計的性質を基盤としている。所定
の文字画像中の相対的な文字のアセンダとデセンダの数
は特に入力画像の縮小版が生成された場合だと極めて高
速な形態的画像処理法によって高信頼度に発見されう
る。
【0030】図1をここで参照すると、本発明のページ
方向付け方法の第1の好適実施例による方法の流れ図が
図示してある。本法は光学的に走査した文書画像が正し
く方向合わせしてあるかまたは正しい方向から90また
は180°の位置にあるかを検出して文書画像のビット
マップを回転し何らかの位置不整合を補正するものであ
る。
【0031】図2に示した文書10の文字部分など、例
えばローマ字の画像を含む文書は第1に走査される(段
階40)。上述のように、走査は既知の走査装置によっ
て実行でき、または電子写真式複写装置または同様の装
置によって走査されて文書上の文字部分の電子的表現を
生成することができる。画像の電子的表現は利便のため
に画像のビットマップとなして、ここで文章のそれぞれ
の文字は画素画像により表現され、それぞれの画素は
「オン」または「オフ」の状態を有している。
【0032】本発明の方法の応用によっては文書に含ま
れる文章全体を処理する必要はなく、文章部分に含まれ
るアセンダとデセンダを調べるために充分な量の文章が
処理されれば良い点は特筆すべきである。
【0033】次に画像の電子的表現が処理され、文書上
の文書の方向が調べられる。これを開始するには、フラ
グRflag が0に設定される42。フラグRflag は画像が
回転されたかまたはされていないかを示す。
【0034】走査画像のビットマップは次に図3に示す
ように水平方向の構成要素によって形態的に拡大される
(段階44)。拡大は従来技術において公知の形態的操
作であり、供給元画像の所定の「オン]画素が供給先画
像内に書き込まれる構成要素となり、構成要素は供給先
画像内で対応する位置の中央にくる。より特定すれば、
拡大操作は供給元画像の各画素について供給先画像内に
一組の画素として構成要素を描画する。文書の文章の方
向を調べる目的のためには、本発明の好適実施例では水
平方向の構成要素が適切であると解っている。例えば、
図3に示すように適切な構成要素は5画素の水平方向要
素を有するが、水平方向の構成要素における画素数は文
書画像の高さXの文字に対する拡大操作の塗沫効果を改
変することなく各種の実施例において変更しうる。水平
方向の構成要素が選択されているのは、文字内部の曲線
部の拡大並びに文字間隔拡大で効果的なためでもある。
本例において、文書10の画像が図3の構成要素を用い
る拡大操作で処理される場合、得られる結果は拡大画像
となる。
【0035】拡大画像はさらに構成要素の文字アセンダ
適合セットによる形態的侵食操作によって変更され(段
階46)、アセンダ数を決定することができる。アセン
ダの適合する構成要素に適切な幾つかの考えうる構成要
素が図4A、A’、B、B’、C、C’に図示してあ
る。特に、図4A−A’は高さ3画素幅5画素の構成要
素の組を示し、B−B’は高さ4画素幅5画素の構成要
素の組、またC−C’は高さ5画素、幅5画素の構成要
素の組を示す。侵食操作は図示した構成要素の対のいず
れかを用いて(すなわちA−A’、B−B’、またはC
−C’)、または文字アセンダ適合構成要素の適切なほ
かの組み合わせによって、行なうことができる。
【0036】拡大画像と構成要素のアセンダ適合セット
の間での侵食操作から得られた画像をもとに、「オン」
画素が計数され(段階47)、これが文字アセンダ画素
数Na を表わす。
【0037】拡大画像はさらに第2の侵食操作によって
変更され(段階48)、今回は構成要素の文字デセンダ
適合セットを用いることによりデセンダ数を決定するこ
とができる。デセンダ適合構成要素に適当な幾つかの考
えうる構成要素が図5A、A’、B、B’、C、C’に
図示してある。また文字デセンダの適合するほかの構成
要素の組み合わせを用いることもできる。特に、A−
A’では高さ3画素幅5画素の構成要素の組を示し、B
−B’は高さ4画素幅5画素の構成要素の組、またC−
C’は高さ5画素、幅5画素の構成要素の組を示す。
【0038】拡大画像と構成要素のデセンダ適合セット
の間での侵食操作から得られた画像をもとに、「オン」
画素が計数され(段階50)、これが文字デセンダの画
素数Nd を表わす。
【0039】上述のように、データ処理システム13は
データ駆動型処理システムであって、メモリ15などの
メモリ内に含まれる所定シーケンス内のプログラム命令
を実行することにより関数を実行するための順次実行処
理手段16を含むことができる。コンピュータを操作し
てNa およびNd の計算を実行させるために使用しうる
指令プログラムのひとつが図8に図示してあり、ここで
は高さ3のアセンダとデセンダを使用している。本プロ
グラムは解像度約75ドット/インチ(25.4mm) の画像
で有用である。
【0040】アセンダおよびデセンダ画素の数、Na お
よびNd について得られた結果がこの後で分析される。
第1の分析でNa およびNd の差の絶対値が統計的に有
意性を有するかを決定し(段階51)、これはNa およ
びNd の差の絶対値の第1の計算(段階53)そして計
算値と均一に分散する乱数変数を用いて計算した(段階
56)推定値Ne が比較されることで実行される。推定
値Ne の近似に使用しうる多数の統計的アルゴリズムの
ひとつは乱数データでの推定標準偏差の3倍を提供する
が、ここで乱数データについての標準偏差はNa の平方
根およびNd の平方根の和をとり、この量を2の平方根
で除した値に等しい、すなわちNe =3((√Na +√
Nd )/√2)である。比較の結果は、 |Na −Nd |>Ne または |Na −Nd |>3((√Na +√Nd )/√2) の場合に有意であるとみなされる。
【0041】Ne の計算値は任意に選択した推定値の近
似であり、他の推定値も満足しうる結果を得るために使
用しうることは強調されるべきである。
【0042】上記で計算した差が有意であると決定され
た場合(段階51)、ページ方向は正しい向きにあるか
または正しい方向から180°の位置にある。ページ方
向は文字アセンダの画素数Na を文字デセンダの画素数
Nd と比較すること(段階58)によって求まる。Na
>Nd の場合、すなわち文字アセンダの画素数が文字デ
センダの画素数より有意に大きい場合、第1の画像は正
しい向きに揃っており、処理は終了する (段階60) 。
それに対してNa ≦Nd の場合、第1の画像のビットマ
ップ画像は正しい向きから180°の位置にある。ビッ
トマップは180°回転され (段階62) 、処理を終了
(段階60) する前にビットマップ画像を正しい方向に
向けることができる。
【0043】一方、Na とNd の比較 (段階54) の結
果が有意ではない場合、そのページは正しい方向から9
0°外れているとみなされる。よって、 |Na −Nd |≦Ne または |Na −Nd |≦3((√Na +√Nd )/√2) であるから、文書画像は正しい方向にあるのでもまたは
逆向き(天地が逆)でもないことが示される。フラグRf
lag が検査されて (段階65) 、その文書画像のビット
マップがすでに回転されたかが検査される。Rflag =1
の場合ビットマップは回転されており、Rflag =0の場
合ビットマップは回転されていない。
【0044】ビットマップが予め90°回転されていな
い場合、ビットマップは時計回りまたは反時計回りに9
0°回転されるものとする。90°の回転により画像は
正しい向きへまたは正しい向きから180°の向きのい
ずれかへ向くことになる。よって画像は90°回転され
る68。ビットマップの90°回転の後、回転フラグRf
lag は1に等しく設定され拡大および侵食操作が回転し
たビットマップ画像を用いて反復される。
【0045】一方、ビットマップがすでに90°回転さ
れている場合、比較が有意ではないという第2の結果は
文書画像の位置合わせが決定し得ないことを示し、所望
すれば利用者は注意を受けることができる72。
【0046】本発明の方法の第2の実施例は図1の拡大
および侵食操作とは対照的に、形態的な近接操作によっ
て走査した第1の画像の高さXの文字の塗沫により文書
画像の方向を決定している。形態的近接操作は形態的拡
大操作とそれに続く侵食と同一の結果を有する。結果と
して近接操作は図1に図示した段階44、46、48を
単一の操作で実行する。当業者には本法の全体的効果を
改変することなく図1の方法における各種段階を実現す
るためにその他の各種形態的操作が使用できることは理
解されよう。
【0047】本発明はある程度詳細に記述され図示され
ているが、本開示は単に実施例として示されたものであ
り、部分の組み合わせおよび構成における数多くの変化
が本発明ならびに請求の範囲を逸脱することなく当業者
によってなされうるものであることは理解されよう。
【図面の簡単な説明】
【図1】 本発明の好適実施例におけるページ方向法の
流れ図である。
【図2】 本発明の好適実施例において図1の方法を実
現するための装置である。
【図3】 本発明の方法を実施する上で拡大動作を実行
するための水平構造を示す。
【図4】 本発明の方法を実行する際に使用する文字ア
センダ照合のための構成要素の対を示す。
【図5】 本発明の方法を実行する際に使用する文字デ
センダ照合のための構成要素の対を示す。
【図6】 デジタル式コンピュータをプログラムして文
書文字のアセンダおよびデセンダの数を決定するための
コンピュータプログラム命令の一覧である。
【符号の説明】
10 文書画像、12 複写装置、13 データ処理シ
ステム、15 メモリ、16 実行処理手段、17 C
RTディスプレイ装置、19 印刷装置
フロントページの続き (72)発明者 ダン・エス・ブルームバーグ アメリカ合衆国 カリフォルニア州 94306 パロアルト パラダイスレーン 1013

Claims (2)

    【特許請求の範囲】
  1. 【請求項1】 文書処理用に文書の画像の方向性を検出
    する方法であって、 上記文書画像の電子的表現を生成することと、 上記電子的表現における文字アセンダおよびデセンダの
    数の間の差から画像の方向を決定することを含む方法。
  2. 【請求項2】 文書処理用に文書の画像の方向性を検出
    する方法であって、 上記文書の画像の電子的表現を生成するために文書スキ
    ャナへ上記文書を供給することと、 上記文書の画像における文字アセンダの数を調べること
    と、 上記文書の画像における文字デセンダの数を調べること
    と、 上記文字アセンダの数と上記文字デセンダの数の間の差
    を調べることと、 上記画像の方向は、上記文字アセンダの数と上記文字デ
    センダの数の間の差が所定量より大きい場合に正しく、
    上記文字デセンダの数と上記文字アセンダの数の間の上
    記差が上記所定量より大きければ正しい方向から180
    °の向きにあり、上記文字アセンダと上記文字デセンダ
    の間の上記差が上記所定量より小さければ正しい方向か
    ら90°の向きにあることを検出することを含む方法。
JP4302725A 1991-11-19 1992-11-12 ページ方向の高速検出 Pending JPH05250409A (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US07/794,551 US5276742A (en) 1991-11-19 1991-11-19 Rapid detection of page orientation
US794551 1991-11-19

Publications (1)

Publication Number Publication Date
JPH05250409A true JPH05250409A (ja) 1993-09-28

Family

ID=25162967

Family Applications (1)

Application Number Title Priority Date Filing Date
JP4302725A Pending JPH05250409A (ja) 1991-11-19 1992-11-12 ページ方向の高速検出

Country Status (2)

Country Link
US (1) US5276742A (ja)
JP (1) JPH05250409A (ja)

Families Citing this family (27)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6373997B1 (en) 1991-07-30 2002-04-16 Xerox Corporation Coarse and fine skew measurement
JP3251959B2 (ja) * 1991-10-17 2002-01-28 株式会社リコー 画像形成装置
DE4224955C2 (de) * 1992-07-24 1998-11-26 Francotyp Postalia Gmbh Anordnung und Verfahren für einen internen Kostenstellendruck
US5642443A (en) * 1994-10-12 1997-06-24 Eastman Kodak Company Whole order orientation method and apparatus
US5917464A (en) * 1994-10-18 1999-06-29 Xerox Corporation Combination of 2-D detector array with display for image processing
US5956468A (en) * 1996-07-12 1999-09-21 Seiko Epson Corporation Document segmentation system
JP3684036B2 (ja) * 1997-07-03 2005-08-17 キヤノン株式会社 画像処理装置及び画像処理方法
US6993205B1 (en) 2000-04-12 2006-01-31 International Business Machines Corporation Automatic method of detection of incorrectly oriented text blocks using results from character recognition
JP2002324236A (ja) * 2001-04-25 2002-11-08 Hitachi Ltd 帳票識別方法及び帳票登録方法
DE60302191T2 (de) * 2002-08-27 2006-07-27 Oce Print Logic Technologies S.A. Ermittlung der Schräglage von Dokumentenbildern
US7286718B2 (en) * 2004-01-26 2007-10-23 Sri International Method and apparatus for determination of text orientation
JP4553241B2 (ja) * 2004-07-20 2010-09-29 株式会社リコー 文字方向識別装置、文書処理装置及びプログラム並びに記憶媒体
US8139897B2 (en) * 2007-03-15 2012-03-20 Ricoh Company, Limited Detecting tilt in an image having different resolutions in different directions
US8208725B2 (en) * 2007-06-21 2012-06-26 Sharp Laboratories Of America, Inc. Methods and systems for identifying text orientation in a digital image
US8144989B2 (en) * 2007-06-21 2012-03-27 Sharp Laboratories Of America, Inc. Methods and systems for identifying text orientation in a digital image
US8340430B2 (en) * 2007-07-10 2012-12-25 Sharp Laboratories Of America, Inc. Methods and systems for identifying digital image characteristics
US8358852B2 (en) * 2008-03-31 2013-01-22 Lexmark International, Inc. Automatic forms identification systems and methods
US8023770B2 (en) 2008-05-23 2011-09-20 Sharp Laboratories Of America, Inc. Methods and systems for identifying the orientation of a digital image
US8023741B2 (en) * 2008-05-23 2011-09-20 Sharp Laboratories Of America, Inc. Methods and systems for detecting numerals in a digital image
US8160365B2 (en) * 2008-06-30 2012-04-17 Sharp Laboratories Of America, Inc. Methods and systems for identifying digital image characteristics
KR101621848B1 (ko) * 2009-12-14 2016-06-01 삼성전자주식회사 화상처리장치 및 방법
US9524411B2 (en) * 2010-03-04 2016-12-20 Symbol Technologies, Llc User-customizable data capture terminal for and method of imaging and processing a plurality of target data on one or more targets
US8619340B2 (en) 2010-10-29 2013-12-31 Xerox Corporation Augmenting page orientation direction detection in a digital document processing environment
US8860989B2 (en) * 2011-12-15 2014-10-14 Kodak Alaris Inc. Scanner with exception preview
US9076058B2 (en) 2013-01-29 2015-07-07 Sharp Laboratories Of America, Inc. Methods, systems and apparatus for determining orientation in a document image
CN108345827B (zh) * 2017-01-24 2021-11-30 富士通株式会社 识别文档方向的方法、系统和神经网络
CN112329777B (zh) * 2021-01-06 2021-05-04 平安科技(深圳)有限公司 基于方向检测的文字识别方法、装置、设备及介质

Family Cites Families (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US2905927A (en) * 1956-11-14 1959-09-22 Stanley F Reed Method and apparatus for recognizing words
JPS5539025B2 (ja) * 1973-07-09 1980-10-08
US4251799A (en) * 1979-03-30 1981-02-17 International Business Machines Corporation Optical character recognition using baseline information
JPS58134368A (ja) * 1982-02-05 1983-08-10 Ricoh Co Ltd 文書画像処理装置
US4558461A (en) * 1983-06-17 1985-12-10 Litton Systems, Inc. Text line bounding system
US4723297A (en) * 1984-09-27 1988-02-02 Siemens Aktiengesellschaft Method for automatic correction of character skew in the acquisition of a text original in the form of digital scan results
JPH0810132B2 (ja) * 1986-06-04 1996-01-31 富士電機株式会社 対象パタ−ンの回転角検出方式
JPS63268081A (ja) * 1987-04-17 1988-11-04 インタ−ナショナル・ビジネス・マシ−ンズ・コ−ポレ−ション 文書の文字を認識する方法及び装置
US4985930A (en) * 1987-09-24 1991-01-15 Hitachi, Ltd. Image data filing system and image data correcting method
US4866784A (en) * 1987-12-02 1989-09-12 Eastman Kodak Company Skew detector for digital image processing system
US5187753A (en) * 1989-12-08 1993-02-16 Xerox Corporation Method and apparatus for identification and correction of document skew
US5129014A (en) * 1989-12-08 1992-07-07 Xerox Corporation Image registration
US5054098A (en) * 1990-05-21 1991-10-01 Eastman Kodak Company Method of detecting the skew angle of a printed business form
US5077811A (en) * 1990-10-10 1991-12-31 Fuji Xerox Co., Ltd. Character and picture image data processing system
US5172422A (en) * 1991-05-13 1992-12-15 Eastman Kodak Company Fast character segmentation of skewed text lines for optical character recognition

Also Published As

Publication number Publication date
US5276742A (en) 1994-01-04

Similar Documents

Publication Publication Date Title
JPH05250409A (ja) ページ方向の高速検出
US5410611A (en) Method for identifying word bounding boxes in text
US5539841A (en) Method for comparing image sections to determine similarity therebetween
EP0764308B1 (en) System and method for automatic page registration and automatic zone detection during forms processing
EP1312038B1 (en) Orthogonal technology for multi-line character recognition
US5706364A (en) Method of producing character templates using unsegmented samples
US5956419A (en) Unsupervised training of character templates using unsegmented samples
US5999649A (en) Method and apparatus for producing a hybrid data structure for displaying a raster image
US5664027A (en) Methods and apparatus for inferring orientation of lines of text
US7567730B2 (en) Detecting an orientation of characters in a document image
EP0543593B1 (en) Method for determining boundaries of words in text
US5212739A (en) Noise tolerant optical character recognition system
JP3308032B2 (ja) スキュー補正方法およびスキュー角検出方法およびスキュー補正装置およびスキュー角検出装置
JPH03201866A (ja) 圧縮形態のデータを含むデータから画像スキュー角度を決定する方法
EP2270746B1 (en) Method for detecting alterations in printed document using image comparison analyses
JP2001175807A (ja) テキスト領域選択方法
JPH04229763A (ja) 画像処理装置および方法
JPH0721320A (ja) 自動スクリプト決定装置
EP0343786A2 (en) Method and apparatus for reading and recording text in digital form
US6771842B1 (en) Document image skew detection method
JP2000067164A (ja) パターン認識方法及び装置並びにテンプレート作成プログラムを記録した記録媒体
JP3303246B2 (ja) 画像処理装置
JP2000187705A (ja) 文書読取装置および方法および記憶媒体
JPH10207978A (ja) 文字等パターン照合方法及び装置
JPH11161738A (ja) 楽譜認識方法及びその装置並びに楽譜認識プログラムを記録したコンピュータ読み取り可能な記録媒体

Legal Events

Date Code Title Description
A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20010928